WO2022114791A1

WO2022114791A1 - 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램

Info

Publication number: WO2022114791A1
Application number: PCT/KR2021/017434
Authority: WO
Inventors: 권혁상; 고은실; 홍옥기; 김미경; 김은숙; 남가은; 한경도; 이민경
Original assignee: 가톨릭대학교 산학협력단; 한양대학교 산학협력단
Priority date: 2020-11-26
Filing date: 2021-11-24
Publication date: 2022-06-02
Also published as: KR102599132B1; KR20230167748A; KR102680761B1; KR20220075046A

Abstract

본 발명은 시간에 따라 누적된 대사 증후군의 발병 요인들을 기반으로 빅데이터를 생성 및 분석하여, 특정한 질환에 대한 발생 및 위험도를 인식 또는 예측함에 따라, 위험 상황을 사전에 예방할 수 있는 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램에 관한 것이다.

Description

빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램

본 발명은 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램에 관한 것이다.

전 세계적으로 가장 빠른 속도로 초고령화 시대에 접어들면서 기대수명은 늘어나고 있지만 건강수명은 오히려 조금씩 줄어드는 추세로서 "건강한 백세시대”를 위해서는 둘의 간극을 줄이는 것이 최대 관건이다,

성인병의 집합체로 표현할 수 있는 대사 증후군은 지난 10년간 꾸준히 증가추세로 1998년 성인 4명 중 1명꼴이었던 대사 증후군 유병률은 최근 3명 중 1명꼴로 증가한 상태이다.

건강 수명을 늘리기 위한 방안은 대사 증후군 중 핵심 3개 만성 대사 질환인 고혈압, 이상지질혈증 및 당뇨병을 예방하고 관리하는 것이 관상 동맥 질환(CAD: Coronary Artery Disease), 뇌졸중(CVA: Cerebral Vascular Accident) 및 만성 신장 질환(CKD: Chronic Kidney Disease)의 발생을 막고 이들에 의한 사망을 줄일 수 있는 최선이다.

다만, 성별, 연령별로 대사 증후군의 발생 현황이 매우 상이하며 서구인과도 다른 한국형 대사 증후군 예방 및 관리를 위한 적정관리지표가 필요하다.

만성 대사 질환의 예방 및 관리 지침을 수립하기 위한 가장 높은 근거 수준의 연구는 무작위 대조 임상 연구 (RCT: Randomized Control Trial)이다. 다만 무작위 대조 임상 연구는 많은 연구 대상자와 오랜 추적 기간을 필요로 하는 문제점이 있다.

상기와 같은 문제점을 해결하기 위해 본 발명은 시간에 따라 누적된 대사 증후군의 발병 요인들을 기반으로 빅데이터를 생성 및 분석하여, 특정한 질환에 대한 발생 및 위험도를 인식 또는 예측함에 따라, 위험 상황을 사전에 예방할 수 있는 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램을 제공하고자 한다.

상술한 기술적 과제를 달성하기 위한 본 발명에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템은, 하나 이상의 컴퓨터로 구성되고, 대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여 빅데이터를 형성하고, 상기 빅데이터를 분석하여, 특정 질환의 질환 발병 위험도는 예측하는 분석 서버와, 상기 분석 서버와 연결된 클라이언트를 포함하고, 상기 클라이언트는 상기 입력 대사 증후군 발병 요인 값을 입력받아, 상기 분석 서버에 제공하고, 상기 분석 서버로부터 상기 질환 발병 위험도를 제공받아 출력하고, 상기 입력 대사 증후군 발병 요인 값은 복부 둘레, 혈압, 혈당, HDL(High-Density Lipoprotein) 콜레스테롤 및 중성 지방을 포함하고, 상기 분석 서버는 상기 입력 대사 증후군 발병 요인 값 중 적어도 세 개가 상기 빅데이터를 기반으로 설정된 기준값을 초과하는 경우, 상기 특정 질환의 상기 질환 발병 위험도를 예측하는 것을 특징으로 한다.

이때, 상기 분석 서버는 딥러닝 학습 모델을 이용하여, 상기 입력 대사 증후군 발병 요인 값 및 상기 특정 질환의 상기 질환 발병 위험도를 데이터셋으로 학습하고, 상기 딥러닝 학습 모델로 상기 질환 발병 위험도를 예측할 수 있다. 또한, 상기 분석 서버는 상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하고, 상기 학습 데이터의 분석을 통해 정상 범위의 정상 대사 증후군 발병 요인 값을 산출하고, 상기 입력 대사 증후군 발병 요인 값이 상기 정상 대사 증후군 발병 요인 값을 기준으로 형성된 특정 범위를 초과하였는지 판단할 수 있다.

또한, 상기 분석 서버는 상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하고, 상기 학습 데이터에서 상기 질환 발병 위험도를 추출할 수 있다. 이때, 상기 분석 서버는 특정한 상황 데이터를 상기 이상 특징 정보에 매칭하여 누적하고, 상기 입력 대사 증후군 발병 요인 값 내에서 특정한 이상 특징 정보를 인식하고, 상기 인식된 이상 특징 정보에 상응하는 상황 데이터를 상기 클라이언트로 전송할 수 있다.

또한, 상기 분석 서버는 상기 빅데이터를 로지스틱 회귀 분석으로 분석할 수 있다.

또한, 상기 특정 질환은 고혈압, 이상지질혈증, 당뇨병, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함할 수 있다. 이 경우, 상기 분석 서버는 상기 빅데이터를 기반으로, 상기 고혈압, 상기 이상지질혈증, 및 상기 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측하고, 상기 빅데이터 및 상기 예측된 대사 증후군의 위험도를 기반으로, 상기 관상 동맥 질환, 상기 뇌졸증, 및 상기 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측할 수 있다.

또한, 상기 질환 발병 위험도는 상기 특정 질환의 발병 시기 및 상기 특정 질환의 발병률 중 적어도 하나를 포함할 수 있다.

또한, 상기 클라이언트는 상기 입력 대사 증후군 발병 요인 값을 입력받아, 상기 분석 서버에 제공하는 입력 장치 및 상기 분석 서버로부터 상기 질환 발병 위험도를 제공받아 출력하는 출력 장치를 포함할 수 있다.

또한, 본 발명에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법은, 대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 획득하는 단계와, 상기 입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여 빅데이터를 형성하는 빅데이터 수집 단계와, 상기 빅데이터를 분석하여, 특정 질환의 질환 발병 위험도를 예측하는 질환 발병 위험도 예측 단계를 포함하고, 상기 입력 대사 증후군 발병 요인 값은 복부 둘레, 혈압, 혈당, HDL(High-Density Lipoprotein) 콜레스테롤 및 중성 지방을 포함하고, 상기 질환 발병 위험도 예측 단계는 상기 입력 대사 증후군 발병 요인 값 중 적어도 세 개가 상기 빅데이터를 기반으로 설정된 기준값을 초과하는 경우, 상기 특정 질환의 상기 질환 발병 위험도를 예측하는 것을 특징으로 한다.

이때, 상기 질환 발병 위험도 예측 단계는 하나 이상의 컴퓨터에 의해, 딥러닝 학습 모델을 이용하여 상기 입력 대사 증후군 발병 요인 값 및 상기 특정 질환의 상기 질환 발병 위험도를 데이터셋으로 학습하는 학습 단계 및 상기 딥러닝 학습 모델로 상기 질환 발병 위험도를 예측하는 단계를 포함할 수 있다.

이때, 상기 학습 단계는 상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하는 단계와, 상기 학습 데이터의 분석을 통해 정상 범위의 정상 대사 증후군 발병 요인 값을 산출하는 단계와, 상기 입력 대사 증후군 발병 요인 값이 상기 정상 대사 증후군 발병 요인 값을 기준으로 형성된 특정 범위를 초과하였는지 판단하는 단계를 포함할 수 있다.

또한, 상기 학습 단계는 상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하는 단계와, 상기 학습 데이터에서 상기 질환 발병 위험도를 추출하는 단계를 포함할 수 있다.

이때, 상기 학습 단계는 특정한 상황 데이터를 이상 특징 정보에 매칭하여 누적하는 단계와, 상기 입력 대사 증후군 발병 요인 값 내에서 특정한 이상 특징 정보를 인식하는 단계와, 상기 인식된 이상 특징 정보에 상응하는 상황 데이터를 클라이언트로 전송하는 단계를 더 포함할 수 있다.

또한, 상기 질환 발병 위험도 예측 단계는 상기 빅데이터를 로지스틱 회귀 분석으로 분석할 수 있다.

또한, 상기 특정 질환은 고혈압, 이상지질혈증, 당뇨병, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함할 수 있다. 이때, 상기 질환 발병 위험도 예측 단계는 상기 빅데이터를 기반으로, 상기 고혈압, 상기 이상지질혈증, 및 상기 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측하는 단계와, 상기 빅데이터 및 상기 예측된 대사 증후군의 위험도를 기반으로, 상기 관상 동맥 질환, 상기 뇌졸증, 및 상기 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측하는 단계를 포함할 수 있다.

또한, 본 발명은 하드웨어인 컴퓨터와 결합되어, 제11항 내지 제19항의 빅데이터 기반의 질환 발병 위험도 예측 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된 빅데이터 기반의 질환 발병 위험도 예측 프로그램을 포함할 수 있다.

본 발명에 따르면, 시간에 따라 누적된 대사 증후군 발병 요인들을 기반으로 빅데이터를 생성 및 분석하여, 특정한 질환에 대한 발생 및 위험도를 인식 또는 예측함에 따라, 위험 상황을 사전에 예방할 수 있는 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램을 제공할 수 있다.

본 발명에 따르면, 무작위 대조 임상 연구 결과에 버금가고, 한국인의 대사 증후군을 관리할 수 있는 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램을 제공할 수 있다.

도 1은 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템를 개략적으로 나타낸 블록도이다.

도 2는 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법을 개략적으로 나타낸 순서도이다.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로, 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.

본 명세서에서 컴퓨터는 연산처리를 수행하여 사용자에게 결과를 시각적으로 제시할 수 있는 다양한 장치들이 모두 포함된다. 예를 들어, 컴퓨터는 데스크 탑 PC, 노트북(Note Book) 뿐만 아니라 스마트폰(Smart phone), 태블릿 PC, 셀룰러폰(Cellular phone), 피씨에스폰(PCS phone; Personal Communication Service phone), 동기식/비동기식 IMT-2000(International Mobile Telecommunication-2000)의 이동 단말기, 팜 PC(Palm Personal Computer), 개인용 디지털 보조기(PDA; Personal Digital Assistant) 등도 해당될 수 있다. 또한, 컴퓨터는 의료영상을 획득하거나 관찰하는 의료장비도 해당될 수 있다. 또한, 컴퓨터는 다양한 클라이언트 컴퓨터와 연결되는 서버 컴퓨터가 해당될 수 있다.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.

이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템(10)은 분석 서버(100), 및 클라이언트(200)를 포함한다.

분석 서버(100)는 하나 이상의 컴퓨터로 구성된다. 분석 서버(100)는 대사 증후군의 발병 요인에 따른 입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여, 빅데이터(110)를 형성한다. 분석 서버(100)는 빅데이터(110)를 분석하여, 특정 질환의 질환 발병 위험도를 예측한다.

본 명세서에서 대사 증후군의 발병 요인에서 "대사 증후군"이란 예를 들어, 고혈압, 이상지질혈증, 및 당뇨병 중 적어도 하나를 포함할 수 있다.

본 명세서에서 "시간에 따라 수집"은 예를 들어, 적어도 1회 이상, 현재 입력 대사 증후군 발병 요인 값을 제공 받기 전에 입력 대사 증후군 발병 요인 값을 제공받은 것을 의미하는 것일 수 있다. 예를 들어, 시간에 따른 수집은 과거 3년간에 제공된 입력 대사 증후군 발병 요인 값을 수집한 것을 의미하는 것일 수 있다.

일 실시예로, 빅데이터(110)는 국민건강보험공단 빅데이터일 수 있다.

대사 증후군 발병 요인은 예를 들어, 복부 둘레, 혈압, 혈당, HDL 콜레스테롤, 및 중성 지방을 포함한다.

분석 서버(100)는 특정 기간동안 입력 대사 증후군 발병 요인들의 값을 누적하여 수집할 수 있다. 예를 들어, 분석 서버(100)는 5년동안 입력 대사 증후군 발병 요인들의 값을 누적하여 수집할 수 있다. 예를 들어, 분석 서버(100)는 과거 3년동안 입력 대사 증후군 발병 요인들의 값을 누적하여 수집할 수 있다. 예를 들어, 분석 서버(100)는 과거 5년동안 입력 대사 증후군 발병 요인들의 값을 누적하여 수집할 수 있다.

분석 서버(100)는 빅데이터(110)를 분석한다. 분석 서버(100)는 예를 들어, 로지스틱 회귀 분석으로 빅데이터(110)를 분석할 수 있다.

분석 서버(100)는 입력 대사 증후군 발병 요인 값들 중 적어도 세 개가 빅데이터를 기반으로 설정된 기준값을 초과하면, 질환 발병 위험도를 예측할 수 있다.

상기 기준값은 예를 들어, 입력 대사 증후군 발병 요인 값의 절대값을 평가할 수 있는 기준일 수도 있고, 입력 대사 증후군 발병 요인 값과 빅데이터 기반으로 설정된 정상값과의 차이값을 평가할 수 있는 기준일 수도 있다.

일 실시예로, 분석 서버(100)는 입력 대사 증후군 발병 요인 값이, 예를 들어, 복부 둘레, 혈압, 혈당, HDL 콜레스테롤, 및 중성 지방 중 적어도 세 개가 빅데이터를 기반으로 설정된 기준값을 초과하였는지 여부를 초과 또는 초과하지 않음으로 판단하여, 질환 발병 위험도를 예측할 수 있다.

질환 발병 위험도에서 위험도가 예측되는 특정 질환은 예를 들어, 고혈압, 이상지질혈증, 당뇨병, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함할 수 있다.

일 실시예로, 분석 서버(100)는 빅데이터(110)를 기반으로 고혈압, 이상지질혈증, 및 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측할 수 있다. 예를 들어, 분석 서버(100)는 입력 대사 증후군 발병 요인 값 중 적어도 세 개가 빅데이터(110) 기반으로 설정된 기준값을 초과할 경우, 고혈압, 이상지질혈증, 및 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측할 수 있다.

일 실시예로, 분석 서버(100)는 빅데이터(110) 및 대사 증후군의 위험도를 기반으로, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측할 수 있다. 예를 들어, 위험도가 예측된 고혈압, 이상지질혈증, 및 당뇨병 중 적어도 하나가, 빅데이터(110) 기반으로 설정된 기준값을 초과할 경우, 대사 증후군이 발전한, 만성 대사 질환의 발병 위험도를 예측할 수 있다.

일 실시예로, 고혈압 및 당뇨병의 위험도가 예측되면, 뇌졸증의 위험도가 예측될 수 있다.

일 실시예로, 고혈압, 이상지질혈증, 및 당뇨병의 위험도가 예측되면 관상 동맥 질환의 위험도가 예측될 수 있다.

일 실시예로, 이상지질혈증 및 당뇨병의 위험도가 예측되면, 만성 신장 질환의 위험도가 예측될 수 있다.

일 실시예로, 이상지질혈증의 위험도가 예측되면, 관상 동맥 질환의 위험도가 예측될 수 있다.

질환 발병 위험도는 예를 들어, 특정 질환의 발병 시기 및 특정 질환의 발병률 중 적어도 하나를 포함할 수 있다.

본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템(10)은 하나 이상의 컴퓨터에 의해, 딥러닝 학습 모델(120)을 이용하여, 질환 발병 위험도를 예측할 수 있다.

이하에서는 딥러닝 학습 모델(120)에 대하여 설명한다.

분석 서버(100)는 하나 이상의 컴퓨터로 구성되어 딥러닝 학습 모델(120)을 형성하여, 입력 대사 증후군 발병 요인 값이 질환 발병 위험도가 어느 정도인지 판단하는 역할을 수행한다.

본 발명의 실시예들에 따른 딥러닝 학습 모델(120)은, 하나 이상의 컴퓨터 내에 하나 이상의 레이어(Layer)를 구축하여 복수의 데이터를 바탕으로 판단을 수행하는 시스템 또는 네트워크를 의미한다.

예를 들어, 딥러닝 학습 모델(120)은 컨볼루션 풀링층(Convolutional Pooling Layer), 로컬 접속층(a locally-connected layer) 및 완전 연결층(fully-connected layer)을 포함하는 층들의 세트로 구현될 수 있다. 컨볼루션 풀링층 또는 로컬 접속층은 영상 내 특징들을 추출하도록 구성 될 수 있다. 완전 연결층은 영상의 특징 간의 상관 관계를 결정할 수 있다. 일부 실시예에서, 딥러닝 학습 모델(120)의 전체적인 구조는 컨볼루션 풀링층에 로컬 접속층이 이어지고, 로컬 접속층에 완전 연결층이 이러지는 형태로 이루어질 수 있다.

딥러닝 학습 모델(120)은 다양한 판단 기준(즉, 파라미터(Parameter))를 포함할 수 있고, 입력되는 영상 분석을 통해 새로운 판단 기준(즉, 파라미터)를 추가할 수 있다. 파라미터들은 예를 들어, 복부 둘레, 혈압, 혈당, HDL (High-Density Lipoprotein) 콜레스테롤 및 중성 지방을 포함할 수 있다. 파라미터들은 음주 여부, 흡연 여부, 운동 여부, 가족력, 과거 병력, 현재 병력, BMI, 나이, 키, 체중, 및 거주 환경 중 적어도 하나를 더 포함할 수 있다.

일 실시예로, 파라미터가 복부 둘레 및 성별을 포함하면, 남성일 경우 예를 들어, 복부 둘레가 90 cm 이상, 여성일 경우 예를 들어, 복부 둘레가 85 cm 이상일 경우, 대사 증후군 위험일 수 있고, 미만이면 정상일 수 있다.

일 실시예로, 파라미터가 혈압을 포함하면, 수축기 혈압(SBP: Systolic blood pressure)값이 예를 들어 130mmHg 이상 또는 확장기 혈압(DBP: Diastolic blood pressure)값이 예를 들어 80 mmHg 이상이면 대사 증후군 위험일 수 있고, 상기 범위를 벗어나면 정상일 수 있다.

일 실시예로, 파라미터가 혈당을 포함하면, 혈당값이 예를 들어, 100 mg/dL 이상이면, 대사 증후군 위험일 수 있고, 미만이면 정상일 수 있다.

일 실시예로, 파라미터가 HDL 콜레스테롤을 포함하면, HDL 콜레스테롤 값이 예를 들어, 240 mg/dL 이상이면, 대사 증후군 위험일 수 있고, 미만이면 정상일 수 있다.

일 실시예로, 파라미터가 중성 지방을 포함하면, 중성 지방값이 예를 들어 150 mg/dL 이상이면, 대사 증후군 위험일 수 있고, 미만이면 정상일 수 있다.

본 발명의 실시예들에 따른 딥러닝 학습 모델(120)은 영상 분석에 적합한 콘볼루셔널 신경망이라고 부르는 구조로서, 주어진 영상 데이터들로부터 가장 분별력(Discriminative Power)가 큰 특징을 스스로 학습하는 특징 추출층(Feature Extraction Layer)와 추출된 특징을 기반으로 가장 높은 예측 성능을 내도록 예측 모델을 학습하는 예측층(Prediction Layer)이 통합된 구조로 구성될 수 있다.

특징 추출층은 영상의 각 영역에 대해 복수의 필터를 적용하여 특징 지도(Feature Map)를 만들어 내는 콘볼루션층(Convolution Layer)과 특징 지도를 공간적으로 통합함으로써 위치나 회전의 변화에 불변하는 특징을 추출할 수 있도록 하는 통합층(Pooling Layer)을 번갈아 수 차례 반복하는 구조로 형성될 수 있다. 이를 통해, 점, 선, 면 등의 낮은 수준의 특징에서부터 복잡하고 의미 있는 높은 수준의 특징까지 다양한 수준의 특징을 추출해낼 수 있다.

콘볼루션층은 입력 영상의 각 패치에 대하여 필터와 국지 수용장(Local Receptive Field)의 내적에 비선형 활성 함수(Activation Function)을 취함으로 서 특징 지도(Feature Map)를 구하게 되는데, 다른 네트워크 구조와 비교하여, CNN은 희소한 연결성 (Sparse Connectivity)과 공유된 가중치(Shared Weights)를 가진 필터를 사용하는 특징이 있다. 이러한 연결 구조는 학습할 모수의 개수를 줄여주고, 역전파 알고리즘을 통한 학습을 효율적으로 만들어 결과적으로 예측 성능을 향상 시킨다.

통합층(Pooling Layer 또는 Sub-sampling Layer)은 이전 콘볼루션층에서 구해진 특징 지도의 지역 정보를 활용하여 새로운 특징 지도를 생성한다. 일반적으로 통합층에 의해 새로 생성된 특징 지도는 원래의 특징 지도보다 작은 크기로 줄어드는데, 대표적인 통합 방법으로는 특징 지도 내 해당 영역의 최대값을 선택하는 최대 통합(Max Pooling)과 특징 지도 내 해당 영역의 평균값을 구하는 평균 통합(Average Pooling) 등이 있다.

통합층의 특징 지도는 일반적으로 이전층의 특징 지도보다 입력 영상에 존재하는 임의의 구조나 패턴의 위치에 영향을 적게 받을 수 있다. 즉, 통합층은 입력 영상 혹은 이전 특징 지도에서의 노이즈나 왜곡과 같은 지역적 변화에 보다 강인한 특징을 추출할 수 있게 되고, 이러한 특징은 분류 성능에 중요한 역할을 할 수 있다. 또 다른 통합층의 역할은, 깊은 구조상에서 상위의 학습층으로 올라갈수록 더 넓은 영역의 특징을 반영할 수 있게 하는 것으로서, 특징 추출층이 쌓이면서, 하위층에서는 지역적인 특징을 반영하고 상위층으로 올라 갈수록 보다 추상적인 전체 영상의 특징을 반영하는 특징 생성할 수 있다.

이와 같이, 콘볼루션층과 통합층의 반복을 통해 최종적으로 추출된 특징은 다중 신경망(MLP: Multi-layer Perception)이나 서포트 벡터 머신(SVM: Support Vector Machine)과 같은 분류 모델이 완전 연결층(Fully-connected Layer)의 형태로 결합되어 분류 모델 학습 및 예측에 사용될 수 있다.

다만, 본 발명의 실시예들에 따른 딥러닝 학습 모델(120)의 구조는 이에 한정되지 아니하고, 다양한 구조의 신경망으로 형성될 수 있다.

클라이언트(200)는 입력 대사 증후군 발병 요인 값을 입력받아, 분석 서버(100)에 제공한다. 클라이언트(200)는 분석 서버(100)로부터 질환 발병 위험도를 제공받아 출력한다.

클라이언트(200)는 입력 장치(210) 및 출력 장치(220)를 포함할 수 있다. 입력 장치(210) 및 출력 장치(220)는 하나의 장치로 구현될 수도 있고, 서로 별개의 장치로 구현될 수도 있다.

입력 장치(210)는 대사 증후군 발병 요인을 입력받아, 이에 대응하는 입력 대사 증후군 발병 요인 값을 분석 서버(100)로 전송하는 장치일 수 있다.

일 실시예로 입력 장치(210)는 질환 발병 위험도를 분석해야하는 사용자의 혈액을 제공받아, 대사 증후군 발병 요인들을 산출할 수도 있다.

입력 장치(210)는 한 개일 수도 있고, 복수 개일 수도 있다.

출력 장치(220)는 분석 서버(100)로부터 질환 발병 위험도 결과를 수신하여, 다양한 방식으로 사용자에게 판단 결과를 제공할 수 있다. 예를 들어, 출력 장치(220)는 디스플레이부를 구비하여, 질환 발병 위험도를 시각적으로 표시하여 사용자에게 제공할 수 있다. 또한, 질환 발병 위험도가 높다는 판단 결과를 수신하는 경우, 출력 장치(220)는 진동을 발생하여 사용자에게 질환 발병 위험도가 높음을 알릴 수도 있다. 다만, 출력 장치(220)가 사용자에게 질환 발병 위험도의 판단 결과를 제공하는 방식은 이에 한정되지 아니하고, 음향 출력 등의 사용자에게 제공할 수 있는 다양한 출력 방식을 활용할 수 있다. 또한, 본 발명의 일실시예에 따른 출력 장치(220)는 이동 단말기를 포함할 수 있다.

출력 장치(220)는 한 개일 수도 있고, 복수 개일 수도 있다.

이하에서는 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법에 대하여 설명한다. 이하에서는 앞서 언급한 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템와의 차이점에 대하여 구체적으로 설명하고, 설명하지 않은 부분은 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템와 동일할 수 있다.

도 1 및 도 2를 참조하면, 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법은 대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 획득하는 단계(S100), 빅데이터 수집 단계(S200), 및 질환 발병 위험도 예측 단계(S300)를 포함한다.

대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 획득한다(S100). 입력 대사 증후군 발병 요인 값은 클라이언트(200)에서 입력되어, 분석 서버(100)로 제공될 수 있다. 입력 대사 증후군 발병 요인 값은 입력 장치(210)에 입력되어, 분석 서버(100)로 제공될 수 있다.

입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여 빅데이터를 형성한다(S200). 빅데이터 수집 단계(S200)는 분석 서버(100)에서 수행될 수 있다.

빅데이터를 분석하여, 특정 질환의 질환 발병 위험도를 예측한다(S300). 질환 발병 위험도는 분석 장치(100)에서 출력 장치(220)로 제공될 수 있다. 출력 장치(220)는 입력 장치(210)와 하나의 장치로 구현될 수도 있고, 서로 별개의 장치로 구현될 수도 있다.

일 실시예로, 질환 발병 위험도 예측 단계(S300)는 하나 이상의 컴퓨터에 의해, 딥러닝 학습 모델을 이용하여, 입력 대사 증후군 발병 요인 값 및 특정 질환의 질환 발병 위험도를 데이터셋으로 학습하는 학습 단계, 및 딥러닝 학습 모델(120)로 질환 발병 위험도를 예측하는 단계를 포함할 수 있다.

일 실시예로, 질환 발병 위험도 예측 단계(S300)는 빅데이터(110)를 기반으로, 고혈압, 이상지질혈증, 및 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측하는 단계, 및 빅데이터(110) 및 예측된 대사 증후군의 위험도를 기반으로, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측하는 단계를 포함할 수 있다.

일 실시예로, 질환 발병 위험도 예측 단계(S300)는 하나 이상의 컴퓨터에 의해, 딥러닝 학습 모델을 이용하여, 입력 대사 증후군 발병 요인 값, 대사 증후군 발병 위험도, 및 특정 질환의 질환 발병 위험도를 데이터셋으로 학습하는 학습 단계, 및 딥러닝 학습 모델(120)로 대상 증후군 발병 위험도 및 질환 발병 위험도를 예측하는 단계를 포함할 수 있다.

질환 발병 위험도는 앞서 언급한 딥러닝 학습 모델(120)의 파라미터들로 판단될 수 있다.

일 실시예로, 학습 단계는 입력 대사 증후군 발병 요인 값을 누적하여, 학습 데이터를 생성하는 단계를 포함할 수 있다. 학습 데이터의 분석을 통해 정상 대사 증후군 발병 요인 값을 산출한다. 입력 대사 증후군 발병 요인 값이 정상 대사 증후군 발병 요인 값을 기준으로 형성된 특정 범위를 초과하였는지 판단할 수 있다.

일 실시예로, 학습 단계는 하나 이상의 조직 분석 장치(200)로부터 제공받은 조직에 대응하는 입력 대사 증후군 발병 요인 값을 누적하여, 학습 데이터를 생성하는 단계를 포함할 수 있다. 학습 데이터에서 이상 특징 정보를 추출할 수 있다.

일 실시예로, 학습 단계는 특정한 상황 데이터를 이상 특징 정보에 매칭하여 누적하는 단계를 포함할 수 있다. 이상 특징 정보란 예를 들어, 복부 둘레, 혈압, 혈당, HDL 콜레스테롤 및 중성 지방 등을 기준으로 정상의 범위에 미치지 못하는 값을 갖는 것을 의미할 수 있다. 입력 대사 증후군 발병 요인 값 내에서 특정한 이상 특징 정보를 인식할 수 있다. 인식된 이상 특징 정보에 상응하는 상황 데이터를 클라이언트로 전송할 수 있다. 이상 특징 정보에 상응하는 상황 데이터는 예를 들어, 질환 발병 위험도일 수 있다.

본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법은, 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 빅데이터 기반의 질환 발병 위험도 예측 시스템에 포함되는 매체에 저장될 수 있다.

프로그램은, 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 방법들을 실행시키기 위하여, 컴퓨터의 프로세서(CPU)가 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 기능들을 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 기능들을 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 컴퓨터의 프로세서가 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.

저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 프로그램은 컴퓨터가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 컴퓨터상의 다양한 기록매체에 저장될 수 있다. 또한, 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.

본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램은 시간에 따라 누적된 대사 증후군 발병 요인들을 기반으로 빅데이터를 생성 및 분석하여, 특정한 질환에 대한 발생 및 위험도를 인식 또는 예측함에 따라, 위험 상황을 사전에 예방할 수 있다. 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램은 시간에 따라 누적된 대사 증후군 발병 요인들을 기반으로 생성된 빅데이터를 바탕으로, 특정한 질환에 대한 발생 및 위험도를 딥러닝 기술로 인식 또는 예측할 수 있다.

이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로, 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.

Claims

하나 이상의 컴퓨터로 구성되고, 대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여 빅데이터를 형성하고, 상기 빅데이터를 분석하여, 특정 질환의 질환 발병 위험도는 예측하는 분석 서버; 및

상기 분석 서버와 연결된 클라이언트;를 포함하고,

상기 클라이언트는,

상기 입력 대사 증후군 발병 요인 값을 입력받아, 상기 분석 서버에 제공하고, 상기 분석 서버로부터 상기 질환 발병 위험도를 제공받아 출력하고,

상기 입력 대사 증후군 발병 요인 값은,

복부 둘레, 혈압, 혈당, HDL(High-Density Lipoprotein) 콜레스테롤 및 중성 지방을 포함하고,

상기 분석 서버는,

상기 입력 대사 증후군 발병 요인 값 중 적어도 세 개가 상기 빅데이터를 기반으로 설정된 기준값을 초과하는 경우, 상기 특정 질환의 상기 질환 발병 위험도를 예측하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
제1항에 있어서,

상기 분석 서버는,

딥러닝 학습 모델을 이용하여, 상기 입력 대사 증후군 발병 요인 값 및 상기 특정 질환의 상기 질환 발병 위험도를 데이터셋으로 학습하고,

상기 딥러닝 학습 모델로 상기 질환 발병 위험도를 예측하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
제2항에 있어서,

상기 분석 서버는,

상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하고,

상기 학습 데이터의 분석을 통해 정상 범위의 정상 대사 증후군 발병 요인 값을 산출하고,

상기 입력 대사 증후군 발병 요인 값이 상기 정상 대사 증후군 발병 요인 값을 기준으로 형성된 특정 범위를 초과하였는지 판단하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
제2항에 있어서,

상기 분석 서버는,

상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하고,

상기 학습 데이터에서 상기 질환 발병 위험도를 추출하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
제4항에 있어서,

상기 분석 서버는,

특정한 상황 데이터를 상기 이상 특징 정보에 매칭하여 누적하고,

상기 입력 대사 증후군 발병 요인 값 내에서 특정한 이상 특징 정보를 인식하고,

상기 인식된 이상 특징 정보에 상응하는 상황 데이터를 상기 클라이언트로 전송하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
제1항에 있어서,

상기 분석 서버는,

상기 빅데이터를 로지스틱 회귀 분석으로 분석하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
제1항에 있어서,

상기 특정 질환은,

고혈압, 이상지질혈증, 당뇨병, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
제7항에 있어서,

상기 분석 서버는,

상기 빅데이터를 기반으로, 상기 고혈압, 상기 이상지질혈증, 및 상기 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측하고,

상기 빅데이터 및 상기 예측된 대사 증후군의 위험도를 기반으로, 상기 관상 동맥 질환, 상기 뇌졸증, 및 상기 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
제1항에 있어서,

상기 질환 발병 위험도는,

상기 특정 질환의 발병 시기 및 상기 특정 질환의 발병률 중 적어도 하나를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
제1항에 있어서,

상기 클라이언트는,

상기 입력 대사 증후군 발병 요인 값을 입력받아, 상기 분석 서버에 제공하는 입력 장치; 및

상기 분석 서버로부터 상기 질환 발병 위험도를 제공받아 출력하는 출력 장치를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
빅데이터 기반의 질환 발병 위험도 예측 시스템에 의해 수행되는 방법에 있어서,

대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 획득하는 단계;

상기 입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여 빅데이터를 형성하는 빅데이터 수집 단계; 및

상기 빅데이터를 분석하여, 특정 질환의 질환 발병 위험도를 예측하는 질환 발병 위험도 예측 단계;를 포함하고,

상기 입력 대사 증후군 발병 요인 값은,

복부 둘레, 혈압, 혈당, HDL(High-Density Lipoprotein) 콜레스테롤 및 중성 지방을 포함하고,

상기 질환 발병 위험도 예측 단계는,

상기 입력 대사 증후군 발병 요인 값 중 적어도 세 개가 상기 빅데이터를 기반으로 설정된 기준값을 초과하는 경우, 상기 특정 질환의 상기 질환 발병 위험도를 예측하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
제11항에 있어서,

상기 질환 발병 위험도 예측 단계는,

하나 이상의 컴퓨터에 의해, 딥러닝 학습 모델을 이용하여 상기 입력 대사 증후군 발병 요인 값 및 상기 특정 질환의 상기 질환 발병 위험도를 데이터셋으로 학습하는 학습 단계; 및

상기 딥러닝 학습 모델로 상기 질환 발병 위험도를 예측하는 단계;를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
제12항에 있어서,

상기 학습 단계는,

상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하는 단계;

상기 학습 데이터의 분석을 통해 정상 범위의 정상 대사 증후군 발병 요인 값을 산출하는 단계; 및

상기 입력 대사 증후군 발병 요인 값이 상기 정상 대사 증후군 발병 요인 값을 기준으로 형성된 특정 범위를 초과하였는지 판단하는 단계;를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
제12항에 있어서,

상기 학습 단계는,

상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하는 단계; 및

상기 학습 데이터에서 상기 질환 발병 위험도를 추출하는 단계;를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
제14항에 있어서,

상기 학습 단계는,

특정한 상황 데이터를 이상 특징 정보에 매칭하여 누적하는 단계;

상기 입력 대사 증후군 발병 요인 값 내에서 특정한 이상 특징 정보를 인식하는 단계; 및

상기 인식된 이상 특징 정보에 상응하는 상황 데이터를 클라이언트로 전송하는 단계;를 더 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
제12항에 있어서,

상기 질환 발병 위험도 예측 단계는,

상기 빅데이터를 로지스틱 회귀 분석으로 분석하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
제12항에 있어서,

상기 특정 질환은,

고혈압, 이상지질혈증, 당뇨병, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
제17항에 있어서,

상기 질환 발병 위험도 예측 단계는,

상기 빅데이터를 기반으로, 상기 고혈압, 상기 이상지질혈증, 및 상기 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측하는 단계; 및

상기 빅데이터 및 상기 예측된 대사 증후군의 위험도를 기반으로, 상기 관상 동맥 질환, 상기 뇌졸증, 및 상기 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측하는 단계를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
제12항에 있어서,

상기 질환 발병 위험도는,

상기 특정 질환의 발병 시기 및 상기 특정 질환의 발병률 중 적어도 하나를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
하드웨어인 컴퓨터와 결합되어, 제11항 내지 제19항의 빅데이터 기반의 질환 발병 위험도 예측 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된, 빅데이터 기반의 질환 발병 위험도 예측 프로그램.