KR102536982B1

KR102536982B1 - 문진표를 이용한 인공지능 기반의 질병 예측 방법 및 장치

Info

Publication number: KR102536982B1
Application number: KR1020210052933A
Authority: KR
Inventors: 박진수; 김성렬
Original assignee: 순천향대학교 산학협력단
Priority date: 2021-04-23
Filing date: 2021-04-23
Publication date: 2023-05-26
Also published as: KR20220146084A

Abstract

본 명세서는 질병 예측 방법 및 장치에 관한 것으로 보다 상세하게는, 문진표를 이용한 인공지능 기반의 질병 예측 방법 및 장치에 관한 것이다. 본 명세서의 일 실시예에 따른 질병 예측 방법은 학습 대상 환자의 문진표 데이터를 포함하는 학습데이터를 수집하여 질병 결과 항목을 포함하는 데이터 테이블을 생성하는 단계, 생성된 데이터 테이블에 포함된 학습데이터의 항목 중 임의의 항목과 상기 질병 결과 항목간의 상관 계수를 질병 결과 항목별로 산출하는 단계, 상관 계수를 기반으로 산출된 조합항목을 입력으로 하여 인공지능 시스템을 학습시키는 단계 및 학습된 인공지능 시스템을 이용하여 테스트 대상 환자의 문진표 데이터를 포함하는 테스트데이터로부터 질병을 예측하는 단계를 포함한다.

Description

문진표를 이용한 인공지능 기반의 질병 예측 방법 및 장치{ARTIFICIAL INTELLIGENCE-BASED DISEASE PREDICTION METHOD AND APPARATUS USING MEDICAL QUESTIONNAIRE}

본 명세서는 질병 예측 방법 및 장치에 관한 것으로 보다 상세하게는, 문진표를 이용한 인공지능 기반의 질병 예측 방법 및 장치에 관한 것이다.

최근 인공지능 시스템의 발달로 인간의 많은 활동 영역이 대체되고 있다. 그 중 하나로써 의사의 환자에 대한 질병 진단 행위 및 환자 맞춤형 의약 처방 행위도 인공지능 시스템에 의해 대체될 수 있도록 많은 연구가 선행되고 있다.

이러한 인공지능 시스템은 학습을 수행하기 위해 학습데이터를 필요로 한다. 그러나, 종래의 질병 예측 시스템은 학습데이터를 획득하기 위해 환자에 약물을 투약해야하는 번거로움이 있으며, 학습데이타의 특징 간의 상관 관계 등을 전혀 고려하지 않아 예측된 질병의 정확도가 떨어지는 문제점이 있다.

또한, 종래의 질병 예측 시스템은 학습데이터를 확보하기 위해 환자를 위한 특정 장치를 제작하여야하는 번거로움이 있어, 이러한 문제점을 보완할 필요성이 대두되고 있다.

삭제

대한민국특허 공개번호 10-2021-0089469호

본 명세서의 목적은 문진표를 학습데이터로 이용함으로써 특정 장치 없이도 복합적인 질병을 정밀하게 예측할 수 있는 질병 예측 방법 및 장치를 제공하는 것이다.

또한, 본 명세서의 목적은 항목간의 상관 계수를 기반으로 최적의 조합항목을 산출함으로써 불필요한 데이터를 이용하는 번거로움을 피하고, 질병 예측 정확도를 높일 수 있는 질병 예측 방법 및 장치를 제공하는 것이다.

본 명세서의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 명세서의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 명세서의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 명세서의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.

본 명세서의 일 실시예에 따른 질병 예측 방법은 학습 대상 환자의 문진표 데이터를 포함하는 학습데이터를 수집하여 질병 결과 항목을 포함하는 데이터 테이블을 생성하는 단계, 생성된 데이터 테이블에 포함된 학습데이터의 항목 중 임의의 항목과 상기 질병 결과 항목간의 상관 계수를 질병 결과 항목별로 산출하는 단계, 상관 계수를 기반으로 산출된 조합항목을 입력으로 하여 인공지능 시스템을 학습시키는 단계 및 학습된 인공지능 시스템을 이용하여 테스트 대상 환자의 문진표 데이터를 포함하는 테스트데이터로부터 질병을 예측하는 단계를 포함한다.

또한, 본 명세서의 일 실시예에서 학습데이터는 학습 대상 환자의 검진 데이터 및 학습 대상 환자의 환경 데이터 중 적어도 하나를 더 포함하고, 테스트데이터는 테스트 대상 환자의 검진 데이터 및 상기 테스트 대상 환자의 환경 데이터 중 적어도 하나를 더 포함한다.

또한, 본 명세서의 일 실시예에서 상관 계수는 하기의 식 1에 의해 산출된다.

<식 1>

여기서, ρ_X,Y는 X와 Y의 상관 계수, X는 학습데이터의 항목 중 임의의 항목, Y는 질병 결과 항목, cov(X,Y)는 공분산, σ_X는 X의 표준편차, σ_Y는 Y의 표준편차, μ_X는 X의 평균, μ_Y는 Y의 평균을 의미한다.

또한, 본 명세서의 일 실시예에서 상관 계수를 기반으로 산출된 조합항목을 입력으로 하여 인공지능 시스템을 학습시키는 단계는 산출된 상관 계수가 미리 설정된 기준값 이상인 경우 상기 상관 계수의 산출에 이용된 학습데이터의 항목을 조합대상항목으로 결정하는 단계 및 결정된 조합대상항목을 이용하여 상기 조합항목을 산출하는 단계를 포함한다.

또한, 본 명세서의 일 실시예에서 조합항목은 하기의 식 2에 의해 산출된다.

<식 2>

여기서, X_P+1는 조합항목이고, X_0,X1, …, X_P 는 조합대상항목을 의미한다.

본 명세서의 일 실시예에 따른 질병 예측 장치는 학습 대상 환자의 문진표 데이터를 포함하는 학습데이터를 수집하여 질병 결과 항목을 포함하는 데이터 테이블을 생성하는 테이블 생성부, 생성된 데이터 테이블에 포함된 학습데이터의 항목 중 임의의 항목과 상기 질병 결과 항목간의 상관 계수를 질병 결과 항목별로 산출하는 상관 계수 산출부, 상관 계수를 기반으로 산출된 조합항목을 입력으로 하여 인공지능 시스템을 학습시키는 학습부 및 학습된 인공지능 시스템을 이용하여 테스트 대상 환자의 문진표 데이터를 포함하는 테스트데이터로부터 질병을 예측하는 질병 예측부를 포함한다.

또한, 본 명세서의 일 실시예에서 학습데이터는 상기 학습 대상 환자의 검진 데이터 및 상기 학습 대상 환자의 환경 데이터 중 적어도 하나를 더 포함하고, 테스트데이터는 상기 테스트 대상 환자의 검진 테이터 및 상기 테스트 대상 환자의 환경 데이터 중 적어도 하나를 더 포함한다.

<식 1>

또한, 본 명세서의 일 실시예에서 상관 계수 산출부는 산출된 상관 계수가 미리 설정된 기준값 이상인 경우 상기 상관 계수의 산출에 이용된 학습데이터의 항목을 조합대상항목으로 결정하고, 상기 결정된 조합대상항목을 이용하여 상기 조합항목을 산출한다.

<식 2>

본 명세서의 일 실시예에 따른 질병 예측 방법 및 장치는 문진표를 학습데이터로 이용함으로써 특정 장치 없이도 복합적인 질병을 정밀하게 예측할 수 있다.

또한, 본 명세서의 일 실시예에 따른 질병 예측 방법 및 장치는 항목간의 상관 계수를 기반으로 최적의 조합항목을 산출함으로써 불필요한 데이터를 이용하는 번거로움을 피하고, 질병 예측 정확도를 높일 수 있다.

도 1은 본 명세서의 일 실시예에 따른 질병 예측 장치의 구성도이다.
도 2는 본 명세서의 일 실시예에서 데이터 테이블을 나타낸 도면이다.
도 3은 본 명세서의 일 실시예에서 상관 관계를 갖는 두 항목간의 산포도를 나타낸 그래프이다.
도 4는 본 명세서의 일 실시예에서 상관 관계가 없는 두 항목간의 산포도를 나타낸 그래프이다.
도 5은 본 명세서의 일 실시예에 따른 질병 예측 방법의 순서도이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명한다.

도 1은 본 명세서의 일 실시예에 따른 질병 예측 장치의 구성도이다.

도면을 참조하면, 질병 예측 장치(10)는 인공지능 시스템을 이용하여 환자의 질병을 예측하는 장치로써 테이블 생성부(100), 상관 계수 산출부(200), 학습부(300) 및 질병 예측부(400)를 포함한다.

테이블 생성부(100)는 문진표 데이터를 포함하는 학습데이터를 수집하여 데이터 테이블을 생성한다. 문진표란 검진 대상자의 건강 검진 등을 위해 문진항목을 작성한 표로써, 질병의 유무, 가족 질환, 복용중인 약, 평소 생활 습관 등 검진 대상자에 대한 사전정보를 얻기 위해 사용된다.

학습데이터는 인공지능 시스템을 학습시키기 위해 사용되는 데이터로써, 본 명세서의 질병 예측 장치(10)는 학습 대상 환자의 문진표 각각의 문진항목에 대한 응답인 문진표 데이터를 학습데이터로 사용한다. 문진표 데이터에는 예를 들어, 과거 질환력, 가족력, 흡연 여부, 음주량, 운동량 등 학습 대상 환자 개인에 대한 정보가 포함될 수 있으며, 문진표 데이터는 학습 대상 환자 별로 서로 다를 수 있다.

학습데이터는 학습 대상 환자의 검진 데이터 및 환경 데이터 중 적어도 하나를 더 포함하여 수집될 수 있다. 여기서, 검진 데이터는 학습 대상 환자의 건강 검진 결과에 대한 데이터로 예컨대, 학습 대상 환자의 신장, 체중, 허리둘레, 시력, 혈압, 총콜레스테롤, 공복혈당 등의 일반건강검진 결과에 대한 데이터일 수 있다. 또한, 환경 데이터는 학습 대상 환자의 주거지, 주거지 주변의 연평균 미세먼지 농도, 주거지 주변의 유해물질 배출 공장 존부 등 학습 대상 환자 주변의 환경에 대한 데이터일 수 있다

본 명세서의 질병 예측 장치(10)는 문진표 데이터뿐만 아니라 학습 대상 환자의 검진 데이터 및 환경 데이터를 동시에 사용한 학습데이터를 이용함으로써 보다 구체적으로 인공지능 시스템을 학습시킬 수 있다.

또한, 테이블 생성부(100)는 질병 결과 항목을 포함하는 데이터 테이블을 생성한다. 여기서, 질병 결과 항목은 학습 대상 환자의 학습데이터를 분석하여 판단된 질병 결과를 기재한 항목이다. 예컨대, 학습 대상 환자의 학습데이터가 폐결핵 가족력이 있고, 발열 증상이 있으며, 체중감소 및 3주 이상의 호흡기 기침 증상이 있는 경우 질병 결과는 폐결핵일 수 있다.

테이블 생성부(100)는 학습데이터와 함께 질병 결과 항목을 포함하여 데이터 테이블을 생성함으로써 인공지능 시스템을 학습시킬 수 있다. 즉, 인공지능 시스템은 지도 학습(Supervised Learning)으로 정답이 있는 데이터를 활용해 스스로 학습할 수 있다. 여기서, 학습데이터는 인공지능 시스템을 학습하기 위해 입력될 입력값이고, 질병 결과 항목은 입력값에 대한 Label인 정답이 될 수 있다.

상관 계수 산출부(200)는 생성된 데이터 테이블에 포함된 항목들의 상관 계수를 산출한다. 구체적으로, 상관 계수 산출부(200)는 학습데이터의 항목 중 임의의 항목과 질병 결과 항목간의 상관 계수를 질병 결과 항목별로 산출한다.

예컨대, 학습데이터의 항목 중 임의의 항목인 발열 증상과 질병 결과 항목의 폐결핵 간의 상관 계수 또는 학습데이터의 항목 중 임의의 항목인 체중감소와 질병 결과 항목의 폐결핵 간의 상관 계수를 각각 구할 수 있다.

여기서, 상관 계수는 -1(음의 상관 관계) 내지 1(양의 상관 관계) 사이의 값을 가지며, -1 또는 1에 가까울수록 두 항목의 연관성이 높다고 판단할 수 있고, 상관 계수가 0에 가까울수록 두 항목의 연관성이 낮다고 판단할 수 있다. 예를 들어, 발열 증상과 폐결핵 간의 상관 계수가 0.8이고, 체중 감소와 폐결핵 간의 상관 계수가 0.2인 경우 폐결핵에 대하여 체중 감소 보다 발열 증상이 더 높은 연관성을 갖는다고 판단할 수 있다.

한편, 상관 계수는 하기의 식 1에 의해 산출될 수 있다.

<식 1>

이와 같이, 상관 계수 산출부(200)는 학습데이터의 항목 중 임의의 항목과 질병 결과 항목에 대하여 질병 결과 항목별로 상관 계수를 산출함으로써 해당 질병에 대하여 어떠한 학습데이터의 항목이 높은 연관성을 갖는지 판단할 수 있다.

학습부(300)는 인공지능 시스템을 학습시킨다. 구체적으로, 학습부(300)는 상관 계수를 기반으로 산출된 조합항목을 입력으로 하여 인공지능 시스템을 학습시킨다.

상술한 바와 같이, 학습데이터의 항목 중 특정 항목은 특정 질병과 관련하여 높은 연관성을 가질 수 있으므로, 모든 학습데이터의 항목을 학습에 이용하는 것보다, 높은 연관성을 갖는 학습데이터의 항목만을 조합한 조합항목을 학습에 이용하는 경우 질병 예측 정확도를 높일 수 있다.

이러한 조합항목을 산출하는 방법과 관련하여, 학습부(300)는 조합대상항목을 먼저 결정하고 결정된 조합대상항목을 이용하여 조합항목을 산출할 수 있다.

구체적으로, 학습부(300)는 기준값을 미리 설정할 수 있고, 산출된 상관 계수가 미리 설정된 기준값 이상인 경우 상관 계수의 산출에 이용된 학습데이터의 항목을 조합대상항목으로 결정한다. 이때, 기준값은 상관 계수의 범위를 넘을 수 없으므로 -1 내지 1 사이의 값을 갖는다.

예를 들어, 미리 설정한 기준값이 0.7이며, 상술한 예시와 같이 발열 증상과 폐결핵간의 상관 계수가 0.8이고, 체중 감소와 폐결핵같의 상관 계수가 0.2인 경우 학습부(300)는 학습데이터의 항목인 발열 증상만을 조합대상항목으로 결정한다.

이후, 학습부(300)는 결정된 조합대상항목을 이용하여 조합항목을 산출한다. 조합항목은 하기의 식 2에 의해 산출될 수 있다.

<식 2>

여기서, X_P+1는 조합항목이고, X_0,X1,… , X_P 는 조합대상항목을 의미한다.

상기에서는 일 실시예로써 조합대상항목의 곱으로 조합항목을 산출하였으나, 반드시 이에 한정되는 것은 아니며, 조합대상항목들의 log값 또는 루트값 등 다양한 조합을 통해 최적의 조합항목이 산출될 수 있다.

이와 같이, 본 명세서의 일 실시예에 따른 질병 예측 장치(10)는 항목간의 상관 계수를 기반으로 최적의 조합항목을 산출함으로써 불필요한 데이터를 이용하는 번거로움을 피하고, 질병 예측 정확도를 높일 수 있다.

질병 예측부(400)는 학습된 인공지능 시스템을 이용하여 테스트 대상 환자의 문진표를 포함하는 테스트데이터로부터 질병을 예측한다. 테스트 대상 환자는 학습된 인공지능 시스템의 성능을 테스트하기 위해 테스트 대상이 되는 환자로써, 테스트 대상 환자의 테스트데이터는 문진표 데이터를 포함할 수 있다.

또한, 본 명세서의 일 실시예에서, 학습데이터가 학습 대상 환자의 문진표 데이터, 검진 데이터 및 환경 데이터를 포함하는 경우 이에 대응하여 테스트데이터는 테스트 대상 환자의 문진표 데이터, 검진 데이터 및 환경 데이터를 포함할 수 있다.

도 2는 본 명세서의 일 실시예에서 데이터 테이블을 나타낸 도면이다.

도면을 참조하면, 데이터 테이블(210)은 n x m 형태의 매트릭스 테이블로 형성되며, 세로축은 학습 대상 환자(211)를, 가로축은 학습데이터에 포함된 각각의 항목(212)을 포함한다. 여기서, 학습데이터는 학습 대상 환자의 문진표 데이터(213), 검진 데이터(214) 및 환경 데이터(215)일 수 있다.

문진표 데이터(213)는 학습 대상 환자의 문진표 각각의 문진항목에 대한 응답 데이터이며 예를 들어, 과거질환력, 가족력, 흡연 여부, 음주량, 운동량 등 학습 대상 환자 개인에 대한 정보가 포함될 수 있다.

검진 데이터(214)는 학습 대상 환자의 건강 검진 결과에 대한 데이터로 예컨대, 학습 대상 환자의 신장, 체중, 허리둘레, 시력, 혈압, 총콜레스테롤, 공복혈당 등의 일반건강검진 결과에 대한 데이터일 수 있다.

환경 데이터(215)는 학습 대상 환자의 주거지, 주거지 주변의 연평균 미세먼지 농도, 주거지 주변의 유해물질 배출 공장 존부 등 학습 대상 환자 주변의 환경에 대한 데이터일 수 있다.

또한, 본 명세서의 일 실시예에서 데이터 테이블(210)은 질병 결과 항목(216)을 더 포함할 수 있다. 질병 결과 항목(216)은 학습 대상 환자의 학습데이터를 분석하여 판단된 질병 결과를 기재한 항목이다. 예컨대, 학습 대상 환자의 학습데이터가 폐결핵 가족력이 있고, 발열 증상이 있으며, 체중감소 및 3주 이상의 호흡기 기침 증상이 있는 경우 질병 결과는 폐결핵일 수 있다.

이와 같이, 데이터 테이블(210)은 학습 대상 환자의 문진표 데이터(213), 검진 데이터(214), 환경 데이터(215) 및 질병 결과 항목(216) 등 다양한 정보를 포함함으로써 인공지능 시스템 학습시 특정 질병에 대하여 복합적인 요소들이 고려될 수 있다.

한편, 특정 요소는 특정 질병에 대하여 높은 연관성을 가질 수 있다. 특정 질병에 대하여 높은 연관성을 갖는 항목에 대하여 인공지능 시스템을 학습시키는 경우 보다 질병 예측의 정확도를 높일 수 있다. 이를 위해, 질병 예측 장치(10)는 데이터 테이블(210)에 포함된 학습데이터의 항목 중 임의의 항목과 질병 결과 항목간의 상관 계수를 질병 결과 항목별로 산출할 수 있다.

도 3은 본 명세서의 일 실시예에서 상관 관계를 갖는 두 항목간의 산포도를 나타낸 그래프이고, 도 4는 본 명세서의 일 실시예에서 상관 관계가 없는 두 항목간의 산포도를 나타낸 그래프이다. 이하, 도 3 및 도 4를 참조하여 설명하도록 한다.

도 3 및 도 4은 예시적인 분석 데이터로써 학습데이터의 항목 중 임의의 항목과 상기 질병 결과 항목간의 상관 관계가 아닌 학습데이터에서 임의의 두 항목을 추출하여 두 항목간의 상관 관계를 비교하였다.

구체적으로, 도 3 및 도 4에서는 학습데이터 중 하나의 항목인 의료 보험비에 대하여 적절한 의료 보험비를 산정하기 위해 다른 항목인 나이 및 자녀수와의 상관 관계를 각각 비교하였다.

도 3을 참조하면, 가로축에는 학습 대상 환자가 부담 중인 의료 보험비(220)가 나타나고, 세로축에는 학습 대상 환자의 나이(222)가 나타난다. 그래프를 보면 학습 대상 환자의 나이(222)가 증가함에 따라 학습 대상 환자가 부담 중인 의료 보험비(220)가 비례하여 증가하는 경향을 보인다.

도 4를 참조하면, 가로축에는 학습 대상 환자가 부담 중인 의료 보험비(220)가, 세로축에는 학습 대상 환자의 자녀수(224)가 나타난다. 그래프를 보면 학습 대상 환자의 자녀수(224)가 증가하여도 학습 대상 환자가 부담 중인 의료 보험비(220)가 비례하여 증가하지 않고, 자녀수가 3명일 때까지 비슷하다가 4명 이후부터는 오히려 의료 보험비가 감소한다.

결과적으로, 도 3의 두 항목인 학습 대상 환자의 의료 보험비(220)와 나이(222)는 서로 상관 관계가 있고, 도 4의 두 항목인 학습 대상 환자의 의료 보험비(220)와 자녀수(224)는 서로 상관 관계가 없다. 이는, 산포도의 분포에 의해 시각적으로도 판단될 수 있다.

따라서, 의료 보험비를 산정할 때, 상관 관계가 높은 항목인 나이는 높은 가중치를 두어 의료 보험비를 산정하고, 상관 관계가 낮은 항목인 자녀수는 고려하지 않거나 낮은 가중치를 두어 의료 보험비를 산정할 수 있다.

한편, 두 항목간의 상관 관계가 높은지 또는 낮은지 여부는 두 항목간의 상관 계수를 산출하여 확인할 수 있다. 상관 계수가 1 또는 -1에 가까울 수록 산포도가 밀집된 그래프를 가지며, 상관 계수가 0에 가까울 수록 산포도가 산개된 그래프를 갖는다. 따라서, 의료 보험비 산정시 상관 관계의 높고 낮음도 고려하여 의료 보험비 산정에 반영할 수 있고, 합리적인 의료 보험비를 산정할 수 있다.

도 5은 본 명세서의 일 실시예에 따른 질병 예측 방법의 순서도이다.

도면을 참조하면, 질병 예측 장치(10)는 학습 대상 환자의 문진표 데이터를 포함하는 학습데이터를 수집하여 질병 결과 항목을 포함하는 데이터 테이블을 생성한다(S100).

여기서, 학습데이터는 인공지능 시스템을 학습시키기 위해 사용되는 데이터로써 학습 대상 환자의 검진 데이터 및 상기 학습 대상 환자의 환경 데이터 중 적어도 하나를 더 포함할 수 있다.

이후, 질병 예측 장치(10)는 생성된 데이터 테이블에 포함된 학습데이터의 항목 중 임의의 항목과 상기 질병 결과 항목간의 상관 계수를 질병 결과 항목별로 산출한다(S200).

또한, 질병 예측 장치(10)는 상기 상관 계수를 기반으로 산출된 조합항목을 입력으로 하여 인공지능 시스템을 학습시킨다(S300). 구체적으로, 질병 예측 장치(10)는 산출된 상관 계수가 미리 설정된 기준값 이상인 경우 상관 계수의 산출에 이용된 학습데이터의 항목을 조합대상항목으로 결정하고, 결정된 조합대상항목을 이용하여 조합항목을 산출한다.

마지막으로 질병 예측 장치(10)는 상기 학습된 인공지능 시스템을 이용하여 테스트 대상 환자의 문진표 데이터를 포함하는 테스트데이터로부터 질병을 예측한다(S400). 이때, 학습데이터가 학습 대상 환자의 검진 데이터 및 환경 데이터 중 적어도 하나를 더 포함하는 경우, 테스트데이터 또한 테스트 대상 환자의 검진 데이터 및 환경 데이터 중 적어도 하나를 더 포함할 수 있다.

위와 같이 본 명세서의 일 실시예에 따른 질병 예측 방법은 문진표를 학습데이터로 이용함으로써 특정 장치 없이도 복합적인 질병을 정밀하게 예측할 수 있다.

또한, 본 명세서의 일 실시예에 따른 질병 예측 방법은 항목간의 상관 계수를 기반으로 최적의 조합항목을 산출함으로써 불필요한 데이터를 이용하는 번거로움을 피하고, 질병 예측 정확도를 높일 수 있다.

이상과 같이 본 발명에 대해서 예시한 도면을 참조로 하여 설명하였으나, 본 명세서에 개시된 실시 예와 도면에 의해 본 발명이 한정되는 것은 아니며, 본 발명의 기술사상의 범위 내에서 통상의 기술자에 의해 다양한 변형이 이루어질 수 있음은 자명하다. 아울러 앞서 본 발명의 실시 예를 설명하면서 본 발명의 구성에 따른 작용 효과를 명시적으로 기재하여 설명하지 않았을지라도, 해당 구성에 의해 예측 가능한 효과 또한 인정되어야 함은 당연하다.

Claims

질병 예측 장치를 이용하여 질병을 예측하는 방법에 있어서,
테이블 생성부가 학습 대상 환자의 문진표 데이터를 포함하는 학습데이터를 수집하여 질병 결과 항목을 포함하는 데이터 테이블을 생성하는 단계;
상관 계수 산출부가 상기 생성된 데이터 테이블에 포함된 학습데이터의 항목 중 임의의 항목과 상기 질병 결과 항목간의 상관 계수를 질병 결과 항목별로 산출하는 단계;
학습부가 상기 상관 계수를 기반으로 산출된 조합항목을 입력으로 하여 인공지능 시스템을 학습시키는 단계; 및
질병 예측부가 상기 학습된 인공지능 시스템을 이용하여 테스트 대상 환자의 문진표 데이터를 포함하는 테스트데이터로부터 질병을 예측하는 단계를 포함하고,
상기 상관 계수는
하기의 식 1에 의해 산출되는 질병 예측 방법.

<식 1>

여기서, ρ_X,Y는 X와 Y의 상관 계수, X는 학습데이터의 항목 중 임의의 항목, Y는 질병 결과 항목, cov(X,Y)는 공분산, σ_X는 X의 표준편차, σ_Y는 Y의 표준편차, μ_X는 X의 평균, μ_Y는 Y의 평균을 의미한다.
제1항에 있어서,
상기 학습데이터는 상기 학습 대상 환자의 검진 데이터 및 상기 학습 대상 환자의 환경 데이터 중 적어도 하나를 더 포함하고,
상기 테스트데이터는 상기 테스트 대상 환자의 검진 데이터 및 상기 테스트 대상 환자의 환경 데이터 중 적어도 하나를 더 포함하는
질병 예측 방법.
삭제
제1항에 있어서
상기 상관 계수를 기반으로 산출된 조합항목을 입력으로 하여 인공지능 시스템을 학습시키는 단계는
상기 산출된 상관 계수가 미리 설정된 기준값 이상인 경우 상기 상관 계수의 산출에 이용된 학습데이터의 항목을 조합대상항목으로 결정하는 단계; 및
상기 결정된 조합대상항목을 이용하여 상기 조합항목을 산출하는 단계를 포함하는
질병 예측 방법.
제4항에 있어서,
상기 조합항목은
하기의 식 2에 의해 산출되는 질병 예측 방법.

<식 2>

여기서, X_P+1는 조합항목이고, X_0,X1, …, X_P 는 조합대상항목을 의미한다.
학습 대상 환자의 문진표 데이터를 포함하는 학습데이터를 수집하여 질병 결과 항목을 포함하는 데이터 테이블을 생성하는 테이블 생성부;
상기 생성된 데이터 테이블에 포함된 학습데이터의 항목 중 임의의 항목과 상기 질병 결과 항목간의 상관 계수를 질병 결과 항목별로 산출하는 상관 계수 산출부;
상기 상관 계수를 기반으로 산출된 조합항목을 입력으로 하여 인공지능 시스템을 학습시키는 학습부; 및
상기 학습된 인공지능 시스템을 이용하여 테스트 대상 환자의 문진표 데이터를 포함하는 테스트데이터로부터 질병을 예측하는 질병 예측부를 포함하고,
상기 상관 계수는
하기의 식 1에 의해 산출되는 질병 예측 장치.

<식 1>

여기서, ρ_X,Y는 X와 Y의 상관 계수, X는 학습데이터의 항목 중 임의의 항목, Y는 질병 결과 항목, cov(X,Y)는 공분산, σ_X는 X의 표준편차, σ_Y는 Y의 표준편차, μ_X는 X의 평균, μ_Y는 Y의 평균을 의미한다.
제6항에 있어서,
상기 학습데이터는 상기 학습 대상 환자의 검진 데이터 및 상기 학습 대상 환자의 환경 데이터 중 적어도 하나를 더 포함하고,
상기 테스트데이터는 상기 테스트 대상 환자의 검진 테이터 및 상기 테스트 대상 환자의 환경 데이터 중 적어도 하나를 더 포함하는
질병 예측 장치.
삭제
제6항에 있어서
상기 상관 계수 산출부는
상기 산출된 상관 계수가 미리 설정된 기준값 이상인 경우 상기 상관 계수의 산출에 이용된 학습데이터의 항목을 조합대상항목으로 결정하고, 상기 결정된 조합대상항목을 이용하여 상기 조합항목을 산출하는
질병 예측 장치.
제9항에 있어서,
상기 조합항목은
하기의 식 2에 의해 산출되는 질병 예측 장치.

<식 2>

여기서, X_P+1는 조합항목이고, X_0,X1,… , X_P 는 조합대상항목을 의미한다.