KR101955526B1 - 혈액종합검사 소견 생성 방법 및 시스템 - Google Patents

혈액종합검사 소견 생성 방법 및 시스템 Download PDF

Info

Publication number
KR101955526B1
KR101955526B1 KR1020170053455A KR20170053455A KR101955526B1 KR 101955526 B1 KR101955526 B1 KR 101955526B1 KR 1020170053455 A KR1020170053455 A KR 1020170053455A KR 20170053455 A KR20170053455 A KR 20170053455A KR 101955526 B1 KR101955526 B1 KR 101955526B1
Authority
KR
South Korea
Prior art keywords
learning
data
neural network
generating
examination
Prior art date
Application number
KR1020170053455A
Other languages
English (en)
Other versions
KR20180119834A (ko
Inventor
최호진
김유진
현종환
오교중
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020170053455A priority Critical patent/KR101955526B1/ko
Publication of KR20180119834A publication Critical patent/KR20180119834A/ko
Application granted granted Critical
Publication of KR101955526B1 publication Critical patent/KR101955526B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physiology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

혈액종합검사 소견 생성 방법은 학습 환자 정보, 학습 검사 결과, 및 학습 소견 문장을 포함하는 학습 데이터를 수신하고, 학습 데이터에 대한 제1 전처리 동작을 수행함으로써 표준화 학습 데이터를 생성하며, 표준화 학습 데이터에 기초하여 심층 신경망을 생성하고, 검진 환자 정보 및 검진 검사 결과를 포함하는 검진 데이터를 수신하며, 검진 데이터에 대한 제2 전처리 동작을 수행함으로써 표준화 검진 데이터를 생성하고, 심층 신경망을 이용하여 표준화 검진 데이터에 대응하는 검진 소견을 생성한다.

Description

혈액종합검사 소견 생성 방법 및 시스템{METHOD AND SYSTEM FOR GENERATING CLINICAL OPINION OF BLOOD SCREENING TEST}
본 발명은 혈액종합검사에 대한 의사결정지원 시스템에 관한 것으로, 보다 상세하게는 심층 신경망을 이용한 혈액종합검사 소견 생성 방법 및 시스템에 관한 것이다.
혈액종합검사는 성인병, 5대암, 당뇨, 갑상선질환, 심장질환 등의 진단을 위해 사용된다. 최근, 건강에 대한 관심이 증가함에 따라 혈액종합검사에 대한 수요는 점점 증가하고 있다. 혈액종합검사 결과는 의료 전문인에 의해 판독되므로, 혈액종합검사에 대한 수요가 증가함에 따라, 혈액종합검사 결과의 판독에 대한 의료 전문인의 부담이 가중되고 있다. 이에 따라, 혈액종합검사 결과의 판독에 대한 인적 오류의 가능성이 높아질 수 있다.
이러한 문제를 해결하기 위한 방법으로, 혈액종합검사 결과의 판독 및 소견 생성에 있어서 임상 의사결정지원 시스템(clinical decision support system)이 연구되고 있다. 일반적인 임상적 의사결정지원 시스템은 미리 결정된 룰에 기초하여 의사 결정하는 룰-베이스(Rule-Based) 알고리즘을 기반으로 한다. 그러나, 룰-베이스 알고리즘은 의료/인공지능 전문가에 의해 룰-베이스를 미리 구축하여야 하며, 이는 많은 시간 및 비용이 요구되는 문제가 있다.
본 발명의 일 목적은 기계 학습을 통해 검진 소견 생성 효율 및 정확도를 높일 수 있는 혈액종합검사 소견 생성 방법을 제공하는 것이다.
본 발명의 다른 목적은 상기 혈액종합검사 소견 생성 방법을 수행하는 혈액종합검사 소견 생성 시스템을 제공하는 것이다.
다만, 본 발명의 목적은 상기 목적들로 한정되는 것이 아니며, 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위에서 다양하게 확장될 수 있을 것이다.
본 발명의 일 목적을 달성하기 위하여, 본 발명의 실시예들에 따른 혈액종합검사 소견 생성 방법은 학습 환자 정보, 학습 검사 결과, 및 학습 소견 문장을 포함하는 학습 데이터를 수신하는 단계, 상기 학습 데이터에 대한 제1 전처리 동작을 수행함으로써 표준화 학습 데이터를 생성하는 단계, 상기 표준화 학습 데이터에 기초하여 심층 신경망(deep neural network)을 생성하는 단계, 검진 환자 정보 및 검진 검사 결과를 포함하는 검진 데이터를 수신하는 단계, 상기 검진 데이터에 대한 제2 전처리 동작을 수행함으로써 표준화 검진 데이터를 생성하는 단계, 및 상기 심층 신경망을 이용하여 상기 표준화 검진 데이터에 대응하는 검진 소견을 생성할 수 있다.
일 실시예에 의하면, 상기 표준화 학습 데이터를 생성하는 단계는 상기 학습 검사 결과에 포함된 항목들 각각을 상기 항목들의 형태(type)에 따라 수치형 데이터 및 분류형 데이터 중 하나로 변환하는 단계, 및 상기 분류형 데이터를 원-핫(one-hot) 인코딩함으로써 인코딩 데이터를 생성하고, 상기 수치형 데이터 및 상기 인코딩 데이터에 기초하여 상기 학습 검사 결과에 상응하는 벡터를 생성하는 단계를 포함할 수 있다.
일 실시예에 의하면, 상기 심층 신경망은 상기 학습 환자 정보 및 상기 학습 검사 결과가 입력되는 경우 상기 학습 소견 문장이 출력되도록 은닉층(hidden layer) 개수, 노드(node) 개수, 가중치(weight), 및 활성화 함수(activation function)가 결정될 수 있다.
일 실시예에 의하면, 상기 심층 신경망의 마지막 활성화 함수는 시그모이드(sigmoid) 함수일 수 있다.
일 실시예에 의하면, 상기 검진 소견을 생성하는 단계는 상기 표준화 검진 데이터를 상기 심층 신경망에 입력하는 단계, 상기 심층 신경망의 상기 시그모이드 함수를 통해 소견 문장들 각각에 대한 확률값을 도출하는 단계, 문턱값을 이용하여 상기 확률값에서 상기 소견 문장들에 대한 지시자 벡터(indicator vector)를 도출하는 단계, 및 상기 지시자 벡터에 기초하여 상기 검진 소견을 생성하는 단계를 포함할 수 있다.
일 실시예에 의하면, 상기 학습 검사 결과는 혈당, 신장-통풍-관절염, 간 기능, 전해질, 지질-심혈관, 간염, 성병, 철, 혈액, 혈액형, 췌장, 염증, 소변, 갑상선, 및 종양표지자 중 적어도 하나에 대응하는 항목을 포함할 수 있다.
본 발명의 다른 목적을 달성하기 위하여, 발명의 실시예들에 따른 혈액종합검사 소견 생성 시스템은 학습 환자 정보, 학습 검사 결과, 및 학습 소견 문장을 포함하는 학습 데이터에 대한 제1 전처리 동작을 수행함으로써 표준화 학습 데이터를 생성하고, 검진 환자 정보 및 검진 검사 결과를 포함하는 검진 데이터에 대한 제2 전처리 동작을 수행함으로써 표준화 검진 데이터를 생성하는 전처리 모듈, 상기 표준화 학습 데이터에 기초하여 심층 신경망(deep neural network)을 생성하는 심층 신경망 학습 모듈, 및 상기 심층 신경망을 이용하여 상기 표준화 검진 데이터에 대응하는 검진 소견을 생성하는 심층 신경망 추론 모듈을 포함할 수 있다.
일 실시예에 의하면, 상기 전처리 모듈은 상기 학습 검사 결과 또는 상기 검진 검사 결과에 포함된 항목들 각각을 상기 항목들의 형태(type)에 따라 수치형 데이터 및 분류형 데이터 중 하나로 변환하고, 상기 분류형 데이터를 원-핫(one-hot) 인코딩함으로써 인코딩 데이터를 생성하며, 상기 수치형 데이터 및 상기 인코딩 데이터에 기초하여 상기 학습 검사 결과 또는 상기 검진 검사 결과에 상응하는 벡터를 생성할 수 있다.
일 실시예에 의하면, 상기 심층 신경망 학습 모듈은 상기 학습 환자 정보 및 상기 학습 검사 결과가 입력되는 경우 상기 학습 소견 문장이 출력되도록 상기 심층 신경망의 은닉층(hidden layer) 개수, 노드(node) 개수, 가중치(weight), 및 활성화 함수(activation function)를 결정할 수 있다.
일 실시예에 의하면, 상기 심층 신경망의 마지막 활성화 함수는 시그모이드(sigmoid) 함수이고, 상기 심층 신경망 추론 모듈은 상기 표준화 검진 데이터를 상기 심층 신경망에 입력함으로써 소견 문장들 각각에 대한 확률값을 도출하며, 문턱값을 이용하여 상기 확률값에서 상기 소견 문장들에 대한 지시자 벡터(indicator vector)를 도출하고, 상기 지시자 벡터에 기초하여 상기 검진 소견을 생성할 수 있다.
본 발명의 실시예들에 따른 혈액종합검사 소견 생성 방법은 학습 데이터를 이용하여 심층 신경망을 생성하고, 심층 신경망을 통해 검진 데이터에 대한 검진 소견을 생성할 수 있으므로, 룰-베이스(Rule-base)를 구축할 필요가 없다. 따라서, 상기 혈액종합검사 소견 생성 방법은 룰-베이스 구축 단계에서 발생하는 의료 전문가 및 인공지능 전문가의 부담을 줄일 수 있으며, 인적 오류의 가능성을 배제할 수 있다.
또한, 혈액종합검사 소견 생성 방법은 새로운 데이터를 지속적으로 학습하고, 방대한 데이터를 바탕으로 검진 소견을 작성하므로, 높은 성능(정확도, 정밀도, 재현도, 등)을 기대할 수 있다.
본 발명의 실시예들에 따른 혈액종합검사 소견 생성 시스템은 상기 혈액종합검사 소견 생성 방법을 수행함에 따라 검진 소견 생성 효율 및 정확도를 높일 수 있다.
다만, 본 발명의 효과는 상기 효과들로 한정되는 것이 아니며, 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위에서 다양하게 확장될 수 있을 것이다.
도 1은 본 발명의 실시예들에 따른 혈액종합검사 소견 생성 방법을 나타내는 순서도이다.
도 2는 도 1의 혈액종합검사 소견 생성 방법에서 심층 신경망 학습 과정을 설명하기 위한 도면이다.
도 3는 도 1의 혈액종합검사 소견 생성 방법에서 심층 신경망 추론 과정을 설명하기 위한 도면이다.
도 4는 도 1의 혈액종합검사 소견 생성 방법에서 학습 데이터 또는 검진 데이터에 대한 전처리 동작의 일 예를 나타내는 도면이다.
도 5는 도 1의 혈액종합검사 소견 생성 방법에서 생성된 심층 신경망의 일 예를 나타내는 도면이다.
도 6은 도 1의 혈액종합검사 소견 생성 방법에서 검진 소견을 생성하는 방법을 설명하기 위한 도면이다.
도 7은 본 발명의 실시예들에 따른 혈액종합검사 소견 생성 시스템을 나타내는 블록도이다.
이하, 첨부한 도면들을 참조하여, 본 발명의 실시예들을 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성 요소에 대해서는 동일하거나 유사한 참조 부호를 사용한다.
도 1은 본 발명의 실시예들에 따른 혈액종합검사 소견 생성 방법을 나타내는 순서도이다. 도 2는 도 1의 혈액종합검사 소견 생성 방법에서 심층 신경망 학습 과정을 설명하기 위한 도면이다. 도 3는 도 1의 혈액종합검사 소견 생성 방법에서 심층 신경망 추론 과정을 설명하기 위한 도면이다.
도 1 내지 도 3을 참조하면, 혈액종합검사 소견 생성 방법은 혈액종합검사의 검사 결과를 기반으로 심층 신경망(deep neural network)을 구축하고, 구축된 심층 신경망을 이용하여 혈액종합검사 결과를 판독하고 검진 소견을 생성할 수 있다. 여기서, 혈액종합검사는 혈액검사, 소변검사, 등 인체의 건강을 검진하기 위한 다양한 검사를 포함하는 의미를 나타낸다.
도 1에 도시된 바와 같이, 혈액종합검사 소견 생성 방법은 학습 데이터에 기초하여 심층 신경망을 구축하는 심층 신경망 학습 과정(S110, S120, S130) 및 구축된 심층 신경망을 이용하여 검진 데이터에 대한 검진 소견이 생성되는 심층 신경망 추론 과정(S210, S220, S230)을 포함할 수 있다.
구체적으로, 혈액종합검사 소견 생성 시스템은 학습 환자 정보, 학습 검사 결과, 및 학습 소견 문장을 포함하는 학습 데이터를 수신(S110)할 수 있다. 예를 들어, 학습 데이터는 이전에 생성된 혈액종합검사 데이터(즉, 환자 정보, 검사 결과, 소견 문장, 등)로서 데이터베이스에 저장될 수 있다. 혈액종합검사 소견 생성 시스템은 기계 학습을 통해 심층 신경망을 구축하기 위해 학습 데이터를 순차적으로 로드할 수 있다. 혈액종합검사 소견 생성 시스템은 신뢰도가 높은 학습 데이터의 개수가 많을수록 더 좋은 성능을 발휘할 수 있는 심층 신경망을 생성할 수 있으므로, 인가된 하나 이상의 데이터베이스를 등록하고, 데이터베이스로부터 학습 데이터를 수신할 수 있다. 여기서, 학습 환자 정보는 환자 성별, 환자 나이, 등을 포함할 수 있다. 학습 검사 결과는 혈당, 신장-통풍-관절염, 간 기능, 전해질, 지질-심혈관, 간염, 성병, 철, 혈액, 혈액형, 췌장, 염증, 소변, 갑상선, 및 종양표지자 중 적어도 하나에 대응하는 검사 코드 및 검사 결과값을 포함할 수 있다. 또한, 소견 문장은 혈액종합검사 검사 결과값에 기반하여 미리 정의될 수 있으며, 혈액종합검사 검사 결과 (e.g., "신장기능 검사 결과는 정상입니다." "혈액형은 A형 Rh 양성입니다."), 의심 질병(e.g., "AST, ALP와 r-GTP가 높습니다. 간 및 담도계 기능 이상이 의심됩니다."), 질병의 원인(e.g., "고밀도(HDL)콜레스테롤이 감소되어 있습니다. HDL콜레스테롤은 좋은 콜레스테롤에 속하고, 낮은 HDL수치는 심 질환의 주요한 위험 인자입니다."), 질병의 증상(e.g., "대구성빈혈 혹은 빈혈의 치료중인 상태에 해당됩니다. 빈혈에 걸리면 힘이 없고 권태감을 느낍니다."), 확진을 위한 추가 검사(e.g., "갑상선자극호르몬(TSH)이 증가하였습니다. FT4검사를 권합니다."), 등에 대한 내용을 포함할 수 있다. 하나의 학습 데이터에는 복수의 학습 소견 문장이 포함될 수 있다.
학습 데이터에 대한 제1 전처리 동작이 수행(S120)되고, 표준화 학습 데이터가 생성될 수 있다. 즉, 학습 데이터는 제1 전처리 동작을 통해 심층 신경망에 입력될 수 있는 표준화된 형태(즉, 표준화 학습 데이터)로 변형될 수 있다. 예를 들어, 학습 데이터에 포함된 학습 환자 정보 및/또는 학습 검사 결과는 미리 정해진 규칙에 따라 수치값으로 변환되고, 변환된 수치값은 심층 신경망의 입력값으로 사용되기 위해 벡터로 변환될 수 있다. 제1 전처리 동작에 의해 표준화 학습 데이터가 생성되는 방법에 대해서는 도 4를 참조하여 자세히 설명하기로 한다.
표준화 학습 데이터가 심층 신경망에 학습(S130)될 수 있다. 즉, 표준화 학습 데이터에 기초하여 심층 신경망이 생성/구축될 수 있다. 심층 신경망은 각각 복수의 노드들을 포함하는 입력층, 출력층, 및 입력층과 출력층 사이에 은닉층(hidden layer)을 포함할 수 있다. 심층 신경망은 혈액종합검사의 소견을 효과적으로 생성하기 위해 복수의 은닉층들을 포함하는 다층 구조를 가질 수 있다. 일 실시예에서, 심층 신경망은 학습 환자 정보 및 학습 검사 결과가 입력되는 경우 학습 소견 문장이 출력되도록 은닉층(hidden layer) 개수, 노드(node) 개수, 가중치(weight), 및 활성화 함수(activation function)가 결정될 수 있다. 즉, 심층 신경망은 학습 데이터의 입력값(학습 환자 정보 및 학습 검사 결과)에 따른 출력값(학습 소견 문장) 매칭되도록 구축될 수 있다. 심층 신경망에 대해서는 도 5를 참조하여 자세히 설명하기로 한다.
검진 환자 정보 및 검진 검사 결과를 포함하는 검진 데이터가 수신(S210)될 수 있다. 예를 들어, 혈액종합검사 소견 생성 시스템은 데이터베이스로부터 검진 데이터로서 검진 소견을 생성하고자 하는 환자에 대한 환자 정보 및 검진 검사 결과를 로드할 수 있다. 검진 환자 정보는 환자 성별, 환자 나이, 등을 포함할 수 있다. 검진 검사 결과는 혈당, 신장-통풍-관절염, 간 기능, 전해질, 지질-심혈관, 간염, 성병, 철, 혈액, 혈액형, 췌장, 염증, 소변, 갑상선, 및 종양표지자 중 적어도 하나에 대응하는 항목을 포함할 수 있다.
검진 데이터에 대한 제2 전처리 동작이 수행(S220)되고, 표준화 검진 데이터가 생성될 수 있다. 즉, 검진 데이터는 제2 전처리 동작을 통해 심층 신경망에 입력될 수 있는 표준화된 형태(즉, 표준화 검진 데이터)로 변형될 수 있다. 예를 들어, 검진 데이터에 포함된 검진 환자 정보 및/또는 검진 검사 결과는 미리 정해진 규칙에 따라 수치값으로 변환되고, 변환된 수치값은 심층 신경망의 입력값으로 사용되기 위해 벡터로 변환될 수 있다. 제2 전처리 동작에 의해 표준화 검진 데이터가 생성되는 방법에 대해서는 도 4를 참조하여 자세히 설명하기로 한다.
심층 신경망을 이용하여 표준화 검진 데이터에 대응하는 검진 소견이 생성(S230)될 수 있다. 즉, 학습 데이터에 기초하여 구축된 심층 신경망에 표준화 검진 데이터를 입력함으로써 소견 문장들에 대응하는 출력값이 도출되고, 검진 소견이 생성될 수 있다. 일 실시예에서, 심층 신경망의 마지막 활성화 함수는 시그모이드(sigmoid) 함수이고, 시그모이드 함수를 통해 소견 문장들 각각에 대한 확률값이 도출될 수 있다. 도출된 확률값에 따라 소견 문장들을 선택함으로써 검진 소견이 생성될 수 있다. 검진 소견을 생성하는 방법에 대해서는 도 6을 참조하여 자세히 설명하기로 한다.
도 2에 도시된 바와 같이, 심층 신경망 학습 과정(S110, S120, S130)에서 학습 데이터(SD)에 기초하여 심층 신경망이 구축될 수 있다. 데이터베이스로부터 학습 데이터(SD)가 로드되고, 학습 데이터(SD)로부터 학습 환자 정보(SP), 학습 검사 결과(SR), 및 학습 소견 문장(SM)이 도출될 수 있다. 도출된 학습 검사 결과(SR)는 제1 전처리 동작을 통해 표준화 학습 검사 결과(SSR)로 변환될 수 있다. 학습 환자 정보(SP), 표준화 학습 검사 결과(SSR), 및 학습 소견 문장(SM)에 기초하여 심층 신경망이 학습될 수 있다.
도 3에 도시된 바와 같이, 심층 신경망 추론 과정(S210, S220, S230)에서 구축된 심층 신경망을 이용하여 검진 데이터에 대한 검진 소견이 생성될 수 있다. 즉, 심층 신경망은 검진 데이터(환자 나이, 환자 성별, 검진 검사 결과)를 입력으로 받고, 분석/판독한 뒤, 미리 정의된 소견 문장 집합에서 복수의 소견 문장들을 선택하여 출력할 수 있다. 이를 위해, 데이터베이스로부터 검진 데이터(ED)가 로드되고, 검진 데이터(ED)로부터 검진 환자 정보(EP) 및 검진 검사 결과(ER)가 도출될 수 있다. 도출된 검진 검사 결과(ER)는 제2 전처리 동작을 통해 표준화 검진 검사 결과(SER)로 변환될 수 있다. 검진 검사 결과(ER) 및 표준화 검진 검사 결과(SER)을 심층 신경망에 입력하고, 출력값으로 소견 문장들이 선택되며, 선택된 소견 문장들(EM)에 기초하여 검진 소견이 생성될 수 있다.
비록, 도 1 및 도 2에서는 학습 데이터를 이용하여 심층 신경망을 생성/구축하는 방법만을 기술하였으나, 심층 신경망은 추가 학습 데이터를 이용하여 갱신되거나 검진 데이터 및 도출된 검진 소견을 이용하여 지속적으로 갱신될 수 있다.
도 4는 도 1의 혈액종합검사 소견 생성 방법에서 학습 데이터 또는 검진 데이터에 대한 전처리 동작의 일 예를 나타내는 도면이다.
도 4를 참조하면, 심층 신경망을 학습시키기 위한 학습 데이터는 제1 전처리 동작을 통해 심층 신경망에 입력되기 위한 포맷으로 변환될 수 있다. 또한, 검진 소견을 생성하기 위한 검진 데이터는 제2 전처리 동작을 통해 심층 신경망에 입력되기 위한 포맷으로 변환될 수 있다. 즉, 전처리 동작은 검사 결과값의 본래 의미에 영향을 주지 않는 범위에서 검사 결과값을 심층 신경망에 적합하게 변경하는 동작을 나타낸다. 일 실시예에서, 학습 데이터에 포함된 학습 검사 결과 및 검진 데이터에 포함된 검진 검사 결과는 동일한 포맷을 가질 수 있다. 이 경우, 제1 전처리 동작 및 제2 전처리 동작을 실질적으로 동일할 수 있다.
구체적으로, 전처리 동작은 학습 검사 결과(또는 검진 검사 결과)에 포함된 항목들 각각을 항목들의 검사 결과값 형태(type)에 따라 수치형 데이터 및 분류형 데이터 중 하나로 변환할 수 있다. 즉, 전처리 동작(즉, 제1 전처리 동작 및 제2 전처리 동작)은 항목들 각각에 대한 검사 결과값 형태에 따라 다르게 진행될 수 있다. 예를 들어, 검사 결과값이 "부등식 수치값" (e.g., <0.5) 형태인 경우, "수치값"(e.g., 0.5)만을 사용할 수 있다. 검사 결과값이 "수치값, 클래스"(e.g., 1.23, 1.0) 형태인 경우, "수치값"(e.g., 1.23)만을 사용할 수 있다. 검사 결과값이 "공칭값 수치값"(e.g., non-reactive 1.0)인 경우, "공칭값"(e.g., non-reactive)만을 사용할 수 있다. 검사 결과값이 "Yet", "추후 송부", "검사 제외", "별지 참조", 등 특정된 형태에 대응하지 않는 경우, "NA"로 변경할 수 있다.
전처리 동작은 변환된 분류형 데이터를 원-핫(one-hot) 인코딩함으로써 인코딩 데이터를 생성할 수 있다. 예를 들어, 변환된 "공칭값"(e.g., non-reactive) 및 "NA"를 미리 지정된 규칙에 따라 바이너리(binary) 값(즉, 인코딩값)으로 변환할 수 있다. 전처리 동작은 수치형 데이터 및 인코딩 데이터에 기초하여 학습 검사 결과(또는 검진 검사 결과)에 상응하는 벡터를 생성하고, 심층 신경망의 입력값으로 제공할 수 있다.
도 4의 예에서, 'HCV Ab' 속성의 검사 결과값의 형태(type)는 "공칭값, 수치값"일 수 있으며, 이는 분류형 데이터인 "공칭값"로 변환되고, 변환된 "공칭값"은 미리 지정된 규칙에 따라 인코딩값으로 변환될 수 있다. 일 실시예에서, 인코딩값 변환 시, 분류형 데이터로 변환된 하나의 속성값(예를 들어, "공칭값")이 복수의 속성값들로 변환될 수 있다. 예를 들어, 인코딩값 변환 시 'HCV Ab' 속성은 속성값이 positive인지 여부를 나타내는 'HCV Ab = positive' 속성 및 속성값이 negative인지 여부를 나타내는 'HCV Ab = negative' 속성으로 구분될 수 있다. 환자 A(PATIENT A)의 경우, 'HCV Ab' 속성에 대한 검사 결과값인 "Positive, 1.7"가 "Positive"로 변환되고, 변환된 분류형 데이터 "Positive"에 기초하여 'HCV Ab = positive' 속성값이 1로 설정되고, 'HCV Ab = negative' 속성값이 0으로 설정될 수 있다. 반면에, 환자 B(PATIENT B)의 경우, 'HCV Ab' 속성에 대한 검사 결과값인 "Negative, 0.24"가 "NEGATIVE"로 변환되고, 변환된 분류형 데이터 "Negative"에 기초하여 'HCV Ab = positive' 속성값이 0으로 설정되고, 'HCV Ab = negative' 속성값이 1로 설정될 수 있다.
'Cholesterol' 속성의 검사 결과값의 형태는 "수치값"일 수 있으며, 이는 단일 수치형 데이터로서 추가 변환 없이 벡터를 생성하기 위한 데이터로 사용될 수 있다. 예를 들어, 환자 A(PATIENT A)의 경우, 'Cholesterol' 속성값이 "150"이고, 이는 변환없이 벡터를 생성하기 위한 데이터로 사용될 수 있다.
'Protein, Total' 속성의 검사 결과값의 형태는 "수치값, 클래스"일 수 있으며, 이는 수치형 데이터인 "수치값"으로 변환되고, 변환된 "수치값"은 벡터를 생성하기 위한 데이터로 사용될 수 있다. 예를 들어, 환자 A(PATIENT A)의 경우, 'Protein, Total' 속성값이 "8.1, 10,5"이고, 이는 수치값에 해당하는 "8.1"로 변환되고 변환된 수치값이 벡터를 생성하기 위한 데이터로 사용될 수 있다.
'RPR 정밀' 속성의 검사 결과값의 형태는 "공칭값, 수치값" 또는 "기타값" (e.g., 추후 송부, 검사 제외, 별지 참조, 등)일 수 있다. 이들은 분류형 데이터인 "공칭값" 또는 "NA"로 각각 변환되고, 변환된 "공칭값" 또는 "NA"은 미리 지정된 규칙에 따라 인코딩값으로 변환될 수 있다. 일 실시예에서, 한 속성에 대해 복수의 속성 형태들을 가질 수 있는 경우, 분류형 데이터로 변환된 하나의 속성값이 복수의 속성값들로 변환될 수 있다. 예를 들어, 인코딩값 변환 시 'RPR 정밀' 속성은 속성값이 non-reactive인지 여부를 나타내는 'RPR 정밀 = non-reactive' 속성 및 속성값이 NA인지 여부를 나타내는 'RPR 정밀 = NA' 속성으로 구분될 수 있다. 환자 A(PATIENT A)의 경우, 'RPR 정밀' 속성에 대한 검사 결과값인 "non-reactive, 0.35"가 "non-reactive"로 변환되고, 변환된 분류형 데이터 "non-reactive"에 기초하여 'RPR 정밀 = non-reactive' 속성값이 1로 설정되고, 'RPR 정밀 = NA' 속성값이 0으로 설정될 수 있다. 반면에, 환자 B(PATIENT B)의 경우, 'RPR 정밀' 속성에 대한 검사 결과값인 "추후 송부"가 "NA"로 변환되고, 변환된 분류형 데이터 "NA"에 기초하여 'RPR 정밀 = non-reactive' 속성값이 0으로 설정되고, 'RPR 정밀 = NA' 속성값이 1로 설정될 수 있다.
비록, 도 4에서는 검진 검사 결과는 학습 검사 결과와 동일한 형태를 갖는 것으로 설명하였으나, 검진 검사 결과는 학습 검사 결과와 다른 형태를 가질 수 있다. 이 경우, 제1 전처리 동작 및 제2 전처리 동작은 서로 다른 수치형/분류형 데이터 변환 기준 및 인코딩 기준이 적용될 수 있다.
도 5는 도 1의 혈액종합검사 소견 생성 방법에서 생성된 심층 신경망의 일 예를 나타내는 도면이다.
도 5를 참조하면, 심층 신경망(DNN)은 각각 복수의 노드들(ND)을 포함하는 입력층(IL), 은닉층(HL1 내지 HL3), 및 출력층(OL)을 포함할 수 있다.
입력층(IL)은 전처리 동작을 통해 도출된 환자 정보(환자 나이, 환자 성별) 및 검사 결과값에 대한 N 크기의 벡터를 입력 받는 N개의 노드들(ND)을 포함할 수 있다. 출력층(OL)은 M개의 미리 정의된 소견 문장들에 각각 대응하는 M개의 노드들(ND)을 포함할 수 있다. 은닉층(HL1 내지 HL3)은 입력층(IL)과 출력층(OL) 사이에 위치할 수 있다. 각각의 은닉층은 복수의 노드들(ND)을 포함할 수 있으며, 각 노드(ND)는 인접한 층들에 포함된 노드(ND)들과 가중치를 의미하는 간선(WT)으로 연결될 수 있다. 심층 신경망(DNN)은 학습 환자 정보 및 학습 검사 결과가 입력 벡터(IV[0] 내지 IV[N-1], N은 2이상의 정수) 형태로 입력되는 경우 학습 소견 문장이 출력 벡터(OV[0] 내지 OV[M-1], M은 2이상의 정수) 형태로 출력되도록 은닉층의 개수, 각 은닉층의 노드 개수(즉, 뉴런 개수), 가중치, 및 활성화 함수가 결정될 수 있다.
예를 들어, 전처리 동작을 통해 685개의 검사 결과값과 환자의 나이 및 성별을 1041 크기의 벡터로 표현하고, 심층 신경망(DNN)을 100회 학습을 수행하는 경우, 하기 [표 1]과 같은 구조를 갖는 심층 신경망(DNN)이 구축될 수 있다. 또한, 심층 신경망(DNN)의 손실 함수(loss function)는 이진 손실(binary loss)이 바람직하다.
[표 1]
Figure 112017040767804-pat00001
일 실시예에서, 심층 신경망(DNN)의 마지막 활성화 함수는 시그모이드(Sigmoid) 함수일 수 있다. 예를 들어, 심층 신경망(DNN)의 입력층(IL), 제1 은닉층(HL1), 제2 은닉층(HL2)에서 활성화 함수로 렐루(Rectified Linear Unit; ReLU) 함수를 사용하고, 제3 은닉층(HL3)에서 활성화 함수로 시그모이드 함수를 사용할 수 있다. 즉, 심층 신경망(DNN)은 마지막 이전의 활성화 함수로 상대적으로 부하가 적은 ReLU 함수를 사용하고, 마지막 활성화 함수로 아날로그 값을 출력하는 시그모이드 함수를 사용함으로써 심층 신경망(DNN)의 효율을 향상시킬 수 있다. 심층 신경망(DNN)은 마지막 활성화 함수인 시그모이드 함수에 의해 각 소견 문장이 발현될 확률을 출력 벡터(OV[0] 내지 OV[M-1]) 형태로 출력할 수 있다.
도 6은 도 1의 혈액종합검사 소견 생성 방법에서 검진 소견을 생성하는 방법을 설명하기 위한 도면이다.
도 6을 참조하면, 혈액종합검사 소견 생성 시스템은 표준화 검진 데이터를 심층 신경망에 입력하고, 심층 신경망을 통해 소견 문장(SM)들 각각에 대한 확률값을 도출하며, 문턱값을 이용하여 확률값에서 소견 문장(SM)들에 대한 지시자 벡터(indicator vector) (DV)를 도출하고, 지시자 벡터(DV)에 기초하여 검진 소견을 생성할 수 있다.
구체적으로, 소견 문장(SM)들은 미리 정의되고, 출력 벡터의 각 요소에 대응될 수 있다. 심층 신경망의 출력값(즉, 출력 벡터)으로 각 소견 문장(SM)이 발현될 확률이 출력되고, 각 소견 문장(SM)에 대한 확률은 문턱값을 이용하여 원자화하여 지시자 벡터(DV)의 요소값으로 변환될 수 있다. 즉, 출력 벡터의 각 요소는 문턱값을 이용하여 0 또는 1 (즉, boolean 형식)으로 변환됨으로써, 출력 벡터가 지시자 벡터(DV)로 변환될 수 있다. 즉, 소견 문장(SM)은 지시자 벡터(DV)로 표현될 수 있으며, 지시자 벡터(DV)의 각 요소는 미리 정의된 소견 문장 집합의 각 소견 문장(SM)을 나타낼 수 있다. 특정 소견 문장이 환자의 검진 소견에 포함될 경우, 지시자 벡터(DV)의 해당 요소는 1의 값을 가질 수 있다. 일 실시예에서, 출력 벡터의 각 요소값은 동일한 문턱값을 기준으로 지시자 벡터(DV)의 요소값으로 변환될 수 있다. 예를 들어, 출력 벡터의 요소값이 문턱값인 0.5 이상인 경우, 1로 변환되고, 출력 벡터의 요소값이 문턱값인 0.5 미만인 경우, 0으로 변환될 수 있다. 다른 실시예에서, 출력 벡터의 요소값에 대해 서로 다른 문턱값을 기준으로 지시자 벡터(DV)의 요소값으로 변환될 수 있다. 즉, 환자의 신변에 큰 영향을 줄 수 있는 고위험 질병을 판단하는 요소인 경우 상대적으로 낮은 문턱값을 설정할 수 있다. 반면에, 저위험 질병을 판단하는 요소인 경우 상대적으로 높은 문턱값을 설정할 수 있다.
각 소견 문장(SM)들에 대응하는 지시자 벡터(DV)의 요소값을 이용하여 검진 소견(ES)이 생성될 수 있다. 즉, 지시자 벡터(DV) 중 요소값이 1에 대응하는 소견 문장(SM)들을 합병하여 검진 소견(ES)을 생성할 수 있다. 예를 들어, 소견 문장(SM)들 중 지시자 벡터(DV) 중 요소값이 1에 해당하는 문장들("공복 혈당이 정상입니다. 당뇨검사의 결과가 정상입니다", "신장기능 검사 결과는 정상입니다", "간 기능 검사의 결과는 정상입니다", "지질검사의 결과 정상입니다")을 하나로 병합함으로써 검진 소견(ES)이 생성될 수 있다.
비록, 도 6에서는 출력 벡터를 지시자 벡터(DV)로 변환하기 위해 미리 지정된 문턱값을 사용하는 것으로 설명하였으나, 이에 한정되지 않는다. 예를 들어, 출력 벡터는 환자 정보(환자 나이, 환자 성별, 등)에 따라 환자마다 다른 문턱값을 이용하여 지시자 벡터(DV)로 변환될 수 있다.
도 7은 본 발명의 실시예들에 따른 혈액종합검사 소견 생성 시스템을 나타내는 블록도이다.
도 7을 참조하면, 혈액종합검사 소견 생성 시스템(100)은 데이터베이스 제어 모듈(110), 전처리 모듈(120), 심층 신경망 학습 모듈(130), 및 심층 신경망 추론 모듈(140)을 포함할 수 있다. 데이터베이스 제어 모듈(110), 전처리 모듈(120), 심층 신경망 학습 모듈(130), 및 심층 신경망 추론 모듈(140)은 각각 이상에서 설명한 심층 신경망을 이용한 혈액종합검사 소견 생성 방법을 실행하기 위한 컴퓨터프로그램일 수 있다. 혈액종합검사 소견 생성 시스템(100)은 중앙처리장치(CPU), 보조기억장치, 주기억장치, 입출력 장치 등을 포함하는 범용 컴퓨터 또는 본 발명의 실시를 위한 특수 목적용 컴퓨터를 이용하여 구현될 수 있다. 상기 컴퓨터프로그램은 상기 컴퓨터에 내장된 주기억장치 또는 외장형 저장장치나 클라우드 시스템이 제공하는 데이터 저장소 등과 같은 비휘발성 기록매체에 저장되고, 상기 컴퓨터의 중앙처리장치 등에 의해 실행될 수 있다. 컴퓨터프로그램의 저장과 실행에 관해서는 이미 널리 알려져 있는 기술이므로 이에 관한 자세한 설명은 생략한다. 혈액종합검사 소견 생성 시스템(100)은 학습 데이터 및 검진 데이터를 저장하는 데이터베이스(10) 및 혈액종합검사 서비스를 의료 전문가 또는 환자에게 제공하는 혈액종합검사 서비스 시스템(20)과 유/무선 네트워크로 연결될 수 있다.
데이터베이스 제어 모듈(110)은 데이터베이스(10)와 연동하여 학습 데이터 및/또는 검진 데이터를 로드할 수 있다. 예를 들어, 데이터베이스 제어 모듈(110)은 학습 데이터를 하나 이상의 데이터베이스(10)로부터 수신하여 전처리 모듈(120)에 제공할 수 있다.
전처리 모듈(120)은 학습 환자 정보, 학습 검사 결과, 및 학습 소견 문장을 포함하는 학습 데이터에 대한 제1 전처리 동작을 수행함으로써 표준화 학습 데이터를 생성할 수 있다. 즉, 전처리 모듈(120)은 학습 데이터를 심층 신경망에 입력될 수 있는 표준화된 형태(즉, 표준화 학습 데이터)로 변환할 수 있다. 또한, 전처리 모듈(120)은 검진 환자 정보 및 검진 검사 결과를 포함하는 검진 데이터에 대한 제2 전처리 동작을 수행할 수 있다. 즉, 전처리 모듈(120)은 검진 데이터를 심층 신경망에 입력될 수 있는 표준화된 형태(즉, 표준화 검진 데이터)로 변환할 수 있다. 일 실시예에서, 전처리 모듈(120)은 학습 검사 결과 또는 검진 검사 결과에 포함된 항목들 각각을 항목들의 검사 결과값 형태(type)에 따라 수치형 데이터 및 분류형 데이터 중 하나로 변환하고, 분류형 데이터를 원-핫(one-hot) 인코딩함으로써 인코딩 데이터를 생성하며, 수치형 데이터 및 인코딩 데이터에 기초하여 학습 검사 결과 또는 검진 검사 결과에 상응하는 벡터를 생성할 수 있다. 다만, 제1 전처리 동작 및 제2 전처리 동작에 대해서는 상술한 바 있으므로, 그에 대한 중복되는 설명은 생략하기로 한다.
심층 신경망 학습 모듈(130)은 표준화 학습 데이터에 기초하여 심층 신경망을 생성할 수 있다. 심층 신경망은 각각 복수의 노드들을 포함하는 입력층, 출력층, 및 입력층과 출력층 사이에 은닉층을 포함할 수 있다. 심층 신경망은 혈액종합검사의 소견을 효과적으로 생성하기 위해 복수의 은닉층들을 포함하는 다층 구조를 가질 수 있다. 일 실시예에서, 심층 신경망 학습 모듈(130)은 학습 환자 정보 및 학습 검사 결과가 입력되는 경우 학습 소견 문장이 출력되도록 심층 신경망의 은닉층 개수, 노드 개수, 가중치, 및 활성화 함수를 결정할 수 있다.
심층 신경망 추론 모듈(140)은 심층 신경망을 이용하여 표준화 검진 데이터에 대응하는 검진 소견을 생성할 수 있다. 즉, 심층 신경망 추론 모듈(140)은 학습된 심층 신경망에 표준화 검진 데이터를 입력함으로써 소견 문장들에 대응하는 출력값을 도출하고, 검진 소견을 생성될 수 있다. 일 실시예에서, 심층 신경망 추론 모듈(140)은 표준화 검진 데이터를 심층 신경망에 입력함으로써 소견 문장들 각각에 대한 확률값을 도출하며, 문턱값을 이용하여 확률값에서 소견 문장들에 대한 지시자 벡터를 도출하고, 지시자 벡터에 기초하여 검진 소견을 생성할 수 있다. 다만, 심층 신경망을 구축하고 검진 소견을 생성하는 방법에 대해서는 상술한 바 있으므로, 그에 대한 중복되는 설명은 생략하기로 한다.
본 발명의 혈액종합검사 소견 생성 방법 및 시스템에 대한 평가를 수행하였으며, 이를 위해 총 14,479명에 대한 혈액종합검사 데이터를 사용하였다. 혈액종합검사 데이터의 예시는 하기 [표 2]에 나타낸다.
[표 2]
Figure 112017040767804-pat00002
여기서, 검사 결과는 검사 코드 및 검사 결과값을 포함하며, 예를 들어, 21101은 "B형 간염 여부", 21102는 "B형 간염 항체 생성 여부", 21429는 "간암, 간경변, 급만성간염등 종양표시 검사"에 대한 검사 코드를 나타낸다.
혈액종합검사는 한 데이터마다 다수의 소견 문장을 갖는 다중-레이블 분류(multi-label classification) 문제에 해당하므로, 혈액종합검사 소견 생성 방법 및 시스템을 평가하기 위해 하기에서 정의되는 정확도, 정밀도, 재현도, 및 F1-measure값을 측정하였다. n개의 데이터 (xi, Yi), (단, 1 <= i <= n)로 이루어진 집합을 T, 다중-레이블 분류기를 h라 하고, 분류기 h의 분류 결과 h(xi)를 Zi라 할 때 정확도, 정밀도, 재현도, 및 F1-measure값은 아래와 같이 정의될 수 있다. 여기서, 정확도, 정밀도, 재현도, 및 F1-measure는 수치가 높을수록 모델의 성능이 우수함을 나타낸다.
정확도(A)는 실제(Yi) 및 예측한(Zi) 레이블 중 예측에 성공한 레이블 비율 평균을 나타낸다. 예를 들어, 정확도(A)는 [수학식 1]에 따라 산출될 수 있다.
[수학식 1]
Figure 112017040767804-pat00003
정밀도(P)는 예측한(Zi) 레이블 중 예측에 성공한 레이블 비율의 평균을 나타낸다. 예를 들어, 정밀도(P)는 [수학식 2]에 따라 산출될 수 있다.
[수학식 2]
Figure 112017040767804-pat00004
재현도(R)은 실제(Yi) 레이블 중 예측에 성공한 레이블 비율의 평균을 나타낸다. 예를 들어, 재현도(R)는 [수학식 3]에 따라 산출될 수 있다.
[수학식 3]
Figure 112017040767804-pat00005
F1-measure값은 정밀도와 재현도의 조화 평균을 나타낸다. 예를 들어, F1-measure값은 [수학식 4]에 따라 산출될 수 있다.
[수학식 4]
Figure 112017040767804-pat00006
또한, Hamming loss값을 사용하여 예측 오류율과 미발견 오류율을 평가하였다. Hamming loss값은 [수학식 5]에 따라 산출될 수 있다. 여기서, Hamming loss값은 작을수록 모델의 성능이 우수함을 나타낸다.
[수학식 5]
Figure 112017040767804-pat00007
본 발명의 심층 신경망(DNN)을 이용한 혈액종합검사 소견 생성 방법 및 시스템의 성능을 측정하기 위해 의사결정 트리(DT) 모델 및 랜덤 포레스트(RF) 모델과 비교하였으며, 모든 평가는 5-fold 교차 검증을 통해 수행되었다. 여기서, 의사결정 트리(DT) 모델의 경우 지니 불순도(Gini impurity)를 기준으로 사용하였고, 랜덤 포레스트(RF) 모델의 경우, 총 200개의 의사결정 트리로 구성되도록 구축하였다. 이에 따른 평가 결과는 [표 3]에 나타낸다.
[표 3]
Figure 112017040767804-pat00008
평가 결과에 따르면, 본 발명의 심층 신경망(DNN)을 이용한 혈액종합검사 소견 생성 방법이 모든 평가 척도(즉, 정확도, 정밀도, 재현도, F1-measure, 및 Hamming loss)에 대해 트리(DT) 모델 및 랜덤 포레스트(RF) 모델보다 우수함을 확인할 수 있었다.
또한, 본 발명의 심층 신경망(DNN)을 이용한 혈액종합검사 소견 생성 방법으로 생성된 소견 문장들(즉, 검진 소견)은 실제 소견 문장과 큰 차이를 보이지 않았다. 예를 들어, 본 발명의 심층 신경망(DNN)을 이용한 혈액종합검사 소견 생성 방법으로 생성된 소견 문장들은 [표 4]에 나타낸다.
[표 4]
Figure 112017040767804-pat00009
이상, 본 발명의 실시예들에 따른 혈액종합검사 소견 생성 방법 및 시스템에 대하여 도면을 참조하여 설명하였지만, 상기 설명은 예시적인 것으로서 본 발명의 기술적 사상을 벗어나지 않는 범위에서 해당 기술 분야에서 통상의 지식을 가진 자에 의하여 수정 및 변경될 수 있을 것이다. 예를 들어, 상기에서는 학습 데이터 및 검진 데이터가 데이터베이스에 저장된 것으로 설명하였으나, 이에 한정되는 것이 아니다. 예를 들어, 학습 데이터 및 검진 데이터는 네트워크를 통해 서로 다른 시스템으로부터 수신될 수 있다.
10: 데이터 베이스 20: 혈액종합검사 서비스 시스템
100: 혈액종합검사 소견 생성 시스템
110: 데이터베이스 제어 모듈 120: 전처리 모듈
130: 심층 신경망 학습 모듈 140: 심층 신경망 추론 모듈

Claims (10)

  1. 혈액종합검사 소견 생성 시스템의 혈액종합검사 소견 생성 방법으로서,
    상기 혈액종합검사 소견 생성 시스템이 데이터베이스 시스템으로부터 학습 환자 정보, 학습 검사 결과, 및 학습 소견 문장을 포함하는 학습 데이터를 수신하는 단계;
    상기 혈액종합검사 소견 생성 시스템의 전처리 모듈에서, 상기 학습 데이터에 대한 제1 전처리 동작을 수행함으로써 표준화 학습 데이터를 생성하는 단계로서, 상기 학습 데이터에 대한 제1 전처리 동작은, 상기 학습 검사 결과에 포함된 항목들 각각을 상기 항목들의 형태(type)에 따라 수치형 데이터 및 분류형 데이터 중 하나로 변환하고, 상기 분류형 데이터를 원-핫(one-hot) 인코딩함으로써 인코딩 데이터를 생성하고, 상기 수치형 데이터 및 상기 인코딩 데이터에 기초하여 상기 학습 검사 결과에 상응하는 벡터를 생성하는 것을 포함하는 단계;
    상기 혈액종합검사 소견 생성 시스템의 심층 신경망 학습 모듈에서, 상기 표준화 학습 데이터에 기초하여 심층 신경망(deep neural network)을 생성하는 단계;
    상기 혈액종합검사 소견 생성 시스템이 상기 데이터베이스 시스템으로부터 검진 환자 정보 및 검진 검사 결과를 포함하는 검진 데이터를 수신하는 단계;
    상기 혈액종합검사 소견 생성 시스템의 상기 전처리 모듈에서, 상기 검진 데이터에 대한 제2 전처리 동작을 수행함으로써 표준화 검진 데이터를 생성하는 단계; 및
    상기 혈액종합검사 소견 생성 시스템의 심층 신경망 추론 모듈에서, 상기 심층 신경망을 이용하여 상기 표준화 검진 데이터에 대응하는 검진 소견을 생성하는 단계를 포함하는 혈액종합검사 소견 생성 방법.
  2. 삭제
  3. 제1 항에 있어서, 상기 심층 신경망은 상기 학습 환자 정보 및 상기 학습 검사 결과가 입력되는 경우 상기 학습 소견 문장이 출력되도록 은닉층(hidden layer) 개수, 노드(node) 개수, 가중치(weight), 및 활성화 함수(activation function)가 결정되는 것을 특징으로 하는 혈액종합검사 소견 생성 방법.
  4. 제1 항에 있어서, 상기 심층 신경망의 마지막 활성화 함수는 시그모이드(sigmoid) 함수인 것을 특징으로 하는 혈액종합검사 소견 생성 방법.
  5. 제4 항에 있어서, 상기 검진 소견을 생성하는 단계는, 상기 혈액종합검사 소견 생성 시스템에서,
    상기 표준화 검진 데이터를 상기 심층 신경망에 제공하고,
    상기 심층 신경망의 상기 시그모이드 함수를 통해 소견 문장들 각각에 대한 확률값을 도출하며,
    문턱값을 이용하여 상기 확률값에서 상기 소견 문장들에 대한 지시자 벡터(indicator vector)를 도출하며,
    상기 지시자 벡터에 기초하여 상기 검진 소견을 생성하는 것을 특징으로 하는 혈액종합검사 소견 생성 방법.
  6. 제1 항에 있어서, 상기 학습 검사 결과는 혈당, 신장-통풍-관절염, 간 기능, 전해질, 지질-심혈관, 간염, 성병, 철, 혈액, 혈액형, 췌장, 염증, 소변, 갑상선, 및 종양표지자 중 적어도 하나에 대응하는 항목을 포함하는 것을 특징으로 하는 혈액종합검사 소견 생성 방법.
  7. 학습 환자 정보, 학습 검사 결과, 및 학습 소견 문장을 포함하는 학습 데이터에 대한 제1 전처리 동작을 수행함으로써 표준화 학습 데이터를 생성하고, 검진 환자 정보 및 검진 검사 결과를 포함하는 검진 데이터에 대한 제2 전처리 동작을 수행함으로써 표준화 검진 데이터를 생성하는 전처리 모듈;
    상기 표준화 학습 데이터에 기초하여 심층 신경망(deep neural network)을 생성하는 심층 신경망 학습 모듈; 및
    상기 심층 신경망을 이용하여 상기 표준화 검진 데이터에 대응하는 검진 소견을 생성하는 심층 신경망 추론 모듈을 포함하며,
    상기 제1 전처리 동작은 상기 학습 검사 결과에 포함된 항목들 각각을 상기 항목들의 형태(type)에 따라 수치형 데이터 및 분류형 데이터 중 하나로 변환하고, 상기 분류형 데이터를 원-핫(one-hot) 인코딩함으로써 인코딩 데이터를 생성하고, 상기 수치형 데이터 및 상기 인코딩 데이터에 기초하여 상기 학습 검사 결과에 상응하는 벡터를 생성하는 것을 포함하는 것을 특징으로 하는 혈액종합검사 소견 생성 시스템.
  8. 삭제
  9. 제7 항에 있어서, 상기 심층 신경망 학습 모듈은 상기 학습 환자 정보 및 상기 학습 검사 결과가 입력되는 경우 상기 학습 소견 문장이 출력되도록 상기 심층 신경망의 은닉층(hidden layer) 개수, 노드(node) 개수, 가중치(weight), 및 활성화 함수(activation function)를 결정하는 것을 특징으로 하는 혈액종합검사 소견 생성 시스템.
  10. 제7 항에 있어서, 상기 심층 신경망의 마지막 활성화 함수는 시그모이드(sigmoid) 함수이고,
    상기 심층 신경망 추론 모듈은 상기 표준화 검진 데이터를 상기 심층 신경망에 입력함으로써 소견 문장들 각각에 대한 확률값을 도출하며, 문턱값을 이용하여 상기 확률값에서 상기 소견 문장들에 대한 지시자 벡터(indicator vector)를 도출하고, 상기 지시자 벡터에 기초하여 상기 검진 소견을 생성하는 것을 특징으로 하는 혈액종합검사 소견 생성 시스템.
KR1020170053455A 2017-04-26 2017-04-26 혈액종합검사 소견 생성 방법 및 시스템 KR101955526B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170053455A KR101955526B1 (ko) 2017-04-26 2017-04-26 혈액종합검사 소견 생성 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170053455A KR101955526B1 (ko) 2017-04-26 2017-04-26 혈액종합검사 소견 생성 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20180119834A KR20180119834A (ko) 2018-11-05
KR101955526B1 true KR101955526B1 (ko) 2019-03-08

Family

ID=64329082

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170053455A KR101955526B1 (ko) 2017-04-26 2017-04-26 혈액종합검사 소견 생성 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101955526B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200132425A (ko) * 2019-05-17 2020-11-25 (주)지놈오피니언 Tma 판별 정보 제공 시스템 및 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102033013B1 (ko) * 2019-07-02 2019-10-16 주식회사 인피니티케어 맞춤형 헬스케어 제공 시스템
KR102595788B1 (ko) * 2022-01-26 2023-11-01 주식회사 데이터스펙트럼리서치 다차원 데이터 기반 질병 진단 시스템 및 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101212714B1 (ko) * 2011-01-26 2013-01-22 계명대학교 산학협력단 계층적 퍼지 추론에 기반한 임상진단 지원방법 및 그 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200132425A (ko) * 2019-05-17 2020-11-25 (주)지놈오피니언 Tma 판별 정보 제공 시스템 및 방법
KR102275237B1 (ko) 2019-05-17 2021-07-09 (주)지놈오피니언 Tma 판별 정보 제공 시스템 및 방법

Also Published As

Publication number Publication date
KR20180119834A (ko) 2018-11-05

Similar Documents

Publication Publication Date Title
Haq et al. A hybrid intelligent system framework for the prediction of heart disease using machine learning algorithms
Paul et al. Genetic algorithm based fuzzy decision support system for the diagnosis of heart disease
Ronoud et al. An evolutionary deep belief network extreme learning-based for breast cancer diagnosis
Sajja et al. Towards application of machine learning in classification and prediction of heart disease
KR101955526B1 (ko) 혈액종합검사 소견 생성 방법 및 시스템
Enriko Comparative study of heart disease diagnosis using top ten data mining classification algorithms
Malibari An efficient IoT-Artificial intelligence-based disease prediction using lightweight CNN in healthcare system
Ramasamy et al. Classification of healthcare data using hybridised fuzzy and convolutional neural network
Assari et al. Heart disease diagnosis using data mining techniques
Peñafiel et al. Associating risks of getting strokes with data from health checkup records using Dempster-Shafer Theory
Saffari et al. DCNN-fuzzyWOA: artificial intelligence solution for automatic detection of covid-19 using X-ray images
Feng et al. An intelligent system for heart disease prediction using adaptive neuro-fuzzy inference systems and genetic algorithm
Rufo et al. A hybrid machine learning model based on global and local learner algorithms for diabetes mellitus prediction
Sheeba et al. A metaheuristic-enabled training system for ensemble classification technique for heart disease prediction
Carvalho et al. COVID-19 diagnosis in CT images using CNN to extract features and multiple classifiers
Ghosh et al. Dividing and conquering a blackbox to a mixture of interpretable models: route, interpret, repeat
Malik et al. Toward grading subarachnoid hemorrhage risk prediction: a machine learning-based aneurysm rupture score
Chen et al. A deep neural network with modified random forest incremental interpretation approach for diagnosing diabetes in smart healthcare
Chen et al. Research on disease prediction method based on R-Lookahead-LSTM
Hussain et al. Supervised learning based classification of cardiovascular diseases
Rao et al. Medical Big Data Analysis using LSTM based Co-Learning Model with Whale Optimization Approach.
Jaiswal et al. GLSTM: A novel approach for prediction of real & synthetic PID diabetes data using GANs and LSTM classification model
Hera et al. Early Gestational Diabetes Detection Using Neural Network
Remzan et al. Ensemble learning based-features extraction for brain mr images classification with machine learning classifiers
Jha et al. Neural Fuzzy Hybrid Rule‐Based Inference System with Test Cases for Prediction of Heart Attack Probability

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right