KR102499912B1 - 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템 - Google Patents

시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템 Download PDF

Info

Publication number
KR102499912B1
KR102499912B1 KR1020200108799A KR20200108799A KR102499912B1 KR 102499912 B1 KR102499912 B1 KR 102499912B1 KR 1020200108799 A KR1020200108799 A KR 1020200108799A KR 20200108799 A KR20200108799 A KR 20200108799A KR 102499912 B1 KR102499912 B1 KR 102499912B1
Authority
KR
South Korea
Prior art keywords
data
psa
neural network
prostate cancer
period
Prior art date
Application number
KR1020200108799A
Other languages
English (en)
Other versions
KR20210084214A (ko
Inventor
김재원
이찬중
홍자민
김상수
김동범
송승재
Original Assignee
주식회사 라이프시맨틱스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 라이프시맨틱스 filed Critical 주식회사 라이프시맨틱스
Publication of KR20210084214A publication Critical patent/KR20210084214A/ko
Application granted granted Critical
Publication of KR102499912B1 publication Critical patent/KR102499912B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/43Detecting, measuring or recording for evaluating the reproductive systems
    • A61B5/4375Detecting, measuring or recording for evaluating the reproductive systems for evaluating the male reproductive system
    • A61B5/4381Prostate evaluation or disorder diagnosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4842Monitoring progression or stage of a disease
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Veterinary Medicine (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Gynecology & Obstetrics (AREA)
  • Reproductive Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

전립선암의 진단 전후 및 수술 전후에 정기적으로 검진된 검진 데이터, 특히, 환자의 전립선 특이 항원검사(PSA) 데이터를 수집하고, 수집된 PSA의 시계열 데이터를 딥러닝 신경망에 적용하여, 해당 환자의 전립선암 재발을 예측하는, 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 관한 것으로서, 순환 신경망을 구비한 신경망 모듈; 일련의 다수의 PSA(Prostate Specific Antige) 수치를 시계열 순으로 정규화 하는 전처리부; PSA 학습 데이터를 상기 신경망 전처리부에 의해 전처리하게 하고, 전처리된 학습 데이터를 이용하여 상기 신경망을 학습시키는 신경망 학습부; 및, 환자의 일련의 PSA 데이터를 수신하여, 상기 환자의 PSA 데이터를 상기 신경망 전처리부에 의해 전처리하게 하고, 전처리된 데이터를 상기 신경망에 적용하고, 적용 결과에 따라 전립선암의 재발 여부를 출력하는 판단부를 포함하는 구성을 마련하여, 정기적으로 검진된 PSA 데이터를 시계열로 정규화 하여 전처리함으로써, 딥러닝 신경망을 보다 효과적으로 학습시킬 수 있고, 전립선암의 재발을 보다 정확하게 진단할 수 있다.

Description

시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템 { A recurrence prediction system based on deep learning for prostate cancer using time series data of examination }
본 발명은 전립선암의 진단 전후 및 수술 전후에 정기적으로 검진된 검진 데이터, 특히, 환자의 전립선특이항원(PSA) 데이터를 수집하고, 수집된 PSA 시계열 데이터를 신경망에 적용하여, 해당 환자의 전립선암 재발을 예측하는, 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 관한 것이다.
일반적으로 암 환자들이 겪는 증상과 예후는 다양하기 때문에 각 환자의 상태에 맞는 능동적인 치료법을 가료하는 것이 중요하다. 그 때문에 암 치료의 치료 효과평가는 암 치료 분야에 있어 중요한 과제이다. 또한 암은 수술이나 다른 치료과정을 통해 일시적으로 암이 제거된 것처럼 보여도, 수술로 완전히 제거되지 않은 암이 잔존하는 경우가 있어, 이들을 평가하는 것은 암의 재발 방지, 또는 재발에 대비한 치료법 선택도 매우 중요하다.
특히, 전립선암(C61)은 전립선암은 전립선에 발생하는 악성신생물로 손으로 직접 전립선 부위를 촉지하거나 전립선특이항원(PSA, Prostate Specific Antigen)검사 등의 방법에 의해 진단되며, 전립선암이 의심될 경우 초음파, MRI CT 등을 통해 암세포의 특성을 진단한다. 즉 전립선암이 의심되어 병원에 내원하는 시점부터 수술 후 5년 생존이 확인되는 시점까지 환자들은 짧게는 1개월, 길게는 3개월의 간격을 두고 PSA 검사를 받으며, 시간이 지날수록 그 검사 간격은 더욱 넓어 진다.
국제 임상가이드라인에 의하면 PSA 수치가 3 이상이면 전립선암의 가능성이 진단되고 있다. 그러나 PSA 수치가 10 미만의 환자에게서도 전립선암이 확진될 확률은 20%가 되지 않는다. 즉 1회의 PSA 검사만으로는 전립선암의 진단이나 재발을 확인하기 어렵다.
이러한 문제를 해결하고자 전립선암 등을 보다 정확하게 진단하고, 수술 후 효과적으로 재발을 예방을 위한 기술들이 제시되고 있다. 일례로서 임상수치 및 암 진행단계 수치를 이용하여 인공지능에 학습시키고, 학습된 인공지능으로 암 발생여부를 진단하는 기술이 제시되고 있다[특허문헌 1]. 또한 전립선암 발생 및 진행에 영향을 미치는 여러 변수들을 딥러닝 시켜 전립선암의 병리학적 단계를 예측하는 기술도 제시되고 있다[특허문헌 2].
그러나 상기 선행기술들은 환자의 단순한 검진 결과를 이용할 뿐, 정기적으로 검진되는 PSA 수치 변화에 대해서는 고려하지 않고 있다. 따라서 정기적으로 측정하는 PSA의 수치 변화가 전립선암 발생 및 재발예측에 긍정적인 영향을 미칠 수 있다.
하지만 환자별로 검사시점이 모두 다르고 PSA 수치의 경우 약물 및 방사선치료시점, 수술시점에 따라 매우 큰 영향을 받으므로, 검사 시점에 따른 PSA 수치를 일정한 간격으로 보정해 줄 필요가 있다. 또한 현실적으로 각각의 병원에서 시행되는 모든 검사 및 검진은 필연적으로 불규칙적인 시점을 가지고 있으므로, 결과값 또한 해당 시간 간격에 큰 영향을 받는다.
한국등록특허공보 제10-1018665호(2011.03.04.공고) 한국공개특허공보 제10-2019-0110834호(2019.10.01.공개)
본 발명의 목적은 상술한 바와 같은 문제점을 해결하기 위한 것으로, 전립선암의 진단 전후 및 수술 전후에 정기적으로 검진된 검진 데이터, 특히, 환자의 전립선 특이 항원검사(PSA) 데이터를 수집하고, 수집된 PSA의 시계열 데이터를 순환 신경망에 적용하여, 해당 환자의 전립선암 재발을 예측하는, 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템을 제공하는 것이다.
또한, 본 발명의 목적은 정기적으로 검진되는 환자의 PSA(전립선 특이 항원검사) 데이터를 수집하고, 수집된 PSA 데이터를 시계열로 정규화 하고, 정규화된 PSA 데이터를 순환 신경망에 적용시키는, 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템을 제공하는 것이다.
상기 목적을 달성하기 위해 본 발명은 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 관한 것으로서, 순환 신경망을 구비한 신경망 모듈; 일련의 다수의 PSA(Prostate Specific Antige) 수치를 시계열 순으로 정규화 하는 전처리부; PSA 학습 데이터를 상기 신경망 전처리부에 의해 전처리하게 하고, 전처리된 학습 데이터를 이용하여 상기 신경망을 학습시키는 신경망 학습부; 및, 환자의 일련의 PSA 데이터를 수신하여, 상기 환자의 PSA 데이터를 상기 신경망 전처리부에 의해 전처리하게 하고, 전처리된 데이터를 상기 신경망에 적용하고, 적용 결과에 따라 전립선암의 재발 여부를 출력하는 판단부를 포함하는 것을 특징으로 한다.
또, 본 발명은 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 있어서, 상기 신경망은 LSTM(long short-term memory networks)으로 구성되고, 상기 신경망은 다음 기간의 PSA 수치를 출력하는 것을 특징으로 한다.
또, 본 발명은 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 있어서, 상기 신경망의 입력은 PSA 수치의 시계열 데이터 외에 환자의 생체 지수를 더 포함하는 것을 특징으로 한다.
또, 본 발명은 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 있어서, 상기 전처리부는 일련의 PSA 수치들을 사전에 정해진 주기로 묶어 각 기간의 대표값을 설정하고, 각 기간의 대표값들을 시계열로 구성하여 정규화 하는 것을 특징으로 한다.
또, 본 발명은 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 있어서, 상기 전처리부는 주기에 의한 각 기간 내에 다수의 PSA 수치들이 존재하면, 해당 기간 내의 수치들의 중앙값을 대표값으로 설정하는 것을 특징으로 한다.
또, 본 발명은 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 있어서, 상기 전처리부는 해당 기간 내에 PSA 수치가 결측된 경우, 해당 기간의 전후 기간의 PSA 수치에 대하여 가중이동평균법을 적용하여, 해당 기간의 대표값을 추정하는 것을 특징으로 한다.
또, 본 발명은 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 있어서, 상기 전처리부는 결측된 대표값에서 최대한 전후 2개 기간의 대표값만을 이용하여, 결측 대표값을 추정하되, 가중치는 이전 기간의 대표값에 0.5, 이후 기간의 대표값에 0.5를 부여하고, 2개인 경우 가장 가까운 대표값에 0.3, 다음으로 가까운 대표값에 0.2를 부여하고, 이전 또는 이후 기간에 하나의 기간의 대표값만 있는 경우 0.5를 부여하는 것을 특징으로 한다.
또, 본 발명은 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 있어서, 시계열 데이터를 PSA 수치에 치료 정보를 더 포함하여 구성하는 것을 특징으로 한다.
상술한 바와 같이, 본 발명에 따른 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 의하면, 정기적으로 검진된 PSA 데이터를 시계열로 정규화 하여 전처리함으로써, 순환 신경망을 보다 효과적으로 학습시킬 수 있고, 전립선암의 재발을 보다 정확하게 진단할 수 있는 효과가 얻어진다.
도 1은 본 발명을 실시하기 위한 전체 시스템에 대한 구성도.
도 2는 본 발명의 일실시예에 따른 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템의 구성에 대한 블록도.
도 3은 본 발명의 일실시예에 따른 순환 신경망(RNN) 및, LSTM 신경망의 구조를 예시한 도면.
도 4는 본 발명의 일실시예에 따른 LSTM 신경망의 세부 구조도.
도 5는 본 발명의 일실시예에 따른 PSA 시계열 데이터에 대한 예시 그래프.
이하, 본 발명의 실시를 위한 구체적인 내용을 도면에 따라서 설명한다.
또한, 본 발명을 설명하는데 있어서 동일 부분은 동일 부호를 붙이고, 그 반복 설명은 생략한다.
먼저, 본 발명을 실시하기 위한 전체 시스템의 구성을 도 1을 참조하여 설명한다.
도 1(a)에서 보는 바와 같이, 본 발명에 따른 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템(이하 재발예측 시스템)은 PSA 검진 데이터를 입력받아 전립선암의 재발을 예측하는, 컴퓨터 단말(10) 상의 프로그램 시스템으로 실시될 수 있다.
즉, 재발예측 시스템(30)은 PC, 스마트폰, 태플릿PC 등 컴퓨터 단말(10) 상의 프로그램 시스템으로 실시될 수 있다. 특히, 상기 재발예측 시스템은 프로그램 시스템 또는 모바일 어플리케이션(또는 어플, 앱)으로 구성되어, 컴퓨터 단말(10)에 설치되어 실행될 수 있다. 재발예측 시스템(30)은 컴퓨터 단말(10)의 하드웨어 또는 소프트웨어 자원을 이용하여, PSA 검진 데이터를 분석하여 전립선암의 재발을 예측하는 서비스를 제공한다.
또한, 다른 실시예로서, 도 1(b)에서 보는 바와 같이, 상기 재발예측 시스템(30)은 컴퓨터 단말(10) 상의 재발예측 클라이언트(30a)와 재발예측 서버(30b)로 구성된 서버-클라이언트 시스템으로 구성되어 실행될 수 있다.
한편, 재발예측 클라이언트(30a)과 재발예측 서버(30b)는 통상의 클라이언트와 서버의 구성 방법에 따라 구현될 수 있다. 즉, 전체 시스템의 기능들을 클라이언트의 성능이나 서버와 통신량 등에 따라 분담될 수 있다. 이하에서는 재발예측 시스템으로 설명하나, 서버-클라이언트의 구성 방법에 따라 다양한 분담 형태로 구현될 수 있다.
다음으로, 본 발명의 제1 실시예에 따른 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템(30)을 도 2를 참조하여 설명한다.
도 2에서 보는 바와 같이, 본 발명의 제1 실시예에 따른 질환예측 서비스 시스템(30)은 딥러닝 신경망을 구비한 신경망 모듈(31), 일련의 다수의 PSA(Prostate Specific Antige) 수치를 시계열 순으로 정규화 하는 전처리부(32), PSA 학습 데이터를 전처리부(32)에 의해 전처리하게 하고, 전처리된 학습 데이터를 이용하여 신경망을 학습시키는 학습부(33), 및, 환자의 PSA 데이터를 신경망에 적용하여 전립선암의 재발 여부를 판단하는 판단부(34)로 구성된다.
먼저, 신경망 모듈(31)은 LSTM(long short-term memory networks) 신경망을 구비한다.
LSTM(Long Short Term Memory networks) 신경망은 RNN(순환신경망, Recurrent Neural Network)의 한 종류이며, 과거의 데이터가 미래에 영향을 줄 수 있는 구조를 가진다.
도 3a에서 보는 바와 같이, 순환 신경망(RNN, Recurrent Neural Network)은 은닉 노드(Hidden Node)가 방향을 가진 에지(Edge)로 연결되어 순환구조(Directed Circle)를 이루는 인공신경망이다. 특히, 순환 신경망은 시계열 데이터의 길이에 상관없이 입력(Input) 데이터와 출력(Output) 데이터를 받아들일 수 있는 네트워크 구조이기 때문에, 학습되는 데이터의 형태에 따라 다양하고 유연하게 구조를 만들 수 있다.
또한, RNN은 신경망의 일종으로 기존 FFNets 방식이 가지고 있는 일방향성의 한계를 보완하였으며, 시간 및 순서정보를 담고 있는 시계열(Time-series) 데이터나 시퀀스(Sequence) 데이터를 다루는데 유용하다. 즉 RNN 신경망을 이용하여, 분석하고자 하는 PSA 검사 및 검진데이터가 일정수준의 경향성 및 주기성만 있다면 해당 특성을 이용하여 미래의 PSA 값을 예측할 수 있다.
또한, 도 3b에서 보는 바와 같이, LSTM(Long Short Term Memory networks) 신경망은 RNN의 한 종류이나, RNN의 단점을 보완하여 기울기 소멸 문제(Vanishing Gradient Problem)를 어느 정도 극복할 수 있다. 즉, 기존의 RNN 신경망에서는 장기 의존성 문제점인 체인 룰(Chain Rule)에 의해 [-1, 1]사이의 값들이 계속 곱해지다보니 앞쪽으로 갈수록 그 값이 작아지고 결국에는 소멸한다. 즉, 기울기 소멸 문제는 학습시킬 데이터가 측정된 간격이 멀수록 발생하는 문제이다. 따라서 기존의 RNN 방식은 파라미터(Parameter)들이 업데이트 되지 않는 문제를 가진다.
LSTM은 이를 해결하기 위해 제안된 방식으로서, RNN 구조의 은닉층(Hidden Node)에 셀 상태(Cell State)를 추가한 방식이다. 기존의 RNN은 은닉층(Hidden Layer)에서 은닉 상태(Hidden State, St)를 계산할 때 단순히 ht=tanh(Uxt+Wht-1)로 계산하였지만, LSTM에서는 총 4가지의 계산과정이 있다. 구체적으로, 도 4에서 보는 바와 같이, LSTM의 은닉층(Hidden Layer)에서 신경망 레이어(Neural Network Layer)가 4개가 존재한다. 또한 LSTM의 핵심은 뉴럴(A)의 상단부분에 있는 수평선에 아주 마이너한 선형 연산을 거치고 전체 체인을 관통하여 정보는 큰 변함 없이 다음 단계로 전달하게 된다.
한편, LSTM 신경망의 입력은 PSA 수치의 시계열 데이터이고, 그 출력은 다음 PSA 수치의 예측 값이다.
특히, PSA 수치의 시계열 데이터는 수술(또는 치료) 후 측정된 PSA 수치들로서, 일정한 시간 간격(이하 측정 주기)에 의해 측정된 일련의 수치들을 나타낸다.
또한, 신경망의 입력은 PSA 수치 외에 연령, BMI(신체질량지수) 수치, 글리슨 점수, 고악성 전립선 상피내 신생물 등 환자의 생체 정보(또는 생체 지수)를 더 포함할 수 있다.
또한, 신경망의 출력은 환자의 시계열 데이터에서 마지막 PSA 수치(마지막 기간의 PSA 수치)의 직후 PSA 수치(직후 기간의 PSA 수치)를 예측한 값이다.
다음으로, 전처리부(32)는 일련의 다수의 PSA(Prostate Specific Antige) 수치를 시계열 순으로 정규화 한다.
도 5는 한 환자의 PSA 수치를 시계열 순으로 나열한 것을 예시하고 있다. 도 5의 예에서, 11.01에 수술을 한 후, 11.10, 02.08, 03.02, 04.10, 06.27, 08.04 등 각 날짜에 PSA를 검사하고, 그 때의 PSA 수치가 각각 10.6, 6.3, 13.5, 11.2, 13.2, 15.3 으로 측정되고 있다. 설명의 편의를 위하여, 도 5의 수치는 원래의 수치 1을 100으로 환산한 수치로 설정하였다. 즉, 도 5의 10.6은 0.106을 나타내며, 환자 PSA데이터는 일반적으로 소수점 3째 자리까지 기록한다.
환자별로 검사시점이 모두 다르고, PSA 수치의 경우 약물치료시점, 방사선치료시점, 수술시점에 따라 매우 큰 영향을 받으므로, 검사시점에 따른 PSA 수치를 보정해줄 필요가 있다.
먼저, PSA 검사결과가 이상치 기준(데이터분포 및 이상치 검정결과)을 초과하면 모두 이상치 기준으로 대체한다. 예를 들어, 이상치 기준이 15.0인데, 15.4나 16.7의 PSA 수치가 존재하면, 해당 수치를 이상치 기준 15.0으로 보정한다.
또한, 환자의 일련의 PSA 수치들을 일정한 주기로 묶어 대표값을 설정한다. 도 5의 예에서, 주기를 2개월로 정하면, 11-12월, 1-2월, 3-4월, 5-6월, 7-8월로 각 기간이 구분된다.
한편, 해당 기간 내에 다수의 PSA 수치가 존재하면, 이들 수치값들의 중앙값을 대표값으로 설정한다. 도 5의 예에서, 각 기간의 대표값은 10.6, 6.3, 12.2(11.2와 13.2의 중앙값), 13.2, 15.3 등으로 구해진다.
또한, 전처리부(32)는 해당 기간 내에 PSA 수치가 없는 경우(PSA 수치가 결측된 경우), 가동이동평균법을 이용하여 PSA 수치를 추정한다. 즉, PSA 결측치가 있는 경우, 결측치의 전후 기간의 데이터(수치)들에 대하여 가중이동평균법을 적용하여 해당 결측치를 추정한다.
가중이동평균법은 현재 시점으로부터 오래된 데이터보다 최신의 데이터가 예측하고자 하는 결과 도출에 더 많은 영향을 미친다고 보는 관점에서 개선된 평균법이다. 즉, 가중이동평균법은 최신의 데이터와 오래된 데이터가 같은 영향력이 있다고 가정하는 단순이동평균법의 문제점을 해결하기 위해 개발되었다. 따라서 가중이동평균법은 가장 최근의 데이터에 높은 가중치 계수를 주고, 더 오래된 데이터일수록 낮은 가중치 계수를 주어, 계수의 총 합이 1이 되도록 산출하는 방식이다.
바람직하게는, 결측 데이터에서 최대한 전후 2개의 데이터(PSA 수치)만을 이용하여, 결측 데이터를 추정한다. 이때, 가중치는 직전 데이터에 0.5, 직후에 0.5 가중치를 부여하되, 2개인 경우 가장 가까운 데이터에 0.3, 다음으로 가까운 데이터에 0.2를 부여한다. 결측치를 기준으로 앞 또는 뒤에 하나의 값만 있는 경우 0.5를 부여한다.
도 5의 예에서, 주기를 1개월로 설정하면, 5월과 7월의 PSA 수치(또는 PSA 데이터)가 결측된다. 5월의 경우, 직전 데이터는 13.5(3월), 11.2(4월)이 있고, 직후 데이터는 13.2(6월)만 존재한다. 따라서 5월의 결측 데이터는 다음과 같이 계산된다.
13.5×0.2 + 11.2×0.3 + 13.2×0.5 = 12.66
즉, 3월, 4월, 6월 데이터의 가중치는 각각 0.2, 0.3, 0.5가 부여된다.
다음으로, 학습부(33)는 PSA 학습 데이터를 전처리부(32)에 의해 전처리하게 하고, 전처리된 학습 데이터를 이용하여 신경망 모듈(31)의 신경망을 학습시킨다.
즉, 학습부(33)는 전립선암 수술 환자 데이터를 수집하여, 수술 이후 PSA 검사를 N번 이상 받은 환자데이터를 선별하고, N개월 주기로 데이터를 그룹화 하고 대표값을 추출한다.
실험에 의하면, 3개 대형 병원에서 수술 후 PSA 검사를 최소 4번이상 받은 환자의 데이터를 3개월 주기 단위로 그룹화 한다. 전처리 전 원데이터는 환자수 6,977명, PSA 데이터 수 74,825개를 수집하였다. 이중 원데이터에서 한 환자 당 PSA 데이터가 8개 이상인 환자 4,510명의 PSA 데이터 63,012개를 추출했다. 그런 다음 PSA 데이터를 3개월 단위로 묶고, 상기 명시된 가중이동평균법으로 결측치를 채우게 되면 PSA 데이터의 총 수는 67,504개가 된다. 이때, PSA 데이터의 결측으로 입력된 가데이터는 4,492개가 발생되었다. 즉, 환자 당 평균 데이터는 14.97개이었다. 이 데이터는 결측으로 입력된 가데이터까지 포함된다.
위 결측으로 입력된 가데이터에 가중이동평균법을 적용하여 값을 추정한 후, 결측이 없는 완결한 데이터를 LSTM 기법으로 학습시켰다.
다음으로, 판단부(34)는 환자의 PSA 데이터를 신경망에 적용하여 전립선암의 재발 여부를 판단한다.
즉, 판단부(34)는 치료 또는 수술 시점 이후 측정된 일련의 환자의 PSA 데이터, 즉, 환자의 PSA 수치의 시계열 데이터를 수신하면(입력받으면), 앞서 전처리부(32)를 통해 전처리를 수행하게 한다.
다음으로, 판단부(34)는 전처리된 환자의 PSA 수치의 시계열 데이터를 LSTM 신경망에 입력시키고, LSTM 신경망의 출력 값을 획득한다.
다음으로, 판단부(34)는 획득된 신경망의 출력 값으로 전립선암 재발 여부를 판단한다. 즉, 신경망의 출력 값은 해당 환자의 다음 PSA 수치의 예측값이다. 해당 예측값(또는 출력값)이 사전에 정해진 기준 범위에 해당하면 전립선암 재발된 것으로 판단한다. 바람직하게는, 예측된 PSA 수치가 재발 기준(사전에 정해진 기준) 0.2를 넘으면 전립선암 재발로 판단하고 넘지 않으면 그렇지 않은 것으로 판단한다.
다음으로, 본 발명의 제2 실시예에 따른 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템(30)을 설명한다.
본 발명의 제2 실시예는 앞서 설명한 제1 실시예와 동일하며, 다만, 시계열 데이터를 PSA 수치에 치료 정보(또는 치료 데이터)를 더 포함하여 구성한다.
바람직하게는 치료 정보의 시계열 데이터는 해당 기간 내의 투약정보, 방사선 치료비 등으로 구성된다.
또한, 바람직하게는, 투약정보나 방사선 치료는 투약 또는 치료 여부에 따라 이진 값으로 설정된다. 예를 들어, 해당 기간 내에 투약 또는 치료 되었으면 “1”로 입력되고, 그렇지 않으면 “0”으로 입력된다.
즉, 수술 후 환자의 PSA수치가 비정상적으로 올라가는것을 확인하면 재수술을 하기전에 호르몬치료, 방사선치료, 항암제치료 등의 수단을 시행하고, 그럼에도 호전되지 않는 경우 재수술을 하게 된다. 따라서 딥러닝 예측모델에 환자 PSA수치 변화에 영향을 줄 수 있는 위 치료들의 날짜를 고려하여, PSA 수치가 크게 변화하기 직전에 PSA 검사일에 해당 정보를 명시(1 또는 0으로 코딩)하는 변수를 추가한다. 실제로 이러한 변수 추가는 성능에도 긍정적인 영향을 미친다.
이상, 본 발명자에 의해서 이루어진 발명을 상기 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 상기 실시 예에 한정되는 것은 아니고, 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 물론이다.
10 : 컴퓨터 단말 20 : 재발예측 클라이언트
30 : 재발예측 시스템 31 : 신경망 모듈
32 : 전처리부 33 : 학습부
34 : 판단부
40 : 데이터베이스 80 : 네트워크

Claims (8)

  1. 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템에 있어서,
    순환 신경망을 구비한 신경망 모듈;
    일련의 다수의 PSA(Prostate Specific Antige) 수치를 시계열 순으로 정규화 하는 전처리부;
    PSA 학습 데이터를 상기 전처리부에 의해 전처리하게 하고, 전처리된 학습 데이터를 이용하여 상기 신경망을 학습시키는 신경망 학습부; 및,
    환자의 일련의 PSA 데이터를 수신하여, 상기 환자의 PSA 데이터를 상기 전처리부에 의해 정규화하게 하고, 정규화된 데이터를 상기 신경망에 적용하고, 적용 결과에 따라 전립선암의 재발 여부를 출력하는 판단부를 포함하고,
    상기 전처리부는 일련의 PSA 수치들을 사전에 정해진 주기로 묶어 각 기간의 대표값을 설정하고, 각 기간의 대표값들을 시계열로 구성하여 정규화 하는 것을 특징으로 하는 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템.
  2. 제1항에 있어서,
    상기 신경망은 LSTM(long short-term memory networks)으로 구성되고, 상기 신경망은 다음 기간의 PSA 수치를 출력하는 것을 특징으로 하는 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템.
  3. 제1항에 있어서,
    상기 신경망의 입력은 PSA 수치의 시계열 데이터 외에 환자의 생체 지수를 더 포함하는 것을 특징으로 하는 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템.
  4. 삭제
  5. 제1항에 있어서,
    상기 전처리부는 주기에 의한 각 기간 내에 다수의 PSA 수치들이 존재하면, 해당 기간 내의 수치들의 중앙값을 대표값으로 설정하는 것을 특징으로 하는 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템.
  6. 제1항에 있어서,
    상기 전처리부는 해당 기간 내에 PSA 수치가 결측된 경우, 해당 기간의 전후 기간의 PSA 수치에 대하여 가중이동평균법을 적용하여, 해당 기간의 대표값을 추정하는 것을 특징으로 하는 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템.
  7. 제6항에 있어서,
    상기 전처리부는 결측된 대표값에서 최대한 전후 2개 기간의 대표값만을 이용하여, 결측 대표값을 추정하되, 가중치는 이전 기간의 대표값에 0.5, 이후 기간의 대표값에 0.5를 부여하고, 2개인 경우 가장 가까운 대표값에 0.3, 다음으로 가까운 대표값에 0.2를 부여하고, 이전 또는 이후 기간에 하나의 기간의 대표값만 있는 경우 0.5를 부여하는 것을 특징으로 하는 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템.
  8. 제1항에 있어서,
    시계열 데이터를 PSA 수치에 치료 정보를 더 포함하여 구성하는 것을 특징으로 하는 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템.
KR1020200108799A 2019-12-27 2020-08-27 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템 KR102499912B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190176818 2019-12-27
KR20190176818 2019-12-27

Publications (2)

Publication Number Publication Date
KR20210084214A KR20210084214A (ko) 2021-07-07
KR102499912B1 true KR102499912B1 (ko) 2023-02-15

Family

ID=76862350

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200108799A KR102499912B1 (ko) 2019-12-27 2020-08-27 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템

Country Status (1)

Country Link
KR (1) KR102499912B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102551808B1 (ko) 2022-10-12 2023-07-05 주식회사 에이비스 근시퇴행 예측 의료기기 장치 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101018665B1 (ko) * 2008-08-18 2011-03-04 재단법인서울대학교산학협력재단 전립선암 진단 방법 및 장치
KR102142754B1 (ko) 2018-03-21 2020-08-07 가톨릭대학교 산학협력단 딥러닝 기반의 전립선암 병리학적 단계 예측 방법

Also Published As

Publication number Publication date
KR20210084214A (ko) 2021-07-07

Similar Documents

Publication Publication Date Title
US11600390B2 (en) Machine learning clinical decision support system for risk categorization
US11900473B2 (en) Method of personalizing, individualizing, and automating the management of healthcare fraud-waste-abuse to unique individual healthcare providers
US20190180379A1 (en) Life insurance system with fully automated underwriting process for real-time underwriting and risk adjustment, and corresponding method thereof
Health Quality Ontario Remote monitoring of implantable cardioverter-defibrillators, cardiac resynchronization therapy and permanent pacemakers: a health technology assessment
US10282843B2 (en) System and method for lesion analysis and recommendation of screening checkpoints for reduced risk of skin cancer
EP3599616A1 (en) System and method for providing a medical data structure for a patient
US20160117457A1 (en) Method and apparatus for analyzing patient's constitutional peculiarity
KR102499912B1 (ko) 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템
Habibi et al. Estimation of re-hospitalization risk of diabetic patients based on radial base function (RBF) neural network method combined with colonial competition optimization algorithm
Tseng et al. Spectrum bias in algorithms derived by artificial intelligence: a case study in detecting aortic stenosis using electrocardiograms
Kafadar et al. A data‐analytic approach for estimating lead time and screening benefit based on survival curves in randomized cancer screening trials
Heckerling et al. Prediction of community-acquired pneumonia using artificial neural networks
Nikolaeva et al. Patient measurements simulation and event processing in telemedicine systems
Poh et al. Anomaly detection for home activity based on sequence pattern
Garcia-Rios et al. Predictive machine learning applying cross industry standard process for data mining for the diagnosis of diabetes mellitus type 2
Straney et al. A two‐compartment mixed‐effects gamma regression model for quantifying between‐unit variability in length of stay among children admitted to intensive care
US20200185104A1 (en) Complex Care Tool
Tian GP Post Call Wait Times Predictions Using LSTM
Cherniaev et al. Forecasting trends in the tuberculosis epidemic situation in the region of the Russian Federation by dynamic simulation model
KR102511516B1 (ko) 인공지능을 이용한 ct 조영제 유발 신독성 예측 장치 및 그 방법
Bailek Effectiveness of Service Quality of Hospitals and Integrated Delivery Networks Based on Early Readmission Rate
CN117079760B (zh) 华法林剂量调整方法、系统及临床辅助决策系统
Merugula et al. RideNN‐OptDRN: heart disease detection using RideNN based feature fusion and optimized deep residual network
Wickramasinghe et al. Real-time prediction of the risk of hospital readmissions
US20230225668A1 (en) Systems, methods, and media for predicting a conversion time of mild cognitive impairment to alzheimer's disease in patients

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right