KR102127449B1 - Apparatus, method, and computer program for generating survival rate prediction model - Google Patents

Apparatus, method, and computer program for generating survival rate prediction model Download PDF

Info

Publication number
KR102127449B1
KR102127449B1 KR1020170017642A KR20170017642A KR102127449B1 KR 102127449 B1 KR102127449 B1 KR 102127449B1 KR 1020170017642 A KR1020170017642 A KR 1020170017642A KR 20170017642 A KR20170017642 A KR 20170017642A KR 102127449 B1 KR102127449 B1 KR 102127449B1
Authority
KR
South Korea
Prior art keywords
survival rate
prediction model
data
section
survival
Prior art date
Application number
KR1020170017642A
Other languages
Korean (ko)
Other versions
KR102127449B9 (en
KR20180092189A (en
Inventor
서성욱
Original Assignee
사회복지법인 삼성생명공익재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 사회복지법인 삼성생명공익재단 filed Critical 사회복지법인 삼성생명공익재단
Priority to KR1020170017642A priority Critical patent/KR102127449B1/en
Priority to PCT/KR2018/001692 priority patent/WO2018147653A1/en
Publication of KR20180092189A publication Critical patent/KR20180092189A/en
Application granted granted Critical
Publication of KR102127449B1 publication Critical patent/KR102127449B1/en
Publication of KR102127449B9 publication Critical patent/KR102127449B9/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Child & Adolescent Psychology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • Algebra (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 일 실시예는 임상 데이터 및 상기 임상 데이터를 제공한 대상자의 N번째 구간 생존율 데이터를 이용하여 N번째 구간 생존율 예측 모델을 생성하는 제1 단계; 상기 N번째 구간 생존율 데이터, 상기 N번째 구간 생존율 예측 모델 및 N+1번째 구간 생존율 데이터를 이용하여 N+1번째 구간 생존율 예측 모델을 생성하는 제2 단계;를 포함하는 생존율 예측 모델 생성 방법을 개시한다.An embodiment of the present invention includes a first step of generating an N-th survival rate prediction model using clinical data and N-th survival rate data of a subject who provided the clinical data; A second step of generating an N+1th interval survival rate prediction model using the Nth interval survival rate data, the Nth interval survival rate prediction model, and the N+1st interval survival rate data. do.

Description

생존율 예측 모델 생성 방법, 장치 및 컴퓨터 프로그램{Apparatus, method, and computer program for generating survival rate prediction model}Apparatus, method, and computer program for generating survival rate prediction model}

본 발명의 실시예들은 생존율 예측 모델 생성 방법, 장치 및 컴퓨터 프로그램에 관한 것이다.Embodiments of the present invention relate to a method, apparatus and computer program for generating a survival rate prediction model.

암 5년 생존율은 암 5년 생존율은 의료기술의 효과와 의료체계의 성과를 드러내는 대표적인 지표이다. 암 5년 생존율은 암에 걸린 것으로 진단받고 치료를 시작한 암 환자가 최소한 5년 동안 발병한 암으로 사망하지 않을 확률을 의미한다. 5년 생존율이 높다는 것은 곧 암 치료가 상대적으로 순탄하게 잘 진행되고 있음을 나타내며 의료체계가 암과 같은 중증질환을 관리하기에 적합하다는 것을 보여준다고 할 수 있다.The 5-year survival rate for cancer is a representative indicator of the effectiveness of medical technology and the performance of the medical system. The 5-year survival rate for cancer means the probability that a cancer patient diagnosed with cancer and has started treatment will not die of cancer that has developed for at least 5 years. A high five-year survival rate indicates that cancer treatment is progressing relatively smoothly, and that the medical system is suitable for managing serious diseases such as cancer.

OECD에서는 대장암, 자궁암, 유방암의 5년 생존율을 국제적으로 비교하고 있다. OECD의 암 생존율 통계는 계산방식의 차이로 인하여 국내의 암 생존율 통계와 일치하지 않는다. OECD 기준으로 볼 때 한국의 대장암 5년 생존율은 2008-2013년 기간에 70.9%로 OECD 주요 국가들 중에서 가장 높으며, 스웨덴(65.4%)이 그 다음으로 높다. 유방암 5년 생존율의 경우 한국은 85.9%로 OECD 국가들의 평균(84.9%)보다 조금 더 높은 수준이며 생존율이 가장 높은 스웨덴(89.4%)보다는 약 5% 포인트 정도 낮다.
The OECD internationally compares the 5-year survival rate for colorectal cancer, uterine cancer and breast cancer. The OECD cancer survival rate statistics do not match the domestic cancer survival rate statistics due to differences in calculation methods. By OECD standards, Korea's 5-year survival rate for colon cancer is 70.9% in the period 2008-2013, the highest among the major OECD countries, followed by Sweden (65.4%). For the 5-year survival rate for breast cancer, Korea is 85.9%, slightly higher than the average of OECD countries (84.9%) and about 5 percentage points lower than Sweden (89.4%), which has the highest survival rate.

본 발명의 실시예들은 환자의 의료 데이터로부터 연차별 생존율을 예측할 수 있는 생존율 예측 모델 생성 방법, 장치 및 컴퓨터 프로그램을 제공한다.Embodiments of the present invention provide a method, apparatus and computer program for generating a survival rate prediction model capable of predicting annual survival rates from medical data of a patient.

본 발명의 일 실시예는 임상 데이터 및 상기 임상 데이터를 제공한 대상자의 N번째 구간 생존율 데이터를 이용하여 N번째 구간 생존율 예측 모델을 생성하는 제1 단계; 상기 N번째 구간 생존율 데이터, 상기 N번째 구간 생존율 예측 모델 및 N+1번째 구간 생존율 데이터를 이용하여 N+1번째 구간 생존율 예측 모델을 생성하는 제2 단계;를 포함하는 생존율 예측 모델 생성 방법을 개시한다.An embodiment of the present invention includes a first step of generating an N-th survival rate prediction model using clinical data and N-th survival rate data of a subject who provided the clinical data; A second step of generating an N+1th interval survival rate prediction model using the Nth interval survival rate data, the Nth interval survival rate prediction model, and the N+1st interval survival rate data. do.

상기 N번째 구간 생존율 데이터 각각에 대하여, 생존 기간에 따른 스코어를 부여하는 단계;를 더 포함하고, 상기 제2 단계는, 상기 N번째 구간 생존율 데이터 각각에 부여된 스코어를 이용하여 N+1년차 생존율 예측 모델을 생성하는 예후 예측 모델 생성 방법을 개시한다.And for each of the N-th section survival rate data, assigning a score according to the survival period; and the second step includes N+1 year survival rate using the score given to each of the N-th section survival rate data. Disclosed is a prognostic model generating method for generating a predictive model.

상기 스코어는 상기 생존 기간에 비례하는 예후 예측 모델 생성 방법을 개시한다.The score discloses a method for generating a prognostic prediction model proportional to the survival period.

상기 생존 기간은 적어도 월 단위로 구분되는 예후 예측 모델 생성 방법을 개시한다.The survival period discloses a method for generating a prognostic prediction model that is divided into at least monthly units.

상기 N+1번째 구간 생존율 예측 모델은 상기 임상 데이터 및 N번째 구간 생존율 데이터를 입력으로 하고 N+1번째 구간 생존율 데이터를 출력으로 하는 입출력함수인 예후 예측 모델 생성 방법을 개시한다.The N+1th section survival rate prediction model discloses a method for generating a predictive prediction model that is an input/output function using the clinical data and the Nth section survival rate data as input and outputting the N+1st section survival rate data.

상기 생성하는 단계는, RNN(Recurrent Neural Network) 알고리즘을 이용하는 예후 예측 모델 생성 방법을 개시한다.The generating step discloses a method for generating a prognostic prediction model using a Recurrent Neural Network (RNN) algorithm.

본 발명의 다른 실시예는 임상 데이터를 획득하는 임상 데이터 획득부; 생존율 데이터를 획득하는 생존율 데이터 획득부; 및 상기 임상 데이터 및 상기 임상 데이터를 제공한 대상자의 N번째 구간 생존율 데이터를 이용하여 N번째 구간 생존율 예측 모델을 생성하고, 상기 N번째 구간 생존율 데이터, 상기 N번째 구간 생존율 예측 모델 및 N+1번째 구간 생존율 데이터를 이용하여 N+1번째 구간 생존율 예측 모델을 생성하는 예측 모델 생성부;를 포함하는 생존율 예측 모델 생성 장치를 개시한다.Another embodiment of the present invention is a clinical data acquisition unit for acquiring clinical data; A survival rate data acquisition unit for obtaining survival rate data; And an N-th survival rate prediction model using the clinical data and the N-th survival rate data of the subject who provided the clinical data, and the N-th survival rate data, the N-th survival rate prediction model, and the N+1th Disclosed is an apparatus for generating a survival rate prediction model including; a prediction model generator for generating an N+1th interval survival rate prediction model using the interval survival rate data.

상기 N번째 구간 생존율 데이터 각각에 대하여, 생존 기간에 따른 스코어를 부여하는 생존율 데이터 가공부;를 더 포함하고, 상기 예측 모델 생성부는, 상기 N번째 구간 생존율 데이터 각각에 부여된 스코어를 이용하여 N+1년차 생존율 예측 모델을 생성하는 예후 예측 모델 생성 장치를 개시한다.For each of the N-th section survival rate data, a survival rate data processing unit that assigns a score according to the survival period; and further comprising, the prediction model generating unit uses the score given to each of the N-th section survival rate data to N+ Disclosed is a prognostic prediction model generating device for generating a predictive model for survival for the first year.

상기 스코어는 상기 생존 기간에 비례하는 예후 예측 모델 생성 장치를 개시한다.The score discloses a device for generating a prognostic prediction model proportional to the survival period.

상기 생존 기간은 적어도 월 단위로 구분되는 예후 예측 모델 생성 장치를 개시한다.The survival period discloses an apparatus for generating a predictive prediction model that is divided into at least monthly units.

상기 N+1번째 구간 생존율 예측 모델은 상기 임상 데이터 및 N번째 구간 생존율 데이터를 입력으로 하고 N+1번째 구간 생존율 데이터를 출력으로 하는 입출력함수인 예후 예측 모델 생성 장치를 개시한다.The N+1th section survival rate prediction model discloses an apparatus for generating a predictive prediction model that is an input/output function that inputs the clinical data and the Nth section survival rate data and outputs the N+1st section survival rate data.

상기 생성하는 단계는, RNN(Recurrent Neural Network) 알고리즘을 이용하는 예후 예측 모델 생성 장치를 개시한다.The generating step discloses an apparatus for generating a prognostic prediction model using a Recurrent Neural Network (RNN) algorithm.

본 발명의 다른 실시예는 컴퓨터를 이용하여 전술한 예후 예측 모델 생성 방법을 실행하기 위하여 매체에 저장된 컴퓨터 프로그램을 개시한다.Another embodiment of the present invention discloses a computer program stored in a medium to execute the above-described prognostic model generation method using a computer.

전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해질 것이다.
Other aspects, features and advantages other than those described above will become apparent from the following drawings, claims and detailed description of the invention.

본 발명의 실시예들에 관한 생존율 예측 모델 생성 방법, 장치 및 컴퓨터 프로그램은 환자의 의료 데이터로부터 연차별 생존율을 예측할 수 있다.The method, apparatus, and computer program for generating a survival rate prediction model according to embodiments of the present invention may predict the survival rate for each year from medical data of a patient.

본 발명의 실시예들에 관한 생존율 예측 모델 생성 방법, 장치 및 컴퓨터 프로그램은 전년도 환자의 생존율 데이터를 이용하여 금년도 생존율 예측 모델을 생성함으로써, 정확도가 높은 예측 모델을 생성한다.The method, apparatus, and computer program for generating a survival rate prediction model according to embodiments of the present invention generate a prediction model with high accuracy by generating a survival rate prediction model this year using survival rate data of a patient of the previous year.

본 발명의 실시예들에 관한 생존율 예측 모델 생성 방법, 장치 및 컴퓨터 프로그램은 전년도 환자의 생존율 데이터를 이용함에 있어서 랭킹화된 스코어를 부여함으로써, 많은 수의 유의미한 데이터를 확보할 수 있고, 이에 따라 정확도가 높은 예측 모델을 생성한다.
The method, apparatus and computer program for generating a survival rate prediction model according to embodiments of the present invention can secure a large number of meaningful data by assigning a ranking score in using the survival rate data of a patient of the previous year, and thus, accuracy Creates a high prediction model.

도 1은 본 발명의 일 실시예에 따른 예측 모델 생성 장치의 구성을 개략적으로 도시한 것이다.
도 2는 본 발명의 일 실시예에 따른 예측 모델 생성 방법을 도시한 흐름도이다.
도 3은 본 발명의 다른 실시예에 따른 예측 모델 생성 방법을 도시한 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 예측 모델을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 예측 모델을 설명하기 위한 도면의 다른 예이다.
도 6은 본 발명의 일 실시예에 따른 예측 모델을 설명하기 위한 그래프이다.
1 schematically shows a configuration of an apparatus for generating a predictive model according to an embodiment of the present invention.
2 is a flowchart illustrating a method for generating a predictive model according to an embodiment of the present invention.
3 is a flowchart illustrating a method for generating a predictive model according to another embodiment of the present invention.
4 is a view for explaining a prediction model according to an embodiment of the present invention.
5 is another example of a diagram for describing a prediction model according to an embodiment of the present invention.
6 is a graph for explaining a prediction model according to an embodiment of the present invention.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다. The present invention can be applied to a variety of transformations and may have various embodiments, and specific embodiments will be illustrated in the drawings and described in detail in the detailed description. Effects and features of the present invention and methods for achieving them will be clarified with reference to embodiments described below in detail with reference to the drawings. However, the present invention is not limited to the embodiments disclosed below, but may be implemented in various forms.

이하, 첨부된 도면을 참조하여 본 발명의 실시예들을 상세히 설명하기로 하며, 도면을 참조하여 설명할 때 동일하거나 대응하는 구성 요소는 동일한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings, and the same or corresponding components will be given the same reference numerals when describing with reference to the drawings, and redundant description thereof will be omitted. .

이하의 실시예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 이하의 실시예에서, 포함하다 또는 가지다 등의 용어는 명세서상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징들 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다. In the following embodiments, singular expressions include plural expressions, unless the context clearly indicates otherwise. In the examples below, terms such as include or have are meant to mean the presence of features or components described in the specification, and do not preclude the possibility of adding one or more other features or components in advance.

이하, 첨부된 도면들에 도시된 본 발명의 바람직한 실시예를 참조하여 본 발명을 보다 상세히 설명한다.
Hereinafter, the present invention will be described in more detail with reference to preferred embodiments of the present invention shown in the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 예측 모델 생성 장치의 구성을 개략적으로 도시한 것이다.1 schematically shows a configuration of an apparatus for generating a predictive model according to an embodiment of the present invention.

도 1에 도시된 예측 모델 생성 장치(10)는 본 실시예의 특징이 흐려지는 것을 방지하기 위하여 본 실시예와 관련된 구성요소들만을 도시한 것이다. 따라서, 도 1에 도시된 구성요소들 외에 다른 범용적인 구성요소들이 더 포함될 수 있음을 본 실시예와 관련된 기술분야에서 통상의 지식을 가진 자라면 이해할 수 있다.The prediction model generating apparatus 10 illustrated in FIG. 1 shows only components related to the present embodiment in order to prevent blurring of features of the present embodiment. Therefore, it can be understood by those of ordinary skill in the art related to this embodiment that components other than those shown in FIG. 1 may be further included.

본 실시예에 따른 예측 모델 생성 장치(10)는 적어도 하나 이상의 프로세서(processor)에 해당하거나, 적어도 하나 이상의 프로세서를 포함할 수 있다. 이에 따라, 예측 모델 생성 장치(10)는 마이크로 프로세서나 범용 컴퓨터 시스템과 같은 다른 하드웨어 장치에 포함된 형태로 구동될 수 있다.The apparatus 10 for generating a predictive model according to the present exemplary embodiment may correspond to at least one processor, or may include at least one processor. Accordingly, the predictive model generating device 10 may be driven in a form included in other hardware devices such as a microprocessor or a general-purpose computer system.

본 발명은 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들은 특정 기능들을 실행하는 다양한 개수의 하드웨어 또는/및 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 본 발명은 하나 이상의 마이크로프로세서들의 제어 또는 다른 제어 장치들에 의해서 다양한 기능들을 실행할 수 있는, 메모리, 프로세싱, 로직(logic), 룩 업 테이블(look-up table) 등과 같은 직접 회로 구성들을 채용할 수 있다. 본 발명에의 구성 요소들이 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있는 것과 유사하게, 본 발명은 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 본 발명은 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. "매커니즘", "요소", "수단", "구성"과 같은 용어는 넓게 사용될 수 있으며, 본 발명의 구성요소들이 기계적이고 물리적인 구성들로서 한정되는 것은 아니다. 상기 용어는 프로세서 등과 연계하여 소프트웨어의 일련의 처리들(routines)의 의미를 포함할 수 있다.The present invention can be represented by functional block configurations and various processing steps. These functional blocks can be implemented with various numbers of hardware or/and software configurations that perform specific functions. For example, the present invention provides a direct circuit configuration, such as memory, processing, logic, look-up table, etc., capable of executing various functions by control of one or more microprocessors or other control devices. You can hire them. Similar to the components of the present invention that can be executed with software programming or software elements, the present invention includes C, C++, including various algorithms implemented with a combination of data structures, processes, routines or other programming configurations. , Can be implemented in programming or scripting languages such as Java, assembler, etc. Functional aspects can be implemented with algorithms running on one or more processors. In addition, the present invention may employ conventional techniques for electronic environment setting, signal processing, and/or data processing. Terms such as "mechanism", "element", "means", and "configuration" can be widely used, and the components of the present invention are not limited to mechanical and physical configurations. The term may include the meaning of a series of routines of software in connection with a processor or the like.

도 1을 참조하면, 예측 모델 생성 장치(10)는 임상 데이터 획득부(11), 생존율 데이터 획득부(12), 생존율 데이터 가공부(14) 및 예측 모델 생성부(13)를 포함한다.Referring to FIG. 1, the predictive model generation device 10 includes a clinical data acquisition unit 11, a survival rate data acquisition unit 12, a survival rate data processing unit 14, and a prediction model generation unit 13.

일 실시예에 따른 임상 데이터 획득부(11)는 환자의 의료 데이터, 예컨대 임상 데이터를 획득한다. 임상 데이터는 환자의 의료 영상으로부터 획득되거나, 환자의 검체 검사 결과로부터 획득될 수 있고, 이에 한정하지 않는다.The clinical data acquisition unit 11 according to an embodiment acquires medical data of a patient, for example, clinical data. Clinical data may be obtained from a patient's medical image, or may be obtained from a patient's sample test results, but are not limited thereto.

일 실시예에 따른 생존율 데이터 획득부(12)는 임상 데이터를 제공한 대상자(환자)의 생존율 데이터를 획득한다. 생존율 데이터는, 생존 여부를 나타내는 데이터이다. 생존율 데이터는 생존 여부만을 포함할 수도 있으나, 생존 기간에 대한 정보를 더 포함할 수 있다. The survival rate data acquisition unit 12 according to an embodiment acquires survival rate data of a subject (patient) who has provided clinical data. Survival rate data is data indicating whether or not survival exists. Survival rate data may include only survival, but may further include information on the survival period.

일 실시예에 따른 예측 모델 생성부(13)는 환자의 임상 데이터로부터 환자의 구간 별 생존율을 예측할 수 있는 생존율 예측 모델을 생성한다. 구간은 연(year)일 수 있다. 예를 들어, 예측 모델 생성부(13)는 위암 환자의 임상 데이터로부터 위암 환자의 연차 별 생존율을 예측하는 생존율 예측 모델을 생성할 수 있다. 상세히, 예측 모델 생성부(13)는 위암 환자의 첫 해 임상 데이터로부터, 위암 환자의 1년차부터 5년차까지의 연차 별 생존율을 예측할 수 있는 생존율 예측 모델을 생성할 수 있다. The predictive model generation unit 13 according to an embodiment generates a survival rate prediction model capable of predicting the survival rate for each section of the patient from clinical data of the patient. The interval may be year. For example, the predictive model generation unit 13 may generate a survival rate prediction model that predicts annual survival rates of gastric cancer patients from clinical data of gastric cancer patients. In detail, the predictive model generation unit 13 may generate a survival rate prediction model capable of predicting survival rates for each year from the first year to the fifth year of gastric cancer patients from clinical data of the first year of gastric cancer patients.

일 실시예에 따른 예측 모델 생성부(13)는 머신러닝 기법을 이용하여, 환자들의 임상 데이터 및 실제 생존율 데이터를 기반으로 생존율 예측 모델을 생성할 수 있다. 일 실시예에 따른 예측 모델 생성부(13)는 머신러닝 기법 중에서도 딥 러닝 알고리즘을 사용할 수 있고, 그 중에서도 RNN(Recurrent Neural Network) 알고리즘을 사용할 수 있다. RNN 알고리즘은, 인공신경망을 구성하는 유닛 사이의 연결이 다이렉티드 싸이클(directed cycle)을 구성하는 신경망을 말한다. The prediction model generator 13 according to an embodiment may generate a survival rate prediction model based on clinical data of patients and actual survival rate data using a machine learning technique. The prediction model generator 13 according to an embodiment may use a deep learning algorithm among machine learning techniques, and may use a Recurrent Neural Network (RNN) algorithm. The RNN algorithm refers to a neural network in which a connection between units constituting an artificial neural network constitutes a directed cycle.

일 실시예에 따른 예측 모델 생성부(13)는 임상 데이터 및 상기 임상 데이터를 제공한 환자의 N번째 구간 생존율 데이터를 이용하여 N번째 구간 생존율 예측 모델을 생성한다. 예측 모델 생성부(13)는 임상 데이터 및 상기 임상 데이터를 제공한 환자의 N+1번째 구간 생존율 데이터를 이용하여, N+1번째 구간 생존율 예측 모델을 생성한다. 예측 모델 생성부(13)는 N+1번째 구간 생존율 예측 모델을 생성하기 위해 RNN 알고리즘을 이용하여 N번째 구간 생존율 예측 모델을 기반으로 할 수 있다. The predictive model generation unit 13 according to an embodiment generates an N-th survival rate prediction model using clinical data and N-th survival rate data of a patient who provides the clinical data. The predictive model generation unit 13 generates an N+1 interval survival rate prediction model using clinical data and N+1 interval survival rate data of the patient who provided the clinical data. The prediction model generator 13 may use the RNN algorithm to generate the N-th survival rate prediction model using the RNN algorithm to generate the N+1-th survival rate prediction model.

일 실시예에 따른 예측 모델 생성부(13)는 N+1번째 구간 생존율 예측 모델을 생성하기 위해 N번째 구간 생존율 데이터를 더 이용한다. 즉, N+1번째 구간 생존율 예측 모델은, 임상 데이터와 N번째 구간 생존율 데이터를 입력으로 하고 N+1번째 구간 생존율을 출력으로 하는 입출력함수일 수 있다. 이와 같이 N+1번째 구간 생존율 예측 모델의 입력 값으로 N번째 구간 생존율 데이터를 더 이용하게 되면, 정확도 높은 예측 모델을 생성할 수 있다. The prediction model generation unit 13 according to an embodiment further uses N-th interval survival data to generate an N+1-th interval survival rate prediction model. That is, the N+1th section survival rate prediction model may be an input/output function that inputs clinical data and Nth section survival rate data as input and outputs N+1st section survival rate as an output. As described above, when the N-th survival rate data is further used as an input value of the N+1-th survival rate prediction model, a highly accurate prediction model can be generated.

일 실시예에 따른 예측 모델 생성부(13)가 N번째 구간 생존율 데이터를 이용하여 N번째 구간 생존율 예측 모델을 생성하는 것과 관련하여, N이 2 이상인 경우 전술한 N+1번째 구간 생존율 예측 모델 생성 방법이 동일하게 적용된다. 예를 들어, N이 2 이상인 경우 예측 모델 생성부(13)는 N번째 구간 생존율 예측 모델을 생성하기 위해 RNN 알고리즘을 이용하여 N-1번째 구간 생존율 예측 모델을 기반으로 할 수 있고, N-1번째 구간 생존율 데이터를 더 이용할 수 있다. In relation to generating the N-th section survival rate prediction model using the N-th section survival rate data, the predictive model generation unit 13 according to an embodiment generates the N+1st section survival rate prediction model described above when N is 2 or more. The method applies equally. For example, when N is 2 or more, the prediction model generator 13 may be based on the N-1th section survival rate prediction model using an RNN algorithm to generate the Nth section survival rate prediction model, and N-1 Survival data for the second section can be further used.

한편, N이 1인 경우 예측 모델 생성부(13)는 N-1번째 구간 생존율 예측 모델을 이용하지 않으며, 임상 데이터 및 상기 임상 데이터를 제공한 환자의 N번째 구간 생존율 데이터를 이용하여 N번째 구간 생존율 예측 모델을 생성하고, 기설정된 생존율 초기값(P_0)을 더 이용할 수 있다. 이와 관련한 상세한 내용은 도 5를 참조하여 후술한다.
On the other hand, when N is 1, the prediction model generator 13 does not use the N-1th section survival rate prediction model, and uses the clinical data and the Nth section survival rate data of the patient who provided the clinical data to the Nth section. A survival rate prediction model may be generated, and a preset survival rate initial value (P_0) may be further used. Details related to this will be described later with reference to FIG. 5.

일 실시예에 따른 예측 모델 생성부(13)는 N번째 구간 생존율 데이터를 이용함에 있어, 가공된 상태의 데이터를 이용할 수 있다.The prediction model generator 13 according to an embodiment may use the processed state data when using the N-th section survival rate data.

일 실시예에 따른 생존율 데이터 가공부(14)는 생존율 데이터를 가공한다. 예를 들어, 생존율 데이터 각각에 대하여 생존 기간에 따른 스코어를 부여한다. 예측 모델 생성부(13)는 N번째 구간 생존율 데이터 각각에 부여된 스코어를 이용하여 N+1년차 생존율 예측 모델을 생성한다. 일 실시예에 따른 생존율 데이터 가공부(14)는 생존 기간에 비례하여 생존율 데이터에 스코어를 부여할 수 있다. 생존 기간은 적어도 월 단위로 구분될 수 있다. 이에 따르면, 사망한 환자의 생존율이 0으로 카운트되지 않고 생존 기간 만큼의 랭킹화된 스코어가 부여됨으로써, 모델 생성에 사용되는 유의미한 데이터 수를 늘릴 수 있고, 결과적으로 정확도 높은 모델의 생성에 기여하게 된다.The survival rate data processing unit 14 according to an embodiment processes the survival rate data. For example, a score according to the survival period is given for each survival rate data. The prediction model generation unit 13 generates an N+1 year survival rate prediction model using scores given to each of the N-th section survival rate data. The survival rate data processing unit 14 according to an embodiment may give a score to the survival rate data in proportion to the survival period. Survival periods can be divided into at least monthly units. According to this, the survival rate of the deceased patient is not counted as 0, and a ranked score corresponding to the survival period is given, thereby increasing the number of meaningful data used for model generation and consequently contributing to the generation of a high-accuracy model. .

일 실시예에 따른 예측 모델 생성부(13)는 구간 별로, 예컨대 연차별로 생존율 예측 모델을 생성된다. 예를 들어, 암 환자의 생존율을 예측하는 모델의 경우, 1년차 생존율 예측 모델, 2년차 생존율 예측 모델, 3년차 생존율 예측 모델, 4년차 생존율 예측 모델 및 5년차 생존율 예측 모델이 생성될 수 있다. 각 연차 별 모델은, 환자의 임상 데이터로부터 환자의 해당 연차 생존율을 예측한다. The prediction model generator 13 according to an embodiment generates a survival rate prediction model for each section, for example, for each year. For example, in the case of a model for predicting the survival rate of cancer patients, a first-year survival rate prediction model, a second-year survival rate prediction model, a third-year survival rate prediction model, a fourth-year survival rate prediction model, and a fifth-year survival rate prediction model may be generated. Each annual model predicts the patient's corresponding annual survival rate from the patient's clinical data.

각 연차 별 모델은, 환자의 임상 데이터에 해당하는 i개의 노드를 2개의 생존율 노드로 연결시키는 복수 레이어의 매트릭스를 포함할 수 있다. 일 실시예에 따른 예측 모델 생성부(13)에 의해 생성되는 각 연차 별 모델은, 환자의 임상 데이터에 해당하는 i개의 노드 및 전년차 생존율에 해당하는 2개의 노드를 2개의 생존율 노드로 연결시키는 복수 레이어의 매트릭스, 즉 i+2개의 입력 노드를 2개 출력 노드로 연결시키는 복수 레이어의 매트릭스를 포함할 수 있다. Each annual model may include a matrix of multiple layers connecting i nodes corresponding to the patient's clinical data to 2 survival nodes. Each annual model generated by the predictive model generation unit 13 according to an embodiment connects i nodes corresponding to the clinical data of the patient and 2 nodes corresponding to the survival rate of the previous year to 2 survival nodes. It may include a multi-layer matrix, i.e., a multi-layer matrix connecting i+2 input nodes to two output nodes.

입력 노드에는 전년도 생존율 데이터에 해당하는 노드가 포함된다. 전년도 생존율 데이터 노드는 2개일 수 있고, 각각 생존노드와 사망노드일 수 있다. 생존율 데이터에 해당하는 2개 노드가 [생존노드, 사망노드]인 경우에는, 생존율 데이터는 환자가 사망한 경우 [0, 1] 또는 환자가 생존한 경우 [1, 0]일 수 있다. The input node includes nodes corresponding to the previous year's survival rate data. There may be two data nodes of the previous year's survival rate, and a survival node and a death node, respectively. When the two nodes corresponding to the survival rate data are [survival node, death node], the survival rate data may be [0, 1] when the patient dies or [1, 0] when the patient survives.

다만 본 발명의 일 실시예에 따르면, 환자가 사망한 경우의 생존율 데이터를 [0, 1]로 처리하지 않고, 랭킹화하여 스코어를 부여할 수 있는 처리 방법이 제안된다. 본 실시예에서 사망한 환자의 생존율 데이터는 [p, 1-p]일 수 있고, 여기서 p에는 0이 아닌 스코어 값이 부여된다. 일 예에 따르면, 스코어는 사망한 환자의 생존 기간에 비례하도록 부여될 수 있다. 여기서 생존 기간은, 적어도 월 단위로 구분될 수 있다. 예컨대, N년차에 3개월 생존한 환자의 경우 N년차 생존율 스코어는 3/12이고, 생존율 데이터는 [3/12, 1-3/12]=[0.25, 0.75]일 수 있다. 다음의 표 1은 N년차 생존 기간 별 N년차 생존율 스코어의 예이다.
However, according to an embodiment of the present invention, a treatment method is proposed in which ranking is given by ranking the survival rate data when a patient dies without processing the data as [0, 1]. In this embodiment, the survival rate data of the patient who died may be [p, 1-p], where p is given a non-zero score value. According to one example, the score may be assigned to be proportional to the survival of the patient who died. Here, the survival period may be divided into at least monthly units. For example, in the case of a patient who survived 3 months in N-year, the N-year survival rate score may be 3/12, and the survival rate data may be [3/12, 1-3/12]=[0.25, 0.75]. Table 1 below is an example of the N-year survival rate score for each N-year survival period.

생존기간(month)Survival period (month) 스코어Score 1One 1/12=0.081/12=0.08 22 2/12=0.172/12=0.17 33 3/12=0.253/12=0.25 44 4/12=0.334/12=0.33 55 5/12=0.425/12=0.42 66 6/12=0.56/12=0.5 77 7/12=0.587/12=0.58 88 8/12=0.678/12=0.67 99 9/12=0.759/12=0.75 1010 10/12=0.8310/12=0.83 1111 11/12=0.9211/12=0.92 1212 12/12=112/12=1

표 1에서는 생존기간이 월 단위로 구분된 예를 설명하였으나, 본 발명은 이에 한정하지 않으며, 설계에 따라 반기, 분기, 월, 일 등 다양한 단위로 생존기간의 구분이 가능하다.
Table 1 describes an example in which the survival period is divided into monthly units, but the present invention is not limited to this, and according to the design, the survival period can be divided into various units such as semi-annual, quarter, month, and day.

도 2는 본 발명의 일 실시예에 따른 예측 모델 생성 방법을 도시한 흐름도이다.2 is a flowchart illustrating a method for generating a predictive model according to an embodiment of the present invention.

도 2를 참조하면, 단계 21에서 도 1의 예측 모델 생성부(13)는 환자의 임상 데이터 및 N번째 구간 생존율 데이터를 이용하여 N번째 구간 생존율 예측 모델을 생성한다.Referring to FIG. 2, in step 21, the predictive model generation unit 13 of FIG. 1 uses the patient's clinical data and N-th section survival rate data to generate an N-th section survival rate prediction model.

단계 22에서 도 1의 예측 모델 생성부(13)는 N번째 구간 생존율 데이터, N번째 구간 생존율 예측 모델 및 N+1번째 구간 생존율 데이터를 이용하여 N+1번째 구간 생존율 예측 모델을 생성한다.
In step 22, the predictive model generation unit 13 of FIG. 1 generates an N+1 interval survival model using the N-th interval survival rate data, the N-th interval survival rate prediction model, and the N+1-th interval survival rate data.

도 3은 본 발명의 다른 실시예에 따른 예측 모델 생성 방법을 도시한 흐름도이다.3 is a flowchart illustrating a method for generating a predictive model according to another embodiment of the present invention.

도 3을 참조하면, 단계 31에서 도 1의 예측 모델 생성부(13)는 환자의 임상 데이터 및 N번째 구간 생존율 데이터를 이용하여 N번째 구간 생존율 예측 모델을 생성한다.Referring to FIG. 3, in step 31, the predictive model generation unit 13 of FIG. 1 uses the clinical data of the patient and the N-th section survival rate data to generate an N-th section survival rate prediction model.

단계 32에서 도 1의 생존율 데이터 가공부(14)는 N번째 구간 생존율 데이터에 생존 기간에 따른 스코어를 부여한다.In step 32, the survival rate data processing unit 14 of FIG. 1 gives a score according to the survival period to the Nth interval survival rate data.

단계 33에서 도 1의 예측 모델 생성부(13)는 N번째 구간 생존율 데이터의 스코어, N번째 구간 생존율 예측 모델 및 N+1번째 구간 생존율 데이터를 이용하여 N+1번째 구간 생존율 예측 모델을 생성한다.In step 33, the predictive model generator 13 of FIG. 1 generates an N+1 interval survival rate prediction model using the score of the N interval survival data, the N interval survival prediction model, and the N+1 interval survival data. .

한편, 도 2 및 도 3에 도시된 흐름도는, 도 1에 도시된 예측 모델 생성 장치(10)에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하에서 생략된 내용이라 하더라도, 도 1에서 도시된 구성들에 관하여 이상에서 기술된 내용은 도 2 및 도 3에 도시된 흐름도에도 적용됨을 알 수 있다.Meanwhile, the flowcharts illustrated in FIGS. 2 and 3 are composed of steps processed in time series by the prediction model generating apparatus 10 illustrated in FIG. 1. Therefore, it can be seen that even if omitted, the contents described above with respect to the components illustrated in FIG. 1 also apply to the flowcharts illustrated in FIGS. 2 and 3.

한편, 도 2 및 도 3에 도시된 본 발명의 일 실시예에 따른 예측 모델 생성 방법은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.
Meanwhile, the method for generating a predictive model according to an embodiment of the present invention illustrated in FIGS. 2 and 3 may be written as a program executable on a computer, and a general purpose of operating the program using a computer-readable recording medium. It can be implemented in a digital computer. The computer-readable recording medium includes a storage medium such as a magnetic storage medium (eg, ROM, floppy disk, hard disk, etc.), an optical reading medium (eg, CD-ROM, DVD, etc.).

도 4는 본 발명의 일 실시예에 따른 예측 모델을 설명하기 위한 도면이다.4 is a view for explaining a prediction model according to an embodiment of the present invention.

도 4를 참조하면, N-1년차 생존율 예측 모델(PM_N-1)과 N년차 생존율 예측 모델(PM_N)이 도시되었다. 도 4를 참조하면, N-1년차 생존율 예측 모델(PM_N-1)은 임상 데이터(X)로부터 N-1년차 생존율(P_N-1)을 예측한다. 예를 들어, N-1년차 생존율 예측 모델(PM_N-1)은 임상 데이터(X)를 입력하였을 때 N-1년차 생존율(P_N-1)을 출력할 수 있는 입출력함수이다. N-1년차 생존율 예측 모델(PM_N-1)은 복수의 환자에 대한 임상 데이터(X) 및 N-1년차 생존율(P_N-1) 데이터에 기초하여 머신러닝 기법에 의해 생성될 수 있다. 한편, N-1년차 생존율 예측 모델(PM_N-1)을 기반으로 하여 N년차 생존율 예측 모델(PM_N)이 생성될 수 있다. Referring to FIG. 4, the N-1 year survival rate prediction model (PM_N-1) and the N year survival rate prediction model (PM_N) are illustrated. 4, the N-1 year survival rate prediction model (PM_N-1) predicts the N-1 year survival rate (P_N-1) from clinical data (X). For example, the N-1 year survival rate prediction model (PM_N-1) is an input/output function capable of outputting the N-1 year survival rate (P_N-1) when clinical data (X) is input. The N-1 year survival rate prediction model (PM_N-1) may be generated by a machine learning technique based on clinical data (X) and N-1 year survival rate (P_N-1) data for a plurality of patients. Meanwhile, an N-year survival rate prediction model (PM_N) may be generated based on the N-1 year survival rate prediction model (PM_N-1).

도 4를 참조하면, N년차 생존율 예측 모델(PM_N)은 N-1년차 예측 모델(PM_N-1)을 기반으로 하여, 임상 데이터(X)로부터 생존율(P_N)을 예측할 수 있도록 생성된다. 본 발명의 일 실시예에 따르면, N년차 생존율 예측 모델(PM_N)을 생성함에 있어, N-1년차 생존율 예측 모델(PM_N-1)뿐 아니라, N-1년차 생존율(P_N-1)이 이용된다. 한편, N-1년차 생존율(P_N-1)은 각 환자의 케이스에 대한 실제 데이터로써, N-1년차 생존율 예측 모델(PM_N-1)을 생성하는 데에 이용된다. 생존율 예측 모델은 1년차부터 5년차까지 생성될 수 있다. Referring to FIG. 4, the N-year survival rate prediction model PM_N is generated to predict the survival rate P_N from clinical data X based on the N-1 year prediction model PM_N-1. According to an embodiment of the present invention, in generating the N-year survival rate prediction model (PM_N), not only the N-1 year survival rate prediction model (PM_N-1), but also the N-1 year survival rate (P_N-1) is used. . On the other hand, the N-1 year survival rate (P_N-1) is actual data for each patient's case, and is used to generate the N-1 year survival rate prediction model (PM_N-1). The survival rate prediction model can be generated from 1 to 5 years.

도 4에서 각 모델의 입력이 되는 임상 데이터(X)는 모두 초기값인 1년차 임상 데이터일 수 있다. 이에 따르면, 복수의 환자에 대한 1년차 임상 데이터 및 연차별 생존율(P)을 이용하여, 연차별 생존율 예측 모델을 생성할 수 있고, 생성된 모델에 임의의 환자의 1년차 임상 데이터를 입력하면, 해당 환자의 연차별 생존율(P)을 예측 수 있게 된다.
In FIG. 4, clinical data (X) that is input to each model may be clinical data of the first year that are all initial values. According to this, it is possible to generate an annual survival rate prediction model using the first year clinical data and the annual survival rate (P) for a plurality of patients, and inputting the first year clinical data of any patient into the generated model, The patient's annual survival rate (P) can be predicted.

도 5는 본 발명의 일 실시예에 따른 예측 모델을 설명하기 위한 도면의 다른 예이다.5 is another example of a diagram for describing a prediction model according to an embodiment of the present invention.

도 5를 참조하면, 1년차 생존율 예측 모델(PM_1)과, 그 이후의 N년차 생존율 예측 모델(PM_N)이 도시되었다. 도 4를 참조하면, 임상 데이터(X) 및 생존율 초기값(P_0)을 입력하였을 때 1년차 생존율(P_1)을 출력할 수 있는 입출력함수인 1년차 생존율 예측 모델(PM_1)이 머신러닝 기법에 의해 생성된다. 다음으로, 임상 데이터(X) 및 1년차 생존율(P_1)을 입력하였을 때 2년차 생존율(P_2)을 출력할 수 있는 입출력함수인 2년차 생존율 예측 모델(PM_2)이 머신러닝 기법에 의해 생성된다. 이 때 1년차 생존율 예측 모델(PM_1)이 2년차 생존율 예측 모델(PM_2) 생성에 이용된다. 이와 같은 과정이 반복됨에 따라(N=N+1), 임상 데이터(X) 및 N-1년차 생존율(P_N-1)을 입력하였을 때 N년차 생존율(P_N)을 출력할 수 있는 입출력함수인 N년차 생존율 예측 모델(PM_N)이 머신러닝 기법에 의해 생성된다. N-1년차 생존율 예측 모델(PM_N-1)은 N년차 생존율 예측 모델(PM_N)의 생성에 이용된다. 예를 들어, N년차 생존율 예측 모델(PM_N)의 입력과 출력을 기반으로 머신 러닝 기법에 의해 N년차 생존율 예측 모델(PM_N)을 생성할 때, 초기모델로 N-1년차 생존율 예측 모델(PM_N-1)을 사용할 수 있다. 1년차 생존율 예측 모델(PM_1)은 2년차 생존율 예측 모델(PM_2)에 이용되고, 2년차 생존율 예측 모델(PM_2)은 3년차 생존율 예측 모델(PM_3) 생성의 기반이 된다. Referring to FIG. 5, the first-year survival rate prediction model PM_1 and the subsequent N-year survival rate prediction model PM_N are illustrated. Referring to FIG. 4, when the clinical data (X) and the initial survival rate (P_0) are input, the first-year survival rate prediction model (PM_1), an input/output function capable of outputting the first-year survival rate (P_1), is obtained by the machine learning technique. Is generated. Next, when the clinical data (X) and the first-year survival rate (P_1) are input, a second-year survival rate prediction model (PM_2), an input/output function capable of outputting the second-year survival rate (P_2), is generated by a machine learning technique. At this time, the first-year survival rate prediction model (PM_1) is used to generate the second-year survival rate prediction model (PM_2). As this process is repeated (N=N+1), when the clinical data (X) and N-1 year survival rate (P_N-1) are input, N is an input/output function that can output the N year survival rate (P_N). The annual survival rate prediction model (PM_N) is generated by a machine learning technique. The N-1 year survival rate prediction model (PM_N-1) is used to generate the N year survival rate prediction model (PM_N). For example, when the N-year survival rate prediction model (PM_N) is generated by the machine learning technique based on the input and output of the N-year survival rate prediction model (PM_N), the initial model is the N-1 year survival rate prediction model (PM_N- 1) can be used. The first year survival rate prediction model (PM_1) is used for the second year survival rate prediction model (PM_2), and the second year survival rate prediction model (PM_2) is the basis for generating the third year survival rate prediction model (PM_3).

생존율 초기값(P_0)은 [0, 1]로 설정될 수 있다. 1년차 생존율(P_1)은 [1-p, p]와 같이 2개 노드의 값을 포함할 수 있다.
The initial survival rate P_0 may be set to [0, 1]. The first-year survival rate P_1 may include values of two nodes, such as [1-p, p].

도 6은 본 발명의 일 실시예에 따른 예측 모델을 설명하기 위한 그래프이다. 6 is a graph for explaining a prediction model according to an embodiment of the present invention.

도 6에 도시된 히트맵(heatmap)들의 세로축은 대상자의 일련번호이고, 세로축은 노드에 해당한다. 각 노드에 해당하는 값은 색상의 농도로 표시되었다. 도 6을 참고하면, 그래프(611, 612, 613)는 1년차 생존율 예측 모델을 보여준다. 그래프(611)는 복수의 대상자들에 대한 임상 데이터가 각 30개 노드에 해당하는 농도로 표시되었고, 여기에 생존율의 초기값이 2개 노드로 표시되었다. 그래프(613)는 복수의 대상자들에 대한 1년차 생존율이 2개 노드로 표시되었다. 즉, 1년차 생존율 예측 모델은 총 32개의 노드값(그래프 611에 도시)을 총 2개의 노드값(그래프 613에 도시)으로 수렴시킨다. 다만, 구체적인 노드의 개수는 예시에 불과하므로, 본 발명이 이에 한정되지 않는다.The vertical axis of the heatmaps shown in FIG. 6 is the serial number of the subject, and the vertical axis corresponds to the node. The value corresponding to each node was expressed as the color density. Referring to FIG. 6, graphs 611, 612, and 613 show a model for predicting survival for the first year. In the graph 611, clinical data for a plurality of subjects are displayed at concentrations corresponding to 30 nodes, and the initial value of the survival rate is displayed as 2 nodes. In the graph 613, the first-year survival rate for a plurality of subjects is represented by two nodes. That is, the first-year survival rate prediction model converges a total of 32 node values (shown in graph 611) to a total of 2 node values (shown in graph 613). However, since the number of specific nodes is only an example, the present invention is not limited thereto.

마찬가지로, 그래프(621, 622, 623)는 2년차 생존율 예측 모델을 보여준다. 그래프(621)는 복수의 대상자들에 대한 임상 데이터가 각 30개 노드에 해당하는 농도로 표시되었고, 1년차 생존율이 2개 노드로 표시되었다. 그래프(623)는 복수의 대상자들에 대한 2년차 생존율이 2개 노드로 표시되었다. 즉, 2년차 생존율 예측 모델은 총 32개의 노드값(그래프 621에 도시)을 총 2개의 노드값(그래프 613에 도시)으로 수렴시킨다. 2년차 생존율 예측 모델은 1년차 생존율 예측 모델, 임상 데이터, 1년차 생존율, 2년차 생존율에 의해 생성된다.Similarly, graphs 621, 622, and 623 show a model for predicting survival for the second year. In the graph 621, clinical data for a plurality of subjects are displayed at concentrations corresponding to 30 nodes, and the survival rate at 1 year is displayed as 2 nodes. In the graph 623, the second year survival rate for a plurality of subjects is represented by two nodes. That is, the second-year survival rate prediction model converges a total of 32 node values (shown in graph 621) to a total of 2 node values (shown in graph 613). The second year survival rate prediction model is generated by the first year survival rate prediction model, clinical data, first year survival rate, and second year survival rate.

마찬가지로, 그래프(651, 652, 653)는 5년차 생존율 예측 모델을 보여준다. 그래프(651)는 복수의 대상자들에 대한 임상 데이터가 각 30개 노드에 해당하는 농도로 표시되었고, 4년차 생존율이 2개 노드로 표시되었다. 그래프(653)는 복수의 대상자들에 대한 5년차 생존율이 2개 노드로 표시되었다. 즉, 5년차 생존율 예측 모델은 총 32개의 노드값(그래프 651에 도시)을 총 2개의 노드값(그래프 653에 도시)으로 수렴시킨다.
Similarly, graphs 651, 652, and 653 show models for predicting survival at 5 years. In the graph 651, clinical data for a plurality of subjects are displayed at concentrations corresponding to 30 nodes, and survival rate at 4 years is displayed as 2 nodes. In the graph 653, the 5-year survival rate for a plurality of subjects is represented by 2 nodes. That is, the 5-year survival rate prediction model converges a total of 32 node values (shown in graph 651) to a total of 2 node values (shown in graph 653).

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있으며, 균등한 다른 실시 예가 가능함을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
So far, the present invention has been focused on the preferred embodiments. The present invention has been described with reference to the embodiments shown in the drawings, but these are merely exemplary, and those skilled in the art to which the present invention pertains are modified in a range that does not depart from the essential characteristics of the present invention. It may be implemented in the form, it will be understood that other equivalent embodiments are possible. Therefore, the disclosed embodiments should be considered in terms of explanation, not limitation. The scope of the present invention is shown in the claims rather than the foregoing description, and all differences within the equivalent range should be interpreted as being included in the present invention.

10: 예측 모델 생성 장치
11: 임상데이터 획득부
12: 생존율 데이터 획득부
13: 예측 모델 생성부
14: 생존율 데이터 가공부
10: prediction model generating device
11: Clinical data acquisition department
12: survival rate data acquisition unit
13: prediction model generator
14: survival rate data processing unit

Claims (13)

임상 데이터 및 상기 임상 데이터를 제공한 대상자의 N번째 구간 생존율 데이터를 이용하여 N번째 구간 생존율 예측 모델을 생성하는 제1 단계;
상기 N번째 구간 생존율 데이터, 상기 N번째 구간 생존율 예측 모델 및 N+1번째 구간 생존율 데이터를 이용하여 N+1번째 구간 생존율 예측 모델을 생성하는 제2 단계;를 포함하고,
상기 N번째 구간 생존율 예측 모델은 N번째 구간 생존율을 예측하고,
상기 N번째 구간 생존율 데이터는 상기 대상자의 상기 N번째 구간에서의 생존 여부, 상기 N번째 구간에서의 생존 기간 및 상기 N번째 구간 생존율을 포함하는
생존율 예측 모델 생성 방법.
A first step of generating an N-th survival rate prediction model using clinical data and N-th survival rate data of a subject who provided the clinical data;
It includes; a second step of generating an N+1 interval survival rate prediction model using the N-th interval survival rate data, the N-th interval survival rate prediction model, and the N+1-th interval survival rate data;
The N-th section survival rate prediction model predicts the N-th section survival rate,
The N-th section survival rate data includes whether the subject survives in the N-th section, the survival period in the N-th section and the N-th section survival rate.
How to create a survival rate prediction model.
제1 항에 있어서,
상기 N번째 구간 생존율 데이터 각각에 대하여, 상기 생존 기간에 따른 스코어를 부여하는 단계;를 더 포함하고,
상기 제2 단계는, 상기 N번째 구간 생존율 데이터 각각에 부여된 스코어를 이용하여 N+1년차 생존율 예측 모델을 생성하는
생존율 예측 모델 생성 방법.
According to claim 1,
Further comprising, for each of the N-th section survival rate data, assigning a score according to the survival period;
In the second step, an N+1 year survival rate prediction model is generated using scores given to each of the N-th interval survival data.
How to create a survival rate prediction model.
제2 항에 있어서,
상기 스코어는 상기 생존 기간에 비례하는
생존율 예측 모델 생성 방법.
According to claim 2,
The score is proportional to the survival time
How to create a survival rate prediction model.
제2 항에 있어서,
상기 생존 기간은 적어도 월 단위로 구분되는
생존율 예측 모델 생성 방법.
According to claim 2,
The survival period is divided into at least monthly
How to create a survival rate prediction model.
제1 항에 있어서,
상기 N+1번째 구간 생존율 예측 모델은 상기 임상 데이터 및 N번째 구간 생존율 데이터를 입력으로 하고 N+1번째 구간 생존율 데이터를 출력으로 하는 입출력함수인
생존율 예측 모델 생성 방법.
According to claim 1,
The N+1th section survival rate prediction model is an input/output function that inputs the clinical data and the Nth section survival rate data and outputs the N+1st section survival rate data.
How to create a survival rate prediction model.
제1 항에 있어서,
상기 생성하는 단계는, RNN(Recurrent Neural Network) 알고리즘을 이용하는
생존율 예측 모델 생성 방법.
According to claim 1,
The generating step uses a Recurrent Neural Network (RNN) algorithm.
How to create a survival rate prediction model.
임상 데이터를 획득하는 임상 데이터 획득부;
생존율 데이터를 획득하는 생존율 데이터 획득부; 및
상기 임상 데이터 및 상기 임상 데이터를 제공한 대상자의 N번째 구간 생존율 데이터를 이용하여 N번째 구간 생존율 예측 모델을 생성하고, 상기 N번째 구간 생존율 데이터, 상기 N번째 구간 생존율 예측 모델 및 N+1번째 구간 생존율 데이터를 이용하여 N+1번째 구간 생존율 예측 모델을 생성하는 예측 모델 생성부;를 포함하고,
상기 N번째 구간 생존율 예측 모델은 N번째 구간 생존율을 예측하고,
상기 N번째 구간 생존율 데이터는 상기 대상자의 상기 N번째 구간에서의 생존 여부, 상기 N번째 구간에서의 생존 기간 및 상기 N번째 구간 생존율을 포함하는
생존율 예측 모델 생성 장치.
A clinical data acquisition unit for acquiring clinical data;
A survival rate data acquisition unit for obtaining survival rate data; And
An N-th survival rate prediction model is generated using the clinical data and the N-th survival rate data of the subject who provided the clinical data, and the N-th survival rate data, the N-th survival rate prediction model, and the N+1-th interval Includes a prediction model generator for generating an N+1 interval survival prediction model using the survival rate data.
The N-th section survival rate prediction model predicts the N-th section survival rate,
The N-th section survival rate data includes whether the subject survives in the N-th section, the survival period in the N-th section, and the N-th section survival rate.
Survival rate prediction model generation device.
제7 항에 있어서,
상기 N번째 구간 생존율 데이터 각각에 대하여, 상기 생존 기간에 따른 스코어를 부여하는 생존율 데이터 가공부;를 더 포함하고,
상기 예측 모델 생성부는, 상기 N번째 구간 생존율 데이터 각각에 부여된 스코어를 이용하여 N+1년차 생존율 예측 모델을 생성하는
생존율 예측 모델 생성 장치.
The method of claim 7,
Each of the N-th section survival rate data, survival rate data processing unit for assigning a score according to the survival period; further comprises,
The prediction model generator generates an N+1 year survival rate prediction model using scores given to each of the N-th interval survival data.
Survival rate prediction model generation device.
제8 항에 있어서,
상기 스코어는 상기 생존 기간에 비례하는
생존율 예측 모델 생성 장치.
The method of claim 8,
The score is proportional to the survival time
Survival rate prediction model generation device.
제8 항에 있어서,
상기 생존 기간은 적어도 월 단위로 구분되는
생존율 예측 모델 생성 장치.
The method of claim 8,
The survival period is divided into at least monthly
Survival rate prediction model generation device.
제7 항에 있어서,
상기 N+1번째 구간 생존율 예측 모델은 상기 임상 데이터 및 N번째 구간 생존율 데이터를 입력으로 하고 N+1번째 구간 생존율 데이터를 출력으로 하는 입출력함수인
생존율 예측 모델 생성 장치.
The method of claim 7,
The N+1th section survival rate prediction model is an input/output function that inputs the clinical data and the Nth section survival rate data and outputs the N+1st section survival rate data.
Survival rate prediction model generation device.
제7 항에 있어서,
상기 생성하는 단계는, RNN(Recurrent Neural Network) 알고리즘을 이용하는
생존율 예측 모델 생성 장치.
The method of claim 7,
The generating step uses a Recurrent Neural Network (RNN) algorithm.
Survival rate prediction model generation device.
컴퓨터를 이용하여 제1항 내지 제6항 중 어느 한 항의 방법을 실행하기 위하여 매체에 저장된 컴퓨터 프로그램. A computer program stored in a medium to execute the method of claim 1 using a computer.
KR1020170017642A 2017-02-08 2017-02-08 Apparatus, method, and computer program for generating survival rate prediction model KR102127449B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020170017642A KR102127449B1 (en) 2017-02-08 2017-02-08 Apparatus, method, and computer program for generating survival rate prediction model
PCT/KR2018/001692 WO2018147653A1 (en) 2017-02-08 2018-02-08 Method, device and computer program for generating survival rate prediction model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170017642A KR102127449B1 (en) 2017-02-08 2017-02-08 Apparatus, method, and computer program for generating survival rate prediction model

Publications (3)

Publication Number Publication Date
KR20180092189A KR20180092189A (en) 2018-08-17
KR102127449B1 true KR102127449B1 (en) 2020-06-26
KR102127449B9 KR102127449B9 (en) 2021-07-26

Family

ID=63107726

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170017642A KR102127449B1 (en) 2017-02-08 2017-02-08 Apparatus, method, and computer program for generating survival rate prediction model

Country Status (2)

Country Link
KR (1) KR102127449B1 (en)
WO (1) WO2018147653A1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2018258683A1 (en) * 2017-04-28 2019-12-19 University Of Southern California System and method for predicting survival time
KR102174608B1 (en) * 2018-11-27 2020-11-05 공주대학교 산학협력단 Apparatus for predicting loan defaults based on machine learning and method thereof
CN110276068B (en) * 2019-05-08 2020-08-28 清华大学 Legal case analysis method and device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050019798A1 (en) * 2003-05-30 2005-01-27 Michael Kattan Methods to predict death from breast cancer
US20100057651A1 (en) * 2008-09-03 2010-03-04 Siemens Medicals Solutions USA, Inc. Knowledge-Based Interpretable Predictive Model for Survival Analysis

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7844560B2 (en) * 2006-04-17 2010-11-30 Siemens Medical Solutions Usa, Inc. Personalized prognosis modeling in medical treatment planning
US8032308B2 (en) * 2008-03-13 2011-10-04 Siemens Medical Solutions Usa, Inc. Modeling lung cancer survival probability after or side-effects from therapy
KR101501826B1 (en) * 2013-04-05 2015-03-13 연세대학교 산학협력단 Method for preparing prognosis prediction model of gastric cancer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050019798A1 (en) * 2003-05-30 2005-01-27 Michael Kattan Methods to predict death from breast cancer
US20100057651A1 (en) * 2008-09-03 2010-03-04 Siemens Medicals Solutions USA, Inc. Knowledge-Based Interpretable Predictive Model for Survival Analysis

Also Published As

Publication number Publication date
KR102127449B9 (en) 2021-07-26
KR20180092189A (en) 2018-08-17
WO2018147653A1 (en) 2018-08-16

Similar Documents

Publication Publication Date Title
Ozenne et al. On the estimation of average treatment effects with right‐censored time to event outcome and competing risks
US9687199B2 (en) Medical imaging system providing disease prognosis
US20180144244A1 (en) Distributed clinical workflow training of deep learning neural networks
JP2020522794A (en) Neural network classification
KR102127449B1 (en) Apparatus, method, and computer program for generating survival rate prediction model
CN112639833A (en) Adaptable neural network
CN110782502B (en) PET scattering estimation system based on deep learning and method for using perception neural network model
CN109948680B (en) Classification method and system for medical record data
Kopper et al. Semi-structured deep piecewise exponential models
Zhang et al. Trabeculae microstructure parameters serve as effective predictors for marginal bone loss of dental implant in the mandible
US12053320B2 (en) Computer-implemented method, computer program, systems and x-ray facility for correction of x-ray image data with regard to noise effects
CN112365962B (en) Medical resource allocation method and equipment based on lung CT image and clinical information
Hong et al. Causal inference regulates audiovisual spatial recalibration via its influence on audiovisual perception
CN116113356A (en) Method and device for determining user dementia degree
Beath metaplus: An R Package for the Analysis of Robust Meta-Analysis and Meta-Regression.
Zamani et al. Classification of early-MCI patients from healthy controls using evolutionary optimization of graph measures of resting-state fMRI, for the Alzheimer’s disease neuroimaging initiative
Imak et al. ResMIBCU-Net: an encoder–decoder network with residual blocks, modified inverted residual block, and bi-directional ConvLSTM for impacted tooth segmentation in panoramic X-ray images
WO2020081308A1 (en) System and method for memory augmented domain adaptation
Chang et al. A stochastic individual-based model of the progression of atrial fibrillation in individuals and populations
CN111627493A (en) Selective prediction method and computing device for kinase inhibitor
TW202101478A (en) Disease suffering probability prediction method and electronic apparatus
Tripathi et al. Turing test-inspired method for analysis of biases prevalent in artificial intelligence-based medical imaging
JP7331926B2 (en) LEARNING DEVICE, OBJECT DETECTION DEVICE, LEARNING METHOD, AND PROGRAM
Pandey et al. Automated detection of poor-quality scintigraphic images using machine learning
KR102231677B1 (en) Device for predicting Coronary Arterial Calcification Using Probabilistic Model, the prediction Method and Recording Medium

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]