KR20220033906A - Apparatus and method for calculating risk of prostate cancer based on machine learning, Apparatus and method for generating risk calculation model of prostate cancer based on machine learning - Google Patents

Apparatus and method for calculating risk of prostate cancer based on machine learning, Apparatus and method for generating risk calculation model of prostate cancer based on machine learning Download PDF

Info

Publication number
KR20220033906A
KR20220033906A KR1020200116339A KR20200116339A KR20220033906A KR 20220033906 A KR20220033906 A KR 20220033906A KR 1020200116339 A KR1020200116339 A KR 1020200116339A KR 20200116339 A KR20200116339 A KR 20200116339A KR 20220033906 A KR20220033906 A KR 20220033906A
Authority
KR
South Korea
Prior art keywords
prostate
prostate cancer
risk
model
calculation model
Prior art date
Application number
KR1020200116339A
Other languages
Korean (ko)
Other versions
KR102515437B1 (en
Inventor
서준교
정현
손환철
변석수
Original Assignee
서울대학교병원
주식회사 프로카젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교병원, 주식회사 프로카젠 filed Critical 서울대학교병원
Priority to KR1020200116339A priority Critical patent/KR102515437B1/en
Publication of KR20220033906A publication Critical patent/KR20220033906A/en
Application granted granted Critical
Publication of KR102515437B1 publication Critical patent/KR102515437B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/43Detecting, measuring or recording for evaluating the reproductive systems
    • A61B5/4375Detecting, measuring or recording for evaluating the reproductive systems for evaluating the male reproductive system
    • A61B5/4381Prostate evaluation or disorder diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

According to one aspect of the present invention, an apparatus for calculating a risk of prostate cancer comprises: a data input unit receiving clinical information of a subject; and a risk calculation unit calculating a prostate cancer risk of the subject or a clinically meaningful prostate cancer risk from the clinical information by using a risk calculation model based on machine learning. The clinical information includes an age, the number of prostate biopsy, a serum prostate-specific antigen level, a serum free prostate-specific antigen level, a serum testosterone level, a total prostate volume, a prostate metastatic region volume, and an ultrasonic hypoechoic lesion.

Description

기계학습 기반 전립선암 위험도 산출 장치 및 방법과, 전립선암 위험도 산출 모델 생성 장치 및 방법{Apparatus and method for calculating risk of prostate cancer based on machine learning, Apparatus and method for generating risk calculation model of prostate cancer based on machine learning}Apparatus and method for calculating risk of prostate cancer based on machine learning, Apparatus and method for generating risk calculation model of prostate cancer based on machine learning}

기계학습을 이용하여 전립선암의 위험도를 산출하는 기술과 관련된다.It is related to technology for calculating the risk of prostate cancer using machine learning.

전립선암은 남성의 가장 흔한 악성 종양이며, 두 번째로 높은 암 관련 사망 원인이다. 전립선 특이 항원 기반 스크리닝(prostate-specific antigen (PSA)-based screening)이 조기 검출을 보조하지만, 전립선암은 전립선 조직 검사(prostate biopsy)에 의해서만 확인될 수 있다. 그러나 전립선 조직 검사는 감염이나 출혈과 같은 합병증의 위험이 있으며, 전립선 특이 항원(PSA)이 높은 환자의 위험과 혜택을 평가하는 것은 임상의에게 어려운 일이다.Prostate cancer is the most common malignancy in men and the second leading cause of cancer-related death. Although prostate-specific antigen (PSA)-based screening aids in early detection, prostate cancer can only be confirmed by prostate biopsy. However, prostate biopsy carries the risk of complications such as infection and bleeding, and it is difficult for clinicians to assess the risks and benefits in patients with high prostate-specific antigen (PSA).

전립선 특이 항원은 양성 전립성 비대증 또는 전립선염과 같은 비악성 상태에서도 나타날 수 있다. 따라서, 전립선 특이 항원만을 이용하여 전립선 조직 검사를 위한 임상적 결정을 내리는 것은 쉽지 않은 일이다.Prostate-specific antigens may also be present in nonmalignant conditions such as benign prostatic hyperplasia or prostatitis. Therefore, it is not easy to make a clinical decision for prostate biopsy using only the prostate-specific antigen.

기계학습 기반 전립선암 위험도 산출 장치 및 방법과, 전립선암 위험도 산출 모델 생성 장치 및 방법을 제공하는 것을 목적으로 한다.It is an object of the present invention to provide an apparatus and method for calculating a risk of prostate cancer based on machine learning, and an apparatus and method for generating a model for calculating a risk of prostate cancer.

일 양상에 따른 전립선암 위험도 산출 장치는, 피험자의 임상 정보를 입력받는 데이터 입력부; 및 기계학습 기반의 위험도 산출 모델을 이용하여 상기 임상 정보로부터 상기 피험자의 전립선암 위험도 또는 임상적으로 의미있는 전립선암 위험도를 산출하는 위험도 산출부; 를 포함하고, 상기 임상 정보는 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변을 포함할 수 있다.A prostate cancer risk calculation apparatus according to an aspect includes: a data input unit for receiving clinical information of a subject; and a risk calculation unit for calculating a prostate cancer risk or a clinically meaningful risk of prostate cancer of the subject from the clinical information using a machine learning-based risk calculation model; The clinical information may include age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesion. there is.

상기 위험도 산출 모델은 트리 기반 기계학습 알고리즘을 이용하여 미리 생성될 수 있다.The risk calculation model may be generated in advance using a tree-based machine learning algorithm.

상기 트리 기반 기계학습 알고리즘은 XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost), Light GBM(Light Gradient Boost Machine)을 포함할 수 있다.The tree-based machine learning algorithm may include Extreme Gradient Boost (XGboost), Adaptive Boost (ADAboost), and Light Gradient Boost Machine (GBM).

상기 위험도 산출 모델은 전립선암 위험도를 산출하는 제1 위험도 산출 모델과 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 포함할 수 있다.The risk calculation model may include a first risk calculation model for calculating a prostate cancer risk and a second risk calculation model for calculating a clinically meaningful prostate cancer risk.

전립선암 위험도 산출 장치는, 상기 피험자의 조직 검사 결과 최종 판단된 전립선암 진단 결과 또는 임상적으로 의미있는 전립선암 진단 결과를 피드백으로 입력받는 피드백 입력부; 및 상기 피드백과 상기 임상 정보를 기반으로 상기 위험도 산출 모델을 갱신하는 모델 갱신부; 를 더 포함할 수 있다.The prostate cancer risk calculation apparatus may include: a feedback input unit configured to receive, as a feedback, a final determined prostate cancer diagnosis result or a clinically meaningful prostate cancer diagnosis result as a result of a biopsy of the subject; and a model updater configured to update the risk calculation model based on the feedback and the clinical information. may further include.

다른 실시예에 따른 전립선암 위험도 산출 모델 생성 장치는, 다수 환자들에 대한 임상 정보와, 그에 대응하는 전립선암 진단 결과 또는 임상적으로 의미있는 전립선암 진단 결과를 학습 데이터로 수집하는 학습 데이터 수집부; 및 상기 수집된 학습 데이터를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도 또는 임상적으로 의미있는 전립선암 위험도를 산출하는 위험도 산출 모델을 생성하는 모델 생성부; 를 포함하고, 상기 임상 정보는 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변을 포함할 수 있다.The apparatus for generating a prostate cancer risk risk calculation model according to another embodiment includes a learning data collection unit that collects clinical information about a plurality of patients and a corresponding prostate cancer diagnosis result or a clinically meaningful prostate cancer diagnosis result as learning data. ; and a model generator for generating a risk calculation model for calculating a prostate cancer risk or a clinically meaningful prostate cancer risk by learning a machine learning model based on the collected learning data. The clinical information may include age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesion. there is.

상기 학습 데이터 수집부는 상기 수집된 임상 정보에 결측치가 존재하면 다중 대치 알고리즘을 이용하여 상기 결측치를 처리할 수 있다.When a missing value exists in the collected clinical information, the learning data collection unit may process the missing value using a multiple imputation algorithm.

상기 기계학습 모델은 트리 기반 기계학습 모델일 수 있다.The machine learning model may be a tree-based machine learning model.

상기 트리 기반 기계학습 모델은 XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost), Light GBM(Light Gradient Boost Machine)을 포함할 수 있다.The tree-based machine learning model may include Extreme Gradient Boost (XGboost), Adaptive Boost (ADAboost), and Light Gradient Boost Machine (GBM).

상기 모델 생성부는, 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이에 대응하는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도를 산출하는 제1 위험도 산출 모델을 생성하고, 연령, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이에 대응하는 임상적으로 의미있는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 생성할 수 있다.The model generator includes age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume and ultrasound image hypoechoic lesion, and prostate cancer corresponding thereto A first risk calculation model is generated that calculates the risk of prostate cancer by training a machine learning model based on the diagnosis result, and age, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate Create a second risk calculation model that calculates clinically meaningful prostate cancer risk by training a machine learning model based on the metastatic area volume and ultrasound image of hypoechoic lesion and the clinically meaningful prostate cancer diagnosis result. can do.

또 다른 실시예에 따른 전립선암 위험도 산출 장치의 전립선암 위험도 산출 방법은, 피험자의 임상 정보를 입력받는 단계; 및 기계학습 기반의 위험도 산출 모델을 이용하여 상기 임상 정보로부터 상기 피험자의 전립선암 위험도 또는 임상적으로 의미있는 전립선암 위험도를 산출하는 단계; 를 포함하고, 상기 임상 정보는 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변을 포함할 수 있다.According to another embodiment, a method for calculating a risk of prostate cancer by an apparatus for calculating a risk of prostate cancer includes: receiving clinical information of a subject; and calculating the subject's risk of prostate cancer or a clinically meaningful risk of prostate cancer from the clinical information using a machine learning-based risk calculation model. The clinical information may include age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesion. there is.

상기 위험도 산출 모델은 트리 기반 기계학습 알고리즘을 이용하여 미리 생성될 수 있다.The risk calculation model may be generated in advance using a tree-based machine learning algorithm.

상기 트리 기반 기계학습 알고리즘은 XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost), Light GBM(Light Gradient Boost Machine)을 포함할 수 있다.The tree-based machine learning algorithm may include Extreme Gradient Boost (XGboost), Adaptive Boost (ADAboost), and Light Gradient Boost Machine (GBM).

상기 위험도 산출 모델은 전립선암 위험도를 산출하는 제1 위험도 산출 모델과 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 포함할 수 있다.The risk calculation model may include a first risk calculation model for calculating a prostate cancer risk and a second risk calculation model for calculating a clinically meaningful prostate cancer risk.

전립선암 위험도 산출 방법은, 상기 피험자의 조직 검사 결과 최종 판단된 전립선암 위험도 산출 결과 또는 임상적으로 의미있는 전립선암 위험도 산출 결과를 피드백으로 입력받는 단계; 및 상기 피드백과 상기 임상 정보를 기반으로 상기 위험도 산출 모델을 갱신하는 단계; 를 더 포함할 수 있다.The method for calculating the risk of prostate cancer includes: receiving as a feedback a final determined result of calculating the risk of prostate cancer or a clinically meaningful result of calculating the risk of prostate cancer as a result of a biopsy of the subject; and updating the risk calculation model based on the feedback and the clinical information. may further include.

또 다른 양상에 따른 전립선암 위험도 산출 모델 생성 장치의 전립선암 위험도 산출 모델 생성 방법은, 다수 환자들에 대한 임상 정보와, 그에 대응하는 전립선암 진단 결과 또는 임상적으로 의미있는 전립선암 진단 결과를 학습 데이터로 수집하는 단계; 및 상기 수집된 학습 데이터를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도 또는 임상적으로 의미있는 전립선암 위험도를 산출하는 위험도 산출 모델을 생성하는 단계; 를 포함하고, 상기 임상 정보는 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변을 포함할 수 있다.A method for generating a prostate cancer risk model of an apparatus for generating a prostate cancer risk risk model according to another aspect is to learn clinical information about a plurality of patients and a corresponding prostate cancer diagnosis result or a clinically meaningful prostate cancer diagnosis result. collecting data; and generating a risk calculation model for calculating a prostate cancer risk or a clinically meaningful risk of prostate cancer by learning a machine learning model based on the collected learning data; The clinical information may include age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesion. there is.

전립선암 위험도 산출 모델 생성 방법은, 상기 수집된 임상 정보에 결측치가 존재하면 다중 대치 알고리즘을 이용하여 상기 결측치를 처리하는 단계; 를 더 포함할 수 있다.The method for generating a prostate cancer risk risk calculation model includes: processing the missing value using a multiple imputation algorithm when there is a missing value in the collected clinical information; may further include.

상기 기계학습 모델은 트리 기반 기계학습 모델일 수 있다.The machine learning model may be a tree-based machine learning model.

상기 트리 기반 기계학습 모델은 XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost), Light GBM(Light Gradient Boost Machine)을 포함할 수 있다.The tree-based machine learning model may include Extreme Gradient Boost (XGboost), Adaptive Boost (ADAboost), and Light Gradient Boost Machine (GBM).

상기 위험도 산출 모델을 생성하는 단계는, 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이에 대응하는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도를 산출하는 제1 위험도 산출 모델을 생성하는 단계; 및 연령, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이에 대응하는 임상적으로 의미있는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 생성하는 단계; 를 포함할 수 있다.The step of generating the risk calculation model includes: age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesion; generating a first risk calculation model for calculating a prostate cancer risk by learning a machine learning model based on a corresponding prostate cancer diagnosis result; Based on age, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume and ultrasonographic hypoechoic lesion, and corresponding clinically meaningful prostate cancer diagnosis results generating a second risk calculation model for calculating a clinically meaningful prostate cancer risk by learning the machine learning model with may include

기계학습 기반으로 전립선암 위험도 또는 임상적으로 의미있는 전립선암 위험도를 산출하기 모델을 생성하여 이용함으로써, 전립선암 위험도 또는 임상적으로 의미있는 전립선암 위험도를 정확하고 용이하게 판단하고 전립선 조직 검사를 위한 임상적 결정에 이용할 수 있다.By creating and using a model to calculate the risk of prostate cancer or clinically meaningful prostate cancer risk based on machine learning, it is possible to accurately and easily determine the risk of prostate cancer or clinically meaningful prostate cancer risk and can be used for clinical decisions.

도 1은 일 실시예에 따른 전립선암 위험도 예측 시스템을 도시한 도면이다.
도 2는 일 실시예에 따른 전립선암 위험도 산출 모델 생성 장치를 도시한 도면이다.
도 3은 일 실시예에 따른 전립선암 위험도 산출 장치를 도시한 도면이다.
도 4는 다른 실시예에 따른 전립선암 위험도 산출 장치를 도시한 도면이다.
도 5는 일 실시예에 따른 전립선암 위험도 산출 모델 생성 방법을 도시한 도면이다.
도 6은 일 실시예에 따른 전립선암 위험도 산출 방법을 도시한 도면이다.
도 7은 다른 실시예에 따른 전립선암 위험도 산출 방법을 도시한 도면이다.
도 8은 실험예에 따른 제1 위험도 산출 모델의 성능을 도시한 도면이다.
도 9는 실험예에 따른 제2 위험도 산출 모델의 성능을 도시한 도면이다.
도 10은 실험예에 따른 제1 위험도 산출 모델에서 각 특징의 중요도를 도시한 도면이다.
도 11은 실험예에 따른 제2 위험도 산출 모델에서 각 특징의 중요도를 도시한 도면이다.
도 12는 PSA가 3-10인 그룹에 대한 제1 위험도 산출 모델의 성능을 도시한 도면이다.
도 13은 PSA가 10-20인 그룹에 대한 제1 위험도 산출 모델의 성능을 도시한 도면이다.
도 14는 PSA가 3-10인 그룹에 대한 제2 위험도 산출 모델의 성능을 도시한 도면이다.
도 15은 PSA가 10-20인 그룹에 대한 제2 위험도 산출 모델의 성능을 도시한 도면이다.
1 is a diagram illustrating a prostate cancer risk prediction system according to an embodiment.
2 is a diagram illustrating an apparatus for generating a prostate cancer risk calculation model according to an exemplary embodiment.
3 is a diagram illustrating an apparatus for calculating a risk of prostate cancer according to an exemplary embodiment.
4 is a diagram illustrating an apparatus for calculating the risk of prostate cancer according to another embodiment.
5 is a diagram illustrating a method of generating a prostate cancer risk calculation model according to an exemplary embodiment.
6 is a diagram illustrating a method for calculating the risk of prostate cancer according to an embodiment.
7 is a diagram illustrating a method for calculating the risk of prostate cancer according to another embodiment.
8 is a diagram illustrating the performance of the first risk calculation model according to an experimental example.
9 is a diagram illustrating the performance of a second risk calculation model according to an experimental example.
10 is a diagram illustrating the importance of each feature in the first risk calculation model according to an experimental example.
11 is a diagram illustrating the importance of each feature in the second risk calculation model according to the experimental example.
12 is a diagram illustrating the performance of the first risk calculation model for a group having a PSA of 3-10.
13 is a diagram illustrating the performance of the first risk calculation model for a group having a PSA of 10-20.
14 is a diagram illustrating the performance of the second risk calculation model for a group having a PSA of 3-10.
15 is a diagram illustrating the performance of the second risk calculation model for a group having a PSA of 10-20.

이하, 첨부된 도면을 참조하여 본 발명의 일 실시예를 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.Hereinafter, an embodiment of the present invention will be described in detail with reference to the accompanying drawings. In adding reference numerals to the components of each drawing, it should be noted that the same components are given the same reference numerals as much as possible even though they are indicated on different drawings. In addition, when it is determined that a detailed description of a known function or configuration related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted.

한편, 각 단계들에 있어, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않은 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 수행될 수 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.On the other hand, in each step, each step may occur differently from the specified order unless a specific order is clearly stated in context. That is, each step may be performed in the same order as specified, may be performed substantially simultaneously, or may be performed in a reverse order.

후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.The terms to be described below are terms defined in consideration of functions in the present invention, which may vary depending on the intention or custom of a user or operator. Therefore, the definition should be made based on the content throughout this specification.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하고, '포함하다' 또는 '가지다' 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Terms such as first, second, etc. may be used to describe various elements, but the elements should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. The singular expression includes the plural expression unless the context clearly dictates otherwise, and terms such as 'comprise' or 'have' refer to the features, numbers, steps, operations, components, parts, or combinations thereof described in the specification. It is to be understood that this is not intended to indicate the existence of one or more other features or numbers, steps, operations, components, parts, or combinations thereof, or to exclude in advance the possibility of addition or existence of one or more other features.

또한, 본 명세서에서의 구성부들에 대한 구분은 각 구성부가 담당하는 주 기능별로 구분한 것에 불과하다. 즉, 2개 이상의 구성부가 하나의 구성부로 합쳐지거나 또는 하나의 구성부가 보다 세분화된 기능별로 2개 이상으로 분화되어 구비될 수도 있다. 그리고 구성부 각각은 자신이 담당하는 주기능 이외에도 다른 구성부가 담당하는 기능 중 일부 또는 전부의 기능을 추가적으로 수행할 수도 있으며, 구성부 각각이 담당하는 주기능 중 일부 기능이 다른 구성부에 의해 전담되어 수행될 수도 있다. 각 구성부는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.In addition, in the present specification, the classification of the constituent units is merely classified according to the main functions each constituent unit is responsible for. That is, two or more components may be combined into one component, or one component may be divided into two or more for each more subdivided function. In addition to the main functions that each of the constituent units is responsible for, each of the constituent units may additionally perform some or all of the functions of other constituent units, and some of the main functions of each constituent unit are dedicated to other constituent units. may be performed. Each component may be implemented as hardware or software, or may be implemented as a combination of hardware and software.

도 1은 일 실시예에 따른 전립선암 위험도 예측 시스템을 도시한 도면이고, 도 2는 일 실시예에 따른 전립선암 위험도 산출 모델 생성 장치를 도시한 도면이고, 도 3은 일 실시예에 따른 전립선암 위험도 산출 장치를 도시한 도면이다.1 is a diagram illustrating a prostate cancer risk prediction system according to an embodiment, FIG. 2 is a diagram illustrating a prostate cancer risk calculation model generating apparatus according to an embodiment, and FIG. 3 is a prostate cancer risk prediction system according to an embodiment It is a diagram showing a risk calculating device.

도 1을 참조하면, 일 실시예에 따른 전립선암 위험도 예측 시스템(100)은 전립선암 위험도 산출 모델 생성 장치(110) 및 전립선암 위험도 산출 장치(120)를 포함할 수 있다.Referring to FIG. 1 , the prostate cancer risk prediction system 100 according to an embodiment may include a prostate cancer risk calculation model generating device 110 and a prostate cancer risk calculating device 120 .

전립선암 위험도 산출 모델 생성 장치(110)는 기계학습 알고리즘을 기반으로 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출하는 위험도 산출 모델을 생성할 수 있다. 이때, 기계학습 알고리즘은 트리 기반 기계학습 알고리즘(예컨대, XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost) 또는 Light GBM(Light Gradient Boost Machine) 등), 딥러닝 알고리즘, K-근접 이웃 알고리즘, 나이브 베이즈 분류(Naㅿve Bayes Classification) 알고리즘, 신경망(Neural Networks) 알고리즘(예컨대, feed-forward neural network(FFNN) 등), 서포트 벡터 머신(Support Vector Machines) 등일 수 있으나, 이에 한정되는 것은 아니다. 임상적으로 의미있는 전립선암은 글리슨 등급의 3 내지 5 그룹에 속하는 전립선암으로 정의될 수 있다.The prostate cancer risk calculation model generating apparatus 110 may generate a risk calculation model for calculating a prostate cancer risk and/or a clinically meaningful prostate cancer risk based on a machine learning algorithm. At this time, the machine learning algorithm is a tree-based machine learning algorithm (eg, XGboost (Extreme Gradient Boost), ADAboost (Adaptive Boost) or Light GBM (Light Gradient Boost Machine), etc.), deep learning algorithm, K-Nearest Neighbor Algorithm, Naive Bay It may be a Naive Bayes Classification algorithm, a Neural Networks algorithm (eg, a feed-forward neural network (FFNN), etc.), Support Vector Machines, etc., but is not limited thereto. Clinically meaningful prostate cancer can be defined as prostate cancer belonging to groups 3 to 5 of the Gleason scale.

전립선암 위험도 산출 모델 생성 장치(110)는 도 2에 도시된 바와 같이, 학습 데이터 수집부(210) 및 모델 생성부(220)를 포함할 수 있다.As shown in FIG. 2 , the prostate cancer risk calculation model generating apparatus 110 may include a learning data collecting unit 210 and a model generating unit 220 .

학습 데이터 수집부(210)는 위험도 산출 모델 생성에 이용될 학습 데이터를 수집할 수 있다.The learning data collection unit 210 may collect learning data to be used for generating a risk calculation model.

보다 구체적으로, 학습 데이터 수집부(210)는 외부 장치로부터 다수의 환자들에 대한 임상 정보(clinical information)와, 그에 대응하는 전립선암 진단 결과 및/또는 임상적으로 의미있는 전립선암 진단 결과를 학습 데이터로서 수집할 수 있다. 여기서 임상 정보는 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치(serum prostate-specific antigen(PSA) level), 혈청 유리 전립선 특이 항원 수치(serum free PSA level), 혈청 테스토스테론 수치(serum testosterone level), 총 전립선 부피(total prostate volume), 전립선 전이 영역 부피(prostate transitional zone volume) 및 초음파상 저에코 병변(hypoechoic lesion on ultrasonography) 등을 포함할 수 있다.More specifically, the learning data collection unit 210 learns clinical information about a plurality of patients from an external device, and a corresponding prostate cancer diagnosis result and/or a clinically meaningful prostate cancer diagnosis result. data can be collected. Here, clinical information includes age, number of prostate biopsies, serum prostate-specific antigen (PSA) level, serum free PSA level, serum testosterone level, total prostate volume, prostate transitional zone volume, and hypoechoic lesion on ultrasonography, and the like.

이때, 학습 데이터 수집부(210)는 외부 장치로부터 학습 데이터를 획득하기 위하여 다양한 유무선 통신 기술을 이용할 수 있다. 또한, 외부 장치는 전자 건강 기록(예컨대, EHR(electronic health record) 또는 EMR(electronic medical record))을 저장하는 장치 또는 서버일 수 있다.In this case, the learning data collection unit 210 may use various wired/wireless communication technologies to acquire learning data from an external device. Also, the external device may be a device or a server that stores an electronic health record (eg, an electronic health record (EHR) or an electronic medical record (EMR)).

학습 데이터 수집부(210)는 수집된 임상 정보에 결측치가 존재하면, 결측치를 처리할 수 있다. 일 실시예에 따르면, 학습 데이터 수집부(210)는 결측치를 삭제하는 방법, 결측치를 대치하는 방법 및 결측치가 없는 변수들로 구성된 데이터 세트로 결측치를 진단하는 방법 등 다양한 방법을 이용하여 결측치를 처리할 수 있다. 보다 바람직하게, 학습 데이터 수집부(210)는 결측치를 대치하는 방법, 예컨대 Mice, Amelia, MissForest, Hmisc, Mi 등을 포함하는 다중 대치 알고리즘을 이용하여 결측치를 처리할 수 있다.When a missing value exists in the collected clinical information, the learning data collection unit 210 may process the missing value. According to an embodiment, the training data collection unit 210 processes missing values using various methods, such as a method of deleting missing values, a method of replacing missing values, and a method of diagnosing missing values with a data set comprising variables having no missing values. can do. More preferably, the learning data collection unit 210 may process the missing values using a method of imputing missing values, for example, using multiple imputation algorithms including Mice, Amelia, MissForest, Hmisc, Mi, and the like.

모델 생성부(220)는 수집된 학습 데이터를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출하는 위험도 산출 모델을 생성할 수 있다. 이때, 위험도 산출 모델은 전립선암 위험도 및 임상적으로 의미있는 전립선암 위험도를 산출하는 하나의 통합 위험도 산출 모델일 수 있다. 또는, 위험도 산출 모델은 전립선암 위험도를 산출하는 제1 위험도 산출 모델 및 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 포함할 수도 있다.The model generator 220 may generate a risk calculation model for calculating a prostate cancer risk and/or a clinically meaningful risk of prostate cancer by learning a machine learning model based on the collected learning data. In this case, the risk calculation model may be one integrated risk calculation model for calculating the prostate cancer risk and clinically meaningful prostate cancer risk. Alternatively, the risk calculation model may include a first risk calculation model for calculating the risk of prostate cancer and a second risk calculation model for calculating a clinically meaningful risk of prostate cancer.

예를 들면, 모델 생성부(220)는 다수의 환자들에 대한 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이들에 대응하는 전립선암 진단 결과 및 임상적으로 의미있는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도 및 임상적으로 의미있는 전립선암 위험도를 산출하는 하나의 통합 위험도 산출 모델을 생성할 수 있다.For example, the model generating unit 220 may calculate age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume and One that calculates prostate cancer risk and clinically meaningful prostate cancer risk by training a machine learning model based on ultrasound image of hypoechoic lesions and their corresponding prostate cancer diagnosis results and clinically meaningful prostate cancer diagnosis results It is possible to create an integrated risk calculation model of

다른 예를 들면, 모델 생성부(220)는 다수의 환자들에 대한 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이들에 대응하는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도를 산출하는 제1 위험도 산출 모델을 생성할 수 있다.For another example, the model generating unit 220 may generate age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, and prostate metastasis region volume for a plurality of patients. and a first risk calculation model for calculating the risk of prostate cancer by learning a machine learning model based on the ultrasound image of the hypoechoic lesion and the prostate cancer diagnosis result corresponding thereto.

또 다른 예를 들면, 모델 생성부(220)는 다수의 환자들에 대한 연령, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이들에 대응하는 임상적으로 의미있는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 생성할 수 있다.For another example, the model generating unit 220 may calculate the age, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound image data for a plurality of patients. A second risk calculation model for calculating a clinically meaningful risk of prostate cancer may be generated by training a machine learning model based on the echo lesion and the clinically meaningful prostate cancer diagnosis result corresponding to the echo lesion.

일 실시예에 따르면, 기계학습 모델은 트리 기반 기계학습 모델(예컨대, XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost) 또는 Light GBM(Light Gradient Boost Machine) 등), 딥러닝, K-근접 이웃, 나이브 베이즈 분류(Naㅿve Bayes Classification), 신경망(Neural Networks)(예컨대, feed-forward neural network(FFNN) 등), 서포트 벡터 머신(Support Vector Machines) 등을 포함할 수 있다. 보다 바람직하게, 기계학습 모델은 트리 기반 기계학습 모델일 수 있다.According to one embodiment, the machine learning model is a tree-based machine learning model (e.g., XGboost (Extreme Gradient Boost), ADAboost (Adaptive Boost) or Light GBM (Light Gradient Boost Machine), etc.), deep learning, K-nearest neighbor, Naive Bayes Classification, Neural Networks (eg, feed-forward neural network (FFNN), etc.), Support Vector Machines, etc. may be included. More preferably, the machine learning model may be a tree-based machine learning model.

한편, 일 실시예에 따르면, 모델 생성부(220)는 기계학습 모델의 하이퍼 파라미터를 최적화할 수 있다. 예컨대, 모델 생성부(220)는 베이지안 최적화(Bayesizan Optimization) 알고리즘을 통해 기계학습 모델의 하이퍼 파라미터를 최적화할 수 있다.Meanwhile, according to an embodiment, the model generator 220 may optimize a hyper parameter of the machine learning model. For example, the model generator 220 may optimize the hyperparameter of the machine learning model through a Bayesian optimization algorithm.

전립선암 위험도 산출 장치(120)는 전립선암 위험도 산출 모델 생성 장치(110)에서 생성된 위험도 산출 모델을 이용하여 피험자의 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출할 수 있다.The prostate cancer risk calculation apparatus 120 may calculate a subject's prostate cancer risk and/or a clinically meaningful risk of prostate cancer by using the risk calculation model generated by the prostate cancer risk calculation model generation apparatus 110 .

전립선암 위험도 산출 장치(120)는 도 3에 도시된 바와 같이, 데이터 입력부(310), 저장부(320) 및 위험도 산출부(330)를 포함할 수 있다.As shown in FIG. 3 , the prostate cancer risk calculation apparatus 120 may include a data input unit 310 , a storage unit 320 , and a risk calculation unit 330 .

데이터 입력부(310)는 사용자로부터 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출에 이용되는 피험자의 임상 정보를 입력받을 수 있다. 임상 정보는 전술한 바와 같이, 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피, 초음파상 저에코 병변 등을 포함할 수 있다.The data input unit 310 may receive, from a user, clinical information of a subject used to calculate a prostate cancer risk and/or a clinically meaningful risk of prostate cancer. Clinical information, as described above, may include age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, ultrasound hypoechoic lesion, etc. can

일 실시예에 따르면, 데이터 입력부(310)는 키 패드(key pad), 돔 스위치(dome switch), 터치 패드(touch pad), 조그 휠(Jog wheel), 조그 스위치(Jog switch), H/W 버튼 등을 포함할 수 있다. 특히, 터치 패드가 디스플레이와 상호 레이어 구조를 이룰 경우, 이를 터치 스크린이라 부를 수 있다.According to an embodiment, the data input unit 310 may include a key pad, a dome switch, a touch pad, a jog wheel, a jog switch, and H/W. It may include a button and the like. In particular, when the touch pad forms a layer structure with the display, it may be referred to as a touch screen.

저장부(320)는 전립선암 위험도 산출 모델 생성 장치(110)에서 생성된 위험도 산출 모델을 저장할 수 있다. 저장부(320)는 플래시 메모리 타입(flash memory type), 하드 디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예컨대, SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read Only Memory), PROM(Programmable Read Only Memory), 자기 메모리, 자기 디스크, 광디스크 등 적어도 하나의 타입의 저장매체를 포함할 수 있다.The storage unit 320 may store the risk calculation model generated by the prostate cancer risk calculation model generating apparatus 110 . The storage unit 320 includes a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (eg, SD or XD memory, etc.), RAM (Random Access Memory, RAM), SRAM (Static Random Access Memory), ROM (Read Only Memory, ROM), EEPROM (Electrically Erasable Programmable Read Only Memory), PROM (Programmable Read Only Memory), magnetic memory, magnetic disk, optical disk and at least one type of storage medium.

위험도 산출부(330)는 데이터 입력부(310)를 통해 입력된 피험자의 임상 정보와 저장부(320)에 저장된 위험도 산출 모델을 이용하여 피험자의 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출할 수 있다. 보다 구체적으로 데이터 입력부(310)는 피험자의 임상 정보를 위험도 산출 모델에 입력하여 피험자의 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출할 수 있다.The risk calculation unit 330 uses the subject's clinical information input through the data input unit 310 and the risk calculation model stored in the storage unit 320 to determine the subject's prostate cancer risk and/or the clinically meaningful risk of prostate cancer. can be calculated. More specifically, the data input unit 310 may input the subject's clinical information into the risk calculation model to calculate the subject's risk of prostate cancer and/or a clinically meaningful risk of prostate cancer.

예를 들면, 위험도 산출부(330)는 하나의 통합 위험도 산출 모델을 이용하여 피험자의 전립선암 위험도 및 임상적으로 의미있는 전립선암 위험도를 산출할 수 있다. 다른 예를 들면, 위험도 산출부(330)는 제1 위험도 산출 모델을 이용하여 피험자의 전립선암 위험도를 산출할 수 있다. 또 다른 예를 들면, 위험도 산출부(330)는 제2 위험도 산출 모델을 이용하여 피험자의 전립선암 위험도를 산출할 수 있다.For example, the risk calculating unit 330 may calculate the subject's prostate cancer risk and a clinically meaningful risk of prostate cancer by using one integrated risk calculation model. As another example, the risk calculator 330 may calculate the prostate cancer risk of the subject by using the first risk calculation model. As another example, the risk calculator 330 may calculate the risk of prostate cancer of the subject by using the second risk calculation model.

도 4는 다른 실시예에 따른 전립선암 위험도 산출 장치를 도시한 도면이다. 도 4의 전립선암 위험도 산출 장치(400)는 도 1의 전립선암 위험도 산출 장치(120)의 다른 실시예일 수 있다.4 is a diagram illustrating an apparatus for calculating the risk of prostate cancer according to another embodiment. The prostate cancer risk calculating apparatus 400 of FIG. 4 may be another embodiment of the prostate cancer risk calculating apparatus 120 of FIG. 1 .

도 4를 참조하면, 전립선암 위험도 산출 장치(400)는 데이터 입력부(310), 저장부(320), 위험도 산출부(330), 피드백 입력부(410), 모델 갱신부(420) 통신부(430) 및 출력부(440)를 포함할 수 있다. 여기서 데이터 입력부(310), 저장부(320) 및 위험도 산출부(330)는 도 3을 참조하여 전술한 바와 같으므로 그 상세한 설명은 생략하기로 한다.Referring to FIG. 4 , the prostate cancer risk calculation apparatus 400 includes a data input unit 310 , a storage unit 320 , a risk calculation unit 330 , a feedback input unit 410 , a model update unit 420 , and a communication unit 430 . and an output unit 440 . Here, since the data input unit 310 , the storage unit 320 , and the risk level calculation unit 330 are the same as those described above with reference to FIG. 3 , a detailed description thereof will be omitted.

피드백 입력부(410)는 피험자의 조직 검사 결과 최종 판단된 전립선암 진단 결과 및/또는 임상적으로 의미있는 전립선암 진단 결과를 피드백으로 입력받을 수 있다. 일 실시예에 따르면, 피드백 입력부(410)는 키 패드(key pad), 돔 스위치(dome switch), 터치 패드(touch pad), 조그 휠(Jog wheel), 조그 스위치(Jog switch), H/W 버튼 등을 포함할 수 있다.The feedback input unit 410 may receive, as feedback, a final determined prostate cancer diagnosis result and/or a clinically meaningful prostate cancer diagnosis result as a result of a biopsy of the subject. According to an embodiment, the feedback input unit 410 may include a key pad, a dome switch, a touch pad, a jog wheel, a jog switch, and H/W. It may include a button and the like.

모델 갱신부(420)는 데이터 입력부(310)를 통해 입력받은 피험자의 임상 정보와, 피드백 입력부(410)를 통해 입력받은 전립선암 진단 결과 및/또는 임상적으로 의미있는 전립선암 진단 결과를 기반으로 기 저장된 위험도 산출 모델을 갱신할 수 있다. 예컨대, 모델 갱신부(420)는 데이터 입력부(310)를 통해 입력받은 피험자의 임상 정보와, 피드백 입력부(410)를 통해 입력받은 전립선암 진단 결과 및/또는 임상적으로 의미있는 전립선암 진단 결과를 새로운 학습 데이터로 하여, 기 저장된 위험도 산출 모델을 추가 학습시킬 수 있다. 이에 따라 위험도 산출부(330)의 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도의 산출 정확도를 높일 수 있다.The model updater 420 is based on the subject's clinical information input through the data input unit 310 and the prostate cancer diagnosis result and/or clinically meaningful prostate cancer diagnosis result input through the feedback input unit 410 . A pre-stored risk calculation model can be updated. For example, the model updater 420 may use the clinical information of the subject input through the data input unit 310 and the prostate cancer diagnosis result and/or clinically meaningful prostate cancer diagnosis result received through the feedback input unit 410 . As the new learning data, a pre-stored risk calculation model may be additionally trained. Accordingly, the accuracy of calculating the risk of prostate cancer and/or the risk of clinically meaningful prostate cancer by the risk calculator 330 may be increased.

통신부(430)는 외부 장치와 통신을 수행할 수 있다. 예컨대, 통신부(423)는 전립선암 위험도 산출 장치(400)에 입력된 데이터, 저장된 데이터, 처리된 데이터 등을 외부 장치로 전송하거나, 외부 장치로부터 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도의 산출에 도움이 되는 다양한 데이터를 수신할 수 있다.The communication unit 430 may communicate with an external device. For example, the communication unit 423 transmits data input to the prostate cancer risk calculation device 400, stored data, processed data, etc. to an external device, or transmits the prostate cancer risk and/or clinically significant prostate cancer risk from the external device. It is possible to receive various data helpful in calculating the degree of risk.

이때, 외부 장치는 전립선암 위험도 산출 모델 생성 장치(110)일 수도 있으며, 전립선암 위험도 산출 장치(400)에 입력된 데이터, 저장된 데이터, 처리된 데이터 등을 사용하는 의료 장비, 결과물을 출력하기 위한 프린트 또는 디스플레이 장치일 수도 있다. 이외에도 외부 장치는 디지털 TV, 데스크탑 컴퓨터, 휴대폰, 스마트 폰, 태블릿, 노트북, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션 장치, MP3 플레이어, 디지털 카메라, 웨어러블 디바이스 등 일 수도 있으나, 이에 제한되지 않는다.In this case, the external device may be the prostate cancer risk calculation model generating device 110 , and for outputting medical equipment and results using data input to the prostate cancer risk calculation device 400 , stored data, processed data, etc. It may be a printing or display device. In addition, the external device may be a digital TV, a desktop computer, a mobile phone, a smart phone, a tablet, a laptop computer, a PDA (Personal Digital Assistants), a PMP (Portable Multimedia Player), a navigation device, an MP3 player, a digital camera, a wearable device, etc. not limited

통신부(430)는 유무선 통신 기술을 이용하여 외부 장치와 통신할 수 있다. 이때 무선 통신 기술은 블루투스(bluetooth) 통신, BLE(Bluetooth Low Energy) 통신, 근거리 무선 통신(Near Field Communication, NFC), WLAN 통신, 지그비(Zigbee) 통신, 적외선(Infrared Data Association, IrDA) 통신, WFD(Wi-Fi Direct) 통신, UWB(ultra-wideband) 통신, Ant+ 통신, WIFI 통신, RFID(Radio Frequency Identification) 통신, 3G 통신, 4G 통신 및 5G 통신 등을 포함할 수 있으나 이는 일 예에 불과할 뿐이며, 이에 한정되는 것은 아니다.The communication unit 430 may communicate with an external device using a wired/wireless communication technology. At this time, the wireless communication technology is Bluetooth (bluetooth) communication, BLE (Bluetooth Low Energy) communication, near field communication (NFC), WLAN communication, Zigbee communication, infrared (Infrared Data Association, IrDA) communication, WFD (Wi-Fi Direct) communication, UWB (ultra-wideband) communication, Ant+ communication, WIFI communication, RFID (Radio Frequency Identification) communication, 3G communication, 4G communication, 5G communication, etc. may include, but this is only an example, and , but is not limited thereto.

출력부(440)는 전립선암 위험도 산출 장치(400)에 입력된 데이터, 저장된 데이터, 처리된 데이터 등을 출력할 수 있다. 예컨대, 전립선암 위험도 산출 장치(400)는 데이터 입력부(310) 및 피드백 입력부(410)를 통해 입력된 데이터, 위험도 산출부(330)를 통해 산출된 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도 등을 출력할 수 있다.The output unit 440 may output data input to the prostate cancer risk calculation apparatus 400 , stored data, processed data, and the like. For example, the prostate cancer risk calculating device 400 may include data input through the data input unit 310 and the feedback input unit 410 , the prostate cancer risk calculated through the risk calculator 330 , and/or a clinically meaningful prostate. Cancer risk and the like can be output.

일 실시예에 따르면, 출력부(440)는 전립선암 위험도 산출 장치(400)에 입력된 데이터, 저장된 데이터, 처리된 데이터 등을 청각적 방법, 시각적 방법 및 촉각적 방법 중 적어도 하나의 방법으로 출력할 수 있다. 이를 위해 출력부(440)는 디스플레이, 스피커, 진동기 등을 포함할 수 있다.According to an embodiment, the output unit 440 outputs data input to the prostate cancer risk calculation device 400, stored data, processed data, etc. in at least one of an auditory method, a visual method, and a tactile method. can do. To this end, the output unit 440 may include a display, a speaker, a vibrator, and the like.

한편, 도 4는 데이터 입력부(310)와 피드백 입력부(410)를 별개의 구성부로 도시하였으나 이에 한정되는 것은 아니며, 데이터 입력부(310) 및 피드백 입력부(410)가 하나의 구성부로 통합될 수도 있다.Meanwhile, although FIG. 4 illustrates the data input unit 310 and the feedback input unit 410 as separate components, the present invention is not limited thereto, and the data input unit 310 and the feedback input unit 410 may be integrated into one component.

또한, 실시예에 따라서는 모델 갱신부(420)의 기능을 전립선암 위험도 산출 모델 생성 장치(110)가 수행할 수도 있다.Also, according to an embodiment, the function of the model updater 420 may be performed by the prostate cancer risk calculation model generating apparatus 110 .

도 5는 일 실시예에 따른 전립선암 위험도 산출 모델 생성 방법을 도시한 도면이다.5 is a diagram illustrating a method of generating a prostate cancer risk calculation model according to an exemplary embodiment.

도 5의 전립선암 위험도 산출 모델 생성 방법은 도 2의 전립선암 위험도 산출 모델 생성 장치(110)에 의해 수행될 수 있다.The method of generating a prostate cancer risk risk calculation model of FIG. 5 may be performed by the prostate cancer risk risk calculation model generating apparatus 110 of FIG. 2 .

도 2 및 도 5를 참조하면, 전립선암 위험도 산출 모델 생성 장치(110)는 위험도 산출 모델 생성에 이용될 학습 데이터를 수집한다(510). 예컨대, 전립선암 위험도 산출 모델 생성 장치(110)는 외부 장치로부터 다수의 환자들에 대한 임상 정보(clinical information)와, 그에 대응하는 전립선암 진단 결과 및/또는 임상적으로 의미있는 전립선암 진단 결과를 학습 데이터로서 수집할 수 있다. 여기서 임상 정보는 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치(serum prostate-specific antigen(PSA) level), 혈청 유리 전립선 특이 항원 수치(serum free PSA level), 혈청 테스토스테론 수치(serum testosterone level), 총 전립선 부피(total prostate volume), 전립선 전이 영역 부피(prostate transitional zone volume) 및 초음파상 저에코 병변(hypoechoic lesion on ultrasonography) 등을 포함할 수 있다.Referring to FIGS. 2 and 5 , the apparatus 110 for generating a risk calculation model for prostate cancer collects learning data to be used for generating a risk calculation model ( S510 ). For example, the prostate cancer risk calculation model generating device 110 may generate clinical information on a plurality of patients from an external device, and a corresponding prostate cancer diagnosis result and/or a clinically meaningful prostate cancer diagnosis result. It can be collected as learning data. Here, clinical information includes age, number of prostate biopsies, serum prostate-specific antigen (PSA) level, serum free PSA level, serum testosterone level, total prostate volume, prostate transitional zone volume, and hypoechoic lesion on ultrasonography, and the like.

전립선암 위험도 산출 모델 생성 장치(110)는 수집된 임상 정보에 결측치가 존재하면, 결측치를 처리한다(520). 예컨대, 전립선암 위험도 산출 모델 생성 장치(110)는 결측치를 삭제하는 방법, 결측치를 대치하는 방법 및 결측치가 없는 변수들로 구성된 데이터 세트로 결측치를 진단하는 방법 등 다양한 방법을 이용하여 결측치를 처리할 수 있다. 보다 바람직하게, 전립선암 위험도 산출 모델 생성 장치(110)는 결측치를 대치하는 방법, 예컨대 Mice, Amelia, MissForest, Hmisc, Mi 등을 포함하는 다중 대치 알고리즘을 이용하여 결측치를 처리할 수 있다.If there is a missing value in the collected clinical information, the prostate cancer risk calculation model generating apparatus 110 processes the missing value ( 520 ). For example, the prostate cancer risk calculation model generating apparatus 110 may process missing values using various methods, such as a method of deleting missing values, a method of replacing missing values, and a method of diagnosing missing values with a data set composed of variables having no missing values. can More preferably, the prostate cancer risk calculation model generating apparatus 110 may process the missing value using a method of imputing the missing value, for example, a multiple imputation algorithm including Mice, Amelia, MissForest, Hmisc, Mi, and the like.

전립선암 위험도 산출 모델 생성 장치(110)는 수집된 학습 데이터를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출하는 위험도 산출 모델을 생성한다(530). 일 실시예에 따르면, 기계학습 모델은 트리 기반 기계학습 모델(예컨대, XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost) 또는 Light GBM(Light Gradient Boost Machine) 등), 딥러닝, K-근접 이웃, 나이브 베이즈 분류(Naㅿve Bayes Classification), 신경망(Neural Networks)(예컨대, feed-forward neural network(FFNN) 등), 서포트 벡터 머신(Support Vector Machines) 등을 포함할 수 있다. 보다 바람직하게, 기계학습 모델은 트리 기반 기계학습 알고리즘일 수 있다.The prostate cancer risk calculation model generating device 110 generates a risk calculation model for calculating a prostate cancer risk and/or a clinically meaningful prostate cancer risk by learning a machine learning model based on the collected learning data ( 530 ). . According to one embodiment, the machine learning model is a tree-based machine learning model (e.g., XGboost (Extreme Gradient Boost), ADAboost (Adaptive Boost) or Light GBM (Light Gradient Boost Machine), etc.), deep learning, K-nearest neighbor, Naive Bayes Classification, Neural Networks (eg, feed-forward neural network (FFNN), etc.), Support Vector Machines, etc. may be included. More preferably, the machine learning model may be a tree-based machine learning algorithm.

위험도 산출 모델은 전립선암 위험도 및 임상적으로 의미있는 전립선암 위험도를 산출하는 하나의 통합 위험도 산출 모델일 수 있다. 또는, 위험도 산출 모델은 전립선암 위험도를 산출하는 제1 위험도 산출 모델 및 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 포함할 수도 있다.The risk calculation model may be one integrated risk calculation model that calculates a prostate cancer risk and a clinically meaningful prostate cancer risk. Alternatively, the risk calculation model may include a first risk calculation model for calculating the risk of prostate cancer and a second risk calculation model for calculating a clinically meaningful risk of prostate cancer.

예를 들면, 전립선암 위험도 산출 모델 생성 장치(110)는 다수의 환자들에 대한 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이들에 대응하는 전립선암 진단 결과 및 임상적으로 의미있는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도 및 임상적으로 의미있는 전립선암 위험도를 산출하는 하나의 통합 위험도 산출 모델을 생성할 수 있다.For example, the prostate cancer risk calculation model generating apparatus 110 may include age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, and prostate for a plurality of patients. Prostate cancer risk and clinically meaningful prostate cancer risk by training a machine learning model based on metastatic area volume and ultrasound image of hypoechoic lesions, and corresponding prostate cancer diagnosis results and clinically meaningful prostate cancer diagnosis results It is possible to create a single integrated risk calculation model that calculates .

다른 예를 들면, 전립선암 위험도 산출 모델 생성 장치(110)는 다수의 환자들에 대한 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이들에 대응하는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도를 산출하는 제1 위험도 산출 모델을 생성할 수 있다.For another example, the prostate cancer risk calculation model generating device 110 may include age, number of prostate biopsies for a plurality of patients, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, A first risk calculation model for calculating the risk of prostate cancer may be generated by training a machine learning model based on the prostate metastasis region volume and the ultrasound image of the hypoechoic lesion, and the prostate cancer diagnosis result corresponding thereto.

또 다른 예를 들면, 전립선암 위험도 산출 모델 생성 장치(110)는 다수의 환자들에 대한 연령, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이들에 대응하는 임상적으로 의미있는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 생성할 수 있다.For another example, the prostate cancer risk calculation model generating device 110 may include age, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, and prostate metastasis region volume for a plurality of patients. And it is possible to generate a second risk calculation model that calculates a clinically meaningful prostate cancer risk by training a machine learning model based on the ultrasound image of the hypoechoic lesion and the clinically meaningful prostate cancer diagnosis result corresponding to them. there is.

한편, 일 실시예에 따르면, 전립선암 위험도 산출 모델 생성 장치(110)는 위험도 산출 모델 생성 과정(530)에서 기계학습 모델의 하이퍼 파라미터를 최적화할 수 있다. 예컨대, 전립선암 위험도 산출 모델 생성 장치(110)는 베이지안 최적화(Bayesizan Optimization) 알고리즘을 통해 기계학습 모델의 하이퍼 파라미터를 최적화할 수 있다.Meanwhile, according to an embodiment, the apparatus 110 for generating a prostate cancer risk calculation model may optimize hyperparameters of the machine learning model in the risk calculation model generation process 530 . For example, the prostate cancer risk calculation model generating apparatus 110 may optimize the hyperparameter of the machine learning model through a Bayesian optimization algorithm.

도 6은 일 실시예에 따른 전립선암 위험도 산출 방법을 도시한 도면이다.6 is a diagram illustrating a method for calculating the risk of prostate cancer according to an embodiment.

도 6의 전립선암 위험도 산출 방법은 도 3의 전립선암 위험도 산출 장치(120)에 의해 수행될 수 있다.The method of calculating the risk of prostate cancer of FIG. 6 may be performed by the apparatus 120 of calculating the risk of prostate cancer of FIG. 3 .

도 3 및 도 6을 참조하면, 전립선암 위험도 산출 장치(120)는 사용자로부터 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출에 이용되는 피험자의 임상 정보를 입력받는다(610). 임상 정보는 전술한 바와 같이, 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피, 초음파상 저에코 병변 등을 포함할 수 있다.3 and 6 , the prostate cancer risk calculating device 120 receives, from a user, clinical information of a subject used to calculate a prostate cancer risk and/or a clinically meaningful prostate cancer risk ( 610 ). Clinical information, as described above, may include age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, ultrasound hypoechoic lesion, etc. can

전립선암 위험도 산출 장치(120)는 입력된 피험자의 임상 정보와 기 저장된 위험도 산출 모델을 이용하여 피험자의 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출한다(620). 보다 구체적으로 전립선암 위험도 산출 장치(120)는 피험자의 임상 정보를 위험도 산출 모델에 입력하여 피험자의 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출할 수 있다.The prostate cancer risk calculation apparatus 120 calculates the subject's prostate cancer risk and/or a clinically meaningful prostate cancer risk by using the inputted clinical information of the subject and a pre-stored risk calculation model ( 620 ). More specifically, the prostate cancer risk calculating device 120 may input the subject's clinical information into the risk calculation model to calculate the subject's prostate cancer risk and/or a clinically meaningful prostate cancer risk.

예를 들면, 전립선암 위험도 산출 장치(120)는 하나의 통합 위험도 산출 모델을 이용하여 피험자의 전립선암 위험도 및 임상적으로 의미있는 전립선암 위험도를 산출할 수 있다. 다른 예를 들면, 전립선암 위험도 산출 장치(120)는 제1 위험도 산출 모델을 이용하여 피험자의 전립선암 위험도를 산출할 수 있다. 또 다른 예를 들면, 전립선암 위험도 산출 장치(120)는 제2 위험도 산출 모델을 이용하여 피험자의 임상적으로 의미있는 전립선암 위험도를 산출할 수 있다.For example, the prostate cancer risk calculation apparatus 120 may calculate a subject's prostate cancer risk and a clinically meaningful risk of prostate cancer by using one integrated risk calculation model. In another example, the prostate cancer risk calculating apparatus 120 may calculate the subject's prostate cancer risk by using the first risk calculating model. As another example, the prostate cancer risk calculating apparatus 120 may calculate a clinically meaningful risk of prostate cancer of the subject by using the second risk calculating model.

도 7은 다른 실시예에 따른 전립선암 위험도 산출 방법을 도시한 도면이다.7 is a diagram illustrating a method for calculating the risk of prostate cancer according to another embodiment.

도 7의 전립선암 위험도 산출 방법은 도 4의 전립선암 위험도 산출 장치(400)에 의해 수행될 수 있다.The method of calculating the risk of prostate cancer of FIG. 7 may be performed by the apparatus 400 of calculating the risk of prostate cancer of FIG. 4 .

도 4 및 도 7을 참조하면, 전립선암 위험도 산출 장치(400)는 사용자로부터 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출에 이용되는 피험자의 임상 정보를 입력받는다(710). Referring to FIGS. 4 and 7 , the prostate cancer risk calculation apparatus 400 receives, from a user, clinical information of a subject used to calculate a prostate cancer risk and/or a clinically meaningful risk of prostate cancer ( 710 ).

전립선암 위험도 산출 장치(400)는 입력된 피험자의 임상 정보와 기 저장된 위험도 산출 모델을 이용하여 피험자의 전립선암 위험도 및/또는 임상적으로 의미있는 전립선암 위험도를 산출한다(720).The prostate cancer risk calculating apparatus 400 calculates the subject's prostate cancer risk and/or a clinically meaningful prostate cancer risk by using the inputted clinical information of the subject and a pre-stored risk calculation model (S720).

전립선암 위험도 산출 장치(400)는 피험자의 조직 검사 결과 최종 판단된 전립선암 진단 결과 및/또는 임상적으로 의미있는 전립선암 진단 결과를 사용자로부터 피드백으로 입력받는다(730). The prostate cancer risk calculation apparatus 400 receives, as a feedback, from a user a final prostate cancer diagnosis result and/or a clinically meaningful prostate cancer diagnosis result as a result of a biopsy of a subject (operation 730).

전립선암 위험도 산출 장치(400)는 단계 710에서 입력받은 피험자의 임상 정보와, 단계 730에서 입력받은 전립선암 진단 결과 및/또는 임상적으로 의미있는 전립선암 진단 결과를 기반으로 기 저장된 위험도 산출 모델을 갱신한다(740). 예컨대, 전립선암 위험도 산출 장치(400)는 피험자의 임상 정보와, 전립선암 진단 결과 및/또는 임상적으로 의미있는 전립선암 진단 결과를 새로운 학습 데이터로 하여, 기 저장된 위험도 산출 모델을 추가 학습시킬 수 있다.The prostate cancer risk calculation device 400 generates a pre-stored risk calculation model based on the subject's clinical information input in step 710 and the prostate cancer diagnosis result and/or clinically meaningful prostate cancer diagnosis result input in step 730. update (740). For example, the prostate cancer risk calculation apparatus 400 may additionally train a pre-stored risk calculation model by using the subject's clinical information, a prostate cancer diagnosis result and/or a clinically meaningful prostate cancer diagnosis result as new learning data. there is.

본 발명의 일 양상은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있다. 상기의 프로그램을 구현하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함할 수 있다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 디스크 등을 포함할 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드로 작성되고 실행될 수 있다.An aspect of the present invention may be implemented as computer-readable codes on a computer-readable recording medium. Codes and code segments implementing the above program can be easily inferred by a computer programmer in the art. The computer-readable recording medium may include any type of recording device in which data readable by a computer system is stored. Examples of the computer-readable recording medium may include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical disk, and the like. In addition, the computer-readable recording medium may be distributed in network-connected computer systems, and may be written and executed as computer-readable codes in a distributed manner.

이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 따라서, 본 발명의 범위는 전술한 실시 예에 한정되지 않고 특허 청구범위에 기재된 내용과 동등한 범위 내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.So far, the present invention has been looked at with respect to preferred embodiments thereof. Those of ordinary skill in the art to which the present invention pertains will understand that the present invention can be implemented in a modified form without departing from the essential characteristics of the present invention. Accordingly, the scope of the present invention is not limited to the above-described embodiments and should be construed to include various embodiments within the scope equivalent to the content described in the claims.

[실험예][Experimental example]

환자 3791명의 임상 정보를 수집하였다. 수집된 임상 정보에는 연령, 전립선 조직 검사 횟수, 체질량지수(BMI), 혈청 크레아티닌 레벨, 직장 수지 검사의 이상(abnormality in digital rectal exam), 혈청 전립선 특이 항원 수치(serum PSA level), 혈청 유리 전립선 특이 항원 수치(serum free PSA level), 혈청 테스토스테론 수치(serum testosterone level), 총 전립선 부피(total prostate volume), 전립선 전이 영역 부피(prostate transitional zone volume) 및 초음파상 저에코 병변(hypoechoic lesion on ultrasonography) 등 총 11가지 특징들이 포함되었다.Clinical information was collected from 3791 patients. Collected clinical information includes age, number of prostate biopsies, body mass index (BMI), serum creatinine level, abnormality in digital rectal exam, serum PSA level, serum free prostate specific Antigen level (serum free PSA level), serum testosterone level (serum testosterone level), total prostate volume (total prostate volume), prostate transitional zone volume (prostate transitional zone volume) and hypoechoic lesion on ultrasonography (hypoechoic lesion on ultrasonography), etc. A total of 11 features were included.

수집된 임상 정보를 랜덤하게 분할하여 2843명의 임상 정보를 학습 세트로서 위험도 산출 모델 생성에 이용하고, 948명의 임상 정보를 검증 세트로서 위험도 산출 모델의 성능 검증에 이용하였다.The collected clinical information was randomly divided, and the clinical information of 2843 people was used as a training set to generate a risk calculation model, and clinical information of 948 people was used as a validation set to verify the performance of the risk calculation model.

라쏘(least absolute shrinkage and selection operator, LASSO) 회귀 및 벌점화 우도 기법(penalized likelihood)을 이용하여 학습 세트의 11가지 특징들 중 전립선암에 독립적으로 영향을 미치는 특징과 임상적으로 의미있는 전립선암에 독립적으로 영향을 미치는 특징을 확인하였다.Among the 11 features of the training set using the least absolute shrinkage and selection operator (LASSO) regression and penalized likelihood technique, the features independently affecting prostate cancer and clinically meaningful Independently influencing characteristics were identified.

그 결과, 전립선암에 독립적으로 영향을 미치는 특징으로 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피, 초음파상 저에코 병변 총 8가지 특징들이 확인되었으며, 임상적으로 의미있는 전립선암에 독립적으로 영향을 미치는 특징으로 연령, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피, 초음파상 저에코 병변 총 7가지 특징들이 확인되었다.As a result, the characteristics that independently affect prostate cancer include age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound low echo. A total of 8 lesion characteristics were identified, and the characteristics independently affecting clinically significant prostate cancer were age, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, and prostate metastasis area. A total of seven characteristics of the hypoechoic lesion were identified on volume and ultrasound.

수집된 임상 정보들에서 결측값은 다중 대치 알고리즘인 MissForest를 이용하여 대치한 후, 위험도 산출 모델의 개발을 위해 트리 기반 기계학습 알고리즘인 XGBoost 모델을 선택하였다.In the collected clinical information, missing values were imputed using MissForest, a multiple imputation algorithm, and then the tree-based machine learning algorithm XGBoost model was selected to develop a risk calculation model.

학습 세트의 8가지 특징(연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피, 초음파상 저에코 병변)을 이용하여 XGBoost 모델을 학습시켜 전립선암 위험도를 산출하는 제1 위험도 산출 모델을 생성하고, 학습 세트의 7가지 특징(연령, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피, 초음파상 저에코 병변)을 이용하여 XGBoost 모델을 학습시켜 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 생성하였다. 제1 위험도 산출 모델 및 제2 위험도 산출 모델을 생성하는 과정에서 XGBoost 모델의 하이퍼파라미터를 베이지안 최적화를 통해 최적화하였다.XGBoost using the 8 features of the training set (age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesion) Train the model to generate a first risk calculation model to calculate prostate cancer risk, and set the seven characteristics of the training set (age, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate The XGBoost model was trained using the metastasis area volume and ultrasonographic hypoechoic lesion) to generate a second risk calculation model that calculates a clinically meaningful prostate cancer risk. In the process of generating the first risk calculation model and the second risk calculation model, the hyperparameters of the XGBoost model were optimized through Bayesian optimization.

제1 위험도 산출 모델 및 제2 위험도 산출 모델 생성 후 검증 세트를 이용하여 제1 위험도 산출 모델 및 제2 위험도 산출 모델의 성능을 검증하고, 각 특징의 중요도를 평가하였다. 모델 성능의 검증은 수신기 작동 특성 커브(receiver operating Characteristic(ROC) Curve)의 곡선하면적(area under the curve, AUC)를 이용하고, 각 모델별 각 특징의 중요도 평가는 샤플리 값(Shapley value)을 이용하였다.After the first risk calculation model and the second risk calculation model are created, the performance of the first risk calculation model and the second risk calculation model were verified using the verification set, and the importance of each feature was evaluated. The verification of model performance uses the area under the curve (AUC) of the receiver operating characteristic curve (ROC), and the evaluation of the importance of each feature for each model uses the Shapley value. was used.

도 8은 실험예에 따른 제1 위험도 산출 모델의 성능을 도시한 도면이고, 도 9는 실험예에 따른 제2 위험도 산출 모델의 성능을 도시한 도면이다.8 is a diagram illustrating the performance of the first risk calculation model according to the experimental example, and FIG. 9 is a diagram illustrating the performance of the second risk calculation model according to the experimental example.

도 8을 참조하면, 제1 위험도 산출 모델의 ROC Curve의 AUC는 0.869이고, 도 9를 참조하면, 제2 위험도 산출 모델의 ROC Curve의 AUC는 0.945임을 알 수 있다. 즉 검증 세트로 제1 위험도 산출 모델 및 제2 위험도 산출 모델을 검증한 결과, 제1 위험도 산출 모델 및 제2 위험도 산출 모델 모두 매우 높은 성능을 보임을 알 수 있다.Referring to FIG. 8 , it can be seen that the AUC of the ROC Curve of the first risk calculation model is 0.869, and referring to FIG. 9 , it can be seen that the AUC of the ROC Curve of the second risk calculation model is 0.945. That is, as a result of verifying the first risk calculation model and the second risk calculation model with the verification set, it can be seen that both the first risk calculation model and the second risk calculation model show very high performance.

도 10은 실험예에 따른 제1 위험도 산출 모델에서 각 특징의 중요도를 도시한 도면이고, 도 11은 실험예에 따른 제2 위험도 산출 모델에서 각 특징의 중요도를 도시한 도면이다.10 is a diagram illustrating the importance of each feature in the first risk calculation model according to the experimental example, and FIG. 11 is a diagram illustrating the importance of each feature in the second risk calculation model according to the experimental example.

도 10을 참조하면, 제1 위험도 산출 모델 즉, 전립선암 위험도를 산출할 때 가장 중요한 파라미터는 혈청 전립선 특이 항원 수치(PSA)이고, 그 뒤로 연령(Age), 전립선 전이 영역 부피(TZ_Vol), 총 전립선 부피(Total_Vol), 혈청 테스토스테론 수치(Testosterone), 초음파상 저에코 병변(HypoE), 전립선 조직 검사 횟수(Bx_N) 및 혈청 유리 전립선 특이 항원 수치(fPSA)가 순차적으로 따른다는 것을 알 수 있다.Referring to FIG. 10 , the first risk calculation model, that is, the most important parameter when calculating the risk of prostate cancer is the serum prostate-specific antigen level (PSA), followed by age (Age), prostate metastasis area volume (TZ_Vol), and total It can be seen that prostate volume (Total_Vol), serum testosterone level (Testosterone), ultrasonographic hypoechoic lesion (HypoE), number of prostate biopsies (Bx_N), and serum free prostate-specific antigen level (fPSA) follow sequentially.

도 11을 참조하면, 제2 위험도 산출 모델 즉, 임상적으로 의미있는 전립선암 위험도를 산출할 때 가장 중요한 파라미터는 혈청 전립선 특이 항원 수치(PSA)이고, 그 뒤로 총 전립선 부피(Total_Vol), 연령(Age), 초음파상 저에코 병변(HypoE), 전립선 전이 영역 부피(TZ_Vol), 혈청 테스토스테론 수치(Testosterone) 및 혈청 유리 전립선 특이 항원 수치(fPSA)가 순차적으로 따른다는 것을 알 수 있다.Referring to FIG. 11 , the second risk calculation model, that is, the most important parameter when calculating the clinically meaningful risk of prostate cancer is the serum prostate-specific antigen level (PSA), followed by total prostate volume (Total_Vol), age ( Age), ultrasonographic hypoechoic lesion (HypoE), prostate metastasis area volume (TZ_Vol), serum testosterone level (Testosterone), and serum free prostate-specific antigen level (fPSA) sequentially follow.

도 12는 PSA가 3-10인 그룹에 대한 제1 위험도 산출 모델의 성능을 도시한 도면이고, 도 13은 PSA가 10-20인 그룹에 대한 제1 위험도 산출 모델의 성능을 도시한 도면이고, 도 14는 PSA가 3-10인 그룹에 대한 제2 위험도 산출 모델의 성능을 도시한 도면이고, 도 15은 PSA가 10-20인 그룹에 대한 제2 위험도 산출 모델의 성능을 도시한 도면이다.12 is a diagram illustrating the performance of the first risk calculation model for the group having a PSA of 3-10, and FIG. 13 is a diagram illustrating the performance of the first risk calculation model for the group having a PSA of 10-20. 14 is a diagram illustrating the performance of the second risk calculation model for the group having a PSA of 3-10, and FIG. 15 is a diagram illustrating the performance of the second risk calculation model for the group having a PSA of 10-20.

도 12 및 도 13을 참조하면, PSA가 3-10인 그룹에 대한 제1 위험도 산출 모델의 ROC Curve의 AUC는 0.827이고(도 12 참조), PSA가 10-20인 그룹에 대한 제1 위험도 산출 모델의 ROC Curve의 AUC는 0.846임(도 13 참조)을 알 수 있다.12 and 13 , the AUC of the ROC Curve of the first risk calculation model for the group having a PSA of 3-10 is 0.827 (see FIG. 12 ), and the first risk calculation for the group having a PSA of 10-20 It can be seen that the AUC of the ROC Curve of the model is 0.846 (see FIG. 13).

도 14 및 도 15를 참조하면, PSA가 3-10인 그룹에 대한 제2 위험도 산출 모델의 ROC Curve의 AUC는 0.926이고(도 14 참조), PSA가 10-20인 그룹에 대한 제2 위험도 산출 모델의 ROC Curve의 AUC는 0.891임(도 15 참조)을 알 수 있다.14 and 15 , the AUC of the ROC Curve of the second risk calculation model for the group having a PSA of 3-10 is 0.926 (see FIG. 14 ), and the second risk calculation for the group having a PSA of 10-20 It can be seen that the AUC of the ROC Curve of the model is 0.891 (see FIG. 15 ).

즉, 임상적으로 중요한 범위인 PSA 3-10과 PSA 10-20에서 제1 위험도 산출 모델과 제2 위험도 산출 모델을 검증한 결과, 제1 위험도 산출 모델과 제2 위험도 산출 모델 모두 매우 높은 성능을 보임을 알 수 있다.That is, as a result of verifying the first risk calculation model and the second risk calculation model in the clinically important ranges PSA 3-10 and PSA 10-20, both the first risk calculation model and the second risk calculation model showed very high performance. it can be seen that

100: 전립선암 위험도 예측 시스템
110: 전립선암 위험도 모델 생성 장치
120, 400: 전립선암 위험도 산출 장치
210: 학습 데이터 수집부
220: 모델 생성부
310: 데이터 입력부
320: 저장부
330: 위험도 산출부
410: 피드백 입력부
420: 모델 갱신부
430: 통신부
440: 출력부
100: Prostate Cancer Risk Prediction System
110: Prostate cancer risk model generating device
120, 400: Prostate cancer risk calculation device
210: learning data collection unit
220: model generation unit
310: data input unit
320: storage
330: risk calculation unit
410: feedback input unit
420: model update
430: communication unit
440: output unit

Claims (20)

피험자의 임상 정보를 입력받는 데이터 입력부; 및
기계학습 기반의 위험도 산출 모델을 이용하여 상기 임상 정보로부터 상기 피험자의 전립선암 위험도 또는 임상적으로 의미있는 전립선암 위험도를 산출하는 위험도 산출부; 를 포함하고,
상기 임상 정보는 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변을 포함하는,
전립선암 위험도 산출 장치.
a data input unit for receiving clinical information of a subject; and
a risk calculator for calculating a risk of prostate cancer or a clinically meaningful risk of prostate cancer of the subject from the clinical information using a machine learning-based risk calculation model; including,
The clinical information includes age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesion,
Prostate cancer risk calculator.
제1항에 있어서,
상기 위험도 산출 모델은 트리 기반 기계학습 알고리즘을 이용하여 미리 생성되는,
전립선암 위험도 산출 장치.
According to claim 1,
The risk calculation model is generated in advance using a tree-based machine learning algorithm,
Prostate cancer risk calculator.
제2항에 있어서,
상기 트리 기반 기계학습 알고리즘은 XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost), Light GBM(Light Gradient Boost Machine)을 포함하는,
전립선암 위험도 산출 장치.
3. The method of claim 2,
The tree-based machine learning algorithm includes XGboost (Extreme Gradient Boost), ADAboost (Adaptive Boost), Light GBM (Light Gradient Boost Machine),
Prostate cancer risk calculator.
제1항에 있어서,
상기 위험도 산출 모델은 전립선암 위험도를 산출하는 제1 위험도 산출 모델과 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 포함하는,
전립선암 위험도 산출 장치.
According to claim 1,
The risk calculation model includes a first risk calculation model for calculating the risk of prostate cancer and a second risk calculation model for calculating a clinically meaningful risk of prostate cancer,
Prostate cancer risk calculator.
제1항에 있어서,
상기 피험자의 조직 검사 결과 최종 판단된 전립선암 진단 결과 또는 임상적으로 의미있는 전립선암 진단 결과를 피드백으로 입력받는 피드백 입력부; 및
상기 피드백과 상기 임상 정보를 기반으로 상기 위험도 산출 모델을 갱신하는 모델 갱신부; 를 더 포함하는,
전립선암 위험도 산출 장치.
According to claim 1,
a feedback input unit receiving, as feedback, a final prostate cancer diagnosis result or a clinically meaningful prostate cancer diagnosis result as a result of a biopsy of the subject; and
a model updater for updating the risk calculation model based on the feedback and the clinical information; further comprising,
Prostate cancer risk calculator.
다수 환자들에 대한 임상 정보와, 그에 대응하는 전립선암 진단 결과 또는 임상적으로 의미있는 전립선암 진단 결과를 학습 데이터로 수집하는 학습 데이터 수집부; 및
상기 수집된 학습 데이터를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도 또는 임상적으로 의미있는 전립선암 위험도를 산출하는 위험도 산출 모델을 생성하는 모델 생성부; 를 포함하고,
상기 임상 정보는 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변을 포함하는
전립선암 위험도 산출 모델 생성 장치.
a learning data collection unit that collects clinical information about multiple patients and a corresponding prostate cancer diagnosis result or a clinically meaningful prostate cancer diagnosis result as learning data; and
a model generator for generating a risk calculation model for calculating a prostate cancer risk or a clinically meaningful prostate cancer risk by learning a machine learning model based on the collected learning data; including,
The clinical information includes age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesion.
Prostate cancer risk estimation model generation device.
제6항에 있어서,
상기 학습 데이터 수집부는 상기 수집된 임상 정보에 결측치가 존재하면 다중 대치 알고리즘을 이용하여 상기 결측치를 처리하는,
전립선암 위험도 산출 모델 생성 장치.
7. The method of claim 6,
The learning data collection unit processes the missing values using a multiple imputation algorithm when there is a missing value in the collected clinical information,
Prostate cancer risk estimation model generation device.
제6항에 있어서,
상기 기계학습 모델은 트리 기반 기계학습 모델인,
전립선암 위험도 산출 모델 생성 장치.
7. The method of claim 6,
The machine learning model is a tree-based machine learning model,
Prostate cancer risk estimation model generation device.
제8항에 있어서,
상기 트리 기반 기계학습 모델은 XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost), Light GBM(Light Gradient Boost Machine)을 포함하는,
전립선암 위험도 산출 모델 생성 장치.
9. The method of claim 8,
The tree-based machine learning model includes XGboost (Extreme Gradient Boost), ADAboost (Adaptive Boost), Light GBM (Light Gradient Boost Machine),
Prostate cancer risk estimation model generation device.
제6항에 있어서,
상기 모델 생성부는,
연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이에 대응하는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도를 산출하는 제1 위험도 산출 모델을 생성하고,
연령, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이에 대응하는 임상적으로 의미있는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 생성하는,
전립선암 위험도 산출 모델 생성 장치.
7. The method of claim 6,
The model generation unit,
Based on age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesions and corresponding prostate cancer diagnosis results. Create a first risk calculation model that calculates the risk of prostate cancer by training the machine learning model,
Based on age, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume and ultrasonographic hypoechoic lesion, and corresponding clinically meaningful prostate cancer diagnosis results. Generating a second risk calculation model that calculates a clinically meaningful prostate cancer risk by training the machine learning model,
Prostate cancer risk estimation model generation device.
전립선암 위험도 산출 장치의 전립선암 위험도 산출 방법에 있어서,
피험자의 임상 정보를 입력받는 단계; 및
기계학습 기반의 위험도 산출 모델을 이용하여 상기 임상 정보로부터 상기 피험자의 전립선암 위험도 또는 임상적으로 의미있는 전립선암 위험도를 산출하는 단계; 를 포함하고,
상기 임상 정보는 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변을 포함하는,
전립선암 위험도 산출 방법.
In the prostate cancer risk calculation method of the prostate cancer risk calculation device,
receiving clinical information of a subject; and
calculating a risk of prostate cancer or a clinically meaningful risk of prostate cancer of the subject from the clinical information using a machine learning-based risk calculation model; including,
The clinical information includes age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesion,
Methods for calculating prostate cancer risk.
제11항에 있어서,
상기 위험도 산출 모델은 트리 기반 기계학습 알고리즘을 이용하여 미리 생성되는,
전립선암 위험도 산출 방법.
12. The method of claim 11,
The risk calculation model is generated in advance using a tree-based machine learning algorithm,
Methods for calculating prostate cancer risk.
제12항에 있어서,
상기 트리 기반 기계학습 알고리즘은 XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost), Light GBM(Light Gradient Boost Machine)을 포함하는,
전립선암 위험도 산출 방법.
13. The method of claim 12,
The tree-based machine learning algorithm includes XGboost (Extreme Gradient Boost), ADAboost (Adaptive Boost), Light GBM (Light Gradient Boost Machine),
Methods for calculating prostate cancer risk.
제11항에 있어서,
상기 위험도 산출 모델은 전립선암 위험도를 산출하는 제1 위험도 산출 모델과 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 포함하는,
전립선암 위험도 산출 방법.
12. The method of claim 11,
The risk calculation model includes a first risk calculation model for calculating the risk of prostate cancer and a second risk calculation model for calculating a clinically meaningful risk of prostate cancer,
Methods for calculating prostate cancer risk.
제11항에 있어서,
상기 피험자의 조직 검사 결과 최종 판단된 전립선암 위험도 산출 결과 또는 임상적으로 의미있는 전립선암 위험도 산출 결과를 피드백으로 입력받는 단계; 및
상기 피드백과 상기 임상 정보를 기반으로 상기 위험도 산출 모델을 갱신하는 단계; 를 더 포함하는,
전립선암 위험도 산출 방법.
12. The method of claim 11,
receiving, as a feedback, a result of a final determined prostate cancer risk calculation result or a clinically meaningful prostate cancer risk calculation result as a result of a biopsy of the subject; and
updating the risk calculation model based on the feedback and the clinical information; further comprising,
Methods for calculating prostate cancer risk.
전립선암 위험도 산출 모델 생성 장치의 전립선암 위험도 산출 모델 생성 방법에 있어서,
다수 환자들에 대한 임상 정보와, 그에 대응하는 전립선암 진단 결과 또는 임상적으로 의미있는 전립선암 진단 결과를 학습 데이터로 수집하는 단계; 및
상기 수집된 학습 데이터를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도 또는 임상적으로 의미있는 전립선암 위험도를 산출하는 위험도 산출 모델을 생성하는 단계; 를 포함하고,
상기 임상 정보는 연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변을 포함하는,
전립선암 위험도 산출 모델 생성 방법.
In the prostate cancer risk calculation model generation method of the prostate cancer risk calculation model generation apparatus,
collecting clinical information on multiple patients and corresponding prostate cancer diagnosis results or clinically meaningful prostate cancer diagnosis results as learning data; and
generating a risk calculation model for calculating a prostate cancer risk or a clinically meaningful prostate cancer risk by learning a machine learning model based on the collected learning data; including,
The clinical information includes age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesion,
A method for generating a prostate cancer risk estimation model.
제16항에 있어서,
상기 수집된 임상 정보에 결측치가 존재하면 다중 대치 알고리즘을 이용하여 상기 결측치를 처리하는 단계; 를 더 포함하는,
전립선암 위험도 산출 모델 생성 방법.
17. The method of claim 16,
processing the missing value by using a multiple imputation algorithm if there is a missing value in the collected clinical information; further comprising,
A method for generating a prostate cancer risk estimation model.
제16항에 있어서,
상기 기계학습 모델은 트리 기반 기계학습 모델인,
전립선암 위험도 산출 모델 생성 방법.
17. The method of claim 16,
The machine learning model is a tree-based machine learning model,
A method for generating a prostate cancer risk estimation model.
제18항에 있어서,
상기 트리 기반 기계학습 모델은 XGboost(Extreme Gradient Boost), ADAboost(Adaptive Boost), Light GBM(Light Gradient Boost Machine)을 포함하는,
전립선암 위험도 산출 모델 생성 방법.
19. The method of claim 18,
The tree-based machine learning model includes XGboost (Extreme Gradient Boost), ADAboost (Adaptive Boost), Light GBM (Light Gradient Boost Machine),
A method for generating a prostate cancer risk estimation model.
제16항에 있어서,
상기 위험도 산출 모델을 생성하는 단계는,
연령, 전립선 조직 검사 횟수, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이에 대응하는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 전립선암 위험도를 산출하는 제1 위험도 산출 모델을 생성하는 단계; 및
연령, 혈청 전립선 특이 항원 수치, 혈청 유리 전립선 특이 항원 수치, 혈청 테스토스테론 수치, 총 전립선 부피, 전립선 전이 영역 부피 및 초음파상 저에코 병변과, 이에 대응하는 임상적으로 의미있는 전립선암 진단 결과를 기반으로 기계학습 모델을 학습시켜 임상적으로 의미있는 전립선암 위험도를 산출하는 제2 위험도 산출 모델을 생성하는 단계; 를 포함하는,
전립선암 위험도 산출 모델 생성 방법.
17. The method of claim 16,
The step of generating the risk calculation model includes:
Based on age, number of prostate biopsies, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume, and ultrasound hypoechoic lesions and corresponding prostate cancer diagnosis results. generating a first risk calculation model for calculating the risk of prostate cancer by learning the machine learning model; and
Based on age, serum prostate-specific antigen level, serum free prostate-specific antigen level, serum testosterone level, total prostate volume, prostate metastasis area volume and ultrasonographic hypoechoic lesion, and corresponding clinically meaningful prostate cancer diagnosis results. generating a second risk calculation model for calculating a clinically meaningful prostate cancer risk by learning the machine learning model; containing,
A method for generating a prostate cancer risk estimation model.
KR1020200116339A 2020-09-10 2020-09-10 Apparatus and method for calculating risk of prostate cancer based on machine learning, Apparatus and method for generating risk calculation model of prostate cancer based on machine learning KR102515437B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200116339A KR102515437B1 (en) 2020-09-10 2020-09-10 Apparatus and method for calculating risk of prostate cancer based on machine learning, Apparatus and method for generating risk calculation model of prostate cancer based on machine learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200116339A KR102515437B1 (en) 2020-09-10 2020-09-10 Apparatus and method for calculating risk of prostate cancer based on machine learning, Apparatus and method for generating risk calculation model of prostate cancer based on machine learning

Publications (2)

Publication Number Publication Date
KR20220033906A true KR20220033906A (en) 2022-03-17
KR102515437B1 KR102515437B1 (en) 2023-03-29

Family

ID=80936189

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200116339A KR102515437B1 (en) 2020-09-10 2020-09-10 Apparatus and method for calculating risk of prostate cancer based on machine learning, Apparatus and method for generating risk calculation model of prostate cancer based on machine learning

Country Status (1)

Country Link
KR (1) KR102515437B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100021804A (en) * 2008-08-18 2010-02-26 재단법인서울대학교산학협력재단 Method and apparatus of diagnosing prostate cancer
KR20190110381A (en) * 2018-03-20 2019-09-30 딜로이트컨설팅유한회사 Apparatus and method for predicting result of clinical trial
KR102102848B1 (en) * 2019-06-12 2020-04-22 주식회사 프로카젠 Prostate cancer risk score calculator, and method of the above calculator

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100021804A (en) * 2008-08-18 2010-02-26 재단법인서울대학교산학협력재단 Method and apparatus of diagnosing prostate cancer
KR20190110381A (en) * 2018-03-20 2019-09-30 딜로이트컨설팅유한회사 Apparatus and method for predicting result of clinical trial
KR102102848B1 (en) * 2019-06-12 2020-04-22 주식회사 프로카젠 Prostate cancer risk score calculator, and method of the above calculator

Also Published As

Publication number Publication date
KR102515437B1 (en) 2023-03-29

Similar Documents

Publication Publication Date Title
Doppalapudi et al. Lung cancer survival period prediction and understanding: Deep learning approaches
US10095684B2 (en) Trained data input system
CN109378065A (en) Medical data processing method and processing device, storage medium, electronic equipment
Castanho et al. Fuzzy expert system for predicting pathological stage of prostate cancer
Dhanya et al. A comparative study for breast cancer prediction using machine learning and feature selection
Sharma et al. Machine learning approaches for breast cancer diagnosis and prognosis
Jacob et al. Discovery of knowledge patterns in clinical data through data mining algorithms: Multi-class categorization of breast tissue data
Zhang et al. Machine learning and AI in cancer prognosis, prediction, and treatment selection: a critical approach
Kim et al. Pre-operative prediction of advanced prostatic cancer using clinical decision support systems: accuracy comparison between support vector machine and artificial neural network
CN104335216A (en) Expedited biometric validation
CA3048522C (en) Determining rate of recruitment information concerning a clinical trial
Wen et al. Comparision of four machine learning techniques for the prediction of prostate cancer survivability
Al Alkeem et al. Robust deep identification using ECG and multimodal biometrics for industrial internet of things
Abdelsamea et al. Automated classification of malignant and benign breast cancer lesions using neural networks on digitized mammograms
Agrawal et al. Health services data: big data analytics for deriving predictive healthcare insights
Mysona et al. Applying artificial intelligence to gynecologic oncology: a review
Esce et al. Lymph node metastases in papillary thyroid carcinoma can be predicted by a convolutional neural network: a multi-institution study
Shah et al. Evaluation of deep learning techniques for identification of sarcoma-causing carcinogenic mutations
KR20200027148A (en) System and method for pathological staging of prostate cancer based on Deep Belief Network and Dempster-Shafer theory
KR102515437B1 (en) Apparatus and method for calculating risk of prostate cancer based on machine learning, Apparatus and method for generating risk calculation model of prostate cancer based on machine learning
KR20210053064A (en) Method and system for predicting colon cancer related information according to the degree of risk factor of lifestyle information.
KR20210053068A (en) Method and system for predicting colon cancer related information based on lifestyle information
Banerjee et al. Radiogenomics influence on the future of prostate cancer risk stratification
Postawka Exercise recognition using averaged hidden Markov models
Garse et al. Cancer Diagnosis Using Artificial Intelligence (AI) and Internet of Things (IoT)

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right