KR101018665B1 - 전립선암 진단 방법 및 장치 - Google Patents

전립선암 진단 방법 및 장치 Download PDF

Info

Publication number
KR101018665B1
KR101018665B1 KR1020080080419A KR20080080419A KR101018665B1 KR 101018665 B1 KR101018665 B1 KR 101018665B1 KR 1020080080419 A KR1020080080419 A KR 1020080080419A KR 20080080419 A KR20080080419 A KR 20080080419A KR 101018665 B1 KR101018665 B1 KR 101018665B1
Authority
KR
South Korea
Prior art keywords
cancer
value
classifier
probability
input
Prior art date
Application number
KR1020080080419A
Other languages
English (en)
Other versions
KR20100021804A (ko
Inventor
이학종
한석민
최진영
Original Assignee
재단법인서울대학교산학협력재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인서울대학교산학협력재단 filed Critical 재단법인서울대학교산학협력재단
Priority to KR1020080080419A priority Critical patent/KR101018665B1/ko
Publication of KR20100021804A publication Critical patent/KR20100021804A/ko
Application granted granted Critical
Publication of KR101018665B1 publication Critical patent/KR101018665B1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/43Detecting, measuring or recording for evaluating the reproductive systems
    • A61B5/4375Detecting, measuring or recording for evaluating the reproductive systems for evaluating the male reproductive system
    • A61B5/4381Prostate evaluation or disorder diagnosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4842Monitoring progression or stage of a disease
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Abstract

본 발명은 환자의 다양한 임상 정보를 입력하여 전립선암으로 의심되는 확률을 출력함으로써 조직 검사 시행 여부 및 전립선암 발병 진단에 도움을 줄 수 있는 암 진단 방법 및 장치를 제공하는 것을 목적으로 한다. 이를 위하여, 본 발명은 하나 이상의 대상자의 임상 정보 수치 및 암 진행 단계 수치를 포함하는 학습 데이터를 분류기에 입력하는 단계; 분류기에서 상기 학습 데이터를 이용하여 의사결정 하이퍼플레인(decision hyperplane)을 생성하는 단계; 검사 대상자의 임상 정보 수치를 분류기에 입력하는 단계; 분류기에서 입력된 검사 대상자의 임상 정보 수치를 이용하여 검사 대상자의 암 진행 단계 수치를 출력하는 단계; 분류기에서 상기 출력된 암 진행 단계 수치를 의사결정 하이퍼플레인을 기준으로 분류하는 단계; 및 상기 분류기의 출력된 암 진행 단계 수치를 이용하여 검사 대상자가 암에 걸렸을 확률을 계산하는 단계를 포함하는 암 진단 방법 및 그에 사용가능한 진단 장치를 제공한다.

Description

전립선암 진단 방법 및 장치{Method and apparatus of diagnosing prostate cancer}
본 발명은 암 진단 방법 및 장치에 관한 것으로, 보다 상세하게 본 발명은 조직 검사에 앞서 조직 검사를 실행할지 여부에 대한 판단 결과를 제공할 수 있는 암 진단 방법 및 장치에 관한 것이다.
전 세계적으로 암으로 사망하는 사람의 숫자는 현재 연간 600만 명에서 2020년에는 1000만 명으로 늘어 날 것이며, 매년 암에 걸리는 사람 1000만 명도 2020년에는 1500만 명으로 증가할 것으로 세계보건기구는 전망하고 있다. 또한, 전 세계 사망자의 12% 이상이 암 환자이며, 선진국들의 경우 암이 심장병에 이어 사망 원인 2위를 차지하고 있다.
특히, 전립선암은 미국 남성암 발생율의 1위를 차지하고 있으며 미국 남성 암 사망자 수는 폐암에 이어 2위를 차지하고 있는 심각한 암이다.
전립선암 검진에 있어서, 환자가 전립선암에 걸렸는지 아닌지를 알아보는 근 본적이고도 가장 정확한 방법은 전립선 조직검사이다. 그러나, 전립선 조직 검사는 그 시행 과정상 감염의 위험이 있으므로 가능한 그 시행 숫자를 줄여야 한다.
전립선암 조기검진에는 DRE(Digital Rectal Examination)나 PSA(Prostate Specific Antigen) 등의 검사 방법이 흔히 쓰이고 있다. 그러나, DRE는 작은 암 병변을 놓치고 간과하는 경우가 있고, PSA 수치는 전립선 암이 아닌 다른 여러 가지 요인에 의해서도 영향 받을 수 있다는 단점이 있다.
이러한 상황에서 전립선 조직검사를 최소화하기 위한 가능한 해결책은 여러 임상정보를 종합적으로 감안하여 전립선암에 걸렸을 확률이 높은 환자에게만 전립선 조직검사를 시행하는 방법이 있다.
그렇다면 임상정보를 종합적으로 판단할 참고자료가 필요하게 되는데, 불행히도 이런 참고자료는 경험 있는 비뇨기과 또는 영상의학과 숙련의들 머릿속의 학습된 개념의 형태로만 존재하고, 따라서 다양한 임상정보를 종합적으로 고려하여 판단할 때도 진단자의 숙련도와 기술에 많이 의존하게 된다.
본 발명은 상기 종래기술의 문제점을 해결하기 위하여 안출된 것으로, 본 발명의 목적은 환자의 다양한 임상 정보를 입력하여 전립선암으로 의심되는 확률을 출력함으로써 조직 검사 시행 여부 및 전립선암 발병 진단에 도움을 줄 수 있는 암 진단 방법 및 장치를 제공하는 것이다.
상기 본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 본 발명은 하나 이상의 대상자의 임상 정보 수치 및 암 진행 단계 수치를 포함하는 학습 데이터를 분류기에 입력하는 단계; 분류기에서 상기 학습 데이터를 이용하여 의사결정 하이퍼플레인(decision hyperplane)을 생성하는 단계; 검사 대상자의 임상 정보 수치를 분류기에 입력하는 단계; 분류기에서 입력된 검사 대상자의 임상 정보 수치를 이용하여 검사 대상자의 암 진행 단계 수치를 출력하는 단계; 분류기에서 상기 출력된 암 진행 단계 수치를 의사결정 하이퍼플레인을 기준으로 분류하는 단계; 및 상기 분류기의 출력된 암 진행 단계 수치를 이용하여 검사 대상자가 암에 걸렸을 확률을 계산하는 단계를 포함하는 암 진단 방법을 제공한다.
본 발명에 따른 암 진단 방법은 입력된 학습 데이터의 평균값 및 분산값을 계산하여 파일 형태로 저장하는 단계; 및 상기 학습 데이터의 평균값 및 분산값을 이용하여 입력된 검사 대상자의 임상 정보 수치를 정규화시키는 단계를 더 포함할 수 있다.
상기 임상 정보 수치는 검사 대상자의 나이, PSA 수치, DRE 수치, 전립선 부피, 전립선의 TZ-부피 및 TRUS 클래스 중 하나 이상을 포함할 수 있다.
상기 확률 계산 단계는 하기 식에 의해 수행될 수 있다:
Figure 112008058600630-pat00001
상기 식에서, p(1|x)는 암에 걸렸을 확률, p(2|x)는 암이 아닐 확률, 및 f(x)는 분류기의 출력값이다. x는 입력 벡터(input vector), w는 입력 벡터에 곱해지는 가중치 벡터(weight vector), b는 입력 벡터와 가중치 벡터의 곱에 더해지는 바이어스 값(bias value)이다. φ는 wx+b 값에 비선형성(nonlinearity)을 부여하기 위한 커널(kernel)이다.
본 발명에 따른 암 진단 방법은 상기 계산된 확률이 최소 위험도 보다 큰 경우에 조직 검사 시행을 결정하는 단계를 더 포함할 수 있다.
본 발명에 따른 암 진단 방법은 분류기의 문턱값 변화에 따른 민감성과 특이성 변화 그래프인 ROC 곡선을 생성하는 단계를 더 포함할 수 있다.
상기 최소 위험도는 하기 식으로 표현되는 직선이 ROC 곡선과 접하는 경우의 y 절편값이고, 상기 ROC 곡선의 x축 및 y축 변수는 각각 FPR 및 TPR인 것일 수 있다:
Figure 112008058600630-pat00002
상기 식에서, TPR은 진양성률(true positive rate), FPR은 위양성률(false positive rate), Risk는 위험도, 및 α는 학습 데이터에서 암이 아닌 경우와 암인 경우의 비율이다.
상기 암은 전립선암일 수 있다.
또한, 본 발명은 하나 이상의 대상자의 임상 정보 수치 및 암 진행 단계 수치를 포함하는 학습 데이터를 입력하는 제1 입력부; 상기 학습 데이터를 이용하여 의사결정 하이퍼플레인(decision hyperplane)을 생성하는 하이퍼플레인 생성부; 검사 대상자의 임상 정보 수치를 입력하는 제2 입력부; 입력된 검사 대상자의 임상 정보 수치를 이용하여 검사 대상자의 암 진행 단계 수치를 출력하는 암 수치 출력부; 상기 출력된 암 진행 단계 수치를 의사결정 하이퍼플레인을 기준으로 분류하는 분류부; 및 상기 출력된 암 진행 단계 수치를 이용하여 검사 대상자가 암에 걸렸을 확률을 계산하는 확률 계산부를 포함하는 암 진단 장치를 제공한다.
본 발명에 따른 암 진단 장치는 입력된 학습 데이터의 평균값 및 분산값을 계산하여 파일 형태로 저장하는 예비 계산부; 및 상기 학습 데이터의 평균값 및 분산값을 이용하여 입력된 검사 대상자의 임상 정보 수치를 정규화시키는 정규화부를 더 포함할 수 있다.
상기 임상 정보 수치는 검사 대상자의 나이, PSA 수치, DRE 수치, 전립선 부피, 전립선의 TZ-부피 및 TRUS 클래스 중 하나 이상을 포함할 수 있다.
상기 확률 계산부는 하기 식에 의해 확률을 계산하는 것일 수 있다:
Figure 112008058600630-pat00003
상기 식에서, p(1|x)는 암에 걸렸을 확률, p(2|x)는 암이 아닐 확률, 및 f(x)는 분류기의 출력값이다.
본 발명에 따른 암 진단 장치는 상기 계산된 확률이 최소 위험도 보다 큰 경우에 조직 검사 시행을 결정하는 검사 결정부를 더 포함할 수 있다.
본 발명에 따른 암 진단 장치는 분류기의 문턱값 변화에 따른 민감성과 특이성 변화 그래프인 ROC 곡선을 생성하는 ROC 곡선 생성부를 더 포함할 수 있다.
상기 최소 위험도는 하기 식으로 표현되는 직선이 ROC 곡선과 접하는 경우의 y 절편값이고, 상기 ROC 곡선의 x축 및 y축 변수는 각각 FPR 및 TPR일 수 있다:
Figure 112008058600630-pat00004
상기 식에서, TPR은 진양성률(true positive rate), FPR은 위양성률(false positive rate), Risk는 위험도, 및 α는 학습 데이터에서 암이 아닌 경우와 암인 경우의 비율이다.
상기 암은 전립선암일 수 있다.
본 발명의 암 진단 방법 및 장치에 따르면 환자의 다양한 임상 정보를 입력하여 전립선암으로 의심되는 확률을 출력함으로써 조직 검사 시행 여부 및 전립선암 발병 진단에 도움을 줄 수 있다. 따라서, 불필요한 조직 검사 및 그에 따른 부작용을 줄일 수 있을 뿐만 아니라 전문적인 지식이 없더라도 누구나 용이하게 암 발생 여부를 확인할 수 있는 장점을 갖는다.
이하, 첨부된 도면들을 참조하여 본 발명의 바람직한 실시예에 대하여 보다 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 암 진단 장치의 구성을 도시하는 블록도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 암 진단 장치(10)는 입력부(12), 전처리부(14), 분류기(16) 및 후처리부(18)를 포함한다.
입력부(12)는 제1 입력부(121) 및 제2 입력부(123)를 포함한다.
제1 입력부(121)는 하나 이상의 대상자의 임상 정보 수치 및 암 진행 단계 수치를 포함하는 학습 데이터를 입력한다.
상기 임상 정보 수치는 검사 대상자의 나이, PSA 수치, DRE 수치, 전립선 부피, 전립선의 TZ-부피 및 TRUS 클래스 중 하나 이상을 포함할 수 있다.
제2 입력부(123)는 검사 대상자의 임상 정보 수치를 입력한다.
전처리부(14)는 예비 계산부(141) 및 정규화부(143)를 포함한다.
예비 계산부(141)는 입력된 학습 데이터의 평균값 및 분산값을 계산하여 파일 형태로 저장한다.
정규화부(143)는 상기 학습 데이터의 평균값 및 분산값을 이용하여 입력된 검사 대상자의 임상 정보 수치를 정규화시킨다.
분류기(16)는 HP 생성부(161), 암 수치 출력부(163), 분류부(165) 및 ROC 곡 선 생성부(167)를 포함한다.
HP 생성부(161)는 상기 학습 데이터를 이용하여 의사결정 하이퍼플레인(decision hyperplane)을 생성한다.
암 수치 출력부(163)는 입력된 검사 대상자의 임상 정보 수치를 이용하여 검사 대상자의 암 진행 단계 수치를 출력한다.
분류부(165)는 상기 출력된 암 진행 단계 수치를 의사결정 하이퍼플레인을 기준으로 분류한다.
ROC 곡선 생성부(167) 분류기의 문턱값 변화에 따른 민감성과 특이성 변화 그래프인 ROC 곡선을 생성한다.
후처리부(18)는 확률 계산부(181) 및 검사 결정부(183)를 포함한다.
확률 계산부(181)는 상기 출력된 암 진행 단계 수치를 이용하여 검사 대상자가 암에 걸렸을 확률을 계산한다.
상기 확률 계산부는 하기 식에 의해 확률을 계산하는 것일 수 있다:
Figure 112008058600630-pat00005
상기 식에서, p(1|x)는 암에 걸렸을 확률, p(2|x)는 암이 아닐 확률, 및 f(x)는 분류기의 출력값이다. x는 입력 벡터(input vector), w는 입력 벡터에 곱해지는 가중치 벡터(weight vector), b는 입력 벡터와 가중치 벡터의 곱에 더해지는 바이어스 값(bias value)이다. φ는 wx+b 값에 비선형성(nonlinearity)을 부여하기 위한 커널(kernel)이다.
검사 결정부(183)는 상기 계산된 확률이 최소 위험도 보다 큰 경우에 조직 검사 시행을 결정한다.
상기 최소 위험도는 하기 식으로 표현되는 직선이 ROC 곡선과 접하는 경우의 y 절편값이고, 상기 ROC 곡선의 x축 및 y축 변수는 각각 FPR 및 TPR일 수 있다:
Figure 112008058600630-pat00006
상기 식에서, TPR은 진양성률(true positive rate), FPR은 위양성률(false positive rate), Risk는 위험도, 및 α는 학습 데이터에서 암이 아닌 경우와 암인 경우의 비율이다.
도 2는 본 발명의 일 실시예에 따른 암 진단 장치를 이용한 데이터 학습 과정을 도시하는 순서도이다.
도 2를 참조하면, 먼저 하나 이상의 대상자의 임상 정보 수치 및 암 진행 단계 수치를 포함하는 학습 데이터를 분류기에 입력한다(21). 학습 데이터는 직접 수치로 입력할 수 있지만 파일의 형태로 입력받을 수도 있다.
다음으로, 입력된 학습 데이터의 평균값 및 분산값을 계산하여 파일 형태로 저장한다(23).
다음으로, 분류기에서 상기 학습 데이터를 이용하여 의사결정 하이퍼플레인(decision hyperplane)을 생성한다(25).
도 3은 본 발명의 일 실시예에 따른 암 진단 장치를 이용한 암 진단 방법을 도시하는 순서도이다.
도 3을 참조하면, 먼저 검사 대상자의 임상 정보 수치를 분류기에 입력한 다(31). 테스트 데이터도 직접 수치로 입력할 수 있지만 파일의 형태로 입력받을 수도 있다.
이후 상기 학습 데이터의 평균값 및 분산값을 이용하여 입력된 검사 대상자의 임상 정보 수치를 정규화시킨다(32).
이후 분류기에서 입력된 검사 대상자의 임상 정보 수치를 이용하여 검사 대상자의 암 진행 단계 수치를 출력한다(33). 상기 임상 정보 수치는 검사 대상자의 나이, PSA 수치, DRE 수치, 전립선 부피, 전립선의 TZ-부피 및 TRUS 클래스 중 하나 이상을 포함할 수 있다.
이후 분류기에서 상기 출력된 암 진행 단계 수치를 의사결정 하이퍼플레인을 기준으로 분류한다(34).
본 발명에 사용가능한 분류기는 SVM(support vector machine), MLP(multi-layer perceptron) 또는 파즌 윈도우(Parzen window)일 수 있다.
상기 분류기의 출력된 암 진행 단계 수치를 이용하여 검사 대상자가 암에 걸렸을 확률을 계산한다(35).
상기 확률 계산 단계는 하기 식에 의해 수행될 수 있다:
Figure 112008058600630-pat00007
상기 식에서, p(1|x)는 암에 걸렸을 확률, p(2|x)는 암이 아닐 확률, 및 f(x)는 분류기의 출력값이다.
파즌 윈도우의 경우 출력값 자체가 확률의 형태이므로, 출력값을 그대로 이용해도 된다.
출력된 확률은 정확하고 절대적인 전립선암 발병 가능성을 의미하지는 않는다. 출력된 확률에서 중요한 것은 확률의 컷오프 값으로, 이 값은 입력된 정보들이 전립선암에 걸렸을 가능성이 높은지 그렇지 않은지를 판단하는 비교값이 된다. 출력된 확률값이 컷오프 값보다 적을수록 암에 걸렸을 가능성이 적고, 컷오프 값보다 클수록 암에 걸렸을 가능성이 높다고 할 수 있다.
이후 분류기의 문턱값 변화에 따른 민감성과 특이성 변화 그래프인 ROC 곡선을 생성하고(36), 계산된 확률이 최소 위험도 보다 큰 경우에 조직 검사 시행을 결정한다(37).
본 발명에 따른 장치의 성능은 분류기의 문턱값 설정에 따라 크게 변하는 특성이 있다. 문턱값이 낮은 경우 암으로 의심되는 경우를 더 많이 검출할 수 있겠지만, 이는 실제로는 암이 아닌데도 암으로 간주하는 경우(False Positive, FP) 또한 많아지게 된다. 문턱값이 높은 경우는 암이 아닌 경우를 더 잘 가려낼 수 있지만, 이는 또한 실제로는 암에 걸린 경우인데도 불구하고 암이 아닌 경우로 간주하는 경우(False Negative, FN)도 많게 된다. 두 가지의 경우 모두 분류를 잘못할 수 있는 위험성이 존재한다.
만약 암 발병 여부를 분류기의 정확도(accuracy) 자체만 감안하여 결정할 경우, 이런 잘못된 분류의 위험성을 간과한 것일 수 있다. 예를 들어, 문턱값을 매 우 높게 하는 경우, 암 발병으로 의심되는 경우의 수가 상대적으로 매우 적게되어, 정확도 자체만으로는 매우 좋은 성능을 보일 수 있다. 하지만, 암에 걸렸음에도 불구하고 암이 아닌 경우로 간주하는(FN) 경우, 전립선암의 조기발견 및 검진의 실패를 의미하므로 매우 심각한 문제를 야기할 수 있다. 따라서 의학적 결정을 내릴 때에는 분류기의 정확성 자체보다는 문턱값의 크기 변화에 따른 민감성(sensitivity)과 특이성(specificity)의 크기 변화를 감안하는 방법이 바람직하다.
조직검사 시행 여부는 다음에 정의한 위험도(risk)의 개념을 감안하여 결정할 수 있다.
risk = 2 α·sen spe
여기서 sen은 민감성, spe는 특이성, 그리고 α는 학습데이터에서 암이 아닌 경우와 암인 경우의 비율이다. 의사결정 컷오프값(decision cutoff)은 다음과 같이 정의된다.
decision = minthRisk
여기서 th는 문턱값을 뜻한다. 위험도(Risk)의 최소값을 얻기 위해서는 우선적으로 민감성과 특이성의 그래프인 ROC 곡선이 그려져야 한다. ROC 곡선의 x 축은 False Positive Rate(FPR)을 뜻하는데, 이 값은 1 specificity과 같다. ROC 곡선의 y 축은 True Positive Rate(TPR)을 뜻하는데, 이 값은 sensitivity와 같다. 따라서, 위험도는 ROC곡선과 만나는 직선의 절편으로 표현될 수 있다.
Risk = 2 α·sen spe
= 1 α·sen + 1 spe
= 1 α·TPR + FPR
따라서,
Figure 112008058600630-pat00008
상기 식에서, TPR은 진양성률(true positive rate), FPR은 위양성률(false positive rate), Risk는 위험도, 및 α는 학습 데이터에서 암이 아닌 경우와 암인 경우의 비율이다.
따라서, 최소 위험도(minimum of Risk)는 상기 식으로 표현되는 직선이 ROC 곡선과 접하는 경우의 y 절편을 뜻한다.
도 4는 본 발명에 따른 장치에 있어서 최소 위험도는 위험도 직선이 ROC 곡선에 접할 때 얻어진다는 것을 나타내는 그래프이다.
본 발명에 따른 장치 및 방법의 유용성을 증명하기 위해, 1077 케이스의 데이터베이스를 수집하여 실험을 진행하였다. 각 케이스는 PSA, DRE, 나이, 전립선 부피, 전립선의 TZ 부피, TRUS 클래스, 그리고 정답의 클래스 라벨로 이루어져있다. 1077 케이스 중 637 클래스는 학습데이터로 쓰였고 440 케이스는 테스트 데이터로 사용하였다. 본 발명에 따른 장치는 의사결정 하이퍼플레인(decision hyperplane)을 학습데이터로부터 생성하고, 테스트데이터의 암 발병 가능성을 예측하였다. 이용된 분류기(classifier)는 SVM, MLP, Parzen classifier 세가지가 포 함되어 있다. 각 분류기는 각각의 ROC 곡선과 테스트 케이스별 암 발병 확률을 출력할 수 있다.
도 5는 본 발명에 따른 장치가 소프트웨어로 구현되는 경우의 인터페이스의 일 예를 나타낸다.
본 발명에 따른 장치는 각 입력을 벡터 형태로 받아들일 수도 있고, 파일 형태로 받아들일 수도 있다. 도 6은 본 발명에 따른 장치가 파일 형태의 입력값을 받아들이는 과정을 나타낸다.
본 발명에 따른 장치의 성능은 ROC 곡선의 형태로 나타난다. ROC 곡선은 분류기의 문턱값의 변화에 따른 민감성과 특이성의 변화를 보여준다. ROC 곡선을 이용하여 성능을 평가하는 표준적인 방법은 AUC(Area Under Curve)를 이용하는 방법이 있다. AUC값은 곡선의 아랫쪽의 면적, 즉 적분값인데, 이 값이 크다는 것은 분류기가 데이터의 특성을 잘 잡아내어 좋은 분류 성능을 보여준다는 뜻이다. AUC값은 다음과 같이 정의한다.
Figure 112008058600630-pat00009
도 7은 본 발명에 따른 장치에 사용 가능한 분류기들의 ROC값과 AUC 곡선의 일 예를 나타낸다. 도 7을 참조하면, SVM, MLP, 파즌 분류기의 ROC값과 AUC 곡선을 보여준다. 또한 ROC 곡선에 접하는 직선들과, 최소 위험도의 수치 또한 나타내고 있다. 직선위의 숫자는 최소 위험도를 갖는 컷오프 값을 보여준다. SVM의 경우 컷오프가 30일 때 최소위험성을 나타내는데, 이런 경우 30보다 큰 결과값이 나 오는 경우를 암 이라고 판단하는 것이 잘못된 결정을 내릴 위험성이 가장 적다는 것을 나타낸다. MLP의 경우는 이 값이 10, 파즌 분류기의 경우는 이 값이 5이다. AUC값은 SVM이 93, MLP가 74, 파즌 분류기가 70을 나타낸다.
본 발명에 따른 장치 및 방법은 의사결정을 돕는 도구가 될 수 있다. 본 발명에 따른 장치 및 방법은 저장된 6개의 특성데이터들로 이루어진 데이터베이스를 학습할 수 있고, 이를 바탕으로 새로운 입력을 받아들여 암 발병 가능성을 예측할 수 있다. 또한 이용될 분류기를 선택하여 ROC 커브를 그릴 수 있다. SVM, MLP, 그리고 파즌 분류기가 분류기로 들어있고, 이는 이용자가 각각의 결과를 비교할 수 있도록 도와준다. ROC 곡선을 그리게 되면 AUC 또한 계산되고, 컷오프값 또한 산출되어서 이를 바탕으로 진단자가 암 발병 여부를 진단할 수 있도록 도와줄 수 있다. 컷오프값은 분류를 잘못할 위험성이 최소가 되도록 정해진다. 본 발명에 따른 장치 및 방법은 진단자나 연구자들이 진단시의 위험성을 감안하고, 누적된 과거의 임상 자료들을 바탕으로 더 정확하고 현명한 결정을 내릴 수 있도록 도와줄 수 있다.
본 발명에 따른 암 진단 방법 및 장치는 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CDROM, 자기 테이프, 플로피디스크 및 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또 한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드로 저장되고 실행될 수 있다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의하여 정해져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 암 진단 장치의 구성을 도시하는 블록도이다.
도 2는 본 발명의 일 실시예에 따른 암 진단 장치를 이용한 데이터 학습 과정을 도시하는 순서도이다.
도 3은 본 발명의 일 실시예에 따른 암 진단 장치를 이용한 암 진단 방법을 도시하는 순서도이다.
도 4는 본 발명에 따른 장치에 있어서 최소 위험도는 위험도 직선이 ROC 곡선에 접할 때 얻어진다는 것을 나타내는 그래프이다.
도 5는 본 발명에 따른 장치가 소프트웨어로 구현되는 경우의 인터페이스의 일 예를 나타낸다.
도 6은 본 발명에 따른 장치가 파일 형태의 입력값을 받아들이는 과정을 나타낸다.
도 7은 본 발명에 따른 장치에 사용 가능한 분류기들의 ROC값과 AUC 곡선의 일 예를 나타낸다.
* 도면의 주요 부분에 대한 부호의 간단한 설명 *
10: 암 진단 장치 12: 입력부
14: 전처리부 16: 분류기
18: 후처리부 121: 제1 입력부
123: 제2 입력부 141: 예비 계산부
143: 정규화부 161: HP 생성부
163: 암 수치 출력부 165: 분류부
167: ROC 곡선 생성부 181: 확률 계산부
183: 검사 결정부

Claims (16)

  1. 하나 이상의 대상자의 임상 정보 수치 및 암 진행 단계 수치를 포함하는 학습 데이터를 분류기에 입력하는 단계;
    분류기에서 상기 학습 데이터를 이용하여 의사결정 하이퍼플레인(decision hyperplane)을 생성하는 단계;
    검사 대상자의 임상 정보 수치를 분류기에 입력하는 단계;
    분류기에서 입력된 검사 대상자의 임상 정보 수치를 이용하여 검사 대상자의 암 진행 단계 수치를 출력하는 단계;
    분류기에서 상기 출력된 암 진행 단계 수치를 의사결정 하이퍼플레인을 기준으로 분류하는 단계; 및
    상기 분류기의 출력된 암 진행 단계 수치를 이용하여 검사 대상자가 암에 걸렸을 확률을 계산하는 단계를 포함하는 암 진단 방법.
  2. 제 1항에 있어서,
    입력된 학습 데이터의 평균값 및 분산값을 계산하여 파일 형태로 저장하는 단계; 및 상기 학습 데이터의 평균값 및 분산값을 이용하여 입력된 검사 대상자의 임상 정보 수치를 정규화시키는 단계를 더 포함하는 것을 특징으로 하는 암 진단 방법.
  3. 제 1항에 있어서,
    상기 임상 정보 수치는 검사 대상자의 나이, PSA 수치, DRE 수치, 전립선 부피, 전립선의 TZ-부피 및 TRUS 클래스 중 하나 이상을 포함하는 것을 특징으로 하는 암 진단 방법.
  4. 제 1항에 있어서,
    상기 확률 계산 단계는 하기 식에 의해 수행되는 것을 특징으로 하는 암 진단 방법:
    Figure 112010055394810-pat00010
    상기 식에서, p(1|x)는 암에 걸렸을 확률, p(2|x)는 암이 아닐 확률, 및 f(x)는 분류기의 출력값이고, x는 입력 벡터(input vector), w는 입력 벡터에 곱해지는 가중치 벡터(weight vector), b는 입력 벡터와 가중치 벡터의 곱에 더해지는 바이어스 값(bias value)이며, φ는 wx+b 값에 비선형성(nonlinearity)을 부여하기 위한 커널(kernel)이다.
  5. 제 1항에 있어서,
    상기 계산된 확률이 최소 위험도 보다 큰 경우에 조직 검사 시행을 결정하는 단계를 더 포함하는 것을 특징으로 하는 암 진단 방법.
  6. 제 1항에 있어서,
    분류기의 문턱값 변화에 따른 민감성과 특이성 변화 그래프인 ROC 곡선을 생성하는 단계를 더 포함하는 것을 특징으로 하는 암 진단 방법.
  7. 제 5항에 있어서,
    상기 최소 위험도는 하기 식으로 표현되는 직선이 ROC 곡선과 접하는 경우의 y 절편값이고, 상기 ROC 곡선의 x축 및 y축 변수는 각각 FPR 및 TPR인 것을 특징으로 하는 암 진단 방법:
    Figure 112010055394810-pat00011
    상기 식에서, TPR은 진양성률(true positive rate), FPR은 위양성률(false positive rate), Risk는 위험도, 및 α는 학습 데이터에서 암이 아닌 경우와 암인 경우의 비율(암이 아닌 경우/암인 경우)이다.
  8. 제 1항에 있어서,
    상기 암은 전립선암인 것을 특징으로 하는 암 진단 방법.
  9. 하나 이상의 대상자의 임상 정보 수치 및 암 진행 단계 수치를 포함하는 학습 데이터를 입력하는 제1 입력부;
    상기 학습 데이터를 이용하여 의사결정 하이퍼플레인(decision hyperplane)을 생성하는 하이퍼플레인 생성부;
    검사 대상자의 임상 정보 수치를 입력하는 제2 입력부;
    입력된 검사 대상자의 임상 정보 수치를 이용하여 검사 대상자의 암 진행 단계 수치를 출력하는 암 수치 출력부;
    상기 출력된 암 진행 단계 수치를 의사결정 하이퍼플레인을 기준으로 분류하는 분류부; 및
    상기 출력된 암 진행 단계 수치를 이용하여 검사 대상자가 암에 걸렸을 확률을 계산하는 확률 계산부를 포함하는 암 진단 장치.
  10. 제 9항에 있어서,
    입력된 학습 데이터의 평균값 및 분산값을 계산하여 파일 형태로 저장하는 예비 계산부; 및 상기 학습 데이터의 평균값 및 분산값을 이용하여 입력된 검사 대상자의 임상 정보 수치를 정규화시키는 정규화부를 더 포함하는 것을 특징으로 하는 암 진단 장치.
  11. 제 9항에 있어서,
    상기 임상 정보 수치는 검사 대상자의 나이, PSA 수치, DRE 수치, 전립선 부피, 전립선의 TZ-부피 및 TRUS 클래스 중 하나 이상을 포함하는 것을 특징으로 하는 암 진단 장치.
  12. 제 9항에 있어서,
    상기 확률 계산부는 하기 식에 의해 확률을 계산하는 것을 특징으로 하는 암 진단 장치:
    Figure 112010055394810-pat00012
    상기 식에서, p(1|x)는 암에 걸렸을 확률, p(2|x)는 암이 아닐 확률, 및 f(x)는 분류기의 출력값이고, x는 입력 벡터(input vector), w는 입력 벡터에 곱해지는 가중치 벡터(weight vector), b는 입력 벡터와 가중치 벡터의 곱에 더해지는 바이어스 값(bias value)이며, φ는 wx+b 값에 비선형성(nonlinearity)을 부여하기 위한 커널(kernel)이다.
  13. 제 9항에 있어서,
    상기 계산된 확률이 최소 위험도 보다 큰 경우에 조직 검사 시행을 결정하는 검사 결정부를 더 포함하는 것을 특징으로 하는 암 진단 장치.
  14. 제 9항에 있어서,
    분류기의 문턱값 변화에 따른 민감성과 특이성 변화 그래프인 ROC 곡선을 생성하는 ROC 곡선 생성부를 더 포함하는 것을 특징으로 하는 암 진단 장치.
  15. 제 13항에 있어서,
    상기 최소 위험도는 하기 식으로 표현되는 직선이 ROC 곡선과 접하는 경우의 y 절편값이고, 상기 ROC 곡선의 x축 및 y축 변수는 각각 FPR 및 TPR인 것을 특징으로 하는 암 진단 장치:
    Figure 112010055394810-pat00013
    상기 식에서, TPR은 진양성률(true positive rate), FPR은 위양성률(false positive rate), Risk는 위험도, 및 α는 학습 데이터에서 암이 아닌 경우와 암인 경우의 비율(암이 아닌 경우/암인 경우)이다.
  16. 제 9항에 있어서,
    상기 암은 전립선암인 것을 특징으로 하는 암 진단 장치.
KR1020080080419A 2008-08-18 2008-08-18 전립선암 진단 방법 및 장치 KR101018665B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080080419A KR101018665B1 (ko) 2008-08-18 2008-08-18 전립선암 진단 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080080419A KR101018665B1 (ko) 2008-08-18 2008-08-18 전립선암 진단 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20100021804A KR20100021804A (ko) 2010-02-26
KR101018665B1 true KR101018665B1 (ko) 2011-03-04

Family

ID=42091348

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080080419A KR101018665B1 (ko) 2008-08-18 2008-08-18 전립선암 진단 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101018665B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101459057B1 (ko) * 2014-02-27 2014-11-12 서울대학교병원 (분사무소) 임신성 당뇨병 이후 제2형 당뇨병 발병 예측 방법
KR20210084215A (ko) 2019-12-27 2021-07-07 주식회사 라이프시맨틱스 예측 데이터를 이용한 전립선암 치료 계획 시스템
KR20210084214A (ko) 2019-12-27 2021-07-07 주식회사 라이프시맨틱스 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101338403B1 (ko) * 2011-04-20 2013-12-10 (주)아이엠 프랙탈 차원값을 이용한 전립선암 진단기 및 방법
WO2012144695A1 (en) * 2011-04-20 2012-10-26 Im Co., Ltd. Prostate cancer diagnosis device using fractal dimension value
KR101953627B1 (ko) * 2017-01-11 2019-03-05 서울여자대학교 산학협력단 다중 파라메터 자기공명영상에서 전립선 주변부 영역의 전립선암 자동 검출 및 국소화 방법
KR20200041772A (ko) * 2018-10-11 2020-04-22 (주)제이엘케이인스펙션 암 영역 상태 평가 장치 및 방법
KR20200041773A (ko) * 2018-10-11 2020-04-22 (주)제이엘케이인스펙션 암 영역 정보 보정 장치 및 방법
KR102515437B1 (ko) * 2020-09-10 2023-03-29 서울대학교병원 기계학습 기반 전립선암 위험도 산출 장치 및 방법과, 전립선암 위험도 산출 모델 생성 장치 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000071096A (ko) * 1997-02-14 2000-11-25 바이오마 인터내셔날, 인코포레이티드 향후 건강 상태를 예측하기 위한 시스템
KR20070052788A (ko) * 2004-08-13 2007-05-22 밀레니엄 파머슈티컬스 인코퍼레이티드 전립선암의 확인, 평가, 예방 및 요법을 위한 유전자,조성물, 키트 및 방법
WO2007079284A2 (en) 2005-11-10 2007-07-12 University Of Kentucky Lung cancer diagnostic assay
WO2007109881A1 (en) 2006-03-24 2007-10-04 Phenomenome Discoveries Inc. Biomarkers useful for diagnosing prostate cancer, and methods thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000071096A (ko) * 1997-02-14 2000-11-25 바이오마 인터내셔날, 인코포레이티드 향후 건강 상태를 예측하기 위한 시스템
KR20070052788A (ko) * 2004-08-13 2007-05-22 밀레니엄 파머슈티컬스 인코퍼레이티드 전립선암의 확인, 평가, 예방 및 요법을 위한 유전자,조성물, 키트 및 방법
WO2007079284A2 (en) 2005-11-10 2007-07-12 University Of Kentucky Lung cancer diagnostic assay
WO2007109881A1 (en) 2006-03-24 2007-10-04 Phenomenome Discoveries Inc. Biomarkers useful for diagnosing prostate cancer, and methods thereof

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101459057B1 (ko) * 2014-02-27 2014-11-12 서울대학교병원 (분사무소) 임신성 당뇨병 이후 제2형 당뇨병 발병 예측 방법
KR20210084215A (ko) 2019-12-27 2021-07-07 주식회사 라이프시맨틱스 예측 데이터를 이용한 전립선암 치료 계획 시스템
KR20210084214A (ko) 2019-12-27 2021-07-07 주식회사 라이프시맨틱스 시계열 검진 데이터를 이용한 딥러닝 기반 전립선암 재발예측 시스템
KR102496026B1 (ko) 2019-12-27 2023-02-06 주식회사 라이프시맨틱스 예측 데이터를 이용한 전립선암 치료 계획 시스템

Also Published As

Publication number Publication date
KR20100021804A (ko) 2010-02-26

Similar Documents

Publication Publication Date Title
KR101018665B1 (ko) 전립선암 진단 방법 및 장치
Gideon et al. Mood state prediction from speech of varying acoustic quality for individuals with bipolar disorder
US8693788B2 (en) Assessing features for classification
US20060059112A1 (en) Machine learning with robust estimation, bayesian classification and model stacking
WO2019024861A1 (zh) 心电信号的检测
Yamashita et al. Discrimination between healthy subjects and patients with pulmonary emphysema by detection of abnormal respiration
Saygılı Computer-aided detection of COVID-19 from CT images based on Gaussian mixture model and kernel support vector machines classifier
Thamilselvan et al. An enhanced k nearest neighbor method to detecting and classifying MRI lung cancer images for large amount data
Idarraga et al. False negative rates in benign thyroid nodule diagnosis: machine learning for detecting malignancy
Celik et al. Proposing a new approach based on convolutional neural networks and random forest for the diagnosis of Parkinson's disease from speech signals
Oloko-Oba et al. Tuberculosis abnormality detection in chest x-rays: A deep learning approach
Cheriguene et al. New computer aided diagnosis system for glaucoma disease based on twin support vector machine
Madan et al. Automated detection of COVID-19 on a small dataset of chest CT images using metric learning
Li et al. Improving generalization by data categorization
US20240057936A1 (en) Speech-analysis based automated physiological and pathological assessment
Sari et al. Performance Analysis of Resampling and Ensemble Learning Methods on Diabetes Detection as Imbalanced Dataset
CN114190949B (zh) 生理状态评估方法与生理状态评估装置
Alkurdi Enhancing Heart Disease Diagnosis Using Machine Learning Classifiers
US11669970B2 (en) System, apparatus, and method for detection of ureteropelvic junction obstruction
Melek Responding to challenge call of machine learning model development in diagnosing respiratory disease sounds
Islam et al. Discriminating COVID-19 from pneumonia using machine learning algorithms and chest X-ray images
Kumar et al. Detection and Classification of Oral Cancer Using Machine Learning Models
Grønnesby Automated lung sound analysis
Sugumar Enhancing COVID-19 Diagnosis with Automated Reporting using Preprocessed Chest X-Ray Image Analysis based on CNN
TWI768288B (zh) 腎臟功能評估方法、腎臟功能評估系統及腎臟照護裝置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140212

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150212

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180129

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190201

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20200203

Year of fee payment: 10