KR101527604B1 - A Method for Grading Pancreatic Ductal Adenocarcinomas Based On Morphological Features - Google Patents

A Method for Grading Pancreatic Ductal Adenocarcinomas Based On Morphological Features Download PDF

Info

Publication number
KR101527604B1
KR101527604B1 KR1020130054968A KR20130054968A KR101527604B1 KR 101527604 B1 KR101527604 B1 KR 101527604B1 KR 1020130054968 A KR1020130054968 A KR 1020130054968A KR 20130054968 A KR20130054968 A KR 20130054968A KR 101527604 B1 KR101527604 B1 KR 101527604B1
Authority
KR
South Korea
Prior art keywords
boundary
pancreatic adenocarcinoma
patent document
features
amplitude
Prior art date
Application number
KR1020130054968A
Other languages
Korean (ko)
Other versions
KR20140134922A (en
Inventor
이주홍
송재원
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020130054968A priority Critical patent/KR101527604B1/en
Publication of KR20140134922A publication Critical patent/KR20140134922A/en
Application granted granted Critical
Publication of KR101527604B1 publication Critical patent/KR101527604B1/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection

Abstract

주어진 조직세포 영상으로부터 형태학적 특징을 추출하고, 추출된 특징을 기반으로 췌장선암을 진단하는 형태학적 특징 기반 췌장선암 등급 진단 방법에 관한 것으로서, 상기 조직세포 영상으로부터 형태학적 특징을 추출하는 제1 단계; 지도학습 기반의 분류기를 이용하여 진단 모델을 구성하는 제2 단계; 및, 상기 진단 모델을 이용하여, 상기 조직세포 영상의 췌장선암을 진단하는 제3 단계를 포함하고, 상기 진단 모델은 입력되는 형태학적 특징에 대하여 췌장선암 여부 또는 등급을 결정하는 구성을 마련한다.
상기와 같은 췌장선암 등급 진단 방법에 의하여, 형태학적 특징들을 추출하고, 추출된 특징으로 진단 모델을 학습시킴으로써 췌장선암을 정확하게 판별하고 각 병기들을 구분할 수 있다.
The present invention relates to a method for diagnosing pancreatic adenocarcinoma based on a morphologic feature of extracting morphological features from a given tissue cell image and diagnosing pancreatic adenocarcinoma based on the extracted features, ; A second step of constructing a diagnostic model using a map-based classifier; And a third step of diagnosing pancreatic adenocarcinoma of the tissue cell image using the diagnostic model, wherein the diagnostic model provides a configuration for determining the presence or degree of pancreatic adenocarcinoma with respect to input morphological characteristics.
According to the diagnosis method of pancreatic adenocarcinoma grade as described above, the morphological features are extracted and the diagnosis model is learned by the extracted features, so that the pancreatic adenocarcinoma can be accurately discriminated and each stage can be distinguished.

Description

형태학적 특징 기반 췌장선암 등급 구분 방법 { A Method for Grading Pancreatic Ductal Adenocarcinomas Based On Morphological Features }TECHNICAL FIELD The present invention relates to a method for classifying pancreatic adenocarcinoma based on morphological characteristics,

또한, 본 발명은 주어진 조직세포 영상으로부터 형태학적 특징을 추출하고, 추출된 특징을 기반으로 췌장선암을 진단하는 형태학적 특징 기반 췌장선암 등급 진단 방법에 관한 것이다.
The present invention also relates to a method for diagnosing pancreatic adenocarcinoma based on a morphological feature that extracts morphological features from a given tissue cell image and diagnoses pancreatic adenocarcinoma based on the extracted features.

전통적으로 병리진단은 광학 현미경을 통해 주어진 조직 슬라이드를 수동으로 검토하고 진단의의 경험과 지식에 의해 주관적으로 진단을 수행한다. 이러한 전통적인 병리진단은 몇 가지 문제점이 있다. 먼저 광학 현미경을 통한 스크리닝과정은 고배율에서 진행되기 때문에 매우 많은 시간과 노력을 필요로 한다 [비특허문헌 1], [비특허문헌 2]. 또한 진단의의 개인적인 능력은 실제 진단에 결정적인 영향을 준다. 즉, 정량적 특징 분석에 의한 객관화된 진단이 아니라 주관적인 진단이 이루어지기 때문에 같은 증상에 대해 의사들마다 다양한 의견을 보일 수 있다[비특허문헌 3]-[비특허문헌 5]. Traditionally, pathologic diagnosis is manually reviewed for tissue slides given through an optical microscope and subjectively diagnosed by the experience and knowledge of the diagnosis. This traditional pathological diagnosis has several problems. First, since the screening process through the optical microscope proceeds at a high magnification, much time and effort are required [Non-Patent Document 1] and [Non-Patent Document 2]. The individual's ability to diagnose also has a decisive impact on the actual diagnosis. That is, since subjective diagnosis is performed instead of objectively diagnosed by quantitative feature analysis, various opinions can be shown to doctors about the same symptoms [Non-Patent Document 3] - [Non-Patent Document 5].

디지탈 병리학(Digital pathology)의 등장은 이러한 병리진단 환경을 변화시키고 있다. 디지탈 병리학은 글래스 슬라이드(glass slide)를 디지털화함으로써 편리한 스크리닝 환경과 정량적 특징분석을 통한 객관적 진단을 가능하게 했다[비특허문헌 6]-[비특허문헌 8]. 그럼에도 불구하고 조직영상의 스크리닝을 통한 병리진단은 수동적으로 수행되어지기 때문에 많은 시간과 노동력을 필요로 한다. 따라서 주관적 판단에 따른 문제가 여전히 존재한다. The emergence of digital pathology is changing the pathological diagnosis environment. Digital pathology digitized a glass slide, enabling objective diagnosis through convenient screening environment and quantitative feature analysis [Non-Patent Document 6] - [Non-Patent Document 8]. Nevertheless, pathologic diagnosis through screening of tissue images requires a lot of time and labor because it is performed passively. Therefore, there is still a problem due to subjective judgment.

최근 이러한 문제점을 극복하기 위해 디지탈 병리학과 CAD(Computer Aided detection) 기술을 결합하려는 연구가 점차 증가하고 있다. 많은 자동화 진단과 관련된 연구들은 종양의 진단뿐 아니라 발견된 종양의 등급(grading)까지 커버하고 있다. 병리적 등급(grading)은 질병의 진행을 식별하고 환자에 대한 올바른 처방을 위해 매우 가치가 있다[비특허문헌 9]. 실제로 병리 의사들은 환자의 베스트한 처방을 위해 병기를 구분에 대한 많은 훈련을 하는 것으로 알려져 있다 [비특허문헌 7]. 현재 많은 연구들은 전립선 암과 유방암을 대상으로 진행되고 있다. To overcome these problems, there is an increasing number of studies to combine digital pathology with computer aided detection (CAD) technology. Many automated diagnosis-related studies cover not only the diagnosis of tumors but also the grading of the tumors found. Pathological grading is very valuable for identifying the progression of the disease and for proper prescribing to the patient [Non-Patent Document 9]. In fact, pathologists are known to do a lot of training in sorting the arms for the best prescription of the patient [Non-Patent Literature 7]. Many studies are now being conducted on prostate cancer and breast cancer.

먼저 전립선 암 진단과 관련된 CAD연구들은 대부분 Gleason에 의해 개발된 글리슨 등급 시스템(Gleason grading system)[비특허문헌 10]에 기반한다. Tabesh et al. [비특허문헌 11]는 전립선암(prostate cancer)을 진단하고 글리슨 등급(Gleason grading)에 기반하여 저(low)와 고(high)로 병기를 구분하는 머신러닝 기반의 자동화 시스템을 제안하였다. 그들은 종양(tumour)의 진단과 병기 구분을 위해 주어진 병리영상의 전반적 수준(global (image) level)과 조직학적 개체 수준(historical object level)에서 색(color), 텍스쳐(texture), 그리고 형태학적 특징(morphometric features)들을 추출하고 그들을 이용하여 분류기(Gaussian, k-NN, SVM과 같은) 학습하였다.First, most of the CAD studies related to prostate cancer diagnosis are based on the Gleason grading system developed by Gleason [Non-Patent Document 10]. Tabesh et al. [Non-Patent Document 11] proposed a machine learning-based automation system that diagnoses prostate cancer and distinguishes between low and high based on Gleason grading. They are used to distinguish color, texture, and morphological features from the historical (object) level and the global (image) level of a given pathology image for the diagnosis and staging of tumors (Gaussian, k-NN, SVM) using morphometric features extracted from them.

Naik et al. [비특허문헌 12]은 중간 글리슨 등급(intermediate Gleason grades)를 구분하기 위한 시스템을 제안했다. 그들은 저수준(low-level) 정보를 이용하는 베이지안 분류기(Bayesian classifier)을 사용하여 후보 분비선 영역(candidate gland region)을 식별하고, 실험 도메인(Empirical domain) 정보를 이용하여 분비선(gland)으로 식별된 참거짓(false positive) 영역들을 제외하였다. 이후, 식별된 분비선으로부터 형태학적 특징들을 추출하고, SVM을 통해 Gleason grade 3, Gleason grade 4, 그리고 양성(benign)을 구분하였다. Huwang 과 Lee는 [비특허문헌 13] 감별 박스 계측(differential box-counting)과 엔트로피 기반 프랙탈 차원 추정(tropy-based fractal dimension estimation) 기법을 사용하여 Gleason grading을 위한 특징들을 추출하고, Bayesina, k-NN, SVM분류기를 이용하여 전립선 암 이미지(prostate cancer image)를 4등급으로 구분하였다. 이 외에도 많은 연구들이 전립선 종양(postate tumour)을 진단과 Gleason Grading 시스템을 자동화하기 위해 진행되고 있다 [비특허문헌 14]-[비특허문헌 17]. Naik et al. [Non-Patent Document 12] proposed a system for classifying intermediate Gleason grades. They use a Bayesian classifier that uses low-level information to identify the candidate gland region and use the Empirical domain information to identify the true falsehood identified as a gland (false positive) regions were excluded. Later, morphological features were extracted from the identified glands, and Gleason grade 3, Gleason grade 4, and benign were classified via SVM. Huwang and Lee [12] extracted features for Gleason grading using differential box-counting and entropy-based fractal dimension estimation, and Bayesina, k- NN and SVM classifiers were used to classify the prostate cancer images into four classes. In addition, many studies have been conducted to diagnose prostate tumor (post tumor) and to automate Gleason grading system [Non-Patent Document 14] - [Non-Patent Document 17].

다음으로 유방암과 관련된 CAD연구들은 다음과 같다. Anderson et al. [비특허문헌 18] 은 비외과적 유방 질환(non-invasive breast lesions)의 양성(benign)인 DH(ductal hyperplasia)와 악성(malignant)인 DCIS(ductal carcinoma in situ)구분 문제를 연구하였다. 그들은 이 연구에서 지식가이드 머신 비젼(knowledge-guided machine vision)을 사용하여 유방 유관(breast duct)을 자동으로 세그먼트하고, DH와 DCIS를 구분하는데 중요한 증식성 병소의 유관 패턴(duct pattern)을 측정하기 위해 유관체(duct cribriformity)와 구조적 복잡도(architectural complexity)와 같은 측정도구(measure)들을 제안하였다.Next, CAD studies related to breast cancer are as follows. Anderson et al. [Non-Patent Document 18] studied the problem of distinguishing between ductal hyperplasia (DH), which is benign in non-invasive breast lesions, and DCIS (ductal carcinoma in situ), which is malignant. They used the knowledge-guided machine vision in this study to automatically segment breast ducts and measure the duct pattern of proliferative lesions that are important for distinguishing between DH and DCIS We have proposed measures such as duct cribriformity and architectural complexity.

Bilgin et al. [비특허문헌 19]은 그래프 이론 기술(graph theoretical techniques)에 기반하여 유방암(breast cancer)을 진단하였다. 그들은 k-means 알고리즘을 이용하여 주어지 조직세포 영상을 세그멘트하고, 세포들의 위치좌표를 사용하여 셀 그래프(cell-graph)를 생성하였다. 주어진 조직 영상을 양성(benign), 침습성(invasive), 비침습성(non-invasive)으로 분류하는 SVM모델은 생성된 cell-graph로부터 계산된 정량적 척도(quantitative metric)들에 의해 학습된다. Basavanhally et al. [비특허문헌 20]는 HER2+ 유방암(breast cancer)의 예측 인자(viable prognostic indicator)로서 알려진 백혈구 침범(lymphocytic infiltration)의 정도(extent)를 식별하고 등급 결정(grading)하는 시스템을 제안했다. 그들은 우선 림프구(lymphocytes)를 영역 양성(region grwowing)과 마코프 랜덤필드 알고리즘(Makov random field algorithm)을 이용하여 식별하였다. 이후, 식별된 림프구를 이용하여 구조적 특징(architectural features)들을 추출하고, 그 특징들에 의해 학습된 SVM 분류기를 이용하여 LI의 정도(extent)를 저(low), 저(midium), 고(high) 등급으로 구분하였다. 그 밖에 유방암 진단과 grading을 위한 연구들이 많이 진행되고 있다 [비특허문헌 21]-[비특허문헌 24]. Bilgin et al. [Non-patent document 19] diagnosed breast cancer based on graph theoretical techniques. They segmented a given tissue cell image using a k-means algorithm and generated a cell-graph using the cell's positional coordinates. SVM models that classify a given tissue image as benign, invasive, or non-invasive are learned by quantitative metrics computed from the generated cell-graph. Basavanhally et al. [Non-patent document 20] proposed a system for identifying and grading the extent of lymphocytic infiltration known as a viable prognostic indicator of HER2 + breast cancer. They first identified lymphocytes using region grwowing and the Makov random field algorithm. We then extract the architectural features using the identified lymphocytes and use the SVM classifier learned by those features to determine the extent of LI as low, midium, high Respectively. There have been many studies for diagnosis and grading of breast cancer [Non-Patent Document 21] - [Non-Patent Document 24].

많은 병리 CAD연구들은 각 질병에 대한 병리적 특징들과 그들을 양적으로 측정하기 위한 방법들을 고안하는데 많은 노력을 기울인다. 왜냐하면 병리진단은 병소와 질병의 유형에 따라 다양한 진단 방법이 존재하기 때문이다. 현재 유방과 전립선 종양을 대상으로 하는 병리진단 CAD 외에 결장(colonic)[비특허문헌 25], 방광(bladder)[비특허문헌 26], 신경아세포종(neuroblastoma) [비특허문헌 27][비특허문헌 28][비특허문헌 29], 여포성 림프종(follicular lymphoma)[비특허문헌 30][비특허문헌 31] 종양(tumour)들을 대상으로 몇몇 연구들이 진행되고 있다.Many pathologic CAD studies are devoted to devising pathological features for each disease and methods for quantitatively measuring them. Because pathologic diagnosis has various diagnostic methods depending on the type of lesion and disease. In addition to the pathological diagnostic CAD for breast and prostate tumors, there are currently available colonic (non-patent document 25), bladder (non-patent document 26), neuroblastoma (non-patent document 27) 28] [Non-Patent Document 29], Follicular lymphoma [Non-Patent Document 30] [Non-Patent Document 31] Some studies are being conducted on tumors.

아직 병리진단 CAD 연구는 아직 초기 단계이며 몇몇 소수 부위만을 대상으로 하고 있다. 다양한 종양진단을 위한 많은 방법들이 있다. 따라서 병리학적(pathological) CAD에 대한 보다 많은 연구들이 필요하다.
Pathology Diagnostic CAD research is still in its infancy and only a few are targeted. There are many methods for diagnosing various tumors. Therefore, more research on pathological CAD is needed.

[비특허문헌 1] M. N. Gurcan, L. E. Boucheron, A. Can, A. Madabhushi, N. M. Rajpoot, and B. Yener, "Histopathological Image Analysis: A Review," Biomedical Engineering, IEEE Reviews in, vol. 2, pp. 147 -171, 2009.[Non-Patent Document 1] M. N. Gurcan, L. E. Boucheron, A. Can, A. Madabhushi, N. M. Rajpoot, and B. Yener, "Histopathological Image Analysis: A Review," Biomedical Engineering, IEEE Reviews in, vol. 2, pp. 147 -171, 2009. [비특허문헌 2] A. E. Tutac, D. Racoceanu, T. Putti, W. Xiong, W.-K. Leow, and V. Cretu, "Knowledge-Guided Semantic Indexing of Breast Cancer Histopathology Images," in International Conference on BioMedical Engineering and Informatics, 2008. BMEI 2008, 2008, vol. 2, pp. 107 -112.[Non-Patent Document 2] A. E. Tutac, D. Racoceanu, T. Putti, W. Xiong, W.-K. Leow, and V. Cretu, "Knowledge-Guided Semantic Indexing of Breast Cancer Histopathology Images," in International Conference on BioMedical Engineering and Informatics, 2008. BMEI 2008, 2008, vol. 2, pp. 107 -112. [비특허문헌 3] S. M. Ismail, A. B. Colclough, J. S. Dinnen, D. Eakins, D. M. Evans, E. Gradwell, J. P. O'Sullivan, J. M. Summerell, and R. G. Newcombe, "Observer variation in histopathological diagnosis and grading of cervical intraepithelial neoplasia," BMJ, vol. 298, no. 6675, pp. 707-710, Mar. 1989.[Non-Patent Document 3] Observer variation in histopathological diagnosis and grading of cervical intraepithelial neoplasia (JS) , "BMJ, vol. 298, no. 6675, pp. 707-710, Mar. 1989. [비특허문헌 4] A. Andrion, C. Magnani, P. G. Betta, A. Donna, F. Mollo, M. Scelsi, P. Bernardi, M. Botta, and B. Terracini, "Malignant mesothelioma of the pleura: interobserver variability," J. Clin. Pathol., vol. 48, no. 9, pp. 856-860, Sep. 1995.[Non-Patent Document 4] A. Andrion, C. Magnani, PG Betta, A. Donna, F. Mollo, M. Scelsi, P. Bernardi, M. Botta, and B. Terracini, "Malignant mesothelioma of the pleura: interobserver variability, "J. Clin. Pathol., Vol. 48, no. 9, pp. 856-860, Sep. 1995. [비특허문헌 5] C. Demir and B. Yener, "Automated Cancer Diagnosis Based on Histopathological Systematic Images: A Systematic Survey." Rensselaer Polytechnic Institute, 2005.[Non-Patent Document 5] C. Demir and B. Yener, "Automated Cancer Diagnosis Based on Histopathological Systematic Images: A Systematic Survey." Rensselaer Polytechnic Institute, 2005. [비특허문헌 6] S. Al-Janabi, A. Huisman, and P. J. Van Diest, "Digital pathology: current status and future perspectives," Histopathology, vol. 61, no. 1, pp. 1-9, 2012.[Non-Patent Document 6] S. Al-Janabi, A. Huisman, and P. J. Van Diest, "Digital pathology: current status and future perspectives," Histopathology, vol. 61, no. 1, pp. 1-9, 2012. [비특허문헌 7] A. Madabhushi, "Digital pathology image analysis: opportunities and challenges," Imaging in Medicine, vol. 1, no. 1, pp. 7-10, Oct. 2009.[Non-Patent Document 7] A. Madabhushi, "Digital pathology image analysis: opportunities and challenges," Imaging in Medicine, vol. 1, no. 1, pp. 7-10, Oct. 2009. [비특허문헌 8] R. S. Weinstein, A. R. Graham, L. C. Richter, G. P. Barker, E. A. Krupinski, A. M. Lopez, K. A. Erps, A. K. Bhattacharyya, Y. Yagi, and J. R. Gilbertson, "Overview of telepathology, virtual microscopy, and whole slide imaging: prospects for the future," Human Pathology, vol. 40, no. 8, pp. 1057-1069, Aug. 2009.[Non-Patent Document 8] RS Weinstein, AR Graham, LC Richter, GP Barker, EA Krupinski, AM Lopez, KA Erps, AK Bhattacharyya, Y. Yagi, and JR Gilbertson, "Overview of telepathology, virtual microscopy, : prospects for the future, "Human Pathology, vol. 40, no. 8, pp. 1057-1069, Aug. 2009. [비특허문헌 9] J. I. Epstein and G. J. Netto, Biopsy Interpretation of the Prostate, Fourth. Lippincott Williams & Wilkins, 2007.[Non-Patent Document 9] J. I. Epstein and G. J. Netto, Biopsy Interpretation of the Prostate, Fourth. Lippincott Williams & Wilkins, 2007. [비특허문헌 10] D. F. Gleason and G. T. Mellinger, "Prediction of prognosis for prostatic adenocarcinoma by combined histological grading and clinical staging," J. Urol., vol. 111, no. 1, pp. 58-64, Jan. 1974.[Non-Patent Document 10] D. F. Gleason and G. T. Mellinger, "Prediction of prognosis for prostatic adenocarcinoma by combined histological grading and clinical staging," J. Urol., Vol. 111, no. 1, pp. 58-64, Jan. 1974. [비특허문헌 11] A. Tabesh, M. Teverovskiy, H.-Y. Pang, V. P. Kumar, D. Verbel, A. Kotsianti, and O. Saidi, "Multifeature Prostate Cancer Diagnosis and Gleason Grading of Histological Images," IEEE Transactions on Medical Imaging, vol. 26, no. 10, pp. 1366 -1378, Oct. 2007.[Non-Patent Document 11] A. Tabesh, M. Teverovskiy, H.-Y. Pang, V. P. Kumar, D. Verbel, A. Kotsianti, and O. Saidi, "Multiparty Prostate Cancer Diagnosis and Gleason Grading of Histological Images," IEEE Transactions on Medical Imaging, vol. 26, no. 10, pp. 1366 -1378, Oct. 2007. [비특허문헌 12] S. Naik, S. Doyle, M. Feldman, J. Tomaszewski, and A. Madabhushi, Gland Segmentation and Computerized Gleason Grading of Prostate Histology by Integrating Low-, High-level and Domain Specific Information. MIAAB Workshop: , 2007.[Non-Patent Document 12] S. Naik, S. Doyle, M. Feldman, J. Tomaszewski, and A. Madabhushi, Gland Segmentation and Computerized Gleason Grading of Prostate Histology by Integrating Low-, High-level and Domain Specific Information. MIAAB Workshop:, 2007. [비특허문헌 13] P.-W. Huang and C.-H. Lee, "Automatic Classification for Pathological Prostate Images Based on Fractal Analysis," IEEE Transactions on Medical Imaging, vol. 28, no. 7, pp. 1037 -1050, Jul. 2009.[Non-Patent Document 13] P.-W. Huang and C.-H. Lee, "Automatic Classification for Pathological Prostate Images Based on Fractal Analysis," IEEE Transactions on Medical Imaging, vol. 28, no. 7, pp. 1037-1050, Jul. 2009. [비특허문헌 14] A. W. Wetzel, "Evaluation of prostate tumor grades by content-based image retrieval," 1999, vol. 3584, pp. 244-252.[Non-patent Document 14] A. W. Wetzel, "Evaluation of prostate tumor grades by content-based image retrieval," 1999, vol. 3584, pp. 244-252. [비특허문헌 15] S. Doyle, M. Hwang, K. Shah, A. Madabhushi, M. Feldman, and J. Tomaszeweski, "AUTOMATED GRADING OF PROSTATE CANCER USING ARCHITECTURAL AND TEXTURAL IMAGE FEATURES," in 4th IEEE International Symposium on Biomedical Imaging: From Nano to Macro, 2007. ISBI 2007, 2007, pp. 1284 -1287.[Non-Patent Document 15] S. Doyle, M. Hwang, K. Shah, A. Madabhushi, M. Feldman, and J. Tomaszeweski, "AUTOMATED GRADING OF PROSTATE CANCER USING ARCHITECTURAL AND TEXTURAL IMAGE FEATURES, on Biomedical Imaging: From Nano to Macro, 2007. ISBI 2007, 2007, pp. 1284 -1287. [비특허문헌 16] S.-K. Tai, Y.-C. Wu, C.-Y. Li, Y.-J. Jan, and S.-C. Lin, "Computer-assisted Detection and Grading of Prostatic Cancer in Biopsy Image | www.libsearch.com - TEST," Mar-2010. [Online]. Available: http://www.libsearch.com/view/1046167. [Accessed: 19-Jul-2012].[Non-Patent Document 16] S.-K. Tai, Y.-C. Wu, C.-Y. Li, Y.-J. Jan, and S.-C. Lin, "Computer-assisted Detection and Grading of Prostatic Cancer in Biopsy Image | www.libsearch.com - TEST," Mar-2010. [Online]. Available: http://www.libsearch.com/view/1046167. [Accessed: 19-Jul-2012]. [비특허문헌 17] Y. Peng, Y. Jiang, S.-T. Chuang, and X. J. Yang, "Computer-aided detection of prostate cancer on tissue sections," Appl. Immunohistochem. Mol. Morphol., vol. 17, no. 5, pp. 442-450, Oct. 2009.[Non-Patent Document 17] Y. Peng, Y. Jiang, S.-T. Chuang, and X. J. Yang, "Computer-aided detection of prostate cancer on tissue sections," Appl. Immunohistochem. Mol. Morphol., Vol. 17, no. 5, pp. 442-450, Oct. 2009. [비특허문헌 18] N. H. Anderson, P. W. Hamilton, P. H. Bar℡s, D. Thompson, R. Montironi, and J. M. Sloan, "COMPUTERIZED SCENE SEGMENTATION FOR THE DISCRIMINATION OF ARCHITECTURAL FEATURES IN DUCTAL PROLIFERATIVE LESIONS OF THE BREAST," The Journal of Pathology, vol. 181, no. 4, pp. 374-380, 1997.[Non-patent Document 18] NH Anderson, PW Hamilton, PH Barnes, D. Thompson, R. Montironi, and JM Sloan, "COMPUTERIZED SCENE SEGMENTATION FOR THE DISCRIMINATION OF ARCHITECTURAL FEATURES IN DUCTAL PROLIFERATIVE LESIONS OF THE BREAST, of Pathology, vol. 181, no. 4, pp. 374-380, 1997. [비특허문헌 19] C. Bilgin, C. Demir, C. Nagi, and B. Yener, "Cell-Graph Mining for Breast Tissue Modeling and Classification," in 29th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, 2007. EMBS 2007, 2007, pp. 5311 -5314.[Non-Patent Document 19] C. Bilgin, C. Demir, C. Nagi, and B. Yener, "Cell-Graph Mining for Breast Tissue Modeling and Classification," 29th Annual International Conference of the IEEE Engineering in Medicine and Biology Society , 2007. EMBS 2007, 2007, pp. 5311 -5314. [비특허문헌 20] A. N. Basavanhally, S. Ganesan, S. Agner, J. P. Monaco, M. D. Feldman, J. E. Tomaszewski, G. Bhanot, and A. Madabhushi, "Computerized image-based detection and grading of lymphocytic infiltration in HER2+ breast cancer histopathology," IEEE Trans Biomed Eng, vol. 57, no. 3, pp. 642-653, Mar. 2010.[Non-patent document 20] AN Basavanhally, S. Ganesan, S. Agner, JP Monaco, MD Feldman, JE Tomaszewski, G. Bhanot, and A. Madabhushi, "Computerized image- based detection and grading of lymphocytic infiltration in HER2 + breast cancer histopathology, "IEEE Trans Biomed Eng, vol. 57, no. 3, pp. 642-653, Mar. 2010. [비특허문헌 21] S. Doyle, S. Agner, A. Madabhushi, M. Feldman, and J. Tomaszewski, "Automated grading of breast cancer histopathology using spectral clustering with textural and architectural image features," in 5th IEEE International Symposium on Biomedical Imaging: From Nano to Macro, 2008. ISBI 2008, 2008, pp. 496 -499.[Non-patent Document 21] S. Doyle, S. Agner, A. Madabhushi, M. Feldman, and J. Tomaszewski, "Automated grading of breast cancer histopathology using spectral clustering with textural and architectural image features, on Biomedical Imaging: From Nano to Macro, 2008. ISBI 2008, 2008, pp. 496 -499. [비특허문헌 22] W. H. Wolberg, W. N. Street, D. M. Heisey, and O. L. Mangasarian, "Computer-derived nuclear features distinguish malignant from benign breast cytology," Hum. Pathol., vol. 26, no. 7, pp. 792-796, Jul. 1995.[Non-Patent Document 22] W. H. Wolberg, W. N. Street, D. M. Heisey, and O. L. Mangasarian, "Computer-derived nuclear features distinguish malignant from benign breast cytology," Hum. Pathol., Vol. 26, no. 7, pp. 792-796, Jul. 1995. [비특허문헌 23] R. Fernandez-Gonzalez, T. Deschamps, A. Idica, R. Malladi, and C. O. de Solorzano, "Automatic segmentation of histological structures in mammary gland tissue sections," Journal of Biomedical Optics, vol. 9, no. 3, pp. 444-453, May 2004.[Non-Patent Document 23] R. Fernandez-Gonzalez, T. Deschamps, A. Idica, R. Malladi, and C. O. de Solorzano, "Automatic segmentation of histological structures in mammal gland tissue sections," Journal of Biomedical Optics, vol. 9, no. 3, pp. 444-453, May 2004. [비특허문헌 24] W. H. Wolberg, W. N. Street, and O. L. Mangasarian, Breast Cytology Diagnosis Via Digital Image Analysis. 1993.[Non-Patent Document 24] W. H. Wolberg, W. N. Street, and O. L. Mangasarian, Breast Cytology Diagnosis Via Digital Image Analysis. 1993. [비특허문헌 25] A. N. Esgiar, R. N. G. Naguib, B. S. Sharif, M. K. Bennett, and A. Murray, "Fractal analysis in the detection of colonic cancer images," IEEE Transactions on Information Technology in Biomedicine, vol. 6, no. 1, pp. 54 -58, Mar. 2002.[Non-Patent Document 25] A. N. Esgiar, R. N. G. Naguib, B. S. Sharif, M. K. Bennett, and A. Murray, "Fractal analysis in the detection of colonic cancer images," IEEE Transactions on Information Technology in Biomedicine, vol. 6, no. 1, pp. 54 -58, Mar. 2002. [비특허문헌 26] H. K. Choi, T. Jarkrans, E. Bengtsson, J. Vasko, K. Wester, P. U. Malmstrㆆm, and C. Busch, "Image analysis based grading of bladder carcinoma. Comparison of object, texture and graph based methods and their reproducibility," Anal Cell Pathol, vol. 15, no. 1, pp. 1-18, 1997.[Non-Patent Document 26] HK Choi, T. Jarkrans, E. Bengtsson, J. Vasko, K. Wester, PU Malmstrom, and C. Busch, "Image analysis based on grading of bladder carcinoma. graph based methods and their reproducibility, "Anal Cell Pathol, vol. 15, no. 1, pp. 1-18, 1997. [비특허문헌 27] M. N. Gurcan, J. Kong, O. Sertel, B. B. Cambazoglu, J. Saltz, and U. Catalyurek, "Computerized pathological image analysis for neuroblastoma prognosis," AMIA Annu Symp Proc, pp. 304-308, 2007.[Non-Patent Document 27] M. N. Gurcan, J. Kong, O. Sertel, B. B. Cambazoglu, J. Saltz, and U. Catalyurek, "Computerized pathological image analysis for neuroblastoma prognosis," AMIA Annu Symp Proc. 304-308, 2007. [비특허문헌 28] O. Sertel, J. Kong, H. Shimada, U. V. Catalyurek, J. H. Saltz, and M. N. Gurcan, "Computer-aided prognosis of neuroblastoma on whole-slide images: Classification of stromal development," Pattern Recognition, vol. 42, no. 6, pp. 1093-1103, Jun. 2009.[Non-patent Document 28] O. Sertel, J. Kong, H. Shimada, UV Catalyurek, JH Saltz, and MN Gurcan, "Classification of Stromal Development," Pattern Recognition on Neuroblastoma on Whole- vol. 42, no. 6, pp. 1093-1103, Jun. 2009. [비특허문헌 29] B. B. Cambazoglu, O. Sertel, J. Kong, J. Saltz, M. N. Gurcan, and U. V. Catalyurek, "Efficient processing of pathological images using the grid: computer-aided prognosis of neuroblastoma," in Proceedings of the 5th IEEE workshop on Challenges of large applications in distributed environments, New York, NY, USA, 2007, pp. 35-41.[Non-Patent Document 29] BB Cambazoglu, O. Sertel, J. Kong, J. Saltz, MN Gurcan, and UV Catalyurek, "Efficient processing of pathological images using the grid: computer-aided prognosis of neuroblastoma," in Proceedings of the 5th IEEE workshop on Challenges of large applications in distributed environments, New York, NY, USA, 2007, pp. 35-41. [비특허문헌 30] K. Belkacem-Boussaid, M. Pennell, G. Lozanski, A. Shana'ah, and M. N. Gurcan, "Effect of pathologist agreement on evaluating a computer-aided assisted system: Recognizing centroblast cells in follicular lymphoma cases," in 2010 IEEE International Symposium on Biomedical Imaging: From Nano to Macro, 2010, pp. 1411 -1414.[Non-Patent Document 30] K. Belkacem-Boussaid, M. Pennell, G. Lozanski, A. Shana'ah, and MN Gurcan, "Effect of pathologist agreement on evaluating a computer-aided assisted system: Recognizing centroblast cells in follicular lymphoma cases, "in < / RTI > 2010 IEEE International Symposium on Biomedical Imaging: From Nano to Macro, 2010, pp. 1411 -1414. [비특허문헌 31] O. Sertel, G. Lozanski, A. Shana'ah, and M. N. Gurcan, "Computer-aided detection of centroblasts for follicular lymphoma grading using adaptive likelihood-based cell segmentation," IEEE Trans Biomed Eng, vol. 57, no. 10, pp. 2613-2616, Oct. 2010.[Non-Patent Document 31] O. Sertel, G. Lozanski, A. Shana'ah, and MN Gurcan, "Computer-aided detection of centroblasts for follicular lymphoma grading using adaptive likelihood-based cell segmentation," IEEE Trans Biomed Eng, Vol. . 57, no. 10, pp. 2613-2616, Oct. 2010. [비특허문헌 32] G. Klㆆppel, R. H. Hruban, D. S. Longnecker, G. Adler, S. E. Kern, and T. J. Partanen, "Ductal adenocarcinoma of the pancreas," in Word Health Organization Classification of Tumours. Pathology and Genetics of Tumours of the digestive System, 3th ed., International Agency for Research on Cancer, 2000.[Non-Patent Document 32] G. Klappeel, R. H. Huruban, D. S. Longnecker, G. Adler, S. E. Kern, and T. J. Partanen, "Word Health Organization Classification of Tumors in Ductal Adenocarcinoma of the Pancreas". Pathology and Genetics of Tumors of the Digestive System, 3rd ed., International Agency for Research on Cancer, 2000. [비특허문헌 33] R. H. Hruban, P. Boffetta, C. Iacobuzio-Donahue, Y. Kato, S. E. Kern, D. S. Klimstra, G. Klㆆppel, A. Maitra, G. J. A. Offerhaus, and M. B. Pitman, "Ductal adenocarcinoma of the pancreas," in WHO Classification of Tumours of the Digestive System, 4th ed., vol. 3, International Agency for Research on Cancer, 2010, pp. 217-224.[Non-Patent Document 33] RH Hruban, P. Boffetta, C. Iacobuzio-Donahue, Y. Kato, SE Kern, DS Klimstra, G. Kloppel, A. Maitra, GJA Offerhaus, and MB Pitman, "Ductal adenocarcinoma of the pancreas, "in WHO Classification of Tumors of the Digestive System, 4th ed., vol. 3, International Agency for Research on Cancer, 2010, pp. 217-224. [비특허문헌 34] C. J. Yeo, J. L. Cameron, T. A. Sohn, K. D. Lillemoe, H. A. Pitt, M. A. Talamini, R. H. Hruban, S. E. Ord, P. K. Sauter, J. Coleman, M. L. Zahurak, L. B. Grochow, and R. A. Abrams, "Six hundred fifty consecutive pancreaticoduodenectomies in the 1990s: pathology, complications, and outcomes.," Ann Surg, vol. 226, no. 3, pp. 248-260, Sep. 1997.[Non-Patent Document 34] Sixty hundred, LB Grochow, and RA Abrams, " Six hundreds, " fifty consecutive pancreaticoduodenectomies in the 1990s: pathology, complications, and outcomes., "Ann Surg, vol. 226, no. 3, pp. 248-260, Sep. 1997. [비특허문헌 35] R. Adams and L. Bischof, "Seeded region growing," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 16, no. 6, pp. 641 -647, Jun. 1994.[Non-Patent Document 35] R. Adams and L. Bischof, "Seeded region growing," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 16, no. 6, pp. 641-647, Jun. 1994. [비특허문헌 36] J. W. Song, J. H. Lee, T. S. Park, S. J. Chun, and J. H. Choi, "Mucinous Cystadenoma Classification System using Automated Epithelial Tissue Detection," International Conference on Machine Vision, 2010.[Non-Patent Document 36] J. W. Song, J. H. Lee, S. Park, S. J. Chun, and J. H. Choi, "Automated Epithelial Tissue Detection Using Mucinous Cystadenoma Classification System," International Conference on Machine Vision, 2010. [비특허문헌 37] K. Rodenacker and E. Bengtsson, "A feature set for cytometry on digitized microscopic images," Anal Cell Pathol, vol. 25, no. 1, pp. 1-36, 2003.[Non-Patent Document 37] K. Rodenacker and E. Bengtsson, "A feature set for cytometry on digitized microscopic images," Anal Cell Pathol, vol. 25, no. 1, pp. 1-36, 2003. [비특허문헌 38] P. K. Sahoo, S. Soltani, A. K. C. Wong, and Y. C. Chen, "A survey of thresholding techniques," Comput. Vision Graph. Image Process., vol. 41, no. 2, pp. 233-260, Feb. 1988.[Non-Patent Document 38] P. K. Sahoo, S. Soltani, A. K. C. Wong, and Y. C. Chen, "A survey of thresholding techniques," Comput. Vision Graph. Image Process., Vol. 41, no. 2, pp. 233-260, Feb. 1988. [비특허문헌 39] A. Z. Chitade and S. K. Katiyar, "Color based image segmentation using K-means clustering," International Journal of Engineering Science and Technology, vol. 2, no. 10, pp. 5319-5325, Oct. 2010.[Non-Patent Document 39] A. Z. Chitade and S. K. Katiyar, "Color based image segmentation using K-means clustering," International Journal of Engineering Science and Technology, vol. 2, no. 10, pp. 5319-5325, Oct. 2010. [비특허문헌 40] R. C. Gonzㅱlez and R. E. Woods, Digital Image Processing. Prentice Hall, 2008.[Non-Patent Document 40] R. C. Gonz ㅱ lez and R. E. Woods, Digital Image Processing. Prentice Hall, 2008. [비특허문헌 41] C. Pan, C.-X. Zheng, and H.-J. Wang, "Robust color image segmentation based on mean shift and marker-controlled watershed algorithm," in 2003 International Conference on Machine Learning and Cybernetics, 2003, vol. 5, pp. 2752 - 2756 Vol.5.[Non-Patent Document 41] C. Pan, C.-X. Zheng, and H.-J. Wang, "Robust color image segmentation based on mean shift and marker-controlled watershed algorithm," in 2003 International Conference on Machine Learning and Cybernetics, 2003, vol. 5, pp. 2752 - 2756 Vol.5. [비특허문헌 42] R. J. Hyndman and A. B. Koehler, "Another look at measures of forecast accuracy," International Journal of Forecasting, vol. 22, no. 4, pp. 679-688, Oct. 2006.[Non-Patent Document 42] R. J. Hyndman and A. B. Koehler, "Another Look at Measures of Forecast Accuracy," International Journal of Forecasting, vol. 22, no. 4, pp. 679-688, Oct. 2006. [비특허문헌 43] F.-L. Chung, T.-C. Fu, V. Ng, and R. W. P. Luk, "An evolutionary approach to pattern-based time series segmentation," IEEE Transactions on Evolutionary Computation, vol. 8, no. 5, pp. 471 - 489, Oct. 2004.[Non-Patent Document 43] F.-L. Chung, T.-C. Fu, V. Ng, and R. W. P. Luk, "An evolutionary approach to pattern-based time series segmentation," IEEE Transactions on Evolutionary Computation, vol. 8, no. 5, pp. 471 - 489, Oct. 2004. [비특허문헌 44] "Efficient Time Series Matching by Wavelets," in Proceedings of the 15th International Conference on Data Engineering, Washington, DC, USA, 1999, p. 126-.[Non-Patent Document 44] "Efficient Time Series Matching by Wavelets," in Proceedings of the 15th International Conference on Data Engineering, Washington, DC, USA, 1999, p. 126-. [비특허문헌 45] M. Kosmahl, U. Pauser, M. Anlauf, and G. Klㆆppel, "Pancreatic ductal adenocarcinomas with cystic features: neither rare nor uniform," Mod. Pathol., vol. 18, no. 9, pp. 1157-1164, Sep. 2005.[Non-Patent Document 45] M. Kosmahl, U. Pauser, M. Anlauf, and G. Klul ppel, "Pancreatic ductal adenocarcinomas with cystic features: Pathol., Vol. 18, no. 9, pp. 1157-1164, Sep. 2005. [비특허문헌 46] M. Kallergi, "Evaluation Strategies for Medical- Image Analysis and Processing Methodologies," in Medical Image Analysis Methods, vol. 18, L. Costaridou, Ed. CRC Press, 2005.[Non-Patent Document 46] M. Kallergi, "Evaluation Strategies for Medical-Image Analysis and Processing Methodologies," in Medical Image Analysis Methods, vol. 18, L. Costaridou, Ed. CRC Press, 2005. [비특허문헌 47] J. K. Udupa, V. R. LaBlanc, H. Schmidt, C. Imielinska, P. K. Saha, G. J. Grevera, Y. Zhuge, L. M. Currie, P. Molholt, and Y. Jin, "Methodology for evaluating image-segmentation algorithms," pp. 266-277, May 2002.[Non-Patent Document 47] JK Udupa, VR LaBlanc, H. Schmidt, C. Imielinska, PK Saha, GJ Grevera, Y. Zhuge, LM Currie, P. Molholt, and Y. Jin, "Methodology for Evaluating Image- , pp. 266-277, May 2002. [비특허문헌 48] T. Allen, Particle Size Measurement: Volume 1: Powder sampling and particle size measurement. Springer, 1996.[Non-Patent Document 48] T. Allen, Particle Size Measurement: Volume 1: Powder sampling and particle size measurement. Springer, 1996. [비특허문헌 49] K. Rodenacker and E. Bengtsson, "A feature set for cytometry on digitized microscopic images," Analytical Cellular Pathology, vol. 25, no. 1, pp. 1-36, Jan. 2003.[Non-Patent Document 49] K. Rodenacker and E. Bengtsson, "A feature set for cytometry on digitized microscopic images," Analytical Cellular Pathology, vol. 25, no. 1, pp. 1-36, Jan. 2003. [비특허문헌 50] W. . Rasband, "ImageJ," 2012-1997. [Online]. Available: http://imagej.nih.gov/ij/. [Accessed: 25-Aug-2012].[Non-Patent Document 50] W. Rasband, "ImageJ," 2012-1997. [Online]. Available: http://imagej.nih.gov/ij/. [Accessed: 25-Aug-2012]. [비특허문헌 51] V. N. Vapnik, Statistical Learning Theory, 1st ed. Wiley-Interscience, 1998.[Non-Patent Document 51] V. N. Vapnik, Statistical Learning Theory, 1st ed. Wiley-Interscience, 1998. [비특허문헌 52] C. J. C. Burges, "A Tutorial on Support Vector Machines for Pattern Recognition," Data Min. Knowl. Discov., vol. 2, no. 2, pp. 121-167, Jun. 1998.[Non-Patent Document 52] C. J. C. Burges, "A Tutorial on Support Vector Machines for Pattern Recognition," Data Min. Knowl. Discov., Vol. 2, no. 2, pp. 121-167, Jun. 1998. [비특허문헌 53] C.-C. Chang and C.-J. Lin, "LIBSVM: A library for support vector machines," ACM Trans. Intell. Syst. Technol., vol. 2, no. 3, pp. 27:1-27:27, May 2011.[Non-patent Document 53] C.-C. Chang and C.-J. Lin, "LIBSVM: A library for support vector machines," ACM Trans. Intell. Syst. Technol., Vol. 2, no. 3, pp. 27: 1-27: 27, May 2011. [비특허문헌 54] D. L. Verbyla and J. A. Litvaitis, "Resampling methods for evaluating classification accuracy of wildlife habitat models," Environmental Management, vol. 13, no. 6, pp. 783-787, Nov. 1989.[Non-Patent Document 54] D. L. Verbyla and J. A. Litvaitis, "Resampling methods for evaluating classification accuracy of wildlife habitat models," Environmental Management, vol. 13, no. 6, pp. 783-787, Nov. 1989. [비특허문헌 55] H. J. Ader, G. J. Mellenbergh, and D. J. Hand, Advising on research methods : a consultant's companion. Huizen, Netherlands: Johannes van Kessel Pub, 2008.[Non-Patent Document 55] H. J. Ader, G. J. Mellenbergh, and D. J. Hand, Advising on research methods: a consultant's companion. Huizen, Netherlands: Johannes van Kessel Pub, 2008. [비특허문헌 56] J. A. Swets, "Measuring the accuracy of diagnostic systems," Science, vol. 240, no. 4857, pp. 1285-1293, Jun. 1988.[Non-Patent Document 56] J. A. Swets, "Measuring the accuracy of diagnostic systems," Science, vol. 240, no. 4857, pp. 1285-1293, Jun. 1988. [비특허문헌 57] M. Greiner, D. Pfeiffer, and R. D. Smith, "Principles and practical application of the receiver-operating characteristic analysis for diagnostic tests," Prev. Vet. Med., vol. 45, no. 1-2, pp. 23-41, May 2000.[Non-Patent Document 57] M. Greiner, D. Pfeiffer, and R. D. Smith, "Principles and Practical Application of the Receiver-Operating Characteristic Analysis for Diagnostic Tests," Vet. Med., Vol. 45, no. 1-2, pp. 23-41, May 2000. [비특허문헌 58] L. J. Williams and H. Abdi, "Fisher's least significance difference (LSD) test," in Encyclopedia of Research Design, 1st ed., SAGE Publications, Inc, 2010, pp. 491-494.[Non-Patent Document 58] L. J. Williams and H. Abdi, "Fisher's least significance difference (LSD) test," in Encyclopedia of Research Design, 1st ed., SAGE Publications, 491-494. [비특허문헌 59] R.L. Graham, "An efficient algorithm for determining the convex hull of a finite planar set", Info. Proc. Lett. 1, 132-133 (1972).[Non-Patent Document 59] R.L. Graham, "An efficient algorithm for determining the convex hull of a finite planar set", Info. Proc. Lett. 1, 132-133 (1972).

본 발명의 목적은 상술한 바와 같은 문제점을 해결하기 위한 것으로, 주어진 조직세포 영상으로부터 형태학적 특징을 추출하고, 추출된 특징을 기반으로 췌장선암을 진단하는 형태학적 특징 기반 췌장선암 등급 진단 방법을 제공하는 것이다. 즉, PDAC(pancreatic ductal adenocarcinomas, 췌장관 선암종 또는 췌장선암)를 식별하고 그들의 병기를 구분하기 위하여, PDAC의 진단과 등급(grading)을 위한 새로운 형태학적 특징들을 추출하고, 추출된 특징을 이용하여 췌장선압의 등급을 진단하는 방법을 제공하는 것이다.It is an object of the present invention to provide a method for diagnosing pancreatic adenocarcinoma based on morphological features extracted from a given tissue cell image and diagnosing pancreatic adenocarcinoma based on extracted features . In other words, to identify PDACs (pancreatic ductal adenocarcinomas, pancreatic adenocarcinomas or pancreatic adenocarcinomas) and to distinguish their stage, new morphological features for diagnosis and grading of PDACs are extracted, And to provide a method of diagnosing the grade of line pressure.

특히, 본 발명의 목적은 췌장선암에 대한 병리진단에서 주로 관심을 두는 부위인 내강과 상피세포로 구성되는 관을 대상으로, 내강과 상피세포들을 세그먼테이션하고, 식별된 오브젝트들로부터 췌장선암을 진단하기 위해 고안된 형태학적 특징들 추출하는 형태학적 특징 기반 췌장선암 등급 진단 방법을 제공하는 것이다.Particularly, it is an object of the present invention to provide a method for diagnosing pancreatic adenocarcinoma by segmenting luminal and epithelial cells and identifying the pancreatic adenocarcinoma from the identified objects in a tube composed of luminal and epithelial cells, And to provide a method for diagnosing pancreatic adenocarcinoma grade based on morphological features extracting morphological features designed for the diagnosis of pancreatic adenocarcinoma.

췌장선암 진단 시 주로 검토되는 부위는 내강과 상피세포로 구성되는 관 부위이다. 따라서 본 발명은 각 오브젝트들(내강, 상피세포, 비상피세포)을 주어진 조직포 영상으로부터 세그멘테이션하고, 진단을 위한 형태학적 특징들을 추출하고, 이후, 추출된 특징들을 이용하여 진단을 위한 SVM모델을 학습시키고 췌장선암의 진단 및 병기를 구분하는 췌장선암 등급 진단 방법을 제공하는 것을 목적으로 한다.In the diagnosis of pancreatic adenocarcinoma, the most common site is the lumen of the lumen and epithelium. Therefore, the present invention seg- ments each object (lumen, epithelial cells, non-epithelial cells) from a given tissue IV, extracts morphological features for diagnosis, and then uses the extracted features to learn the SVM model for diagnosis And to provide a method for diagnosing pancreatic adenocarcinoma which distinguishes diagnosis and stage of pancreatic adenocarcinoma.

상기 목적을 달성하기 위해 본 발명은 조직세포 영상으로부터 형태학적 특징을 추출하여 췌장선암을 진단하는 형태학적 특징 기반 췌장선암 등급 진단 방법에 관한 것으로서, 상기 조직세포 영상으로부터 형태학적 특징을 추출하는 제1 단계; 지도학습 기반의 분류기를 이용하여 진단 모델을 구성하는 제2 단계; 및, 상기 진단 모델을 이용하여, 상기 조직세포 영상의 췌장선암을 진단하는 제3 단계를 포함하고, 상기 진단 모델은 입력되는 형태학적 특징에 대하여 췌장선암 여부 또는 등급을 결정하는 것을 특징으로 한다.In order to accomplish the above object, the present invention relates to a method for diagnosing pancreatic adenocarcinoma based on morphological characteristics, which extracts morphological characteristics from tissue cell images and diagnoses pancreatic adenocarcinoma. step; A second step of constructing a diagnostic model using a map-based classifier; And a third step of diagnosing pancreatic adenocarcinoma of the tissue cell image using the diagnostic model, wherein the diagnostic model determines the presence or degree of pancreatic adenocarcinoma with respect to the inputted morphological characteristics.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 제1 단계는, (a) 조직세포 영상에서 내강 영역을 세그멘테이션하는 단계; (b) 상기 조직세포 영상에서 핵들을 식별하는 단계; (c) 식별된 핵들을 상피 세포 핵과 비상피 세포 핵으로 구분하는 단계; (d) 상기 내강 영역에 대하여 내강 특징을 추출하는 단계; 및, (e) 상기 상피세포 핵들로부터 상피세포 특징을 추출하는 단계를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method for diagnosing pancreatic adenocarcinoma based on morphological characteristics, comprising the steps of: (a) segmenting a lumen area in a tissue cell image; (b) identifying nuclei in the tissue cell image; (c) dividing the identified nuclei into epithelial and non-epithelial cell nuclei; (d) extracting a luminal feature for the lumenal region; And (e) extracting epithelial cell characteristics from the epithelial cell nuclei.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 진단 모델은 SVM(Support Vector Machine) 분류기를 이용하는 것을 특징으로 한다.Further, the present invention is characterized in that, in the diagnostic method of pancreatic adenocarcinoma grade based on morphological characteristics, the diagnostic model uses SVM (Support Vector Machine) classifier.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 제2 단계에서, 상기 형태학적 특징들의 벡터(이하 특징벡터)와 진단결과의 등급의 쌍으로 구성된 학습데이터로 상기 분류기를 학습하여 상기 진단 모델을 구성하는 것을 특징으로 한다.Further, the present invention provides a method for diagnosing pancreatic adenocarcinoma grade based on morphological characteristics, wherein in the second step, learning of the classifier is performed with learning data composed of pairs of classes of morphological features (hereinafter, referred to as characteristic vectors) Thereby constructing the diagnostic model.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 (a)단계에서, 상기 내강 영역을 씨드 영역 양성(SGR) 방법에 의하여 식별하여 세그멘테이션하는 것을 특징으로 한다.Further, the present invention provides a method for diagnosing pancreatic adenocarcinoma based on morphological characteristics, wherein in the step (a), the lumenal region is identified and segmented by a seed region positive (SGR) method.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 (a)단계는, (a1) 상기 조직세포 영상에 중간값 필터링과 배경상관 알고리즘을 적용한 후 최대 엔트로피 문턱치를 적용하여 이진 영상을 획득하는 단계; (a2) 상기 이진 영상으로부터 방향 누적맵을 생성하는 단계; (a3) 상기 방향 누적맵의 지역 최대점들을 후보 씨드점으로 선정하는 단계; 및, (a4) 상기 후보 씨드점들을 SRG 방법의 초기 파라미터로 이용하여 내강 영역의 경계를 구하는 단계를 포함하는 것을 특징으로 한다.(A1) applying a median filtering and a background correlation algorithm to the tissue cell image, and applying a maximum entropy threshold to obtain a binary image of the pancreas adenocarcinoma based on a morphological feature, ; (a2) generating a direction cumulative map from the binary image; (a3) selecting local maximum points of the direction accumulation map as candidate seed points; And (a4) finding the boundary of the lumenal region using the candidate seed points as an initial parameter of the SRG method.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 (a3)단계에서, 상기 방향 누적맵에 문턱치 처리를 적용하여 후보 씨드점을 구하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method for diagnosing pancreatic adenocarcinoma based on a morphological characteristic, wherein a candidate seed point is obtained by applying a threshold process to the direction cumulative map in the step (a3).

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 (b)단계에서, 상기 조직세포 영상에 k평균에 기반한 문턱치 처리를 한 후, 와더쉐드(Wathershed) 알고리즘을 적용하여 핵을 분리하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method for diagnosing pancreatic adenocarcinoma based on a morphological characteristic, comprising the steps of: (a) subjecting a tissue cell image to a threshold processing based on a k- .

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 (c)단계에서, 상기 내강 영역의 경계에 인접한 핵들을 상피세포 핵으로 구분하고, 상기 식별된 핵 전체에서 상피세포 핵을 제외한 나머지를 비상피 세포 핵으로 구분하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method for diagnosing pancreatic adenocarcinoma based on a morphological characteristic, wherein in step (c), nuclei adjacent to the border of the lumenal region are divided into epithelial cell nuclei, And the remainder is divided into non-epithelial cell nuclei.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 상피세포 핵들의 집합 NE를 다음 [수식 1]에 의해 구하는 것을 특징으로 한다.Further, the present invention is characterized in that in the method for diagnosing pancreatic adenocarcinoma grade based on morphological characteristics, the set N E of epithelial cell nuclei is obtained by the following [Expression 1].

[수식 1][Equation 1]

Figure 112013042898076-pat00001
Figure 112013042898076-pat00001

단, BO는 내강 영역의 경계이고, centroid(-)는 식별된 핵 n의 중심 포인트를 반환하는 함수이고, distance(·,·) 는 주어진 두 점들 사이의 유클리디언 거리를 반환하는 함수.Where B O is the boundary of the lumen region, centroid (-) is the function that returns the center point of the identified nucleus n, and distance (·, ·) is the function that returns the Euclidian distance between two given points.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 (d)단계는, (d1) 상기 내강 영역의 경계(이하 오리지널 경계)로부터 이상적인 경계를 구하는 단계; (d2) 상기 오리지널 경계와 상기 이상적인 경계에서 서로 수직하는 점들의 거리를 이용하여 이형성 진폭 시그니쳐를 구하는 단계; 및, (d3) 상기 이형성 진폭 시그니쳐로부터 내강 특징을 추출하는 단계를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method for diagnosing pancreatic adenocarcinoma based on a morphological characteristic, comprising the steps of: (d1) obtaining an ideal boundary from a boundary of the lumenal region (hereinafter referred to as an original boundary); (d2) obtaining a dyspeakable amplitude signature using a distance of points perpendicular to each other at the original boundary and the ideal boundary; And (d3) extracting the luminal feature from the dyspeakable amplitude signature.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 (d1)단계에서, 상기 이상적인 경계는 상기 오리지널 경계의 볼록껍질을 상기 오리지널 경계의 내부 영역의 크기로 스케일링하여 구하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a method for diagnosing pancreatic adenocarcinoma based on a morphological characteristic, wherein in the step (d1), the ideal boundary is obtained by scaling the convex shell of the original boundary to a size of an inner region of the original boundary do.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 (d2)단계에서, 상기 이형성 진폭은 이상적인 경계 상의 포인트에서 수직에 위치하는 오리지널 경계 상의 포인트 사이의 거리로 표현하되, 오리지널 경계 상의 포인트가 이상적 경계의 바깥 경계 또는 안쪽 경계에 있는지에 따라 부호를 달리하는 거리로 표현되는 것을 특징으로 한다.According to the present invention, there is provided a method for diagnosing pancreatic adenocarcinoma based on a morphological characteristic, wherein in the step (d2), the emissivity amplitude is expressed as a distance between points on an original boundary vertically positioned at an ideal boundary point, Is expressed as a distance that differs in sign depending on whether the point on the boundary is the outer boundary or the inner boundary of the ideal boundary.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 (d3)단계에서, 상기 이형성 진폭 시그니쳐는 상기 이상적인 경계의 둘레 길이에 대한 둘레 상의 포인트(이하 이상적인 경계 포인트)의 이형성 진폭으로 나타내고, 상기 이형성 진폭은 상기 이상적인 경계 포인트에서 수직에 위치하는 오리지널 경계 상의 포인트 사이의 부호를 가진 거리인 것을 특징으로 한다.The present invention also provides a method for diagnosing pancreatic adenocarcinoma grade based on morphologic characteristics, wherein in the step (d3), the dysplastic amplitude signature is a dystrophic amplitude of a circumferential point (hereinafter, an ideal boundary point) with respect to a circumferential length of the ideal boundary And the emissivity amplitude is a distance having a sign between points on an original boundary located vertically at the ideal boundary point.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 이형성 진폭은 다음 [수식 2]의 이형성 진폭 함수 A(t)에 의해 구해지는 것을 특징으로 한다.Further, the present invention is characterized in that in the method for diagnosing pancreatic adenocarcinoma grade based on morphological characteristics, the above-mentioned dyssine amplitude is obtained by the dyssine amplitude function A (t) of the following [Expression 2].

[수식 2][Equation 2]

Figure 112013042898076-pat00002
Figure 112013042898076-pat00002

단, t는 상기 이상적인 경계에 있는 포인트들의 순서를 가리키는 인덱스 변수이고, sgnt(q)는 pt∈BI 에서 수직 위치에 있는 점 q∈BO 사이의 거리에 대한 부호를 나타내는 함수로서 점 q가 점 pt의 바깥 경계에 위치해 있으면 +1, 안쪽 경계에 위치해 있으면 -1을 반환한다.Where t is an index variable indicating the order of the points at the ideal boundary and sgn t (q) is a function representing the sign of the distance between vertex q ∈B 0 in p t ∈ B I , Returns -1 if q is at the outer boundary of the point p t , or -1 if it is at the inner boundary.

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 내강 특징은 이형성 진폭들에 대한 제곱 평균의 제곱근(RMSAA), 이형성 진폭 시그니쳐의 변곡점에서의 변화량의 합(TSAV), 이형성 비율(AtypiaRatio), 이형성 영역의 개수(#AtypiaRegions) 중 어느 하나 이상인 것을 특징으로 한다.The present invention also provides a method of diagnosing a pancreatic adenocarcinoma grade based on morphological features, wherein the luminal feature comprises a root mean square (RMSAA) of the root mean square for the dendritic amplitudes, a sum of the change amounts at the inflection point of the dendritic amplitude signature (TSAV) (AtypiaRatio), and the number of releasable regions (#AppliaRegions).

또, 본 발명은 형태학적 특징 기반 췌장선암 등급 진단 방법에 있어서, 상기 상피세포 특징은 상피 세포질 길이(CytoplasmLength) 및 상피세포의 세포질 길이에 대한 표준편차(CytoplasmLengthSD) 중 어느 하나 이상인 것을 특징으로 한다.
The present invention also provides a method of diagnosing pancreatic adenocarcinoma based on a morphological characteristic, wherein the epithelial cell characteristic is characterized by being at least one of a cytoplasm length and a standard deviation (CytoplasmLength SD ) of a cytoplasmic length of epithelial cells .

상술한 바와 같이, 본 발명에 따른 형태학적 특징 기반 췌장선암 등급 진단 방법에 의하면, 추출된 형태학적 특징들로 췌장선암을 정확하게 판별하고 각 병기들을 구분할 수 있는 효과가 얻어진다.As described above, according to the morphological feature-based diagnosis method of pancreatic adenocarcinoma grade according to the present invention, the extracted morphological characteristics can accurately discriminate pancreatic adenocarcinoma and distinguish each stage.

특히, 대표적인 통계적 분류기법인 SVM모델을 학습하고 분류성능을 평가한 결과, 본 발명에 의해 추출된 형택학적 특징들이 정상과 췌장선암을 구분하는데 있어서 94.38%의 분류 정확도로를 보였으며, 췌장선암에 대한 1 등급(Grade1)과 2 등급(Grade2)의 병기 기분에 있어서도 97.03%의 분류 정확도를 보이고 있다.
In particular, the SVM model, which is a representative statistical classification technique, was evaluated and the classification performance was evaluated. As a result, the taxonomic features extracted by the present invention showed a classification accuracy of 94.38% in discriminating between normal and pancreatic adenocarcinoma. The classification accuracy of 97.03% is shown for the Grade 1 and Grade 2 staging.

도 1은 본 발명을 실시하기 위한 전체 시스템의 구성도.
도 2는 본 발명의 대상인 췌장선암의 조직세포 영상으로서, (a) 정상관, (b) 등급 1(well-differentiated), (c) 등급 2(moderately differentiated), (d) 등급 3(poorly differentiated)의 영상의 예시도.
도 3과 도 4는 본 발명의 일실시예에 따른 형태학적 특징 기반 췌장선암 등급 진단 방법을 설명하는 도식화된 도면과 흐름도.
도 5는 본 발명의 일실시예에 따른 췌장선암의 등급을 위한 형태학적 특징 추출 방법을 설명하는 흐름도.
도 6은 본 발명에 따른 내강 영역 식별 과정을 설명하는 각 과정의 예시 영상.
도 7은 본 발명에 따른 식별된 핵의 집합의 예시 영상.
도 8은 본 발명에 따른 상피-핵 집합 구하는 알고리즘.
도 9는 본 발명에 따른 주요 표기를 나타낸 표.
도 10은 본 발명에 따른 오리지날 내강 경계와 이상적인 내강 경계의 영상.
도 11은 본 발명에 따른 이형성-진폭 측정 과정을 보여주는 영상 및 그래프.
도 12는 본 발명에 따른 도 1의 영상에 대한 이형성-진폭 시그너쳐.
도 13은 본 발명에 따른 도 12의 등급 2에 대한 이형성 시그너쳐의 일부분과 PIP를 나타낸 그래프.
도 14는 본 발명에 따른 (a) 등급 2의 조직세포 영상과, (a) 이형성 영역의 영상.
도 15는 본 발명에 따른 정상관과 등급 1의 상피 세포의 CytoplasmLength 측정 결과(파란색 라인) 영상.
도 16은 본 발명의 실험에 따른 디지털 슬라이드의 정보를 나타낸 표.
도 17은 본 발명의 실험에 따른 획득된 실험 영상의 개수를 나타낸 표.
도 18은 본 발명의 실험에 따른 분류 실험에서 사용된 형태학적 특징들에 대한 표.
도 19는 본 발명의 실험에 따른 분류 실험들에 사용된 특징 집합들에 대한 심벌과 차원에 대한 표.
도 20은 본 발명의 실험에 따른 SVM 분류기를 학습하고 평가하기 위한 학습 데이터와 테스트 데이터 집합의 개수에 대한 표.
도 21은 본 발명의 실험에 따른 각 특징 집합에 대한 정상관과 PDAC를 분류하기 위한 평가 결과 표.
도 22는 본 발명의 실험에 따른 각 특징 지밥에 대한 정상관과 PDAC에 대한 분류 정확도의 비교 그래프.
도 23은 본 발명의 실험에 따른 케이스 1의 분류기를 위한 ROC 곡선과 AUC 값의 비교 그래프로서, (a) ROC curve and AUC of CNF; (b) ROC curves and AUC values for CLF, PLF, and ALF; (c) ROC curves and AUC values for CEF, PEF, and AEF; (d) ROC curves and AUC values for CDF, PDF, and ADF; (e) ROC curves and AUC values for CTF, PTF, and ATF에 대한 그래프.
도 24는 본 발명의 실험에 따른 각 특징 집합에 대한 등급 1과 등급 2 사이를 구별하는 평가 결과표.
도 25는 본 발명의 실험에 따른 각 특징 지밥에 대한 등급 1과 등급 2에 대한 분류 정확도의 비교 그래프.
도 26은 본 발명의 실험에 따른 케이스 2의 분류기를 위한 ROC 곡선과 AUC 값의 비교 그래프로서, (a) ROC curve and AUC of CNF; (b) ROC curves and AUC values for CLF, PLF, and ALF; (c) ROC curves and AUC values for CEF, PEF, and AEF; (d) ROC curves and AUC values for CDF, PDF, and ADF; (e) ROC curves and AUC values for CTF, PTF, and ATF에 대한 그래프.
도 27은 본 발명의 실험에 따른 F-test의 결과와 비상피세포 특징에 대한 통계표.
도 28은 본 발명의 실험에 따른 F-test의 결과와 내강 특징에 대한 통계표.
도 29는 본 발명의 실험에 따른 F-test의 결과와 상피세포 특징에 대한 통계표.
도 30은 본 발명의 실험에 따른 비상피세포 특징의 LSD-test와 F-test에 대한 표.
도 31은 본 발명의 실험에 따른 내강 특징의 LSD-test와 F-test에 대한 표.
도 32는 본 발명의 실험에 따른 상피세포 특징의 LSD-test와 F-test에 대한 표.
BRIEF DESCRIPTION OF THE DRAWINGS Fig. 1 is a configuration diagram of an entire system for implementing the present invention; Fig.
Figure 2 is a histological image of a pancreatic adenocarcinoma of the pancreas adenocarcinoma, which is a subject of the present invention. (A) Positive correlation, (b) well-differentiated, (c) moderately differentiated, (d) Fig.
FIGS. 3 and 4 are schematic diagrams and flowcharts illustrating a method for diagnosing a pancreatic adenocarcinoma grade based on a morphological feature according to an embodiment of the present invention. FIG.
FIG. 5 is a flowchart illustrating a morphological feature extraction method for classifying pancreatic adenocarcinoma according to an embodiment of the present invention. FIG.
6 is an exemplary image of each process for explaining the lumen area identification process according to the present invention.
Figure 7 is an exemplary image of a set of identified nuclei according to the present invention.
8 is an algorithm for obtaining an epithelium-nucleus set according to the present invention.
9 is a table showing main notations according to the present invention.
Figure 10 is an image of the original luminal boundary and the ideal luminal boundary according to the present invention.
11 is an image and a graph showing the process of measuring the releasing-amplitude according to the present invention.
Figure 12 is a diagrammatic-amplitude signature for the image of Figure 1 according to the present invention.
Figure 13 is a graph showing a portion of the release signature and PIP for Class 2 of Figure 12 in accordance with the present invention.
FIG. 14 shows (a) grade 2 tissue cell image and (a) imaging of a dysplastic area according to the present invention.
FIG. 15 is an image (blue line) of CytoplasmLength measurement results of the epithelial cells of the positive correlation and grade 1 according to the present invention.
16 is a table showing information of a digital slide according to the experiment of the present invention.
17 is a table showing the number of obtained experimental images according to the experiment of the present invention.
18 is a table for morphological features used in the classification experiment according to the experiment of the present invention.
Figure 19 is a table of symbols and dimensions for the feature sets used in the classification experiments according to the experiments of the present invention.
20 is a table for the number of test data sets and learning data for learning and evaluating the SVM classifier according to the experiment of the present invention;
FIG. 21 is a table showing evaluation results for classifying positive correlation and PDAC for each feature set according to the experiment of the present invention; FIG.
FIG. 22 is a graph showing the comparison between the positive correlation for each characteristic Jipp and the classification accuracy for PDAC according to the experiment of the present invention.
23 is a graph comparing the ROC curve and the AUC value for the classifier of Case 1 according to the experiment of the present invention, wherein (a) ROC curve and AUC of CNF; (b) ROC curves and AUC values for CLF, PLF, and ALF; (c) ROC curves and AUC values for CEF, PEF, and AEF; (d) ROC curves and AUC values for CDF, PDF, and ADF; (e) ROC curves and AUC values for CTF, PTF, and ATF.
24 is an evaluation result table for distinguishing between class 1 and class 2 for each feature set according to the experiment of the present invention.
25 is a graph showing a comparison of classification accuracy for Grade 1 and Grade 2 for each characteristic Jeep according to the experiment of the present invention.
FIG. 26 is a graph comparing the ROC curve and the AUC value for the classifier of case 2 according to the experiment of the present invention, wherein (a) ROC curve and AUC of CNF; (b) ROC curves and AUC values for CLF, PLF, and ALF; (c) ROC curves and AUC values for CEF, PEF, and AEF; (d) ROC curves and AUC values for CDF, PDF, and ADF; (e) ROC curves and AUC values for CTF, PTF, and ATF.
FIG. 27 is a statistical table for F-test results and non-epithelial cell characteristics according to the experiment of the present invention.
Fig. 28 is a statistical table for the results of the F-test and the luminal characteristics according to the experiment of the present invention.
29 is a statistical table for the results of the F-test and the epithelial cell characteristics according to the experiment of the present invention.
FIG. 30 is a table for LSD-test and F-test of the characteristics of non-epithelial cells according to the experiment of the present invention.
31 is a table for LSD-test and F-test of the lumenal characteristics according to the experiment of the present invention.
32 is a table for LSD-test and F-test of epithelial cell characteristics according to the experiment of the present invention.

이하, 본 발명의 실시를 위한 구체적인 내용을 도면에 따라서 설명한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the present invention will be described in detail with reference to the drawings.

또한, 본 발명을 설명하는데 있어서 동일 부분은 동일 부호를 붙이고, 그 반복 설명은 생략한다.
In the description of the present invention, the same parts are denoted by the same reference numerals, and repetitive description thereof will be omitted.

먼저, 본 발명을 실시하기 위한 전체 시스템의 구성에 대하여 도 1을 참조하여 설명한다.First, the overall system configuration for carrying out the present invention will be described with reference to Fig.

도 1에서 보는 바와 같이, 본 발명에 따른 형태학적 특징 기반 췌장선암 등급 진단 방법은 컴퓨터 단말(20) 상의 프로그램 시스템(30)으로 실시될 수 있다. 이때, 프로그램 시스템을 췌장선암 등급 진단 시스템(30)이라 부르기로 한다.As shown in FIG. 1, the method for diagnosing pancreatic adenocarcinoma based on morphological characteristics according to the present invention can be implemented in the program system 30 on the computer terminal 20. At this time, the program system is referred to as a pancreatic adenocarcinoma grade assessment system (30).

즉, 췌장선암 등급 진단 시스템(30)의 각 기능들은 컴퓨터 프로그램으로 구현되어 컴퓨터 단말(20)에 설치되어, 사용자에 의해 명령 등을 컴퓨터 단말(20)의 입력장치를 통해 입력받거나, 추출된 형태학적 특징, 진단 결과 등을 컴퓨터 단말(13)의 출력장치를 통해 출력한다. 한편, 췌장선암 등급 진단 시스템(30)에서 필요한 데이터들은 컴퓨터 단말(20)의 하드디스크 등 저장공간에 저장되어 이용된다.That is, the respective functions of the pancreatic adenocarcinoma grade diagnosis system 30 are implemented in a computer program and installed in the computer terminal 20, so that the user can input commands or the like through the input device of the computer terminal 20, Diagnostic results, and the like through the output device of the computer terminal 13. [ On the other hand, data required in the pancreatic adenocarcinoma grade diagnosis system 30 is stored in a storage space such as a hard disk of the computer terminal 20 and used.

췌장선암 등급 진단 시스템(30)에 입력되는 데이터는 조직세포 영상(10)으로서, 특히, 췌장 부분을 촬영한 영상 또는 이미지이다.The data input to the pancreatic adenocarcinoma grade assessment system 30 is a tissue cell image 10, in particular an image or an image of the pancreas part.

다른 실시예로서, 췌장선암 등급 진단 시스템(30)은 마이크로 프로그램으로 구성되어 마이크로프로세서에 의해 구동되는 하나의 전용 IC칩으로 실시되거나, ASIC(주문형 반도체) 등 하나의 전자회로로 구성되어 실시될 수 있다. 즉, 소프트웨어 형태, FPGA 칩이나 여러 개의 회로소자로 구성된 전자회로의 형태로 구성될 수도 있다. 그 외 가능한 다른 형태도 실시될 수 있다. 그러나 이하에서 설명의 편의를 위해 컴퓨터 단말(20)에 구현된 췌장선암 등급 진단 시스템(30)으로 설명하기로 한다.
In another embodiment, the pancreatic adenocarcinoma grade diagnostic system 30 may be implemented as a single dedicated IC chip configured as a microprogram and driven by a microprocessor, or as an electronic circuit such as an ASIC have. In other words, it may be configured in the form of software, an electronic circuit composed of an FPGA chip or a plurality of circuit elements. Other possible forms may also be practiced. However, for convenience of explanation, the pancreatic adenocarcinoma grade diagnosis system 30 implemented in the computer terminal 20 will be described below.

다음으로, 본 발명에 따른 형태학적 특징 추출 방법을 설명하기에 앞서, 특징 추출의 대상인 췌장선암(PDAC, 췌장관 선암종)에 대하여 도 2를 참조하여 먼저 설명한다.Next, before describing the morphological feature extraction method according to the present invention, pancreatic adenocarcinoma (PDAC, pancreatic duct adenocarcinoma), which is an object of feature extraction, will be described first with reference to FIG.

췌장암은 소화기 암으로 인한 사망 원인 중 결장암 다음가는 암종(neoplasm)으로서, 서구에서는 전체 암으로 인한 사망 원인 중 5위를 차지하고 있다[비특허문헌 32]. 이중 췌장선암은 전체 췌장 종양(neoplasm)들 중 85~90%를 차지하고 있다. 주로 80%가 60~80세 환자들에게서 나타나며, 40세 이하 사람들에게서는 매우 드물게 나타난다. 성별로는 여성이 남성보다 발병률이 약간 더 높게 나타나고 있다. 인종별로는 흑인이 가장 높은 발병률을 보인다[비특허문헌 33]. 췌장선암은 치료에 있어서 수술적 치료가 최선의 치료방법으로 알려져 있다. 그러나 췌장선암의 조기진단은 어렵기 때문에 완치를 기대할 수 있는 근치적 절제술의 대상이 되는 환자는 약 5~22%정도 이다. 따라서 수술 전 병기의 정확한 결정은 치료방침과 예후를 결정하는 핵심적인 요소가 된다[비특허문헌 34].Pancreatic cancer is the next most common cause of death from gastrointestinal cancer and is the fifth most common cause of cancer death in the western world [Non-patent document 32]. Double pancreatic adenocarcinoma accounts for 85% to 90% of all pancreatic neoplasms. Eighty percent of them are seen in patients aged 60 to 80 years, and very rarely in people under 40 years of age. By gender, the incidence of women is slightly higher than that of men. Blacks have the highest incidence rate by race [Non-Patent Document 33]. Surgical treatment of pancreatic adenocarcinoma is known to be the best treatment method. However, because early diagnosis of pancreatic adenocarcinoma is difficult, about 5 ~ 22% of the patients are eligible for curative resection. Therefore, precise determination of the preoperative stage is a key factor in determining treatment strategy and prognosis [Non-Patent Document 34].

췌장선암은 관의 구조적인 특징과 핵의 형태학적인 특징들에 의해 등급 1(Well-differentiated carcinomas), 등급 2(Moderately differentiated carcinomas), 등급 3(Poorly differentiated ductal adenocarcinomas)들로 구분된다.Pancreatic adenocarcinomas are classified into well-differentiated carcinomas, moderately differentiated carcinomas, and grade 3 (Poorly differentiated ductal adenocarcinomas) according to the structural features of the ducts and morphological features of the nucleus.

먼저 등급 1(Well differentiated carcinomas)들은 관유사(duct-like) 구조를 가지며, 중간 크기의 분비선종양(neoplastic gland)들로 결합된다. 일반적으로 통모양(Tubular) 혹은 체(Cribriform) 형태를 보이며, 관에서 불규칙한 유두상을 보일 수 있다. 세포의 유사분열(mitotic activity)은 적게 나타나다. 세포는 원주(columnar) 경향을 보이며, 점액을 생성한다. 그리고 상피세포 중 몇몇은 극성을 잃어 버린다.First, well-differentiated carcinomas have a duct-like structure and are joined by neoplastic glands. It is usually tubular or cribriform, and may have an irregular papillary appearance in the tube. The mitotic activity of the cells is less. Cells show columnar tendency and produce mucus. And some of the epithelial cells lose their polarity.

등급 2(Moderately differentiated carcinomas)는 대게 중간 크기의 관유사 모양(duct-like)과 통모양(tubular) 구조의 혼합된 형태를 보이며, 결합조직형성 스트로마(Desmoplastic stroma)에 존재한다. 관의 모양은 불완전하게 형성된 분비선(gland)들이 일반적이다. 등급 1과 비교해서 핵의 크기가 크고, 유사분열(mitotic activity)이 보다 빈번하게 나타나고 점액의 생성은 감소한다.Grade 2 (Moderately differentiated carcinomas) is a mixed form of medium-sized duct-like and tubular structures and is present in the desmoplastic stroma. The shape of the tube is usually incomplete glands. Compared to grade 1, the size of the nucleus is larger, mitotic activity is more frequent and mucus production is decreased.

등급 3(Poorly differentiated ductal carcinomas)은 빈번하게 발생하지는 않는다. 이것은 작은 불규칙한 분비선(gland)과 솔리드 튜머 셀 시트(solid tumour cell sheet)와 네트(net)들의 혼합된 형태를 보인다. 일반적으로 관의 형태는 크고 관유사 모양(duct-like)구조와 관내 종양 요소(intraductal tumour component)들은 잘 나타나지 않는다. 세포에서는 괴사(necrosis)와 출혈(haemorrhage)이 발생하며, 활발한 유사분열(mitotic activity)을 보인다. 암종(Carcinoma)이 점점 진행되면서 분비선(gland)과 주변 조직은 작은 종양세포들의 군집에 의해 침습된다.Poorly differentiated ductal carcinomas do not occur frequently. It shows a mixture of small irregular glands and solid tumour cell sheets and nets. In general, the tube shape is large and duct-like structures and intraductal tumor components are not well represented. In the cells, necrosis and haemorrhage occur and show active mitosis activity. As the carcinoma progresses, the glands and surrounding tissues are invaded by a cluster of small tumor cells.

도 2는 췌장선암의 등급 1과 등급 2, 그리고 등급 3에 대한 조직세포 영상을 보여주고 있다.Figure 2 shows tissue cell images for grade 1, grade 2, and grade 3 of pancreatic adenocarcinoma.

위에서 설명하듯이 등급 3은 잘 발생하지 않으며, 형태학적으로도 등급 1과 등급 2에서 확연한 차이를 보인다. 따라서 본 발명에서는 정상관의 조직과, 등급 1, 그리고 등급 2의 감별진단 하는 것을 주 목표로 한다.
As described above, grade 3 does not occur well, and morphologically there is a clear difference between grade 1 and grade 2. Therefore, in the present invention, the main goal is to differentiate between the tissue of the positive correlation, the grade 1, and the grade 2.

다음으로, 본 발명의 일실시예에 따른 형태학적 특징 기반 췌장선암 등급 진단 방법을 도 3과 4를 참조하여 설명한다. 도 3과 4는 본 발명에 따른 형태학적 특징 기반 췌장선암 등급 진단 방법을 흐름으로 도식화한 도면과 흐름도이다.Next, a method for diagnosing pancreatic adenocarcinoma based on a morphological characteristic according to an embodiment of the present invention will be described with reference to FIGS. 3 and 4. FIG. FIGS. 3 and 4 are flowcharts and flowcharts illustrating a method for diagnosing pancreatic adenocarcinoma based on a morphological characteristic according to the present invention.

도 3 및 도 4에서 보는 바와 같이, 본 발명에 따른 형태학적 특징 기반 췌장선암 등급 진단 방법은 다음과 같이 3개의 단계로 구성된다: (a) 조직세포의 영상처리 및 특징추출 단계(S100), (b) 진단 모델 구성 및 검증 단계(S200), (c) 학습된 모델을 이용한 진단 단계(S300).3 and 4, the method for diagnosing pancreatic adenocarcinoma grade based on morphological characteristics according to the present invention comprises three steps as follows: (a) Image processing and feature extraction step (S100) of tissue cells, (b) a diagnosis model configuration and verification step (S200), (c) a diagnosis step using the learned model (S300).

첫 번째 단계인 영상처리 및 특징 추출 단계에서는 진단시 필요한 정량적인 특징들을 추출하기 위해, 주어진 조직세포 영상을 3부분으로 세그멘테이션 하고, 각 부위의 특징들을 추출되고 특징 데이터베이스에 저장된다. 두 번째 단계는 모델 학습 및 검증 단계로서 첫 번째 단계에서 구성된 특징데이터베이스를 이용하여 진단모델을 학습하고 검증한다. 그리고 마지막 단계는 생성된 진단 모델을 이용하여 조직세포 영상에 대한 진단을 수행한다.
In the first step, image processing and feature extraction, a given tissue cell image is segmented into three parts and the features of each part are extracted and stored in a feature database to extract the quantitative characteristics required for diagnosis. The second step is learning and verifying the diagnostic model using the feature database constructed in the first step as the model learning and verification step. The final step is to perform a diagnosis of tissue cell images using the generated diagnostic model.

먼저, 본 발명의 일실시예에 따른 췌장선암의 등급을 위한 형태학적 특징 추출 방법을 도 5를 참조하여 설명한다. 형태학적 특징 추출 방법은 앞서 조직세포의 영상처리 및 특징추출 단계(100)에 대한 구체적인 방법이다.First, a morphological feature extraction method for classifying pancreatic adenocarcinoma according to an embodiment of the present invention will be described with reference to FIG. The morphological feature extraction method is a concrete method for the image processing and feature extraction step (100) of the tissue cell.

도 5에서 보는 바와 같이, 췌장선암의 등급을 위한 형태학적 특징 추출 방법(또는 과정)(S100)은 내강영역 세그멘테이션 단계(S10); 핵 식별 단계(S20); 상피세포 핵 구분 단계(S30); 내강 특징 추출 단계(S40); 및, 상피세포 추출 단계(S50)로 구성된다.As shown in FIG. 5, a morphological feature extraction method (or process) S100 for classifying pancreatic adenocarcinoma comprises segmenting the lumen area (step S10); Nuclear identifying step (S20); Epithelial cell nuclear differentiation step (S30); Luminal feature extraction step (S40); And an epithelial cell extraction step (S50).

본 과정은 주어진 조직세포 영상을 세가지 타입의 오브젝트들로 식별한다. 3가지 오브젝트 타입은 관을 구성하는 내강과 상피 핵이고, 나머지 하나는 비-상피 핵이다. 도 3b는 조직 이미지를 3가지 오브젝트 타입으로 영상을 세그멘테이션하는 과정을 보여준다. 각 오브젝트 타입의 식별 방법은 이하에서 설명한다.
This process identifies a given tissue cell image as three types of objects. The three object types are the lumen and epithelial nuclei constituting the tube, and the other one is the non-epithelial nucleus. FIG. 3B shows a process of segmenting an image into three object types. The method of identifying each object type will be described below.

먼저, 내강(Lumen) 세그멘테이션 단계(S10)에 대하여 설명한다.First, the lumen segmentation step S10 will be described.

본 발명에서 내강 영역 식별은 씨드 영역 양성("Seeded" region growing, SRG) 방법[비특허문헌 35]을 이용하였다. SGR(seeded region growing) 방법은 초기 시작점을 요구한다. 이전 연구[비특허문헌 36]에서 내강 영역의 후보 씨드점(candidate seed points)을 찾음으로써 SRG 방법을 이용한 내강 영역 식별을 자동화 하였다.In the present invention, luminal area identification was performed using a "Seeded" region growing (SRG) method [Non-Patent Document 35]. The seeded region growing (SGR) method requires an initial starting point. In the previous study [Non-Patent Document 36], the identification of the lumen area using the SRG method was automated by looking for candidate seed points in the lumenal area.

본 발명의 씨드 영역 양성(SGR) 단계(S10)는 구체적으로, (a1) 이진 영상 획득 단계(S11); (a2) 방향 누적맵 생성 단계(S12); (a3) 후보 씨드점 선별 단계(S13); 및, (a4) 후보 씨드점으로 SRG 방법을 적용하여 내강 영역의 경계를 구하는 단계(S14)로 구성된다.Specifically, the SGR step S10 of the present invention comprises: (a1) obtaining a binary image S11; (a2) direction cumulative map generation step S12; (a3) a candidate seed point selection step (S13); And (a4) applying the SRG method to the candidate seed point to obtain the boundary of the lumenal region (S14).

우선 SRG가 보다 쉽게 적용할 수 있도록 주어진 영상에 중간값 필터링(median filtering)과 배경 상관(background correlection)[비특허문헌 37] 알고리즘을 적용한 후 최대 엔트로피 문턱치(maximum entropy treshold)[비특허문헌 38]을 적용하여 이진 영상 A를 만든다(S11).First, a maximum entropy threshold [Non-Patent Document 38] is obtained after applying median filtering and background corrections (Non-Patent Document 37) algorithm to a given image so that SRG can be more easily applied. To generate a binary image A (S11).

이후, 이진 영상 A로부터 씨드점(seed point)을 얻기 위해 방향 누적맵(Direction Cumulative Map) H(A)을 생성한다(S12). 이 맵은 전처리된 이진 영상 A의 각 방향(left, right, up, and down)에 대해 흰색 픽셀들만을 누적하고, 그 누적 값들의 제곱근의 합을 구함으로써 각 내강 영역의 중심에 대응되는 위치에서 큰 값을 가지게 된다.Thereafter, a direction cumulative map H (A) is generated to obtain a seed point from the binary image A (S12). This map accumulates only white pixels with respect to each direction (left, right, up, and down) of the preprocessed binary image A and obtains the sum of the square root of the cumulative values to obtain a position corresponding to the center of each lumen It has a large value.

이때, H(A)의 지역 최대점(local maximum point)들은 SRG 알고리즘의 후보 씨드점으로 사용된다(S13). 그러나, H(A)로부터 바로 후보 씨드점을 구하게 되면 불필요하게 작은 영역에 대해서도 후보 씨드점들이 생성된다. 이러한 문제를 해결하기 위해 H(A)의 작은 값들 문턱치(threshold)로 처리 한 HT(A)로부터 후보 씨드점들을 구한다. 문턱치 처리 방법은 오쯔(Otsus) 방법이 사용되었다.At this time, the local maximum points of H (A) are used as candidate seed points of the SRG algorithm (S13). However, if a candidate seed point is obtained directly from H (A), candidate seed points are generated even in an unnecessarily small area. To solve this problem, candidate seed points are obtained from H T (A) processed with a small threshold value of H (A). The Otsus method was used as the thresholding method.

Otsu 방법은 다양한 문턱치 처리 방법들 중 일반적으로 사용되는 문턱치 처리 방법이다. 이 방법은 클래스 간 분산을 최대화하는 지점을 문턱치 값으로 선택한다. 즉, Otsu 방법은 두 클래스간 분산을 최대화하도록 문턱치 값을 결정하는 방법이다. 영상의 각 픽셀 값이 선택된 문턱치 값 이상이면 1, 미만이면 0으로 할당한다. 불필요한 작은 영역들을 제거하기 위해 Otsu 방법을 이용한다.The Otsu method is a commonly used thresholding method among various thresholding methods. This method selects the point at which the variance between classes is maximized as the threshold value. That is, the Otsu method is a method of determining the threshold value to maximize the dispersion between two classes. If each pixel value of the image is greater than or equal to the selected threshold value, 1 is assigned. Use the Otsu method to remove unwanted small areas.

이제 얻어진 후보 씨드점들을 SRG 알고리즘의 초기 파라미터 이용하여 내강 영역을 식별한다(S14). 이때 식별된 내강 영역의 경계를 BO로 표현한다.Now, the obtained candidate seed points are identified by using the initial parameters of the SRG algorithm (S14). At this time, the boundary of the identified lumenal region is represented by B 0 .

도 6는 지금까지 설명된 내강 영역 식별에 대한 과정을 시각적으로 보여준다. 도 6(a)는 내강 경계를 식별하기 위하여 전처리된 이진 영상이고, 도 6(b)는 영상을 위한 HT(A)와 후보 씨드점(노란점)을 나타내고 있다. 이때, 이 영상은 시각화를 위해 0 ~ 255로 스케일링되었다. 도 6(c)는 HT(A)를 위한 3차원 그래프를 나타낸 것이고, 도 6(d)는 후보 씨드(녹색선)에 의해 식별된 내강 경계를 나타내고 있다.Fig. 6 shows a process for identification of the lumen area described so far. 6 (a) is a binary image preprocessed to identify a lumen boundary, and FIG. 6 (b) shows H T (A) and a candidate seed point (yellow point) for an image. At this time, the image was scaled from 0 to 255 for visualization. Fig. 6 (c) shows a three-dimensional graph for H T (A), and Fig. 6 (d) shows the lumen boundary identified by the candidate seed (green line).

이 단계에서, 식별한 내강 영역의 경계를 오리지널 내강 경계라 부르기로 한다.
At this stage, the boundaries of the identified lumen areas are referred to as original lumen boundaries.

다음으로, 상피 핵과 비-상피 핵의 식별하는 과정을 설명한다.Next, the process of identifying epithelial and non-epithelial nuclei is described.

본 과정에서 주어진 조직 이미지(또는 조직세포 영상)의 핵들을 식별하고(S20), 그들을 상피 핵과 비-상피 핵으로 구분한다(S30). 그 과정은 다음과 같다.In this procedure, nuclei of a given tissue image (or tissue cell image) are identified (S20) and classified into epithelial nuclei and non-epithelial nuclei (S30). The process is as follows.

먼저 핵 식별 단계(S20)를 설명한다.First, the nucleus identification step S20 will be described.

본 단계는 주어진 조직 영상에 있는 모든 핵들을 식별한다(S20). 먼저 주어진 조직 영상에서 핵을 식별하는데 불필요한 부분인 세포질과 같은 부분을 k평균(k-means)에 기반한 컬러 문턱치 처리(color thresholding)[비특허문헌 39]에 의해 제거한다.This step identifies all nuclei in a given tissue image (S20). First, a portion such as a cytoplasm, which is an unnecessary part for identifying a nucleus in a given tissue image, is removed by color thresholding based on k-means (Non-Patent Document 39).

바람직하게는, 이후 문턱치 처리된 이미지에 있는 핵들에 존재하는 홀(hole)들을 홀채움(Hole-Filling) 알고리즘[비특허문헌 40]을 적용한다. 핵에 홀이 존재하는 경우는 잘 발생하지 않는다. 가끔 염색이 잘 되지 않은 핵들(핵이 부분적으로 연하게 염색되는 경우)은 문턱치 처리에 의해 홀이 발생할 수 있다. 이때 이 부분들을 메우기 위해 홀 채움 알고리즘을 적용한다. 이 과정은 생략해도 되나, 발생할지 모르는 경우를 대비하기 위한 과정이다.Preferably, a hole-filling algorithm (non-patent document 40) is applied to holes existing in the nuclei in the threshold-processed image. The presence of holes in the nucleus does not occur well. Sometimes non-stained nuclei (where the nuclei are partially stained softly) can cause holes by thresholding. At this time, a hole filling algorithm is applied to fill these parts. This process can be omitted, but it is a process to prepare for the case where it may happen.

마지막으로 와더쉐드(Wathershed) 알고리즘[비특허문헌 41]을 적용하여 핵(nuclei)들을 분리한다. 이때 분리된 핵들을 핵집합 N으로 정의한다. 와더쉐더 알고리즘은 영상을 분할하는 방법 중의 하나이다. WaterShed 알고리즘은 객체들이 인접해 있는 경우 다른 영상 분할 알고리즘들에 비해 효과적으로 객체들을 분할하는 방법으로 알려져 있다. 따라서 객체들의 중첩이 빈번한 세포영상에서 핵들을 분리하는데 가장 많이 사용되는 방법이다.Finally, the Wathershed algorithm [Non-Patent Document 41] is applied to separate the nuclei. At this time, the separated nuclei are defined as the nucleus set N. The watermarker algorithm is one of the methods of image segmentation. The WaterShed algorithm is known to split objects more effectively than other image segmentation algorithms when objects are adjacent. Therefore, superposition of objects is the most commonly used method for separating nuclei from frequent cell images.

도 7(a)는 식별된 핵들의 집합 N을 보여준다. 도 7(b)는 이하의 단계에서 수행하여, 핵집합 N에서 선택된 상피 핵 집합 NE (빨간색으로 마크됨)을 보여준다.
Figure 7 (a) shows the set N of identified nuclei. Figure 7 (b) shows the epithelial nucleus set N E (marked in red) selected in nucleus N by performing in the following steps.

다음으로, 상피 세포 핵과 비-상피세포 핵의 구분 단계(S30)를 설명한다. 본 단계에서는 식별된 핵들을 상피 핵 집합과 비상피세포 핵 집합으로 분리한다.Next, the differentiation step (S30) between epithelial and non-epithelial cell nuclei is described. In this step, the identified nuclei are separated into epithelial nucleus and non-epithelial nucleus clusters.

상피세포는 내강을 에워싸고 있다. 따라서 상피세포 핵은 식별된 내강 경계 BO에 인접한 핵들을 식별된 핵 집합 N으로부터 선별함으로써 선택될 수 있다. 상피 세포 핵 집합은 NE와 표기되고 다음과 같이 정의된다. The epithelial cells surround the lumen. The epithelial cell nucleus can thus be selected by selecting nuclei adjacent to the identified luminal border B < 0 > from the identified nucleus N. [ The epithelial cell nucleus set is denoted as N E and is defined as follows.

[수학식 1][Equation 1]

Figure 112013042898076-pat00003
Figure 112013042898076-pat00003

여기서 p는 내강 경계를 BO를 구성하는 포인트이고, centroid(-)는 식별된 핵 n의 중심 포인트를 반환하는 함수이다. 그리고 distance(·,·) 는 주어진 두 점들 사이의 유클리디언 거리를 반환하는 함수이다.Where p is the point at which the lumenal boundary is made up of B 0 , and centroid (-) is a function that returns the center point of the identified nucleus n. And distance (·, ·) is a function that returns the Euclidean distance between two given points.

즉, 핵 집합 N으로부터 상피 핵의 분리는 BO에 속한 각 포인트 p에서 가장 가까운 핵을 선택하고, 선택된 핵을 상피-핵 집합 NE 에 포함시킴으로써 구현된다. 도 8의 알고리즘 1은 이 과정을 보여준다.That is, the separation of the epithelial nuclei from the nucleus set N is accomplished by selecting the nuclei closest to each point p belonging to B 0 , and including the selected nuclei in the epithelial-nuclear set N E. Algorithm 1 of FIG. 8 shows this process.

비상피 세포 핵은 식 2와 같이 식별된 핵 집합에서 식별된 상피세포 핵을 제외시킴으로써 구해진다. Non-epithelial cell nuclei are obtained by excluding epithelial cell nuclei identified in the identified nucleus set as shown in Equation 2.

[수학식 2]&Quot; (2) "

Figure 112013042898076-pat00004
Figure 112013042898076-pat00004

도 9의 표는 본 발명에서 사용되는 주요 표기들을 요약한다.
The table in Figure 9 summarizes the main notations used in the present invention.

다음으로, 형태학적 특징을 추출하는 과정을 설명한다. 형태학적 특징 추출 과정은 세그먼트된 내강 영역에 대하여 내강 특징을 추출하고(S40), 구분된 상피세포 핵들로부터 상피세포 특징을 추출한다(S50).Next, the process of extracting morphological features will be described. In the morphological feature extraction process, the luminal features are extracted for the segmented lumenal region (S40), and the epithelial cell features are extracted from the divided epithelial cell nuclei (S50).

조직 영상에서 PDAC를 진단하기 위한 주요 부위는 관(duct)이다. 앞에서 설명된 것처럼 PDAC는 관의 분화정도에 따라 등급 1, 등급 2, 그리고 등급 3으로 분류된다. 관은 내강과 그것을 에워싸는 상피세포로 구성된다. 따라서 세그먼트된 내강과 상피세포 핵들로부터 PDAC진단을 위한 형태학적 특징들을 추출하기 위한 방법들에 대해서 설명한다.
The main site for the diagnosis of PDAC in the tissue image is the duct. As described above, PDACs are classified into Class 1, Class 2, and Class 3 depending on the degree of tube differentiation. The tube consists of the lumen and epithelial cells surrounding it. Thus, we describe methods for extracting morphological features for PDAC diagnosis from segmented luminal and epithelial cell nuclei.

먼저, 내강 특징(Lumen Features) 추출 단계(S40)에 대하여 설명한다.First, the lumen feature extraction step S40 will be described.

PDAC에서 관은 유두상을 보이고, 상피세포는 극성을 잃어 불완전한 분비선(gland) 형태를 보인다. 병기가 진행됨에 따라 관의 모양은 복잡하고 이형성 정도는 점점 더 심해진다. 본 단계에서는 관의 이형성을 표현하는 방법과 이형성을 정량적으로 측정하는 형태학적 특징 추출방법들에 대해 설명한다.In the PDAC, the papilla shows a papillary phase, and the epithelial cells lose their polarity and show an incomplete gland shape. As the armature progresses, the shape of the tube becomes complicated and the degree of releasing becomes more and more severe. In this step, the method of expressing the dysplasticity of the tube and the morphological feature extraction methods which quantitatively measure the dysplasia are explained.

내강 특징 추출 단계(S40)는 이상적인 경계를 구하는 단계(S41); 이형성 진폭 시그니쳐를 구하는 단계(S42); 및 이형성 진폭 시그니쳐로부터 내강 특징을 추출하는 단계(S43)로 구성된다.The lumen feature extraction step S40 may include: obtaining an ideal boundary (S41); A step (S42) of obtaining a dysplasia amplitude signature; And extracting a luminal feature from the dyssomal amplitude signature (S43).

..

관의 이형성(Atypia of Duct)의 표현에 대하여 설명한다.Describe the expression of Atypia of Duct.

일반적으로, 정상적인 관의 내강은 이형성이 거의 나타나지 않기 때문에 볼록껍질(convex hull)과 같이 보인다. 그에 비해 PDAC의 관은 병기가 진행됨에 따라 내강 경계의 복잡한 변화와 함께 보다 복잡한 관의 이형성을 보인다. 이러한 관점으로부터 우리는 주어진 관의 이상적인 내강 경계를 추정하고, 오리지널 내강 경계와의 비교를 통해 오리지널 내강의 이형성을 표현한다.
In general, the lumen of a normal tube looks like a convex hull because it shows little diffusivity. On the other hand, PDAC ducts show more complicated tube dehiscence with complicated changes of the lumen boundary as the stage progresses. From this perspective, we estimate the ideal lumenal boundary of a given lumen and express the original lumenal lumen by comparison with the original lumen boundary.

먼저, 이상적인 내강 경계를 구한다(S41).First, an ideal lumen boundary is obtained (S41).

이상적인 내강 경계는, 오리지널 내강 경계로부터 볼록껍질(또는 볼록껍질 경계)을 구하되, 오리지널 내강의 크기로 볼록껍질을 스케일링하여 구한다.The ideal lumenal boundary is obtained by scaling the convex hull to the size of the original lumen by finding the convex hull (or convex hull boundary) from the original lumen boundary.

본 단계에서 오리지널 내강의 경계는 BO로 표현하고 추정되는 이상적인 내강 경계는 BI로 표현한다. BO와 BI는 각각의 내강 경계를 구성하는 포인트들의 시퀀스이다. 이상적 내강 경계를 추정하기 위한 절차는 다음과 같다.In this step, the boundary of the original lumen is expressed as B O and the ideal boundary of the lumen is estimated as B I. B O and B I are the sequence of points constituting each lumen boundary. The procedure for estimating the ideal lumenal boundary is as follows.

우선 오리지널 내강경계 BO의 볼록껍질을 구한다. 이때 구한 BO의 볼록껍질은 BC로 표기한다. 볼록껍질이란 주어진 점들을 포함하는 가장 작은 볼록(convex)다각형으로 정의된다. 즉, 최외각의 한점을 기준으로 해서(점들을 감싸는 최소 사각형상의 한점) 그 자신을 뺀 모든 점들이 왼편이나 일직선상에 놓일수 있는 점을 찾는다. 다시 이 찾은 점을 기준으로 나머지 점들에 대해서 동일한 조건을 만족하는 점들을 차례로 찾으면, 주어진 점들을 감싸는 최소의 점들의 모임을 구할 수 있고, 이것이 볼록껍질(convex hull)을 구성한다.First, the convex shell of the original lumen boundary B O is obtained. The convex shell of B 2 O thus obtained is denoted by B C. A convex shell is defined as the smallest convex polygon containing given points. In other words, a point on the outermost point (a point on the smallest rectangle that encloses the points) is searched to find a point where all the points subtracted from it can be placed on the left or straight line. Again, finding the points satisfying the same condition for the remaining points on the basis of the found point in turn, we can obtain the group of the minimum points enclosing the given points, which constitutes the convex hull.

이때, BC를 경계로 하는 영역은 BO를 경계로 하는 영역크기 때문에, 이상적인 내강계 BI는 BC를 경계로 하는 영역을 BO가 경계로 하는 영역의 크기로 줄인 영역의 경계로서 구한다. At this time, because the area bounded by B C is the area size bounded by B O , the ideal inner boundary B I is obtained as the boundary of the area bounded by B C , which is reduced to the size of the area bounded by B O .

BC를 경계로 하는 영역을 BO가 경계로 하는 영역으로 줄이기 위한 스케일링 계수 s는 식 3과 같다. 즉, BO와 BC의 면적을 이용하여 이상적인 내강 경계 BI를 구하기 위한 스케일링 계수를 구한다.The scaling factor s for reducing the region bounded by B C to the region bounded by B O is given by Equation 3. That is, the scaling factor for obtaining the ideal lumen boundary B I is obtained using the area of B 0 and B C.

[수학식 3] &Quot; (3) "

Figure 112013042898076-pat00005
Figure 112013042898076-pat00005

여기서 RO는 BO를 경계로 하는 영역의 의미하고 RC는 BC를 경계로 하는 영역을 의미한다. Area(·)는 영역의 크기를 반환하는 함수이다. 내강 BI는 RC의 중심(center)에 관해서 s로 스케일된 영역의 경계를 구성하는 포인트들의 집합이다.Here, R O means a region bounded by B O and R C means a region bounded by B C. Area (·) is a function that returns the size of the area. The lumen B I is the set of points constituting the boundary of the scaled region with respect to the center of R C.

도 10은 오리지널 내강 경계 BO(녹색)와 이상적인 내강 경계 BI(붉은색)를 보여준다.
Figure 10 shows the original luminal boundary B O (green) and the ideal luminal boundary B I (red).

다음으로, 이형성 진폭 시그니쳐(Atypia-Amplitude Signature)를 구한다(S42)Next, an Atypia-Amplitude Signature is obtained (S42)

본 단계에서는 오리지널 내강 경계와 이상적인 내강 경계를 이용하여 내강의 이형성을 표현하는 1-D 시그니쳐를 제안한다. 제안된 1-D 시그니쳐는 이상적인 내강과 오리지널 내강 사이의 이형성 진폭을 측정함으로써 오리지널 내강에 존재하는 이형성을 시각화한다. 이때, 이형성 진폭은 이상적인 내강과 오리지널 내강 사이의 부호를 가지는 수직 거리로서 이형성-진폭 함수 A(t)에 의해 측정된다.In this step, we propose a 1-D signature that expresses the dissociation of the lumen using the original lumen boundary and the ideal lumen boundary. The proposed 1-D signature visualizes the dissociation in the original lumen by measuring the amplitude of the dissociation between the ideal lumen and the original lumen. At this time, the dysmorphic amplitude is measured by the dysmorphic-amplitude function A (t) as the vertical distance having the sign between the ideal lumen and the original lumen.

식 4는 이형성 진폭함수의 정의를 보여준다.Equation (4) shows the definition of the damping amplitude function.

[수학식 4]&Quot; (4) "

Figure 112013042898076-pat00006
Figure 112013042898076-pat00006

여기서 t는 이상적인 내강 경계에 있는 포인트들의 순서를 가리키는 인덱스 변수이고, sgnt(q)는 pt∈BI 에서 수직 위치에 있는 점 q∈BO 사이의 거리에 대한 부호를 나타내는 함수로서 점 q가 점 pt의 바깥 경계에 위치해 있으면 +1, 안쪽 경계에 위치해 있으면 -1을 반환한다.Where t is an index variable indicating the order of the points at the ideal lumen boundary, and sgn t (q) is a function representing the sign of the distance between vertex q ∈B 0 in p t ∈ B I , +1 if it is located at the outer boundary of the point p t , or -1 if it is at the inner boundary.

즉, 상기 이형성 진폭은 이상적인 경계 상의 포인트에서 수직에 위치하는 오리지널 경계 상의 포인트 사이의 거리이되, 부호를 가진 거리로 표현된다.That is, the emissivity amplitude is a distance between points on an original boundary located vertically at an ideal boundary point, and is represented by a distance having a sign.

도 11(a)는 pt∈BI 에서 이형성-진폭 측정과정을 보여준다. 이 예에서 q는 pt의 바깥 경계에 있는 점이므로 양의 값으로 A(t)가 측정된다.
Fig. 11 (a) shows the process of measuring the dyssymmetry-amplitude at p t ∈ B I. In this example, q is a point at the outer boundary of p t , so A (t) is measured as a positive value.

본 발명에서 이형성-진폭 함수 A(t)를 이용한 1-D 시그니쳐를 이형성 진폭 시그니쳐로 명명한다. 이형성 진폭 시그니쳐(Atypia-Amplitude Signature)는 이상적인 내강 경계의 원점(p0)에서 pt까지의 둘레 길이 L(t)를 x좌표 그리고 BI의 포인트 pt에서 구한 이형성 진폭 A(t)를 y좌표로 하는 포인트 (L(t), A(t))에 의해 그려진다(도 12(b)). 여기서 원점(p0)에서 점 pt까지의 둘레 길이를 표현하는 L(t)는 식 5와 같이 각 포인트 사이의 거리 합으로 정의된다.In the present invention, the 1-D signature using the releasing-amplitude function A (t) is called a releasing amplitude signature. The Atypia-Amplitude Signature is the distance from the origin (p 0 ) to p t of the ideal lumen boundary to the x-coordinate of the circumference L (t) and the emissivity amplitude A (t) obtained from the point p t of B I as y (T (t), A (t)) of coordinates (Fig. 12 (b)). Here, L (t) representing the circumferential length from the origin (p 0 ) to the point p t is defined as the sum of the distances between the points as shown in Equation (5).

도 12의 테이블은 도 1의 (a), (b), (c)에 대한 이형성 진폭 시그니쳐를 보여준다.
The table of Fig. 12 shows the dummy amplitude signatures for Figs. 1 (a), (b) and (c).

다음으로, 내강 영역에 대한 관의 이형성 측정 특징들을 추출한다(S43).Next, the dissimilarity measurement features of the tube to the lumenal region are extracted (S43).

본 단계에서는 이전 단계에서 구한 이상적 내강 경계와 이형성-진폭 시그니쳐를 이용하여 내강의 이형성을 정량적으로 측정하는 특징들을 설명한다. 제안되는 특징들은 RMSAA(Root Mean Square Atypia Amplitude), TSAV(Total Sum of Atypia Volatility), 이형성 비율(AtypiaRatio), 이형성 영역의 개수(#AtypiaRegions)이다.
In this step, we describe the characteristics of quantitatively measuring the lumenal dysplasia using the ideal lumenal boundary and the dysplasia-amplitude signature obtained in the previous step. The proposed features are Root Mean Square Atypia Amplitude (RMSAA), Total Sum of Atypia Volatility (TSAV), AtypiaRatio, and #AtypiaRegions.

먼저, RMSAA(Root Mean Square Atypia Amplitude)에 대하여 설명한다.First, the Root Mean Square Atypia Amplitude (RMSAA) will be described.

RMSAA는 이전 단계에서 구한 이형성 진폭 시그니쳐로부터 측정한다. 이것은 이형성 진폭 A(t)들에 대한 제곱 평균(the average squared atypia amplitued)의 제곱근(square root)이다. A(t)는 추정된 이상적 내강 경계 BI 서 오리지널 내강 경계 BO사이의 수직 거리(called by atypia-amplitude)로서 오리지널 내강 BO가 추정된 정상 내강 BI로부터 얼마나 이탈되었는지를 표현한다.The RMSAA is measured from the dyssomnal amplitude signature obtained in the previous step. This is the square root of the average squared atypia amplitudes for the discrete amplitude A (t). A (t) is the vertical distance between the original ideal lumen boundary B I and the original lumen boundary B O , which represents how far the original lumen B O deviates from the estimated normal lumen B I.

따라서 측정된 A(t)는 회귀 분석에서 관찰(observation)과 추정된 함수 값 사이의 차이를 나타내는 나머지(residual or error)로 해석될 수 있다. 마찬가지로 MSAA 회귀식의 평균 에러를 측정하는 MSE(Root Mean Square Error)[비특허문헌 42] 에 대응된다. RMSAA는 식 6으로 정의된다. Thus, the measured A (t) can be interpreted as a residual or error indicating the difference between the observation and the estimated function value in the regression analysis. Similarly, it corresponds to an MSE (Root Mean Square Error) [Non-Patent Document 42] which measures an average error of the MSAA regression equation. RMSAA is defined by Equation 6.

[수학식 6]&Quot; (6) "

Figure 112013042898076-pat00007
Figure 112013042898076-pat00007

여기서 m은 BI에 있는 포인트들의 수 이다.
Where m is the number of points in B I.

TSAV(Total Sum of Atypia Volatility)에 대하여 설명한다.TSAV (Total Sum of Atypia Volatility) will be described.

췌장선암은 병기가 진행될 수록 내강은 복잡해지기 때문에 내강의 경계변화도 더 복잡하게 변한다. TSAV는 병기의 진행에 따라 복잡해 지는 내강의 경계변화를 측정한다. TSAV의 측정은 이형성-진폭 시그니쳐의 주요 변곡점을 찾고, 그 지점들에서의 변화량의 합으로 계산된다.Pancreatic adenocarcinoma becomes more complex as the lumen becomes more complicated as the stage progresses. TSAV measures the border changes of the lumen complicating the progression of the stage. The TSAV measurement is calculated by finding the major inflection point of the dysplasia-amplitude signature and summing the variations at those points.

본 발명에서는 이형성-진폭 시그니쳐의 주요 변곡점을 찾기 위해 PIP 알고리즘[비특허문헌 3],[비특허문헌 4]를 이용하였다. PIP 알고리즘은 시계열 데이터(Time Series Data)로부터 주요한 트랜드를 표현하는 중요한 포인트들을(PIP) 발견하는 방법이다.In the present invention, a PIP algorithm [Non-Patent Document 3] and [Non-Patent Document 4] were used to find the main inflection point of the dyssomance-amplitude signature. The PIP algorithm is a method of finding important points (PIPs) representing key trends from time series data.

본 발명에서는 이형성-진폭 시그니쳐에 존재하는 모든 변곡점들을 찾기 위해, 고정된 개수의 PIP를 탐지하는 기존 PIP알고리즘을 수정하였다.In the present invention, the existing PIP algorithm for detecting a fixed number of PIPs is modified to find all inflexion points present in the dysplasia-amplitude signature.

도 13은 도 12에 있는 등급 2에 대한 이형성 시그니쳐의 일부분과 수정된 PIP 알고리즘에 의해 식별된 PIP들을 보여준다. Figure 13 shows a portion of the dormancy signature for Grade 2 in Figure 12 and the PIPs identified by the modified PIP algorithm.

도 13에서, PIP에서의 AVi 인 pi는 ai와 bi 사이의 각도(θi)로 측정된다.In Fig. 13, p i, which is AV i in the PIP, is measured at an angle (? I ) between a i and b i .

TSAV는 식별된 PIP들의 각 지점에서 AV를 측정하고, 그 값들의 총합으로 계산된다. 이때, i번째 PIPi 에서 AVi는 두 벡터 ai = PIPi-PIPi -1 와 bi = PIPi +1-PIPi 에 사이의 사이 각(θi)로 정의된다. 도 13은 PIPi에서 AVi가 어떻게 측정되는지를 보여준다. TSAV measures the AV at each point of the identified PIPs and is calculated as the sum of the values. In this case, AV i in the i-th PIP i is defined as the two vectors, a i = i PIP -PIP i -1 b i = the angle (θ i) between the between the PIP -PIP i +1 i. Figure 13 shows how AV i is measured in PIP i .

[수학식 7]&Quot; (7) "

Figure 112013042898076-pat00008
Figure 112013042898076-pat00008

여기서 m은 이형성 진폭 시그니쳐로부터 식별된 PIP들의 개수이다.
Where m is the number of PIPs identified from the dormant amplitude signature.

이형성 비율과 이형성 영역의 개수에 대하여 설명한다.The releasability ratio and the number of releasable regions will be described.

관샘암(췌장선암, 취장관샘암)은 병기가 진행됨에 따라 관모양은 복잡해 지고 뚜렷한 유두상을 보인다. 병기가 진행된 실제 내강 영역 RO 은 이상적인 관 영역 RI 을 벗어나거나 침습한다. 따라서 본 단계에서는 원래 관 영역과 이상적인 관 영역에 집합 연산(set operation)을 적용하여 이형성 영역들을 구하고, 원래 관에서의 이형성 비율과 이형성 개수를 카운팅 한다.Tubular adenocarcinoma (pancreatic adenocarcinoma, pancreatic duct adenocarcinoma) has a complicated tubular shape and a distinct papillary phase as the stage progresses. The actual lumenal area R O in which the armature is advanced deviates or invades the ideal tube area R I. Therefore, in this step, set operation is applied to the original tube region and the ideal tube region to obtain the dissociation regions, and the number of dissociation ratios and the number of dissociation in the original tube are counted.

이 두 특징을 구하기 위해 이형성 영역들의 집합 AR={ar1, ar2, ... , arm} 을 구한다. AR은 (RI ∪ RO) - (RI ∩ RO) 를 BI에 의해 나누지는 영역들의 집합으로 정의된다. 도 14는 등급 2에서 식별된 이형성 영역들을 보여준다.To obtain these two features, we obtain the set of homogeneous regions AR = {ar 1 , ar 2 , ..., ar m }. AR is defined as the set of regions that divide (R I ∪ R O ) - (R I ∩ R O ) by B I. Figure 14 shows the emissive regions identified in Class 2.

도 14에서, (a)는 등급 2의 조직 세포 영상이고, (b)는 (a)의 영역 R0와 RI에 의해 생성된 이형성 영역이다.
In Fig. 14, (a) is a tissue cell image of Grade 2, and (b) is a releasability region generated by regions R 0 and R I of (a).

이제 획득된 이형성 영역들로부터 실제 관에서 이형성 영역이 차지하는 비율(AtypiaRatio)과 이형성 영역의 개수(#AtypiaRegions)를 구한다.Now we obtain the ratio (AtypiaRatio) and the number of heterogeneous regions (#AtypiaRegions) that the heterogeneous region occupies in the actual tube from the acquired heterogeneous regions.

[수학식 8]&Quot; (8) "

Figure 112013042898076-pat00009
Figure 112013042898076-pat00009

[수학식 9]&Quot; (9) "

Figure 112013042898076-pat00010
Figure 112013042898076-pat00010

여기서 Area(·)는 주어진 영역의 크기를 리턴하는 함수이다. m은 AR집합의 엘리먼트 개수를 의미한다. AtypiaRatio는 관이 전반적으로 얼마나 많이 찌그러져 있는지를 나타낸다. #AtypiaRegions는 실제 관 영역이 이상적인 관 영역을 벗어나거나 침습하는 이형성 영역들의 개수를 카운팅함으로써 유두상 정도를 표현한다. 이때 유두상을 표현하기에는 너무 작은 영역들은 쓰레숄딩을 적용하여 카운팅에서 제외한다.Here Area () is a function that returns the size of a given area. m is the number of elements in the AR set. AtypiaRatio indicates how much the tube is distorted overall. #AtypiaRegions expresses the degree of papillary phase by counting the number of dissociative regions in which the actual tube region deviates or invades the ideal tube region. At this time, areas that are too small to express the nipple image are excluded from counting by applying thresholding.

바람직하게는, 쓰레숄딩 값(또는 문턱치)은 300 μm2 으로 설정한다.
Preferably, the threshold value (or threshold value) is set to 300 μm 2 .

다음으로, 상피세포 핵들로부터 상피세포 특징(Epithelial Cell Feature)을 추출한다(S50).Next, an epithelial cell feature is extracted from epithelial cell nuclei (S50).

관을 구성하는 두 번째 요소는 상피세포들이다. 많은 경우 관샘암에서 상피세포들은 점액소(mucin)을 생성하며, 원주형 모양(columnar) 경향과, 핵의 극성을 잃어버리는 특징을 보인다[비특허문헌 33][비특허문헌 45]. 본 단계에서 식별된 상피세포를 이용하여, 이러한 특징들을 추출하는 방법을 설명한다.
The second component of the tube is epithelial cells. In many cases, the epithelial cells in mucinous adenocarcinoma produce mucin, which exhibits columnar tendency and polarity of nucleus is lost [Non-Patent Document 33] [Non-Patent Document 45]. We describe how to extract these features using the epithelial cells identified in this step.

먼저, 상피 세포질 길이(Epithelial Cytoplasm Length)의 특징에 대하여 설명한다.First, the characteristics of the epithelial cytoplasm length will be described.

일반적으로 정상조직의 관은 입방형 상피세포들로 에워싸여있다. 반면, PDAC의 관은 풍부한 세포질로 인해 원주형 상피세포로 에워싸여있다. 원주형세포의 핵은 달걀 모양을 가진다. 풍부한 세포질을 가지는 원주형 상피 세포의 세포질 길이는 입방형 상피 세포에 비해 길다.In general, ducts of normal tissues are surrounded by cuboidal epithelial cells. On the other hand, the ducts of PDAC are surrounded by columnar epithelium due to abundant cytoplasm. The nucleus of the columnar cell has an egg shape. The cytoplasmic length of columnar epithelial cells with abundant cytoplasm is longer than that of cuboidal epithelial cells.

따라서 상피세포의 세포질 길이의 측정은 상피세포가 원주형 세포인지 아닌지를 표현한다. 종래 논문[비특허문헌 36]에서 상피세포들의 세포질 길이를 측정하는 세포질 길이(Cytoplasm Length) 특징을 사용한다. 세포질 길이 특징은 오리지널 내강 경계 BO와 상피 핵 n사이의 수직 거리이다. 식 16은 세포질 길이 특징 CytoplasmLength의 수식을 나타낸다.Thus, the measurement of the cytoplasmic length of epithelial cells expresses whether epithelial cells are columnar cells or not. In the prior art [Non-Patent Document 36], Cytoplasm Length is used to measure the cytoplasmic length of epithelial cells. The cytoplasmic length feature is the vertical distance between the original luminal border B O and the epithelial nucleus n. Equation 16 expresses the cytoplasm length characteristic CytoplasmLength.

[수학식 10]&Quot; (10) "

Figure 112013042898076-pat00011
Figure 112013042898076-pat00011

여기서 m은 집합 NE의 엘리먼트 수이고 BO의 점 q는 centroid(n)와 수직 위치에 있는 점이다.Where m is the number of elements in the set N E and the point q of B O is the vertex of the centroid (n).

도 15은 정상과 등급 1의 CytoplasmLength 측정 결과를 보여준다. 도 15에서 붉은 점은 상피 핵이고, 녹색 선은 식별된 내강 경계이다. 그리고 식별된 내강 경계와 상피 핵 사이의 파런선은 측정된 CytoplasmLength이다.
FIG. 15 shows the result of measurement of the CytoplasmLength of normal and Grade 1. In Fig. 15, the red dot is the epithelial nucleus and the green line is the identified luminal border. And the wave line between the identified luminal border and epithelial nuclei is the measured CytoplasmLength.

다음으로, 세포질 길이 특징(CytoplasmLength)의 표준편차에 대하여 설명한다.Next, the standard deviation of the cytoplasm length characteristic (CytoplasmLength) will be described.

본 특징은 췌장선암에서 나타는 특징 중 하나인 핵 극성의 손실(the loss of nuclear polarity)를 측정한다. 이 특징이 나타나는 상피 세포들은 내강을 따라 불규칙하게 배열되기 때문에 세포질 길이의 편차가 크다. 반면, 정상의 경우는 극성 손실이 발생하지 않게 때문에 상피 세포들은 내강을 따라 규칙적으로 배열되며 세포질 길이의 편차는 매우 작다.This feature measures the loss of nuclear polarity, one of the characteristics of pancreatic adenocarcinoma. The epithelial cells that exhibit this feature are irregularly arranged along the lumen, and thus the deviation of the cytoplasmic length is large. On the other hand, the epithelial cells are regularly arranged along the lumen because the polarity loss does not occur in the normal case, and the deviation of the cytoplasmic length is very small.

따라서 상피세포의 세포질 길이에 대한 표준편차를 구함으로써 핵 극성의 손실(the loss of nuclear polarity)를 측정한다. Thus, the loss of nuclear polarity is measured by determining the standard deviation of the cytoplasmic length of epithelial cells.

[수학식 11]&Quot; (11) "

Figure 112013042898076-pat00012

Figure 112013042898076-pat00012

다음으로, 진단 모델 구성 및 검증 단계(S200)에 대하여 설명한다.Next, the diagnosis model configuration and verification step (S200) will be described.

진단 모델은 지도학습 기반의 분류기를 이용하여 구성된다. 바람직하게는 SVM(Support Vector Machine) 분류기를 이용한다. 각 특징들과 췌장선암의 진단결과(또는 등급)를 쌍으로 하는 학습데이터를 이용하여 학습시켜 진단모델을 구성한다. 그리고 교차 검증을 통해 검증한다.The diagnostic model is constructed using a classifier based on map learning. Preferably, a SVM (Support Vector Machine) classifier is used. Diagnostic models are constructed by using learning data that pairs each feature with the diagnostic result (or grade) of pancreatic adenocarcinoma. And verified through cross validation.

진단 모델은 췌장선암과 병기를 구분하는 '분류기'이다. 즉, 췌장선암의 진단은 곧 췌장선암 여부를 분류하는 것과 같다. 컴퓨터를 활용하여 분류문제를 다루는 방법으로서, 지도학습 기반의 방법들을 이용한다. 바람직하게는, 통계학 기반 지도학습 방법인 SVM(Support Vector Machine)을 이용한다.The diagnostic model is a 'classifier' that distinguishes between pancreatic adenocarcinoma and stage. In other words, diagnosis of pancreatic adenocarcinoma is similar to classification of pancreatic adenocarcinoma. As a way of dealing with classification problems using computers, we use methods based on map learning. Preferably, SVM (Support Vector Machine), which is a statistical based map learning method, is used.

지도학습 방법은 학습데이터들을 이용하여 진단모델 또는 분류모델(분류기)을 학습시킨다. 여기서 학습데이터는 특징벡터(x)와 클래스 레이블(y)의 쌍(pair)의 원소로 구성되는 집합이다. 기호로 학습데이터를 D를 표현하면 다음과 같다.The map learning method learns a diagnostic model or classification model (classifier) using learning data. Here, the learning data is a set composed of elements of a pair of a feature vector ( x ) and a class label (y). Let D denote the learning data as follows.

D={(x 1, y1),(x 2, y2), ... , (x n, yn)}.D = {( x 1 , y 1 ), ( x 2 , y 2 ), ..., ( x n , y n )}.

특징벡터(x)는 앞서 구한 췌장선암의 특징들을 벡터화한 것이다.The feature vector ( x ) is a vectorized feature of the previously obtained pancreatic adenocarcinoma.

클래스 레이블 y는 특징벡터 x의 실제 클래스 레이블을 가리키는 것으로서, 췌장선암의 진단결과(또는 진단결과의 등급)를 구분한 것이다. 예를 들어 정상과 췌장선암 분류 문제의 경우 y는 '정상' 혹은 '췌장선암'의 값을 가질 수 있으며, 췌장선암 병기 구분 문제의 경우 y는 'Grade 1'과 'Grade 2'의 값을 가질 수 있다.The class label y indicates the actual class label of the feature vector x , which is a classification of the diagnostic result (or the grade of the diagnostic result) of pancreatic adenocarcinoma. For example, in the case of normal and pancreatic adenocarcinoma classification, y may have a value of 'normal' or 'pancreatic adenocarcinoma', and in the case of pancreatic adenocarcinoma staging, y has a value of 'Grade 1' and 'Grade 2' .

이때 진단 모델의 학습은 SVM 학습시 결정되는 학습 파라미터들 (C**)에 의해 많은 영향을 받는다(여기서, C는 모델 파라미터이고, γ는 커널 파라미터이다). 물론, 학습데이터가 가장 중요하지만, 학습데이터를 학습시키는데 이들 파라미터들이 중요한 역할을 한다. 구체적인 예는 도 20을 참조한 본 발명의 실험에 기재된 것을 참조한다.At this time, the learning of the diagnostic model is heavily influenced by the learning parameters (C * , γ * ) determined at SVM learning (where C is the model parameter and γ is the kernel parameter). Of course, learning data is most important, but these parameters play an important role in learning learning data. Specific examples refer to those described in the experiment of the present invention with reference to Fig.

학습된 진단 모델의 검증은 k겹 교차 검증(k-fold cross validation)을 통해 수행된다. k겹 교차 검증은 학습데이터 D를 k개의 데이터 집합으로 분할하고 k-1개의 데이터 집합을 SVM모델을 학습하는데 이용한다. 그리고 남은 한 개의 데이터 집합을 진단모델을 성능을 검증(평가)하는데 사용한다. 이 과정을 k번 수행하게 된다. 즉, 분할된 데이터집합을 이용하여 k개의 진단모델을 생성하고, k번의 진단모델 성능평가의 평균으로 모델을 검증하게 된다. k겹 교차 검증을 위한 학습은 SVM 학습에서 얻어진 학습파라미터 (C**)를 이용한다.
Verification of the learned diagnostic model is performed through k-fold cross validation. k-fold crossover validation divides training data D into k data sets and k-1 data sets to learn the SVM model. The remaining one data set is used to verify the performance of the diagnostic model. This process is performed k times. That is, k diagnostic models are generated using the divided data sets, and the model is verified as an average of the performance evaluation of k diagnostic models. Learning for k-th cross-validation uses learning parameters (C * , γ * ) obtained in SVM learning.

다음으로, 학습된 모델을 이용한 진단 단계(S300)에 대하여 설명한다.Next, the diagnosis step (S300) using the learned model will be described.

학습된 진단모델(또는 진단 분류기)을 이용하여 주어진 임의의 조직 영상을 진단하는 과정이다. 즉, 진단 모델(또는 진단 분류기)에 특징벡터를 입력하여, 진단 모델에 의해 나오는 결과값(또는 진단결과의 등급)이 진단결과이다. 즉, 진단 모델은 클래스를 구분하는 하나의 함수와 같다.
It is a process of diagnosing a given tissue image using a learned diagnostic model (or a diagnostic classifier). That is, the feature vector is input to the diagnostic model (or the diagnostic classifier), and the result (or the grade of the diagnostic result) output by the diagnostic model is the diagnosis result. That is, the diagnostic model is like a function that classifies classes.

다음으로, 본 발명의 효과를 실험을 통해 구체적으로 설명한다.Next, the effects of the present invention will be described in detail through experiments.

본 발명의 실험을 위하여, 21개의 정상 조직 슬라이드와 26개의 PDAC조직 슬라이드를 영남대학교 병리학 교실로부터 제공받았다. 제공받은 조직 슬라이드들은 Hematoxylin & Eosin 방법으로 염색되었다. 그리고 이들 조직 슬라이드들은 ScanScopeCS 시스템을이용하여 20X배율의 디지털 슬라이드로 변환하였다. 각 디지털 슬라이드 이미지 크기는 획득한 조직에 따라 가변적이다. 도 16는 디지털 슬라이드의 정보를 보여준다.For the experiments of the present invention, 21 normal tissue slides and 26 PDAC tissue slides were provided from Yeungnam University Pathology Department. The tissue slides provided were stained with Hematoxylin & Eosin method. And these tissue slides were converted into 20X magnification digital slides using ScanScopeCS system. The size of each digital slide image is variable depending on the acquired organization. Figure 16 shows information on a digital slide.

본 발명의 특징들의 평가를 위해, 우리는 획득된 디지털 슬라이드로부터 하나의 관이 포함되도록 실험이미지를 생성했다. 실험 영상은 24bit tiff포멧으로 저장되었고 각 영상의 크기는 관의 크기에 따라 가변적이다. 진단에서 중요한 이슈는 inter- and intra- observer variability 문제이다. 이 문제들은 부정확하고, 비일관적이고, 그리고 바이어스된 진단결과를 초래할 수 있다[비특허문헌 46]. 이러한 문제는 진단 시스템을 학습하고 성능을 평가를 위한 전문가의 ground truth 데이터에서도 역시 나타난다. ground thruth의 variability 문제를 줄이기 위해 잘 알려진 방법은 여러 전문가들이 참여하여 ground thruth를 구성하는 것이다[비특허문헌 47]. 본 발명에서, ground throuth 평가를 위해 영남대의 병리학교실의 3 명의 병리의사의 도움을 받았다. 디지털 슬라이드로부터 생성된 각 관 영상은 3명의 병리학자들의 협의를 거쳐 조심스럽게 각 클래스를 레이블링 하였다. In order to evaluate the features of the present invention, we have created an experimental image to include one tube from the obtained digital slide. Experimental images were stored in 24bit tiff format and the size of each image was variable according to the size of the tube. An important issue in diagnosis is inter- and intra-observer variability. These problems can lead to inaccurate, inconsistent, and biased diagnostic results [Non-Patent Document 46]. These problems also appear in the experts' ground truth data for learning diagnostic systems and evaluating performance. To reduce the variability problem of ground thruth, a well-known method involves the participation of several experts to construct ground thruth [Non-Patent Document 47]. In the present invention, three pathologists of the pathology department of Yeungnam University received the help of a ground pathologist for evaluation of ground throuth. Each tube image generated from the digital slide was carefully labeled by each of the three pathologists.

도 17는 ground thruth 평가를 위해 전문가들에 의해 레이블된 실험영상의 개수를 보여준다.Figure 17 shows the number of experimental images labeled by experts for ground thruth evaluation.

주어진 조직세포 영상을 세 부분(내강, 상피 핵, 비-상피 핵)으로 세그멘테이션하고, 각 부위에서 기존의 전통적인 형태학적 특징들과 함께 관샘암에 특화된 새로운 특징들을 추출하였다. 도 18은 췌장선암의 진단을 위해, 실험에서 이용된 특징들이다. 세그먼트된 각 부위에서 추출되는 특징들을 "*"로 표시하였다. 도 18에서 음영 처리된 행들은 본 발명에서 제안된 관샘암에 특화된 특징들이고, 나머지 행들은 기존의 형태학적 특징들[비특허문헌 5], [비특허문헌 24], [비특허문헌 48], [비특허문헌 49]이다. 상피 핵과 비-상피핵의 경우 하나의 조직세포 영상에 여러 개의 오브젝트들이 있기 때문에 각 오브젝트별로 특징값들을 구하고 평균화함으로써 각 영상의 특징 값들을 표현하였다. 실험영상의 특징추출을 위한 실험 환경은 AMD Athlon II 3GHz CPU와2G RAM, Windows7-64bit에서 진행되었다. 기존 특징추출 방법들과 제안된 특징추출 방법들은 JAVA언어 기반의 공개용 이미지 분석 패키지인 Image J[비특허문헌 50]을 통해 구현 되었다
A given tissue cell image was segmented into three parts (lumen, epithelium, and non-epithelial nuclei) and new features specific to tubal carcinoma were extracted at each site along with traditional morphological features. Figure 18 is a characteristic used in the experiments for diagnosis of pancreatic adenocarcinoma. The features extracted from each segment are indicated by "*". The shaded rows in FIG. 18 are characteristics specific to the tuberculosis proposed in the present invention, and the remaining rows are the characteristics of the existing morphological features [Non-Patent Document 5], [Non-Patent Document 24], [Non-Patent Document 48] [Non-Patent Document 49]. In the case of epithelial nuclei and non - epithelial nuclei, since there are several objects in one tissue cell image, feature values of each image are expressed by obtaining and averaging the feature values for each object. Experimental environment for feature extraction of experimental images was conducted on AMD Athlon II 3GHz CPU, 2G RAM and Windows7-64bit. Existing feature extraction methods and proposed feature extraction methods are implemented through Image J [Non-Patent Document 50], a public image analysis package based on JAVA language

관샘암(PDAC) 진단을 위해 본 발명에서 제시된 형태학적 특징들의 우수성을 입증하기 위해, 기존 특징들과 제안된 특징들에 의해 학습된 분류기 들의 분류성능을 비교하였다. 본 발명에서, 분류기의 학습 바업은 통계적 학습 기법으로서 잘 알려진 SVM[비특허문헌 51] 을 이용하였다. SVM은 VC차원과 경험적 리스크를 최소화하기 때문에 일반적으로 성능이 좋은 것으로 알려져 있다[비특허문헌 52]. 실험은 다음 두 경우에 대한 분류결과를 측정하였다. 첫째는 정상과 관샘암 분류이고, 둘째는 관샘암의 등급 1과 등급 2의 병기 분류이다. 본 발명의 특징들이 분류능력 향상에 얼마나 기여하는지를 측정하기 위해 기존 특징들과 본 발명의 특징들을 조합하여 분류기를 학습하였고, 각 분류기의 분류결과들의 비교를 통해 본 발명의 특징들을 평가하였다. 도 19은 분류 실험들에 사용된 특징 집합들에 대한 심벌과 차원을 보여준다.In order to demonstrate the superiority of the morphological features presented in the present invention for PDAC diagnosis, the classification performance of the classifiers learned by the proposed features and the existing features is compared. In the present invention, learning of the classifier employs SVM [Non-Patent Document 51], which is well known as a statistical learning technique. SVM is generally known to have good performance because it minimizes VC dimension and empirical risk [Non-Patent Document 52]. The experiment was carried out to measure the classification results for the following two cases. The first is the classification of normal and tubal adenocarcinoma. The second is the stage classification of tubal adenocarcinoma grade 1 and grade 2. In order to measure the contribution of the features of the present invention to the improvement of the classification ability, the classifier was learned by combining the features of the present invention and the features of the present invention, and the characteristics of the present invention were evaluated through comparison of the classification results of the classifiers. Figure 19 shows the symbols and dimensions for the feature sets used in the classification experiments.

실험 데이터는 두 실험(Normal vs PDAC와 등급1 vs 등급 2)을 위해 도 19의 각 특징 집합에 따라 생성되었다. 즉, 첫 번째 PDAC진단 실험에서 13개의Data Set 들이 다음과 같이 생성되었다 D(CNF), D(CLF), D(PLF), D(ALF), D(CEF), D(PEF), D(AEF), D(CDF), D(PDF), D(ADF), D(CTF), D(PTF), and D(ATF). 여기서 D(·)는 인자로주어진 특정 feature set으로 구성되는 Data set을 의미한다. D(·)는 D(·)={(x(·)1, y1), ... , (x(·)m, ym)}처럼 표기 된다. 여기서 x(·)i는 인자로 주어진 특징 set을 가지는 i번째 특징 벡터이다. 클래스 레이블 yi는x(·)i의 클래스 레이블로서 Normal class를 의미하는 -1 이나 PDAC클래스를 의미하는 1 값을 가진다. 마찬가지로 두 번째 PDAC의 병기구분 실험에서도 15개의 Data Set이 생성되었다. 이때 클래스 yi가 -1이면 등급1을 의미하고 1이면 등급2를 의미한다.Experimental data were generated according to each feature set in Fig. 19 for two experiments (Normal vs. PDAC and Grade 1 vs. Grade 2). In the first PDAC diagnostic experiment, 13 data sets were generated as follows: D (CNF), D (CLF), D (PLF), D (ALF), D (CEF) (AFT), D (CDF), D (PDF), D (ADF), D (CTF), D (PTF), and D (ATF). Where D (·) is a data set consisting of a specific feature set given as a factor. D (·) is written as D (·) = {(x (·) 1 , y 1 ), ..., (x (·) m , y m )}. Where x (·) i is an i-th feature vector with feature set given as a factor. The class label y i is the class label of x (·) i and has a value of -1 which means Normal class or a value of 1 meaning PDAC class. Similarly, fifteen data sets were generated in the second PDAC arm sorting experiment. If the class y i is -1, it means class 1, and if 1, it means class 2.

특징 집합에 따른 SVM의 분류성능을 평가하기 위해 특징 집합별로 생성된 Data set으로부터 training set과 test set을 구성하였다. 학습과 평가를 위한training set과 test set의 비율은 60:40으로 설정하였다. 첫 번째 실험(normal vs PDAC)에서, PDAC실험 데이터는 160개의 PDAC 데이터(등급 1의 데이터와 등급 2의 데이터)로 부터 80개 데이터를 셈플링 함으로써 구성되었다. 정상 샘플의 수가 80개이기 때문에, 분류기의 공평한 평가를 위해 우리는 PDAC 셈플 수를 80개로 제한 하였다.In order to evaluate the classification performance of SVM according to feature set, training set and test set were constructed from data set generated by feature set. The ratio of training set to test set for learning and evaluation was set at 60:40. In the first experiment (normal vs. PDAC), the PDAC experimental data was constructed by sampling 80 data from 160 PDAC data (data of class 1 and data of class 2). Since the number of normal samples is 80, we have limited the number of PDAC samples to 80 for fair evaluation of the classifier.

다음 도 20은 실험 1(Classification between the normal and PDAC)과 실험2(Classification between the normal and PDAC)에서 사용되는 training data와 test data의 개수를 보여준다.Figure 20 shows the number of training data and test data used in Experiment 1 (Classification between the normal and PDAC) and Experiment 2 (Classification between the normal and PDAC).

본 발명에서, SVM분류기는 soft-margin 방법과 RBF커널[비특허문헌 51]이 이용되었다. 따라서 모델 파라미터 C와 커널 파라미터인 γ가 필요하다. 최적의 분류 파라미터 (C*, γ*)쌍은 10 cross validation방법을 이용하여 트레이닝 집합의 정확도를 최대화하는 쌍을 (C, γ)∈{10-1, 10-0.5, ... , 104} {2-5, 2-4.5, ... , 20}을 그리드 검색을 통해 선택하였다[비특허문헌 53]. 본 발명에서 사용된 실험 영상의 수는 매우 부족하다. 따라서 생성된 분류기의 정확도는 바이어스(biase)될 수 있다[비특허문헌 54]. 통계적으로, 이 문제를 해결하기 위해, 부트스트랩 기법[비특허문헌 55]이 사용된다. 각 특징 집합에 대한 분류기의 unbiased 평가를 위해 부트스트랩 기법을 사용한다. 우선, 부트스트랩 평가를 위해 주어진 특징집합(테이블 6) 에 대응되는 데이터 집합 D(·) 로부터 10개의 훈련 집합들과 10개의 테스트 집합들을 생성했다. 10개의 훈련 집합과 테스트 집합들은 D(·)={(L(·)1,T(·)1), ... , (L(·)10,T(·)10)}, ∀L(·)i,T(·)i⊂D(·) (1≤i≤10)로 표기 된다. 여기서, L(·)i 과 T(·)i는 각각 트레이닝 데이터와 테스팅 데이터를 의미한다. 따라서 각 특징 집합에 대한 분류 성능은 10개의 트래이닝 데이터 집합과 테스트 데이터집합에 대해 개별적으로 최적화된 분류기 평가 결과들의 평균으로 측정된다.In the present invention, a soft-margin method and an RBF kernel (Non-Patent Document 51) are used for the SVM classifier. Therefore, the model parameter C and the kernel parameter γ are required. The optimal classification parameter (C * , γ * pair) is a pair of (C, γ) ∈ {10 -1 , 10 -0.5 , ..., 10 4 ) that maximizes the accuracy of the training set using 10 cross validation methods. } {2 -5 , 2 -4.5 , ..., 2 0 } were selected through grid search [Non-Patent Document 53]. The number of experimental images used in the present invention is very low. Thus, the accuracy of the generated classifier can be biased [Non-Patent Document 54]. Statistically, to solve this problem, a bootstrap technique (Non-Patent Document 55) is used. The bootstrap technique is used for unbiased evaluation of the classifier for each feature set. First, we created 10 training sets and 10 test sets from the data set D (·) corresponding to a given feature set (Table 6) for bootstrap evaluation. Test a set of 10 training sets are D (·) = {(L (·) 1, T (·) 1), ..., (L (·) 10, T (·) 10)}, ∀L (· ) i , T (·) i ⊂ D (·) ( 1i ≤ 10). Where L ( i ) and T ( i ) denote training data and testing data, respectively. Thus, the classification performance for each feature set is measured as the average of 10 training data sets and the sorter evaluation results individually optimized for the test data set.

실험에서 분류기의 성능평가를 위해 사용된 평가항목은 다음과 같다: rue Positive (TP), True Negative (TN), False Positive (FP), False Negative (FN), Sensitivity (SN), Specificity (SP), Positive Predictive Value (PPV), Negative Predictive Value (NPV), and Accuracy (ACC). TP, TN, FP, FN에 대한 설명은 각 케이스의 실험에서 설명된다. 그 외 나머지 성능평가 항목들은 다음과 같이 정의된다.The evaluation items used for the performance evaluation of the classifier in the experiment are rue Positive (TP), True Negative (TN), False Positive (FP), False Negative (FN), Sensitivity (SN) , Positive Predictive Value (PPV), Negative Predictive Value (NPV), and Accuracy (ACC). The description of TP, TN, FP, FN is described in the experiment of each case. The remaining performance evaluation items are defined as follows.

[수학식 12]&Quot; (12) "

Figure 112013042898076-pat00013
Figure 112013042898076-pat00013

[수학식 13]&Quot; (13) "

Figure 112013042898076-pat00014
Figure 112013042898076-pat00014

[수학식 14]&Quot; (14) "

Figure 112013042898076-pat00015
Figure 112013042898076-pat00015

[수학식 15]&Quot; (15) "

Figure 112013042898076-pat00016
Figure 112013042898076-pat00016

[수학식 16]&Quot; (16) "

Figure 112013042898076-pat00017

Figure 112013042898076-pat00017

다음으로, 실험 결과에 대하여 설명한다.Next, the experimental results will be described.

먼저, 케이스 1(정상관 vs. PDAC)에 대하여 설명한다.First, case 1 (positive correlation vs. PDAC) will be described.

도 21와 도 22은 Normal과 PDAC구분을 위해 각 특징집합에 의해 학습된 분류기의 부트스트랩 평가를 보여준다. 도 21에 있는 괄호 안 수치는 10개의 bootstrap evaluation결과에 대한 표준편차를 나타낸다. 우선 내각 오브젝트로부터 추출된 특징집합에 의해 학습된 분류기들의 비교를 살펴 보자. 이 비교에서, PLF에 의해 학습된 분류기의 정확도는 91.56이었다. 그것은 CLF(73.44%)에 학습된 분류기보다 약 18%정도 높은 정확도를 보였다. CLF와 PLF의 조합으로 구성된 ALF 특징 집합으로 학습된 분류기의 정확도는 87.35로서 PLF에 비해 오히려 정확도가 낮아졌다. 이러한 결과는 제안된 PLF 특징 집합이 PDAC를 진단하는데 보다 적잘함을 보여준다. 또한 PLF와 CLF의 조합을 통한 추가적인 성능 향상이 없음을 보여준다. 이것은 Area, Perimeter와 같은 간단한 형태학적 특징들이 PDAC의 복잡한 특성을 표현하는데 적합하지 않음을 보여준다.21 and 22 show the bootstrap evaluation of the classifier learned by each feature set for distinguishing Normal and PDAC. The numerical values in parentheses in FIG. 21 represent standard deviations for 10 bootstrap evaluation results. First, let's look at a comparison of classifiers learned by feature sets extracted from cabinet objects. In this comparison, the accuracy of the classifier learned by the PLF was 91.56. It was about 18% more accurate than the classifier learned in CLF (73.44%). The accuracy of the classifier learned by the ALF feature set composed of CLF and PLF is 87.35, which is lower than that of PLF. These results show that the proposed PLF feature set is better for diagnosing PDAC. It also shows that there is no additional performance improvement due to the combination of PLF and CLF. This shows that simple morphological features such as Area and Perimeter are not suitable for expressing complex features of PDAC.

다음으로 상피 핵으로 부터 추출된 특징 집합들의 분류결과를 살펴보자. 먼저 기존 형태학적 특징들의 집합인 CEF는 72.66의 정확도로 내강의 CLF와 비슷한 분류 성능을 보였다. PEF와 AEF는 87.50%의 동일한 분류 정확도를 보였다. 하지만 AEF와 함께하는 분류기의 경우 분류 정확도의 표준편차가 1.47로서 3.21의 표준편차를 가지는 PEF 에 비해 좀더 안정 적인 성능을 보이고 있다. AEF가 제안된 PEF와 기존 CEF의 조합인것을 고려했을 때, AEF의 정확도는 제안된 PEF에 기인한다고 볼 수 있다. Next, let us look at the classification results of feature sets extracted from epithelial nuclei. First, CEF, which is a set of existing morphological features, showed classification performance similar to CLF of lumen with an accuracy of 72.66. PEF and AEF showed the same classification accuracy of 87.50%. However, the classifier with AEF has a standard deviation of classification accuracy of 1.47, which is more stable than the PEF with a standard deviation of 3.21. Considering that the AEF is a combination of the proposed PEF and the existing CEF, the accuracy of the AEF can be attributed to the proposed PEF.

또한, 주목할만한 것은 PEF의 특징 차원이 2차원이라는 것이다. 이러한 결과는 PEF가 PDAC를 식별하는데 매우 적절함을 보여준다. 또한 비용 측면에서도 매우 효과적임을 보여준다. PDAC진단에서, 관은 진단시 중요한 관심 영역이다. 관은 내강과 상피세포로 구성된다. 따라서, 내강과 상피 세포로 부터 추출된 특징들의 조합이 의미 있을 것이다. 이를 위해, 3가지 특징 집합을 준비했다. CDF(CLF+CEF), PDF(PLF+PEF), and ADF(CDF+PDF). 그리고 이들을 이용하여 분류 성능을 평가했다. 이 실험에서, 분류기의 정확도는 PDF와 함께 94.38%를 보였다. 이것은 각 오브젝트에서 최고의 분류정확도를 보였던 PLF와 AEF(or PEF)에 비해 약 3~7% 높게 정확도가 측정되었다. 이것은 내강과 상피 세포 특징들의 조합이 PDAC진단에 도움이 되는 것을 보여준다.It is also noteworthy that the characteristic dimension of the PEF is two-dimensional. These results show that PEF is very suitable for identifying PDACs. It is also very cost effective. In the PDAC diagnosis, the tube is an important area of interest in diagnosis. The tube consists of lumen and epithelial cells. Thus, the combination of features extracted from lumen and epithelial cells will be meaningful. To this end, we have prepared three feature sets. CDF (CLF + CEF), PDF (PLF + PEF), and ADF (CDF + PDF). And we used them to evaluate the classification performance. In this experiment, the accuracy of the classifier was 94.38% with PDF. This is about 3-7% higher accuracy than PLF and AEF (or PEF), which showed the best classification accuracy in each object. This demonstrates that the combination of luminal and epithelial cell features are helpful in the diagnosis of PDAC.

다음으로, 세 객체로부터 추출된 특징들의 조합을 사용하는 CTF, PTF, ATF의 실험 결과들은 관 객체에서 수행되었던 실험결과에 의존됨을 볼 수 있다. 따라서, 이것은 모든 객체들의 특징을 조합을 통한 성능개선은 없음을 보여준다. PTF의 경우는 PDF에 CNF특징 집합을 추가함으로써, 오히려 PDF의 분류 정확도에 비해 약 2%정도 정확도가 낮아졌다.Next, the experimental results of the CTF, PTF, and ATF using the combination of the features extracted from the three objects can be seen to depend on the experimental results performed on the vessel object. Therefore, this shows that there is no performance improvement through combining features of all objects. In the case of the PTF, by adding the CNF feature set to the PDF, the accuracy is lowered by about 2% compared to the classification accuracy of the PDF.

다음으로 각 특징 집합에 의해 학습된 분류기들에 대해 ROC분석을 수행하였다. ROC분석은 진단 검사의 정확성을 나타내고 비교하는 기준으로 의학분야에서 널리 사용되고 있다. ROC분석은 TP rate(Sensitivity)와 FP rate(1-Specificity)에 의해 그려지는 ROC 커브를 통해 분석된다. 이 분석에서 ROC커브의 아래의 면적(AUC; Area under the ROC curve)는 진단의 정확도를 의미한다. Swets는 AUC 수치 따라 비정보적(non-informative)(AUC=0.5), 덜 정확한(less accurate)(0.5<AUC≤0.7), 중등도의 정확한(moderately accurate)(0.7<AUC≤0.9), 매우 정확한(highly accurate)(0.9<AUC<1), 그리고 완벽한 검사(perfect tests)(AUC=1)로 로 분류했다[비특허문헌 57],[비특허문헌 58]. 즉, ROC커브는 좌 측 모서리에 가까울수록 좀 더 정확한 진단 되었다고 해석할 수 있다. 도 23은 각 객체 타입 별로 특징집합들에 의해 학습된 10개 분류기들의 평균화된 ROC그래프와 AUC값을 보여준다.Next, ROC analysis was performed on the classifiers learned by each feature set. ROC analysis is widely used in the medical field as a criterion for comparing and indicating the accuracy of diagnostic tests. The ROC analysis is analyzed through ROC curves plotted with TP rate (Sensitivity) and FP rate (1-Specificity). In this analysis, the area under the ROC curve (AUC) of the ROC curve represents the accuracy of the diagnosis. Swets are classified as non-informative (AUC = 0.5), less accurate (0.5 <AUC≤0.7), moderately accurate (0.7 <AUC≤0.9), very accurate , and highly accurate (0.9 <AUC <1) and perfect tests (AUC = 1) [Non-Patent Document 57] and [Non-Patent Document 58]. In other words, it can be interpreted that the closer the ROC curve is to the left edge, the more accurate diagnosis is obtained. 23 shows the averaged ROC graph and AUC values of the 10 classifiers learned by the feature sets for each object type.

ROC분석에서는 PDF에 의해 학습된 분류기의 AUC값이 0.96으로 가장 높게 나타났다. 이것은 이전의 분류기 정확도 분석과 마찬가지로 내강과 상피 핵 특징의 조합이 의미가 있음을 보여주고 있다. 그 다음으로는 PEF에 의해 학습된 분류기의 AUC 값이 0.94로 내강 보다 0.93의 AUC값을 가지는 PLF보다 높게 측정되었다. CNF특징을 제외하고 제안된 PDF나 PEF가 포함되는 특징집합들에 의해 학습된 분류기들은 AUC값이 0.9이상으로써 매우 정확한 진단을 수행한다고 해석 할 수 있다.In the ROC analysis, the AUC value of the classifier learned by PDF was the highest at 0.96. This shows that the combination of lumen and epithelial nuclear features is significant, as in previous classifier accuracy analyzes. Next, the AUC value of the classifier learned by the PEF was 0.94, which was higher than that of the PLF with an AUC value of 0.93 than that of the lumen. Except for the CNF feature, the classifiers learned by the feature sets including the proposed PDF or PEF can be interpreted to perform highly accurate diagnosis with AUC value of 0.9 or higher.

전체적으로 본 발명의 특징 집합을 포함하는 실험들은 기존 특징 집합과 함께하는 분류기들 보다 좋은 성능을 보였다. 앞에서 언급했듯이, 관이 PDAC진단에 중요한 영역임을 보였다. PLF와 PEF로 구성된 PDF는 분류기의 성능 향상을 이끌었다. 또한 제안된 내강과 상피세포로부터 추출된 PLF와 PEF는 기존 특징 집합들 CLF와 CEF, CNF에 비해 높은 성능을 보였다.
Overall, experiments involving the feature set of the present invention showed better performance than classifiers with existing feature sets. As mentioned earlier, we have shown that tubes are an important area for PDAC diagnosis. The PDF consisting of PLF and PEF led to improved performance of the classifier. PLF and PEF extracted from the proposed lumen and epithelial cells showed higher performance than the existing feature sets CLF, CEF and CNF.

다음으로, 케이스 2(등급1 vs. 등급2)에 대하여 설명한다.Next, Case 2 (Grade 1 vs. Grade 2) will be described.

본 단계에서, 특징집합에 따라 PDAC의 병기 등급 1과 등급 2의 구분을 수행한다. 케이스 1의 실험과 마찬가지로, 등급 1과 등급 2을 구분을 위한 10개의 훈련 집합과 테스트 집합을 생성하고, 분류 정확도를 평가했다. 도 24와 도 25은 분류기의 성능평가 결과를 보여준다. 등급 1과 등급 2 사이의 병기를 구분하기 위한 각 특징 집합의 분류 결과들은 케이스 1(Normal vs PDAC)을 구분하는 실험들보다 낮은 분류 정확도를 보였다.In this step, the distinction between armor class 1 and class 2 of the PDAC is performed according to the feature set. Similar to the experiment in Case 1, we generated 10 training sets and test sets for class 1 and class 2 distinction and evaluated classification accuracy. 24 and 25 show the performance evaluation results of the classifier. The classification results of each feature set to distinguish between stages 1 and 2 showed lower classification accuracy than those of case 1 (Normal vs PDAC).

우선적으로, 내강 객체에 대한 실험에서 PLF(77.03%)는 CLF(57.97%)보다 약 19%의 높은 정확도를 보였다. 특히, PLF 의specificity (79.69) 는 CLF (45.94)보다 약73%의 성능 이득(performance gain)을 보여준다. CLF와 PLF의 조합인 ALF와 함께 하는 실험에서, 분류정확도는 68.44%를 보였다. 이는 PLF로 학습된 분류기의 성능보다 오히려 낮아짐을 보여준다.First, PLF (77.03%) showed about 19% higher accuracy than CLF (57.97%) in the experiment on the lumen object. In particular, the PLF specificity (79.69) shows a performance gain of about 73% over CLF (45.94). In an experiment with ALF, a combination of CLF and PLF, the classification accuracy was 68.44%. This shows that the performance of the classifier learned by the PLF is lower than that of the classifier.

다음으로, 상피-핵으로 부터 추출된 특징집합과 함께하는 실험들은 전체적으로 케이스 1(normal vs pdac)의 분류정확도에 비해 낮은 성능을 보여준다. PDAC의 Grad1과 등급2에서 상피세포들은 원주형 모양을 보이며 핵의 극성 손실 특성을 보인다. 따라서 이 특징들이 등급 1과 등급 2를 구분하는 것은 어렵다. 그럼에도 불구하고, PEF(70.78%)의 분류 정확도는 CEF(56.41%)보다 14%높았다. AEF를 사용하는 실험은 PEF에 비해 낮게 측정되었다. 이것은 CEF와 PEF를 통한 성능 개선이 없음을 보여준다.Next, experiments with feature sets extracted from epithelial-nuclei show overall lower performance than that of case 1 (normal vs pdac). In Grad1 and grade 2 of PDAC, epithelial cells show a columnar shape and polarity loss characteristic of nucleus. It is therefore difficult for these features to distinguish between class 1 and class 2. Nevertheless, the classification accuracy of PEF (70.78%) was 14% higher than that of CEF (56.41%). Experiments using AEF were lower than those of PEF. This shows no performance improvement through CEF and PEF.

관 특징 집합들을 사용하는 실험들은 내강 객체로부터 추출된 특징집합들의 실험 결과와 동일하다. PDF 을 사용한 Case 1(Normal vs PDAC)실험과 달리, PLF와 PEF를 통한 성능개선은 없었고 PLF와 동일한 실험 결과를 보였다. 이것은 PDF를 통한 분류기의 성능 향상은 PEF가 아니라 전적으로 PLF에 의존됨을 보여준다. 세 오브젝트들로부터 추출된 특징 집합들의 조합(CTF, PTF, ATF)에 대한 실험들은 관으로부터 추출된 특징집합의 실험결과와 동일한 결과를 보였다. Experiments using the tube feature sets are identical to those of the feature sets extracted from the lumen object. Unlike Case 1 (Normal vs. PDAC) experiments using PDF, there was no improvement in performance through PLF and PEF, and the same experimental results as PLF were obtained. This shows that the performance improvement of the classifier via PDF is entirely dependent on PLF, not PEF. Experiments on the combination of feature sets (CTF, PTF, ATF) extracted from three objects showed the same results as those of the feature set extracted from the tube.

도 26는 각 객체 타입 별로 특징집합들에 의해 병기 구분 분류기들의 평균화된 ROC그래프와 AUC값을 보여준다. 전체적으로 Case1에 비해 많은 성능차이를 보였다. CNF, CLF, CEF등과 같은 기존 형태학적 특징 집합을 이용한 분류기의 경우 AUC값은 각각 0.61, 0.45, 061로 less accurate 진단 결과를 보였다. 반면 PLF와 PEF와 같은 본 발명의 특징 집합들을 이용한 분류기들은 각각 0.79와 0.7로 한단계 높은 moderately accurate test결과를 보여주고 있다. 26 shows the averaged ROC graph and the AUC value of the staging classifiers according to the feature sets for each object type. Compared to Case 1, the performance difference was large. For the classifier using existing morphological feature sets such as CNF, CLF, and CEF, the AUC values were 0.61, 0.45, and 061, respectively, indicating less accurate diagnostic results. On the other hand, the classifiers using the feature sets of the present invention, such as PLF and PEF, show a moderately accurate test result of 0.79 and 0.7, respectively.

이번 병기 구분 실험들에서 PLF와 함께하는 분류기의 성능이 가장 좋은 성능을 보였다. 정상과 PDAC를 구분하는 Case1의 실험과 달리 PEF와 PLF결합을 통한 성능향상은 보여주지 못했다. 본 실험에서 특이 할만한 것은 Lumen오브젝트의 특징집합들의 실험결과가 duct 오브젝트와 Tissue오브젝트의 특징집합들의 실험결과와 동일하다는 것이다. duct오브젝트 특징집합과 tissue오브젝트의 특징집합은 lumen 오브젝트로부터 추출된 특징들에 다른 오브젝트로 부터 추출된 특징들을 결합으로 구성되어 있다. 이는 내강 오브젝트로부터 추출된 특징들이 분류기의 성능에 직접적으로 영향을 주고 있음을 보여주며 내강부위가 진단 시 필요한 정보를 가장 많이 포함하고 있음을 의미한다. The performance of the classifier with PLF showed the best performance in this stage classification experiment. Unlike Case 1, which distinguishes between normal and PDAC, performance improvement through PEF and PLF combination is not shown. What is unique in this experiment is that the experimental results of the feature sets of the Lumen object are the same as the experimental results of the duct and Tissue object feature sets. The duct object feature set and the tissue feature set consist of features extracted from a lumen object and features extracted from other objects. This means that the features extracted from the lumen object directly affect the performance of the classifier and the lumen part contains the most information necessary for the diagnosis.

전체적으로 등급1과 등급2의 병기 구분실험들은 본 발명의 특징들과 기존 특징들 모두에서 정상과 PDAC를 구분하는 실험에 비행 낮은 성능을 보였다. 이것은 PDAC에서 나타나는 특성이 등급 1과 등급2 병기들에서 나타나기 때문이다. 또한 본 발명의 특징들은 우선적으로 췌장 선암과 정상조직을 분류하도록 설계되었기 때문에 비슷한 형태학적 특징들(characteristics)이 포함되는 췌장 선암의 병기 진단에는 한계를 보여주고 있다. 하지만, 본 발명의 특징들은 기존 특징들에 비해 높은 분류 정확도를 보였다.
Overall, stage 1 and level 2 armament trials have shown poor flight performance in tests distinguishing normal and PDAC from both the features of the present invention and the existing features. This is because the characteristics that appear in the PDAC appear in Class 1 and Class 2 arms. In addition, the features of the present invention are designed to classify pancreatic adenocarcinoma and normal tissue preferentially, thus limiting the diagnosis of pancreatic adenocarcinoma including similar morphological characteristics. However, the features of the present invention show higher classification accuracy than the existing features.

다음으로, 추출된 특징의 적합성 실험에 대하여 설명한다.Next, the fitness test of the extracted features will be described.

즉, 세그먼트된 세부분들(non-epithelial cells, epithelial cells, lumen)로부터 추출된 특징들이 췌장선암을 진단하기 위해 얼마나 적합한지를 보이기 위해 특징들에 대한 통계적 분석을 수행한다. 먼저 추출된 특징이 진단에 적합할 특징일 경우, 특징 값은 집단간에 구분되는 차이를 보일 것이라 가정했다. 추출된 특징들이 세 집단 사이에서 차이가 있는지를 통계적으로 보이기 위해, 각 특징들에 대해 분산분석(ANOVA; Analysis of variance)을 수행하였다. 추출된 특징이 차이가 있는지를 검정하기 위한 가설은 다음과 같다. In other words, a statistical analysis of the features is performed to show how the features extracted from the segmented details (non-epithelial cells, epithelial cells, lumen) are suitable for diagnosing pancreatic adenocarcinoma. If the extracted features are suitable for diagnosis, it is assumed that the feature values will be differentiated among the groups. Analysis of variance (ANOVA) was performed for each feature to statistically show whether the extracted features differed among the three groups. The hypotheses to test for differences in extracted features are as follows.

[수학식 17]&Quot; (17) &quot;

Figure 112013042898076-pat00018
Figure 112013042898076-pat00018

여기서, μN, μG1, μG2는 각각 Normal, 등급 1, 등급 2에 대한 모 평균을 의미한다. ANOVA의 유의성 검정은 F-통계량에 의해 검정된다. 도 27, 도 28, 도 29은 세그먼트된 세부위(비상피세포, 상피세포, 내강)로부터 얻은 특징들에 대한 F-test를 통한 검정 결과이다.Where μ N , μ G1 , and μ G2 are the mean of the mean for Normal, Grade 1, and Grade 2, respectively. The significance test of ANOVA is tested by F-statistic. Figures 27, 28, and 29 are F-test results of the features obtained from the segmented cells (non-epithelial cells, epithelial cells, lumen).

세 객체 타입에 대한 특징들의 F-test결과는 대부분의 특징들이 집단간에 차이가 존재함을 통계적으로 보여주고 있다. 내강 오브젝트에서 추출된 특징들에 대한 F-test경우 Roundness and Solidity 특징을 제외하고 모든 특징들이 그룹들(normal, 등급1, and 등급2) 사이에 차이가 있음을 보여주고 있으며, 상피-핵 오브젝트로부터 추출된 특징들의 F-test 결과는 모든 추출된 모든 특징들이 그룹들 사이에 차이가 있음을 보여주고 있다. 비-상피핵에서는 MinorAxis과 skewness를 제외하고 모든특징들이 그룹들간 차이가 있음을 보여주었다.The F-test results of the features for the three object types statistically show that most features differ between groups. It is shown that all the features differ between the groups (normal, grade 1, and grade 2) except for the F-test case Roundness and Solidity feature for the features extracted from the endurance object, The F-test results of the extracted features show that all extracted features differ among the groups. In non-epithelial nuclei, all features except MinorAxis and skewness showed differences between groups.

위의 귀무가설이 기각된 특징들(즉, 세집단간에 차이가 존재하는)에 대해 어느 집단들의 비교에서 차이가 존재하는지를 찾아내기 위해 다중범위 검정을 수행하였다. 본 발명에서는 여러 가지 다중범위검정방법들 중 가장 흔히 사용되는Fisher's LSD(LSD(Least Significant Difference) test[비특허문헌 58] 이용하였다. LSD는 비교하고자 하는 두 모집단의 평균들, μi와 μj간에 차이가 있는지를 검정함으로써, 위의 영가설이 어디서 기각되었는지를 보여준다. 본 발명에서는 3개의 group들, normal, 등급1, and 등급2, 이 있으므로 총

Figure 112013042898076-pat00019
개 쌍들간에 대해 차이가 있는지를 검정한다. 각 쌍들을 검정하기 위한 영가설은 다음과 같다.We conducted a multiple range test to find out which differences exist in the comparison of the groups for the above null hypothesis-rejected features (ie, there is a difference between the three groups). In the present invention, was used Fisher's LSD (LSD (Least Significant Difference) test [ Non-Patent Document 58] The most commonly of the number of multiple range test method used. LSD is the average of the two populations to be compared, μ i and μ j In the present invention, there are three groups, normal, grade 1, and grade 2, so that the total
Figure 112013042898076-pat00019
Check for differences between pairs of dogs. The null hypothesis for testing each pair is as follows.

[수학식 18]&Quot; (18) &quot;

Figure 112013042898076-pat00020
Figure 112013042898076-pat00020

LSD-test는 Eq. 17의 영가설을 기각한 특징들에 대해서만 수행된다. LSD-test 결과는 도 30 내지 도 32의 테이블과 같다.The LSD-test was performed using Eq. 17 is rejected. The LSD-test results are shown in the tables of FIGS. 30 to 32.

도 30 내지 도 32에서 음영처리된 행은 LSD-test에 대한 Eq. 30의 세 영가설을 모두 기각한 특징들이다.The shaded rows in FIGS. 30-32 show the Eq. These are the features that rejected all three spiritual theories of 30.

그리고 표에서 '-'로 표시된 특징들은 F-test에서 Eq.29의 가설을 reject하지 못했기 때문에 LSD-test가 수행되지 않았음을 표시한다. 우선, 내강 객체로부터 추출된 특징들에 대한 LSD-test에서 Circularity 와 AspectRati를 제외한 12개의 특징들이 Eq. 18의 모든 영가설을 기각했다. 이들 중 8개는 기존 특징들이고, 4개는 본 발명의 특징들이다. 비록 기존의 많은 특징들이 집단간(Normal, 등급1, 등급2)사이의 차이를 보임에도 불구하고 제안된 PLF를 사용하는 실험의 결과가 Case 1과 Case 2에서 CLF에비해 좋은 성능을 보였다.The features marked '-' in the table indicate that the LSD-test was not performed because the F-test did not reject the Eq. 29 hypothesis. First, twelve features except Circularity and AspectRati in the LSD-test for features extracted from the lumen object are Eq. I rejected all the spiritual theories of 18. Eight of these are existing features, and four are features of the present invention. Despite the fact that many of the existing features show differences between groups (Normal, Grade 1, Grade 2), the results of experiments using the proposed PLF showed good performance for CLF in Case 1 and Case 2.

상피 핵 객체에서는, 제안된 CytoplasmLength 와 CytoplasmLengthSD특징들을 포함하여 5개의 특징들이 Eq. 18의 영 가설을 기각했다. 비-상피 핵의 경우는Perimeter, Width, MajorAxis, and Fereter's Diameter만이 영가설들(Eq. 30)을 모두 reject했다. In the epithelial nucleus object, five features, including the proposed CytoplasmLength and CytoplasmLength SD features, I rejected the null hypothesis of 18. In the case of non-epithelial nuclei, only Perimeter, Width, Major Axis, and Fereter's Diameter rejected all null hypotheses (Eq. 30).

LSD-test에서 Eq.18의 영가설 H03(등급 1과 Grae 2사이의 유의한 차이를 검정하기 위한)는 상피 핵과 비-상피핵들로 부터 추출된 많은 특징들에서 기각되지 않았다. F-test에서 영가설(Eq.29)을 기각한 특징들 중 LSD-test의 H03 of Eq. 30을 기각하지 못한 특징은 Circularity 와 AspectRatio 단 2개의 특징이다. 그러나 F-test에서 모든 특징들이 영가설(Eq.29)을 기각했던 epithelial nucleus 타입의 경우, 14개의 특징들 중 단 5개만이 LSD-test에서 H03 of Eq. 30을 기각했다. 비-상피 핵 타입에서는 단 4개의 특징들만이 LSD-test에서 H03 of Eq. 30를 reject했다. In the LSD-test, the null hypothesis H 03 of Eq. 18 (to test for a significant difference between grade 1 and grade 2) was not rejected in many of the features extracted from epithelial and non-epithelial nuclei. In the F-test, the null hypothesis (Eq. 29) was rejected. Among the features rejected, H 03 of Eq. The feature that failed to dismiss 30 is only two features of Circularity and AspectRatio. However, in the case of the epithelial nucleus type, in which all the features rejected the null hypothesis (Eq. 29) in the F-test, only 5 of the 14 features were identified in the LSD-test as H 03 of Eq. 30 was rejected. In the non-epithelial nuclear type, only four features were identified in the LSD-test, H 03 of Eq. 30 rejected.

이 LSD-test결과는 내강이 PDAC진단 및 병기구분에 있어서 가장 중요한 오브젝트임을 보여주고 있다. 또한 이 결과들은 병기구분을 위한 Case 2의 실험들이 정상과 PDAC를 진단하는 Case1실험에 비해 성능이 낮은 이유가 통계적으로 설명된다.
This LSD-test result shows that lumen is the most important object in PDAC diagnosis and staging. In addition, these results are statistically explained because the performance of Case 2 for staging is lower than that of Case 1 for normal and PDAC diagnosis.

본 발명은 관샘암을 자동으로 진단하기 위한 방법들을 설명하였다. 관샘암 진단은 주로 관의 분화정도와 관을 에워싸고 있는 상피세포를 관찰함으로써 수행되어 진다. 본 발명은 주어진 조직세포 영상을 내강과 상피세포, 그리고 비상피세포로 세그멘테이션하였다. 세그멘테이션된 관과 상피세포루 부터 전통적인 특징들과 함께 관샘암을 진단하는데 특화된 새로운 형태학적 특징들을 제안하였다. 관샘암의 경우 관은 정상조직의 관에 비해 모양이 더 복잡하고 경계의 굴곡 변화기 매우 심하다. 본 발명에서는 이러한 관점으로부터 관의 변동성과 관의 이형성 비율을 측정하기 위한 특징들을 제안했다. 관의 변동성을 직관적으로 표현하기 위해 이형성 진폭을 이용한 1-D 시그너쳐로 관을 표현하였다. 이 이형성 진폭 시그너쳐로부터 이형성 진폭의 변동 폭을 측정하기 위한 RMSAA특징과, 변곡점에서의 변화량의 측정을 위한 PIP기반의 TSAV특징을 제안하였다. 그리고 이상적 내강과 오리지널 내강 영역들을 사용하여, 관의 찌그러진 정도를 측정하기 위한 AtypiaRatio와 관의 유두상 정도를 측정하기 위한 #AtypiaRegions특징들이 제안되었다. 또한 세그멘트된 상피세포로부터 세포질 길이, 극성 정도등를 측정하기 위해 CytopasmLength와 CytoplasmLengthSD특징들이 사용되었다. SVM을 이용한 분류결과와 특징들에 대한 통계적 분석은 본 발명의 특징들이 관샘암을 진단과 등급1과 등급등급 구분에 적합한 특징임을 보여 주고 있다.
The present invention has described methods for automatically diagnosing tuberous carcinoma. Diagnosis of ductal carcinoma is mainly performed by observing the degree of differentiation of the duct and epithelial cells surrounding the duct. The present invention segmented a given tissue cell image into luminal, epithelial, and non-epithelial cells. From the segmented duct and epithelial cell line, we have proposed new morphological features that are specialized to diagnose tuberous carcinoma with traditional features. In the case of tubular adenocarcinoma, the tube is more complex in shape than the tube of normal tissue and the bending change of the border is very severe. From this viewpoint, the present invention has proposed features for measuring pipe volatility and pipe release ratio. In order to intuitively express the volatility of the pipe, the pipe is represented by a 1-D signature using the damping amplitude. The RMSAA feature for measuring the variation width of the emissivity amplitude from this emissive amplitude signature and the PIP - based TSAV feature for measuring the variation at the inflection point are proposed. Using the ideal lumen and original lumen areas, AtypiaRatio for measuring the degree of distortion of the tube and #AtypiaRegions for measuring the papillary level of the tube were proposed. In addition, CytopasmLength and CytoplasmLength SD features were used to measure the cytoplasmic length and polarity from the segmented epithelial cells. Statistical analysis of the classification results and features using the SVM shows that the features of the present invention are suitable for diagnosis, grade 1 and grade classification.

이상, 본 발명자에 의해서 이루어진 발명을 상기 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 상기 실시 예에 한정되는 것은 아니고, 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 물론이다.
Although the present invention has been described in detail with reference to the above embodiments, it is needless to say that the present invention is not limited to the above-described embodiments, and various modifications may be made without departing from the spirit of the present invention.

10 : 조직세포 영상 20 : 컴퓨터 단말
30 : 프로그램 시스템
10: tissue cell image 20: computer terminal
30: Program system

Claims (14)

조직세포 영상으로부터 형태학적 특징을 추출하여 췌장선암 여부 또는 등급을 구분하는 형태학적 특징 기반 췌장선암 등급 구분 방법에 있어서,
상기 조직세포 영상으로부터 상기 형태학적 특징 벡터를 추출하는 제1 단계;
상기 형태학적 특징 벡터를 입력받으면 췌장선암 여부 또는 등급을 분류하는 SVM(Support Vector Machine) 분류기를 구성하는 제2 단계; 및,
상기 분류기를 이용하여, 상기 조직세포 영상의 췌장선암 여부 또는 등급을 분류하는 제3 단계를 포함하고,
상기 제1 단계는,
(a) 조직세포 영상에서 내강 영역을 씨드 영역 양성(SGR) 방법에 의하여 식별하여 세그멘테이션하는 단계;
(b) 상기 조직세포 영상에서 k평균에 기반한 문턱치 처리를 한 후, 와더쉐드(Wathershed) 알고리즘을 적용하여 핵들을 식별하는 단계;
(c) 식별된 핵들을 상피 세포 핵과 비상피 세포 핵으로 구분하되, 상기 내강 영역의 경계에 인접한 핵들을 상피세포 핵으로 구분하고, 상기 식별된 핵 전체에서 상피세포 핵을 제외한 나머지를 비상피 세포 핵으로 구분하는 단계;
(d) 상기 내강 영역의 오리지널 경계의 블록껍질을 이용하여 이상적인 경계를 구하고, 상기 오리지널 경계와 상기 이상적인 경계 간의 거리로부터 이형성 진폭을 구하고, 상기 이형성 진폭을 이용하여 내강 특징을 추출하는 단계; 및,
(e) 상기 내강 영역의 경계와 상기 상피 세포 핵 사이의 거리인 세포질 길이를 구하여, 상기 세포질 길이로부터 상피세포 특징을 추출하는 단계; 및,
(f) 상기 내강 특징 및 상기 상피세포 특징으로 구성되는 형태학적 특징 벡터를 생성하는 단계를 포함하는 것을 특징으로 하는 형태학적 특징 기반 췌장선암 등급 구분 방법.
A method for classifying pancreatic adenocarcinoma based on morphologic features that extract morphologic features from tissue cell images and classify the presence or grade of pancreatic adenocarcinoma,
A first step of extracting the morphological feature vector from the tissue cell image;
A second step of constructing a SVM (Support Vector Machine) classifier for classifying the presence or absence of pancreatic adenocarcinoma upon receipt of the morphological feature vector; And
And a third step of classifying whether the tissue cell image is pancreatic adenocarcinoma or grade using the classifier,
In the first step,
(a) identifying and segmenting a luminal area in a tissue cell image by a seed area positive (SGR) method;
(b) subjecting the tissue cell image to threshold processing based on k-means and then applying a Wathershed algorithm to identify nuclei;
(c) dividing the identified nuclei into epithelial cell nuclei and non-epithelial cell nuclei, wherein the nuclei adjacent to the border of the lumenal region are divided into epithelial cell nuclei, and the remaining epithelium nuclei except for the epithelial cell nucleus are divided into non-epithelial cell nuclei A step of discriminating;
(d) obtaining an ideal boundary using a block skin of the original boundary of the lumenal region, determining a distinction amplitude from a distance between the original boundary and the ideal boundary, and extracting a luminal characteristic using the dissimilarity amplitude; And
(e) extracting epithelial cell characteristics from the cytoplasmic length by obtaining a cytoplasmic length, which is a distance between the boundary of the lumenal region and the epithelial cell nucleus; And
(f) generating a morphological feature vector comprising the lumenal feature and the epithelial cell feature.
삭제delete 삭제delete 제1항에 있어서,
상기 제2 단계에서, 상기 형태학적 특징 벡터와 구분결과의 등급의 쌍으로 구성된 학습데이터로 상기 분류기를 학습시키는 것을 특징으로 하는 형태학적 특징 기반 췌장선암 등급 구분 방법.
The method according to claim 1,
Wherein in the second step, the classifier is learned with learning data composed of a pair of classes of the morphological feature vector and classification result.
삭제delete 제1항에 있어서, 상기 (a)단계는,
(a1) 상기 조직세포 영상에 중간값 필터링과 배경상관 알고리즘을 적용한 후 최대 엔트로피 문턱치를 적용하여 이진 영상을 획득하는 단계;
(a2) 상기 이진 영상으로부터 방향 누적맵을 생성하는 단계;
(a3) 상기 방향 누적맵의 지역 최대점들을 후보 씨드점으로 선정하는 단계; 및,
(a4) 상기 후보 씨드점들을 SRG 방법의 초기 파라미터로 이용하여 내강 영역의 경계를 구하는 단계를 포함하는 것을 특징으로 하는 형태학적 특징 기반 췌장선암 등급 구분 방법.
The method of claim 1, wherein the step (a)
(a1) acquiring a binary image by applying a median filtering and a background correlation algorithm to the tissue cell image and applying a maximum entropy threshold;
(a2) generating a direction cumulative map from the binary image;
(a3) selecting local maximum points of the direction accumulation map as candidate seed points; And
(a4) determining the boundary of the lumenal region using the candidate seed points as an initial parameter of the SRG method.
삭제delete 삭제delete 제1항에 있어서, 상기 (d)단계는,
(d1) 상기 오리지널 경계로부터 이상적인 경계를 구하는 단계;
(d2) 상기 오리지널 경계와 상기 이상적인 경계에서 서로 수직하는 점들의 거리를 이용하여 이형성 진폭 시그니쳐를 구하는 단계; 및,
(d3) 상기 이형성 진폭 시그니쳐로부터 내강 특징을 추출하는 단계를 포함하는 것을 특징으로 하는 형태학적 특징 기반 췌장선암 등급 구분 방법.
The method of claim 1, wherein the step (d)
(d1) obtaining an ideal boundary from the original boundary;
(d2) obtaining a dyspeakable amplitude signature using a distance of points perpendicular to each other at the original boundary and the ideal boundary; And
(d3) extracting the luminal feature from the dyspeptic amplitude signature. &lt; Desc / Clms Page number 19 &gt;
제9항에 있어서,
상기 (d1)단계에서, 상기 이상적인 경계는 상기 오리지널 경계의 볼록껍질을 상기 오리지널 경계의 내부 영역의 크기로 스케일링하여 구하는 것을 특징으로 하는 형태학적 특징 기반 췌장선암 등급 구분 방법.
10. The method of claim 9,
Wherein the ideal boundary is obtained by scaling the convex shell of the original boundary to a size of an inner region of the original boundary in the step (d1).
제9항에 있어서,
상기 (d3)단계에서, 상기 이형성 진폭 시그니쳐는 상기 이상적인 경계의 둘레 길이에 대한 둘레 상의 포인트(이하 이상적인 경계 포인트)의 이형성 진폭으로 나타내고, 상기 이형성 진폭은 상기 이상적인 경계 포인트에서 수직에 위치하는 오리지널 경계 상의 포인트 사이의 부호를 가진 거리인 것을 특징으로 하는 형태학적 특징 기반 췌장선암 등급 구분 방법.
10. The method of claim 9,
Wherein in the step (d3), the dyspeakable amplitude signature is expressed by a dummy amplitude of a circumferential point (hereinafter, an ideal dummy point) with respect to the circumferential length of the ideal boundary, and the dummy amplitude indicates an original boundary Wherein the distance between the points on the pancreatic adenocarcinoma is a distance having a sign between points on the pancreas.
제11항에 있어서,
상기 이형성 진폭은 다음 [수학식 4]의 이형성 진폭 함수 A(t)에 의해 구해지는 것을 특징으로 하는 형태학적 특징 기반 췌장선암 등급 구분 방법.
[수학식 4]
Figure 112015021545939-pat00021

단, t는 상기 이상적인 경계에 있는 포인트들의 순서를 가리키는 인덱스 변수이고, sgnt(q)는 pt∈BI 에서 수직 위치에 있는 점 q∈BO 사이의 거리에 대한 부호를 나타내는 함수로서 점 q가 점 pt의 바깥 경계에 위치해 있으면 +1, 안쪽 경계에 위치해 있으면 -1을 반환한다.
12. The method of claim 11,
Wherein the dissociation amplitude is determined by a dyssymic amplitude function A (t) of the following formula (4).
&Quot; (4) &quot;
Figure 112015021545939-pat00021

Where t is an index variable indicating the order of the points at the ideal boundary and sgn t (q) is a function representing the sign of the distance between vertex q ∈B 0 in p t ∈ B I , Returns -1 if q is at the outer boundary of the point p t , or -1 if it is at the inner boundary.
제11항에 있어서,
상기 내강 특징은 이형성 진폭들에 대한 제곱 평균의 제곱근(RMSAA), 이형성 진폭 시그니쳐의 변곡점에서의 변화량의 합(TSAV), 이형성 비율(AtypiaRatio), 이형성 영역의 개수(#AtypiaRegions) 중 어느 하나 이상인 것을 특징으로 하는 형태학적 특징 기반 췌장선암 등급 구분 방법.
12. The method of claim 11,
The luminal feature may be any one or more of the square root of the root mean square (RMSAA) for the emissive amplitudes, the sum of the amounts of change at the inflection points of the emissive amplitude signature (TSAV), the emissivity ratio (AtypiaRatio), and the number of emissive regions (#AtypiaRegions) Characterized by morphological features based on classification of pancreatic adenocarcinoma grade.
제11항에 있어서,
상기 상피세포 특징은 상피 세포질 길이(CytoplasmLength) 및 상피세포의 세포질 길이에 대한 표준편차(CytoplasmLengthSD) 중 어느 하나 이상인 것을 특징으로 하는 형태학적 특징 기반 췌장선암 등급 구분 방법.
12. The method of claim 11,
Wherein the epithelial cell characteristic is at least one of an epithelial cytoplasm length (CytoplasmLength) and a standard deviation (CytoplasmLength SD ) with respect to a cytoplasmic length of epithelial cells.
KR1020130054968A 2013-05-15 2013-05-15 A Method for Grading Pancreatic Ductal Adenocarcinomas Based On Morphological Features KR101527604B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130054968A KR101527604B1 (en) 2013-05-15 2013-05-15 A Method for Grading Pancreatic Ductal Adenocarcinomas Based On Morphological Features

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130054968A KR101527604B1 (en) 2013-05-15 2013-05-15 A Method for Grading Pancreatic Ductal Adenocarcinomas Based On Morphological Features

Publications (2)

Publication Number Publication Date
KR20140134922A KR20140134922A (en) 2014-11-25
KR101527604B1 true KR101527604B1 (en) 2015-06-10

Family

ID=52455799

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130054968A KR101527604B1 (en) 2013-05-15 2013-05-15 A Method for Grading Pancreatic Ductal Adenocarcinomas Based On Morphological Features

Country Status (1)

Country Link
KR (1) KR101527604B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101906944B1 (en) * 2017-07-28 2018-10-11 계명대학교 산학협력단 Method for automatic classification of vascular lumen based on intravascular optical coherence tomography image and system thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11062459B2 (en) * 2019-02-07 2021-07-13 Vysioneer INC. Method and apparatus for automated target and tissue segmentation using multi-modal imaging and ensemble machine learning models

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100895481B1 (en) * 2007-05-03 2009-05-06 인하대학교 산학협력단 Method for Region Based on Image Retrieval Using Multi-Class Support Vector Machine
KR20120110604A (en) * 2011-03-30 2012-10-10 인하대학교 산학협력단 Device and method for classifying mucinous cystadenoma
KR20120113861A (en) * 2011-04-06 2012-10-16 인하대학교 산학협력단 A system and method for diagnosing pancreatic intraepithelial neoplasia

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100895481B1 (en) * 2007-05-03 2009-05-06 인하대학교 산학협력단 Method for Region Based on Image Retrieval Using Multi-Class Support Vector Machine
KR20120110604A (en) * 2011-03-30 2012-10-10 인하대학교 산학협력단 Device and method for classifying mucinous cystadenoma
KR20120113861A (en) * 2011-04-06 2012-10-16 인하대학교 산학협력단 A system and method for diagnosing pancreatic intraepithelial neoplasia

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
논문 : PATTERN ANALYSIS AND MACHINE INTELLIGENCE *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101906944B1 (en) * 2017-07-28 2018-10-11 계명대학교 산학협력단 Method for automatic classification of vascular lumen based on intravascular optical coherence tomography image and system thereof

Also Published As

Publication number Publication date
KR20140134922A (en) 2014-11-25

Similar Documents

Publication Publication Date Title
Conceição et al. A review of computational methods for cervical cells segmentation and abnormality classification
US10846367B2 (en) Predicting recurrence in early stage non-small cell lung cancer (NSCLC) with integrated radiomic and pathomic features
US8712142B2 (en) Method and apparatus for analysis of histopathology images and its application to cancer diagnosis and grading
Doyle et al. Cascaded discrimination of normal, abnormal, and confounder classes in histopathology: Gleason grading of prostate cancer
Kumar et al. Detection and classification of cancer from microscopic biopsy images using clinically significant and biologically interpretable features
Kwak et al. Multiview boosting digital pathology analysis of prostate cancer
Irshad et al. Methods for nuclei detection, segmentation, and classification in digital histopathology: a review—current status and future potential
US10783627B2 (en) Predicting cancer recurrence using local co-occurrence of cell morphology (LoCoM)
US9430830B2 (en) Spatially aware cell cluster (SPACCL) graphs
US8280132B2 (en) Malignancy diagnosis using content-based image retreival of tissue histopathology
WO2010088672A1 (en) Image-based risk score-a prognostic predictor of survival and outcome from digital histopathology
EP2174263A1 (en) Malignancy diagnosis using content-based image retreival of tissue histopathology
Huang et al. Cancer diagnosis by nuclear morphometry using spatial information
Xu et al. Using transfer learning on whole slide images to predict tumor mutational burden in bladder cancer patients
US11922625B2 (en) Predicting overall survival in early stage lung cancer with feature driven local cell graphs (FeDeG)
WO2013019856A1 (en) Automated malignancy detection in breast histopathological images
Lopez et al. Exploration of efficacy of gland morphology and architectural features in prostate cancer gleason grading
Xu et al. An unsupervised method for histological image segmentation based on tissue cluster level graph cut
Sharma et al. Cell nuclei attributed relational graphs for efficient representation and classification of gastric cancer in digital histopathology
KR101396308B1 (en) A method for extracting morphological features for grading pancreatic ductal adenocarcinomas
Song et al. New morphological features for grading pancreatic ductal adenocarcinomas
WO2014006421A1 (en) Identification of mitotic cells within a tumor region
KR101527604B1 (en) A Method for Grading Pancreatic Ductal Adenocarcinomas Based On Morphological Features
Shirazi et al. Automated pathology image analysis
Song et al. Automatic differential diagnosis of pancreatic serous and mucinous cystadenomas based on morphological features

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180406

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190408

Year of fee payment: 5