KR20100108778A - 영상정보 분류방법 및 장치 - Google Patents

영상정보 분류방법 및 장치 Download PDF

Info

Publication number
KR20100108778A
KR20100108778A KR1020090026977A KR20090026977A KR20100108778A KR 20100108778 A KR20100108778 A KR 20100108778A KR 1020090026977 A KR1020090026977 A KR 1020090026977A KR 20090026977 A KR20090026977 A KR 20090026977A KR 20100108778 A KR20100108778 A KR 20100108778A
Authority
KR
South Korea
Prior art keywords
image information
feature vector
descriptor
classification
ensemble
Prior art date
Application number
KR1020090026977A
Other languages
English (en)
Other versions
KR101093107B1 (ko
Inventor
심정희
박기희
고병철
남재열
Original Assignee
계명대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 계명대학교 산학협력단 filed Critical 계명대학교 산학협력단
Priority to KR1020090026977A priority Critical patent/KR101093107B1/ko
Publication of KR20100108778A publication Critical patent/KR20100108778A/ko
Application granted granted Critical
Publication of KR101093107B1 publication Critical patent/KR101093107B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4023Scaling of whole images or parts thereof, e.g. expanding or contracting based on decimating pixels or lines of pixels; based on inserting pixels or lines of pixels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/162Segmentation; Edge detection involving graph-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 영상정보를 색상 특징 및 경계선 특징에 따라 분류하는 영상정보 분류방법 및 장치에 관한 것이다. 상기한 본 발명에 따른 영상정보 분류방법은, 영상정보를 입력받아 색 구조 기술자에 따른 제1특징 벡터를 검출하는 단계; 상기 영상정보를 입력받아 경계선 히스토그램 기술자에 따른 제2특징벡터를 검출하는 단계; 상기 제1 및 제2특징벡터를 다수의 클래스에 각각 대응되는 클래스 분류자 각각에 대해 어느 정도 근접한지를 나타내는 다수의 멤버십 스코어를 생성하는 단계;를 포함하며, 상기 멤버십 스코어들이 상기 영상정보의 분류정보가 된다.
영상정보, 분류, 색 구조 기술자, 경계선 히스토그램 기술자

Description

영상정보 분류방법 및 장치{Image information classification method and apparatus}
본 발명은 영상정보 처리기술에 관한 것으로, 더욱 상세하게는 영상정보를 색상 특징 및 경계선 특징에 따라 분류하는 영상정보 분류방법 및 장치에 관한 것이다.
의료 영상은 환자 진단, 의학 요법, 수술 계획, 의학 증명과 훈련 등에 중심적인 역할을 하고 있으며, 최근 의료 영상이 디지털화됨에 따라 의료 영상을 분류하고 검색하는 기술의 연구가 증가하고 있다.
이러한 요구를 반영하여 영상 처리, 통신, 데이터베이스 등의 다양한 기술을 바탕으로 만들어진 의료 지원 시스템인 PACS(Picture Archiving Communication System)[Ko, B., Seo, M. S. Nam. J-Y. "Frip: Microscopic Cell Nuclei Segmentation Based on Adaptive Attention Window." Journal of Digital Imaging, Published online, 1- 16, June 2008.]와 의료 영상용 표준 네트워크 프로토콜인 DICOM(Digital Image and Communication in Medicine) 등이 제정되었다.
그러나 검색을 위해서는 많은 수의 의료 영상에 대해 일일이 텍스트를 부여하고 그 종류에 따라 분류하여야 하므로, 작업이 매우 번거롭고 비효율적이었다.
더욱이 의료 영상을 사람에 의해 분류하는 것은 작업자의 주관적인 관점이 반영되므로 문제를 발생시킬 수 있었으며, 시간과 비용이 많이 걸리는 단점이 있었다. 이러한 문제들을 해결하기 위해 다양한 유형의 분류와 검색 방법들이 제시되었다.
예를 들어, Liu[Liu Y., Dellaert F. "Classification Driven Medical Image Retrieval" Proceeding of the Int. Workshop on Image Understanding 1-7, 1998] 등은 영상 인덱스 특징 선택 룰을 사용하여 영상을 분류하였으며, 영상 의미 기반 유사성 측정을 이용한 분류 검색 중심의 영상 검색 프레임 워크를 제안하였다.
Mojsilovic[Mojsilovc A. and Gomes J. "Semantic based categorization, browsing and retrieval in medical image databases." Proceedings of the Int.Conf. on Image Processing 3, 145-148, 2002.] 등은 의료 영상의 여러 특징들을 사용하여 새로운 자동적 분류 방법을 제안하였다. 이 방법은 영상으로부터 획득한 특징들의 의미에 기반한 시각적 특징 집합을 이용하여 영상을 분류하는 방법이다.
Greenspan[Greenspan H. "Medical Image Categorization and Retrieval for PACS Using the GMM-KL Framework."IEEE Transactions on Information Technology in Bio Medicine 11, 190-202, 2007.]은 KL(Kullback-Leibler) 거리와 가우시안 혼합 모델(Gaussian Mixture Modeling)을 이용한 확률적인 영상 표현 방법을 제안하였다.
GMM-KL 프레임 워크는 영상 측정과 신체 영역에 의한 X-ray 영상을 범주화하는 데에 사용하였다. Bhattacharya[Bhattacharya P. and Rahman M. M. "Image Representation and Retrieval Using Support Vector Machine and Fuzzy C-means Clustering Based Semantical Spaces." Proceedings of the, Int. Conf. on Pattern Recognition 2, 1162-1168, 2006.]등은 교사학습(확률적 멀티 클래스 SVM)과 비교사 학습(fuzzy c-mean clustering)의 선형 결합으로 의료 영상 검색에서 학습 기반 프레임 워크를 제안하였다. 상기 학습 알고리즘에서 얻은 멤버십 스코어로 유사성 측정은 질의 영상과 비교하여 가장 유사한 영상을 검색하였다.
Mueen[Mueen A. Zainuddin R. Baba M. S. "Automatic Multilevel Medical Image Annotation and Retrieval." Journal of Digital Imaging, Published online, 1- 6, Sept. 2007.] 등은 개념 계층 또는 클래스 계층 기반의 키워드로 다계층 자동 의료 영상 주석 삽입 및 검색 방법을 제안하였다. 또한 자동 특징 추출을 위하여 픽셀 강도로 전역적 및 지역적 레벨 특징을 제공하는 다계층 특징 추출법을 사용하였다. 그 중 X-ray영상에 대해 키워드(클래스 이름)로만 실행할 수 있다.
상기한 바와 같이 내용 기반의 영상 검색은 영상 처리와 컴퓨터 비전 분야에서 매우 활발히 연구되고 있는 영역이다. 이중 의료 영상은 작업자의 주관적인 관점에 따라 다른 판단을 할 수도 있으며 중요 내용이 포함된 관심 영역과 의미 없는 단색의 배경으로 구성되는 특징을 가지므로, 일반적인 자연 영상과는 다른 분류와 검색 방법이 요구되었다.
본 발명은 해리스 코너 검출 기반의 색 구조 기술자(CSD)와 질감 특징을 위한 경계선 히스토그램 기술자(EHD)를 사용하여 영상 정보에서 특징 벡터들을 추출하고, 추출된 특징 벡터들을 다수의 영상종류 각각에 대응되는 멀티 클래스 SVM에 각각 적용하여 영상 종류를 표식하는 멤버십 스코어를 생성하는 영상정보 분류방법 및 장치를 제공하는 것을 그 목적으로 한다.
또한 본 발명의 다른 목적은 영상 정보로부터 검출해낸 멤버십 스코어를 하나의 앙상블 벡터로 결합하여 검색의 정확도를 향상시키는 영상정보 분류방법 및 장치를 제공하는 것이다.
또한 본 발명의 또 다른 목적은 CCV(Correlated Categories Vector) 기반 유사성 정보를 상기 앙상블 벡터에 부가하여 유사 영상정보에 대한 검색이 정확하고 빠르게 이행될 수 있게 하는 영상정보 분류방법 및 장치를 제공하는 것이다.
상기한 목적을 달성하기 위한 본 발명의 영상정보 분류방법은, 영상정보를 입력받아 색 구조 기술자에 따른 제1특징 벡터를 검출하는 단계; 상기 영상정보를 입력받아 경계선 히스토그램 기술자에 따른 제2특징벡터를 검출하는 단계; 상기 제1 및 제2특징벡터를 다수의 클래스에 각각 대응되는 클래스 분류자 각각에 대해 어느 정도 근접한지를 나타내는 다수의 멤버십 스코어를 생성하는 단계;를 포함하며, 상기 멤버십 스코어들이 상기 영상정보의 분류정보가 됨을 특징으로 한다.
상기한 본 발명은 의료 영상 정보, 특히 X-ray 영상 정보에 대한 효과적인 분류 및 검색을 가능하게 하는 효과가 있다.
또한 본 발명은 향후 진행될 영상 분류를 기반으로 하는 자동 주석 생성, 유사한 카테고리에 대한 분류 성능의 개선을 야기할 수 있는 효과가 있다.
본 발명의 바람직한 실시예에 따른 영상정보 분류장치의 구성을 도 1을 참조하여 설명한다.
상기 영상정보 분류장치는 색 구조 기술자에 따른 특징벡터 검출부(100), 경계선 히스토그램 기술자에 따른 특징벡터 검출부(102), SVM을 이용한 클래스 분류부(104), CCV 생성부(106), 저장매체(108)로 구성된다.
상기 색 구조 기술자에 따른 특징벡터 검출부(100)는 영상정보를 입력받아 색 구조 기술자에 따른 특징벡터를 검출하여 SVM을 이용한 클래스 분류부(104)에 제공한다.
상기 경계선 히스토그램 기술자에 따른 특징벡터 검출부(102)는 영상정보를 입력받아 경계선 히스토그램 기술자에 따른 특징벡터를 검출하여 SVM을 이용한 클래스 분류부(104)에 제공한다.
상기 SVM을 이용한 클래스 분류부(104)는 다수의 영상종류(이하 클래스라 칭함)에 대응되는 다수의 클래스 분류자를 학습을 통해 획득하고, 상기 색 구조 기술자 및 상기 경계선 히스토그램 기술자에 따라 검출된 특징벡터들을 상기 다수의 클 래스 분류자 각각에 적용하여, 상기 영상정보가 각 클래스에 어느 정도 근접하는지를 나타내는 다수의 멤버십 스코어를 생성하고, 상기 다수의 멤버십 스코어 중 가장 큰 멤버십 스코어를 생성한 클래스 분류자에 대응되는 클래스로 해당 영상정보를 분류하며, 상기 다수의 멤버십 스코어를 앙상블 벡터로 결합하여 검색의 정확성을 높인다.
상기 CCV 생성부(106)는 상기 영상정보로부터 검출한 앙상블 벡터와 미리 데이터베이스에 등록된 영상정보의 앙상블 벡터를 대비하여, 두 앙상블 벡터에서 서로 대응되는 위치의 멤버십 스코어가 미리 정해둔 수치 이상일 경우에는 그 멤버십 스코어에 대해서는 두 영상정보가 유사성이 있다고 판단하여, 상기 판단결과에 따라 0 또는 1을 값을 표식한 유사성 판단정보를 기록한 CCV를 생성한다.
상기 저장매체(108)는 색 구조 기술자에 따른 특징벡터 검출부(100), 경계선 히스토그램 기술자에 따른 특징벡터 검출부(102), SVM을 이용한 클래스 분류부(104), CCV 생성부(106)의 프로세스 수행을 위한 저장영역을 제공함과 아울러, 영상정보 및 그 영상정보에 대응되는 앙상블 벡터와 CCV를 저장한다.
본 발명의 바람직한 실시예에 따른 영상정보 분류장치의 동작을 도면을 참조하여 좀 더 상세히 설명한다.
<색 구조 기술자에 따른 특징벡터 검출과정>
상기 색 구조 기술자에 따른 특징벡터 검출부(100)는 영상정보를 입력받아 상기 영상정보에 대해 색 구조 기술자(CSD : Color Structure Descriptor)에 따른 특징벡터를 검출한다.
일반적으로 X-ray 영상정보는 어두운 배경과 중요 내용이 포함된 밝은 전경을 가지는 특징이 있다. 이에따라 상기 색 구조 기술자에 따른 특징벡터 검출부(100)는 영상정보를 128 단계의 명암으로 양자화하고, MPEG-7 표준에 따라 NxN개의 서브 블록들로 분리한다. 여기서, 상기 서브 블록의 크기는 8 x 8로 설정할 수 있다.
도 2에서 도시한 바와 같이 X-ray 영상정보에는 쓸데없는 배경영역을 포함한다. 이에 색 구조 기술자에 따른 특징벡터 검출부(100)는 미리 정해둔 수치 이하의 명암값을 가지는 배경 영역을 제거한다.
이후 상기 색 구조 기술자에 따른 특징벡터 검출부(100)는 상기 배경 영역에 따른 서브 블록을 제외한 나머지 서브 블록에 대해 해리스 코너 검출 방식(Harris C. and Stephens M. J. "A combined corner and edge detector." Proceeding of the Alvey Vision Conference, 147-152, 1998.)에 따라 해리스 코너 포인트를 검출하고, 상기 서브 블록 중 하나 또는 다수의 해리스 코너 포인트를 포함하는 서브 블록들만을 선택한다.
이후 상기 색 구조 기술자에 따른 특징벡터 검출부(100)는 상기 선택된 서브 블록들에 대해 128 빈 색 구조 히스토그램을 추출하며, 그 결과 128개의 양자화된 흑백 색 공간이 나타난다. 따라서 상기 색 구조 히스토그램은 m 비트로 양자화된 값의 1차원 배열이다.
수학식 1의 m은 집합{256, 128, 64, 32} 중의 하나를 의미하고, s는 조합된 구조적인 요소(서브 블록)의 스케일이다. 각 서브 블록에서 색 구조 히스토그램은 서브 블록 내의 색을 표현되는 원리로 축적된다.
Figure 112009019054204-PAT00001
예를 들어, 여덟 개의 명암 레벨과 여덟 개의 색 구조 히스토그램은 8x8 서브 블록으로 만들어지고, 영상 정보와 일치하는 미리 분리된 색 구조 히스토그램에서 대량의 적절한 빈이 서브 블록의 위치와 동일하면 수를 1 증가시킨다. 이에따라 영상 정보의 특징 벡터들은 대량의 서브 블록들의 분포와 각 기록된 색 구조 히스토그램과 일치하게 된다.
상기 추출된 128개의 색 구조 기술자 빈 히스토그램 값은 SVM 학습을 위해 0~1의 범위로 정규화된다. 여기서, 상기 색 구조 기술자 빈 히스토그램 값이 색 구조 기술자에 따른 특징벡터이다.
<경계선 히스토그램 기술자에 따른 특징벡터 검출과정>
상기 경계선 히스토그램 기술자에 따른 특징벡터 검출부(102)는 질감 특징을 추출하기 위해 경계선 히스토그램 기술자 검출방식(EHD)(Won C. S. and Park D. K. "Efficient Use of MPEG-7 Edge Histogram Descriptor", ETRI Journal 24, 23-30, 2002.)에 따라 입력된 영상정보로부터 경계선 히스토그램 기술자를 검출한다.
상기한 경계선 히스토그램 기술자에 따르면 상기 영상정보는 겹치지 않는 서브 영상들로 분리되며, 각 서브 영상은 도 3(a)에 도시한 바와 같이 겹치지 않는 영상 블록으로 다시 분리된다. 영상 블록의 크기는 수학식 2를 통하여 결정된다.
Figure 112009019054204-PAT00002
Figure 112009019054204-PAT00003
Figure 112009019054204-PAT00004
,
위 수학식 2에서 desired Num block은 영상정보에서 영상블록들의 전체 수이다. 본 발명에서는 실험을 통하여 상기 desired Num block의 기본값을 1100으로 결정하였다.
도 2(b)는 경계선 히스토그램을 생성하기 위해 서브 영상들에 적용된 5가지 종류(수직, 수평, 45° 대각선, 135° 대각선, 무 방향)의 경계선 필터를 도시한 것이다. 상기 5가지 종류의 필터를 이용하여 추출된 특징 값들을 이용하여 경계선 히스토그램 기술자에 따른 특징벡터 검출부(102)는 최대 경계선 값을 검출한다.
일반적으로 의료 영상 정보의 일종인 X-ray 영상정보에서 질감 특징, 특히 경계선은 중요한 특징 성분이라 할 수 있다. 따라서 본 발명의 경계선 히스토그램 기술자에 따른 특징벡터 검출부(102)는 지역적 히스토그램 값뿐만 아니라, 전역적인 경계선 히스토그램과 반(semi) 전역적 히스토그램을 추가적으로 추출하여 특징 값으로 사용한다. 여기서, 상기 특징값이 경계선 히스토그램 기술자에 따른 특징벡터이다.
<SVM를 이용한 클래스 분류>
상기 색 구조 기술자와 경계선 히스토그램 기술자에 따른 특징 벡터들은 SVM을 이용한 클래스 분류부(104)에 의해 미리 정의된 클래스들로 분류된다.
예를들어, 미리 주어진 학습 데이터
Figure 112009019054204-PAT00005
는 공간
Figure 112009019054204-PAT00006
차원에서 존재하고, 출력값
Figure 112009019054204-PAT00007
Figure 112009019054204-PAT00008
로 표현되어 진다면, 수학식 3은 일반적인 이진 선형 분류 함수를 나타낸다.
Figure 112009019054204-PAT00009
상기 수학식 3에서 x는 입력 벡터, w는 가중치 벡터, b는 바이어스를 나타낸다. 이때,
Figure 112009019054204-PAT00010
,
Figure 112009019054204-PAT00011
인 두 개의 클래스가 있다고 할 때,
Figure 112009019054204-PAT00012
의 w와 b값들에 대해 구해진 최적의 값이 초평면이 된다. 상기 SVM의 주된 목표는 최적의 평면을 결정하는 매개변수 w와 b를 찾는 것이다. 이 값들은 아래의 제약식인 수학식 4와 목적식인 수학식 5를 통해 계산되어진다.
Figure 112009019054204-PAT00013
Figure 112009019054204-PAT00014
상기 수학식 4 및 5에서 N은 영상의 총 개수,
Figure 112009019054204-PAT00015
는 라그랑제 승수를 나타 낸다.
상기 결정된 값들은 SVM 분류함수인 수학식 6에 적용되어 입력되어지는 영상들에 대한 분류를 가능하게 한다.
Figure 112009019054204-PAT00016
상기 수학식 6에서 X는 입력 영상,
Figure 112009019054204-PAT00017
는 커널함수 값,
Figure 112009019054204-PAT00018
는 각 커널 출력들의 가중치를 각각 나타내며
Figure 112009019054204-PAT00019
은 +1 클래스와 -1 클래스처럼 x의 클래스 멤버십 스코어를 결정한다. 초평면에서 분류 함수 f(x)는 영상이 속하는 하나의 클래스(+1)가 다른 클래스(-1)로부터 얼마나 다른지를 측정하는 서포트 벡터로 결정이 된다.
본 발명에서 사용되는 X-ray 영상들은 신체의 각 부분별로 임의 20개의 카테고리를 나누어 분류하였기 때문에 다중 클래스 SVM을 사용하였고 커널 함수로는 RBF(Radial Basis Function)를 사용한다.
다중 클래스 SVM은 아래의 수학식 7을 사용하게 되며 는 입력된 영상 X가 각 클래스에 처리된 값들을 의미한다. 여기서 가장 큰 값을 가지는 가 최종 X의 분류 클래스로 선택되어지는 방법이다.
Figure 112009019054204-PAT00020
상기 SVM 학습은 도 4에서 보는 것과 같이 영상 자체 개수가 적은 발가락, 허벅지, 팔꿈치를 제외한 나머지 카테고리에 대해서는 각각 100장의 영상을 학습시켜 20개의 카테고리에 대해 총 1,754장의 학습 데이터를 생성한다.
본 발명에서는 학습을 위해 두 개의 특징 벡터(H-CSD, EHD)를 각각 다중 클래스 SVM에 적용하기 때문에 2n개의 SVM 분류자가 생성된다.
도 5는 입력 영상정보로부터 생성한 특징 벡터 Fc와 FE(Fc: H-CSD 특징 벡터, FE: EHD 특징 벡터)는 미리 나눠둔 20개의 SVM 분류자에 각각 제공되고, 상기 SVM 분류자들 각각은 각 특징 벡터를 위해 20개의 멤버십 스코어인
Figure 112009019054204-PAT00021
Figure 112009019054204-PAT00022
를 출력한다.
상기 출력된 멤버십 스코어들은 한 개의 카테고리로 분류되지 않고 검색의 정확성을 높이기 위해 하나의 앙상블 벡터(
Figure 112009019054204-PAT00023
)로 합쳐진다. 여기서, 상기 앙상블 벡터의 각 값은 입력 영상이 20개의 클래스에 대해 어느 정도 근접한지를 나타내는 분류정보이다.
상기한 SVM을 이용한 클래스 분류부(104)는 상기 앙상블 벡터는 상기 입력된 영상정보에 대응되게 저장매체(108)에 저장한다.
<CCV 생성과정>
본 발명을 위해 실험에 사용된 X-ray 영상정보들의 클래스들은 독립적이거나 혹은 서로 연관 내용으로 판단되어 분류가 가능하다. 예를 들면 클래스 1(가슴)은 클래스 11(손가락)과 일반적으로 독립적이다. 하지만 클래스 10(손)과 클래스 11(손가락)은 서로 연관된 내용으로 이루어진 클래스이다[Yao J., Zhang Z., Antani S., Long R., and Thoma G. "Automatic medical image annotation and retrieval", Neurocomputing 71, 2012-2022, 2008.]. 이처럼 클래스간의 연관된 특징들은 유사성 특징에도 크게 작용된다.
이에 본 발명은 상기 앙상블 벡터간의 클래스 관련성을 이용한 CCV(Correlated Categories Vector)를 생성한다.
상기 CCV 생성부(106)는 도 6에 도시한 바와 같이 질의 영상정보에 대한 앙상블 벡터를 추출하고 수학식 8을 만족하는 CCV에서 i번째 차원에 대해 유사성 판단 결과를 나타내는 ‘1’또는 ‘0’을 기록한다.
Figure 112009019054204-PAT00024
상기 수학식 8에서 θ는 관련된 카테고리를 결정하기 위한 결정 값이고,
Figure 112009019054204-PAT00025
는 앙상블 벡터의 i번째 차원의 멤버십 스코어이다. 여기서, θ는 0.5의 값으로 설정될 수 있다.
상기한 CCV 생성후, 유사성 측정은 일치하는 i번째 차원의 CCV 코드가 ‘1’일 때 i번째 앙상블 벡터의 값들로만 실행된다.
상기 앙상블 벡터와 상기 CCV를 이용하여, 최종 거리는 아래 수학식 9를 통해 측정되고, 가장 유사한 영상이 최종 거리의 오름차순으로 나타낸다.
Figure 112009019054204-PAT00026
상기 수학식 9에서
Figure 112009019054204-PAT00027
는 i번째 질의 앙상블 벡터의 멤버십 스코어이고,
Figure 112009019054204-PAT00028
는 i번째 목표(데이터베이스) 앙상블 벡터의 멤버십 스코어이다. M은 CCV에 포함된 ‘1’들의 수이고,
Figure 112009019054204-PAT00029
Figure 112009019054204-PAT00030
는 각각 H-CSD와 EHD를 위한 멤버십 스코어의 가중치이다.
Figure 112009019054204-PAT00031
Figure 112009019054204-PAT00032
의 값 결정을 위하여, 모든 카테고리에서 임의로 다섯개의 영상 선택을 기반으로 다른 값들을 이용하여 정확한 평균이 계산된다.
도 7에서 보이는 것과 같이 실험을 통해
Figure 112009019054204-PAT00033
Figure 112009019054204-PAT00034
는 각각 0.3과 0.7을 주었을 때, 정확(precision) 정도는 상대적으로 높다. 또한 결과에서 EHD는 의료 영상 분류를 위하여 중요한 특징임을 확인하였다. 따라서 본 발명에서는
Figure 112009019054204-PAT00035
Figure 112009019054204-PAT00036
를 각각 0.3과 0.7로 설정하였다.
여기서, 실험을 위해서 IRMA(Image Retrieval in Medical Application)[Vapnik V., "The Nature of Statistical Learning Theory." Springer-Verlag, 1999., Deselaers T. "The CLEF 2005 Automatic Medical Image Annotation Task", International Journal of Computer Vision 74, 55-58, 2007.]에서 사용된 1000개의 영상(20개 클래스)을 사용하였다.
도 8은 각 클래스별 이름과 실험에 사용된 영상의 수를 보여준다.
도 9는 MISS의 인터페이스의 메인 화면이다. 본 발명에서 제안하는 방법(앙상블 벡터 + CCV)의 성능을 확인하기 위한 비교실험으로 CCV를 제외시킨 앙상블 벡터만을 사용하는 방법과 Addition 방법을 사용한다. Addition 방법은 H-CSD 의 SVM을 통한 멤버십 스코어 값과 EHD 의 멤버십 스코어 값을 각 클래스별 해당 되는 값들을 각각 더한 방법이다.
도 1은 본 발명의 바람직한 실시예에 따르는 의료 영상 분류 장치의 구성도.
도 2는 본 발명의 바람직한 실시예에 따른 색 구조 기술자에 따른 특징벡터 검출과정을 도시한 도면.
도 3은 본 발명의 바람직한 실시예에 따른 서브 영상 및 영상 블록의 정의와 경계 추출을 위한 다섯 가지 경계선 필터를 도시한 도면.
도 4는 본 발명에 따른 각 클래스별 이름과 학습된 영상의 수를 도시한 도면.
도 5는 본 발명에 따른 학습 처리과정 및 데이터베이스 영상들을 위한 앙상블 벡터 생성과정을 도시한 도면.
도 6은 본 발명에 따른 유사성 측정 처리과정을 도시한 도면.
도 7은 본 발명에 따른 각각 다른 가중치 간의 성능을 비교한 도면.
도 8은 본 발명에 따른 각 클래스별 이름과 실험된 영상의 수를 도시한 도면.
도 9는 본 발명에 따른 의료 영상 검색 시스템인 MISS 인터페이스 메인 화면을 도시한 도면.

Claims (14)

  1. 영상정보 분류방법에 있어서,
    영상정보를 입력받아 색 구조 기술자에 따른 제1특징 벡터를 검출하는 단계;
    상기 영상정보를 입력받아 경계선 히스토그램 기술자에 따른 제2특징벡터를 검출하는 단계;
    상기 제1 및 제2특징벡터를 다수의 클래스에 각각 대응되는 클래스 분류자 각각에 대해 어느 정도 근접한지를 나타내는 다수의 멤버십 스코어를 생성하는 단계;
    를 포함하여, 상기 멤버십 스코어들이 상기 영상정보의 분류정보가 됨을 특징으로 하는 영상정보 분류방법.
  2. 제1항에 있어서,
    상기 다수의 클래스를 결합하여 앙상블 벡터를 생성하는 단계;
    를 더 구비함을 특징으로 하는 영상정보 분류방법.
  3. 제2항에 있어서,
    상기 앙상블 벡터를 상기 입력된 영상정보에 대응되게 저장하는 단계;
    를 더 구비함을 특징으로 하는 영상정보 분류방법.
  4. 제3항에 있어서,
    상기 앙상블 벡터로 구성된 다수의 멤버십 스코어 각각과 미리 저장된 다른 영상정보에 대응되는 앙상블 벡터에 포함된 다수의 멤버십 스코어 각각의 매칭정도가 미리 정해둔 값이상인지를 체크하고,
    상기 미리 정해둔 값이상 매칭되는 멤버십 스코어에 대응되게 유사여부를 표식한 유사정보를 생성하는 단계;
    를 더 포함하는 것을 특징으로 하는 영상정보 분류방법.
  5. 제1항에 있어서,
    상기 제1특징 벡터는 입력 영상을 다수의 블록으로 분할하고, 각 블록 중 배경에 대응되는 블록을 제거하고, 나머지 블록에 대해 색 구조 기술자를 검출하여 생성함을 특징으로 하는 영상정보 분류방법.
  6. 제1항에 있어서,
    상기 제2특징 벡터는 입력 영상을 다수의 블록으로 분할한 후에 각 블록에 대해 경계선 히스토그램 기술자를 검출하여 생성함을 특징으로 하는 영상정보 분류방법.
  7. 제6항에 있어서,
    상기 제2특징 벡터는 입력 영상정보에 대해 전역적 또는 반전역적으로 경계 선 히스토그램 기술자를 검출하여 생성함을 특징으로 하는 영상정보 분류방법.
  8. 영상정보 분류장치에 있어서,
    영상정보를 입력받아 색 구조 기술자에 따른 제1특징 벡터를 검출하는 색 구조 기술자에 따른 특징벡터 검출부;
    상기 영상정보를 입력받아 경계선 히스토그램 기술자에 따른 제2특징벡터를 검출하는 경계선 히스토그램 기술자에 따른 특징벡터 검출부;
    상기 제1 및 제2특징벡터를 다수의 클래스에 각각 대응되는 클래스 분류자 각각에 대해 어느 정도 근접한지를 나타내는 다수의 멤버십 스코어를 생성하는 클래스 분류부;
    를 포함하여, 상기 멤버십 스코어들이 상기 영상정보의 분류정보가 됨을 특징으로 하는 영상정보 분류장치.
  9. 제8항에 있어서,
    상기 클래스 분류부가,
    상기 다수의 클래스를 결합하여 앙상블 벡터를 생성함을 특징으로 하는 영상정보 분류장치.
  10. 제9항에 있어서,
    상기 클래스 분류부가,
    상기 앙상블 벡터를 상기 입력된 영상정보에 대응되게 저장매체에 저장함을 특징으로 하는 영상정보 분류장치.
  11. 제10항에 있어서,
    상기 앙상블 벡터로 구성된 다수의 멤버십 스코어 각각과 미리 저장된 다른 영상정보에 대응되는 앙상블 벡터에 포함된 다수의 멤버십 스코어 각각의 매칭정도가 미리 정해둔 값이상인지를 체크하고,
    상기 미리 정해둔 값이상 매칭되는 멤버십 스코어에 대응되게 유사여부를 표식한 유사정보를 생성하는 유사정보 생성부;
    를 더 포함하는 것을 특징으로 하는 영상정보 분류장치.
  12. 제8항에 있어서,
    상기 제1특징 벡터는 입력 영상을 다수의 블록으로 분할하고, 각 블록 중 배경에 대응되는 블록을 제거하고, 나머지 블록에 대해 색 구조 기술자를 검출하여 생성함을 특징으로 하는 영상정보 분류장치.
  13. 제8항에 있어서,
    상기 제2특징 벡터는 입력 영상을 다수의 블록으로 분할한 후에 각 블록에 대해 경계선 히스토그램 기술자를 검출하여 생성함을 특징으로 하는 영상정보 분류장치.
  14. 제13항에 있어서,
    상기 제2특징 벡터는 입력 영상정보에 대해 전역적 또는 반전역적으로 경계선 히스토그램 기술자를 검출하여 생성함을 특징으로 하는 영상정보 분류장치.
KR1020090026977A 2009-03-30 2009-03-30 영상정보 분류방법 및 장치 KR101093107B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090026977A KR101093107B1 (ko) 2009-03-30 2009-03-30 영상정보 분류방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090026977A KR101093107B1 (ko) 2009-03-30 2009-03-30 영상정보 분류방법 및 장치

Publications (2)

Publication Number Publication Date
KR20100108778A true KR20100108778A (ko) 2010-10-08
KR101093107B1 KR101093107B1 (ko) 2011-12-13

Family

ID=43129997

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090026977A KR101093107B1 (ko) 2009-03-30 2009-03-30 영상정보 분류방법 및 장치

Country Status (1)

Country Link
KR (1) KR101093107B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101323369B1 (ko) * 2012-09-21 2013-10-30 한양대학교 에리카산학협력단 영상 프레임 군집화 장치 및 방법
KR101443187B1 (ko) * 2012-12-24 2014-09-19 계명대학교 산학협력단 영상 군집화 기반의 의료 영상 검색 방법
KR20150086616A (ko) * 2014-01-20 2015-07-29 한국과학기술원 영상의 다변수화를 이용한 영상 구별 특징 자동 선별 장치 및 방법
KR101685821B1 (ko) * 2015-06-18 2016-12-13 인하대학교 산학협력단 흉부 X-ray 영상에서 몸체 및 관심영역 분할 방법 및 시스템
KR101685823B1 (ko) * 2015-06-18 2016-12-21 인하대학교 산학협력단 흉부 X―ray 영상을 위한 화질 개선 방법 및 시스템
CN108009984A (zh) * 2017-11-21 2018-05-08 中国地质大学(武汉) 一种面向水环境监测的水面显著性区域的检测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101323369B1 (ko) * 2012-09-21 2013-10-30 한양대학교 에리카산학협력단 영상 프레임 군집화 장치 및 방법
KR101443187B1 (ko) * 2012-12-24 2014-09-19 계명대학교 산학협력단 영상 군집화 기반의 의료 영상 검색 방법
KR20150086616A (ko) * 2014-01-20 2015-07-29 한국과학기술원 영상의 다변수화를 이용한 영상 구별 특징 자동 선별 장치 및 방법
KR101685821B1 (ko) * 2015-06-18 2016-12-13 인하대학교 산학협력단 흉부 X-ray 영상에서 몸체 및 관심영역 분할 방법 및 시스템
KR101685823B1 (ko) * 2015-06-18 2016-12-21 인하대학교 산학협력단 흉부 X―ray 영상을 위한 화질 개선 방법 및 시스템
CN108009984A (zh) * 2017-11-21 2018-05-08 中国地质大学(武汉) 一种面向水环境监测的水面显著性区域的检测方法
CN108009984B (zh) * 2017-11-21 2020-07-07 中国地质大学(武汉) 一种面向水环境监测的水面显著性区域的检测方法

Also Published As

Publication number Publication date
KR101093107B1 (ko) 2011-12-13

Similar Documents

Publication Publication Date Title
Kavasidis et al. A saliency-based convolutional neural network for table and chart detection in digitized documents
Caicedo et al. Histopathology image classification using bag of features and kernel functions
US8165410B2 (en) Bags of visual context-dependent words for generic visual categorization
US8315465B1 (en) Effective feature classification in images
Dou et al. A fast template matching-based algorithm for railway bolts detection
KR101093107B1 (ko) 영상정보 분류방법 및 장치
CN109993201A (zh) 一种图像处理方法、装置和可读存储介质
CN109213886B (zh) 基于图像分割和模糊模式识别的图像检索方法及系统
Puspaningrum et al. Waste classification using support vector machine with SIFT-PCA feature extraction
Taschwer et al. Automatic separation of compound figures in scientific articles
JPWO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム
Caicedo et al. A semantic content-based retrieval method for histopathology images
Wei et al. Food image classification and image retrieval based on visual features and machine learning
CN115203408A (zh) 一种多模态试验数据智能标注方法
Chakraborty et al. Application of daisy descriptor for language identification in the wild
Park Multiple feature-based classifier and its application to image classification
Gopalan et al. Statistical modeling for the detection, localization and extraction of text from heterogeneous textual images using combined feature scheme
KR20210031444A (ko) 데이터 프로그래밍에 기반한 레이블링 모델 생성 방법 및 장치
CN109993178B (zh) 一种特征数据生成和特征匹配方法及装置
Calarasanu et al. From text detection to text segmentation: a unified evaluation scheme
Yannawar A Novel Approach for Object Detection Using Optimized Convolutional Neural Network to Assist Visually Impaired People
Boparai et al. A hybrid approach for improving content based image retrieval systems
Reddy Extensive Content Feature based Image Classification and Retrieval using SVM
Qiu et al. Report on the Annotation Task in ImageCLEFmed 2005.
Matuszewski et al. Recognition of alphanumeric characters using artificial neuron networks and MSER algorithm

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150306

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151201

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee