KR102074406B1

KR102074406B1 - 영상 랜드마크 분류 장치 및 방법

Info

Publication number: KR102074406B1
Application number: KR1020190090279A
Authority: KR
Inventors: 배준호; 이용은; 정종훈; 최우식; 김태규
Original assignee: 주식회사 딥노이드
Priority date: 2019-07-25
Filing date: 2019-07-25
Publication date: 2020-02-06

Abstract

본 문서에 개시되는 일 실시 예에 따른 영상 랜드마크 분류 장치는, 분석대상 영상 및 참조 영상을 저장하는 메모리; 상기 분석대상 영상에서 신경망(neural network) 알고리즘을 통해 추출된 제1 특징점들 및 통계 기반 알고리즘을 통해 추출된 제2 특징점들 중 공통 특징점을 포함하는 특징지도 영상을 생성하는 랜드마크(landmark) 추출부; 및 상기 특징지도 영상의 에지(edge)에 관련된 포인트 그라디언트(point gradient)와 특징 벡터들에 기반하여 상기 분석대상 영상과 상기 참조 영상 간의 유사도 점수들을 확인하고, 상기 유사도 점수들에 기반하여 상기 분석대상 영상과 상기 참조 영상 간의 유사성을 결정하는 유사도 평가부를 포함할 수 있다.

Description

영상 랜드마크 분류 장치 및 방법{Apparatus and Method for classifying Landmark of Image}

본 문서에서 개시되는 다양한 실시 예들은, 머신 러닝 기반 영상 처리 기술과 관련된다.

인공 지능 기술은 머신 러닝(machine learning) 및 딥(deep) 러닝을 포함한다. 머신 러닝은 사람에 의해 입력된 훈련 데이터(training data)와 레이블링 데이터(labeling data)(정답)을 비교하면서 훈련 데이터의 특징(feature)을 학습하고, 학습 결과를 이용하여 다른 데이터를 예측(예: 종류를 예측)할 수 있다. 이 같이, 머신 러닝은 레이블링 데이터(정답)을 입력하기 위하여 사람의 수작업을 필요로 한다. 또한, 딥 러닝(deep learning)은 회선 신경망(CNN: convolution neural network)을 이용하여 (학습) 데이터를 스스로 분석하고 분석된 결과에 기반하여 데이터를 예측할 수 있다. 그런데, 딥 러닝은 데이터에 대한 예측 정밀도가 뛰어나지만, 학습을 위한 대량의 데이터 및 긴 학습 시간을 필요로 한다.

인공 지능 기술은 의료 영상과 같은 다양한 영상의 분석과 분류에 사용될 수 있다. 인공 지능 기술은 비지도 학습에 기반하여 영상을 분석하는 것을 목표로 하지만, 아직까지는 지도 학습에 어느 정도 기반하여 영상을 분석할 수 있다. 그런데, 의료 영상과 같이 정답(예: 병명 진단) 확인이 어려운 분야에서는 수동 영상 분석에 기반한 레이블링 데이터의 생성에 많은 시간이 소요될 수 있다. 예를 들어, 의료 영상은 영상전문의(radiologist)에 의해서만 분석될 수 있는데, 영상전문의 수는 많지 않으므로, 레이블링 데이터의 생성에 많이 시간이 소요될 수 있다.

본 문서에 개시되는 다양한 실시 예들은 영상에 포함된 랜드마크를 용이하게 추출 및 분류할 수 있는 영상 랜드마크 분류 장치 및 방법을 제공할 수 있다.

또한, 본 문서에 개시되는 일 실시 예에 따른 랜드마크 분류 방법은, 분석대상 영상에서 신경망(neural network) 알고리즘을 통해 추출된 제1 특징점들 및 통계 기반 알고리즘을 통해 추출된 제2 특징점들 중 공통 특징점을 포함하는 특징지도 영상을 생성하는 동작; 상기 특징지도 영상의 에지(edge)에 관련된 포인트 그라디언트(point gradient)와 특징 벡터들에 기반하여 상기 분석대상 영상과 메모리에 저장된 참조 영상 간의 유사도 점수들을 확인하는 동작; 및 상기 유사도 점수들에 기반하여 상기 분석대상 영상과 상기 참조 영상 간의 유사성을 결정하는 동작을 포함할 수 있다.

본 문서에 개시되는 다양한 실시 예들에 따르면, 영상에 포함된 랜드마크를 용이하게 추출 및 분류할 수 있다. 이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.

도 1은 일 실시예에 따른 영상 랜드마크(landmark) 분류 장치의 구현 환경을 나타낸다.
도 2는 일 실시예에 따른 영상 랜드마크 분류 장치의 구성도를 나타낸다.
도 3은 일 실시예에 따른 영상 랜드마크 분류 방법의 흐름도를 나타낸다.
도 4는 일 실시예에 따른 랜드마크 추출 방법을 나타낸다.
도 5는 일 실시예에 따른 제1 유사도 점수 산출 방법을 나타낸다.
도면의 설명과 관련하여, 동일 또는 유사한 구성요소에 대해서는 동일 또는 유사한 참조 부호가 사용될 수 있다.

도 1은 일 실시예에 따른 영상 랜드마크(landmark) 분류 장치의 구현 환경을 나타낸다.

외부 전자 장치(100)는 영상 데이터를 저장하고 있는 장치로서, 적어도 하나의 네트워크를 통해 영상 랜드마크 분류 장치(200)로 영상 데이터를 송신하고, 영상 랜드마크 분류 장치(200)에 의해 생성된 영상 데이터에 대응하는 랜드마크 정보를 영상 랜드마크 분류 장치(200)로부터 수신할 수 있다. 상기 영상 데이터는 예를 들면, x-ray 영상, CT(computerized　tomography) 영상, MRI(magnetic　resonance　imaging) 영상과 같은 의료 영상 및 상기 영상에 관련된 메타데이터를 포함할 수 있다. 상기 랜드마크 정보는 예를 들어, 분석대상 영상(또는, 분석대상 영상의 변환 영상)에 랜드마크의 위치와 형태를 중첩한 랜드마크 관련 영상을 포함할 수 있다. 외부 전자 장치(100)는 예를 들면, 측정기(예: x-ray 촬영기, CT 촬영기 및 MRI 촬영기) 및 측정기로부터 영상 데이터를 수신하는 다른 장치 중 적어도 하나를 포함할 수 있다.

영상 랜드마크 분류 장치(200)는 영상 랜드마크 분류 서비스를 위하여 구현된 웹 서버일 수 있다. 영상 랜드마크 분류 장치(200)는 상기 서비스를 위한 웹 사이트(web site)에 접속한 외부 전자 장치(100)로부터 영상 데이터를 수신할 수 있다.

영상 랜드마크 분류 장치(200)는 수신된 영상 데이터로부터 분석대상 영상을 추출하고, 신경망 알고리즘을 이용하여 분석대상 영상에서 제1 특징점들을 추출하고, 제1 특징점들을 포함하는 특징지도 영상을 생성할 수 있다. 영상 랜드마크 분류 장치(200)는 통계 기반 알고리즘을 이용하여 분석대상 영상에서 제2 특징점을 추출하고, 제2 특징점들에 대한 특징 벡터들을 생성할 수 있다. 영상 랜드마크 분류 장치(200)는 추출된 제1 특징점들 및 제2 특징점들 중 공통 특징점들을 포함하는 공통 특징지도 영상을 생성할 수 있다. 영상 랜드마크 분류 장치(200)는 분석대상 영상의 픽셀 분포도(예: 픽셀 값 중 색상 별 밝기 값 분포도)를 확인하고, 확인된 픽셀 분포도의 패턴을 확인할 수 있다.

영상 랜드마크 분류 장치(200)는 공통 특징지도 영상의 에지(edge)에 관련된 포인트 그라디언트(point gradient)와 특징 벡터에 기반하여 분석대상 영상과 데이터베이스에 저장된 참조 영상 간의 제1 유사도 점수 및 제2 유사도 점수들을 결정할 수 있다. 영상 랜드마크 분류 장치(200)는 상기 픽셀 분포도 패턴에 기반하여 분석대상 영상과 상기 참조 영상 간의 제3 유사도 점수를 결정할 수 있다. 상기 포인트 그라디언트는 예를 들면, 공통 특징지도 영상으로부터 에지를 검출하는 과정에서 확인된, 에지의 밝기 변화율(그라디언트)일 수 있다. 상기 특징 벡터는 예를 들면, 통계 기반 알고리즘에 기반하여 생성된 특징점의 밝기 변화율일 수 있다.

영상 랜드마크 분류 장치(200)는 복수의 유사도 점수들(예: 제1 유사도 점수, 제2 유사도 점수 및 제3 유사도 점수 중 복수의 유사도 점수들)을 결정 트리(decision tree) 기반의 랜덤 포레스트(random forest)에 입력하여, 참조 영상과의 유사도에 기반하여 분석대상 영상을 분류할 수 있다. 상기 결정 트리 기반 랜덤 포레스트는 참조 영상에 기반하여 분류대상 영상의 카테고리를 분류할 수 있도록 마련된 것일 수 있다.

영상 랜드마크 분류 장치(200)는 분석대상 영상에 랜드마크(공통 특징점)의 위치 및 형태를 중첩한 랜드마크 관련 영상을 생성할 수 있다. 영상 랜드마크 분류 장치(200)는 상기 유사도 점수 및 상기 결정 트리 기반의 랜덤 포레스트의 분류 근거(예: 분류에 사용된 임계치, 분기 구조) 중 적어도 일부를 시각화함에 따라 분류 근거 영상을 생성할 수 있다. 영상 랜드마크 분류 장치(200)는 상기 랜드마크 관련 영상 및 분류 근거 영상 중 적어도 하나를 외부 전자 장치(100)에 송신할 수 있다.

상술한 실시예에 따르면, 영상 랜드마크 분류 장치(200)는 신경망 알고리즘에 기반하여 사람의 시각 인지 과정과 유사한 영상 분석 과정을 수행하므로, 시각 인지 과정에서 인지된 랜드마크와 유사한 특징을 추출할 수 있으므로, 의료 분야와 같이 레이블링 데이터 확보가 어려운 분야에서 레이블링 데이터 생성에 이용될 수 있다.

또한, 영상 랜드마크 분류 장치(200)는 분석대상 영상의 분류 근거(예: 랜드마크 및 분류 조건)를 시각화하여 표시할 수 있어, 해당 장치에 의한 유사도 판단을 전문가에 의하여 용이하게 검증할 수 있다.

도 2는 일 실시예에 따른 영상 랜드마크 분류 장치의 구성도를 나타낸다.

도 2를 참조하면, 일 실시예에 따른 영상 랜드마크 분류 장치(200)는 통신 회로(210), 메모리(220) 및 프로세서(230)를 포함할 수 있다. 일 실시 예에서, 영상 랜드마크 분류 장치(200)는 일부 구성요소가 생략되거나, 추가적인 구성요소를 더 포함할 수 있다. 또한, 영상 랜드마크 분류 장치(200)의 구성요소들 중 일부가 결합되어 하나의 개체로 구성되되, 결합 이전의 해당 구성요소들의 기능을 동일하게 수행할 수 있다.

통신 회로(210)는 영상 랜드마크 분류 장치(200)와 다른 전자 장치(예: 도 1의 외부 전자 장치(100)) 간의 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 회로(210)는 무선 통신 모듈(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(예: 블루투스, WiFi direct 또는 IrDA(infrared data association) 같은 근거리 통신 네트워크) 또는 제 2 네트워크(예: 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 다른 전자 장치(외부 전자 장치(100))와 통신할 수 있다.

메모리(220)는 영상 랜드마크 분류 장치(200)의 적어도 하나의 구성요소(예: 프로세서(230))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는 예를 들어, 소프트웨어 및 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 예를 들어, 메모리(220)는 랜드마크 검출을 위한 적어도 하나의 인스트럭션을 저장할 수 있다. 메모리(220)는 휘발성 메모리 또는 비휘발성 메모리를 포함할 수 있다.

프로세서(230)는 상기 적어도 하나의 인스트럭션을 실행함에 따라 영상 랜드마크 분류 장치(200)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 프로세서(230)는 예를 들어, 중앙처리장치(CPU), 그래픽처리장치(GPU), 마이크로프로세서, 애플리케이션 프로세서(application processor), 주문형 반도체(ASIC(application specific integrated circuit), FPGA(field programmable gate arrays)) 중 적어도 하나를 포함할 수 있으며, 복수의 코어를 가질 수 있다.

프로세서(230)는 수신부(231), 전처리부(233), 랜드마크 추출부(235), 유사도 평가부(237) 및 결과 출력부(239)를 포함할 수 있다. 수신부(231), 전처리부(233), 랜드마크 추출부(235), 유사도 평가부(237) 및 결과 출력부(239)는 각기 별도의 하드웨어 모듈이거나, 또는 적어도 하나의 프로세서에 의하여 구현되는 소프트웨어 구성요소일 수 있다. 예를 들어, 수신부(231), 전처리부(233), 랜드마크 추출부(235), 유사도 평가부(237) 및 결과 출력부(239)가 수행하는 기능은 하나의 프로세서에 의하여 수행되거나, 각각 별도의 프로세서에 의하여 수행될 수 있다.

일 실시예에 따르면, 수신부(231)는 통신 회로(210)를 통해 외부 전자 장치(예: 도 1의 외부 전자 장치(100))로부터 지정된 방식으로 영상 데이터를 수신하고, 수신된 영상 데이터를 메모리(220)에 저장할 수 있다. 예를 들어, 수신부(231)는 외부 전자 장치(100)로부터 바이너리 파일(binary file)을 비동기 방식으로 수신하고, 수신된 바이너리 파일을 메모리(220)의 메시지 큐(message queue)에 저장할 수 있다. 수신부(231)는 상기 저장된 바이너리 파일을 영상 데이터로 변환할 수 있다. 상술한 실시예에 따르면, 수신부(231)는 메시지 큐 방식으로 영상 데이터를 송수신함에 따라 영상 데이터의 송수신 속도를 향상시킬 수 있고, 영상 데이터의 처리 부하를 개선할 수 있다. 상기 영상 데이터는 예를 들면, x-ray 영상, CT(computerized　tomography) 영상, MRI(magnetic　resonance　imaging) 영상과 같은 의료 영상 및 상기 의료 영상에 관련된 메타데이터를 포함할 수 있다.

일 실시예에 따르면, 전처리부(233)는 메모리(220)로부터 영상 데이터를 획득하고, 획득된 영상 데이터에 포함된 메타데이터(metadata)로 분리할 수 있다. 전처리부(233)는 분리된 분석대상 영상을 전처리하고, 전처리된 영상을 출력할 수 있다. 예를 들어, 전처리부(233)는 영상의 해상도를 지정된 해상도로 변환할 수 있다. 다른 예를 들어, 전처리부(233)는 영상의 강도(또는, 밝기)(intensity) 값을 분석하여 히스토그램(histogram)을 구성하고, 구성된 히스토그램을 기반으로 영상에 대한 히스토그램 균일화(histogram equalization)를 수행할 수 있다. 상기 균일화된 영상은 사물과 배경 사이의 대비가 강화될 수 있다. 추가적으로 또는 대체적으로, 전처리부(233)는 영상에 포함된 강도 값들 중에서 지정된 강도 값이 강조되도록 영상에 대한 히스토그램 균일화를 수행할 수 있다. 예를 들어, 전처리부(233)는 영상에 포함된 오브젝트들 중 분류에 이용될 오브젝트에 대응하는 강도 값이 강조되도록(예: 커지도록) 히스토그램 균일화를 수행할 수 있다. 또 다른 예로, 전처리부(233)는 통계 기반 데이터에 기반하여 영상으로부터 노이즈를 제거할 수 있다. 예를 들면, CT(computerized　tomography) 영상 또는 MRI(magnetic　resonance　imaging) 영상과 같은 의료 영상은 환자 또는 측정기(예: CT 촬영기, MRI 촬영기)의 움직임으로 인한 노이즈를 포함할 수 있다. 상기 움직임으로 인하여 영상에 발생된 노이즈는 일정 패턴을 가질 수 있다. 따라서, 전처리부(233)는 메모리(220)에 저장된 보정 데이터에 기반하여 영상에 포함된 상기 움직임으로 인한 노이즈를 제거(예: bias correction)할 수 있다. 상기 보정 데이터는 상기 움직임으로 인한 노이즈의 일정 패턴을 제거할 수 있도록 마련될 수 있다. 또 다른 예로, 전처리부(233)는 수신된 3차원 영상을 2차원 영상으로 영상의 차원을 축소할 수 있다.

일 실시예에 따르면, 랜드마크 추출부(235)는 전처리된 영상을 입력 받고, 입력 영상에 신경망 알고리즘에 기반한 컨볼루션 필터(convolution filter)를 컨볼루션함에 따라, 신경망에 포함된 복수의 계층들(또는, 컨볼루션 필터)에 대응하는 복수의 특징 지도(feature map) 영상들을 생성할 수 있다. 상기 신경망 알고리즘은 예를 들면, Resnet(residual network), Desenet(densely connected convolutional networks) 및 Mobilenet 중 적어도 하나의 신경망 알고리즘의 조합으로 구성될 수 있다. 상기 신경망 알고리즘은 다른 예를 들면, 오토 인코더(auto encoder) 기반의 인코딩-디코딩(encoding-decoding) 구조의 알고리즘 또는 딥 러닝 알고리즘에서 이용되는 다른 다양한 신경망 알고리즘을 포함할 수 있다. 상기 각 특징지도 영상들은 예를 들면, 각 신경망에 의해 특징적인 부분으로 판단된 픽셀들(제1 특징점(keypoint))이 상대적으로 큰 픽셀 값(활성화 정도)을 가지고, 특징적이지 않은 부분(비특징적인 부분)으로 판단된 픽셀들은 상대적으로 작은 픽셀 값(예: 0에 가까운 값)을 가지는 영상일 수 있다. 상기 각 특징지도 영상들은 다른 예를 들면, 분류에 있어서 중요한 부분(특징적인 부분)을 제외한 나머지 부분의 픽셀 값이 검정색인 영상일 수 있다. 상기 특징적인 부분은 예를 들면, 윤곽, 강도 값, 물체의 형태를 포함할 수 있다.

한 실시예에 따르면, 랜드마크 추출부(235)는 복수의 컨볼루션 계층(convolution layer)들 및 적어도 하나의 풀링 계층(polling layer)을 포함할 수 있다. 상기 컨볼루션 계층은 필터 및 활성화 함수를 포함할 수 있다. 상기 필터는 입력 영상과 컨볼루션되어, 입력 영상에 포함된 가로 선, 세로 선 및 십자 모양과 같은 지정된 모양(특징점)을 검출하고, 검출된 모양이 활성화된 영상을 출력할 수 있다. 상기 활성화 함수(예: ReLu)는 필터링된 영상의 픽셀 값을 제1 지정된 범위(예: 0에서 1사이)의 값으로 정규화할 수 있다. 상기 풀링 계층은 컨볼루션 계층에 의하여 특징점이 활성화된 특징지도 영상을 M*N 크기로 분할하고, 각 분할 영역에서 하나의 값(예: 최대 값)을 추출하고 추출된 값을 조합함에 따라 활성화 영상의 사이즈(또는, 해상도)를 축소할 수 있다. 상술한 동작을 통해서, 랜드마크 추출부(235)는 복수의 컨볼루션 필터에 의해 추출된 제1 특징점들 중 적어도 일부를 각기 포함하는 복수의 특징지도 영상들을 생성할 수 있다.

일 실시예에 따르면, 랜드마크 추출부(235)는 통계 기반 알고리즘에 기반하여 전처리된 영상에서 제2 특징점들을 추출할 수 있다. 상기 통계 기반 알고리즘은 SIFT(Scale Invariant Feature Transform), SIFT-DoG(Difference of Gaussian), FAST(Features from Accelerated Segment Test) 및 SURF(Speeded up robust features) 중 적어도 하나의 알고리즘을 포함할 수 있다.

한 실시예에 따르면, 랜드마크 추출부(235)는 제1 통계 기반 알고리즘에 기반하여 각 영상에서 코너(corner)점과 같이 식별이 용이한 특징점을 추출하고, 제2 통계 기반 알고리즘에 기반하여 추출된 제2 특징점에 대한 특징 벡터(특징점 기술자)을 생성할 수 있다. 상기 제2 통계 기반 알고리즘은 제1 통계 기반 알고리즘과 동일 또는 상이할 수 있다. 상기 특징 벡터는 예를 들면, 제2 특징점의 픽셀 그라디언트(pixel gradient)일 수 있다. 예를 들어, 랜드마크 추출부(235)는 SIFT 알고리즘에 기반하여 영상의 스케일(또는, 해상도)를 달리하여 라플라시안(laplacian) 함수를 통해 각 스케일의 영상에 대한 라플라시안 값(영상의 밝기 변화에 대한 2차 미분값))을 산출하고, 각 스케일의 영상 내에서 라플라시안 값이 극대(또는, 극소)인 점을 크기 불변의 특징점을 추출할 수 있다. 랜드마크 추출부(235)는 SIFT 알고리즘에 기반하여 추출된 특징점을 중심으로 지정된 윈도우(예: 16*16 윈도우) 블록을 설정하고, 지정된 연산식을 이용하여 설정된 블록 내 모든 픽셀의 그라디언트 방향과 크기를 산출하고, 설정된 블록에서 가장 큰 방향을 각 특징점의 방향으로 할당할 수 있다. 랜드마크 추출부(235)는 예를 들면, 제2 특징점에 상대적으로 가까운 주변 픽셀보다 상대적으로 먼 주변 픽셀의 그라디언트 크기를 더 크게 설정할 수 있다. 랜드마크 추출부(235)는 예를 들면, 상기 설정된 블록 내 픽셀들의 그레디언트 방향에 대한 히스토그램(360도는 36개의 구간으로 분할)을 구성하고, 구성된 히스토그램에서 가장 높은 구간에 대응하는 방향을 특징점의 방향으로 할당할 수 있다. 랜드마크 추출부(235)는 제2 특징점의 주변 모양 변화에 대한 경향을 확인하고, 확인된 경향에 기반하여 특징점 기술자를 생성할 수 있다. 예를 들어, 랜드마크 추출부(235)는 각 특징점을 중심으로 16*16 블록을 설정하고, 설정된 블록을 4*4 블록 단위로 총 16개의 서브 블록으로 나누고, 상기 서브 블록 내 픽셀들의 그라디언트 크기와 방향을 산출할 수 있다. 랜드마크 추출부(235)는 제2 특징점 주변의 픽셀들(16개의 서브 블록 내 픽셀들)의 그라디언트 방향과 크기에 기반하여 각 제2 특징점의 그라디언트 크기와 방향을 128차원 특징 벡터(128개의 숫자)로 산출할 수 있다. 랜드마크 추출부(235)는 서브 블록 내 픽셀들의 그라디언트 방향에서 제2 특징점의 그라디언트 방향을 빼줌에 따라 제2 특징점에 대한 특징 벡터(특징점 기술자)를 보정할 수 있다.

랜드마크 추출부(235)는 신경망 알고리즘에 기반하여 추출된 제1 특징점들과 통계 기반 알고리즘에 기반하여 추출된 제2 특징점들 중 공통 특징점들을 추출하고, 추출된 공통 특징점(랜드마크(landmark))을 포함하는 공통 특징지도 영상을 생성할 수 있다. 예를 들어, 랜드마크 추출부(235)는 복수의 특징지도 영상들을 조합하여 제1 특징점을 포함하는 하나의 특징지도 영상을 생성할 수 있다. 다른 예를 들어, 랜드마크 추출부(235)는 상기 공통 특징지도에 포함된 특징점들을 신경망에 기반하여 산출된 활성화 정도 및 통계 기반 알고리즘에 기반하여 산출된 특징 벡터와 맵핑(mapping)(또는 관련)할 수 있다.

랜드마크 추출부(235)는 전처리된 영상을 그레이 스케일 영상으로 변환하고, 상기 그레이 스케일 영상의 픽셀 값에 대하여 픽셀 분포 그래프(예: 히스토그램)를 구성할 수 있다. 랜드마크 추출부(235)는 구성된 픽셀 분포 그래프에 기반하여 분석대상 영상의 픽셀 분포도 패턴을 검출할 수 있다. 예를 들어, 의료 영상은 x-ray 영상, CT 영상 및 MRI 영상과 같은 영상 종류에 따라서 어느 정도 일정한 분포도 패턴을 가질 수 있다. 랜드마크 추출부(235)는 상기 픽셀 분포도 패턴에 기반하여 영상 종류 분류의 근거를 제공할 수 있다.

유사도 평가부(237)는 랜드마크 추출부(235)로부터 공통 특징지도 영상을 수신하고, 수신된 공통 특징지도 영상에서 활성화된 부분을 추출(예: 활성화된 부분을 크롭(crop))하고, 지정된 영상처리 알고리즘에 기반하여 추출된 영상을 이진화할 수 있다. 예를 들어, 유사도 평가부(237)는 Otsu 알고리즘에 의하여 공통 특징지도 영상에서 활성화된 부분(특징점의 활성화 정도)의 이진화를 위한 임계 값을 설정하고, 설정된 임계 값에 기반하여 특징지도 영상의 활성화된 부분을 1로 변환하고, 그 외 부분을 0으로 변환할 수 있다.

유사도 평가부(237)는 에지 검출 알고리즘(예: 캐니(canney) 에지 검출 알고리즘)에 기반하여 이진화된 영상에서 에지(또는, 외곽선)를 검출하고, 검출된 에지의 포인트 그라디언트(point gradient)를 산출할 수 있다. 예를 들어, 유사도 평가부(237)는 이진화된 영상(공통 특징점을 포함)을 가우시안 필터링(Gaussian filtering)하여 영상을 부드럽게 하고, 소벨(Sobel) 연산자를 사용하여 수평 방향과 수직 방향의 그라디언트 벡터의 크기를 계산할 수 있다. 유사도 평가부(237)는 3*3 윈도우를 이용하여 그라디언트 벡터 방향에서 그라디언트의 크기가 최대값인 화소만을 남기고 나머지는 0으로 억제할 수 있다. 유사도 평가부(237)는 제1 임계값을 사용하여 그라디언트 방향에서 제2 임계값(제1 임계값 보다 작음)이 나올 때까지 추적하여 검출된 에지를 연결함에 따라 외곽선을 검출할 수 있다. 유사도 평가부(237)는 검출된 외곽선 상에 존재하는 공통 특징점에 대한 그라디언트(포인트 그라디언트)를 확인할 수 있다. 상기 포인트 그라디언트는 예를 들면, 이진 영상으로부터 에지를 검출하는 과정에서 확인된, 에지의 밝기 변화율(그라디언트)일 수 있다.

유사도 평가부(237)는 분석대상 영상에서 검출된 에지의 포인트 그라디언트와 메모리(220)에 저장된 참고 영상에 포함된 에지의 포인트 그라디언트들 간의 벡터 거리(예: 유클리디안 거리)를 산출할 수 있다. 예를 들어, 유사도 평가부(237)는 코사인 거리, 유클리디안 거리(euclidean distance) 및 마할라노비스 거리(mahalanobis distance) 중 적어도 하나에 기반하여 분석대상 영상과 참고 영상에 포함된 에지의 포인트 그라디언트들 간의 벡터 거리를 계산할 수 있다. 유사도 평가부(237)는 산출된 특징 벡터들 간의 거리를 자연 로그 형태로 변환하여 제2 지정된 범위(예: 0~1 사이) 내에 속하는 제1 유사도 점수를 결정할 수 있다.

유사도 평가부(237)는 특징지도 영상(분석대상 영상)에 맵핑된 특징 벡터와 참조 영상에 맵핑된 특징 벡터 간의 코사인 유사도에 기반하여 분석대상 영상과 참조 영상 간의 제2 유사도 점수를 결정할 수 있다. 예를 들어, 유사도 평가부(237)는 이진화된 영상에 포함된 공통 특징점들에 맵핑된, 통계 기반 알고리즘에 따라 생성된 특징 벡터들(분석대상 영상에 관련된 특징 벡터)을 확인하고, 분석대상 영상에 관련된 특징 벡터와 참조 영상에 관련된 특징 벡터 간의 코사인 유사도(이하, 제2 유사도 점수라 함)를 산출할 수 있다. 다양한 실시예에 따르면, 유사도 평가부(237)는 이진화 영상으로부터 검출된 외곽선 상의 공통 특징점에 맵핑된 특징 벡터를 확인하고, 확인된 특징 벡터와 참조 영상의 특징 벡터에 기반하여 분석대상 영상과 참조 영상 간의 제2 유사도 점수를 확인할 수 있다.

유사도 평가부(237)는 분석대상 영상(전처리된 영상)에서 검출된 픽셀 분포도 패턴과 메모리(220)에 저장된 참고 영상의 픽셀 분포도 패턴 간의 코사인 유사도(cosine similarity)를 산출할 수 있다. 예를 들어, 유사도 평가부(237)는 특징지도 영상에서 통계 기반 알고리즘에 의하여 검출된 특징점에 대한 픽셀 분포도 그래프와 참고 영상에서 통계 기반 알고리즘에 의해 검출된 특징점에 대한 픽셀 분포도 간의 코사인 유사도(이하, "제3 유사도 점수"라 함)를 산출할 수 있다.

유사도 평가부(237)는 제1 유사도 점수, 제2 유사도 점수 및 제3 유사도 점수를 결정트리(decision tree) 기반 랜덤 포레스트(random forest)에 입력하고, 상기 결정 트리 기반 랜덤 포레스트에 기반하여 특징지도 영상(분석대상 영상)과 참고 영상 간의 유사성 여부 및 최종 유사도 점수를 결정할 수 있다. 예를 들어, 유사도 평가부(237)는 제3 유사도 점수에 기반하여 분석대상 영상이 x-ray 영상, CT 영상 및 MRI 영상 중 어느 종류에 해당하는지를 분류하고, 제1 유사도 점수와 제2 유사도 점수에 기반하여 분석대상 영상의 카테고리(예: 복부 영상, 흉부 영상, 뇌 영상, 의료 영상으로 확인 가능한 병명)를 결정할 수 있다.

일 실시예에 따르면, 결과 출력부(239)는 분석대상 영상(예: 수신된 영상)에 랜드마크의 위치와 형태(예: 윤곽선)를 중첩한 랜드마크 관련 영상을 생성할 수 있다. 예를 들어, 결과 출력부(239)는 분석대상 영상과 참고 영상의 유사성 정보(유사성 여부, 분석대상 영상의 분류 결과) 및 랜드마크(공통 특징점)의 위치와 형태를 나타내는 오브젝트(object)를 지정된 형태(예: 히트맵(heat-map) 형태)로 시각화함에 따라 랜드마크 관련 영상을 생성할 수 있다. 결과 출력부(239)는 결정 트리 기반 랜덤 포레스트를 시각화한 분류 근거 영상을 생성할 수 있다. 예를 들어, 결과 출력부(239)는 상기 유사도 점수들 및 상기 결정 트리 기반의 랜덤 포레스트의 분류 근거(예: 임계치, 분기 구조) 중 적어도 일부를 시각화함에 따라 분류 근거 영상을 생성할 수 있다.

결과 출력부(239)는 랜드마크 관련 영상, 분류 근거 영상, 분석대상 영상, 제1 내지 제3 유사도 점수 및 유사성 정보(예: 분석대상 영상의 분류 결과)를 관련하여 메모리(220)에 저장할 수 있다. 추가적으로, 결과 출력부(239)는 랜드마크 관련 영상 및 분류 근거 이미지를 통신 회로(210)를 통해 외부 전자 장치(100)로 송신할 수 있다.

상술한 실시예에 따르면, 영상 랜드마크 분류 장치(200)는 컨볼루션 신경망에 기반하여 사람의 시각 인지 과정과 유사한 영상 분석 과정을 수행하므로, 시각 인지 과정에서 인지된 랜드마크와 유사한 특징을 추출할 수 있으므로, 의료 분야와 같이 레이블링 데이터 확보가 어려운 분야에서 레이블링 데이터 생성에 이용될 수 있다.

또한, 영상 랜드마크 분류 장치(200)는 분석대상 영상의 유사성 판단 근거가 되는 랜드마크를 시각화하여 표시할 수 있어, 해당 장치에 의한 유사도 판단을 전문가에 의하여 용이하게 검증할 수 있다.

또한, 영상 랜드마크 분류 장치(200)는 분석대상 영상의 랜드마크 및 관련데이터(특징 벡터)를 기반하여 이후 분석대상 영상을 참조 영상으로 이용하거나, 학습 데이터로 이용할 수 있다.

도 3은 일 실시예에 따른 영상 랜드마크 분류 방법의 흐름도를 나타낸다.

도 3을 참조하면, 동작 310에서, 영상 랜드마크 분류 장치(200)는 입력 영상(분석대상 영상)에서 신경망(neural network) 알고리즘을 통해 추출된 제1 특징점들 및 통계 기반 알고리즘을 통해 추출된 제2 특징점들 중 공통 특징점을 포함하는 특징지도 영상을 생성할 수 있다. 예를 들어, 영상 랜드마크 분류 장치(200)는 신경망 알고리즘을 이용하여 분석대상 영상에서 제1 특징점들을 추출하고, 제1 특징점들을 포함하는 특징지도 영상을 생성할 수 있다. 영상 랜드마크 분류 장치(200)는 통계 기반 알고리즘을 이용하여 분석대상 영상에서 제2 특징점을 추출하고, 제2 특징점들에 대한 특징 벡터들을 생성할 수 있다. 영상 랜드마크 분류 장치(200)는 추출된 제1 특징점들 및 제2 특징점들 중 공통 특징점들을 포함하는 공통 특징지도 영상을 생성할 수 있다. 추가적으로, 영상 랜드마크 분류 장치(200)는 분석대상 영상의 픽셀 분포도(예: 픽셀 값 중 색상 별 밝기 값 분포도)를 확인하고, 확인된 픽셀 분포도의 패턴을 확인할 수 있다.

동작 320에서, 영상 랜드마크 분류 장치(200)는 상기 특징지도 영상의 에지(edge)에 관련된 포인트 그라디언트(point gradient)와 상기 제2 특징점들에 대응하는 특징 벡터들에 기반하여 상기 입력 영상과 메모리에 저장된 참조 영상 간의 복수의 유사도 점수들을 확인할 수 있다. 예를 들어, 영상 랜드마크 분류 장치(200)는 공통 특징지도 영상의 에지(edge)에 관련된 포인트 그라디언트(point gradient)와 특징 벡터들에 기반하여 분석대상 영상과 데이터베이스에 저장된 참조 영상 간의 제1 및 제2 유사도 점수들을 결정할 수 있다. 영상 랜드마크 분류 장치(200)는 상기 픽셀 분포도 패턴에 기반하여 분석대상 영상과 상기 참조 영상 간의 제3 유사도 점수를 결정할 수 있다.

동작 330에서, 영상 랜드마크 분류 장치(200)는 복수의 유사도 점수들에 기반하여 상기 입력 영상과 상기 참조 영상 간의 유사성을 결정할 수 있다. 예를 들어, 영상 랜드마크 분류 장치(200)는 복수의 유사도 점수들(예: 제1 유사도 점수, 제2 유사도 점수 및 제3 유사도 점수 중 복수의 유사도 점수들)을 결정 트리(decision tree) 기반의 랜덤 포레스트(random forest)에 입력하여, 참조 영상과의 유사도에 기반하여 분석대상 영상을 분류할 수 있다.

동작 340에서, 영상 랜드마크 분류 장치(200)는 분석대상 영상에 랜드마크(공통 특징점)의 위치 및 형태를 중첩한 랜드마크 관련 영상을 생성할 수 있다. 영상 랜드마크 분류 장치(200)는 상기 유사도 점수 및 상기 결정 트리 기반의 랜덤 포레스트의 분류 근거(예: 임계치, 분기 구조) 중 적어도 일부를 시각화하여 분류 기준 영상을 생성할 수 있다.

또한, 영상 랜드마크 분류 장치(200)는 영상의 유사성 판단 근거가 되는 랜드마크를 시각화하여 표시할 수 있어, 해당 장치에 의한 유사도 판단을 전문가에 의하여 용이하게 검증할 수 있다.

도 4는 일 실시예에 따른 랜드마크 추출 방법을 나타낸다.

도 4를 참조하면, 동작 410에서, 랜드마크 추출부(도 2의 랜드마크 추출부(235))는 분석대상 영상(전처리된 영상)에 신경망에 기반한 컨볼루션 필터를 컨볼루션함에 따라, 신경망에 포함된 복수의 계층들(또는, 컨볼루션 필터)에 대응하는 복수의 특징 지도(feature map) 영상들을 생성할 수 있다.

동작 420에서, 랜드마크 추출부(235)는 통계 기반 알고리즘에 기반하여 분석대상 영상에서 제2 특징점들을 추출할 수 있다. 상기 통계 기반 알고리즘은 예를 들면, SIFT(Scale Invariant Feature Transform), SIFT-DoG(Difference of Gaussian), FAST(Features from Accelerated Segment Test) 및 SURF(Speeded up robust features) 중 적어도 하나의 알고리즘을 포함할 수 있다. 동작 420에서, 랜드마크 추출부(235)는 통계 기반 알고리즘에 기반하여 추출된 제2 특징점에 대한 특징 벡터(특징점 기술자)을 생성할 수 있다.

동작 430에서, 랜드마크 추출부(235)는 제1 특징점들과 제2 특징점들 중 공통 특징점들을 추출하고, 추출된 공통 특징점(랜드마크(landmark))을 포함하는 공통 특징지도 영상을 생성할 수 있다. 예를 들어, 랜드마크 추출부(235)는 복수의 특징지도 영상들을 조합하여 제1 특징점을 포함하는 하나의 특징지도 영상을 생성할 수 있다. 랜드마크 추출부(235)는 상기 공통 특징지도의 각 특징점들을 신경망에 기반하여 산출된 활성화 정도 및 통계 기반 알고리즘에 기반하여 산출된 특징 벡터와 각기 맵핑할 수 있다.

동작 440에서, 랜드마크 추출부(235)는 분석대상 영상의 픽셀 분포도 패턴을 산출할 수 있다. 예를 들어, 랜드마크 추출부(235)는 전처리된 영상을 그레이 스케일(gray scale) 영상으로 변환하고, 상기 그레이 스케일 영상의 픽셀 값에 대하여 픽셀 분포 그래프(예: 히스토그램)를 구성할 수 있다. 랜드마크 추출부(235)는 구성된 픽셀 분포 그래프에 기반하여 분석대상 영상의 픽셀 분포도 패턴을 검출할 수 있다.

도 5는 일 실시예에 따른 유사도 평가부에 의한 제1 유사도 점수 산출 방법을 나타낸다.

도 5를 참조하면, 동작 510에서, 유사도 평가부(237)는 공통 특징지도 영상에서 활성화된 부분을 추출(예: 활성화된 부분을 크롭(crop))할 수 있다.

동작 520에서, 유사도 평가부(237)는 지정된 영상처리 알고리즘에 기반하여 추출된 영상을 이진화할 수 있다. 예를 들어, 유사도 평가부(237)는 Otsu 알고리즘에 의하여 공통 특징지도 영상에서 활성화된 부분(특징점의 활성화 정도)의 이진화를 위한 임계 값을 설정하고, 설정된 임계 값에 기반하여 특징지도 영상의 활성화된 부분과 그 외 부분을 각기 1과 0으로 변환할 수 있다.

동작 530에서, 유사도 평가부(237)는 에지 검출 알고리즘(예: 캐니(canney) 에지 검출 알고리즘)에 기반하여 이진화된 영상에서 에지(또는, 외곽선)를 검출할 수 있다. 예를 들어, 유사도 평가부(237)는 이진화된 영상(공통 특징점을 포함)을 가우시안 필터링하여 영상을 부드럽게 하고, 소벨(Sobel) 연산자를 사용하여 수평 방향과 수직 방향의 그라디언트 벡터의 크기를 계산할 수 있다. 유사도 평가부(237)는 3*3 윈도우를 이용하여 그라디언트 벡터 방향에서 그라디언트의 크기가 최대값인 화소만을 남기고 나머지는 0으로 억제할 수 있다. 유사도 평가부(237)는 제1 임계값을 사용하여 그라디언트 방향에서 제2 임계값(제1 임계값 보다 작음)이 나올 때까지 추적하여 검출된 에지를 연결함에 따라 외곽선을 검출할 수 있다. 유사도 평가부(237)는 검출된 외곽선 상에 존재하는 공통 특징점에 대한 그라디언트(포인트 그라디언트)를 확인할 수 있다.

동작 540에서, 유사도 평가부(237)는 분석대상 영상에서 검출된 에지의 포인트 그라디언트와 메모리(220)에 저장된 참고 영상에 포함된 에지의 포인트 그라디언트들 간의 벡터 거리를 산출할 수 있다. 예를 들어, 유사도 평가부(237)는 코사인 거리, 유클리디안 거리(euclidean distance) 및 마할라노비스 거리(mahalanobis distance) 중 적어도 하나에 기반하여 분석대상 영상과 참고 영상에 포함된 에지의 포인트 그라디언트들 간의 벡터 거리를 계산할 수 있다. 이후, 유사도 평가부(237)는 산출된 특징 벡터들 간의 거리를 자연 로그 형태로 변환하여 제2 지정된 범위(예: 0~1 사이) 내에 속하는 제1 유사도 점수를 결정할 수 있다. 상기 포인트 그라디언트는 예를 들면, 이진 영상으로부터 에지를 검출하는 과정에서 확인된, 에지의 밝기 변화율(그라디언트)일 수 있다.

본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나",“A 또는 B 중 적어도 하나”, "A, B 또는 C", "A, B 및 C 중 적어도 하나” 및 “A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, “기능적으로” 또는 “통신적으로”라는 용어와 함께 또는 이런 용어 없이, “커플드” 또는 “커넥티드”라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.

본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.

본 문서의 다양한 실시예들은 기기(machine)(예: 영상 랜드마크 분류 장치(200)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 메모리(220))(예: 내장 메모리 또는 외장 메모리)에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램)로서 구현될 수 있다. 예를 들면, 기기(예: 영상 랜드마크 분류 장치(200))의 프로세서(예: 프로세서(230)는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체 는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, ‘비일시적’은 저장매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.

일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어^TM)를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims

영상 랜드마크 분류 장치에 있어서,
분석대상 영상 및 참조 영상을 저장하는 메모리;
상기 분석대상 영상에서 신경망(neural network) 알고리즘을 통해 추출된 제1 특징점들 및 통계 기반 알고리즘을 통해 추출된 제2 특징점들 중 공통 특징점을 포함하는 특징지도 영상을 생성하는 랜드마크(landmark) 추출부; 및
상기 특징지도 영상의 에지(edge)에 관련된 포인트 그라디언트(point gradient)와 특징 벡터들에 기반하여 상기 분석대상 영상과 상기 참조 영상 간의 유사도 점수들을 확인하고, 상기 유사도 점수들에 기반하여 상기 분석대상 영상과 상기 참조 영상 간의 유사성을 결정하는 유사도 평가부를 포함하 고,
상기 유사도 평가부는,
a) 상기 특징지도 영상에서 상기 공통 특징점들이 포함된 부분을 추출하고, 상기 추출된 부분에 포함된 공통 특징점들의 그라디언트에 기반하여 에지를 검출하고, 상기 분석대상 영상과 상기 참조 영상에 포함된 에지의 포인트 그라이언드들 간의 벡터 거리를 산출하고, 산출된 특징 벡터들 간의 거리를 자연 로그 형태로 변환하여 0 ~ 1 범위 내의 점수인 제1 유사도 점수를 결정하고,
b) 상기 통계 기반 알고리즘에 따라 추출된 상기 공통 특징점들에 맵핑된 특징 벡터들을 확인하고, 상기 확인된 특징 벡터들과 상기 참조 영상에 맵핑된 특징 벡터 간의 코사인 유사도에 기반하여 상기 분석대상 영상과 상기 참조 영상 간의 코사인 유사도인 제2 유사도 점수를 결정하고,
c) 상기 분석대상 영상과 상기 참조 영상의 픽셀 분포도 패턴 간의 코사인 유사도인 제3 유사도 점수를 결정하고,
d) 상기 제1 유사도 점수, 제2 유사도 점수 및 제3 유사도 점수를 결정트리 기반 랜덤 포레스트에 입력하고, 상기 결정 트리 기반 랜덤 포레스트에 기반하여 상기 특징지도 영상과 참고 영상 간의 유사성 여부 및 최종 유사도 점수를 결정하며,
상기 제3 유사도 점수에 기반하여 상기 분석대상 영상의 종류(x-ray, CT 및 MRI 중 어느 하나)를 분류하고, 상기 제1 유사도 점수 및 상기 제2 유사도 점수에 기반하여 상기 분석대상 영상의 카테고리(병명)을 결정하는 영상 랜드마크 분류 장치.
청구항 1에 있어서, 상기 랜드마크 추출부는,
상기 분석대상 영상에, 상기 신경망 알고리즘에 기반한 복수의 컨볼루션 필터(convolution filter)를 컨볼루션하여 복수의 특징지도 영상들을 생성하고,
상기 복수의 특징지도 영상들을 조합하여 상기 제1 특징점들을 포함하는 특징지도 영상을 생성하고,
상기 통계 기반 알고리즘에 기반하여 상기 분석대상 영상에서 상기 제2 특징점들 및 상기 제2 특징점들의 특징 벡터들을 생성하고,
상기 생성된 특징지도 영상에서 상기 제1 특징점들과 상기 제2 특징점들과 맵핑되는 상기 공통 특징점들을 추출하고,
상기 공통 특징점들을 포함하고 상기 특징 벡터들과 맵핑된 특징지도 영상을 생성하도록 설정된, 영상 랜드마크 분류 장치.
삭제
청구항 1에 있어서, 상기 유사도 평가부는,
상기 추출된 부분을 이진화하고 이진화된 영상에 포함된 공통 특징점들의 그라디언트에 기반하여 상기 에지를 검출하도록 설정된, 영상 랜드마크 분류 장치.
삭제
삭제
삭제
청구항 1에 있어서,
상기 분석대상 영상에 상기 공통 특징점을 중첩한 랜드마크 관련 영상을 생성하는 결과 출력부
를 더 포함하는, 영상 랜드마크 분류 장치.
청구항 8에 있어서, 상기 결과 출력부는,
상기 유사도 점수들 및 상기 공통 특징점들에 기반하여 상기 분석대상 영상에 대한 분류 근거 영상을 생성하도록 설정된, 영상 랜드마크 분류 장치.
영상 랜드마크 분류 장치에 의한 랜드마크 분류 방법에 있어서,
분석대상 영상에서 신경망(neural network) 알고리즘을 통해 추출된 제1 특징점들 및 통계 기반 알고리즘을 통해 추출된 제2 특징점들 중 공통 특징점을 포함하는 특징지도 영상을 생성하는 동작;
상기 특징지도 영상의 에지(edge)에 관련된 포인트 그라디언트(point gradient)와 특징 벡터들에 기반하여 상기 분석대상 영상과 메모리에 저장된 참조 영상 간의 유사도 점수들을 확인하는 동작; 및
상기 유사도 점수들에 기반하여 상기 분석대상 영상과 상기 참조 영상 간의 유사성을 결정하는 동작을 포함하고,
상기 유사도 점수들을 확인하는 동작은
a) 상기 특징지도 영상에서 상기 공통 특징점들이 포함된 부분을 추출하고, 상기 추출된 부분에 포함된 공통 특징점들의 그라디언트에 기반하여 에지를 검출하고, 상기 분석대상 영상과 상기 참조 영상에 포함된 에지의 포인트 그라이언드들 간의 벡터 거리를 산출하고, 산출된 특징 벡터들 간의 거리를 자연 로그 형태로 변환하여 0 ~ 1 범위 내의 점수인 제1 유사도 점수를 결정하고,
b) 상기 통계 기반 알고리즘에 따라 추출된 상기 공통 특징점들에 맵핑된 특징 벡터들을 확인하고, 상기 확인된 특징 벡터들과 상기 참조 영상에 맵핑된 특징 벡터 간의 코사인 유사도에 기반하여 상기 분석대상 영상과 상기 참조 영상 간의 코사인 유사도인 제2 유사도 점수를 결정하고,
c) 상기 분석대상 영상과 상기 참조 영상의 픽셀 분포도 패턴 간의 코사인 유사도인 제3 유사도 점수를 결정하고,
d) 상기 제1 유사도 점수, 제2 유사도 점수 및 제3 유사도 점수를 결정트리 기반 랜덤 포레스트에 입력하고, 상기 결정 트리 기반 랜덤 포레스트에 기반하여 상기 특징지도 영상과 참고 영상 간의 유사성 여부 및 최종 유사도 점수를 결정하고,
상기 제3 유사도 점수에 기반하여 상기 분석대상 영상의 종류(x-ray, CT 및 MRI 중 어느 하나)를 분류하고, 상기 제1 유사도 점수 및 상기 제2 유사도 점수에 기반하여 상기 분석대상 영상의 카테고리(병명)을 결정하는 동작인 영상 랜드마크 분류 방법.