KR100932210B1 - 영상 특징 추출 방법 및 장치, 이를 이용한 컨텐츠 기반의영상 검색 방법 및 장치 그리고 상기 방법들을 수행하는프로그램이 기록된 기록 매체 - Google Patents

영상 특징 추출 방법 및 장치, 이를 이용한 컨텐츠 기반의영상 검색 방법 및 장치 그리고 상기 방법들을 수행하는프로그램이 기록된 기록 매체 Download PDF

Info

Publication number
KR100932210B1
KR100932210B1 KR1020070102974A KR20070102974A KR100932210B1 KR 100932210 B1 KR100932210 B1 KR 100932210B1 KR 1020070102974 A KR1020070102974 A KR 1020070102974A KR 20070102974 A KR20070102974 A KR 20070102974A KR 100932210 B1 KR100932210 B1 KR 100932210B1
Authority
KR
South Korea
Prior art keywords
image
feature
feature value
similarity
radon
Prior art date
Application number
KR1020070102974A
Other languages
English (en)
Other versions
KR20090037585A (ko
Inventor
헤저지 마무드레자
호요성
Original Assignee
광주과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 광주과학기술원 filed Critical 광주과학기술원
Priority to KR1020070102974A priority Critical patent/KR100932210B1/ko
Publication of KR20090037585A publication Critical patent/KR20090037585A/ko
Application granted granted Critical
Publication of KR100932210B1 publication Critical patent/KR100932210B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/003Reconstruction from projections, e.g. tomography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/42Analysis of texture based on statistical description of texture using transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/49Analysis of texture based on structural texture description, e.g. using primitives or placement rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20064Wavelet transform [DWT]

Abstract

본 발명은 영상 특징 추출 방법 및 장치, 컨텐츠 기반의 영상 검색 방법 및 장치 그리고 상기 방법들을 수행하는 프로그램이 기록된 기록 매체를 개시한다. 본 발명의 영상 특징 추출 방법은 주어진 영상에 대하여 라돈 특징값을 생성하는 단계; 라돈 특징값의 분산 어레이를 생성하는 단계; 상기 분산 어레이를 이용하여 거칠기 특징값을 생성하는 단계; 피크의 수 또는 상기 생성된 거칠기 특징값을 이용하여 방향성 특징값을 생성하는 단계; 및 서브 영상들 간의 유사도를 이용하여 규칙성 특징값을 생성하는 단계를 포함한다. 본 발명에 따르면, 영상 텍스쳐가 갖는 특징을 보다 효과적으로 표현할 수 있고, 회전 불변의 영상 특징값을 추출할 수 있으며, 영상 분석 또는 리트리벌에 소요시간을 단축하고 정확도를 향상시키는 효과가 있다.
컨텐츠 기반의 영상 검색, 리트리벌, 라돈 변환, 회전 불변 영상 특징, 텍스쳐 브라우징 기술자

Description

영상 특징 추출 방법 및 장치, 이를 이용한 컨텐츠 기반의 영상 검색 방법 및 장치 그리고 상기 방법들을 수행하는 프로그램이 기록된 기록 매체{Image feature extracting method and apparatus, content-based image retrieval method and apparatus using the same and recording medium storing program for performing the method thereof}
본 발명은 영상 특징 추출 방법 및 장치에 관한 것으로서, 특히 컨텐츠 기반의 영상 리트리벌(content-based image retrieval) 방법 및 장치에 관한 것이다. 본 발명은 디지털 이미지 프로세싱 기술을 이용하여 디지털 이미지로부터 효과적으로 의미있는 정보를 추출하는 방법 및 장치에 관한 것이다. 본 발명은 이미지 분석의 광범위한 영역에 적용될 수 있으며, 특히 컨텐츠 기반의 영상 리트리벌, 영상 인텍싱 및 분류 분야에 사용될 수 있다.
멀티미디어 기술의 발달로 다량의 멀티미디어 정보를 다루는 어플리캐이션의 영역은 더 확대되고 있으며, 그러한 어플리캐이션에 적합한 효율적인 멀티미디어 리트리벌 시스템의 필요성은 증대되고 있다.
컨텐츠 기반의 영상 리트리벌 분야에서 이론적인 연구와 시스템의 괄목할 만 한 발달에도 불구하고, 본 분야에는 많은 도전적인 문제가 있다. CBIR (Content-Based Image Retrieval) 시스템은 사용자의 쿼리 영상을 입력으로, 디지털 영상 데이터 베이스로부터 관련 영상들을 검색하는 시각적 컨텐츠를 사용하는 시스템이다. 영상의 시각적 컨텐츠(또는 특징들) 즉 색깔, 모양, 텍스쳐(texture), 공간적인 레이아웃(spatial layout)은 어떤 영상을 대표하고 인덱싱하는데 사용된다. 그것들 중에서 텍스쳐는 가장 중요한 것들 중의 하나이다. 왜냐하면, 텍스쳐 분석은 컨텐츠 기반의 리트리벌 뿐만 아니라 컴퓨터 비전, 메디컬 이미징, 리모트 센싱 등과 같은 다른 어플리캐이션에서 주목받기 때문이다.
텍스쳐 분석에 대하여 제안된 대부분의 접근들은 실제의 영상 리트리벌에 사용될 수 없다. 우선, 많은 접근들은 데이터셋에 의존하고 있으며, 영상 리트리벌에 적용되기 전에 데이터 셋 각각에 대하여 트레이닝을 수행할 필요가 있다. 또한, 영상이 갖는 방향성과 규칙성의 정도가 감소할 때, 대부분 접근 방식들은 그 수행 능력이 떨어지는 문제가 있다.
또한, 종래의 대다수의 영상 텍스쳐 분석 방법들은 모두 영상이 동일한 방향으로 부터 획득된 것으로 추정을 하고 분석을 수행하였다. 이러한 추정은 실제적인 적용에 있어서는 비현실적이다. 왜냐햐면, 실제 상황에 있어서 영상은 다른 방향 또는 다른 크기로 획득될 수 있기 때문이다. 회전 불변 영상 분석은 수년간 연구자 및 개발자에게 중요한 연구 영역이 되어왔다. 어떤 영상으로부터 회전 불변 특징을 추출하는 것은 텍스쳐 분석 방법에서 많은 시간이 소요되는 프로세스인데, 기존의 방식에 의할 경우 프로세스에 소요되는 시간이 길다는 문제가 있다.
본 발명은 영상 텍스쳐가 갖는 방위각, 방향성 특징값, 거칠기 특징값, 규칙성 특징값을 영상 특징값으로 채택함으로써, 영상 텍스쳐가 갖는 특징을 보다 정확하고 효과적으로 표현할 수 있는 영상 특징 추출 방법 및 장치를 제공하는 것을 목적으로 한다. 또한, 본 발명은 영상 분석 결과와 리트리벌 결과의 정확도를 향상시키며, 프로세싱 시간을 단축할 수 있는 영상 검색 방법 및 장치를 제공하는 것을 목적으로 한다.
상기 본 발명의 기술적 과제를 해결하기 위한 본 발명에 따른 영상 특징 추출 방법은 a) 주어진 영상에 대하여 미리 설정된 참조 라인에 따른 라돈 변환을 수행하여 라돈 특징값을 생성하는 단계; b) 상기 참조 라인의 방위각에 따른 라돈 특징값의 분산 어레이(variance array)를 생성하는 단계; c) 상기 라돈 특징값의 분산 어레이에서 피크를 탐색하고, 상기 탐색된 피크의 폭을 고려하여 영상의 거칠기 정도를 나타내는 거칠기 특징값(coarseness feature value)을 계산하는 단계; d) 상기 피크의 수 또는 상기 생성된 거칠기 특징값을 이용하여, 영상의 등방성 정도를 나타내는 방향성 특징값(directionality feature value)을 계산하는 단계; 및 e) 상기 영상에 속하는 소정 크기의 서브 영상들 간의 유사도를 이용하여, 영상 패턴의 규칙성 정도를 나타내는 규칙성 특징값(regularity feature value)을 계산하는 단계를 포함한다.
본 발명의 영상 특징 추출 방법은 상기 생성된 분산 어레이 정보를 이용하여 상기 영상의 주 방위각을 계산하는 단계; 상기 영상에 상기 주 방위각에 기반하는 가보 웨이브렛 필터를 적용하는 단계; 및 상기 필터링된 가보 웨이브렛 특징을 이용하여 회전 불변 텍스쳐 특징을 추출하는 단계를 더 포함할 수 있다.
또한, 본 발명에서 상기 규칙성 특징값을 생성하는 단계는 상기 영상을 소정 크기의 서브 영상들로 분할하는 단계; 상기 서브 영상들 각각에 따른 라돈 특징값의 분산 어레이 정보를 생성하는 단계; 상기 분산 어레이 정보를 이용하여 상기 서브 영상들 간의 유사도를 계산하는 단계; 및 상기 유사도를 이용하여 규칙성 특징값을 생성하는 단계를 포함할 수 있다.
상기 본 발명의 또 다른 기술적 과제를 해결하기 위한 본 발명의 영상 특징 추출 장치는 주어진 영상에 대하여 미리 설정된 참조 라인에 따른 라돈 변환을 수행하여 라돈 특징값을 추출하는 라돈 특징값 생성부; 상기 참조 라인의 방위각에 따른 라돈 특징값의 분산 어레이(variance array) 를 생성하는 분산 어레이 생성부; 상기 라돈 특징값의 분산 어레이에서 피크를 탐색하고, 상기 탐색된 피크의 폭을 고려하여 영상의 거칠기 정도를 나타내는 거칠기 특징값(coarseness feature value)을 계산하는 거칠기 특징값 생성부; 상기 탐색된 피크의 수 또는 상기 생성된 거칠기 특징값을 이용하여, 영상의 등방성 정도를 나타내는 방향성(directionality feature value) 특징값을 생성하는 방향성 특징값 생성부; 및 상기 영상에 속하는 소정 크기의 서브 영상들 간의 유사도를 이용하여, 영상 패턴의 규칙성 정도를 나타내는 규칙성 특징값(regularity feature value)을 생성하는 규칙성 특징값 생성부를 포함한다.
본 발명의 영상 특징 추출 장치는 분산 어레이 생성부에서 생성된 분산 어레이 를 이용하여 상기 영상의 주 방위각 정보를 생성하는 주 방위각 생성부; 상기 영상에 상기 주 방위각에 기반하는 가보 웨이브렛 필터를 적용하는 가보 웨이브렛 특징 추출부; 및 상기 필터링된 가보 웨이브렛 특징을 이용하여 회전 불변 텍스쳐 특징을 산출하는 텍스쳐 특징 산출부를 더 포함할 수 있다.
또한, 본 발명에서 규칙성 특징값 생성부는 영상을 소정 크기의 서브 영상들로 분할하는 서브 영상 생성부; 서브 영상들에 따른 분산 어레이 정보를 이용하여 상기 서브 영상들 간의 유사도를 계산하는 유사도 산출부; 및 유사도를 이용하여 규칙성 특징값을 생성하는 특징값 산출부를 포함한다.
상기 본 발명의 또 다른 기술적 과제를 해결하기 위한 본 발명의 영상 검색 방법은 a) 입력 영상에 대하여 미리 설정된 참조 라인에 따른 라돈 변환을 수행하여 라돈 특징값을 생성하는 단계; b) 상기 참조 라인의 방위각에 따른 라돈 특징값의 분산 어레이(variance array)를 생성하는 단계; c) 상기 라돈 특징값의 분산 어레이에서 피크를 탐색하고, 상기 탐색된 피크를 이용하여 거칠기 특징값(coarseness feature value) 을 생성하는 단계; d) 상기 탐색된 피크의 수 또는 상기 생성된 거칠기 특징값을 이용하여 방향성 특징값(directionality feature value) 을 생성하는 단계; e) 상기 입력 영상에 속하는 소정 크기의 서브 영상들 간의 유사도를 이용하여 규칙성 특징값(regularity feature value) 을 생성하는 단계; f) 영상 저장부에 저장된 저장 영상들 각각에 따른 거칠기 특징값, 방향성 특징값 및 규칙성 특징값들을 독출하는 단계; 및 g) 상기 입력 영상의 거칠기 특징값과 상기 저장 영상의 거칠기 특징값 간의 유사도, 상기 입력 영상의 방향성 특징값과 상기 저장 영상의 방향성 특징값 간의 유사도 및 상기 입력 영상의 규칙성 특징값과 상기 저장 영상의 규칙성 특징값 간의 유사도를 계산하는 단계를 포함한다.
본 발명에서 상기 유사도를 판단하는 단계는 상기 입력 영상에 따른 방향성 특징값과 상기 저장 영상에 따른 방향성 특징값 간의 제 1 유사도를 계산하는 단계; 상기 입력 영상에 따른 규칙성 특징값과 상기 저장 영상에 따른 규칙성 특징값 간의 제 2 유사도를 계산하는 단계; 상기 입력 영상에 따른 회전 불변 텍스쳐 특징 값과 상기 저장 영상에 따른 회전 불변 텍스쳐 특징값 간의 제 3 유사도를 계산하는 단계; 및 상기 제 1 유사도, 제 2 유사도 및 제 3 유사도를 소정의 가중치에 따라 합산하여 최종 유사도를 판단하는 단계를 포함한다.
상기 본 발명의 또 다른 기술적 과제를 해결하기 위한 본 발명의 영상 검색 장치는 입력 영상에 대하여 미리 설정된 참조 라인에 따른 라돈 변환을 수행하여 라돈 특징값을 생성하는 특징값 생성부; 상기 참조 라인의 방위각에 따른 라돈 특징값의 분산 어레이(variance array) 를 생성하는 분산 어레이 생성부; 상기 라돈 특징값의 분산 어레이를 이용하여 상기 분산값의 피크를 탐색하고, 상기 탐색된 피크를 이용하여 거칠기 특징값(coarseness feature value) 을 생성하는 거칠기 특징값 생성부; 상기 탐색된 피크의 수 또는 상기 생성된 거칠기 특징값을 이용하여 방향성 특징값(directionality feature value) 을 생성하는 방향성 특징값 생성부; 상기 입력 영상에 속하는 소정 크기의 서브 영상들 간의 유사도를 이용하여 규칙성 특징값(regularity feature value) 을 생성하는 규칙성 특징값 생성부; 복수 개의 저장 영상들을 저장하며, 상기 저장 영상들로부터 추출된 거칠기 특징값, 방향성 특징값, 규칙성 특징값을 저장하는 영상 저장부; 영상 저장부에 저장된 저장 영상들 각각에 따른 거칠기 특징값, 방향성 특징값 및 규칙성 특징값들을 독출하는 독출부; 및 상기 입력 영상의 거칠기 특징값과 상기 저장 영상의 거칠기 특징값 간의 유사도, 상기 입력 영상의 방향성 특징값과 상기 저장 영상의 방향성 특징값 간의 유사도 및 상기 입력 영상의 규칙성 특징값과 상기 저장 영상의 규칙성 특징값 간의 유사도를 계산하는 유사도 계산부를 포함한다.
또한, 본 발명은 상술한 영상 특징 추출 방법 및 영상 검색 방법을 컴퓨터 상에서 수행하기 위한 프로그램이 기록된 컴퓨터에서 판독가능한 기록 매체를 제공한다.
본 발명의 영상 특징 생성 방법 및 장치는 영상 텍스쳐가 갖는 특징으로서 방위각, 방향성 특징값, 거칠기 특징값, 규칙성 특징값을 이용함으로써, 영상 텍스쳐가 갖는 특징을 보다 효과적으로 표현할 수 있다. 또한, 본 발명에 따르면 회전 불변의 영상 특징값을 추출할 수 있으며, 상기 회전 불변의 영상 특징값을 영상 분석에 활용할 경우 분석의 정확도 및 분석에 소요되는 시간을 단축할 수 있다. 또한, 본 발명의 영상 특징 추출 방법과 영상 검색 방법을 텍스쳐 영상과 항공 영상에 대한 컨텐츠 기반의 영상 리트리벌과 유사도 리써치에 활용할 경우, 리트리벌 결과와 유사도 리써치 결과의 정확성을 향상시킬 수 있다.
이하에서는 도면과 실시예를 참고하여 본 발명의 영상 특징 추출 방법 및 장치, 이를 이용한 컨텐츠 기반의 영상 검색 방법 및 장치 그리고 상기 방법들을 수행하는 프로그램이 기록된 기록 매체에 대하여 구체적으로 설명한다.
도 1은 본 발명의 바람직한 일 실시예에 따른 영상 특징 추출 장치를 나타낸 블록도이다. 도 1에 도시된 영상 특징 추출 장치(1)는 참조라인 설정부(12), 화소 할당부(14), 라돈 특징값 추출부(16), 분산 어레이 생성부(18), 평활화부(19), 주 방위각 생성부(22), 거칠기 특징값 생성부(24), 방향성 특징값 생성부(26), 서브 영상 생성부(28), 규칙성 특징값 생성부(30), 회전 불변 텍스쳐 특징값 생성부(32)를 포함한다.
도 1에 도시되지는 않았지만, 도시된 영상 특징 추출 장치(1)는 영상 입력 부(미도시)를 더 포함한다. 영상 입력부는 다수의 화소로 특징 추출을 하고자 하는 영상을 입력 받는다. 입력되는 영상은 복수개의 화소들(pixels)로 이루어지고, 본 실시예에서 영상은 픽셀 단위로 처리된다.
도 1의 실시예에서 라돈 특징값 생성부는 참조 라인 설정부(12), 화소 할당부(14) 및 라돈 특징값 추출부(16)를 포함한다.
우선, 참조라인 설정부(12)는 방향각(θ)와 원점으로 부터의 최단 거리(ρ)에 의존하는 참조 라인을 설정한다. 특히, 본 실시예에서 참조라인 설정부(12)는 방향각을 고정하고 이산화된 최단 거리를 갖는 복수개의 참조 라인들을 설정한다. 여기에서 복수의 참조 라인들은 원점을 통과하는 라인, 원점과 소정의 기본 단위 거리(Δρ) 만큼 떨어진 라인, 위 Δρ의 정수 배 만큼 떨어진 라인들을 포함한다.
화소 할당부(14)는 영상의 화소들을 다수의 참조 라인 들 중 하나의 참조 라인에 할당한다. 영상의 화소들은 거리상 가장 가까운 참조 라인에 할당될 수 있다.
라돈 특징값 추출부(16)는 입력 영상에 대하여 미리 설정된 참조 라인에 따른 라돈 변환을 수행하고, 라돈 특징값을 추출한다. 라돈 변환은 하기 수학식1,2로 표현될 수 있다.
[수학식1]
Figure 112009022196283-pat00067
삭제
여기에서, ρ는 원점으로 부터 참조 라인까지의 최단 거리이고, θ는 X축과 참조 라인이 이루는 방향각이며,
Figure 112009022196283-pat00068
는 2차원 연속 영상(continuous image)에 대한 라돈 특징값이다.
[수학식2]
Figure 112009022196283-pat00069
수학식2는 수학식1과 등가이다. s는 참조 라인 상에 존재하는 변수이다. 상기 라돈 변환을 2차원 디지털 영상에 대하여 적용하기 위해서는, 위 수학식1, 2를 이산화된 방정식으로 수정할 필요가 있다. 라돈 변환을 M× N 크기의 2차원 디지털 영상 g(m, n)에 적용하기 위해서는 연속 변수들을 다음과 같이 샘플링할 필요가 있다.
[수학식3]
Figure 112009022196283-pat00070
여기에서, xmin, ymin, ρmin, smin은 하기 수학식4로 나타낼 수 있다.
[수학식4]
Figure 112009022196283-pat00071
이다.
또한, 여기에서 Pθ,는 참조 라인의 수이고, Sρ,θ 는 각각의 참조 라인 상에 투영되는 화소 수이며, Δs, Pθ와 Sρ,θ 는 ρ와 θ에 따라 정해지는 값이다.
참조 라인 설정부(12)에 의하여 설정되는 복수 개의 참조 라인들 각각에 할당되는 화소 수 즉, Sρ,θ는 ρ와 θ에 의존하는 함수이다. Sρ,θ를 추정함에 있어서, 각각의 화소들은 가장 가까운 참조 라인에 할당되는 것으로 추정한다. 복잡한 인터폴레이션을 수행하는 것 보다는 반올림과 같은 연산을 수행함으로써 이산화된 라돈 변환을 얻을 수 있다. x'k와 y'k를 하기 수학식5와 같이 정의하면 2차원 디지털 영상 g(m, n)에 대한 이산 라돈 변환식을 하기 수학식6으로 표현할 수 있다.
[수학식5]
Figure 112009022196283-pat00072
[수학식6]
Figure 112009022196283-pat00073
여기에서, s축은 참조 라인 상에 위치하며, Δs은 영상의 화소를 참조 라인에 투영한 경우 투영된 점들간의 거리에 대한 미소 변량이다. 그러나, 이러한 통상의 라돈 변환은 영상의 방향을 예측함에 있어서 라돈 변환을 수행하는 방향에 따라 결과가 달라지므로, 회전 불변한 영상 분석에 사용되기 어려운 문제가 있다. 왜냐 하면, 라돈 변환에 있어서 참조 라인에 투영되는 픽셀의 수가 방향이나 방향의 좌표에 따라 달라지기 때문이다.
본 실시예에서는 기존의 이산 라돈 변환이 아닌 수정된 이산 라돈 변환을 이용하여 라돈 특징값을 추출하는 것이 바람직하다. 수정된 이산 라돈 변환(Modified Discrete Radon Transform : MDRT)에서 특정의 참조 라인에 할당되는 2차원 디지털 영상 g(m, n)의 화소 집합은 수학식7과 같이 정의할 수 있다.
[수학식7]
Figure 112009022196283-pat00074
여기에서, ρr는 참조 라인을 나타내고, θt는 상기 참조 라인의 방향을 나타내며,
Figure 112009022196283-pat00009
는 참조 라인들 각각에 할당되는 화소 수이고, Φr,t는 상기 참조 라인에 할당된 화소들의 집합을 나타낸다. Φr,t의 k번째 원소를
Figure 112009022196283-pat00075
라고 하면, 수학식 6은 다음과 같이 기술될 수 있다.
[수학식8]
Figure 112009022196283-pat00076
여기에서, Φr,t의 샘플 평균값을 이용하면 수학식8은 하기 수학식9로 나타낼 수 있다.
[수학식9]
여기에서,
Figure 112009022196283-pat00078
는 수정된 이산 라돈 변환에 따른 라돈 특징값을 나타낸다. 기존의 수학식8에서는 참조라인(ρr)에 따라
Figure 112009022196283-pat00079
의 원소 수가 달라서 통계적으로 불안정하였으나, 수학식9에 따르면 요소의 합을 계산하지 않고 샘플 평균값과 참조 라인에 투영된 점들간의 거리에 대한 미소변이량을 이용하므로 보다 안정성 있는 결과를 얻을 수 있다. 즉, 영상의 방향성 예측을 보다 효율적으로 할 수 있다.
또한, 본 실시예에서는 상기 수정된 라돈 변환(MDRT) 뿐만 아니라 재수정된 라돈 변환 방법(NonLinear Modified Modified Radon Transform: NLMDRT)을 개시한다. 이하에서는 재수정된 이산 라돈 변환에 대하여 설명한다. 수정된 이산 라돈 변환(MDRT)에서 특정의 참조 라인에 할당되는 2차원 디지털 영상 g(m, n)의 화소 집합은 수학식7과 같이 정의된 바 있다. 참조라인 집합 Φr,t의 집합 즉
Figure 112009022196283-pat00080
에 대한 연속적 합성(successive concatenation)의 집합을
Figure 112009022196283-pat00016
라 하면,
Figure 112009022196283-pat00017
는 수학식10과 같이 나타낼 수 있다.
[수학식10]
Figure 112009022196283-pat00081
결과적으로, 방향각 qt에 대한 집합
Figure 112007073261145-pat00019
의 원소 총 개수는 영상에 포함된 모든 픽셀의 수와 동일하게 된다. 만약, 주어진 영상이 2차원 스퀘어 영상이고, M의 디멘젼을 갖는다면
Figure 112007073261145-pat00020
의 원소 수는 M2이다. 상기 연속적 합성을 이용할 때 재수정된 이산 라돈 변환은 하기 수학식11과 같이 나타낼 수 있다.
[수학식11]
Figure 112009022196283-pat00082
여기에서, λjmin+j이고, λmin은 -(M-1)/2 이며, j는 화소 그룹의 순번을 나타내고, θt는 상기 참조 라인의 방향을 나타내며,
Figure 112009022196283-pat00083
= Concat(Φr,t)로서 화소들의 개수가 동일하게 조절된 j번째 화소 그룹에 속하는 화소들의 집합이고, 상기 Φr,t는 상기 참조 라인에 할당된 화소들의 집합을 나타내며, ΔS는 화소간 거리의 미소 변이량을 나타낸다.
재수정된 이산 라돈 변환에 있어서는 동일한 수로 할당된 화소의 집합에 대하여 평균값을 구하고, 결과값을 얻기 때문에 보다 안정적인 결과를 얻을 수 있다. 또한, 종래의 라돈 변환에서는 서로 다른 원소 개수를 갖는 부분 집합에 대해 변환을 수행하였으나, 재수정된 이산 라돈변환에 있어서는 동일한 원소의 개수를 가진 부분 집합에 대해 변환을 수행하므로 더 빠른 연산 수행 능력을 발휘할 수 있다.
본 발명에서 제안하는 상기 변형된 라돈 변환들은 더 이상 선형적이지 않기 때문에 본 발명에서는 상술한 수정된 이산 라돈 변환과 재수정된 이산 라돈 변환을 일컬어 NLMDRT(NonLinear Modified Discrete Radon Transform)라 한다.
분산 어레이 생성부(18)는 상기 참조 라인의 방위각에 따른 라돈 특징값의 분산값을 각각 계산하여 분산 어레이(variance array) 정보를 생성한다. 도 2의 (b), (d)에 도시된 그래프는 분산 어레이를 2차원 상에 투영시킨 예로서, x축은 방위각이고, y축은 방위각에 따른 분산값을 나타낸다. 평활화부(19)는 이산 특성을 갖는 분산 어레이 값들에 대한 평활화, 노이즈 제거 또는 보간을 수행한다.
[수학식12]
Figure 112009022196283-pat00084
여기에서 RMMD는 입력 영상에 대한 재수정된 라돈 변환이고,
Figure 112009022196283-pat00085
는 변수 θ에 따른 라돈 특징값에 대한 분산을 나타내는 함수이다. RMMD는 모든 방향에 대하여 계산된다. 즉, θt 는 0도에서 180도 범위 내에서 이산화된 값을 갖는다.
주 방위각(Da) 생성부(22)는 분산 어레이 상에서 분산 어레이의 주된 방위각을 계산한다. 영상의 방위 또는 방향(orientation)을 추정하기 위한 기술로는, 예를 들어 이미지 그래디언트와 신호 자동 상관 구조, 푸리에 도메인에서의 신호 전력의 각 분산, 방향 히스토그램, 이산 라돈 변환 등을 이용한 방법이 있다. 본 실시예에서는 상술한 수정된 라돈 변환 또는 재수정된 라돈 변환을 사용한다.
주 방위각(Da)은 주어진 영상에서 방향성이 가장 큰 각도를 의미한다. 특히, 주 방위각은 영상에서 가장 곧게 뻗은 방향을 의미한다. 상기 정의를 갖는 주 방위각을 고려하면, 분산 어레이(variance array)가 Da에 대하여 수직인 방향으로 전역적인 최대값을 갖는다고 할 수 있다. Da
Figure 112009022196283-pat00086
의 관계는 하기 수학식 13으로 나타낼 수 있다.
[수학식13]
Figure 112009022196283-pat00087
여기에서 Da는 주 방위각을 나타내고, argmax는
Figure 112009022196283-pat00088
를 최대로하는 각도를 의미한다.
도 2는 서로 다른 방향성을 갖는 영상과 그 영상에서 추출된 라돈 변환의 분산 어레이를 나타내는 참고도이다.
상술한 바 있듯이, Da에 대하여 수직인 방향으로 분산값이 최대값을 갖는다는 사실은 도 2의 다방형적인 이방성의 텍스쳐(multidirectional anisotropic texture)를 통해 쉽게 검증될 수 있다. 도 2의 (a)와 (c)는 방향성을 갖는 영상들로서, (b) 영상은 (a)영상을 반시계방향으로 30도 회전시킨 영상이다. 도 2의 (b)와 (d)는 각각 (a)와 (c)영상에서 추출된 재수정된 라돈 변환값에 대한 분산 어레이를 나타낸 것이다. 도 2의 (b)에는 몇 개의 피크가 나타나 있는데, 특히 θ가 166도 일 때 재수정된 라돈 특징값의 분산값이 최대임을 알 수 있다. 분산 어레이 정보를 이용하면, 등방성의 이미지들(방향성을 갖지 않는 이미지들)에 대하여 몇몇 의 주요 방향을 정의할 수 있다. 실제의 순수한 등방성은 매우 드물게 나타나며, 어떠한 장면의 이미지들은 다른 방향성들을 갖는데, 비선형적으로 변형된 라돈 변환의 예측의 정확성을 향상시키기 위해서는 이미지의 중간으로부터 일정한 거리의 영역 즉 디스크 형상의 영역("disk shape area")에 라돈 변환을 적용함이 바람직하다.
거칠기 특징값(Coarseness feature value, Ci) 생성부(24)는 상기 생성된 분산 어레이 정보를 이용하여 분산 값의 피크들을 탐색하고, 탐색된 피크들을 이용하여 거칠기 특징값을 생성한다. 영상의 텍스트에 대한 거칠기의 판단하기 위한 구체적인 방법을 이하 설명한다.
도 3은 비등방성의 영상과 그 영상에서 추출된 라돈 특징값의 분산 어레이를 나타낸 것이다. 도 3에 도시된 영상들은 비등방성의 이미지로서 서로 다른 스캐일과 분산 어레이를 갖는다. 도 3에 도시된 바와 같이 모든 분산 어레이들은 100도 근방에서 명확한 주된 방향 또는 주 방위를 가지며, 분산 어레이들의 분포도 서로 유사하다. 그러나, 주 방위각에서의 피크의 폭(peak-width)은 서로 다르게 나타난다. 본 실시예에서 각의 폭은 DC 바이어스 라인에 따른 피크의 각 사이드간 거리로 정의된다. DC 바이어스 라인의 예로는 SRMM의 평균 즉 Mean(SRMM)이 있다. 도 3으로부터 거칠은 정도가 높은 도 3(c)가 도 3(a), (b) 보다 더 큰 피크-폭을 가짐을 확인할 수 있다.
도 4는 방향성이 서로 다른 영상과 그 영상에서 추출된 라돈 특징값의 분산 어레이를 나타낸 참고도이다.
도 4의 영상은 서로 다른 레벨의 텍스쳐 거칠기와 분산 어레이를 갖는다. 피크 폭들을 비교할 경우, 거칠은 정도가 높은 영상(도 4의 (a)영상)이 거칠은 정도가 낮은 영상(도 4의 (b)에 비하여 더 큰 피크-폭을 갖는다는 것을 알 수 있다. 따라서, 피크-폭에 기반하여 어떤 방향에 따른 거칠기를 평가할 수 있다. 영상이 갖는 복수의 피크들 중에서 i번째 피크에 따른 방위각에 대하여 거칠기 특성값은 하기 수학식 14로 표현될 수 있다.
[수학식14]
Figure 112009022196283-pat00089
여기에서 βi 는 i번째 피크의 피크 폭(peak width) 또는 각의 폭을 나타낸다.
방향성 특징값(diso) 생성부(26)는 탐색된 피크의 개수와 상기 생성된 거칠기의 특징값을 이용하여 방향성 특징값(directionality feature value)을 생성한다. 영상 텍스쳐가 갖는 방향성은 영상의 비등방성 또는 등방성의 정도를 결정하는데 적용될 수 있다. 앞서 도2, 3의 예에서, 비등방성의 영상의 경우 분산 어레이에서 다른 피크로 부터 주된 방향이 잘 분리된다는 것을 확인할 수 있다.
도 5는 서로 다른 스캐일을 갖는 등방성의 영상과 그 영상에서 추출된 라돈 특징값들의 분산 어레이를 나타낸 참고도이다. 도 5에 도시된 바와 같이 분산 어레이의 모양은 유사하지 않게 나타난다. 등방성을 갖는 영상은 공통적으로 노이즈 형상(noisy-shape figures)을 갖는다. 특히, 거칠기 정도의 레벨이 감소할 때 더욱 그러하다. 등방성의 영상의 경우 DC 바이어스 라인 위에 많은 피크들이 관측된다. 이론적으로 볼 때 순수한 비등방성을 갖는 영상의 경우 하나의 피크만을 가지며, 순수한 등방성을 갖는 영상의 경우 피크를 갖지 않는 것으로 취급할 수 있다.
본 발명에서 방향성 특징값(diso)는 하기 수학식15 로 나타낼 수 있다.
[수학식15]
Figure 112009022196283-pat00090
여기에서, Np는 DC 바이어스 라인 위에서의 분산 배열의 피크 수이이고, C1은 주된 방위각(제1 피크)에 따른 거칠기 특징값이며, Niso 와 Cios는 피크 수와 거칠기 특징값에 대해 등방성의 레벨을 조절하기 위해 미리 결정된 기준값이다. 본 실시예에서 위 계수는 각각 8과 3.3으로 사용되었다.
서브 영상 생성부(28)는 입력 영상을 복수개의 서브 영상으로 분할한다. 본 실시예에서 서브 영상 생성부(28)는 입력 영상을 4개의 서브 영상들로 분할한다. 영상의 분할은 분할된 서브 영상들이 서로 중복됨 없이 분할되는 것이 바람직하다.규칙성을 갖는 영상과 규칙성을 갖지 않는 영상을 비교할 때, 규칙성을 갖는 영상 에서 분할된 서브 영상들에 따른 분산 어레이는 서로 유사하며, 본 발명을 이를 이용하여 입력 영상의 규칙성 정도를 판단한다.
서브 영상 생성부(28)를 통해 생성된 서브 영상들은 다시 참조라인 설정부(12)와 화소 할당부(14)에 입력된다. 라돈 특징값 추출부(16)는 상기 입력된 서브 영상들로 부터 수정된 또는 재수정된 라돈 변환을 수행하고, 라돈 변환 수행의 결과로써 라돈 특징값들을 추출한다. 분산 어레이 생성부(18)는 서브 영상들 각각에 대한 분산 어레이 정보를 생성하고, 평활화부(20)는 생성된 분산 어레이 정보에서 노이즈를 제거하고, 분산값을 평활화시키거나 또는 보간시킨다. 평활화부를 통과한 분산 어레이 정보는 후술하는 규칙성 특징값 생성부(30)로 전달된다. 평활화부는 웨이블렛을 이용한 표준 스무딩 함수를 이용하여 구현할 수 있다.
규칙성 특징값(rt) 생성부(30)는 상기 분할된 서브 영상들 간의 유사도를 고려하여 주어진 영상의 규칙성 특징값(regularity feature value)을 생성한다. 규칙성 특징값 생성부(30)는 서브 영상에 따른 분산 어레이 정보를 입력 받아 상기 서브 영상들에 따른 분산 어레이 정보를 이용하여 상기 서브 영상들 간의 유사도를 계산하는 유사도 산출부(미도시 됨)와 상기 계산된 유사도를 이용하여 규칙성 특징값을 생성하는 특징값 산출부(미도시 됨)를 포함한다.
영상의 규칙성은 그 영상의 주기적인 패턴을 찾음으로써 판단될 수 있다. 본 실시예에서 규칙성 특징값 생성부(30)는 분할된 서브 영상들의 유사도 특히 서브 영상 각각에 따른 분산 어레이들 간의 유사도를 고려하여 영상의 규칙성 특징값을 생성한다.
본 실시예에서 규칙성 특징값 생성부(30)는 분산 어레이 정보를 2차원 상에 투영하고, 2차원상에 투영된 분산 어레이 곡선에 존재하는 피크의 수와 피크의 위치에 의존하여 규칙성 특징값을 생성한다. 본 실시예에서는 i 번째 서브 영상(SR i)의 분산 어레이에서 DC 라인 위의 피크 수를 Np i 라하고, 피크의 위치를 Pj pos(j)라 한다. 여기에서 j=1,2...Np i 이다. 칙성 특징값 생성부(30)는 서브 영상에 따른 분산 어레이의 쌍을 비교한다. 본 실시예에서 k번째 서브 영상과 l번째 써브 영상 간의 유사도 SIM (k, l)는 하기 수학식16으로 표현된다. SIM(k,l)은 Pl pos과 매치되는 Pk pos 에서의 피크의 수와 위치에 근거하여 산출된다.
만약, Pl pos에 있는 다른 피크들에 비하여 피크 q가 Pk pos 에 있는 피크 p와 최소의 위치 차이를 갖고, 그 위치 차이가 소정의 임계값(Tr) 보다 작다면, 규칙성 특징값 생성부(30)는 Pl pos에서의 피크 q가 Pk pos 에서의 피크p와 잘 매치되는 것으로 취급한다. 본 실시예에서 Tr은 30도이다. m을 Pl pos와 잘 매치되는 Pk pos 에서의 피크 수라고하고, pl mat와 pk mat를 Pl pos와 Pk pos의 부분 집합이라할 때, 그 부분 집합의 구성 요소들은 Pl pos에 속하는 m개의 피크들이고, 그 피크들은 Pl pos과 매치된다. 하기 수학식16은 서브 영상들간의 유사도를 나타내는 수식이다.
[수학식16]
Figure 112009022196283-pat00091
여기에서,
Figure 112009022196283-pat00092
이고, Np k 는 k번째 서브 영상의 분산 어레이에서 DC 라인 위의 피크 수를 의미하고, Np l 는 l번째 서브 영상의 분산 어레이에서 DC 라인 위의 피크 수를 의미하며, m은 Pl pos와 잘 매치되는 Pk pos 에서의 피크 수를 의미한다.
규칙성 특징값 생성부(28)는 조합 가능한 서브 영상들간의 SIM(k,l)을 모두 계산하고, 주어진 영상의 규칙성 특징값을 하기 수학식17 에 따라 계산한다.
[수학식17]
Figure 112009022196283-pat00093
여기에서, rt는 주어진 영상의 규칙성 특징값으로서 0 내지 1의 값을 가지며, n은 분할된 서브 영상들의 개수이다. 본 실시예에서와 같이 주어진 영상을 4개의 서브 영상들로 분할할 경우, 위 수학식17은
Figure 112009022196283-pat00094
으로 나타낼 수 있다. 규칙성 특징값이 0인 경우 주어진 영상이 이상적인 비규칙성을 갖는다는 것을 의미하며, 1인 경우 완벽한 규칙성을 갖는다는 것을 의미한다.
도 6은 규칙성을 갖는 영상과 서브 영상에서 추출된 라돈 특징값들의 분산 어레이를 나타낸 참고도이다. 도 6는 주어진 영상을 서로 중첩되지 않는 서브 영상으로 분할하고, 분할된 서브 영상에 따른 분산 어레이를 나타낸 것인데, 서브 영상들(a~d)간의 분산 어레이 특성이 유사함을 확인할 수 있다.
회전 불변 텍스쳐 특징값(finv) 생성부(32)는 입력 영상으로 부터 회전 불편 텍스쳐 특징값을 생성한다. 회전 불변 텍스쳐 특징 생성부(32)는 주어진 영상에 가보 웨이브렛 필터를 적용시키는 가보 웨이브렛 특징 추출부(미도시)와 필터링의 결과를 이용하여 텍스쳐 특징을 산출하는 텍스처 특징 산출부(미도시)를 구비한다. 회전 불변 텍스쳐 특징을 생성하는 방법은 2가지 방법이 있다. 하나의 방법은 주 방위각에 기반하여 영상을 회전시킨 후 가보 웨이브렛 필터를 적용하는 방법이다. 그러나 이 경우 영상의 회전에 따라 상대적으로 많은 데이터 잃을 수 있다. 또 다른 방법은 영상의 주 방위각을 고려하여 회전된 가보 웨이브렛 필터를 적용하고, 필터링된 결과에 따라 얻어지는 가보 웨이브렛 특징값을 이용하여 후술하는 소정의 변수들을 이용하여 회전 불변 텍스쳐 특징을 추출하는 방법이다.
본 실시예에서 가보 웨이브렛 특징 추출부(미도시됨)는 주 방위각 생성부(22)에서 생성된 주 방위각 정보를 전달 받고, 상기 주 방위각 정보(Da)에 따라 변형된 가보 웨이브렛 필터를 적용한다. 텍스쳐 특징 산출부(미도시됨)는 가보 필터링된 영상으로부터 하기와 같이 정의되는 소정의 계수들을 계산함으로써 영상의 회전 불변 텍스쳐 특징을 생성한다.
이하에서는 본 실시예에서 필터링을 위한 가보 웨이브렛 함수에 대하여 수학식을 통해 설명한다. 일반적으로 가보 웨이브렛 필터링을 위한 가보 웨이브렛 필터는 고유의 스캐일과 방향을 포함한 소정의 계수값을 갖는 필터들로 구성된다. 2차원 가보 함수 g(x, y)는 하기 수학식18 로 나타낼 수 있다.
[수학식18]
상기 가보 함수에 대한 푸리에 변환은 하기 수학식19로 나타낼 수 있다.
[수학식19]
Figure 112009022196283-pat00096
여기에서,
Figure 112009022196283-pat00097
이다. 모 가보 웨이브렛(mother Gabor wavelet)으로서 g(x, y)를 고려하면, 이산 가보 웨이브렛으로 언급되는 자기-유사 함수(self-similar functions)의 클래스는 g(x, y)에 대한 변환을 통해 획득될 수 있다. 이러한 변환은 하기 수학식20과 같이 나타낼 수 있다.
[수학식20]
Figure 112009022196283-pat00098
여기에서, K는 방향들의 갯수이다. Manjunath와 Ma에 의해서 제안을 이용하면, 상기 수학식19, 20의 가보 필터의 파라미터는 하기 수학식21으로 나타낼 수 있다.
[수학식21]
Figure 112009022196283-pat00099
여기에서, S와 K는 스캐일들과 방향들의 수이고, Ut와 Uh는 낮고 높은 중심 주파수를 나타낸다. 회전 불변 특징을 추출하기 위해, 본 실시예의 가보 웨이브렛 특징 추출부는 상기 β를 하기 수학식22에 따라 조정함으로써 영상 텍스쳐의 주된 방향에 따라 회전된 가보 변환을 수행한다.
[수학식22]
β = nπ/K - Da
본 실시예에서 영상을 I(x, y)라 할 때, 가보 웨이브렛 변환은 하기 수학식23와 같이 정의될 수 있다.
[수학식23]
Figure 112009022196283-pat00100
텍스쳐 특징 산출부는 상기 수학식23과 변환 계수 Gmn의 크기의 표준 편차와 평균을 이용하여 S개 스캐일들과 K개의 방향들에 대한 회전 불변 텍스쳐 특징(rotation-invariant texture feature:finv)을 하기 수학식24에 따라 산출한다.
[수학식24]
Figure 112009022196283-pat00101
영상 특징 저장부(40)는 주어진 영상으로 부터 추출된 방향성 특징값(diso), 규칙성 특징값(rt), 회전 불변 텍스쳐 특징값(finv)을 저장한다.
도 7은 본 발명의 일 실시예에 따른 영상 특징 추출 방법을 나타내는 흐름도이다. 도 7에 도시된 영상 특징 추출 방법은 영상 특징 추출 장치(1)에서 시계열 적으로 수행되는 하기의 단계들을 포함한다.
102단계에서, 화소 할당부(14)는 소정의 각도 θ를 갖는 참조 라인에 영상의 픽셀들을 할당한다.
104단계에서, 라돈 특징값 추출부(16)는 수학식9에 따른 수정된 이산 라돈 변환(RMD) 또는 수학식 11에 따른 재수정된 이산 라돈 변환(RMMD)을 수행하고, 라돈 특징값을 추출한다.
106단계에서, 라돈 특징값 추출부(16)는 모든 θ에 대하여 이산 라돈 변환이 수행되었는지 여부를 판단한다. 모든 θ에 대해 이산 라돈 변환이 수행된 경우 110단계가 진행되며, 그렇지 않은 경우 소정의 기준에 따라 θ를 변화시켜가며(108단계) 102단계 내지 106단계가 반복 수행된다.
110단계에서, 분산 어레이 생성부(18)는 수학식12에 따라 앞선 단계를 통해 생성된 라돈 특징값들의 분산 어레이 정보를 생성한다. 여기에서 분산 어레이 정보는 방위각을 변수로 하고, 방위각에 따른 라돈 특징값들의 분산값에 대한 정보이다. 도 2의 (b)는 분산 어레이 정보를 2차원상에 투영시킨 예를 나타낸다.
112단계에서, 주 방위각 생성부(22)는 분산 어레이에서 피크를 탐색하고, 수학식13을 이용하여 최대 분산값을 갖는 주 방위각을 계산한다.
114단계에서, 거칠기 특징값 생성부(24)는 상기 생성된 분산 어레이 정보와 상기 탐색된 피크들에 대한 정보를 이용하여 거칠기 특징값(Ci)을 생성한다. 본 발명에서 거칠기 특징값은 상술한 수학식14에 따라 정의된다.
116단계에서, 방향성 특징값 생성부(26)는 상기 탐색된 피크의 개수와 생성된 거칠기 특징값을 이용하여 수학식15에 따라 방향성 특징값(diso)을 생성한다. 영상 텍스쳐가 갖는 방향성은 그 영상의 비등방성 또는 등방성의 정도를 결정하는 기준이된다.
118단계에서, 규칙성 특징값 생성부(30)는 서브 영상들간의 유사도 특히 서브 영상으로 부터 얻어지는 분산 어레이들간의 유사성을 이용하여 수학식16 및 수 학식17에 따라 영상의 규칙성 특징값(rt)을 생성한다.
120단계에서, 회전 불변 텍스쳐 특징값(finv) 생성부(32)는 입력 영상으로 부터 회전 불편 텍스쳐 특징값(finv)을 수학식24에 따라 산출한다.
도 7에 도시되지는 않았지만, 본 실시예는 상기 단계들을 통해 생성된 영상 특징 저장부(40)는 주어진 영상으로 부터 추출된 방향성 특징값(diso), 규칙성 특징값(rt), 회전 불변 텍스쳐 특징값(finv)을 영상 특징 저장부(40)에 저장하는 단계를 더 포함할 수 있다.
도 8은 본 발명의 바람직한 일 실시예에 따른 영상 검색 장치를 나타내는 블록도이다. 도 8에 도시된 영상 검색 장치(200)는 라돈 특징값 추출부(202), 분산 어레이 정보 생성부(204), 주 방위각 생성부(206), 거칠기 특징값 생성부(208), 방향성 특징값 생성부(210), 규칙성 특징값 생성부(212), 회전 불변 텍스쳐 특징값 생성부(214), 제 1 유사도 계산부(222), 제 2 유사도 계산부(224), 제 3 유사도 계산부(226), 최종 유사도 계산부(28), 저장부(30), 영상 특징 독출부(236) 및 출력부(240)를 포함한다. 영상 검색 장치(200)는 사용자 쿼리로서 입력된 입력 영상과 유사한 영상을 저장부(230)에서 찾거나, 또는 유사한 영상들의 랭킹을 구하는 역할을 한다.
라돈 특징값 추출부(202)는 입력 영상을 수신하고, 수신된 입력 영상으로 부터 수정된 라돈 변환 또는 재수정된 라돈 변환을 수행하여 라돈 특징값을 추출한 다. 상기 라돈 특징값 추출부(202)를 비롯하여 분산 어레이 정보 생성부(204), 주 방위각 생성부(206), 거칠기 특징값 생성부(208), 방향성 특징값 생성부(210), 규칙성 특징값 생성부(212), 회전 불변 텍스쳐 특징값 생성부(214)는 도 1에 도시된 구성 요소들과 각각 대응되므로 이하 설명은 생략한다.
제 1 유사도 계산부(222)는 입력 영상의 방향성 특징값(diso q)과 저장 영상들 중에서 선택된 하나의 저장 영상에 따른 방향성 특징값(diso DB) 간의 유사도를 하기 수학식25를 이용하여 계산한다.
[수학식25]
Figure 112009022196283-pat00102
제 2 유사도 계산부(224)는 입력 영상의 규칙성 특징값(rt q)과 저장 영상들 중에서 선택되는 하나의 저장 영상에 따른 규칙성 특징값(rt DB) 간의 유사도를 하기 수학식26과 27을 이용하여 계산한다.
[수학식26]
Figure 112009022196283-pat00103
여기에서 Q(rt)는 rt의 양자화된 값으로서 하기 수학식27로 나타낼 수 있다.
[수학식27]
Figure 112009022196283-pat00104
수학식27에서 n은 양자화 레벨의 수를 나타낸다. 실험결과로부터 n의 값으로 8부터 16사이의 값이 적당함을 알 수 있다. 여기서 우리는 n의 값으로 8을 선택한다. 제 3 유사도 계산부(226)는 입력 영상(Iq)의 회전 불변 텍스쳐 특징(fq)와 저장 영상들 중에서 선택되는 하나의 저장 영상(IDB)에 따른 회전 불변 텍스쳐 특징(fDB) 간의 유사도를 하기 수학식28, 29를 이용하여 계산한다.
[수학식28]
Figure 112009022196283-pat00105
여기에서, fqi는 입력 영상의 회전 불변 텍스쳐 특징(fq)을 이루는 i번째 원소이고, fDBi는 저장 영상의 회전 불변 텍스쳐 특징(fDB)을 이루는 i번째 원소이다.
dB (Iq , IDB)값이 1이면 대비되는 텍스쳐 특징간의 관련성이 없는 것이고, 0 이면 완벽하게 매칭되는 것을 의미한다.
[수학식29]
Figure 112009022196283-pat00106
여기에서, Sf는 대비되는 영상들(IDB ,Iq) 간의 유사 정도를 나타내는 지수이다.
최종 유사도 계산부(228)는 제 1 내지 제 3 유사도 계산부의 계산 결과를 가중치에 따라 합산하여, 대비되는 두 영상들 간의 유사도 결과값을 산출한다.
[수학식30]
Figure 112009022196283-pat00107
여기에서, wf, wd, wr은 Sf, Sd, Sr에 대한 가중치로서, wf + wd + wr = 1이며, SFIN은 대비되는 두 영상들 간의 최종 유사도 결과이다.
저장부(230)는 저장 영상 데이터베이스(232)와 영상 특징 저장부(234)를 포함한다. 영상 특징 저장부(234)는 저장 영상 데이터베이스(232)에 저장된 저장 영상들 각각에 대한 영상 특징들을 저장한다. 영상 특징 저장부는 사전적인 영상 특징 추출과정을 통해 저장 영상들로 부터 추출된 영상 특징 정보를 저장한다.
출력부(240)는 최종 유사도 계산부(228)에 따른 검색 결과를 사용자에게 출력한다. 예를 들어, 사용자 쿼리로서 입력된 입력 영상과 가장 유사한 검색 영상을 사용자에게 제공하거나, 최종 유사도의 크기 순으로 랭킹이 설정된 랭킹 정보를 사용자에게 제공할 수 있다.
도 9는 본 발명의 바람직한 일 실시예에 따른 영상 검색 방법을 나타내는 흐름도이다. 도 9에 도시된 영상 검색 방법은 영상 검색 장치(200)에서 시계열적으로 수행되는 하기 단계들을 포함한다.
302단계에서 영상 정보 검색 장치의 입력부(미도시됨)는 쿼리 영상 정보를 입력 받고, 라돈 특징값 추출부(202)는 입력된 쿼리 영상에 수정된 이산 라돈 변환 또는 재수정된 이산 라돈 변환을 적용하여 이산 라돈 특징값을 추출한다.
304단계에서, 분산 어레이 생성부(204)는 302단계에서 추출된 이산 라돈 특징값들에 대한 분산 어레이 정보를 생성한다.
306단계에서, 거칠기 특징값 생성부(208), 방향성 특징값 생성부(210), 규칙성 특징값 생성부(212) 및 회전 불변 텍스쳐 특징값 추출부(214)는 입력된 쿼리 영상으로 부터, 거칠기 특징값, 방향성 특징값, 규칙성 특징값, 회전 불변 텍스쳐 특징값을 각각 산출한다.
308단계에서, 제 1 유사도 계산부(222) 내지 제 3 유사도 계산부(226)은 상기 산출된 방향성 특징값, 규칙성 특징값, 회전 불변 텍스쳐 특징값과 영상 특징 저장부(234)에 저장된 저장 영상의 특징값들을 이용하여 각각의 유사도를 계산한다.
310단계에서, 최종 유사도 계산부(228)는 상기 계산된 유사도값들을 소정의 가중치에 따라 합산한다.
312단계에서, 출력부(240)는 리트리벌(retrieval) 결과를 사용자에게 제공한다.
도 10은 본 발명의 일 실시예에 따라 쿼리 영상과 유사한 영상을 리트리벌하는 예를 나타내는 참고도이다. 도 10의 쿼리 영상은 혼합된 방향성을 가지며 비규칙성을 갖는 텍스쳐 영상이다. 우측 영상들에서 위에 랭크된 영상들은 좌측의 쿼리 영상과 유사도가 높은 영상들이다.
도 11은 본 발명의 일 실시예에 따라 쿼리 영상과 유사한 영상을 리트리벌하는 또 다른 예를 나타내는 참고도이다. 도 11의 쿼리 영상은 이란에 있는 페르세폴리스(Persepolis) 유적지에 대한 영상이다. 도 11의 우측에 도시된 영상들은 회전 불변 텍스쳐 특징과 컬러 히스토그램에 근거하여 상위에 랭크된 영상들이다. 도 11을 통하여 확인할 수 있듯이, 상위에 랭크된 영상들은 쿼리 영상과 유사함을 알 수 있다.
도 12는 본 발명의 일 실시예에 따라 쿼리 영상과 유사한 영상을 리트리벌하는 또 다른 예를 나타내는 참고도이다. 도 12의 영상은 항공 영상으로서, 전체 항공 영상들 중의 일부 타일이 쿼리 영상으로 선택되고, 선택된 쿼리 영상과 유사한 타일의 랭킹을 리트리벌 결과로서 도시한 예이다.
본 발명은 항공 영상을 파티셔닝하는 예에 사용하기 적합하다. 일반적으로, 항공 영상과 같은 원격제어 로 센싱되는 데이터는 회전 불변 영상 텍스 특징이 활용될 수 있는 훌륭한 어플리케이션이다. 도 12는 영상 데이터를 128*128 픽셀 블록 단위로 분할한 예이다. 분할된 서브 영상들 중에서 질의어 영상을 하나 선택하고, 서브 영상들 각각에 대하여 본 발명에서 제안된 바 있는 회전 불변 영상 특징값의 추출 방법에 따라 회전 불변 영상 특징값을 추출한 후, 수학식14를 이용하여 유사도 지수를 계산할 수 있다. 본 실시예에서는 wf는 1로 설정하고, wd와 wr은 0으로 설정하였다. 계산돈 유사도 지수를 근거로 하여 항공 영상을 2개의 클러스터로 분 할하기 위해서는 집적된 클러스터링 알고리즘(agglomerate clustering algorithm)을 이용할 수 있다.
도 12에서 질의어인 서브 영상과 동일한 클러스터에 속해 있는 서브 영상들은 하나의 파티션으로서 취급된다. 도 12는 항공 영상에서 파티셔닝 어플리캐이션의 좋은 예이다. 뿐만 아니라, 이러한 영상 분석의 정확성은 MPEG-7의 균일 질감 기술자를 이용한 유사한 텍스쳐를 써치를 함에 있어서의 정확도와 거의 일지한다. 특히, 상술한 어플리케이션을 온라인 프로세스 상에서 적용할 경우, 영상으로부터의 특징값 추출은 온라인 프로세스에서 유사성 매칭에 앞서서 수행되야 하며, 본 발명에서 제안된 접근 방법은 기존의 방법에 비하여 프로세싱 시간을 1/3로 단축 시킬 수 있다.
상술한 영상 특징 정보는 MPEG-7에서 텍스쳐 기술자의 하나인 텍스쳐 브라우징 기술자(Texture Browsing Descriptor : TBD)로 사용될 수 있다. 본 발명의 특징 정보를 이용한 TBD는 12비트로 구성될 수 있다. 우선, 6비트는 두개의 주된 방위각(DIR1, DIR2) 정보를 나타내고, 2비트는 규칙성 정도(REG)를 나타내며, 4비트는 2개의 거칠기 정도(COR1, COR2)를 나타낸다. 방위각은 0도 부터 150도 까지 30도의 스텝 사이즈를 갖는 6개의 양자화된 값이다. 텍스쳐 규칙성은 1 내지 4의 스캐일을 가지며, 거칠기 정도는 영상 스캐일과 각각의 방향에 관련되며, 0 내지 3 범위의 정수로서 4개의 양자화된 값을 갖는다. 상술한 텍스쳐 브라우징 기술자는 하기 수학식31로 표현될 수 있다.
[수학식31]
Figure 112009022196283-pat00108
한편 본 발명의 영상 특징 추출 방법 및 영상 검색 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.
컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현하는 것을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트 들은 본 발명이 속하는 기술 분야의 프로그래머들에 의하여 용이하게 추론될 수 있다.
이제까지 본 발명에 대하여 바람직한 실시예를 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 본 발명을 구현할 수 있음을 이해할 것이다. 그러므로, 상기 개시된 실시예 들은 한정적인 관점이 아니라 설명적인 관점에 서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 한다.
본 발명에 따르면 영상 텍스쳐가 갖는 특징으로서 방위각, 방향성, 거칠기, 규칙성에 대한 특징값을 이용하여 영상 텍스쳐가 갖는 특징을 보다 효과적으로 표현할 수 있다. 또한, 본 발명에 따라 추출된 영상의 특징값들을 컨텐츠 기반의 영상 리트리벌, 영상의 인덱싱에 활용할 경우 분석의 정확도 및 프로세싱 시간을 단축할 수 있다. 또한, 본 발명에 따라 생성되는 영상 특징값들을 이용하면 MPEG-7의 텍스쳐 브라우징 기술자(TBD) 또는 균일 질감 기술자를 효과적으로 생성할 수 있다.
도 1은 본 발명의 바람직한 일 실시예에 따른 영상 특징 추출 장치를 나타낸 블록도이다.
도 2는 서로 다른 방향성을 갖는 영상과 그 영상에서 추출된 라돈 특징값의 분산 어레이를 나타내는 참고도이다.
도 3은 비등방성의 영상과 그 영상에서 추출된 라돈 변환의 분산 어레이를 나타내는 참고도이다.
도 4는 방향성이 서로 다른 영상과 그 영상에서 추출된 라돈 특징값의 분산 어레이를 나타내는 참고도이다.
도 5는 서로 다른 스캐일을 갖는 등방성의 영상과 그 영상에서 추출된 라돈 특징값들의 분산 어레이를 나타내는 참고도이다.
도 6은 규칙성을 갖는 영상과 서브 영상에서 추출된 라돈 특징값들의 분산어레이를 나타내는 참고도이다.
도 7은 본 발명의 바람직한 일 실시예에 따른 영상 특징 추출 방법을 나타내는 흐름도이다.
도 8은 본 발명의 바람직한 일 실시예에 따른 영상 검색 장치를 나타내는 블록도이다.
도 9는 본 발명의 바람직한 일 실시예에 따른 영상 검색 방법을 나타내는 흐름도이다.
도 10 내지 12는 본 발명의 일 실시예에 따라 쿼리 영상과 유사한 영상을 리 트리벌하는 예를 나타내는 참고도이다.

Claims (20)

  1. 영상 특징 추출 방법에 있어서,
    a) 주어진 영상에 대하여 미리 설정된 참조 라인에 따른 라돈 변환을 수행하여 라돈 특징값을 생성하는 단계;
    b) 상기 참조 라인의 방위각에 따른 라돈 특징값의 분산 어레이(variance array)를 생성하는 단계;
    c) 상기 라돈 특징값의 분산 어레이에서 피크를 탐색하고, 상기 탐색된 피크의 폭을 고려하여 영상의 거칠기 정도를 나타내는 거칠기 특징값(coarseness feature value)을 계산하는 단계;
    d) 상기 탐색된 피크의 수 또는 상기 생성된 거칠기 특징값을 이용하여, 영상의 등방성 정도를 나타내는 방향성 특징값(directionality feature value)을 계산하는 단계; 및
    e) 상기 영상에 속하는 소정 크기의 서브 영상들 간의 유사도를 이용하여, 영상 패턴의 규칙성 정도를 나타내는 규칙성 특징값(regularity feature value)을 계산하는 단계를 포함하는 것을 특징으로 하는 영상 특징 추출 방법.
  2. 제 1 항에 있어서,
    f1) 상기 b) 단계에서 생성된 분산 어레이를 이용하여 상기 영상의 주 방위각을 계산하는 단계;
    f2) 상기 영상의 주 방위각에 기반하는 가보 웨이브렛 필터를 상기 영상에 적용하여 가보 웨이브렛 특징을 추출하는 단계; 및
    f3) 상기 추출된 가보 웨이브렛 특징을 이용하여 회전 불변 텍스처 특징을 산출하는 단계를 포함하는 것을 특징으로 하는 영상 특징 추출 방법.
  3. 제 1 항에 있어서, 상기 e)단계는
    e1) 상기 영상을 소정 크기의 서브 영상들로 분할하는 단계;
    e2) 상기 서브 영상들 각각에 따른 라돈 특징값의 분산 어레이를 생성하는 단계;
    e3) 상기 분산 어레이를 이용하여 상기 서브 영상들 간의 유사도를 계산하는 단계; 및
    e4) 상기 유사도를 이용하여 규칙성 특징값을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 특징 추출 방법.
  4. 제 1 항에 있어서,
    상기 c)단계에서 상기 탐색된 피크를 이용하여 거칠기 특징값을 생성하는 것은 탐색된 피크에 따른 피크 폭(peak width) 정보를 이용하여 거칠기 특징값을 생성하는 것을 특징으로 하는 영상 특징 추출 방법.
  5. 제 1 항에 있어서,
    상기 방향성 특징값은 하기 수학식으로 표현되는 것을 특징으로 하는 영상 특징 추출 방법.
    수학식
    Figure 112009022196283-pat00109
    여기에서, Np는 상기 c)단계에서 탐색된 피크의 개수이고, 상기 Niso는 등방성의 정도를 나타내는 피크 개수의 기준값이며, Cl은 피크의 거칠기 특징값이고, Ciso는 등방성의 정도를 나타내는 거칠기 특정값의 기준값이다.
  6. 제 3 항에 있어서,
    상기 e3)단계는 상기 라돈 특징값의 분산값이 소정의 기준값 이상인 피크들의 개수와 상기 피크들의 방위각을 고려하여, 상기 서브 영상들 중에서 선택되는 2개의 서브 영상들 간의 유사도를 계산하는 단계이고,
    상기 e4)단계는 상기 서브 영상들 중에서 선택되는 2개의 서브 영상들의 모든 조합에 따른 유사도의 합을 계산하고, 상기 합을 규칙성 특징값으로 생성하는 단계인 것을 특징으로 하는 영상 특징 추출 방법.
  7. 제 1 항에 있어서, 상기 a) 단계는
    a1) 미리 설정된 참조 라인에 주어진 영상의 화소들을 각각 할당하는 단계;
    a2) 상기 참조 라인에 할당된 화소들에 따른 화소값 평균을 계산하는 단계; 및
    a3) 상기 계산된 화소값 평균을 이용하여 상기 참조 라인에 따른 이산 라돈 변환을 수행하는 단계를 포함하는 것을 특징으로 하는 영상 특징 추출 방법.
  8. 제 7 항에 있어서,
    상기 이산 라돈 변환은 하기 수학식으로 표현되는 것을 특징으로 하는 영상 특징 추출 방법.
    수학식
    Figure 112009022196283-pat00110
    여기에서, ρr는 참조 라인을 나타내고, θt는 상기 참조 라인의 방향을 나타내며, Φr,t는 상기 참조 라인에 할당된 화소들의 집합을 나타내고, Mean(Φr,t)는 Φr,t의 산술 평균을 의미하며, Δs는 화소간 거리의 미소 변이량을 의미하고,
    Figure 112009022196283-pat00111
    는 이산 라돈 변환에 따른 라돈 특징값을 나타낸다.
  9. 제 1 항에 있어서, 상기 a) 단계는
    a1) 미리 설정된 참조 라인에 주어진 영상의 화소들을 각각 할당하는 단계;
    a2) 상기 할당된 화소를 연속적으로 나열하고, 상기 나열된 화소들을 순서적으로 그룹핑하되 각 그룹을 이루는 화소들의 개수를 동일하게 조절하여 그룹핑하고, 상기 그룹핑된 화소들을 상기 참조 라인에 할당하는 단계;
    a3) 상기 참조 라인에 할당된 화소들의 화소값 평균을 계산하는 단계; 및
    a4) 상기 계산된 화소값 평균을 이용하여 상기 참조 라인에 따른 이산 라돈 변환을 수행하는 단계를 포함하는 것을 특징으로 하는 영상 특징 추출 방법.
  10. 제 9 항에 있어서,
    상기 이산 라돈 변환은 하기 수학식으로 표현되는 것을 특징으로 하는 영상 특징 추출 방법.
    수학식
    Figure 112009022196283-pat00112
    여기에서, λj = λmin + j이고, λmin은 -(M-1)/2 이며, j는 화소 그룹의 순번으로서 0 내지 M-1 까지의 정수이고, M은 영상의 디멘젼을 의미하며, θt는 상기 참조 라인의 방향을 나타내고,
    Figure 112009022196283-pat00053
    = Concat(Φr,t)로서 화소들의 개수가 동일하게 조절된 j번째 화소 그룹에 속하는 화소들의 집합이며, Mean(
    Figure 112009022196283-pat00113
    )는
    Figure 112009022196283-pat00114
    의 산술 평균을 의미하고, 상기 Φr,t는 상기 참조 라인에 할당된 화소들의 집합을 나타내며,
    Figure 112009022196283-pat00054
    는 화소간 거리의 미소 변이량을 나타낸다.
  11. 제 1 항 내지 제 10 항 중 어느 한 항의 영상 특징 추출 방법을 컴퓨터 상에서 수행하기 위한 프로그램이 기록된 컴퓨터에서 판독가능한 기록 매체.
  12. 영상 특징 추출 장치에 있어서,
    주어진 영상에 대하여 미리 설정된 참조 라인에 따른 라돈 변환을 수행하여 라돈 특징값을 추출하는 라돈 특징값 생성부;
    상기 참조 라인의 방위각에 따른 라돈 특징값의 분산 어레이(variance array) 를 생성하는 분산 어레이 생성부;
    상기 라돈 특징값의 분산 어레이에서 피크를 탐색하고, 상기 탐색된 피크의 폭을 고려하여 영상의 거칠기 정도를 나타내는 거칠기 특징값(coarseness feature value)을 계산하는 거칠기 특징값 생성부;
    상기 탐색된 피크의 수 또는 상기 생성된 거칠기 특징값을 이용하여, 영상의 등방성 정도를 나타내는 방향성(directionality feature value) 특징값을 생성하는 방향성 특징값 생성부; 및
    상기 영상에 속하는 소정 크기의 서브 영상들 간의 유사도를 이용하여, 영상 패턴의 규칙성 정도를 나타내는 규칙성 특징값(regularity feature value)을 생성하는 규칙성 특징값 생성부를 포함하는 것을 특징으로 하는 영상 특징 추출 장치.
  13. 제 12 항에 있어서,
    상기 분산 어레이 생성부에서 생성된 분산 어레이를 이용하여 상기 영상의 주 방위각 정보를 생성하는 주 방위각 생성부;
    상기 영상의 주 방위각에 기반하는 가보 웨이브렛 필터를 상기 영상에 적용하여 가보 웨이브렛 특징을 추출하는 가보 웨이브렛 특징 추출부; 및
    상기 추출된 가보 웨이브렛 특징을 이용하여 회전 불변 텍스처 특징을 산출하는 텍스쳐 특징 산출부를 더 포함하는 것을 특징으로 하는 영상 특징 추출 장치.
  14. 제 12 항에 있어서, 상기 규칙성 특징값 생성부는
    상기 영상을 소정 크기의 서브 영상들로 분할하는 서브 영상 생성부;
    상기 서브 영상들에 따른 분산 어레이를 이용하여 상기 서브 영상들 간의 유사도를 계산하는 유사도 산출부; 및
    상기 유사도를 이용하여 규칙성 특징값을 생성하는 특징값 산출부를 포함하는 것을 특징으로 하는 영상 특징 추출 장치.
  15. a) 입력 영상에 대하여 미리 설정된 참조 라인에 따른 라돈 변환을 수행하여 라돈 특징값을 생성하는 단계;
    b) 상기 참조 라인의 방위각에 따른 라돈 특징값의 분산 어레이(variance array)를 생성하는 단계;
    c) 상기 라돈 특징값의 분산 어레이에서 피크를 탐색하고, 상기 탐색된 피크를 이용하여 거칠기 특징값(coarseness feature value) 을 생성하는 단계;
    d) 상기 탐색된 피크의 수 또는 상기 생성된 거칠기 특징값을 이용하여 방향성 특징값(directionality feature value) 을 생성하는 단계;
    e) 상기 입력 영상에 속하는 소정 크기의 서브 영상들 간의 유사도를 이용하여 규칙성 특징값(regularity feature value) 을 생성하는 단계;
    f) 영상 저장부에 저장된 저장 영상들 각각에 따른 거칠기 특징값, 방향성 특징값 및 규칙성 특징값들을 독출하는 단계; 및
    g) 상기 입력 영상의 거칠기 특징값과 상기 저장 영상의 거칠기 특징값 간의 유사도, 상기 입력 영상의 방향성 특징값과 상기 저장 영상의 방향성 특징값 간의 유사도 및 상기 입력 영상의 규칙성 특징값과 상기 저장 영상의 규칙성 특징값 간의 유사도를 계산하는 단계를 포함하는 것을 특징으로 하는 영상 검색 방법.
  16. 제 15 항에 있어서,
    상기 b) 단계에서 생성된 분산 어레이를 이용하여 상기 영상의 주 방위각을 생성하는 단계; 상기 영상의 주 방위각에 기반하는 가보 웨이브렛 필터를 상기 영상에 적용하여 가보 웨이브렛 특징을 추출하는 단계; 및 상기 추출된 가보 웨이브렛 특징을 이용하여 회전 불변 텍스쳐 특징을 추출하는 단계를 더 포함하며,
    상기 f)단계는 상기 저장 영상들 각각에 따른 회전 불변 텍스쳐 특징값을 독출하는 것을 더 포함하는 것을 특징으로 하는 영상 검색 방법.
  17. 제 16 항에 있어서, 상기 g)단계는
    g1) 상기 입력 영상에 따른 방향성 특징값과 상기 저장 영상에 따른 방향성 특징값 간의 제 1 유사도를 계산하는 단계;
    g2) 상기 입력 영상에 따른 규칙성 특징값과 상기 저장 영상에 따른 규칙성 특징값 간의 제 2 유사도를 계산하는 단계;
    g3) 상기 입력 영상에 따른 회전 불변 텍스쳐 특징값과 상기 저장 영상에 따른 회전 불변 텍스쳐 특징값 간의 제 3 유사도를 계산하는 단계; 및
    g4) 상기 제 1 유사도, 제 2 유사도 및 제 3 유사도를 각각의 가중치를 이용하여 가중합하여 최종 유사도를 계산하는 단계를 포함하는 것을 특징으로 하는 영상 검색 방법.
  18. 제 15 항 내지 제 17 항들 중 어느 한 항의 영상 검색 방법을 컴퓨터 상에서 수행하기 위한 프로그램이 기록된 컴퓨터에서 판독가능한 기록 매체.
  19. 입력 영상에 대하여 미리 설정된 참조 라인에 따른 라돈 변환을 수행하여 라돈 특징값을 생성하는 특징값 생성부;
    상기 참조 라인의 방위각에 따른 라돈 특징값의 분산 어레이(variance array) 를 생성하는 분산 어레이 생성부;
    상기 라돈 특징값의 분산 어레이를 이용하여 상기 분산값의 피크를 탐색하고, 상기 탐색된 피크를 이용하여 거칠기 특징값(coarseness feature value) 을 생성하는 거칠기 특징값 생성부;
    상기 탐색된 피크의 수 또는 상기 생성된 거칠기 특징값을 이용하여 방향성 특징값(directionality feature value) 을 생성하는 방향성 특징값 생성부;
    상기 입력 영상에 속하는 소정 크기의 서브 영상들 간의 유사도를 이용하여 규칙성 특징값(regularity feature value) 을 생성하는 규칙성 특징값 생성부;
    복수 개의 저장 영상들을 저장하며, 상기 저장 영상들로부터 추출된 거칠기 특징값, 방향성 특징값, 규칙성 특징값을 저장하는 영상 저장부;
    영상 저장부에 저장된 저장 영상들 각각에 따른 거칠기 특징값, 방향성 특징값 및 규칙성 특징값들을 독출하는 독출부; 및
    상기 입력 영상의 거칠기 특징값과 상기 저장 영상의 거칠기 특징값 간의 유사도, 상기 입력 영상의 방향성 특징값과 상기 저장 영상의 방향성 특징값 간의 유사도 및 상기 입력 영상의 규칙성 특징값과 상기 저장 영상의 규칙성 특징값 간의 유사도를 계산하는 유사도 계산부를 포함하는 것을 특징으로 하는 영상 검색 장치.
  20. 제 19 항에 있어서,
    상기 생성된 분산 어레이를 이용하여 상기 영상의 주 방위각을 생성하는 주 방위각 생성부;
    상기 영상의 주 방위각에 기반하는 가보 웨이브렛 필터를 상기 영상에 적용하여 가보 웨이브렛 특징을 추출하는 가보 웨이브렛 특징 추출부; 및
    상기 추출된 가보 웨이브렛 특징을 이용하여 회전 불변 텍스쳐 특징을 추출하는 텍스쳐 특징 산출부를 더 포함하며,
    상기 독출부는 상기 저장 영상들 각각에 따른 회전 불변 텍스쳐 특징을 더욱 독출하는 것을 특징으로 하는 영상 검색 장치.
KR1020070102974A 2007-10-12 2007-10-12 영상 특징 추출 방법 및 장치, 이를 이용한 컨텐츠 기반의영상 검색 방법 및 장치 그리고 상기 방법들을 수행하는프로그램이 기록된 기록 매체 KR100932210B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070102974A KR100932210B1 (ko) 2007-10-12 2007-10-12 영상 특징 추출 방법 및 장치, 이를 이용한 컨텐츠 기반의영상 검색 방법 및 장치 그리고 상기 방법들을 수행하는프로그램이 기록된 기록 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070102974A KR100932210B1 (ko) 2007-10-12 2007-10-12 영상 특징 추출 방법 및 장치, 이를 이용한 컨텐츠 기반의영상 검색 방법 및 장치 그리고 상기 방법들을 수행하는프로그램이 기록된 기록 매체

Publications (2)

Publication Number Publication Date
KR20090037585A KR20090037585A (ko) 2009-04-16
KR100932210B1 true KR100932210B1 (ko) 2009-12-16

Family

ID=40762164

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070102974A KR100932210B1 (ko) 2007-10-12 2007-10-12 영상 특징 추출 방법 및 장치, 이를 이용한 컨텐츠 기반의영상 검색 방법 및 장치 그리고 상기 방법들을 수행하는프로그램이 기록된 기록 매체

Country Status (1)

Country Link
KR (1) KR100932210B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9727581B2 (en) 2011-09-26 2017-08-08 Carnegie Mellon University Quantitative comparison of image data using a linear optimal transportation
CN104730083B (zh) * 2015-04-09 2018-05-01 中煤科工集团重庆研究院有限公司 钢丝绳芯输送带接头抽动自动检测方法
KR101717079B1 (ko) * 2015-10-07 2017-03-16 민운기 색 히스토그램 정보 중복성에 관한 영상 키 인증 방법 및 시스템
CN106651933A (zh) * 2016-12-27 2017-05-10 西安邮电大学 一种基于Radon变换的改进型纹理特征提取算法
KR102204936B1 (ko) * 2019-09-10 2021-01-19 국방과학연구소 라돈 변환을 이용한 표적 방위각 추정장치 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000031751A (en) * 1998-11-10 2000-06-05 Korea Electronics Telecomm Method for extracting and indexing multimedia characteristic in multimedia indexing system
KR20010012020A (ko) * 1999-07-09 2001-02-15 정선종 주파수 공간상에서의 질감표현방법 및 질감기반 검색방법
KR20010078707A (ko) * 1999-12-03 2001-08-21 오길록 주파수 공간상에서의 가보 필터를 이용한 질감표현방법 및질감기반 영상 검색방법
KR20050094228A (ko) * 2004-03-22 2005-09-27 엘지전자 주식회사 지문 인식 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000031751A (en) * 1998-11-10 2000-06-05 Korea Electronics Telecomm Method for extracting and indexing multimedia characteristic in multimedia indexing system
KR20010012020A (ko) * 1999-07-09 2001-02-15 정선종 주파수 공간상에서의 질감표현방법 및 질감기반 검색방법
KR20010078707A (ko) * 1999-12-03 2001-08-21 오길록 주파수 공간상에서의 가보 필터를 이용한 질감표현방법 및질감기반 영상 검색방법
KR20050094228A (ko) * 2004-03-22 2005-09-27 엘지전자 주식회사 지문 인식 방법

Also Published As

Publication number Publication date
KR20090037585A (ko) 2009-04-16

Similar Documents

Publication Publication Date Title
JP4545641B2 (ja) 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体
Arandjelović et al. DisLocation: Scalable descriptor distinctiveness for location recognition
US8467611B2 (en) Video key-frame extraction using bi-level sparsity
Moghaddam et al. A new algorithm for image indexing and retrieval using wavelet correlogram
WO2013129580A1 (ja) 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム
CN107223242B (zh) 用于在多个已存储图像中搜索相似图像的方法
CN107633065B (zh) 一种基于手绘草图的识别方法
EP2383990B1 (en) Time segment representative feature vector generation device
CN107577758B (zh) 一种基于多区域交叉权值的图像卷积特征的生成方法
Seetharaman et al. Statistical framework for image retrieval based on multiresolution features and similarity method
KR100932210B1 (ko) 영상 특징 추출 방법 및 장치, 이를 이용한 컨텐츠 기반의영상 검색 방법 및 장치 그리고 상기 방법들을 수행하는프로그램이 기록된 기록 매체
Zieliński et al. Persistence codebooks for topological data analysis
Abrishami Moghaddam et al. Enhanced Gabor wavelet correlogram feature for image indexing and retrieval
Zieliński et al. Persistence bag-of-words for topological data analysis
Sebai et al. Dual-tree complex wavelet transform applied on color descriptors for remote-sensed images retrieval
Yadav et al. Video image retrieval method using dither-based block truncation code with hybrid features of color and shape
Srivastava et al. Content-based image retrieval using local binary curvelet co-occurrence pattern—a multiresolution technique
Nagaraja et al. Low-level features for image retrieval based on extraction of directional binary patterns and its oriented gradients histogram
Chowdhury et al. Comparative assessment of efficiency for content based image retrieval systems using different wavelet features and pre-classifier
Mosleh et al. Texture image retrieval using contourlet transform
Ren A comparative study of irregular pyramid matching in bag-of-bags of words model for image retrieval
Mistry et al. Efficient content based image retrieval using transform and spatial feature level fusion
Huang et al. Retrieving images using saliency detection and graph matching
Niu et al. Statistical texture image retrieval in DD-DTCWT domain using magnitudes and relative phases
Kobayashi et al. Image retrieval using features in spatial and frequency domains based on block-division

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121129

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130930

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141001

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee