KR101322524B1 - 화상 시그너처 추출 디바이스 - Google Patents

화상 시그너처 추출 디바이스 Download PDF

Info

Publication number
KR101322524B1
KR101322524B1 KR1020117017243A KR20117017243A KR101322524B1 KR 101322524 B1 KR101322524 B1 KR 101322524B1 KR 1020117017243 A KR1020117017243 A KR 1020117017243A KR 20117017243 A KR20117017243 A KR 20117017243A KR 101322524 B1 KR101322524 B1 KR 101322524B1
Authority
KR
South Korea
Prior art keywords
feature
image
dimension
feature amount
validity
Prior art date
Application number
KR1020117017243A
Other languages
English (en)
Other versions
KR20110103437A (ko
Inventor
고타 이와모토
료마 오아미
Original Assignee
닛본 덴끼 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 닛본 덴끼 가부시끼가이샤 filed Critical 닛본 덴끼 가부시끼가이샤
Publication of KR20110103437A publication Critical patent/KR20110103437A/ko
Application granted granted Critical
Publication of KR101322524B1 publication Critical patent/KR101322524B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/80Recognising image objects characterised by unique random patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

화상 시그너처 추출 디바이스는, 화상으로부터, 특징 벡터의 각 차원에 대응하는 제 1 특징량을 추출하는 제 1 특징량 추출 수단; 화상으로부터, 특징 벡터의 각 차원에 대응하는 제 1 특징량과는 상이한 제 2 특징량을 추출하는 제 2 특징량 추출 수단; 화상 및 추출된 제 1 특징량 중 적어도 일방을 분석 대상으로서 분석하여, 추출된 제 1 특징량으로 구성되는 특징 벡터가 화상을 판별함에 있어서 유효성을 갖는지 여부를 판정하고, 특징 벡터가 유효성을 갖는 경우에는 각 차원에 이용되는 특징량의 유형을 제 1 특징량으로 결정하지만, 유효성을 갖지 않는 경우에는 적어도 일부의 차원 각각에 이용되는 특징량의 유형을 제 2 특징량으로 결정하고, 나머지의 차원 각각에 이용되는 특징량의 유형을 제 1 특징량으로 결정하는 특징량 유형 결정 수단; 및 각 차원에 이용되는 특징량의 유형에 따라, 추출된 제 1 특징량 및 추출된 제 2 특징량으로부터 화상의 특징 벡터를 생성하는 특징 벡터 생성 수단을 포함한다.

Description

화상 시그너처 추출 디바이스{IMAGE SIGNATURE EXTRACTION DEVICE}
본 발명은, 화상을 식별하는 (화상의 동일성을 판정하는) 특징량인 화상 시그너처를 추출하는 화상 시그너처 (image signature) 추출 디바이스에 관한 것이다.
화상 시그너처는, 화상을 식별하는 (화상의 동일성을 판정하는) 화상 특징량이다. 어느 화상으로부터 추출된 화상 시그너처를 다른 화상으로부터 추출된 화상 시그너처와 비교함으로써, 그 비교 결과로부터 2개의 화상이 동일한 정도를 나타내는 동일성 스케일 (일반적으로, 유사도 또는 거리로 지칭됨) 이 산출될 수 있다. 또한, 산출된 동일성 스케일을 임계치와 비교함으로써, 2개의 화상들이 동일한지 여부를 판정하는 것이 가능하게 된다. 여기서, "2개의 화상이 동일" 이라는 의미는, 화상 신호 (화상을 구성하는 화소의 화소값) 의 레벨로 2개의 화상이 동일한 경우뿐만 아니라, 화상의 압축 형식 (포맷) 의 변환, 화상의 사이즈/종횡비의 변환, 화상의 색상의 조정, 화상에 가해지는 각종 필터 처리 (예각화, 평활화 등), 화상에 가해지는 국소적인 가공 (캡션 중첩, 컷아웃 등), 화상의 리캡처와 같은 각종 개변 처리에 의해, 어느 화상이 다른 화상의 복제된 화상인 경우도 포함한다. 화상 시그너처를 이용함으로써, 예를 들어, 화상, 또는 화상의 집합체인 동화상의 복제를 검출할 수 있기 위해, 화상 또는 동화상의 불법 복사 검출 시스템에 적용 가능하게 된다.
화상 시그너처의 예들에는, 비특허문헌 1, 비특허문헌 2, 및 특허문헌 1 에 기재되어 있다. 이들 문헌들에 기재된 방법들은, 화상의 복수의 국소 영역들에 대한 특징량들을 추출하고, 추출된 특징량들을 양자화하여 양자화 인덱스들을 산출하고, 산출된 국소 영역마다의 양자화 인덱스를 양자화 인덱스 벡터로서 이용하여 화상 시그너처로서 사용하고 있다.
구체적으로는, 비특허문헌 1, 비특허문헌 2 에서는, 화상이 블록으로 분할된다. 각각의 블록을 국소 영역으로서 이용하여 특징량 (양자화 인덱스) 을 추출한다. 또한, 비특허문헌 1 에서는, 블록 내의 휘도 분포의 패턴을 11 유형으로 분류한 것을 양자화 인덱스로서 이용하고 있다. 비특허문헌 2 (비특허문헌 2 의 "Local Edge Representation" 으로서 기재되어 있는 기술) 에서는, 블록으로부터 추출되는 에지 점의 중력의 중심 위치를 양자화하여, 양자화 인덱스로 이용하고 있다.
한편, 도 12 에 나타낸 바와 같이, 특허문헌 1 에 기재된 방법은, 화상 (240) 내에서의 미리 정해진 위치의 32개의 장방형 영역 (244) (도 12 에서는 그 중 16개의 장방형 영역이 나타나 있음) 으로부터 각각 평균 휘도값들을 산출하고, 쌍을 형성하는 장방형 영역들 사이 (도 12 에서는 쌍을 이루는 장방형 영역들을 점선 (248) 으로 서로 연결하고 있음) 의 평균 휘도값의 차이를 산출하고, 이에 의해 16차원의 차이 벡터 (250) 를 획득한다. 차이 벡터 (250) 에 대해, 벡터 변환에 의해 합성 벡터를 생성하고, 합성 벡터의 각 차원을 양자화함으로써 취득되는 16차원의 양자화 인덱스 벡터를 화상 시그너처로서 이용한다.
일본 미심사 특허 공개 평8-500471호 공보
Proceedings of International Conference on Image Processing (ICIP2006), 2006 의 Kota Iwamoto, Eiji Kasutani, Akio Yamada 의 "Image Signature Robust to Caption Superimposition for Video Sequence Identification". Proceedings of International Conference on Multimedia and Expo (ICME2001), p.946, 2001 의 Arun Hampapur, Ruud M. Bolle 의 "Comparison of Distance Measures for Video Copy Detection".
화상 시그너처에 관하여, 결합될 특징량들의 유형들 및 차원의 수가 제한되는 한, 어느 특징량이 임의의 방식으로 결합되더라도 판별될 수 없는 화상의 유형이 존재한다.
결합될 특징량들의 유형들 및 차원의 수가 증가함에 따라, 판별될 수 없는 화상들의 유형들은 감소된다. 그러나, 이것은 화상 시그너처의 크기 (데이터 크기) 에 있어서의 증가의 부정적인 영향을 야기한다. 화상 시그너처의 크기가 증가된다면, 화상 시그너처에 매칭하는 매칭 비용에 있어서의 증가와 같은 문제점들이 야기된다.
본 발명의 목적은, 식별될 수 있는 화상들의 유형을 증가시키기 위해 차원의 수가 증가된다면, 화상 시그너처의 크기도 또한 증가된다는 문제점을 해결할 수 있는 화상 시그너처 추출 디바이스를 제공하는 것이다.
본 발명의 일 양태에 따르면, 화상 시그너처 추출 디바이스는, 화상으로부터, 특징 벡터의 각 차원에 대응하고 화상으로부터 추출된 물리량을 양자화함으로써 획득된 양자화값인 제 1 특징량을 추출하는 제 1 특징량 추출 수단; 화상으로부터, 특징 벡터의 각 차원에 대응하는 제 1 특징량과는 상이한 제 2 특징량을 추출하는 제 2 특징량 추출 수단; 화상 및 추출된 제 1 특징량 중 적어도 일방을 분석 대상으로서 분석하여, 추출된 제 1 특징량으로 구성되는 특징 벡터가 화상을 판별함에 있어서 유효성을 갖는지 여부를 판정하고, 특징 벡터가 유효성을 갖는 경우에는 각 차원에 이용되는 특징량의 유형을 제 1 특징량으로 결정하지만, 유효성을 갖지 않는 경우에는 제 1 특징량이 미리 결정된 양자화값인 차원 각각에 이용되는 특징량의 유형을 제 2 특징량으로 결정하고, 나머지의 차원 각각에 이용되는 특징량의 유형을 제 1 특징량으로 결정하는 특징량 유형 결정 수단; 및 결정된 각 차원에 이용되는 특징량의 유형에 따라, 추출된 제 1 특징량 및 추출된 제 2 특징량으로부터 화상의 특징 벡터를 생성하는 특징 벡터 생성 수단을 포함한다.
본 발명은 전술한 바와 같이 구성되기 때문에, 화상 시그너처의 크기를 증가시키지 않고도, 식별될 수 없는 유형들의 화상들을 감소시킬수 있는 화상 시그너처 추출 디바이스를 제공하는 것이 가능하게 된다.
도 1 은 본 발명의 제 1 실시형태의 블록도이다.
도 2 는 본 발명의 발명자에 의해 고안된 화상 시그너처를 추출하는 방법을 나타내는 도면이다.
도 3 은 본 발명의 제 1 실시형태의 동작을 나타내는 흐름도이다.
도 4 는 본 발명의 제 2 실시형태를 나타내는 블록도이다.
도 5 는 본 발명의 제 2 실시형태의 동작을 나타내는 흐름도이다.
도 6 은 본 발명의 제 3 실시형태를 나타내는 블록도이다.
도 7 은 본 발명의 제 3 실시형태의 동작을 나타내는 흐름도이다.
도 8 은 본 발명의 제 4 실시형태를 나타내는 블록도이다.
도 9 는 본 발명의 제 4 실시형태의 동작을 나타내는 흐름도이다.
도 10 은 본 발명의 제 5 실시형태를 나타내는 블록도이다.
도 11 은 본 발명의 제 5 실시형태의 동작을 나타내는 흐름도이다.
도 12 는 특허문헌 1 에 기재된 화상 시그너처를 추출하는 방법을 나타내는 도면이다.
다음으로, 본 발명의 제 1 실시형태에 대해 도면을 참조하여 상세히 설명하기로 한다.
[제 1 실시형태]
도 1 을 참조하면, 본 발명의 제 1 실시형태에 따른 화상 시그너처 추출 디바이스 (100) 는, 화상 시그너처를 추출하는 대상인 화상을 수신하고, 그 화상을 식별하기 위한 복수의 차원의 특징 벡터를 화상 시그너처로서 출력한다. 이렇게 하기 위해, 화상 시그너처 추출 디바이스 (100) 는, 제 1 특징량 추출 수단 (110) 과 제 2 특징량 추출 수단 (120) 과 특징량 유형 결정 수단 (130) 과 특징 벡터 생성 수단 (140) 을 포함한다. 이하, 각각의 수단의 기능에 대해 상세히 설명하기로 한다.
(1) 제 1 특징량 추출 수단 (110)
제 1 특징량 추출 수단 (110) 은, 입력으로서 공급되는 화상으로부터 특징 벡터의 차원마다 제 1 특징량을 추출하고, 이것을 특징량 유형 결정 수단 (130) 과 특징 벡터 생성 수단 (140) 에 공급한다. 제 1 특징량 추출 수단 (110) 에 의해 추출된 제 1 특징량으로 구성되는 특징 벡터는, 이하, 제 1 특징 벡터로 지칭된다.
제 1 특징량 추출 수단 (110) 이 화상으로부터 추출되는 각 차원의 제 1 특징량은, 유형이 미리 규정 (고정) 되어 있다면, 어떠한 종류의 특징량이어도 상관없다. 예를 들어, 비특허문헌 1, 비특허문헌 2, 및 특허문헌 1 중 어느 하나에 기재된 화상 시그너처의 특징 벡터를 구성하는 각 차원의 특징량과 동일한 특징량들을 사용하는 것이 가능하게 된다. 이에 기재된 화상 시그너처의 특징 벡터를 구성하는 각 차원의 특징량은 양자화 인덱스이지만, 제 1 특징량 추출 수단 (110) 에 의해 화상으로부터 추출되는 각 차원의 제 1 특징량은 양자화 인덱스들이 아닐 수도 있지만, 연속값으로 구성되는 특징량일 수도 있다. 또한, 제 1 특징량 추출 수단 (110) 에 의해 화상으로부터 추출되는 각 차원의 제 1 특징량은 보다 많은 유형의 화상들에 대해 유효하도록 개량된 특징량일 수도 있다. 그 일례에 대해 도 2 를 참조하여 설명하기로 한다.
도 2 는 보다 많은 유형의 화상들에 대해 유효하도록 개량된 예시적인 특징량 (이하, 다형상 (multi-shape) 영역 비교 특징량으로 지칭함) 의 추출 방법을 나타내는 도면이다. 다형상 영역 비교 특징량에 있어서, 미리, 특징 벡터의 차원마다 그 특징량을 추출하도록, 화상 내의 2개의 추출 영역 (제 1 추출 영역과 제 2 추출 영역) 이 설정된다. 다형상 영역 비교 특징량과 특허문헌 1 에 기재된 특징량 사이의 상당한 차이점은, 추출 영역의 형상들이 다양성을 갖는다는 점에 있다. 다형상 영역 비교 특징량을 추출하기 위해, 차원마다, 차원마다 설정된 제 1 추출 영역과 제 2 추출 영역의 평균 휘도값들을 산출하고, 제 1 추출 영역의 평균 휘도값을 제 2 추출 영역의 평균 휘도값과 비교하고 (즉, 차이값에 기초하고), 이 차이를 3개의 값들로 양자화하여 (+1, 0, -1), 이에 의해 양자화 인덱스를 획득한다. 제 1 추출 영역의 평균 휘도값과 제 2 추출 영역의 평균 휘도값 사이의 차이값의 절대값이 설정된 임계치 이하인 경우, 제 1 추출 영역과 제 2 추출 영역의 평균 휘도값들은 차이가 없는 것으로 결정되어, 차이가 없다는 것을 나타내는 양자화 인덱스 0 으로 설정된다. 다른 경우에는, 제 1 추출 영역의 평균 휘도값과 제 2 추출 영역의 평균 휘도값을 비교하여, 제 1 추출 영역의 평균 휘도값이 더 큰 경우에는 양자화 인덱스가 +1 로 설정되는 한편, 다른 경우에는 양자화 인덱스가 -1 로 설정된다. 차원 n 에서의 제 1 추출 영역의 평균 휘도값을 Vn1, 제 2 추출 영역의 평균 휘도값을 Vn2, 그리고 설정된 임계치를 th 로 가정하면, 차원 n 의 양자화 인덱스 Qn 은 이하의 식으로부터 산출될 수 있다.
[식 1]
Qn = +1 (|Vn1-Vn2|>th 및 Vn1>Vn2 인 경우)
0 (|Vn1-Vn2|≤th 인 경우)
-1 (|Vn1-Vn2|>th 및 Vn1≤Vn2 인 경우)
(2) 제 2 특징량 추출 수단 (120)
제 2 특징량 추출 수단 (120) 은, 입력으로서 공급되는 화상으로부터 특징 벡터의 차원마다 제 1 특징량과는 상이한 제 2 특징량을 추출하고, 이것을 특징 벡터 생성 수단 (140) 에 공급한다. 제 2 특징량 추출 수단 (120) 에 의해 화상으로부터 추출되는 각 차원의 제 2 특징량은, 그 유형이 미리 규정 (고정) 되어 있다면, 어떠한 유형의 특징량일 수도 있다.
그러나, 제 1 특징 벡터의 조합 방법을 직접적으로 적용하기 위해, 제 2 특징량 추출 수단 (120) 에 의해 추출되는 제 2 특징량들의 값들은, 제 1 특징량들의 값들 (제 1 특징 벡터의 차원의 특징량들의 값들) 에 의해 취해질 수 있는 값들의 부분 집합일 필요가 있다 (그러나 공집합은 포함되지 않음). 그 이유는, 복수의 차원에서의 특징 벡터들의 화상 시그너처들을 이용하고, 2개의 화상들의 화상 시그너처들을 비교하여 동일성이 판정되는 경우, 동일한 (대응하는) 차원의 특징량의 값들이 비교되어, 예를 들어, 값들이 매칭되는 차원의 수를 유사도로서 산출하거나 또는 해밍 거리 (Hamming distance), 유클리드 거리 (Euclidean distance), 코사인 유사도 (내적) 를 산출하기 때문이다. 이와 같이, 제 2 특징량들의 값들이 제 1 특징량들의 값들의 부분 집합이 아니라면, 제 1 특징 벡터의 조합 방법이 제 2 특징 벡터에 직접 적용될 수 없다.
예를 들어, 제 1 특징량 (제 1 특징 벡터의 차원의 특징량의 값) 이 양자화 인덱스이며, 그 값으로서 {+1, 0, -1} 중 임의의 값을 취하는 경우, 제 2 특징량 추출 수단 (120) 에 의해 추출되는 제 2 특징량은 양자화 인덱스일 필요가 있으며, 그 취할 수도 있는 값들의 집합은, {+1, 0, -1} 의 부분 집합, 즉, {+1, 0, -1}, {+1, 0}, {+1, -1}, {0, -1}, {+1}, {0}, 또는 {-1} 에 한정된다. +2 는 제 1 특징량에 의해 취해질 수 없는 값이기 때문에, 제 2 특징량 추출 수단 (120) 은 제 2 특징량의 값을 +2로서 추출해서는 아니되므로, 제 1 특징 벡터의 차원의 특징량의 값이 이 값으로 치환된다면, 제 1 특징 벡터에 대한 조합 방법이 적용될 수 없다.
또한, 예를 들어, 제 1 특징량들의 값들 (제 1 특징 벡터의 차원의 특징량들의 값들) 이 이산값 또는 연속값이며, 치역이 정의되어 있는 경우, 제 2 특징량 추출 수단 (120) 에 의해 추출되는 제 2 특징량의 값은 그 취할 수 있는 치역 내에 포함되는 값들일 필요가 있다. 제 1 특징량의 값들 (제 1 특징 벡터의 차원의 특징량들의 값들) 에 치역이 설정되지 않은 경우, 제 2 특징량 추출 수단 (120) 에 의해 추출되는 제 2 특징량들의 값들에 대한 치역이 설정될 필요는 없다.
제 2 특징량 추출 수단 (120) 에 의해 추출되는 제 2 특징량들은, 전술한 제약을 만족하는 한, 어떠한 특징량일 수도 있다. 또한, 제 2 특징량 추출 수단 (120) 은 화상으로부터 임의의 방식으로 특징량들을 추출할 수도 있다.
또한, 제 2 특징량 추출 수단 (120) 은, 추출된 특징량을 임의의 방법에 의해 차원에 할당 (추출 특징량을 어느 차원에 할당할 것인지를 결정) 할 수도 있다. 예를 들어, 제 1 특징 벡터가 다형상 영역 비교 특징량을 이용하는 경우, 제 2 특징량 추출 수단 (120) 은, 차원 D 에 대응하는 제 2 특징량을, 제 1 특징 벡터인 다형상 영역 비교 특징량이 추출되는 동일한 차원 D 에 대응한 2개의 추출 영역들로부터 추출할 수도 있고, 다른 영역이나 화상 전체로부터 추출할 수도 있다. 이것은, 제 2 특징량 추출 수단 (120) 이 어느 차원에 대해 제 1 특징량 추출 수단 (110) 에 의해 특징량을 추출하는 방법과 독립적으로 특징량을 추출할 수도 있음을 의미한다. 또한, 제 2 특징량 추출 수단 (120) 은 화상으로부터 추출된 특징량을 복수의 차원에 할당할 수도 있다. 이것은, 제 2 특징량 추출 수단 (120) 에 의해 추출되는 차원마다의 특징량이 복수의 차원에 대해 동일할 수도 있다는 것을 의미한다.
또한, 제 2 특징량 추출 수단 (120) 은 복수의 차원로 하여금 1개의 의미를 나타내게 할 수도 있다. 예를 들어, 차원 1 과 차원 2 를 결합함으로써, {0, 0} 은 적색을 나타내고 {0, 1} 은 청색을 나타내고 {1, 0} 은 녹색을 나타내고 {1, 1} 은 흑색을 나타내는 방식으로, 차원의 각각은 어떠한 의미를 갖지 않지만, 복수의 차원의 세트에 의해 하나의 의미를 표현하는 것은 가능하게 된다.
또한, 제 2 특징량 추출 수단 (120) 에 의해 추출되는 제 2 특징량들은, 차원마다, 상이한 유형의 특징량들일 수도 있다. 예를 들어, 어느 차원에 대해서는 색 정보가 특징량인 한편 다른 차원에 대해서는 에지 정보가 특징량일 수 있다.
제 2 특징량 추출 수단 (120) 에 의해 추출되는 제 2 특징량은, 제 1 특징량 (제 1 특징 벡터) 의 유효성이 낮은 경우, 이 제 1 특징량을 보충할 수 있는 특징량인 것이 바람직하다.
제 1 특징 벡터의 유효성은, 제 1 특징 벡터를 화상 시그너처로서 사용했을 경우의 유효성을 의미하는 것임을 유의해야 한다. 화상 시그너처로서의 유효성을 판정하는 지표는 "판별 능력" 및 "견고성 (robustness)" 을 포함한다. 판별 능력은 상이한 화상을 식별할 수 있는 정도이며, 판별 능력이 더 높을수록 유효성이 더 높다고 판정될 수 있다. 견고성은 화상에 적용되는 각종 개변 처리에 의해 특징량의 값이 변화되지 않는 정도이며, 견고성이 더 높을수록, 유효성이 더 높다고 판정될 수 있다.
이와 같이, 제 2 특징량은 제 1 특징량 (제 1 특징 벡터) 의 판별 능력이 낮은 경우, 판별 능력이 높아지는 특징량인 것이 바람직하다. 또한, 예를 들어, 제 2 특징량은, 제 1 특징량 (제 1 특징 벡터) 의 견고성이 낮은 경우에 견고성이 높아지는 특징량인 것이 바람직하다. 또한, 제 2 특징량은, 제 1 특징량 (제 1 특징 벡터) 과는 상이한 유형의 특징량이거나 또는 제 1 특징량 (제 1 특징 벡터) 과는 상관이 작은 특징량인 것이 바람직하다.
예를 들어, 제 1 특징량 (제 1 특징 벡터) 이 화상의 에지에 관한 정보인 경우, 제 2 특징량은 상이한 유형의 특징량, 즉, 화상의 색에 관한 정보인 것이 바람직하다.
또한, 예를 들어, 제 2 특징량이 제 1 특징량 (제 1 특징 벡터) 과 동일한 유형의 특징량이더라도, 예를 들어, 제 2 특징량은 상이한 크기의 영역으로부터 추출되거나 또는 상이한 파라미터 (예컨대, 임계치) 를 이용하여 추출되는 특징량일 수도 있다. 이 경우, 예를 들어, 판별 능력이나 견고성이 더 높아지도록, 추출되는 영역의 크기나, 추출되는 파라미터를 상이하게 하는 것이 바람직하다. 예를 들어, 제 1 특징량 (제 1 특징 벡터) 이 화상의 에지에 관한 정보의 경우, 제 2 특징량은 제 1 특징량에 사용되는 것과는 상이한 스케일이거나 상이한 임계치를 이용하여 추출된 에지에 관한 정보일 수도 있다. 이 경우, 예를 들어, 제 1 특징 벡터의 판별 능력이 낮은 것으로 판정되는 경우, 제 2 특징량은 더 작은 스케일로 추출된 에지에 관한 정보일 수도 있다. 또한, 예를 들어, 제 1 특징 벡터의 견고성이 낮은 것으로 판정되는 경우, 제 2 특징량은 더 큰 스케일로 추출된 에지에 관한 정보일 수도 있다.
이제, 제 1 특징 벡터가 전술한 다형상 영역 비교 특징량을 이용하는 경우, 제 2 특징량 추출 수단 (120) 에 의해 추출되는 제 2 특징량의 예를 나타낸다. 다형상 영역 비교 특징량은 화상의 기복을 표현한 특징량이기 때문에, 예를 들어, 판별 능력이 낮은 것으로 판정된 경우, 즉, 양자화 인덱스가 0 인 수많은 차원이 존재하는 경우, 제 2 특징량으로서 화상의 기복을 표현하는 특징량과는 상이한 종류의 특징량이 추출되는 것이 바람직하다. 또한, 예를 들어, 제 2 특징량은 동일한 차원의 다형상 영역 비교 특징량을 추출하는 추출 영역과 동일한 추출 영역으로부터 추출되지만, 더 작은 임계치 (th) 로 추출될 수도 있고, 다형상 영역 비교 특징량을 추출하는 추출 영역에 비해, 더 작은 추출 영역으로부터 추출될 수도 있다.
예를 들어, 차원 D 에 대응하는 제 2 특징량은, 제 1 특징 벡터의 다형상 영역 비교 특징량이 추출되는 추출 영역과 동일한 2개의 추출 영역으로부터, 예를 들어, 이하의 방식으로 추출될 수도 있다 (이것은, 차원 D 에 대해, 제 2 특징량을 추출하는 영역이 제 1 특징량을 추출하는 영역과 동일할 수도 있음을 의미함).
(A) 더 작은 임계치 (th) 를 이용하여 특징량이 추출된다.
(B) 2개의 추출 영역들의 휘도의 대표값은, 평균값에 의하지 않고 다른 방법 (예를 들어, 최대값, 최소값, 중간값, 모드값) 에 의해 산출된다.
(C) 제 2 특징량은 2개의 추출 영역들 중 더 작은 영역의 평균 휘도값으로부터 추출된다.
(D) 추출 영역들의 휘도값들의 대표값이 양자화되어 제 2 특징량으로서 사용된다. 예를 들어, 2개의 추출 영역들의 휘도값들의 (종합적인) 대표값이 산출되고 (예를 들어, 각각의 추출 영역들의 평균값들의 평균값이 산출되고), 그 대표 휘도값을 3개의 값으로 양자화하여, 양자화 인덱스 {+1, 0, -1} 을 산출한다.
(E) 추출 영역의 색 정보가 추출되고 양자화되어 제 2 특징량으로서 사용된다. 예를 들어, 추출 영역의 RGB 성분의 평균값이 산출되고, 벡터 양자화에 의해 3개의 값으로 양자화되어, 양자화 인덱스 {+1, 0, -1} 가 산출된다. 이와 달리, 예를 들어, 추출 영역의 색상 성분들의 히스토그램을 생성하고, 그 정보를 3개의 값으로 양자화하여, 양자화 인덱스 {+1, 0, -1} 을 산출한다.
(F) 추출 영역에 대해, 에지를 추출하고 양자화하여 제 2 특징량으로서 사용한다. 예를 들어, 추출 영역의 에지의 총량을 산출하고 양자화할 수도 있고, 또는 추출 영역의 에지의 방향을 산출하고 양자화할 수도 있다.
(G) 추출 영역에 대해, 주파수 특징을 추출하고 양자화하여 제 2 특징량으로서 사용한다. 예를 들어, 추출 영역에 대해 DCT 변환을 수행하고, 그 결과를 벡터 양자화에 의해 3개의 값으로 양자화하여, 양자화 인덱스 {+1, 0, -1} 을 산출한다.
또한, 제 2 특징량 추출 수단 (120) 은, 화상을 블록으로 분할하고, 각각의 블록을 국소 영역으로서 사용하여 그 블록 내의 특징량을 복수의 템플릿들을 이용한 템플릿 매칭에 의해 검출하고, 가장 높은 스코어 템플릿의 번호를 양자화 인덱스로서 사용하는 방법에 의해, 제 2 특징량을 추출할 수도 있다.
또한, 제 2 특징량 추출 수단 (120) 은, 예를 들어, 차원 D 에 대응하는 제 2 특징량을, 제 1 특징 벡터의 동일한 차원의 다형상 영역 비교 특징량을 추출하는 2개의 추출 영역들 외의 영역으로부터, 상기 (A) 내지 (G) 에 나타낸 방법들 중 어느 하나에 의해 추출할 수도 있다. 또한, 예를 들어, 차원 D 에 대한 제 2 특징량은, 추출 영역인 화상 전체로부터, 상기 (A) 내지 (G) 에 나타낸 방법들 중 어느 하나에 의해 추출될 수도 있다.
또한, 제 2 특징량 추출 수단 (120) 은, 예를 들어, 제 2 특징량들을, 각 차원에 대해 상이한 특징량 추출 방법들의 수단에 의해 조합된 방식으로 추출될 수도 있다.
또한, 예를 들어, 제 2 특징량들은, 각 차원에 대해, 상이한 주파수 대역, 상이한 에지 추출 스케일, 상이한 색 성분 등을 이용하여, 화상 전체 혹은 화상의 부분 영역으로부터 추출된 특징량들일 수도 있다. 예를 들어, 어느 차원에 대한 주파수 대역의 특징을 양자화함으로써 획득된 특징, 및 다른 차원에 대한 다른 주파수 대역을 양자화함으로써 획득된 특징을 이용하는 것이 가능하다. 구체적으로는, 예를 들어, 화상 전체에 2차원 DCT 를 적용함으로써, 주파수 (u1, v1) 의 파워를 양자화함으로써 차원 1 의 제 2 특징량을 획득하는 것, 다른 주파수 (u2, v2) 의 파워를 양자화함으로써 차원 2 의 제 2 특징량을 획득하는 것, 또 다른 주파수 (u3, v3) 의 파워를 양자화함으로써 차원 3 의 제 2 특징량을 획득하는 것 등이 가능하게 된다.
또한, 예를 들어, 제 2 특징량들은, 어느 차원의 특징은 스케일 1 로 추출된 에지의 총량을 양자화함으로써 획득되고, 다른 차원의 특징은 그 2배의 스케일로 추출된 에지의 총량을 양자화함으로써 획득되고, 또 다른 차원의 특징은 3배의 스케일로 추출된 에지의 총량을 양자화함으로써 획득되도록, 획득될 수도 있다.
또한 예를 들어, 제 2 특징량은, 어느 차원의 특징은 R 성분의 값을 양자화함으로써 획득되고, 다른 차원의 특징은 G 성분의 값을 양자화함으로써 획득되고, 또 다른 차원의 특징은 B 성분의 값을 양자화함으로써 획득되도록, 획득될 수도 있다.
또한, 예를 들어, 제 2 특징량들은, 제 1 특징 벡터에서의 각 차원의 제 1 특징량들의 값들에 따라 결정될 수도 있다. 예를 들어, 다형상 영역 비교 특징량의 경우, 어느 차원의 제 1 특징량이 +1 또는 -1 이라면 대응하는 추출 영역들 사이에 상이한 휘도가 존재하게 되는 한편, 차원의 제 1 특징량이 0 이라면 이들 사이의 휘도 차이는 존재하지 않게 된다. 이와 같이, +1 또는 -1 인 경우에는, 휘도의 차이에 관한 상세한 정보, 즉, 차이의 크기에 따라 라지, 미디엄, 및 스몰로 양자화된 +1, 0, 또는 -1 의 인덱스가 제 2 특징량으로서 사용될 수도 있다. 한편, 0 인 경우에는, 휘도의 차이가 존재하지 않기 때문에, 휘도 외에도, 예를 들어 색 정보가 제 2 특징량으로서 사용될 수도 있다. 예를 들어, R 성분들의 평균값, G 성분들의 평균값, 및 B 성분들의 평균값을 산출하고, 최대의 성분의 정보를 양자화하여, 제 2 특징량으로서 사용하는 것이 가능하게 된다. 예를 들어, 제 2 특징량은 R 성분이 최대라면 +1 의 인덱스, G 성분이 최대라면 0 의 인덱스, 또는 B 성분이 최대라면 -1 의 인덱스일 수도 있다.
(3) 특징량 유형 결정 수단 (130)
특징량 유형 결정 수단 (130) 은, 제 1 특징량 추출 수단 (110) 에 의해 추출된 제 1 특징량을 분석하고, 제 1 특징량으로 구성되는 제 1 특징 벡터가 유효한지 여부를 판정하는 기능을 갖는다. 또한, 특징량 유형 결정 수단 (130) 은, 제 1 특징 벡터가 유효성을 갖는 경우에는 각 차원에 대해 이용되는 특징량들의 유형이 제 1 특징량이 되도록 설정되는 특징량 유형 정보를 특징 벡터 생성 수단 (140) 에 출력하는 한편, 제 1 특징 벡터가 유효성을 갖지 않는 경우에는 적어도 일부의 차원에 이용되는 특징량들의 유형이 제 2 특징량이 되도록 설정되고 나머지의 차원에 이용되는 특징량들의 유형이 제 1 특징량이 되도록 설정되는 특징량 유형 정보를 특징 벡터 생성 수단 (140) 에 출력하도록 하는 기능을 갖는다. 이 특징량 유형 결정 수단 (130) 은, 유효성 수치화 수단 (131) 및 특징량 유형 정보 생성 수단 (132) 으로 형성된다.
유효성 수치화 수단 (131) 은, 제 1 특징량을 분석하고, 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 출력한다. 유효성의 정도를 나타내는 유효성 값은 유효성의 정도를 수치화한 정보를 의미하는 것이라는 점에 유의해야 한다.
유효성 수치화 수단 (131) 은, 판별 능력 혹은 견고성 중 어느 일방 혹은 양방 모두의 정도를 나타내는 지표인 유효성 값을 생성하고, 이것을 특징량 유형 정보 생성 수단 (132) 에 출력한다. 이하, 판별 능력과 견고성에 대한 유효성 값의 구체적인 예들을 분리하여 설명한다.
(3-1) 판별 능력의 정도를 나타내는 유효성 값
(3-1-1) 판별 능력의 정도를 나타내는 유효성 값으로서, 제 1 특징량 추출 수단 (110) 으로부터 출력된 제 1 특징량으로 구성되는 제 1 특징 벡터가 발생할 확률의 값이 이용될 수도 있다. 이 경우, 유효성 수치화 수단 (131) 은, 제 1 특징 벡터가 발생할 확률을 추정하고, 그 추정값을 특징량 유형 정보 생성 수단 (132) 에 출력한다. 특징량 유형 정보 생성 수단 (132) 은, 그 확률의 크기에 기초하여, 판별 능력의 유무를 판정한다. 즉, 추정된 발생 확률이 크다면, 그것은 특징 벡터가 빈번히 발생하는 것을 의미하기 때문에, 상이한 화상을 식별할 수 있는 정도인 판별 능력이 낮은 것으로 판정된다. 추정된 발생 확률이 작다면, 그것은 특징 벡터가 빈번히 발생하지 않는 것을 의미하기 때문에, 상이한 화상을 식별할 수 있는 정도인 판별 능력이 높은 것으로 판정된다.
제 1 특징 벡터가 발생할 확률을 추정하는 방법들은, 예를 들어, 미리, 화상 모집단에 대해 관측된 제 1 특징 벡터의 발생 확률의 확률 밀도 분포를 이용하는 추정 방법을 포함한다.
또한, 미리, 제 1 특징 벡터의 차원마다, 특징량의 값이 발생할 확률이 알려져 있는 경우 (이 발생 확률은, 예를 들어 학습 화상군으로부터 계산될 수 있음), 이러한 차원마다의 특징량의 값의 발생 확률에 기초하여, 제 1 특징 벡터 전체의 발생 확률을 추정하는 것이 또한 가능하다. 가장 간단한 방법으로서는, 모든 차원의 발생 확률들의 총 승산 (곱한 값) 으로서 산출하거나 또는 모든 차원의 발생 확률의 평균값으로서 산출하는 것이 가능하다.
여기서, 추정된 발생 확률 자체가, 유효성의 정도를 수치화한 정보 (발생 확률이 더 커짐에 따라 유효성이 낮아지고, 발생 확률이 낮아짐에 따라 유효성이 높아짐) 로서 기능하기 위해, 유효성 수치화 수단 (131) 은, 추정된 발생 확률을 유효성 값으로서 특징량 유형 정보 생성 수단 (132) 에 출력한다. 특징량 유형 정보 생성 수단 (132) 은, 추정된 발생 확률이 임계치보다 큰 경우에는 제 1 특징 벡터는 유효성을 갖지 않고, 추정된 발생 확률이 임계치보다 작은 경우에는 제 1 특징 벡터는 유효성을 갖도록, 유효성의 유무를 판정할 수 있다.
(3-1-2) 또한, 판별 능력의 정도를 나타내는 유효성 값으로서 제 1 특징량 추출 수단 (110) 으로부터 출력된 제 1 특징량으로 구성되는 제 1 특징 벡터 및 빈출 화상 패턴으로부터 추출된 제 1 특징량으로 구성되는 특징 벡터 사이의 유사도의 값을 이용하는 것이 가능하다. 빈출 화상 패턴은, 어느 화상 모집단에서, 상이한 화상이지만 빈번히 출현하는 유사한 화상 패턴을 의미한다. 예를 들어, 어느 화상 모집단이 바다의 화상들을 포함하는 경우, 상이한 화상이지만, 화상의 하반부가 바다이고 화상의 상반부가 하늘인, 유사한 구도의 화상 패턴이 존재하게 된다. 또한, 예를 들어, 뉴스 프로그램들의 화상들을 포함하는 화상 모집단에서, 화상들이 상이한 화상이더라도, 화상의 하반부가 책상 (테이블) 이고, 화상의 중앙에 사람이 앉아 있는 것과 유사한 구도의 화상 패턴이 존재하게 된다. 전술한 바와 같이, 빈출 화상 패턴에 유사한 화상들은, 화상들이 상이한 화상이더라도, 제 1 특징 벡터가 서로 유사하기 때문에, 그 화상으로부터 추출된 제 1 특징 벡터는 상이한 화상을 식별할 수 있는 정도인 낮은 판별 능력을 갖는다.
이 경우, 유효성 수치화 수단 (131) 은, 제 1 특징량 추출 수단 (110) 에 의해 추출된 제 1 특징량으로 구성되는 제 1 특징 벡터 및 빈출 화상 패턴으로부터 사전에 추출된 제 1 특징 벡터 사이의 유사도 (예를 들어, 특징량이 일치하는 차원수) 를 산출하고, 산출된 유사도를 유효성 값으로서 특징량 유형 정보 생성 수단 (132) 에 출력한다. 빈출 화상 패턴으로부터 추출된 제 1 특징 벡터로서는, 예를 들어, 미리, 빈출 화상 패턴 (예컨대, 전술한 바와 같은 화상) 으로부터 추출된 제 1 특징 벡터가 사용될 수도 있으며, 제 1 특징 벡터가 템플릿으로서 주어질 수도 있다. 이 템플릿은 이따금 갱신되도록 구성될 수도 있다. 특징량 유형 정보 생성 수단 (132) 은, 산출된 유사도가 큰 경우에는 판별 능력이 낮고, 산출된 유사도가 낮은 경우에는 판별 능력이 높다고 판정한다. 구체적으로는, 제 1 특징 벡터 및 빈출 화상 패턴으로부터 추출한 특징 벡터 사이의 유사도가 임계치보다 큰 경우에는 제 1 특징 벡터는 유효성을 가지지 않고, 산출된 유사도가 임계치보다 작은 경우에는 제 1 특징 벡터는 유효성을 갖는다고 판정될 수 있다.
(3-1-3) 또한, 판별 능력의 정도를 나타내는 유효성 값으로서, 제 1 특징량 추출 수단 (110) 으로부터 출력된 제 1 특징량으로 구성되는 제 1 특징 벡터의 제 1 특징량이, 소정의 방식에 의해 양자화되는 경우에 소정의 양자화 인덱스들로 되는 차원의 수를 이용하는 것이 가능하다. 이것은 제 1 특징 벡터의 판별 능력을 제 1 특징 벡터의 특성에 따라 판정하는 방법이다. 이 예에서, 제 1 특징 벡터의 제 1 특징량으로서, 전술한 다형상 영역 비교 특징량을 이용하는 경우에 대해 설명하기로 한다.
다형상 영역 비교 특징량은, 차원마다 2개의 추출 영역들의 평균 휘도값들을 비교하여, 차이가 없는 경우에는 그 결과값을 인코딩하여 양자화 인덱스 0 이 되게 하고, 차이가 있는 경우에는 그 크기를 인코딩하여 양자화 인덱스 +1 또는 -1 이 되게 함으로써 획득되는 특징량이다. 이것은, 다형상 영역 비교 특징량이 휘도 화상에 있어서의 기복을 특징량으로서 표현함으로써 생생됨을 의미한다. 다형상 영역 비교 특징량은 휘도 화상이 기복을 포함하는 화상에 대해서는 충분한 판별 능력을 갖지만, 휘도 화상이 기복을 갖지 않거나, 혹은 기복이 작고 평탄한 화상, 이를테면 "푸른 하늘의 화상" 또는 "흰 벽의 화상" 에 대해서는, 수많은 차원 (경우에 따라서는 모든 차원) 에 있어서 특징량들의 값이 양자화 인덱스 0 으로 된다. 이것은, 기복을 갖지 않거나, 혹은 기복이 작고 평탄한 화상에 대해서는, 화상들이 상이한 화상이더라도, 특징 벡터들이 매우 유사하기 때문에 판별 능력이 낮아진다. 이와 같이, 2개의 추출 영역들의 평균 휘도값들 사이에 차이가 없다고 판정되고, 수많은 차원에서 양자화 인덱스가 0 이 되기 때문에 판별 능력이 낮아진다. 즉, 제 1 특징 벡터로서 다형상 영역 비교 특징량을 이용했을 경우, 유효성 수치화 수단 (131) 은, 예를 들어, 양자화 인덱스가 0 이 되는 차원의 수 (2개의 추출 영역들의 평균 휘도값들의 차이가 없다고 판정된 차원의 수) 를, 판별 능력의 정도를 나타내는 수치로서, 특징량 유형 정보 생성 수단 (132) 에 출력한다. 특징량 유형 정보 생성 수단 (132) 에서는, 양자화 인덱스가 0 이 되는 차원 (2개의 추출 영역의 평균 휘도값의 차이가 없으면 판정된 차원) 의 수가 임계치보다 큰 경우에는 제 1 특징 벡터는 유효성을 갖지 않고, 양자화 인덱스가 0 이 되는 차원의 수가 임계치보다 크지 않은 경우에는 제 1 특징 벡터는 유효성을 갖는다고 판정될 수 있다.
(3-2) 견고성의 정도를 나타내는 유효성 값
견고성의 정도를 나타내는 유효성 값으로서, 제 1 특징량 추출 수단 (110) 으로부터 출력된 제 1 특징량으로 구성되는 제 1 특징 벡터의 제 1 특징량을 소정의 방법에 의해 양자화함으로써 획득된 각 양자화 인덱스마다의 견고성의 값들의 평균값, 또는, 제 1 특징 벡터의 제 1 특징량들이 소정의 방법에 의해 양자화된 경우에 양자화 인덱스들이 소정의 임계치 이하 혹은 이상이 되는 차원의 수, 또는, 제 1 특징 벡터의 제 1 특징량들이 소정의 방법에 의해 양자화된 경우에 견고성을 갖지 않는 양자화 인덱스들이 생성되는 차원의 수를 이용할 수 있다. 이들은, 제 1 특징 벡터의 각각의 차원이 양자화 인덱스로 구성되는 양자화 인덱스 벡터인 경우, 각 양자화 인덱스마다의 견고성, 즉, 각종 개변 처리에 의해 양자화 인덱스들이 변화되지 않는 정도가 상이한 경우일 수도 있는 (양자화 인덱스들에 따라 견고성이 상이한) 경우에 주목한 방법이다.
각 양자화 인덱스마다의 견고성은, 예를 들어, 어느 학습 화상 그룹에 대해 각종 개변 처리를 적용하고, 각 양자화 인덱스들에 개변 처리를 수행한 후, 양자화 인덱스들이 변화되지 않는 비율 (개변 전과 개변 후가 일치하는 비율) 을 측정함으로써 획득될 수도 있다. 이러한 양자화 인덱스마다의 견고성은 유효성 수치화 수단 (131) 에 사전에 주어진다.
유효성 수치화 수단 (131) 은, 제 1 특징량 추출 수단 (110) 으로부터 출력된 제 1 특징량으로 구성되는 제 1 특징 벡터의 각 차원의 양자화 인덱스 및 주어진 양자화 인덱스마다의 견고성 (개변 후에 양자화 인덱스가 변화하지 않는 비율) 으로부터 제 1 특징 벡터의 각 차원의 견고성을 획득하고, 그 평균값을 견고성의 정도를 나타내는 값으로서 특징량 유형 정보 생성 수단 (132) 에 출력한다. 특징량 유형 정보 생성 수단 (132) 은, 이 견고성의 정도를 나타내는 평균값을 임계치와 비교하여, 이에 의해 제 1 특징 벡터의 견고성의 유무를 판정할 수 있다.
또한, 유효성 수치화 수단 (131) 은, 제 1 특징량 추출 수단 (110) 으로부터 출력된 제 1 특징량으로 구성되는 제 1 특징 벡터의 차원 가운데, 그 차원의 견고성이 임계치보다 큰 차원의 수 (임계치보다 큰 견고성의 양자화 인덱스들을 갖는 차원의 수) 를 획득하고, 그 차원의 수를 견고성의 정도를 나타내는 값으로서 특징량 유형 정보 생성 수단 (132) 에 출력할 수도 있다. 유효성 수치화 수단 (131) 은, 제 1 특징량 추출 수단 (110) 으로부터 출력된 제 1 특징량으로 구성되는 제 1 특징 벡터의 차원 가운데, 그 차원의 견고성이 임계치보다 작은 차원의 수 (임계치보다 작은 견고성의 양자화 인덱스들을 갖는 차원의 수) 를 획득하고, 그 차원수를 견고성의 정도를 나타내는 값으로서 특징량 유형 정보 생성 수단 (132) 에 출력할 수도 있다. 특징량 유형 정보 생성 수단 (132) 에서는, 이러한 견고성의 정도를 나타내는 값을 임계치와 비교하여, 이에 의해 제 1 특징 벡터의 견고성의 유무를 판정할 수 있다.
또한, 유효성 수치화 수단 (131) 은, 제 1 특징량 추출 수단 (110) 으로부터 출력된 제 1 특징량으로 구성되는 제 1 특징 벡터의 차원 가운데, 견고성을 갖지 않는 양자화 인덱스들이 되는 차원의 수 (견고성을 갖지 않는 양자화 인덱스들을 갖는 차원의 수) 를 획득하고, 그 차원의 수를 견고성의 정도를 나타내는 값으로서 특징량 유형 정보 생성 수단 (132) 에 출력할 수도 있다. 특징량 유형 정보 생성 수단 (132) 은, 이 견고성의 정도를 나타내는 값을 임계치와 비교하여, 이에 의해 제 1 특징 벡터의 견고성의 유무를 판정할 수 있다.
(3-3) 판별 능력 및 견고성의 정도를 나타내는 유효성 값
전술한 바와 같이 획득된 판별 능력의 정도를 나타내는 유효성 값과 견고성의 정도를 나타내는 유효성 값을 단순하게 가산함으로써 산출되는 값을 유효성 값으로서 사용하거나, 또는 값 {α×판별 능력의 정도를 나타내는 유효성 값 + (1-α) ×견고성의 정도를 나타내는 유효성 값} 를 유효성 값으로서 사용하는 것이 가능하다.
(4) 특징량 유형 정보 생성 수단 (132)
특징량 유형 정보 생성 수단 (132) 은, 유효성 수치화 수단 (131) 으로부터 공급되는 유효성의 정도를 나타내는 유효성 값을 임계치와 비교하여, 제 1 특징량 추출 수단 (110) 으로부터 공급되는 제 1 특징량으로 구성되는 제 1 특징 벡터의 유효성을 판정하고, 그 판정 결과에 따라 특징량 유형 정보를 생성하고, 이를 특징 벡터 생성 수단 (140) 에 출력한다.
특징량 유형 정보 생성 수단 (132) 이 제 1 특징 벡터가 유효성을 갖는다고 판정한 경우, 특징량 유형 정보 생성 수단 (132) 은 특징 벡터의 각 차원에 이용되는 특징량들의 유형을 제 1 특징량으로 규정한 사용 특징량 정보를 특징 벡터 생성 수단 (140) 에 출력한다.
특징량 유형 정보 생성 수단 (132) 은, 제 1 특징 벡터가 유효성을 갖지 않는다고 판정한 경우, 특징 벡터의 일부의 차원 또는 모든 차원에 이용되는 특징량의 유형을 제 2 특징량으로 규정하고 나머지의 차원에 이용되는 특징량의 유형을 제 1 특징량으로 규정한 사용 특징량 정보를, 특징 벡터 생성 수단 (140) 에 출력한다.
특징량 유형 정보 생성 수단 (132) 은, 제 1 특징 벡터가 유효성을 갖지 않는 경우, 제 2 특징량을 이용하는 차원을, 이하의 방법들 중 어느 하나에 의해 결정한다.
(4-1) 제 2 특징량을 이용하는 차원은, 예를 들어, 미리 고정된 방식으로 결정될 수도 있다. 이 경우, 예를 들어, 제 1 특징 벡터가 N차원으로 구성된다면, N차원 중 제 2 특징량을 이용하는 K차원 (K≤N) 의 정보 (차원을 특정하는 정보) 가, 미리 특징량 유형 정보 생성 수단 (132) 에 설정되어 있다. 특징량 유형 정보 생성 수단 (132) 은, 제 1 특징 벡터가 유효성을 갖지 않는다고 판정한 경우, 미리 설정된 제 2 특징량을 이용하는 차원을 규정하는 정보를 참조하여, 제 2 특징량을 이용하는 차원을 결정하고, 또한 이 결정된 차원 이외의 차원에 대해서는 제 1 특징량을 이용하여 결정한다. 또한, 예를 들어, 특징량 유형 정보 생성 수단 (132) 이 제 1 특징 벡터가 유효성을 갖지 않는다고 판정한 경우, 특징량 유형 정보 생성 수단 (132) 은 제 1 특징 벡터의 모든 차원에 대해 제 2 특징량을 이용하여 결정할 수도 있다.
(4-2) 또한, 제 2 특징량을 이용하는 차원은, 제 1 특징 벡터의 각 차원의 값에 기초하여 결정될 수도 있다. 구체적으로는, 제 1 특징량을 소정의 방법에 의해 양자화했을 경우에 소정의 양자화 인덱스가 획득되는지 아닌지에 따라 결정될 수도 있다. 예를 들어, 소정의 양자화 인덱스들이 되는 차원에 대해, 거기에 이용되는 특징량들의 유형을 제 2 특징량으로 설정하고 나머지의 차원에 이용되는 특징량들의 유형을 제 1 특징량으로 설정한다.
예를 들어, 제 1 특징 벡터로서 다형상 영역 비교 특징량이 이용된 경우, 양자화 인덱스가 0 인 차원에서는 제 2 특징량을 사용하고, 그 이외의 차원에 대해서는 제 1 특징량을 사용하면 결정될 수도 있다. 그 이유는, 다형상 영역 비교 특징량은, 차원에서의 특징량의 값이 양자화 인덱스 0 인 경우 (2개의 추출 영역의 평균 휘도값 사이에 차이가 없는 경우), 판별 능력에의 기여가 적기 때문이다.
(4-3) 또한, 제 2 특징량을 이용하는 차원은, 제 1 특징량을 소정의 방법에 의해 양자화했을 경우에 견고성이 낮아지는 양자화 인덱스로 되는지 아닌지에 따라 결정될 수 있다. 예를 들어, 견고성이 낮아지는 양자화 인덱스 (견고성이 임계치보다 낮은 양자화 인덱스) 로 되는 제 1 특징량의 차원에 대해서는, 거기에 이용되는 특징량의 유형을 제 2 특징량으로 설정하고 나머지의 차원에 이용되는 특징량의 유형을 제 1 특징량으로 설정한다.
(4-4) 상기 4-1 내지 4-3 에 기재된 방법들에서, 제 2 특징량을 이용하는 차원의 수는 제 1 특징 벡터의 유효성의 정도를 나타내는 값에 따라 결정 (유효성의 정도가 보다 낮은 만큼, 제 2 특징량이 보다 많은 차원에서 이용된다) 될 수도 있다.
예를 들어, 제 2 특징량을 이용하는 K차원 (K≤N) 이 고정된 방식으로 결정되는 4-1 에 기재된 방법에서, 제 1 특징 벡터의 유효성의 정도를 나타내는 수치에 따라, 최대 K차원로부터 최소 1차원까지의 범위 내에서, 제 2 특징량을 이용하는 차원의 수를 증가 또는 감소시킬 수도 있다.
또한, 제 1 특징량을 소정의 방법에 의해 양자화했을 경우에 소정의 양자화 인덱스로 되는 제 1 특징량을 갖는 차원에 대해 제 2 특징량을 이용하는 4-2 에 기재된 방법에서, 제 1 특징 벡터의 유효성을 나타내는 수치에 따라, 소정의 양자화 인덱스로 되는 제 1 특징량을 갖는 차원의 수로부터 최소 1차원까지의 범위 내에서, 제 2 특징량을 이용하는 차원의 수를 증가 또는 감소시킬 수도 있다.
또한, 제 1 특징량을 소정의 방법으로 양자화했을 경우에 견고성이 낮아지는 양자화 인덱스로 되는 제 1 특징량을 갖는 차원에 대해 제 2 특징량을 이용하는 4-3 에 기재된 방법에서, 제 1 특징 벡터의 유효성의 정도를 나타내는 수치에 따라, 견고성이 낮아지는 양자화 인덱스로 되는 제 1 특징량을 갖는 차원의 수로부터 최소 1차원까지의 범위 내에서, 제 2 특징량을 이용하는 차원의 수를 증가 도는 감소시킬 수도 있다.
(4-5) 상기 4-4 에 기재된 방법에서, 제 2 특징량을 이용하는 차원을 무작위로 선택하여 증가 또는 감소시키는 것이 아니라, 제 2 특징량을 이용하는 차원의 우선순위를 규정하는 우선순위 테이블을 특징량 유형 정보 생성 수단 (132) 에 설정하고, 특징량 유형 정보 생성 수단 (132) 은 우선순위 테이블을 참조하여 보다 상위의 우선순위의 차원으로부터 제 2 특징량을 이용하여 차원의 수를 결정하는 방식으로 차원을 결정하는 것도 또한 가능하다.
(4-6) 상기 4-1 에 기재된 방법에 의해 제 2 특징량을 이용하여 결정된 차원 가운데, 상기 4-2, 4-3, 및 4-4 중 어느 하나에 의해 결정된 차원을, 제 2 특징량을 이용하는 차원으로서 결정할 수도 있다. 예를 들어, 제 1 특징 벡터가, {차원 1 = 0, 차원 2 = 0, 차원 3 = +1, 차원 4 = -1, 차원 5 = 0, 차원 6 = -1, 차원 7 = 0, 차원 8 = 0, 차원 9 = 0, 차원 10 = 0} 이라고 가정한다. 또한, 상기 4-1 에서, 짝수 차원을 제 2 특징량을 이용하는 차원으로 하여 사전에 설정했다고 가정한다. 이 경우, 양자화 인덱스가 0 인 차원을 제 2 특징량을 사용하는 차원으로서 이용하는 상기 4-2 의 방법과 조합했을 경우, 양자화 인덱스가 0 인 짝수 차원, 즉 차원 2, 차원 8, 및 차원 10 이 제 2 특징량을 사용하는 차원으로서 결정된다.
(5) 특징 벡터 생성 수단 (140)
특징 벡터 생성 수단 (140) 은, 제 1 특징량 추출 수단 (110) 으로부터 차원마다의 제 1 특징량을 수신하고, 제 2 특징량 추출 수단 (120) 으로부터 차원마다의 제 2 특징량을 수신하고, 특징량 유형 정보 생성 수단 (132) 으로부터 특징량 유형 정보를 수신하고, 특징량 유형 정보가 제 1 특징량을 이용하는 것을 나타내는 차원은 제 1 특징량 추출 수단 (110) 으로부터 공급되는 제 1 특징량을 사용하고, 특징량 유형 정보가 제 2 특징량을 이용하는 것을 나타내는 차원은 제 2 특징량 추출 수단 (120) 으로부터 공급되는 제 2 특징량을 사용하여, 이에 의해 특징 벡터를 생성하고, 생성된 특징 벡터를 화상 시그너처로서 출력한다.
다음으로, 본 실시형태에 따른 화상 시그너처 추출 디바이스 (100) 의 동작을 도 3 의 흐름도를 참조하여 설명하기로 한다.
화상 시그너처 추출 디바이스 (100) 이 화상 시그너처를 추출하는 대상이 되는 화상을 도 1 에는 나타내지 않은 저장 수단 등으로부터 수신하는 경우, 우선, 제 1 특징량 추출 수단 (110) 은 그 화상으로부터 차원마다의 제 1 특징량을 추출한다 (단계 S101). 다음으로, 제 2 특징량 추출 수단 (110) 이 그 화상으로부터 차원마다의 제 2 특징량을 추출한다 (단계 S102).
다음으로, 특징량 유형 결정 수단 (130) 의 유효성 수치화 수단 (131) 은, 제 1 특징량 추출 수단 (110) 으로부터 추출된 차원마다의 제 1 특징량을 분석하고, 제 1 특징량으로 구성되는 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 생성한다 (단계 S103). 그 후, 특징량 유형 정보 생성 수단 (132) 이, 이 생성된 유효성 값을 임계치와 비교하여, 제 1 특징 벡터의 유효성의 유무를 판정하고, 그 판정 결과에 따라, 각 차원마다의 특징량으로서 제 1 특징량 또는 제 2 특징량 중 어느 쪽을 사용할 것인지를 지정한 특징량 유형 정보를 생성한다 (단계 S104).
마지막으로, 특징 벡터 생성 수단 (140) 이, 특징량 유형 정보가 제 1 특징량을 사용하도록 지정된 차원에 대해서는, 제 1 특징량 추출 수단 (110) 에 의해 추출된 제 1 특징량을 사용하고, 특징량 유형 정보가 제 2 특징량을 사용하도록 지정된 차원에 대해서는, 제 2 특징량 추출 수단 (120) 에 의해 추출된 제 2 특징량을 사용하여, 차원의 특징 벡터를 생성하고, 이를 화상 시그너처로서 도 1 에는 나타내지 않은 저장 수단 등에 출력한다 (단계 S105).
전술한 바와 같이 생성된 화상 시그너처 (특징 벡터) 는, 화상과 연관되어 관리되며, 화상을 식별하기 위해 (화상의 동일성을 판정하기 위해) 이용된다. 화상과 다른 화상 사이의 동일성을 판정하는 경우, 이들 2개의 화상에 대응하는 화상 시그너처들끼리 비교된다. 화상 시그너처들 사이의 비교는, 동일한 (대응하는) 차원마다의 특징량의 값을 비교하고 차원마다의 비교 결과를 조합함으로써 수행되어, 2개의 화상 시그너처들 사이의 동일성을 판정하는 스케일을 산출한다. 예를 들어, 특징량의 값 (양자화 인덱스) 이 일치하는 차원의 수를 유사도 (동일성 스케일) 로서 산출하고, 해밍 거리를 산출하고, 유클리드 거리를 산출하고, 또는 코사인 유사도 (내적) 를 산출하는 방법들에 의해 2개의 화상 시그너처의 동일성을 판정하는 스케일을 산출한다는 것을 의미한다. 이러한 방식으로 산출된 동일성 스케일을 임계치와 비교하여, 이에 의해 2개의 화상이 동일한지 여부를 판정할 수 있다.
전술한 바와 같이, 본 실시형태에 따르면, 화상 시그너처의 크기를 증가시키지 않고도, 식별될 수 없는 유형의 화상들을 감소시킬 수 있는 화상 시그너처를 추출할 수 있는 화상 시그너처 추출 디바이스를 제공하는 것이 가능하게 된다. 그 이유는 이하와 같다.
제 1 특징량을 분석하여, 제 1 특징량으로 구성되는 제 1 특징 벡터의 유효성의 유무를 판정하고, 유효성이 없다면, 즉, 이번 화상 시그너처 추출 대상인 화상이 제 1 특징량 추출 수단 (110) 에 의해 추출되는 유형의 특징량의 조합에 의해 판별될 수 없는 유형의 화상이라면, 적어도 일부의 차원에 이용되는 특징량의 유형은 제 1 특징량으로부터 제 2 특징량으로 변경된다. 이것은, 마치, 조합되는 특징량의 유형과 차원의 수의 증가에 실질적으로 대응한다. 그 결과, 제 1 특징량만으로 구성되는 제 1 특징 벡터로 식별될 수 없는 화상에 대해서, 그 화상을 식별할 수 있는 화상 시그너처를 획득할 수 있다. 이하에서, 보다 구체적으로 설명하기로 한다.
여기서, 화상 A, 화상 A', 및 화상 B 의 3개의 화상을 생각해본다. 화상 A' 는, 화상 A 에 대해 각종 개변 처리 (예를 들어, 화상 A 에 캡션을 중첩하고, 화상의 압축 형식을 변환하는 것) 를 가함으로써 형성된 화상이라고 가정한다. 화상 A 와 화상 A' 는 동일한 화상으로서 식별되어야 하는 대상인 화상 쌍이라고 가정한다. 화상 B 는 화상 A 와 화상 A' 와는 상이한 화상이지만 (다른 화상으로서 식별되어야 하는 대상인 화상 쌍이지만), 제 1 특징 벡터로서는 유사한 특징 벡터를 갖는 화상이라고 가정한다. 이것은, 화상 A (화상 A') 와 화상 B 사이에서, 제 1 특징 벡터에서는 판별 능력이 낮아질 것임을 의미한다.
이와 같이, 화상 A, 화상 A', 및 화상 B 에 대해 제 1 특징량 벡터를 추출하는 경우, 이들 특징 벡터가 유사하게 되어, 이에 의해 화상 A (화상 A') 와 화상 B를 판별할 수 없게 된다.
이 경우, 화상 A, 화상 A', 및 화상 B 에 본 실시형태를 적용하면, 제 1 특징 벡터의 유효성이 낮아지기 때문에, 모든 화상에서 특징 벡터의 적어도 일부의 차원의 특징량이 제 1 특징량으로부터 제 2 특징량으로 치환된다. 제 2 특징량은 제 1 특징량과 상이한 특징량이기 때문에, 적어도 일부의 차원의 특징량이 제 1 특징량으로부터 제 2 특징량으로 치환된 특징 벡터는, 그 유효성이 개선될 가능성이 상당히 존재한다. 화상 A (화상 A') 와 화상 B 는, 본래 상이한 화상이기 때문에, 제 2 특징량으로 특징량의 값을 치환하면, 특징 벡터는 상당히 상이하게 될 수도 있다. 한편, 화상 A 와 화상 A' 는, 본래 동일하기 때문에, 제 2 특징량으로 특징량의 값을 치환한 후에도, 유사한 특징 벡터가 생성된다.
이와 같이, 제 2 특징량으로 특징량의 값을 치환할 때, 동일한 화상은 여전히 유사한 특징 벡터를 가지는 한편, 상이한 화상은 분리되기에 충분히 상이한 특징 벡터를 갖는다. 따라서, 제 2 특징량에 의한 특징량의 값을 치환함으로써, 화상 시그너처 (특징 벡터) 의 성능을 향상시킬 수 있다.
다음으로, 화상 A (화상 A') 와 화상 B 와는 상이한 다른 화상 D 를 고려해 볼 수 있다. 이 화상 D 는, 제 1 특징 벡터가 높은 유효성을 가져서, 이 특징량을 제 2 특징량으로 치환할 필요가 없고, 이에 의해 제 1 특징 벡터가 그대로 출력되는 화상이라고 가정한다.
이제, 화상 A (화상 A') 및 화상 B 에 제 2 특징량에 의한 치환 처리를 수행함으로써, 화상 A (화상 A') 또는 화상 B 의 특징 벡터가, 치환 처리를 수행하지 않았던 화상 D 의 특징 벡터에, 우연히 유사하게 된 (근접하게 된) 경우가 존재할 수도 있다. 그러나, 치환 처리를 수행한 화상 A (화상 A') 또는 화상 B 의 특징 벡터 및 치환 처리를 수행하지 않은 화상 D 의 특징 벡터는, 본래 상이한 제 1 특징량과 제 2 특징량을 비교하는 방식으로 비교되기 때문에, 이것은 단순한 우연에 불과하며, 이러한 우연이 발생할 확률은 낮다. 이와 같이, 적어도 일부의 차원의 특징량을 제 1 특징량으로부터 제 2 특징량으로 치환함으로써 부작용이 발생할 가능성은 낮다.
[제 2 실시형태]
도 4 를 참조하면, 본 발명의 제 2 실시형태에 따른 화상 시그너처 추출 디바이스 (200) 는, 도 1 에 나타낸 화상 시그너처 추출 디바이스 (100) 와 비교할 때, 제 2 특징량 추출 수단 (120) 대신에 제 2 특징량 추출 수단 (121) 이 설치되어 있는 점, 및 특징량 유형 정보 생성 수단 (132) 으로부터 출력되는 특징량 유형 정보가 특징 벡터 생성 수단 (140) 뿐만 아니라 제 2 특징량 추출 수단 (121) 에도 공급된다는 점에서 상이하다.
제 2 특징량 추출 수단 (121) 은 화상 시그너처를 추출하는 대상인 화상을 수신하고, 특징량 유형 정보 생성 수단 (132) 으로부터 특징량 유형 정보가 공급되는 경우, 이 특징량 유형 정보가 제 2 특징량을 사용해야 하는 것으로 지정하는 차원에 있어서, 이들 차원에 대해 미리 결정된 제 2 특징량을 추출하고, 이를 특징 벡터 생성 수단 (140) 에 출력한다. 이와 같이, 제 2 특징량 추출 수단 (121) 은 제 2 특징량을 필요로 하는 차원에 대해서만 제 2 특징량을 추출한다는 점에서, 제 1 실시형태의 제 2 특징량 추출 수단 (120) 과 상이하다.
다음으로, 본 실시형태에 따른 화상 시그너처 추출 디바이스 (200) 의 동작을 도 5 의 흐름도를 참조하여 설명하기로 한다.
화상 시그너처 추출 디바이스 (200) 가 화상 시그너처를 추출하는 대상이 되는 화상을 도 4 에는 나타내지 않은 저장 수단 등으로부터 수신하는 경우, 우선, 제 1 특징량 추출 수단 (110) 이 그 화상으로부터 차원마다의 제 1 특징량을 추출한다 (단계 S201).
다음으로, 특징량 유형 결정 수단 (130) 의 유효성 수치화 수단 (131) 이, 제 1 특징량 추출 수단 (110) 으로부터 추출된 차원마다의 제 1 특징량을 분석하고, 제 1 특징량으로 구성되는 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 생성한다 (단계 S202). 그 후, 특징량 유형 정보 생성 수단 (132) 이, 이 생성된 유효성 값을 임계치와 비교하여, 제 1 특징 벡터의 유효성의 유무를 판정하고, 그 판정 결과에 따라, 차원마다의 특징량으로서 제 1 특징량 및 제 2 특징량 중 어느 쪽을 사용할 것인지를 지정한 특징량 유형 정보를 생성한다 (단계 S203).
그 후, 제 2 특징량 추출 수단 (121) 이, 특징량 유형 정보가 제 2 특징량을 사용하도록 지정하는 차원에 대해, 화상 시그너처를 추출하는 대상인 화상으로부터, 제 2 특징량을 추출한다 (단계 S204).
마지막으로, 특징 벡터 생성 수단 (140) 이, 특징량 유형 정보가 제 1 특징량을 사용하도록 지정한 차원에 대해서는, 제 1 특징량 추출 수단 (110) 에 의해 추출된 제 1 특징량을 사용하고, 특징량 유형 정보가 제 2 특징량을 사용하도록 지정한 차원에 대해서는, 제 2 특징량 추출 수단 (121) 에 의해 추출된 해당 차원의 제 2 특징량을 사용하여, 복수 차원에 대한 특징 벡터를 생성하고, 이를 화상 시그너처로서 도 4 에는 나타내지 않은 저장 수단 등에 출력한다 (단계 S205).
본 실시형태에 따르면, 제 1 실시형태와 동일한 유리한 효과를 달성할 수 있고, 또한 제 2 특징량 추출 수단 (121) 은 제 2 특징량을 필요로 하는 경우에 필요한 차원에 대해서만 제 2 특징량을 추출할 필요가 있기 때문에, 처리 비용을 절감할 수 있다.
[제 3 실시형태]
도 6 을 참조하면, 본 발명의 제 3 실시형태에 따른 화상 시그너처 추출 디바이스 (300) 는, 도 1 에 나타낸 화상 시그너처 추출 디바이스 (100) 와 비교할 때, 제 1 특징량 추출 수단 (110), 제 2 특징량 추출 수단 (120), 및 유효성 수치화 수단 (131) 대신에 제 1 특징량 추출 수단 (111), 제 2 특징량 추출 수단 (121), 유효성 수치화 수단 (133) 이 설치되어 있다는 점, 유효성 수치화 수단 (133) 에는 제 1 특징량 추출 수단에 의해 추출된 제 1 특징량 대신에 화상 시그너처를 추출하는 대상인 화상이 입력된다는 점, 및 특징량 유형 정보 생성 수단 (132) 으로부터 출력되는 특징량 유형 정보가 특징 벡터 생성 수단 (140) 이외에 제 1 특징량 추출 수단 (111) 및 제 2 특징량 추출 수단 (121) 에도 공급되고 있다는 점에서 상이하다.
유효성 수치화 수단 (133) 은, 화상을 분석하고, 그 화상으로부터 추출한 제 1 특징량으로 구성되는 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 출력한다. 제 1 실시형태에서는, 유효성 수치화 수단 (131) 은, 제 1 특징량 추출 수단 (110) 이 추출한 제 1 특징량을 분석하고, 제 1 특징 벡터의 유효성의 정도를 나타내는 수치를 생성했지만, 본 실시형태에서는, 유효성 수치화 수단 (133) 은 화상 자체로부터 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 생성한다.
유효성 수치화 수단 (133) 이, 화상 자체로부터, 제 1 특징 벡터의 유효성의 정도를 나타내는 수치를 생성하는 방법은, 제 1 특징 벡터의 유효성의 정도를 나타내는 수치를 생성할 수 있는 방법이라면 (즉, 실제로 제 1 특징 벡터를 추출하여 유효성의 정도를 나타내는 수치를 생성했을 경우와 상관성을 갖는 수치를 생성할 수 있는 방법이라면), 어떠한 방법이어도 상관없다.
예를 들어, 유효성 수치화 수단 (133) 은, 제 1 특징 벡터 그 자체가 아니어도, 더 단순한 방식으로 (더 낮은 처리 비용으로), 제 1 특징 벡터와의 동일한 상관성을 갖는 특징량, 또는 제 1 특징 벡터와의 높은 상관성을 갖는 특징량을 추출하고, 이들 특징에 기초하여 제 1 특징 벡터의 유효성의 정도를 나타내는 수치를 생성할 수도 있다.
또한, 예를 들어, 유효성 수치화 수단 (133) 은, 화상으로부터 제 1 특징 벡터가 발생할 확률을 추정하고, 그 확률의 값을 유효성의 정도를 나타내는 값으로서 출력할 수도 있다. 이 경우, 확률이 더 커짐에 따라, 유효성 (판별 능력) 의 정도는 더 낮아진다. 또한, 예를 들어, 빈출 화상 패턴 (사전에 주어짐) 및 공급되는 화상 사이의 유사도의 값을, 유효성의 정도를 나타내는 값으로서 출력할 수도 있다. 이 경우, 유사도가 커짐에 따라, 유효성 (판별 능력) 의 정도는 낮아진다.
또한, 예를 들어, 유효성 수치화 수단 (133) 은, 화상으로부터, 제 1 특징 벡터의 특징량의 견고성의 정도를 나타내는 유효성 값을 생성할 수도 있다. 예를 들어, 제 1 특징 벡터가 색상 (색 각도) 에 기초한 경우, 화상 자체로부터 화상의 채도에 대한 정보를 추출함으로써, 제 1 특징 벡터인 색상의 견고성의 정도를 추정할 수 있다. 이것은, 채도가 높은 경우, 색상 정보의 견고성 (신뢰도) 은 높아서, 제 1 특징 벡터의 견고성 (유효성) 은 높다는 것을 의미한다. 반대로, 채도가 낮은 경우, 색상 정보의 견고성 (신뢰도) 은 낮아서, 제 1 특징 벡터의 견고성 (유효성) 은 낮다고 판정된다. 이와 같이, 채도의 정도를 나타내는 값은, 제 1 특징 벡터를 구성하는 특징량의 견고성의 정도를 나타내는 유효성 값으로서 이용될 수 있다.
또한, 예를 들어, 유효성 수치화 수단 (133) 은, 제 1 특징 벡터가 다형상 영역 비교 특징량인 경우, 이하의 방식으로 화상으로부터 제 1 특징 벡터의 유효성의 정도를 나타내는 값을 생성할 수 있다.
(a) 화상으로부터, 제 1 특징 벡터의 모든 차원이 아니고, 일부의 차원만의 특징량을 추출하여, 제 1 특징 벡터의 (전체의) 유효성의 정도를 나타내는 값을 생성한다.
(b) 화상을, 다형상 영역 비교 특징량으로 이용되는 추출 영역보다 큰 추출 영역으로 분할하여, 그 추출된 특징량에 기초하여, 제 1 특징 벡터의 유효성의 정도를 나타내는 값을 생성한다.
(c) 화상으로부터, 양자화 인덱스 0 이 발생하는 정도를 추정하고, 제 1 특징 벡터의 유효성의 정도를 나타내는 값을 생성한다. 이 경우, 양자화 인덱스 0 이 발생하는 정도를 나타내는 수치가 클수록, 제 1 특징 벡터의 유효성은 낮아진다.
(d) 화상으로부터 화상의 평탄도 (기복이 없는 정도) 를 획득하고 이 평탄도를 제 1 특징 벡터의 유효성의 정도를 나타내는 값으로서 사용한다. 이 경우, 화상의 평탄도가 높을수록, 제 1 특징 벡터의 유효성이 낮은 것으로 판정된다.
제 1 특징량 추출 수단 (111) 은, 화상 시그너처를 추출하는 대상인 화상을 수신하고, 특징량 유형 정보 생성 수단 (132) 으로부터 특징량 유형 정보가 공급될 때, 이 특징량 유형 정보가 제 1 특징량을 사용하도록 지정한 차원에 대해서, 이들 차원에 대해 미리 규정된 제 1 특징량을 추출하고, 이를 특징 벡터 생성 수단 (140) 에 출력한다. 이와 같이, 제 1 특징량 추출 수단 (111) 은, 제 1 특징량을 필요로 하는 차원에 대해서만 제 1 특징량을 추출한다는 점에서, 제 1 실시형태의 제 1 특징량 추출 수단 (110) 과 상이하다.
제 2 특징량 추출 수단 (121) 은, 화상 시그너처를 추출하는 대상인 화상을 수신하고, 특징량 유형 정보 생성 수단 (132) 으로부터 특징량 유형 정보가 공급될 때, 이 특징량 유형 정보가 제 2 특징량을 사용하도록 지정한 차원에 대해서, 이들 차원에 대해 미리 규정된 제 2 특징량을 추출하고, 특징 벡터 생성 수단 (140) 에 출력한다. 이와 같이, 제 2 특징량 추출 수단 (121) 은, 제 2 특징량을 필요로 하는 차원에 대해서만 제 2 특징량을 추출한다는 점에서, 제 2 특징량 추출 수단 (120) 과 상이하다.
다음으로, 본 실시형태에 따라 화상 시그너처 추출 디바이스 (300) 의 동작을 도 7의 흐름도를 참조하여 설명하기로 한다.
화상 시그너처 추출 디바이스 (300) 가 화상 시그너처를 추출하는 대상인 화상을 도 6 에는 나타내지 않은 저장 수단 등에서 수신하면, 우선, 특징량 유형 결정 수단 (130) 의 유효성 수치화 수단 (133) 이 화상을 분석하고, 그 화상으로부터 추출되는 제 1 특징량으로 구성되는 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 생성한다 (단계 S301). 다음으로, 특징량 유형 정보 생성 수단 (132) 이, 이 생성된 유효성 값을 임계치와 비교하여, 제 1 특징 벡터의 유효성의 유무를 판정하고, 그 판정 결과에 따라, 차원마다의 특징량으로서 제 1 특징량 및 제 2 특징량 중 어느 쪽을 사용할 것인지를 지정한 특징량 유형 정보를 생성한다 (단계 S302).
그 후, 제 1 특징량 추출 수단 (111) 이 특징량 유형 정보가 제 1 특징량을 사용하도록 지정한 차원에 대해, 화상 시그너처 추출 대상인 화상으로부터 제 1 특징량을 추출한다 (단계 S303). 또한, 제 2 특징량 추출 수단 (121) 이, 특징량 유형 정보가 제 2 특징량을 사용하도록 지정한 차원에 대해, 화상 시그너처 추출 대상인 화상으로부터 제 2 특징량을 추출한다 (단계 S304).
마지막으로, 특징 벡터 생성 수단 (140) 이, 특징량 유형 정보에 있어 제 1 특징량을 사용하도록 지정한 차원에 대해서는, 제 1 특징량 추출 수단 (111) 에 의해 추출된 해당 차원의 제 1 특징량을 사용하고, 특징량 유형 정보가 제 2 특징량을 사용하도록 지정한 차원에 대해서는, 제 2 특징량 추출 수단 (121) 에 의해 추출된 해당 차원의 제 2 특징량을 사용하여, 차원의 특징 벡터를 생성하고, 이를 화상 시그너처로서 도 6 에는 나타내지 않은 저장 수단 등에 출력한다 (단계 S305).
본 실시형태에 따르면, 제 1 실시형태의 유리한 효과를 획득할 수 있을 뿐만 아니라, 이하의 유리한 효과를 달성할 수 있다.
화상으로부터 제 1 특징 벡터의 유효성의 유무를 판정할 수 있다. 특히, 제 1 특징 벡터 자체로부터 그 유효성을 판정할 수 없는 경우이더라도, 화상을 사용하여 그 유효성을 판정할 수 있는 경우가 있다. 이러한 경우, 본 실시형태가 유리한 효과를 발휘한다. 이하에서, 구체적인 예를 들어 설명하기로 한다.
예를 들어, 제 1 특징량의 다형상 영역 비교 특징량으로서, 각 차원에, 색상 성분 히스토그램을 양자화함으로써 획득된 것을 이용하는 것을 고려해본다. 색상 (H) 은 색 각도 (적색, 청색, 또는 황색과 같은 색의 방향을 나타냄) 이며, 색상 성분 히스토그램은 색상의 각도 구간마다의 출현 빈도를 나타낸다. 색상에 있어서, 채도 (S: 색의 선명함) 가 낮아지면 (원의 반경에 대응), 신뢰도 (즉 견고성) 가 낮아진다 (채도가 감소되면, 적색 방향도, 청색 방향도, 및 황색 방향도가 모두 회색에 근접한다). 이것은, 색상 정보의 견고성은, 색 정보로부터 판정될 수 없지만, 채도 정보를 이용하여 판정될 수 있다 (즉, 채도가 낮은 경우, 색상의 견고성은 낮다). 이와 같이, 색 성분 히스토그램을 양자화함으로써 획득된 것을 제 1 특징 벡터로서 이용한 경우, 그 유효성은 제 1 특징 벡터 자체로부터는 판정될 수 없다. 반면, 각 차원마다, 화상으로부터, 각 차원의 추출 영역으로부터, 예를 들어 채도 (S) 의 평균값을 산출하고, 그 크기에 기초하여, 차원마다의 제 1 특징량의 유효성을 판정할 수 있다. 이것들을 차원 전체에 대해 총합하는 경우, 제 1 특징 벡터 전체적으로의 유효성을 판정할 수 있다.
또한, 본 실시형태에 따르면, 제 1 특징량 추출 수단 (111) 은 제 1 특징량을 필요로 하는 경우에 필요한 차원에 대해 제 1 특징량을 추출할 필요가 있기 때문에, 처리 비용을 감소시킬 수 있다. 이러한 처리 비용의 절감을 필요로 하지 않는 경우에는, 제 1 특징량 추출 수단 (111) 을 제 1 실시형태에서 사용된 제 1 특징량 추출 수단 (110) 으로 치환할 수도 있다.
또한, 본 실시형태에 따르면, 제 2 특징량 추출 수단 (121) 은 제 2 특징량을 필요로 하는 경우에 필요한 차원에 대해 제 2 특징량을 추출할 필요가 있기 때문에, 처리 비용을 절감할 수 있다. 처리 비용의 절감을 필요로 하지 않는 경우에는, 제 2 특징량 추출 수단 (121) 을 제 1 실시형태에서 사용된 제 2 특징량 추출 수단 (120) 으로 치환할 수도 있다.
[제 4 실시형태]
도 8 을 참조하면, 본 발명의 제 4 실시형태에 따른 화상 시그너처 추출 디바이스 (400) 는, 도 1 에 나타낸 화상 시그너처 추출 디바이스 (100) 와 비교할 때, 제 2 특징량 추출 수단 (120) 과 유효성 수치화 수단 (131) 대신에 제 2 특징량 추출 수단 (121) 과 유효성 수치화 수단 (134) 이 설치되어 있다는 점, 유효성 수치화 수단 (134) 에는 제 1 특징량 추출 수단 (110) 에 의해 추출된 제 1 특징량과 화상 시그너처를 추출하는 대상인 화상이 입력된다는 점, 및 특징량 유형 정보 생성 수단 (132) 으로부터 출력되는 특징량 유형 정보가 특징 벡터 생성 수단 (140) 이외에 제 2 특징량 추출 수단 (121) 에도 공급되고 있다는 점에서 상이하다.
유효성 수치화 수단 (134) 은, 화상 및 그 화상으로부터 제 1 특징량 추출 수단 (110) 에 의해 추출된 제 1 특징량을 분석하고, 화상으로부터 추출된 제 1 특징량으로 구성되는 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 출력한다. 예를 들어, 유효성 수치화 수단 (134) 은, 도 1 에서의 유효성 수치화 수단 (131) 에서 사용되는 바와 동일한 방법을 이용하여, 제 1 특징량 추출 수단 (110) 에 의해 추출된 제 1 특징량으로부터 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 생성한다. 또한, 유효성 수치화 수단 (134) 은, 도 6 의 유효성 수치화 수단 (133) 에서 사용되는 바와 동일한 방법을 이용하여, 화상으로부터 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 생성한다. 그 후, 유효성 수치화 수단 (134) 은, 제 1 특징 벡터로부터 생성된 유효성의 정도를 나타내는 유효성 값과 화상으로부터 생성된 유효성의 정도를 나타내는 유효성 값을 조함함으로써, 유효성 값을 생성하고, 이를 특징량 유형 정보 생성 수단 (132) 에 출력한다.
제 1 특징 벡터로부터 생성된 유효성의 정도를 나타내는 유효성 값과 화상으로부터 생성된 유효성의 정도를 나타내는 유효성 값의 조합은, 양자의 평균값을 산출하고, 양자를 가중치 산정함으로써 이를 산출하고, 양자 중 최소값 혹은 최대값을 선택하는 방법에 의해 수행될 수도 있다.
제 2 특징량 추출 수단 (121) 은, 화상 시그너처를 추출하는 대상인 화상을 수신하고, 특징량 유형 정보 생성 수단 (132) 으로부터 특징량 유형 정보가 공급될 때, 이 특징량 유형 정보가 제 2 특징량을 사용하도록 지정한 차원에 대해 미리 결정된 제 2 특징량을 추출하고, 이들을 특징 벡터 생성 수단 (140) 에 출력한다. 이와 같이, 제 2 특징량 추출 수단 (121) 은, 제 2 특징량을 필요로 하는 차원에 대해서만 제 2 특징량을 추출한다는 점에서, 제 2 특징량 추출 수단 (120) 과 상이하다.
다음으로, 본 실시형태에 따른 화상 시그너처 추출 디바이스 (400) 의 동작을 도 9 의 흐름도를 참조하여 설명하기로 한다.
화상 시그너처 추출 디바이스 (400) 가 화상 시그너처를 추출하는 대상이 되는 화상을 도 8 에는 나타내지 않은 저장 수단 등으로부터 수신하는 경우, 우선, 제 1 특징량 추출 수단 (110) 이 그 화상으로부터 차원마다의 제 1 특징량을 추출한다 (단계 S401).
다음으로, 특징량 유형 결정 수단 (130) 의 유효성 수치화 수단 (134) 이, 화상 및 제 1 특징량 추출 수단 (110) 에 의해 추출된 제 1 특징량을 분석하고, 화상으로부터 추출되는 제 1 특징량에 의해 구성되는 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 생성한다 (단계 S402). 그 후, 특징량 유형 정보 생성 수단 (132) 이, 이 생성된 유효성 값을 임계치와 비교하여, 제 1 특징 벡터의 유효성의 유무를 판정하고, 그 판정 결과에 따라, 차원마다의 특징량으로서 제 1 특징량 또는 제 2 특징량 중 어느 쪽을 사용할 것인지를 지정하는 특징량 유형 정보를 생성한다 (단계 S403).
그 후, 제 2 특징량 추출 수단 (121) 이, 특징량 유형 정보가 제 2 특징량을 사용하도록 지정한 차원에 대해, 화상 시그너처를 추출하는 대상인 화상으로부터 제 2 특징량을 추출한다 (단계 S404).
마지막으로, 특징 벡터 생성 수단 (140) 이, 특징량 유형 정보가 제 1 특징량을 사용하도록 지정한 차원에 대해서는, 제 1 특징량 추출 수단 (110) 에 의해 추출된 제 1 특징량을 사용하고, 특징량 유형 정보가 제 2 특징량을 사용하도록 지정한 차원에 대해서는, 제 2 특징량 추출 수단 (121) 에 의해 추출된 제 2 특징량을 사용하여, 차원의 특징 벡터를 생성하고, 이를 화상 시그너처로서 도 8 에 나타내지 않은 저장 수단 등에 출력한다 (단계 S405).
본 실시형태에 따르면, 제 1 실시형태의 유리한 효과 외에도, 이하의 유리한 효과를 달성하는 것이 가능하게 된다.
화상 및 그 화상으로부터 추출된 제 1 특징량으로 구성되는 제 1 특징 벡터로부터 제 1 특징 벡터의 유효성을 판정하기 때문에, 제 1 특징 벡터 자체로부터 그 유효성을 판정할 수 없는 경우에서도 화상을 사용하면 그 유효성을 판정할 수 있는 경우, 및 화상 자체로부터 그 유효성을 판정할 수 없더라도 제 1 특징 벡터를 사용하면 그 유효성을 판정할 수 있는 경우인 양방 모두에 있어서, 제 1 특징 벡터의 유효성이 판정될 수 있다.
또한, 본 실시형태에 따르면, 제 2 특징량 추출 수단 (121) 은 제 2 특징량을 필요로 하는 경우에만 필요한 차원에 대해 제 2 특징량을 추출할 필요가 있기 때문에, 처리 비용을 절감하는 것이 가능하게 된다. 이러한 처리 비용을 절감할 필요가 없는 경우에는, 제 2 특징량 추출 수단 (121) 을 제 1 실시형태에서 사용한 제 2 특징량 추출 수단 (120) 으로 치환할 수도 있다.
[제 5 실시형태]
도 10 을 참조하면, 본 발명의 제 5 실시형태에 따른 화상 시그너처 추출 디바이스 (500) 는, 도 1 에 나타낸 화상 시그너처 추출 디바이스 (100) 와 비교할 때, 특징 벡터 생성 수단 (140) 대신에 특징 벡터 생성 수단 (141) 이 설치되어 있다는 점, 및 유효성 재판정 수단 (150) 이 부가되어 있다는 점에서 상이하다.
특징 벡터 생성 수단 (141) 은, 제 1 특징량 추출 수단 (110) 으로부터 차원마다의 제 1 특징량을 수신하고, 제 2 특징량 추출 수단 (120) 으로부터 차원마다의 제 2 특징량을 수신하고, 특징량 유형 정보 생성 수단 (132) 으로부터 특징량 유형 정보를 수신하고, 이 특징량 유형 정보가 제 1 특징량을 이용하는 것을 나타내는 차원에 대해 제 1 특징량 추출 수단 (110) 으로부터 공급되는 제 1 특징량을 사용하고, 특징량 유형 정보가 제 2 특징량을 이용하는 것을 나타내는 차원에 대해 제 2 특징량 추출 수단 (120) 으로부터 공급되는 제 2 특징량을 사용하여, 특징 벡터를 생성한다. 생성된 특징 벡터가 제 1 특징량으로만 구성되어 있으면, 특징 벡터 생성 수단 (141) 은 생성된 특징 벡터를 화상 시그너처로서 출력한다.
한편, 생성한 특징 벡터가 제 2 특징량을 포함한다면, 즉, 제 1 특징량으로만 구성되는 제 1 특징 벡터가 유효성을 갖지 않고, 판정된 결과, 적어도 일부의 차원의 제 1 특징량을 제 2 특징량으로 치환한 특징 벡터 (이하, 제 2 특징 벡터로 지칭함) 를 생성했을 경우, 특징 벡터 생성 수단 (141) 은 제 2 특징 벡터를 유효성 재판정 수단 (150) 으로 전달하여, 유효성 재판정 수단 (150) 으로 하여금 제 2 특징 벡터의 유효성의 판정하게 한다. 그 후, 특징 벡터 생성 수단 (141) 은 유효성 재판정 수단 (150) 으로부터 제 2 특징 벡터의 유효성의 판정 결과를 수신하고, 판정 결과가 제 2 특징 벡터가 유효성을 갖는 것으로 나타나면, 제 2 특징 벡터를 화상 시그너처로서 출력한다. 반대로, 판정 결과가 제 2 특징 벡터가 유효성을 갖지 않는 것으로 나타나면, 특징 벡터 생성 수단 (141) 은 제 1 특징 벡터를 화상 시그너처로서 출력한다.
유효성 재판정 수단 (150) 은, 제 2 특징 벡터를 분석하고, 제 2 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 생성하고, 이 유효성 값을 임계치와 비교하여, 제 2 특징 벡터의 유효성의 유무를 판정한다. 제 2 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 생성하는 방법으로서는, 유효성 수치화 수단 (131) 에 의해, 제 1 특징 벡터를 분석함으로써 제 1 특징 벡터의 유효성의 정도를 나타내는 유효성 값을 생성하도록 사용되는 방법과 동일한 방법이 이용될 수도 있다.
다음으로, 본 실시형태에 따른 화상 시그너처 추출 디바이스 (500) 의 동작을 도 11 의 흐름도를 참조하여 설명하기로 한다.
화상 시그너처 추출 디바이스 (500) 가 화상 시그너처를 추출하는 대상이 되는 화상을 도 10 에는 나타내지 않은 저장 수단 등으로부터 수신하는 경우, 우선, 화상 시그너처 추출 디바이스 (500) 는, 제 1 특징량 추출 수단 (110), 제 2 특징량 추출 수단 (120), 특징량 유형 결정 수단 (130) 및 특징 벡터 생성 수단 (141) 을 이용하여, 화상의 특징 벡터를 생성한다 (단계 S501). 이 단계 S501 은, 도 3 에서의 단계 S101 내지 S105 에 대응한다. 그러나, 특징 벡터를 즉시 화상 시그너처로서 출력하지 않고, 이하의 처리가 순차적으로 수행된다.
우선, 특징 벡터 생성 수단 (141) 은 생성된 특징 벡터가 제 1 특징 벡터인지 여부를 판정한다 (단계 S502). 이것이 제 1 특징 벡터라면, 특징 벡터 생성 수단 (141) 은 이를 화상 시그너처로서 출력한다 (단계 S505).
생성된 특징 벡터가 제 1 특징 벡터가 아니고 제 2 특징 벡터라면, 유효성 재판정 수단 (150) 은 제 2 특징 벡터의 유효성의 유무를 판정한다 (단계 S503, S504). 그 결과, 제 2 특징 벡터가 유효성을 갖는 경우, 특징 벡터 생성 수단 (141) 은 제 2 특징 벡터를 화상 시그너처로서 출력한다 (단계 S506).
한편, 이 특징 벡터가 유효성을 갖지 않는다면, 특징 벡터 생성 수단 (141) 은 제 1 특징 벡터를 화상 시그너처로서 출력한다 (단계 S505). 제 1 특징 벡터 및 제 2 특징 벡터의 양방 모두 유효성을 갖지 않기 때문에 제 2 특징 벡터를 출력해도 되겠지만, 제 2 특징 벡터는 그 적어도 일부의 차원이 제 2 특징량으로 치환되므로, 이러한 치환이 수행되지 않은 제 1 특징 벡터가 출력된다. 제 1 특징 벡터 및 제 2 특징 벡터의 양방 모두가 유효성을 갖지 않는 경우, 이러한 유효성의 정도를 나타내는 수치를 비교하고, 유효성의 정도가 더 높은 정도를 갖는 것을 화상 시그너처로서 출력하는 것도 또한 가능하다.
본 실시형태에 따르면, 제 1 실시형태의 유리한 효과 외에도, 이하의 유리한 효과를 달성할 수 있다.
유효성이 없다면 판정된 제 1 특징 벡터의 적어도 일부의 차원을 제 2 특징량으로 치환한 제 2 특징 벡터에 대해, 제 2 특징 벡터가 유효성을 갖는지 여부를 판정하고, 유효성이 있는 경우 혹은 유효성이 개선되고 있는 경우에만, 제 2 특징 벡터를 화상 시그너처로서 출력할 수 있다. 이에 의해, 제 1 특징 벡터의 유효성보다 그 유효성이 개선되지 않은 제 2 특징 벡터로부터 화상 시그너처가 생성되는 것을 억제하는 것이 가능하게 된다.
본 실시형태의 화상 시그너처 추출 디바이스 (500) 는, 제 1 실시형태의 화상 시그너처 추출 디바이스 (100) 에 대해서 유효성 재판정 수단 (150) 을 부가한 것이지만, 제 2 실시형태, 제 3 실시형태, 또는 제 4 실시형태의 화상 시그너처 추출 디바이스 (200, 300, 또는 400) 에 대해서 유효성 재판정 수단 (150) 도 또한 부가될 수도 있다는 점에 유의해야 한다.
이상, 본 발명의 실시형태에 대해 설명했지만, 본 발명은 이들 예에 한정되는 것은 아니며, 여기서 각종 부가형태 및 변형형태들이 이루어질 수도 있다. 또한, 본 발명의 화상 시그너처 추출 디바이스는, 그 기능들을 하드웨어적으로 실현되는 것은 물론, 컴퓨터와 프로그램으로 실현될 수 있도록 구성된다. 이러한 프로그램은, 자기 디스크, 반도체 메모리 등과 같은 컴퓨터 판독가능 기록 매체에 기록되고, 예를 들어 컴퓨터의 시작시에 컴퓨터에 의해 판독되고, 그 컴퓨터의 동작을 제어하는 형식으로 설치되어, 이에 의해 그 컴퓨터를 전술한 실시형태들의 화상 시그너처 추출 디바이스로서 기능할 수 있게 한다.
본 발명은, 일본에서 2009년 1월 23일에 특허출원된 일본 특허출원 제 2009-12813 호에 기초하여 우선권 주장의 이익을 향유하는 것이며, 해당 특허 출원에 기재된 내용은 모두 본 명세서에 통합되어 있다.
100, 200, 300, 400, 500: 화상 시그너처 추출 디바이스
110, 111: 제 1 특징량 추출 수단
120, 121: 제 2 특징량 추출 수단
130: 특징량 유형 결정 수단
131, 133, 134: 유효성 수치화 수단
132: 특징량 유형 정보 생성 수단
140, 141: 특징 벡터 생성 수단
150: 유효성 재판정 수단

Claims (29)

  1. 화상으로부터, 특징 벡터의 각 차원에 대응하고 상기 화상으로부터 추출된 물리량을 양자화함으로써 획득된 양자화값인 제 1 특징량을 추출하는 제 1 특징량 추출 수단;
    상기 화상으로부터, 상기 특징 벡터의 각 차원에 대응하는 제 1 특징량과는 상이한 제 2 특징량을 추출하는 제 2 특징량 추출 수단;
    상기 화상 및 상기 추출된 제 1 특징량 중 적어도 일방을 분석 대상으로서 분석하여, 상기 추출된 제 1 특징량으로 구성되는 특징 벡터가 화상을 판별함에 있어서 유효성을 갖는지 여부를 판정하고, 상기 특징 벡터가 유효성을 갖는 경우에는 각 차원에 이용되는 특징량의 유형을 상기 제 1 특징량으로 결정하지만, 유효성을 갖지 않는 경우에는 상기 제 1 특징량이 미리 결정된 양자화값인 차원 각각에 이용되는 특징량의 유형을 상기 제 2 특징량으로 결정하고, 나머지의 차원 각각에 이용되는 특징량의 유형을 상기 제 1 특징량으로 결정하는 특징량 유형 결정 수단; 및
    상기 결정된 각 차원에 이용되는 특징량의 유형에 따라, 상기 추출된 제 1 특징량 및 상기 추출된 제 2 특징량으로부터 상기 화상의 특징 벡터를 생성하는 특징 벡터 생성 수단을 포함하는, 화상 시그너처 추출 디바이스.
  2. 제 1 항에 있어서,
    상기 특징량 유형 결정 수단은, 상기 분석 대상을 분석하고, 상기 추출된 제 1 특징량으로 구성되는 특징 벡터의 유효성의 정도를 유효성 값으로서 산출하고, 상기 유효성 값을 임계치와 비교하여 상기 특징 벡터의 유효성의 유무를 판정하고, 상기 판정 결과에 따라 각 차원에 이용되는 상기 특징량의 유형을 결정하는, 화상 시그너처 추출 디바이스.
  3. 제 2 항에 있어서,
    상기 특징량 유형 결정 수단은, 상기 유효성 값으로서 상기 제 1 특징량으로 구성되는 특징 벡터의, 상이한 화상을 판별하는 정도를 나타내는 판별 능력을 수치화하는, 화상 시그너처 추출 디바이스.
  4. 제 2 항에 있어서,
    상기 특징량 유형 결정 수단은, 상기 유효성 값으로서 상기 제 1 특징량으로 구성되는 특징 벡터의, 화상에 대한 각종 개변 처리에 의해 특징량의 값이 변화되지 않는 정도를 나타내는 견고성 (robustness) 을 수치화하는, 화상 시그너처 추출 디바이스.
  5. 삭제
  6. 삭제
  7. 제 2 항 또는 제 3 항에 있어서,
    상기 특징량 유형 결정 수단은, 상기 제 1 특징량이 상기 화상으로부터 추출된 물리량을 양자화함으로써 획득된 양자화값인 경우, 상기 제 1 특징량으로 구성되는 상기 특징 벡터의 미리 결정된 양자화값을 갖는 차원의 수를, 상기 유효성 값으로서 이용하는, 화상 시그너처 추출 디바이스.
  8. 제 2 항 또는 제 4 항에 있어서,
    상기 특징량 유형 결정 수단은, 상기 제 1 특징량이 상기 화상으로부터 추출된 물리량을 양자화함으로써 획득된 양자화값인 경우, 미리 설정된 각 양자화값마다의, 화상에 대한 각종 개변 처리에 의해 양자화값이 변화되지 않는 정도를 나타내는 견고성의 값에 기초하여, 상기 제 1 특징량으로 구성되는 상기 특징 벡터의 견고성을 나타내는 수치를 산출하고, 상기 산출된 수치를 상기 유효성 값으로서 이용하는, 화상 시그너처 추출 디바이스.
  9. 제 8 항에 있어서,
    상기 특징량 유형 결정 수단은, 상기 주어진 각 양자화값마다의 견고성의 값들의 평균값을, 상기 유효성 값으로서 이용하는, 화상 시그너처 추출 디바이스.
  10. 삭제
  11. 삭제
  12. 제 4 항에 있어서,
    상기 특징량 유형 결정 수단은, 상기 유효성 값에 기초하여, 제 2 특징량을 이용하는 차원의 수를 결정하는, 화상 시그너처 추출 디바이스.
  13. 제 12 항에 있어서,
    상기 특징량 유형 결정 수단은, 상기 제 2 특징량을 이용하는 차원의 우선순위를 규정하는 우선순위 테이블을 가지며, 상기 우선순위 테이블을 참조하여, 보다 상위의 우선순위의 차원으로부터 시작하여, 상기 제 2 특징량을 이용하도록 결정된 차원의 수로 상기 제 2 특징량을 이용하는 차원을 선택하는, 화상 시그너처 추출 디바이스.
  14. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 제 1 특징량 및 상기 제 2 특징량은, 상기 화상의 에지에 관한 정보 및 상기 화상의 색에 관한 정보인, 화상 시그너처 추출 디바이스.
  15. 화상으로부터, 특징 벡터의 각 차원에 대응하고 상기 화상으로부터 추출된 물리량을 양자화함으로써 획득된 양자화값인 제 1 특징량을 추출하는 단계;
    상기 화상으로부터, 상기 특징 벡터의 각 차원에 대응하는 제 1 특징량과는 상이한 제 2 특징량을 추출하는 단계;
    상기 화상 및 상기 추출된 제 1 특징량 중 적어도 일방을 분석 대상으로서 분석하여, 상기 추출된 제 1 특징량으로 구성되는 특징 벡터가 화상을 판별함에 있어서 유효성을 갖는지 여부를 판정하고, 상기 특징 벡터가 유효성을 갖는 경우에는 각 차원에 이용되는 특징량의 유형을 상기 제 1 특징량으로 결정하고, 상기 특징 벡터가 유효성을 갖지 않는 경우에는 상기 제 1 특징량이 미리 결정된 양자화값인 차원 각각에 이용되는 특징량의 유형을 상기 제 2 특징량으로 결정하고, 나머지의 차원에 이용되는 특징량의 유형을 상기 제 1 특징량으로 결정하는 단계; 및
    상기 결정된 각 차원에 이용되는 특징량의 유형에 따라, 상기 추출된 제 1 특징량 및 상기 추출된 제 2 특징량으로부터 상기 화상의 특징 벡터를 생성하는 단계를 포함하는, 화상 시그너처 추출 방법.
  16. 제 15 항에 있어서,
    각 차원에 이용되는 특징량의 유형을 결정하는 단계는, 상기 분석 대상을 분석하고, 상기 추출된 제 1 특징량으로 구성되는 특징 벡터의 유효성의 정도를 유효성 값으로서 산출하고, 상기 유효성 값을 임계치와 비교하여 상기 특징 벡터의 유효성의 유무를 판정하고, 상기 판정 결과에 따라 각 차원에 이용되는 상기 특징량의 유형을 결정하는 단계를 포함하는, 화상 시그너처 추출 방법.
  17. 제 16 항에 있어서,
    각 차원에 이용되는 특징량의 유형을 결정하는 단계는, 상기 유효성 값으로서 상기 제 1 특징량으로 구성되는 특징 벡터의, 다른 화상을 식별할 수 있는 정도를 나타내는 판별 능력을 수치화하는 단계를 포함하는, 화상 시그너처 추출 방법.
  18. 제 16 항에 있어서,
    각 차원에 이용되는 특징량의 유형을 결정하는 단계는, 상기 유효성 값으로서, 상기 제 1 특징량으로 구성되는 특징 벡터의, 화상에 대한 각종 개변 처리에 의해 특징량의 값이 변화되지 않는 정도를 나타내는 견고성을 수치화하는 단계를 포함하는, 화상 시그너처 추출 방법.
  19. 삭제
  20. 삭제
  21. 제 16 항 또는 제 17 항에 있어서,
    각 차원에 이용되는 특징량의 유형을 결정하는 단계는, 상기 제 1 특징량이 상기 화상으로부터 추출된 물리량을 양자화함으로써 획득된 양자화값인 경우, 상기 제 1 특징량으로 구성되는 상기 특징 벡터의 미리 결정된 양자화값을 갖는 차원의 수를, 상기 유효성 값으로서 이용하는 단계를 포함하는, 화상 시그너처 추출 방법.
  22. 제 16 항 또는 제 18 항에 있어서,
    각 차원에 이용되는 특징량의 유형을 결정하는 단계는, 상기 제 1 특징량이 상기 화상으로부터 추출된 물리량을 양자화함으로써 획득된 양자화값인 경우, 미리 설정된 각 양자화값마다의, 화상에 대한 각종 개변 처리에 의해 양자화값이 변화되지 않는 정도를 나타내는 견고성의 값에 기초하여, 상기 제 1 특징량으로 구성되는 상기 특징 벡터의 견고성을 나타내는 수치를 산출하고, 상기 산출된 수치를 상기 유효성 값으로서 이용하는 단계를 포함하는, 화상 시그너처 추출 방법.
  23. 제 22 항에 있어서,
    각 차원에 이용되는 특징량의 유형을 결정하는 단계는, 각각의 주어진 양자화값마다의 견고성의 값들의 평균값을, 상기 유효성 값으로서 이용하는 단계를 포함하는, 화상 시그너처 추출 방법.
  24. 삭제
  25. 삭제
  26. 제 18 항에 있어서,
    각 차원에 이용되는 특징량의 유형을 결정하는 단계는, 상기 유효성 값에 기초하여, 제 2 특징량을 이용하는 차원의 수를 결정하는, 화상 시그너처 추출 방법.
  27. 제 26 항에 있어서,
    상기 제 2 특징량을 이용하는 차원의 우선순위를 규정하는 우선순위 테이블이 제공되며,
    각 차원에 이용되는 특징량의 유형을 결정하는 단계는, 상기 우선순위 테이블을 참조하여, 보다 상위의 우선순위의 차원으로부터 시작하여, 상기 제 2 특징량을 이용하도록 결정된 차원의 수로, 상기 제 2 특징량을 이용하는 차원을 선택하는 단계를 포함하는, 화상 시그너처 추출 방법.
  28. 제 15 항 내지 제 18 항 중 어느 한 항에 있어서,
    상기 제 1 특징량 및 상기 제 2 특징량은, 상기 화상의 에지에 관한 정보 및 상기 화상의 색에 관한 정보인, 화상 시그너처 추출 방법.
  29. 컴퓨터로 하여금,
    화상으로부터, 특징 벡터의 각 차원에 대응하고 상기 화상으로부터 추출된 물리량을 양자화함으로써 획득된 양자화값인 제 1 특징량을 추출하는 제 1 특징량 추출 수단;
    상기 화상으로부터, 상기 특징 벡터의 각 차원에 대응하는 제 1 특징량과는 상이한 제 2 특징량을 추출하는 제 2 특징량 추출 수단;
    상기 화상 및 상기 추출된 제 1 특징량 중 적어도 일방을 분석 대상으로서 분석하여, 상기 추출된 제 1 특징량으로 구성되는 특징 벡터가 화상을 판별함에 있어서 유효성을 갖는지 여부를 판정하고, 상기 특징 벡터가 유효성을 갖는 경우에는 각 차원에 이용되는 특징량의 유형을 상기 제 1 특징량으로 결정하고, 상기 특징 벡터가 유효성을 갖지 않는 경우에는 상기 제 1 특징량이 미리 결정된 양자화값인 차원 각각에 이용되는 특징량의 유형을 상기 제 2 특징량으로 결정하고, 나머지의 차원 각각에 이용되는 특징량의 유형을 상기 제 1 특징량으로 결정하는 특징량 유형 결정 수단; 및
    상기 결정된 각 차원에 이용되는 특징량의 유형에 따라, 상기 추출된 제 1 특징량 및 상기 추출된 제 2 특징량으로부터 상기 화상의 특징 벡터를 생성하는 특징 벡터 생성 수단으로서 기능하게 하는, 프로그램을 저장한 컴퓨터 판독가능 저장매체.
KR1020117017243A 2009-01-23 2010-01-14 화상 시그너처 추출 디바이스 KR101322524B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009012813 2009-01-23
JPJP-P-2009-012813 2009-01-23
PCT/JP2010/000156 WO2010084713A1 (ja) 2009-01-23 2010-01-14 画像識別子抽出装置

Publications (2)

Publication Number Publication Date
KR20110103437A KR20110103437A (ko) 2011-09-20
KR101322524B1 true KR101322524B1 (ko) 2013-10-28

Family

ID=42355772

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117017243A KR101322524B1 (ko) 2009-01-23 2010-01-14 화상 시그너처 추출 디바이스

Country Status (6)

Country Link
US (1) US8170341B2 (ko)
EP (1) EP2383697A4 (ko)
JP (1) JP4831255B2 (ko)
KR (1) KR101322524B1 (ko)
CN (1) CN102292746B (ko)
WO (1) WO2010084713A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8744193B2 (en) * 2009-03-13 2014-06-03 Nec Corporation Image signature extraction device
US9015741B2 (en) 2009-04-17 2015-04-21 Gracenote, Inc. Method and system for remotely controlling consumer electronic devices
US8863165B2 (en) 2010-11-01 2014-10-14 Gracenote, Inc. Method and system for presenting additional content at a media system
US8786785B2 (en) * 2011-04-05 2014-07-22 Microsoft Corporation Video signature
JP5822411B2 (ja) 2013-08-12 2015-11-24 株式会社アポロジャパン 画像情報のコード変換装置、画像情報のコード変換方法、画像コードを用いた画像関連情報提供システム、画像情報のコード変換プログラム、及びそのプログラムを記録した記録媒体
JP6393230B2 (ja) * 2015-04-20 2018-09-19 株式会社日立製作所 オブジェクト検出方法及び画像検索システム
JP6997656B2 (ja) * 2018-03-15 2022-01-17 ヤフー株式会社 検索装置、検索方法および検索プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003150960A (ja) 2001-11-12 2003-05-23 Telecommunication Advancement Organization Of Japan 識別処理装置およびそのコンピュータプログラム
JP2004192603A (ja) 2002-07-16 2004-07-08 Nec Corp パターン特徴抽出方法及びその装置
JP2006293859A (ja) 2005-04-13 2006-10-26 Nippon Television Network Corp 画像比較方法、画像比較システム及びプログラム

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5425782B2 (ko) * 1973-03-28 1979-08-30
US5157743A (en) * 1987-10-28 1992-10-20 Canon Kabushiki Kaisha Image information coding apparatus
US5485531A (en) * 1987-12-17 1996-01-16 Fuji Electric Co., Ltd. Character-feature extraction device
US5287275A (en) * 1988-08-20 1994-02-15 Fujitsu Limited Image recognition apparatus and method for recognizing a pattern within an image
US5263097A (en) * 1991-07-24 1993-11-16 Texas Instruments Incorporated Parameter normalized features for classification procedures, systems and methods
US5436653A (en) 1992-04-30 1995-07-25 The Arbitron Company Method and system for recognition of broadcast segments
US5577135A (en) * 1994-03-01 1996-11-19 Apple Computer, Inc. Handwriting signal processing front-end for handwriting recognizers
US5802207A (en) * 1995-06-30 1998-09-01 Industrial Technology Research Institute System and process for constructing optimized prototypes for pattern recognition using competitive classification learning
DE69939055D1 (de) * 1998-03-05 2008-08-21 Matsushita Electric Ind Co Ltd Verfahren zur bildkodierung, verfahren zur bildkodierung/-dekodierung, bildkodierer, oder vorrichtung zur bildaufzeichnung/-wiedergabe
JP2002099916A (ja) * 2000-09-25 2002-04-05 Olympus Optical Co Ltd パターン分類方法及びその装置、コンピュータにより読み取り可能な記憶媒体
US7203343B2 (en) * 2001-09-21 2007-04-10 Hewlett-Packard Development Company, L.P. System and method for determining likely identity in a biometric database
JP2004192555A (ja) * 2002-12-13 2004-07-08 Fuji Xerox Co Ltd 情報管理方法、情報管理装置及び情報管理プログラム
US7643684B2 (en) * 2003-07-15 2010-01-05 Samsung Electronics Co., Ltd. Apparatus for and method of constructing multi-view face database, and apparatus for and method of generating multi-view face descriptor
JP2005100122A (ja) 2003-09-25 2005-04-14 Fuji Photo Film Co Ltd 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
US7379627B2 (en) * 2003-10-20 2008-05-27 Microsoft Corporation Integrated solution to digital image similarity searching
JP4349160B2 (ja) * 2004-03-05 2009-10-21 日本電気株式会社 画像類似度算出システム、画像検索システム、画像類似度算出方法および画像類似度算出用プログラム
JP2005309535A (ja) * 2004-04-16 2005-11-04 Hitachi High-Technologies Corp 画像自動分類方法
US20060193520A1 (en) * 2005-02-28 2006-08-31 Takeshi Mita Object detection apparatus, learning apparatus, object detection system, object detection method and object detection program
US20060204107A1 (en) * 2005-03-04 2006-09-14 Lockheed Martin Corporation Object recognition system using dynamic length genetic training
WO2007148264A1 (en) * 2006-06-20 2007-12-27 Koninklijke Philips Electronics N.V. Generating fingerprints of video signals
US7805011B2 (en) * 2006-09-13 2010-09-28 Warner Bros. Entertainment Inc. Method and apparatus for providing lossless data compression and editing media content
EP1912160B1 (en) * 2006-10-11 2012-05-16 Mitsubishi Electric R&D Centre Europe B.V. Image descriptor for image recognition
JP4310356B2 (ja) * 2006-11-13 2009-08-05 シャープ株式会社 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及び記録媒体
JP4936535B2 (ja) 2007-07-05 2012-05-23 株式会社岩田レーベル 容器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003150960A (ja) 2001-11-12 2003-05-23 Telecommunication Advancement Organization Of Japan 識別処理装置およびそのコンピュータプログラム
JP2004192603A (ja) 2002-07-16 2004-07-08 Nec Corp パターン特徴抽出方法及びその装置
JP2006293859A (ja) 2005-04-13 2006-10-26 Nippon Television Network Corp 画像比較方法、画像比較システム及びプログラム

Also Published As

Publication number Publication date
WO2010084713A1 (ja) 2010-07-29
EP2383697A4 (en) 2012-09-05
JP4831255B2 (ja) 2011-12-07
CN102292746B (zh) 2014-03-19
US8170341B2 (en) 2012-05-01
EP2383697A1 (en) 2011-11-02
KR20110103437A (ko) 2011-09-20
CN102292746A (zh) 2011-12-21
JPWO2010084713A1 (ja) 2012-07-12
US20110280487A1 (en) 2011-11-17

Similar Documents

Publication Publication Date Title
KR101322524B1 (ko) 화상 시그너처 추출 디바이스
KR101319780B1 (ko) 이미지 시그니처 추출 장치
Hou et al. Reversible data hiding in color image with grayscale invariance
CN102301395B (zh) 特征选择设备
US20190347755A1 (en) Geometric Enumerated Watermark Embedding for Colors and Inks
WO2010103848A1 (ja) 画像識別子照合装置
JP5573131B2 (ja) 映像識別子抽出装置および方法、映像識別子照合装置および方法、ならびにプログラム
Qu et al. A convolutive mixing model for shifted double JPEG compression with application to passive image authentication
KR101968921B1 (ko) 강건한 낮은 복잡도 비디오 핑거프린팅을 위한 장치 및 방법
KR101353104B1 (ko) 이미지 시그니처 추출 장치
KR100924690B1 (ko) 디지털 영상 특징 관리 시스템 및 그 방법
WO2010084738A1 (ja) 照合加重情報抽出装置
US8744193B2 (en) Image signature extraction device
KR20110123770A (ko) 화상 식별자 추출 장치
Cattaneo et al. Improving the experimental analysis of tampered image detection algorithms for biometric systems
Saadat et al. A New Approach for Copy‐Move Detection Based on Improved Weber Local Descriptor
Patil et al. Improved image splicing forgery localization with first digits and Markov model features
Aljarf et al. Detection System for Grey and Colour Images Based on Extracting Features of Difference Image and Renormalized Histogram.
Chantharainthron et al. Robust video editing detection using scalable color and color layout descriptors
Raj et al. NOW-LBP GLCM Feature as the Texture Descriptor of the Camera Fingerprint in Image Forensics
Sekeh et al. Spiral unique sequence: A new rotation invariant feature for small-size image block matching

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160921

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170920

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181004

Year of fee payment: 6