KR101649766B1 - 이미지 식별을 위한 스케일 안정적 특징-기반 식별자 - Google Patents

이미지 식별을 위한 스케일 안정적 특징-기반 식별자 Download PDF

Info

Publication number
KR101649766B1
KR101649766B1 KR1020107023739A KR20107023739A KR101649766B1 KR 101649766 B1 KR101649766 B1 KR 101649766B1 KR 1020107023739 A KR1020107023739 A KR 1020107023739A KR 20107023739 A KR20107023739 A KR 20107023739A KR 101649766 B1 KR101649766 B1 KR 101649766B1
Authority
KR
South Korea
Prior art keywords
image
scale
delete delete
feature points
feature
Prior art date
Application number
KR1020107023739A
Other languages
English (en)
Other versions
KR20110002043A (ko
Inventor
미로슬로우 보버
폴 브라스넷
Original Assignee
미쓰비시덴키 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 미쓰비시덴키 가부시키가이샤 filed Critical 미쓰비시덴키 가부시키가이샤
Publication of KR20110002043A publication Critical patent/KR20110002043A/ko
Application granted granted Critical
Publication of KR101649766B1 publication Critical patent/KR101649766B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/48Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

이미지 식별자를 도출하는 방법은 이미지의 스케일-공간 표현을 도출하는 단계 및 최대값 또는 최소값인 값들을 갖는 복수의 특징점들을 검출하기 위해 스케일-공간 표현을 처리하는 단계를 포함한다. 검출된 복수의 특징점들 중 하나 이상과 연관된 스케일-의존적 이미지 영역에 대한 표현이 도출된다. 일 실시예에서, 이미지 영역의 크기가 대응하는 특징점과 연관된 스케일에 의존한다. 스케일-의존적 이미지 영역들에 대해 도출된 표현들을 사용하여 이미지 식별자가 도출된다. 이미지 식별자가 이미지들을 비교하는 방법에서 사용될 수 있다.

Description

이미지 식별을 위한 스케일 안정적 특징-기반 식별자{SCALE ROBUST FEATURE-BASED IDENTIFIERS FOR IMAGE IDENTIFICATION}
본 발명은 안정적 이미지 식별의 문제에 관한 것이며, 이전에 출원된 동시 계류 중인 특허 출원들 EP 06255239.3, GB 0700468.2, GB 0712388.8, GB 0719833.6 및 GB 0800364.2에 개시된 것과 같은 종래 기술의 방법들보다 장점들을 제공하는 새로운 방법을 개시한다.
멀티미디어 컨텐츠의 안정적 식별의 목적은 멀티미디어 컨텐츠에 수행될 수 있는 통상적인 수정들 중에 보존되는 정보를 추출하는 데 있다. 그 수정은 선의적인 또는 악의적인 목적일 수 있다. 이미지들의 경우에, 그 중에서도 특히, 압축, 그레이스케일 변환, 회전, 잡음 삽입, 색 변경, 크로핑 및 이동될 때, 안정적 식별자가 실질적으로 보존되어야만 한다. 또한, 독립적인 컨텐츠가 충분히 서로 다른 식별자들을 갖도록 식별자가 분별력을 제공해야만 한다.
유럽 특허 출원 EP 06255239.3 및 영국 특허 출원 GB 0700468.2, GB 0712388.8 및 GB 0719833.6에 개시된 기술들은 그 모두가 전역 정보, 즉 전체 이미지에 관한 정보에 기초하여 식별자를 추출한다는 점에서 유사하다. 이러한 계열의 관련된 식별자들은 아주 낮은 오경보율(false alarm rates)[통상적으로 0.1 ppm(parts per million)보다 작음]에서 100%에 가까운 안정성을 제공한다(이는 높은 분별 능력을 제공한다는 것을 의미함).
많은 수의 이미지들이 다양한 이미지 데이터베이스들에 존재하고, 웹 페이지, 프레젠테이션 및 문서에 임베딩되어 있다. 유명한 웹 사이트들의 조사에 의하면 Flickr가 20억개 이상의 이미지를 가지고 있고 Photobucket이 40억개 이상을 가지고 있으며 Facebook이 17억개를 가지고 있다고 한다. 소비자들은 종종 자신의 개인 컬렉션에 수천장의 사진을 가지고 있고 전문가들은 상당히 더 많이 가지고 있을 것이다. 데이터세트의 크기가 큰 경우 실용적이도록 하기 위해, 식별자들은 또한 아주 빠른 검색을 가능하게 하여야만 한다. 특허 출원들 EP 06255239.3, GB 0700468.2, GB 0712388.8 및 GB 0719833.6에 개시된 기술들은 초당 1천만개 이상의 이미지의 검색 속도를 가능하게 할 수 있다.
많은 통상의 이미지 수정들에 대해 높은 수준의 안정성에도 불구하고, 특허 출원들 EP 06255239.3, GB 0700468.2, GB 0712388.8 및 GB 0719833.6에 개시된 종래 기술의 식별자들은, 이동 및 크로핑과 같은 이미지 컨텐츠의 상당 부분이 상실되거나 대체된, 한 부류의 이미지 수정들에 대해 요구된 수준의 안정성을 제공하지 못할 수 있다. GB 0800364.2에 개시된 기술은 이러한 부류의 이미지 수정들에서 상당히 개선된 안정성을 제공한다. 이는 i) 특징 검출 및 선택, ii) 특징 영역 및 식별자 추출, 및 iii) 매칭을 필요로 하는 프로세스이다. 본 발명은 종래 기술의 이미지 식별자들의 안정성에 대한 개선을 제안한다.
컴퓨터 비전 및 물체 인식의 영역에서 종래 기술의 특징점 방법이 개발되었다[별첨 인용 문헌 2, 3]. 이러한 접근 방법들은 아주 많은 수의 점들에 의존한다:
"이 접근 방법의 중요한 양태는 이미지를 빽빽하게 채우고 있는 많은 수의 특징들을 발생한다는 것이다... 500x500 픽셀 크기의 통상적인 이미지가 약 2000개 특징들을 발생할 것이다."[별첨 참조 문헌 2]
많은 수의 특징들을 추출하는 결과, 검색 및 매칭 계산이 아주 느리게 되고, 간단한 경우에, 쿼리 이미지로부터의 모든 특징들이 데이터베이스 내의 모든 이미지들로부터의 모든 특징들과 비교되어야만 한다. 검색 시간을 감소시키기 위해, 종래 기술의 방법들은 다양한 형태의 데이터 구조들을 사용하지만, 이러한 구조들이 부가의 데이터베이스 초기화 시간, 부가의 저장 장치 및 메모리 요건을 대가로 얻어지며, 종종 개선된 검색 속도를 낮은 검출율과 맞바꾸는 어떤 근사가 행해진다.
본 발명은 대부분의 종래 기술의 적용 분야와 다른, 이미지 및 그의 수정된 버전을 검출하는 것에 관한 것이다. 상세하게는, 이미지 복제본 검출은 이미지의 수정된 버전, 예를 들어, 크로핑된 것, 압축된 것 등을 찾아내는 것에 관한 것이다. 이와 달리, 대부분의 종래 기술의 방법들은 이미지들에서 특정의 물체들 또는 한 부류의 물체들(예를 들어, Ford Focus 자동차 또는 자동차들)을 검출하는 것에 관한 것이다. 이러한 문제점들 간의 구별이 사소하거나 미묘한 것처럼 보일 수 있지만, 이는 중요하다. 예를 들어, 2개의 서로 다른 전망대에서 찍은 런던에 있는 세인트폴 대성당의 이미지 2장을 생각해보자. 이제, 물체 인식 작업 중에는, 이 이미지들 간의 유사성이 검출되어야만 하지만, 이미지 복제본 검출 중에는, 유사성이 검출되어서는 안 된다. 이것을 염두에 두고, 이 2가지 서로 다른 문제점들을 다루기 위해 다른 기법들이 필요하다.
GB 0800364.2에 개시된 방법은 Trace 변환에 기초한 이진 특징점 기술자(binary feature point descriptor)를 발전시킨다. 이진 기술자를 사용하는 것의 장점은 특징 매칭을 위해 해밍 거리가 사용되고, 이는 검색 프로세스를 아주 빠르게 만들어준다는 것이다. 게다가, 선택 프로세스가 특징들의 수를, 크로핑 및 이동과 같은 어려운 이미지 수정들에 대해 놀랄 정도로 안정적인 것으로 밝혀진 작은 세트로 제한한다. 안정성이 우수하지만, 추가의 개선을 제공하는 것이 바람직하다.
제1 양태에 따르면, 본 발명은 이미지에 대응하는 신호들을 처리함으로써 이미지의 표현, 즉 이미지 기술자(image descriptor)를 도출하는 방법을 제공한다. 이 방법은 이미지의 스케일-공간 표현(scale-space representation)을 도출하는 단계를 포함한다. 진폭 극값(amplitude extrema)(즉, 최대값 또는 최소값)을 갖는 스케일-공간 표현 내의 복수의 특징점들을 검출하기 위해 스케일-공간 표현이 처리된다. 검출된 복수의 특징점들 중 하나 이상에 대해, 이 방법은 대응하는 특징점과 연관된 스케일-의존적 이미지 영역(scale-dependent image region)을 결정한다. 이어서, 각각의 결정된 스케일-의존적 이미지 영역에 대한 표현이 도출된다.
따라서, 최고 특징 강도(feature strength)를 갖는 이미지의 특징들에 기초하여 이미지 기술자가 도출될 수 있다.
일 실시예에서, 2차 이미지 기울기(image gradient)에 기초한 제1 연산자를 이미지의 스케일-공간 표현에 적용하는 것 및 최고 결과 값을 갖는 스케일-공간 표현 내의 특징점들을 식별하는 것에 의해 복수의 특징점들이 검출된다. 이어서, 제2 연산자가 검출된 복수의 특징점들에 적용될 수 있고, 제2 연산자는 1차 이미지 기울기에 기초하고 임계값보다 낮은 결과 값들을 갖는 특징점들은 제거된다. 제1 연산자 및 제2 연산자를 적용함으로써 복수의 특징점들 중에서 미리 정해진 수의 특징점들이 선택될 수 있다.
다른 실시예들에서, 원하는 응용에 따라 다른 차수의 연산자들을 사용하여 또는 다른 기법들을 사용하여 복수의 특징점들이 검출될 수 있다.
양호하게는, 선택된 하나 이상의 검출된 특징점들에 대해, 특징점의 공간 위치와 연관된 이미지의 공간 영역을 결정함으로써 스케일-의존적 이미지 영역이 결정되고, 공간 영역의 크기는 특징점의 스케일에 기초한다.
Trace 변환 또는 그에 상당하는 것을 사용하는 등에 의해, 이미지 영역에 걸친 선 투영(line projection)에 기초하여 각각의 정해진 스케일-의존적 이미지 영역의 표현이 도출될 수 있다.
일례에서, 하나 이상의 정해진 스케일-의존적 이미지 영역들 각각에 대해, 이미지 영역의 적어도 일부의 함수가 도출되고, 이때 이미지 영역의 이동된, 스케일링된 또는 회전된 버전의 함수가 이미지 영역의 함수의 이동된 또는 스케일링된 버전이다. 이미지 영역의 적어도 일부의 함수를 도출하는 단계는 이미지 영역 상의 라인들을 따라 제1 범함수(functional)를 적용하는 단계를 포함한다. 이 방법은 또한 이미지 영역의 적어도 일부의 중간 표현을 획득하기 위해 도출된 함수에 제2 범함수를 적용하는 단계를 포함할 수 있다.
각각의 정해진, 스케일-의존적 이미지 영역에 대한 표현은 이진 이미지 기술자를 포함할 수 있다.
이미지의 표현이 스케일-의존적 이미지 영역들의 도출된 표현들 중 2개 이상으로부터 도출될 수 있다.
제2 양태에 따르면, 본 발명은 본 발명의 제1 양태에 따른 방법을 사용하여 도출된 이미지들의 기술자들을 사용하여 이미지들을 비교하는 방법을 제공한다. 이 방법은 제1 이미지의 기술자와 연관된 하나 이상의 스케일-의존적 이미지 영역들의 표현들을 제2 이미지의 기술자와 연관된 하나 이상의 스케일-의존적 이미지 영역들의 표현들과 비교하는 단계를 포함한다.
본 발명의 다른 양태들은 본 발명의 제1 양태에 따른 방법을 사용하여 도출된 이미지의 표현의 사용(전송 또는 수신을 포함함), 본 발명의 제1 양태 또는 제2 양태 또는 둘다에 따른 방법을 실행하는 장치, 및 컴퓨터에 의해 실행될 때, 본 발명의 제1 양태 또는 제2 양태 또는 둘다에 따른 방법을 수행하는 명령어들을 포함하는 컴퓨터-판독가능 저장 매체를 포함한다.
본 발명의 다른 특징들 및 이점들이 이하의 설명 및 첨부된 특허청구범위로부터 명백하게 될 것이다.
본 발명은 필요에 따라 안정성을 개선시키는 2가지 주요 양태를 포함한다: i) 영역-스케일이 특징 선택 및 추출의 프로세스에 포함되고, ii) 계산 비용을 최소화시키면서 안정성을 유지하는 최대 4-단계인 매칭 프로세스가 개발된다.
공간 및 스케일 위치를 갖는 복수의 특징들을 선택하기 위해 특징 검출 프로세스가 사용된다. 특징 선택은 작업에 적절하고 Trace 변환-기반 특징 기술자들과 잘 동작하는 것으로 실험적으로 입증된 특징들을 선택하기 위해 새로운 프로세스를 사용한다.
이미지 매칭을 위해, 검출 성능, 독립성, 계산 시간 및 메모리 요건 사이의 트레이드오프가 필요하다. 개시된 실시예에서, 계산 시간 및 메모리 요건 둘다를 최소화하면서 검출율 및 독립성을 최대화하는 것을 목표로 하는 4-단계 매칭 프로세스가 소개된다. 제1 단계는 높은 확률을 갖는 가설들(즉, 후보들)을 신속하게 결정하고 낮은 확률 매치(probability match)를 제거하며, 제2 단계는 이러한 가설들을 검정하고 상당한 수의 잘못된 가설을 제거한다. 제3 단계는 추가의 잘못된 가설을 제거한다. 각각의 단계는 이전의 단계들보다 증가된 수준의 복잡도를 수반하며, 따라서 프로세스에서 잘못된 가설을 가능한 한 일찍 제거함으로써 복잡도가 관리되고 최소화된다.
상기한 양태들은 물론, 본 발명의 다른 양태들도 이미지의 선택되고 추출된 특징들에 기초하여 이미지의 표현을 도출하는 것, 및 본 발명의 하나 이상의 양태들에 따른 프로세스들을 구현하는 장치 및 컴퓨터 프로그램을 포함한다.
본 발명의 실시예들에 대해 이제부터 첨부 도면들을 참조하여 기술할 것이다.
도 1a는 이미지를 나타낸 도면이다.
도 1b는 도 1a의 이미지의 축소된 버전을 나타낸 도면이다.
도 1c는 도 1a의 이미지의 회전된 버전을 나타낸 도면이다.
도 1d는 도 1a의 이미지의 블러링된 버전을 나타낸 도면이다.
도 1e는 도 1a의 이미지의 (좌우로) 뒤집기된 버전을 나타낸 도면이다.
도 1f는 도 1a의 이미지의 많이 압축된 버전을 나타낸 도면이다.
도 1g는 도 1a의 이미지의 크로핑된 버전을 나타낸 도면이다.
도 2는 종래 기술에 따른 이미지 및 이미지의 비트열 표현을 나타낸 도면이다.
도 3은 특징 검출기에 의해 검출된 이미지의 관심점들의 예시적인 집합을 나타낸 도면이다.
도 4는 최종적인 일련의 특징들이 선택되고, 특징의 스케일이 원의 크기로 표시되며, 특징의 방향이 라인으로 표시된 이미지를 나타낸 도면이다.
도 5는 (a) 원본 이미지 및 (b) 원본 이미지의 회전된 버전으로부터 해밍 거리를 사용하여 일치하는 것으로 발견된 관심점들을 나타낸 도면으로서, 관심점들 간의 라인 길이는 기하학적 제약조건들을 적용하는 데 사용된다.
도 6은 본 발명의 일 실시예에 따른 장치의 블록도이다.
도 7은 본 발명의 일 실시예에 따른 (a) 특징 식별자 및 (b) 이미지 식별자의 구조를 나타낸 도면이다.
이제부터, 이미지의 표현, 구체적으로는 이미지 식별자를 도출하고, 예를 들어, 이미지 또는 이미지들의 식별, 매칭 또는 유효성 확인을 위해 이러한 표현/식별자를 사용하는 다양한 실시예들에 대해 기술할 것이다. 본 발명은 이미지를 식별하는 데 특히 유용하지만, 그것으로 제한되지 않는다. 기술된 실시예들에서, "이미지 식별자"("식별자", "기술자", "이미지 기술자", "서명" 또는 "이미지 서명"이라고도 함)는 이미지의 표현의 일례이며, 이 용어는 단지 이미지의 표현, 즉 기술자(descriptor)를 나타내기 위해 사용된다.
당업자라면 본 발명의 일 실시예에 따른 이미지 식별 장치 및 방법의 구체적인 설계 상세 및 이미지 식별에서 사용하기 위한 이미지 식별자의 도출이 식별자가 안정적이어야만 하는 이미지 수정의 유형에 관련된 요구사항들, 식별자의 크기, 추출 및 매칭 복잡도, 목표 오경보율(false-alarm rate) 등에 의해 결정된다는 것을 잘 알 것이다.
이하의 예는 이미지에 대한 다음과 같은 수정들에 안정적인 식별자가 얻어지는 일반 설계에 대해 설명한다(이것이 전수적인 리스트는 아님):
ㆍ 색 감소,
ㆍ 블러링,
ㆍ 밝기 변화,
ㆍ 뒤집기(좌우 및 상하),
ㆍ 그레이스케일 변환,
ㆍ 히스토그램 평활화,
ㆍ JPEG 압축,
ㆍ 잡음,
ㆍ 회전,
ㆍ 크로핑,
ㆍ 스케일링,
ㆍ 이동,
ㆍ 스큐잉 및
ㆍ 원근감 변화.
제안된 설계가 통상적으로 넓은 부류의 이미지들에 대해 1 ppm(parts per million) 미만의 낮은 오경보율 및 98.0%를 넘는 통상적인 검출율을 달성할 수 있다는 것이 밝혀졌다.
도 1은 이미지 및 이미지의 수정된 버전들의 일례를 나타낸 것이다. 보다 구체적으로는, 도 1a는 원본 이미지이고, 도 1b는 도 1a의 이미지의 축소된(스케일링된) 버전이며, 도 1c는 도 1a의 이미지의 회전된 버전이고, 도 1d는 도 1a의 이미지의 블러링된 버전이며, 도 1e는 도 1a의 이미지의 뒤집기된 버전이고, 도 1f는 도 1a의 이미지의 압축된 버전이며, 도 1g는 도 1a의 이미지의 크로핑된 버전이다.
본 발명의 일 실시예는 이미지에 대응하는 신호 및/또는 이미지 데이터를 처리함으로써 이미지의 표현, 보다 구체적으로는 이미지 식별자를 도출한다.
특징점 추출 및 선택
EP 06255239.3, GB 0700468.2, GB 0712388.8, GB 0719833.6 및 GB 0800364.2에 따르면, 이미지 식별자의 추출의 초기 단계에서, 이미지가 선택적으로 크기 조정 및 필터링에 의해 사전-처리된다. 크기 조정 단계는 처리 이전에 이미지를 정규화하는 데 사용된다. 필터링 단계는 엘리어싱과 같은 효과를 제거하기 위해 필터링하는 것을 포함할 수 있으며, 영역 선택 및 테이퍼링도 포함할 수 있다. 일 실시예에서, 이미지가 256xN 또는 Nx256(단, N≥256이고 종횡비를 유지함)의 해상도로 크기 조정된다. 다른 실시예에서, 이미지가 256x256의 정사각형으로 크기 조정된다. 이어서, 이미지가 3x3 가우시안 커널(Gaussian kernel)로 저역 통과 필터링된다. 사전 처리 단계들은 선택적이며, 이상의 것들의 임의의 조합을 포함할 수 있다.
다음 단계에서, 이미지에서 특징점들이 검출된다. 일 실시예는 특징 검출기를 사용하여, 이미지에서 잠재적인 특징들 및 이미지 기울기를 측정한 것에 기초한 특징들의 강도를 검출한다. 1차 이미지 기울기에 기초한 한가지 적당한 이미지 특징 검출기는 GB 0800364.2에서 사용된 Harris이다.
Figure 112010068561528-pct00001
여기서 Ix(x,y)는 위치 (x,y)에서의 이미지 강도 I(x,y)의 1차 미분이고, α는 특징 검출을 제어하는 파라미터이다.
대안의 2차 검출기는 Laplacian(2차 편미분 Hessian 행렬의 트레이스에 대응함)이다.
Figure 112010068561528-pct00002
여기서 Ixx(x,y)는위치 (x,y)에서의 이미지의 2차 미분이다.
GB 0800364.2에서, 특징들이 단지 하나의 스케일에서, 즉 원본 이미지의 정규화된 버전에서 선택된다. 게다가, 특징 서명이 추출되는 이미지 영역을 형성하는 특징 주변의 영역은 고정된다. 그러나, 크로핑 수정 중에, 이미지의 일부가 상실된다. 이미지가 (전술한 사전-처리에서 또는 사용자에 의해) 기하학적으로 정규화될 때, 영역이 원본 이미지에서의 동일한 영역에 비해 더 커지게 된다. 심한 크로핑에 의해, 이러한 2개의 영역의 Trace 변환-기반 기술자가 용인할 수 없을 정도로 다르게 되고, 거리가 유사성을 선언하는 임계값을 넘을 수도 있다.
이 문제를 해결하기 위해, 본 발명의 제1 양태에 따르면, "스케일 추정(scale estimation)"이 사용될 수 있다. 스케일 추정은 각각의 특징의 분석을 위해 적절한 스케일을 선택하려고 시도한다. 각각의 특징이 그 자신의 스케일과 연관될 것임에 주목해야 한다.
먼저, 이미지의 스케일-공간 표현이 도출된다. 실시예들에서, 이미지의 스케일-공간 표현이 2가지 방식 중 하나로 구성될 수 있다(그러나, 다른 기법들이 가능하며 생각되고 있다). 첫번째 방식은 원본 이미지를 연속하여 평활화(smooth)하고 샘플링하는 것이고, 두번째 방식은 필터 크기를 점점 증가시키면서 이미지를 반복하여 평활화하는 것이다. 이어서, 위치-스케일 공간에서 최대값을 찾아냄으로써 특징들이 검출된다. 평활화 필터에 대한 최적의 선택이 가우시안(필터)이고, 가우시안(필터)에 의해 평활화된 이미지가 수학식 3으로 표시되며,
Figure 112010068561528-pct00003
여기서 *는 콘벌루션 연산자이고,
Figure 112010068561528-pct00004
이 가우시안 필터이며,
Figure 112010068561528-pct00005
이 스케일을 결정하는 평활화 필터의 표준 편차이다.
일 실시예에서, 스케일-공간 표현에서 특징의 위치 및 스케일의 양호한 검출을 제공하기 위해 2개의 검출기가 사용되고, 한쪽 검출기는 1차 기울기를 사용하고, 다른쪽 검출기는 2차 기울기를 사용한다.
먼저, 가우시안 연산자의 수정된 스케일 보정된 Laplacian인
Figure 112010068561528-pct00006
이 복수의 특징 위치 및 스케일(즉, 스케일-공간 표현에서의 특징점들)을 검출하는 데 사용된다. 여기서,
Figure 112010068561528-pct00007
은 미분들의 평균을 구하는 적분을 위해 사용되는 가우시안 필터이고,
Figure 112010068561528-pct00008
은 적분 스케일이며,
Figure 112010068561528-pct00009
은 스케일 정규화 파라미터이다. 적분 평활화를 스케일-적응 Laplacian(scale adapted Laplacian)에 도입하면 특징 검출기의 성능을 향상시키는 데 도움이 된다.
제2 검출기는 스케일-적응 Harris 연산자
Figure 112010068561528-pct00010
Figure 112010068561528-pct00011
이고, 여기서
Figure 112010068561528-pct00012
이다.
따라서, 스케일 공간에서 적용되는 라플라스 방정식(Laplacian equation)(수학식 4), 및 최고값을 갖는 위치 및 스케일이 이어서 잠재적 특징으로서 선택된다. 이어서, 무의미한(즉, 임계값보다 낮은) Harris 검출기 응답을 갖는 특징들이 일련의 잠재적 특징들로부터 제거된다. 2개의 검출기의 사용으로부터 얻어지는 일련의 잠재적 특징들로부터 일련의 대표적 특징들을 선택하기 위해 이하에서 기술되는 선택 절차가 적용된다. 일 실시예에서, 최대 미리 정해진 수의 특징들이 선택된다.
검출된 특징들 중의 허용가능 특징들 중에서 라플라스 검출기 방정식(수학식 4)에 따라 가장 강한 특징이 먼저 선택된다. 특징이 특징 스케일로부터 계산된 반경 r보다 이미지의 가장자리에 더 가까운 경우 거부된다(수학식 7 참조). 특징이 이전에 선택된 특징들 중 임의의 것을 중심으로 한 제외 영역(exclusion zone) 내에 있는 경우 선택되지 않는다는 제한에 의해, 이후의 특징들이 강도의 순서로 선택된다. 일 실시예에서, 10 픽셀의 반경을 갖는 원형 영역이 제외 영역으로서 사용된다. 미리 정해진 수의 대표적 특징들(예를 들어, 32개 특징들)이 선택되거나 특징들이 더 이상 없는 경우, 선택 프로세스가 종료된다.
도 3에 도시된 검출된 특징들 중에서 선택된 도 2의 이미지의 일련의 특징들이 도 4에 나타내어져 있으며, 스케일은 원의 크기로 표현되어 있고, 특징 방향은 라인으로 표현되어 있다. 검출된 특징들 및 이들의 주변의 이미지 영역들이 이미지 전체를 대표한다(또는 이미지 전체에 중요하다)는 것을 잘 알 것이다.
특징점들(또는 관심점들)의 위치가 선택되었기 때문에, 그들의 위치가 양호하게는, 예를 들어, 인터넷을 통해 http://opencvlibrary.sourceforge.net/CvReference(별첨 인용 문헌 1)에서 획득될 수 있는 OpenCV (FindCornerSubPix) 03/01/2008에 기술된 것과 같은 방법을 사용하여 서브-픽셀 해상도까지 선택된 스케일로 미세 조정된다.
특징 영역 및 식별자 추출
본 명세서에 인용 문헌으로서 포함된 GB 0719833.6에, 이진 이미지 식별자 또는 이미지 표현을 추출하는 방법이 개시되어 있다. 본 발명의 일 실시예에서, GB 0719833.6의 방법은 특징점들을 중심으로 한 영역들로부터 이진 "특징 식별자"를 추출하는 데 적용된다. 따라서, 각각의 특징 식별자는 검출된 특징과 연관된 이미지 영역의 이진 표현이다. 이미지 영역은 미리 정해진 크기를 가질 수 있다. 예를 들어, 일 실시예에서, 특징점에 중심이 있는 32 픽셀의 반경을 갖는 원형 이미지 영역이 선택되고, 이미지 영역에 대한 이진 서명이 계산된다. 원형 영역은 양호하게는, 예를 들어, 3차 보간(cubic interpolation)을 사용하여 서브-픽셀 레벨 정확도까지 추출된다.
양호하게는, 고정된 특징 영역 반경을 사용하는 대신에, 특징이 검출되는 스케일이 영역 크기를 적절히 적응시키는 데 사용된다. 스케일 s에서 선택될 영역의 반경은 수학식 7로 주어진다:
Figure 112010068561528-pct00013
여기서, r0는 베이스 반경이고,
Figure 112010068561528-pct00014
은 초기 스케일이며,
Figure 112010068561528-pct00015
은 설계 파라미터인 상수이다. 또한, 적분 스케일에 대한 양호한 선택이
Figure 112010068561528-pct00016
이라는 것도 주목할만한 가치가 있다.
양호한 실시예에서,
Figure 112010068561528-pct00017
이고 S = 14이다. 특징 위치 (x,y) 및 반경 r에 의해 결정되는 영역이 3차 보간을 사용하여 서브-픽셀 정확도까지 추출된다. 이 영역은 이어서 정규화된 반경
Figure 112010068561528-pct00018
(양호한 실시예에서, 32임)에 의해 주어지는 미리 정의된 크기로 정규화된다. GB 0719833.6에 따른 방법을 사용하여 대응하는 이미지 식별자를 도출하기 위해, 추출된 영역이 이어서 처리된다. 이 방법에 대한 간략한 요약이 이하에 제공된다.
이미지에 걸쳐
Figure 112010068561528-pct00019
으로 파라미터화된 모든 가능한 라인들을 투영하고 이 라인들에 걸쳐 제1 범함수 T를 적용함으로써 이미지 영역의 Trace 변환
Figure 112010068561528-pct00020
이 수행된다. GB 0700468.2에 개시된 방법에 따라 그의 차원들
Figure 112010068561528-pct00021
중 어느 하나 또는 둘다에서 그의 해상도를 감소시키기 위해 Trace 변환의 결과가 분해될 수 있다. EP 06255239.3 및 GB 0700468.2의 방법들에서와 같이, 실수 숫자들의 벡터(즉, 1차원 함수)를 제공하기 위해 제2 범함수 P가 Trace 변환의 열들에 적용될 수 있다. 이 제2 범함수 P는 diametrical 범함수(diametrical functional)라고 하며, 그 결과의 벡터가 circus 함수(circus function)라고 한다.
하나의 숫자를 제공하기 위해 제3 범함수인 circus 범함수가 circus 함수에 적용될 수 있지만, 양호한 실시예에서는 이 단계가 사용되지 않는다.
대안으로서, GB 0719833.6의 방법에 따르면, 상기한 circus 함수의 대안으로서 소위 "band-circus" 함수가 획득될 수 있고, 이는 Trace 변환의 일부분만으로부터의 값들을 선택하여 처리함으로써, Trace 변환을 이미지의 라인들의 일부로 제한한다.
제1, 제2 및/또는 제3 범함수(Trace, diametrical 및 circus)의 적절한 선택에 의해 결과의 속성들이 제어될 수 있다.
이미지 영역에 대한 이진 식별자가 주파수 표현을 통해 circus 함수(또는 band-circus 함수)로부터 추출된다. 예를 들어, 푸리에 변환의 크기 계수들에 대해 함수
Figure 112010068561528-pct00022
이 정의될 수 있다. 이 함수의 일례는 이웃하는 계수들의 차이를 구하는 것이다.
Figure 112010068561528-pct00023
수학식 9와 같이 결과 벡터에 임계값을 적용함으로써 이진 문자열이 추출될 수 있다.
Figure 112010068561528-pct00024
S에 대한 적당한 선택은 S = 0 및 S = mean(c)를 포함한다. 이미지 영역의 이진 표현은 이어서 이러한 이진 문자열 값들 B = {b0,...,bn}로 이루어져 있다.
본 발명의 일 실시예에서, (GB 0719833.6에서와 같이 이미지 전체와 달리) 지역 이미지 영역들이 사용되기 때문에, 이 영국 출원에 기술된 서명 추출 기법에 수정이 행해질 필요가 있다. 상세하게는, EP 06255239.3에 개시된 방법에 따라 이하의 범함수들을 사용하여 전체 Trace 변환(full Trace transform)의 circus 함수로부터 2개의 식별자가 추출된다:
Figure 112010068561528-pct00025
Figure 112010068561528-pct00026
GB 0700468.2에 개시된 방법에 따라, Trace 변환의 거리 (d) 파라미터를 8, 16 및 32의 인자로 분해(또는 서브샘플링)하고 수학식 10 및 11 둘다를 적용함으로써 획득된 circus 함수로부터 추가의 6개의 "다중 해상도" 식별자들이 추출될 수 있다.
GB 0712388.8에 개시된 방법에 따라 추가의 3개의 함수가 Trace 변환에서 대역들로부터 선택되고, GB 0719833.6에 개시된 방법에 따라 2개의 함수가 trace-annulus 함수로부터 추출되고 하나의 함수가 trace-circular 함수로부터 추출된다.
이들 14개 성분 식별자 각각이 8 비트이며, 각각의 특징 식별자에 대해 총 112 비트를 제공한다.
또한, 각각의 특징(수학식 12)에 대한 이웃에 걸쳐 적분되는 스케일-적응 특징 방향이 또한 계산된다.
Figure 112010068561528-pct00027
방향 θ가 양호하게는 16개 레벨(4 비트의 데이터로 표현될 수 있음)로 양자화된다.
이미지 식별자 또는 기술자가 특징 서명들 전부 또는 일부로부터 형성된다. 일련의 특징점들 전부에 대한 이미지 식별자가 다수의 방식으로 표현될 수 있다. 양호한 실시예에서, 이미지 기술자는 다수의 정보 필드를 포함하는 비트 스트림이며, 제1 필드는 특징들의 수이다. 이어서, 각각의 특징이 비트스트림에서 정규화된 특징점 좌표(x 및 y), 양자화된 특징 방향 및 이진 특징 서명으로서 표현된다. 선택적으로, 특징들의 수를 저장하기보다는, 패딩이 사용될 수 있으며, 플래그가 미사용 필드를 표현하도록 설정된다. 이진 특징 서명은 112 비트 전부를 포함하거나, 선택적으로 112 비트의 일부가 선택, 도출 또는 저장될 수 있다. 특징 식별자의 구조가 도 7a에 도시되어 있으며, 이미지 서명이 도 7b에 도시되어 있다.
특징 식별자를 사용한 이미지 매칭
이미지 식별자들의 일부를 형성하는 특징 서명들을 비교하거나 매칭시킴으로써 이미지 매칭이 수행될 수 있다. 앞서 언급한 바와 같이, 효율성을 위해, 특징 서명들을 비교함으로써 한 쌍의 이미지 사이의 전체 매칭 절차가 4개의 단계로 이루어져 있다. 단계 1 및 3에서 가설이 작성된다. 일련의 기하학적 테스트가 단계 2 및 4에서 수행되고, 가설이 그 다음 단계로 진행하기 위해서는 이들 테스트를 통과해야만 한다. 이 단계들은 점점 더 계산이 복잡하게 되고, 따라서 각각의 단계가 차후의 처리에서 받아들여지는 가설의 수를 최소화하려고 한다.
제1 단계는 하나의 이미지로부터의 N개의 특징 서명들 중 처음 M개를 제2 이미지로부터의 N개의 특징 서명들 중 처음 M개와 비교함으로써 잠재적인 일치 특징들에 대한 가설들을 작성하는 것을 포함한다. M개의 서브셋을 사용하는 것의 장점은 안정성을 유지하면서 속도가 빨라진다는 것이다. 양호한 실시예에서, N은 32이고 M은 24이다.
2개의 서명 B1과 B2 간의 매칭을 수행하기 위해, 해밍 거리가 구해진다:
Figure 112010068561528-pct00028
여기서,
Figure 112010068561528-pct00029
는 배타적 OR(XOR) 연산자이다.
양호한 실시예에서, 3개의 일치 특징들의 쌍의 모든 조합을 사용하여 가설들의 집합이 생성된다. 가설은 3개의 특징점 쌍의 집합(a1, a2, a3, b1, b2, b3)으로 이루어져 있다. 각각의 특징 쌍의 거리가 상수 임계값 TA보다 낮고 누적 거리가 어떤 제2 상수 임계값 TB보다 낮은 경우, 3개의 특징점 쌍의 집합이 일치로 선언된다. 양호한 가설에서, TA = 0.06이고 TB = 0.2이다. 가설들의 집합이 그의 누적 거리에 의해 정렬되고, 가장 낮은 거리(즉, 일치할 가능성이 가장 높음)가 처음에 온다. 복잡도를 최소화하기 위해, 가설의 수가 최저 거리에 대응하는 K개의 가설로 제한될 수 있다. 양호한 실시예에서, K는 18이다.
제2 단계는 단계 1로부터 발생된 각각에 기하학적 제약조건들을 적용한다. 틀린 일치를 감소시키기 위해 2개의 기하학적 제약조건들, i) 특징 방향 및 ii) 라인 길이의 비가 적용된다.
앞서 기술한 바와 같이, 방향은 각각의 특징과 연관되어 있고, 특징
Figure 112010068561528-pct00030
에 대한 방향은
Figure 112010068561528-pct00031
로 표시된다. 각도 거리 척도가 회전에 의해 영향을 받지 않도록 하기 위해, 동일한 이미지로부터의 특징들에 대응하는 각도들 간의 차이가 구해진다. 이러한 2개의 각도 거리 척도를 사용하여 여기서 하는 것처럼, 거리 척도가 좌우 및 상하 뒤집기 수정의 문제를 해결해야만 한다.
Figure 112010068561528-pct00032
2개의 각도 거리 척도
Figure 112010068561528-pct00033
가 허용가능한 구간 내에 있는지 여부를 테스트하기 위해 이들 각도 거리 척도에 임계값이 적용된다. 각도 거리의 허용가능한 값은 각도 양자화 Q에서의 레벨들의 수에 의존하고 수학식 15에 의해 주어진다.
Figure 112010068561528-pct00034
여기서, q는 각도 변화에 대한 민감도를 변화시키는 데 사용될 수 있는 상수이다. 양호한 실시예에서, q는 1로 설정되고, Q는 16이다.
도 5에 나타낸 바와 같이, 각각의 가설에서 선택된 특징들의 위치를 사용하여, 특징들 간의 라인 길이들의 비가 제약조건으로서 사용된다.
Figure 112010068561528-pct00035
은 특징 a1의 위치와 특징 a2의 위치를 연결하는 라인의 길이를 나타낸다. 3개의 특징점
Figure 112010068561528-pct00036
Figure 112010068561528-pct00037
이 라인 길이들의 비를 구하는 데 사용된다. 3개의 라인 길이 비가 계산된다.
Figure 112010068561528-pct00038
2개의 이미지 A 및 B에 대한 라인 길이 비 사이의 유사성의 척도 (G1, G2, G3)는 다음과 같이 정의된다.
Figure 112010068561528-pct00039
유리하게는, 이미지 내의 정의된 점들 간의 라인 길이들의 비가 회전, 이동 및 스케일링 등의 변환에 불변이며, 따라서 상기 기하학적 제약조건이 이러한 기하학적 변환을 거친 이미지를 매칭시키는 데 적합하다. 그러나, 설계 요구사항들에 따라, 다른 적당한 기하학적 제약조건들이 사용될 수 있다.
일 실시예에서, 2개의 임계값이 거리 척도에 적용되고, 하나는 개개의 척도의 크기를 제약하고 다른 하나는 거리들의 합을 제약한다.
상기한 테스트들 중 하나 이상을 통과하지 못하는 가설은 유효한 가설들의 집합으로부터 제거된다. 모든 가설들을 테스트한 후에 집합이 비어 있는 경우, 이미지들은 일치하지 않는 것으로 선언된다. 가설이 모든 테스트를 통과한 경우, 4개의 특징 가설을 생성하기 위해 그 다음 단계로 진행한다.
매칭의 제3 단계는 제1 이미지로부터의 N개의 특징들 모두를 제2 이미지로부터의 N개의 특징들 전부와 비교한다. 이제, 3개의 특징 쌍에 대한 가설이 이미 있고, 따라서 목표는 4개의 쌍을 갖는 가설들(현재의 3개의 특징 쌍 가설에 하나 이상의 특징을 추가하는 가설들)의 집합을 구하는 것이다. 단계 1에서와 같이 서명 거리에 기초하여 잠재적 특징들이 발견된다. 가설들의 집합이 제4 특징의 거리에 의해 정렬된다.
단계 4에서, 오수락률(false acceptance rate)을 추가적으로 감소시키기 위해 4개의 특징 가설들의 집합에 대해 기하학적 분석이 수행된다. 제1 기하학적 제약조건은 3개의 특징에 대해서와 같이 특징 방향 방정식 14 및 15에 기초한다. 이전에 사용된 라인들의 비가 유사성 변환에 불변이다. 4개의 특징들을 사용하여, 이하에서 기술되는 면적들의 비를 사용함으로써 불변성(invariance)이 보다 일반적인 affine 변환으로 완화될 수 있다. 이것에 의해 잘못된 일치(false match)를 거부하면서 올바른 일치(true match)를 수락하는 더 엄격한 임계값이 설정될 수 있다.
4개의 특징들의 집합 (a1, a2, a3, a4)으로부터, 3개의 삼각형 (a1a2a3, a2a3a4, a3a4a1, a4a1a2)이 구성될 수 있고, 이들 삼각형의 면적이 다음과 같이 구해질 수 있다:
Figure 112010068561528-pct00040
여기서,
Figure 112010068561528-pct00041
이다. 이어서, 면적비는 다음과 같이 계산될 수 있고
Figure 112010068561528-pct00042
그러면, 이미지 A의 면적비와 이미지 B의 면적비 사이의 거리는 다음과 같이 구해질 수 있다:
Figure 112010068561528-pct00043
2개의 임계값 Tc 및 TD는 특징 집합들 간의 4개의 면적비 거리들의 집합에 적용된다. 제1 임계값은 제1 임계값 Tc를 넘는 면적비 거리 중 임의의 것을 갖는 가설을 거부한다. 제2 임계값은 거리들의 합이 임계값 TD보다 큰 가설을 거부한다. 양호한 실시예에서, Tc=0.15이고 TD=0.4이다.
본 발명의 상기한 실시예들의 이미지 매칭 기법은, GB 0719833.6에 개시된 방법과 같은 다른 이미지 매칭 기법들과 결합될 수 있다. 개별 식별자들 전부를 포함하는 각각의 이미지에 대해 기술자가 생성된다. 양호한 실시예에서, 식별자 비트스트림은 GB 0719833.6에 기초한 2개의 식별자 및 본 발명에 따른 기술자를 포함한다. GB 0719833.6에 기초한 2개의 식별자 중에서, 제1 식별자는 이미지 종횡비를 유지하기 위해 이미지를 사전-처리함으로써 생성되고, 다른 하나는 정사각형으로 처리되는 경우이다.
양호하게는, 먼저 아주 낮은 오경보 임계값에서 GB 0719833.6의 더 빠른 알고리즘을 사용하여 매칭이 수행된다. 임계값보다 낮은 임의의 이미지 쌍이 일치로 간주되고, 임계값보다 높은 쌍들(GB 0719833.6에서 일치로 간주되지 않음)은 이어서 본 발명에 따라 처리된다.
상기한 방법들을 수행하기 위해 일 실시예에 따라 본 발명을 구현하는 장치가 도 6에 도시되어 있다. 이 구현은 이미지 데이터베이스(230)에 저장된 이미지들에 대한 식별자들의 데이터베이스(240)를 구축하는 것을 포함한다. 2개의 데이터베이스(230 및 240)가 동일하거나 개별적인 데이터베이스일 수 있다. 이 장치는 식별자 데이터베이스(140)에서 일치를 찾기 위해 쿼리 이미지(250)로부터 추출된 식별자(260)를 검색하는 것을 가능하게 한다. 가능하게는 순서화된 이미지들의 목록이 사용자(290) 또는 쿼리 응용 프로그램에 반환된다.
당업자라면 잘 알 수 있는 바와 같이, 기술된 실시예들에 많은 변형들 및 수정들이 이루어질 수 있다. 예를 들어, 기술된 실시예들이 특징 검출에 기초하여 이미지 영역들(이들로부터 이미지 서명이 도출됨)을 식별하지만, 이미지를 대표하는(또는 이미지 내에서 의미있는) 이미지 영역들을 식별하기 위해 다른 기법들이 사용될 수 있다. 게다가, 기술된 실시예가 이미지 기울기 방법에 기초하여 특징 검출기를 사용하지만, 이미지에서 관심점들 또는 관심 영역들을 검출하는 데 많은 다른 적당한 방법들이 사용될 수 있다. 유사하게, 최상의 또는 가장 강한 검출된 특징 또는 관심점들을 선택하는 다른 기법들이 가능하다.
또한, 기술된 실시예에서 사용되는 3개의 특징점들의 집합과 연관된 라인 길이들의 비와 관련된 거리 척도 이외의 각종의 기하학적 제약조건들 중 하나 이상을 사용하는 것이 가능하다. 예를 들어, 임의의 수의 특징점들이 거리 척도와 관련하여 사용될 수 있다. 대안으로서, 다른 기하학적 제약조건들이 특징점들 간의 각도에 기초할 수 있다. 게다가, affine 모델이 기하학적 제약조건을 정의하는 데 사용될 수 있다.
본 발명의 정신 및 범위 내에 속하는 모든 이러한 변형, 수정 및 등가물을 포괄하는 것으로 보아야 한다.
대안의 구현들
이상의 설명이 어떤 상황들에서 가설들을 생성하기 위해 맹목적 검색(brute force searching)을 사용하지만, 개략적인 해밍 거리 게산을 가능하게 하는 구조를 사용하는 것이 유익할 수 있다. 이것은 어떤 수준의 검출에 대한 대가로 증가된 검색 속도를 제공할 것이다.
제시된 특징 매칭 방식은 별첨 인용 문헌 4에 제시된 라인들을 따라 확률 모델을 적용하는 것에 적합하다.
인용 문헌
Figure 112010068561528-pct00044

Claims (36)

  1. 이미지에 대응하는 신호들을 처리함으로써 상기 이미지의 표현을 도출하는 방법으로서,
    상기 이미지의 스케일-공간 표현(scale-space representation)을 도출하는 단계;
    진폭 극값(amplitude extrema)을 갖는 복수의 특징점들을 검출하기 위해 상기 스케일-공간 표현을 처리하는 단계;
    상기 검출된 복수의 특징점들 중 하나 이상의 특징점에 대해, 대응하는 특징점과 연관된 스케일-의존적 이미지 영역(scale-dependent image region)을 결정하는 단계; 및
    각각의 결정된 스케일-의존적 이미지 영역에 대한 표현을 도출하는 단계
    를 포함하고,
    상기 방법은,
    상기 검출된 복수의 특징점들 중에서 미리 정해진 수의 특징점들을 선택하는 단계, 및
    상기 선택된 특징점들 각각과 연관된 스케일-의존적 이미지 영역을 결정하는 단계
    를 포함하며,
    상기 선택된 특징점들의 공간적 위치는 실질적으로 상기 이미지에 걸쳐 분산되어 있고, 각각의 선택된 특징점의 공간적 위치는, 특징점이 이전에 선택된 특징들 중 임의의 것을 중심으로 한 제외 영역(exclusion zone) 내에 있는 경우에 선택되지 않는다는 제한으로, 특징점들을 강도의 순서로 선택함으로써, 상기 이미지에서 적어도 미리 정해진 거리만큼 다른 선택된 특징점들로부터 분리되어 있고,
    상기 각각의 결정된 스케일-의존적 이미지 영역에 대한 표현을 도출하는 단계는, Trace 변환을 사용하여, 상기 이미지 영역에 걸쳐 라인 투영(line projections)에 기초한 표현을 도출하는 단계를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    상기 복수의 특징점들은, 2차 이미지 기울기에 기초한 연산자를 상기 이미지의 스케일-공간 표현에 적용하고, 최고 결과값들로 상기 스케일-공간 표현 내의 특징점들을 식별함으로써 검출되는 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 선택하는 단계는 상기 스케일-공간 표현에서의 가장 낮은 진폭값들 또는 임계값보다 낮은 상기 스케일-공간 표현에서의 진폭값들을 갖는 특징점들을 상기 검출된 복수의 특징점들로부터 제거하는 단계를 포함하는 방법.
  4. 제1항 또는 제2항에 있어서,
    상기 선택하는 단계는 상기 이미지에서의 특징점들의 공간적 위치에 따라 특징점들을 상기 검출된 복수의 특징점들로부터 제거하는 단계를 포함하는 방법.
  5. 제1항 또는 제2항에 있어서,
    상기 선택하는 단계는,
    상기 검출된 복수의 특징점들에 연산자를 적용하는 단계 - 상기 연산자가 1차 이미지 기울기에 기초함 -, 및
    임계값보다 낮은 결과 값들을 갖는 특징점들을 제거하는 단계
    를 포함하며,
    예를 들어, 상기 연산자는 스케일 적응(scale adapted) Harris 연산자인 방법.
  6. 제1항 또는 제2항에 있어서,
    상기 스케일-공간 표현에서의 특징점에 대한 스케일-의존적 이미지 영역을 결정하는 단계는 상기 특징점의 공간적 위치와 연관된 상기 이미지의 공간적 영역을 결정하는 단계를 포함하며, 상기 공간적 영역의 크기는 상기 특징점의 스케일에 기초하는 방법.
  7. 제1항 또는 제2항에 있어서,
    스케일-의존적 이미지 영역을 결정하기 전에, 3차 보간(cubic interpolation)을 사용하여, 상기 하나 이상의 특징점들의 공간적 위치를 서브-픽셀 해상도로 미세 조정(refining)하는 단계를 더 포함하는 방법.
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 제1항 또는 제2항에 있어서,
    상기 복수의 특징점들 중 하나 이상의 특징점에 대해, 상기 특징점의 이웃에 걸쳐 적분함으로써, 상기 특징점에 대한 특징 방향을 결정하는 단계를 더 포함하며,
    상기 특징 방향은 이하의 방정식
    Figure 112016061654542-pct00055
    (12)
    을 사용하여 결정되고, 여기서
    Figure 112016061654542-pct00056
    는 공간적 위치(x,y)에서의 상기 특징점의 특징 방향인 방법.
  13. 제1항 또는 제2항에 있어서,
    각각의 결정된 스케일-의존적 이미지 영역에 대한 표현을 도출하는 단계는 상기 스케일-의존적 이미지 영역에 대한 이진 이미지 기술자(binary image descriptor)를 도출하는 단계를 포함하는 방법.
  14. 제1항의 방법을 이용하여 도출된 이미지들의 기술자들을 사용하여 이미지들을 비교하는 방법으로서,
    제1 이미지의 기술자와 연관된 하나 이상의 스케일-의존적 이미지 영역들의 표현들을, 제2 이미지의 기술자와 연관된 하나 이상의 스케일-의존적 이미지 영역들의 표현들과 비교하는 단계
    를 포함하는 방법.
  15. 이미지들 또는 이미지들의 표현들을 저장하기 위한 이미지 데이터베이스;
    식별자 데이터베이스; 및
    제1항 또는 제14항의 방법을 실행하도록 구성되는 프로세서
    를 포함하는 장치.
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
KR1020107023739A 2008-04-23 2009-04-21 이미지 식별을 위한 스케일 안정적 특징-기반 식별자 KR101649766B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0807411.4 2008-04-23
GBGB0807411.4A GB0807411D0 (en) 2008-04-23 2008-04-23 Scale robust feature-based indentfiers for image identification

Publications (2)

Publication Number Publication Date
KR20110002043A KR20110002043A (ko) 2011-01-06
KR101649766B1 true KR101649766B1 (ko) 2016-08-19

Family

ID=39494114

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107023739A KR101649766B1 (ko) 2008-04-23 2009-04-21 이미지 식별을 위한 스케일 안정적 특징-기반 식별자

Country Status (7)

Country Link
US (1) US8831355B2 (ko)
EP (1) EP2294531B1 (ko)
JP (1) JP5427883B2 (ko)
KR (1) KR101649766B1 (ko)
CN (1) CN102016880B (ko)
GB (1) GB0807411D0 (ko)
WO (1) WO2009130451A1 (ko)

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9646005B2 (en) 2005-10-26 2017-05-09 Cortica, Ltd. System and method for creating a database of multimedia content elements assigned to users
US11032017B2 (en) 2005-10-26 2021-06-08 Cortica, Ltd. System and method for identifying the context of multimedia content elements
US11019161B2 (en) 2005-10-26 2021-05-25 Cortica, Ltd. System and method for profiling users interest based on multimedia content analysis
US11386139B2 (en) 2005-10-26 2022-07-12 Cortica Ltd. System and method for generating analytics for entities depicted in multimedia content
US11604847B2 (en) 2005-10-26 2023-03-14 Cortica Ltd. System and method for overlaying content on a multimedia content element based on user interest
US8326775B2 (en) 2005-10-26 2012-12-04 Cortica Ltd. Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof
US20160085733A1 (en) 2005-10-26 2016-03-24 Cortica, Ltd. System and method thereof for dynamically associating a link to an information resource with a multimedia content displayed in a web-page
US20160321253A1 (en) 2005-10-26 2016-11-03 Cortica, Ltd. System and method for providing recommendations based on user profiles
US10742340B2 (en) 2005-10-26 2020-08-11 Cortica Ltd. System and method for identifying the context of multimedia content elements displayed in a web-page and providing contextual filters respective thereto
US20140156901A1 (en) 2005-10-26 2014-06-05 Cortica Ltd. Computing device, a system and a method for parallel processing of data streams
US10848590B2 (en) 2005-10-26 2020-11-24 Cortica Ltd System and method for determining a contextual insight and providing recommendations based thereon
US10949773B2 (en) 2005-10-26 2021-03-16 Cortica, Ltd. System and methods thereof for recommending tags for multimedia content elements based on context
US11361014B2 (en) 2005-10-26 2022-06-14 Cortica Ltd. System and method for completing a user profile
US11403336B2 (en) 2005-10-26 2022-08-02 Cortica Ltd. System and method for removing contextually identical multimedia content elements
US11216498B2 (en) 2005-10-26 2022-01-04 Cortica, Ltd. System and method for generating signatures to three-dimensional multimedia data elements
US11620327B2 (en) 2005-10-26 2023-04-04 Cortica Ltd System and method for determining a contextual insight and generating an interface with recommendations based thereon
US11537636B2 (en) 2007-08-21 2022-12-27 Cortica, Ltd. System and method for using multimedia content as search queries
EP2359272B1 (en) 2008-11-12 2023-07-26 Nokia Corporation Method and apparatus for representing and identifying feature descriptors utilizing a compressed histogram of gradients
US9710491B2 (en) * 2009-11-02 2017-07-18 Microsoft Technology Licensing, Llc Content-based image search
KR101399804B1 (ko) * 2009-11-19 2014-05-27 보드 오브 트러스티스 오브 더 리랜드 스탠포드 주니어 유니버시티 회전 불변형 특징 디스크립터를 이용한 추적 및 인식을 위한 방법 및 장치
KR101117239B1 (ko) * 2010-01-12 2012-03-20 키위플 주식회사 객체 인식시스템 및 이를 이용하는 객체 인식 방법
JP5578965B2 (ja) 2010-07-02 2014-08-27 富士フイルム株式会社 オブジェクト推定装置および方法ならびにプログラム
US8483427B2 (en) * 2010-09-28 2013-07-09 Futurewei Technologies, Inc. System and method for image authentication
US20120137377A1 (en) * 2010-11-30 2012-05-31 ZOO Digital Limited, a Limited Company Method and system for safeguarding digital objects consisting of digital assets
US9008424B2 (en) 2011-01-25 2015-04-14 Telecom Italia S.P.A. Method and system for comparing images
JP2012234258A (ja) * 2011-04-28 2012-11-29 Sony Corp 画像処理装置と画像処理方法およびプログラム
US9245204B2 (en) 2012-01-02 2016-01-26 Telecom Italia S.P.A. Method and system for comparing images
KR20140102038A (ko) * 2013-02-13 2014-08-21 삼성전자주식회사 영상 정합 장치 및 영상 정합 방법
WO2014175481A1 (ko) * 2013-04-24 2014-10-30 전자부품연구원 서술자 생성 방법 및 이를 구현하는 하드웨어 장치
KR101418524B1 (ko) * 2013-04-24 2014-08-06 전자부품연구원 하드웨어 장치 및 적분 이미지 생성 방법
WO2014175480A1 (ko) * 2013-04-24 2014-10-30 전자부품연구원 하드웨어 장치 및 적분 이미지 생성 방법
CN104123532B (zh) * 2013-04-28 2017-05-10 浙江大华技术股份有限公司 对目标对象进行检测、确定目标对象数量的方法和设备
CN104182719B (zh) * 2013-05-21 2017-06-30 宁波华易基业信息科技有限公司 一种图像识别方法及装置
ES2901385T3 (es) * 2013-12-12 2022-03-22 Fund Centro De Tecnologias De Interaccion Visual Y Comunicaciones Vicomtech Método y sistema para describir una imagen
JP6095559B2 (ja) * 2013-12-17 2017-03-15 日本電信電話株式会社 特徴抽出装置、方法、及びプログラム
JP6448767B2 (ja) 2014-04-24 2019-01-09 ナント・ホールデイングス・アイ・ピー・エル・エル・シー 画像物体認識におけるロバスト特徴特定
CN105224582B (zh) * 2014-07-03 2018-11-09 联想(北京)有限公司 信息处理方法和设备
US9805099B2 (en) * 2014-10-30 2017-10-31 The Johns Hopkins University Apparatus and method for efficient identification of code similarity
CN104933434A (zh) * 2015-06-16 2015-09-23 同济大学 一种结合LBP特征提取和surf特征提取方法的图像匹配方法
US9390315B1 (en) * 2015-06-25 2016-07-12 A9.Com, Inc. Image match for featureless objects
CN105069403B (zh) * 2015-07-20 2018-10-26 同济大学 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别
CN105005794B (zh) * 2015-07-21 2018-06-05 太原理工大学 融合多粒度上下文信息的图像像素语义标注方法
US9727800B2 (en) * 2015-09-25 2017-08-08 Qualcomm Incorporated Optimized object detection
US11037015B2 (en) 2015-12-15 2021-06-15 Cortica Ltd. Identification of key points in multimedia data elements
US11195043B2 (en) 2015-12-15 2021-12-07 Cortica, Ltd. System and method for determining common patterns in multimedia content elements based on key points
CN105574528B (zh) * 2015-12-15 2019-01-22 安徽工业大学 一种基于多相互斥水平集的黏连细胞图像分割方法
CN109074369B (zh) 2016-03-08 2022-03-04 河谷控股Ip有限责任公司 用于基于图像的对象识别的图像特征组合
CN106302124A (zh) * 2016-08-18 2017-01-04 北京奇虎科技有限公司 一种添加特效的方法及电子设备
KR101870355B1 (ko) * 2017-01-31 2018-06-22 서울대학교병원 영상 처리 방법
US11760387B2 (en) 2017-07-05 2023-09-19 AutoBrains Technologies Ltd. Driving policies determination
US11899707B2 (en) 2017-07-09 2024-02-13 Cortica Ltd. Driving policies determination
US10740431B2 (en) * 2017-11-13 2020-08-11 Samsung Electronics Co., Ltd Apparatus and method of five dimensional (5D) video stabilization with camera and gyroscope fusion
US10846544B2 (en) 2018-07-16 2020-11-24 Cartica Ai Ltd. Transportation prediction system and method
US11613261B2 (en) 2018-09-05 2023-03-28 Autobrains Technologies Ltd Generating a database and alerting about improperly driven vehicles
US20200133308A1 (en) 2018-10-18 2020-04-30 Cartica Ai Ltd Vehicle to vehicle (v2v) communication less truck platooning
US10839694B2 (en) 2018-10-18 2020-11-17 Cartica Ai Ltd Blind spot alert
US11392738B2 (en) 2018-10-26 2022-07-19 Autobrains Technologies Ltd Generating a simulation scenario
US11904863B2 (en) 2018-10-26 2024-02-20 AutoBrains Technologies Ltd. Passing a curve
US11700356B2 (en) 2018-10-26 2023-07-11 AutoBrains Technologies Ltd. Control transfer of a vehicle
US10789535B2 (en) 2018-11-26 2020-09-29 Cartica Ai Ltd Detection of road elements
US11170647B2 (en) 2019-02-07 2021-11-09 Cartica Ai Ltd. Detection of vacant parking spaces
US11643005B2 (en) 2019-02-27 2023-05-09 Autobrains Technologies Ltd Adjusting adjustable headlights of a vehicle
US11285963B2 (en) 2019-03-10 2022-03-29 Cartica Ai Ltd. Driver-based prediction of dangerous events
US11694088B2 (en) 2019-03-13 2023-07-04 Cortica Ltd. Method for object detection using knowledge distillation
US11132548B2 (en) 2019-03-20 2021-09-28 Cortica Ltd. Determining object information that does not explicitly appear in a media unit signature
US11908242B2 (en) 2019-03-31 2024-02-20 Cortica Ltd. Efficient calculation of a robust signature of a media unit
US10776669B1 (en) 2019-03-31 2020-09-15 Cortica Ltd. Signature generation and object detection that refer to rare scenes
US11488290B2 (en) * 2019-03-31 2022-11-01 Cortica Ltd. Hybrid representation of a media unit
US11222069B2 (en) 2019-03-31 2022-01-11 Cortica Ltd. Low-power calculation of a signature of a media unit
CN112150533A (zh) * 2019-06-28 2020-12-29 顺丰科技有限公司 物体体积计算方法、装置、设备、及存储介质
US11704292B2 (en) 2019-09-26 2023-07-18 Cortica Ltd. System and method for enriching a concept database
CN111008955B (zh) * 2019-11-06 2023-05-26 重庆邮电大学 多尺度图像块匹配的快速复制粘贴篡改检测方法
US11593662B2 (en) 2019-12-12 2023-02-28 Autobrains Technologies Ltd Unsupervised cluster generation
US11590988B2 (en) 2020-03-19 2023-02-28 Autobrains Technologies Ltd Predictive turning assistant
US11827215B2 (en) 2020-03-31 2023-11-28 AutoBrains Technologies Ltd. Method for training a driving related object detector
CN112966694A (zh) * 2021-02-02 2021-06-15 哈尔滨商业大学 一种应用于图像匹配的尺度不变特征点提取方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005317020A (ja) * 2004-04-27 2005-11-10 Microsoft Corp マルチスケールの有向パッチ(multi−scaleorientedpatches)を使用したマルチ画像フィーチャ(feature)のマッチング

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0674794B1 (en) * 1993-10-15 2000-03-22 AT&T Corp. Method for classification of images using distribution maps
KR100215450B1 (ko) * 1996-05-17 1999-08-16 윤종용 불규칙메쉬들을 이용한 대상물 지향 화상표현방법및그장치
US6215898B1 (en) * 1997-04-15 2001-04-10 Interval Research Corporation Data processing system and method
JP3568732B2 (ja) * 1997-04-18 2004-09-22 シャープ株式会社 画像処理装置
US6711293B1 (en) * 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
KR100308456B1 (ko) 1999-07-09 2001-11-02 오길록 주파수 공간상에서의 질감표현방법 및 질감기반 검색방법
US6975755B1 (en) * 1999-11-25 2005-12-13 Canon Kabushiki Kaisha Image processing method and apparatus
EP1390814A2 (en) * 2001-05-30 2004-02-25 Nptest, Inc. Sub-resolution alignment of images
JP4060615B2 (ja) 2002-03-05 2008-03-12 株式会社東芝 画像処理装置及び超音波診断装置
US7542036B2 (en) * 2003-02-19 2009-06-02 California Institute Of Technology Level set surface editing operators
JP4392584B2 (ja) * 2003-06-27 2010-01-06 ソニー株式会社 信号処理装置および信号処理方法、並びにプログラムおよび記録媒体
JP2005208979A (ja) 2004-01-23 2005-08-04 Fuji Xerox Co Ltd 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置
JP2006293949A (ja) * 2005-03-17 2006-10-26 Sharp Corp 画像照合装置、画像照合方法、画像照合プログラムおよび画像照合プログラムを記録したコンピュータ読取り可能な記録媒体
JP4518092B2 (ja) * 2006-03-31 2010-08-04 ソニー株式会社 物体認識装置、物体認識方法、物体認識プログラム、特徴量登録装置、特徴量登録方法、及び特徴量登録プログラム
JP4791233B2 (ja) 2006-04-10 2011-10-12 三菱電機株式会社 画像処理装置、画像処理方法、画像出力装置、画像処理システム
US7680341B2 (en) * 2006-05-05 2010-03-16 Xerox Corporation Generic visual classification with gradient components-based dimensionality enhancement
EP2315161A1 (en) * 2006-10-11 2011-04-27 Mitsubishi Electric Information Technology Centre Europe B.V. Image descriptor for image recognition
GB0700468D0 (en) 2007-01-10 2007-02-21 Mitsubishi Electric Inf Tech Improved image identification
WO2008123969A1 (en) * 2007-04-02 2008-10-16 The Trustees Of The University Of Pennsylvania Combined feature ensemble mutual information image registration
GB0712388D0 (en) 2007-06-26 2007-08-01 Mitsubishi Electric Inf Tech High Performance Image Identification
GB0719833D0 (en) 2007-10-10 2007-11-21 Mitsubishi Electric Inf Tech Enhanced image identification
US8064679B2 (en) * 2007-12-27 2011-11-22 Cytyc Corporation Targeted edge detection method and apparatus for cytological image processing applications
GB0800364D0 (en) 2008-01-09 2008-02-20 Mitsubishi Electric Inf Tech Feature-based signatures for image identification

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005317020A (ja) * 2004-04-27 2005-11-10 Microsoft Corp マルチスケールの有向パッチ(multi−scaleorientedpatches)を使用したマルチ画像フィーチャ(feature)のマッチング

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Brasnett et al. Robust visual identifier using the trace transform. Proc. of IET visual information engineering conference (VIE), July 2007*
Mikolajczyk et al. Scale & affine invariant interest point detectors. International journal of computer vision, 2004, Vol. 60, No. 1, pp. 63-86.*

Also Published As

Publication number Publication date
CN102016880B (zh) 2014-04-09
KR20110002043A (ko) 2011-01-06
JP2011519090A (ja) 2011-06-30
EP2294531B1 (en) 2014-07-02
US8831355B2 (en) 2014-09-09
US20110038545A1 (en) 2011-02-17
WO2009130451A1 (en) 2009-10-29
CN102016880A (zh) 2011-04-13
JP5427883B2 (ja) 2014-02-26
EP2294531A1 (en) 2011-03-16
GB0807411D0 (en) 2008-05-28

Similar Documents

Publication Publication Date Title
KR101649766B1 (ko) 이미지 식별을 위한 스케일 안정적 특징-기반 식별자
Shabanian et al. A new approach for detecting copy-move forgery in digital images
Kwon et al. Learning jpeg compression artifacts for image manipulation detection and localization
Niyishaka et al. Copy-move forgery detection using image blobs and BRISK feature
JP5431362B2 (ja) 画像識別のための特徴ベースの識別特性(signature)
EP2138978B1 (en) System and method for finding stable keypoints in a picture image using localized scale space properties
EP2534612B1 (en) Efficient scale-space extraction and description of interest points
JP2010506323A (ja) 画像認識のための画像記述子
Shreyas et al. Fingerprint authentication using geometric features
Elaskily et al. Comparative study of copy-move forgery detection techniques
Thajeel et al. A Novel Approach for Detection of Copy Move Forgery using Completed Robust Local Binary Pattern.
Brogan et al. Spotting the difference: Context retrieval and analysis for improved forgery detection and localization
Isaac et al. Image forgery detection using region–based Rotation Invariant Co-occurrences among adjacent LBPs
Soni et al. Image forensic using block-based copy-move forgery detection
Tralic et al. Copy-move forgery detection using cellular automata
Karanwal Analysis on Image Enhancement Techniques
KR100888674B1 (ko) 주파수영역을 이용한 지폐의 유사도 측정방법
Karsh et al. Copy-move forgery detection using ASIFT
CN113077410A (zh) 图像检测方法、装置方法、芯片及计算机可读存储介质
Hashmi et al. Passive Detection of Copy-Move Forgery using Wavelet Transforms and SIFT Features.
Li et al. A fast rotated template matching based on point feature
Chu et al. Image-guided tours: fast-approximated sift with u-surf features
Mahdian et al. Detection of near-duplicated image regions
Sadu et al. A Detection Method for Copy-Move Forgery Attacks in Digital Images
Shu Edge extraction from multispectral images and density analysis of superdimensional spectral space

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20190718

Year of fee payment: 4