KR20070118156A - 검색 시스템 및 검색 방법 - Google Patents

검색 시스템 및 검색 방법 Download PDF

Info

Publication number
KR20070118156A
KR20070118156A KR1020077025085A KR20077025085A KR20070118156A KR 20070118156 A KR20070118156 A KR 20070118156A KR 1020077025085 A KR1020077025085 A KR 1020077025085A KR 20077025085 A KR20077025085 A KR 20077025085A KR 20070118156 A KR20070118156 A KR 20070118156A
Authority
KR
South Korea
Prior art keywords
image
template
image data
matching
database
Prior art date
Application number
KR1020077025085A
Other languages
English (en)
Inventor
나오히로 후꾸야마
유이찌로 아까쯔까
다까오 시바사끼
Original Assignee
올림푸스 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 올림푸스 가부시키가이샤 filed Critical 올림푸스 가부시키가이샤
Publication of KR20070118156A publication Critical patent/KR20070118156A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Abstract

촬상하여 얻어진 화상 데이터에 기초하여, 개요 템플릿(21)을 사용한 템플릿 매칭에 의해 전체 특징량 DB를 구성한 스토리지(20)로부터 복수의 화상 데이터를 검색하고, 그 검색한 결과의 복수의 화상 데이터로부터, 상기 개요 템플릿(21)보다 좁은 영역이며 또한 해상도가 높은 상세 템플릿(22)을 사용하여, 템플릿 매칭에 의해 단일 또는 복수의 화상 데이터를 검색한다.
개요 템플릿, 템플릿 매칭, 스토리지, 검색원 프린트 아웃, 원화상 데이터, 상세 템플릿

Description

검색 시스템 및 검색 방법{RETRIEVAL SYSTEM AND RETRIEVAL METHOD}
본 발명은, 데이터베이스로부터 화상 데이터를 검색하는 검색 시스템 및 검색 방법에 관한 것이다.
최근, 디지털 카메라로 촬영한 화상 데이터에 대해서도, 은염 카메라로 촬영한 화상과 마찬가지로, 그것을 프린트 아웃하여 즐기는 것이 널리 행하여지고 있다.
그와 같이 프린트 아웃하게 된 화상 데이터를 재프린트하고자 할 때, 그 화상 데이터의 부대 정보(파일명, 촬영 일시, 등)를 참고로, 화상 기억 매체로부터 유저가 검색해야만 하여, 매우 수고스러운 것이었다.
따라서, 예를 들면, 일본 특개 2001-88374호 공보에는, 화상 데이터 공급원으로부터 한번 프린트 아웃한 화상의 데이터를 간이하게 찾아내는 것을 목적으로, 프린트 아웃한 화상 데이터를 보존해 두고, 키워드 검색 등을 행할 수 있도록 한 스토리지 프린터가 제안되어 있다.
<발명의 개시>
그러나, 상기 일본 특개 2001-88374호 공보에 개시된 스토리지 프린터에서는, 키워드 분류에 의한 검색을 행하기 때문에, 사전에 유저가 분류할 필요가 있 어, 수고스러웠다.
또한, 큰 모집단으로부터, 템플릿 매칭에 의해 원하는 화상 데이터를 검색하는 경우, 인식률 향상을 위해 그대로 해상도가 높은 템플릿을 적용하면, 연산 시간이 증가하는 경향이 있기 때문에, 고속화 방법이 필요로 되고 있다.
본 발명은, 상기한 점을 감안하여 이루어진 것으로, 데이터베이스로부터 화상 데이터를 용이하게 또한 고속으로 찾아내는 것이 가능한 검색 시스템 및 검색 방법을 제공하는 것을 목적으로 한다.
본 발명의 검색 시스템의 일 양태는, 화상을 입력하는 화상 입력 수단과, 상기 화상 입력 수단에 의해 입력된 화상에 기초하여, 제1 템플릿을 사용한 템플릿 매칭에 의해 데이터베이스로부터 복수의 화상을 검색하고, 그 검색한 결과의 복수의 화상으로부터, 상기 제1 템플릿보다 좁은 영역이며 또한 해상도가 높은 제2 템플릿을 사용하여, 템플릿 매칭에 의해 단일 또는 복수의 화상을 검색하는 화상 검색 수단을 구비하는 것을 특징으로 한다.
또한, 본 발명의 검색 시스템의 다른 양태는, 화상을 입력하는 화상 입력 수단과, 상기 화상 입력 수단에 의해 입력된 화상에 기초하여, 부분적으로 해상도를 높인 템플릿에 의한 템플릿 매칭에 의해 데이터베이스로부터 단일 또는 복수의 화상을 검색하는 화상 검색 수단을 구비하는 것을 특징으로 한다.
또한, 본 발명의 검색 방법의 일 양태는, 화상을 입력하고, 상기 입력된 화상에 기초하여, 제1 템플릿을 사용한 템플릿 매칭에 의해 데이터베이스로부터 복수의 화상을 검색하고, 상기 검색한 결과의 복수의 화상으로부터, 상기 제1 템플릿보 다 좁은 영역이며 또한 해상도가 높은 제2 템플릿을 사용하여, 템플릿 매칭에 의해 단일 또는 복수의 화상을 검색하는 것을 특징으로 한다.
또한, 본 발명의 검색 방법의 다른 양태는, 화상을 입력하고, 상기 입력된 화상에 기초하여, 부분적으로 해상도를 높인 템플릿에 의한 템플릿 매칭에 의해 데이터베이스로부터 단일 또는 복수의 화상을 검색하는 것을 특징으로 한다.
도 1은 본 발명의 제1 실시예에 따른 검색 시스템의 개략구성을 도시하는 도면.
도 2는 개요 템플릿을 설명하기 위한 도면.
도 3은 상세 템플릿을 설명하기 위한 도면.
도 4는 원화상 데이터와 개요 템플릿 및 상세 템플릿의 위치 관계를 설명하기 위한 도면.
도 5는 제1 실시예에 따른 검색 시스템의 블록 구성도.
도 6은 제1 실시예에 따른 검색 시스템의 동작 플로우차트를 도시하는 도면.
도 7은 프린트 아웃의 잘라냄 처리의 상세 플로우차트를 도시하는 도면.
도 8은 DB와의 매칭 처리의 상세 플로우차트를 도시하는 도면.
도 9는 화상 후보를 1점만 표시하는 경우의 디지털 카메라의 표시부의 표시 화면을 도시하는 도면.
도 10은 9점의 화상 후보를 표시하는 경우의 표시 화면을 도시하는 도면.
도 11은 화상 데이터의 중앙부에 주목한 상세 템플릿을 설명하기 위한 도면.
도 12는 화상 내에 수개소 분산 배치한 상세 템플릿을 설명하기 위한 도면.
도 13은 주목 영역을 원화상 데이터 촬영 시의 합초 위치에 둔 상세 템플릿을 설명하기 위한 도면.
도 14는 개요 템플릿과 상세 템플릿을 동일 화상에 넣은 복합 템플릿을 설명하기 위한 도면.
도 15는 16×16 템플릿과, 128×128 템플릿과, 그들을 조합한 복합 템플릿을 도시하는 도면.
도 16은 개요 템플릿과 동일한 영역에 대하여 작성한 상세 템플릿을 설명하기 위한 도면.
도 17은 특징량 데이터베이스의 작성 방법을 설명하기 위한 플로우차트를 도시하는 도면.
도 18은 특징량 데이터베이스의 작성 방법의 다른 예를 설명하기 위한 플로우차트를 도시하는 도면.
도 19는 특징량 데이터베이스의 작성 방법의 또 다른 예를 설명하기 위한 플로우차트를 도시하는 도면.
도 20은 특징량 데이터베이스의 작성 방법의 다른 예를 설명하기 위한 플로우차트를 도시하는 도면.
도 21은 본 발명의 제2 실시예에 따른 검색 시스템의 블록 구성도.
도 22는 제2 실시예에 따른 검색 시스템의 동작 플로우차트를 도시하는 도면.
도 23은 프린트 아웃의 촬상 처리의 상세 플로우차트를 도시하는 도면.
도 24는 특징량 데이터베이스의 작성 방법을 설명하기 위한 플로우차트를 도시하는 도면.
도 25는 촬영 시 등에서의 견본 화상으로의 유도 기능을 디지털 카메라에 적용한 예를 도시하는 도면.
도 26은 유도의 표시예를 도시하는 도면.
도 27은 유도의 다른 표시예를 도시하는 도면.
도 28은 본 발명의 제3 실시예에 따른 검색 시스템의 동작 플로우차트를 도시하는 도면.
<발명을 실시하기 위한 최량의 형태>
이하, 본 발명을 실시하기 위한 최량의 형태를 도면을 참조하여 설명한다.
[제1 실시예]
본 발명의 제1 실시예에 따른 검색 시스템은, 도 1에 도시하는 바와 같이, 디지털 카메라(10)와, 스토리지(20)와, 프린터(30)로 구성된다. 여기서, 스토리지(20)는, 복수의 화상 데이터를 저장하는 것이고, 프린터(30)는, 그 스토리지(20)에 저장된 화상 데이터를 프린트 아웃한다.
예를 들면, 스토리지(20)는, 디지털 카메라(10)에 내장 내지는 착탈 가능한 메모리이며, 프린터(30)는, 디지털 카메라(10)로부터의 프린트 아웃 지시에 따라서, 그 스토리지(20)인 메모리 내의 화상 데이터를 프린트 아웃한다. 혹은, 스토리지(20)는, 디지털 카메라(10)에 접속 단자, 케이블, 혹은 무선/유선 네트워크를 통하여 접속되거나, 혹은, 디지털 카메라(10)로부터 떼어내어진 메모리를 장착하여, 화상 데이터를 전송할 수 있는 디바이스이어도 된다. 그 경우에는, 프린터(30)는, 스토리지(20)에 접속 또는 일체적으로 구성되며, 디지털 카메라(10)로부터의 프린트 아웃 지시에 따라서 프린트 아웃을 실행하는 것이어도 된다.
또한, 스토리지(20)는, 특징량에 의해 화상 데이터가 검색 가능하게 구성된 데이터베이스의 기능도 구비한다. 즉, 스토리지(20)는, 원화상의 디지털 데이터로부터 작성된 특징량 데이터(템플릿)군을 저장한 특징량 데이터베이스를 구성하고 있다.
이 경우, 제1 템플릿으로서의 개요 템플릿을 등록한 전체 특징량 데이터베이스와, 제2 템플릿으로서의 상세 템플릿을 등록한 상세 특징량 데이터베이스를 포함한다. 또한, 특징량은, 소정의 해상도에 상당하는 화상 데이터 내의 분할 에리어, 즉 미리 정해진 격자에 의해 할당된 소영역의 상대 농도 등을 사용하는 것이어도 되고, 분할 에리어마다의 푸리에 변환값 등에 기초한 것이어도 된다.
여기서, 개요 템플릿(21)은, 도 2에 도시하는 바와 같이, 화상 데이터(50)의 전체(100%)의 대부분(예를 들면 약 90%)을 포함하는 영역을 비교적 거친 해상도(분할 에리어)로 특징량 데이터를 추출함으로써 얻어진 것이다. 또한, 상세 템플릿(22)은, 도 3에 도시하는 바와 같이, 화상 데이터(50)의 중앙 영역 부분(예를 들면 중앙 약 25%)을 포함하는 영역을, 상기 개요 템플릿(21)의 해상도에 비하여 높은 해상도로 특징량 데이터를 추출함으로써 얻어진 것이다. 또한, 원화상 데이터와 상기 개요 템플릿(21) 및 상세 템플릿(22)의 위치 관계는, 도 4에 도시하는 바 와 같이 된다.
이와 같은 구성의 검색 시스템은, 이하와 같이 동작한다.
(1) 우선, 디지털 카메라(10)는, 프린터(30)에 의해 일단 프린트 아웃된 검색원 프린트 아웃(1)의 화상을 포함하는 피사체를 촬영한다. 그리고, 얻어진 촬영 화상 데이터로부터, 그 검색원 프린트 아웃(1)의 화상에 대응하는 영역을 추출하고, 그 추출한 영역의 특징량을 추출한다.
(2) 그리고, 디지털 카메라(10)는, 그 추출한 특징량에 의해 스토리지(20)에 저장된 개요 템플릿(21) 및 상세 템플릿(22)과 템플릿 매칭 처리를 실행한다.
(3) 그 결과, 디지털 카메라(10)는, 매치한 템플릿에 대응하는 화상 데이터를, 상기 검색원 프린트 아웃(1)의 원화상 데이터인 것으로 하여, 스토리지(20)로부터 읽어낸다.
(4) 이에 의해, 디지털 카메라(10)는, 그 읽어낸 원화상 데이터를, 다시, 프린터(30)에서 프린트 아웃할 수 있다.
또한, 검색원 프린트 아웃(1)으로서는, 1매 단위로 출력된 프린트 아웃 이외에, 복수의 축소 화상을 통합하여 출력한 인덱스 프린트를 사용하는 것도 가능하다. 이것은, 인덱스 프린트로부터 필요한 것을 선택하여, 추가 인화하는 쪽이 코스트면이나 편의성이 좋기 때문이다.
또한, 검색원 프린트 아웃(1)에 대해서는, 시스템 내의 스토리지(20)에 구성한 특징량 데이터베이스에 원화상 데이터가 있는 화상이면, 시스템 밖(도시 생략)의 프린터로 프린트 아웃한 것이어도 된다.
이하, 본 제1 실시예에 따른 검색 시스템을, 도 5에 도시하는 블록 구성도 및 도 6에 도시하는 동작 플로우차트를 참조하여, 상세하게 설명한다. 또한, 디지털 카메라(10)는, 통상의 촬영 모드와는 별도로, 촬영된 데이터의 검색 모드를 갖고, 도 6의 동작 플로우차트는, 그 검색 모드로 설정되어 있는 경우의 처리를 도시하고 있다.
즉, 유저는, 상기 검색 모드로 설정한 후, 재차 프린트 아웃하는 것을 원하는 검색원 프린트 아웃(1)을 테이블 위 혹은 벽면 등에 접착한 상태에서, 디지털 카메라(10)의 촬상부(11)에 의해, 적어도 상기 검색원 프린트 아웃(1)의 누락이 없도록 촬영한다(스텝 S11).
그러면, 디지털 카메라(10)에서는, 영역 추출부(12)에서, 촬상부(11)에서 촬영된 화상 데이터 중으로부터, 상기 검색원 프린트 아웃(1)의 화상을 특정하고, 그 부분을 특정하여 추출하기 위한 프린트 아웃의 잘라냄 처리를 실행한다(스텝 S12).
이 프린트 아웃의 잘라냄 처리는, 도 7에 도시하는 바와 같이, 우선, 촬영된 화상 데이터 중의 선분을 검출하고(스텝 S121), 그들 검출된 선분 중으로부터 직선을 검출한다(스텝 S122). 그리고, 그들 검출한 직선 4개로 구성되는 틀을 추정한다(스텝 S123). 즉, 4변으로 둘러싸인 관심 영역을 촬영된 화상 데이터 중으로부터 찾아낸다. 또한, 그와 같은 4변으로 둘러싸인 영역이 복수 있는 경우에는, 그 중에서 가장 면적이 큰 부분을 관심 영역으로서 추출하거나, 혹은 사각형의 종횡비 등으로부터 관심 영역을 특정하면 된다. 또한, 드물게, 촬영된 화상 데이터 중에서 검색원 프린트 아웃(1) 자체가 휨이 생겨, 그 결과, 4변으로 둘러싸인 영역이라 고 특정할 수 없는 경우가 있다. 이 경우, 4변 중 몇 갠가가 완만한 원호로 구성되어 있어도 그것을 허용하는 처리를 행하는 것도 유효하다. 또한, 여기서 검색원 프린트 아웃(1)으로 보여지는 영역을 추출한 후, 그 화상 데이터 영역을 아핀 변환 등에 의해 정규화하는 처리도 포함하고 있다.
다음으로, 특징량 추출부(13)에 의해, 상기 영역 추출부(12)에서 특정되어 추출된 관심 영역의 화상 데이터 전체로부터 특징량을 추출하는 전체 특징량 추출 처리를 행한다(스텝 S13). 그리고 그 후, 매칭부(14)에 의해, 상기 특징량 추출부(13)에서 추출한 전체 특징량 데이터를, 스토리지(20)에 구성한 상기 개요 템플릿(21)을 등록한 전체 특징량 데이터베이스와 비교하고, 그 유사도가 높은 것을 순서대로 추출하는 전체 특징량 DB와의 매칭 처리를 실행한다(스텝 S14).
즉, 이 전체 특징량 DB와의 매칭 처리는, 도 8에 도시하는 바와 같이, 우선, 각 개요 템플릿(21)과의 유사도를 산출하고(스텝 S141), 유사도에 기초하여 소트한다(스텝 S142). 그리고, 그 유사도에 따라서 원화상 후보를 선출한다(스텝 S143). 또한, 이 선출은, 임계값을 설정해도 되고, 유사도가 높은 순으로 상위의 것을 지정해도 된다. 어쨌든, 유사도가 최상위인 것을 1점 선출하는 방법과, 유사도가 높은 것부터 복수점을 선출하는 방법의 2종의 방법이 있다.
그 후, 상기 영역 추출부(12)에서, 상기 특정되어 추출된 관심 영역 전체의 화상 데이터로부터, 다시 상세 검색 대상 영역, 이 예에서는 상기 관심 영역의 중앙 영역부의 화상 데이터를 상세 검색 대상 화상 데이터로서 추출한다(스텝 S15). 그리고, 특징량 추출부(13)에 의해, 상기 영역 추출부(12)에서 추출한 상세 검색 대상 화상 데이터로부터 특징량을 추출하는 상세 특징량 추출 처리를 행하고(스텝 S16), 그 추출한 상세 특징량 데이터를, 매칭부(14)에 의해, 스토리지(20)에 구성한 상기 상세 템플릿(22)을 등록한 상세 특징량 데이터베이스와 비교하여, 그 유사도가 높은 것을 순서대로 추출하는 상세 특징량 DB와의 매칭 처리를 실행한다(스텝 S17). 단 이 경우, 상세 특징량 데이터베이스에 등록된 모든 상세 템플릿(22)과의 템플릿 매칭을 행하는 것이 아니라, 상기 스텝 S14의 전체 특징량 DB와의 매칭 처리에서 추출된 복수의 원화상 후보에 대응하는 상세 템플릿(22)에 대해서만 템플릿 매칭이 실행된다. 따라서, 해상도가 높기 때문에 처리 시간을 요하는 상세 템플릿(22)과의 템플릿 매칭 처리는, 필요 최저한으로 완료되게 된다. 또한, 상기 스텝 S14의 전체 특징량 DB와의 매칭 처리에서의 추출하는 기준으로서는, 유사도에 임계값을 설정하는 방법이나 상위 500개분 고정적으로 선택하는 것 등과 같은 방법으로 행한다.
그런데, 이 상세 특징량 DB와의 매칭 처리에서 유사도가 높은 화상 데이터가 원화상 후보로서 추출되었다면, 다음으로, 표시부(15)에, 상기 추출된 원화상 후보의 화상 데이터를 스토리지(20)로부터 읽어내어, 추출할 화상 후보로서 표시하고(스텝 S18), 유저에 의한 선택을 접수한다(스텝 S19).
도 9는, 화상 후보를 1점만 표시하는 경우의 표시부(15)의 표시 화면을 도시하고 있다. 이 표시 화면에서는, 화상 후보(151)의 표시의 옆에, 다른 화상 후보의 표시를 지시할 때에 조작할 버튼을 나타내는 『앞』 및 『다음』 아이콘(152)과, 그 화상 후보(151)를 원하는 화상 데이터로서 지시할 때에 조작할 버튼을 나타 내는 『결정』 아이콘(153)이 배치된다. 『앞』 및 『다음』 아이콘(152)은, 디지털 카메라(10)가 통상 구비하는 소위 십자 키의 왼쪽 키 및 오른쪽 키인 것을 나타내며, 『결정』 아이콘(153)은 그 십자 버튼의 한가운데에 배치되는 엔터 키인 것을 나타낸다.
여기서, 『앞』 및 『다음』 아이콘(152)에 상당하는 십자 키가 조작된 경우에는(스텝 S20), 상기 스텝 S18로 되돌아가서, 화상 후보(151)를 갱신 표시한다. 이에 대하여, 『결정』 아이콘(153)에 상당하는 엔터 키가 조작된 경우에는(스텝 S20), 매칭부(14)는, 스토리지(20)에 저장되어 있는 그 화상 후보(151)에 대응하는 원화상 데이터를, 접속된 프린터(30)로 보내어, 재차 프린트 아웃한다(스텝 S21). 또한, 프린터(30)에 유선/무선으로 직접 접속되어 있지 않은 경우에는, 스토리지(20)에 저장되어 있는 그 화상 후보(151)에 대응하는 원화상 데이터에, 플래그를 추기하는 등의 소정의 마킹을 행하는 처리를 실행함으로써, 그 스토리지(20)에 액세스 가능한 프린터(30)로 프린트 아웃하는 것을 가능하게 한다.
또한, 상기 스텝 S18의 화상 후보의 표시에서, 복수의 후보를 동시에 표시하도록 해도 된다. 이 경우, 통상 디지털 카메라(10)에 설치되어 있는 표시부(15)는 당연 수인치의 소형의 것이기 때문에, 4점 혹은 9점 정도의 표시가 사용하기 쉽다. 도 10은, 9점의 화상 후보(151)를 표시하도록 한 예를 도시하고 있다. 이 경우, 『앞』 및 『다음』 아이콘(152)에 상당하는 십자 키의 왼쪽 키 및 오른쪽 키의 조작에 따라서, 선택 화상을 나타내는 굵은 틀(154)이 이동된다. 또한, 특별히 도시는 하지 않지만, 십자 키의 위 키 및 아래 키의 조작에 따라서, 9점의 화상 후 보(151)의 표시를 앞 및 다음의 9점의 화상 후보의 표시로 변경하는, 소위 페이지 절환 표시를 행하도록 해도 된다.
이러한 본 실시예에 따르면, 원화상 데이터의 검색 결과의 질(만족도) 향상과, 타당한 검색 시간의 양립이 가능하다.
또한, 촬영자의 주목 영역을 고려한 검색 결과를 얻을 수 있다. 즉, 통상적으로, 촬영자는 주요 피사체를 화상 중앙에 포착하여 촬영하므로, 도 11에 도시하는 바와 같이, 화상 데이터의 중앙부에 주목한 상세 템플릿(22)을 사용함으로써, 양호한 검색 결과를 얻을 수 있다. 따라서, 프린트 아웃한 사진인 검색원 프린트 아웃(1)으로부터, 그 원화상 데이터를 검색 추출하여, 추가 인화를 용이하게 행하는 시스템에서, 그 프린트 사진의 검색에서 효과가 높다.
또한, 키워드 분류 등이 어려운 원화상 모집단에 대한 검색에서, 고속으로 세부의 차이를 판별하는 수단으로서의 효과가 높다. 즉, 대규모의 모집단에 대한, 단계적인 검색 결과 좁혀 들어감이 가능하게 된다.
또한, 상세 템플릿(22)은, 도 3이나 도 11에 도시한 바와 같이, 화상 데이터의 중앙부에 주목한 것에 한정되는 것은 아니다.
예를 들면, 도 12에 도시하는 바와 같이, 화상 내에 수개소, 상세 템플릿(22)을 설정해도 된다. 이와 같이 상세 템플릿(22)을 분산 배치함으로써, 프린트 촬영 조건에 의한 실패를 회피할 수 있다. 즉, 위치나 수를 동적으로 변화시켜 좁혀 들어감을 행할 수 있다.
또한, 도 13에 도시하는 바와 같이, 주목 영역을 원화상 데이터 촬영 시의 합초 위치에 둔 상세 템플릿(22)으로 해도 된다. 이러한 상세 템플릿(22)에서는, 촬영자의 의도를 반영한 결과를 예상할 수 있다.
또한, 도 14에 도시하는 바와 같이, 저해상도의 개요 템플릿(21)과 고해상도의 상세 템플릿(22)을 동일 화상에 넣은 복합 템플릿(23)을 구성하고, 1 회의 템플릿 매칭 처리로 완료되도록 해도 된다. 예를 들면, 도 15에 도시하는 바와 같이, 개요 템플릿(21)(16×16템플릿)과 상세 템플릿(22)(128×128템플릿)을 조합함으로써, 복합 템플릿(23)을 구성한다. 이와 같은 복합 템플릿(23)에 의하면, 고속성과 안정적인 검색 결과의 양립을 예상할 수 있다. 또한, 고해상도 영역의 배치나 구성을 변경해도, 전체의 실장을 변경하지 않고 취급할 수 있다.
또한, 도 16에 도시하는 바와 같이, 상세 템플릿(22)을 개요 템플릿(21)과 동일한 영역에 대하여 작성하여 데이터베이스에 등록해 두고, 실제의 상세 템플릿(22)과의 템플릿 매칭 시에는, 그 중의 일부의 영역, 즉 도 11 내지 도 13에 도시하는 바와 같은 영역을 참조 영역(24)으로서 사용하고, 다른 영역을 비참조 영역(25)으로 하도록 해도 된다.
또한, 상기한 바와 같은 상세 템플릿(22)을 등록한 상세 특징량 데이터베이스 및 개요 템플릿(21)을 등록한 전체 특징량 데이터베이스에 대해서는, 미리, 스토리지(20) 중의 원화상 데이터에 기초하여 작성해 둘 필요가 있다. 또한, 이 스토리지(20)는, 디지털 카메라(10)에 부속되는 메모리이어도 되고, 도 2에 파선으로 나타내는 바와 같은 통신부를 통하여 액세스 가능한 데이터베이스이어도 된다.
이들 특징량 데이터베이스의 작성에는, 각종 방법이 생각된다.
예를 들면, 원화상 촬영 시에 그 촬영 화상 데이터를 디지털 카메라(10)의 메모리 영역에 보존할 때에, 각 특징량 산출과 그 데이터베이스 등록을 행하는 방법이다. 즉, 도 17에 도시하는 바와 같이, 디지털 카메라(10)로 촬영을 행하고(스텝 S301), 그 촬영 화상 데이터를 디지털 카메라(10)의 메모리 영역에 보존한다(스텝 S302). 그리고, 그 보존한 촬영 화상 데이터로부터 2종류의 해상도(및 위치)로 각각 특징량을 산출하여 양 템플릿 데이터를 작성하고(스텝 S303), 그 작성한 각 템플릿 데이터를 상기 촬영 화상 데이터에 관련지어 각각의 데이터베이스에 보존한다(스텝 S304). 따라서, 스토리지(20)가 디지털 카메라(10)가 내장하는 메모리이면, 데이터베이스가 구축되게 된다. 또한, 스토리지(20)가 디지털 카메라(10)와 별체인 경우에는, 디지털 카메라(10)의 메모리 영역에 보존된 촬영 화상 데이터와 템플릿 데이터가 함께 스토리지(20)에 전송되어, 데이터베이스가 구축되게 된다.
또한, 스토리지(20)에 축적된 원화상 데이터를 프린터(30)로 프린트 아웃할 때에, 그 프린트 아웃 지시와 동시에 특징량 추출 처리를 행하여, 데이터베이스에 축적하는 것도 프로세스적으로 효율이 좋은 방법이다. 즉, 도 18에 도시하는 바와 같이, 스토리지(20)에 축적된 원화상 데이터를 프린트 아웃할 때, 통상적으로, 유저 지시에 의해, 프린트 아웃하는 원화상 데이터가 선택되고(스텝 S311), 또한, 프린트 조건이 설정되어(스텝 S312), 프린트가 실행된다(스텝 S313). 통상은 여기서 프린트 처리는 종료이지만, 본 예에서는, 다시 계속해서, 그 선택된 원화상 데이터로부터 각 해상도(및 위치)로 특징량을 산출하여 양 템플릿 데이터를 작성하고(스텝 S314), 작성한 각 템플릿 데이터를 그 원화상 데이터에 관련지어 각 데이터베이 스에 보존한다(스텝 S315). 또한, 템플릿 데이터 작성 시에, 프린트 조건을 반영시킴으로써, 검색원 프린트 아웃(1)과 템플릿 데이터의 매칭 정밀도를 향상시킬 수 있다. 이와 같은 방법에 의하면, 매칭 처리가 실시될지도 모르는 원화상 데이터에 대해서만 템플릿 데이터를 작성하므로, 불필요한 템플릿 데이터의 작성 시간 및 보존 용량을 생략할 수 있다.
또한, 물론, 배지 처리로 행하여도 된다. 즉, 도 19에 도시하는 바와 같이, 유저로부터의 일괄 템플릿 작성 실행 지시가 있었을 때(스텝 S321), 스토리지(20) 내의 템플릿 미작성 원화상 데이터를 선별하고(스텝 S322), 그들 선별한 템플릿 미작성 원화상 데이터에 대하여 일괄 템플릿 작성 처리를 실행한다(스텝 S323). 이 일괄 템플릿 작성 처리는, 개개의 템플릿 미작성 원화상 데이터로부터 각 해상도(및 위치)로 특징량을 추출하여 양 템플릿 데이터를 작성하고(스텝 S323A), 그들 작성한 각 템플릿 데이터를 대응하는 원화상 데이터에 관련지어 스토리지(20)에 보존하는 것이다(스텝 S323B).
나아가서는, 유저의 지시 입력에 의해, 개별로 처리해도 된다. 즉, 도 20에 도시하는 바와 같이, 유저가, 스토리지(20) 내의 원화상 데이터 중 하나를 선택하고(스텝 S331), 그 선택한 원화상 데이터에 대하여 템플릿 데이터의 작성의 지시를 행함으로써(스텝 S332), 그 선택된 원화상 데이터로부터 각 해상도(및 위치)로 특징량을 추출하여 양 템플릿 데이터를 작성하고(스텝 S333), 그 작성한 각 템플릿 데이터를 상기 선택된 원화상 데이터에 관련지어 각각의 스토리지(20)에 보존한다(스텝 S334).
또한, 반드시 동시에 양 템플릿을 작성할 필요는 없으며, 예를 들면, 상세 템플릿(22)은, 2차 검색을 실행하는 단계에서 필요로 되었을 때에 작성하는 방법이어도 된다.
또한, 상기 스텝 S12 내지 S20의 처리는, 디지털 카메라(10) 내에서 실시하는 것으로서 설명하였지만, 디지털 카메라(10)와 별체로 스토리지(20)를 존재시키는 경우에는, 그와 같은 처리를 소프트웨어로서 스토리지(20)에서 기동시키거나, 혹은 디지털 카메라(10)와 스토리지(20)로 분할한 형태로 기동시킴으로써 실제로 동작시키는 것도 가능하다.
이상과 같이, 지금까지, 프린트 아웃된 화상 데이터를 재프린트하고자 할 때, 화상 데이터의 부대 정보(파일명, 촬영 일시 등)를 참고로 유저가 검색하는 일이 많았지만, 본 실시예에 따른 검색 시스템에 의하면, 디지털 카메라(10)로 원하는 검색원 프린트 아웃(1)의 화상을 촬영하는 것만으로, 원화상의 파일(화상 데이터)에 액세스하는 것이 가능하게 되어, 직감적 또한 유저의 사용 편의성이 좋은 검색 방법을 제공하는 것이 가능하다.
게다가, 원화상 데이터 그 자체뿐만 아니라, 유사한 화상 구성의 화상 데이터를 검색하는 것도 가능하여, 부차적이면서 신규의 용도를 제공할 수 있다. 즉, 가두의 간판이나 포스터 등을 이 소위 검색 모드에서 촬영하고, 디지털 카메라(10)에 부속되는 메모리나 도 5에 파선으로 나타내는 바와 같은 통신부를 통하여 액세스 가능한 데이터베이스 등의 스토리지(20)에 존재하는 화상 데이터 및 그 특징량 데이터 중으로부터 유사 혹은 동일한 화상 데이터를 용이하게 검색 가능하게 된다.
또한, 상술한 바와 같이, 본 실시예에 따르면, 원화상 데이터의 검색 결과의 질(만족도) 향상과, 타당한 검색 시간의 양립이 가능하다.
나아가서는, 촬영자의 주목 영역을 고려한 검색 결과를 얻을 수 있다.
또한, 키워드 분류 등이 어려운 원화상 모집단에 대한 검색에서, 고속으로 세부의 차이를 판별하는 수단으로서의 효과가 높다. 즉, 대규모의 모집단에 대한, 단계적인 검색 결과 좁혀 들어감이 가능하게 된다.
[제2 실시예]
다음으로, 도 1을 참조하여, 본 발명의 제2 실시예에 따른 검색 시스템의 개략을 설명한다.
즉, 본 검색 시스템은, 디지털 카메라(10)와, 스토리지(20)와, 프린터(30)와, 퍼스널 컴퓨터(PC)(40)로 구성된다. 여기서, 스토리지(20)는, PC(40)에 내장 내지는 통신에 의해 액세스 가능한 기억 장치이다. 또한, PC(40)는, 디지털 카메라(10)에 무선/유선 접속되거나, 혹은, 디지털 카메라(10)로부터 떼어내어진 메모리를 장착하여, 디지털 카메라(10)의 메모리에 보존된 화상 데이터를 읽어내기 가능하게 구성되어 있다.
이와 같은 구성의 검색 시스템은, 이하와 같이 동작한다.
(1) 우선, 디지털 카메라(10)는, 프린터(30)에 의해 일단 프린트 아웃된 검색원 프린트 아웃(1)의 화상을 포함하는 피사체를 촬영한다.
(5) PC(40)는, 얻어진 촬영 화상 데이터로부터, 그 검색원 프린트 아웃(1)의 화상에 대응하는 영역을 추출하고, 그 추출한 영역의 특징량을 추출한다.
(6) 그리고, PC(40)는, 그 추출한 특징량에 의해 스토리지(20)에 저장된 개요 템플릿(21) 및 상세 템플릿(22)과 템플릿 매칭 처리를 실행한다.
(7) 그 결과, PC(40)는, 매치한 템플릿에 대응하는 화상 데이터를, 상기 검색원 프린트 아웃(1)의 원화상 데이터인 것으로서 읽어낸다.
(8) 이에 의해, PC(40)는, 그 읽어낸 원화상 데이터를, 다시, 프린터(30)로 프린트 아웃할 수 있다.
이하, 본 제2 실시예에 따른 검색 시스템을, 도 21에 도시하는 블록 구성도 및 도 22에 도시하는 동작 플로우차트를 참조하여, 상세하게 설명한다. 또한, 이들 도면에서, 상기 제1 실시예와 대응하는 것에 대해서는, 동일한 참조 번호를 붙이고 있다.
즉, 본 실시예는, 디지털 카메라(10)로 촬영된 화상 데이터를 그 유저가 특정하는 PC(40)에 내장 또는 접속된 스토리지(20)에 축적하며, 또한 도 22에 PC측으로서 나타내는 처리가 어플리케이션 소프트웨어로서 PC(40)에서 동작하는 경우이다. 또한, PC(40)와 디지털 카메라(10)를 유선 혹은 무선으로 접속하고, 통신 상태를 확립한 상태에서, 본 어플리케이션 소프트웨어를 기동하는 것이다. 이것은, 디지털 카메라(10)에 설정된 "검색 모드" 등과 같은 스위치를 넣는 조작에 의해 기능이 기동되는 상태이어도 된다.
이와 같이 본 어플리케이션 소프트웨어가 동작하자마자, 디지털 카메라(10) 측에서, 프린트 아웃의 촬상 처리가 실행된다(스텝 S11). 즉, 도 23에 도시하는 바와 같이, 유저가, 재차 프린트 아웃하는 것을 원하는 검색원 프린트 아웃(1)을 테이블 위 혹은 벽면 등에 접착한 상태에서, 디지털 카메라(10)의 촬상부(11)에 의해, 적어도 상기 검색원 프린트 아웃(1)의 누락이 없도록 촬영한다(스텝 S111). 이에 의해, 얻어진 촬영 화상 데이터가 디지털 카메라(10) 내의 메모리인 기억부(16)에 보존된다. 그리고, 그 보존된 촬영 화상 데이터가, 유선 혹은 무선으로, 접속된 PC(40)에 전송된다(스텝 S112).
그러면, PC(40)에서는, 어플리케이션 소프트웨어에 의해 실현되는 영역 추출부(41)에서, 상기 송신되어 온 촬영 화상 데이터 중으로부터, 상기 검색원 프린트 아웃(1)의 화상을 특정하고, 그 부분을 특정·추출하기 위한 프린트 아웃의 잘라냄 처리를 실행한다(스텝 S12). 다음으로, 어플리케이션 소프트웨어에 의해 실현되는 특징량 추출부(42)에 의해, 상기 특정·추출된 관심 영역의 화상 데이터 전체로부터 특징량을 추출하는 전체 특징량 추출 처리를 행한다(스텝 S13).
그리고 그 후, 어플리케이션 소프트웨어에 의해 실현되는 매칭부(43)에 의해, 상기 추출한 전체 특징량 데이터를, 스토리지(20)에 구성한 상기 개요 템플릿(21)을 등록한 전체 특징량 데이터베이스와 비교하여, 그 유사도가 높은 것을 순서대로 추출하는 전체 특징량 DB와의 매칭 처리를 실행한다(스텝 S14). 즉, 산출된 전체 특징량 데이터에 기초하여 PC(40)측의 매칭부(43)에서, 스토리지(20)의 화상 데이터 각각에 갖추어지는(혹은 포괄적으로 데이터베이스화된) 특징량 데이터(개요 템플릿(21))군과 비교하여, 가장 가까운 것을 선출한다. 설정에 의해, 가장 가까운 복수의 특징량 후보를 선출하는 것도 사용 편의성에서 유효하다. 이 특징량 데이터에는, 그 특징량을 산출한 원화상 데이터의 지정 정보가 포함되어 있어, 그것에 따라 후보 화상을 호출한다.
그 후, 상기 영역 추출부(41)에서, 상기 특정·추출된 관심 영역 전체의 화상 데이터로부터, 더욱 상세 검색 대상 영역, 이 예에서는 상기 관심 영역의 중앙 영역부의 화상 데이터를 상세 검색 대상 화상 데이터로서 추출한다(스텝 S15). 그리고, 상기 특징량 추출부(42)에 의해, 상기 영역 추출부(41)에서 추출한 상세 검색 대상 화상 데이터로부터 특징량을 추출하는 상세 특징량 추출 처리를 행하고(스텝 S16), 그 추출한 상세 특징량 데이터를, 매칭부(43)에 의해, 스토리지(20)에 구성한 상기 상세 템플릿(22)을 등록한 상세 특징량 데이터베이스와 비교하여, 그 유사도가 높은 것을 순서대로 추출하는 상세 특징량 DB와의 매칭 처리를 실행한다(스텝 S17). 단 이 경우, 상세 특징량 데이터베이스에 등록된 모든 상세 템플릿(22)과의 템플릿 매칭을 행하는 것이 아니라, 상기 스텝 S14의 전체 특징량 DB와의 매칭 처리에서 추출된 복수의 원화상 후보에 대응하는 상세 템플릿(22)에 대해서만 템플릿 매칭이 실행된다. 따라서, 해상도가 높기 때문에 처리 시간을 요하는 상세 템플릿(22)과의 템플릿 매칭 처리는, 필요 최저한으로 완료되게 된다.
그 후, 상기 선출된 원화상 후보(혹은 후보 화상군)의 화상 데이터를 스토리지(20)로부터 읽어내어, 그 PC(40)의 디스플레이인 표시부(44)에 추출할 화상 후보로서 표시하고(스텝 S18), 상기 제1 실시예와 마찬가지로, 유저에 의한 선택을 접수한다. 이 때, 상기 선출된 원화상 후보(혹은 후보 화상군)의 화상 데이터를 그대로나, 적절히 압축한 상태에서, PC(40)로부터 디지털 카메라(10)에 전송하여, 디지털 카메라(10)의 표시부(15) 상에 표시하도록 해도 된다(스텝 S41).
그리고, 마우스 등의 조작에 의한 선택에 따라서, 스토리지(20)에 저장되어 있는 그 화상 후보에 대응하는 원화상 데이터를, 접속된 프린터(30)에 보내어, 재차 프린트 아웃한다(스텝 S21). 즉, 상기 표시된 원화상 후보를 유저의 판단에 의해 결정하고, 인쇄 프로세스에 전달함으로써 당초의 목적인 프린트 아웃된 화상의 재인쇄를 유저에게 있어서는 간단히 행할 수 있는 것이다. 또한 이 때, 단순히 인쇄할 뿐만 아니라, 후보 화상으로서 복수 선택한 것 중에서 유저 판단에 따라서는, 「목표한 원화상과는 다르지만, 유사한 화상을 모음」으로써, 유사한 화상 데이터를 일괄 검색하는 기능의 실현으로도 이어지고 있다.
또한, 본 실시예에서는, 특징량 데이터베이스의 작성은, 디지털 카메라(10)로부터 PC(40)를 통한 스토리지(20)로의 촬영 화상 데이터의 전송 시에 행하도록 해도 된다. 즉, 도 24에 도시하는 바와 같이, 디지털 카메라(10)로부터 PC(40)로의 촬영 화상 데이터의 전송을 개시하고(스텝 S341), PC(40)에 의해, 그 전송되어 온 촬영 화상 데이터를 스토리지(20)에 보존함과 함께(스텝 S342), 그 촬영 화상 데이터로부터 개요 템플릿 데이터 및 상세 템플릿 데이터를 작성한다(스텝 S343). 그리고, 그 작성한 각 템플릿 데이터를 스토리지(20)에 상기 촬영 화상 데이터에 관련지어 보존한다(스텝 S344).
이상과 같이, 본 제2 실시예에서도, 상기 제1 실시예와 마찬가지의 효과를 발휘할 수 있다.
게다가, 원화상 데이터 그 자체뿐만 아니라, 유사한 화상 구성의 화상 데이터를 검색하는 것도 가능하여, 부차적이면서 신규의 용도를 제공할 수 있다. 즉, 가두의 간판이나 포스터 등을 이 소위 검색 모드로 촬영하고, 디지털 카메라(10)에 부속되는 메모리나 도 5에 파선으로 나타내는 바와 같은 통신부를 통하여 액세스 가능한 데이터베이스 등의 스토리지(20)에 존재하는 화상 데이터 및 그 특징량 데이터 중으로부터 유사 혹은 동일한 화상 데이터를 용이하게 검색 가능하게 된다. 또한, 그 데이터에 결부되는 인터넷 사이트를 PC(40)나 디지털 카메라 등의 디스플레이에서 표시하거나, 특정한 어플리케이션(음성·동화상 등)을 작동시키는 것 등이 가능하게 된다.
또한, 유사한 화상 구성의 화상 데이터를 검색하는 기능은, 촬영 시 등에서의 견본 화상으로의 유도 등의 것도 가능하다. 이것은, 전체의 구도를 개요 템플릿(21)에서 평가하고, 상세 템플릿(22)에서 세부의 평가를 행하여, 유도 정보나 바람직한 구도의 화상을 선별하는 것이 가능하게 되기 때문이다.
이 기능은, PC(40) 상에서 오프라인 처리하는 방법과, 디지털 카메라(10)나 휴대 정보 단말기 등의 촬상 장치에 내장하여 온라인 처리하는 방법이 있다. PC(40) 상에서 오프라인 처리하는 예로서는, 촬영한 다수의 화상 중으로부터, 바람직한 구도의 화상을 선별하는 등의 용도에 적용 가능하다. 또한, 디지털 카메라(10)나 휴대 정보 단말기에 내장한 경우에는, 촬영의 보조 기능으로서 동작하고, 촬영을 리얼타임에서 서포트하는 등의 예에도 적용할 수 있다.
이 기능에서 사용하는 견본 화상으로서는, 포토 콘테스트 등에서 뽑힌 좋은 작례나 프로 카메라맨이 촬영한 화상 등의 작례적으로 바람직한 화상(견본 화상)을 이용하여, 유저의 기호에 따라서 선택하는 것도 가능하다.
견본 화상의 템플릿에는, 특징량뿐만 아니라, 시간, 위치 정보, 기상 정보 등을 가하는 것도 가능하며, 이들 정보를 이용함으로써, 예를 들면 촬영 위치에서의 일몰 시각을 고려하여 최적의 구도로 되는 시간대를 지시하는 등의 것도 가능하게 된다. 또한, 렌즈 교환식의 카메라의 경우에는, 교환한 렌즈의 정보에 기초하여 견본 화상 템플릿의 자동 선택이나 보정 등의 기능도 가능하다.
도 25는, 촬영 시 등에서의 견본 화상으로의 유도 기능을 디지털 카메라(10)에 적용한 예를 도시하는 도면이다. 이 예에서는, 견본 화상을 템플릿으로 하여 스토리지(20)에 유지해 두고, 촬영 시에 견본 화상 템플릿과 매칭을 행하여, 그 유사도가 높은 화상을 촬영할 수 있도록 유도해 감으로써, 최적의 구도의 화상을 촬영할 수 있도록 보조할 수 있다. 견본 화상과의 어긋남을 매칭에 의해 검지하고, 예를 들면 도 26에 도시하는 바와 같이, 화살표(155) 등으로 구도적으로 바람직한 방향으로 유도하는 방법이나, 도 27에 도시하는 바와 같이, 구도적으로 바람직한 부분을 강조 표시(156)한다라고 하는 방법 등이 있다.
유도 시에 사용하는 특징량으로서는, 화상 데이터 내의 특징점이나 색 정보의 배치 관계를 사용하는 것이어도 되고, 소정의 룰에 따른 화상 데이터 내의 분할 에리어, 즉 미리 정해진 격자에 의해 할당된 소영역의 상대 농도 등을 사용하는 것이라도 되며, 분할 에리어마다의 푸리에 변환값 등에 기초한 것이어도 된다.
또한, 상기 설명에서는, 디지털 카메라(10)를 이용하였지만, 본 실시예는 그에 한정되는 것이 아니라, 스캐너이어도 된다.
또한, 실제로 프린트 아웃한 검색원 프린트 아웃(1)을 디지털 카메라(10)로 촬영하고 있지만, 예를 들면 검색원 프린트 아웃(1)을 촬영한 화상을 표시하고 있는 디스플레이를 디지털 카메라(10)로 촬영해도 마찬가지로 실시 가능하다.
[제3 실시예]
다음으로, 본 발명의 제3 실시예에 따른 검색 시스템을 설명한다.
본 실시예는, 카메라 부착 휴대 전화기 등의 촬상 기능을 가진 통신 장치인 통신 기능을 구비한 디지털 카메라(10)를 사용하는 예로서, 미리 등록한 화상을 촬영함으로써, 그 화상을 인식하고, 인식 결과에 따라서 소정의 동작(예를 들면 음성 출력이나 소정의 프로그램의 기동, 혹은 소정의 URL의 표시)을 시키는 경우에 적용하는 것이다.
화상을 인식하는 경우, 참조하는 데이터베이스(소위 사전 데이터)로서 화상 데이터는 등록하지만, 화상을 그대로 비교하는 것이 아니라, 화상의 특징량을 비교하는 것이 효율적이며 실제적이기 때문에, 화상으로부터 추출한 특징량 데이터베이스를 사용한다. 또한 이 데이터베이스는 내장이어도 통신을 통한 서버 상에 존재하는 것이어도 된다.
본 실시예에서는, 화상의 특징점의 배치 관계를 벡터량의 조합으로서 산출하고, 그 다수 조를 특징량으로서 정의한다. 그 때, 이 특징량은 특징점이 나타나는 수에 따라 그 정밀도가 상이하며, 원화상 데이터의 정세도가 높으면 특징점이 수많이 검출 가능하기 때문에, 동일한 원화상 데이터에 대하여, 되도록이면 고정세한 조건에서 특징량을 산출한다. 이 때, 동일한 화상 소재에 대하여 정세도를 저하시킨 화상 데이터에 기초하여 특징량을 산출하면, 특징점이 비교적 적어지기 때문에 특징량 자체는 작은 용량으로 된다. 용량이 작은 것은 매칭 정밀도는 뒤떨어지지만, 매칭 속도가 고속인 것이나, 통신 속도가 빠른 등의 메리트가 있다.
본 실시예에서는 여기에 착안하여, 화상 데이터를 참조 데이터(템플릿)로서 등록할 때, 하나의 화상 소재의 등록 시에 상이한 복수의 정세도로부터 특징량을 산출하고, 각각의 정세도로 개별화한 데이터베이스를 구성한다. 그 각각의 데이터베이스에는, 각각에 대응하는 매칭 서버가 접속하고, 병렬 동작 가능한 배치로 한다. 즉, 도 28에 도시하는 바와 같이, 1차 특징량의 매칭 서버 및 1차 정보 DB(21), 2차 특징량의 매칭 서버 및 2차 정보 DB(22), …, n차 특징량의 매칭 서버 및 n차 정보 DB(2n)를 준비한다. 또한, 2차 특징량의 매칭 서버 및 2차 정보 DB(22) 내지 n차 특징량의 매칭 서버 및 n차 정보 DB(2n)는, 1차 특징량의 매칭 서버 및 1차 정보 DB(21)보다도 고정세한 특징량 또는 특별한 카테고리의 데이터베이스이다.
이와 같은 매칭 처리계를 준비한 후에, 도 28에 도시하는 바와 같이, 통신 기능을 구비한 디지털 카메라(10)로부터, 이미 등록되어 있는 의장(대상 마커)을 촬영하고(스텝 S51), 상기 디지털 카메라(10)에 내장되는 어플리케이션 소프트웨어에 의해 특징점의 배치 관계로부터 특징량 데이터를 산출한다(스텝 S52). 그리고, 그 특징량 데이터를 통신을 통하여 각 매칭 서버에 송신함으로써, 각 DB와의 매칭 처리가 행하여진다(스텝 S53). 이 매칭 처리에 의해, 매치하는 결과가 얻어졌다면, 그 결과에 결부되는 동작 정보(예를 들면 URL의 링크 등)가 취득되고(스텝 S54), 그 동작 정보가 디지털 카메라(10)에 송신되어, 예를 들면 3D 오브젝트 취득 과 표시 등의 지정 동작이 수행된다(스텝 S55).
또한, 이 때의 카메라 해상도가 200만 화소급이었던 것으로 하면, 통신을 통하여 매칭 서버에서 검색하는 경우도 200만 화소급의 해상도의 특징량 데이터베이스로부터의 데이터로 매칭을 행할 수 있으면 오인식률이 적다. 그러나, 동시에 동작하는 저해상도(예를 들면 VGA 클래스의 해상도)의 특징량 데이터베이스에서의 매칭은 고속으로 응답하기 때문에, 먼저 디지털 카메라(10)에 결과가 송부된다. 이와 같이 매칭 서버를 해상도별로 병렬 배치하는 것은 속도적, 인식 정밀도적으로 유리하다. 또한, 뒤따르는 고해상도 매칭 서버로부터의 회답이 이미 먼저 나와 있는 저해상도 매칭 서버와 상이한 경우가 있고, 그러한 경우에는, 우선 빠른 쪽의 결과에 기초하는 표시가 행하여지고, 그 후에, 폴로업의 결과에 기초하는 표시로 갱신된다. 예를 들면, 지폐 등을 인식하고자 하면, 저해상도 매칭에서의 회답이 『일만엔권』이라고 하는 레벨이어도, 고해상도 매칭에서는 『일만엔권이고 넘버가 ZTA473298SPK』라고 하는 회답과 같이, 보다 정밀도가 높은 것에 의한 상세하거나 혹은 올바른 결과가 얻어진다.
또한, 상술한 바와 같이 고해상도 매칭 서버에서는 특징량 자체의 용량이 크고, XGA 클래스의 특징량은 40kB 정도로 비대하지만, 미리 저해상도 매칭에 의해 대략 10kB 정도까지 작게 된다. 또한, 2차 이후의 매칭 서버 및 데이터베이스에서는, 보다 저해상 데이터베이스와의 차분만을 유지하면, 보다 작은 데이터베이스 구성을 실현하고, 그것은 인식 처리의 고속화로 이어진다. 또한, 특징량에 템플릿(에리어 할당을 행하고, 각각의 농도값을 비교하는 방식)에 의한 추출을 진행시킨 경우, 일반적으로 10kB 이하로, 적절히 양 방식을 조합한 다차원 특징량도 인식 정밀도의 향상에 유효하다는 것을 확인하고 있다.
이와 같이, 촬영 화상면의 일부 또는 전체면의 해상도를 다단계화하고, 실질상의 매칭 계층화를 실현하는 것은, 단순히 복수의 매칭 서버를 클러스터적으로 분산 처리하는 경우에 비하여 인식 속도, 인식 정밀도의 양면에서 효과가 있다.
특히, 미리 데이터베이스 등록한 화상이 매우 다수(1000 이상)인 경우에 효과가 있는 방식이며, 또한, 유사성이 높은 화상이 그 중에 포함되어 있는 경우에도 효과를 갖는다.
이상 실시예에 기초하여 본 발명을 설명하였지만, 본 발명은 상술한 실시예에 한정되는 것이 아니라, 본 발명의 요지의 범위 내에서 다양한 변형이나 응용이 가능한 것은 물론이다.
예를 들면, 디지털 카메라는, 정지 화상을 촬영하는 디지털 스틸 카메라에 한정되는 것이 아니라, 동화상을 촬영하는 디지털 무비 카메라도 포함한다.
또한, 통신 기능을 구비한 디지털 카메라인 촬상 기능을 가진 통신 장치란, 카메라 부착 휴대 전화기, 카메라 부착 PHS, 고정 텔레비전 전화를 포함한다.
본 발명의 응용 범위로서, 카메라 부착 휴대 전화나 디지털 카메라는 물론이고, 화상으로 인증하는 타입의 시큐러티 시스템 등, 일반적으로 카메라에 의해 디지털 화상을 촬영하여 축적하는 시스템에서는 광범위한 이용을 기대할 수 있다.

Claims (12)

  1. 화상을 입력하는 화상 입력 수단(11)과,
    상기 화상 입력 수단에 의해 입력된 화상에 기초하여, 제1 템플릿(21)을 사용한 템플릿 매칭에 의해 데이터베이스(20)로부터 복수의 화상을 검색하고, 그 검색한 결과의 복수의 화상으로부터, 상기 제1 템플릿보다 좁은 영역이며 또한 해상도가 높은 제2 템플릿(22)을 사용하여, 템플릿 매칭에 의해 단일 또는 복수의 화상을 검색하는 화상 검색 수단(14;43)
    을 구비하는 것을 특징으로 하는 검색 시스템.
  2. 제1항에 있어서,
    상기 화상 검색 수단에서, 상기 제2 템플릿은, 화상의 중앙 영역 부분에 대응하는 것을 특징으로 하는 검색 시스템.
  3. 제1항에 있어서,
    상기 화상 검색 수단에서, 상기 제2 템플릿은, 화상의 복수 영역 부분에 대응하는 것을 특징으로 하는 검색 시스템.
  4. 제1항에 있어서,
    상기 화상 검색 수단에서, 상기 제2 템플릿은, 화상의 합초 영역 부분에 대 응하는 것을 특징으로 하는 검색 시스템.
  5. 화상을 입력하는 화상 입력 수단(11)과,
    상기 화상 입력 수단에 의해 입력된 화상에 기초하여, 부분적으로 해상도를 높인 템플릿(23)에 의한 템플릿 매칭에 의해 데이터베이스(20)로부터 단일 또는 복수의 화상을 검색하는 화상 검색 수단(14;43)
    을 구비하는 것을 특징으로 하는 검색 시스템.
  6. 제5항에 있어서,
    상기 화상 검색 수단에서, 상기 템플릿에서 부분적으로 해상도를 높인 영역은, 화상의 중앙 영역 부분에 대응하는 것을 특징으로 하는 검색 시스템.
  7. 제5항에 있어서,
    상기 화상 검색 수단에서, 상기 템플릿에서 부분적으로 해상도를 높인 영역은, 화상의 복수 영역 부분에 대응하는 것을 특징으로 하는 검색 시스템.
  8. 제5항에 있어서,
    상기 화상 검색 수단에서, 상기 템플릿에서 부분적으로 해상도를 높인 영역은, 화상의 합초 영역 부분에 대응하는 것을 특징으로 하는 검색 시스템.
  9. 제1항 또는 제5항에 있어서,
    상기 화상 검색 수단에서, 상기 화상 입력 수단에 의해 입력되는 화상은, 프린트 아웃한 화상(1)을 촬상한 것인 것을 특징으로 하는 검색 시스템.
  10. 화상을 입력하고,
    상기 입력된 화상에 기초하여, 제1 템플릿(21)을 사용한 템플릿 매칭에 의해 데이터베이스로부터 복수의 화상을 검색하고,
    상기 검색한 결과의 복수의 화상으로부터, 상기 제1 템플릿보다 좁은 영역이며 또한 해상도가 높은 제2 템플릿(22)을 사용하여, 템플릿 매칭에 의해 단일 또는 복수의 화상을 검색하는 것을 특징으로 하는 검색 방법.
  11. 제10항에 있어서,
    상기 제1 및 제2 템플릿(21,22)이, 작례적으로 바람직한 화상으로부터 작성된 것이고,
    상기 검색되는 단일 또는 복수의 화상으로서, 바람직한 화상이 선별되는 것을 특징으로 하는 검색 방법.
  12. 화상을 입력하고,
    상기 입력된 화상에 기초하여, 부분적으로 해상도를 높인 템플릿(23)에 의한 템플릿 매칭에 의해 데이터베이스로부터 단일 또는 복수의 화상을 검색하는 것을 특징으로 하는 검색 방법.
KR1020077025085A 2005-06-30 2006-06-29 검색 시스템 및 검색 방법 KR20070118156A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2005-00192808 2005-06-30
JP2005192808 2005-06-30

Publications (1)

Publication Number Publication Date
KR20070118156A true KR20070118156A (ko) 2007-12-13

Family

ID=37604387

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077025085A KR20070118156A (ko) 2005-06-30 2006-06-29 검색 시스템 및 검색 방법

Country Status (6)

Country Link
US (1) US20080095447A1 (ko)
EP (1) EP1898339A1 (ko)
JP (1) JPWO2007004520A1 (ko)
KR (1) KR20070118156A (ko)
CN (1) CN101010694A (ko)
WO (1) WO2007004520A1 (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7986423B2 (en) * 2004-05-14 2011-07-26 Samsung Electronics Co., Ltd. Image reprinting apparatus and method
JP5139716B2 (ja) * 2007-05-16 2013-02-06 キヤノン株式会社 画像検索装置及び画像検索方法
JP4949924B2 (ja) * 2007-05-17 2012-06-13 オリンパス株式会社 撮影システム及び撮影装置
CN101493813B (zh) * 2008-01-25 2012-05-30 北京新岸线网络技术有限公司 一种基于内容的视频检索系统
JP5112901B2 (ja) * 2008-02-08 2013-01-09 オリンパスイメージング株式会社 画像再生装置、画像再生方法、画像再生用サーバー、および画像再生システム
JP2009199232A (ja) * 2008-02-20 2009-09-03 Seiko Epson Corp 画像処理装置
JP5181825B2 (ja) * 2008-05-19 2013-04-10 株式会社ニコン 画像処理装置、画像処理方法およびプログラム
JP5353299B2 (ja) * 2009-02-25 2013-11-27 株式会社リコー 画像検索システム、画像検索装置、及び画像検索方法
JP5625246B2 (ja) * 2009-03-16 2014-11-19 株式会社リコー 画像検索装置及び画像検索方法
JP5554984B2 (ja) * 2009-12-24 2014-07-23 キヤノン株式会社 パターン認識方法およびパターン認識装置
KR101357262B1 (ko) * 2010-08-13 2014-01-29 주식회사 팬택 필터 정보를 이용한 객체 인식 장치 및 방법
JP2012141693A (ja) * 2010-12-28 2012-07-26 Kashiko Kodate 画像検索システム及び画像検索プログラム
JP5773737B2 (ja) * 2011-05-10 2015-09-02 アズビル株式会社 照合装置
JP5788299B2 (ja) * 2011-11-22 2015-09-30 日本電信電話株式会社 画像検索装置、画像検索方法およびプログラム
JP5253595B2 (ja) * 2012-03-08 2013-07-31 オリンパス株式会社 撮影システム及び撮影装置
JP2014103630A (ja) * 2012-11-22 2014-06-05 Olympus Imaging Corp 撮像装置及び画像通信方法
JP2019017867A (ja) * 2017-07-20 2019-02-07 株式会社東芝 情報処理装置、情報処理システム、およびプログラム
CN112488177A (zh) * 2020-11-26 2021-03-12 金蝶软件(中国)有限公司 一种图像匹配方法及相关设备
CN112559813B (zh) * 2021-01-29 2022-04-29 广州技象科技有限公司 基于指令关联推送的物联网网关数据处理方法及装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0664614B2 (ja) * 1987-02-27 1994-08-22 株式会社安川電機 階層化構造的テンプレ−ト・マツチング方法
US5077805A (en) * 1990-05-07 1991-12-31 Eastman Kodak Company Hybrid feature-based and template matching optical character recognition system
US6714665B1 (en) * 1994-09-02 2004-03-30 Sarnoff Corporation Fully automated iris recognition system utilizing wide and narrow fields of view
US5963670A (en) * 1996-02-12 1999-10-05 Massachusetts Institute Of Technology Method and apparatus for classifying and identifying images
US5933546A (en) * 1996-05-06 1999-08-03 Nec Research Institute, Inc. Method and apparatus for multi-resolution image searching
GB9627037D0 (en) * 1996-12-30 1997-02-19 Cole Polytechnique Fudurale De Real-time interactive remote inspection of high-resolution images
JPH11134346A (ja) * 1997-10-27 1999-05-21 Dainippon Printing Co Ltd 画像検索装置及び記録媒体
US6072904A (en) * 1997-12-31 2000-06-06 Philips Electronics North America Corp. Fast image retrieval using multi-scale edge representation of images
US6356654B1 (en) * 1998-12-23 2002-03-12 Xerox Corporation Systems and methods for template matching of multicolored images
JP3496559B2 (ja) * 1999-01-06 2004-02-16 日本電気株式会社 画像特徴量生成装置、並びに画像特徴量生成方法
US6584221B1 (en) * 1999-08-30 2003-06-24 Mitsubishi Electric Research Laboratories, Inc. Method for image retrieval with multiple regions of interest
US7006099B2 (en) * 2000-08-15 2006-02-28 Aware, Inc. Cache system and method for generating uncached objects from cached and stored object components
US6603882B2 (en) * 2001-04-12 2003-08-05 Seho Oh Automatic template generation and searching method
JP4226247B2 (ja) * 2002-01-15 2009-02-18 富士フイルム株式会社 画像処理装置
US7142718B2 (en) * 2002-10-28 2006-11-28 Lee Shih-Jong J Fast pattern searching
US7313268B2 (en) * 2002-10-31 2007-12-25 Eastman Kodak Company Method for using effective spatio-temporal image recomposition to improve scene classification
US20050018250A1 (en) * 2003-07-24 2005-01-27 Raymond Moskaluk Image storage method and media
US7444004B2 (en) * 2004-03-29 2008-10-28 Fujifilm Corporation Image recognition system, image recognition method, and machine readable medium storing thereon an image recognition program
US20060126123A1 (en) * 2004-12-15 2006-06-15 Omnivision Technologies, Inc. Digital camera for producing positive images from negatives

Also Published As

Publication number Publication date
CN101010694A (zh) 2007-08-01
US20080095447A1 (en) 2008-04-24
EP1898339A4 (en) 2008-03-12
JPWO2007004520A1 (ja) 2009-01-29
EP1898339A1 (en) 2008-03-12
WO2007004520A1 (ja) 2007-01-11

Similar Documents

Publication Publication Date Title
KR20070118156A (ko) 검색 시스템 및 검색 방법
KR100906918B1 (ko) 검색 시스템 및 검색 방법
US7272269B2 (en) Image processing apparatus and method therefor
JP2007264992A (ja) 文書検索装置、文書検索方法、および文書検索プログラム
US20060021027A1 (en) Personal information management apparatus, personal information file creation method, and personal information file search method
JP2011008752A (ja) ドキュメント操作システム、ドキュメント操作方法およびそのためのプログラム
JP5653131B2 (ja) オブジェクト認識装置およびその認識方法
EP2105930B1 (en) Selection and positioning of images within a template based on relative comparison of image attributes
KR20090052014A (ko) 인물별 자동분류 패킹 서비스를 제공하는 방법 및 이를제공하는 키오스크
JP2011138315A (ja) 画像出力装置、システム、方法およびプログラム
EP1884950A2 (en) Image recording and playing system and image recording and playing method
CN111223045A (zh) 一种拼图方法、装置及终端设备
JP3673615B2 (ja) 画像処理装置及びその制御方法
JP2003150617A (ja) 画像処理装置およびプログラム
JP2004178018A (ja) 画像検索システム、端末装置、サーバ、および画像検索方法
JP2008217660A (ja) 検索方法、および装置
JP2008197674A (ja) 支援情報提供方法、支援情報提供プログラム及び情報提供管理システム
JP2006101156A (ja) 情報処理装置及び情報処理プログラム
CN108234868B (zh) 一种基于案例推理的智能拍摄系统及方法
JP7318289B2 (ja) 情報処理装置およびプログラム
JP2014063300A (ja) 文字認識装置及び文字認識処理方法並びにプログラム
JP4150651B2 (ja) 支援情報提供方法、支援情報提供プログラム及び情報提供管理システム
JP2005135210A (ja) 文字認識機能を有する携帯機器
KR20130036839A (ko) 증강현실 서비스를 지원하는 시스템에서 영상 정합을 위한 장치 및 방법
US20070076231A1 (en) Order processing apparatus and method for printing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E601 Decision to refuse application