WO2022050473A1

WO2022050473A1 - 카메라 포즈 추정 장치 및 방법

Info

Publication number: WO2022050473A1
Application number: PCT/KR2020/012753
Authority: WO
Inventors: 김상록; 조규성; 박재완; 손태윤; 이형민
Original assignee: 주식회사 맥스트
Priority date: 2020-09-01
Filing date: 2020-09-22
Publication date: 2022-03-10
Also published as: US11941845B2; US20220309703A1; KR102225093B1

Abstract

카메라 포즈 추정 장치 및 방법이 개시된다. 일 실시예에 따른 카메라 포즈 추정 장치는, 입력 이미지에 기초하여 기 저장된 복수의 이미지 중 상기 입력 이미지에 대한 복수의 유사 이미지를 검색하는 유사 이미지 검색부; 상기 복수의 유사 이미지 각각에 태깅된 시점(viewpoint) 데이터에 기초하여, 상기 복수의 유사 이미지 중 기 설정된 조건을 만족하는 적어도 일부 이미지를 포함하는 군집(cluster)을 생성하는 군집화부; 및 상기 군집에 기초하여 상기 입력 이미지를 생성한 카메라의 포즈를 추정하는 추정부를 포함한다.

Description

카메라 포즈 추정 장치 및 방법

개시되는 실시예들은 카메라 포즈 추정을 수행하는 기술에 관한 것이다.

일반적으로 카메라 포즈 추정을 위한 방법으로 입력 이미지에 대해 3차원 맵 상에서의 6D 포즈를 직접 구하는 방법을 들 수 있다. 이는 특징점 추출 알고리즘을 통해 2차원 이미지에서 유의미한 특징점을 추출하는 특징점 추출 단계와, 입력 이미지 쌍의 추출된 특징점들을 매칭하고 유효한 매칭 쌍을 검출하는 특징점 검증단계, 검증된 특징점 각각과 3차원 점군(Point Cloud) 내의 각 점들 중 하나와 매핑하고, 매핑된 3차원 점의 월드 좌표계 상의 좌표와 2차원 특징점의 픽셀 좌표를 기준으로 좌표계 변환 알고리즘을 사용하여 카메라 좌표계가 어떤 포즈(Rotation, Translation matrix)를 가지고 있는지 추정하는 포즈 추정 단계로 이루어져있다.

SIFT, SURF, FAST 등의 알고리즘은 특징점 추출 방법으로 사용될 수 있다. 그러나, 이와 같은 기존의 지역적 특징 기반의 특징점 추출 및 매칭 알고리즘의 경우 이미지에 포함된 물체의 수가 적고 단순할수록 좋은 성능을 보이지만, 도심이나 도로 사진과 같이 다양하고 동적인 물체들이 많이 포함된 이미지의 경우 특징점 검출이 이루어지지 않는 문제가 있었다.

이러한 문제를 해결하기 위해 입력 이미지와 유사한 이미지를 찾아내는 이미지 리트리벌 알고리즘을 사용한 단계를 추가하여 카메라 포즈 추정을 진행하는 방법이 있다. 그러나 이러한 기술은 리트리벌 단계에서 입력 이미지에 대해 잘못된 이미지를 유사 이미지로 판단할 경우 카메라 추정이 원활히 이루어지지 않을 수 있으며, 이미지 리트리벌 알고리즘이 갖는 성능과 시간 비용 사이의 상충 관계로 인해 이미지 리트리벌 알고리즘의 성능을 높이는 과정에서 시간 및 비용이 발생한다는 문제가 발생한다.

개시되는 실시예들은 카메라 포즈 추정을 수행하기 위한 장치 및 방법을 제공하기 위한 것이다.

일 실시예에 따른 카메라 포즈 추정 장치는, 입력 이미지에 기초하여 기 저장된 복수의 이미지 중 상기 입력 이미지에 대한 복수의 유사 이미지를 검색하는 유사 이미지 검색부; 상기 복수의 유사 이미지 각각에 태깅된 시점(viewpoint) 데이터에 기초하여, 상기 복수의 유사 이미지 중 기 설정된 조건을 만족하는 적어도 일부 이미지를 포함하는 군집(cluster)을 생성하는 군집화부; 및 상기 군집에 기초하여 상기 입력 이미지를 생성한 카메라의 포즈를 추정하는 추정부를 포함한다.

상기 군집화부는, 상기 복수의 유사 이미지 각각에 태깅된 시점 데이터에 기초하여, 상기 복수의 유사 이미지 중에서 임의 선택된 기준 이미지와 상기 복수의 유사 이미지 중 상기 기준 이미지를 제외한 복수의 나머지 이미지 사이의 거리를 각각 산출하고, 상기 산출된 거리에 기초하여 상기 군집을 생성할 수 있다.

상기 군집화부는, 상기 복수의 나머지 이미지 중 상기 산출된 거리가 기 설정된 거리 이하인 이미지를 상기 기준 이미지에 대한 이웃 이미지로 결정하고, 상기 이웃 이미지의 개수에 기초하여 상기 군집을 생성할 수 있다.

상기 군집화부는, 상기 이웃 이미지의 개수가 기 설정된 개수 이상인 경우, 상기 기준 이미지 및 상기 이웃 이미지를 포함하는 군집을 생성할 수 있다.

상기 추정부는, 상기 군집에 포함된 각 이미지로부터 하나 이상의 특징점을 추출하고, 상기 추출된 하나 이상의 특징점에 기초하여 상기 카메라의 포즈를 추정할 수 있다.

일 실시예에 따른 카메라 포즈 추정 방법은, 입력 이미지에 기초하여 기 저장된 복수의 이미지 중 상기 입력 이미지에 대한 복수의 유사 이미지를 검색하는 단계; 상기 복수의 유사 이미지 각각에 태깅된 시점(viewpoint) 데이터에 기초하여, 상기 복수의 유사 이미지 중 기 설정된 조건을 만족하는 적어도 일부 이미지를 포함하는 군집(cluster)을 생성하는 단계; 및 상기 군집에 기초하여 상기 입력 이미지를 생성한 카메라의 포즈를 추정하는 단계를 포함한다.

상기 군집을 생성하는 단계는, 상기 복수의 유사 이미지 각각에 태깅된 시점 데이터에 기초하여, 상기 복수의 유사 이미지 중에서 임의 선택된 기준 이미지와 상기 복수의 유사 이미지 중 상기 기준 이미지를 제외한 복수의 나머지 이미지 사이의 거리를 각각 산출하고, 상기 산출된 거리에 기초하여 상기 군집을 생성할 수 있다.

상기 군집을 생성하는 단계는, 상기 복수의 나머지 이미지 중 상기 산출된 거리가 기 설정된 거리 이하인 이미지를 상기 기준 이미지에 대한 이웃 이미지로 결정하고, 상기 이웃 이미지의 개수에 기초하여 상기 군집을 생성할 수 있다.

상기 군집을 생성하는 단계는, 상기 이웃 이미지의 개수가 기 설정된 개수 이상인 경우, 상기 기준 이미지 및 상기 이웃 이미지를 포함하는 군집을 생성할 수 있다.

상기 입력 이미지를 생성한 카메라의 포즈를 추정하는 단계는, 상기 군집에 포함된 각 이미지로부터 하나 이상의 특징점을 추출하고, 상기 추출된 하나 이상의 특징점에 기초하여 상기 카메라의 포즈를 추정할 수 있다.

개시되는 실시예들에 따르면, 입력 이미지에 대해 검색된 유사 이미지를 태깅(tagging)된 시점(viewpoint)를 통해 군집함으로써 적은 시간과 비용으로 유사 이미지에 대한 검증 과정을 제공할 수 있는바, 저비용의 신속한 검증 과정을 통해 카메라 포즈 추정의 정확성을 향상시킬 수 있다.

도 1은 일 실시예에 따른 카메라 포즈 추정 장치의 블록도

도 2는 일 실시예에 따른 카메라 포즈 추정 방법의 흐름도

도 3은 일 실시예에 따른 군집 생성 방법의 구체적인 흐름도

도 4는 일 실시예에 따른 유사 이미지 검색 결과 유사 이미지와 입력 이미지 각각의 위치를 나타낸 도면

도 5는 일 실시예에 따라 검색된 유사 이미지 중 군집화된 이미지의 위치와 입력 이미지의 위치를 나타낸 도면

도 6은 일 실시예에 따른 컴퓨팅 장치를 포함하는 컴퓨팅 환경을 예시하여 설명하기 위한 블록도

이하, 도면을 참조하여 구체적인 실시형태를 설명하기로 한다. 이하의 상세한 설명은 본 명세서에서 기술된 방법, 장치 및/또는 시스템에 대한 포괄적인 이해를 돕기 위해 제공된다. 그러나 이는 예시에 불과하며 개시되는 실시예들은 이에 제한되지 않는다.

실시예들을 설명함에 있어서, 관련된 공지기술에 대한 구체적인 설명이 개시되는 실시예들의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고, 후술되는 용어들은 개시되는 실시예들에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 상세한 설명에서 사용되는 용어는 단지 실시예들을 기술하기 위한 것이며, 결코 제한적이어서는 안 된다. 명확하게 달리 사용되지 않는 한, 단수 형태의 표현은 복수 형태의 의미를 포함한다. 본 설명에서, "포함" 또는 "구비"와 같은 표현은 어떤 특성들, 숫자들, 단계들, 동작들, 요소들, 이들의 일부 또는 조합을 가리키기 위한 것이며, 기술된 것 이외에 하나 또는 그 이상의 다른 특성, 숫자, 단계, 동작, 요소, 이들의 일부 또는 조합의 존재 또는 가능성을 배제하도록 해석되어서는 안 된다.

도 1은 일 실시예에 따른 카메라 포즈 추정 장치의 블록도이다.

도 1을 참조하면, 도시된 카메라 포즈 추정 장치(100)는 유사 이미지 검색부(110), 군집화부(120) 및 추정부(130)를 포함한다.

도시된 실시예에서, 각 구성들은 이하에 기술된 것 이외에 상이한 기능 및 능력을 가질 수 있고, 이하에 기술된 것 이외에도 추가적인 구성을 포함할 수 있다.

또한, 일 실시예에서, 유사 이미지 검색부(110), 군집화부(120) 및 추정부(130)는 물리적으로 구분된 하나 이상의 장치를 이용하여 구현되거나, 하나 이상의 프로세서 또는 하나 이상의 프로세서 및 소프트웨어의 결합에 의해 구현될 수 있으며, 도시된 예와 달리 구체적 동작에 있어 명확히 구분되지 않을 수 있다.

유사 이미지 검색부(110)는 입력 이미지에 기초하여, 기 저장된 복수의 이미지 중 입력 이미지에 대한 복수의 유사 이미지를 검색한다.

일 실시예에 따르면, 유사 이미지 검색부(110)는 이미지 리트리벌(Image Retrieval) 알고리즘을 이용하여 기 저장된 복수의 이미지 중 입력 이미지와 유사한 이미지를 검색할 수 있다. 이때, 이미지 리트리벌 알고리즘이란, 이미지의 지역적 혹은 전역적 특징을 활용하여 인공신경망을 학습시킨 뒤 입력 이미지와 학습 된 이미지들의 특징 비교를 통해 가장 높은 유사도 값을 갖는 유사 이미지를 찾아내는 알고리즘을 의미할 수 있다.

군집화부(120)는 복수의 유사 이미지 각각에 태깅된 시점(viewpoint) 데이터에 기초하여, 복수의 유사 이미지 중 기 설정된 조건을 만족하는 적어도 일부 이미지를 포함하는 군집(cluster)을 생성한다.

이때, 일 실시에에 따르면, 시점 데이터는 이미지가 촬영된 위치와 관련된 정보를 포함할 수 있다. 예를 들어, 시점 데이터는 위치 좌표, 위경도, 방위 등과 같은 저차원의 실수값으로 구성된 데이터를 포함할 수 있다.

군집화부(120)는 복수의 유사 이미지에 태깅된 시점 데이터를 통해 유사 이미지 검색부(110)에 의해 검색된 각 유사 이미지가 입력 이미지와 실제로 유사한 이미지인지 여부를 추가적으로 검증할 수 있다.

따라서, 기존에 일반적인 유사 이미지 분류 알고리즘이 정확도 또는 성능을 향상시키기 위해 학습데이터의 특징 차원을 늘리거나 비용이 큰 고차원 데이터에 의한 추가적인 검증 단계를 거치는 것과 달리, 일 실시예는 상술한 과정 없이도 본래의 목적을 달성할 있으므로 기존의 방식과 비교할 때 메모리 요구량, 계산 복잡량 등을 대폭 감소시킬 수 있다.

다만, 이때 유사한 이미지인지 여부는 입력 이미지에 포함된 객체(예를 들어, 건물, 고정된 조형물 등)와 동일한 객체를 포함하는 이미지인지 여부를 의미할 수 있다.

여기서 유사 이미지란, 입력 이미지에 포함되어 있는 객체와 동일한 객체를 포함하거나 그 객체와 외관상 유사하나 상이한 객체가 이미지에 포함되어 있는 이미지를 포함할 수 있다.

그 중, 입력 이미지에 포함되어 있는 객체와 동일한 객체가 이미지에 포함되어 있는 이미지는 실제로 유사한 이미지를 의미할 수 있다.

일 실시예에 따르면, 군집화부(120)는 복수의 유사 이미지 중 하나를 임의 선택하고, 선택된 이미지를 기준 이미지로 설정할 수 있다.

또한, 군집화부(120)는 복수의 유사 이미지 각각에 태깅된 시점 데이터에 기초하여, 기준 이미지와 복수의 유사 이미지 중 기준 이미지를 제외한 나머지 이미지 사이의 거리를 산출하고, 산출된 거리에 기초하여 군집을 생성할 수 있다.

이때, 일 실시예에 따르면, 기준 이미지와 복수의 나머지 이미지 사이의 거리는 예를 들어, 유클리디안 거리(Euclidean distance), 코사인 유사도(Cosine similarity) 등일 수 있다.

한편, 일 실시예에 따르면, 군집화부(120)는, 복수의 나머지 이미지 중 기준 이미지와의 거리가 기 설정된 거리 이하인 이미지를 기준 이미지에 대한 이웃 이미지로 결정하고, 이웃 이미지의 개수에 기초하여 군집을 생성할 수 있다.

구체적으로, 일 실시예에 따르면, 군집화부(120)는 기준 이미지에 대한 이웃 이미지의 개수가 기 설정된 개수 이상인 경우, 기준 이미지 및 이웃 이미지를 포함하는 군집을 생성할 수 있다.

반면, 군집화부(120)는 기준 이미지에 대한 이웃 이미지의 개수가 기 설정된 개수 미만인 경우, 이웃 이미지의 개수가 기 설정된 개수 이상이 될 때까지 복수의 유사 이미지 중 기준 이미지를 변경하면서 상술한 이웃 이미지 결정 과정을 반복 수행하여 군집을 생성할 수 있다.

즉, 동일한 객체를 포함하는 이미지들 사이의 시점 데이터에 기초한 거리는 서로 가까울 수 밖에 없는 반면, 상이한 객체를 포함하는 이미지들 사이의 시점 데이터에 기초한 거리는 동일한 객체를 포함하는 이미지들 사이의 거리보다 멀어질 수 밖에 없다.

또한, 유사 이미지 검색부(110)에 의해 검색된 복수의 유사 이미지 중 입력 이미지와 상이한 객체를 포함하는 이미지가 일부 포함되어 있더라도, 입력 이미지와 동일한 객체를 포함하는 이미지가 입력 이미지와 상이한 객체를 포함하는 이미지보다 다수일 가능성이 높다.

따라서, 상술한 군집화 과정을 통해 군집화부(120)는 검색된 복수의 유사 이미지 중 입력 이미지와 동일한 객체를 포함하는 유사 이미지를 선별할 수 있게 된다.

추정부(130)는 생성된 군집에 기초하여 상기 입력 이미지를 생성한 카메라의 포즈를 추정한다.

추정부(130)는 군집에 포함된 각 이미지로부터 특징점을 추출하고, 추출된 특징점에 기초하여 카메라의 포즈를 추정할 수 있다.

이때, 카메라의 포즈 추정을 위한 특징점 추출 및 매칭 알고리즘으로는 코너, 엣지, 라인 등의 유의미한 특징을 추출하는 SIFT, SURF, FAST 등의 알고리즘과, 인공 신경망 학습을 통해 이미지 자체를 학습하여 주요 특징점을 검출하는 딥러닝 기반 기술들이 사용될 수 있다.

또한, 매칭된 특징점을 검증하는 알고리즘으로는 대표적으로 RANSAC(RANdom Sample Consensus)일 수 있으며, 좌표계 변환 알고리즘으로는 대표적으로 Perspective-n-Point(PnP) 알고리즘일 수 있다.

도 2는 일 실시예에 따른 카메라 포즈 추정 방법의 흐름도이다.

도 2에 도시된 방법은 도 1에 도시된 카메라 포즈 추정 장치(100)에 의해 수행될 수 있다.

도 2를 참조하면, 우선, 카메라 포즈 추정 장치(100)는 입력 이미지에 기초하여, 기 저장된 복수의 이미지 중 상기 입력 이미지에 대한 복수의 유사 이미지를 검색한다(210).

이후, 카메라 포즈 추정 장치(100)는 복수의 유사 이미지 각각에 태깅된 시점 데이터에 기초하여, 복수의 유사 이미지 중 기 설정된 조건을 만족하는 적어도 일부 이미지를 포함하는 군집을 생성한다(220).

구체적으로, 일 실시예에 따르면, 카메라 포즈 추정 장치(100)는 복수의 유사 이미지 각각에 태깅된 시점 데이터에 기초하여, 복수의 유사 이미지 중에서 선택된 이미지와 상기 복수의 유사 이미지 중 선택된 이미지를 제외한 복수의 나머지 이미지 사이의 거리를 산출하고, 상기 산출된 거리에 기초하여 상기 군집을 생성할 수 있다.

또한, 일 실시예에 따르면 카메라 포즈 추정 장치(100)는 복수의 나머지 이미지 중 상기 산출된 거리가 기 설정된 거리 이하인 이미지를 선택된 이미지에 대한 이웃 이미지로 결정하고, 이웃 이미지의 개수에 기초하여 군집을 생성할 수 있다.

이후, 카메라 포즈 추정 장치(100)는 군집에 기초하여 상기 입력 이미지를 생성한 카메라의 포즈를 추정한다(230).

구체적으로, 일 실시예에 따르면, 카메라 포즈 추정 장치(100)는 군집에 포함된 각 이미지로부터 특징점을 추출하고, 추출된 특징점에 기초하여 상기 카메라의 포즈를 추정할 수 있다.

도 3은 일 실시예에 따른 군집을 생성하는 방법의 흐름도이다.

도 3에 도시된 방법은 도 1에 도시된 카메라 포즈 추정 장치(100)에 의해 수행될 수 있다.

도 3을 참조하면, 우선, 카메라 포즈 추정 장치(100)는 입력 이미지에 기초하여 기 저장된 복수의 이미지 중 상기 입력 이미지에 대한 복수의 유사 이미지를 검색할 수 있다(310).

이후, 카메라 포즈 추정 장치(100)는 검색된 복수의 유사 이미지 중 어느 하나를 선택할 수 있다(320).

이후, 카메라 포즈 추정 장치(100)는 선택된 이미지와 선택된 이미지를 제외한 나머지 유사 이미지 간에 산출된 거리가 기 설정된 거리 이하인 이미지는 선택된 이미지에 대한 이웃 이미지로 결정할 수 있다(330).

이후, 결정된 이웃 이미지의 개수가 기 설정된 개수 이상인 경우, 선택된 이미지와 이웃 이미지를 동일한 군집으로 생성시킬 수 있다(350).

다만, 결정된 이웃 이미지의 개수가 기 설정된 개수 미만인 경우, 카메라 포즈 추정 장치(100)는 기 선택된 이미지를 제외한 나머지 복수의 유사 이미지 중에서 다른 하나를 재선택하여 320 내지 340 단계를 재차 수행할 수 있다.

350 단계 이후, 카메라 포즈 추정 장치(100)는 생성된 군집에 기초하여 생성된 입력 이미지의 카메라 포즈를 추정할 수 있다(360).

도 4는 일 실시예에 따른 입력 이미지에 대한 유사 이미지 검색을 통해 검색된 유사 이미지와 입력 이미지 각각에 대응되는 위치를 시점 데이터에 기초하여 맵 상에 표시한 도면이다.

구체적으로, 도 4에서는 입력 이미지의 위치(410)와 이미지 리트리벌 알고리즘에 의해 검색된 입력 이미지에 대한 유사 이미지들의 위치(420, 430, 440, 450, 460, 470)를 맵 상에 표시하고 있다.

서로 다른 두 객체의 전역적 특징이 유사한 경우, 이미지 리트리벌 알고리즘에 의해 두 객체 중 하나를 포함하는 이미지가 다른 하나를 포함하는 입력 이미지의 유사 이미지로 검색될 수 있다.

이때, 유사 이미지로 검색된 이미지들 중 입력 이미지와 실제로 동일한 객체를 포함하는 유사 이미지들의 위치(420, 430, 440)는 입력 이미지의 위치(410)와 근접한 거리에 있는 반면, 입력 이미지와 실제로 상이한 객체를 포함하는 유사 이미지들의 위치(450, 460, 470)는 입력 이미지의 위치(410)와 상대적으로 먼 거리에 있게 된다.

도 5는 일 실시예에 따른 군집화를 통해 생성된 군집에 포함된 이미지 각각에 대응되는 위치를 시점 데이터에 기초하여 맵 상에 표시한 도면이다.

구체적으로, 도 5에서는 도 4에 도시된 유사 이미지들의 위치(420, 430, 440, 450, 460, 470) 중 군집화를 통해 생성된 군집에 포함된 유사 이미지들의 위치(420, 430, 440)를 입력 이미지(410)의 위치와 함께 맵 상에 표시하고 있다. 도 5에 도시된 예에서 알 수 있듯이, 입력 이미지에 기초한 검색을 통해 검색된 유사 이미지 중 입력 이미지에 포함된 객체와 상이한 객체를 포함하는 유사 이미지가 포함되어 있더라도, 상술한 군집화를 통해 입력 이미지에 포함된 객체와 동일한 객체를 포함하는 유사 이미지를 선별할 수 있게 된다.

도 6은 일 실시예에 따른 컴퓨팅 장치를 포함하는 컴퓨팅 환경(10)을 예시하여 설명하기 위한 블록도이다. 도시된 실시예에서, 각 컴포넌트들은 이하에 기술된 것 이외에 상이한 기능 및 능력을 가질 수 있고, 이하에 기술된 것 이외에도 추가적인 컴포넌트를 포함할 수 있다.

도시된 컴퓨팅 환경(10)은 컴퓨팅 장치(12)를 포함한다. 일 실시예에서, 컴퓨팅 장치(12)는 카메라 포즈 추정 장치(100)일 수 있다.

컴퓨팅 장치(12)는 적어도 하나의 프로세서(14), 컴퓨터 판독 가능 저장 매체(16) 및 통신 버스(18)를 포함한다. 프로세서(14)는 컴퓨팅 장치(12)로 하여금 앞서 언급된 예시적인 실시예에 따라 동작하도록 할 수 있다. 예컨대, 프로세서(14)는 컴퓨터 판독 가능 저장 매체(16)에 저장된 하나 이상의 프로그램들을 실행할 수 있다. 상기 하나 이상의 프로그램들은 하나 이상의 컴퓨터 실행 가능 명령어를 포함할 수 있으며, 상기 컴퓨터 실행 가능 명령어는 프로세서(14)에 의해 실행되는 경우 컴퓨팅 장치(12)로 하여금 예시적인 실시예에 따른 동작들을 수행하도록 구성될 수 있다.

컴퓨터 판독 가능 저장 매체(16)는 컴퓨터 실행 가능 명령어 내지 프로그램 코드, 프로그램 데이터 및/또는 다른 적합한 형태의 정보를 저장하도록 구성된다. 컴퓨터 판독 가능 저장 매체(16)에 저장된 프로그램(20)은 프로세서(14)에 의해 실행 가능한 명령어의 집합을 포함한다. 일 실시예에서, 컴퓨터 판독 가능 저장 매체(16)는 메모리(랜덤 액세스 메모리와 같은 휘발성 메모리, 비휘발성 메모리, 또는 이들의 적절한 조합), 하나 이상의 자기 디스크 저장 디바이스들, 광학 디스크 저장 디바이스들, 플래시 메모리 디바이스들, 그 밖에 컴퓨팅 장치(12)에 의해 액세스되고 원하는 정보를 저장할 수 있는 다른 형태의 저장 매체, 또는 이들의 적합한 조합일 수 있다.

통신 버스(18)는 프로세서(14), 컴퓨터 판독 가능 저장 매체(16)를 포함하여 컴퓨팅 장치(12)의 다른 다양한 컴포넌트들을 상호 연결한다.

컴퓨팅 장치(12)는 또한 하나 이상의 입출력 장치(24)를 위한 인터페이스를 제공하는 하나 이상의 입출력 인터페이스(22) 및 하나 이상의 네트워크 통신 인터페이스(26)를 포함할 수 있다. 입출력 인터페이스(22) 및 네트워크 통신 인터페이스(26)는 통신 버스(18)에 연결된다. 입출력 장치(24)는 입출력 인터페이스(22)를 통해 컴퓨팅 장치(12)의 다른 컴포넌트들에 연결될 수 있다. 예시적인 입출력 장치(24)는 포인팅 장치(마우스 또는 트랙패드 등), 키보드, 터치 입력 장치(터치패드 또는 터치스크린 등), 음성 또는 소리 입력 장치, 다양한 종류의 센서 장치 및/또는 촬영 장치와 같은 입력 장치, 및/또는 디스플레이 장치, 프린터, 스피커 및/또는 네트워크 카드와 같은 출력 장치를 포함할 수 있다. 예시적인 입출력 장치(24)는 컴퓨팅 장치(12)를 구성하는 일 컴포넌트로서 컴퓨팅 장치(12)의 내부에 포함될 수도 있고, 컴퓨팅 장치(12)와는 구별되는 별개의 장치로 컴퓨팅 장치(12)와 연결될 수도 있다.

한편, 본 발명의 실시예는 본 명세서에서 기술한 방법들을 컴퓨터상에서 수행하기 위한 프로그램, 및 상기 프로그램을 포함하는 컴퓨터 판독 가능 기록매체를 포함할 수 있다. 상기 컴퓨터 판독 가능 기록매체는 프로그램 명령, 로컬 데이터 파일, 로컬 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나, 또는 컴퓨터 소프트웨어 분야에서 통상적으로 사용 가능한 것일 수 있다. 컴퓨터 판독 가능 기록매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광 기록 매체, 및 롬, 램, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 프로그램의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다.

이상에서 본 발명의 대표적인 실시예들을 상세하게 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리범위는 설명된 실시예에 국한되어 정해져서는 안 되며, 후술하는 청구범위뿐만 아니라 이 청구범위와 균등한 것들에 의해 정해져야 한다.

Claims

입력 이미지에 기초하여, 기 저장된 복수의 이미지 중 상기 입력 이미지에 대한 복수의 유사 이미지를 검색하는 유사 이미지 검색부;

상기 복수의 유사 이미지 각각에 태깅(tagging)된 시점(viewpoint) 데이터에 기초하여, 상기 복수의 유사 이미지 중 기 설정된 조건을 만족하는 적어도 일부 이미지를 포함하는 군집(cluster)을 생성하는 군집화부; 및

상기 군집에 기초하여 상기 입력 이미지를 생성한 카메라의 포즈를 추정하는 추정부를 포함하는, 카메라 포즈 추정 장치.
청구항 1에 있어서,

상기 군집화부는,

상기 복수의 유사 이미지 각각에 태깅된 시점 데이터에 기초하여, 상기 복수의 유사 이미지 중에서 임의 선택된 기준 이미지와 상기 복수의 유사 이미지 중 상기 기준 이미지를 제외한 복수의 나머지 이미지 사이의 거리를 각각 산출하고, 상기 산출된 거리에 기초하여 상기 군집을 생성하는, 카메라 포즈 추정 장치.
청구항 2에 있어서,

상기 군집화부는,

상기 복수의 나머지 이미지 중 상기 산출된 거리가 기 설정된 거리 이하인 이미지를 상기 기준 이미지에 대한 이웃 이미지로 결정하고, 상기 이웃 이미지의 개수에 기초하여 상기 군집을 생성하는, 카메라 포즈 추정 장치.
청구항 3에 있어서,

상기 군집화부는,

상기 이웃 이미지의 개수가 기 설정된 개수 이상인 경우, 상기 기준 이미지 및 상기 이웃 이미지를 포함하는 군집을 생성하는, 카메라 포즈 추정 장치.
청구항 1에 있어서,

상기 추정부는,

상기 군집에 포함된 각 이미지로부터 하나 이상의 특징점을 추출하고, 상기 추출된 하나 이상의 특징점에 기초하여 상기 카메라의 포즈를 추정하는 카메라 포즈 추정 장치.
입력 이미지에 기초하여, 기 저장된 복수의 이미지 중 상기 입력 이미지에 대한 복수의 유사 이미지를 검색하는 단계;

상기 복수의 유사 이미지 각각에 태깅(tagging)된 시점(viewpoint) 데이터에 기초하여, 상기 복수의 유사 이미지 중 기 설정된 조건을 만족하는 적어도 일부 이미지를 포함하는 군집(cluster)을 생성하는 단계; 및

상기 군집에 기초하여 상기 입력 이미지를 생성한 카메라의 포즈를 추정하는 단계를 포함하는, 카메라 포즈 추정 방법.
청구항 6에 있어서,

상기 군집을 생성하는 단계는,

상기 복수의 유사 이미지 각각에 태깅된 시점 데이터에 기초하여, 상기 복수의 유사 이미지 중에서 임의 선택된 기준 이미지와 상기 복수의 유사 이미지 중 상기 기준 이미지를 제외한 복수의 나머지 이미지 사이의 거리를 각각 산출하고, 상기 산출된 거리에 기초하여 상기 군집을 생성하는, 카메라 포즈 추정 방법.
청구항 7에 있어서,

상기 군집을 생성하는 단계는,

상기 복수의 나머지 이미지 중 상기 산출된 거리가 기 설정된 거리 이하인 이미지를 상기 기준 이미지에 대한 이웃 이미지로 결정하고, 상기 이웃 이미지의 개수에 기초하여 상기 군집을 생성하는, 카메라 포즈 추정 방법.
청구항 8항에 있어서,

상기 군집을 생성하는 단계는,

상기 이웃 이미지의 개수가 기 설정된 개수 이상인 경우, 상기 기준 이미지 및 상기 이웃 이미지를 포함하는 군집을 생성하는, 카메라 포즈 추정 방법.
청구항 6에 있어서,

상기 입력 이미지를 생성한 카메라의 포즈를 추정하는 단계는,

상기 군집에 포함된 각 이미지로부터 하나 이상의 특징점을 추출하고, 상기 추출된 하나 이상의 특징점에 기초하여 상기 카메라의 포즈를 추정하는 카메라 포즈 추정 방법.