KR101917515B1

KR101917515B1 - 물체 인식 장치, 물체 인식 방법 및 프로그램

Info

Publication number: KR101917515B1
Application number: KR1020170062709A
Authority: KR
Inventors: 노리마사 고보리; 구니마츠 하시모토; 미노루 야마우치
Original assignee: 도요타지도샤가부시키가이샤
Priority date: 2016-05-25
Filing date: 2017-05-22
Publication date: 2018-11-09
Also published as: CN107437060B; EP3249579A1; JP6528723B2; EP3249579B1; JP2017211807A; CN107437060A; KR20170133262A; US10452950B2; US20170344850A1

Abstract

물체 인식 장치는, 인식 대상물의 화상 정보를 취득하는 화상 정보 취득 수단과, 인식 대상물의 후보인 물체 후보와, 해당 물체 후보에 대하여 검출 가능한 검출기를 대응지은 검출 프로파일 정보와, 물체 후보에 대응지어진 해당 물체 후보의 모델 화상 정보를 기억하는 기억 수단과, 검출 프로파일 정보에 설정된 복수의 검출기를 갖고, 화상 정보 취득 수단에 의해 취득된 화상 정보로부터, 해당 검출기를 사용해서 상기 인식 대상물을 검출하는 물체 검출 수단을 구비한다. 물체 검출 수단의 검출기의 각각은, 검출 프로파일 정보에 있어서 해당 검출기에 대응지어진 물체 후보의 모델 화상 정보와, 화상 정보 취득 수단에 의해 취득된 인식 대상물의 화상 정보를 비교하여, 물체 후보를 검출하고, 해당 검출한 물체 후보를 인식 대상물로서 출력한다.

Description

물체 인식 장치, 물체 인식 방법 및 프로그램 {OBJECT RECOGNITION APPARATUS, OBJECTION RECOGNITION METHOD, AND PROGRAM}

본 발명은, 물체를 인식하는 물체 인식 장치, 물체 인식 방법 및 프로그램에 관한 것이다.

물체의 촬상 화상으로부터 추출한 윤곽 정보에 기초하여, 물체의 위치 및 자세(위치 자세)를 검출하는 장치가 알려져 있다(일본 특허 공개 제2008-015895호 공보 참조).

그런데 상기와 같은 검출기는, 검출하는데 능숙한 또는 능숙하지 못한 물체(예를 들어, 그 물체가 윤곽 형상이 유니크, 얇은 형상의 경우 등)를 갖고 있다. 따라서, 사용하는 검출기의 종류에 따라서는, 그 물체를 검출할 수 없는 미검출이 될 우려가 있다.

본 발명은, 이러한 문제점을 감안하여 이루어진 것으로, 물체의 미검출을 억제해 인식 정밀도를 향상시킨 물체 인식 장치, 물체 인식 방법 및 프로그램을 제공하는 것을 주된 목적으로 한다.

상기 목적을 달성하기 위한 본 발명의 일 형태는, 인식 대상물의 화상 정보를 취득하는 화상 정보 취득 수단과, 상기 인식 대상물의 후보인 물체 후보와, 해당 물체 후보에 대하여 검출 가능한 검출기를 대응지은 검출 프로파일 정보와, 상기 물체 후보에 대응지어진 해당 물체 후보의 모델 화상 정보를 기억하는 기억 수단과, 상기 검출 프로파일 정보에 설정된 복수의 검출기를 갖고, 상기 화상 정보 취득 수단에 의해 취득된 화상 정보에 기초하여, 해당 검출기를 사용해서 상기 인식 대상물을 검출하는 물체 검출 수단을 구비하고, 상기 물체 검출 수단의 검출기의 각각은, 상기 검출 프로파일 정보에 있어서 해당 검출기에 대응지어진 상기 물체 후보의 모델 화상 정보와, 상기 화상 정보 취득 수단에 의해 취득된 인식 대상물의 화상 정보를 비교하여, 상기 물체 후보를 검출하고, 해당 검출한 물체 후보를 상기 인식 대상물로서 출력하는 것을 특징으로 하는 물체 인식 장치이다.

이 일 형태에 있어서, 상기 기억 수단은 상기 물체 후보와, 해당 물체 후보에 대하여 판정 가능한 판정기와 대응지은 판정 프로파일 정보를 기억하고 있으며, 상기 판정 프로파일 정보에 설정된 복수의 판정기를 갖고, 상기 화상 정보 취득 수단에 의해 취득된 화상 정보로부터, 해당 판정기를 사용해서 상기 물체 검출 수단으로부터 출력된 물체 후보에 대하여 판정을 행하는 물체 판정 수단을 더 구비하고, 상기 물체 판정 수단은, 상기 기억 수단의 판정 프로파일 정보에 기초하여, 상기 물체 검출 수단에 의해 검출된 물체 후보에 대응하는 판정기를 선택하고, 해당 판정기를 사용하여, 상기 화상 정보 취득 수단에 의해 취득된 인식 대상물의 화상 정보의 색 정보 및 거리 정보 중 적어도 한쪽과, 상기 물체 검출 수단으로부터 출력된 물체 후보의 모델 화상 정보의 색 정보 및 거리 정보 중 적어도 한쪽을 비교하여, 상기 물체 후보가 소정값 이상의 신뢰도를 갖는지 여부를 판정하고, 해당 소정값 이상의 신뢰도를 갖는다고 판정한 물체 후보를 상기 인식 대상물로서 출력해도 된다.

이 일 형태에 있어서, 상기 물체 검출 수단은, 상기 화상 정보 취득 수단에 의해 취득된 인식 대상물의 화상 정보의 특징량과, 상기 검출한 물체 후보의 모델 화상 정보의 특징량에 기초하여, 상기 물체 후보의 위치 자세 후보를 검출해도 된다.

이 일 형태에 있어서, 상기 물체 검출 수단에 의해 검출된 물체 후보 및 해당 위치 자세 후보 중에서, 유사한 것끼리를 동일한 것으로서 통합하는 클러스터링 처리 수단을 더 구비하고 있어도 된다.

이 일 형태에 있어서, 상기 물체 검출 수단에 의해 검출된 물체 후보 및 해당 위치 자세 후보의 모델 화상의 모델과, 상기 화상 정보의 인식 대상물 사이의 기하량을 구하고, 상기 물체 검출 수단에 의해 검출된 물체 후보 및 해당 위치 자세 후보 중에서, 해당 구한 기하량이 소정량 이상이 되는 물체 후보 및 해당 위치 자세 후보를 제외한 트래킹 처리를 행하고, 해당 트래킹 처리된 물체 후보 및 해당 위치 자세 후보를 출력하는 트래킹 처리 수단을 더 구비하고 있어도 된다.

이 일 형태에 있어서, 상기 기억 수단은, 상기 모델 화상의 모델을 둘러싸는 3차원 복셀의 각 그리드로부터 상기 모델까지의 해당 모델 상의 최근방점의 정보를 기억하고 있고, 상기 트래킹 처리 수단은, 상기 기억 수단에 기억된 상기 최근방점의 정보를 사용하여, 상기 트래킹 처리를 행해도 된다.

이 일 형태에 있어서, 상기 인식 대상물의 후보인 물체 후보의 색 정보, 형상 정보, 표기 정보 및 물성 정보 중 적어도 하나를 포함하는 상기 물체 후보의 특징을 나타내는 특징 정보에 기초하여, 해당 물체 후보와 적어도 하나의 검출기와 대응지은 상기 검출 프로파일 정보 및, 상기 물체 후보의 색 정보 및 표기 정보 중 적어도 하나를 포함하는 상기 물체 후보의 특징을 나타내는 특징 정보에 기초하여, 해당 물체 후보와 적어도 하나의 판정기와 대응지은 상기 판정 프로파일 정보 중 적어도 한쪽을 생성하는 프로파일 정보 생성 수단을 더 구비하고 있어도 된다.

상기 목적을 달성하기 위한 본 발명의 일 형태는, 인식 대상물의 화상 정보를 취득하는 스텝과, 상기 인식 대상물의 후보인 물체 후보와, 해당 물체 후보에 대하여 검출 가능한 검출기를 대응지은 검출 프로파일 정보에 설정된 복수의 검출기를 사용하여, 상기 취득된 화상 정보에 기초하여, 상기 인식 대상물을 검출하는 스텝을 포함하는 물체 인식 방법이며, 상기 검출기의 각각은, 상기 검출 프로파일 정보에 있어서 해당 검출기에 대응지어진 상기 물체 후보의 모델 화상 정보와, 상기 취득된 인식 대상물의 화상 정보를 비교하여, 상기 물체 후보를 검출하고, 해당 검출한 물체 후보를 상기 인식 대상물로서 출력하는 것을 특징으로 하는 물체 인식 방법이라도 된다.

상기 목적을 달성하기 위한 본 발명의 일 형태는, 인식 대상물의 화상 정보를 취득하는 처리와, 상기 인식 대상물의 후보인 물체 후보와, 해당 물체 후보에 대하여 검출 가능한 검출기를 대응지은 검출 프로파일 정보에 설정된 복수의 검출기를 갖고, 상기 취득된 화상 정보로부터, 해당 검출기를 사용해서 상기 인식 대상물을 검출하는 처리를 컴퓨터에 실행시키는 프로그램이며, 상기 검출기의 각각은, 상기 검출 프로파일 정보에 있어서 해당 검출기에 대응지어진 상기 물체 후보의 모델 화상 정보와, 상기 취득된 인식 대상물의 화상 정보를 비교하여, 상기 물체 후보를 검출하고, 해당 검출한 물체 후보를 상기 인식 대상물로서 출력하는 것을 특징으로 하는 프로그램이어도 된다.

본 발명에 따르면, 물체의 미검출을 억제해 인식 정밀도를 향상시킨 물체 인식 장치, 물체 인식 방법 및 프로그램을 제공할 수 있다.

본 발명의 다른 특징, 목적, 장점은, 본 발명을 제한하기 위한 것이 아닌 예로서 부수되는 도면에 대한 참조와 함께 이하의 상세한 설명을 읽는 것에 의해 보다 명백해질 것이다.

도 1은, 본 발명의 실시 형태 1에 관한 물체 인식 장치의 개략적인 시스템 구성을 도시하는 블록도이다.
도 2는, 물체 후보와 검출기를 대응짓는 처리 플로우의 일례를 도시하는 도면이다.
도 3은, 물체 후보와 검출기를 대응지은 검출 프로파일 정보의 일례를 도시하는 도면이다.
도 4는, 본 발명의 실시 형태 2에 관한 물체 인식 장치의 개략적인 시스템 구성을 도시하는 블록도이다.
도 5는, 클러스터링 처리를 설명하기 위한 도면이다.
도 6은, 본 발명의 실시 형태 3에 관한 물체 인식 장치의 개략적인 시스템 구성을 도시하는 블록도이다.
도 7은, CLBP 판정기의 판정 방법을 설명하기 위한 도면이다.
도 8은, 물체 후보와 판정기를 대응지은 판정 프로파일 정보의 일례를 도시하는 도면이다.
도 9는, 물체 후보와 판정기를 대응짓는 처리 플로우의 일례를 도시하는 도면이다.
도 10은, 본 발명의 실시 형태 4에 관한 물체 인식 장치의 개략적인 시스템 구성을 도시하는 블록도이다.
도 11은, 포인트 클라우드의 대응짓기를 설명하기 위한 도면이다.
도 12는, 물체 위치 자세 후보의 모델과 인식 대상물 간의 기하량을 구하는 방법의 일례를 도시하는 도면이다.
도 13은, 3차원 복셀 그리드의 일례를 도시하는 도면이다.
도 14는, 본 발명의 실시 형태 1 내지 4를 조합한 구성의 일례를 도시하는 도면이다.

실시 형태 1

이하, 도면을 참조하여 본 발명의 실시 형태에 대해서 설명한다. 도 1은, 본 발명의 실시 형태 1에 관한 물체 인식 장치의 개략적인 시스템 구성을 도시하는 블록도이다. 본 실시 형태 1에 관한 물체 인식 장치(1)는, 임의의 3차원 형상의 인식 대상물(이제부터 인식하는 대상물) 및 그 위치 및 자세(위치 자세)를 검출하는 장치이다.

물체 인식 장치(1)는, 예를 들어 연산 처리 등을 행하는 CPU(Central Processing Unit), CPU에 의해 실행되는 연산 프로그램 등이 기억된 ROM(Read Only Memory)이나 RAM(Random Access Memory)으로 이루어지는 메모리, 외부와 신호의 입출력을 행하는 인터페이스부(I/F) 등으로 이루어지는 마이크로컴퓨터를 중심으로 해서, 하드웨어 구성되어 있다. CPU, 메모리 및 인터페이스부는, 데이터 버스 등을 개재하여 서로 접속되어 있다.

물체 인식 장치(1)는, 화상 정보 취득부(2)와, 프로파일 정보 생성부(3)와, 기억부(4)와, 물체 검출부(5)를 구비하고 있다.

화상 정보 취득부(2)는, 화상 정보 취득 수단의 일 구체예이다. 화상 정보 취득부(2)는, 카메라나 거리 센서(거리 화상 센서, 밀리미터파 센서, 초음파 센서 등) 등 센서를 사용하여, 물체의 화상 정보[RGB 휘도 정보(색 정보)나 거리 정보를 포함함]를 취득한다.

프로파일 정보 생성부(3)는, 프로파일 정보 생성 수단의 일 구체예이다. 프로파일 정보 생성부(3)는, 인식 대상물의 후보인 물체 후보와, 해당 물체 후보에 대하여 검출 가능하고, 해당 물체 후보를 검출하는데 최적인 검출기를 대응지은 검출 프로파일 정보를 생성한다. 검출 프로파일 정보에는, 각 물체 후보와, 특성이 다른 적어도 하나의 검출기가 대응지어져 있다. 프로파일 정보 생성부(3)는, 미리 설정된 복수의 검출기 중에서 그 물체 후보를 검출하는데 최적인 검출기를 선택하고, 그 물체 후보와 선택한 검출기를 대응짓는다.

여기서, 복수의 검출기는, 예를 들어 LineMode 검출기(51), PnP 검출기(52), SHOT 검출기(53) 및 Bayse 검출기(54) 등을 포함한다.

LineMode 검출기(51)는, 이산화된 복수 종류의 특징량을 사용한 템플릿에 대해서, 메모리 배치를 고안함으로써 병렬 계산을 행하고, 고속으로 물체를 검출하는 검출기이다. LineMode 검출기(51)는, 예를 들어 전화기의 스탠드 등의, 일정 이상의 크기를 갖고, 또한 특징적인 윤곽 형상을 갖고 있거나, 또는 직육면체, 정육면체, 원기둥, 원뿔, 공기 형상 등의 입체 형상의 물체를 검출하는데도 최적이다.

상세한 알고리즘은, 예를 들어 비특허문헌

S.Hinterstoisser, C.Cagniart, S.Iiic, P.Sturm, N.Navab, P.Fua, V.Lepetit Gradient Response Maps for Real-Time Detection of Texture-Less Objects IEEE Transactions on Pattern Analysis and Maschine Intelligence(TPAMI)

에 상세하게 개시되어 있으며, 이것을 원용할 수 있는 것으로 한다.

PnP 검출기(52)는, SIFT(Scale-Invariant Feature Transform) 또는 A-KAZE(Accelerated KAZE) 특징량을 사용한 검출기이다. PnP 검출기(52)는, 예를 들어 과자 상자 등의, 일정 이상의 크기를 갖고, 또한 텍스처를 갖는 물체를 검출하는데도 최적이다.

SIFT에 대해서는, 예를 들어 비특허문헌

David G.Lowe, "Distinctive image features from scale-invariant keypoints," International Journal of Computer Vision, 60, 2(2004), pp.91-110에 상세하게 개시되어 있으며, 이것을 원용할 수 있는 것으로 한다.

A-KAZE에 대해서는, 예를 들어 비특허문헌

Fast Explicit Diffusion for Accelerrated Features in Nonlinear Scale Spaces Pablo F.Alcantarilla, Jesus Nuevo and Adrien Bartoli. In British Machine Vision Conference(BMVC). Bristol, UK. September 2013

SHOT 검출기(53)는, SHOT(Signature of Histograms of OrienTations) 특징량을 사용한 검출기이다. SHOT 검출기(53)는, 예를 들어 공기(볼) 등의, 곡률 변화를 갖거나 또는 선 대칭의 물체를 검출하는데도 최적이다.

SHOT에 대해서는, 예를 들어 비특허문헌 Tombari et al. Unique signatures of histograms for local surface description. ECCV 2010에 상세하게 개시되어 있으며, 이것을 원용할 수 있는 것으로 한다.

Bayse 검출기(54)는, 베이지안 네트워크에서 로컬 패치를 학습한 네트워크에 기초하여 검출을 행하는 검출기이다. Bayse 검출기(54)는, 예를 들어 리모컨 등의, 그 색이 흑색 및 투명한, 또는 강체가 아닌 물체를 검출하는데도 최적이다.

또한, 상기 검출기(51 내지 54)는 일례이며, 이에 한정되지 않는다. 프로파일 정보 생성부(3)는, 또한 HOG(Histograms of Oriented Gradients) 검출기, SURF(Speeded Up Robust Features) 검출기 등의 검출기를 선택해도 되고, 선택되는 검출기의 수 및 종류는 임의라도 된다.

프로파일 정보 생성부(3)는, 물체 후보의 색 정보, 형상 정보, 표기 정보 및 물성 정보 중 적어도 하나를 포함하는 물체 후보의 특징을 나타내는 특징 정보에 기초하여, 물체 후보와, 해당 물체 후보를 검출하는데 최적인 검출기를 대응짓는다.

프로파일 정보 생성부(3)는, 예를 들어 도 2의 흐름도에 따라, 미리 설정된 복수의 검출기(51 내지 54) 중에서 그 물체 후보를 검출하는데 최적인 검출기(51 내지 54)를 선택하고, 그 물체 후보와 선택한 검출기(51 내지 54)를 대응짓는다.

프로파일 정보 생성부(3)는, 화상 정보 취득부(2)에 의해 취득된 물체 후보의 화상 정보와, 기억부(4)에 미리 설정된 물성 정보에 기초하여, 물체 후보가 강체인지 여부를 판정한다(스텝 S101). 물성 정보는, 예를 들어 물체와 그 물성(강체, 탄성체 등)을 대응지은 정보를 포함하고 있고, 기억부(4)에 미리 설정되어 있다.

프로파일 정보 생성부(3)는, 물체 후보가 강체가 아니라고 판정하면(스텝 S101의 "아니오"), Bayse 검출기(54)를 선택한다(스텝 S102). 한편, 프로파일 정보 생성부(3)는, 물체 후보가 강체라고 판정하면(스텝 S101의 "예"), 물체 후보의 색이 흑색 또는 투명색은 아닌지 여부를 판정한다(스텝 S103).

프로파일 정보 생성부(3)는, 물체 후보의 색이 흑색 또는 투명색이라고 판정하면(스텝 S103의 "아니오"), Bayse 검출기(54)를 선택한다(스텝 S102). 한편, 프로파일 정보 생성부(3)는, 물체 후보의 색이 흑색 또는 투명색이 아니라고 판정하면(스텝 S103의 "예"), 물체 후보의 표면에 표기 정보(텍스처, 기호, 도형, 상형 문자 등을 포함함)가 있는지 여부를 판정한다(스텝 S104).

프로파일 정보 생성부(3)는, 물체 후보의 표면에 표기 정보가 없다고 판정하면(스텝 S104의 "아니오"), 후술하는 (스텝 S108)로 이행한다. 한편, 프로파일 정보 생성부(3)는, 물체 후보의 표면에 표기 정보가 있다고 판정하면(스텝 S104의 "예"), 그 표기 정보의 사이즈(문자 사이즈, 폭, 면적 등)가 소정값 A 이상인지 여부를 판정한다(스텝 S105).

프로파일 정보 생성부(3)는, 물체 후보의 표기 정보의 사이즈가 소정값 A 이상이 아니라고 판정하면(스텝 S105의 "아니오"), 후술하는 (스텝 S108)로 이행한다. 한편, 프로파일 정보 생성부(3)는, 물체 후보의 표기 정보의 사이즈가 소정값 A 이상이라 판정하면(스텝 S105의 "예"), 그 표기 정보가 비대칭 또는 비주기성인지 여부를 판정한다(스텝 S106).

프로파일 정보 생성부(3)는, 물체 후보의 표기 정보가 비대칭 또는 비주기성이 아니라고 판정하면(스텝 S106의 "아니오"), 후술하는 (스텝 S108)로 이행한다. 한편, 프로파일 정보 생성부(3)는, 물체 후보의 표기 정보가 비대칭 또는 비주기성이라고 판정하면(스텝 S106의 "예"), PnP 검출기(52)를 선택한다(스텝 S107).

프로파일 정보 생성부(3)는, 물체 후보의 사이즈(체적, 높이, 폭, 종횡 치수 등)가 소정값 B 이상인지 여부를 판정한다(스텝 S108). 프로파일 정보 생성부(3)는, 물체 후보의 사이즈가 소정값 B 이상이라 판정하면(스텝 S108의 "예"), 물체 후보가 직육면체, 정육면체, 원기둥, 원뿔, 또는 공기에 가까운 3차원 형상인지 여부를 판정한다(스텝 S109). 프로파일 정보 생성부(3)는, 물체 후보가 직육면체, 정육면체, 원기둥, 원뿔, 또는 공기에 가까운 3차원 형상이라고 판정하면(스텝 S109의 "예"), LineMode 검출기(51)를 선택한다(스텝 S110). 한편, 프로파일 정보 생성부(3)는, 물체 후보가 직육면체, 정육면체, 원기둥, 원뿔, 또는 공기에 가까운 3차원 형상이 아니라고 판정하면(스텝 S109의 "아니오"), 후술하는 (스텝 S111)로 이행한다.

프로파일 정보 생성부(3)는, 물체 후보의 사이즈가 소정값 B 이상이 아니라고 판정하면(스텝 S108의 "아니오"), 물체 후보에 3차원 형상이 선 대칭이 아닌지 여부를 판정한다(스텝 S111).

프로파일 정보 생성부(3)는, 물체 후보의 3차원 형상이 선 대칭이 아니라고 판정하면(스텝 S111의 "예"), LineMode 검출기(51)를 선택한다(스텝 S110). 한편, 프로파일 정보 생성부(3)는, 물체 후보의 3차원 형상이 선 대칭이라고 판정하면(스텝 S111의 "아니오"), 물체 후보의 3차원 형상에 곡률 변화가 있고, 그 곡률이 소정값 C 이상인지 여부를 판정한다(스텝 S112).

프로파일 정보 생성부(3)는, 물체 후보의 3차원 형상에 곡률 변화가 있고, 그 곡률이 소정값 C 이상이라 판정하면(스텝 S112의 "예"), LineMode 검출기(51)를 선택한다(스텝 S110). 한편, 프로파일 정보 생성부(3)는, 물체 후보의 3차원 형상에 곡률 변화가 없고, 그 곡률이 소정값 C 이상이 아니라고 판정하면(스텝 S112의 "아니오"), SHOT 검출기(53)를 선택한다(스텝 S113).

이와 같이, 프로파일 정보 생성부(3)에 의해, 물체 후보의 색 정보, 형상 정보, 표기 정보 및 물성 정보 중 적어도 하나를 포함하는 물체 후보의 특징을 나타내는 특징 정보에 기초하여, 물체 후보와, 해당 물체 후보를 검출하는데 최적인 검출기(51 내지 54)를, 대응지은 검출 프로파일 정보를 자동으로 생성할 수 있다.

프로파일 정보 생성부(3)는, 상술한 플로우에 따라, 물체 후보와 선택한 검출기(51 내지 54)를 대응지은 검출 프로파일 정보를 생성하고, 생성한 검출 프로파일 정보를 기억부(4)에 기억시킨다.

또한, 물체 인식 장치(1)는, 상술한 프로파일 정보 생성부(3)를 갖지 않은 구성이라도 된다. 이 경우, 물체 후보와 해당 물체 후보를 검출하는데 최적인 검출기(51 내지 54)를 대응지은 검출 프로파일 정보는, 미리 기억부(4)에 기억되어 있어도 된다. 또한, 유저가 상기 흐름도에 따라, 각 검출기(51 내지 54)의 선택을 행하고, 그 선택한 검출 프로파일 정보를 기억부(4)에 기억시켜도 된다. 기억부(4)에 기억된 검출 프로파일 정보는, 예를 들어 유저에 의해 임의로 설정 변경할 수 있도록 구성되어 있다.

기억부(4)는, 기억 수단의 일 구체예이다. 기억부(4)는, 상기 프로파일 정보 생성부(3)에 의해 생성된 검출 프로파일 정보를 기억한다. 또한, 기억부(4)는, 예를 들어 물체 후보 및 해당 위치 자세 후보의 3차원 물체 형상을 나타내는 복수의 모델 화상(물체의 CAD 데이터 등이며, 포인트 클라우드 데이터에 면을 덮은 메시 데이터나 색 정보 등을 포함함)을 기억하고 있다. 기억부(4)는, 예를 들어 상기 메모리에 의해 구성되어 있다.

물체 검출부(5)는, 물체 검출 수단의 일 구체예이다. 물체 검출부(5)는, 화상 정보 취득부(2)에 의해 취득된 인식 대상물의 화상 정보에 의해, 검출기(51 내지 54)를 사용하여, 인식 대상물의 물체 후보 및 해당 위치 자세의 후보(위치 자세 후보)를 검출한다.

물체 검출부(5)는, 기억부(4)의 검출 프로파일 정보에 설정된 검출기[예를 들어, LineMode 검출기(51), PnP 검출기(52), SHOT 검출기(53) 및 Bayse 검출기(54)]를 갖고 있다. 물체 검출부(5)는, 이들 검출기(51 내지 54)를 사용하여, 물체 후보 및 해당 위치 자세 후보를 검출한다.

그런데 상기와 같은 검출기(51 내지 54)는, 검출하는데 능숙한 또는 능숙하지 못한 물체를 갖고 있다. 예를 들어, LineMode 검출기(51)는, 물체가 어떤 일정 이상의 사이즈를 갖고, 그 윤곽 형상이 유니크한 물체를 고정밀도로 검출할 수 있다. 한편, LineMode 검출기(51)는 센서 노이즈 등에 기인하여 물체의 일부 윤곽 형상을 취득할 수 없는 경우나, 얇은 형상의 물체일 경우, 그 물체를 검출할 수 없는 미검출이 될 우려가 있다. 이와 같이, 사용하는 검출기의 종류에 따라서는, 그 물체의 미검출이 될 우려가 있다.

이에 반해, 본 실시 형태 1에 관한 물체 인식 장치(1)에 있어서, 검출기(51 내지 54)의 각각은, 검출 프로파일 정보에 있어서 해당 검출기(51 내지 54)에 대응지어진 물체 후보의 모델 화상 정보와, 화상 정보 취득부(2)에 의해 취득된 인식 대상물의 화상 정보를 비교하여, 물체 후보를 검출한다. 물체 검출부(5)의 검출기(51 내지 54)는, 검출한 물체 후보를 인식 대상물로서 출력한다.

이에 의해, 물체 검출부(5)의 검출기(51 내지 54)에는, 검출하는데 최적인 물체 후보의 모델 화상이 대응지어진다. 이로 인해, 검출기(51 내지 54)는, 대응지어진 검출하는데 최적인 물체 후보의 모델 화상을 사용하여, 검출하는데 최적인 물체 후보만을 검출하게 된다. 따라서, 상술한 검출기의 능숙 또는 능숙하지 못함에 기인하는 문제를 해소할 수 있으므로, 인식 대상물의 미검출을 억제해 인식 정밀도를 향상시킬 수 있다.

예를 들어, 물체 검출부(5)의 검출기[LineMode 검출기(51), PnP 검출기(52), SHOT 검출기(53) 및 Bayse 검출기(54)]는 기억부(4)의 검출 프로파일 정보에 기초하여, 기억부(4)로부터 해당 검출기(51 내지 54)에 대응지어진 물체 후보의 모델 화상을 취득한다. 그리고 검출기(51 내지 54)는, 화상 정보 취득부(2)에 의해 취득된 인식 대상물의 화상 정보(대상물 화상)의 특징량과, 기억부(4)로부터 취득한 대응지어진 물체 후보의 모델 화상의 특징량을 비교하여, 물체 후보를 검출한다.

보다 구체적으로는, 각 검출기(51 내지 54)는 화상 정보 취득부(2)에 대상물 화상의 특징량과, 기억부(4)의 물체 후보의 모델 화상의 특징량과의 상관값을 산출하고, 산출한 상관값이 소정값 이상이 되는 모델 화상의 물체 후보를 인식 대상물로서 검출한다.

기억부(4)의 검출 프로파일 정보에 있어서, 1개의 물체 후보와 복수의 검출기(51 내지 54)가 각각 대응지어져 있어도 된다. 이 경우, 각 검출기(51 내지 54)는, 중복해서 동일한 물체 후보를 검출하게 된다.

도 3은, 물체 후보와 검출기를 대응지은 검출 프로파일 정보의 일례를 도시하는 도면이다. 도 3에 도시한 바와 같이, 물체 후보 B(과자 상자)에는, LineMode 검출기(51) 및 PnP 검출기(52)가 대응지어져 있다. 이에 의해, LineMode 검출기(51)가 물체 후보 B의 윤곽 형상(크기 등)에 기초해서 그 물체 B를 검출할 뿐만 아니라, 또한 PnP 검출기(52)가 물체 후보 B의 텍스처에 기초하여 그 물체 후보 B를 검출한다. 따라서, 단일 물체 후보 B를 특성이 다른 LineMode 검출기(51) 및 PnP 검출기(52)를 사용해서 중복해서 검출함으로써 그 미검출을 더욱 억제할 수 있다.

마찬가지로, 물체 후보 C(공기)에는, LineMode 검출기(51) 및 SHOT 검출기(53)가 대응지어져 있다. 이에 의해, LineMode 검출기(51)가 물체 후보 C의 윤곽 형상(크기 등)에 기초해서 그 물체 후보 C를 검출할 뿐만 아니라, 또한 SHOT 검출기(53)가 물체 후보 C의 국소적인 3차원 형상의 곡률 변화에 기초하여 그 물체 후보 C를 검출한다. 따라서, 단일 물체 후보 C를 특성이 다른 LineMode 검출기(51) 및 SHOT 검출기(53)를 사용해서 중복해서 검출함으로써 그 미검출을 더욱 억제할 수 있다.

또한, 물체 후보 A에는 LineMode 검출기(51)만이 대응지어져 있다. 이것은, LineMode 검출기(51)만으로, 물체 후보 A를 확실하게 검출할 수 있기 때문이다. 한편, 물체 후보 D에는 Bayse 검출기(54)만이 대응지어져 있다. 이것은, 물체 후보 D는 흑색이기 때문에 거리 정보를 취득할 수 없고 LineMode 검출기(51)에서의 검출은 불가능하므로, 물체 후보 D에는 LineMode 검출기(51)가 대응지어져 있지 않다. 그러나 Bayse 검출기(54)는, 물체 후보 D의 RGB 휘도 정보만으로, 확실하게 물체 후보 D를 검출할 수 있다. 따라서, 물체 후보 D에는 Bayse 검출기(54)만이 대응지어져 있다.

이와 같이, 물체 후보의 특징을 나타내는 특징 정보에 따라, 특성이 다른 복수의 검출기(51 내지 54)를 단일인 물체 후보에 대응짓고, 이들 검출기(51 내지 54)를 사용하여, 물체 후보를 검출함으로써, 또한 물체 후보의 미검출을 억제할 수 있다.

또한, 물체 검출부(5)의 검출기(51 내지 54)는, 화상 정보 취득부(2)에 의해 취득된 대상물 화상의 특징량과, 검출한 물체 후보의 모델 화상의 특징량에 기초하여, 해당 물체 후보의 위치 자세 후보를 검출한다.

이에 의해, 물체 검출부(5)의 검출기(51 내지 54)는, 검출하는데 최적인 물체 후보만을 검출하고, 또한 그 최적인 물체 후보의 위치 자세 후보를 검출하게 된다. 따라서, 인식 대상물의 위치 자세의 미검출을 억제해 인식 정밀도를 향상시킬 수 있다.

예를 들어, 물체 검출부(5)의 검출기(51 내지 54)는, K 근방법(k-nearest neighbor법)에 의해, 대상물 화상의 특징량과, 검출한 물체 후보의 모델 화상의 특징량의 대응짓기를 행하고, 또한 RANSAC(Random Sample Consensus)법을 이용하여, 그 기하학적인 구성에 기초하여, 물체 후보의 위치 자세 후보를 검출한다.

또한, 상기 물체 검출 방법 및 위치 자세의 산출 방법은 일례이며, 이에 한정되지 않는다.

이상과 같이 하여, 물체 검출부(5)는, 적어도 하나의 검출기(51 내지 54)를 사용하여, 물체 후보 및 그 위치 자세 후보를 검출한다. 물체 인식 장치(1)의 물체 검출부(5)는, 각 검출기(51 내지 54)에 의해 검출된 물체 후보 및 해당 위치 자세 후보를, 인식 대상물 및 그 위치 자세로서 출력한다.

또한, 상기 실시 형태 1에 있어서, 물체 검출부(5)는 인식 대상물의 물체 후보 및 해당 위치 자세 후보를 검출하고 있지만, 이에 한정되지 않고, 인식 대상물의 물체 후보만을 검출해도 된다.

본 실시 형태 1에 관한 물체 인식 장치(1)를 사용함으로써, 종래의 물체 인식 장치에 비하여, 재현율(recall, 검출률 및 미검출률에 관한 지표)을 약 18% 향상시킬 수 있었다.

실시 형태 2

도 4는, 본 발명의 실시 형태 2에 관한 물체 인식 장치의 개략적인 시스템 구성을 도시하는 블록도이다. 본 실시 형태 2에 관한 물체 인식 장치(20)는, 상기 실시 형태 1에 관한 물체 인식 장치(1)의 구성에 추가하여, 물체 검출부(5)에 의해 검출된 물체 후보 및 해당 위치 자세 후보(물체 위치 자세 후보)군 중에서, 유사한 것끼리를 동일한 것으로서 통합하는 클러스터링 처리를 행하는 클러스터링 처리부(6)를 더 구비하고 있다. 이에 의해, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보군 중에서, 유사한 것을 하나로 통합하여, 유저에 대하여 출력할 수 있으므로, 편리성이 향상된다.

클러스터링 처리부(6)는, 클러스터링 처리 수단의 일 구체예이다.

예를 들어, 도 5에 도시한 바와 같이, 물체 검출부(5)는, 예를 들어 선택한 복수의 검출기[LineMode 검출기(51) 및 PnP 검출기(52)]를 사용하여, 인식 대상물의 물체 위치 자세 후보(1)-(3)을 검출한다. 클러스터링 처리부(6)는, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보(1)-(3) 중에서, 유사한 것 동지를 동일한 것으로서 통합하는 클러스터링 처리를 행한다. 구체적으로는, 클러스터링 처리부(6)는, MeanShfit법 등을 이용해서 클러스터링 처리를 행한다. MeanShfit법에 있어서, 도 5에 도시한 바와 같이, 물체 위치 자세 후보(1)과 물체 위치 자세 후보(2)는 거리가 가까워 유사하다. 이로 인해, 물체 위치 자세 후보(1) 및 (2)는 양자의 평균이 되는 물체 위치 자세 후보(4)에 통합된다. 또한, 물체 위치 자세 후보(3)은 유사한 것이 없으므로, 통합되지 않는다.

물체 인식 장치(1)는, 클러스터링 처리부(6)에 의해 통합시킨 물체 위치 자세 후보를, 인식 대상물 및 해당 위치 자세로서 출력한다. 또한, 본 실시 형태 2에 있어서, 상기 실시 형태 1과 동일 부분에는 동일 부호를 붙여서 상세한 설명은 생략한다.

실시 형태 3

도 6은, 본 발명의 실시 형태 3에 관한 물체 인식 장치의 개략적인 시스템 구성을 도시하는 블록도이다. 본 실시 형태 3에 관한 물체 인식 장치(30)는, 상기 실시 형태 1에 관한 물체 인식 장치(1)의 구성에 추가하여, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보를, 그 색 정보 및 거리 정보 중 적어도 한쪽에 기초하여 판정하는 물체 판정부(7)를 더 구비하고 있다.

물체 판정부(7)는, 물체 검출부(5)에 의한 물체 위치 자세 후보의 오검출을 억제하기 위해서, 물체 검출부(5)가 물체 위치 자세 후보를 검출한 후, 또한 그 물체 위치 자세 후보를, 색 정보 및 거리 정보 중 적어도 한쪽에 기초하여 판정한다. 물체 판정부(7)는, 이 판정 처리에 의해, 모델 화상과 대상물 화상 간의, 색 정보나 거리 정보의 비교를 픽셀 단위로 실시하여, 일치하고 있는지 여부를 판정한다.

물체 판정부(7)는, 물체 판정 수단의 일 구체예이다. 물체 판정부(7)는, 화상 정보 취득부(2)에 의해 취득된 대상물 화상의 거리 정보 및 색 정보 중 적어도 한쪽과, 물체 검출부(5)로부터 출력된 물체 위치 자세 후보의 모델 화상 정보의 색 정보 및 거리 정보 중 적어도 한쪽을 비교하여, 판정을 행한다.

물체 판정부(7)는, 예를 들어 렌더링 처리 등을 행하여, 상기 대상물 화상과 모델 화상을 비교한다. 물체 판정부(7)는, 이 렌더링 처리에 있어서, 모델 화상 상의 3차원 물체(모델로서 미리 등록된 3차원 물체)를, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보에 기초하여, 대상물 화상 상에 투영한다.

물체 판정부(7)는, 물체 위치 자세 후보마다, 그 모델 화상과 대상물 화상과의 비교를 행한다. 물체 판정부(7)는, 대상물 화상과 모델 화상을 비교한 결과, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보 중에서, 소정값 이상의 신뢰도가 있는 물체 위치 자세 후보를 인식 물체 및 해당 위치 자세로서 출력한다.

물체 판정부(7)는, 예를 들어 화상 정보 취득부(2)에 의해 취득된 대상물 화상의 거리 정보와, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보의 모델 화상의 거리 정보를 비교하고, 그 일치도의 차분이 판정 임계치 이상일 때, 소정값 이상의 신뢰도가 있다고 판정한다.

또는, 물체 판정부(7)는, 예를 들어 화상 정보 취득부(2)에 의해 취득된 대상물 화상의 색 정보[하기 (A) 내지 (D) 중 적어도 하나]와, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보의 모델 화상의 색 정보를 비교하여, 그 일치도의 차분이 판정 임계치 이상일 때, 그 물체 위치 자세 후보는 소정값 이상의 신뢰도가 있다고 판정한다. 또한, 물체 판정부(7)는, 상기 불일치도의 차분이 판정 임계치 이하일 때, 그 물체 위치 자세 후보는 소정값 이상의 신뢰도가 있다고 판정해도 된다.

물체 인식 장치(1)는, 물체 판정부(7)에 의해 소정값 이상의 신뢰도가 있다고 판정된 물체 위치 자세 후보를, 인식 대상물 및 해당 위치 자세로서 출력한다. 또한, 상기 판정 임계치는, 미리 기억부(4) 등에 설정되어 있고, 유저에 의해 임의로 설정 변경할 수 있도록 구성되어 있다.

물체 판정부(7)는, 후술하는 판정 프로파일 정보에 설정된, 특성이 다른 복수의 판정기를 갖고 있다. 물체 판정부(7)는, 예를 들어 색상 판정기(71), RGB 판정기(72), Gray_Scale 판정기(73), CLBP 판정기(74)를 갖고 있다.

(A) 색상

색상 판정기(71)는, RGB 휘도 정보를, HSV 정보[색상(Hue), 채도(Saturation·Chroma), 명도(Value·Lightness·Brightness)의 3개의 성분으로 이루어지는 색 공간 정보]로 변환하고, 그 색상 H를 사용해서 상기 비교 행한다. 색상 판정기(71)는, 동일 단순색으로 황색, 적색, 청색, 녹색, 마젠타, 또는 시안의 물체(컵 등)의 판정을 행하는 경우에, 그 오판정을 낮게 억제할 수 있다.

(B) RGB

RGB 판정기(72)는, RGB 휘도 정보의 본래 값을 사용해서 상기 비교를 행한다. RGB 판정기(72)는, 복합색(백색과 황녹색의 복합색 등)이나 흑색의 물체(리모컨 등)의 판정을 행하는 경우에, 그 오판정을 낮게 억제할 수 있다.

(C) 그레이 스케일(Gray Scale)

Gray_Scale 판정기(73)는, RGB 휘도 정보를, 그레이스케일 정보(흑백 정보)로 변환하고, 그 변환한 값을 사용하여, 상기 비교를 행한다. Gray_Scale 판정기(73)는, 백 기조의 물체(공기 등)의 판정을 행하는 경우에, 그 오판정을 낮게 억제할 수 있다.

(D) CLBP(Color Local Binray Pattern)

CLBP 판정기(74)는, 도 7에 도시한 바와 같이, 대상물 화상 및 모델 화상을 컬러 채널 분리(R 화상, G 화상, B 화상)를 행하고(2), 각 채널의 LBP[LBP(R), LBP(G), LBP(B)]를 산출한다(3). 그리고 CLBP 판정기(74)는, 산출한 LBP에 기초하여, 히스토그램을 작성하고(4), 작성한 히스토그램을 사용해서 상기 비교를 행한다. 또한, LBP는 화상의 조명 변화의 변동에 강하게, LBP를 히스토그램화함으로써 또한 상기 렌더링했을 때의 섭동에 강해져, 판정 정밀도가 향상된다. CLBP 판정기(74)는, 텍스처를 갖는 물체의 판정을 행하는 경우에, 그 오판정을 낮게 억제할 수 있다.

또한, 상기 판정기는 일례이며 이에 한정되지 않고, 물체 판정부(7)는 임의의 판정기를 갖고 있어도 되고, 판정기의 수 및 종류는 임의라도 된다.

그런데 상술한 바와 같이, 판정기도 상기 검출기와 마찬가지로, 판정하는데 능숙한 또는 능숙하지 못한 물체를 갖고 있다. 따라서, 사용하는 판정기의 종류에 따라서는, 오판정(판정하지 않아야 할 물체를 판정하는 등)을 초래할 우려가 있다. 예를 들어, RGB 판정기는 외란(RGB 휘도 변화)이 발생하면 오판정을 일으킬 가능성이 높아진다.

이에 반해, 본 실시 형태 3에 관한 물체 인식 장치(30)에 있어서, 기억부(4)는, 물체 후보와 해당 물체 후보에 대하여 판정 가능한 판정기(71 내지 74)를 대응지은 판정 프로파일 정보를 기억하고 있다. 물체 판정부(7)는, 기억부(4)의 판정 프로파일 정보에 기초하여 물체 검출부(5)에 의해 검출된 물체 후보에 대응하는 판정기(71 내지 74)를 선택하고, 해당 선택한 판정기(71 내지 74)를 사용하여, 화상 정보 취득부(2)에 의해 취득된 인식 대상물의 화상 정보의 색 정보 및 거리 정보 중 적어도 한쪽과, 물체 검출부(5)로부터 출력된 물체 후보의 모델 화상 정보의 색 정보 및 거리 정보 중 적어도 한쪽을 비교함으로써, 물체 후보가 소정값 이상의 신뢰도를 갖는지 여부를 판정한다. 물체 판정부(7)는, 해당 소정값 이상의 신뢰도를 갖는다고 판정한 물체 후보를 인식 대상물로서 출력한다.

이에 의해, 판정기(71 내지 74)는, 미리 판정 프로파일 정보에 설정된, 판정하는데 최적인 물체 후보 및 그 위치 자세 후보에 대하여 판정을 행하게 된다. 따라서, 인식 대상물의 오검출을 억제해 인식 정밀도를 더욱 향상시킬 수 있다.

기억부(4)는, 물체 후보와 적어도 하나의 판정기(71 내지 74)를 각각 대응지은 판정 프로파일 정보를 기억하고 있다. 판정 프로파일 정보에 있어서, 물체 후보의 색 정보(동일 단순색, 복합색, 물체색 등) 및 표기 정보(텍스처의 유무 등) 중 적어도 하나를 포함하는 물체 후보의 특징을 나타내는 특징 정보에 기초하여, 물체 후보와 판정기(71 내지 74)는 대응지어져 있다.

도 8은, 물체 후보와 판정기를 대응지은 판정 프로파일 정보의 일례를 도시하는 도면이다. 도 8에 도시한 바와 같이, 물체 후보 A는 백색과 황녹색의 복합 색을 갖고 있다. 이로 인해, 복합색을 양호하게 판정할 수 있는 RGB 판정기(72)를 물체 후보 A에 대응짓고 있다. 물체 후보 B는 텍스처를 갖는다. 이로 인해, 텍스처를 양호하게 판정할 수 있는 CLBP 판정기(74)가 물체 후보 B에 대응지어져 있다. 물체 후보 C는 백 기조의 색을 갖고 있다. 이로 인해, 백 기조의 색을 양호하게 판정할 수 있는 Gray_Scale 판정기(73)가 물체 후보 C에 대응지어져 있다. 물체 후보 D는 흑색을 갖고 있다. 이로 인해, 흑색을 양호하게 판정할 수 있는 RGB 판정기(72)가 물체 후보 D에 대응지어져 있다. 물체 후보 E는 황색을 갖고 있다. 이로 인해, 황색을 양호하게 판정할 수 있는 색상 판정기(71)가 물체 후보 E에 대응지어져 있다.

프로파일 정보 생성부(3)는, 예를 들어 도 9의 흐름도에 따라, 미리 설정된 복수의 판정기(71 내지 74) 중에서 그 물체 후보를 판정하는데 최적인 판정기(71 내지 74)를 선택하고, 그 물체 후보와 선택한 판정기(71 내지 74)를 대응짓는다.

프로파일 정보 생성부(3)는, 화상 정보 취득부(2)에 의해 취득된 물체 후보의 화상 정보에 기초하여, 물체 후보의 색이 동일 단순색 중심인지 여부를 판정한다(스텝 S201). 또한, 동일 단순색 중심이라 함은, 예를 들어 그 단순색 영역의 면적 비율이 일정값 이상으로 높은 것을 가리킨다.

프로파일 정보 생성부(3)는, 물체 후보의 색이 동일 단순색 중심이라고 판정하면(스텝 S201의 "예"), 화상 정보 취득부(2)에 의해 취득된 물체 후보의 화상 정보에 기초하여, 물체 후보의 색이 황색, 적색, 청색, 녹색, 마젠타 및 시안 중 어느 것인지 여부를 판정한다(스텝 S202). 한편, 프로파일 정보 생성부(3)는, 물체 후보의 색이 동일 단순색이 아니라고 판정하면(스텝 S201의 "아니오"), 후술하는 (스텝 S204) 처리로 이행한다.

프로파일 정보 생성부(3)는, 물체 후보의 색이 황색, 적색, 청색, 녹색, 마젠타 및 시안 중 어느 하나라고 판정하면(스텝 S202의 "예"), 색상 판정기(71)를 선택한다(스텝 S203).

프로파일 정보 생성부(3)는, 물체 후보의 색이 황색, 적색, 청색, 녹색, 마젠타 및 시안 중 어느 것도 아니라고 판정하면(스텝 S202의 "아니오"), 화상 정보 취득부(2)에 의해 취득된 물체 후보의 화상 정보에 기초하여, 물체 후보가 표기 정보를 갖는지 여부를 판정한다(스텝 S204).

프로파일 정보 생성부(3)는, 물체 후보가 표기 정보를 갖는다고 판정하면(스텝 S204의 "예"), CLBP 판정기를 선택한다(스텝 S205). 한편, 프로파일 정보 생성부(3)는, 물체 후보가 표기 정보를 갖지 않는다고 판정하면(스텝 S204의 "아니오"), 화상 정보 취득부(2)에 의해 취득된 물체 후보의 화상 정보에 기초하여, 물체 후보의 색이 백 기조 또는 그레이 기조인지 여부를 판정한다(스텝 S206). 또한, 백 기조 또는 그레이 기조라고 하는 것은, 예를 들어 그 백색 또는 그레이색의 면적 비율이 일정값 이상으로 높은 것을 가리킨다.

프로파일 정보 생성부(3)는, 물체 후보의 색이 백 기조 또는 그레이 기조라고 판정하면(스텝 S206의 "예"), Gray_Scale 판정기(73)를 선택한다(스텝 S207). 한편, 프로파일 정보 생성부(3)는, 물체 후보의 색이 백 기조 또는 그레이 기조가 아니라고 판정하면(스텝 S206의 "아니오"), RGB 판정기(72)를 선택한다(스텝 S208).

이와 같이, 프로파일 정보 생성부(3)에 의해, 물체 후보의 색 정보 및 표기 정보 중 적어도 하나를 포함하는 물체 후보의 특징을 나타내는 특징 정보에 기초하여, 물체 후보와, 해당 물체 후보를 판정하는데 최적인 판정기(71 내지 74)를, 대응지은 판정 프로파일 정보를 자동으로 생성할 수 있다.

프로파일 정보 생성부(3)는, 상술한 플로우에 따라, 물체 후보와 선택한 판정기(71 내지 74)를 대응지은 판정 프로파일 정보를 생성하고, 생성한 판정 프로파일 정보를 기억부(4)에 기억시킨다. 또한, 물체 후보와, 해당 물체 후보를 검출하는데 최적인 판정기(71 내지 74)를 대응지은 판정 프로파일 정보는, 미리 기억부(4)에 기억되어 있어도 된다. 또한 유저가 상기 흐름도에 따라, 각 판정기(71 내지 74)의 선택을 행해도 된다. 기억부(4)에 기억된 판정 프로파일 정보는, 예를 들어 유저에 의해 임의로 설정 변경할 수 있도록 구성되어 있다.

기억부(4)의 판정 프로파일 정보에 있어서, 1개의 물체 후보와 복수의 판정기(71 내지 74)가 각각 대응지어져 있어도 된다. 이 경우, 각 판정기(71 내지 74)는, 중복해서 동일한 물체 후보를 판정하게 된다. 이에 의해, 물체 후보의 특징을 나타내는 특징 정보에 따라, 특성이 다른 복수의 판정기(71 내지 74)를 단일인 물체 후보에 대응지어, 이들 판정기(71 내지 74)를 사용하여, 물체 후보를 판정함으로써, 물체 후보의 오판정을 더욱 억제할 수 있다.

이상과 같이 하여, 물체 판정부(7)는, 적어도 하나의 판정기(71 내지 74)를 사용하여, 물체 후보 및 그 위치 자세 후보를 판정한다. 물체 인식 장치(1)의 물체 판정부(7)는, 각 판정기(71 내지 74)에 의해 소정값 이상의 신뢰도가 있다고 판정된 물체 후보 및 해당 위치 자세 후보를, 인식 대상물 및 그 위치 자세로서 출력한다.

또한, 상기 실시 형태 3에 있어서, 물체 판정부(7)는 인식 대상물의 물체 후보 및 해당 위치 자세 후보를 판정하고 있지만, 이에 한정되지 않고, 인식 대상물의 물체 후보만을 판정해도 된다.

본 실시 형태 3에 관한 물체 인식 장치(30)를 사용함으로써, 종래의 물체 인식 장치에 비하여, 정밀도(precision, 정답율 및 오검출률에 관한 지표)를 약 18% 향상시킬 수 있었다.

본 실시 형태 3에 있어서, 상기 실시 형태 1 및 2와 동일 부분에는 동일 부호를 붙여서 상세한 설명은 생략한다.

실시 형태 4

도 10은, 본 발명의 실시 형태 4에 관한 물체 인식 장치의 개략적인 시스템 구성을 도시하는 블록도이다. 본 실시 형태 4에 관한 물체 인식 장치(40)는, 상기 실시 형태 3에 관한 물체 인식 장치(30)의 구성에 추가하여, 물체의 기하 형상 정보에 기초하여, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보를 추적하는 트래킹 처리부(8)를 더 구비하고 있다.

상기 물체 판정부(7)에 의한 판정을 행하는데 있어서, 정확하게 위치 자세를 추정하지 않으면, 대상물 화상과 모델 화상 사이에서 픽셀 오차가 발생하여, 그 오판정이 발생하기 쉬워진다. 따라서, 본 실시 형태 4에 있어서, 물체 판정부(7)의 판정 전에, 물체 위치 자세 후보의 기하 형상 정보에 기초하는 추적을 행함으로써, 정확하게 위치 자세를 추정할 수 있어, 오판정을 더욱 억제할 수 있다.

트래킹 처리부(8)는, 트래킹 처리 수단의 일 구체예이다. 트래킹 처리부(8)는, 예를 들어 물체 위치 자세 후보의 기하 형상 정보에 기초하여 물체 위치 자세 후보를 추적하는 ICP(Iterative Closest Point) 트래킹(ICP 알고리즘을 사용한 트래킹 처리)을 행한다.

ICP 트래킹이라 함은, 예를 들어 도 11에 도시한 바와 같이, 물체 위치 자세 후보의 모델 화상의 모델과 대상물 화상의 인식 대상물과의 포인트 클라우드의 대응짓기를 행하고, 그 오차가 작아지도록 최소 2제곱을 이용하여, 도 12에 도시한 바와 같이, 물체 위치 자세 후보의 모델 화상의 모델과 대상물 화상의 인식 대상물 간의 기하량(회전 및 병진량)을 구하는 방법이다.

또한, ICP 트래킹은, 일반적으로 계산 비용이 드는 처리이다. 이로 인해, 본 실시 형태 4에 있어서는, 사전에 ICP 트래킹에 필요한 최근방점을 계산하고, 이 최근방점을 사용해서 ICP 트래킹을 행한다. 여기서, 최초에 상기 점의 대응짓기를 행할 필요가 있다. 이로 인해, 본 수법에 있어서는, 예를 들어 도 13에 도시한 바와 같이, 모델 화상의 모델에 대하여 3차원 복셀(모델을 둘러싸는 3차원 그리드 복셀)을 구축하고, 각 그리드로부터 모델까지의 모델 상의 최근방점을 미리 산출한다. 그리고 산출한 최근방점의 정보(최근방점의 좌표나 최근방점의 Index)를 각 복셀에 대응시켜서 기억부(4)에 기억시킨다.

또한, 각 복셀에는 인식 대상물까지의 최근방점의 정보를 저장하지만, 복셀 밖의 레인지의 점은 무시한다. 본 실시 형태 4에 있어서, 최근방점은 point to plane(점에서 면)이지만, 이에 한정되지 않고, point to point(점에서 점)라도 된다. 도 13에 나타내는 거리 X, Y, Z는, 복셀 1변당의 그리드수와 격자 단위(수㎜)로부터 결정할 수 있다.

이상과 같이, 실제 ICP 트래킹을 행하기 전에, ICP 트래킹에 필요한 최근방점을 계산하고, 이 최근방점의 정보를 기억부(4)에 미리 보존한다. 그리고 트래킹 처리부(8)는, 이 기억부(4)에 기억된 최근방점의 정보를 사용하여, 상기 실시간으로 ICP 트래킹을 행한다. 이에 의해, ICP 트래킹에 걸리는 계산 비용을 대폭으로 저감할 수 있다.

트래킹 처리부(8)는, 상술한 ICP 트래킹을 행하고, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보 중에서, 예를 들어 구한 기하량이 소정량 이상으로 큰 경우에, 기하 형상에 일관성이 없다고 해서, 그 물체 위치 자세 후보를 파기한다. 트래킹 처리부(8)는, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보 중에서, 파기한 물체 위치 자세 후보를 제외한 물체 위치 자세 후보를 물체 판정부(7)에 출력한다. 물체 판정부(7)는, 화상 정보 취득부(2)에 의해 취득된 대상물 화상의 거리 정보 및 색 정보 중 적어도 한쪽과, 트래킹 처리부(8)로부터 출력된 물체 위치 자세 후보의 모델 화상 정보의 색 정보 및 거리 정보 중 적어도 한쪽을 비교하여, 상기 판정을 행한다.

본 실시 형태 4에 있어서, 상기 실시 형태 1 내지 3과 동일 부분에는 동일 부호를 붙여서 상세한 설명은 생략한다.

본 발명은 상기 실시 형태에 한정된 것이 아닌, 취지를 일탈하지 않는 범위에서 적절히 변경하는 것이 가능하다.

상기 실시 형태 1 내지 4를 임의로 조합해도 된다. 예를 들어, 물체 인식 장치(50)는, 화상 정보 취득부(2)와, 프로파일 정보 생성부(3)와, 기억부(4)와, 물체 검출부(5)와, 클러스터링 처리부(6)와, 물체 판정부(7)와, 트래킹 처리부(8)를 구비하는 구성이라도 된다(도 14). 이 경우, 인식 대상물의 미검출이나 오검출을 가장 양호하게 억제해 인식 정밀도를 향상시킬 수 있다.

물체 검출부(5)는, 검출기(51 내지 54)를 사용하여, 인식 대상물의 물체 위치 자세 후보를 검출하고, 클러스터링 처리부(6)에 출력한다. 클러스터링 처리부(6)는, 물체 검출부(5)에 의해 검출된 물체 위치 자세 후보군 중에서 유사한 것을 통합하고, 통합한 물체 위치 자세 후보군을 트래킹 처리부(8)에 출력한다. 트래킹 처리부(8)는, 기하 형상 정보에 기초하여, 클러스터링 처리부(6)로부터의 물체 위치 자세 후보를 추적하는 ICP 트래킹을 행하고, 그 ICP 트래킹 후의 물체 위치 자세 후보를 물체 판정부(7)에 출력한다. 물체 판정부(7)는, 판정기(71 내지 74)를 사용하여, 트래킹 처리부(8)로부터의 물체 위치 자세 후보를 판정하고, 판정한 물체 위치 자세 후보를, 인식 대상물의 위치 자세로서 출력한다.

본 발명은, 예를 들어 상기 프로파일 정보 생성부(3), 물체 검출부(5), 클러스터링 처리부(6), 물체 판정부(7) 및 트래킹 처리부(8)가 실행하는 처리 중 적어도 하나를, CPU 또는 GPU(Graphics Processing Unit)에 컴퓨터 프로그램을 실행시킴으로써 실현하는 것도 가능하다.

프로그램은, 여러 가지 타입의 비일시적인 컴퓨터 가독 매체(non-transitory computer readable medium)를 사용해서 저장되어, 컴퓨터에 공급할 수 있다. 비일시적인 컴퓨터 가독 매체는, 여러 가지 타입의 실체가 있는 기록 매체(tangible storage medium)를 포함한다. 비일시적인 컴퓨터 가독 매체의 예는, 자기 기록 매체(예를 들어 플렉시블 디스크, 자기 테이프, 하드디스크 드라이브), 광자기 기록 매체(예를 들어 광자기 디스크), CD-ROM(Read Only Memory), CD-R, CD-R/W, 반도체 메모리[예를 들어, 마스크 ROM, PROM(Programmable ROM), EPROM(Erasable PROM), 플래시 ROM, RAM(random access memory)]를 포함한다.

프로그램은, 여러 가지 타입의 일시적인 컴퓨터 가독 매체(transitory computer readable medium)에 의해 컴퓨터에 공급되어도 된다. 일시적인 컴퓨터 가독 매체의 예는, 전기 신호, 광 신호 및 전자파를 포함한다. 일시적인 컴퓨터 가독 매체는, 전선 및 광 파이버 등의 유선 통신로, 또는 무선 통신로를 통해, 프로그램을 컴퓨터에 공급할 수 있다.

이상의 본 발명의 설명으로부터, 본 발명을 다양하게 변형할 수 있는 것은 명확하다. 그러한 변형은 본 발명의 사상 및 범위로부터 일탈하는 것이라 간주되는 것은 아니며, 또한 모든 당업자에게 있어서 자명한 그러한 개량은 이하의 청구범위에 포함되는 것이다.

Claims

인식 대상물의 화상 정보를 취득하는 화상 정보 취득 수단과,
상기 인식 대상물의 후보인 물체 후보와, 해당 물체 후보에 대하여 검출 가능한 검출기를 대응지은 검출 프로파일 정보와, 상기 물체 후보에 대응지어진 해당 물체 후보의 모델 화상 정보를 기억하는 기억 수단과,
상기 검출 프로파일 정보에 설정된 복수의 검출기를 갖고, 상기 화상 정보 취득 수단에 의해 취득된 화상 정보에 기초하여, 해당 검출기를 사용해서 상기 인식 대상물을 검출하는 물체 검출 수단을 구비하고,
상기 물체 검출 수단의 검출기의 각각은, 상기 검출 프로파일 정보에 있어서 해당 검출기에 대응지어진 상기 물체 후보의 모델 화상 정보와, 상기 화상 정보 취득 수단에 의해 취득된 인식 대상물의 화상 정보를 비교하여, 상기 물체 후보를 검출하고, 해당 검출한 물체 후보를 상기 인식 대상물로서 출력하고,
상기 기억 수단은, 상기 물체 후보와, 해당 물체 후보에 대하여 판정 가능한 판정기와 대응지은 판정 프로파일 정보를 기억하고 있으며,
상기 판정 프로파일 정보에 설정된 복수의 판정기를 갖고, 상기 화상 정보 취득 수단에 의해 취득된 화상 정보로부터, 해당 판정기를 사용해서 상기 물체 검출 수단으로부터 출력된 물체 후보에 대하여 판정을 행하는 물체 판정 수단을 더 구비하고,
상기 물체 판정 수단은,
상기 기억 수단의 판정 프로파일 정보에 기초하여, 상기 물체 검출 수단에 의해 검출된 물체 후보에 대응하는 판정기를 선택하는 것을 특징으로 하는, 물체 인식 장치.
제1항에 있어서,
상기 판정기를 사용하여, 상기 화상 정보 취득 수단에 의해 취득된 인식 대상물의 화상 정보의 색 정보 및 거리 정보 중 적어도 한쪽과, 상기 물체 검출 수단으로부터 출력된 물체 후보의 모델 화상 정보의 색 정보 및 거리 정보 중 적어도 한쪽을 비교하여, 상기 물체 후보가 소정값 이상의 신뢰도를 갖는지 여부를 판정하고,
해당 소정값 이상의 신뢰도를 갖는다고 판정한 물체 후보를 상기 인식 대상물로서 출력하는 것을 특징으로 하는, 물체 인식 장치.
제2항에 있어서, 상기 물체 검출 수단은, 상기 화상 정보 취득 수단에 의해 취득된 인식 대상물의 화상 정보의 특징량과, 상기 검출한 물체 후보의 모델 화상 정보의 특징량에 기초하여, 상기 물체 후보의 위치 자세 후보를 검출하는 것을 특징으로 하는, 물체 인식 장치.
제3항에 있어서, 상기 물체 검출 수단에 의해 검출된 물체 후보 및 해당 위치 자세 후보 중에서, 유사한 것끼리를 동일한 것으로서 통합하는 클러스터링 처리 수단을 더 구비하는 것을 특징으로 하는, 물체 인식 장치.
제3항에 있어서, 상기 물체 검출 수단에 의해 검출된 물체 후보 및 해당 위치 자세 후보의 모델 화상의 모델과, 상기 화상 정보의 인식 대상물 사이의 기하량을 구하고, 상기 물체 검출 수단에 의해 검출된 물체 후보 및 해당 위치 자세 후보 중에서, 해당 구한 기하량이 소정량 이상이 되는 물체 후보 및 해당 위치 자세 후보를 제외하는 것으로 트래킹 처리를 행하고, 해당 트래킹 처리된 물체 후보 및 해당 위치 자세 후보를 출력하는 트래킹 처리 수단을 더 구비하는 것을 특징으로 하는, 물체 인식 장치.
제5항에 있어서, 상기 기억 수단은, 상기 모델 화상의 모델을 둘러싸는 3차원 복셀의 각 그리드로부터 상기 모델까지의 해당 모델 상의 최근방점의 정보를 기억하고 있으며,
상기 트래킹 처리 수단은, 상기 기억 수단에 기억된 상기 최근방점의 정보를 사용하여, 상기 트래킹 처리를 행하는 것을 특징으로 하는, 물체 인식 장치.
제2항 내지 제6항 중 어느 한 항에 있어서, 상기 인식 대상물의 후보인 물체 후보의 색 정보, 형상 정보, 표기 정보 및 물성 정보 중 적어도 하나를 포함하는 상기 물체 후보의 특징을 나타내는 특징 정보에 기초하여, 해당 물체 후보와 적어도 하나의 검출기와 대응지은 상기 검출 프로파일 정보 및, 상기 물체 후보의 색 정보 및 표기 정보 중 적어도 하나를 포함하는 상기 물체 후보의 특징을 나타내는 특징 정보에 기초하여, 해당 물체 후보와 적어도 하나의 판정기와 대응지은 상기 판정 프로파일 정보 중 적어도 한쪽을 생성하는 프로파일 정보 생성 수단을 더 구비하는 것을 특징으로 하는, 물체 인식 장치.
인식 대상물의 화상 정보를 취득하는 스텝과,
상기 인식 대상물의 후보인 물체 후보와, 해당 물체 후보에 대하여 검출 가능한 검출기를 대응지은 검출 프로파일 정보에 설정된 복수의 검출기를 사용하여, 상기 취득된 화상 정보에 기초하여, 상기 인식 대상물을 검출하는 스텝을 포함하는 물체 인식 방법이며,
상기 검출기의 각각은, 상기 검출 프로파일 정보에 있어서 해당 검출기에 대응지어진 상기 물체 후보의 모델 화상 정보와, 상기 취득된 인식 대상물의 화상 정보를 비교하고, 상기 물체 후보를 검출하고, 해당 검출한 물체 후보를 상기 인식 대상물로서 출력하고,
상기 물체 후보와, 해당 물체 후보에 대하여 판정 가능한 판정기와 대응지은 판정 프로파일 정보에 설정된 복수의 판정기를 사용하여, 상기 취득된 화상 정보로부터, 상기 출력된 물체 후보에 대하여 판정을 행하고,
상기 판정 프로파일 정보에 기초하여, 상기 검출된 물체 후보에 대응하는 판정기를 선택하는 것을 특징으로 하는, 물체 인식 방법.
인식 대상물의 화상 정보를 취득하는 처리와,
상기 인식 대상물의 후보인 물체 후보와, 해당 물체 후보에 대하여 검출 가능한 검출기를 대응지은 검출 프로파일 정보에 설정된 복수의 검출기를 갖고, 상기 취득된 화상 정보로부터, 해당 검출기를 사용해서 상기 인식 대상물을 검출하는 처리를 컴퓨터에 실행시키는 비일시적인 컴퓨터 가독 매체에 저장된 프로그램이며,
상기 검출기의 각각은, 상기 검출 프로파일 정보에 있어서 해당 검출기에 대응지어진 상기 물체 후보의 모델 화상 정보와, 상기 취득된 인식 대상물의 화상 정보를 비교하여, 상기 물체 후보를 검출하고, 해당 검출한 물체 후보를 상기 인식 대상물로서 출력하고,
상기 물체 후보와, 해당 물체 후보에 대하여 판정 가능한 판정기와 대응지은 판정 프로파일 정보에 설정된 복수의 판정기를 사용하여, 상기 취득된 화상 정보로부터, 상기 출력된 물체 후보에 대하여 판정을 행하고,
상기 판정 프로파일 정보에 기초하여, 상기 검출된 물체 후보에 대응하는 판정기를 선택하는 것을 특징으로 하는, 비일시적인 컴퓨터 가독 매체에 저장된 프로그램.