KR102182540B1

KR102182540B1 - 시차맵과 보행자 상하단 인식을 이용한 정밀한 보행자 검출 방법 및 장치

Info

Publication number: KR102182540B1
Application number: KR1020180160609A
Authority: KR
Inventors: 이충희
Original assignee: 재단법인대구경북과학기술원
Priority date: 2018-12-13
Filing date: 2018-12-13
Publication date: 2020-11-24
Also published as: KR20200072714A

Abstract

객체 인식 방법 및 장치가 개시된다. 일 실시예에 따른 객체 인식 방법은 스테레오 영상에서 기초하여 시차맵을 생성하는 단계, 스테레오 영상과 시차맵에 기초하여 하나 이상의 객체 후보 영역을 검출하는 단계, 객체 후보 영역에 기초하여 객체 영역을 결정하는 단계, 객체 영역을 미리 정해진 크기로 정규화하는 단계, 정규화된 객체 영역의 탐색 영역을 결정하는 단계, 및 미리 학습된 분류기에 탐색 영역을 입력하여, 객체를 인식하는 단계를 포함한다.

Description

시차맵과 보행자 상하단 인식을 이용한 정밀한 보행자 검출 방법 및 장치{METHODS AND APPARATUS FOR ACCURATE PEDESTRIAN DETECTION USING DISPARITY MAP AND PEDESTRIAN UPPER AND LOWER RECOGNITION}

아래 실시예들은 시차맵과 보행자 상하단 인식을 이용한 정밀한 보행자 검출 방법 및 장치에 관한 것이다.

3차원 공간에서 객체를 검출 및 인식하는 것은 지능형 자동차 및 로봇 등의 자율 주행과 관련하여 매우 중요한 기술이다. 영상을 이용한 객체 검출에 있어서, 성능을 높이기 위하여 스테레오 비전이 사용될 수 있다. 스테레오 비전은 3차원 정보를 제공하는 시차맵(disparity map)을 제공하기 때문에, 2차원 정보와 결합하면 인식 오류를 줄이고 속도를 향상시킬 수 있다.

하지만, 스테레오 카메라로부터 획득된 시차맵은 스테레오 매칭 에러(stereo matching error)가 존재할 수 있다. 이와 같은 매칭 에러로 인해 관심 영역 생성 시에 오차가 발생할 수 있으며 분류기(classifier)로 검출하지 못하는 객체가 발생할 수 있는 문제점이 있다.

실시예들은 대략적인 객체 후보 영역에 대해서 피라미드 기법 적용없이 최소한의 분류기를 사용하여 객체를 검출하고자 한다.

실시예들은 객체 상하 위치 추적 결과를 적용한 최적의 객체 상하 위치 결정하고자 한다.

실시예들은 객체 영역을 모두 같은 크기로 정규화하여 한 번의 분류기 사용으로 속도를 향상시키고자 한다.

일 실시예에 따른 객체 인식 방법은 스테레오 영상에서 기초하여 시차맵을 생성하는 단계; 상기 스테레오 영상과 상기 시차맵에 기초하여 하나 이상의 객체 후보 영역을 검출하는 단계; 상기 객체 후보 영역에 기초하여 객체 영역을 결정하는 단계; 상기 객체 영역을 미리 정해진 크기로 정규화하는 단계; 상기 정규화된 객체 영역의 탐색 영역을 결정하는 단계; 및 미리 학습된 분류기에 상기 탐색 영역을 입력하여, 상기 객체를 인식하는 단계를 포함한다.

상기 객체 영역을 결정하는 단계는 상기 객체 후보 영역의 가로 폭을 결정하는 단계; 상기 결정된 가로 폭에 기초하여 상기 객체 후보 영역의 세로 폭을 확장하는 단계; 및 상기 결정된 가로 폭과 상기 확장된 세로 폭에 기초하여 상기 객체 영역을 결정하는 단계를 포함할 수 있다.

상기 탐색 영역을 결정하는 단계는 상기 객체 영역의 미리 정해진 비율의 상단 영역을 제1 탐색 영역으로 결정하는 단계; 및 상기 객체 영역의 미리 정해진 비율의 하단 영역을 제2 탐색 영역으로 결정하는 단계를 포함할 수 있다.

상기 미리 학습된 분류기는 제1 분류기 및 제2 분류기를 포함하고, 상기 객체를 인식하는 단계는 상기 제1 분류기에 상기 제1 탐색 영역을 입력하여, 상기 객체의 제1 말단 위치를 결정하는 단계; 및 상기 제2 분류기에 상기 제2 탐색 영역을 입력하여, 상기 객체의 제2 말단 위치를 결정하는 단계를 포함할 수 있다.

상기 객체를 인식하는 단계는 상기 미리 학습된 분류기에 상기 탐색 영역을 입력하여 상기 객체 영역의 가로 방향 출력을 획득하는 단계; 상기 가로 방향 출력의 최고점을 검출하는 단계; 상기 객체의 과거 위치에 기초하여 획득한 누적 추적 정보를 획득하는 단계; 및 상기 누적 추적 정보와 상기 최고점에 기초하여 상기 객체를 인식하는 단계를 포함할 수 있다.

상기 객체는 보행자를 포함할 수 있다.

상기 객체 후보 영역을 검출하는 단계는 V-시차맵 방법, U-시차맵 방법, 컬럼(column) 검출 방법 중 적어도 하나를 이용하여 상기 객체 후보 영역을 검출하는 단계를 포함할 수 있다.

상기 객체 후보 영역의 가로 폭을 결정하는 단계는 상기 시차맵의 시차값에 기초하여 상기 객체와의 실제 거리를 추정하는 단계; 및 미리 정해진 실제 객체의 가로 폭과 상기 추정된 실제 거리에 기초하여 상기 객체 후보 영역의 가로 폭을 결정하는 단계를 포함할 수 있다.

상기 객체 후보 영역의 가로 폭을 결정하는 단계는 상기 시차맵에 세그멘테이션 기법을 적용하여 상기 객체를 분류하는 단계; 및 상기 분류된 객체의 가로 폭을 측정하는 단계를 포함할 수 있다.

상기 세그멘테이션 기법은 k-평균 알고리즘, 슈퍼 픽셀(super pixel) 기법, 마르코프 랜덤 필드(Markov Random Fields) 및 조건적 랜덤 필드(Conditional Random Fields) 중 적어도 하나를 포함할 수 있다.

상기 객체 후보 영역의 세로 폭을 확장하는 단계는 상기 결정된 가로 폭에 미리 정해진 비율을 곱하여 상기 객체 후보 영역의 세로 폭을 갱신하는 단계; 상기 갱신된 세로 폭까지 상기 객체 후보 영역의 세로 폭을 확장하는 단계를 포함할 수 있다.

상기 객체 후보 영역의 세로 폭을 확장하는 단계는 상기 객체 후보 영역의 중심을 기준으로 상기 객체 후보 영역의 세로 폭을 확장하는 단계를 포함할 수 있다.

상기 객체 후보 영역의 가로 폭을 결정하는 단계는 상기 시차맵에 수평 방향의 히스토그램을 생성하는 단계; 및 상기 히스토그램의 가로 폭을 측정하는 단계를 포함할 수 있다.

일 실시예에 따른 객체 인식 장치는 스테레오 영상에서 기초하여 시차맵을 생성하고, 상기 스테레오 영상과 상기 시차맵에 기초하여 하나 이상의 객체 후보 영역을 검출하고, 상기 객체 후보 영역에 기초하여 객체 영역을 결정하고, 상기 객체 영역을 미리 정해진 크기로 정규화하고, 상기 정규화된 객체 영역의 탐색 영역을 결정하며, 미리 학습된 분류기에 상기 탐색 영역을 입력하여, 상기 객체를 인식하는 프로세서를 포함한다.

상기 프로세서는 상기 객체 후보 영역의 가로 폭을 결정하고, 상기 결정된 가로 폭에 기초하여 상기 객체 후보 영역의 세로 폭을 확장하며, 상기 결정된 가로 폭과 상기 확장된 세로 폭에 기초하여 상기 객체 영역을 결정할 수 있다.

상기 프로세서는 상기 객체 영역의 미리 정해진 비율의 상단 영역을 제1 탐색 영역으로 결정하고, 상기 객체 영역의 미리 정해진 비율의 하단 영역을 제2 탐색 영역으로 결정할 수 있다.

상기 미리 학습된 분류기는 제1 분류기 및 제2 분류기를 포함하고, 상기 프로세서는 상기 제1 분류기에 상기 제1 탐색 영역을 입력하여, 상기 객체의 제1 말단 위치를 결정하고, 상기 제2 분류기에 상기 제2 탐색 영역을 입력하여, 상기 객체의 제2 말단 위치를 결정할 수 있다.

상기 프로세서는 상기 미리 학습된 분류기에 상기 탐색 영역을 입력하여 상기 객체 영역의 가로 방향 출력을 획득하고, 상기 가로 방향 출력의 최고점을 검출하고, 상기 객체의 과거 위치에 기초하여 획득한 누적 추적 정보를 획득하며, 상기 누적 추적 정보와 상기 최고점에 기초하여 상기 객체를 인식할 수 있다.

상기 프로세서는 상기 결정된 가로 폭에 미리 정해진 비율을 곱하여 상기 객체 후보 영역의 세로 폭을 갱신하고, 상기 갱신된 세로 폭까지 상기 객체 후보 영역의 세로 폭을 확장할 수 있다.

실시예들은 대략적인 객체 후보 영역에 대해서 피라미드 기법 적용없이 최소한의 분류기를 사용하여 객체를 검출할 수 있다.

실시예들은 객체 상하 위치 추적 결과를 적용한 최적의 객체 상하 위치 결정할 수 있다.

실시예들은 객체 영역을 모두 같은 크기로 정규화하여 한 번의 분류기 사용으로 속도를 향상시킬 수 있다.

도 1은 일 실시예에 따른 스테레오 비전에 따른 시차맵을 획득하는 방법을 설명하기 위한 도면이다.
도 2는 일 실시예에 따른 객체 인식 방법을 설명하기 위한 순서도이다.
도 3은 일 실시예에 따른 객체 영역을 결정하는 방법을 설명하기 위한 순서도이다.
도 4는 일 실시예에 따른 객체 인식 방법을 설명하기 위한 도면이다.
도 5는 일 실시예에 따른 분류기를 통한 객체의 말단 위치 결정 방법을 설명하기 위한 도면이다.
도 6과 도 7은 일 실시예에 따른 분류기를 학습하는 방법을 설명하기 위한 순서도이다.
도 8은 일 실시예에 따른 보행자 인식 방법을 나타낸 흐름도이다.

본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시예들은 다양한 형태로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.

본 발명의 개념에 따른 실시예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시예들을 도면에 예시하고 본 명세서에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시예들을 특정한 개시형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 변경, 균등물, 또는 대체물을 포함한다.

제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만, 예를 들어 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.

어떤 구성요소가 다른 구성요소에 “연결되어” 있다거나 “접속되어” 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 “직접 연결되어” 있다거나 “직접 접속되어” 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 표현들, 예를 들어 “~사이에”와 “바로~사이에” 또는 “~에 직접 이웃하는” 등도 마찬가지로 해석되어야 한다.

본 명세서에서 사용한 용어는 단지 특정한 실시예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, “포함하다” 또는 “가지다” 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.

도 1은 일 실시예에 따른 스테레오 비전에 따른 시차맵을 획득하는 방법을 설명하기 위한 도면이다.

도 1을 참조하면, 일 실시예에 따른 스테레오 비전에 따르면, 스테레오 카메라를 이용하여 얻은 2차원 정보만 있는 두 장의 스테레오 영상(도면에는 편의 상 한 장의 스테레오 영상 만 도시)(110)에 기초하여, 3차원 거리 정보를 포함하는 시차맵(120)을 생성할 수 있다. 스테레오 카메라는 동일한 두 대의 카메라를 수평 높이와 회전 상태를 같게 하여 하나로 연결한 카메라로, 각각의 렌즈에서 촬영한 이미지(스테레오 영상(110))를 가지고 시차맵(120)을 생성할 수 있다.

양안 시차의 원리에 따르면, 사람의 왼쪽 눈과 오른쪽 눈에서 보는 각도가 다르기 때문에 물체의 상이 각막을 통해 들어와서 망막에 맺힐 때 상이 맺히는 위치가 차이가 나게 되는데 이 차이를 통해서 거리를 알 수 있다. 스테레오 카메라를 이용하여 얻은 두 장의 스테레오 영상(110) 중 좌측 영상의 한 점을 기준으로 우측 영상의 동일한 점은 좌측 영상에서의 점보다 좌측에 위치할 수 있고, 이 때의 위치 차이가 시차(disparity)일 수 있다. 시차값은 거리가 멀수록 적고, 거리가 가까울수록 클 수 있다. 시차맵(120)은 시차를 밝기의 정도로 표현한 흑백 영상일 수 있다. 예를 들어, 시차맵(120)은 시차값이 클수록 밝고, 시차값이 작을수록 어둡게 표현될 수 있다. 시차맵(120)은 밝기 표현으로 거리 정보를 표현할 수 있기 때문에 영상의 3차원 정보를 표현할 수 있다. 시차맵(120)은 시차 영상(disparity image) 또는 깊이 맵(depth image)이라고 지칭될 수도 있다.

일 실시예에 따른 객체 인식 방법을 설명하기에 앞서, 종래의 일반적인 객체 인식 방법을 간략하게 설명한다.

시차맵(120)은 3차원 정보를 포함하기 때문에 객체와 배경의 분리도를 높일 수 있어 객체 검출에 사용될 수 있지만, 시차맵(120)을 단독으로 사용하는 경우에는 스테레오 매칭 에러로 인하여 인식 오차가 발생할 수 있다. 스테레오 매칭 에러에 의해 시차값이 거의 없는 경우에도 시차맵(120) 상에서 큰 시차값이 존재하는 것으로 표현되거나, 또는 큰 시차값이 존재함에도 불구하고 입력 영상의 해상도, 노이즈 등으로 인하여 시차맵(120) 상에는 시차값이 거의 존재하지 않게 나타날 수 있다. 예를 들어, 스테레오 영상(110)의 보행자의 머리 부분(111, 113)의 경우 실제로 큰 시차값이 존재하나, 대응되는 시차맵(120)에서는 시차값이 거의 존재하지 않는 것으로 표현될 수 있다(121, 123). 또한, 스테레오 영상(110)의 하늘 부분(112)의 경우 실제로는 시차값이 거의 없으나, 대응되는 시차맵(120)에서는 밝게 표시되며 큰 시차값이 있는 것으로 표현될 수 있다(122). 시차맵(120)만 사용하여 객체를 검출하는 경우에는, 위와 같이 다양한 요인으로 인하여 검출 에러가 발생할 수 있고, 특히 시차값이 존재하지 않는 부분(보행자 머리, 발)은 검출에서 제외되는 문제가 발생할 수 있다.

이러한 문제를 해소하고 검출 성능을 높이기 위하여 시차맵(120)과 분류기(classifier)를 함께 사용하여 객체를 검출하는 방법이 사용되고 있다. 시차맵(120)을 이용하여 객체 후보 영역을 추출하고, 추출한 후보 영역에 대해서 미리 학습한 분류기를 이용하여 객체 여부를 판단할 수 있다. 시차맵을 이용하여 객체 영역을 검출하는 부분은 속도가 다소 빠르나, 객체 후보 영역에 대해서 객체를 인식하는 부분은 객체의 크기, 객체 영역 추출의 정밀성을 고려한 피라미드 구조의 인식 방법 등을 사용하기 때문에 많은 시간이 필요할 수 있다. 또한, 일반적으로 객체의 특정 부분이 아닌 객체 전체를 검출하기 위하여 다양한 객체 전체 영상을 학습 영상으로 사용하여 분류기를 학습하여야 하기 때문에, 객체 전체를 인식하는 방법은 학습 영상 및 검출 영역 크기의 증가로 인하여 인식 속도의 저하를 가져올 수 있다.

종래의 객체 인식 방법에 따르면, 객체 후보 영역의 부정확한 검출에 따른 전반적인 인식 성능 저하, 객체 크기 변화에 대응하기 위한 피라미드기반 검출 방법에 따른 속도 저하, 분류기를 사용함에 따른 속도 저하 등 다양한 문제가 발생할 수 있다. 또한 객체 전체를 인식하는 방법은 학습 영상 및 검출 영역 크기의 증가로 인하여 인식 속도의 저하를 가져올 수 있다.

도 2는 일 실시예에 따른 객체 인식 방법을 설명하기 위한 순서도이다.

단계들(210 내지 260)은 객체 인식 장치에 의해 수행될 수 있다. 객체 인식 장치는 하나 또는 그 이상의 하드웨어 모듈, 하나 또는 그 이상의 소프트웨어 모듈, 또는 이들의 다양한 조합에 의하여 구현될 수 있다.

단계(210)에서, 객체 인식 장치는 스테레오 영상에서 기초하여 시차맵을 생성한다. 시차맵은 시차를 밝기의 정도로 표현한 흑백 영상으로, 시차맵은 시차값이 클수록 밝고, 시차값이 작을수록 어둡게 표현될 수 있다. 시차맵은 밝기 표현으로 거리 정보를 표현할 수 있기 때문에 영상의 3차원 정보를 표현할 수 있다.

단계(220)에서, 객체 인식 장치는 스테레오 영상과 시차맵에 기초하여 하나 이상의 객체 후보 영역을 검출한다. 객체는 다양한 목적에 따라 검출하고자 하는 미리 정해진 대상일 수 있다. 예를 들어, 객체는 보행자를 포함할 수 있다. 다만, 객체 인식 방법의 실시예들은 보행자 인식 방법에 국한되어 적용될 필요는 없고, 다양한 객체 인식 방법에 응용될 수 있다. 객체 후보 영역이란, 시차맵에서 시차값에 기초하여 일차적으로 결정되는 객체의 후보가 될 수 있는 영역에 대응되는 스테레오 영상 상의 영역일 수 있다. 객체 후보 영역은 V-시차맵 방법, U-시차맵 방법, 컬럼(column) 검출 방법 중 적어도 하나를 이용하여 검출될 수 있다. 객체 후보 영역은 시차맵에 기초하여 생성되기 때문에 전술한 스테레오 매칭 에러로 인하여 객체의 특정 부분을 포함하지 못할 수 있다. 예를 들어, 보행자 후보 영역은, 보행자의 머리나 발 부분을 포함하지 못할 수 있다. 객체의 상단과 하단 부분을 정확히 검출하는 것은 객체 인식 방법에 있어서 매우 중요한 이슈일 수 있다. 객체의 상단과 하단 부분의 정확한 검출을 통해 객체의 높이(키)를 정밀하게 유추하여 성인, 어린이의 대략적인 인식이 가능하며, 이를 통하여 지능형 자동차, 로봇 등의 적용에 있어서 다양한 서비스를 제공할 수 있다. 일 실시예에 따른 객체 인식 방법에 따르면, 객체의 상단과 하단까지 정확하게 인식하기 위해 객체 후보 영역을 수정할 필요가 있을 수 있다.

단계(230)에서, 객체 인식 장치는 객체 후보 영역에 기초하여 객체 영역을 결정한다. 객체 영역은 객체의 상단과 하단까지 포함하기 위해 객체 후보 영역을 미리 정해진 방법에 따라 수정하여 결정된 영역일 수 있다. 아래에서, 객체 후보 영역을 결정하는 방법에 대하여 도 3을 참조하여 상세히 설명된다.

단계(240)에서, 객체 인식 장치는 객체 영역을 미리 정해진 크기로 정규화한다. 단계(210 내지 230)에 따라 결정된 하나 이상의 객체 영역을 동일한 크기로 정규화할 수 있다. 다양한 크기의 보행자가 존재할 때, 일반적으로 피라미드 기법을 적용하여 분류기를 여러 번 사용하는데, 이는 시간이 매우 많이 필요할 수 있다. 일 실시예에 따른 객체 인식 방법에 따르면, 단계(210 내지 230)에 의해 객체의 상단과 하단이 포함된 비교적 정확한 보행자 영역이 결정되었기 때문에, 보행자 영역을 모두 같은 크기로 정규화하여 한 번의 분류기 사용으로 속도를 향상시킬 수 있다. 정규화의 크기는 임의로 정할 수 있다. 예를 들어, 32*96으로 정규화할 수 있다.

단계(250)에서, 객체 인식 장치는 정규화된 객체 영역의 탐색 영역을 결정한다. 종래의 객체 전체를 인식하는 방법은 학습 영상 및 검출 영역 크기의 증가로 인하여 인식 속도의 저하를 가져올 수 있다. 일 실시예에 따른 객체 인식 방법에 따르면, 객체 영역의 미리 정해진 비율의 상단 영역을 제1 탐색 영역으로 결정하고, 객체 영역의 미리 정해진 비율의 하단 영역을 제2 탐색 영역으로 결정하여 객체 영역의 탐색 영역을 결정할 수 있고, 결정된 탐색 영역만 분류기에 입력하여 객체를 인식하기 때문에 분류기를 사용함에 따른 속도 저하 등을 해결함으로써 성능은 상당히 유지하면서 속도를 개선시킬 수 있다.

객체 영역의 탐색 영역을 결정하는 방법에 따르면, 예를 들어 보행자 영역의 상하크기를 4등분하여 상단의 1등분 영역과 하단의 1등분 영역만을 탐색 영역으로 결정할 수 있고, 보행자 검출 영역이 보행자 전체 영역에서 상하단 부분으로 그 크기가 축소되고, 보행자 탐색 영역도 제한됨으로써, 전반적인 보행자 인식 속도가 상당히 개선될 수 있다. 탐색 영역을 결정하는 방법의 실시예들은 위 예시에 국한되어 적용될 필요는 없고, 다양한 실시예가 응용될 수 있다.

단계(260)에서, 객체 인식 장치는 미리 학습된 분류기에 탐색 영역을 입력하여, 객체를 인식한다. 미리 학습된 분류기는 제1 분류기 및 제2 분류기를 포함하고, 제1 탐색 영역은 제1 분류기에 입력되어, 객체의 제1 말단 위치를 결정할 수 있고, 제2 탐색 영역은 제2 분류기에 입력되어, 객체의 제2 말단 위치를 결정할 수 있다. 예를 들어, 보행자 분류기는 보행자 상단 분류기, 보행자 하단 분류기를 별도로 둘 수 있고, 보행자 영역의 상하크기를 4등분하여 보행자 상단 분류기는 상단의 1등분 영역만 탐색하여 객체의 상단 위치를 결정할 수 있고, 보행자 하단 분류기는 하단의 1등분 영역만을 탐색하여 객체의 하단 위치를 결정할 수 있다. 아래에서, 분류기를 통한 객체의 말단 위치 결정 방법에 대하여 도 5를 참조하여 상세히 설명되고, 분류기의 학습 방법에 대하여는 도 6을 참조하여 상세히 설명된다.

도 3은 일 실시예에 따른 객체 영역을 결정하는 방법을 설명하기 위한 순서도이다.

도 3을 참조하면, 일 실시예에 따른 객체 후보 영역을 검출한 객체 인식 장치는 객체 후보 영역의 가로 폭을 결정할 수 있다(310). 시차맵은 수평 타입의 스테레오 카메라 특성상 수평 방향 에러는 작고, 대부분 수직방향으로 에러가 발생할 수 있다. 또한 객체가 보행자일 경우, 보행자의 특성상 사람의 가로 폭은 대략적으로 비슷하지만, 키(세로 폭)는 일반적으로 다를 수 있다. 객체 후보 영역의 가로 폭을 결정 시, 시차맵을 이용하면 상당히 정확한 정보를 추출할 수 있다.

객체 후보 영역의 가로 폭을 결정하기 위한 일 실시예에 따르면, 객체 후보 영역의 시차맵 정보는 수평 방향으로는 정확하기 때문에, 그 정보를 기반으로 객체 후보 영역에서 보행자 검출을 직접적으로 수행할 수 있다. 예를 들어, 시차맵을 수평방향으로 히스토그램을 생성하고, 히스토그램의 수평위치를 검출하면 쉽게 보행자 영역의 수평 폭을 결정할 수 있다. 또는, 슈퍼 픽셀(super pixel) 기법, 마르코프 랜덤 필드(Markov Random Fields) 및 조건적 랜덤 필드(Conditional Random Fields) 중 적어도 하나를 포함하는 세그멘테이션 기법을 시차맵상의 객체 후보 영역에 수행하여 객체를 검출하여 객체 후보 영역의 가로 폭을 획득할 수 있다. 또는, 시차맵을 수평방향으로 히스토그램을 생성하고, 히스토그램의 수평위치를 검출하면 쉽게 객체 후보 영역의 가로 폭을 결정할 수 있다.

객체 후보 영역의 가로 폭을 결정하기 위한 다른 실시예에 따르면, 시차맵의 시차값을 이용하여 객체 후보 영역의 가로 폭을 결정할 수 있다. 시차값을 이용하여 보행자와의 실제적인 거리를 유추하고, 이를 이용하여 보행자의 가로 폭을 결정할 수 있다. 예를 들어, 실제 보행자의 폭을 50~60cm로 가정하고, 실제 거리를 알면, 시차맵 이미지상에서 보행자의 폭을 결정할 수 있다. 이때 객체 후보 영역의 가로 폭은 객체 후보 영역의 중심을 기준으로 맞출 수 있다.

단계(320)에서, 객체 인식 장치는 결정된 가로 폭에 기초하여 객체 후보 영역의 세로 폭을 확장할 수 있다. 다양한 요인으로 보행자의 상하부분이 부족한 형태로 보행자 후보 영역이 추출될 수 있다. 예를 들어, 전술한 바와 같이, 객체 후보 영역은 시차맵에 기초하여 생성되기 때문에 세로 방향에 대한 스테레오 매칭 에러로 인하여 객체의 특정 부분을 포함하지 못할 수 있기 때문에, 객체의 상단과 하단까지 인식하기 위해 객체 후보 영역의 세로 폭을 확장할 필요가 있을 수 있다. 단계(310)에 따라 결정된 객체 후보 영역의 가로 폭(w)에 기초하여 객체 후보 영역의 세로 폭(h)을 확장할 수 있다. 결정된 가로 폭에 미리 정해진 비율을 곱하여 객체 후보 영역의 세로 폭을 갱신할 수 있고, 갱신된 세로 폭까지 객체 후보 영역의 세로 폭을 확장할 수 있다. 예를 들어, 보행자의 일반적인 크기 비율을 고려하여 세로 폭(h)는 가로 폭(w)의 2~4배가 되도록 결정할 수 있다. 또한, 미리 정해진 비율에 따라 세로 폭을 확장할 때, 객체 후보 영역의 중심을 기준으로 객체 후보 영역의 세로 폭을 확장할 수 있다.

단계(330)에서, 객체 인식 장치는 결정된 가로 폭과 확장된 세로 폭에 기초하여 객체 영역을 결정할 수 있다.

도 4는 일 실시예에 따른 객체 인식 방법을 설명하기 위한 도면이다. 도 1 내지 3의 설명은 도 4에도 적용 가능하므로, 중복되는 내용의 설명은 생략한다.

도 4를 참조하면, 일 실시예에 따른 객체 인식 장치는 스테레오 영상(410)과 시차맵(420)에 기초하여 하나 이상의 객체 후보 영역을 검출할 수 있다. 객체 인식 장치는 스테레오 영상(410)과 시차맵(420)에 기초하여 하나 이상의 객체 후보 영역을 검출할 수 있다.

객체 인식 장치는 객체 후보 영역에 기초하여 객체 영역을 결정할 수 있다. 구체적으로, 객체 인식 장치는 객체 후보 영역의 가로 폭을 결정할 수 있다(430). 객체 인식 장치는 결정된 가로 폭에 기초하여 객체 후보 영역의 세로 폭을 확장할 수 있다(440). 객체 인식 장치는 결정된 가로 폭과 확장된 세로 폭에 기초하여 객체 영역을 결정할 수 있다.

객체 인식 장치는 이전 단계를 통해 결정된 하나 이상의 객체 영역을 동일한 크기로 정규화할 수 있다(450). 객체 인식 장치는 정규화된 객체 영역의 탐색 영역을 결정할 수 있다(460). 예를 들어 보행자 영역의 상하크기를 4등분하여 상단의 1등분 영역과 하단의 1등분 영역만을 탐색 영역으로 결정할 수 있다.

객체 인식 장치는 미리 학습된 분류기에 탐색 영역을 입력할 수 있다(470). 예를 들어, 보행자 분류기는 보행자 상단 분류기, 보행자 하단 분류기를 별도로 둘 수 있고, 보행자 영역의 상하크기를 4등분하여 보행자 상단 분류기는 상단의 1등분 영역만 탐색하고, 보행자 하단 분류기는 하단의 1등분 영역만을 탐색할 수 있다.

객체 인식 장치는 분류기를 통한 객체의 말단 위치 결정 방법에 따라 객체를 인식할 수 있다(480).

도 5는 일 실시예에 따른 분류기를 통한 객체의 말단 위치 결정 방법을 설명하기 위한 도면이다.

도 5를 참조하면, 일 실시예에 따른 객체의 말단 위치 결정 방법에 따르면, 말단 위치를 최종적으로 결정할 때, 앞 단계의 누적 추적 결과를 결합하여 결정할 수 있다. 한 장의 영상만으로 위치를 정하면 오차가 커질 수 있다. 오차를 보완하는 측면으로 앞 단계의 결과를 누적으로 추적하여 그 결과를 현재의 결과에 결합하여 말단의 위치를 결정할 수 있다.

분류기를 수직방향(y)으로 인식을 수행하면 각각에 대해서 분류기 값이 존재할 수 있다(510). 이 값을 필터링하여 노이즈를 제거한 후, 최고점을 검출할 수 있다(520). 최고점을 검출한 후, 누적 추적 정보(540)와 결합 할 수 있다(530). 누적 추적 정보(540)는 해당 보행자의 과거의 위치를 중심으로 하는 가우시안(Gaussian) 분포를 누적하여 사용할 수 있다. 예를 들어, 해당 보행자의 과거의 위치를 중심으로 하는 가우시안 분포들을 만들고 누적해서 더하여 만들 수 있다. 앞 단계에서 검출한 최고점과 누적 추적 정보를 곱하여 최종 말단 위치를 결정할 수 있다(550). 최종 말단 위치를 기준으로 객체를 인식할 수 있다.

도 6과 도 7은 일 실시예에 따른 분류기를 학습하는 방법을 설명하기 위한 순서도이다.

도 6을 참조하면, 일 실시예에 따른 분류기는 단계(610)에서, 객체 영상의 상단 및 하단 영역에 대한 스테레오 영상과 시차맵을 학습영상으로 획득할 수 있다. 분류기는 오프라인상에서 학습을 하여 생성할 수 있다.

일반적으로 보행자 학습영상은 보행자 전체 영역이 포함되고, 상하좌우로 배경이 포함된 형태를 갖을 수 있다. 도 7을 참조하면, 일 실시예에 따른 학습 영상은 상단의 일부분과 하단의 일부분만 보행자 하단 분류기의 학습 영상으로 사용할 수 있다. 학습 영상으로 컬러 스테레오 영상(710) 뿐만 아니라, 컬러 스테레오 영상(710)에 대응되는 시차맵 영상(750)도 함께 학습 영상으로 사용할 수 있다.

단계(620)에서, 스테레오 영상(710)과 시차맵 영상(750)에 동일한 크기로 정규화할 수 있다. 학습 영상도 인식 영상과 마찬가지로 정규화하여 한 번의 분류기 사용으로 속도를 향상시킬 수 있다.

단계(630)에서, 정규화된 학습 영상을 이용하여 각각의 분류기 학습 과정에 사용할 수 있다. 예를 들어, 상단 부분의 학습 영상을 이용하여 상단 분류기를, 하단 부분의 학습 영상을 이용하여 하단 분류기를 학습할 수 있다. 학습 영상의 크기는 임의로 결정할 수 있다. 예를 들어, 학습 영상의 크기는 32*8처럼 가로로 긴 형태일 수 있다.

도 8은 일 실시예에 따른 보행자 인식 방법을 나타낸 흐름도이다.

도 8을 참조하면, 일 실시예에 따른 보행자 인식 장치는 입력 영상을 수신할 수 있다(810). 입력 영상은 보행자를 포함하는 스테레오 영상일 수 있다. 입력 영상을 수신한 보행자 인식 장치는 입력 영상에 기초하여 시차맵을 생성할 수 있고(820), 입력 영상과 시차맵에 기초하여 보행자 후보 영역을 검출할 수 있다(830).

보행자 인식 장치는 시차맵의 시차값에 기초하여 보행자 후보 영역의 가로 폭을 결정할 수 있고(840), 결정된 가로 폭에 기초하여 보행자 후보 영역의 세로 폭을 확장 할 수 있고(850), 결정된 가로 폭과 확장된 세로 폭에 기초하여 보행자 영역을 결정할 수 있다.

보행자 인식 장치는 보행자 영역의 크기를 정규화할 수 있고(860), 이 후 보행자 영역의 탐색 영역, 상단 영역과 하단 영역을 결정할 수 있다(865). 탐색 영역을 결정한 후 탐색 영역을 오프라인에서 학습된 분류기(870)에 입력할 수 있다. 분류기는 상단 영역에 대한 분류기와 하단 영역에 대한 분류기로 분리될 수 있으며, 각각의 분류기는 보행자 학습 영상을 수신하고(871, 874), 수신한 학습 영상의 크기를 정규화하고(872, 875), 정규화된 학습 영상을 학습하여 생성될 수 있다(873, 876).

보행자 인식 장치는 앞 단계의 보행자 탐색 영역 누적 추적 결과(880)와 분류기를 통해 획득한 분류기의 최고점 값에 기초하여 보행자 말단 위치를 결정할 수 있다(890). 보행자 인식 장치는 결정된 보행자 말단 위치에 기초하여 보행자를 인식할 수 있다(895).

도 9는 일 실시예에 따른 객체 인식 장치의 블록도이다.

도 9를 참조하면, 일 실시예에 따른 객체 인식 장치(900)는 프로세서(910)를 포함한다. 객체 인식 장치(900)는 통신 인터페이스(930) 및 메모리(950)를 더 포함할 수 있다. 프로세서(910), 메모리(950) 및 통신 인터페이스(930)는 통신 버스(905)를 통해 서로 통신할 수 있다. 객체 인식 장치(900)는 예를 들어, 학습 영상으로부터 객체를 인식하는 분류기(classifier)를 포함할 수 있다. 객체 인식 장치(900)는 예를 들어, 무인 자동차, 로봇, 감시 카메라, 및/또는 의료 분야의 다양한 장치들의 임베디드 시스템(embedded system)에 적용될 수 있다.

프로세서(910)는 스테레오 영상에 기초하여 시차맵을 생성하고, 스테레오 영상과 시차맵에 기초하여 하나 이상의 객체 후보 영역을 검출하고, 객체 후보 영역에 기초하여 객체 영역을 결정하고, 객체 영역을 미리 정해진 크기로 정규화하고, 정규화된 객체 영역의 탐색 영역을 결정하며, 미리 학습된 분류기에 탐색 영역을 입력하여, 객체를 인식할 수 있다.

프로세서(910)는 객체 후보 영역의 가로 폭을 결정하고, 결정된 가로 폭에 기초하여 객체 후보 영역의 세로 폭을 확장하며, 결정된 가로 폭과 확장된 세로 폭에 기초하여 객체 영역을 결정할수 있다.

프로세서(910)는 객체 영역의 미리 정해진 비율의 상단 영역을 제1 탐색 영역으로 결정하고, 객체 영역의 미리 정해진 비율의 하단 영역을 제2 탐색 영역으로 결정할 수 있다.

프로세서(910)는 제1 분류기에 제1 탐색 영역을 입력하여, 객체의 제1 말단 위치를 결정하고, 제2 분류기에 제2 탐색 영역을 입력하여, 객체의 제2 말단 위치를 결정할 수 있다.

프로세서(910)는 미리 학습된 분류기에 탐색 영역을 입력하여 객체 영역의 가로 방향 출력을 획득하고, 가로 방향 출력의 최고점을 검출하고, 객체의 과거 위치에 기초하여 획득한 누적 추적 정보를 획득하며, 누적 추적 정보와 최고점에 기초하여 객체를 인식할 수 있다.

프로세서(910)는 결정된 가로 폭에 미리 정해진 비율을 곱하여 객체 후보 영역의 세로 폭을 갱신하고, 갱신된 세로 폭까지 객체 후보 영역의 세로 폭을 확장할 수 있다.

프로세서(910)는 이 밖에도, 도 1 내지 도 8를 통하여 전술한 적어도 하나의 방법을 수행할 수 있다. 프로세서(910)는 프로그램을 실행하고, 객체 인식 장치(900)를 제어할 수 있다. 프로세서(910)에 의하여 실행되는 프로그램 코드는 메모리(950)에 저장될 수 있다.

통신 인터페이스(930)는 객체 인식 장치(900)의 외부로부터 입력 영상을 수신할 수 있다. 또한, 통신 인터페이스(930)는 프로세서(910)에 의해 결정된 객체와 관련된 정보(예를 들어, 객체의 존재 여부, 객체와의 거리, 객체의 위치, 객체의 개수, 및 객체의 분포 경향 등) 및 프로세서(910)가 검출한 객체에 대한 정보 등을 객체 인식 장치(900)의 외부로 전달할 수도 있다.

메모리(950)는 스테레오 영상, 시차 맵을 저장할 수 있다. 또한, 메모리(950)는 프로세서(910)가 결정한 객체 후보 영역, 객체 영역, 탐색 영역, 누적 추적 정보 등을 저장할 수 있다. 또한, 메모리(950)는 상술한 프로세서(910)에서의 처리 과정에서 생성되는 다양한 정보들을 저장할 수 있다. 이 밖에도, 메모리(950)는 각종 데이터와 프로그램 등을 저장할 수 있다. 메모리(950)는 휘발성 메모리 또는 비휘발성 메모리를 포함할 수 있다. 메모리(950)는 하드 디스크 등과 같은 대용량 저장 매체를 구비하여 각종 데이터를 저장할 수 있다.

이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims

스테레오 영상에서 기초하여 시차맵을 생성하는 단계;
상기 스테레오 영상과 상기 시차맵에 기초하여 하나 이상의 객체 후보 영역을 검출하는 단계;
상기 객체 후보 영역에 기초하여 객체 영역을 결정하는 단계;
상기 객체 영역을 미리 정해진 크기로 정규화하는 단계;
상기 정규화된 객체 영역의 탐색 영역을 결정하는 단계; 및
미리 학습된 분류기에 상기 탐색 영역을 입력하고, 상기 객체의 과거 위치에 기초하여 획득한 누적 추적 정보를 고려하여 상기 객체를 인식하는 단계
를 포함하고,
상기 미리 학습된 분류기는
제1 분류기 및 제2 분류기를 포함하고,
상기 객체를 인식하는 단계는
상기 제1 분류기에 제1 탐색 영역을 입력하여, 상기 객체의 제1 말단 위치를 결정하는 단계; 및
상기 제2 분류기에 제2 탐색 영역을 입력하여, 상기 객체의 제2 말단 위치를 결정하는 단계
를 포함하는, 객체 인식 방법.
제1항에 있어서,
상기 객체 영역을 결정하는 단계는
상기 객체 후보 영역의 가로 폭을 결정하는 단계;
상기 결정된 가로 폭에 기초하여 상기 객체 후보 영역의 세로 폭을 확장하는 단계; 및
상기 결정된 가로 폭과 상기 확장된 세로 폭에 기초하여 상기 객체 영역을 결정하는 단계
를 포함하는, 객체 인식 방법.
제1항에 있어서,
상기 탐색 영역을 결정하는 단계는
상기 객체 영역의 미리 정해진 비율의 상단 영역을 상기 제1 탐색 영역으로 결정하는 단계; 및
상기 객체 영역의 미리 정해진 비율의 하단 영역을 상기 제2 탐색 영역으로 결정하는 단계
를 포함하는, 객체 인식 방법.
삭제
제1항에 있어서,
상기 객체를 인식하는 단계는
상기 미리 학습된 분류기에 상기 탐색 영역을 입력하여 상기 객체 영역의 가로 방향 출력을 획득하는 단계;
상기 가로 방향 출력의 최고점을 검출하는 단계;
상기 누적 추적 정보를 획득하는 단계; 및
상기 누적 추적 정보와 상기 최고점에 기초하여 상기 객체를 인식하는 단계
를 포함하는, 객체 인식 방법.
제1항에 있어서,
상기 객체는 보행자를 포함하는, 객체 인식 방법.
제1항에 있어서,
상기 객체 후보 영역을 검출하는 단계는
V-시차맵 방법, U-시차맵 방법, 컬럼(column) 검출 방법 중 적어도 하나를 이용하여 상기 객체 후보 영역을 검출하는 단계
를 포함하는, 객체 인식 방법.
제2항에 있어서,
상기 객체 후보 영역의 가로 폭을 결정하는 단계는
상기 시차맵의 시차값에 기초하여 상기 객체와의 실제 거리를 추정하는 단계; 및
미리 정해진 실제 객체의 가로 폭과 상기 추정된 실제 거리에 기초하여 상기 객체 후보 영역의 가로 폭을 결정하는 단계
를 포함하는, 객체 인식 방법.
제2항에 있어서,
상기 객체 후보 영역의 가로 폭을 결정하는 단계는
상기 시차맵에 세그멘테이션 기법을 적용하여 상기 객체를 분류하는 단계; 및
상기 분류된 객체의 가로 폭을 측정하는 단계
를 포함하는, 객체 인식 방법.
제9항에 있어서,
상기 세그멘테이션 기법은
k-평균 알고리즘, 슈퍼 픽셀(super pixel) 기법, 마르코프 랜덤 필드(Markov Random Fields) 및 조건적 랜덤 필드(Conditional Random Fields) 중 적어도 하나를 포함하는, 객체 인식 방법.
제2항에 있어서,
상기 객체 후보 영역의 가로 폭을 결정하는 단계는
상기 시차맵에 수평 방향의 히스토그램을 생성하는 단계; 및
상기 히스토그램의 가로 폭을 측정하는 단계
를 포함하는, 객체 인식 방법.
제2항에 있어서,
상기 객체 후보 영역의 세로 폭을 확장하는 단계는
상기 결정된 가로 폭에 미리 정해진 비율을 곱하여 상기 객체 후보 영역의 세로 폭을 갱신하는 단계;
상기 갱신된 세로 폭까지 상기 객체 후보 영역의 세로 폭을 확장하는 단계
를 포함하는, 객체 인식 방법.
제12항에 있어서,
상기 객체 후보 영역의 세로 폭을 확장하는 단계는
상기 객체 후보 영역의 중심을 기준으로 상기 객체 후보 영역의 세로 폭을 확장하는 단계
를 포함하는, 객체 인식 방법.
하드웨어와 결합되어 제1항 내지 제 3항 및 제 5항 내지 제13항 중 어느 하나의 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램.
스테레오 영상에 기초하여 시차맵을 생성하고, 상기 스테레오 영상과 상기 시차맵에 기초하여 하나 이상의 객체 후보 영역을 검출하고, 상기 객체 후보 영역에 기초하여 객체 영역을 결정하고, 상기 객체 영역을 미리 정해진 크기로 정규화하고, 상기 정규화된 객체 영역의 탐색 영역을 결정하며, 미리 학습된 분류기에 상기 탐색 영역을 입력하고, 상기 객체의 과거 위치에 기초하여 획득한 누적 추적 정보를 고려하여 상기 객체를 인식하는 프로세서
를 포함하고,
상기 미리 학습된 분류기는
제1 분류기 및 제2 분류기를 포함하고,
상기 프로세서는
상기 제1 분류기에 제1 탐색 영역을 입력하여, 상기 객체의 제1 말단 위치를 결정하고, 상기 제2 분류기에 제2 탐색 영역을 입력하여, 상기 객체의 제2 말단 위치를 결정하는 객체 인식 장치.
제15항에 있어서,
상기 프로세서는
상기 객체 후보 영역의 가로 폭을 결정하고, 상기 결정된 가로 폭에 기초하여 상기 객체 후보 영역의 세로 폭을 확장하며, 상기 결정된 가로 폭과 상기 확장된 세로 폭에 기초하여 상기 객체 영역을 결정하는, 객체 인식 장치.
제15항에 있어서,
상기 프로세서는
상기 객체 영역의 미리 정해진 비율의 상단 영역을 상기 제1 탐색 영역으로 결정하고, 상기 객체 영역의 미리 정해진 비율의 하단 영역을 상기 제2 탐색 영역으로 결정하는, 객체 인식 장치.
삭제
제15항에 있어서,
상기 프로세서는
상기 미리 학습된 분류기에 상기 탐색 영역을 입력하여 상기 객체 영역의 가로 방향 출력을 획득하고, 상기 가로 방향 출력의 최고점을 검출하고, 상기 누적 추적 정보를 획득하며, 상기 누적 추적 정보와 상기 최고점에 기초하여 상기 객체를 인식하는, 객체 인식 장치.
제15항에 있어서,
상기 프로세서는
상기 결정된 가로 폭에 미리 정해진 비율을 곱하여 상기 객체 후보 영역의 세로 폭을 갱신하고, 상기 갱신된 세로 폭까지 상기 객체 후보 영역의 세로 폭을 확장하는, 객체 인식 장치.