KR101362768B1

KR101362768B1 - 객체 검출 방법 및 장치

Info

Publication number: KR101362768B1
Application number: KR1020070120357A
Authority: KR
Inventors: 김정배; 이성덕; 이종하
Original assignee: 삼성전자주식회사
Priority date: 2007-11-23
Filing date: 2007-11-23
Publication date: 2014-02-14
Also published as: US8666175B2; KR20090053492A; US20100284622A1

Abstract

본 발명은 객체 검출 방법 및 장치에 관한 것으로, 본 발명의 일 실시 예에 따른 객체 검출 방법은 제i스테이지의 분류기에서 입력 영상으로부터 추출한 특징들을 기초로 특징값을 계산하고, 계산한 특징값과 제i 스테이지의 제1 임계값을 비교하고, 특징값과 제i 스테이지의 제1 임계값의 비교 결과에 따라 특징값과 제i 스테이지의 제2 임계값을 비교하고, 특징값과 제i 스테이지의 제2 임계값의 비교 결과에 따라 제i+2 스테이지의 분류기로 점프함으로써, 반복적인 계산을 피하고 고속으로 입력 영상에서 객체를 검출할 수 있다.

객체, 검출, 임계값, 점프

Description

객체 검출 방법 및 장치{Method and apparatus for detecting an object}

본 발명은 객체 검출 방법 및 장치에 관한 것으로, 더 상세하게는 다단 분류기(multi-stage classifier)를 이용하여 객체, 특히 얼굴을 검출하는 방법 및 장치에 관한 것이다.

최근 들어, 사회가 고도의 정보화 사회로 발달해 감에 따라 정보의 보안 및 고객 관리 등과 같은 분야에서 소비자의 욕구가 증대되고, 이에 따라 해당 관리자의 확인 및 방문객의 보안 등에 관한 보다 신뢰성 있는 시스템을 요구하는 추세이다. 이에 따라, 근래에는 상술한 보안시스템뿐만 아니라, 검문, 대형 매장에서의 고객 관리, 개인 신변보호, 무인 자판대 등 이용자의 얼굴 검색분야 및, 컴퓨터의 정보처리능력과 인터넷 등 광범위 통신망을 이용한 다양한 분야에서 사용되고 있는 얼굴 인식방법이 각광을 받고 있다.

얼굴 검출 기술은 디지털 콘텐츠 관리, 얼굴 인식, 3차원 얼굴 모델링, 애니메이션, 아바타, 스마트 감시(smart surveillance), 혹은 디지털 엔터테인먼트 등과 같은 다양한 분야에 적용되는 기본 기술 중 하나로, 그 중요성이 점점 커지고 있다.

고속 물체 검출 기술은, 특히 고속 얼굴 검출이 필요한 분야, 예를 들면 얼굴 검출 기반의 3A(AE/AWB/AF) 카메라 , 얼굴 검출 기반 ATM DVR, 얼굴 인증 폰, 인물 기반 포토 앨범 분류 및 검색 등에 다양하게 이용되고 있다.

최근 얼굴 검출 기술에 대한 많은 연구가 이루어지고 있으나, 실제 생활에 적용되기에는 아직 알고리즘의 검출신뢰성이 낮고, 검출속도가 만족스럽지 못하다. 이러한 문제를 해결하기 위해서, 얼굴 샘플 패턴으로부터 결정 바운더리(decision boundary)를 학습시켜 얼굴 검출에 이용하는 방법이 연구되고 있다.

일반적인 고속 물체 검출 기법은 입력 영상으로부터 특징을 추출하여 캐스케이드 구조의 멀티 분류기에서 충분한 객체 특징을 보이지 않는 입력은 버리면서, 연속적으로 스테이지를 진행하거나, 또는 충분한 객체 특징을 보이지 않는 입력뿐만 아니라 객체 특징을 보이는 입력은 객체로 분류하면서 캐스케이드 구조의 분류기에서 분류 계산 동작을 순차적으로 진행시킨다.

하지만, 전술한 종래기술들의 경우, 영상 입력에 대해서는 모든 스테이지에서 연산을 수행해야 하고, 일부 객체의 특징을 보이지 않는 입력에 대해서도 상당한 스테이지까지 진행을 수행해야만 하므로, 계산량이 많다는 한계가 있다

본 발명은 일반적인 멀티-스테이지 구조의 분류기에서 스테이지를 점프할 수 있는 구조를 적용함으로써, 반복적인 계산을 피하고 고속으로 입력 영상에서 객체를 검출할 수 있는 객체 검출 방법 및 장치를 제공하는 데 목적이 있다.

본 발명의 기술적 과제를 달성하기 위한 멀티-스테이지의 분류기를 이용한 객체 검출 방법은 제i(i는 양의 정수) 스테이지의 분류기에서 상기 입력 영상으로부터 추출한 특징들을 기초로 특징값을 계산하고, 상기 계산한 특징값과 제i 스테이지의 제1 임계값을 비교하고, 상기 특징값과 제i 스테이지의 제1 임계값의 비교 결과에 따라 상기 특징값과 상기 제i 스테이지의 제2 임계값을 비교하고, 상기 특징값과 상기 제i 스테이지의 제2 임계값의 비교 결과에 따라 제i+2 스테이지의 분류기로 점프하여 이루어진다.

본 발명의 다른 기술적 과제를 달성하기 위한 멀티-스테이지의 분류기를 이용한 객체 검출 장치는 제i(i은 양의 정수) 스테이지의 분류기에서 상기 입력 영상으로부터 추출한 특징들을 기초로 특징값을 계산하고, 상기 계산한 특징값과 제i 스테이지의 제1 임계값을 비교하고, 상기 특징값과 제i 스테이지의 제1 임계값의 비교 결과에 따라 상기 특징값과 상기 제i 스테이지의 제2 임계값을 비교하고, 상기 특징값과 상기 제i 스테이지의 제2 임계값의 비교 결과에 따라 제i+2 스테이지의 분류기로 점프하는 멀티-스테이지의 분류기를 포함한 객체 분류부와, 상기 객체 분류부의 분류 결과를 기초로 상기 입력 영상에서 소정의 객체가 존재하는지를 판단하는 결정부를 포함하여 이루어진다.

본 발명의 또 다른 기술적 과제를 달성하기 위한 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함한다.

본 발명의 세부 및 개선 사항은 종속항에 개시된다.

이하, 첨부한 도면들을 참조하여 본 발명의 바람직한 실시 예들을 상세히 설명한다.

도 1은 본 발명의 일 실시 예에 따른 객체 검출 시스템(100)의 개략적인 블록도이다.

도 1을 참조하면, 객체 검출 시스템(100)은 객체 검출 장치(110), 저장부(120) 및 트레이닝 부(130)를 포함한다.

객체 검출 시스템(100)은 입력 영상으로부터 객체의 인스턴스들(instances)를 검출한다. 여기서, 인스턴스는 미리 정의된 객체들의 카테고리를 의미하며, 객체는 얼굴, 나무, 자동차 등의 카테고리를 포함한다. 입력 영상은 사진 이미지, 비디오 이미지, 컴퓨터로 생성된 이미지, 또는 다른 디지털 이미지들에 기초한 비트단위, 즉 픽셀들로 구성된 디지털 영상이다. 객체 검출 시스템(100)을 통해 출력된 출력 영상은 검출된 객체 인스턴스들을 나타내는 영상이다.

또한, 입력 영상은 소정 크기의 서브 윈도우로 분할되어 객체 검출 시스템(100)에 입력될 수 있다. 예를 들면 서브 윈도우는 24×24 픽셀의 크기로 입력 영상을 분할할 수 있다.

객체 검출 장치(110)는 입력 영상에서 소정의 객체 인스턴스를 검출하는데, 이러한 객체 검출 장치(110)는 소프트웨어 프로그램, 하드웨어, 펌웨어, 모듈 등으로 구성할 수 있다. 객체 검출 장치(110)는 본 발명의 바람직한 실시 예에 따라 멀티-스테이지 구조의 분류기를 이용하여 입력 영상에서 객체 인스턴스를 검출한다. 객체 검출 장치(110)의 구체적인 구성은 도 2를 참조하여 후술한다.

저장부(120)는 객체 검출 장치(110)와 연결된 데이터 저장 장치로서, 입력 영상, 처리 중인 영상, 출력 영상 등을 저장한다.

트레이닝 부(130)는 객체 검출 장치(110)에 포함된 각각의 스테이지의 분류기들을 트레이닝한다. 트레이닝 부(130)는 실제 검출 동작이 이루어지기 전에 분류기들을 트레이닝시키는데, 객체인지 아닌지를 보이는 네거티브 샘플들뿐만 아니라 공지의 객체 인스턴스들을 포함한 많은 영상들을 포함한 트레이닝 데이터 셋을 이용하여 분류기를 훈련한다.

도 2는 본 발명의 도 1에 도시된 객체 검출 장치(100)의 개략적인 블록도이다.

도 2를 참조하면, 객체 검출 장치(100)는 객체 분류부(200) 및 판단부(210)를 포함한다.

객체 분류부(200)는 멀티 스테이지 구조의 분류기들을 포함하며, 제i 스테이지의 분류기에서 입력 영상으로부터 추출한 특징들을 기초로 특징값을 계산하고, 계산한 특징값과 제i 스테이지의 제1 임계값을 비교한다. 여기서, 특징들은 입력 영상의 픽셀 단위로 계산하는 것을 피하여 계산속도를 높이기 위한 것으로, 객체 검출에 사용되는 공지의 특징들, 예를 들면 하(Haar) 특징, 가보 웨이브렛(gabor wavelet) 특징, 다양한 수의 직사각형(rectangular) 특징들을 사용할 수 있다.

또한, 제i 스테이지의 제1 임계값의 비교 결과에 따라 특징값과 제i 스테이지의 제2 임계값을 비교하고, 특징값과 제i 스테이지의 제2 임계값의 비교 결과에 따라 제i+2 스테이지의 분류기로 점프하도록 한다.

여기서, 제i 스테이지의 제1 임계값은 입력 영상을 네거티브 클래스로 분류하는 기준값, 즉 네거티브 임계값(T_i ⁿ)이며, 제2 임계값은 입력 영상의 특징값을 다음 스테이지, 즉 제i+1 스테이지의 분류기에서 계산하지 않도록 다다음 스테이지, 즉 제i+2 스테이지로 점프하도록 하는 기준값, 즉 점프 임계값(T_i ^j)이다.

본 발명의 일 실시 예에서, 객체 분류부(200)는 특징값이 제i 스테이지의 제1 임계값보다 작은 경우, 특징값에 상응하는 입력 영상을 비-객체로 분류한다. 그리고 특징값이 제i 스테이지의 네거티브 임계값보다 큰 경우, 특징값과 제i 스테이지의 점프 임계값을 비교하여 특징값이 제i 스테이지의 점프 임계값보다 큰 경우, 제i+2 스테이지의 분류기로 점프하고, 특징값이 제i 스테이지의 점프 임계값보다 작은 경우, 제i+1 스테이지의 분류기로 이동시킨다.

하지만, 반대의 경우, 예를 들면 특징값이 제i 스테이지의 네거티브 임계값보다 작은 경우, 특징값과 제i 스테이지의 점프 임계값을 비교하여 특징값이 제i 스테이지의 점프 임계값보다 작은 경우, 제i+2 스테이지의 분류기로 점프하고, 특 징값이 제i 스테이지의 점프 임계값보다 큰 경우, 제i+1 스테이지의 분류기로 이동시키는 것도 당업자에게는 자명하다.

판단부(210)는 객체 분류부의 분류 결과를 기초로 입력 영상에서 소정의 객체가 존재하는지를 판단한다. 즉, 입력 영상 또는 입력 영상의 서브 윈도우의 특징값을 기초로 각각의 스테이지들에서 분류된 객체 또는 비-객체 결과에 따라 입력 영상에서 최종 객체가 존재하는지는 판단한다.

도 3A 내지 3C는 본 발명의 다른 실시 예에 따른 멀티 임계값과 멀티-스테이지 구조의 분류기를 이용한 객체 검출을 설명하기 위한 도면이다.

도 3A는 본 발명의 바람직한 실시 예에 따른 멀티 임계값 및 멀티 스테이지 구조의 분류기를 나타낸다.

도 3A를 참조하면, i 스테이지부터 i+5 스테이지의 분류기들(201 내지 206)이 도시되어 있으며, 각각의 스테이지마다 2개의 임계값, 네거티브 임계값과 점프 임계값이 존재한다. 여기서, F는 현재 스테이지의 분류기에 입력된 입력 영상 또는 서브 윈도우가 네거티브 임계값과 비교한 결과 비-객체로 분류된 것을 의미하며, T는 마지막 스테이지에서 입력 영상 또는 서브 윈도우가 객체로 분류된 것을 의미한다.

도 3B를 참조하면, 입력 영상을 분할한 서브 윈도우가 i스테이지의 분류기(201)에 입력되면, 서브 윈도우로부터 추출한 특징을 이용하여 특징값을 계산하고, 특징값이 네거티브 임계값(T_i ⁿ)보다 작은 입력은 비-객체로 분류한다(301). 또 한, 현재 스테이지, 즉 i 스테이지에서 비-객체로 분류되지 못하는 입력들 중에서 다음번 스테이지, 즉 i+1 스테이지에서도 비-객체로 분류되지 못하는 입력들은 i+2 스테이지로 바로 점프한다(303). 즉, 입력 영상의 특징값이 점프 임계값(T_i ^j)보다 큰 입력은 다다음 스테이지, 즉 i+2 스테이지의 분류기(203)로 점프시킨다. 결과적으로 다음 스테이지, i+1 스테이지에서는 302 영역만을 계산하므로, i+1 스테이지에서의 계산량을 줄일 수 있다.

도 3C를 참조하면, i 스테이지와 i+1 스테이지의 네거티브 샘플과 포지티브 샘플들의 스테이지 분류기 출력이 각각 도시되어 있다. i 스테이지에서 네거티브 임계값(T_i ⁿ)보다 작은 영역(301)에는 네거티브 샘플들만이 분포하고 있다. 즉, 분류기에 입력된 서브 윈도우의 특징값이 비-객체일 확률이 높은 것이므로 이 영역은 비-객체로 분류된다. 또한, i 스테이지에서 점프 임계값(T_i ^j)보다 큰 영역(303)은 i+1 스테이지에서도 비-객체로 분류되지 못하는 영역이므로, 이는 i+1 스테이지에서 계산을 수행하지 않고 다다음 스테이지, 즉 i+2 스테이지로 점프시킨다. 이러한 점프 임계값(T_i ^j)은 도 3C에 도시된 바와 같이, i+1 스테이지의 네거티브 임계값(T_i ₊₁ ⁿ)으로부터 결정한다.

i 스테이지의 점프 임계값(T_i ^j)은 i+1 스테이지에서 생성된 학습DB로부터 백 워드 학습을 통해서 결정한다. 즉, i+1 스테이지에서 비-객체로 분류된 네거티브 샘플들을 수집한다. 이는 다음 수학식 1과 같이, i+1 스테이지의 네거티브 임계값(T_i ₊₁ ⁿ)보다 작은 i+1 스테이지의 분류기 출력들, h_i ₊₁(x)에 해당하는 샘플들을 수집한다. 그리고 다음 수학식 2와 같이, 수집한 샘플들을 i 스테이지의 분류기에 입력하고, 분류기 출력의 최대값을 점프 임계값으로 결정한다.

또한, 점프 임계값을 결정할 때, 네거티브 샘플 셋들의 아웃라이어(outlier)들이 롱 테일로 인하여 임계값이 너무 커질 우려가 있으므로, 전체 분포의 상위 몇% 정도의 아웃라이어를 제외하고 결정할 수 있다. 본 발명의 일 실시 예인 도 3C에 도시된 점프 임계값은 네거티브 샘플 셋의 상위1-3% 정도의 아웃라이어를 제외하고 결정한다.

여기서, N_i ₊₁ 는 i+1 스테이지의 네거티브 샘플 셋이고, h_i 는 i 스테이지의 분류기이고, T_i ⁿ 은 i 스테이지의 네거티브 임계값이고, T_i ^j 는 i 스테이지의 점프 임계값이다.

여기서, 네거티브 임계값(T_i ⁿ)은 종래의 아다부스트(Adaboost) 학습 방법을 통해 결정할 수 있으며, 이는 Viola 등이 개시한 "Rapid Object Detection using a Boosted Cascade of Simple Features" 및 미국 특허 7,099,510호에 참조하면 알 수 있다.

따라서, 도 3C에 도시된 303 영역에 대해 i+1 스테이지에서의 계산이 필요 없으므로 객체 검출 속도를 향상시킬 수 있다.

도 4A 내지 4C는 본 발명의 또 다른 실시 예에 따른 멀티 임계값과 멀티-스테이지 구조의 분류기를 이용한 객체 검출을 설명하기 위한 도면이다.

도 4A는 본 발명의 바람직한 실시 예에 따른 멀티 임계값 및 멀티 스테이지 구조의 분류기를 나타낸다.

도 4A를 참조하면, i 스테이지부터 i+5 스테이지의 분류기들(201 내지 206)이 도시되어 있으며, 각각의 스테이지마다 3개의 임계값, 네거티브 임계값, 포지티브 임계값과 점프 임계값이 존재한다. 여기서, F는 현재 스테이지의 분류기에 입력된 입력 영상 또는 서브 윈도우가 네거티브 임계값과 비교한 결과 비-객체로 분류된 것을 의미하며, T는 현재 스테이지의 분류기에 입력된 입력 영상 또는 서브 윈도우가 포지티브 임계값(T_i ^p)과 비교한 결과 객체로 분류된 것을 의미한다.

도 4B를 참조하면, 입력 영상을 분할한 서브 윈도우가 i스테이지의 분류기(201)에 입력되면, 서브 윈도우로부터 추출한 특징을 이용하여 특징값을 계산하고, 특징값이 네거티브 임계값(T_i ⁿ)보다 작은 입력은 비-객체로 분류한다(401). 그리고 특징값이 포지티브 임계값(T_i ^p)보다 큰 입력들은 객체로 분류한다(404). 또한, 현재 스테이지, 즉 i 스테이지에서 비-객체로 분류되지 못하는 입력들 중에서 다음번 스테이지, 즉 i+1 스테이지에서도 비-객체로 분류되지 못하는 입력들은 i+2 스테이지로 바로 점프한다(403). 즉, 입력 영상의 특징값이 점프 임계값(T_i ^j)보다 큰 입력은 다다음 스테이지, 즉 i+2 스테이지의 분류기(203)로 점프시킨다. 결과적으로, 다음번 스테이지, 즉 i+1 스테이지에서는 402 영역에 대해서만 계산을 수행한다.

도 4C를 참조하면, i 스테이지와 i+1 스테이지의 네거티브 샘플과 포지티브 샘플들의 스테이지 분류기 출력이 각각 도시되어 있다. i 스테이지에서 네거티브 임계값(T_i ⁿ)보다 작은 영역(401)에는 네거티브 샘플들만이 분포하고 있다. 즉, 분류기에 입력된 서브 윈도우의 특징값이 비-객체일 확률이 높은 것이므로 이 영역은 비-객체로 분류된다. 또한, 특징값이 포지티브 임계값(T_i ^p)보다 큰 영역(404)에는 포지티브 샘플만이 분포하고 있다. 즉, 분류기에 입력된 서브 윈도우의 특징값이 객체일 확률이 높은 것이므로 이 영역은 객체로 분류된다. 또한, i 스테이지에서 점프 임계값(T_i ^j)보다 큰 영역(303)은 i+1 스테이지에서도 비-객체로 분류되지 못하는 영역이므로, 이는 i+1 스테이지에서 계산을 수행하지 않고 다다음 스테이지, 즉 i+2 스테이지로 점프시킨다. 이러한 점프 임계값(T_i ^j)은 도 3C를 참조하여 설명한 바와 같다.

여기서, 포지티브 임계값(T_i ^p)는 i 스테이지의 학습 DB로부터 결정하는 포워드 학습방법을 이용한다. 즉, 다음 수학식 3과 같이, 학습한 네거티브 샘플 셋를 i 스테이지의 분류기에 입력하여, 그 최대값을 포지티브 임계값으로 결정한다.

여기서, N_i 는 i 스테이지의 네거티브 샘플 셋이고, h_i 는 i 스테이지의 분류기이고, T_i ^p 는 i 스테이지의 포지티브 임계값이다.

다시 도 4C를 참조하면, 403 영역에서 대해서는 i+1 스테이지에서의 계산이 필요 없으며, 404 영역에 대해서는 이후 스테이지. 즉 i+1 내지 i+5 스테이지에서 계산이 필요 없으므로 객체 검출 속도를 향상시킬 수 있다.

도 5는 도 3A 내지 3C에 따른 멀티 스테이지 구조의 분류기를 이용한 객체 검출 방법을 설명하기 위한 흐름도이다.

도 5를 참조하면, 단계 500에서, 현재 스테이지, 즉 i 스테이지의 분류기로 특징을 추출한다. 단계 502에서, 추출한 특징을 이용하여 특징값을 계산하고, 특징값과 네거티브 임계값을 비교한다. 즉 특징값이 네거티브 임계값보다 작은 경우에는 특징값에 상응하는 입력 영상을 네거티브 클래스로 분류하고, 특징값이 네거티브 임계값보다 큰 경우에는 단계 504로 진행한다.

단계 504에서, 특징값과 점프 임계값을 비교한다. 즉, 특징값이 점프 임계값보다 큰 경우에는 단계 506으로 진행하여, i+2 스테이지로 점프한다. 단계 504에서, 특징값이 점프 임계값보다 작은 경우에는, 단계 508로 진행하여 i+1 스테이지로 이동한다.

단계 510에서, 현재 점프하거나 이동한 스테이지가 마지막 스테이지인지 확인한다. 마지막 스테이지인 경우에는 특징값에 상응하는 입력 영상을 포지티브 클래스로 분류한다. 마지막 스테이지가 아닌 경우에는 다시 i+1 또는 i+2 스테이지에서의 분류 동작을 수행한다.

도 6은 도 4A 내지 4C에 따른 멀티 스테이지 구조의 분류기를 이용한 객체 검출 방법을 설명하기 위한 흐름도이다.

도 6을 참조하면, 단계 600에서, 현재 스테이지, 즉 i 스테이지의 분류기로 특징을 추출한다. 단계 602에서, 추출한 특징을 이용하여 특징값을 계산하고, 특징값과 네거티브 임계값을 비교한다. 즉 특징값이 네거티브 임계값보다 작은 경우 에는 특징값에 상응하는 입력 영상을 네거티브 클래스로 분류하고, 특징값이 네거티브 임계값보다 큰 경우에는 단계 604로 진행한다.

단계 604에서, 특징값과 포지티브 임계값을 비교한다. 즉, 특징값이 포지티브 임계값보다 큰 경우에는 특징값에 상응하는 입력 영상을 포지티브 클래스로 분류한다. 하지만, 특징값이 포지티브 임계값보다 작은 경우에는 단계 606으로 진행한다.

단계 606에서, 특징값과 점프 임계값을 비교한다. 즉, 특징값이 점프 임계값보다 큰 경우에는 단계 608로 진행하여, i+2 스테이지로 점프한다. 단계 606에서, 특징값이 점프 임계값보다 작은 경우에는, 단계 610으로 진행하여 i+1 스테이지로 이동한다.

단계 612에서, 현재 점프하거나 이동한 스테이지가 마지막 스테이지인지 확인한다. 마지막 스테이지인 경우에는 특징값에 상응하는 입력 영상을 포지티브 클래스로 분류한다. 마지막 스테이지가 아닌 경우에는 다시 i+1 또는 i+2 스테이지에서의 분류 동작을 수행한다.

한편, 본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.

컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인 터넷을 통한 전송)의 형태로 구현하는 것을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술 분야의 프로그래머들에 의하여 용이하게 추론될 수 있다.

이제까지 본 발명에 대하여 바람직한 실시 예를 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 본 발명을 구현할 수 있음을 이해할 것이다. 그러므로 상기 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 한다.

<도면의 주요 부분에 대한 부호의 설명>

100: 객체 검출 시스템 110: 객체 검출 장치

120: 저장부 130: 트레이닝 부

200: 객체 분류부 210: 판단부

201, 202, 203, 204, 205 및 206: 분류기

Claims

멀티-스테이지의 분류기를 이용하여 입력 영상에서 소정의 객체를 검출하는 방법에 있어서,

(a) 제i(i는 양의 정수) 스테이지의 분류기에서 상기 입력 영상으로부터 추출한 특징들을 기초로 특징값을 계산하고, 상기 계산한 특징값과 제i 스테이지의 제1 임계값을 비교하는 단계;

(b) 상기 특징값과 제i 스테이지의 제1 임계값의 비교 결과에 따라 상기 특징값과 상기 제i 스테이지의 제2 임계값을 비교하는 단계; 및

(c) 상기 특징값과 상기 제i 스테이지의 제2 임계값의 비교 결과에 따라 제i+2 스테이지의 분류기로 점프하는 단계를 포함하는 객체 검출 방법.
제 1 항에 있어서,

상기 (b) 단계는,

상기 특징값이 상기 제i 스테이지의 제1 임계값보다 작은 경우, 상기 특징값에 상응하는 입력 영상을 비-객체로 분류하고, 상기 특징값이 상기 제i 스테이지의 제1 임계값보다 큰 경우, 상기 특징값과 상기 제i 스테이지의 제2 임계값을 비교하는 것을 특징으로 하는 객체 검출 방법.
제 1 항에 있어서,

상기 (c) 단계는,

상기 특징값이 상기 제i 스테이지의 제2 임계값보다 큰 경우, 제i+2 스테이지의 분류기로 점프하고, 상기 특징값이 상기 제i 스테이지의 제2 임계값보다 작은 경우, 제i+1 스테이지의 분류기로 이동하는 것을 특징으로 하는 객체 검출 방법.
제 1 항에 있어서,

상기 (c) 단계 다음에,

상기 제i+2 스테이지의 분류기에서 상기 입력 영상으로부터 추출한 특징을 기초로 특징값을 계산하고, 상기 계산한 특징값과 상기 제i+2 스테이지의 제1 임계값을 비교하는 단계를 더 포함하고,

상기 특징값이 상기 제i+2 스테이지의 제1 임계값보다 작은 경우, 상기 입력 영상을 비-객체로 분류하는 것을 특징으로 하는 객체 검출 방법.
제 1 항에 있어서,

상기 (b) 단계는,

상기 특징값과 상기 제i 스테이지의 제3 임계값과 비교하는 단계를 더 포함하고,

상기 특징값이 상기 제i 스테이지의 제3 임계값보다 큰 경우, 상기 특징값에 상응하는 입력 영상을 객체로 분류하는 것을 특징으로 하는 객체 검출 방법.
제 1 항에 있어서,

상기 제i 스테이지의 제2 임계값은,

제i+1 스테이지에서 비-객체로 분류된 네거티브 샘플들이 상기 제i 스테이지의 분류기를 통해 출력된 최대값으로부터 결정되는 것을 특징으로 하는 객체 검출 방법.
제 5 항에 있어서,

상기 제i 스테이지의 제3 임계값은,

상기 제i 스테이지에서 비-객체로 분류된 네거티브 샘플들이 상기 제i 스테이지의 분류기를 통해 출력된 최대값으로부터 결정되는 것을 특징으로 하는 객체 검출 방법.
제 1 항에 있어서,

상기 입력 영상은 소정 크기의 서브 윈도우로 분할되어 상기 제i 스테이지의 분류기에 입력되는 것을 특징으로 하는 객체 검출 방법.
제 1 항에 있어서,

상기 객체는 얼굴인 것을 특징으로 하는 객체 검출 방법.
제 1 항에 있어서,

현재 스테이지가 마지막 스테이지인지 확인하는 단계를 더 포함하고,

상기 확인 결과, 현재 스테이지가 마지막 스테이지인 경우 상기 특징값에 상응하는 입력 영상을 객체로 분류하는 것을 특징으로 하는 객체 검출 방법.
제 1 항 내지 제 10 항 중 어느 한 항에 따른 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체.
멀티-스테이지의 분류기를 이용하여 입력 영상에서 소정의 객체를 검출하는 장치에 있어서,

제i(i은 양의 정수) 스테이지의 분류기에서 상기 입력 영상으로부터 추출한 특징들을 기초로 특징값을 계산하고, 상기 계산한 특징값과 제i 스테이지의 제1 임계값을 비교하고, 상기 특징값과 제i 스테이지의 제1 임계값의 비교 결과에 따라 상기 특징값과 상기 제i 스테이지의 제2 임계값을 비교하고, 상기 특징값과 상기 제i 스테이지의 제2 임계값의 비교 결과에 따라 제i+2 스테이지의 분류기로 점프하는 멀티-스테이지의 분류기를 포함한 객체 분류부; 및

상기 객체 분류부의 분류 결과를 기초로 상기 입력 영상에서 소정의 객체가 존재하는지를 판단하는 판단부를 포함하는 객체 검출 장치.
제 12 항에 있어서,

상기 객체 분류부는,

상기 특징값이 상기 제i 스테이지의 제1 임계값보다 작은 경우, 상기 특징값에 상응하는 입력 영상을 비-객체로 분류하고, 상기 특징값이 상기 제i 스테이지의 제1 임계값보다 큰 경우, 상기 특징값과 상기 제i 스테이지의 제2 임계값을 비교하는 것을 특징으로 하는 객체 검출 장치.
제 12 항에 있어서,

상기 객체 분류부는,

상기 특징값이 상기 제i 스테이지의 제2 임계값보다 큰 경우, 제i+2 스테이지의 분류기로 점프하고, 상기 특징값이 상기 제i 스테이지의 제2 임계값보다 작은 경우, 제i+1 스테이지의 분류기로 이동하는 것을 특징으로 하는 객체 검출 장치.
제 12 항에 있어서,

상기 제i 스테이지의 제2 임계값은,

제i+1 스테이지에서 비-객체로 분류된 네거티브 샘플들이 상기 제i 스테이지의 분류기를 통해 출력된 최대값으로부터 결정되는 것을 특징으로 하는 객체 검출 장치.