KR101048582B1

KR101048582B1 - 칼라 이미지에서 얼굴들을 검출하기 위한 방법 및 디바이스

Info

Publication number: KR101048582B1
Application number: KR1020040053147A
Authority: KR
Inventors: 쉬뽀베르뜨랑; 또뤼벵쌍; 스또데쥐르쟝; 오아젤리오넬
Original assignee: 톰슨 라이센싱
Priority date: 2003-07-08
Filing date: 2004-07-08
Publication date: 2011-07-12
Also published as: EP1496465A1; CN1577380A; FR2857481A1; JP2005032250A; KR20050006089A; US7551756B2; JP4658532B2; CN100409248C; US20050041868A1

Abstract

본 발명은 이미지에서 살색의 픽셀들을 검출하는 디바이스 및 프로세스에 관한 것이다. 상기 프로세스는,

- 상기 이미지를 동질 색의 영역들(R_i)로 세그먼트화하는 단계,

- 상기 동질 색의 영역들(R_i) 중에서, 제1 소정 임계치보다 큰 다수의 살색의 픽셀들(flesh coloured pixels)을 포함하는 영역들을 선택하는 단계 - 상기 선택된 영역들은 살색의 영역들이라 칭해짐 - ,

- 병합 비용이 제2 소정 임계치에 달할 때까지 이웃하는 살색의 영역들(Ri)을 병합하는 단계 - 상기 병합 비용은 상기 영역들(R_i)의 형상에 관한 병합 비용과 상기 영역들(R_i)의 색에 관한 병합 비용을 가중함 - ,

- 거짓 긍정들(false positives)을 제외하는 단계

를 포함한다.

이미지, 병합 비용, 거짓 긍정들, 형상

Description

칼라 이미지에서 얼굴들을 검출하기 위한 방법 및 디바이스{PROCESS AND DEVICE FOR DETECTING FACES IN A COLOUR IMAGE}

도 1은 평면(Cb, Cr)에서의 살색 확률 법칙(flesh colour probability law)을 나타낸 도면.

도 2는 영역과 동일한 무게 중심을 갖는 타원들을 나타낸 도면.

도 3은 후보자로서 검출된 후보 타원을 둘러싸는 사각형의 웨이블렛 변환을 나타낸 도면.

도 4는 이미지의 계층적 분해에 의해 얻어지는 12개의 상세한 이미지들을 나타낸 도면.

〈도면의 주요 부분에 대한 부호의 설명〉

R_i : 영역

E_i : 타원

본 발명은 이미지에서 얼굴들을 검출하기 위한 디바이스 및 방법에 관한 것 이다.

얼굴 검출은 전송의 품질을 향상시키기 위해 많은 비디오 어플리케이션들에서, 그리고 특히 이미지 인덱싱 시스템들과 화상 전화기 시스템들에서 발생하는 문제점이다.

또한, 얼굴들의 검출은 그들의 자동 인식에 대한 준비이다. 얼굴들의 검출은 최근 수년에 걸쳐 크게 발전하였고, 검출은 기대 이상으로 되고 있다.

- 멀티미디어 컨텍스트에서는, 예를 들어 이러이러한 사람이 나타나는 모든 사진들을 찾는 것을 가능하게 함으로써, 얼굴들의 검출과 인식을 결합하는 기술이 개인적인 사진들의 기초에 관한 철저한 조사를 허용한다.

-이러한 기술은 또한 민감한 기준에 기초하여 영상들을 자동적으로 보관하기 위해 영화 또는 텔레비전 회사에 매우 유용할 것이다.

보다 간단히, 얼굴들을 검출하는 알고리즘은 개인적인 사진들을 여러 카테고리들: 얼굴 없음, 하나의 얼굴 있음, 소수의 얼굴 있음으로 분류하는 것을 가능하게 한다.

얼굴들의 검출에 대한 문제점에 대해서 2가지 형태의 접근법: 모델 기반 접근법들(model based approachs) 및 외형 기반 접근법들(appearance based approaches)이 존재한다.

모델 접근법들은 실루엣, 색, 빛의 변화, 텍스쳐 등의 관점에서 찾은 오브젝트를 간단한 방식으로 정의하고자 한다. 이러한 방법들의 문제점은 규칙들의 관점에서 오브젝트를 정의하기 어렵다는 것이다. 채택된 규칙들이 너무 엄격하면, 표 준에서 단지 약간 벗어난 오브젝트들은 검출되지 않는다. 반대로, 규칙들이 너무 막연하면, 시스템은 많은 원치 않는 오브젝트들을 검출한다.

그러나, 외형 접근법들은 신경 회로망들과 같은 비파라미터적 판정 방식들(nonparametric decision method)(분류자들)에 의존한다. 검출될 오브젝트들을 정의하는 규칙들은 명확히 정해지지 않고, 학습 세트를 통해 학습된다. 이미지, 기술자(평균색, 픽셀들의 색, 웨이블렛 변환 등)에 대해 측정이 행해진다. 그리고 분류자는 검출될 오브젝트가 무엇인지를 정의하도록 학습 세트의 기술자들을 가중한다. 그러면 규칙들은 기술자들에 대한 통계적인 평균들이 된다.

이러한 해결책의 원리는 입력 이미지를 작은 부분들로 분할하고 이들 각 부분들을 이러이러한 하나의 부분이 얼굴인지를 결정하는 분류자에게 보내는 것이다. 문제는 상기 부분들이 가져야하는 사이즈를 결정하는 것이다. 신분증 사진 형태의 이미지에서 또는 그룹 사진에서, 얼굴들은 완전하게 동일한 사이즈를 갖지 않는다. 그러면 매 입력 이미지에 대해 다중 해상도 분할을 행할 필요가 있고, 즉 이미지에 대한 각 4분할, 8분할 등이 분류자에게 제공될 것이다. 이러한 시스템들은 계산 시간의 관점에서 이러한 것을 갈망한다.

본 발명은 매우 유연한 모델을 사용하여 다중 해상도 분할을 불필요하게 할 수 있는 비파라메트릭 판정 시스템에 축소된 후보자 세트를 제공하는 단계를 포함하는 간단한 방법을 제안한다.

이를 위해, 본 발명은 이미지에서 얼굴들을 검출하는 프로세스를 제안하며, 상기 이미지는 복수의 픽셀들로 이루어진다.

본 발명에 따르면, 프로세스는

- 이미지에서 살색의 픽셀들을 검출하는 단계,

- 이미지를 동질 색의 영역들로 세그먼트화하는 단계,

- 동질 색의 영역들 중에서, 제1 소정 임계치보다 큰 다수의 살색의 픽셀들을 포함하는 영역들을 선택하는 단계 - 상기 선택된 영역들은 살색의 영역들이라 칭해짐 - ,

병합 비용이 제2 소정 임계치에 달할 때까지 이웃하는 살색의 영역들을 병합하는 단계 - 병합 비용은 영역들의 형상에 관한 병합 비용과 영역들의 색에 관한 병합 비용을 선형으로 가중함 - ,

- 거짓 긍정들을 제외하는 단계를 포함한다.

살색의 픽셀들의 검출 단계의 종료시 얻어지는 확률맵에 대해서가 아니라 입력 이미지에 대해 이미지의 세그먼트화를 수행함으로써, 제한 내에서 보다 양호한 정확도가 가능하게 될 수 있다.

또한, 영역들의 형상 및 색 모두에 기초한 병합 비용의 계산은 얼굴들과 같은 잠재적인 후보자들인 영역들에 대하여 빠르고 효과적인 접근을 가능하게 한다.

바람직한 실시예에 따르면, 병합 단계는

- 이웃하는 영역들 사이의 평균색차를 계산함으로써 영역들의 색에 관한 병합 비용을 계산하는 단계, 및

- 영역의 면적과, 상기 영역과 동일한 무게 중심을 갖고 그것을 최적으로 오버랩하는 타원 면적 사이의 오버랩,

- 타원의 픽셀들의 수에 대한 타원의 외부 영역의 픽셀들의 수 및 영역 외부의 타원의 픽셀들의 수의 합의 비율을 계산하는 것에 의한 각 영역의 타원 성질(elliptic nature),

- 2개의 인접하는 영역들의 타원 성질에 대한 측정값들중 최대값과 병합된 영역의 타원 성질에 대한 측정값 사이의 차

를 계산함으로써 형상에 관한 병합 비용을 계산하는 단계를 포함한다.

바람직하게는, 살색의 픽셀들의 검출 단계는 채도 평면에서 2차원 가우스 확률 법칙의 형태로 얼굴색 모델을 정의하는 단계를 포함한다.

바람직한 실시예에 따르면, 거짓 긍정들을 제외하는 단계는 얼굴의 특정 속성들과 병합된 영역들의 속성들을 비교하는 단계 및 속성들이 얼굴의 속성들과 매우 상이한 영역들을 제외하는 단계를 포함한다.

바람직한 실시예에 따르면, 속성들은

- 영역의 사이즈,

- 영역의 형상,

- 평균색,

- 주축에 따른 휘도의 변화

및 이 속성들의 임의의 조합 중에서 선택된다.

바람직한 실시예에 따르면, 거짓 긍정들을 제외하는 단계는

- 병합된 영역들에 대하여 적어도 하나의 시각적 기술자(descriptor)를 계산하는 단계,

- 얼굴을 포함하는 예시적인 이미지들과 어떤 얼굴도 포함하지 않는 예시적인 이미지들 사이에서 기술자들의 공간의 최적 하이퍼평면(hyperplane)을 결정하는 단계,

- 기술자가 하이퍼평면의 정확한 측면에 존재하지 않는 영역들을 제외하는 단계

를 포함한다.

유리하게는, 기술자는 병합된 타원을 둘러싸는 최소 사각형의 웨이블렛 변환을 수행하고 이미지의 계층적 분해에 의해 얻어진 12개의 상세한 이미지들의 웨이블렛 계수들의 변화를 기술자들에게 할당함으로써 산출된다.

본 발명은 또한 이미지에서 얼굴들을 검출하는 디바이스에 관한 것으로, 이미지는 복수의 픽셀들로 이루어진다. 본 발명에 따르면, 디바이스는

- 이미지에서 살색의 픽셀들을 검출하는 수단,

- 이미지를 동질 색의 영역들로 세그먼트화하는 수단,

- 동질 색의 영역들 중에서, 제1 소정 임계치보다 큰 다수의 살색의 픽셀들을 포함하는 영역들을 선택하는 수단 - 상기 선택된 영역들은 살색의 영역들이라 칭해짐 - ,

병합 비용이 제2 소정 임계치에 달할 때까지 이웃하는 살색의 영역들을 병합하는 수단 - 병합 비용은 영역들의 형상에 관한 병합 비용과 영역들의 색에 관한 병합 비용을 가중함 - ,

- 거짓 긍정들을 제외하는 수단을 포함한다.

본 발명은 또한 프로그램이 컴퓨터에서 실행되는 경우, 본 발명에 따라 얼굴들을 검출하는 프로세스의 단계들을 실행하기 위한 프로그램 코드 명령어들을 포함하는 컴퓨터 프로그램 제품에 관한 것이다.

본 발명은 첨부된 도면을 참조하여, 전혀 제한되지 않는 유리한 예시적인 실시예들 및 구현 모드들에 의해 보다 잘 이해되고 설명될 것이다.

도 1은 평면(Cb, Cr)에서의 살색 확률 법칙을 나타낸다.

프로세스는 이미지에서의 살색의 픽셀들의 검출 단계를 포함한다.

사용된 색 공간은 청색(Cb)과 적색(Cr)을 기술하는 2가지 성분들로부터 휘도 성분 Y를 분리하는 공간(Y,Cb,Cr)이다.

인종이 무엇이든, 사람의 피부색은 채도 평면의 정확한 부분에 존재한다.

피부색의 모델을 구성하는 여러 가지 방법들이 제안될 수 있다.

바람직한 실시예에서는, 채도 평면(chrominance plane) 중 특정 평면에 피부색이 존재한다는 가정에 따라, 도 1에 따른 채도 평면(Cb,Cr)에서 2차원 가우스 확률 법칙의 형태로 피부색 모델을 정의한다. 이 가우스 확률 법칙의 파라미터들은 트레이닝에 의해 결정된다.

다른 실시예에서는, 비파라메트릭 접근법들에 기초할 수 있다. 색 히스토그램 h(r,g) - r은 적색을 나타내고, g는 녹색을 나타냄 - 가 예시적인 얼굴들에 기초하여 실험적으로 선택된 임계값보다 큰 경우에 살색을 갖는 것으로서 픽셀이 분류된다.

살색의 픽셀들이 식별되면, 이미지는 픽셀들 보다는 동질의 색의 영역들을 식별하도록 영역들로 세그먼트화된다.

다수의 세그먼트화 프로세스가 적용될 수 있다.

세그먼트화는 살색의 픽셀들의 검출 단계의 종료시에 얻어지는 확률맵에 대해서가 아니라 입력 이미지에 대해서 수행된다. 이에 의해 특히 경계들에서 보다 양호한 정확도를 얻을 수 있다.

세그먼트화는 본 기술 분야의 당업자들에게 공지된 방법들을 사용하여, 색 동질성의 기준에 관해서 픽셀들을 클러스터링(clustering)함으로써 또는 윤곽 검출에 의해 수행될 수 있다.

따라서, 제1 단계는 살색의 픽셀들을 결정하고, 가능하다면 제1 단계와 병행하여 수행될 수 있는 제2 단계는 동질 색들의 영역들로 입력 이미지를 세그먼트화한다.

그 후, 이들 2가지 단계들을 완료하면, 그 픽셀들의 특정 퍼센티지(예를 들어 절반 이상)의 영역들은 살색이고, "살색의 영역들"이라 칭해지며, 얼굴들에 대한 나머지 조사가 행해진다.

영역들이 살색이라고 검출된 경우, 이들 영역들의 형상을 고려하는 것이 바람직하다.

출발 가정은 얼굴의 형상이 타원형이라는 것이다.

다음 단계는 타원형의 매크로(macro) 살색의 영역들을 용이하게 병합하는 단계를 포함한다.

바람직하게는, 이 단계는 영역들 RSST(recursive shortest spanning tree)의 병합 프로세스를 적용하는 것을 포함한다. IEEE 트랜잭션 CSVT, 볼륨 10, 2000 문서에 공개된 어텀 턴셀 및 레번트 오누탈(Ertem Tuncel and Levert Onutal)의 "utilization of the recursive shortest spanning tree algorithm for video-object segmentation by 2-D affine motion modeling" 문헌은 이와 같은 병합 프로세서를 도시한다.

인접하는 영역들 사이의 링크들의 리스트는 증가하는 병합 비용에 의해 갱신 및 소팅(sorting)된다. 병합 비용이 최저인 2개의 영역들은 소정의 최대 병합 비용이 달성될 때까지 반복적으로 병합된다.

병합은 색과 형상 정보를 고려한다.

색에 관한 병합 비용 C_colour과 형상에 관한 병합 비용 C_shape을 선형으로 가중화하는 비용 함수 C는 다음과 같다:

형상에 주어진 웨이트 α_f는 예를 들어 색에 주어진 웨이트 α_c의 2배이다.

색에 대해서 계산된 병합 비용은 병합 가능한 영역들 사이의 평균 색차를 계산함으로써 얻어진다. 이에 의해 병합된 영역은 색의 동질성을 갖게 된다.

이하의 식에서,

및

은 2개의 인접하고 따라서 병합 가능한 영역들 R1 및 R2의 공간 YCbCr에서 평균색의 벡터들이다. 색 성분들이 0과 255 사이에서 부호화되는 경우, 분모는 비용을 0과 1 사이의 값들로 표준화하 는 것이다.

형상에 관한 병합 비용을 정의하기 위해, 우선 영역들에 대해 타원 성질의 측정값을 정의한다.

이를 위해, 도 2에 도시된 바와 같이, 영역과 동일한 무게 중심을 갖는 타원의 특성을 결정한다. 이러한 타원은 적어도 영역의 표면과 동일한 면적을 갖고 그것을 최적으로 오버랩한다. 본 기술 분야의 당업자들에게 공지되어 있는 소위 "모멘트법(method of moments)"는, 예를 들어 이러한 타원을 결정하기 위해 사용될 수 있다.

각 영역 R_i와 타원 E_i가 관련된다.

따라서 영역과 그 관련 타원의 상호 오버랩을 측정함으로써 영역 R_i의 타원 성질 E_ri를 결정한다: 영역 외부에 있는 타원 내부의 모든 점들뿐만 아니라 타원 외부 영역의 모든 점들이 카운트되고 타원의 면적에 의해 그 합이 표준화되며, 이 값이 클수록, 영역이 덜 타원적이다.

2개의 인접하는 영역들 R₁ 및 R₂의 형상에 관한 병합 비용은 2개의 병합 가능한 영역들 E_r1 및 E_r2의 타원 성질의 측정값들 중 최소값과 병합된 영역 R1∪R2의 타원 성질의 측정값 사이의 차이다. 이 비용은 병합된 영역이 그 부분들보다 더 타원적인 경우에 더 작다. 형상에 관한 병합 비용은 예를 들어 이하의 식에 의해 주어질 수 있다.

이 단계를 완료하면, 얼굴들이 되는 후보자들인 타원 형상의 살색 영역들이 임의개 존재한다.

이 영역들 중에서, 일부는 얼굴들이 아니고 "거짓 긍정들"이라 칭해진다. 따라서 이 영역들을 제외하는 것이 중요하다.

거짓 긍정들을 제외하는 여러 가지 방법들이 존재한다.

2가지의 방법들, 파라메트릭 접근법에 기초한 방법 및 분류자의 트레이닝에 기초한 방법이 설명된다.

파라메트릭 접근법

타원 형상의 살색의 병합된 영역들에 대한 다양한 속성들이 측정된다.

이들 속성들은 얼굴들에 대해 공통이다.

예를 들면 다음과 같다:

- 형상은 너무 크거나 너무 작아도 안되고, 너무 확장되어도 안된다,

- 주축은 수직축으로부터 아주 멀지 않다,

- 평균색은 살색이다,

- 주축에 따른 채도의 변화는 매우 크지 않다.

이외의 실시예들에서는, 다른 파라미터들이 고려될 수 있다.

트레이닝 기반 접근법

이에 대한 대안으로, 후보자 타원들 각각에 대해 시각적 기술자들을 산출한다.

관리되는 분류자에 의해 얼굴들을 얼굴이 아닌 부분(non-faces)과 구별할 수 있다.

바람직한 실시예에서는, "SVM(support vector machine)"형의 분류자가 사용된다.

분류자는, 예들과 반대 예들의 기초가 제공되는 트레이닝 상태(training phase)의 중간에, 얼굴들과 얼굴이 아닌 부분들 사이에서, 기술자들의 공간의 최적 하이퍼평면을 결정한다. 이 트레이닝 상태는 오프 라인으로 수행된다. 이 트레이닝 상태가 수행되면, 분류자는 상술된 검출 상태로부터 생성되는 후보자가 얼굴인지 얼굴이 아닌지를 실시간으로 결정할 수 있다.

다른 실시예들에서는, k-평균형(k-means type)의 분류자들 또는 신경 회로망들이 사용될 수 있다

여러가지의 기술자들이 사용될 수 있다.

바람직한 실시예에서는, 도 3에 도시된 바와 같은 후보자로서 전술한 단계에서 검출된 후보 타원을 둘러싸는 사각형의 웨이블렛 변환(또는 하위 대역 변환)으로부터, 사용되는 기술자들이 생성된다.

기술자는 도 4에 도시된 바와 같이 이미지의 계층적 분해에 의해 얻어지는 12개의 상세한 이미지들에서의 웨이블렛 계수들의 변화로부터 생성되며, 12개의 상세한 이미지들은 사선으로 표시된 영역을 제외하고 나타낸 상세한 이미지들이다.

이미지들을 하위 대역들로 분해하는 회로는 양 방향의 이미지를 저 및 고주파 하위 대역들로 필터링하는 필터들의 집합이다.

이 회로는 이미지를 4레벨의 해상도에 따른 하위 대역들로 분해하는 4개의 연속적인 분해 레벨들을 포함한다.

하위 대역 LL₁은 이미지 신호의 양 방향의 저주파 성분들 또는 계수들을 포함한다. 하위 대역 LH₁은 제1 방향의 저주파 계수들 및 다른 방향의 고주파 계수들을 포함한다. 하위 대역 HL₁은 제1 방향의 고주파 계수들 및 제2 방향의 저주 파 계수들을 포함한다. 마지막으로, 하위 대역 HH₁은 양 방향의 고주파 계수들을 포함한다.

그 후, 하위 대역 LL₁은 상술한 바와 같은 원리에 따라 하위 대역들 LL₂, LH₂, HL₂, HH₂로 분해된다.

그 후, 하위 대역 LL₂는 상술한 바와 같은 원리에 따라 하위 대역들 LL₃, LH₃, HL₃, HH₃으로 분해된다.

그 후, 하위 대역 LL₃은 상술한 바와 같은 원리에 따라 하위 대역들 LL₄, LH₄, HL₄, HH₄로 분해된다.

이러한 기술자에 의해 얼굴들의 텍스쳐의 특별한 속성들을 캡쳐할 수 있다.

다른 실시예들에서는, 타원의 주축에 따른 휘도 변화를 나타내는 기술자들이 사용될 수 있다.

본 발명에 의하면, 매우 유연한 모델을 사용하여 다중 해상도 분할을 불필요하게 할 수 있는 비파라메트릭 판정 시스템에 축소된 후보자 세트를 제공하는 단계를 포함하는 간단한 방법이 제공된다.

Claims

복수의 픽셀로 이루어진 이미지에서 얼굴들을 검출하는 방법으로서,

상기 이미지 내의 살색의 픽셀들(flesh coloured pixels)을 검출하는 단계,

상기 이미지를 동질 색의 영역들(R_i)로 세그먼트화하는 단계,

상기 동질 색의 영역들(R_i) 중에서, 제1 소정 임계치보다 큰 다수의 살색의 픽셀들을 포함하는 영역들을 선택하는 단계 - 상기 선택된 영역들은 살색의 영역들이라 칭해짐 - ,

병합 비용(merge cost)이 제2 소정 임계치에 달할 때까지 이웃하는 살색의 영역들(Ri)을 병합하는 단계 - 상기 병합 비용은 상기 영역들(R_i)의 형상에 관한 병합 비용과 상기 영역들(R_i)의 색에 관한 병합 비용을 선형으로 가중함 - , 및

거짓 긍정들(false positives)을 제외하는 단계

를 포함하고,

상기 병합 단계는,

이웃하는 영역들(Ri) 사이의 평균 색차를 계산함으로써 상기 영역들(R_i)의 색에 관한 상기 병합 비용을 계산하는 단계, 및

상기 영역(R_i)의 면적과, 상기 영역(R_i)과 동일한 무게 중심을 갖고 그것을 최적으로 오버랩하는 타원(E_i)의 면적 사이의 오버랩,

상기 타원(E_i)의 픽셀들의 수에 대한, 상기 타원(E_i)의 외부 영역의 픽셀들의 수 및 상기 영역(R_i) 외부의 상기 타원(E_i)의 픽셀들의 수의 합의 비율 - 이 비율을 타원 비율이라 함 -, 및

2개의 이웃하는 영역들(Ri)의 타원 비율들 중 최대 타원 비율과 병합된 영역(R_i)의 타원 비율 사이의 차

를 계산함으로써 형상에 관한 병합 비용을 계산하는 단계

를 포함하는 얼굴 검출 방법.
삭제
제1항에 있어서,

상기 살색의 픽셀들을 검출하는 단계는 채도 평면(chrominance plane)에서 2차원 가우스 확률 법칙(two-dimensional Gaussian probability law)의 형태로 얼굴색 모델을 정의하는 단계를 포함하는 얼굴 검출 방법.
제1항 또는 제3항에 있어서,

상기 거짓 긍정들을 제외하는 단계는 상기 병합된 영역들(R_i)의 속성들을 얼굴의 대응하는 속성들과 비교하는 단계 및 속성들이 얼굴의 대응하는 속성들과 전혀 다른 영역들을 제외하는 단계를 포함하는 얼굴 검출 방법.
제4항에 있어서,

상기 속성들은

상기 영역의 사이즈,

상기 영역의 형상,

평균색,

주축에 따른 휘도의 분산

및 이러한 속성들의 임의의 조합 중에서 선택되는 얼굴 검출 방법.
제1항에 있어서,

상기 거짓 긍정들을 제외하는 단계는,

병합된 영역들(R_i)에 대하여 적어도 하나의 시각적 기술자(visual descriptor)를 계산하는 단계,

얼굴을 포함하는 예시적인 이미지들과 어떠한 얼굴도 포함하지 않는 예시적인 이미지들 사이에 기술자들(descriptors)의 공간에서의 최적 하이퍼평면(hyperplane)을 결정하는 단계, 및

기술자가, 얼굴을 포함하는 예시적인 이미지들에 대응하는 상기 하이퍼평면의 측에 놓여있지 않은 영역들(R_i)을 제외하는 단계 - 상기 하이퍼평면의 측은 하이퍼평면의 올바른 측이라 칭해짐 -,

를 포함하는 얼굴 검출 방법.
제3항에 있어서,

상기 거짓 긍정들을 제외하는 단계는,

병합된 영역들(R_i)에 대하여 적어도 하나의 시각적 기술자를 계산하는 단계,

얼굴을 포함하는 예시적인 이미지들과 어떠한 얼굴도 포함하지 않는 예시적인 이미지들 사이에 기술자들의 공간에서의 최적 하이퍼평면을 결정하는 단계, 및

기술자가, 얼굴을 포함하는 예시적인 이미지들에 대응하는 상기 하이퍼평면의 측에 놓여있지 않은 영역들(R_i)을 제외하는 단계 - 상기 하이퍼평면의 측은 하이퍼평면의 올바른 측이라 칭해짐 -

를 포함하는 얼굴 검출 방법.
제4항에 있어서,

상기 거짓 긍정들을 제외하는 단계는,

병합된 영역들(R_i)에 대하여 적어도 하나의 시각적 기술자를 계산하는 단계,

얼굴을 포함하는 예시적인 이미지들과 어떠한 얼굴도 포함하지 않는 예시적인 이미지들 사이에 기술자들의 공간에서의 최적 하이퍼평면을 결정하는 단계, 및

기술자가, 얼굴을 포함하는 예시적인 이미지들에 대응하는 상기 하이퍼평면의 측에 놓여있지 않은 영역들(R_i)을 제외하는 단계 - 상기 하이퍼평면의 측은 하이퍼평면의 올바른 측이라 칭해짐 -

를 포함하는 얼굴 검출 방법.
제6항에 있어서,

상기 기술자는, 병합된 타원을 둘러싸는 최소 사각형의 웨이블렛 변환 (wavelet transformation)을 수행하고 상기 이미지의 계층적 분해에 의해 얻어진 12개의 최저 주파수의 부대역의 웨이블렛 계수들의 분산을 상기 기술자에게 할당함으로써 산출되는 얼굴 검출 방법.
복수의 픽셀로 이루어진 이미지에서 얼굴들을 검출하는 디바이스로서,

상기 이미지에서 살색의 픽셀들을 검출하는 수단,

상기 이미지를 동질 색의 영역들(R_i)로 세그먼트화하는 수단,

상기 동질 색의 영역들(R_i) 중에서, 제1 소정 임계치보다 큰 다수의 살색의 픽셀들을 포함하는 영역들(R_i)을 선택하는 수단 - 상기 선택된 영역들은 살색의 영역들이라 칭해짐 - ,

병합 비용이 제2 소정 임계치에 달할 때까지 이웃하는 살색의 영역들(Ri)을 병합하는 수단 - 상기 병합 비용은 상기 영역들(R_i)의 형상에 관한 병합 비용과 상기 영역들(R_i)의 색에 관한 병합 비용을 선형적으로 가중함 - , 및

거짓 긍정들을 제외하는 수단

을 포함하고,

상기 병합 수단은,

이웃하는 영역들(Ri) 사이의 평균 색차를 계산함으로써 상기 영역들(R_i)의 색에 관한 상기 병합 비용을 계산하는 수단, 및

상기 영역(R_i)의 면적과, 상기 영역(R_i)과 동일한 무게 중심을 갖고 그것을 최적으로 오버랩하는 타원(E_i)의 면적 사이의 오버랩,

상기 타원(E_i)의 픽셀들의 수에 대한, 상기 타원(E_i)의 외부 영역의 픽셀들의 수 및 상기 영역(R_i) 외부의 상기 타원(E_i)의 픽셀들의 수의 합의 비율 - 이 비율을 타원 비율이라 함 -, 및

2개의 이웃하는 영역들(Ri)의 타원 비율들 중 최대 타원 비율과 병합된 영역(R_i)의 타원 비율 사이의 차

를 계산함으로써 형상에 관한 병합 비용을 계산하는 수단

을 포함하는 얼굴 검출 디바이스.