KR20080035711A

KR20080035711A - 3차원 얼굴 인식을 위한 전역적 특징 추출 방법

Info

Publication number: KR20080035711A
Application number: KR1020060102084A
Authority: KR
Inventors: 손광훈; 양욱일
Original assignee: 연세대학교 산학협력단
Priority date: 2006-10-20
Filing date: 2006-10-20
Publication date: 2008-04-24
Also published as: KR100828411B1

Abstract

본 발명은 3차원 얼굴 인식을 위한 전역적 특징 추출 방법에 관한 것으로, 얼굴의 전 영역이 아니라 표정 및 장신구에 의한 변화가 적은 부분에서만 전역적 특징을 추출하여 국소적 성격을 가지는 전역적 특징을 추출한다. 본 발명에서는 코끝점(NPP;Nose Peak Point)을 지나는 가로방향(수평방향) 프로파일(profile)을 추출하고, 추출된 프로파일(profile)을 데이터베이스를 기반으로 학습된 방사 기저 함수 신경망(RBFN; Radial Basis Function Network)에 적용시킨 결과로 파생되는 기저 함수들의 가중치를 얼굴의 새로운 전역적 특징으로 추출한다.

본 발명은 국소적 특징의 단점과 전역적 특징의 단점을 상호 보완하면서 국소적 특징의 장점과 전역적 특징의 장점을 모두 가지고 있으며, 본 발명에 따른 전역적 특징을 사용하여 3차원 얼굴 인식을 수행할 경우 방시 기저 함수 신경망의 학습방법에 따라 동일인으로부터 여러 개의 특징 정보를 추출할 수 있어, 생체 정보 유출 시 발생하는 생체 정보의 불변성이라는 단점을 해결할 수 있으며, 국소적 영역에서의 전역적 특징을 추출하므로 특징 정보만으로는 원래 얼굴로의 역변환이 불가능하여 특징 정보 유출에 의한 개인 권리 침해를 방지할 수 있는 장점이 있다.

3차원 얼굴 인식, 전역적 특징 추출, 코끝점, 방사 기저 함수, 가중치

Description

3차원 얼굴 인식을 위한 전역적 특징 추출 방법{Global feature extraction method for 3D face recognition}

도 1은 통상의 얼굴 인식 과정을 나타낸 플로차트.

도 2는 종래의 포인트 신호(Point signature) 기반 특징 추출 방법을 나타낸 실시예.

도 3은 본 발명에 따른 3차원 얼굴 인식을 위한 전역적 특징 추출 방법을 나타낸 플로차트.

도 4는 본 발명에 따른 3차원 얼굴 데이터의 정규화 과정을 나타낸 사진.

도 5는 본 발명에서 사용하는 직교좌표계와 원통좌표계를 정의하는 그래프.

도 6은 본 발명에 따른 깊이 영상과 거리 영상의 차이를 나타낸 사진.

도 7은 3차원 얼굴 데이터 DB로부터 선택된 3개(DB1,DB2,DB3)의 얼굴 데이터로부터 추출한 코끝점(NPP)를 지나는 가로방향(수평방향) 프로파일(profile)을 나타낸 실시예.

도 8은 c=0, R=I인 경우의 방사 기저 함수(RBF)를 나타낸 그래프.

도 9는 일반적인 단층 신경망 구조에 방사 기저 함수 신경망이 적용된 실시예.

도 10은 기저 함수 개수 m의 증가에 따른 오차제곱합(SSE)을 나타낸 그래프.

도 11은 본 발명에 따라 추출된 전역적 특징을 사용하여 3차원 얼굴 인식을 수행할 경우의 인식률 측정 결과를 나타낸 그래프.

본 발명은 3차원 얼굴 인식에 관한 것이며, 더욱 상세히는 3차원 얼굴 인식을 위한 전역적 특징 추출 방법에 관한 것이다.

얼굴 인식 기술은 2차원 얼굴 영상을 기반으로 연구되어 왔으며, 신원 확인, 출입 통제, 감독, 데이터베이스(DB) 검색 등 다양한 분야에 활용되고 있다. 그러나 포즈, 조명, 표정 변화 같은 다양한 내·외적 환경 변화에서의 2차원 얼굴 인식 기술은 아직 만족스러운 상태가 아니며, 이를 극복하기 위해 많은 연구가 진행되고 있다. 특히 지금까지는 2차원 얼굴 영상을 기반으로 연구가 이루어졌으나, 최근에는 3차원 영상 획득 장치가 발달하면서 3차원 얼굴 데이터를 기반으로 하는 연구도 활발히 진행되고 있다.

일반적으로 얼굴 인식은 도 1에서 보는 바와 같이 얼굴 영역 검출 과정(S10), 얼굴 데이터의 정규화 과정(S12), 얼굴 데이터로부터의 특징 추출 과정(S14), 특징 비교 과정(S16)으로 이루어진다.

상기 얼굴 영역 검출 과정(S10)은 테스트 데이터에서 인식 대상인 얼굴과 인식 대상이 아닌 배경을 구분하여 얼굴 인식에 사용될 의미있는 정보를 가진 데이터만을 선택하는 과정이다.

상기 얼굴 데이터의 정규화 과정(S12)은 얼굴 영역 검출 과정을 통해 검출된 얼굴 데이터의 포즈, 조명, 표정 변화 등을 감지하여 이를 보정함으로써 정확한 특징 추출을 용이하게 해주며, 각 개인의 특징이 환경 변화에 의해 변하지 않도록 하는 과정이다.

상기 특징 추출 과정(S14)은 정규화된 얼굴 데이터로부터 얼굴 인식에 적합한 특징을 추출하는 과정이다.

상기 특징 비교 과정(S16)은 얼굴 인식을 마지막 과정으로 테스트 데이터로부터 추출된 얼굴 특징과 미리 구축한 DB에서의 얼굴 특징을 비교하여 테스트 데이터가 누구인지를 판별 또는 인증하는 과정이다.

상기한 4가지 과정(S10,S12,S14,S16)을 수행하기 위한 기술은 각각 고유한 기능을 담당하면서도 서로 연관되어 있다. 다시 말해서 상기 4가지 과정(S10,S12,S14,S16)을 수행하는 각 기술은 해당 과정에서 고유한 목표를 가지고 데이터를 처리함과 동시에 그 데이터 처리 결과는 다음 과정을 수행하기 위한 기술의 복잡성을 결정한다.

실제로, 얼굴 영역 검출이 정확할수록 얼굴 데이터의 정규화가 쉽고 정확하게 이루어진다. 또한 정규화가 잘된 데이터일수록 특징 추출이 쉬우며, 정확한 특징 추출이 가능하다.

특히, 특징 추출 과정을 수행하기 위한 기술의 경우 특징 비교 과정을 수행하기 위한 기술과 면밀한 관계를 맺고 있다. 즉, 정확한 특징 추출은 정확한 얼굴 인식 결과로 이어진다. 추출된 특징이 각 개인별로 고유하며 다른 사람과 확실하게 구별되면 될수록 특징 비교는 간단해지며, 더 정확한 인식 결과를 얻을 수 있다. 쉽게 말해서 얼굴 인식에 사용될 특징의 특성에 따라서 특징 비교 과정의 복잡성이 결정되며, 인식 결과에도 많은 영향을 주게 된다.

한편, 기존에 제안된 3차원 얼굴 특징 추출 기법에 대해서 서술하면 다음과 같다.

첫째로, 곡률 기반 특징 추출 기법은 곡률을 기반으로 3차원 얼굴 데이터의 특징을 추출하는 방법으로서, 깊이 영상(Depth image)으로부터 주요 곡률을 계산하여 특징으로 사용하는 방법, 깊이 영상으로부터 곡률을 계산한 다음 확장된 가우시안 영상(EGI; Extended Gaussian Image)을 생성하여 그 영상을 특징으로 사용하는 방법, 눈, 코, 입 등과 같은 특이점에서의 곡률과 특이점 간의 거리를 특징으로 사용하는 방법, 얼굴의 프로파일(profile)을 추출하고 추출된 프로파일(profile)의 곡률을 계산하여 특징으로 사용하는 방법 등과 같은 여러 가지 방법들이 제안되어 있다.

둘째로, 포인트 신호(Point signature) 기반 특징 추출 방법은 포인트 신호(point signature)의 정의를 나타낸 도 2의 (a)의 2차원 곡면 S위의 한 점 P에서 곡면 S로의 법선 벡터

을 포함하는 평면을 S_p라고 하고, 평면 S_p에 수직이고 점 P를 포함하는 평면을 접면 S_⊥라 할 때, 점 P를 중심으로 반지름 r인 원을 평면 S_⊥위에 그렸을 때, 도 2의 (b)처럼 원 위의 각 지점으로부터 곡면 S까지의 수직 거리 d_n들, 즉 포인트 신호(point signature)들을 도 2의 (c)와 같이 최종적인 특징으로 산출하며, 도 2의 (c)와 같은 특징을 서로 비교하여 얼굴 인식을 수행한다.

셋째로, 고유 얼굴을 이용한 특징 추출 방법은 2차원 얼굴 인식 기술 초기에 제안된 방법이다. 이 방법은 데이터가 가지고 있는 원래의 특징을 잃어버리지 않으면서 효율적으로 데이터의 차원을 줄일 수 있는 선형 변환 방법을 이용하여 얼굴의 특징을 추출하는 방법이다. 2차원 얼굴 인식에서는 얼굴 영상을 이용하여 고유 얼굴을 생성한다. 반면에 3차원 얼굴 인식의 경우 얼굴 영상이 아닌 얼굴의 구조적 정보를 가지고 있는 깊이 영상 또는 거리 영상(Range image)을 이용하여 고유 얼굴을 생성하고, 이것을 특징으로 하여 얼굴 인식을 수행하는 방법들이 제안되었다. 거리 영상을 이용하여 고유 얼굴을 특징으로 추출하고 마르코프 필드(Markov field)를 이용하여 인식하는 방법, 여러 가지 사이즈의 깊이 영상을 이용하여 고유 얼굴을 계산하여 인식에 사용하는 방법등이 있다.

넷째로, 반복 최근점(ICP; Iterative closest point)을 이용한 특징 추출 방법은 다음의 4단계를 거치면서 수행된다.

1) 입력 영상과 DB 데이터를 비교하기 위한 대응점을 추출한다.

2) 주어진 대응점을 기준으로 두 데이터를 가장 비슷하게 만들어주는 선형 변환을 계산한다. 일반적으로 평균자승오차를 측면에서 최적이 되도록 하는 방법을 사용한다.

3) 계산된 선형 변환을 적용한다.

4) 계산된 선형 변환이 주어진 임계치보다 작아질 때까지 위의 3단계를 반복한다.

상기 반복 최근점(ICP)에 의해 선형 변환된 테스트 데이터 자체가 특징이 되며, 테스트 데이터와 DB 데이터 사이의 상관도를 측정하여 3차원 얼굴 인식을 수행 하는 방법이 제안되어 있다.

상기한 얼굴 특징 추출 방법 중, 상기 곡률 기반 특징 추출 방법과 포인트 신호(Point signature) 기반 특징 추출 방법이 대표적인 국소적 정보를 이용한 특징 추출 방법이고, 상기 고유 얼굴을 이용한 특징 추출 방법과 반복 최근점(ICP)을 이용한 특징 추출 방법이 대표적인 전역적 정보를 이용한 특징 추출 방법이다.

현재까지 제안된 방법들을 보면 대부분 국소적 정보를 이용한 특징 추출 방법을 이용하고 있다. 특히 얼굴의 곡률을 이용하여 인식하는 방법이 대세를 이루고 있다. 포인트 신호(Point signature) 기반 특징 추출 방법의 경우 곡률을 계산하는 방법이 틀리기는 하지만 한 점을 기준으로 얼굴의 굴곡 정도를 특징으로 하는 면에서는 곡률을 이용한 방법과 동일하다.

얼굴의 생김새와 굴곡은 사람마다 다르므로, 그 굴곡 정도를 수치적으로 계 산한 곡률을 계산하여 비교하면 얼굴 인식이 가능하다. 하지만 곡률은 이차 미분을 통해 계산되기 때문에 입력 데이터의 잡음에 의한 결과 변화가 심하며, 주변 데이터와의 결과 값 차이도 크다. 다시 말해 정확한 비교를 위해서는 테스트 데이터와 DB 데이터의 대응점을 정확하게 찾아야 한다는 가정이 전제된다. 두 데이터간의 대응점을 찾는 문제는 매우 어려운 문제로서 많은 방법이 제안되었지만 만족스러운 결과는 보여주지 못하고 있다.

전역적 정보를 이용하는 상기 고유 얼굴을 이용한 특징 추출 방법의 경우 특징 추출 과정에서 선형 변환만을 사용하기 때문에 입력 데이터의 잡음에 의한 급격한 결과 변화가 발생하지 않는다. 2차원 얼굴 인식 기술에서 고유 얼굴을 이용한 특징 추출 방법은 입력 영상의 화소값을 기반으로 고유 얼굴을 계산하기 때문에 조명 변화에 민감한 결과를 보여주었다. 따라서 얼굴 인식 기술 연구 초기에 하나의 알고리즘으로 제안되었을 뿐 실제 사용 한경에 적용되지는 못하였다. 그러나 3차원 얼굴인식에서는 화소값 대신 얼굴의 구조적 정보를 가지고 있는 깊이 영상 혹은 거리 영상을 사용하기 때문에 조명에 의한 문제가 발생하지 않는다. 얼굴의 구조적 특징을 이용하여 포즈 보정이 가능하기 때문에 포즈 변화 문제도 해결 가능하다. 하지만 얼굴의 전 영역으로부터 전역적인 특징을 추출할 경우 표정 변화에 의한 문제와 안경 같은 장신구에 의한 문제가 발생한다.

기존에 제안되었던 특징 추출 방법에 의해 추출된 국소적 특징과 전역적 특징은 상호 보완적인 특징들이다. 다시 말해 국소적 특징의 단점을 전역적 특징이 보완해줄 수 있고, 전역적 특징의 단점을 국소적 특징이 보완해줄 수 있다.

본 발명은 상기한 바와 같은 종래의 문제점을 해결하고 상기 국소적 특징과 전역적 특징의 상호 보완적인 특성을 이용하기 위한 것으로서, 본 발명의 목적은 얼굴의 전 영역이 아니라 표정 및 장신구에 의한 변화가 적은 부분에서만 전역적 특징을 추출하여 국소적 성격을 가지는 전역적 특징을 생성하기 위해 코끝점(NPP;Nose Peak Point)을 지나는 가로방향(수평방향) 프로파일(profile)을 추출하고, 추출된 프로파일(profile)을 데이터베이스에 의해 학습된 방사 기저 함수 신경망(RBFN; Radial Basis Function Network)에 적용시킨 결과로 파생되는 기저 함수들의 가중치를 얼굴의 새로운 전역적 특징으로 추출하는 3차원 얼굴 인식을 위한 전역적 특징 추출 방법을 제공하는 것이다.

상기한 바와 같은 본 발명의 목적을 달성하기 위하여, 본 발명의 실시예에 따른 3차원 얼굴 인식을 위한 전역적 특징 추출 방법은, 3차원 데이터 획득 장치에 의해 획득된 3차원 얼굴 데이터의 색상 정보와 구조적 정보 중 상기 색상 정보에 할-라이크(Haar-like) 특징을 이용한 아다부스트(Adaboost) 알고리즘을 적용하여 눈 위치 정보를 추출하고, 추출된 눈 위치 정보를 이용하여 얼굴 포즈를 대략적으로 추정한 다음, 상기 구조적 정보 중 두 눈 사이에 존재하는 눈 보다 높은 z 좌표값을 가지는 코끝점(NPP; Nose Peak Point) 후보점을 추출한 후, 이 점을 중심으로 콧등점(NRP; Nose Ridge Point)들을 추출하고, 추출된 콧등점(NRP)들을 기반으로 얼굴 중심 평면을 선형회귀법에 의해서 구하고, 얼굴 중심 평면 위의 얼굴 점들 가운데 z 좌표값이 가장 큰 점을 코끝점(NPP)으로 선택하고 코끝점(NPP)의 좌표값이 (0,0,MAX)의 좌표값을 갖도록 3차원 얼굴 데이터를 회전이동, 평행이동, 크기 조정하여 정규화하는 과정과; 정규화된 3차원 얼굴 데이터로부터 원통좌표계 변환된 거리 영상을 생성하는 과정; 생성된 거리 영상으로부터 코끝점(NPP)를 지나는 가로방향(수평방향) 프로파일(profile)을 추출하는 과정; 및 추출된 프로파일(profile)을 데이터베이스에 의해 학습된 방사 기저 함수 신경망(RBFN; Radial Basis Function Network)에 적용시킨 결과로 산출되는 방사 기저 함수들의 가중치(

)를 얼굴 데이터의 전역적 특징으로 추출하는 과정;으로 이루어진다.

이하, 본 발명의 실시예를 첨부된 도면을 참조하여 더욱 상세하게 설명한다.

도 3은 본 발명에 따른 3차원 얼굴 인식을 위한 전역적 특징 추출 방법을 나타낸 플로차트이다.

도 3을 참조하면, 가장 먼저 3차원 데이터 획득 장치에 의해 획득된 3차원 얼굴 데이터의 색상 정보와 구조적 정보 중 상기 색상 정보에 할-라이크(Haar-like) 특징을 이용한 아다부스트(Adaboost) 알고리즘을 적용하여 눈 위치 정보를 추출하고, 추출된 눈 위치 정보를 이용하여 얼굴 포즈를 추정한 다음, 상기 구조적 정보 중 두 눈 사이에 존재하는 눈 보다 높은 z 좌표값을 가지는 코끝점(NPP) 후보점과 그 점을 중심으로 콧등점(NRP)를 추출하고, 추출된 콧등점(NRP)을 이용하여 선형회귀법에 의해 얼굴 중심 평면을 구하고, 얼굴 중심 평면상의 얼굴 점들 가운데 z 좌표값이 가장 큰 점을 코끝점(NPP)으로 정한 다음, 코끝점(NPP)의 좌표값이 (0,0,MAX)의 좌표값을 갖도록 3차원 얼굴 데이터를 회전이동, 평행이동, 크기 조정하여 정규화한다(S20).

상기 3차원 얼굴 데이터 정규화 과정(S20)을 더욱 구체적으로 설명하면 다음과 같다.

본 발명에서는 360° 전방향에 대한 얼굴 데이터 획득이 가능한 3D 얼굴 카메라 또는 3D 레이저 스캐너 등으로 3차원 얼굴 데이터를 획득한다.

3차원 얼굴 데이터의 경우 얼굴에 대한 색상 정보와 구조적 정보를 모두 포함하고 있다. 본 발명에서는 이 두 가지 정보를 모두 이용하여 데이터를 정규화하였다. 먼저, 주어진 3차원 얼굴 데이터의 색상 정보에 할-라이크(Haar-like) 특징을 이용한 아다부스트(Adaboost) 알고리즘을 적용하여 눈의 위치 정보를 추출하고, 추출된 눈의 위치를 나타내는 벡터를 각각

,

라 정의하고, 시선의 방향을 나타내는 벡터를

로 정의하고, z축 기울임 벡터를

라 정의한다. 이어서, 상기 눈 위치 벡터

과 z축이 평행하고, 상기 z축 기울임 벡터

와 y축이 평행하도록 회전 변환을 수행함으로써 대략적인 얼굴 포즈 추정을 할 수 있다.

상기와 같이 얼굴 포즈가 추정되고 나면, 일반적인 얼굴 구조로 인해 정면의 얼굴의 경우 코는 두 눈 사이에 존재하며 눈보다 높은 z 좌표값을 가지게 되므로 이런 조건을 만족하는 영역에서 z 좌표값이 가장 큰 곳을 코끝점(NPP) 후보점

라 정의하고, 이 코끝점(NPP) 후보점

와 상기 눈 위치 벡터

사이를 y축 방향으로 검색하여 주변보다 높은 z 좌표값을 가지는 콧등점(NRP)들을 추출한다.

이어서, 추출된 콧등점(NRP)들을 지나는 평면을 선형 회귀법에 의해 구하고, 그 평면을 얼굴중심 평면 F_c라 정의하고, 이 얼굴중심 평면 F_c와 얼굴 데이터가 만나서 생성되는 곡선상의 점들 가운데 가장 큰 z 좌표값을 가지는 점을 코끝점(NPP)으로 정한다.

이와 같이 정해진 코끝점(NPP)과 상기 얼굴중심 평면 F_c의 법선 벡터를 이용하여 코끝점(NPP)이 (0, 0, MAX), 예컨대 (0, 0, 100)의 좌표값을 갖도록 3차원 얼굴 데이터를 회전이동, 평행이동, 크기 조정하여 정규화한다.

참고로, 도 4는 본 발명에 따른 3차원 얼굴 데이터의 정규화 과정을 나타낸 사진으로서, 도 4의 (a)는 비정규화된 3차원 얼굴 데이터를 나타내고, 도 4의 (b)는 색상 정보에서의 눈 위치 추출 과정을 나타내고, 도 4의 (c)는 얼굴의 일반적인 구조정보를 이용하여 추출한 얼굴중심 평면 F_c와 코끝점(NPP)을 나타내고, 도 4의 (d)는 정규화된 3차원 얼굴 데이터를 나타낸다.

상기와 같이 3차원 얼굴 데이터가 정규화되고 나면, 정규화된 3차원 얼굴 데 이터로부터 원통좌표계 변환된 거리 영상을 생성한다(S22).

종래의 3차원 얼굴 인식에서는 깊이 영상과 거리 영상의 개념을 동일한 개념으로 사용하고 있으나, 본 발명에서는 기존에 사용된 깊이 영상과는 다른 개념으로 거리 영상을 정의하고 사용한다.

도 5는 본 발명에서 사용하는 직교좌표계(x,y,z)와 원통좌표계(r,y,θ)의 정의를 나타내고, 도 6은 본 발명에서 깊이 영상과 거리 영상의 차이를 나타낸다.

참고로, 도 6의 (a)는 3차원 얼굴 모델을 나타내고, 도 6의 (b)와 (c)는 각각 거리 영상과 깊이 영상을 나타낸다.

본 발명에 있어서, 깊이 영상이란 직교 좌표계에서 3차원 물체의 z축 좌표값을 영상으로 나타낸 것이다. 반면에 거리 영상은 직교좌표계가 아니라 원통좌표계에서의 r 좌표값을 θ값에 따라서 영상으로 나타낸 것이다.

본 발명에 따른 직교좌표계와 원통좌표계 변환은 다음의 수학식 1에 의해 이루어진다.

상기 정규화된 3차원 얼굴 데이터로부터 원통좌표계 변환된 거리 영상을 생 성되고 나면, 코끝점(NPP)를 지나는 가로방향(수평방향) 프로파일(profile)을 추출한다(S24).

도 7은 2004년 연세대학교 생체인식 연구센터(BERC)에서 3차원 얼굴 인식 및 특징 추출을 위해 구축한 3차원 얼굴 데이터 DB에서 선택된 3개(DB1,DB2,DB3)의 얼굴 데이터로부터 추출한 코끝점(NPP)를 지나는 가로방향(수평방향) 프로파일(profile)을 나타낸 실시예이다.

상기 코끝점(NPP)를 지나는 가로방향(수평방향) 프로파일(profile)이 추출되고 나면, 추출된 프로파일(profile)을 데이터베이스(DB)에 의해 학습된 방사 기저 함수 신경망(RBFN; Radial Basis Function Network)에 적용시킨 결과로 산출되는 방사 기저 함수들의 가중치(

)를 얼굴 데이터의 전역적 특징으로 추출한다(S26).

상기 전역적 특징 추출 과정(S26)을 더욱 구체적으로 설명하면 다음과 같다.

방사 기저 함수(RBF)는 중심점으로부터 단조 감소 또는 단조 증가하는 특성을 가진 함수이다. 이와 같은 특성으로 인해 방사 기저 함수(RBF)는 함수의 중심과 단조 증가 또는 단조 감소하는 패턴, 증가 또는 감소하는 속도로 정의되며, 일반적인 방사 기저 함수(RBF)는 하기의 수학식 2와 같다.

상기 수학식 2에서, Φ는 단조 증가 또는 단조 감소하는 패턴을 의미하고, c 는 중심을, R은 단조 증가 또는 감소하는 정도를 나타낸다. 상기 Φ의 경우 여러 가지로 많은 형태의 함수가 존재하지만 일반적으로 아래의 수학식 3 내지 수학식 6 중에 어느 한가지로 정의된다.

상기 R은 많은 경우 R=r²I로 정의되어 사용되며, 참고로 도 8은 c=0, R=I인 경우의 방사 기저 함수(RBF)를 나타낸다.

상기 방사 기저 함수 신경망(RBFN)의 경우 모든 종류의 신경망 구조에 사용될 수 있으나 일반적으로 도 9와 같이 단층 신경망 구조에 자주 적용된다. n개의 입력 x_j가 m개의 방사 기저 함수 h_i(ㆍ)에 적용되며, m개의 h_i(ㆍ)와 m개의 가중치 w_i의 선형 결합에 의해 하기의 수학식 7과 같이 최종 결과 f(x)가 계산된다.

상기한 바와 같은 방사 기저 함수 신경망(RBFN) 학습을 위해, 본 발명에서는 도 7에 나타낸 바와 같은 3차원 얼굴 데이터 DB에서 추출된 코끝점(NPP)를 지나는 가로방향(수평방향) 프로파일(profile)을 학습 데이터로 사용하고, 최소자승법에 의한 오차 최소화 기법과 포워드 셀렉션(Forward selection) 기법을 적용한다.

상기 3차원 얼굴 데이터 DB에서 추출된 코끝점(NPP)를 지나는 가로방향(수평방향) 프로파일(profile)

을 회귀하는 곡선 f(θ)를 방사 기저 함수 신경망(RBFN)를 이용하여 구할 경우, 하기의 수학식 8의 형태로 나타난다.

상기 수학식 8에 최소자승법

을 적용할 경우 가중치(

)는 하기의 수학식 9로 계산된다.

상기와 같이 방사 기저 함수 신경망(RBFN)의 기저 함수로 구성되는 H가 정해지면 최소자승법에 의해 방사 기저 함수 신경망(RBFN)의 가중치 (

)가 결정된다. H를 정하기 위해서 사용되는 기저 함수 h(θ)와 기저 함수의 개수 m을 정해주어야 한다. 이 과정은 포워드 셀렉션(Forward selection) 기법을 적용하여 수행한다.

상기 포워드 셀렉션(Forward selection) 기법은 전체 집합에서 어떤 조건에 적합한 부분집합을 선택하는 알고리즘이다. 즉 가로방향(수평방향) 프로파일(profile)

을 이루는 모든 점으로부터 적절한 부분 집합을 선택하여 그 부분 집합으로 전체 집합을 대신하는 알고리즘이다. 적절한 부분 집합을 선택하는 기준으로 일반적으로 오차제곱합(SSE; Sum of Square Error)을 사용한다.

참고로, 일반적인 포워드 셀렉션(Forward selection) 기법은 다음과 같이 3단계로 이루어진다.

1) 초기치로 공집합 B를 설정한다.

2) 전체집합 A의 원소 가운데 오차제곱합(SSE)을 최소로 하는 원소 한 개를 선택하여 집합 B로 이동한다.

3) 오차제곱합(SSE)이 임계값보다 작거나 또는 A집합의 모든 원소가 B집합으로 이동할 때까지 상기 2)번 과정을 반복한다.

상기 2)번의 과정에서 이때 기저 함수 h(θ)의 종류를 상기의 수학식 3 내지 수학식 6을 모두 적용시켜 적절한 기저 함수 h(θ)를 선택하여야 하며, 동시에 상기 수학식 2의 R도 선택하여야 한다. 그러나, 본 발명에서는 학습 시간을 줄이고 학습의 효율성을 높이기 위해 기저 함수 h(θ)를 상기 수학식 3의 형태로 고정시켜 사용하였다.

도 10은 기저 함수 개수 m의 증가에 따른 오차제곱합(SSE)을 나타낸다. 도 10에서 볼 수 있듯이 기저 함수 개수 m이 증가함에 따라서 오차제곱합(SSE)은 감소함을 확인할 수 있으며, 약 95%의 정확도까지 방사 기저 함수 신경망(RBFN)을 학습시킬 경우 약 30개의 방사 기저 함수(RBF)가 필요하다는 것을 알 수 있다. 그래서 본 발명에 따른 실시예에서는 방사 기저 함수 신경망(RBFN) 학습을 통해 선택된 θ_m을 중심으로 하는 30개의 방사 기저 함수(RBF)를 사용하여 상기 수학식 9의 H를 생성하였으며, 상기 수학식 9에 의해 가중치(

)를 구하여 각 얼굴 데이터의 특징으로 사용하였다.

참고로, 도 11은 본 발명에 따라 추출된 전역적 특징을 사용하여 3차원 얼굴 인식을 수행할 경우의 인식률 측정 결과를 나타낸 그래프로서, 3차원 얼굴 DB 100명에 대해서 계산한 결과 92.7%의 인식률(EER)을 획득할 수 있었다.

이상에서 설명한 본 발명에 따른 3차원 얼굴 인식을 위한 전역적 특징 추출 방법은 상기한 실시예에 한정되지 않고, 이하의 특허청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양하게 변경하여 실시할 수 있는 범위까지 그 기술적 정신이 있다.

상술한 바와 같은 본 발명에서는 포즈 및 크기 보정 과정을 거친 거리 영상에서 코끝점(NPP)을 지나는 가로방향(수평방향)의 프로파일(profile)을 추출하고, 추출된 프로파일(profile)을 방사 기저 함수 신경망(RBFN)을 통해 학습시킨 결과로 파생되는 가중치를 3차원 얼굴 인식에 적합한 전역적 특징으로 추출하고, 특히 내외적 환경 변화에 의한 영향을 가장 적게 받는 국소적 영역에서 방사 기저 함수 신경망(RBFN)을 이용한 전역적 방법을 사용하여 특징을 추출하였기 때문에 국소적 특징의 단점과 전역적 특징의 단점을 상호 보완하면서 국소적 특징의 장점과 전역적 특징의 장점을 모두 가지고 있다.

또한, 본 발명에 따라 추출된 전역적 특징을 사용하여 3차원 얼굴 인식을 수행할 경우 학습방법에 따라 동일인으로부터 여러 개의 특징 정보를 추출하여 생체 정보 유출 시 생체 정보의 불변성이라는 단점을 해결할 수 있으며, 국소적 영역에서의 전역적 특징을 추출하므로 특징 정보 유출 시 원래 얼굴로의 역변환이 불가능한 장점이 있다.

더욱 구체적으로는, 첫 번째로 조명의 영향을 받지 않는 얼굴의 구조적 정보인 가로방향(수평방향)의 프로파일(profile)을 이용하여 특징을 생성하기 때문에 조명 변화에 의한 영향이 없다.

두 번째로 3차원 데이터의 특성상 포즈 추정 및 보정이 가능하기 때문에 포즈 문제와 크기 문제에 의한 영향을 받지 않는다.

세 번째로 입과 턱 영역의 경우 표정 변화나 대화, 취식 등에 의해 구조적인 변화가 크게 발생하고, 눈 영역의 경우는 표정 변화에 의해 구조적 변화가 심하지는 않지만 여전히 구조적인 변화가 발생하며 안경이라는 일반적인 장신구에 의해 영향을 많이 받는 영역이고, 이마 부분의 경우 개인적 특성이 비슷하고 머리카락에 의해 가려질 가능성이 높은 영역인 반면에, 본 발명에 따른 코끝점(NPP)을 지나는 가로방향(수평방향)의 프로파일(profile)은 얼굴에서 가려짐과 움직임이 거의 없는 영역이므로 표정 변화에 강인하며, 장신구의 영향을 가장 적게 받는다.

네 번째로 상기 가로방향(수평방향)의 프로파일(profile) 자체가 아니라 이 프로파일(profile)을 방사 기저 함수 신경망(RBFN)에 적용하여 가공한 형태인 가중치를 특징으로 사용하기 때문에 특징의 차원 감소와 함께 정규화가 가능하여 테스트 데이터의 특징과 DB 데이터의 특징을 비교하기가 용이하다.

다섯 번째로 방사 기저 함수 신경망(RBFN)의 학습 과정은 미분 연산이 아니 고 오차를 줄여주는 방향으로 진행하는 적분 연산이기 때문에 입력 데이터의 잡음에 의해 발생하는 결과의 변화가 적다. 즉 테스트 데이터의 잡음으로 인해 추출되는 특징의 변화가 작다.

여섯 번째로 공간상의 한 지점을 기준으로 하는 국소적 특징이 아니라 프로파일(profile) 전체 데이터를 이용하는 전역적 특징이기 때문에 테스트 데이터와 DB 데이터의 대응점을 찾는 과정이 필요 없다.

실제로, 연세대학교 생체인식 연구 센터의 3차원 얼굴 DB 100명에 대해서 본 발명에 따라 생성된 방사 기저 함수 신경망(RBFN)의 가중치를 각 테스트 데이터의 특징으로 사용하고, 그 특징들을 비교함으로써 얼굴 인식을 수행해본 결과 하나의 프로파일(profile)만 가지고서도 92.7%의 인식률을 보였다.

Claims

3차원 데이터 획득 장치에 의해 획득된 3차원 얼굴 데이터의 색상 정보와 구조적 정보 중 상기 색상 정보에 할-라이크(Haar-like) 특징을 이용한 아다부스트(Adaboost) 알고리즘을 적용하여 눈 위치 정보를 추출하고, 추출된 눈 위치 정보를 이용하여 얼굴 포즈를 추정한 다음, 상기 구조적 정보 중 두 눈 사이에 존재하는 눈 보다 높은 z 좌표값을 가지는 코끝점(NPP; Nose Peak Point) 후보점을 추출한 후, 이 점을 중심으로 콧등점(NRP; Nose Ridge Point)들을 추출하고, 추출된 콧등점(NRP)들을 기반으로 얼굴 중심 평면을 선형회귀법에 의해서 구하고, 얼굴 중심 평면 위의 얼굴 점들 가운데 z 좌표값이 가장 큰 점을 코끝점(NPP)으로 선택하고 코끝점(NPP)의 좌표값이 (0,0,MAX)의 좌표값을 갖도록 3차원 얼굴 데이터를 회전이동, 평행이동, 크기 조정하여 정규화하는 과정과;

정규화된 3차원 얼굴 데이터로부터 원통좌표계 변환된 거리 영상을 생성하는 과정;

생성된 거리 영상으로부터 코끝점(NPP)를 지나는 가로방향(수평방향) 프로파일(profile)을 추출하는 과정; 및

추출된 프로파일(profile)을 데이터베이스에 의해 학습된 방사 기저 함수 신경망(RBFN; Radial Basis Function Network)에 적용시킨 결과로 산출되는 방사 기저 함수들의 가중치(
)를 얼굴 데이터의 전역적 특징으로 추출하는 과정;

으로 이루어지는 것을 특징으로 하는 3차원 얼굴 인식을 위한 전역적 특징 추출 방법.
제 1 항에 있어서, 상기 3차원 얼굴 데이터 정규화 과정은

주어진 3차원 얼굴 데이터의 색상 정보에 할-라이크(Haar-like) 특징을 이용한 아다부스트(Adaboost) 알고리즘을 적용하여 눈의 위치 정보를 추출하는 과정과;

추출된 눈의 위치를 나타내는 벡터를 각각
,
라 정의하고, 시선의 방향을 나타내는 벡터를
로 정의하고, z축 기울임 벡터를
라 정의하는 과정;

상기 눈 위치 벡터
과 z축이 평행하고, 상기 z축 기울임 벡터
와 y축이 평행하도록 회전 변환을 수행함으로써 얼굴 포즈를 추정하는 과정;

얼굴 포즈가 추정되고 나면, 두 눈 사이에 존재하면서 z 좌표값이 가장 큰 곳을 코끝점(NPP) 후보점
라 정의하고, 이 코끝점(NPP) 후보점
와 상기 눈 위치 벡터
사이를 y축 방향으로 검색하여 주변보다 높은 z 좌표값을 가지는 콧등점(NRP)들을 추출하는 과정;

추출된 콧등점(NRP)들을 지나는 평면을 선형 회귀법에 의해 구하고, 그 평면 을 얼굴중심 평면 F_c라 정의하고, 이 얼굴중심 평면 F_c와 얼굴 데이터가 만나서 생성되는 곡선상의 점들 가운데 가장 큰 z 좌표값을 가지는 점을 코끝점(NPP)으로 정하는 과정; 및

이와 같이 정해진 코끝점(NPP)과 상기 얼굴중심 평면 F_c의 법선 벡터를 이용하여 코끝점(NPP)이 (0, 0, MAX)의 좌표값을 갖도록 3차원 얼굴 데이터를 회전이동, 평행이동, 크기 조정하여 정규화하는 과정;

으로 이루어지는 것을 특징으로 하는 3차원 얼굴 인식을 위한 전역적 특징 추출 방법.
제 1 항에 있어서, 상기 거리 영상 생성 과정에서는

하기의 수학식

에 의해 원통좌표계 변환하여 원통좌표계에서의 r 좌표값을 θ값에 따라서 나타낸 거리 영상을 생성하는 것을 특징으로 하는 3차원 얼굴 인식을 위한 전역적 특징 추출 방법.
제 1 항에 있어서, 상기 전역적 특징 추출 과정에서는

추출된 코끝점(NPP)를 지나는 가로방향(수평방향) 프로파일(profile)
을 회귀하는 곡선 f(θ)를 방사 기저 함수 신경망(RBFN)를 이용하여 구할 경우, 하기의

의 형태로 나타내고, 이 수학식에 최소자승법
을 적용할 경우 가중치(
)는 하기의 수학식

로 계산되는 것을 특징으로 하는 3차원 얼굴 인식을 위한 전역적 특징 추출 방법.