KR102093216B1 - 얼굴 영상의 자세를 보정하는 방법 및 장치 - Google Patents

얼굴 영상의 자세를 보정하는 방법 및 장치 Download PDF

Info

Publication number
KR102093216B1
KR102093216B1 KR1020150171235A KR20150171235A KR102093216B1 KR 102093216 B1 KR102093216 B1 KR 102093216B1 KR 1020150171235 A KR1020150171235 A KR 1020150171235A KR 20150171235 A KR20150171235 A KR 20150171235A KR 102093216 B1 KR102093216 B1 KR 102093216B1
Authority
KR
South Korea
Prior art keywords
landmarks
face
posture
face image
dimensional
Prior art date
Application number
KR1020150171235A
Other languages
English (en)
Other versions
KR20160088223A (ko
Inventor
펭 슈에타오
펭 하오
장 홍웨이
공 루진
최창규
한재준
서성주
황원준
왕 비야오
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US14/996,709 priority Critical patent/US10134177B2/en
Publication of KR20160088223A publication Critical patent/KR20160088223A/ko
Application granted granted Critical
Publication of KR102093216B1 publication Critical patent/KR102093216B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20101Interactive definition of point of interest, landmark or seed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Processing Or Creating Images (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

2차원 얼굴 영상으로부터 검출된 2차원 랜드마크들에 기초하여 3차원 얼굴 모델의 초기 자세를 결정함으로써 3차원 얼굴 모델에 포함된 3차원 랜드마크들을 설정하고, 3차원 얼굴 모델의 자세 및 형상을 반복적으로 조절함으로써 갱신된 3차원 랜드마크들에 기초하여 2차원 얼굴 영상의 자세를 보정하는 얼굴 영상의 자세를 보정하는 방법 및 장치를 제공할 수 있다.

Description

얼굴 영상의 자세를 보정하는 방법 및 장치{METHOD AND APPARATUS FOR POSE CORRECTION ON FACE IMAGE}
아래의 실시예들은 얼굴 영상의 자세를 보정하는 방법 및 장치에 관한 것이다.
얼굴 식별은 사용자를 인증하는 데에 사용되는 방법 중 하나로서, 예를 들어, HCI(Human-Computer Interaction), 금융 등 많은 영역에 광범위하게 응용되고 있다. 수집한 얼굴 영상과 데이터베이스에 저장된 얼굴 영상 간의 매칭(matching)을 통해 얼굴을 식별할 수 있으나, 통제를 받지 않는 조건에서 수집한 얼굴의 자세가 다양하게 변화되는 것은 피할 수 없다. 예를 들어, 수집한 얼굴 영상이 정면이 아니고 일정한 각도를 이루었을 때 얼굴 영상을 식별하는 것은 매우 어렵다.
일 측에 따르면, 얼굴 영상의 자세를 보정하는 방법은 2차원 얼굴 영상으로부터 2차원 랜드마크들을 검출하는 단계; 상기 2차원 랜드마크들에 기초하여 3차원 얼굴 모델의 초기 자세를 결정함으로써, 상기 3차원 얼굴 모델에 포함된 3차원 랜드마크들을 설정하는 단계; 상기 3차원 얼굴 모델의 자세 및 형상을 반복적으로 조절함으로써, 상기 3차원 랜드마크들을 갱신하는 단계; 및 상기 갱신된 3차원 랜드마크들에 기초하여 상기 2차원 얼굴 영상의 자세(pose)를 보정하는 단계를 포함한다.
상기 3차원 랜드마크들을 설정하는 단계는 상기 2차원 랜드마크들에 기초하여 상기 3차원 얼굴 모델의 초기 자세(initial pose)를 나타내는 초기 기하 파라미터(initial geometric parameter)를 결정하는 단계를 포함할 수 있다.
상기 초기 기하 파라미터는 상기 3차원 얼굴 모델의 초기 자세 정보를 포함하고, 상기 초기 자세 정보는 상기 3차원 얼굴 모델에 대한 회전(roll) 정보, 척도(pitch) 정보, 및 평행 이동(yaw) 정보를 포함하는 자세 정보 벡터에 의해 표현될 수 있다.
상기 초기 기하 파라미터를 결정하는 단계는 상기 2차원 랜드마크들에 기초하여 상기 2차원 랜드마크들의 초기 가중치를 결정하는 단계; 및 상기 초기 가중치, 상기 2차원 랜드마크들, 및 상기 3차원 랜드마크들에 기초하여, 제1 에너지 함수를 최소화하는 상기 초기 기하 파라미터를 결정하는 단계를 포함할 수 있다.
상기 초기 가중치를 결정하는 단계는 상기 2차원 랜드마크들 각각에 대하여, 미리 저장된 얼굴 영상 데이터베이스에 저장된 2차원 얼굴 샘플 영상의 실제 검출된 랜드마크와 상기 2차원 랜드마크 사이의 편차(deviation)를 측정하는 단계; 및 상기 측정된 편차에 기초하여 상기 2차원 랜드마크들의 초기 가중치를 결정하는 단계를 포함할 수 있다.
상기 측정된 편차에 기초하여 상기 2차원 랜드마크들의 초기 가중치를 결정하는 단계는 상기 측정된 편차를 기초로 상기 2차원 랜드마크들을 정렬하는 단계; 상기 정렬된 2차원 랜드마크들 중 상기 측정된 편차가 미리 설정된 기준보다 높은 값을 가지는 일부 2차원 랜드마크들을 선택하는 단계; 및 상기 일부 2차원 랜드마크들에게 상기 측정된 편차와 반비례하게 상기 초기 가중치를 할당하는 단계를 포함할 수 있다.
상기 얼굴 영상 데이터베이스는 복수 개의 2차원 얼굴 샘플 영상들, 상기 2차원 얼굴 샘플 영상의 실제 검출된 랜드마크들, 및 상기 2차원 얼굴 샘플 영상들에서 실제 측정된 기하 파라미터 중 적어도 하나를 포함할 수 있다.
상기 3차원 랜드마크들을 갱신하는 단계는 상기 초기 기하 파라미터에 기초하여 상기 3차원 랜드마크들을 갱신하는 단계; 상기 갱신된 3차원 랜드마크들의 가중치를 결정하는 단계; 및 상기 가중치에 기초하여, 제2 에너지 함수를 최소화하는 상기 3차원 얼굴 모델의 기하 파라미터 및 형상 파라미터를 결정하는 단계를 포함할 수 있다.
상기 초기 기하 파라미터에 기초하여 상기 3차원 랜드마크들을 갱신하는 단계는 상기 초기 기하 파라미터에 기초하여 상기 3차원 얼굴 모델의 자세를 조정(adjust)하는 단계; 상기 자세가 조정된 3차원 얼굴 모델을 2차원으로 투영하여 2차원 텍스처 영상을 획득하는 단계; 상기 2차원 텍스처 영상으로부터 새로운 2차원 랜드마크들을 검출하는 단계; 상기 새로운 2차원 랜드마크들에 대응되는 상기 3차원 랜드마크들을 탐색하는 단계; 및 상기 탐색된 3차원 랜드마크들에 의해 상기 3차원 랜드마크들을 갱신하는 단계를 포함할 수 있다.
상기 갱신된 3차원 랜드마크들의 가중치를 결정하는 단계는 상기 초기 기하 파라미터로부터 상기 3차원 얼굴 모델의 현재 자세 정보를 획득하는 단계; 미리 저장된 얼굴 영상 데이터베이스에서 상기 3차원 얼굴 모델의 현재 자세 정보에 인접한 자세 정보를 검색하는 단계; 상기 얼굴 영상 데이터베이스에서 상기 인접한 자세 정보에 대응되는 2차원 얼굴 샘플 영상을 검색하는 단계; 및 상기 검색된 2차원 얼굴 샘플 영상에 대응하는 2차원 랜드마크들과 상기 새로운 2차원 랜드마크들 사이의 제2 편차에 기초하여 상기 2차원 랜드마크의 가중치를 결정하는 단계를 포함할 수 있다.
상기 2차원 랜드마크의 가중치를 결정하는 단계는 상기 제2 편차의 평균값을 산출하는 단계; 및 상기 제2 편차의 평균값에 반비례하여 상기 2차원 랜드마크의 가중치를 결정하는 단계를 포함할 수 있다.
상기 현재 자세 정보에 인접한 자세 정보는 상기 현재 자세 정보와 상기 인접한 자세 정보 사이의 편차가 미리 설정된 한계값 범위 내에 있는 자세 정보를 포함할 수 있다.
상기 3차원 랜드마크들을 갱신하는 단계는 상기 3차원 얼굴 모델에 대하여 i-2번째 반복 수행에서 획득한 기하 파라미터와 i-1번째 반복 수행에서 획득한 기하 파라미터 사이의 편차가 미리 설정된 임계치보다 작은지 여부, 또는 상기 반복 수행의 횟수가 미리 설정된 횟수에 도달했는지 여부에 기초하여 상기 3차원 얼굴 모델의 자세 및 형상을 반복적으로 조절하는 단계를 포함할 수 있다.
상기 2차원 얼굴 영상의 자세를 보정하는 단계는 상기 반복 수행에 의해 최종적으로 산출된 최종 기하 파라미터 및 최종 형상 파라미터에 기초하여 상기 3차원 얼굴 모델을 재구성하는 단계; 및 상기 재구성된 3차원 얼굴 모델을 2차원으로 투영하여 상기 2차원 얼굴 영상의 자세를 보정하는 단계를 포함할 수 있다.
상기 얼굴 영상의 자세를 보정하는 방법은 상기 자세가 보정된 2차원 얼굴 영상에 대하여 배경 보존 텍스처(background preserving texture)를 맵핑하는 단계를 더 포함할 수 있다.
상기 배경 보존 텍스처를 맵핑하는 단계는 상기 2차원 얼굴 영상의 픽셀 색상을 기초로, 상기 재구성된 3차원 얼굴 모델에 색상을 부여하여 3차원 텍스처 모델을 결정하는 단계; 및 상기 3차원 텍스처 모델을 2차원으로 투영한 얼굴 영상에서 얼굴 영역 이외의 배경 영역에 대한 픽셀 색상을 결정하는 단계를 포함할 수 있다.
상기 3차원 텍스처 모델을 결정하는 단계는 상기 최종 기하 파라미터 및 상기 최종 형상 파라미터에 기초하여 상기 2차원 얼굴 영상에 상기 재구성된 3차원 얼굴 모델의 정점들(vertexes)을 피팅(fitting)하는 단계; 상기 재구성된 3차원 얼굴 모델의 정점들에 상기 피팅된 2차원 얼굴 영상의 텍스처를 할당하는 단계; 상기 최종 기하 파라미터 및 상기 최종 형상 파라미터에 기초하여, 상기 3차원 얼굴 모델에서 가려진 정점(occluded vertex)을 결정하는 단계; 및 상기 가려진 정점에 대한 텍스처를 할당하는 단계를 포함할 수 있다.
상기 가려진 정점에 대한 텍스처를 할당하는 단계는 상기 3차원 얼굴 모델에서 상기 가려진 정점의 대칭점이 가려졌는지 여부를 판단하는 단계; 및 상기 판단 결과, 상기 대칭점이 가려졌다면, 상기 3차원 텍스처 모델의 텍스처 값의 평균을 상기 정점에 할당하고, 상기 대칭점이 가려지지 않았다면, 상기 대칭점의 텍스처를 상기 가려진 정점에 할당하는 단계를 포함할 수 있다.
상기 배경 영역에 대한 픽셀 색상을 결정하는 단계는 상기 2차원으로 투영한 얼굴 영상에서 상기 배경 영역에 대한 추가 랜드마크들을 설정하는 단계; 상기 3차원 텍스처 모델에서 상기 추가 랜드마크들의 대응점을 검색하는 단계; 및 구간적 아핀 변환(piece-wise affine transformation)을 수행하여 상기 추가 랜드마크들의 대응점에 대한 색상 값을 획득하는 단계를 포함할 수 있다.
도 1은 일 실시예에 따른 2차원 얼굴 영상과 3차원 얼굴 모델에서 대응하는 랜드마크들을 나타낸 도면.
도 2는 일 실시예에 따른 얼굴 영상의 자세를 보정하는 방법을 나타낸 흐름도.
도 3은 일 실시예에 따른 3차원 랜드마크들을 설정하는 방법을 나타낸 흐름도.
도 4는 일 실시예에 따른 얼굴 영상 데이터베이스에 저장된 2차원 얼굴 샘플 영상들을 나타낸 도면.
도 5는 일 실시예에 따른 3차원 랜드마크들을 갱신하는 방법을 나타낸 흐름도.
도 6은 일 실시예에 따른 초기 기하 파라미터에 기초하여 3차원 랜드마크들을 갱신하는 방법을 나타낸 흐름도.
도 7은 일 실시예에 따른 갱신된 3차원 랜드마크들의 가중치를 결정하는 방법을 나타낸 흐름도.
도 8은 일 실시예에 따른 2차원 얼굴 영상의 자세를 보정하는 방법을 나타낸 흐름도.
도 9는 다른 실시예에 따른 얼굴 영상의 자세를 보정하는 방법을 나타낸 흐름도.
도 10은 일 실시예에 따른 배경 보존 텍스처를 맵핑하는 방법을 나타낸 흐름도.
도 11은 일 실시예에 따른 3차원 텍스처 모델을 결정하는 방법을 나타낸 흐름도.
도 12는 일 실시예에 따른 가려진 정점에 대한 텍스처를 할당하는 방법을 나타낸 흐름도.
도 13은 일 실시예에 따른 배경 영역에 대한 픽셀 영상을 결정하는 방법을 나타낸 흐름도.
도 14는 다른 실시예에 따른 얼굴 영상의 자세를 보정하는 방법을 나타낸 흐름도.
도 15는 일 실시예에 따른 신뢰도를 산출하는 방법을 나타낸 흐름도.
도 16은 일 실시예에 따른 랜드마크들의 가중치를 초기화하는 방법을 나타낸 흐름도.
도 17은 일 실시예에 따른 3차원 랜드마크들을 갱신하는 방법을 나타낸 흐름도.
도 18은 일 실시예에 따른 랜드마크들의 가중치를 갱신하는 방법을 나타낸 흐름도.
도 19는 일 실시예에 따른 배경 보존 텍스처를 맵핑하는 방법을 나타낸 흐름도.
도 20은 일 실시예에 따른 배경을 워핑하는 방법을 설명하기 위한 도면.
도 21은 일 실시예에 따른 얼굴 영상의 자세를 보정하는 방법의 수행 과정에서 출력되는 영상들을 나타낸 도면.
도 22는 일 실시예에 따른 얼굴 영상의 자세를 보정하는 장치의 블록도.
도 23은 다른 실시예에 따른 얼굴 영상의 자세를 보정하는 장치의 블록도.
본 명세서에서 개시되어 있는 특정한 구조적 또는 기능적 설명들은 단지 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 실시예들은 다양한 다른 형상으로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 이해되어야 한다. 예를 들어 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 표현들, 예를 들어 "~간의에"와 "바로~간의에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설명된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 해당 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
하기에서 설명될 실시예들은 운전자를 모니터링하는 데에 사용될 수 있다. 실시예들은 태블릿 컴퓨터, 스마트 폰, 스마트 가전 기기, 지능형 자동차, 웨어러블 장치 등 다양한 형상의 제품으로 구현될 수 있다. 예를 들어, 실시예들은 스마트 폰, 웨어러블 장치, 모바일 기기, 지능형 자동차 등에서 사용자로부터 측정된 심박수를 이용하여 사용자의 건강에 이상이 발생했다거나, 사용자가 졸고 있는지를 판단하여 적절한 대응책을 제공하는 데에 적용될 수 있다. 실시예들은 차량의 운행 모드가 자율 운행 모드 또는 수동 운전 모드 간의 전환이 가능한 지능형 자동차 등에 적용될 수 있다. 이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
도 1은 일 실시예에 따른 2차원 얼굴 영상과 3차원 얼굴 모델에서 대응하는 랜드마크들을 나타낸 도면이다. 도 1(a)을 참조하면, 얼굴 자세(pose)가 정면을 바라보는 2차원 얼굴 영상(110)과 2차원 얼굴 영상에 대응되는 3차원 얼굴 모델(130)이 도시된다. 또한, 도 1(b)를 참조하면, 얼굴 자세가 정면이 아닌 2차원 얼굴 영상들(140, 160, 180)과 2차원 얼굴 영상들(140, 160, 180)에 대응되는 3차원 얼굴 모델들(150, 170, 190)이 도시된다.
2차원 얼굴 영상(110)은 촬영 장비를 이용하여 수집될 수 있다. 또한, 2차원 얼굴 영상(110)의 랜드마크들은 미리 트레이닝 한 랜드마크 검출기에 의해 자동으로 검출될 수 있다. 3차원 얼굴 모델(130)의 랜드마크들은 2차원 얼굴 영상(110)에서 검출한 랜드마크들을 3차원 얼굴 모델(130)에 대응시켜 검출할 수 있다. 2차원 얼굴 영상(110)에서 검출된 2차원 랜드마크들에 기초하여 3차원 얼굴 모델에서 2차원 랜드마크들에 대응되는 3차원 랜드마크들을 설정하는 방법은 당업자에게 잘 알려져 있으므로 이에 대한 구체적인 설명은 생략한다.
이하에서는 설명의 편의를 위하여, 2차원 얼굴 영상에서 검출한 랜드마크를 '2차원 랜드마크'라고 부르고, 3차원 얼굴 모델에서 검출한 랜드마크를 '3차원 랜드마크'라고 부르기로 한다.
도 1(a)와 같이 얼굴 자세가 정면인 경우, 2차원 랜드마크들과 3차원 랜드마크들은 서로 대응되지만, 도 1(b)와 같이, 얼굴 자세가 정면이 아닌 경우, 2차원 랜드마크들과 3차원 랜드마크들은 서로 대응 관계가 유지되지 않을 수 있다.
도 2는 일 실시예에 따른 얼굴 영상의 자세를 보정하는 방법을 나타낸 흐름도이다. 도 2를 참조하면, 일 실시예에 따른 얼굴 영상의 자세를 보정하는 장치(이하, '보정 장치')는 2차원 얼굴 영상으로부터 2차원 랜드마크들을 검출한다(210).
단계(210)에서, 보정 장치는 2차원 얼굴 영상에서 얼굴 영역의 위치를 결정할 수 있다. 보정 장치는 예를 들어, MB-LBP(Multi-scale Block Local Binary Patten) 기법과 Adaboost(adaptive Boosting) 기법의 반복 알고리즘을 결합한 얼굴 검출기를 이용하여 2차원 얼굴 영상으로부터 얼굴 영역의 위치를 결정할 수 있다.
이후, 보정 장치는 예를 들어, ASM(Active Shape Model) 방법, AAM(Active Appearance Model) 방법, 및 SDM(Supervised Descent Method) 방법 등을 사용하여 2차원 얼굴 영상의 얼굴 영역으로부터 2차원 랜드마크들을 검출할 수 있다. 보정 장치는 SDM 방법을 사용하여 2차원 얼굴 영상의 얼굴 영역으로부터 자동으로 검출한 얼굴 부위의 특징점들을 2차원 얼굴 영상의 2차원 랜드마크들로 검출할 수 있다. 이때, 자동으로 검출한 얼굴 부위의 특징점들은 수동으로 측정한 랜드마크들의 개수와 동일할 수 있다. 보정 장치는 2차원 얼굴 영상에 대하여 예를 들어, 68개의 2차원 랜드마크들을 검출할 수 있다.
보정 장치는 검출된 2차원 랜드마크들에 기초하여 3차원 얼굴 모델의 초기 자세를 결정함으로써, 3차원 얼굴 모델에 포함된 3차원 랜드마크들을 설정한다(220). 보정 장치는 2차원 랜드마크들에 기초하여 3차원 얼굴 모델의 초기 자세(initial pose)를 나타내는 초기 기하 파라미터(initial geometric parameter)를 결정할 수 있다. 보정 장치는 초기 기하 파라미터에 기초하여 3차원 랜드마크들을 설정할 수 있다.
초기 기하 파라미터는 3차원 얼굴 모델의 초기 자세 정보를 포함할 수 있다. 초기 자세 정보는 3차원 얼굴 모델에 대한 회전(roll) 정보, 척도(pitch) 정보, 및 평행 이동(yaw) 정보를 포함하는 자세 정보 벡터에 의해 표현될 수 있다. 3차원 얼굴 모델의 자세 정보는 기하 파라미터에 기초하여 결정될 수 있다.
3차원 얼굴 모델의 초기 기하 파라미터는 다양한 방법들에 의해 결정될 수 있다. 3차원 얼굴 모델의 초기 기하 파라미터는 예를 들어, 경험에 기초하여 결정되거나, 일정 규칙에 의한 계산을 통해 결정될 수도 있다. 3차원 얼굴 모델의 초기 기하 파라미터를 결정하는 방법은 후술한다. 보정 장치가 3차원 랜드마크들을 설정하는 구체적인 방법은 도 3을 참조하여 설명한다.
보정 장치는 3차원 얼굴 모델의 자세 및 형상을 반복적으로 조절함으로써, 3차원 랜드마크들을 갱신한다(230). 보정 장치는 3차원 얼굴 모델의 초기 기하 파라미터를 기초로 반복 수행에 의해 3차원 랜드마크들을 갱신할 수 있다. 보정 장치는 이전 반복 과정에서 획득한 3차원 얼굴 모델의 기하 파라미터를 기초로, 3차원 랜드마크들을 갱신하고, 갱신된 3차원 랜드마크들에 기초하여 이번 반복에서의 3차원 얼굴 모델의 기하 파라미터를 획득할 수 있다.
보정 장치는 3차원 얼굴 모델의 기하 파라미터에 대한 반복 갱신을 통해 3차원 얼굴 모델의 자세를 조절할 수 있다. 다시 말해, 보정 장치는 3차원 얼굴 모델의 기하 파라미터에 기초하여 3차원 얼굴 모델의 얼굴 자세를 확정할 수 있다.
보정 장치는 예를 들면, 처음 반복 과정에서 3차원 얼굴 모델의 초기 기하 파라미터에 기초하여 3차원 랜드마크를 갱신하고, 갱신한 3차원 랜드마크에 기초하여 처음 반복한 3차원 얼굴 모델의 기하 파라미터를 계산할 수 있다. 다시 말하면, 보정 장치는 3차원 얼굴 모델의 초기의 기하 파라미터를 이전에 반복한 3차원 얼굴 모델의 기하 파라미터로 하여 3차원 랜드마크를 갱신하고, 갱신한 3차원 랜드마크에 기초하여 이번에 반복하는 3차원 얼굴 모델의 기하 파라미터를 계산할 수 있다.
보정 장치는 갱신한 3차원 랜드마크에 기초하여 3차원 얼굴 모델의 기하 파라미터를 산출하는 과정에서, 3차원 얼굴 모델의 형상 파라미터 또한 함께 산출할 수 있다.
전술한 바와 같이 보정 장치가 3차원 랜드마크들을 갱신하는 과정은 3차원 얼굴 모델의 자세 및 형상을 반복적으로 조절함으로써 수행될 수 있으며, 이때, 반복은 반복 중지 조건을 만족하는지 여부에 의해 종료될 수 있다.
보정 장치는 예를 들어, 3차원 얼굴 모델에 대하여 i-2번째 반복 수행에서 획득한 기하 파라미터와 i-1번째 반복 수행에서 획득한 기하 파라미터 사이의 편차가 미리 설정된 임계치보다 작거나, 또는, 반복 수행의 횟수가 미리 설정된 횟수(예를 들어, n 번)에 도달한 경우에 반복을 종료할 수 있다. 여기서, i는 2보다 크거나 같은 자연수이고, n은 반복 수행 과정에서 총 반복 차수를 나타낼 수 있다.
이때, 기하 파라미터들 사이의 편차는 기하 파라미터들 사이의 유클리디언 거리로도 대체될 수 있다. 임계치 및 미리 설정된 횟수는 경험칙에 의해 결정되거나, 그 외의 방법에 의한 계산을 통해 결정될 수 있다.
보정 장치는 매 번의 반복 과정을 마친 후, 반복 수행이 반복 중지 조건을 만족하는지 여부를 판단할 수 있다. 반복 수행의 결과가 반복 중지 조건을 만족하는 경우, 보정 장치는 반복을 중지하고, 마지막 반복 과정에서 획득한 3차원 얼굴 모델의 기하 파라미터 및 형상 파라미터를 최종 기하 파라미터 및 형상 파라미터로 결정할 수 있다. 반복 수행의 결과가 반복 중지 조건을 만족하지 않는 경우, 보정 장치는 다음 번 반복 과정을 수행할 수 있다. 보정 장치가 3차원 랜드마크들을 갱신하는 방법은 도 5 내지 도 7을 참조하여 설명한다.
보정 장치는 갱신된 3차원 랜드마크들에 기초하여 2차원 얼굴 영상의 자세를 보정한다(240). 보정 장치는 갱신된 3차원 랜드마크들에 기초하여 최종 반복한 3차원 얼굴 모델의 기하 파라미터를 확정하고, 확정된 기하 파라미터에 기초하여 자세 보정 후의 2차원 얼굴 영상을 확정할 수 있다. 보정 장치가 2차원 얼굴 영상의 자세를 보정하는 보다 구체적인 방법은 도 8을 참조하여 설명한다.
일 실시예에서는 현재의 3차원 얼굴 모델의 기하 파라미터에 기초하여 3차원 랜드마크들을 갱신함으로써 현재의 3차원 얼굴 모델의 기하 파라미터에 의해 확정된 3차원 랜드마크들이 2차원 랜드마크들과 여전히 대응 관계를 유지하도록 할 수 있다. 또한, 3차원 랜드마크들에 의해 최종 확정된 3차원 얼굴 모델의 기하 파라미터는 더욱 높은 정확도를 가질 수 있다.
일 실시예에서는 높은 정확도를 가지는 3차원 얼굴 모델의 기하 파라미터를 이용하여 자세를 보정한 2차원 얼굴 영상을 확정함으로써 자세를 보정한 2차원 얼굴 영상과 실제 정면 얼굴 영상 사이의 차이를 줄여 얼굴 인증 또는 식별 성능을 향상시킬 수 있다.
도 3은 일 실시예에 따른 3차원 랜드마크들을 설정하는 방법을 나타낸 흐름도이다. 도 3을 참조하면, 일 실시예에 따른 보정 장치는 단계(210)에서 검출된 2차원 랜드마크들 각각에 대하여, 얼굴 영상 데이터베이스에 저장된 2차원 얼굴 샘플 영상의 실제 측정된 랜드마크들과 검출된 2차원 랜드마크들 사이의 편차(deviation)를 측정한다(310). 이때, 2차원 얼굴 샘플 영상의 실제 측정된 랜드마크들의 개수와 검출된 2차원 랜드마크들의 개수는 서로 동일하다.
얼굴 영상 데이터베이스는 예를 들어, 복수 개의 2차원 얼굴 샘플 영상들, 2차원 얼굴 샘플 영상의 실제 측정된 랜드마크들, 및 2차원 얼굴 샘플 영상들에서 실제 측정된 기하 파라미터 등을 포함할 수 있다. 얼굴 영상 데이터베이스에 저장된 2차원 얼굴 샘플 영상들의 일 예는 도 4에 도시된다.
보정 장치는 측정된 편차에 기초하여 2차원 랜드마크들의 초기 가중치를 결정할 수 있다.
보정 장치는 2차원 랜드마크들 각각에 대하여 2차원 랜드마크들의 검출 값(좌표 값)와 2차원 얼굴 샘플 영상에서 대응되는 랜드마크들의 실제 좌표 값 사이의 유클리디언 거리(편차)를 계산할 수 있다. 보정 장치는 계산한 유클리디언 거리에 기초하여 2차원 랜드마크의 초기 가중치를 결정할 수 있다. 이때, 유클리디언 거리(편차)가 클수록 2차원 랜드마크들에 대한 신뢰도는 낮아지고, 유클리디언 거리(편차)가 작을수록 2차원 랜드마크들에 대한 신뢰도는 높아질 수 있다.
다른 실시예에 따르면, 보정 장치는 입력된 2차원 얼굴 영상으로부터 검출된 2차원 랜드마크들과 가장 유사한 랜드마크들을 가지는 2차원 얼굴 샘플 영상을 얼굴 영상 데이터베이스로부터 추출할 수 있다. 두 영상들(2차원 얼굴 영상 및 2차원 얼굴 샘플 영상)의 랜드마크들이 서로 유사하는 것은 두 영상들 사이에서 서로 대응되는 랜드마크들의 위치가 유사하다는 것을 의미할 수 있다. 보정 장치는 추출된 2차원 얼굴 샘플 영상의 랜드마크들의 편차를 입력 영상으로부터 검출된 2차원 랜드마크들의 편차로 설정할 수 있다. 여기서, 추출된 2차원 얼굴 샘플 영상의 랜드마크들의 편차는 미리 계산되어 데이터베이스에 저장되어 있을 수 있다. 보정 장치는 검출된 랜드마크들의 편차에 기초하여 초기 가중치를 결정할 수 있다.
보정 장치는 측정된 편차를 기초로 2차원 랜드마크들을 정렬할 수 있다(320).
보정 장치는 정렬된 2차원 랜드마크들 중 측정된 편차가 미리 설정된 기준보다 높은 값을 가지는 일부 2차원 랜드마크들을 선택할 수 있다(330).
보정 장치는 일부 2차원 랜드마크들에게 측정된 편차와 반비례하게 초기 가중치를 산출할 수 있다(340). 이때, 가중치는 가중 행렬의 형태를 가질 수 있다. 보정 장치는 예를 들어, 측정된 편차가 클수록 초기 가중치를 작게 할당하고, 측정된 편차가 작을수록, 초기 가중치를 크게 할당할 수 있다.
보정 장치는 제1 에너지 함수를 최소화하는 초기 기하 파라미터를 결정할 수 있다(350). 보정 장치는 단계(340)에서 산출한 초기 가중치, 단계(210)에서 검출된 2차원 랜드마크들에 기초하여 3차원 얼굴 모델의 초기 기하 파라미터를 산출할 수 있다. 보정 장치는 예를 들어, 아래의 <수학식 1>과 같은 제1 에너지 함수(E1)를 최소화하는 초기 기하 파라미터를 산출할 수 있다.
Figure 112015118281023-pat00001
여기서,
Figure 112015118281023-pat00002
은 단계(340)에서 산출한 초기 가중치(초기 가중 행렬)이고,
Figure 112015118281023-pat00003
은 초기 기하 파라미터 g 에 대응되는 3차원 랜드마크들을 2차원으로 투영하여 획득한 2차원 랜드마크들의 투영 좌표 값을 포함한 행렬이다.
Figure 112015118281023-pat00004
은 단계(210)에서 검출된 2차원 랜드마크의 검출 값(좌표 값)을 포함한 행렬이다.
2차원 랜드마크들의 검출 값(좌표 값)이 실제 값에 근접할수록 2차원 랜드마크들의 초기 가중치는 커지고, 2차원 랜드마크들의 검출 값이 실제 값에서 멀어질수록 2차원 랜드마크들의 초기 가중치는 작아질 수 있다.
일 실시예에 따른 에너지 함수는 랜드마크 검출기가 검출한, 편차가 비교적 작은 2차원 랜드마크들에 의한 영향을 강화하고, 편차가 비교적 큰 2차원 랜드마크들에 의한 영향을 감소시킴으로써 3차원 얼굴 모델의 초기 기하 파라미터의 정확도를 향상시킬 수 있다.
보정 장치는 예를 들어, 기울기 감소(Gradient Descent) 알고리즘을 이용하여 제1 에너지 함수를 최소화하는 초기 기하 파라미터를 결정할 수 있다. 기울기 감소 알고리즘은 임의의 함수에 대한 최소값을 찾는 알고리즘으로 당업자에게 잘 알려져 있으므로 이에 대한 추가적인 설명은 생략한다.
보정 장치는 초기 기하 파라미터에 기초하여 3차원 랜드마크들을 설정할 수 있다(360). 보정 장치가 초기 기하 파라미터를 이용하여 3차원 랜드마크들을 설정하는 방법의 일 예는 다음과 같다.
초기 기하 파라미터가 산출되면, 보정 장치는 3차원 모델을 초기 기하 파라미터 값을 기준으로 회전시킬 수 있다, 보정 장치는 회전시킨 3차원 모델을 2D로 투영(projection)하여 2D 텍스쳐 영상을 획득할 수 있다. 보정 장치는 획득한 2D 텍스쳐 영상으로부터 랜드마크(2D 랜드마크)(들)을 검출할 수 있다. 이때, 보정 장치는 앞서 3차원 모델을 2D로 프로젝션 하였으므로, 2D 데이터에 대응되는 3D 데이터를 알 수 있다. 보정 장치는 2D 텍스쳐 영상에서의 2D 랜드마크(들)에 대응되는 3차원 모델 상에서의 랜드마크(들)의 위치를 찾아 3D 랜드마크들을 설정할 수 있다.
도 4는 일 실시예에 따른 얼굴 영상 데이터베이스에 저장된 2차원 얼굴 샘플 영상들을 나타낸 도면이다. 도 4를 참조하면, 얼굴 영상 데이터베이스는 미리 수집된 복수의 2차원 얼굴 샘플 영상들을 포함할 수 있다. 2차원 얼굴 샘플 영상들은 자유로운 환경(unconstrained circumstances) 하에서 수집된 것일 수 있다.
2차원 얼굴 샘플 영상들의 얼굴 영역에 대한 랜드마크들(410)은 수동으로 설정될 수 있다. 2차원 얼굴 샘플 영상들의 얼굴 영역에 대하여는 예를 들어, 68개의 랜드마크들이 설정될 수 있다. 수동으로 설정된 랜드마크들(410)은 2차원 얼굴 샘플 영상의 실제 측정된 2차원 랜드마크들이 될 수 있다. 2차원 얼굴 샘플 영상의 실제 측정된 2차원 랜드마크들은 얼굴 영상의 자세를 보정하는 후속 과정에서 2차원 랜드마크들 간의 평균 편차와 2차원 랜드마크의 가중치를 결정하는 데에 이용될 수 있다.
얼굴 영상 데이터베이스에 포함된 모든 2차원 얼굴 샘플 영상의 (얼굴 영역에 대한) 자세 정보(430) 또한 수동으로 측정될 수 있다. 2차원 얼굴 샘플 영상들의 자세 정보(430)는 실제 측정된 기하 파라미터를 포함하는 자세 정보 벡터에 의해 표현될 수 있다. 자세 정보 벡터는 예를 들어, (회전(roll), 척도(pitch), 및 평행 이동(yaw))의 형태로 표현될 수 있다.
도 4에 도시된 2차원 얼굴 샘플 영상들의 자세 정보 벡터는 좌에서 우로, 각각 (6.2,0.2,18.2), (-1.6,5.6,34.7), (-4.6,9.6,-29.5), (-9.3,7.4,13.9)와 (5.4,11.3,6.9)일 수 있다.
도 5는 일 실시예에 따른 3차원 랜드마크들을 갱신하는 방법을 나타낸 흐름도이다. 도 5를 참조하면, 일 실시예에 따른 보정 장치는 단계(350)에서 결정된 초기 기하 파라미터에 기초하여 3차원 랜드마크들을 갱신할 수 있다(510).
보정 장치가 초기 기하 파라미터에 기초하여 3차원 랜드마크들을 갱신하는 방법은 도 6을 참조하여 설명한다.
보정 장치는 갱신된 3차원 랜드마크들의 가중치를 결정할 수 있다(520). 보정 장치가 3차원 랜드마크들의 가중치를 결정하는 방법은 도 7을 참조하여 설명한다.
보정 장치는 가중치에 기초하여, 제2 에너지 함수를 최소화하는 3차원 얼굴 모델의 기하 파라미터 및 형상 파라미터를 결정할 수 있다(530). 보정 장치는 가중치 외에도 단계(510)에서 갱신된 3차원 랜드마크들 및 2차원 텍스처 영상으로부터 검출된 새로운 2차원 랜드마크들에 기초하여 3차원 얼굴 모델의 기하 파라미터 및 형상 파라미터를 결정할 수 있다. 여기서, '새로운 2차원 랜드마크들'은 초기 기하 파라미터에 기초하여 자세가 조정된 3차원 얼굴 모델을 2차원으로 투영하여 획득한 2차원 텍스처 영상으로부터 검출된 랜드마크들로 이해될 수 있다.
보정 장치는 예를 들어, 아래의 <수학식 2>와 같은 제2 에너지 함수(
Figure 112015118281023-pat00005
)를 이용하여 3차원 얼굴 모델의 기하 파라미터와 형상 파라미터를 결정할 수 있다.
Figure 112015118281023-pat00006
여기서,
Figure 112015118281023-pat00007
은 단계(520)에서 결정된 갱신된 3차원 랜드마크들의 가중 행렬(가중치)을 나타낸다.
Figure 112015118281023-pat00008
는 기하 파라미터 g 및 형상 파라미터 c에 대응되는 3차원 랜드마크들을 2차원으로 투영하여 획득한 2차원 랜드마크의 투영 좌표 값을 포함한 행렬을 나타낸다. η 은 재구성 후의 3차원 형상이 얼굴 공간 내에 위치하고, 자연스럽게 보이는 것을 보증하는 정규화 파라미터(regularization parameter)이다.
2차원 랜드마크들의 검출 값(좌표 값)이 실제 값에 근접할수록 2차원 랜드마크들의 가중치는 커지고, 2차원 랜드마크들의 검출 값이 실제 값에서 멀어질수록 2차원 랜드마크들의 가중치는 작아질 수 있다.
일 실시예에 따른 제2 에너지 함수(
Figure 112015118281023-pat00009
)는 반복 과정을 통해 편차가 비교적 작은 2차원 랜드마크들에 의한 영향을 강화하고, 편차가 비교적 큰 2차원 랜드마크들에 의한 영향을 감소시킴으로써 3차원 얼굴 모델의 기하 파라미터의 정확도를 향상시킬 수 있다.
일 실시예에서는 최종 반복에 의해 3차원 얼굴 모델의 기하 파라미터로 확정된 3차원 얼굴 모델의 자세 정보의 정확도를 향상시킴으로써 3차원 얼굴 모델로 투영한 2차원 얼굴 영상의 정확도를 향상시켜 얼굴 식별 성능을 향상시킬 수 있다.
도 6은 일 실시예에 따른 초기 기하 파라미터에 기초하여 3차원 랜드마크들을 갱신하는 방법을 나타낸 흐름도이다.
도 6을 참조하면, 일 실시예에 따른 보정 장치는 단계(350)에서 결정된 초기 기하 파라미터에 기초하여 3차원 얼굴 모델의 자세를 조정(adjust)할 수 있다(610).
보정 장치는 자세가 조정된 3차원 얼굴 모델을 2차원으로 투영하여 2차원 텍스처 영상을 획득할 수 있다(620).
보정 장치는 2차원 텍스처 영상으로부터 새로운 2차원 랜드마크들을 검출하고(630), 새로운 2차원 랜드마크들에 대응되는 3차원 랜드마크들을 탐색할 수 있다(640).
보정 장치는 탐색된 3차원 랜드마크들에 의해 3차원 랜드마크들을 갱신할 수 있다(650).
도 7은 일 실시예에 따른 갱신된 3차원 랜드마크들의 가중치를 결정하는 방법을 나타낸 흐름도이다. 도 7을 참조하면, 일 실시예에 따른 보정 장치는 단계(350)에서 결정된 초기 기하 파라미터로부터 3차원 얼굴 모델의 현재 자세 정보를 획득할 수 있다(710).
보정 장치는 미리 저장된 얼굴 영상 데이터베이스에서, 3차원 얼굴 모델의 현재 자세 정보에 인접한 자세 정보를 검색할 수 있다(720).
보정 장치는 얼굴 영상 데이터베이스에서 인접한 자세 정보에 대응되는 2차원 얼굴 샘플 영상을 검색할 수 있다(730). 보정 장치는 미리 수집한 얼굴 영상 데이터베이스에서 현재 자세 정보와 동일 또는 인접한 자세 정보의 2차원 얼굴 샘플 영상을 검색할 수 있다. 여기서, '현재 자세 정보에 인접한 자세 정보'는 현재 자세 정보와 동일한 또는 인접한 자세 정보 사이의 편차가 미리 설정된 한계값 범위 내에 있는 자세 정보를 포함할 수 있다.
보정 장치는 검색된 2차원 얼굴 샘플 영상에 대응하는 2차원 랜드마크들과 새로운 2차원 랜드마크들 사이의 제2 편차에 기초하여, 2차원 랜드마크들의 가중치를 결정할 수 있다(740). 단계(740)에서, 보정 장치는 제2 편차의 평균값을 산출하고, 제2 편차의 평균값에 반비례하여 2차원 랜드마크의 가중치를 결정할 수 있다.
보정 장치는 단계(740)에서 결정된 2차원 랜드마크의 가중치를 3차원 랜드마크들의 가중치로 갱신할 수 있다(750).
도 8은 일 실시예에 따른 2차원 얼굴 영상의 자세를 보정하는 방법을 나타낸 흐름도이다. 도 8을 참조하면, 일 실시예에 따른 보정 장치는 반복 수행에 의해 최종적으로 산출된 최종 기하 파라미터 및 최종 형상 파라미터에 기초하여 3차원 얼굴 모델을 재구성(또는 변환)할 수 있다(810).
보정 장치는 재구성된 3차원 얼굴 모델을 2차원으로 투영하여 2차원 얼굴 영상의 자세를 보정함으로써 자세가 보정된 2차원 얼굴 영상을 획득할 수 있다(820).
도 9는 다른 실시예에 따른 얼굴 영상의 자세를 보정하는 방법을 나타낸 흐름도이다. 도 9를 참조하면, 일 실시예에 따른 보정 장치는 2차원 얼굴 영상을 획득하고(910), 획득한 2차원 얼굴 영상으로부터 2차원 랜드마크들을 검출할 수 있다(920). 도 9의 단계(920) 내지 단계(950)의 과정은 도 2의 단계(210) 내지 단계(240)의 과정과 동일하므로 해당 부분의 설명을 참고하기로 한다.
보정 장치는 단계(950)에서 자세가 보정된 2차원 얼굴 영상에 대하여 배경 보존 텍스처(background preserving texture)를 맵핑할 수 있다(960). 보정 장치가 배경 보존 텍스처를 맵핑하는 방법은 도 10을 참조하여 설명한다.
도 10은 일 실시예에 따른 배경 보존 텍스처를 맵핑하는 방법을 나타낸 흐름도이다. 도 10을 참조하면, 일 실시예에 따른 보정 장치는 2차원 얼굴 영상의 픽셀 색상을 기초로, 재구성된 3차원 얼굴 모델(의 정점)에 색상을 부여하여 3차원 텍스처 모델을 결정할 수 있다(1010). 보정 장치는 예를 들어, 최종 반복으로 획득한 3차원 얼굴 모델의 기하 파라미터 및 형상 파라미터를 기초로, 3차원 얼굴 모델에서 가려진 정점의 대칭점 또한 가려졌는지를 판단하여 정점의 대칭점의 텍스처(또는 색상)이나 3차원 텍스처 모델의 텍스처의 평균(색상의 평균)을 정점에 할당할 수 있다. 보정 장치가 3차원 텍스처 모델을 결정하는 방법은 도 11을 참조하여 설명한다.
보정 장치는 3차원 텍스처 모델을 2차원으로 투영한 얼굴 영상에서 얼굴 영역 이외의 배경 영역에 대한 픽셀 색상을 결정할 수 있다(1020). 보정 장치는 예를 들어, 이중 선형 보간법(Bilinear interpolation)을 이용하여 3차원 얼굴 얼굴 모델에 대응하는 2차원 얼굴 영상 중 검은 점(black dot)로 채워진 부분과 같이 색상 값이 부여되지 않은 배경 영역에 색상 값을 부여할 수 있다. 보정 장치가 배경 영역에 대한 픽셀 색상을 결정하는 방법은 도 13을 참조하여 설명한다.
도 11은 일 실시예에 따른 3차원 텍스처 모델을 결정하는 방법을 나타낸 흐름도이다. 도 11을 참조하면, 일 실시예에 따른 보정 장치는 최종 기하 파라미터 및 최종 형상 파라미터에 기초하여 2차원 얼굴 영상에 재구성된 3차원 얼굴 모델의 정점들(vertexes)을 피팅(fitting)할 수 있다(1110).
보정 장치는 재구성된 3차원 얼굴 모델의 정점들에 피팅된 2차원 얼굴 영상의 텍스처를 할당할 수 있다(1120).
보정 장치는 최종 기하 파라미터 및 최종 형상 파라미터에 기초하여, 3차원 얼굴 모델에서 가려진 정점(occluded vertex)을 결정할 수 있다(1130).
보정 장치는 가려진 정점에 대한 텍스처를 할당할 수 있다(1140). 보정 장치가 가려진 정점에 대한 텍스처를 할당하는 방법은 도 12를 참조하여 설명한다.
도 12는 일 실시예에 따른 가려진 정점에 대한 텍스처를 할당하는 방법을 나타낸 흐름도이다. 도 12를 참조하면, 일 실시예에 따른 보정 장치는 3차원 얼굴 모델에서 가려진 정점의 대칭점이 가려졌는지 여부를 판단할 수 있다(1210).
단계(1210)의 판단 결과, 대칭점이 가려졌다면, 보정 장치는 3차원 텍스처 모델의 텍스처의 평균(색상의 평균)을 정점에 할당할 수 있다(1220).
단계(1210)의 판단 결과, 대칭점이 가려지지 않았다면, 보정 장치는 대칭점의 텍스처(또는 색상)를 가려진 정점에 할당할 수 있다(1230).
도 13은 일 실시예에 따른 배경 영역에 대한 픽셀 영상을 결정하는 방법을 나타낸 흐름도이다. 도 13을 참조하면, 일 실시예에 따른 보정 장치는 2차원으로 투영한 얼굴 영상에서 배경 영역에 대한 추가 랜드마크들을 설정할 수 있다(1310).
보정 장치는 3차원 텍스처 모델에서 추가 랜드마크들의 대응점(또는 대응 픽셀)을 검색할 수 있다(1320).
보정 장치는 구간적 아핀 변환(piece-wise affine transformation)을 수행하여 추가 랜드마크들의 대응점에 대한 색상 값을 획득할 수 있다(1330). 아핀 변환은 세 개의 점들에 의해 기하학적으로 성립될 수 있다. 하나의 기하체에 아핀 변환을 적용하게 되면 변환된 기하체는 원래 기하체와 평행 관계를 유지하게 된다. 이때, 기하체의 이동, 회전, 스케일(scale), 그리고 이들의 결합 등이 아핀 변환에 해당될 수 있다.
보정 장치는 획득된 색상 값을 배경 영역에 대한 픽셀 색상으로 결정할 수 있다(1340).
도 14는 다른 실시예에 따른 얼굴 영상의 자세를 보정하는 방법을 나타낸 흐름도이다.
도 14를 참조하면, 일 실시예에 따른 보정 장치는 2차원 얼굴 영상을 획득하고, 획득한 2차원 얼굴 영상으로부터 2차원 랜드마크들을 검출할 수 있다(1410). 보정 장치는 다양한 종류의 랜드마크 검출기들에 의해 2차원 랜드마크들을 검출할 수 있다.
보정 장치는 2차원 랜드마크들의 가중치를 초기화할 수 있다(1420). 보정 장치가 2차원 랜드마크들의 가중치를 초기화하는 방법은 도 16을 참조하여 설명한다.
보정 장치는 기하 파라미터를 초기화 할 수 있다(1430). 보정 장치는 전술한 <수학식 1>을 이용하여 기하 파라미터를 초기화할 수 있다. 보정 장치는 기울기 감소 알고리즘에 의해 <수학식 1>의 에너지 함수를 최소화하는 기하 파라미터를 구할 수 있다.
보정 장치는 초기화된 기하 파라미터에 기초하여 3차원 랜드마크들을 갱신할 수 있다(1440). 보정 장치가 3차원 랜드마크들을 갱신하는 방법은 도 17을 참조하여 설명한다.
보정 장치는 갱신된 3차원 랜드마크들의 가중치를 갱신할 수 있다(1450). 보정 장치가 3차원 랜드마크들의 가중치를 갱신하는 방법은 도 18을 참조하여 설명한다.
보정 장치는 단계(1420) 및 단계(1450)에서, 얼굴 영상 데이터베이스(1405)에 저장된 2차원 얼굴 샘플 영상의 실제 검출된 랜드마크와 2차원 랜드마크(또는 3차원 랜드마크) 사이에 산출된 신뢰도(1415)를 이용할 수 있다. 보정 장치가 신뢰도를 산출하는 방법은 도 15를 참조하여 설명한다.
보정 장치는 산출된 신뢰도에 기초하여 2차원 랜드마크들(또는 3차원 랜드마크들)의 가중치를 갱신하고(1450), 갱신된 가중치에 기초하여 기하 파라미터 및 형상 파라미터를 갱신할 수 있다(1460).
보정 장치는 갱신된 기하 파라미터와 갱신 이전의 기하 파라미터 간의 편차(유클리디언 거리)가 미리 설정된 기준값(예를 들어, 5 도(degree))에 수렴하는지 여부를 판단할 수 있다(1470).
단계(1470)의 판단 결과, 편차가 미리 설정된 기준값에 수렴하지 않는다면, 보정 장치는 3차원 랜드마크들을 다시 갱신할 수 있다(1440).
일 실시예에서는 3차원 얼굴 모델의 3차원 랜드마크들을 반복적으로 갱신함으로써 현재의 얼굴 영상의 자세에서 확정한 3차원 랜드마크들과 2차원 랜드마크들 간의 대응 관계가 유지되도록 할 수 있다.
또한, 일 실시예에서는 3차원 얼굴 모델의 3차원 랜드마크들을 점차적으로 갱신함으로써 대응 관계가 없는 2차원 랜드마크와 3차원 랜드마크를 사용하여 계산할 때에 발생할 수 있는 실제 정면의 얼굴 영상과 보정된 얼굴 영상 간의 오차를 줄일 수 있다.
단계(1470)의 판단 결과, 편차가 미리 설정된 기준값에 수렴한다면, 보정 장치는 최종적으로 자세가 보정된 2차원 얼굴 영상에 대하여 배경 보존 텍스처를 맵핑할 수 있다(1480). 일 실시예에서는 최종적으로 자세가 보정된 2차원 얼굴 영상에 대하여 배경 보존 텍스처를 맵핑함으로써 얼굴 영역 주변에 대하여 부정확한 설정된 랜드마크들로 인한 텍스처 맵핑 에러를 해결할 수 있다. 보정 장치가 배경 보존 텍스처를 맵핑하는 방법은 도 19를 참조하여 설명한다.
도 15는 일 실시예에 따른 신뢰도를 산출하는 방법을 나타낸 흐름도이다. 도 15를 참조하면, 일 실시예에 따른 보정 장치는 얼굴 영상 데이터베이스에 저장된 2차원 얼굴 샘플 영상에 대한 랜드마크들을 실제 검출할 수 있다(1510).
보정 장치는 단계(1510)에서 검출된 랜드마크들과 2차원 얼굴 영상으로부터 검출된 2차원 랜드마크들 사이의 편차(또는 유클리디안 거리)를 산출할 수 있다(1520).
보정 장치는 편차의 통계(예를 들어, 평균 편차)를 산출할 수 있다(1530). 보정 장치는 얼굴 영상 데이터베이스에 저장된 특정 기하 파라미터에 인접한 모든 2차원 얼굴 샘플 영상에 대하여 검출된 랜드마크들과 2차원 얼굴 영상으로부터 검출된 2차원 랜드마크들 사이의 평균 편차를 산출할 수 있다.
보정 장치는 얼굴 영상 데이터베이스 중 모든 정면 자세에서의 2차원 얼굴 샘플 영상에서 오프라인으로 검출한 랜드마크들의 검출값과 2차원 얼굴 영상으로부터 검출된 2차원 랜드마크들의 검출값 사이의 평균 편차를 산출할 수 있다. 보정 장치는 평균 편차가 작은 일부 2차원 랜드마크들을 선택하고, 선택한 2차원 랜드마크들에 대하여 평균 편차에 반비례하게 서로 다른 가중치를 부여할 수 있다. 보정 장치는 예를 들어, 얼굴 영상에 대한 68개의 2차원 랜드마크들 중 평균 편차가 작은 상위의 25개의 2차원 랜드마크들을 선택하고, 선택된 2차원 랜드마크들에 대하여 평균 편차에 반비례하게 서로 다른 가중치를 부여할 수 있다.
도 16은 일 실시예에 따른 랜드마크들의 가중치를 초기화하는 방법을 나타낸 흐름도이다. 도 16을 참조하면, 일 실시예에 따른 보정 장치는 N 개의 검출된 2차원 랜드마크들 중 서브 셋들(subsets)을 선택할 수 있다(1610). 보정 장치는 N 개의 검출된 2차원 랜드마크들에 대하여 2차원 얼굴 샘플 영상의 실제 검출된 랜드마크들과의 사이의 편차를 산출하고, 산출된 편차를 기초로 2차원 랜드마크들을 정렬할 수 있다. 보정 장치는 예를 들어, 측정된 편차가 증가하는 순서로 N 개의 2차원 랜드마크들을 정렬할 수 있다. 보정 장치는 정렬된 N 개의 2차원 랜드마크들 중 측정된 편차가 미리 설정된 기준보다 낮은 값을 가지는 상위 n 개의 2차원 랜드마크들을 선택할 수 있다.
보정 장치는 선택된 서브 셋들(상위 n 개의 2차원 랜드마크들)에 대하여 가중치를 할당할 수 있다(1620). 보정 장치는 측정된 편차가 미리 설정된 기준보다 낮은 값을 가지는 n 개의 2차원 랜드마크들에 대해 측정된 편차와 반비례하게 가중치(초기 가중치)를 할당할 수 있다.
도 17은 일 실시예에 따른 3차원 랜드마크들을 갱신하는 방법을 나타낸 흐름도이다. 도 17을 참조하면, 일 실시예에 따른 보정 장치는 현재의 기하 파라미터에 의해 회전시켜 가며 3차원 얼굴 모델의 자세를 조절할 수 있다(1710).
보정 장치는 자세가 조절된 3차원 얼굴 모델에 대한 텍스처를 맵핑할 수 있다(1720). 보정 장치는 자세가 조정된 3차원 얼굴 모델을 2차원으로 투영하여 2차원 텍스처 영상을 획득함으로써 자세가 조절된 3차원 얼굴 모델에 대한 텍스처를 맵핑할 수 있다.
보정 장치는 랜드마크들을 검출할 수 있다(1730). 보정 장치는 2차원 텍스처 영상으로부터 새로운 2차원 랜드마크들을 검출할 수 있다.
보정 장치는 2차원 랜드마크들을 3차원 랜드마크들로 맵핑할 수 있다(1740).
보정 장치는 새로운 2차원 랜드마크들에 대응되는 3차원 랜드마크들을 탐색하고, 탐색된 3차원 랜드마크들에 의해 3차원 랜드마크들을 갱신할 수 있다.
도 18은 일 실시예에 따른 랜드마크들의 가중치를 갱신하는 방법을 나타낸 흐름도이다. 도 18을 참조하면, 일 실시예에 따른 보정 장치는 기하 파라미터들을 추정할 수 있다(1810).
보정 장치는 단계(1810)에서 추정된 기하 파라미터들에 기초하여 이웃(neighborhood)을 검색할 수 있다(1820). 여기서, '이웃'은 3차원 얼굴 모델의 현재 자세 정보에 인접한 자세 정보, 다시 말해, 현재 자세 정보와 인접한 자세 정보 사이의 편차가 미리 설정된 한계값 범위 내에 있는 자세 정보로 이해될 수 있다.
보정 장치는 미리 저장된 얼굴 영상 데이터베이스에서 3차원 얼굴 모델의 현재 자세 정보에 인접한 자세 정보를 검색할 수 있다.
보정 장치는 이웃에 대하여 가중치를 할당할 수 있다(1830). 보정 장치는 얼굴 영상 데이터베이스에서 인접한 자세 정보에 대응되는 2차원 얼굴 샘플 영상을 검색할 수 있다. 보정 장치는 검색된 2차원 얼굴 샘플 영상에 대응하는 2차원 랜드마크들과 새로운 2차원 랜드마크들 사이의 제2 편차에 기초하여 2차원 랜드마크들의 가중치를 결정할 수 있다. 보정 장치는 제2 편차에 반비례하게 2차원 랜드마크들의 가중치를 결정할 수 있다.
도 19는 일 실시예에 따른 배경 보존 텍스처를 맵핑하는 방법을 나타낸 흐름도이다. 도 19를 참조하면, 일 실시예에 따른 보정 장치는 정점의 색상을 할당할 수 있다(1910). 보정 장치는 2차원 얼굴 영상에 재구성된 3차원 얼굴 모델의 정점들(vertexes)을 피팅(fitting)함으로써 정점의 색상을 할당할 수 있다.
보정 장치는 텍스처를 맵핑할 수 있다(1920). 보정 장치는 재구성된 3차원 얼굴 모델의 정점들에 피팅된 2차원 얼굴 영상의 텍스처를 할당하고, 최종 기하 파라미터 및 최종 형상 파라미터에 기초하여, 3차원 얼굴 모델에서 가려진 정점(occluded vertex)을 결정할 수 있다. 보정 장치는 가려진 정점에 대한 텍스처를 할당할 수 있다.
보정 장치는 이중 선형 보간(bilinear interpolation)을 수행할 수 있다(1930). 보정 장치는 이중 선형 보간을 이용하여 3차원 텍스처 모델을 2차원으로 투영한 얼굴 영상에서 얼굴 영역 이외의 배경 영역에 대한 픽셀 색상을 결정할 수 있다.
보정 장치는 배경을 워핑(warping)할 수 있다(1940). 워핑은 영상을 늘리거나 크기를 조절하는 기하학적인 처리를 말한다. 워핑은 스케일링(scaling)과 달리 크기 변화의 정도가 영상 전체에 대해 균일하지 않을 수 있다. 보정 장치가 배경을 워핑하는 방법은 도 20을 참조하여 설명한다.
도 20은 일 실시예에 따른 배경을 워핑하는 방법을 설명하기 위한 도면이다. 도 20을 참조하면, 일 실시예에 따른 보정 장치는 단계(1930)에서 배경 영역에 대한 픽셀 색상이 결정된 후, 2차원 얼굴 영상에서 배경 영역에 대한 추가 랜드마크들(2010)을 설정할 수 있다. 보정 장치는 최종적으로 자세가 보정된 2차원 얼굴 영상에서 얼굴 영역 외각에 대응하는 픽셀 정점들을 설정할 수 있다.
보정 장치는 삼각 측량을 이용하여 픽셀 정점들에 대응하는 3각형(2020)들 간의 구간적 아핀 변환을 수행하여 추가 랜드마크들의 대응점(대응 픽셀)의 색상 값을 획득할 수 있다. 이를 통해 일 실시예에서는 부정확한 랜드마크의 위치에 의해 발생하는 얼굴 영역의 분실 문제를 피할 수 있고, 얼굴 영상의 정확률을 향상시킬 수 있다. 보정 장치는 최종적으로 자세가 보정된 2차원 얼굴 영상을 2030 부분에 결합할 수 있다.
도 21은 일 실시예에 따른 얼굴 영상의 자세를 보정하는 방법의 수행 과정에서 출력되는 영상들을 나타낸 도면이다. 일 실시예에 따라 얼굴 영상의 자세를 보정하는 과정에 따른 영상의 변화는 다음과 같다.
도 21(a)는 보정 장치로 입력되는 2차원 얼굴 영상을 나타낸다. 이때, 2차원 얼굴 영상은 도 21(a)와 같은 비정면 자세일 수도 있다.
보정 장치는 도 21(a)의 2차원 얼굴 영상으로부터 도 21(b)와 같이 2차원 랜드마크들을 자동으로 검출할 수 있다.
보정 장치는 도 21(c)와 같이 3차원 얼굴 모델의 랜드마크들을 자동으로 검출하여 랜드마크들의 초기 가중치를 결정할 수 있다.
보정 장치는 도 21(d)와 같이, 3차원 얼굴 모델에 대하여 자세를 보정하고, 자세가 보정된 3차원 얼굴 모델에서 랜드마크들을 자동으로 검출하여 랜드마크들의 가중치를 결정할 수 있다.
보정 장치는 도 21(e)와 같이, 2차원 랜드마크들과 3차원 얼굴 모델의 3차원 랜드마크들을 매칭할 수 있다. 보정 장치는 랜드마크들의 매칭 결과에 기초하여, 도 21(f)와 같이 3차원 얼굴 모델을 재구성할 수 있다.
보정 장치는 도 21(g)와 같이, 3차원 얼굴 모델의 정점에 대하여 색상을 부여할 수 있다. 보정 장치는 도 21(h)와 같이, 3차원 얼굴 모델을 2차원으로 투영하여 자세가 보정된 2차원 얼굴 영상을 획득하고, 얼굴 영역 이외의 배경 영역의 정점(픽셀 포인트)에 대하여 색상을 부여할 수 있다.
도 21(i)는 실제의 정면 얼굴 영상을 나타낸다.
도 21(h)와 도 21(i)를 비교하면, 일 실시예에 따라 얼굴 영상의 자세를 보정하여 획득한 2차원 얼굴 영상과 실제의 정면 얼굴 영상이 비교적 근접함을 알 수 있다.
도 22는 일 실시예에 따른 얼굴 영상의 자세를 보정하는 장치의 블록도이다.
도 22를 참조하면, 일 실시예에 따른 보정 장치(2200)는 수신부(2210), 프로세서(2230), 및 메모리(2250)를 포함한다. 수신부(2210), 프로세서(2230), 및 메모리(2250)는 버스(2270)를 통하여 서로 통신할 수 있다.
수신부(2210)는 2차원 얼굴 영상을 수신한다.
프로세서(2230)는 2차원 얼굴 영상으로부터 검출한 2차원 랜드마크들에 기초하여 3차원 얼굴 모델의 초기 자세를 결정함으로써, 3차원 얼굴 모델에 포함된 3차원 랜드마크들을 설정한다. 프로세서(2230)는 3차원 얼굴 모델의 자세 및 형상을 반복적으로 조절함으로써 3차원 랜드마크들을 갱신하고, 갱신된 3차원 랜드마크들에 기초하여 2차원 얼굴 영상의 자세를 보정한다.
메모리(2250)는 얼굴 영상 데이터베이스를 저장할 수 있다. 얼굴 영상 데이터베이스는 예를 들어, 복수 개의 2차원 얼굴 샘플 영상들, 2차원 얼굴 샘플 영상의 실제 검출된 랜드마크들, 및 2차원 얼굴 샘플 영상들에서 실제 측정된 기하 파라미터 등을 포함할 수 있다.
이 밖에도, 프로세서(2230)는 도 1 내지 도 21을 통하여 전술한 적어도 하나의 방법을 수행할 수 있다. 프로세서(2230)는 프로그램을 실행하고, 보정 장치(2200)를 제어할 수 있다. 프로세서(2230)에 의하여 실행되는 프로그램 코드는 메모리(2250)에 저장될 수 있다. 보정 장치(2200)는 입출력 장치(도면 미 표시)를 통하여 외부 장치(예를 들어, 퍼스널 컴퓨터 또는 네트워크)에 연결되고, 데이터를 교환할 수 있다.
도 1 내지 도 21을 통하여 전술한 적어도 하나의 방법은 태블릿, 스마트 폰, 또는 웨어러블 디바이스 내의 프로세서에서 동작하는 앱 형상으로도 구현되거나, 칩 형상으로 구현되어 스마트 폰, 웨어러블 디바이스, 지능형 자동차 또는 기타 사용자 인증 장치 내에 내장될 수 있다.
도 23은 다른 실시예에 따른 얼굴 영상의 자세를 보정하는 장치의 블록도이다. 도 23을 참조하면, 일 실시예에 따른 보정 장치(2300)는 2차원 영상 획득부(2310), 랜드마크 설정부(2330), 반복 수행부(2350) 및 영상 보정부(2370)를 포함할 수 있다.
2차원 영상 획득부(2310)는 보정할 2차원 얼굴 영상을 획득한다.
랜드마크 설정부(2330)는 보정할 2차원 얼굴 영상의 2차원 랜드마크를 검출하고, 또한 3차원 얼굴 모델에서 검출한 2차원 랜드마크와 대응하는 3차원 랜드마크를 확정한다.
반복 수행부(2350)는 랜드마크 확정부(701)가 확정한 3차원 랜드마크에 기초하여 반복 계산의 방법을 이용하여 3차원 랜드마크를 갱신 한다.
실제 응용에서, 반복 계산부(702)는 반복 계산 과정에서 그전에 반복한 3차원 얼굴 모델의 기하 파라미터를 응용하여 3차원 랜드마크를 갱신하고 갱신한 3차원 랜드마크에 기초하여 이번에 반복한 기하 파라미터를 계산한다.
반복 계산부(702)가 반복 계산을 할 때의 반복 중지 조건은 구체적으로 인접한 두 번의 반복 과정으로 획득한 3차원 얼굴 모델의 기하 파라미터 사이의 유클리디언 거리가 한계 값보다 작거나 또는 반복 차수가 설정 값에 도달하는 것일 수 있다.
반복 중지 조건을 만족하지 않을 때, 반복 계산부(702)는 그전에 반복한 3차원 얼굴 모델의 기하 파라미터를 응용하여 3차원 랜드마크를 갱신하고 갱신한 3차원 랜드마크에 기초하여 이번에 반복한 기하 파라미터를 계산하며, 그러지 않으면 반복 계산부(702)는 최종 반복한 3차원 얼굴 모델의 기하 파라미터로 되돌아 간다.
영상 보정부(2370)는 반복 계산부(702)가 갱신한 3차원 랜드마크에 기초하여 자세 보정 후의 2차원 얼굴 영상을 확정한다.
2차원 얼굴 영상 보정부(703)는 구체적으로 반복 계산부(702)가 갱신 후의 3차원 랜드마크에 기초하여 최종 반복한 기하 파라미터를 확정하고 최종 반복으로 획득한 기하 파라미터에 기초하여 자세 보정 후의 2차원 얼굴 영상을 확정한다.
이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형상으로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형상으로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
2200: 보정 장치
2210: 수신부
2230: 프로세서
2250: 메모리
2270: 버스

Claims (20)

  1. 2차원 얼굴 영상으로부터 2차원 랜드마크들을 검출하는 단계;
    얼굴 영상 데이터베이스에 저장된 2차원 얼굴 제1 샘플 영상에서 검출된 2차원 랜드마크들과 상기 2차원 얼굴 영상의 2차원 랜드마크들 사이의 제1 편차를 측정하는 단계;
    상기 제1 편차에 기초하여 3차원 얼굴 모델의 초기 자세를 결정함으로써, 상기 3차원 얼굴 모델의 자세를 조정하고, 상기 3차원 얼굴 모델에 3차원 랜드마크들을 설정하는 단계; 상기 자세가 조정된 3차원 얼굴 모델을 2차원으로 투영하여 2차원 텍스처 영상을 획득하는 단계;
    상기 2차원 텍스처 영상으로부터 검출한 새로운 2차원 랜드마크들과 상기 얼굴 영상 데이터베이스에서 상기 3차원 얼굴 모델의 현재 자세 정보에 인접한 것으로 검색된 2차원 얼굴 제2 샘플 영상에 대응하는 2차원 랜드마크들 사이의 제2 편차를 측정하는 단계;
    상기 제2 편차에 기초하여 상기 3차원 얼굴 모델의 갱신된 자세 정보를 결정함으로써 상기 3차원 얼굴 모델의 자세를 조정하고, 상기 3차원 랜드마크들의 위치를 갱신하는 단계; 및
    상기 갱신된 3차원 랜드마크들의 위치에 기초하여 상기 2차원 얼굴 영상의 자세(pose)를 보정하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  2. 제1항에 있어서,
    상기 3차원 랜드마크들을 설정하는 단계는
    상기 2차원 랜드마크들에 기초하여 상기 3차원 얼굴 모델의 초기 자세(initial pose)를 나타내는 초기 기하 파라미터(initial geometric parameter)를 결정하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  3. 제2항에 있어서,
    상기 초기 기하 파라미터는
    상기 3차원 얼굴 모델의 초기 자세 정보를 포함하고,
    상기 초기 자세 정보는
    상기 3차원 얼굴 모델에 대한 회전(roll) 정보, 척도(pitch) 정보, 및 평행 이동(yaw) 정보를 포함하는 자세 정보 벡터에 의해 표현되는, 얼굴 영상의 자세를 보정하는 방법.
  4. 제2항에 있어서,
    상기 초기 기하 파라미터를 결정하는 단계는
    상기 2차원 랜드마크들에 기초하여 상기 2차원 랜드마크들의 초기 가중치를 결정하는 단계; 및
    상기 초기 가중치, 상기 2차원 랜드마크들, 및 상기 3차원 랜드마크들에 기초하여, 제1 에너지 함수를 최소화하는 상기 초기 기하 파라미터를 결정하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  5. 제4항에 있어서,
    상기 초기 가중치를 결정하는 단계는
    상기 2차원 랜드마크들 각각에 대하여, 상기 2차원 얼굴 제1 샘플 영상의 실제 검출된 랜드마크와 상기 2차원 랜드마크 사이의 제1 편차(deviation)를 측정하는 단계; 및
    상기 제1 편차에 기초하여 상기 2차원 랜드마크들의 초기 가중치를 결정하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  6. 제5항에 있어서,
    상기 제1 편차에 기초하여 상기 2차원 랜드마크들의 초기 가중치를 결정하는 단계는
    상기 제1 편차를 기초로 상기 2차원 랜드마크들을 정렬하는 단계;
    상기 정렬된 2차원 랜드마크들 중 상기 제1 편차가 미리 설정된 기준보다 낮은 값을 가지는 일부 2차원 랜드마크들을 선택하는 단계; 및
    상기 일부 2차원 랜드마크들에게 상기 제1 편차와 반비례하게 상기 초기 가중치를 할당하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  7. 제5항에 있어서,
    상기 얼굴 영상 데이터베이스는
    복수 개의 2차원 얼굴 샘플 영상들, 상기 2차원 얼굴 샘플 영상의 실제 검출된 랜드마크들, 및 상기 2차원 얼굴 샘플 영상들에서 실제 측정된 기하 파라미터 중 적어도 하나를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  8. 제2항에 있어서,
    상기 3차원 랜드마크들의 위치를 갱신하는 단계는
    상기 초기 기하 파라미터에 기초하여 상기 3차원 랜드마크들을 갱신하는 단계;
    상기 갱신된 3차원 랜드마크들의 가중치를 결정하는 단계; 및
    상기 가중치에 기초하여, 제2 에너지 함수를 최소화하는 상기 3차원 얼굴 모델의 기하 파라미터 및 형상 파라미터를 결정하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  9. 제8항에 있어서,
    상기 초기 기하 파라미터에 기초하여 상기 3차원 랜드마크들을 갱신하는 단계는
    상기 초기 기하 파라미터에 기초하여 상기 3차원 얼굴 모델의 자세를 조정(adjust)하는 단계;
    상기 자세가 조정된 3차원 얼굴 모델로부터 획득한 상기 2차원 텍스처 영상으로부터 새로운 2차원 랜드마크들을 검출하는 단계;
    상기 새로운 2차원 랜드마크들에 대응되는 상기 3차원 랜드마크들을 탐색하는 단계; 및
    상기 탐색된 3차원 랜드마크들에 의해 상기 3차원 랜드마크들을 갱신하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  10. 제9항에 있어서,
    상기 갱신된 3차원 랜드마크들의 가중치를 결정하는 단계는
    상기 초기 기하 파라미터로부터 상기 3차원 얼굴 모델의 현재 자세 정보를 획득하는 단계;
    상기 3차원 얼굴 모델의 현재 자세 정보에 인접한 것으로 검색된 2차원 얼굴 제2 샘플 영상에 대응하는 2차원 랜드마크들과 상기 새로운 2차원 랜드마크들 사이의 제2 편차에 기초하여 상기 2차원 랜드마크의 가중치를 결정하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  11. 제10항에 있어서,
    상기 2차원 랜드마크의 가중치를 결정하는 단계는
    상기 제2 편차의 평균값을 산출하는 단계;
    상기 제2 편차의 평균값에 반비례하여 상기 2차원 랜드마크의 가중치를 결정하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  12. 제10항에 있어서,
    상기 현재 자세 정보에 인접한 자세 정보는
    상기 현재 자세 정보와 상기 인접한 자세 정보 사이의 편차가 미리 설정된 한계값 범위 내에 있는 자세 정보를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  13. 제8항에 있어서,
    상기 3차원 랜드마크들을 갱신하는 단계는
    상기 3차원 얼굴 모델에 대하여 i-2번째(i는 2보다 크거나 같은 자연수임) 반복 수행에서 획득한 기하 파라미터와 i-1번째 반복 수행에서 획득한 기하 파라미터 사이의 편차가 미리 설정된 임계치보다 작은지 여부, 또는 상기 반복 수행의 횟수가 미리 설정된 횟수에 도달했는지 여부에 기초하여 상기 3차원 얼굴 모델의 자세 및 형상을 반복적으로 조절하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  14. 제13항에 있어서,
    상기 2차원 얼굴 영상의 자세를 보정하는 단계는
    상기 반복 수행에 의해 최종적으로 산출된 최종 기하 파라미터 및 최종 형상 파라미터에 기초하여 상기 3차원 얼굴 모델을 재구성하는 단계; 및
    상기 재구성된 3차원 얼굴 모델을 2차원으로 투영하여 상기 2차원 얼굴 영상의 자세를 보정하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  15. 제14항에 있어서,
    상기 자세가 보정된 2차원 얼굴 영상에 대하여 배경 보존 텍스처(background preserving texture)를 맵핑하는 단계
    를 더 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  16. 제15항에 있어서,
    상기 배경 보존 텍스처를 맵핑하는 단계는
    상기 2차원 얼굴 영상의 픽셀 색상을 기초로, 상기 재구성된 3차원 얼굴 모델에 색상을 부여하여 3차원 텍스처 모델을 결정하는 단계; 및
    상기 3차원 텍스처 모델을 2차원으로 투영한 얼굴 영상에서 얼굴 영역 이외의 배경 영역에 대한 픽셀 색상을 결정하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  17. 제16항에 있어서,
    상기 3차원 텍스처 모델을 결정하는 단계는
    상기 최종 기하 파라미터 및 상기 최종 형상 파라미터에 기초하여 상기 2차원 얼굴 영상에 상기 재구성된 3차원 얼굴 모델의 정점들(vertexes)을 피팅(fitting)하는 단계;
    상기 재구성된 3차원 얼굴 모델의 정점들에 상기 피팅된 2차원 얼굴 영상의 텍스처를 할당하는 단계; 및
    상기 최종 기하 파라미터 및 상기 최종 형상 파라미터에 기초하여, 상기 3차원 얼굴 모델에서 가려진 정점(occluded vertex)을 결정하는 단계; 및
    상기 가려진 정점에 대한 텍스처를 할당하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  18. 제17항에 있어서,
    상기 가려진 정점에 대한 텍스처를 할당하는 단계는
    상기 3차원 얼굴 모델에서 상기 가려진 정점의 대칭점이 가려졌는지 여부를 판단하는 단계; 및
    상기 판단 결과, 상기 대칭점이 가려졌다면, 상기 3차원 텍스처 모델의 텍스처 값의 평균을 상기 정점에 할당하고, 상기 대칭점이 가려지지 않았다면, 상기 대칭점의 텍스처를 상기 가려진 정점에 할당하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  19. 제16항에 있어서,
    상기 배경 영역에 대한 픽셀 색상을 결정하는 단계는
    상기 2차원으로 투영한 얼굴 영상에서 상기 배경 영역에 대한 추가 랜드마크들을 설정하는 단계;
    상기 3차원 텍스처 모델에서 상기 추가 랜드마크들의 대응점을 검색하는 단계;
    구간적 아핀 변환(piece-wise affine transformation)을 수행하여 상기 추가 랜드마크들의 대응점에 대한 색상 값을 획득하는 단계
    를 포함하는, 얼굴 영상의 자세를 보정하는 방법.
  20. 하드웨어와 결합되어 제1항 내지 제19항 중에서 어느 하나의 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램.
KR1020150171235A 2015-01-15 2015-12-03 얼굴 영상의 자세를 보정하는 방법 및 장치 KR102093216B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US14/996,709 US10134177B2 (en) 2015-01-15 2016-01-15 Method and apparatus for adjusting face pose

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510021503.1A CN105844276A (zh) 2015-01-15 2015-01-15 人脸姿态校正方法和装置
CN201510021503.1 2015-01-15

Publications (2)

Publication Number Publication Date
KR20160088223A KR20160088223A (ko) 2016-07-25
KR102093216B1 true KR102093216B1 (ko) 2020-04-16

Family

ID=56580748

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150171235A KR102093216B1 (ko) 2015-01-15 2015-12-03 얼굴 영상의 자세를 보정하는 방법 및 장치

Country Status (2)

Country Link
KR (1) KR102093216B1 (ko)
CN (1) CN105844276A (ko)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3545467A4 (en) 2016-12-28 2019-12-18 Zhejiang Dahua Technology Co., Ltd. METHODS, SYSTEMS AND MEDIA FOR ASSESSING IMAGES
CN106778660B (zh) * 2016-12-28 2019-11-15 浙江大华技术股份有限公司 一种人脸姿态校正方法及装置
CN107317953B (zh) 2017-06-30 2020-09-01 上海兆芯集成电路有限公司 图像获取方法及其装置
CN107333028B (zh) * 2017-06-30 2020-08-25 上海兆芯集成电路有限公司 图像获取方法及其装置
CN107564097B (zh) * 2017-09-05 2021-02-05 民政部一零一研究所 一种基于正面图像的遗容三维重建方法
CN108416291B (zh) * 2018-03-06 2021-02-19 广州逗号智能零售有限公司 人脸检测识别方法、装置和系统
CN108470328A (zh) * 2018-03-28 2018-08-31 百度在线网络技术(北京)有限公司 用于处理图像的方法和装置
EP3782124A1 (en) 2018-04-18 2021-02-24 Snap Inc. Augmented expression system
CN108764033A (zh) * 2018-04-18 2018-11-06 深圳市商汤科技有限公司 身份验证方法和装置、电子设备、计算机程序和存储介质
KR102476758B1 (ko) 2018-05-09 2022-12-09 삼성전자주식회사 영상 정규화 장치 및 방법
CN108629333A (zh) * 2018-05-25 2018-10-09 厦门市美亚柏科信息股份有限公司 一种低照度的人脸图像处理方法、装置、设备及可读介质
CN109087261B (zh) * 2018-08-03 2020-08-18 上海依图网络科技有限公司 基于非受限采集场景的人脸矫正方法
CN109191552A (zh) * 2018-08-16 2019-01-11 Oppo广东移动通信有限公司 三维模型处理方法、装置、电子设备和存储介质
CN109063678B (zh) * 2018-08-24 2020-09-29 北京字节跳动网络技术有限公司 脸部图像识别的方法、装置及存储介质
US11830132B2 (en) 2018-12-06 2023-11-28 Deepixel Inc. Device for processing face feature point estimation image on basis of standard face model, and phusical computer-readable recording medium in which program for processing face feature point estimation image on basis of standard face medel is recorded
CN110245612A (zh) 2019-06-14 2019-09-17 百度在线网络技术(北京)有限公司 人脸图像的检测方法和装置
CN110738601A (zh) * 2019-10-23 2020-01-31 智慧视通(杭州)科技发展有限公司 一种基于三维人脸模型低分辨率人脸图像超分辨率重建方法
CN110956691B (zh) * 2019-11-21 2023-06-06 Oppo广东移动通信有限公司 一种三维人脸重建方法、装置、设备及存储介质
CN111127547A (zh) * 2019-12-17 2020-05-08 北京迈格威科技有限公司 定位方法、装置、机器人及存储介质
KR102288001B1 (ko) * 2020-02-13 2021-08-11 한국과학기술연구원 나이 변환된 얼굴을 갖는 직업영상 생성 장치 및 이를 포함한 포토 부스
CN111489435B (zh) * 2020-03-31 2022-12-27 天津大学 基于单图像的自适应三维人脸重建方法
CN112785683B (zh) * 2020-05-07 2024-03-19 武汉金山办公软件有限公司 一种人脸图像调整方法及装置
KR102422822B1 (ko) * 2020-05-29 2022-07-18 연세대학교 산학협력단 경쟁적 학습을 이용한 3차원 얼굴 이미지 합성 장치 및 방법
CN112001859B (zh) * 2020-08-10 2024-04-16 深思考人工智能科技(上海)有限公司 一种人脸图像的修复方法及系统
CN112562048A (zh) * 2020-12-16 2021-03-26 北京百度网讯科技有限公司 三维模型的控制方法、装置、设备以及存储介质
CN113158908A (zh) * 2021-04-25 2021-07-23 北京华捷艾米科技有限公司 人脸识别方法、装置、存储介质及电子设备
CN114529640B (zh) * 2022-02-17 2024-01-26 北京字跳网络技术有限公司 一种运动画面生成方法、装置、计算机设备和存储介质
CN114549501A (zh) * 2022-02-28 2022-05-27 佛山虎牙虎信科技有限公司 人脸遮挡的识别、三维人脸处理方法、装置、设备及介质
CN116704622B (zh) * 2023-06-09 2024-02-02 国网黑龙江省电力有限公司佳木斯供电公司 一种基于重建3d模型的智能机柜人脸识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090309878A1 (en) * 2008-06-11 2009-12-17 Sony Corporation Image processing apparatus and image processing method
US20130129159A1 (en) * 2011-11-22 2013-05-23 Ronald Huijgens Face recognition method and apparatus
US20140043329A1 (en) * 2011-03-21 2014-02-13 Peng Wang Method of augmented makeover with 3d face modeling and landmark alignment

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5602891A (en) * 1995-11-13 1997-02-11 Beth Israel Imaging apparatus and method with compensation for object motion
US6967658B2 (en) * 2000-06-22 2005-11-22 Auckland Uniservices Limited Non-linear morphing of faces and their dynamics
US8976160B2 (en) * 2005-03-01 2015-03-10 Eyesmatch Ltd User interface and authentication for a virtual mirror
US7894664B2 (en) * 2006-03-22 2011-02-22 University Of Washington Conditional shape model for image processing
US20090010500A1 (en) * 2007-06-05 2009-01-08 Umasankar Kandaswamy Face Recognition Methods and Systems
CN101159015B (zh) * 2007-11-08 2010-12-08 清华大学 一种二维人脸图像的识别方法
US8190549B2 (en) * 2007-12-21 2012-05-29 Honda Motor Co., Ltd. Online sparse matrix Gaussian process regression and visual applications
US8406567B2 (en) * 2008-01-09 2013-03-26 Purdue Research Foundation Reconstruction of shapes of near symmetric and asymmetric objects
KR101697184B1 (ko) * 2010-04-20 2017-01-17 삼성전자주식회사 메쉬 생성 장치 및 그 방법, 그리고, 영상 처리 장치 및 그 방법
US9265468B2 (en) * 2011-05-11 2016-02-23 Broncus Medical, Inc. Fluoroscopy-based surgical device tracking method
US8666119B1 (en) * 2011-11-29 2014-03-04 Lucasfilm Entertainment Company Ltd. Geometry tracking

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090309878A1 (en) * 2008-06-11 2009-12-17 Sony Corporation Image processing apparatus and image processing method
US20140043329A1 (en) * 2011-03-21 2014-02-13 Peng Wang Method of augmented makeover with 3d face modeling and landmark alignment
US20130129159A1 (en) * 2011-11-22 2013-05-23 Ronald Huijgens Face recognition method and apparatus

Also Published As

Publication number Publication date
CN105844276A (zh) 2016-08-10
KR20160088223A (ko) 2016-07-25

Similar Documents

Publication Publication Date Title
KR102093216B1 (ko) 얼굴 영상의 자세를 보정하는 방법 및 장치
US10134177B2 (en) Method and apparatus for adjusting face pose
US10885659B2 (en) Object pose estimating method and apparatus
CN111795704B (zh) 一种视觉点云地图的构建方法、装置
KR102285376B1 (ko) 3d 얼굴 모델링 방법 및 3d 얼굴 모델링 장치
US10217234B2 (en) Modeling method and apparatus using three-dimensional (3D) point cloud
US10553026B2 (en) Dense visual SLAM with probabilistic surfel map
CN113330490B (zh) 三维(3d)辅助个性化家庭对象检测
KR101997500B1 (ko) 개인화된 3d 얼굴 모델 생성 방법 및 장치
US9715761B2 (en) Real-time 3D computer vision processing engine for object recognition, reconstruction, and analysis
Dou et al. 3D scanning deformable objects with a single RGBD sensor
US8848975B2 (en) Efficient and accurate 3D object tracking
WO2015139574A1 (zh) 一种静态物体重建方法和系统
US11049270B2 (en) Method and apparatus for calculating depth map based on reliability
CN106156692B (zh) 一种用于人脸边缘特征点定位的方法及装置
Eckart et al. Mlmd: Maximum likelihood mixture decoupling for fast and accurate point cloud registration
JP2016508652A (ja) 画像シーケンスにおける物体のオクルージョンの決定
US9846974B2 (en) Absolute rotation estimation including outlier detection via low-rank and sparse matrix decomposition
US9830703B2 (en) Model-based three-dimensional head pose estimation
JP7345664B2 (ja) 不確実性を有するランドマーク位置推定のための画像処理システムおよび方法
US20140168204A1 (en) Model based video projection
Lehment et al. Using segmented 3D point clouds for accurate likelihood approximation in human pose tracking
US10861174B2 (en) Selective 3D registration
US11915449B2 (en) Method and apparatus for estimating user pose using three-dimensional virtual space model
JP2023065296A (ja) 平面検出装置及び方法

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant