KR100442835B1

KR100442835B1 - 인공 신경망을 이용한 얼굴 인식 방법 및 장치

Info

Publication number: KR100442835B1
Application number: KR10-2002-0047898A
Authority: KR
Inventors: 기석철; 김태균
Original assignee: 삼성전자주식회사
Priority date: 2002-08-13
Filing date: 2002-08-13
Publication date: 2004-08-02
Also published as: US20040034611A1; US7295687B2; JP2004078959A; KR20040015613A

Abstract

본 발명은 인공 신경망을 이용하여 얼굴을 인식하는 얼굴 인식 방법 및 장치를 개시한다. 본 발명의 얼굴 인식 장치는 얼굴의 특징 패턴을 나타내는 고유 팩셀들을 생성하고, 생성된 고유 팩셀들 중 소정수의 고유 팩셀들을 선정하는 고유 팩셀 선정부; 입력 영상을 선정된 고유 팩셀들로 각각 필터링하는 고유 필터링부; 선정된 고유 팩셀에 각각 대응되며, 대응되는 고유 팩셀로 필터링된 영상의 신호를 입력받아, 얼굴 인식 결과를 출력하는 소정수의 신경망; 및 각각의 신경망으로부터 인식결과를 입력받아, 입력 영상의 최종 얼굴 인식 결과를 출력하는 판단부를 포함한다.

Description

인공 신경망을 이용한 얼굴 인식 방법 및 장치{Face recognition method using artificial neural network, and the apparatus using thereof}

본 발명은 신경망을 이용하여 얼굴을 인식하는 방법 및 장치에 관한 것으로 특히, 소정의 얼굴 영상을 이용하여 신경망을 학습하고, 학습된 신경망에 인식의 대상이 되는 얼굴 영상의 특징을 추출하고 인가하여, 인식대상이 되는 얼굴 영상이 학습된 얼굴 영상과 동일한지 여부를 판단함으로써, 얼굴을 인식하는 방법 및 장치에 관한 것이다.

21세기 정보화 사회로 이행되는 과정에서 개인은 물론 특정 단체의 정보는 어느 자산보다도 중요한 가치를 지니게 되었다. 이렇게 중요한 정보를 보호하기 위해서 각종 패스워드가 사용되고, 기타 신분을 확인할 수 있는 기술이 절실히 요구되고 있다. 이 가운데 얼굴 인식 기술은 사용자가 특별한 동작이나 행위를 취하지 않고, 심지어는 사용자 자신이 인지하지 못하는 동안 신분 확인을 할 수 있다는 장점이 있기 때문에 가장 편리하고, 경쟁력 있는 신분 확인 방법으로 평가되고 있다.

정보 보호 차원을 넘어서 신용카드, 현금카드, 전자 주민등록증 등 신분 확인을 필요로 하는 사회적 요구는 계속 확대되고 있으나 현재까지는 비밀번호 이외의 보조적인 신분 확인 방법이 없기 때문에 컴퓨터를 사용한 범죄 등 많은 사회적 문제점을 안고 있다. 이러한 사회적 문제를 해결할 수 있는 방법으로 얼굴 인식 기술이 각광을 받고 있다. 이외에도, 얼굴 인식 기술은 단말기 접근 제어, 공공 장소 관제 시스템, 전자 사진첩, 범죄자 얼굴 인식 등 많은 응용 분야를 가지고 있어 정보화 사회에서 매우 유용한 기술이라고 평가된다.

현재 많이 이용되고 있는 얼굴 인식 기술로서, 얼굴 영상에 주성분 분석법(Principal Component Analysis: 이하, PCA라 약칭함)을 적용하여 얼굴을 인식하는 기술이 있다. 주성분 분석법은 영상 데이터를 영상 자체의 고유정보의 손실을 최소화하면서 저 차원 고유벡터 공간으로 투영시켜 정보를 축소시키는 기법이다. 주성분 분석법을 이용한 얼굴 인식 방법으로는 얼굴의 주요 특징 벡터를 추출한 후, 미리 등록된 영상으로부터 추출된 주성분 벡터로 학습된 패턴 분류기를 이용하여 얼굴을 인식하는 방법이 많이 사용되었다. 그러나, 이러한 방법은 대용량의 얼굴 인식에 있어서, 인식 속도와 신뢰성이 낮고, PCA 기저벡터를 선택함에 따라서 조명에는 강인한 특징을 얻을 수 있으나, 얼굴의 표정 또는 포즈의 변화에는 만족할 만한 얼굴 인식 결과를 얻을 수 없는 문제점이 있다.

한편, 얼굴 인식의 성능은 등록된 얼굴과 등록되지 않은 얼굴을 구별하는 패턴 분류기의 성능에 따라서 좌우되는데, 이러한 패턴 분류기를 학습하는 한 방법으로 인공 신경망(Artificial Neural Network: 이하, ANN이라 약칭함)을 이용하는 방법이 있다.

도 1 은 ANN[(Artificial Neural Network)]-PCA[(Principal ComponentAnalysis)] 방법의 얼굴 인식 장치의 일 예를 도시한 도이다.

실험적으로 정의된 크기의 2차원 윈도우를 팩셀(Paxel)이라고 정의할 때, 도 1 에 도시된 얼굴 인식 장치는 먼저, 입력 영상에 대하여 N x N 크기의 팩셀 윈도우(Paxel window)를 이동하면서 고유 필터링 (또는 convolution) 한다. 이 때, 팩셀 윈도우란 임의의 학습 영상을 소정의 크기의 블록으로 분할한 후, 각 블록에 주성분 분석법을 적용하여 얻어진 M개의 고유 팩셀 커널(eigenpaxel kernel)을 의미한다. 고유 필터링(Eigenfiltering)된 영상은 신경망으로의 입력 벡터로서는 차원이 너무 크기 때문에 서브 샘플링 기법으로 벡터의 차원을 줄여서 신경망의 입력으로 사용한다.

그러나, 도 1 에 도시된 얼굴 인식 장치는 고유 팩셀 커널의 성질을 고려하지 않고 모든 입력 벡터를 그대로 신경망의 입력값으로 사용하므로, 신경망 학습을 위한 연산량이 많아지고, 따라서 연산에 수행되는 시간이 길어지며, 인식 성능과 수렴성에서 성능이 저하되는 문제점이 있다.

본 발명의 이루고자 하는 기술적 과제는, 신경망의 학습에 필요한 연산량을 대폭 줄임으로써, 신경망의 학습 수렴 속도가 빠르고, 대용량의 얼굴 인식에 적합한 얼굴 인식 장치를 제공하는 것이다.

도 1 은 종래의 신경망을 이용한 얼굴 인식 장치의 일 예를 도시하는 도면이다.

도 2a 는 본 발명의 바람직한 실시예에 따른 얼굴 인식 장치의 구성을 도시하는 블록도이다.

도 2b 는 도 2a 에 도시된 판단부의 구성을 도시하는 블록도이다.

도 3 은 본 발명의 바람직한 실시예에 따른 얼굴 인식 방법을 설명하는 흐름도이다.

도 4 는 도 3 의 S350 단계를 설명하는 흐름도이다.

도 5 는 본 발명의 바람직한 실시예에 따라서 선정되는 고유 팩셀의 예를 도시하는 도면이다.

도 6 은 일반적인 인공 신경망의 구조를 나타내는 도면이다.

도 7 은 2 개의 입력 영상에 대해서 도 5 에 도시된 첫 번째 고유 팩셀로 고유 필터링하고 서브 샘플링한 영상, 및 10번째 고유 팩셀로 고유 필터링하고 서브 샘플링한 영상을 각각 나타낸 도면이다.

도 8 은 그레이드를 부여할 때, 적용되는 그레이드의 범위를 나타내는 표를도시 도면이다.

도 9 는 도 2a 의 판단부로 입력되는 각 신경망의 출력 뉴런의 순서를 도시한 도면이다.

상술한 본 발명의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른, 인공 신경망을 이용하여 얼굴을 인식하는 얼굴 인식 장치는, 얼굴의 특징패턴을 나타내는 고유 팩셀들을 생성하고, 생성된 고유 팩셀들 중 소정수의 고유 팩셀들을 선정하는 고유 팩셀 선정부; 입력 영상을 선정된 고유 팩셀들로 각각 필터링하는 고유 필터링부; 선정된 고유 팩셀에 각각 대응되며, 대응되는 고유 팩셀로 필터링된 영상의 신호를 입력받아, 얼굴 인식 결과를 출력하는 소정수의 신경망; 및 각각의 신경망으로부터 인식결과를 입력받아, 입력 영상의 최종 얼굴 인식 결과를 출력하는 판단부를 포함한다.

또한, 상술한 본 발명의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른 다른 인공 신경망을 이용한 얼굴 인식 장치는, 얼굴의 특징 패턴을 나타내는 고유 팩셀들을 생성하고, 생성된 고유 팩셀들 중 소정수의 고유 팩셀들을 선정하는 고유 팩셀 선정부; 얼굴 영상을 입력받아 소정의 형식으로 정규화된 얼굴 영상을 출력하는 입력영상 정규화부; 정규화된 입력 영상을 선정된 고유 팩셀들로 각각 필터링하는 고유 필터링부; 각각의 고유 팩셀들로 필터링된 각각의 영상을 서브 샘플링하여 신경망에 입력하기 적합한 크기의 영상을 출력하는 서브 샘플링부; 선정된 고유 팩셀에 각각 대응되며, 대응되는 고유 팩셀로 필터링되고 서브 샘플링된 영상의 신호를 입력받아, 얼굴 인식 결과를 출력하는 소정수의 신경망; 및 각각의 신경망으로부터 인식결과를 입력받아, 입력 영상의 최종 얼굴 인식 결과를 출력하는 판단부를 포함한다.

또한, 상기 판단부는 입력된 각 신경망의 출력층 뉴런의 출력값을 소정의 범위의 값으로 변환하고, 신뢰값을 계산하며, 신뢰값들을 각 신경망의 출력층 뉴런에 대해서 합산하는 신뢰값 계산부; 신뢰값에 따라서 상위 소정수의 신경망에서 검출된 얼굴을 선정하는 얼굴 선정부; 각 신경망의 신뢰값에 그레이드를 부여하고, 선정된 얼굴에 대해서, 전체 신경망의 제 1 그레이드 순서 및 상위 소정수의 신경망의 제 2 그레이드 순서를 계산하는 그레이드 연산부; 제 1 및 제 2 그레이드 순서를 소정의 제 1 및 제 2 임계 그레이드 순서와 각각 비교하여 상기 선정된 얼굴들을 소정의 얼굴 그룹으로 분류하는 그룹핑부; 및 소정의 얼굴 그룹 중 제 1 및 제 2 임계 그레이드 순서보다 큰 제 1 및 제 2 그레이드를 갖는 제 1 얼굴 그룹에 속하는 얼굴을 인식 결과로서 출력하는 인식 결과 출력부를 포함하는 것이 바람직하다.

상술한 본 발명의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른, 인공 신경망을 이용하여 얼굴을 인식하는 얼굴 인식 방법은, 얼굴의 특징 패턴을 나타내는 고유 팩셀들을 생성하고, 생성된 고유 팩셀들 중 소정수의 고유 팩셀들을 선정하는 단계; 선정된 고유 팩셀들을 이용하여 신경망을 학습하는 단계; 입력 영상을 선정된 고유 팩셀들로 각각 고유 필터링하여, 고유 필터에 대응되는 얼굴 특징 패턴이 나타나는 고유 필터링된 영상을 얻는 단계; 고유 필터링된 영상을 선정된 고유 팩셀에 각각 대응되는 신경망으로 출력하여 각각의 얼굴 특징 패턴에 대해서 얼굴 인식을 수행하는 단계; 각 신경망의 얼굴 인식 결과를 분석하여, 입력 영상의 최종 얼굴 인식 결과를 출력하는 단계를 포함한다.

또한, 상술한 본 발명의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른 다른 인공 신경망을 이용한 얼굴 인식 방법은, 얼굴의 특징 패턴을 나타내는 고유 팩셀들을 생성하고, 생성된 고유 팩셀들 중 소정수의 고유 팩셀들을선정하는 단계; 선정된 고유 팩셀들을 이용하여 신경망을 학습하는 단계; 입력된 얼굴 영상을 소정의 형식의 얼굴 영상으로 정규화하는 단계; 정규화된 얼굴 영상을 선정된 고유 팩셀들로 각각 고유 필터링하여, 고유 필터에 대응되는 얼굴 특징 패턴이 나타나는 고유 필터링된 영상을 얻는 단계; 고유 필터링된 각각의 영상을 서브 샘플링하여 신경망에 입력하기 적합한 크기의 영상을 얻는 단계; 고유 필터링되고 서브 샘플링된 영상을 선정된 고유 팩셀에 각각 대응되는 신경망으로 출력하여 각각의 얼굴 특징 패턴에 대해서 얼굴 인식을 수행하는 단계; 및 각 신경망의 얼굴 인식 결과를 분석하여, 입력 영상의 최종 얼굴 인식 결과를 출력하는 단계를 포함한다.

또한, 출력층 뉴런의 출력값을 소정의 범위의 값으로 변환하여, 신뢰값을 계산하고, 신뢰값들을 각 신경망의 출력층 뉴런에 대해서 합산하는 단계; 신뢰값에 따라서 상위 소정수의 신경망에서 검출된 얼굴을 선정하는 단계; 각 신경망의 신뢰값에 그레이드를 부여하고, 선정된 얼굴에 대해서, 전체 신경망의 제 1 그레이드 순서 및 상위 소정수의 신경망의 제 2 그레이드 순서를 계산하는 단계; 제 1 및 제 2 그레이드 순서를 소정의 제 1 및 제 2 임계 그레이드 순서와 각각 비교하여 선정된 얼굴들을 소정의 얼굴 그룹으로 분류하는 단계; 및 소정의 얼굴 그룹 중 제 1 및 제 2 임계 그레이드 순서보다 큰 제 1 및 제 2 그레이드를 갖는 제 1 얼굴 그룹에 속하는 얼굴을 인식 결과로서 출력하는 단계를 포함하는 것이 바람직하다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명한다.

도 2 는 본 발명의 바람직한 실시예에 따른 얼굴 인식 장치의 구성을 도시하는 도면이다.

본 발명의 인공 신경망을 이용하여 얼굴을 인식하는 얼굴 인식 장치는, 얼굴의 특징 패턴을 나타내는 소정수의 고유 팩셀들을 생성하고, 생성된 고유 팩셀들 중 소정수의 고유 팩셀들을 선정하는 고유 팩셀 선정부(200), 얼굴 영상을 입력받아 소정의 형식으로 정규화하는 입력영상 정규화부(210), 정규화된 입력 영상을 선정된 고유 팩셀들로 각각 필터링하는 고유 필터링부(220), 각각의 고유 팩셀들로 필터링된 각각의 영상을 서브 샘플링하여 신경망에 입력하기 적합한 크기의 영상을 출력하는 서브 샘플링부(230), 선정된 고유 팩셀에 각각 대응되도록 병렬로 배치되며 대응되는 고유 팩셀로 필터링되고 서브 샘플링된 영상의 신호를 입력받아 얼굴 인식 결과를 출력하는 소정수의 신경망(240), 및 각각의 신경망(240)으로부터 신뢰값을 입력받아 인식대상 영상의 얼굴 인식 결과를 출력하는 판단부(250)를 포함한다.

도 3 은 본 발명의 바람직한 실시예에 따른 얼굴 인식 방법의 과정을 설명하는 흐름도이다.

본 발명에 따라서 입력 얼굴 영상을 인식하고, 입력된 얼굴이 등록된 얼굴인지를 판단하기 위해서는, 먼저, 소정수의 고유 팩셀을 선정하고, 선정된 고유 팩셀을 이용해서 본 발명에서 패턴 분류기로서 작용하는 신경망(240)을 미리 학습하여야 한다(S300).

본 발명에서 이용되는 고유 팩셀을 설명한다. 먼저, 신경망(240)의 학습에 이용될 임의의 영상을 소정의 크기의 블록들로 분할하고, 각각의 분할된 블록을 팩셀이라고 정의한다. 각각의 팩셀들에 대해서 주성분 분석법(PCA)을 적용하면, 도 5 에 도시된 바와 같은 형태의 고유 팩셀들이 얻어진다.

각각의 고유 팩셀은 얼굴 영역의 특징을 나타내는데, 도 5 에 도시된 첫 번째 고유 팩셀은 얼굴 영역에서 평평한 부분을 나타내고, 2번째 및 3번째 고유 팩셀과 같은 사선으로 분포되는 특징을 나타내는 고유 팩셀은 턱선과 같이 얼굴에서 사선이 분포되는 부분의 특성을 각각 나타낸다.

이러한, 팩셀의 크기는 연산속도와 비교해서 얼마나 만족할 만한 신경망 학습 결과 및 인식 결과가 나오는가에 따라서 결정된다. 즉, 팩셀의 크기가 너무 크면 연산량이 많아져서 신경망의 학습과 얼굴 인식에 지나치게 많은 시간이 소요되고, 팩셀의 크기가 너무 작으면, 얼굴의 특징을 제대로 표현할 수 없기 때문에, 이러한 사항을 고려하여 팩셀의 크기를 선택한다.

도 5 에 도시된바와 같은 고유 팩셀들이 얻어지면, 고유팩셀 선정부(200)는 얻어진 고유팩셀 중에서 고유값(eigenvalue)이 가장 큰 고유 팩셀들, 즉, 가장 많은 성분이 검출되는 고유팩셀들의 순서로 고유팩셀을 배치하고, 그 중에서 소정수(이하, "M 개"라 칭함)의 고유 팩셀을 선정한다. 도 5 는 16 ×16 크기의 15개의 고유 팩셀을 고유값이 큰 순서로 배치하였다.

한편, 학습 및 얼굴 인식에 이용될 소정수의 고유 팩셀이 선정되면, 후술할 얼굴 인식과 동일한 과정을 통해서 신경망을 학습하게 되는데, 본 발명은 학습의 일예로서, 일반적인 신경망 학습방법중의 하나인 Supervised Learning 방법을 이용하여 신경망을 학습하였다.

도 6 은 일반적인 신경망의 구조를 도시한 도면이다. 일반적인 신경망은 입력층, 은닉층 및 출력층을 포함하며, 은닉층은 필요에 따라서 1 이상의 층으로 구성될 수 있다. 이러한, 신경망을 학습시키기 위한 알고리즘으로 본 실시예는 모멘텀을 갖는 역전파(back propagation) 알고리즘을 이용하였다. 이 알고리즘은 오차 영역이 매우 좁은 경우에 일반적으로 잘 알려진 역전파 알고리즘에, 발진을 피하기 위한 모멘텀(Momentum)을 부가한 것으로, 학습을 위한 업데이트된 웨이팅 계수는 다음의 수학식 1 에 의해서 계산된다.

여기서, η는 학습 계수를, j 는 현재 유닛의 인덱스를 각각 나타낸다. 또한, i 는 유닛 j 에 선행하는 유닛의 인덱스를, δ_j는 유닛 j 의 출력 오차를, O_i는 유닛 i 의 출력을, α는 모멘텀의 영향을 특정하는 상수를 각각 나타낸다.

본 실시예에서는 간략한 학습(brief learning) 및 집중 학습(intensive learning)의 2가지 타입의 학습방법을 사용하였다.

간략한 학습의 경우에, η=0.1 , α=0.05 , c=0.05 , d_max= 0.01 로 각각 설정하였고, 집중 학습의 경우에 η=0.01 , α=0.0005 , c=0.01 , d_max= 0.0001 로 각각 설정하였다. 여기서, c 는 평탄점 제거량(the amount of flat spot elimination)을 나타내고, d_max는 최대 비-전파(non-propagation) 오차를 나타낸다. 학습 함수는 최초에 [-1,1] 범위의 임의의 웨이트로 설정되고, 토폴로지 차수(topological order)에 따라서 업데이트 된다. 오차가 대략 0.0001 이하가 되면 학습은 중단된다. 일반적으로, 모든 신경망은 간략하게 학습되고, 소정수의 신경망만이(본 실시예에서는 상위 4 개의 신경망) 집중 학습된다.

고유 팩셀이 선정되고 신경망(240)이 학습되면, 입력영상 정규화부(210)는 검증할 얼굴 영상을 입력받아 그레이 레벨로 정규화한 후 고유 필터링부(220)로 정규화된 영상을 출력한다(S310).

고유 필터링부(220)는 고유 팩셀 선정부(200)에서 선정된 M 개의 고유팩셀을 이용하여 정규화된 입력영상에 대해서 각각 고유 필터링을 수행하여, 얼굴의 특징을 나타내는 고유 필터링된 M 개의 영상를 얻는다(S320).

고유 필터링부(220)는 각각의 고유 팩셀을 정규화된 입력 영상에 대해서 이동시키면서 컨벌루션 연산을 수행함으로써 입력 영상을 고유 필터링하게 된다. 구체적으로, 입력된 영상을 소정의 블록들로 분할하고, 분할된 블록과 고유 팩셀이 소정의 퍼센트만큼 서로 겹쳐지도록 이동시키면서 컨벌루션 연산을 수행하면, 일정한 크기로 축소된 고유 필터링된 영상을 얻게 된다.

본 실시예에서는, 16 ×16 크기의 고유 팩셀 10개를 이용하였고, 컨벌루션 오버래핑(overlapping percentage)를 75% 로하여 입력 영상을 각각 고유 필터링 하였다. 약, 4~5 개의 고유 팩셀을 이용하여도 어느 정도 인식 성능이 보장된 결과를 얻을 수 있었으나, 보다 신뢰성이 높은 결과를 얻기 위해서 본 발명의 실시예는 10 개의 고유 팩셀을 선정하여, 40명에 대하여 주로 표정 및 포즈에 대한 10장의 영상을 가진 공지의 Olivetti DB의 얼굴 영상에 대해서 고유 필터링을 수행하였다.Olivetti DB에 저장된 원 영상은 92 ×112 크기의 영상으로, 이 영상을 16 ×16 크기의 고유 팩셀로 필터링하면 20 ×25 크기의 고유 필터링된 영상이 얻어진다.

그러나, 각각의 고유필터를 이용하여 고유 필터링된 얻어진 영상은 아직도 영상의 차원이 커서 신경망(240)에 입력하기에는 부적당하므로, 서브 샘플링부(230)는 필터링된 영상에 대해서 서브 샘플링을 수행하여 벡터의 차원을 줄인다(S330).

본 실시예에서는 20 ×25 크기의 고유 필터링된 영상을 2 ×2 크기의 서브 샘플링을 이용하여 10 ×12 크기의 영상으로 서브 샘플링함으로써, 신경망(240)에 입력되는 벡터의 차원을 줄인다.

서브 샘플링부(230)는 서브 샘플링된 영상을 병렬 구조의 신경망(240)에 인가한다(S340). 먼저, 본 발명이 병렬 구조의 신경망(240)을 채택한 이유를 살펴본다.

도 7 은 2 개의 입력 영상에 대해서 도 5 에 도시된 첫 번째 고유 팩셀로 필터링하고 서브 샘플링한 영상, 및 10번째 고유 팩셀로 필터링하고 서브 샘플링한 영상을 각각 나타내었다. 도 7 에 도시된 바와 같이, 동일한 얼굴의 영상이라 하더라도 고유팩셀에 따라서 필터링된 후 나타나는 벡터 영상은 서로 다르게 나타난다. 반면, 다른 얼굴 영상이라 하더라도 동일한 고유 팩셀로 필터링된 후 나타나는 벡터 영상은 서로 유사한 특징을 나타내는 것을 알 수 있다.

따라서, 동일한 얼굴이라도 각각의 고유 필터로 필터링된 영상은 서로 다른 특징을 나타내므로, 동일한 신경망에 상술한 다른 특징을 갖는 영상 벡터들을 입력하여, 신경망을 통해서 이런 다른 특징을 나타내는 영상이 서로 동일한 얼굴 영상임을 학습시키기 위해서는 상당한 양의 학습 영상 데이터와 복잡한 학습 알고리즘이 필요하다. 따라서, 신경망의 학습 수렴 속도가 매우 늦어지게 된다.

M개의 고유 팩셀 필터의 반응값으로 구해지는 신경망 입력 벡터의 통계적인 특징은 각 필터마다 고유한 특징을 가지고 있으므로, 얼굴 인식과 같이 사람 얼굴의 신원 변화를 찾아내야 하는 목적을 이루기 위해서는 같은 성질을 갖는 필터의 반응값만 가지고 신원의 변화를 학습할 수 있는 신경망을 구성하는 것이 바람직하다.

따라서, 본 발명은 도 2 에 도시된 바와 같이, 고유 팩셀로 영상을 필터링한 각각의 반응값을, 각각의 고유 팩셀에 대응되는 별개의 신경망에 인가하여 얼굴 학습 및 얼굴 인식을 수행할 수 있도록 병렬 구조의 신경망(240)을 채택한다.

병렬 구조의 신경망(240) 각각은 도 6 에 도시된 일반적인 신경망의 구조를 갖는다. 은닉층에서의 뉴런의 개수는 좋은 인식 성능을 보일 수 있는 충분한 연결이 가능하도록 선택된다. Olivetti DB에 저장된 총 40명, 사람 당 5장의 얼굴 영상을 학습한 본 실시예의 경우는 60개의 뉴런이 은닉층에 사용되었다. 또한, 본 실시예에서 고유 팩셀의 개수가 10개이므로, 동일한 구조의 신경망 10개를 병렬로 학습하였으며, 각각의 신경망은 입력 벡터의 차원이 10 ×12 이므로 입력층의 뉴런의 개수는 120개, 은닉층의 뉴런의 개수는 전술할 바와 같이 60개, 분류해야 하는 등록 인수가 40명이므로 출력층의 뉴런의 개수는 40개로 각각 구성된다.

참고로, 기존의 방법처럼 신경망 1개만을 사용하는 경우에는, 입력 뉴런의개수가 입력 벡터의 차원[120] ×고유 팩셀의 개수[10]와 같아야 하므로, 1200개의 입력 뉴런이 필요하게 된다. 따라서, 수많은 연결 조합을 학습해야 하므로 은닉 뉴런의 개수도 입력 뉴런의 개수에 따라서 늘어야 하고, 학습 시간도 기하 급수적으로 늘어나게 된다.

한편, 등록인의 수가 500명이며 표정 및 포즈에 대한 10장의 영상을 가진 HIU(Hong Ik University) DB에 고유 팩셀 10 개를 적용하여, 등록된 500명중 250명에 대하여 본 발명을 적용하는 경우에는, 입력 뉴런의 개수는 같으나, 출력 뉴런의 개수가 250개로 늘어나서, 은닉 뉴런의 개수는 100개가 필요하게 된다.

병렬로 연결된 도 2 의 각 신경망(240)들은 고유 팩셀로 필터링된 입력 영상에 대한 얼굴 인식 결과를 판단부(250)로 출력하게 되고, 판단부(250)는 입력된 결과들를 분석하여 최종적인 얼굴 인식 결과를 출력하게 된다(S350).

도 4 및 도 2b 를 참조하여, 본 발명의 판단부(250)에서 각각의 신경망으로부터 입력된 결과들을 종합하여 최종적인 얼굴 인식 결과를 판단하는 과정을 설명한다.

도 5 는 본 발명의 판단부(250)의 구성을 도시하는 도이다.

본 발명의 판단부(250)는, 입력된 출력 뉴런의 출력값을 소정의 범위의 값으로 변환하고 신뢰값을 계산하며 신뢰값들을 각 신경망의 출력 뉴런에 대해서 합산하는 신뢰값 계산부(251), 신뢰값에 따라서 상위 소정수의 신경망에서 검출된 얼굴을 선정하는 얼굴 선정부(253), 각 신경망의 신뢰값에 그레이드를 부여하고 선정된 얼굴에 대해서 전체 신경망(240)의 제 1 그레이드 순서 및 상위 소정수의 신경망의제 2 그레이드 순서를 계산하는 그레이드 연산부(255), 얼굴 선정부(253)에서 선정된 얼굴의 제 1 및 제 2 그레이드 순서를 소정의 제 1 및 제 2 임계 그레이드 순서와 각각 비교하여 소정의 얼굴 그룹으로 분류하는 그룹핑부(257), 및 소정의 얼굴 그룹에 속하는 얼굴을 인식 결과로서 출력하는 인식 결과 출력부(259)를 포함한다.

도 4 는 본 발명의 판단부(250)의 얼굴 인식 결과를 출력하는 과정을 설명하는 흐름도이다.

신뢰값 계산부(251)는 입력된 각각의 신경망의 출력층 뉴런의 출력값을 변환하여 신뢰값을 계산한다(S400).

각 신경망의 출력층 뉴런의 출력값들은 범위가 매우 다양하여 각 신경망간의 인식 결과를 비교하여 최종 인식 결과를 분석하기에는 어려움이 있다. 따라서, 본 발명은 각 신경망의 뉴런의 출력값들을 다른 신경망의 출력값들과 비교할 수 있도록 정규화하는 것이 필요하다. 따라서, 본 발명에서는 신경망의 각 출력값들에 대한 신경망의 출력값을 모두 합산한 값의 비를 신경망 뉴런의 출력값으로 이용한다.

본 발명의 바람직한 일 실시예의 신뢰값 계산부(251)는 신뢰값을 계산하기 위해서 각 신경망 출력층의 뉴런의 출력을 다음의 수학식 2 를 이용하여 출력층 뉴런의 출력값을 변환한다.

여기서, W_α는 신경망의 각 뉴런의 실제 출력값을, β는 출력층 뉴런의 전체 개수를 나타낸다.

그 후, 신뢰값 계산부(251)는 변환된 값들 중에서 최대값과 그 다음으로 큰 값간의 차에 최대값을 곱하여 신뢰값을 얻는다. 본 발명의 바람직한 일 실시예에서는 수학식 2에 의해서 변환된 출력값을 다음의 수학식 3에 대입하여 신뢰값을 계산한다.

여기서, y_max,1은 가장 큰 변환된 출력값을, y_max,2두 번째로 큰 변환된 출력값을 각각 나타낸다. 수학식 3 에 의해서 계산된 신뢰값은 각각의 신경망에서 최대 출력값을 갖는 출력층 뉴런의 신뢰값으로 부여되고, 나머지 출력층 뉴런들의 신뢰값은 0 으로 설정된다.

신뢰값 계산부(251)는 상술한 과정에 의해서 구해진 각 신경망의 신뢰값을 각각의 출력 뉴런에 대해서 합산한다(S410).

도 9 를 참조하여 설명하면, 도 9에 도시된 바와 같이 각각의 신경망 (1 내지 10) 은 각각 k 개의 출력 뉴런을 갖는다. 따라서 각각의 출력 뉴런에 대한 신뢰값의 합(S1 내지 Sk)은 다음과 같다.

S1=N¹ ₁+N² ₁+N³ ₁+N⁴ ₁.....N¹⁰ ₁

S2=N¹ ₂+N² ₂+N³ ₂+N⁴ ₂.....N¹⁰ ₂

S3=N¹ ₃+N² ₃+N³ ₃+N⁴ ₃.....N¹⁰ ₃

....

Sk=N¹ _k+N² _k+N³ _k+N⁴ _k.....N¹⁰ _k

단, 각각의 출력 뉴런은 N^m _n으로 나타내고, 여기서 m 은 각각의 신경망을 나타내며, n 은 각 신경망에서 출력 뉴런의 순서를 나타내는 것임은 도 9 에 도시한 바와 같다.

신경망의 각 출력 노드는 등록된 인물에 대응되고, 각 신경망의 i 번째 노드는 모두 동일한 인물에 대응되므로, 각 신경망의 동일한 출력 뉴런의 신뢰값을 합산하여, 입력된 영상에 대한 전체 신뢰값을 계산하게된다. 합산된 신뢰값은 후술할 인식 결과를 최종 결정하는 단계(S470)에서 이용된다.

얼굴 선정부(253)는 신뢰값 계산부(251)로부터 신뢰값 계산 결과를 입력받고, 상위 소정수의 신경망에 의해서 검출된 얼굴을 선정한다(S420).

상술한 바와 같이, 신뢰값은 각 신경망의 출력 뉴런 중 최고 출력값을 나타내는 하나의 출력 뉴런에만 부여되고, 각 출력 뉴런은 학습된 얼굴에 대응되므로, 각 신경망마다 하나의 얼굴이 검출된다. 얼굴 선정부(253)는 상위 소정수의 신경망, 본 발명의 실시예에서는 상위 4 개의 신경망으로부터 얼굴을 검출하여, 후보얼굴을 선정한다.

예컨대, 상술한 예에서 상술한 수학식 3에 의해서 계산된 신뢰값이 다음과 같을 때,

N¹ ₁=0.9, N¹ ₂=0, N¹ ₃=0, N¹ ₄=0, ....N¹ _k=0

N² ₁=0 , N² ₂=0.7, N² ₃=0, N² ₄=0, ....N² _k=0

N³ ₁=0 , N³ ₂=0, N³ ₃=0, N³ ₄=0, ....N³ _k=0.01

N⁴ ₁=0 , N⁴ ₂=0, N⁴ ₃=0.1, N⁴ ₄=0, ....N⁴ _k=0

....

N¹⁰ ₁=0.8, N¹⁰ ₂=0, N¹⁰ ₃=0, N¹⁰ ₄=0, ....N¹⁰ _k=0

얼굴 선정부(253)에서 선정된 얼굴은, 상위 4 개의 신경망에서 검출된 첫 번째, 두 번째, k 번째 및 3 번째 출력 뉴런에 대응되는 얼굴이 된다.

그레이드 연산부(255)는 신뢰값 계산부(251)로부터 입력된 상기와 같은 신뢰값에 대해서 도 8 에 도시된 표에 따라서 각각의 신뢰값에 대해서 그레이드를 부여한다(S430).

상술한 예를 다시 참조하면, 제 1 신경망의 첫 번째 출력 뉴런의 신뢰값은 0.9 이므로 도 8 의 표에 따라서 그레이드 A 가 부여되고, 나머지 출력 뉴런에는 0 이 부여되어, 제 1 신경망에는 A000...0 이 부여된다.

또한, 제 1 신경망과 동일한 방식으로 제 2 신경망에는 0B00000000 가 부여되고, 제 3 신경망에는 000000000F 가, 제 4 신경망에는 00E0000000 가 부여되고, 제 5내지 제 9 신경망에도 제 1 신경망과 동일한 방식으로 그레이드가 부여되고, 마지막으로 제 10 신경망에는 A000000000 가 각각 부여된다.

그레이드 연산부(255)는 각 신경망의 신뢰값에 대해서 그레이드를 부여하고 난 후, 얼굴 선정부(253)로부터 선정된 얼굴을 입력받아, 선정된 얼굴에 대해서 전체 그레이드 순서를 계산한다(S440).

상술한 예를 다시 참조하면, 얼굴 선정부(253)에 의해서 선정된 얼굴은 1,2,k 및 3번째 얼굴이므로 이 4 개의 얼굴에 대한 각 신경망의 그레이드를 순서대로 나열하여 그레이드 순서를 계산한다. 예컨대, 제 1 신경망에서 선정된 첫 번째 얼굴에 대한 그레이드는, 제 1 신경망에서는 A 이고, 제 2 신경망에서는 0 이며, 제 3 신경망에서는 0 이고, 제 4 내지 제 9 신경망에 대해서도 이러한 방식으로 계산되어, 마지막으로 제 10 신경망에서는 A 이다.

상술한 방식으로 선정된 4 개의 얼굴에 대한 그레이드 순서를 구하면 다음과 같다.

G1= N¹ ₁, N² ₁, N³ ₁, N⁴ ₁,....., N¹⁰ ₁= A00000000A

G2= N¹ ₂, N² ₂, N³ ₂, N⁴ ₂,....., N¹⁰ ₂= 0B00000000

G3= N¹ ₃, N² ₃, N³ ₃, N⁴ ₃,....., N¹⁰ ₃= 000E000000

Gk= N¹ _k, N² _k, N³ _k, N⁴ _k,....., N¹⁰ _k= 00F0000000

그레이드 연산부(255)는 선정된 얼굴에 대해서 전체 그레이드를 구한 후, 전체 그레이드에서 소정수의 신경망에 대한 그레이드 순서(이하, "기본 그레이드 순서"라 칭함)를 계산한다(S450).

예컨대, 전술한 그레이드 순서에서 4개의 신경망에 대한 기본 그레이드 순서를 구하면, G1= N¹ ₁, N² ₁, N³ ₁, N⁴ ₁= A000, G2= N¹ ₂, N² ₂, N³ ₂, N⁴ ₂= 0B00, G3= N¹ ₃, N² ₃, N³ ₃, N⁴ ₃= 000E, Gk= N¹ _k, N² _k, N³ _k, N⁴ _k,= 00F0 와 같다. 이 때, 소정수의 신경망은 후보 얼굴을 선정한 신경망인 것이 바람직하나, 그 보다 많은 수의 신경망을 선정하는 것도 무방하다.

그룹핑부(257)는 그레이드 연산부(255)로부터 선정된 얼굴 및 각 얼굴에 대한 전체 그레이드 순서 및 기본 그레이드 순서를 입력받아, 각 얼굴의 전체 그레이드 순서 및 기본 그레이드 순서를 전체 그레이드 순서에 대한 소정의 제 1 임계 그레이드 순서 및 기본 그레이드 순서에 대한 소정의 제 2 그레이드 순서와 각각 비교하여, 선정된 얼굴들을 소정의 그룹으로 분류한다(S460).

그룹핑부(257)는 상술한 바와 같이 비교하여, 선정된 얼굴을, 제 1 임계값과 제 2 임계값을 모두 초과하는 그레이드 순서들을 갖는 제 1 그룹, 제 1 임계값 또는 제 2 임계값 중 어느 하나만을 초과하는 제 2 그룹, 어느 임계값도 초과하지 못하는 제 3 그룹으로 분류한다. 이때, 그룹핑부(257)는 그레이드의 높고 낮음을대수적으로 비교함으로써 각 그레이드 순서와 임계값의 비교한다.

상술한 예를 참조하여 설명하면, 제 1 임계값이 BBBBAAAAAA 이고, 제 2 임계값이 0CAA 라고 한다면, 첫 번째 얼굴의 전체 그레이드 순서는 A00000000A 이므로 제 1 입계값보다 높고, 기본 그레이드 순서도 A0000 이므로 제 2 임계값보다도 높다. 따라서 첫 번째 얼굴은 제 1 그룹으로 결정된다.

한편, 두 번째 얼굴의 전체 그레이드 순서는 0B00000000 이므로 제 1 임계값 보다는 낮지만, 기본 그레이드 순서는 0B00 이므로 제 2 임계값보다는 높다. 따라서, 두 번째 얼굴은 제 2 그룹으로 분류된다. 세 번째 및 k 번째 얼굴에 대해서도 이와 같은 방식으로 그룹을 분류하여 각각의 얼굴과 얼굴에 해당되는 그룹을 인식결과 출력부(259)로 출력한다.

인식결과 출력부(259)는 입력된 얼굴과 해당되는 그룹에 따라서 얼굴 인식 결과를 출력한다(S470).

인식결과 출력부(259)는 입력된 얼굴 중 제 1 그룹에 속하는 얼굴을 인식결과로서 출력하고, 제 1 그룹에 속하는 얼굴이 없는 경우에는 제 2 그룹에 있는 얼굴을 인식 결과로서 출력한다. 한편, 동일한 그룹에 복수의 얼굴이 속하는 경우에는 상술한 제 S410 단계에서 계산된 얼굴에 대한 신뢰값의 합이 큰 얼굴을 인식 결과로서 출력한다.

한편, 본 발명의 바람직한 실시예에 따른 얼굴 인식 실험 결과를 다음의 표 1 및 표 2 에 기재하였다.

	제 1 실험	제 2 실험
1개의 얼굴을 출력한 경우	4.5 %	4.5 %
2개의 얼굴을 출력한 경우	3.0 %	3.0 %
3개의 얼굴을 출력한 경우	2.5 %	2.5 %

표 1 에 기재된 실험 결과는 40 명의 얼굴에 대해서 각 얼굴마다 10 장의 얼굴 영상을 저장하고 있는 Olivetti DB에 대한 실험 결과이다. 표 1 의 제 1 실험은 Olivetti DB에 저장된 얼굴 영상 중 200 장의 홀수번째 영상을 학습하고, 200 장의 짝수번째 영상을 얼굴 인식 대상 얼굴영상으로 입력하였을 때 인식 오차 결과를 기재하였고, 제 2 실험은 그 역의 경우를 기재하였다. 상기 표에서, 인식 결과로서 1 명의 얼굴을 출력하였을 때 및 인식 결과로서 2 명 및 3 명을 출력하였을 때, 출력된 얼굴에 인식 대상 얼굴이 포함되었는지 여부에 따라서 인식 오차를 계산하였다.

	간략 학습한 경우	집중 학습한 경우
1개의 얼굴을 출력한 경우	6.06 %	5.89 %
2개의 얼굴을 출력한 경우	4.06 %	3.89 %
3개의 얼굴을 출력한 경우	3.31 %	3.20 %

표 2 에 기재된 실험 결과는 250 명의 얼굴에 대해서 각 얼굴마다 10 장의 얼굴 영상을 저장하고 있는 HIU(Hong Ik University) DB에 대한 실험 결과이다. HIU DB 에 저장된 얼굴 영상 중 750장의 얼굴 영상으로 본 발명의 신경망을 학습하고, 1750 장의 얼굴 영상에 대해서 얼굴 인식을 수행하였으며, 신경망을 상술한 간략 학습한 경우와 집중 학습한 경우의 오차율에 대해서 각각 표 2 에 기재하였다.

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

본 발명의 다수의 신경망을 병렬로 구성하고, 각각의 신경망을 유사한 패턴적 특징을 갖는 고유 필터링된 영상으로 학습하고 얼굴 인식을 수행함으로써, 신경망의 학습 시간이 현저하게 감소시킬 수 있고, 신경망 학습 수렴 속도를 대폭 개선할 수 있는 효과가 있다. 아울러, 본 발명은 신경망을 병렬로 구성하여 각각의 신경망을 제어하기 위한 프로세서를 병렬로 구성하는 것이 가능하여, 학습 및 인식 속도를 크게 개선할 수 있게된다. 또한, 병렬로 구성된 각각의 신경망은 적은 양의 얼굴 영상만을 학습하고 인식을 수행하게 되므로 대용량의 데이터 베이스에 저장된 얼굴 인식에 적합하다.

Claims

인공 신경망을 이용하여 얼굴을 인식하는 얼굴 인식 장치로서,

얼굴의 특징 패턴을 나타내는 고유 팩셀들을 생성하고, 생성된 고유 팩셀들 중 소정수의 고유 팩셀들을 선정하는 고유 팩셀 선정부;

입력 영상을 상기 선정된 고유 팩셀들로 각각 필터링하는 고유 필터링부;

상기 선정된 고유 팩셀에 각각 대응되며, 대응되는 고유 팩셀로 필터링된 영상의 신호를 입력받아, 얼굴 인식 결과를 출력하는 소정수의 신경망; 및

상기 각각의 신경망으로부터 인식결과를 입력받아, 상기 입력 영상의 최종 얼굴 인식 결과를 출력하는 판단부를 포함하는 것을 특징으로 하는 얼굴 인식 장치.
인공 신경망을 이용하여 얼굴을 인식하는 얼굴 인식 장치로서,

얼굴의 특징 패턴을 나타내는 고유 팩셀들을 생성하고, 생성된 고유 팩셀들 중 소정수의 고유 팩셀들을 선정하는 고유 팩셀 선정부;

얼굴 영상을 입력받아 소정의 형식으로 정규화된 얼굴 영상을 출력하는 입력영상 정규화부;

상기 정규화된 입력 영상을 상기 선정된 고유 팩셀들로 각각 필터링하는 고유 필터링부;

상기 각각의 고유 팩셀들로 필터링된 각각의 영상을 서브 샘플링하여 신경망에 입력하기 적합한 크기의 영상을 출력하는 서브 샘플링부;

상기 선정된 고유 팩셀에 각각 대응되며, 대응되는 고유 팩셀로 필터링되고 서브 샘플링된 영상의 신호를 입력받아, 얼굴 인식 결과를 출력하는 소정수의 신경망; 및

상기 각각의 신경망으로부터 인식결과를 입력받아, 상기 입력 영상의 최종 얼굴 인식 결과를 출력하는 판단부를 포함하는 것을 특징으로 하는 얼굴 인식 장치.
제 1 항 또는 제 2 항에 있어서, 상기 고유 팩셀 선정부는

임의의 얼굴 영상을 소정의 블록들로 분할하고, 상기 각 블록들에 주성분 분석법을 적용하여 얼굴의 일정한 패턴적 특징을 나타내는 고유 팩셀을 생성하는 고유 팩셀 생성부를 포함하는 것을 특징으로 하는 얼굴 인식 장치.
제 3 항에 있어서, 상기 고유 팩셀 선정부는

상기 선정된 고유 팩셀 중에서 고유값이 큰 벡터의 순서로 소정수의 벡터를 선택하는 고유 팩셀 선택부를 더 포함하는 것을 특징으로 하는 얼굴 인식 장치.
제 1 항 또는 제 2 항에 있어서, 상기 고유 필터링부는

상기 입력 영상에 대해서 상기 각각의 고유 팩셀을 이동시키면서 컨벌루션 연산을 수행함으로써 상기 입력 영상을 고유 필터링하는 것을 특징으로 하는 얼굴 인식 장치.
제 5 항에 있어서, 상기 고유 필터링부는

상기 입력된 영상을 소정의 블록들로 분할하고, 분할된 상기 블록과 고유 팩셀이 소정의 부분만큼 겹쳐지도록 상기 고유 팰셀을 이동시키면서 컨벌루션 연산을 수행하여, 소정의 크기로 축소된 고유 필터링된 영상을 출력하는 것을 특징으로 하는 얼굴 인식 장치.
제 1 항 또는 제 2 항에 있어서,

상기 신경망은 모멘텀을 부가한 역전파(back propagation) 알고리즘에 의해서 학습되고,

이 때의 웨이팅 계수(w sub i )는 다음의 수식에 의해서 갱신되며,

상기 η는 학습 계수를, 상기 j 는 현재 유닛의 인덱스를, i 는 유닛 j 에 선행하는 유닛의 인덱스를, δ_j는 유닛 j 의 출력 오차를, O_i는 유닛 i 의 출력을, α는 모멘텀의 영향을 특정하는 상수를 각각 나타내는 것을 특징으로 하는 얼굴 인식 장치.
제 1 항 또는 제 2 항에 있어서, 상기 신경망의 출력층의 뉴런의 개수는 학습된 얼굴의 수와 동일한 것을 특징으로 하는 얼굴 인식 장치.
제 1 항 또는 제 2 항에 있어서, 상기 판단부는

입력된 각 신경망의 출력층 뉴런의 출력값을 소정의 범위의 값으로 변환하고, 신뢰값을 계산하며, 상기 신뢰값들을 상기 각 신경망의 출력층 뉴런에 대해서 합산하는 신뢰값 계산부;

상기 신뢰값에 따라서 상위 소정수의 신경망에서 검출된 얼굴을 선정하는 얼굴 선정부;

상기 각 신경망의 신뢰값에 그레이드를 부여하고, 상기 선정된 얼굴에 대해서, 전체 신경망의 제 1 그레이드 순서 및 상위 소정수의 신경망의 제 2 그레이드 순서를 계산하는 그레이드 연산부;

상기 제 1 및 제 2 그레이드 순서를 소정의 제 1 및 제 2 임계 그레이드 순서와 각각 비교하여 상기 선정된 얼굴들을 소정의 얼굴 그룹으로 분류하는 그룹핑부; 및

상기 소정의 얼굴 그룹 중 제 1 및 제 2 임계 그레이드 순서보다 큰 제 1 및 제 2 그레이드를 갖는 제 1 얼굴 그룹에 속하는 얼굴을 인식 결과로서 출력하는 인식 결과 출력부를 포함하는 것을 특징으로 하는 얼굴 인식 장치.
제 9 항에 있어서, 상기 신뢰값 계산부는

각 신경망의 출력층 뉴런의 각 출력값을, 각 출력값들에 대한 신경망의 출력값을 모두 합산한 값의 비로 변환하는 것을 특징으로 하는 얼굴 인식 장치.
제 10 항에 있어서, 상기 신뢰값 계산부는

상기 각 신경망의 출력층 뉴런의 각 출력값을 다음의 수식에 의해서 변환하고,

상기 W_α는 각 신경망의 출력층 뉴런의 실제 출력값을, β는 각 신경망의 출력층 뉴런의 개수를 각각 나타내는 것을 특징으로 하는 얼굴 인식 장치.
제 10 항에 있어서, 상기 신뢰값 계산부는

상기 변환된 출력값을 이용하여 다음의 수식

에 따라서 신경망의 신뢰값을 계산하며, 상기 y_max,1은 가장 큰 변환된 출력값을, y_max,2두 번째로 큰 변환된 출력값을 각각 나타내는 것을 특징으로 하는 얼굴 인식 장치.
제 12 항에 있어서, 상기 신경망의 신뢰값은

변환된 최대 출력값을 갖는 출력층 뉴런의 신뢰값으로 설정되고, 나머지 출력층 뉴런의 신뢰값은 0 으로 설정되는 것을 특징으로 하는 얼굴 인식 장치.
제 11 항에 있어서, 상기 그레이드 연산부는

상기 각 신경망의 신뢰값에 그레이드를 부여하고, 상기 선정된 얼굴에 대한 전체 신경망의 그레이드를 상위 신경망에서 하위 신경망의 순서로 나열한 제 1 그레이드 순서, 및 상기 선정된 얼굴에 대한 상기 소정수의 신경망의 그레이드를 상위 신경망에서 하위 신경망의 순서로 나열한 제 2 그레이드 순서를 계산하는 것을 특징으로 하는 얼굴 인식 장치.
제 11 항에 있어서, 상기 인식결과 출력부는

제 1 얼굴 그룹에 속하는 복수개의 얼굴 중, 상기 신뢰값 계산부로부터 입력받은 합산된 신뢰값이 큰 얼굴을 인식결과로서 출력하는 것을 특징으로 하는 얼굴 인식 장치.
인공 신경망을 이용하여 얼굴을 인식하는 얼굴 인식 방법으로서,

(a) 얼굴의 특징 패턴을 나타내는 고유 팩셀들을 생성하고, 생성된 고유 팩셀들 중 소정수의 고유 팩셀들을 선정하는 단계;

(b) 상기 선정된 고유 팩셀들을 이용하여 상기 신경망을 학습하는 단계;

(d) 입력 영상을 상기 선정된 고유 팩셀들로 각각 고유 필터링하여, 상기 고유 필터에 대응되는 얼굴 특징 패턴이 나타나는 고유 필터링된 영상을 얻는 단계;

(f) 상기 고유 필터링된 영상을 상기 선정된 고유 팩셀에 각각 대응되는 신경망으로 출력하여 각각의 얼굴 특징 패턴에 대해서 얼굴 인식을 수행하는 단계;

(g) 상기 각 신경망의 얼굴 인식 결과를 분석하여, 상기 입력 영상의 최종 얼굴 인식 결과를 출력하는 단계를 포함하는 것을 특징으로 하는 얼굴 인식 방법.
인공 신경망을 이용하여 얼굴을 인식하는 얼굴 인식 방법으로서,

(a) 얼굴의 특징 패턴을 나타내는 고유 팩셀들을 생성하고, 생성된 고유 팩셀들 중 소정수의 고유 팩셀들을 선정하는 단계;

(b) 상기 선정된 고유 팩셀들을 이용하여 상기 신경망을 학습하는 단계;

(c) 입력된 얼굴 영상을 소정의 형식의 얼굴 영상으로 정규화하는 단계;

(d) 상기 정규화된 얼굴 영상을 상기 선정된 고유 팩셀들로 각각 고유 필터링하여, 상기 고유 필터에 대응되는 얼굴 특징 패턴이 나타나는 고유 필터링된 영상을 얻는 단계;

(e) 상기 고유 필터링된 각각의 영상을 서브 샘플링하여 신경망에 입력하기 적합한 크기의 영상을 얻는 단계;

(f) 상기 고유 필터링되고 서브 샘플링된 영상을 상기 선정된 고유 팩셀에 각각 대응되는 신경망으로 출력하여 각각의 얼굴 특징 패턴에 대해서 얼굴 인식을 수행하는 단계; 및

(g) 상기 각 신경망의 얼굴 인식 결과를 분석하여, 상기 입력 영상의 최종 얼굴 인식 결과를 출력하는 단계를 포함하는 것을 특징으로 하는 얼굴 인식 방법.
제 16 항 또는 제 17 항에 있어서, 상기 (a) 단계는

임의의 얼굴 영상을 소정의 블록들로 분할하고, 상기 각 블록들에 주성분 분석법을 적용하여 얼굴의 일정한 패턴적 특징을 나타내는 고유 팩셀을 생성하는 단계를 포함하는 것을 특징으로 하는 얼굴 인식 방법.
제 18 항에 있어서, 상기 (a) 단계는

상기 생성된 고유 팩셀 중에서 고유값이 큰 벡터의 순서로 소정수의 벡터를 선택하는 단계를 더 포함하는 것을 특징으로 하는 얼굴 인식 방법.
제 16 항 또는 제 17 항에 있어서, 상기 (b) 단계는

모멘텀을 부가한 역전파(back propagation) 알고리즘에 의해서 상기 신경망을 학습하고,

이 때의 웨이팅 계수(w sub i )는 다음의 수식에 의해서 갱신되며,

상기 η는 학습 계수를, 상기 j 는 현재 유닛의 인덱스를, i 는 유닛 j 에 선행하는 유닛의 인덱스를, δ_j는 유닛 j 의 출력 오차를, O_i는 유닛 i 의 출력을, α는 모멘텀의 영향을 특정하는 상수를 각각 나타내는 것을 특징으로 하는 얼굴 인식 방법.
제 16 항 또는 제 17 항에 있어서, 상기 신경망의 출력층의 뉴런의 개수는 학습된 얼굴의 수와 동일한 것을 특징으로 하는 얼굴 인식 방법.
제 16 항 또는 제 17 항에 있어서, 상기 (d) 단계는

상기 입력 영상에 대해서 상기 각각의 고유 팩셀을 이동시키면서 컨벌루션 연산을 수행함으로써 상기 입력 영상을 고유 필터링하는 것을 특징으로 하는 얼굴 인식 방법.
제 22 항에 있어서, 상기 (d) 단계는

상기 입력 영상을 소정의 블록들로 분할하고, 분할된 상기 블록과 고유 팩셀이 소정의 부분만큼 겹쳐지도록 상기 고유 팰셀을 이동시키면서 컨벌루션 연산을 수행하여, 소정의 크기로 축소된 고유 필터링된 영상을 얻는 것을 특징으로 하는 얼굴 인식 방법.
제 16 항 또는 제 17 항에 있어서, 상기 (b) 단계는

(b1) 입력된 학습영상을 소정의 형식으로 정규화하는 단계;

(b2) 상기 정규화된 학습 영상을 상기 (a) 단계에서 선정된 고유 팩셀들로 각각 고유 필터링하여, 상기 고유 필터에 대응되는 얼굴 특징 패턴이 나타나는 고유 필터링된 영상을 얻는 단계; 및

(b3) 상기 고유 필터링된 각각의 영상을 서브 샘플링하고, 상기 선정된 고유팩셀에 각각 대응되는 신경망에 입력하여, 상기 각각의 신경망을 학습하는 단계를 포함하는 것을 특징으로 하는 얼굴 인식 방법.
제 16 항 또는 제 17 항에 있어서, 상기 (g) 단계는

(g1) 상기 출력층 뉴런의 출력값을 소정의 범위의 값으로 변환하여, 신뢰값을 계산하고, 상기 신뢰값들을 상기 각 신경망의 출력층 뉴런에 대해서 합산하는 단계;

(g2) 상기 신뢰값에 따라서 상위 소정수의 신경망에서 검출된 얼굴을 선정하는 단계;

(g3) 상기 각 신경망의 신뢰값에 그레이드를 부여하고, 상기 선정된 얼굴에 대해서, 전체 신경망의 제 1 그레이드 순서 및 상위 소정수의 신경망의 제 2 그레이드 순서를 계산하는 단계;

(g4) 상기 제 1 및 제 2 그레이드 순서를 소정의 제 1 및 제 2 임계 그레이드 순서와 각각 비교하여 상기 선정된 얼굴들을 소정의 얼굴 그룹으로 분류하는 단계; 및

(g5) 상기 소정의 얼굴 그룹 중 제 1 및 제 2 임계 그레이드 순서보다 큰 제 1 및 제 2 그레이드를 갖는 제 1 얼굴 그룹에 속하는 얼굴을 인식 결과로서 출력하는 단계를 포함하는 것을 특징으로 하는 얼굴 인식 방법.
제 25 항에 있어서, 상기 (g1) 단계는

각 신경망의 출력층 뉴런의 각 출력값을, 각 출력값들에 대한 신경망의 출력값을 모두 합산한 값의 비로 변환하는 단계를 포함하는 것을 특징으로 하는 얼굴 인식 방법.
제 26 항에 있어서, 상기 (g1) 단계는

상기 각 신경망의 출력층 뉴런의 각 출력값을 다음의 수식에 의해서 변환하고,

상기 W_α는 각 신경망의 출력층 뉴런의 실제 출력값을, β는 각 신경망의 출력층 뉴런의 개수를 각각 나타내는 것을 특징으로 하는 얼굴 인식 방법.
제 26 항에 있어서, 상기 (g1) 단계는

상기 변환된 출력값을 이용하여 다음의 수식

에 따라서 신경망의 신뢰값을 계산하는 단계를 더 포함하며, 상기 y_max,1은 가장 큰 변환된 출력값을, y_max,2두 번째로 큰 변환된 출력값을 각각 나타내는 것을 특징으로 하는 얼굴 인식 방법.
제 28 항에 있어서, 상기 각 신경망의 신뢰값은

상기 변환된 최대 출력값을 갖는 출력층 뉴런의 신뢰값으로 설정되고, 나머지 출력층 뉴런의 신뢰값은 0 으로 설정되는 것을 특징으로 하는 얼굴 인식 방법.
제 27 항에 있어서, 상기 (g3) 단계는

상기 각 신경망의 신뢰값에 그레이드를 부여하는 단계; 및

상기 선정된 얼굴에 대한 전체 신경망의 그레이드를 상위 신경망에서 하위 신경망의 순서로 나열한 제 1 그레이드 순서, 및 상기 선정된 얼굴에 대한 상기 소정수의 신경망의 그레이드를 상위 신경망에서 하위 신경망의 순서로 나열한 제 2 그레이드 순서를 계산하는 단계를 포함하는 것을 특징으로 하는 얼굴 인식 방법.
제 27 항에 있어서, 상기 (g5) 단계는

제 1 얼굴 그룹에 속하는 복수개의 얼굴 중, 상기 (g1) 단계에서 계산된 합산된 신뢰값이 큰 얼굴을 인식결과로서 출력하는 것을 특징으로 하는 얼굴 인식 방법.
제 16 항 또는 제 17 항의 얼굴 인식 방법을 컴퓨터에서 판독할 수 있고, 실행 가능한 프로그램 코드로 기록한 기록 매체.
제 27 항의 얼굴 인식 방법을 컴퓨터에서 판독할 수 있고, 실행 가능한 프로그램 코드로 기록한 기록 매체.