KR101676101B1

KR101676101B1 - 동적보상퍼지신경네트워크(dcfnn)를 기반으로 한 얼굴인식 알고리즘

Info

Publication number: KR101676101B1
Application number: KR1020140129852A
Authority: KR
Inventors: 이응주
Original assignee: 동명대학교산학협력단
Priority date: 2014-09-29
Filing date: 2014-09-29
Publication date: 2016-11-15
Also published as: KR20160037423A

Abstract

본 발명은 얼굴인식 방법에 관한 것으로, 동적보상퍼지신경네트워크(DCFNN)와 고유얼굴인식-LCA(Eigen face-LDA)를 혼합한 얼굴인식 알고리즘으로서, 고차원의 이미지를 저차원으로 투영시켜 사이즈를 감소시키는 사이즈 감소단계; 고유얼굴알고리즘 및 LDA알고리즘을 이용하여 대상얼굴의 특징을 추출하여 데이터베이스화하는 특징추출단계; 상기 특징추출단계에서 추출된 데이터베이스를 이용하여, 동적보상퍼지신경네트워크(DCFNN) 알고리즘구조를 형성하는 알고리즘구조형성단계; 상기 알고리즘 구조형성단계로부터 형성된 알고리즘구조가 얼굴 추출기에 입력되는 입력단계; 상기의 입력단계에서 입력된 데이터가 얼굴인식 알고리즘을 통해 데이터를 처리하는 처리단계; 상기의 처리단계에서 추출된 데이터가 인식과정을 거쳐 얼굴인식이 구현되는 구현단계를 포함하는 것을 특징으로 하는 얼굴인식 알고리즘을 제공한다.

Description

동적보상퍼지신경네트워크(DCFNN)를 기반으로 한 얼굴인식 알고리즘{A Hybrid Method based on Dynamic Compensatory Fuzzy Neural Network Algorithm for Face Recognition}

본 발명은 얼굴인식 방법에 관한 것으로, 동적보상퍼지신경네트워크(DCFNN)와 고유얼굴인식-LCA(Eigen face-LDA)를 혼합한 방식을 이용한 얼굴인식 알고리즘에 관한 것이다.

자동얼굴인식 기술은 인간과 컴퓨터상호작용(HCI), 비주얼 커뮤니케이션, 보안시스템, 현장감식, 범인인식 등 다양한 영역에 적용되어 점점 더 중요한 역할을 수행하고 있다.

지난 10년간 얼굴인식은 컴퓨터 비전분야 연구와 이미지 분석 및 이해부분에서 컴퓨터과학자뿐만 아니라 신경과학자, 심리학자에게까지도 가장 인기 있는 영역이 되었다.

그러나 얼굴인식은 촬영각도, 조명의 변화, 포즈나 노화 등 다양한 원인으로 인해 매우 어려운 문제로 인식되고 있다. 이러한 얼굴인식의 문제점은 얼굴이미지 데이터는 고차원이고, 처리에 대규모의 공간이 필요하고, 얼굴인식과정을 처리하기 위해서는 고차원의 공간에서 수행되어야 하는 문제점을 안고 있다.

과거 몇 십 년 동안 다양한 얼굴인식알고리즘이 발명되어왔고, 접근통제나 감시 등에 적용되고 있다.

Principal Component Analysis (PCA) 방식은 얼굴값에 이미지가 투사되는 이른바 고유공간의 방법으로, 기본데이터 압축방법을 사용하여 데이터차원을 감소시켜주어 얼굴패턴의 저 구조화에 가장 효과적인 것으로 드러났다.

Local Feature Analysis(LFA) 인식방법은 눈이나 코 등 얼굴 국소부위 특징에 의해 분석하는 방법으로 이른바 LFA kernels라고 불린다.

최근의 연구원들은 항상 혼합 방식을 사용하는 연구법을 개발하고 있다. 선과 비선적인 투사방법을 혼합한 것으로 더 나은 인지결과를 얻을 수 있다.

수많은 연구원들은 연구결과를 향상시키기 위해 최적화 알고리즘과 신경네트워크를 혼합한 방법을 사용한다. Convolutional Neural Network(CNN)은 국부이미지샘플링, 자가형성 신경네트워크지도와 CNN을 혼합하는 방식이다.

PDBNN방식은 확률적 결정에 기초한 얼굴인식 시스템으로, 얼굴검출-눈 위치판별-얼굴인식의 총 3단계모듈에 의해 구성된다.

많은 하이브리드 방식에 있어서, 신경네트워크와 퍼지시스템의 혼합 방식은 최근에 가장 뜨거운 연구분야가 되었지만, 그럼에도 불구하고 퍼지신경시스템을 사용한 인식속도 문제 때문에 최적절차가 쉽게 이루어지지 않고 있어 이러한 문제점을 해결할 혼합 알고리즘의 필요성이 대두되고 있다.

또한, 향후 21세기 멀티미디어 정보사회에서는 개인에 대한 정보관리, 보호가 무엇보다 중요하게 될 것이다. 최근 컴퓨터를 이용한 개인의 정보보호 및 신분확인을 위해 인체특징을 이용한 바이오메트릭 기술이 많이 연구되고 있다.

그 가운데 대표적인 것으로는 얼굴인식, 지문인식, 안구인식, 정맥패턴인식과 같은 컴퓨터 비전기술을 이용하는 방법과 화자인식과 같이 음성정보를 이용하는 방법 등이 있다. 그러나 대부분의 방법에서는 센싱 방식에 따라 특별한 환경하에서 사용자로 하여금 일정한 동작을 취하도록 요구하기 때문에 사용자의 거부감을 일으키는 단점이 있다.

이에 반해 얼굴인식 기술은 사용자의 특별한 동작이나 행위에 대한 요구가 없이 비 접촉식으로 자연스럽게 확인할 수 있다는 장점 때문에 편리하고, 경쟁력 있는 바이오메트릭 기술로 평가된다.

그러나 이러한 얼굴인식시스템의 필요성에도 불구하고 얼굴인식 제품의 상용화를 위해서는 아직도 많은 문제점을 해결해야 한다.

왜냐하면 같은 사람의 얼굴이라도 여러 가지 왜곡요인에 의하여 서로 다른 시점에서 획득된 얼굴영상의 정보가 크게 변하기 때문이다.

예를 들어 얼굴표정, 포즈 또는 크기의 변화는 심한 기하학적인 왜곡을 일으키며, 설사 주어진 얼굴영상들이 같은 기하학적 모양을 유지하더라도 조명이 변하는 경우에는 얼굴영상의 밝기 정보가 크게 왜곡된다.

이외에도 배경의 변화, 화장, 노화, 안경 등 얼굴장식품의 착용 등으로 인한 얼굴영상의 왜곡이 얼굴을 분류하는데 많은 어려움을 주고 있다. 따라서 실제 환경에 적용이 가능한 얼굴인식 응용제품을 개발하기 위해서는 가능한 앞에서 언급한 왜곡요인들과 무관한 얼굴인식시스템을 연구, 개발해야 할 필요성이 있다.

KR 10-2012-0145214 KR 10-2004-0046851 KR 10-2002-0076045

본 발명은 기존에 제안된 상기와 같은 종래기술의 문제점을 해결하기 위해 고안된 것으로서, 고유얼굴인식(Eigenface)과 LDA를 혼합한 알고리즘을 사용하여 특징을 추출하고 분류한다. 고유얼굴인식(Eigenface)은 고차원의 얼굴이미지를 저 차원의 공간으로 투영시키는데 사용되고, LDA알고리즘은 분류를 위한 최적의 부분공간을 찾고, 분류 간 조합과 분류 내 거리를 극대화 시키도록 한다.

즉, 본 발명의 목적은, 동적보상퍼지신경네트워크(DCFNN)를 활용하여 퍼지신경망 학습속도를 높여 얼굴인식기술을 향상시키는데 있다.

동적보상퍼지신경네트워크(DCFNN)을 기반으로 한 얼굴인식 알고리즘에 있어서, 상기 얼굴인식 알고리즘은, 고차원의 이미지를 저차원으로 투영시켜 사이즈를 감소시키는 사이즈 감소단계; 고유얼굴알고리즘 및 LDA알고리즘을 이용하여 대상얼굴의 특징을 추출하여 데이터베이스화하는 특징추출단계; 상기 특징추출단계에서 추출된 데이터베이스를 이용하여, 동적보상퍼지신경네트워크(DCFNN) 알고리즘구조를 형성하는 알고리즘구조형성단계; 상기 알고리즘 구조형성단계로부터 형성된 알고리즘구조가 얼굴 추출기에 입력되는 입력단계; 상기의 입력단계에서 입력된 데이터가 얼굴인식 알고리즘을 통해 데이터를 처리하는 처리단계; 상기의 처리단계에서 추출된 데이터가 인식과정을 거쳐 얼굴인식이 구현되는 구현단계를 포함하는 것을 특징으로 한다.

이상에서 설명한 바와 같이, 본 발명에 따른 얼굴인식 시스템에서는 동적보상퍼지신경망(DCFNN)과 고유얼굴인식-LCA(Eigen face-LDA)의 장점을 결합하여 얼굴인식 알고리즘을 제안하였으며, DCFNN의 구조는 능력과 안정성의 일반화 측면에서 더욱 최적화 되어있다.

실험결과, 고유 얼굴-LDA와 동적보상퍼지신경네트워크(DCFNN)알고리즘의 혼합알고리즘이 표정과, 조명, 포즈가 달라지더라도 ORL과 예일 데이터베이스에서 잘 작동하는 것을 나타났다.

포즈와 따라서 이 알고리즘은 얼굴인식 구현에 뛰어난 능력을 가지고 있고, 효과적으로 분류 치수를 감소시킬 수 있다.

또한 이 알고리즘은 계산의 복잡성을 줄여준다. 또한 본 발명을 통해 과다 적합과 과잉훈련의 DCFNN의 문제를 해결할 수 있다.

도 1은 본 발명의 실시 예에 따른 얼굴 인식을 위한 고유 얼굴(Eigenface)과 DCF-LDA 결합에 기초한 혼합알고리즘 작동 예시도이다;
도 2은 본 발명에 따른 얼굴인식을 위한 동적보상퍼지신경네트워크(DCFNN)와 고유얼굴인식-LCA(Eigen face-LDA)를 혼합한 방식을 이용한 얼굴인식 알고리즘의 작동 위상기하학도이다;

1단계에서는, 고유얼굴(Eigenface)인식과 LDA를 혼합한 알고리즘을 사용하여 특징을 추출한다.

고유얼굴은 고차원의 얼굴이미지를 저차원구조로 투영시키는데 사용되고, 동시에 분류를 위한 최적의 하부공간을 찾고, 클래스간 공간과 클래스 내 공간의 조합을 극대화시킨다. 절차는 다음과 같다.

얼굴이미지 I1, I2,I3,,IM을 획득한다. 각각의 얼굴이미지는 I(x,y)로 표시되고, 얼굴이미지트레이닝세트를 1, 2, , M으로 두고 평균얼굴값을 구한다.

식1

식(1)은 평균영상을 구하는 식이다. M은 트레이닝 얼굴이미지의 숫자를 나타내고, i 는 i번째 얼굴벡터를 나타낸다. 구해진 평균에서 i 를 공제한다. 공제식은 다음과 같다.

식2

식(2)의 i 를 저차원의 공간으로 투영하기 위한 것이다. 이를 이용하여 공분산행렬 C를 계산한다. 식은 다음과 같다.

식3

여기서 A는 1, 2, , M을 나타낸다. 공분산 행렬C를 위한 고유 벡터와 고유 값을 나타내는 VK와 k을 계산한다. 식은 다음과 같다.

식4

여기서, VK는 고유 얼굴 Ul로부터 M개의 얼굴 이미지 훈련 세트의 선형 결합을 결정한다. 여기서 고유얼굴벡터 세트 U = [u ,u ,..., ]를 획득한다. 분류를 위한 가장 중요한 부분 공간을 찾기 위해, 클래스 간 분산과 클래스 내 분산의 비율을 극대화하고 클래스간 분산 매트릭스 Sb와 클래스 내 분산매트릭스 Sw 계산한다. 식은 다음과 같다.

식5

식6

여기서

은 모든 클래스의 평균이며,

은 클래스 I의 평균이다.

C는 클래스의 수이고, ni는 i번재 클래스의 수를 나타내고, uij는 i클래스의 j번째 샘플을 나타낸다.

최적의 부분공간W*는 식(7)에 의해 결정된다.

식7

가장 중요한 부분 공간 W*는 라그랑주 승수에 의해 계산된다. 반면 부분공간 W*는 DCFNN 입력값으로 간주된다.

2단계에서는, 동적퍼지신경네트워크구조가 형성되고 알고리즘의 학습이 이루어진다.

동적 보상 퍼지 신경망은 보상 퍼지와 동적 퍼지 신경망을 조합 한 시스템이다.

이것은 제어기반 신경세포와 의사 결정기반의 신경 세포로 구성되어 있다. DCFNN의 구조는 미리 정의되지 않지만 동적으로 변동될 수 있다.

즉, DCFNN을 학습하기 전에는 규칙이 존재하지 않고, 규칙이 학습 과정에서 연속적으로 생성된다. DCFNN는 차원의 급수적인 증가를 회피 할 수 있기 때문에, 규칙의 수는 기하 급수적으로 증가하지 않는다.

DCFNN의 구조는 5 개의 층(입력층, 퍼지화층, 퍼지추론층, 보상산정층,출력층)으로 구성되어 있다. DCFNN 토폴로지는 그림 1. 로 표시되어있다.

그림 1. DCFNN토폴로지

그림1에서, X1,2,...,n는 입력 언어 변수이고, Y1,2,...,M는 출력 변수이며, MFJ입력 변수 i 번째 구성원 함수 j 번째이며, Ru는 u번째 퍼지 규칙을 나타내며, Cr은 r번째 보상 퍼지 신경을, Wum은 u 번째에서 m번째 규칙 가중치를 나타낸다.
{d}_i(j) = │{x}_i - {c}_j│, 여기서, {x}_i는 입력언어 변수이고, {c}_j는 j번째 보상퍼지신경을 나타낸다.

레이어1. 입력 층(input layer): 각 노드는 입력 언어 변수를 나타낸다. 그들은 직접 다음 층으로 이동한다.

레이어2. 퍼지화층(fuzzification layer): 이 층에서 각 노드는 멤버십 함수를 나타내며, 함수는 가우스 함수로 나타내며, 식은 다음과 같다.

식8

여기서 I = 1, 2, N; J = 1,2, U 및 ij는 XI의 j번째 멤버십함수이고, CIJ는 XI의 J 번째 가우시안멤버십의 중심이고, j는 J번째 멤버십의 폭이다. n은 입력 변화의 수이고, u는 총 규칙의 수 즉 멤버십함수의 수이다.

레이어3. 퍼지추론층(fuzzy inference layer): 레이어 3의 각노드는 퍼지규칙을 위한 IF섹션의 가능성을 나타낸다.

이층의 대다수는 많은 퍼지규칙을 반영한다. j 번째 규칙의 Rj경우, 출력값은 식(9)에 의해 도출된다.

식9

여기서 X = (x1,, xn)RN과 Cj=(c1,, cn)RN은 j번째 뉴런의 중앙에 있다.

레이어4. 보상산정층(compensatory computation layer): 이 층은 액티브 - 패시브 보상 동작 층이다. 보상 퍼지 뉴런의 수는 퍼지 규칙의 노드와 같다. Cj의 j번째 노드의 산출 값은 식(10)으로 표현될 수 있다.

식10

여기서 [0,1]은 보상 정도와 j = 1, 2,u. 이다. 이 층에서는 보상 동작의 활성화 동작 및 수동 운용을 기반으로 한다. 활성화 동작을 나타낼 때에는, 입력은 최고의 출력으로 투영되고, 입력은 최고의 결과를 위한 낙관적인 결정을 한다.

대신, 수동으로 운용될때는 작동이 최악의 입력을 투영 할 수 있고, 수동적인 작동은 최악의 출력을 위한 보상작동을 만든다. 또한, 보상작동은 최고와 최악의 출력을 보상출력으로 투영시킨다.

그리고 보상작동은 그것들을 균형(최고와 최악)으로 결정된다. 작동방식은 식(11)과 같다.

식11

보상작동방식은 식(12)와 같이 나타낼 수 있다.

식12

따라서, 보상방식은 식(13)과 같다.

식13

이것은 결점묵인의 네트워크를 강화시키고, 보상 작동 도입에 있어서 시스템을 더욱 안정적으로 만든다.

하지만 보상도 선택을 인식하는 것에 가치가 있다. 오버사이즈나 언더사이즈를 가지는 감마는 훈련시간과 경험적 결과에 영향을 준다. 따라서 적절한 보상 값 감마는 많은 실험이 이루어진 후에 선택된다.

레이어5. 출력 층(output layer): 레이어5의 각 노드는 입력 신호의 합인 출력 변수를 나타낸다.

식14

여기서 w_ji는 j번째 보상퍼지뉴런에서 i번째 출력뉴런으로의 가중치이다.

DCFNN의 구조는 미리 정의 된 것이 아니며, DCFNN의 학습이전에는 어떠한 규칙도 존재하지 않는다. 퍼지 규칙은 학습 과정에서 지속적으로 생성되는 동적 변화이다.

시스템에 많은 규칙이 존재하지 않는다면 모든 입출력의 상태 공간을 포함 할 수 없고, ??DCFNN의 성능은 떨어진다. 반대로 시스템에 매우 많은 규칙이 존재하는 경우에는, 시스템의 복잡성은 증가한다. 그래서 새로운 규칙이 추가되는지 여부를 확인하는 것이 매우 중요하다. 또한 출력 오차와 가우스 함수의 적용 범위는 시스템 여부에 새 규칙이 추가되는지 여부가 중요한 고려 사항이다.

알고리즘의 학습법은 다음과 같이 나타낼 수 있다.

1)우선, 미리 정의된 DCFNN의 파라미터를 초기화한다.

2)시스템의 첫 번째 학습 데이터 x_i 입력하면, 첫 번째 규칙은 연속적으로 생성된다.

여기서 C₁=x₁, σ1= σ0, γ1=γ0은 미리 정의된 상수이다.

3)모든 데이터

를 시스템에 입력하고, 훈련과정이 시작되면, 실제출력오차 e_I 는 계산되고, d_min는 식(15), 식(16)에 근거해서 추출된다. 유효 반경 k_d와 오류임계 값k_e는 식(16), 식(17)에 의해 계산된다.

식15

식16

식17

dmin과 kd를 비교했을 때, dmin가 kd보다 크면, 5)로 넘어가고 그렇지 않으면 8)로 간다.

Ei와 ke를 비교했을 때, Ei가 ke보다 크면, 6)으로 넘어가고 그렇지 않으면 10)으로 간다.

식(18)은 새로운 규칙을 만들고, 새로운 파라미터를 조정하기 위해 사용된다.

식18

오류 하강 속도 i을 계산한다.

i는 i번째 규칙의 중요도를 나타낸다. i와 kerr(미리 정의된 임계 값)의 비교를 통해 새로운 규칙의 중요성을 판단한다. 만약, i이 kerr보다 작다면, 새로운 규칙이 중요하지 않다는 것을 의미하고, 시스템은 새로운 규칙을 삭제한다. 그리고 나서 (3)과 (4)의 단계를 반복하거나 (10)으로 넘어간다.

Ei와 ke를 비교했을 때, Ei가 ke보다 크면 (9)로 가고, 아니면 (10)으로 간다.

식(19)에 따라 퍼지 규칙 층의 뉴런의 폭을 조정한다.

식19

여기서 ku(ku>1)는 상수이다.

최소 자승 법 (LSM)을 사용하여, 보상작동층과 출력 층의 가중치를 조절한다.

모든 훈련 데이터가 DCFNN 시스템에 입력 될 때까지 (3), (4)를 반복한다.

위의 적절한 매개 변수는 수많은 실험에 의해 얻어진다.

본 얼굴인식 시스템에서는 고유 얼굴과 퍼지신경망을 이용한 알고리즘을 제안하였으며, 실험에서는 ORL의 얼굴데이터베이스를 사용한다.

이전의 ORL의 얼굴데이터베이스는 1992년 4월부터 1994년 4월까지 실험실에서 촬영한 얼굴이미지 세트를 포함한다.

얼굴이미지세트에는 각각 40개의 별개의 분류에 10개의 다른 이미지가 있다. 일부 피사체의 이미지는 조명, 얼굴 표정 변화(뜬눈 / 감은 눈 / 웃는 얼굴, 무표정), 얼굴의 디테일(안경착용 / 미착용), 촬영 시간 등이 다르다. 모든 이미지는 정면 위치, 피사체와 수직을 이루는 어둡고 균일한 배경에 촬영되었다. 회전, 기울기 허용 오차는 20도, 약 10 %규모이다. 파일은 BMP 형식이고, 각 화상의 크기는 픽셀 당 256 그레이스케일로, 92 * 112 픽셀이다. 그림. 2는 ORL 얼굴 데이터베이스의 샘플이다.

그림 2. ORL얼굴데이터베이스의 샘플

얼굴 인식을 위한 고유 얼굴(Eigenface)과 DCF-LDA 결합에 기초한 혼합방식의 흐름도는 그림3. 에 도시되어있다.

그림 3. 플로우차트

얼굴 인식 방법은 세 단계로 구성된다: 첫째, LDA알고리즘과 고유 얼굴 (Eigenface) 알고리즘을혼한합 방법을 이용하여 특징 추출 및 사이즈 감소시키고, 둘째, DFNN가 얼굴분류기로 분류한 얼굴을 받아들이는 단계를 거쳐, 마지막으로, 최종 단계는 인식 과정으로 이어진다.

고유얼굴알고리즘과 LDA알고리즘의 혼합방식의 실험결과를 살펴보기 위해, 40명의 사진 중 무작위로 5개의 이미지를 선택했다. 선택된 200개의 이미지는 트레이닝세트로 구현되었다. 반면 테스트를 위해 40명의 사람의 다른 200개의 이미지는 선택했다.

92 * 112의 크기는 원본 이미지가 10304 * 1 행렬로 변환했고, 우리는 60개의 고유 얼굴과 LDA 분류기에서 40개의 특징을 선택하면, 특징 추출과 차원의 감소가 실현된다. 그 결과는 그림 4-7에 나타난다.

그림 4. 훈련하는 모든 얼굴의 평균

그림 5.분산 S_W의 분배

그림 6. 분산 S_b의 분배

그림 7. 높은 고유가치가 투영된 처음 10개의 고유얼굴

분류문제를 해결하기 위한 DCFNN의 성능실험결과는 다음과 같다. 시스템에서, 규칙이 거의 없으면, 입출력 상태의 공간모두를 포함하지 않고, DCFNN의 성능은 나빠진다. 반대로 시스템에 매우 많은 규칙이 존재하는 경우에는 시스템의 복잡성이 증가하고, 일반화 능력은 떨어진다. 따라서, 확실히 새로운 규칙을 추가할지 여부를 확인하는 것이 매우 중요하다.

트레이닝 상태에서 DCFNN의 성능은 그림 8-11에 나와있다. 이것은 각각 DCFNN의 실제 오차와 퍼지규칙생성, 요구된 결과와 실제결과 사이의 비교, RMSE 을 의미한다.

그림 8. DCFNN의 실제오차

그림 9. 퍼지규칙생성

그림 10. 요구된 결과와 실제 결과의 비교

그림 11. RMSE

그림. 8은 보상퍼지뉴런과 결합한 DFNN가 초기의 옳고 그름의 퍼지규칙을 통해 샘플이 트레이닝될 수 있는 것을 보여준다. 이것은 네트워크의 내결함성 및 안정성을 증명한다. 그림. 9, 우리는 DCFNN을 학습하기 전에는 규칙이 존재하지 않고, DCFNN 규칙은 학습 과정에서 연속적으로 생성됨을 나타낸다.

DCFNN는 차원저주의 영향을 피할 수 있기 때문에 규칙의 수는 기하 급수적으로 증가하는 것은 아니다. 그림. 10은 DCFNN의 분류의 정확도를 보여준다. 실제출력은 DCFNN에 의해 훈련결과가 희망 값과 유사하게 나타나는 것을 보여준다.

우리는 PCA와 LDA의 혼합, RBFNN, PCA와 DFNN의 혼합과 고유 얼굴- LDA와 DCFNN의 혼합 등과 같은 다양한 혼합알고리즘 아래에 훈련했다.

비교 시험의 결과는 그림12, 그림13과 같이 표시되어있다. 그림. 12, 그림. 13은 본 논문에서 제안하는 방법이 훈련 속도가 빠르고, 인식률이 다른 3 개의 알고리즘보다 우수하다는 것을 우리에게 보여준다. 이것은 얼굴 인식의 수준이 만족할만하다는 것을 보여준다.

그림 12. ORL데이터베이스의 비교테스트

그림 13. ORL데이터베이스를 이용하여 다양한 혼합법을 사용하여 이루어진 얼굴인식비율 비교

제안된 방법의 유효성을 검증하기 위해, 우리는 예일데이터베이스의 15명의 11가지의 다른 상황에서 촬영한 165개의 정면이미지를 가지고 실험을 수행하였다. 비교 테스트 결과는 그림14. 로 표시되어있다.

그림 14. YALE데이터베이스를 이용하여 다양한 혼합법을 사용하여 이루어진 얼굴인식비율 비교

여기에서는 일인당 6개의 얼굴 이미지는 훈련 샘플 등으로 선택되어 그 후 교차검증이 이루어진다. 또한 우리의 얼굴 인식 시스템의 성능은 더 많은 훈련 샘플을 사용할수록, 같은 훈련 샘플을 사용한 다른 방법보다 우수하다.

동적보상퍼지신경네트워크(DCFNN)가 보상 퍼지 신경망과 동적 신경망의 장점을 조합하고 있기 때문에 원래의 정규화 레이어를 대체하는 네트워크 모델의 생성 능력을 효과적으로 향상시킬 수 있다. 실험 결과는 본 발명에서 제안하는 얼굴 인식 시스템이 ORL과 YALE 얼굴 데이터베이스에서 만족할만한 성능을 가지는 것을 증명한다.

Claims

동적보상퍼지신경네트워크(DCFNN)을 기반으로 한 얼굴인식 알고리즘에 있어서,
상기 얼굴인식 알고리즘은,
고차원의 이미지를 저차원으로 투영시켜 사이즈를 감소시키는 사이즈 감소단계;
고유얼굴알고리즘 및 LDA알고리즘을 이용하여 대상얼굴의 특징을 추출하여 데이터베이스화하는 특징추출단계;
상기 특징추출단계에서 추출된 데이터베이스를 이용하여, 동적보상퍼지신경네트워크(DCFNN) 알고리즘구조를 형성하는 알고리즘구조형성단계;
상기 알고리즘 구조형성단계로부터 형성된 알고리즘구조가 얼굴 추출기에 입력되는 입력단계;
상기의 입력단계에서 입력된 데이터가 얼굴인식 알고리즘을 통해 데이터를 처리하는 처리단계;
상기의 처리단계에서 추출된 데이터가 인식과정을 거쳐 얼굴인식이 구현되는 구현단계를 포함하고,
상기 고유얼굴알고리즘은 고차원의 얼굴이미지를 저차원의 얼굴이미지로 투영시키고, 얼굴이미지데이터 분류를 위한 하부공간을 찾는 것이며,
상기 동적보상퍼지신경네트워크 알고리즘은 입력 언어 변수를 나타내는 각 노드가 직접 다음 층으로 이동하는 것을 특징으로 하는 입력층인 레이어 1;
각 노드가 가우시안 멤버십 함수인 것을 특징으로 하는 퍼지화층인 레이어 2;
각 노드는 퍼지규칙을 위한 IF섹션의 가능성을 나타내며, 퍼지규칙을 반영하는 퍼지추론층인 레이어 3;
액티브-패시브 보상 동작 층으로, 보상 퍼지 뉴런의 수는 퍼지 규칙의 노드와 동일한 보상산정층인 레이어 4;
각 노드가 입력 신호의 합인 출력 변수로 나타내는 출력층인 레이어 5;를 포함하고,
상기 동적보상퍼지신경네트워크 알고리즘은 기 정의된 동적보상퍼지신경네트워크의 파라미터를 초기화하는 초기화 단계; 시스템의 첫 번째 학습 데이터 xi를 입력하면, 첫 번째 규칙이 연속적으로 생성되는 입력단계;
시스템에 모든 데이터
를 입력하고, 훈련과정이 시작 되면 실제출력오차 e_I가 계산되고, d_min에 대한 관계식
을 근거해서 추출되고, {d}_i(j) = │{x}_i - {c}_j│, 여기서, {x}_i는 입력언어 변수이고, {c}_j는 j번째 보상퍼지신경을 나타낸다. 유효반경 k_d는
와 오류임계값 k_e는
에 의해 산출하는 계산단계;

에 근거해 파라미터를 조정하기 위한 새로운 규칙을 만드는 규칙생성단계;
오류하강속도 ηi을 계산하는 오류하강속도 산출단계;

(상기 식에서 ku는 1보다 큰 상수이다)에 근거해 퍼지 규칙 층의 뉴런의 폭을 조정하는 뉴런 폭 조정단계;
최소자승법을 사용하여, 보상작동층과 출력층의 가중치를 조절하는 가중치 조절단계;
모든 훈련 데이터가 동적보상퍼지신경네트워크 시스템에 입력 될 때까지 상기 계산단계와 상기 규칙생성단계를 반복하는 반복단계를 포함하고,
상기 얼굴이미지 I1, I2, IM을 획득시 각각의 얼굴이미지는 I(x,y)로 표시되고 얼굴이미징트레이닝세트를 1, 2, ..., M으로 두고 평균얼굴값을 구하고,
상기 평균얼굴값에 대한 평균영상은
의 관계로 구하며 여기서 M은 트레이닝 얼굴이미지의 수, i는 i번째 얼굴벡터를 나타내며,

의 관계를 통해서 상기 i를 공제하며 상기 i를 저차원의 공간으로 투영하기 위해서
의 관계로 공분산 행렬 C를 구하며, 여기서, A는 1, 2, ..., M을 나타내고 고유벡터 VK와 고유값 k는
의 관계로 산출하고,
상기 VK는 고유얼굴UI로부터 M개의 얼굴이미지 훈련세트의 선형결합을 결정하여 고유얼굴벡터 세트 U를 획득하는데 분류를 위한 부분 공간을 찾기 위해서 클래스 간 분산과 클래스 내 분산 비율을 극대화하고 클래스간 분산 매트릭스 S_b와 클래스 내 분산매트릭스 S_w를 각각
와
관계를 기반으로 계산하며,
상기 부분공간(W*)은
의 관계로 계산된 이후에 동적퍼지신경네트워크구조가 형성되고 알고리즘 학습이 이루어지는 것을 특징으로 하는 얼굴인식 알고리즘 구현방법.
삭제
삭제
삭제