KR100571813B1 - 로컬 선형변환함수를 이용한 특징벡터 추출방법과 이를이용한 영상인식방법 및 장치 - Google Patents

로컬 선형변환함수를 이용한 특징벡터 추출방법과 이를이용한 영상인식방법 및 장치 Download PDF

Info

Publication number
KR100571813B1
KR100571813B1 KR1020030052131A KR20030052131A KR100571813B1 KR 100571813 B1 KR100571813 B1 KR 100571813B1 KR 1020030052131 A KR1020030052131 A KR 1020030052131A KR 20030052131 A KR20030052131 A KR 20030052131A KR 100571813 B1 KR100571813 B1 KR 100571813B1
Authority
KR
South Korea
Prior art keywords
local
function
vector
linear transformation
group
Prior art date
Application number
KR1020030052131A
Other languages
English (en)
Other versions
KR20050013467A (ko
Inventor
김태균
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020030052131A priority Critical patent/KR100571813B1/ko
Priority to US10/896,991 priority patent/US20050078869A1/en
Publication of KR20050013467A publication Critical patent/KR20050013467A/ko
Application granted granted Critical
Publication of KR100571813B1 publication Critical patent/KR100571813B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis

Abstract

다수개의 로컬 선형변환함수를 이용한 특징벡터 추출방법 및 장치와 이를 이용한 영상인식방법 및 장치가 개시된다. 로컬 선형변환함수를 이용한 특징벡터 추출방법은 (a) 제1 소정 갯수의 클래스로 이루어지는 학습영상들을 제2 소정 갯수의 로컬그룹으로 분리하고, 분리된 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 생성하여 데이터베이스에 저장하는 단계; (b) 입력영상벡터와 상기 각 로컬그룹의 평균벡터를 비교하여 상기 입력영상을 로컬그룹에 할당하는 단계; 및 (c) 상기 할당된 로컬그룹의 로컬 선형변환함수를 상기 입력영상에 벡터 투영시켜 특징벡터를 추출하는 단계를 포함한다. 이에 따르면, 포즈나 조명에 따라서 그 변화정도가 커서 다수의 모달러티 분포를 갖는 데이터구조에 대하여 소정 갯수의 로컬그룹으로 분류하여, 각 로컬그룹에 대한 로컬 선형변환함수를 학습하여 구하고, 로컬 선형변환함수를 이용하여 등록영상과 인식영상의 특징벡터를 추출함으로써 보다 큰 정확도로 영상을 인식할 수 있다.

Description

로컬 선형변환함수를 이용한 특징벡터 추출방법과 이를 이용한 영상인식방법 및 장치 {Method for feature extraction using locally linear transformations, and method and apparatus for image recognition employing the same}
도 1a 내지 도 1c는 종래의 데이터 분류방법과 본 발명에 적용된 데이터 분류방법을 비교한 도면,
도 2는 본 발명의 일실시예에 따른 학습영상의 학습과정을 설명하는 흐름도,
도 3은 도 2에 있어서 220 단계의 세부적인 과정을 보여주는 흐름도,
도 4는 도 3에 있어서 기준함수를 생성하는 과정을 보여주는 흐름도,
도 5는 본 발명의 일실시예에 따른 등록영상의 특징벡터를 추출하는 과정을 보여주는 흐름도,
도 6은 본 발명의 일실시예에 따른 인식영상의 특징벡터를 추출하는 과정을 보여주는 흐름도,
도 7은 본 발명의 일실시예에 따른 영상인식장치의 구성을 나타내는 블록도,
도 8a 및 도 8b는 본 발명에 따른 학습영상의 학습결과를 보여주는 도면,
도 9a 및 도 9b는 본 발명에 적용된 데이터 분류방법의 성능을 평가하기 위하여 시뮬레이션된 2개의 2차원 데이터세트를 보여주는 도면,
도 10a 및 도 10b는 각각 PCA 와 본 발명에 적용된 데이터 분류방법에 의한 변환벡터를 시각적으로 나타낸 도면, 및
도 11은 LDA, GDA, GDA1 및 본 발명을 적용한 경우에 대한 얼굴인식결과를 퍼센트로 나타내어 비교한 그래프이다.
본 발명은 다수개의 로컬 선형변환함수를 이용한 특징벡터 추출방법과, 이를 이용한 영상인식방법 및 장치에 관한 것이다
얼굴인식기술이란 정지영상이나 동영상에 존재하는 한 사람 이상의 얼굴에 대하여 주어진 얼굴 데이터베이스를 이용하여 그 신원을 확인하는 기술을 일컫는다. 얼굴영상 데이터는 포즈나 조명에 따라서 변화 정도가 크기 때문에 동일한 신원에 대한 포즈별 데이터 또는 조명별 데이터를 동일한 신원 즉, 동일한 클래스로 분류하는 것이 어렵고, 따라서 그 정확도가 높은 분류방법을 사용할 필요가 있다. 널리 사용되는 선형분류방법의 예로는 선형판별분석(Linear Discriminant Analysis, 이하 LDA라 약함) 및 LDA 혼합모델을 들 수 있고, 비선형분류방법의 예로는 일반판별분석(Generalized Discriminant Analysis;이하 GDA라 약함)을 들 수 있다.
선형분류방법과 관련하여, LDA는 신원이 다른 집단을 집단간의 분리가 잘 되도록 표현하는 방법으로서, 변환 후 서로 다른 신원을 가지는 집단에 속하는 영상간의 분산은 최대로 하고, 신원이 같은 집단 내부의 영상간의 분산은 최소가 되도 록 하는 변환행렬을 구하여 적용한다. 그런데, LDA 방법은 데이터가 2차 통계량으로 적절히 분리되어 있는 경우 원래의 데이터공간을 저차원 특징공간으로 선형적으로 효율적으로 변환시킬 수 있으나, 도 1a에 도시된 바와 같이 다수개의 모달러티 분포를 갖는 비선형 데이터에 대해서는 제대로 분류가 이루어지지 않는 문제가 있다. LDA에 대해서는 『Introduction to statistical pattern recognition, 2nd ed. Fukunaga, K. Academic Press, 1990』에 자세히 기술되어 있다. LDA와 같은 선형분류방법을 채택하는 기존의 인식시스템에서는 하나의 로컬 프레임당 적어도 하나의 샘플로 이루어지는 많은 샘플 그룹들이 인식 성능을 향상시키기 위하여 등록된다.
한편, LDA 혼합모델은 다수개의 로컬 프레임을 독립적으로 고려하는 것으로서, 각 로컬 프레임에 대한 LDA 분류결과간의 관계를 부호화하지 못하기 때문에 도 1b에 도시된 바와 같이 LDA에서와 마찬가지로 다수개의 모달러티 분포를 갖는 비선형 데이터에 대해서는 제대로 분류가 이루어지지 않는 문제가 있다. LDA 혼합모델에 대해서는 Hyun-chul Kim, Dai-jin Kim 및 Sung-Yang Bang의 『Face Recognition Using LDA Mixture Model, International Conference on Pattern Recognition, Canada, 2002』에 자세히 기술되어 있다.
비선형분류방법과 관련하여, GDA는 원래의 데이터공간을 커널 함수를 갖는 고차원 특징공간으로 매핑한다. GDA 방법은 비선형 데이터구조에 대하여도 정확한 분류가 가능하나 학습데이터에 대해 오버피팅이 발생할 뿐 아니라 과도한 특징추출과 매칭비용을 필요로 하는 문제점이 있다. GDA에 대해서는 G. Baudat 및 F. Anouar의 『Generalized Discriminant Analysis Using a Kernel Approach, Neural Computation vol. 12, pp. 2385-2404, 2000』에 자세히 기술되어 있다.
따라서, 본 발명이 이루고자 하는 기술적 과제는 학습영상들을 소정 개수의 로컬그룹으로 분리하고, 각 로컬그룹별로 로컬 선형변환함수를 구하는 방법을 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 상기 학습영상들에 대한 로컬 선형변환함수를 이용하여 등록영상 또는 인식영상의 특징벡터를 추출하는 방법을 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 상기 학습영상들에 대한 로컬 선형변환함수를 이용하여 추출된 특징벡터를 이용하여 영상을 인식하는 방법을 제공하는데 있다.
상기 기술적 과제를 달성하기 위하여 본 발명에 따른 로컬 선형변환함수 생성방법은 (a) 제1 소정 갯수의 클래스로 이루어지는 학습영상들을 제2 소정 갯수의 로컬그룹으로 분리하는 단계; (b) 상기 분리된 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 생성하는 단계; 및 (c) 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 한다.
상기 다른 기술적 과제를 달성하기 위하여 본 발명에 따른 특징벡터 추출방법은 (a) 제1 소정 갯수의 클래스로 이루어지는 학습영상들을 제2 소정 갯수의 로컬그룹으로 분리하고, 분리된 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 생성 하여 데이터베이스에 저장하는 단계; (b) 입력영상벡터와 상기 각 로컬그룹의 평균벡터를 비교하여 상기 입력영상을 로컬그룹에 할당하는 단계; 및 (c) 상기 할당된 로컬그룹의 로컬 선형변환함수를 상기 입력영상에 벡터 투영시켜 특징벡터를 추출하는 단계를 포함하는 것을 특징으로 한다.
상기 또 다른 기술적 과제를 달성하기 위하여 본 발명에 따른 영상 인식방법은 (a) 제1 소정 갯수의 클래스로 이루어지는 학습영상들을 제2 소정 갯수의 로컬그룹으로 분리하고, 분리된 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 생성하여 제1 데이터베이스에 저장하는 단계; (b) 등록영상벡터와 상기 제1 데이터베이스에 저장된 각 로컬그룹의 평균벡터를 비교하여 상기 등록영상을 로컬그룹에 할당하고, 할당된 로컬그룹의 로컬 선형변환함수를 상기 등록영상에 벡터 투영시켜 특징벡터를 추출하여 제2 데이터베이스에 저장하는 단계; (c) 인식영상벡터와 상기 제1 데이터베이스에 저장된 각 로컬그룹의 평균벡터를 비교하여 상기 인식영상을 로컬그룹에 할당하고, 할당된 로컬그룹의 로컬 선형변환함수를 상기 인식영상에 벡터 투영시켜 특징벡터를 추출하는 단계; 및 (d) 상기 인식영상의 특징벡터와 상기 제2 데이터베이스에 저장된 등록영상의 특징벡터를 비교하는 단계를 포함하는 것을 특징으로 한다.
상기 또 다른 기술적 과제를 달성하기 위하여 본 발명에 따른 영상 인식장치는 등록영상벡터와 학습영상들의 각 로컬그룹의 평균벡터를 비교하여 상기 등록영상을 로컬그룹에 할당하고, 할당된 로컬그룹의 로컬 선형변환함수를 상기 등록영상에 벡터 투영시켜 추출한 특징벡터를 저장하는 특징벡터 데이터베이스; 인식영상벡 터와 학습영상들의 각 로컬그룹의 평균벡터를 비교하여 상기 인식영상을 로컬그룹에 할당하고, 할당된 로컬그룹의 로컬 선형변환함수를 상기 인식영상에 벡터 투영시켜 특징벡터를 추출하는 특징벡터 추출부; 및 상기 인식영상의 특징벡터와 상기 특징벡터 데이터베이스에 저장된 등록영상의 특징벡터를 비교하는 매칭부를 포함하는 것을 특징으로 한다.
상기 방법은 바람직하게로는 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로 구현할 수 있다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예에 대하여 보다 상세히 설명하기로 한다.
먼저 본 발명에 도입된 기본원칙을 살펴보기로 한다.
입력벡터들(X)은 복수개의 클래스(Ci)로 이루어지고, 이때 x를 클래스(Ci)의 성분인 데이터벡터라 하고, 클래스의 수를 Nc로 나타낸다. 또한 입력벡터들(X)은 각각 서로 다른 변환함수를 갖는 복수개의 로컬그룹(Li)으로 이루어진다. 초기에는 로컬그룹의 수(NL)를 2로 가정하여 학습 과정을 설명하고 후에 임의의 수로 확장한다. 이에 따르면, 입력벡터들(X)은 다음 수학식 1과 같이 나타낼 수 있다.
Figure 112003027846644-pat00001
여기서, 로컬그룹은 여러가지 방법으로 정의될 수 있다. 일예로는 입력벡터들을 K-평균(means) 클러스터링 또는 혼합모델링 기법을 이용하여 이웃하는 데이터벡터들로 이루어지는 적어도 두개 이상의 로컬그룹을 정의할 수 있다. 설명의 편이를 위하여, 데이터벡터(x)를 x ∈ Li 인 경우 E{x|x∈Li} = 0 인 제로평균 벡터로 정의한다. 이때, 전역평균벡터(m)를 다음 수학식 2와 같이 정의할 수 있다.
Figure 112003027846644-pat00002
여기서, n은 입력벡터들의 전체 수를 나타내며,
Figure 112003027846644-pat00003
Figure 112003027846644-pat00004
는 각각 제1 로컬그룹(L1)에 속하는 데이터벡터들의 평균벡터와 제2 로컬그룹(L2)에 속하는 데이터벡터들의 평균벡터를 나타낸다.
한편, ni 개의 데이터벡터들로 이루어지는 클래스(Ci)에 대한 평균벡터(mi )는 다음 수학식 3과 같이 정의된다.
Figure 112003027846644-pat00005
여기서,
Figure 112003027846644-pat00006
Figure 112003027846644-pat00007
는 각각 클래스(Ci) 및 제1 로컬그룹(L1)에 속하는 데이터벡터들의 평균벡터와 클래스(Ci) 및 제2 로컬그룹(L2)에 속하는 데이터벡터들의 평균벡터를 나타낸다.
그리고, 클래스간 스캐터 매트릭스(SB)와 클래스내 스캐터 매트릭스(SW)는 각각 다음 수학식 4 및 수학식 5와 같이 정의된다.
Figure 112003027846644-pat00008
여기서,
Figure 112003027846644-pat00009
Figure 112003027846644-pat00010
은 각각 제1 및 제2 로컬그룹(L1, L2)에 대한 클래스간 스캐터 매트릭스를 나타내고,
Figure 112003027846644-pat00011
는 제1 및 제2 로컬그룹(L1, L2)에 대한 클래스간의 공분산을 의미하는 매트릭스를 나타낸다.
Figure 112003027846644-pat00012
Figure 112003027846644-pat00013
Figure 112003027846644-pat00014
은 각각 제1 및 제2 로컬그룹(L1, L2)에 대한 클래스내 스캐터 매트릭스를 나타내고,
Figure 112003027846644-pat00015
Figure 112003027846644-pat00016
는 각각 제1 및 제2 로컬그룹(L1, L2)에 대한 클래스내의 공분산을 의미하는 매트릭스를 나타낸다. 위의 모든 항들은 뒤에 설명되는 최적화 방법을 쉽게 구하기 위해 정의된 것이다.
한편, 로컬 선형변환함수(Wi = [wi1,...,win], i=1,...,NL)를 로컬그룹별, 즉 제1 및 제2 로컬그룹(L1, L2)으로 변환된 데이터공간에서 클래스간 분산이 최대가 되고, 클래스내 분산이 최소가 되도록 다음 수학식 6과 같이 정의한다.
Figure 112003027846644-pat00017
즉, 로컬 선형변환함수(W1, W2)에 의해 제1 및 제2 로컬그룹(L1, L 2)에 속하는 데이터벡터(x)는 변환벡터 예를 들면, 특징벡터(y1, y2)로 표현되어진다. 로컬 선형변환함수(W1, W2)를 얻기 위하여 최대가 되어야 하는 기준함수(J)는 다음 수학식 7과 같이 나타낼 수 있다.
Figure 112003027846644-pat00018
여기서,
Figure 112003027846644-pat00019
Figure 112003027846644-pat00020
는 각각 클래스간 스캐터 매트릭스 및 클래스내 스캐터 매트릭스의 변환된 형태이고, k는 조정가능한 상수이며, tr(·)는 트레이스 연산자(trace operation)이다. 로컬 선형변환함수(W1, W2)는 기준함수(J)를 최대가 되도록 하는 해로부터 구해진다. 이와 같이 구해진 로컬 선형변환함수(W1, W2)를 이용하여 데이터벡터(x)를 분류할 경우, 데이터벡터(x)가 다수개의 모달러티로 이루어지는 분포를 갖더라도 도 1c에 도시된 바와 같이 신원 즉, 클래스별로 정확하게 분류하는 것이 가능하다.
도 2는 본 발명의 일실시예에 따른 학습영상의 학습과정을 설명하는 흐름도이다.
도 2를 참조하면, 210 단계에서는 소정 수의 클래스로 이루어지는 학습영상들, 즉 입력벡터들을 L개의 로컬그룹으로 분류한다. 이때, 입력벡터들을 K-평균 클러스터링 또는 혼합모델링 기법을 이용할 수 있다.
220 단계에서는 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 구한다. 이를 위하여 사용되는 기준함수(J)를 정의하고, 기준함수(J)를 소정의 구속장 하에서 최대가 될 수 있도록 각 로컬그룹의 로컬 선형변환함수의 각 벡터를 반복적으로 갱신한다. 이와 같은 갱신과정은 갱신된 벡터들로 이루어지는 로컬 선형변환함수가 수렴할 때까지 반복적으로 수행된다.
230 단계에서는 220 단계에서 결정된 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 데이터베이스에 저장한다.
도 3은 도 2에 있어서 220 단계를 세부적으로 설명하는 흐름도로서, 이는 학습영상의 각 로컬그룹별로 수행되어진다.
도 3을 참조하면, 310 단계에서는 기준함수의 편미분함수를 얻기 위한 제1 내지 제5 상수매트릭스를 후술하는 수학식 17를 이용하여 계산한다. 320 단계에서는 로컬 선형변환함수를 랜덤 값으로 초기화한다.
330 단계에서는 310 단계에서 얻어진 제1 내지 제5 상수매트릭스와 로컬 선형변환함수를 이용하여 기준함수(J)의 편미분함수를 후술하는 수학식 19를 이용하여 획득한다.
340 단계에서는 330 단계에서 얻어진 기준함수의 편미분함수를 이용하여 후술하는 수학식 20에 의거하여 해당 로컬그룹에 대한 로컬 선형변환함수의 갱신량을 결정한다. 350 단계에서는 340 단계에서 결정된 갱신량을 이전의 로컬 선형변환함수에 가산하여 해당 로컬그룹에 대한 로컬 선형변환함수를 갱신한다. 360 및 370 단계에서는 350 단계에서 갱신된 로컬 선형변환함수에 대하여 벡터 직교화 및 벡터 정규화를 순차적으로 수행한다.
380 단계에서는 370 단계에서 벡터 정규화가 수행된 갱신된 로컬 선형변환함수의 수렴이 이루어질 때까지 상기 330 내지 370 단계를 반복적으로 수행한다. 이때, 갱신된 로컬 선형변환함수를 적용한 상기 기준함수가 일정한 값으로 포화상태에 이르렀는지에 따라서 수렴여부를 판단하거나, 로컬 선형변환함수의 갱신량과 소정의 문턱치를 비교하고, 소정의 문턱치보다 작은 경우 수렴이 이루어진 것으로 판단하는 방법을 예로 들 수 있으며, 그 외 다른 방법에 의해서도 수렴여부를 판단할 수 있다.
도 4는 도 3에 있어서 기준함수(J)를 구하는 세부적인 단계를 보여주는 흐름도이다.
도 4를 참조하면, 410 및 420 단계에서는 모든 학습영상들의 전역평균벡터(
Figure 112003027846644-pat00021
)와 학습영상들의 클래스(Ci)별 평균벡터(
Figure 112003027846644-pat00022
)를 구한다.
430 및 440 단계에서는 410 및 420 단계에서 구해진 전역평균벡터(
Figure 112003027846644-pat00023
)와 클래스(Ci)별 평균벡터(
Figure 112003027846644-pat00024
)를 이용하여 클래스간 분산을 나타내는 클래스간 스캐터 매트릭스(
Figure 112003027846644-pat00025
)와 클래스내 분산을 나타내는 클래스내 스캐터 매트릭스(
Figure 112003027846644-pat00026
)를 구한 다.
450 단계에서는 430 및 440 단계에서 구해진 클래스간 스캐터 매트릭스(
Figure 112003027846644-pat00027
)와 클래스내 스캐터 매트릭스(
Figure 112003027846644-pat00028
)를 이용하여 기준함수(J)를 정의한다.
다음, 도 3 및 도 4에 도시된 각 단계를 입력벡터들을 2개의 로컬그룹으로 정의하는 경우와 L개의 로컬그룹을 정의하는 경우로 나누어 구체적으로 설명하기로 한다.
먼저, 2개의 로컬그룹으로 정의하는 경우로서, 각 로컬그룹(L1, L2)에 대한 로컬 선형변환함수(W1, W2)에서 하나의 베이시스 벡터(w11, w21 )에 대하여 살펴보기로 한다.
먼저 기준함수(J)를 정의하기 위하여, 전역평균벡터(
Figure 112003027846644-pat00029
)와 클래스(Ci)별 평균벡터(
Figure 112003027846644-pat00030
)는 각각 다음 수학식 8 및 9와 같이 정의한다(410 및 420 단계).
Figure 112003027846644-pat00031
Figure 112003027846644-pat00032
다음, 클래스간 분산을 나타내는 클래스간 스캐터 매트릭스(
Figure 112003027846644-pat00033
)를 구하며, 이는 다음 수학식 10과 같이 주어진다(430 단계).
Figure 112003027846644-pat00034
다음, 클래스내 분산을 나타내는 클래스내 스캐터 매트릭스(
Figure 112003027846644-pat00035
)를 구하며, 이는 다음 수학식 11과 같이 주어진다(440 단계).
Figure 112003027846644-pat00036
상기 430 및 440 단계에서 구해진 클래스간 스캐터 매트릭스(
Figure 112003027846644-pat00037
)와 클래스내 스캐터 매트릭스(
Figure 112003027846644-pat00038
)를 이용하여 상기 수학식 7과 같이 정의되는 기준함수(J)를 구할 수 있다(450 단계).
다음, 단위 놈(norm) 벡터의 구속장 하에서 기준함수(J)를 최대가 되도록 하는 벡터 w11과 w21을 구한다(320 내지 350 단계). 구속장 하에서의 최적화문제는 Aapo Hyvarinen, Juha Karhunen 및 Erkki Oja에 의한 "Independent Component Analysis" (John Wiley & Sons, Inc. 2001)에 기재된 구속장 집합에 대한 프로젝션 방법에 의해 해결될 수 있다. 상기 수학식 7의 해 즉, 로컬 선형변환함수를 구하기 위해서는 반복 최적화기법, 바람직하게로는 그래디언트(gradient) 기반 학습방법을 사용한다. 그래디언트 기반 학습 방법에 따라 구해지는 로컬 선형변환함수를 적용한 2차 볼록함수인 기준함수(J)는 전역 최대값을 갖게 된다.
즉, 다음 수학식 12에 의해 정의되는 기준함수(J)를 최대가 되도록 하는 각 로컬그룹(L1, L2)에 대한 로컬 선형변환함수(W1, W2)에서 베이시스 벡터 w11과 w21는 다음 수학식 13의 편미분함수 획득과정, 수학식 14의 갱신량 결정과정, 및 수학식 15의 벡터 정규화과정에 의해 학습되고 갱신된다.
Figure 112003027846644-pat00039
Figure 112003027846644-pat00040
Figure 112003027846644-pat00041
여기서, η는 적절한 학습계수를 나타낸다.
Figure 112003027846644-pat00042
한편, 상기와 같은 410 내지 450 단계를 각 로컬그룹(L1, L2)에 대한 로컬 선형변환함수(W1, W2)에서 나머지 벡터들(w12~w1p, w22 ~w2p)에 대해서도 반복적으로 적용 하여 각각 대응하는 기준함수(J)를 구할 수 있다.
나머지 벡터들(w12~w1p, w22~w2p)을 효율적으로 구하기 위해서는 예를 들면, 디플레이션 직교화(deflationary orthogonalization)를 적용한다. 디플레이션 직교화에 대해서는 Aapo Hyvarinen, Juha Karhunen 및 Erkki Oja에 의한 "Independent Component Analysis" (John Wiley & Sons, Inc. 2001)에 자세히 기술되어 있다. 나머지 벡터들(w12,...,w1p 및 w22,...,w2p)에 대해서도 상기 수학식 8 내지 11로 구성되는 단일 베이시스 벡터 갱신 알고리즘을 반복적으로 적용한다. 매 반복 이후에 서로 다른 벡터들이 동일한 최대값으로 수렴하는 것을 방지하기 위하여 벡터의 직교화를 수행한다. 이와 같은 직교화를 수행함으로써 본 발명에 의한 데이터 분류방법이 로컬그룹에 있는 직교 베이시스 벡터에 의해 결정되어진다는 것을 보장할 수 있다.
즉, 기준함수(J)를 최대가 되도록 하는 제1 로컬그룹(L1)에 대한 로컬 선형변환함수(W1)에서 베이시스 벡터들(w1p)은 다음 수학식 16의 갱신량 결정과정, 수학식 17의 벡터 직교화과정, 및 수학식 18의 벡터 정규화과정에 의해 학습되고 갱신된다.
Figure 112003027846644-pat00043
Figure 112003027846644-pat00044
Figure 112003027846644-pat00045
마찬가지로, 제2 로컬그룹(L2)에 대한 로컬 선형변환함수(W2)에서 베이시스 벡터들(w2p)에 대해서도 동일한 방법이 적용된다.
한편, 입력벡터를 L개의 로컬그룹으로 정의하는 경우 x ∈ Li 인 경우 로컬그룹별로 간략화된 표현은
Figure 112003027846644-pat00046
에 의해 얻어진다. 이때, 각 로컬그룹(Li, i는 1~L)에 대한 로컬 선형변환함수(Wi, i는 1~L)를 구하기 위한 기준함수(J) 획득단계(310)에 있어서, 변환된 전역평균벡터(
Figure 112003027846644-pat00047
)와 변환된 클래스(Ci)의 평균벡터(
Figure 112003027846644-pat00048
)는 각각 다음 수학식 19 및 수학식 20와 같이 나타낼 수 있다(410 및 420 단계).
Figure 112003027846644-pat00049
Figure 112003027846644-pat00050
다음, 변환된 클래스간 스캐터 매트릭스와 클래스내 스캐터 매트릭스(
Figure 112003027846644-pat00051
,
Figure 112003027846644-pat00052
)를 구하며, 이들은 다음 수학식 21와 같이 정의할 수 있다(430 및 440 단계).
Figure 112003027846644-pat00053
여기서,
Figure 112003027846644-pat00054
,
Figure 112003027846644-pat00055
,
Figure 112003027846644-pat00056
,
Figure 112003027846644-pat00057
,
Figure 112003027846644-pat00058
는 제1 내지 제5 상수매트릭스를 나타내며, 다음 수학식 22에 의해 정의된다.
상기 430 및 440 단계에서 구해진 변환된 클래스간 스캐터 매트릭스(
Figure 112003027846644-pat00060
)와 변환된 클래스내 스캐터 매트릭스(
Figure 112003027846644-pat00061
)를 이용하여 다음 수학식 23과 같이 정의되는 기준함수(J)를 구할 수 있다(450 단계).
Figure 112003027846644-pat00062
각 로컬그룹의 로컬 선형변환함수에서 베이시스 벡터(wil)에 대한 기준함수(J)의 그래디언트(∂J/∂wip)와, i 번째 로컬그룹에서 다른 베이시스 벡터들에 직교하는 베이시스 벡터(wip)는 각각 다음 수학식 24 내지 수학식 27에 의해 얻을 수 있다(330 내지 380 단계).
Figure 112003027846644-pat00063
Figure 112003027846644-pat00064
Figure 112003027846644-pat00065
Figure 112003027846644-pat00066
한편, 상기 수학식 12에 대한 해는 다음 수학식 28과 같은 라그랑지안(Lagrangian) 함수(L)를 이용하여서도 얻어질 수 있다. 수학식 28은 입력벡터들이 두개의 로컬그룹으로 나누어진 경우에 한한다.
Figure 112003027846644-pat00067
여기서, Λi 는 다음 수학식 29와 같이 나타내어지는 고유값으로 이루어진 대각선 행렬이고, I는 항등 행렬이다.
Figure 112003027846644-pat00068
베이시스 벡터에 대한 상기 라그랑지안 함수의 그래디언트는 다음 수학식 30과 같이 나타낼 수 있다.
Figure 112003027846644-pat00069
본 발명에 적용된 데이터 분류방법은 각 로컬그룹에 대한 로컬 선형변환함수에 존재하는 베이시스 벡터들(w1l, w2l)에 대하여 2차 볼록함수인 기준함수로 인하여 전역 최대값으로 수렴되어질 수 있다.
도 5는 본 발명의 일실시예에 따른 등록영상의 특징벡터를 추출하는 과정을 보여주는 흐름도이다.
도 5를 참조하면, 510 단계에서는 등록영상을 입력받고, 520 단계에서는 등록영상벡터와 도 2에 도시된 절차에 의해 얻어진 학습영상의 각 로컬그룹의 평균벡터를 비교하여 가장 가까운 평균벡터가 속하는 로컬그룹을 등록영상의 로컬그룹으로 할당한다.
530 단계에서는 520 단계에서 할당된 로컬그룹에 대하여 도 3에 도시된 절차에 의해 얻어진 로컬 선형변환함수를 등록영상에 벡터 투영시켜 특징벡터를 추출하고, 540 단계에서는 이를 데이터베이스에 저장한다.
도 6은 본 발명의 일실시예에 따른 인식영상의 특징벡터를 추출하는 과정을 보여주는 흐름도이다.
610 단계에서는 인식영상을 입력받고, 620 단계에서는 인식영상벡터와 도 2에 도시된 절차에 의해 얻어진 학습영상의 각 로컬그룹의 평균벡터를 비교하여 가장 가까운 평균벡터가 속하는 로컬그룹을 인식영상의 로컬그룹으로 할당한다.
630 단계에서는 620 단계에서 할당된 로컬그룹에 대하여 도 3에 도시된 절차에 의해 얻어진 로컬 선형변환함수를 인식영상에 벡터 투영시켜 특징벡터를 추출한다.
도 7은 본 발명의 일실시예에 따른 영상인식장치의 구성을 나타내는 블록도로서, 특징벡터 데이터베이스(710), 차원 축소부(720), 특징벡터 추출부(730) 및 매칭부(740)로 이루어진다.
도 7을 참조하면, 특징벡터 데이터베이스(710)는 등록영상벡터와 학습영상들 의 각 로컬그룹의 평균벡터를 비교하여 상기 등록영상에 로컬그룹을 할당하고, 할당된 로컬그룹의 로컬 선형변환함수를 상기 등록영상에 벡터 투영시켜 추출한 특징벡터를 저장한다. 이때, 도 2에 도시된 방법에 의한 학습영상의 로컬그룹별 평균벡터와 로컬 선형변환함수를 이용하여 도 5에 도시된 절차에 따라 등록영상의 특징벡터가 추출된다.
차원 축소부(720)는 입력되는 인식영상의 차원을 낮추기 위하여 인식영상에 대하여 PCA 변환과 같은 소정의 변환을 수행하여 인식영상의 차원을 대폭 축소할 수 있으며, 옵션으로 구비되는 요소이다.
특징벡터 추출부(730)는 차원축소부(720)에서 차원이 축소된 인식영상벡터와 학습영상들의 각 로컬그룹의 평균벡터를 비교하여 상기 인식영상에 로컬그룹을 할당하고, 할당된 로컬그룹의 로컬 선형변환함수를 상기 인식영상에 벡터 투영시켜 특징벡터를 추출한다. 이때, 도 2에 도시된 방법에 의한 학습영상의 로컬그룹별 평균벡터와 로컬 선형변환함수를 이용하여 도 6에 도시된 절차에 따라 인식영상의 특징벡터가 추출된다.
매칭부(740)는 특징벡터 추출부(730)에서 추출되는 인식영상의 특징벡터들과 특징벡터 데이터베이스(710)에 저장된 등록영상의 특징벡터들을 매칭시켜, 매칭결과에 따라서 인식영상에 대한 인식결과를 출력한다.
도 8a 및 도 8b는 본 발명에 적용된 데이터 분류방법의 학습결과를 보여주는 도면으로서, 로컬그룹이 2개인 경우를 예로 든 것이다. 도 8a는 w1l 및 w2l의 방향 함수로서 기준함수(이때, k=0.1)의 값을 나타내고, 도 8b는 각각 k가 0.1, 1, 10 인 경우 수렴상황을 나타낸 그래프이다.
도 8a를 참조하면 서로 반대 방향으로 두 세트의 베이시스 벡터에 대응하여 두개의 로컬 최대값을 가짐을 알 수 있다. 두개의 로컬 최대값은 전역최대값을 갖는 동일한 기준함수값을 생성한다. 도 8b를 참조하면, 본 발명에 따른 데이터 분류방법은 상수 k 값에 상관없이 일정한 반복횟수 이후부터 점차 전역최대값으로 수렴하게 되는 것을 알 수 있다.
다음, 본 발명에 적용된 데이터 분류방법의 성능을 평가하기 위하여 시뮬레이션된 2개의 2차원 데이터세트들을 만들어 실험하였다. 세트 1은 도 9a에서와 같이 데이터분포상에서 2개의 뚜렷한 모달러티를 갖는 세개의 클래스로 가지며, 세트 2는 도 9b에서와 같이 데이터분포상에서 3개의 뚜렷한 피크를 갖는 두개의 클래스를 가진다. N-N(Nearest Neighbor) 분류에 대한 유사도 측정 방법으로서, 유클리디안 거리(Euclidean), 정규화된 크로스 상관값(Cross-corr.), 마할노비스 거리(Mahal)가 사용된다. 이때, 로컬그룹의 수는 이미 알고 있다고 가정한다. 로컬그룹을 결정하기 위하여 여러가지 방법이 사용될 수 있으나, 여기서는 K-평균 클러스터링 알고리즘을 이용한다. 한편, 4가지 방법의 성능을 평가하는 다른 요소로서 특징벡터추출(F.E.)에서의 상대적인 복잡도를 고려한다.
기존의 LDA, LDA 혼합모델, GDA 및 본 발명을 각각 이용하여 분류한 결과에 대한 분류오차는 다음 표 1에 도시된 바와 같다.
Figure 112003027846644-pat00070
여기서, 'alpha'는 통상 1 보다 작은 값을 가지며, 새로운 패턴이 어느 로컬그룹에 속하는지를 결정하기 위한 계산비용을 나타낸다.
표 1을 참조하면, 3가지 종류의 분류오차에 대하여 본 발명은 LDA 나 LDA 혼합모델에 비해서는 분류오차의 수에 있어서 매우 우수한 성능을 나타내고, GDA에 비해서는 성능은 거의 유사하나 특징벡터추출(F.E.)시의 계산효율 측면에서 볼 때 수백분의 1정도로 뛰어남을 알 수 있다.
다음, 본 발명에 적용된 데이터 분류방법을 채용하는 얼굴인식시스템의 성능을 평가하기로 한다. 자세에 따라 크게 변동되는 얼굴영상은 다중 모달러티를 가지는 것으로 알려져 있다. 여기서는 얼굴영상에 대하여 포즈 레이블을 갖는 XM2VTS 데이터세트를 사용하였고, 포즈 레이블은 로컬그룹을 결정하기 위해 사용되었다. 얼굴 데이터베이스는 고정된 눈의 위치를 가지면서 23×28 화소해상도로 정규화된 295×2개의 얼굴영상들로 이루어진다. 각 얼굴영상들은 정면영상과 오른쪽으로 돌린 우측영상을 가지는데, 정면영상은 등록되고 우측영상은 쿼리로 간주되었 다. 학습을 간단히 하기 위하여 50개의 고유특징을 사용하였으며, 데이터세트의 고유값 플로트에 의하면 영상을 묘사하는데 50개의 고유특징으로 충분하다는 것을 알 수 있다.
도 10a 및 도 10b는 각각 PCA 와 본 발명에 의한 분류방법에 의한 변환벡터를 시각적으로 나타낸 것이며, 첫번째 열은 정면영상의 변환벡터, 두번째 열은 우측영상의 변환벡터를 각각 나타낸다. 도 10a 및 도 10b를 살펴보면, 정면영상과 우측영상 간의 관계는 첫번째 고유얼굴을 제외하고는 구별하기 힘들다는 것을 알 수 있다. 즉, 첫번째 고유얼굴은 두 영상간의 회전, 스케일링, 병진 관계등을 보여준다.
서로 다른 수의 트레이닝영상과 테스트영상을 갖는 두가지 경우를 위하여 3개의 트레이닝 및 테스트세트가 랜덤하게 제작되었다. 첫번째 경우는 트레이닝을 위한 245인의 얼굴영상(245×2개)과 테스트를 위한 50인의 얼굴영상(50×2개)의 얼굴영상을 가지며, 두번째 경우는 트레이닝을 위한 100인의 얼굴영상(100×2개)과 테스트를 위한 195인의 얼굴영상(195×2개)의 얼굴영상을 가진다. 본 발명에서 k 값은 트레이닝세트에 대하여 경험적 또는 실험적으로 최상의 성능을 갖는 값으로 선택하였고, GDA 에 대해서는 RBF 커널을 사용하면서 커널의 표준편차를 조정하였다.
도 11은 LDA, GDA, GDA1 및 본 발명을 이용한 얼굴인식결과를 퍼센트로 나타내어 비교한 그래프로서, 트레이닝세트에 대해서는 GDA가 매우 오버피트되어 있고, 테스트세트에 대해서는 본 발명에 의한 방법이 매우 뛰어남을 알 수 있다. 여기서 GDA1은 테스트세트에 대해 커널 파라미터를 조정하여 얻은 최상의 얼굴인식결과를 의미한다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
상술한 바와 같이, 본 발명에 따르면 얼굴영상 데이터 등과 같이 포즈나 조명에 따라서 그 변화정도가 커서 다수의 모달러티 분포를 갖는 데이터구조에 대하여 소정 갯수의 로컬그룹으로 분류하여, 각 로컬그룹에 대한 로컬 선형변환함수를 학습하여 구하고, 로컬 선형변환함수를 이용하여 등록영상과 인식영상의 특징벡터를 추출함으로써 보다 큰 정확도로 영상을 인식할 수 있다.
이상 도면과 명세서에서 최적 실시예들이 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한 정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims (24)

  1. (a) 제1 소정 갯수의 클래스로 이루어지는 학습영상들을 제2 소정 갯수의 로컬그룹으로 분리하는 단계;
    (b) 상기 분리된 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 생성하는 단계;
    (c) 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  2. 제1 항에 있어서, 상기 (b) 단계는
    (b1) 상기 로컬 선형변환함수를 초기화하는 단계;
    (b2) 기준함수의 편미분함수를 획득하는 단계;
    (b3) 상기 기준함수의 편미분함수를 이용하여 해당 로컬그룹에 대한 로컬 선형변환함수를 갱신하는 단계;
    (b4) 상기 갱신된 로컬 선형변환함수의 수렴이 이루어질 때까지 상기 (b2) 내지 (b3) 단계를 반복적으로 수행하는 단계; 및
    (b5) 상기 (b1) 내지 (b4) 단계를 상기 제2 소정갯수의 로컬그룹에 대하여 수행하는 단계를 포함하는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  3. 제2 항에 있어서, 상기 (b2) 단계는
    (b21) 상기 기준함수의 편미분함수를 얻기 위한 제1 내지 제5 상수매트릭스를 계산하는 단계; 및
    (b22) 상기 제1 내지 제5 상수매트릭스와 선형변환함수를 이용하여 상기 기준함수의 편미분함수를 획득하는 단계를 포함하는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  4. 제2 항 또는 제3 항에 있어서, 상기 기준함수의 편미분함수는 다음 식
    Figure 112003027846644-pat00071
    (여기서, J는 기준함수,
    Figure 112003027846644-pat00072
    ,
    Figure 112003027846644-pat00073
    ,
    Figure 112003027846644-pat00074
    ,
    Figure 112003027846644-pat00075
    ,
    Figure 112003027846644-pat00076
    는 제1 내지 제5 상수매트릭스, wil, wjl, wkl 은 각각 제i 내지 제k 로컬그룹에 대한 로컬 선형변환함수의 벡터, k는 조정가능한 상수를 각각 나타낸다.)
    에 의해 정의되는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  5. 제4 항에 있어서, 상기 제1 내지 제5 상수매트릭스(
    Figure 112003027846644-pat00077
    ,
    Figure 112003027846644-pat00078
    ,
    Figure 112003027846644-pat00079
    ,
    Figure 112003027846644-pat00080
    ,
    Figure 112003027846644-pat00081
    )는 다음 식
    Figure 112003027846644-pat00082
    (여기서, x는 각 학습영상에 해당하는 벡터, ni는 클래스(Ci)에 속하는 학습영상의 수,
    Figure 112003027846644-pat00083
    Figure 112003027846644-pat00084
    는 각각 제j 로컬그룹(Lj)과 제k 로컬그룹(Lk)에 속하는 학습영상들의 평균벡터,
    Figure 112003027846644-pat00085
    Figure 112003027846644-pat00086
    는 각각 클래스(Ci)에 속하면서 제j 로컬그룹(Lj)과 제k 로컬그룹(Lk)에 속하는 학습영상들의 평균벡터를 나타낸다.)
    에 의해 정의되는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  6. 제2 항 또는 제3 항에 있어서, 상기 기준함수는 다음 식
    Figure 112003027846644-pat00087
    Figure 112003027846644-pat00088
    (여기서, J는 기준함수, tr(·)는 트레이스 연산자, 및 는 클래스간 스캐터 매트릭스와 클래스내 스캐터 매트릭스, wil은 제i 로컬그룹에 대한 로컬 선형변환함수의 벡터,
    Figure 112003027846644-pat00089
    ,
    Figure 112003027846644-pat00090
    ,
    Figure 112003027846644-pat00091
    ,
    Figure 112003027846644-pat00092
    ,
    Figure 112003027846644-pat00093
    는 제1 내지 제5 상수매트릭스, Wi, Wj, Wk 는 각각 제i 내지 k 로컬그룹의 로컬 선형변환함수를 나타낸다.)
    에 의해 정의되는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  7. 제2 항에 있어서, 상기 (b3) 단계는
    (b31) 상기 기준함수의 편미분함수를 이용하여 해당 로컬그룹에 대한 로컬 선형변환함수의 갱신량을 결정하는 단계;
    (b32) 결정된 갱신량을 이전의 로컬 선형변환함수에 가산하여 해당 로컬그룹에 대한 로컬 선형변환함수를 갱신하는 단계; 및
    (b33) 상기 갱신된 로컬 선형변환함수에 대하여 벡터 직교화 및 벡터 정규화를 순차적으로 수행하는 단계를 포함하는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  8. 제7 항에 있어서, 상기 로컬 선형변환함수의 갱신량은 상기 기준함수의 편미 분함수에 소정의 학습계수를 승산하여 얻어지는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  9. 제7 항에 있어서, 상기 (b33) 단계는 다음 수학식
    Figure 112003027846644-pat00094
    Figure 112003027846644-pat00095
    (여기서, wip, wij은 제i 로컬그룹에 대한 로컬 선형변환함수의 벡터, ∥ w ip ∥는 wip 의 단위 놈 벡터를 나타낸다.)
    에 의해 수행되는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  10. 제2 항에 있어서, 상기 (b4) 단계는 갱신된 로컬 선형변환함수를 적용한 상기 기준함수가 일정한 값으로 포화상태에 이르렀는지에 따라서 수렴여부를 판단하는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  11. 제2 항에 있어서, 상기 (b4) 단계는 상기 로컬 선형변환함수의 갱신량과 소정의 문턱치를 비교하고, 그 비교 결과에 따라서 수렴여부를 판단하는 것을 특징으로 하는 로컬 선형변환함수 생성방법.
  12. (a) 제1 소정 갯수의 클래스로 이루어지는 학습영상들을 제2 소정 갯수의 로컬그룹으로 분리하고, 분리된 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 생성하여 데이터베이스에 저장하는 단계;
    (b) 입력영상벡터와 상기 각 로컬그룹의 평균벡터를 비교하여 상기 입력영상에 로컬그룹을 할당하는 단계; 및
    (c) 상기 할당된 로컬그룹의 로컬 선형변환함수를 상기 입력영상에 벡터 투영시켜 특징벡터를 추출하는 단계를 포함하는 것을 특징으로 하는 로컬 선형변환함수를 이용한 특징벡터 추출방법.
  13. 제12 항에 있어서, 상기 (a) 단계는 기준함수의 편미분함수를 이용하여 로컬 선형변환함수의 수렴이 이루어질 때까지 해당 로컬그룹에 대한 로컬 선형변환함수를 갱신하는 것을 특징으로 하는 특징벡터 추출방법.
  14. 제13 항에 있어서, 상기 로컬 선형변환함수는
    (a1) 상기 로컬 선형변환함수를 초기화하는 단계;
    (a2) 기준함수의 편미분함수를 얻기 위한 제1 내지 제5 상수매트릭스를 계산하는 단계;
    (a3) 상기 제1 내지 제5 상수매트릭스와 선형변환함수를 이용하여 상기 기준함수의 편미분함수를 획득하는 단계;
    (a4) 상기 기준함수의 편미분함수를 이용하여 해당 로컬그룹에 대한 로컬 선 형변환함수를 갱신하는 단계; 및
    (a5) 상기 갱신된 로컬 선형변환함수의 수렴이 이루어질 때까지 상기 (a3) 내지 (a4) 단계를 반복적으로 수행하는 단계를 포함하는 것을 특징으로 하는 특징벡터 추출방법.
  15. 제14 항에 있어서, 상기 기준함수의 편미분함수는 다음 식
    Figure 112003027846644-pat00096
    (여기서, J는 기준함수,
    Figure 112003027846644-pat00097
    ,
    Figure 112003027846644-pat00098
    ,
    Figure 112003027846644-pat00099
    ,
    Figure 112003027846644-pat00100
    ,
    Figure 112003027846644-pat00101
    는 제1 내지 제5 상수매트릭스, wil, wjl, wkl 은 각각 제i 내지 제k 로컬그룹에 대한 로컬 선형변환함수의 벡터, k는 조정가능한 상수를 각각 나타낸다.)
    에 의해 정의되는 것을 특징으로 하는 특징벡터 추출방법.
  16. 제15 항에 있어서, 상기 제1 내지 제5 상수매트릭스(
    Figure 112003027846644-pat00102
    ,
    Figure 112003027846644-pat00103
    ,
    Figure 112003027846644-pat00104
    ,
    Figure 112003027846644-pat00105
    ,
    Figure 112003027846644-pat00106
    )는 다음 식
    Figure 112003027846644-pat00107
    (여기서, x는 각 학습영상에 해당하는 벡터, ni는 클래스(Ci)에 속하는 학습영상의 수,
    Figure 112003027846644-pat00108
    Figure 112003027846644-pat00109
    는 각각 제j 로컬그룹(Lj)과 제k 로컬그룹(Lk)에 속하는 학습영상들의 평균벡터,
    Figure 112003027846644-pat00110
    Figure 112003027846644-pat00111
    는 각각 클래스(Ci)에 속하면서 제j 로컬그룹(Lj)과 제k 로컬그룹(Lk)에 속하는 학습영상들의 평균벡터를 나타낸다.)
    에 의해 정의되는 것을 특징으로 하는 특징벡터 추출방법.
  17. 제14 항에 있어서, 상기 (a4) 단계는
    (a41) 상기 기준함수의 편미분함수를 이용하여 해당 로컬그룹에 대한 로컬 선형변환함수의 갱신량을 결정하는 단계;
    (a42) 결정된 갱신량을 이전의 로컬 선형변환함수에 가산하여 해당 로컬그룹에 대한 로컬 선형변환함수를 갱신하는 단계; 및
    (a43) 상기 갱신된 로컬 선형변환함수에 대하여 벡터 직교화 및 벡터 정규화를 순차적으로 수행하는 단계를 포함하는 것을 특징으로 하는 특징벡터 추출방법.
  18. 제14 항에 있어서, 상기 (a5) 단계는 갱신된 로컬 선형변환함수를 적용한 상기 기준함수가 일정한 값으로 포화상태에 이르렀는지에 따라서 수렴여부를 판단하는 것을 특징으로 하는 특징벡터 추출방법.
  19. 제14 항에 있어서, 상기 (a5) 단계는 상기 로컬 선형변환함수의 갱신량과 소정의 문턱치를 비교하고, 그 비교 결과에 따라서 수렴여부를 판단하는 것을 특징으로 하는 특징벡터 추출방법.
  20. (a) 제1 소정 갯수의 클래스로 이루어지는 학습영상들을 제2 소정 갯수의 로컬그룹으로 분리하고, 분리된 각 로컬그룹의 평균벡터와 로컬 선형변환함수를 생성하여 제1 데이터베이스에 저장하는 단계;
    (b) 등록영상벡터와 상기 제1 데이터베이스에 저장된 각 로컬그룹의 평균벡터를 비교하여 상기 등록영상에 로컬그룹을 할당하고, 할당된 로컬그룹의 로컬 선형변환함수를 상기 등록영상에 벡터 투영시켜 특징벡터를 추출하여 제2 데이터베이스에 저장하는 단계;
    (c) 인식영상벡터와 상기 제1 데이터베이스에 저장된 각 로컬그룹의 평균벡터를 비교하여 상기 인식영상에 로컬그룹을 할당하고, 할당된 로컬그룹의 로컬 선 형변환함수를 상기 인식영상에 벡터 투영시켜 특징벡터를 추출하는 단계; 및
    (d) 상기 인식영상의 특징벡터와 상기 제2 데이터베이스에 저장된 등록영상의 특징벡터를 비교하는 단계를 포함하는 것을 특징으로 하는 로컬 선형변환함수를 이용한 영상인식방법.
  21. 등록영상벡터와 학습영상들의 각 로컬그룹의 평균벡터를 비교하여 상기 등록영상에 로컬그룹을 할당하고, 할당된 로컬그룹의 로컬 선형변환함수를 상기 등록영상에 벡터 투영시켜 추출한 특징벡터를 저장하는 특징벡터 데이터베이스;
    인식영상벡터와 학습영상들의 각 로컬그룹의 평균벡터를 비교하여 상기 인식영상에 로컬그룹을 할당하고, 할당된 로컬그룹의 로컬 선형변환함수를 상기 인식영상에 벡터 투영시켜 특징벡터를 추출하는 특징벡터 추출부; 및
    상기 인식영상의 특징벡터와 상기 특징벡터 데이터베이스에 저장된 등록영상의 특징벡터를 비교하는 매칭부를 포함하는 것을 특징으로 하는 로컬 선형변환함수를 이용한 영상인식장치.
  22. 제1 항 내지 제3 항, 제7 항 내지 제11 항 중 어느 한 항에 기재된 로컬 선형변환함수 생성방법을 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  23. 제12 항 내지 제19 항 중 어느 한 항에 기재된 특징벡터 추출방법을 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  24. 제20 항에 기재된 로컬 선형변환함수를 이용한 영상인식방법을 실행할 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020030052131A 2003-07-28 2003-07-28 로컬 선형변환함수를 이용한 특징벡터 추출방법과 이를이용한 영상인식방법 및 장치 KR100571813B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020030052131A KR100571813B1 (ko) 2003-07-28 2003-07-28 로컬 선형변환함수를 이용한 특징벡터 추출방법과 이를이용한 영상인식방법 및 장치
US10/896,991 US20050078869A1 (en) 2003-07-28 2004-07-23 Method for feature extraction using local linear transformation functions, and method and apparatus for image recognition employing the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030052131A KR100571813B1 (ko) 2003-07-28 2003-07-28 로컬 선형변환함수를 이용한 특징벡터 추출방법과 이를이용한 영상인식방법 및 장치

Publications (2)

Publication Number Publication Date
KR20050013467A KR20050013467A (ko) 2005-02-04
KR100571813B1 true KR100571813B1 (ko) 2006-04-17

Family

ID=34420488

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030052131A KR100571813B1 (ko) 2003-07-28 2003-07-28 로컬 선형변환함수를 이용한 특징벡터 추출방법과 이를이용한 영상인식방법 및 장치

Country Status (2)

Country Link
US (1) US20050078869A1 (ko)
KR (1) KR100571813B1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9492114B2 (en) 2004-06-18 2016-11-15 Banner Health Systems, Inc. Accelerated evaluation of treatments to prevent clinical onset of alzheimer's disease
US9471978B2 (en) 2004-10-04 2016-10-18 Banner Health Methodologies linking patterns from multi-modality datasets
US8457997B2 (en) * 2005-04-29 2013-06-04 Landmark Graphics Corporation Optimization of decisions regarding multiple assets in the presence of various underlying uncertainties
US7451124B2 (en) * 2005-05-12 2008-11-11 Xerox Corporation Method of analyzing documents
KR101428715B1 (ko) 2007-07-24 2014-08-11 삼성전자 주식회사 인물 별로 디지털 컨텐츠를 분류하여 저장하는 시스템 및방법
US8385656B2 (en) * 2008-10-23 2013-02-26 Canon Kabushiki Kaisha Image processing apparatus, image processing method and program
US8737747B2 (en) * 2011-02-14 2014-05-27 Xerox Corporation Method for automated tire detection and recognition
JP5214762B2 (ja) * 2011-03-25 2013-06-19 株式会社東芝 認識装置、方法及びプログラム
US8861798B2 (en) 2011-06-30 2014-10-14 Shenzhen Junshenghuichuang Technologies Co., Ltd. Method for authenticating identity of handset user
CN103412960B (zh) * 2013-08-31 2016-08-10 西安电子科技大学 基于双边随机投影的图像感知哈希方法
CN106845397B (zh) * 2017-01-18 2020-04-14 湘潭大学 一种基于相似度度量的人脸确认方法
TWI659364B (zh) 2018-04-03 2019-05-11 財團法人工業技術研究院 電子裝置、虹膜辨識方法以及電腦可讀式媒體
CN109753577B (zh) * 2018-12-29 2021-07-06 深圳云天励飞技术有限公司 一种搜索人脸的方法及相关装置
US11206428B1 (en) * 2020-07-14 2021-12-21 Tencent America LLC Method and apparatus for frequency-dependent joint component secondary transform

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3118725B2 (ja) * 1991-09-11 2000-12-18 株式会社日立製作所 自動分類方法
JP2690027B2 (ja) * 1994-10-05 1997-12-10 株式会社エイ・ティ・アール音声翻訳通信研究所 パターン認識方法及び装置
US7050534B2 (en) * 2000-08-29 2006-05-23 Imaging Therapeutics, Inc. Methods and devices for quantitative analysis of x-ray images

Also Published As

Publication number Publication date
US20050078869A1 (en) 2005-04-14
KR20050013467A (ko) 2005-02-04

Similar Documents

Publication Publication Date Title
KR100543707B1 (ko) 서브그룹별 pca 학습을 이용한 얼굴인식방법 및 장치
Neuhaus et al. Automatic learning of cost functions for graph edit distance
KR100571813B1 (ko) 로컬 선형변환함수를 이용한 특징벡터 추출방법과 이를이용한 영상인식방법 및 장치
Berg et al. Shape matching and object recognition using low distortion correspondences
Hariharan et al. Discriminative decorrelation for clustering and classification
US8340439B2 (en) Image conversion method and apparatus, and pattern identification method and apparatus
CN111738143B (zh) 一种基于期望最大化的行人重识别方法
CN108415883B (zh) 基于子空间聚类的凸非负矩阵分解方法
Calonder et al. Compact signatures for high-speed interest point description and matching
CN102906787A (zh) 脸部分析技术
CN107145841B (zh) 一种基于矩阵的低秩稀疏人脸识别方法及其系统
Berg et al. Shape matching and object recognition
Suo et al. Structured dictionary learning for classification
CN110852152A (zh) 一种基于数据增强的深度哈希行人重识别方法
CN111401429B (zh) 基于聚类自适应典型相关分析的多视角图像聚类方法
CN110555386A (zh) 一种基于动态贝叶斯的人脸识别身份认证方法
CN107784284B (zh) 人脸识别方法及系统
CN111695455A (zh) 一种基于耦合判别流形对齐的低分辨人脸识别方法
CN114863151A (zh) 一种基于模糊理论的图像降维聚类方法
CN105069427B (zh) 一种基于改进的稀疏编码的虹膜识别方法及装置
Haindl et al. Model-based texture segmentation
Su et al. Learning low-dimensional temporal representations
CN107729945A (zh) 基于类间稀疏表示的鉴别回归、分类方法及系统
CN112001231A (zh) 加权多任务稀疏表示的三维人脸识别方法、系统及介质
CN114943862A (zh) 一种基于结构性解析字典学习的两阶段图像分类方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment
FPAY Annual fee payment
LAPS Lapse due to unpaid annual fee