KR101066343B1 - 상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법, 장치 및 그 기록 매체 - Google Patents

상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법, 장치 및 그 기록 매체 Download PDF

Info

Publication number
KR101066343B1
KR101066343B1 KR1020090114058A KR20090114058A KR101066343B1 KR 101066343 B1 KR101066343 B1 KR 101066343B1 KR 1020090114058 A KR1020090114058 A KR 1020090114058A KR 20090114058 A KR20090114058 A KR 20090114058A KR 101066343 B1 KR101066343 B1 KR 101066343B1
Authority
KR
South Korea
Prior art keywords
lbp
face image
feature vectors
mutual information
vector
Prior art date
Application number
KR1020090114058A
Other languages
English (en)
Other versions
KR20110057595A (ko
Inventor
김대진
김태완
Original Assignee
포항공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포항공과대학교 산학협력단 filed Critical 포항공과대학교 산학협력단
Priority to KR1020090114058A priority Critical patent/KR101066343B1/ko
Publication of KR20110057595A publication Critical patent/KR20110057595A/ko
Application granted granted Critical
Publication of KR101066343B1 publication Critical patent/KR101066343B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/467Encoded features or binary features, e.g. local binary patterns [LBP]

Abstract

상호 정보 최대화 기반의 국부 이진 패턴(Local Binary Patterns; LBP) 코드를 이용한 패턴 인식 방법은, 얻어진 학습 얼굴 이미지들로부터 LBP 변환을 수행한 후, 이미지 픽셀의 위치에 기반한 LBP 변환된 특징 벡터들을 구성한다. N 개의 특징 벡터들로부터 클래스 레이블 벡터와 상호 정보를 최대화하는 특징 벡터들만을 선택하여 이미지의 차원을 줄인 다음, 각각의 이미지당 LBP 코드 기반의 히스토그램 변환을 수행하여 256개의 LBP 빈도 특징 벡터를 구성하고, 구해진 256개의 LBP 빈도 특징 벡터들에 대해 클래스 레이블 벡터와 상호 정보를 최대화하는 최적의 LBP 코드들을 선택한다. 이 선택된 최적의 LBP 코드들은 분류 에러율의 최소화를 보장하는 코드들로서, 이를 이용하여 패턴 인식에 적용함으로써 종래의 국부 커널 기반 이미지 표현 방법보다 높은 인식 성능과, 감소된 LBP 코드에 의해 향상된 인식 속도를 제공한다.

Description

상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법, 장치 및 그 기록 매체{Method and apparatus of recognizing patterns using maximization of mutual information based code selection for local binary patterns, and recoding medium thereof}
본 발명은 패턴 인식 방법 및 장치에 관한 것으로서, 보다 상세하게는 국부 커널 기반의 템플릿 정합을 이용한 패턴 인식에 있어서 적은 개수의 분류 성능이 뛰어난 패턴 코드를 이용하여 인식 속도와 인식 성능을 향상시키는 상호 정보 최대화 기반의 국부 이진 패턴(Local Binary Pattern; LBP) 코드를 이용한 패턴 인식 방법 및 장치와 그 기록매체에 관한 것이다.
종래의 얼굴 인식을 위한 국부 커널 기반 이미지 표현 방법에서 적용되는 코드들 중에는 유용성이 낮은 많은 코드들이 존재한다. 이러한 유용성이 낮은 코드들은 인식 성능을 저하시킬 뿐 아니라, 많은 수의 코드로 인해 패턴 정합시에, 고차원의 벡터로 패턴을 표현하게 되어 인식을 위해 많은 시간을 필요로 하게 된다.
예컨대, 종래의 공지된 국부 이진 패턴(LBP) 구별 방법을 이용한 얼굴 검증 방법 및 장치에 대한 특허 문헌(특허등록번호: 0723406)과 확장 국부 이진 패턴을 이용한 얼굴 기술자 생성에 방법 및 장치와 이를 이용한 얼굴인식 방법 및 장치에 대한 특허 문헌(특허등록번호: 0866792)은 국부 이진 패턴을 이용하여 얼굴 인식 및 검증을 수행하는 방법을 개시하고 있다. 그러나 종래의 인식 방법은 구별성이 떨어지는 코드가 포함된 256개의 패턴들을 모두 사용함으로써, 인식 성능에 좋지 않은 영향을 미치게 된다. 즉, 이러한 불필요한 코드들을 사용하는 경우 패턴 정합시, 인식 속도를 떨어뜨리는 단점이 있었다.
본 발명이 이루고자 하는 기술적 과제는 저 사양의 휴대단말기 및 로봇 환경에서 256개의 국부 이진 패턴들 중에서 클래스 간의 구별성이 뛰어난 몇 개의 코드만을 이용하여 이미지를 표현함으로써, 인식 성능을 높이는 동시에 인식 속도를 높이는 상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법 및 장치를 제공하는 데 있다.
본 발명의 과제를 달성하기 위한 상호 정보 최대화 기반의 LBP 코드를 이용한 패턴 인식 방법은,
a) 복수의 D개의 학습 얼굴 이미지에 대하여 국부 이진 패턴(Local Binary Pattern; LBP)으로 변환시키고, 상기 LBP 변환된 학습 얼굴 이미지마다 생성한 N 개의 특징 벡터 중에서 사전에 설정된 클래스 레이블 벡터를 이용하여 선택한 M 개의 특징 벡터로 차원이 감소된 학습 얼굴이미지를 생성하는 단계;
b) 상기 차원이 감소된 각각의 학습 얼굴이미지에 대하여 256개의 각 LBP 코드의 출현 빈도를 나타내는 빈도 특징 벡터를 산출하는 단계;
c) 상기 256개의 빈도 특징 벡터에 대하여 상기 클래스 레이블 벡터와 상호 정보를 최대화하는 K개의 optimal LBP(OLBP) 코드를 선택하는 단계;
d) 등록할 얼굴이미지에 대하여 상기 선택된 OLBP 코드를 이용하여 LBP 변환하고 템플릿 특징벡터를 생성하여 얼굴이미지를 등록하는 단계; 및
e) 입력된 얼굴이미지에 대하여 상기 선택된 OLBP 코드와 상기 얼굴 등록 단계에서 산출된 템플릿 특징 벡터를 이용하여 얼굴을 인식하는 단계를 포함함을 특징으로 한다.
또한, a) 단계에서,
상기 N 개의 특징 벡터는 상기 LBP로 변환된 각 학습 얼굴이미지 픽셀의 위치에 기반한 N(가로 픽셀수 × 세로 픽셀수)개의 D차원 특징벡터임을 특징으로 한다.
또한, a) 단계에서, 선택된 상기 M 개의 특징 벡터는,
상기 N 개의 LBP로 변환된 특징 벡터 중에서 이미 설정된 상기 클래스 레이블 벡터와 상호 정보를 최대화하는 특징 벡터임을 특징으로 한다.
또한, 상기 M개의 특징 벡터의 선택은 다음 수학식으로 계산됨을 특징으로 한다.
Figure 112009072220994-pat00001
여기서, fi는 i 번째 특징 벡터, fj는 j 번째 특징 벡터, FLBP는 N 개의 특징 벡터들의 집합, SLBP는 이미 선택된 특징 벡터의 집합, C는 클래스 레이블 벡터, I(C;fi)는 클래스 레이블 벡터와 i 번째 특징 벡터간의 상호 정보량, I(fi;fj)는 i 번째 특징 벡터와 j 번째 특징 벡터간의 상호 정보량이다.
또한, b) 단계에서, 상기 256개의 빈도 특징 벡터의 산출은,
b1) 상기 차원이 감소된 각각의 학습 얼굴이미지당 LBP 코드 기반의 히스토 그램 벡터를 생성하는 단계; 및
b2) 상기 히스토그램 벡터로부터 256개의 각 LBP 벡터의 출현빈도를 나타내는 LBP 빈도 특징 벡터를 생성하는 단계; 및
b3) 상기 256개의 빈도 특징 벡터 중에서 클래스 레이블 벡터 간의 상호 정보를 최대화하는 K개의 빈도 특징 벡터를 선택하는 단계를 포함함을 특징으로 한다.
또한, b3) 단계에서, K개의 상기 빈도 특징 벡터의 선택은 다음 수식으로 계산됨을 특징으로 한다.
Figure 112009072220994-pat00002
여기서, li는 i 번째 빈도 특징 벡터, lj는 j 번째 빈도 특징 벡터, FCODE는 256 개의 LBP 빈도 특징 벡터들의 집합, SCODE는 이미 선택된 빈도 특징 벡터의 집합, C는 클래스 레이블 벡터, I(C;li)는 클래스 레이블 벡터와 i 번째 빈도 특징 벡터간의 상호 정보량, I(li;lj)는 i 번째 빈도 특징 벡터와 j 번째 빈도 특징 벡터간의 상호 정보량이다.
또한, d) 단계는,
d1) 상기 템플릿 특징벡터를 생성하는 단계는 상기 K개의 LBP 코드를 이용하여 표현된 상기 등록 얼굴이미지를 ra × rb 개의 영역단위로 분할하는 단계; 및
d2) 상기 분할된 등록 얼굴이미지에서 각각의 영역에 대해 K개의 최적의 LBP 기반의 히스토그램을 계산하고, 총 ra × rb개의 영역 각각에 대해 독립적으로 계 산된 히스토그램들을 순차적으로 연계시켜 ra× rb × K 차원의 템플릿 특징 벡터를 생성하는 단계를 포함함을 특징으로 한다.
또한, e) 단계는,
e1) 입력된 얼굴이미지에 대해 상기 K개의 OLBP 코드를 이용하여 ra × rb개의 영역으로 분할하는 단계;
e2) 상기 분할된 입력 얼굴 이미지에서 각각의 영역에 대해 K 개의 OLBP 기반의 히스토그램을 계산하고, 총 ra × rb 개의 영역 각각에 대해 독립적으로 계산된 히스토그램들을 순차적으로 연계시켜 ra × rb × K 차원의 입력 특징 벡터를 구하는 단계; 및
e3) K 개의 OLBP 코드들을 이용하여, 각 등록 얼굴 이미지와 입력된 얼굴 이미지에 대해 각 템플릿간의 거리값에 기초하여 상기 입력된 얼굴을 인식하는 단계를 포함함을 특징으로 한다.
또한, 본 발명의 다른 과제를 달성하기 위한
a) 복수의 D개의 학습 얼굴 이미지에 대하여 국부 이진 패턴(Local Binary Pattern; LBP)으로 변환시키고, 상기 LBP 변환된 학습 얼굴 이미지마다 생성한 N 개의 특징 벡터 중에서 사전에 설정된 클래스 레이블 벡터를 이용하여 선택한 M 개의 특징 벡터로 차원이 감소된 학습 얼굴이미지를 생성하는 수단;
b) 상기 차원이 감소된 각각의 학습 얼굴이미지에 대하여 256개의 각 LBP 코드에 대한 출현 빈도 특징 벡터를 생성하는 수단;
c) 상기 256개의 빈도 특징 벡터에 대하여 상기 클래스 레이블 벡터와 상호 정보를 최대화하는 K개의 최적의(optimal) LBP(OLBP) 코드를 선택하는 단계; 및
d) 등록할 얼굴이미지에 대하여 상기 선택된 OLBP 코드를 이용하여 LBP 변환하고 템플릿 특징벡터를 생성하여 얼굴이미지를 등록하는 수단; 및
e) 입력된 얼굴이미지에 대하여 상기 선택된 OLBP 코드와 상기 얼굴이미지 등록 수단에서 산출된 템플릿 특징 벡터를 이용하여 얼굴을 인식하는 수단을 포함함을 특징으로 한다.
본 발명에 의한 상호 정보 최대화 기반의 국부 이진 패턴 코드 선택 방법은 LBP 코드와 클래스 레이블 벡터 간의 상호 정보를 최대화하는 몇 개의 코드들을 선택함으로써, 분류 에러율의 최소화를 보장하기 때문에 기존의 원(original) LBP와, MCT(Modified Census Transform) 등과 같은 국부 커널 기반 이미지 표현 방법보다 높은 인식 성능과 감소된 코드로 인해 향상된 인식 속도를 제공한다.
이하, 첨부 도면을 참조하여 본 발명의 바람직한 실시 예를 설명하기로 한다.
도 1은 본 발명에 의한 상호 정보 최대화 기반 국부 이진 패턴 코드 선택 방법을 설명하기 위한 학습단계에 대한 흐름도이다.
D개의 학습 얼굴이미지들로부터 LBP 변환을 수행한 후, 각각의 LBP 변환된 2차원의 학습 얼굴 이미지에 대해 벡터화를 수행하여 N(이미지의 가로 픽셀수(w) × 이미지의 세로 픽셀수(h))개의 D차원 특징 벡터들을 구성한다(100 내지 102 단계).
도 2는 D 개의 2차원 학습 이미지들에 대해 N × D 차원의 특징 행렬을 얻는 과정이다. 이 LBP 변환 특징 행렬의 각 칼럼 벡터들이 얻어진 특징 벡터들이 된다.
얻어진 LBP 변환된 특징 벡터들과 얼굴 이미지에 대하여 사전에 설정된 클래스 레이블 벡터간의 상호 정보를 최대화하는 M 개의 특징 벡터들을 다음 수학식 1과 같이 산출한다(103 단계).
Figure 112009072220994-pat00005
여기서, fi는 i 번째 특징 벡터, fj는 j 번째 특징 벡터, FLBP는 N 개의 특징 벡터들의 집합, SLBP는 이미 선택된 특징 벡터의 집합, C는 클래스 레이블 벡터, I(C;fi)는 클래스 레이블 벡터와 i 번째 특징 벡터간의 상호 정보량, I(fi;fj)는 i 번째 특징 벡터와 j 번째 특징 벡터간의 상호 정보량이다. 이렇게 구해진 M개의 특징 벡터에 대응되는 인덱스의 집합은 학습 이미지들에 대해 구별성이 가장 뛰어난 픽셀들의 위치이다.
도 3a 및 3b는 학습 얼굴 이미지(30, 32)를 이용하여 우측 방향으로 각각 수학식 1을 통해 얻어진 40개, 80개, 120개, 160개, 200개, 및 240개의 특징 벡터에 대응되는 인덱스의 집합을 표현한 결과를 나타낸다. 여기서 흰색 픽셀은 수학식 1에 의해 선택된 특징 벡터들에 대응되는 픽셀들의 위치이며, 검정 픽셀은 선택되지 않은 픽셀들을 나타낸다.
이렇게 M 개의 특징 벡터들로 구성된 차원 감소된 학습 이미지들에 대해 각각의 얼굴이미지마다 LBP 코드 기반 히스토그램 변환을 수행하여 256개의 LBP 빈도 특징 벡터를 산출한다(104 내지 106 단계).
도 4는 M개의 특징 벡터(fp1 내지 fpM)로 이루어진 차원 감소된 학습 이미지(40)들에 대해 각각의 이미지 당 LBP 코드 기반 히스토그램 변환을 수행하는 과정을 나타낸 도면이다. D개의 각각의 차원 감소된 이미지(40)를 LBP 코드 기반 히스토그램 벡터로 만든다. 이렇게 계산된 D개의 256 차원의 히스토그램 백터들을 통해 D × 256 차원의 LBP 빈도 행렬(42)을 구성한다. 이 LBP 빈도 행렬(42)에서 256개의 컬럼 벡터들(l0 내지 l255)이 LBP 빈도 특징 벡터들이다.
구해진 256개의 LBP 빈도 특징 벡터들과 클래스 레이블 간의 상호 정보를 최대화하는 K 개의 빈도특징 벡터들을 다음 수학식 2와 같이 산출한다(107, 108 단계).
Figure 112009072220994-pat00006
여기서, li는 i 번째 빈도 특징 벡터, lj는 j 번째 빈도 특징 벡터, FCODE는 256 개의 LBP 빈도 특징 벡터들의 집합, SCODE는 이미 선택된 빈도 특징 벡터의 집합, C는 클래스 레이블 벡터, I(C;li)는 클래스 레이블 벡터와 i 번째 빈도 특징 벡터간의 상호 정보량, I(li;lj)는 i 번째 빈도 특징 벡터와 j 번째 빈도 특징 벡터간의 상호 정보량이다. 이 SCODE의 각각의 원소들에 대응되는 인덱스가 최종적으로 구해진 K 개의 LBP 코드들이다.
도 5a 내지 도 5d는 4가지 얼굴 이미지(60 내지 66)에 대하여 우측 방향으로 순차적으로 각각 10개, 20개, 40개, 60개, 80개의 선택된 LBP 코드들만을 표현한 결과를 나타낸 도면이다.
도 6은 본 발명에 의해 선택된 K 개의 OLBP 코드들을 이용하여 얼굴 인식 시스템에 적용하는 방법을 설명하기 위한 흐름도이다.
도 1에 도시된 바와 같이 100 내지 108 단계로 구성된 얼굴 이미지 학습단계를 통해, K 개의 OLBP(최적의 국부 이진코드; Optimal LBP) 코드들이 선택되며, 도 6에서는 본 발명에 의해 선택된 이 K 개의 OLBP 코드들을 이용하여 패턴 인식의 대표적인 분야인 얼굴 인식에 응용한 예를 기술한다. 다음의 얼굴 등록 및 인식 단계들은 종래의 얼굴 인식 방법이 그대로 적용된다.
얼굴 등록 단계에서 등록하고자 하는 하나의 얼굴 이미지에 대해 구해진 K 개의 OLBP 코드를 이용하여 얼굴을 표현한다(109 내지 111 단계). 이렇게 변환된 얼굴 이미지는 각 부위의 특징을 보다 잘 인식할 수 있도록 ra × rb 개의 영역으로 분할시킨다.
도 7은 ra × rb가 예컨대 5 × 5개의 영역으로서 분할된 등록 얼굴 이미지의 예시도이다. 5 × 5개의 영역으로 분할된 등록 얼굴 이미지에서 각각의 영역에 대해 K 개의 OLBP 기반의 히스토그램을 계산한다. 총 ra × rb 개의 영역 각각에 대해 독립적으로 계산된 히스토그램들을 순차적으로 연계시켜 ra × rb × K 차원의 템플릿 특징 벡터를 구한다(112 내지 113 단계). 얼굴 인식 단계에서 인식하고자 하는 입력 얼굴 이미지에 대해 K 개 OLBP 코드를 이용하여 얼굴 이미지를 표현한다. 이렇게 변환된 입력 얼굴 이미지는 ra × rb 개의 영역으로 분할시킨다. 이 렇게 분할된 입력 얼굴 이미지에서 각각의 영역에 대해 K 개의 OLBP 기반의 히스토그램을 계산한다. 총 ra × rb 개의 영역 각각에 대해 독립적으로 계산된 히스토그램들을 순차적으로 연계시켜 ra × rb × K 차원의 입력 특징 벡터를 구한다(114 내지 118 단계). 여기서 보다 세부적인 단계 설명은 종래의 얼굴 인식 방법에 있어서 종래의 기술과 동일하므로 생략하기로 한다.
또한, 얼굴 등록단계에서 구해진 템플릿 특징 벡터와 얼굴 인식 단계에서 구해진 입력 특징 벡터를 통상의 χ2-거리 기반 정합 방법을 통해 계산된 거리 값이 특정 임계치 이하일 경우, 등록된 사람과 동일한 사람이라 판단하고, 그렇지 않은 경우, 등록된 사람이 아니라고 판단한다. 여기서 얼굴 등록 단계에서 등록된 얼굴 이미지가 T 개일 경우, 얼굴 인식 단계에서의 인식할 입력 얼굴 이미지에 대해 T 개의 모든 템플릿 특징 벡터에 대해 χ2-거리 기반 정합 방법으로 각각의 템플릿과의 거리 값들을 계산하고, 이미 정해진 임계치를 근거로 하여, 하나의 등록된 사람에 대해 인식하는 방법과 동일한 방법으로 다수의 사람에 대한 인식을 수행한다(119 내지 120 단계).
이상 본 발명의 바람직한 실시 예에 대해 상세히 기술하였지만, 본 발명이 속하는 기술 분야에 있어서 통상의 지식을 가진 사람이라면, 첨부된 청구 범위에 정의된 본 발명의 정신 및 범위를 벗어나지 않으면서 본 발명을 여러 가지로 변형 또는 변경하여 표정 인식, 성별 인식 등을 실시할 수 있음을 알 수 있을 것이다. 따라서 본 발명의 앞으로의 실시 예들의 변경은 본 발명의 기술을 벗어날 수 없을 것이다.
도 1은 본 발명에 의한 상호 정보 최대화 기반의 국부 이진 패턴 코드 선택하는 방법을 보여주는 학습 단계에 대한 흐름도 이다.
도 2는 D 개의 학습 이미지들을 통해 LBP 변환 특징 벡터들을 구성하는 방법을 성명하기 위한 도면이다.
도 3a 및 3b는 인식에 사용된 각 학습 얼굴 이미지와 얼굴 이미지로부터 구한 특징벡터의 개수에 따라 대응되는 인덱스의 집합을 나타낸 결과이다.
도 4는 차원 감소된 학습 얼굴 이미지들에 대해 각각의 이미지 당 LBP 코드 기반 히스토그램 변환을 수행하는 과정을 나타낸 도면이다.
도 5a 내지 도 5d는 표정 인식용 학습 이미지들 중 4가지 표정 (화남, 놀람, 즐거움, 무표정) 이미지와 이들 이미지로부터 선택된 OLBP 코드들의 개수에 대응하여 표현한 이미지의 예시도이다.
도 6은 본 발명에 의해 선택된 K 개의 OLBP 코드들을 이용하여 얼굴 인식 시스템에 적용하는 방법을 설명하기 위한 흐름도이다.
도 7은 얼굴 이미지에 대해 5 × 5 개의 영역들로 나눈 이미지에 대한 예시 도면이다.

Claims (10)

  1. a) 복수의 D개의 학습 얼굴 이미지에 대하여 LBP(Local Binary Pattern)로 변환시키고, 상기 LBP 변환된 학습 얼굴 이미지마다 생성한 N 개의 특징 벡터 중에서 사전에 설정된 클래스 레이블 벡터를 이용하여 선택한 M 개의 특징 벡터로 차원이 감소된 학습 얼굴이미지를 생성하는 단계;
    b) 상기 차원이 감소된 각각의 학습 얼굴이미지에 대하여 256개의 각 LBP 코드의 출현 빈도를 나타내는 빈도 특징 벡터를 산출하는 단계;
    c) 상기 256개의 빈도 특징 벡터에 대하여 상기 클래스 레이블 벡터와 상호 정보를 최대화하는 K개의 OLBP(Optimal Local Binary Pattern) 코드를 선택하는 단계;
    d) 등록할 얼굴이미지에 대하여 상기 선택된 OLBP 코드를 이용하여 LBP 변환하고 템플릿 특징벡터를 생성하여 얼굴이미지를 등록하는 단계; 및
    e) 입력된 얼굴이미지에 대하여 상기 선택된 OLBP 코드와 상기 얼굴 이미지 등록 단계에서 산출된 템플릿 특징 벡터를 이용하여 얼굴을 인식을 하는 단계를 포함함을 특징으로 하는 상호 정보 최대화 기반의 LBP 코드를 이용한 패턴 인식 방법.
  2. 제 1항에 있어서, a) 단계에서,
    상기 N 개의 특징 벡터는 상기 LBP로 변환된 각 학습 얼굴 이미지 픽셀의 위치에 기반한 N(가로 픽셀수 × 세로 픽셀수)개의 D차원 특징벡터임을 특징으로 하는 상호 정보 최대화 기반의 LBP 코드를 이용한 패턴 인식 방법.
  3. 제 1항에 있어서, a) 단계에서, 선택된 상기 M개의 특징 벡터는,
    상기 N 개의 LBP로 변환된 특징 벡터 중에서 이미 설정된 상기 클래스 레이블 벡터와 상호 정보를 최대화하는 특징 벡터임을 특징으로 하는 상호 정보 최대화 기반의 LBP 코드를 이용한 패턴 인식 방법.
  4. 제 3항에 있어서,
    상기 M개의 특징 벡터의 선택은 다음 수학식으로 산출됨을 특징으로 하는 상호 정보 최대화 기반의 LBP를 이용한 패턴 인식 방법.
    Figure 112011033147655-pat00009
    여기서, fi는 i 번째 특징 벡터, fj는 j 번째 특징 벡터, FLBP는 N 개의 특징 벡터들의 집합, SLBP는 이미 선택된 특징 벡터의 집합, C는 클래스 레이블 벡터, I(C;fi)는 클래스 레이블 벡터와 i 번째 특징 벡터간의 상호 정보량, I(fi;fj)는 i 번째 특징 벡터와 j 번째 특징 벡터간의 상호 정보량이다.
  5. 제 1항에 있어서, b) 단계에서, 상기 256개의 빈도 특징 벡터의 산출은,
    b1) 상기 차원이 감소된 각각의 학습 얼굴이미지당 LBP 코드 기반의 히스토그램 벡터를 생성하는 단계; 및
    b2) 상기 히스토그램 벡터로부터 256개의 각 LBP 벡터의 출현빈도를 나타내는 LBP 빈도 특징 벡터를 생성하는 단계; 및
    b3) 상기 256개의 빈도 특징 벡터 중에서 상기 클래스 레이블 벡터 간의 상호 정보를 최대화하는 K개의 빈도 특징 벡터를 선택하는 단계를 포함함을 특징으로 하는 상호 정보 최대화 기반의 LBP 코드를 이용한 패턴 인식 방법.
  6. 제 5항에 있어서, b3) 단계에서, K개의 상기 빈도 특징 벡터의 선택은 다음 수식으로 계산됨을 특징으로 하는 상호 정보 최대화 기반의 LBP 코드를 이용한 패턴 인식 방법.
    Figure 112011033147655-pat00010
    여기서, li는 i 번째 빈도 특징 벡터, lj는 j 번째 빈도 특징 벡터, FCODE는 256 개의 LBP 빈도 특징 벡터들의 집합, SCODE는 이미 선택된 빈도 특징 벡터의 집합, C는 클래스 레이블 벡터, I(C;li)는 클래스 레이블 벡터와 i 번째 빈도 특징 벡터간의 상호 정보량, I(li;lj)는 i 번째 빈도 특징 벡터와 j 번째 빈도 특징 벡터간의 상호 정보량이다.
  7. 제 1항에 있어서, d) 단계는,
    d1) 상기 템플릿 특징벡터를 생성하는 단계는 상기 K개의 OLBP 코드를 이용하여 표현된 상기 등록 얼굴이미지를 ra × rb 개의 영역단위로 분할하는 단계; 및
    d2) 상기 분할된 등록 얼굴이미지에서 각각의 영역에 대해 K개의 최적의 LBP 기반의 히스토그램을 계산하고, 총 ra × rb개의 영역 각각에 대해 독립적으로 계산된 히스토그램들을 순차적으로 연계시켜 ra × rb × K 차원의 템플릿 특징 벡터를 생성하는 단계를 포함함을 특징으로 하는 상호 정보 최대화 기반의 LBP 코드를 이용한 패턴 인식 방법.
  8. 제 1항에 있어서, e) 단계는,
    e1) 입력된 얼굴이미지에 대해 상기 K개의 OLBP 코드를 이용하여 ra × rb개의 영역으로 분할하는 단계;
    e2) 상기 분할된 입력 얼굴 이미지에서 각각의 영역에 대해 K 개의 OLBP 기반의 히스토그램을 계산하고, 총 ra × rb 개의 영역 각각에 대해 독립적으로 계산된 히스토그램들을 순차적으로 연계시켜 ra × rb × K 차원의 입력 특징 벡터를 구하는 단계; 및
    e3) K개의 OLBP 코드들을 이용하여, 각 등록 얼굴 이미지와 입력된 얼굴 이미지에 대해 각 템플릿간의 거리값에 기초하여 상기 입력된 얼굴을 인식하는 단계를 포함함을 특징으로 하는 상호 정보 최대화 기반의 LBP 코드를 이용한 패턴 인식 방법.
  9. a) 복수의 D개의 학습 얼굴 이미지에 대하여 LBP(Local Binary Pattern)로 변환시키고, LBP 변환된 학습 얼굴 이미지로부터 생성한 N 개의 특징 벡터 중에서 사전에 설정된 클래스 레이블 벡터를 이용하여 선택한 M개의 특징 벡터로 차원이 감소된 학습 얼굴이미지를 생성하는 수단;
    b) 상기 차원이 감소된 각각의 학습 얼굴이미지에 대하여 256개의 각 LBP 코드에 대한 출현 빈도 특징 벡터를 생성하는 수단;
    c) 상기 256개의 빈도 특징 벡터에 대하여 상기 클래스 레이블 벡터와 상호 정보를 최대화하는 K개의 OLBP(Optimal Local Binary Pattern) 코드를 선택하는 수단; 및
    d) 등록할 얼굴이미지에 대하여 상기 선택된 OLBP 코드를 이용하여 LBP 변환하고 템플릿 특징벡터를 생성하여 얼굴이미지를 등록하는 수단; 및
    e) 입력된 얼굴이미지에 대하여 상기 선택된 OLBP 코드와 상기 얼굴이미지 등록 수단에서 산출된 템플릿 특징 벡터를 이용하여 얼굴을 인식하는 수단을 포함함을 특징으로 하는 상호 정보 최대화 기반의 LBP 코드를 이용한 패턴 인식 장치.
  10. 제 1항에 기재된 상호 정보 최대화 기반의 LBP 코드를 이용한 패턴 인식 방법을 컴퓨터로 실행하기 위한 프로그램을 저장한 컴퓨터 판독 가능한 기록 매체.
KR1020090114058A 2009-11-24 2009-11-24 상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법, 장치 및 그 기록 매체 KR101066343B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090114058A KR101066343B1 (ko) 2009-11-24 2009-11-24 상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법, 장치 및 그 기록 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090114058A KR101066343B1 (ko) 2009-11-24 2009-11-24 상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법, 장치 및 그 기록 매체

Publications (2)

Publication Number Publication Date
KR20110057595A KR20110057595A (ko) 2011-06-01
KR101066343B1 true KR101066343B1 (ko) 2011-09-20

Family

ID=44393200

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090114058A KR101066343B1 (ko) 2009-11-24 2009-11-24 상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법, 장치 및 그 기록 매체

Country Status (1)

Country Link
KR (1) KR101066343B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447492A (zh) * 2015-11-13 2016-03-30 重庆邮电大学 一种基于二维局部二值模式的图像描述方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101397845B1 (ko) * 2012-10-26 2014-05-20 포항공과대학교 산학협력단 얼굴 인식 방법 및 기계로 읽을 수 있는 저장 매체 및 얼굴 인식 장치
KR101716646B1 (ko) 2013-01-10 2017-03-15 한국전자통신연구원 국부이진패턴을 이용한 객체 검출 인식 방법 및 장치
KR101598712B1 (ko) * 2014-10-15 2016-02-29 유상희 물체 검출을 위한 학습 방법 및 그 물체 검출 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004078863A (ja) 2002-08-15 2004-03-11 Sony Corp 画像処理装置および画像処理方法
JP2005160015A (ja) 2003-11-07 2005-06-16 Sony Corp 画像処理装置および方法、並びにプログラム
KR20060133345A (ko) * 2005-06-20 2006-12-26 삼성전자주식회사 국부이진패턴 구별 방법을 이용한 얼굴 검증 방법 및 장치
KR20080065866A (ko) * 2007-01-10 2008-07-15 삼성전자주식회사 확장 국부 이진 패턴을 이용한 얼굴 기술자 생성 방법 및장치와 이를 이용한 얼굴 인식 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004078863A (ja) 2002-08-15 2004-03-11 Sony Corp 画像処理装置および画像処理方法
JP2005160015A (ja) 2003-11-07 2005-06-16 Sony Corp 画像処理装置および方法、並びにプログラム
KR20060133345A (ko) * 2005-06-20 2006-12-26 삼성전자주식회사 국부이진패턴 구별 방법을 이용한 얼굴 검증 방법 및 장치
KR20080065866A (ko) * 2007-01-10 2008-07-15 삼성전자주식회사 확장 국부 이진 패턴을 이용한 얼굴 기술자 생성 방법 및장치와 이를 이용한 얼굴 인식 방법 및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447492A (zh) * 2015-11-13 2016-03-30 重庆邮电大学 一种基于二维局部二值模式的图像描述方法
CN105447492B (zh) * 2015-11-13 2018-10-12 重庆邮电大学 一种基于二维局部二值模式的图像描述方法

Also Published As

Publication number Publication date
KR20110057595A (ko) 2011-06-01

Similar Documents

Publication Publication Date Title
CN109840531B (zh) 训练多标签分类模型的方法和装置
WO2022017245A1 (zh) 一种文本识别网络、神经网络训练的方法以及相关设备
JP4933186B2 (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
CN111414906A (zh) 纸质票据图片的数据合成与文本识别方法
CN110929665B (zh) 一种自然场景曲线文本检测方法
US11430255B2 (en) Fast and robust friction ridge impression minutiae extraction using feed-forward convolutional neural network
KR101777601B1 (ko) 초서체 또는 흘림체로 작성된 문자의 판별 방법 및 시스템
JP2009514110A (ja) ポーズによるヒト検出
Ayyalasomayajula et al. PDNet: Semantic segmentation integrated with a primal-dual network for document binarization
CN111191583A (zh) 基于卷积神经网络的空间目标识别系统及方法
KR102645698B1 (ko) 얼굴의 정렬 형태에 강인한 얼굴 인식 방법 및 그 장치
Kessentini et al. Evidential combination of SVM classifiers for writer recognition
KR101066343B1 (ko) 상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법, 장치 및 그 기록 매체
Zhong et al. Sgbanet: Semantic gan and balanced attention network for arbitrarily oriented scene text recognition
KR102268174B1 (ko) 가버 함수를 이용한 패턴 인식 시스템 및 방법
Chen et al. Page segmentation for historical handwritten document images using conditional random fields
Arafat et al. Two stream deep neural network for sequence-based Urdu ligature recognition
CN114581918A (zh) 一种文本识别模型训练方法及装置
CN117115824A (zh) 一种基于笔划区域分割策略的视觉文本检测方法
EP3702958B1 (en) Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image
JP2004094644A (ja) 画像処理装置、画像処理方法、記憶媒体及びプログラム
Pan et al. Identification of road signs using a novel convolutional neural network
SOUMYA et al. RECOGNIZING FACIAL EXPRESSIONS BY USING FACIAL MOVEMENT FEATURES
Molinuevo Gómez Self-supervised foreground segmentation by sequences of images without camera motion
SINGH et al. Development of a local binary pattern descriptor for texture analysis using deep convolutional neural network

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140612

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150609

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee