KR20180094453A - 다중채널 가버 필터와 중심대칭지역 이진 패턴기반 얼굴인식기술 - Google Patents

다중채널 가버 필터와 중심대칭지역 이진 패턴기반 얼굴인식기술 Download PDF

Info

Publication number
KR20180094453A
KR20180094453A KR1020170020770A KR20170020770A KR20180094453A KR 20180094453 A KR20180094453 A KR 20180094453A KR 1020170020770 A KR1020170020770 A KR 1020170020770A KR 20170020770 A KR20170020770 A KR 20170020770A KR 20180094453 A KR20180094453 A KR 20180094453A
Authority
KR
South Korea
Prior art keywords
lbp
image
gabor filter
histogram
images
Prior art date
Application number
KR1020170020770A
Other languages
English (en)
Other versions
KR101993729B1 (ko
Inventor
이응주
이석환
왕계원
Original Assignee
동명대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동명대학교산학협력단 filed Critical 동명대학교산학협력단
Priority to KR1020170020770A priority Critical patent/KR101993729B1/ko
Priority to PCT/KR2017/001886 priority patent/WO2018151357A1/ko
Publication of KR20180094453A publication Critical patent/KR20180094453A/ko
Application granted granted Critical
Publication of KR101993729B1 publication Critical patent/KR101993729B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/164Detection; Localisation; Normalisation using holistic features
    • G06K9/00241
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06K9/4614
    • G06K9/4647
    • G06K9/481
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/446Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/469Contour-based spatial representations, e.g. vector-coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Abstract

본 발명은 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법에 관한 것이다. 본 발명은, 입력이 N명(N은 2 이상의 자연수)의 얼굴 이미지
Figure pat00045
이며, 출력은 통계의 계단식 파티클 히스토그램 특징 벡터 표현의 이미지인
Figure pat00046
인 경우, 특징 이미지
Figure pat00047
(
Figure pat00048
,
Figure pat00049
)를 획득하는 제 1 단계; 각
Figure pat00050
를 같은 방식으로, 여러 개의 중복되는 하위 이미지를 구분하는 제 2 단계; 및
Figure pat00051
의 모든 하위 이미지의 히스토그램을 생성하여, 계단식 히스토그램 특징 벡터 순서를 추출하는 제 3 단계; 를 포함하는 것을 특징으로 한다.
이에 의해, 가버(Gabor) 필터와 CS-LBP(Center-symmetric local binary patterns)를 결합하여, 잡음에 강인한 특징점 추출과 추출된 얼굴 특징점의 차원(high dimensionality)을 줄일 수 있는 효과를 제공한다.
또한, 가버 특징 영상들을 다른 방향과 스케일로 결합하여 특징 영상의 차원을 줄이고, 특징 영상으로부터 CS-LBP 기반으로 낮은 차원의 얼굴 특징점들을 추출할 수 있는 효과를 제공한다.
뿐만 아니라, 기존의 가버 필터와 LBP의 접근 방법에 비해 가버 필터와 CS-LBP 결합 방법을 통해 특징 차원, 저장 공간 및 계산 시간을 줄이는 동시에 얼굴 인식의 높은 정확도를 얻을 수 있는 효과를 제공한다.

Description

다중채널 가버 필터와 중심대칭지역 이진 패턴기반 얼굴인식기술{FACE RECOGNITION Technique using Multi-channel Gabor Filter and Center-symmetry Local Binary Pattern}
본 발명은 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법에 관한 것으로, 보다 구체적으로는, 잡음에 강인한 특징점 추출과 추출된 얼굴 특징점의 차원(high dimensionality)을 줄이기 위하여 가버(Gabor) 필터와 CS-LBP(Center-symmetric local binary patterns)를 결합한 휴먼 얼굴 인식을 위한 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법에 관한 것이다.
더욱 안전한 사회를 위하여 개인 신원 확인에 기반한 신뢰성 높은 출입 통제 시스템 구축에 대한 관심이 점증 되고 있다. 더욱 안전한 신원 확인을 위하여 종래의 토큰 방식(카드, 키 등)보다는 사람 고유의 생체 정보를 이용한 생체 인식 분야 기술이 활발히 연구되고 있는데, 생체 인식 가운데 얼굴 인식은 이용자의 거부감이 적고 가장 자연스러운 생체 인식 방법이어서 많은 연구 노력이 집중되고 있다. 그런데 조명, 자세, 얼굴 표정, 세월 등의 환경에 있어서의 차이에 따라 같은 사람의 얼굴 이미지라도 매우 변화가 심하여 경우에 따라서는 같은 사람의 이미지끼리의 상관관계보다도 다른 사람 얼굴 이미지와의 상관관계가 더 높을 수 있다. 이러한 이유 등으로 조명, 자세, 표정, 세월 등에 무관한 안정적인 얼굴 인식 알고리즘의 개발이 매우 어렵다는 것이 잘 알려져 있다.
대한민국 특허등록공보 등록번호 제10-1355589호 "각 분할 스핀영상을 이용한 얼굴인식 방법(VACUUM PLATE HAVING A MESH-TYPE WOVEN FABRIC)" 대한민국 특허공개공보 공개번호 제10-2012-0066462호 "얼굴 인식 방법 및 시스템, 얼굴 인식을 위한 학습용 특징 벡터 추출 장치 및 테스트용 특징 벡터 추출 장치(METHOD AND SYSTEM FOR PROVIDING FACE RECOGNITION, FEATURE VECTOR EXTRACTION APPARATUS FOR FACE RECOGNITION)"
본 발명은 상기의 문제점을 해결하기 위한 것으로, 가버(Gabor) 필터와 CS-LBP(Center-symmetric local binary patterns)를 결합하여, 잡음에 강인한 특징점 추출과 추출된 얼굴 특징점의 차원(high dimensionality)을 줄이도록 하기 위한 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법을 제공하기 위한 것이다.
또한, 본 발명은 가버 특징 영상들을 다른 방향과 스케일로 결합하여 특징 영상의 차원을 줄이고, 특징 영상으로부터 CS-LBP 기반으로 낮은 차원의 얼굴 특징점들을 추출하도록 하기 위한 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법을 제공하기 위한 것이다.
또한, 본 발명은 기존의 가버 필터와 LBP의 접근 방법에 비해 가버 필터와 CS-LBP 결합 방법을 통해 특징 차원, 저장 공간 및 계산 시간을 줄이는 동시에 얼굴 인식의 높은 정확도를 얻도록 하기 위한 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법을 제공하기 위한 것이다.
그러나 본 발명의 목적들은 상기에 언급된 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기의 목적을 달성하기 위해 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법은, 입력이 N명(N은 2 이상의 자연수)의 얼굴 이미지
Figure pat00001
이며, 출력은 통계의 계단식 파티클 히스토그램 특징 벡터 표현의 이미지인
Figure pat00002
인 경우, 특징 이미지
Figure pat00003
(
Figure pat00004
,
Figure pat00005
)를 획득하는 제 1단계; 각
Figure pat00006
를 같은 방식으로, 여러 개의 중복되는 하위 이미지를 구분하는 제 2 단계; 및
Figure pat00007
의 모든 하위 이미지의 히스토그램을 생성하여, 계단식 히스토그램 특징 벡터 순서를 추출하는 제 3 단계; 를 포함하는 것을 특징으로 한다.
이때, 상기 제 3 단계 이후, 각각
Figure pat00008
의 캐스케이드 시퀀스의 해당 고유 벡터를 추출하는 제 4 단계; 를 더 포함하는 것을 특징으로 한다.
또한, 상기 제 4 단계 이후, 상기 제 1 내지 제 4 단계의 특징 추출 후 얼굴 이미지 특징 벡터를 추출하는 제 5 단계; 를 더 포함하는 것을 특징으로 한다,
또한, 상기 제 1 단계는, 얼굴 이미지
Figure pat00009
를 가보 변환하여 가보 진폭 스펙트럼을 획득하는 제 1-1 단계; 중첩에 의해 다른 n의 진폭 스펙트럼에 대해,
Figure pat00010
를 획득하는 제 1-2 단계; 및 각 CS-LBP 코드에 대해, 이미지
Figure pat00011
를 획득하는 제 1-3 단계; 를 포함하는 것을 특징으로 한다.
본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법은, 가버(Gabor) 필터와 CS-LBP(Center-symmetric local binary patterns)를 결합하여, 잡음에 강인한 특징점 추출과 추출된 얼굴 특징점의 차원(high dimensionality)을 줄일 수 있는 효과를 제공한다.
또한, 본 발명의 다른 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법은, 가버 특징 영상들을 다른 방향과 스케일로 결합하여 특징 영상의 차원을 줄이고, 특징 영상으로부터 CS-LBP 기반으로 낮은 차원의 얼굴 특징점들을 추출할 수 있는 효과를 제공한다.
뿐만 아니라, 본 발명의 다른 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법은, 기존의 가버 필터와 LBP의 접근 방법에 비해 가버 필터와 CS-LBP 결합 방법을 통해 특징 차원, 저장 공간 및 계산 시간을 줄이는 동시에 얼굴 인식의 높은 정확도를 얻을 수 있는 효과를 제공한다.
도 1은 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법이 수행되는 특징 추출 알고리즘 모듈(100)을 나타내는 도면이다.
도 2는 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법에서는 사용하는 가버 진폭 스펙트럼의 이미지를 나타낸다.
도 3은 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법을 나타내는 도면이다.
도 4와 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법에서 사용되는 예일 얼굴 데이터베이스를 나타내는 도면이다.
도 5는 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법을 설명하기 위한 CS-LBP에 대한 이미지 블록 크기 및 빈의 영향을 나타내며, 도 6은 LBP에 대한 이미지 차단 크기 및 저장소의 영향을 나타내는 그래프이다.
도 7은 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법에서 사용되는 ORL 얼굴 데이터베이스를 나타내는 도면이다.
도 7은 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법에서 사용되는 FERET 얼굴 데이터베이스를 나타내는 도면이다.
이하, 본 발명의 바람직한 실시예의 상세한 설명은 첨부된 도면들을 참조하여 설명할 것이다. 하기에서 본 발명을 설명함에 있어서, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
본 명세서에 있어서는 어느 하나의 구성요소가 다른 구성요소로 데이터 또는 신호를 '전송'하는 경우에는 구성요소는 다른 구성요소로 직접 상기 데이터 또는 신호를 전송할 수 있고, 적어도 하나의 또 다른 구성요소를 통하여 데이터 또는 신호를 다른 구성요소로 전송할 수 있음을 의미한다.
도 1은 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법이 수행되는 특징 추출 알고리즘 모듈(100)을 나타내는 도면이다. 도 1을 참조하면, 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법에서는 CS-LBP(Center-Symmetric Local Binary Patterns)와 가버 웨이브릿(Gabor Wavelet) 조합에 기반한 "특징 추출 알고리즘 모듈(100)"이 수행된다. "특징 추출 알고리즘 모듈(100)"은 CS-LBP 얼굴 영상 특징 추출 알고리즘과 결합된 가버 웨이브릿 변환을 수행하기 위해 가버 웨이브릿(Gabor Wavelet) 변환 수단(110) 및 CS-LBP 연산자를 사용한 가버 필터 이미지 텍스처 추출 기능 수단(120)을 구비한다.
먼저, 가버 웨이브릿(Gabor Wavelet) 변환 수단(110)은 좋은 공간 지역성, 공간 주파수 및 이미지와 같은 선택적 속성을 사용하여 멀티 스케일 이미지를 추출한다.
둘째, CS-LBP 연산자를 사용한 가버 필터 이미지 텍스처 추출 기능 수단(120)에 의해 외부 환경 변화의 견고성을 향상시킨다. 여기서 지역, 그 밖의 중요한 특성의 방향, 조명, 표현, 자세 및 그늘과 같은 외부 환경의 변화는 견고함을 가지기 때문이다.
이에 따라 종래의 LBP 연산 알고리즘과 결합된 가버 웨이브릿 변환과 비교할 때, 본 발명의 CS-LBP(Center-Symmetric Local Binary Patterns)와 가버 웨이브릿(Gabor Wavelet) 조합에 기반한 알고리즘은 공간과 시간에서 알고리즘의 오버 헤드를 감소시킬 뿐만 아니라 상당한 인식률을 나타낼 수 있다.
먼저, CS-LBP 연산자를 사용한 가버 필터 이미지 텍스처 추출 기능 수단(120)은 필터의 방향이 다른 다양한 스케일의 그룹에 의해 모든 방향에서 스케일 및 이미지의 회색조 변화를 분석할 수 있다.
CS-LBP 연산자를 사용한 가버 필터 이미지 텍스처 추출 기능 수단(120)은 좋은 시간-주파수 로컬리제이션과 다중 해상도 특성이 있으며, 이미지의 로컬 뉘앙스를 추출하는 능력이 있다. 따라서, CS-LBP 연산자를 사용한 가버 필터 이미지 텍스처 추출 기능 수단(120)은 조명 변화, 이미지 회전 및 변형에 있어서 확실한 견고성을 갖도록 한다. CS-LBP 연산자를 사용한 가버 필터 이미지 텍스처 추출 기능 수단(120)이 사용하는 가버 웨이브릿 커널 함수는 하기의 수학식 1과 같다.
Figure pat00012
여기서,
Figure pat00013
,
Figure pat00014
,
Figure pat00015
,
Figure pat00016
이며, μ와 v는 각각 필터의 방향과 크기에 해당하므로, μ와 v를 조정하여 필터의 방향과 치수를 선택한다. 여기서, v ∈ {0, 1, 2, 3, 4}, μ ∈ {0, 1, 2, 3, 4, 5, 6, 7},
Figure pat00017
,
Figure pat00018
이다.
한편, 도 2는 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법에서는 사용하는 가버 진폭 스펙트럼의 이미지를 나타낸다.
도 2를 참조하면, 가버 진폭 스펙트럼의 이미지를 보여 주며, 관련 매개 변수는 v ∈ {0, 1, 2}, μ ∈ {0, 1, 2, 3, 4, 5, 6, 7}, σ = 2π,
Figure pat00019
,
Figure pat00020
이다.
특징 추출 알고리즘 모듈(100)은 가버(Gabor) 기능의 크기를 줄이기 위해 다음과 같은 두 가지 방법에 따라 가버 필터 이미지를 결합하여 멀티 채널 가버 기능을 사용하여 가버 필터 이미지의 수를 줄이고 이미지를 유지하고 원본 이미지를 멀티 스케일 이미지를 추출한다. 여기서, 두 가지 조합 방법의 가버 필터 이미지는 다음과 같다.
첫째로, 특징 추출 알고리즘 모듈(100)은 멀티 채널 가버 기능 이미지의 다양한 스케일에서 가버 필터 이미지 오버레이 방향으로 각 스케일이 조정되어 멀티 주파수 가버 채널(MFGC)을 획득한다.
둘째로, 특징 추출 알고리즘 모듈(100)은 멀티 채널 가버 특징 이미지 가버 필터의 다른 방향에 있어서, 스케일 이미지 오버레이에서 각 방향으로 멀티 방향 가버 채널(MOGC)을 획득한다.
도 3은 본 발명의 실시예에 따른 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법을 나타내는 도면이다. 도 3을 참조하면, 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법은 상술한 도 1의 특징 추출 알고리즘 모듈(100)에 의해 수행되며, 특징 추출 알고리즘 모듈(100)은 멀티 채널 가버 필터 및 CS-LBP 얼굴 이미지 특징 추출 알고리즘을 기반으로 MOGC와 CS-LBP을 결합한 방식으로 수행될 수 있다.
즉, 특징 추출 알고리즘 모듈(100)은 얼굴 특징점의 추출과 얼굴 특징점의 감소를 위해 이미지 가버 웨이브릿 변환, 가버 진폭 스펙트럼의 중첩, MOGC 추출 이미지 코딩 후 중첩 특성 CS-LBP 결합, 블록 및 통계 히스토그램, 캐스케이드 히스토그램 양식 특징 벡터 시퀀싱을 수행할 수 있다.
만약, 특징 추출 알고리즘 모듈(100)로의 입력은 N명(N은 2 이상의 자연수)의 얼굴 이미지
Figure pat00021
이며, 출력은 통계의 계단식 파티클 히스토그램 특징 벡터 표현의 이미지인
Figure pat00022
인 경우, 특징 추출 알고리즘 모듈(100)은 제 1 단계에서
Figure pat00023
특징 이미지를 획득하며,
Figure pat00024
,
Figure pat00025
이다.
보다 구체적으로, 제 1-1 단계에서 얼굴 이미지
Figure pat00026
를 가보 변환하여 가보 진폭 스펙트럼을 획득하며, 제 1-2 단계에서 중첩에 의해 다른 n의 진폭 스펙트럼에 대해,
Figure pat00027
를 획득하며, 제 1-3 단계에서 각 CS-LBP 코드에 대해, 이미지
Figure pat00028
를 획득한다.
다음으로, 제 2 단계에서 특징 추출 알고리즘 모듈(100)은 각
Figure pat00029
를 같은 방식으로, 여러 개의 중복되는 하위 이미지를 구분한다.
다음으로, 제 3 단계에서 특징 추출 알고리즘 모듈(100)은
Figure pat00030
의 모든 하위 이미지의 히스토그램을 생성하여, 계단식 히스토그램 특징 벡터 순서를 추출한다.
다음으로, 제 4 단계에서 특징 추출 알고리즘 모듈(100)은 각각
Figure pat00031
의 캐스케이드 시퀀스의 해당 고유 벡터를 추출한다.
특징 추출 알고리즘 모듈(100)은 상술한 제 1 내지 제 4 단계의 특징 추출 후 얼굴 이미지 특징 벡터를 추출한다.
여기서, 특징 추출 알고리즘 모듈(100)은 얼굴 인식 단계에서 하기의 수학식 2의
Figure pat00032
거리 함수를 사용하여 테스트 샘플을 계산하고, 샘플 유사성을 학습할 수 있다.
Figure pat00033
상기 수학식 2에서, T는 트레이닝 샘플의 1차원 히스토그램 특징 벡터에 대한 것이고, S는 테스트 샘플 1차원 히스토그램 고유 벡터이며, P는 서브 이미지의 수, Q가 서브 이미지 히스토그램 빈의 수를 의미한다. r과 i는 각각 P와 Q에 대한 지수이다. 테스트 샘플과 각 트레이닝 샘플을 유사성의 특징으로 만들 때, 가장 가까운 이웃 분류기 원리는 얼굴 인식에 널리 사용되는 간단한 계산이기 때문에, 이를 사용하여 테스트 샘플을 분류시 효과가 향상된다.
이하에선, 상술한 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법에 대한 테스트 결과 및 분석에 대해서 살펴보도록 한다. 여기서는 Yale, ORL 및 FERET에서 MFGC 및 MOGC CS-LBP를 기반으로 하는 LBP, CS-LBP, Gabor + LBP에 대한 표준 라이브러리를 활용하여, 알고리즘의 인식 성능을 비교한다. 테스트를 하는 동안 모든 이미지를 잘라내고 쌍 선형 보간법을 사용하여 64x64 크기로 조정한 것을 전제로 한다.
먼저, 매개 변수 선택에 있어서, 매개 변수 선택을 위한 CS-LBP 연산자와 LBP 연산자를 사용한다. 하위 이미지의 크기를 차단하면 인식 성능에 영향을 미친다. 블록이 너무 크면 극단적인 블록 크기가 원본 이미지 크기이므로 이미지 분석의 로컬 영역의 이점을 반영할 수 없다.
블록 이미지 픽셀 수준 분석의 극단적인 상황은 너무 작아서 이미지 등록 감도를 높이고 계산 복잡성을 증가시키며 노이즈 이미지의 특성을 도입하기 쉽다. 동시에, 히스토그램 빈의 수를 선택하는 것은 인식 성능에 특정 영향을 미쳤다. 블록 크기와 히스토그램 빈 수를 적절하게 선택하기 위해 CS-LBP 및 LBP 블록 이미지 크기와 히스토그램 빈 수에 가장 적합한 것을 선택하기 위해 Yale 얼굴 표준 라이브러리를 이용해 테스트한다.
예일대의 얼굴 데이터베이스는 15명을 포함하여 모두 11 개의 이미지를 가지고 있으며 얼굴 표정, 명암 변화 등을 포함한 총 165 개의 긍정적인 얼굴 이미지가 있다. 예일대의 한 부분은 도 4와 같은 예일에 있는 사람의 몇 가지 샘플 이미지 데이터베이스이다.
테스트하는 동안 무작위로 5개의 이미지를 선택하고 나머지 이미지 테스트를 수행하되, 10회 테스트를 반복한다.
하위 이미지 크기와 히스토그램 빈 수를 각각 도 5 및 도 6에 표시된 대로 CS-LBP 및 LBP의 영향에 대한 테스트 결과로 한정한다. 여기서 도 5는 CS-LBP에 대한 이미지 블록 크기 및 빈의 영향을 나타내며, 도 6은 LBP에 대한 이미지 차단 크기 및 저장소의 영향을 나타낸다.
도 5에서와 같이, 이미지 블록이 크지 않은 경우 인식률에 미치는 빈의 수는 그다지 크지 않다. 반대로, 빈 수가 적을수록 인식률은 낮아진다. 빈이 16, 8 또는 4인지 여부에 관계없이 인식률은 모두 이미지 블록 크기로 8 × 8이며 빈이 16과 8일 때 두 인식률 곡선이 매우 가깝기 때문에 CS-LBP 알고리즘을 선택한다. 여기서 매개 변수 이미지 블록 크기는 8 * 8, 빈 수는 8이다.
도 6을 참조하면 이미지 블록 크기가 4 * 4인 경우 인식률에 미치는 빈의 수는 그다지 크지 않다. 빈(bin)의 수가 256일 때, 전체 최적의 인식률 곡선과 이미지 블록 크기가 가장 높을 때 8 * 8이므로 LBP 알고리즘 매개 변수에 대해 이미지 블록 크기를 8 * 8, 빈 수를 256인 시점에서 각각 LBP와 CS-LBP 알고리즘이 후술하는 테스트에서 사용된 최적의 매개 변수로 선택한다.
이러한 상술한 매개 변수를 이용해 알고리즘 성능 비교를 살펴본다.
샘플을 추출하는 5가지 특성 차원 알고리즘을 사용하여 가장 가까운 이웃 분류자를 사용한 5가지 샘플 테스트와 테스트 비교에 필요한 샘플 시간을 트레이닝하는데 사용한다. 트레이닝과 테스트에 필요한 시간은 테스트 평균의 10배이다. 테스트 결과는 표 1과 같으며, 표 1은 특징점 치수 및 교육 및 테스트 시간 결과를 나타낸다.
Feature dimension Training time(s) Test time(s)
LBP 16384 14.30 0.06
CS-LBP 512 0.27 0.03
Gabor + LBP 373216 454.0 7.0
MFGC + CS-LBP 1536 12.32 0.11
MOGC + CS-LBP 4096 17.10 0.27
표 1에서 (1) 특징 차원을 추출하는 MFGC와 MOGC를 기반으로 한 CS-LBP 알고리즘은 LBP의 1/32로 CS-LBP 알고리즘은 LBP 알고리즘보다 특징점 차원을 추출하는 알고리즘이 훨씬 낮으며, (2) 트레이닝 샘플에 필요한 시간에 CS-LBP는 더 큰 우위를 가지며, (3) 테스트 시간 면에서 CS-LBP 알고리즘이 여전히 우위에 있으며, LBP의 1/2이 소요된다. 가장 긴 Gabor + LBP 알고리즘은 7.0초, MOGC + CS-LBP 알고리즘은 0.27초가 필요하다. 따라서 CSP-LBP는 LBP보다 특징점 치수를 추출하고, 트레이닝 및 테스트 샘플에 필요한 시간에 더 많은 이점이 있으며, 보다 효과적으로 이미지 특징점 추출을 수행할 수 있다.
다음으로, 예일대의 얼굴 데이터베이스의 테스트 결과를 살펴보면, 예일대의 얼굴 데이터베이스가 기본 상황에 대한 라이브러리의 얼굴에 자세히 소개되었으므로 여기서 생략하도록 한다. 테스트 계획은 다음과 같이 무작위로 3, 4, 5, 6, 7 이미지를 트레이닝 샘플로 선택하고 나머지는 테스트 샘플로, 10회 테스트를 반복한다. 다섯 가지 종류의 테스트적 비교 알고리즘에 따른 예일대의 얼굴 데이터베이스에 대한 알고리즘의 인식률 결과는 표 2와 같다.
Training sample number 3 4 5 6 7
LBP 88.17 89.33 90.78 92.40 93.00
CS-LBP 88.83 90.67 92.33 93.33 93.50
Gabor + LBP 89.45 91.33 93.20 94.07 95.00
MFGC + CS-LBP 85.50 88.19 90.56 93.00 93.83
MOGC + CS-LBP 90.08 91.43 93.22 94.27 95.00
표 2를 살펴보면, (1) LBP 알고리즘보다 CS-LBP 알고리즘이 상당한 인식률을 얻었으며, 테스트 샘플에서 4와 6에 대해 인식률이 거의 1% 증가했다. (2) Gabor + LBP 알고리즘, MOGC + CS-LBP 알고리즘은 LBP 알고리즘에 비해 상당한 인식률을 달성했으며 CS-LBP 알고리즘에 비해 인식률이 약 2% 향상되었다.
다음으로, ORL 얼굴 데이터베이스의 테스트 결과를 살펴보면, ORL 얼굴 데이터베이스는 40명을 포함하고 있으며, 모두가 10 이미지, 총 400 얼굴 이미지를 가지고 있다. 그 중 얼굴 이미지의 10 ORL 얼굴 이미지 데이터베이스 중 하나에 대해 도 7과 같이 약간의 편향, 블록 등이 각 개인의 이미지에 포함되어 있다. 즉, 도 7은 ORL에 있는 사람의 10 가지 샘플 이미지를 나타낸다. 테스트에서 3, 4, 5, 6 이미지 각각을 트레이닝 샘플로 무작위로 선택하고 이미지의 나머지 부분을 테스트 샘플로 무작위로 선택했다. 반복 테스트에 있어서 다섯 가지 종류의 알고리즘에 대한 테스트 결과는 표 3과 같다. 즉, 표 3은 ORL에 대한 다섯 가지 알고리즘의 인식률 결과를 나타낸다.
Training sample number 3 4 5 6
LBP 86.93 91.08 94.10 96.00
CS-LBP 88.09 91.70 94.40 96.00
Gabor + LBP 89.78 93.32 95.54 96.89
MFGC + CS-LBP 88.36 91.79 93.50 94.69
MOGC + CS-LBP 90.32 93.54 95.65 97.00
표 3을 참조하면, (1) 다른 트레이닝 샘플에서, LBP 알고리즘보다 CS-LBP 알고리즘이 높은 인식률을 보였으며, (2) MFGC + CS-LBP 알고리즘, CS-LBP 알고리즘은 유사한 인식률을 보였으며, (3) MOGC + CS-LBP 알고리즘은 최고의 인식 속도를 달성했다.
다음으로, FERET 얼굴 데이터베이스의 테스트 결과를 살펴본다. FERET 얼굴 표준 라이브러리에서 120명을 선택하고 각각 6개의 이미지, 총 720개의 얼굴 이미지를 선택했다. 선택한 각 이미지에는 표정, 조명 및 연령 변경이 포함된다. 도 8을 참조하면, 6개의 이미지 중 하나인 FERET 얼굴 표준 라이브러리에서 선택된다. 즉, 도 8은 FERET의 사람의 여섯 샘플 이미지를 나타낸다.
테스트에서 2개 및 4 개의 이미지 각각을 트레이닝 샘플로 무작위로 선택하고 나머지는 테스트 샘플로 선택했다. 반복 테스트, 10배 평균 테스트에 따라 다섯 가지 종류의 알고리즘에 대한 테스트 비교 결과는 표 4와 같다. 즉, 표 4는 FERET에서의 다섯 알고리즘의 인식률 결과를 나타낸다.
Training sample number 2 3 4
LBP 82.79 88.86 92.33
CS-LBP 82.21 89.00 91.79
Gabor + LBP 86.70 91.33 92.89
MFGC + CS-LBP 85.86 90.03 92.00
MOGC + CS-LBP 87.37 91.42 93.00
표 4를 참조하면, (1) LBP와 CS-LBP 알고리즘이 비슷한 인식률을 달성했으며, (2) Gabor + LBP와 MOGC + CS-LBP 알고리즘은 여전히 상당한 인식률을 갖는다.
이와 같은, 테스트 결과 분석 결과 Gabor + LBP 알고리즘에 비해 MOGC + CS-LBP 알고리즘은 특징 추출의 차원이 낮고 상당한 인식률을 달성했다. 즉, MOGC + CS-LBP 알고리즘은 가장 좋은 인식률을 얻었고 인식률의 정확도가 향상된다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.
컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.
또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술 분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이상과 같이, 본 명세서와 도면에는 본 발명의 바람직한 실시예에 대하여 개시하였으며, 비록 특정 용어들이 사용되었으나, 이는 단지 본 발명의 기술 내용을 쉽게 설명하고 발명의 이해를 돕기 위한 일반적인 의미에서 사용된 것이지, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시예 외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다.
100 : 특징 추출 알고리즘 모듈
110 : 가버 웨이브릿(Gabor Wavelet) 변환 수단
120 : CS-LBP 연산자를 사용한 가버 필터 이미지 텍스처 추출 기능 수단

Claims (4)

  1. 입력이 N명(N은 2 이상의 자연수)의 얼굴 이미지
    Figure pat00034
    이며, 출력은 통계의 계단식 파티클 히스토그램 특징 벡터 표현의 이미지인
    Figure pat00035
    인 경우, 특징 이미지
    Figure pat00036
    (
    Figure pat00037
    ,
    Figure pat00038
    )를 획득하는 제 1 단계;
    Figure pat00039
    를 같은 방식으로, 여러 개의 중복되는 하위 이미지를 구분하는 제 2 단계; 및
    Figure pat00040
    의 모든 하위 이미지의 히스토그램을 생성하여, 계단식 히스토그램 특징 벡터 순서를 추출하는 제 3 단계; 를 포함하는 것을 특징으로 하는 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법.
  2. 청구항 1에 있어서, 상기 제 3 단계 이후,
    각각
    Figure pat00041
    의 캐스케이드 시퀀스의 해당 고유 벡터를 추출하는 제 4 단계; 를 더 포함하는 것을 특징으로 하는 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법.
  3. 청구항 2에 있어서, 상기 제 4 단계 이후,
    상기 제 1 내지 제 4 단계의 특징 추출 후 얼굴 이미지 특징 벡터를 추출하는 제 5 단계; 를 더 포함하는 것을 특징으로 하는 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법.
  4. 청구항 1에 있어서, 상기 제 1 단계는,
    얼굴 이미지
    Figure pat00042
    를 가보 변환하여 가보 진폭 스펙트럼을 획득하는 제 1-1 단계;
    중첩에 의해 다른 n의 진폭 스펙트럼에 대해,
    Figure pat00043
    를 획득하는 제 1-2 단계; 및
    각 CS-LBP 코드에 대해, 이미지
    Figure pat00044
    를 획득하는 제 1-3 단계; 를 포함하는 것을 특징으로 하는 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법.
KR1020170020770A 2017-02-15 2017-02-15 다중채널 가버 필터와 중심대칭지역 이진 패턴기반 얼굴인식기술 KR101993729B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020170020770A KR101993729B1 (ko) 2017-02-15 2017-02-15 다중채널 가버 필터와 중심대칭지역 이진 패턴기반 얼굴인식기술
PCT/KR2017/001886 WO2018151357A1 (ko) 2017-02-15 2017-02-21 향상된 다중채널 가버 필터 기반 휴먼 얼굴 인식 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170020770A KR101993729B1 (ko) 2017-02-15 2017-02-15 다중채널 가버 필터와 중심대칭지역 이진 패턴기반 얼굴인식기술

Publications (2)

Publication Number Publication Date
KR20180094453A true KR20180094453A (ko) 2018-08-23
KR101993729B1 KR101993729B1 (ko) 2019-06-27

Family

ID=63170362

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170020770A KR101993729B1 (ko) 2017-02-15 2017-02-15 다중채널 가버 필터와 중심대칭지역 이진 패턴기반 얼굴인식기술

Country Status (2)

Country Link
KR (1) KR101993729B1 (ko)
WO (1) WO2018151357A1 (ko)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902581A (zh) * 2019-01-28 2019-06-18 重庆邮电大学 一种基于多步加权的单样本部分遮挡人脸识别方法
CN110084135A (zh) * 2019-04-03 2019-08-02 平安科技(深圳)有限公司 人脸识别方法、装置、计算机设备及存储介质
CN110705375A (zh) * 2019-09-11 2020-01-17 西安交通大学 一种面向噪声图像的骨架检测系统及检测方法
CN110781800A (zh) * 2019-10-23 2020-02-11 北京远舢智能科技有限公司 一种图像识别系统
CN111126300A (zh) * 2019-12-25 2020-05-08 成都极米科技股份有限公司 一种人体图像检测方法、装置和电子设备及可读存储介质
CN111539271A (zh) * 2020-04-10 2020-08-14 哈尔滨新光光电科技股份有限公司 基于可穿戴设备的人脸识别方法及用于边防的可穿戴人脸检测设备
CN111967542A (zh) * 2020-10-23 2020-11-20 江西小马机器人有限公司 一种基于深度特征点的表计识别二次定位方法
CN113626553A (zh) * 2021-07-15 2021-11-09 人民网股份有限公司 一种基于预训练模型的级联二进制中文实体关系提取方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109753910B (zh) * 2018-12-27 2020-02-21 北京字节跳动网络技术有限公司 关键点提取方法、模型的训练方法、装置、介质及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080107311A1 (en) * 2006-11-08 2008-05-08 Samsung Electronics Co., Ltd. Method and apparatus for face recognition using extended gabor wavelet features
KR20150136225A (ko) * 2014-05-26 2015-12-07 에스케이텔레콤 주식회사 관심객체 검출을 위한 관심영역 학습장치 및 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100096686A (ko) * 2009-02-25 2010-09-02 오리엔탈종합전자(주) 조명분리 고유얼굴에 기반한 조명에 강인한 얼굴 인식
KR20110067480A (ko) * 2009-12-14 2011-06-22 한국전자통신연구원 얼굴 검출을 위한 특징점 검출 방법
US20130004028A1 (en) * 2011-06-28 2013-01-03 Jones Michael J Method for Filtering Using Block-Gabor Filters for Determining Descriptors for Images
KR101314293B1 (ko) * 2012-08-27 2013-10-02 재단법인대구경북과학기술원 조명변화에 강인한 얼굴인식 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080107311A1 (en) * 2006-11-08 2008-05-08 Samsung Electronics Co., Ltd. Method and apparatus for face recognition using extended gabor wavelet features
KR20150136225A (ko) * 2014-05-26 2015-12-07 에스케이텔레콤 주식회사 관심객체 검출을 위한 관심영역 학습장치 및 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
대한민국 특허공개공보 공개번호 제10-2012-0066462호 "얼굴 인식 방법 및 시스템, 얼굴 인식을 위한 학습용 특징 벡터 추출 장치 및 테스트용 특징 벡터 추출 장치(METHOD AND SYSTEM FOR PROVIDING FACE RECOGNITION, FEATURE VECTOR EXTRACTION APPARATUS FOR FACE RECOGNITION)"
대한민국 특허등록공보 등록번호 제10-1355589호 "각 분할 스핀영상을 이용한 얼굴인식 방법(VACUUM PLATE HAVING A MESH-TYPE WOVEN FABRIC)"

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902581B (zh) * 2019-01-28 2020-11-10 重庆邮电大学 一种基于多步加权的单样本部分遮挡人脸识别方法
CN109902581A (zh) * 2019-01-28 2019-06-18 重庆邮电大学 一种基于多步加权的单样本部分遮挡人脸识别方法
CN110084135A (zh) * 2019-04-03 2019-08-02 平安科技(深圳)有限公司 人脸识别方法、装置、计算机设备及存储介质
CN110084135B (zh) * 2019-04-03 2024-04-23 平安科技(深圳)有限公司 人脸识别方法、装置、计算机设备及存储介质
CN110705375B (zh) * 2019-09-11 2022-07-12 西安交通大学 一种面向噪声图像的骨架检测系统及检测方法
CN110705375A (zh) * 2019-09-11 2020-01-17 西安交通大学 一种面向噪声图像的骨架检测系统及检测方法
CN110781800A (zh) * 2019-10-23 2020-02-11 北京远舢智能科技有限公司 一种图像识别系统
CN111126300A (zh) * 2019-12-25 2020-05-08 成都极米科技股份有限公司 一种人体图像检测方法、装置和电子设备及可读存储介质
CN111126300B (zh) * 2019-12-25 2023-09-08 成都极米科技股份有限公司 一种人体图像检测方法、装置和电子设备及可读存储介质
CN111539271A (zh) * 2020-04-10 2020-08-14 哈尔滨新光光电科技股份有限公司 基于可穿戴设备的人脸识别方法及用于边防的可穿戴人脸检测设备
CN111539271B (zh) * 2020-04-10 2023-05-02 哈尔滨新光光电科技股份有限公司 基于可穿戴设备的人脸识别方法及用于边防的可穿戴人脸检测设备
CN111967542A (zh) * 2020-10-23 2020-11-20 江西小马机器人有限公司 一种基于深度特征点的表计识别二次定位方法
CN113626553A (zh) * 2021-07-15 2021-11-09 人民网股份有限公司 一种基于预训练模型的级联二进制中文实体关系提取方法
CN113626553B (zh) * 2021-07-15 2024-02-20 人民网股份有限公司 一种基于预训练模型的级联二进制中文实体关系提取方法

Also Published As

Publication number Publication date
WO2018151357A1 (ko) 2018-08-23
KR101993729B1 (ko) 2019-06-27

Similar Documents

Publication Publication Date Title
KR101993729B1 (ko) 다중채널 가버 필터와 중심대칭지역 이진 패턴기반 얼굴인식기술
Mohan et al. Example-based object detection in images by components
Arora et al. On iris camera interoperability
CN106022223B (zh) 一种高维局部二值模式人脸识别方法及系统
Schneiderman et al. A histogram-based method for detection of faces and cars
Angelo et al. On the application of Gabor filtering in supervised image classification
El-Naggar et al. Which dataset is this iris image from?
Sharkas et al. The contourlet transform with the principal component analysis for palmprint recognition
Al-Abaji et al. The using of PCA, wavelet and GLCM in face recognition system, a comparative study
Rahulkar et al. Fast discrete curvelet transform based anisotropic iris coding and recognition using k-out-of-n: A fused post-classifier
Wang et al. Iris Feature extraction based on wavelet packet analysis
Pal et al. A comparative analysis of visual and thermal face image fusion based on different wavelet family
Hong-Ying et al. An iris recognition method based on multi-orientation features and Non-symmetrical SVM
Hasan et al. Dual iris matching for biometric identification
Kumbhar et al. Facial expression recognition using gabor wavelet
Kalsi et al. A classification of emotion and gender using approximation image Gabor local binary pattern
Rezaei et al. A robust fingerprint recognition system based on hybrid DCT and DWT
Ajitha et al. Face recognition system using Combined Gabor Wavelet and DCT approach
Lajevardi et al. Contourlet structural similarity for facial expression recognition
L Fernandes et al. Study on MACE Gabor filters, Gabor wavelets, DCT-neural network, hybrid spatial feature interdependence matrix, fusion techniques for face recognition
Bougourzi et al. A comparative study on textures descriptors in facial gender classification
Nunes et al. Waveletfaces and linear regression classification for face recognition
Azizi et al. A new method for iris recognition based on contourlet transform and non linear approximation coefficients
Al-Rawi et al. Feature extraction of human facail expressions using Haar wavelet and neural network
Ali et al. Facial emotion recognition based on empirical mode decomposition and discrete wavelet transform analysis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right