KR101479225B1 - Method and apparatus for generating feature vector, and method and apparatus for Image Recognition using the same - Google Patents

Method and apparatus for generating feature vector, and method and apparatus for Image Recognition using the same Download PDF

Info

Publication number
KR101479225B1
KR101479225B1 KR20140022802A KR20140022802A KR101479225B1 KR 101479225 B1 KR101479225 B1 KR 101479225B1 KR 20140022802 A KR20140022802 A KR 20140022802A KR 20140022802 A KR20140022802 A KR 20140022802A KR 101479225 B1 KR101479225 B1 KR 101479225B1
Authority
KR
South Korea
Prior art keywords
pixel
patterns
feature vector
local binary
image
Prior art date
Application number
KR20140022802A
Other languages
Korean (ko)
Inventor
이철희
권 이
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to KR20140022802A priority Critical patent/KR101479225B1/en
Application granted granted Critical
Publication of KR101479225B1 publication Critical patent/KR101479225B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/44Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/467Encoded features or binary features, e.g. local binary patterns [LBP]

Abstract

The present invention relates to a new method and an apparatus for generating a feature vector to express local binary patterns in eight-sided prism form as a technology of recognizing an image, and a method and an apparatus for recognizing an image using the same. The method for generating a feature vector according to the present invention includes: comparing a pixel value of a target pixel included in at least a partial region among input images with pixel values of pixels adjacent to the target pixel; and generating at least a three-dimensional feature vector according to the target pixel.

Description

특징 벡터 생성 방법 및 그 장치, 이를 이용한 영상 인식 방법 및 장치{Method and apparatus for generating feature vector, and method and apparatus for Image Recognition using the same}BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and apparatus for generating a feature vector,

본 발명은 영상 인식을 위한 특징 벡터 생성 방법 및 장치에 관한 것으로서, 특히 국부 이진 패턴(Local Binary Patterns)을 이용한 영상 인식을 위한 방법과 장치에 관한 것이다.The present invention relates to a method and apparatus for generating feature vectors for image recognition, and more particularly, to a method and apparatus for image recognition using Local Binary Patterns.

얼굴 인식 기술이란 영상이나 영상에 존재하는 사람의 얼굴에서 특징을 추출하여 기존에 저장되어 있는 데이터와의 비교를 통해 신원을 확인하는 것을 말한다.Face recognition technology refers to the identification of features by extracting features from the faces of people existing in the images or images and comparing them with the data stored in the existing ones.

얼굴 인식 기술은 다른 생체인식 기술과는 달리, 신체 일부를 장치에 직접 접촉시키지 않아도 되고 생체정보의 획득 방법에 강제성이 적어 사용자에게 거부감과 불편함을 거의 주지 않는 장점이 있다. 그러나, 조명의 변화, 표정 및 자세의 변화, 노화, 원근에 의한 크기 변화 등은 얼굴 영상을 왜곡시킴으로써 안정된 인식에 큰 장애가 되고 있다.Unlike other biometrics technologies, facial recognition technology does not require a part of the body to be in direct contact with the device, and the method of acquiring biometric information has a low degree of impossibility. However, changes in illumination, changes in facial expression and posture, aging, and change in size due to the perspective are distorting the facial image, which is a serious obstacle to stable recognition.

특히, 조명에 의해 얼굴 영상이 왜곡되는 현상은 인식률에 치명적인 영향을 끼친다. 심지어 서로 다른 조명 조건에서 동일한 얼굴에 대해 발생한 변화가 서로 다른 얼굴 사이에서 생긴 변화보다 더 큰 경우도 발생하게 된다. 이러한 조명 변화에 의한 얼굴 인식의 문제점을 해결하기 위한 방법으로는 외관 기반(appearance-based) 기법, 정규화 기반(normalization-based) 기법 및 특징 기반(feature-based) 기법 등이 있고, 정규화 기반(normalization-based) 기법에는 그레이-레벨 변환(gray-level transformation), 그레디언트-에지 추출(gradient and edge extraction), 얼굴 방영영역 평가(face reflection field estimation) 등의 기법 등 다수의 기법에 제안되고 있으나, 같은 얼굴의 동일성과 다른 얼굴의 차이점을 구별하기 쉽지 않은 문제점이 있다.Particularly, the phenomenon that the face image is distorted by the illumination has a serious effect on the recognition rate. There are also cases where the changes to the same face in different lighting conditions are greater than those that occur between different faces. There are appearance-based, normalization-based, and feature-based techniques for solving the problem of face recognition due to illumination change, -based technique has been proposed in a number of techniques such as gray-level transformation, gradient and edge extraction, and face reflection field estimation, There is a problem that it is not easy to distinguish the face identity from the other face difference.

특허 문헌으로서 대한민국 특허공개 제2011-67480호에는, 얼굴 검출을 위한 특징점 검출 방법으로서, 특히 n개의 입력 이미지를 입력 받는 단계와, n개의 입력 이미지 각각에 대해 서로 다른 크기와 위치를 갖는 다수개의 영역으로 분할하는 단계와, 분할된 영역별 각입력 이미지의 특징점을 각각 추출하는 단계와, 영역별 추출된 특징점들의 분포인 히스토그램을 유니폼 패턴을 이용하여 차원 벡터로 변환하는 단계를 개시한 바 있다. As a patent document, Korean Patent Laid-Open Publication No. 2011-67480 discloses a feature point detection method for detecting a face, in particular, a method for detecting a feature point, comprising: receiving n input images; Extracting feature points of each input image for each divided region, and converting a histogram, which is a distribution of feature points extracted for each region, into a dimension vector using a uniform pattern.

종래의 국부이진패턴을 이용할 경우, 서로 비유사한 영역의 국부이진패턴이 유사하여 유사한 영상으로 취급되는 문제가 있었고, 서로 유사한 영역의 국부이진패턴이 비유사하여 비유사한 영상으로 취급되는 문제가 있었는데, 본 발명은 이러한 문제를 완화시키기 위한 새로운 개념의 국부이진패턴으로서 3차원 특징 벡터를 생성하는 방법과 장치를 제공하는 것을 그 목적으로 한다.In the case of using the conventional local binary pattern, there is a problem that the local binary patterns of the regions similar to each other are similar and treated as similar images, and the local binary patterns of similar regions are not similar, It is an object of the present invention to provide a method and apparatus for generating a three-dimensional feature vector as a local binary pattern of a novel concept to alleviate this problem.

또한, 본 발명은 상기 특징 벡터를 생성하는 방법과 장치를 이용한 영상 인식 방법 및 장치를 제공하는 것을 목적으로 한다.It is another object of the present invention to provide a method of generating the feature vector and an image recognition method and apparatus using the apparatus.

상기 본 발명의 과제를 해결하기 위한 본 발명의 특징 벡터 생성 방법은, According to another aspect of the present invention,

영상을 입력받는 단계; 및 상기 입력된 영상 중 적어도 일부의 영역에 포함된 목적 화소의 화소값과 상기 목적 화소와 인접한 인접 화소들의 화소값들의 크기를 비교하고, 상기 목적 화소에 따른 적어도 3차원의 특징 벡터를 생성하는 단계를 포함한다. Receiving an image; And comparing at least a pixel value of the target pixel included in the input image with a size of pixel values of adjacent pixels adjacent to the target pixel and generating at least three dimensional feature vectors according to the target pixel .

본 발명에서 상기 특징 벡터는 3차원 특징 벡터이고, 상기 3차원 특징 벡터는 컴퓨터 비젼(computer vision)상에서의 상기 영상과 관련된 분류 또는 유사 판단을 수행하기 위하여, 상기 화소의 화소값과 상기 인접 화소들의 화소값들에 대한 비교를 통해 정의되는 국부이진패턴(Local Binary Pattern)들을 3차원상에 배열시킨 3차원 구조에서 선택된 벡터가 바람직하다.In the present invention, the feature vector is a three-dimensional feature vector, and the three-dimensional feature vector is used to determine a pixel value of the pixel and a pixel value of the adjacent pixels A vector selected from a three-dimensional structure in which local binary patterns defined through comparison of pixel values are arranged in three dimensions is preferable.

상기 국부이진패턴들은 상기 N (여기서, N은 8 이상의 정수이다) 비트의 정보가 링의 형태로 표현된 패턴들이고, 상기 3차원 구조는 상기 패턴들 간의 형태적 유사도에 따라 상기 패턴들을 위치시킨 구조인 것이 바람직하다.The local binary patterns are patterns in which information of N bits (where N is an integer of 8 or more) bits are expressed in the form of a ring, and the three-dimensional structure is a structure in which the patterns are positioned according to the morphological similarity between the patterns .

본 발명에서 상기 3차원 구조는 유사도가 높은 패턴들 간의 공간상 거리는 상기 유사도가 낮은 패턴들 간의 공간상 거리 보다 작도록 정의된 구조인 것이 바람직하다.In the present invention, the three-dimensional structure preferably has a structure in which a spatial distance between patterns having a high similarity is smaller than a spatial distance between patterns having a low similarity.

바람직하게는, 상기 국부이진패턴들은 상기 8 비트의 정보가 링의 형태로 표현된 패턴들이고, 상기 3차원 구조는 상기 링의 형태로 표현된 패턴들 간의 형태적 유사도에 따라 상기 패턴들을 위치시킨 8각 기둥 형태의 구조일 수 있다. 또한, 상기 3차원 구조는 상기 8비트의 정보가 링의 형태로 표현된 동일한 패턴들이 회전 방향을 다르게 하여 배열될 수 있다.Preferably, the local binary patterns are patterns in which the 8-bit information is expressed in the form of a ring, and the 3-dimensional structure is formed by arranging the patterns in accordance with the morphological similarity between the patterns expressed in the form of the ring It may be a structure of each column type. In addition, the three-dimensional structure may be arranged such that the same patterns in which the 8-bit information is expressed in the form of a ring are rotated in different directions.

본 발명의 또 다른 과제를 해결하기 위한, 본 발명의 특징 벡터 생성 장치는In order to solve still another problem of the present invention,

영상을 입력받는 입력부; 및 상기 입력된 영상 중 적어도 일부의 영역에 포함된 목적 화소의 화소값과 상기 목적 화소와 인접한 인접 화소들의 화소값들의 크기를 비교하고, 상기 목적 화소에 따른 적어도 3차원의 특징 벡터를 생성하는 특징 벡터 생성부를 포함한다. An input unit for inputting an image; And comparing the pixel value of the target pixel included in at least a part of the input image with the size of the pixel values of the adjacent pixels adjacent to the target pixel and generating at least three dimensional feature vectors according to the target pixel, And a vector generating unit.

본 발명에서 상기 특징 벡터 생성부는, 상기 입력된 영상에 포함된 적어도 일부의 영역에 포함된 화소 각각에 대하여, 상기 화소의 화소값과 상기 화소와 인접한 인접 화소들의 화소값들을 비교하는 비교부와; 상기 비교부의 비교 결과를 이용하여 상기 화소의 특징 벡터를 생성하는 생성부를 더 포함한다. 상기 생성부는 상기 3차원 구조에서 상기 화소의 3차원 특징 벡터를 결정할 수 있다.The feature vector generating unit may include a comparator for comparing the pixel value of the pixel with the pixel value of the adjacent pixel adjacent to the pixel with respect to each of pixels included in at least a part of the area included in the input image; And a generation unit that generates a feature vector of the pixel using the comparison result of the comparison unit. The generation unit may determine a three-dimensional feature vector of the pixel in the three-dimensional structure.

본 발명의 또 다른 과제를 해결하기 위한 영상 인식 방법은, 영상을 입력받는 단계; 및 상기 입력된 영상 중 적어도 일부의 영역에 포함된 화소 각각에 대하여, 상기 화소의 화소값과 상기 화소와 인접한 인접 화소들의 화소값들을 비교하고, 상기 비교된 화소들의 특징 벡터들을 생성하는 단계; 및 상기 생성된 특징 벡터들과 미리 마련된 훈련 영상으로부터 생성된 트레이닝 특징 벡터들을 비교하는 단계를 포함한다.According to another aspect of the present invention, there is provided an image recognition method comprising: receiving an image; And comparing pixel values of the pixels and pixel values of adjacent pixels adjacent to the pixel with respect to each of pixels included in at least a part of the input image and generating feature vectors of the compared pixels; And comparing the generated feature vectors with training feature vectors generated from previously prepared training images.

본 발명의 영상 인식 장치는, 영상을 입력받는 입력부; 및 상기 입력된 영상 중 적어도 일부의 영역에 포함된 화소 각각에 대하여, 상기 화소의 화소값과 상기 화소와 인접한 인접 화소들의 화소값들을 비교하고, 상기 비교된 화소들의 특징 벡터들을 생성하는 특징 벡터 생성부; 및 상기 생성된 특징 벡터들과 미리 마련된 훈련 영상으로부터 생성된 트레이닝 특징 벡터들을 비교하는 특징 벡터 비교부를 포함한다.An image recognition apparatus of the present invention includes: an input unit for inputting an image; And a feature vector generation unit for comparing the pixel value of the pixel with the pixel values of the adjacent pixels adjacent to the pixel with respect to each of the pixels included in at least a part of the input image and generating feature vectors of the compared pixels, part; And a feature vector comparing unit for comparing the generated feature vectors with training feature vectors generated from a training image prepared in advance.

본 발명에 따르면, 서로 비유사한 영역의 국부이진패턴이 유사하여 유사한 영상으로 취급되는 문제, 서로 유사한 영역의 국부이진패턴이 비유사하여 비유사한 영상으로 취급되는 문제에 따른 영상 인식 오류의 문제를 완화시킬 수 있다. 또한 조명의 변화에 강인한 효과가 있다. According to the present invention, a problem that a local binary pattern of regions that are not similar to each other is treated as a similar image, a problem of image recognition error due to a problem in which local binary patterns of similar regions are treated as non- . There is also a strong effect on the change of illumination.

도 1은 본 발명의 일 실시예에 따른 특징 벡터 생성 방법을 나타내는 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 특징 벡터 생성 장치를 나타내는 블록도이다.
도 3은 종래의 국부이진패턴 생성방법을 설명하기 위한 도면이다.
도 4는 종래의 국부이진패턴의 문제점을 설명하기 위한 도면이다.
도 5는 서로 다른 조명 하에서 히스토그램 인터섹션의 차이를 설명하기 위한 도면이다.
도 6a는 전통적인 일차원 국부이진패턴을 나타내는 그림이고, 도 6b는 회전 불변특성을 갖도록 재배열된 국부이진패턴을 나타내는 그림이며, 도 6c는 본 발명에서 새롭게 정의된 8각형상의 국부이진패턴 배열을 나타내는 그림이다.
도 7은 본 발명의 국부이진패턴이 공간상에 배열된 3차원 구조를 나타내는 도면이다.
도 8은 도 7의 배열을 좌표값의 룩업테이블로 도시한 것이다.
도 9는 본 발명의 일 실시예에 따른 국부이진패턴을 이용한 영상 인식 방법을 나타내는 흐름도이다.
도 10은 본 발명의 일 실시예에 따른 국부이진패턴을 이용한 영상 인식 장치를 나타내는 블록도이다.
도 11은 얼굴 영상에서 가중치를 부여하는 실시예를 도시한 것이다.
1 is a flowchart illustrating a method of generating a feature vector according to an embodiment of the present invention.
2 is a block diagram illustrating an apparatus for generating feature vectors according to an embodiment of the present invention.
3 is a diagram for explaining a conventional local binary pattern generation method.
4 is a view for explaining a problem of a conventional local binary pattern.
5 is a diagram for explaining the difference of the histogram intersection under different illumination.
FIG. 6A is a diagram illustrating a conventional one-dimensional local binary pattern, FIG. 6B is a diagram illustrating a local binary pattern rearranged to have rotation-invariant characteristics, FIG. 6C is a diagram illustrating an octagonal local binary pattern array newly defined in the present invention It is a picture.
7 is a diagram showing a three-dimensional structure in which a local binary pattern of the present invention is arranged in space.
Fig. 8 shows the arrangement of Fig. 7 as a look-up table of coordinate values.
9 is a flowchart illustrating an image recognition method using a local binary pattern according to an embodiment of the present invention.
10 is a block diagram illustrating an image recognition apparatus using a local binary pattern according to an embodiment of the present invention.
FIG. 11 shows an embodiment for weighting face images.

이하의 내용은 단지 발명의 원리를 예시한다. 그러므로 당업자는 비록 본 명세서에 명확히 설명되거나 도시되지 않았지만 발명의 원리를 구현하고 발명의 개념과 범위에 포함된 다양한 장치를 발명할 수 있는 것이다. 또한, 본 명세서에 열거된 모든 조건부 용어 및 실시예들은 원칙적으로, 발명의 개념이 이해되도록 하기 위한 목적으로만 명백히 의도되고, 이와 같이 특별히 열거된 실시예들 및 상태들에 제한적이지 않는 것으로 이해되어야 한다. 또한, 발명의 원리, 관점 및 실시예들 뿐만 아니라 특정 실시예를 열거하는 모든 상세한 설명은 이러한 사항의 구조적 및 기능적 균등물을 포함하도록 의도되는 것으로 이해되어야 한다. 또한 이러한 균등물들은 현재 공지된 균등물뿐만 아니라 장래에 개발될 균등물 즉 구조와 무관하게 동일한 기능을 수행하도록 발명된 모든 소자를 포함하는 것으로 이해되어야 한다. The following merely illustrates the principles of the invention. Therefore, those skilled in the art will be able to devise various apparatuses which, although not explicitly described or shown herein, embody the principles of the invention and are included in the concept and scope of the invention. It is also to be understood that all conditional terms and examples recited in this specification are, in principle, expressly intended for the purpose of enabling the inventive concept to be understood and are not to be construed as limited to such specifically recited embodiments and conditions do. It is also to be understood that the detailed description, as well as the principles, aspects and embodiments of the invention, as well as specific embodiments thereof, are intended to cover structural and functional equivalents thereof. It is also to be understood that such equivalents include all elements contemplated to perform the same function irrespective of the currently known equivalents as well as the equivalents to be developed in the future, i.e., the structure.

본 명세서의 특허청구범위에서, 상세한 설명에 기재된 기능을 수행하기 위한 수단으로 표현된 구성요소는 예를 들어 상기 기능을 수행하는 회로 소자의 조합 또는 펌웨어/마이크로 코드 등을 포함하는 모든 형식의 소프트웨어를 포함하는 기능을 수행하는 모든 방법을 포함하는 것으로 의도되었으며, 상기 기능을 수행하도록 상기 소프트웨어를 실행하기 위한 적절한 회로와 결합된다. 이러한 특허청구범위에 의해 정의되는 발명은 다양하게 열거된 수단에 의해 제공되는 기능들이 결합되고 청구항이 요구하는 방식과 결합되기 때문에 상기 기능을 제공할 수 있는 어떠한 수단도 본 명세서로부터 파악되는 것과 균등한 것으로 이해되어야 한다.In the claims of the present specification, the elements represented as means for performing the functions described in the detailed description may include, for example, a combination of circuit elements performing the function or any type of software including firmware / And is coupled with appropriate circuitry for executing the software to perform the function. It is to be understood that the invention as defined by the appended claims is not to be interpreted as limiting the scope of the invention as defined by the appended claims, as the functions provided by the various enumerated means are combined and combined with the manner in which the claims require. .

어떤 구성요소가 다른 구성요소에 ”연결되어”있다거나 “접속되어”있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 “직접 연결되어”있다거나 “직접 접속되어”있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.It is to be understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, . On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between. Unless defined otherwise, all terms (including technical and scientific terms) used herein may be used in a sense commonly understood by one of ordinary skill in the art to which this invention belongs. Also, commonly used predefined terms are not ideally or excessively interpreted unless explicitly defined otherwise.

본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함될 수 있다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.In this specification, a singular form may include plural forms unless specifically stated in the phrase. It is noted that the terms "comprises" and / or "comprising" used in the specification are intended to be inclusive in a manner similar to the components, steps, operations, and / Or additions.

상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 발명을 설명함에 있어서 발명과 관련된 공지 기술에 대한 구체적인 설명이 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.BRIEF DESCRIPTION OF THE DRAWINGS The above and other objects, features and advantages of the present invention will become more apparent from the following detailed description taken in conjunction with the accompanying drawings, in which: . In the following description, a detailed description of known technologies related to the present invention will be omitted when it is determined that the gist of the present invention may be unnecessarily blurred. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

본 명세서는 국부이진패턴(LBP: Local Binary Pattern)을 3차원 8각형의 프리즘을 이용하여 표현한, 3차원 특징 벡터의 생성 방법 및 장치와, 이를 이용한 영상 인식 방법 및 장치를 개시한다. 국부 이진 패턴은 3차원 공간 상의 좌표로 인코딩됨으로써, 기존 방식에 따른 국부이진패턴의 스칼라값(scalar value) 인코딩에 비해 조명 변화에 의한 영상 인식 성능 열화를 감소시킬 수 있다. 본 명세서에서 설명하는 영상으로는 사람의 얼굴 또는 이를 포함한 영상 등 다양한 형태의 영상이 사용될 수 있다. 이하, 본 명세서에서 개시하는 발명들에 대해 도면을 참조하여 상세히 설명한다.The present invention discloses a method and apparatus for generating a three-dimensional feature vector by using a three-dimensional octagonal prism (LBP) and a method and apparatus for recognizing an image using the same. The local binary pattern is encoded in coordinates on a three-dimensional space, thereby reducing degradation of image recognition performance due to illumination changes compared to scalar value encoding of a localized binary pattern according to conventional methods. As the image described in this specification, various types of images such as a human face or an image including the human face can be used. Hereinafter, the invention disclosed in this specification will be described in detail with reference to the drawings.

도 1은 본 발명의 일 실시예에 따른 특징 벡터 생성 방법을 설명하기 위한 흐름도이다. 1 is a flowchart illustrating a method of generating a feature vector according to an embodiment of the present invention.

도 1에 도시된 특징 벡터 생성 방법은, 특징 벡터 생성 장치(200)에서 시계열적으로 수행되는 하기 단계들을 포함한다. The feature vector generation method shown in FIG. 1 includes the following steps, which are performed in a time-series manner in the feature vector generation apparatus 200.

S101단계에서, 입력부(201)는 영상 인식, 영상 분류를 위한 목적 영상을 입력 받는다. 본 단계에서 입력받는 영상은, 인식 또는 분류의 대상이 되는 목적 영상으로서, 예를 들어 얼굴 영상, 지문 영상 등이 있다. In step S101, the input unit 201 receives a target image for image recognition and image classification. The image received in this step is an object image to be recognized or classified, for example, a face image, a fingerprint image, and the like.

S102단계에서, 전처리부(202)는 입력된 영상에 대한 영상 정규화를 포함한 전처리를 수행한다. 본 단계는 특징 벡터 생성 이전에 수행되며, illumination 효과 등을 줄이기 위해서 수행되며, 필요에 따라 선택적으로 수행될 수 있다. 또한, 본 단계의 영상 정규화는 선택적으로 영상에 대한 스케일링을 수행하고 스케일링된 영상에 대한 정규화를 수행하도록 구현될 수 있다. In step S102, the preprocessing unit 202 performs preprocessing including image normalization on the input image. This step is performed before the feature vector generation, and is performed to reduce the illumination effect, etc., and can be selectively performed as needed. In addition, the image normalization in this step may be implemented to selectively perform scaling on the image and perform normalization on the scaled image.

S103단계에서, 특징벡터 생성부(203)는 전처리된 영상의 3차원 특징 벡터를 생성한다. 특징벡터 생성부(203)는 입력된 영상 중 일부의 영역에 포함된 각각의 화소들에 대하여, 각각의 화소와, 그 화소와 인접한 인접 화소들의 화소값을 비교하고, 비교 결과에 따라 그 화소의 특징 벡터를 생성한다. 여기서 화소값은 화소의 신호값을 의미하는 개념임은 당업자의 입장에서 자명할 것이다.In step S103, the feature vector generation unit 203 generates a three-dimensional feature vector of the preprocessed image. The feature vector generation unit 203 compares the pixel values of each pixel included in a part of the input image with the pixel values of adjacent pixels adjacent to the pixel, And generates a feature vector. Herein, the pixel value is a concept of a signal value of a pixel, which will be apparent to those skilled in the art.

S103 단계에서 특징 벡터는 각각의 화소별로 생성되며, 3차원 벡터가 바람직하다. 일반적으로 특징 벡터는 컴퓨터 비젼 기술을 통해 기술 영상의 분류 또는 유사 판단을 수행하기 위하여 사용되는 것인데, 본 실시예에서의 특징 벡터는 기존의 1차원 국부이진패턴들을 3차원 벡터로 표현한 것이다. 즉, 기존의 국부이진패턴들을 3차원의 구조로 특정되는 3차원 좌표 또는 3차원 벡터로 표현한 것에 특징이 있다. In step S103, the feature vector is generated for each pixel, and a three-dimensional vector is preferable. In general, the feature vector is used for classifying or judging similarity of a technical image through a computer vision technique. In the present embodiment, a feature vector is a three-dimensional vector of existing one-dimensional local binary patterns. That is, it is characterized in that existing local binary patterns are expressed by three-dimensional coordinates or three-dimensional vectors specified by a three-dimensional structure.

본 실시예에서, 3차원 특징벡터는 공지의 개념에 따른 국부이진패턴들이 3차원의 정다각형기둥의 각 꼭지점, 그리고 정다각기둥의 옆면을 따라 일정한 간격으로 배치된 특정의 점에 대응된다. 다르게 말하면, 본 실시예에서는 기존의 국부이진패턴들을 3차원의 정다각 기둥 등을 통해 특정되는 좌표로 표현된다. 물론 원기둥 형태의 구조물도 사용될 수 있다.In this embodiment, the three-dimensional feature vector corresponds to a specific point in which the local binary patterns according to the known concept are arranged at regular intervals along the respective vertexes of the three-dimensional regular polygonal column and the side faces of the regular polygonal column. In other words, in the present embodiment, existing local binary patterns are expressed by coordinates specified through three-dimensional regular polygonal columns or the like. Of course, a cylindrical structure can also be used.

서로 인접하여 배치된 국부이진패턴들은 유니폼한 패턴이 바람직하다. 여기서 유니폼한 패턴은 0과 1로 구성된 이진패턴에서 0과 1사이의 전환, 즉 공간적 전환의 횟수가 2회 이내인 것을 의미한다. 국부이진패턴은 3×3 화소들로 구성된 패턴일 수 있으며, 실시예에 따라 4×4 또는 그 이상의 화소들로 구성될 수 있다. 또한, 3차원 기둥의 평면좌표 상에 형태가 유사하고, 인접한 국부이진패턴 사이의 거리는 서로 동일할 수 있다. 이 경우 정다각형 또는 원기둥 구조일 수 있고, 국부이진패턴이 3×3 화소들로 구성된 패턴인 경우 정 팔각형일 수 있다. 3차원 기둥의 높이좌표 상에 인접한 국부이진패턴 사이의 거리도 서로 동일할 수 있다. 이렇게 함으로써, 서로 다른 조명 환경에서 유사한 패턴은 3차원 좌표 상에 서로 근접하게 위치될 수 있고, 조명 변화 강인한 영상 인식이 가능하다. The localized binary patterns disposed adjacent to each other are preferably uniform patterns. Here, the uniform pattern means that the transition between 0 and 1 in the binary pattern consisting of 0 and 1, that is, the number of spatial conversions is less than 2 times. The local binary pattern may be a pattern composed of 3 x 3 pixels, and may be composed of 4 x 4 or more pixels according to an embodiment. Also, the shapes are similar on the plane coordinates of the three-dimensional columns, and the distances between adjacent local binary patterns may be equal to each other. In this case, it may be a regular polygonal or cylindrical structure, or it may be regular octagonal when the local binary pattern is a pattern composed of 3 x 3 pixels. The distance between adjacent local binary patterns on the height coordinates of the three-dimensional column may be the same. By doing so, similar patterns in different illumination environments can be placed close to each other on three-dimensional coordinates, and illumination change robust image recognition is possible.

도 2는 본 발명의 일 실시예에 따른 특징 벡터 생성 장치를 설명하기 위한 도면이다. 2 is a diagram for explaining a feature vector generating apparatus according to an embodiment of the present invention.

도 2를 참조하면, 본 실시예의 특징 벡터 생성 장치(200)는 입력부(201), 전처리부(202) 및 특징벡터 생성부(203)을 포함한다. 또한, 본 실시예의 특징 벡터 생성부(203)는 입력된 영상 중 적어도 일부의 영역에 포함된 화소 각각에 대하여, 상기 화소의 화소값과, 상기 화소와 인접한 인접 화소의 화소값들을 비교하는 비교부(미도시)와, 상기 비교부의 비교 결과를 이용하여 상기 화소의 3차원 특징 벡터를 생성하는 생성부(미도시)를 더 포함할 수 있다. 또한, 특징 벡터 생성 장치(200)는 생성된 특징벡터를 저장하는 저장부(미도시)를 더 포함할 수 있다. Referring to FIG. 2, the feature vector generation apparatus 200 of the present embodiment includes an input unit 201, a preprocessing unit 202, and a feature vector generation unit 203. In addition, the feature vector generation unit 203 of the embodiment compares the pixel value of the pixel with the pixel value of the adjacent pixel adjacent to the pixel, with respect to each pixel included in at least a part of the input image, (Not shown) for generating a three-dimensional feature vector of the pixel using the comparison result of the comparison unit. In addition, the feature vector generation apparatus 200 may further include a storage unit (not shown) for storing the generated feature vectors.

본 실시예에서 특징 벡터는 미리 정의된 3차원 구조에서 선택되는 3차원의 특징 벡터이다. 여기에서, 미리 정의된 3차원 구조는, 컴퓨터 비젼(computer vision) 상에서 영상의 분류 또는 유사 판단을 수행하기 위하여, 임의의 화소의 화소값과 상기 임의의 화소와 인접한 인접 화소들의 화소값들의 크기 비교를 통해 정의되는 국부이진패턴(Local Binary Pattern)들 중 적어도 일부를 3차원상에 대응시켜 정의되는 3차원 구조가 바람직하다. In the present embodiment, the feature vector is a three-dimensional feature vector selected from a predefined three-dimensional structure. Here, the predefined three-dimensional structure is a three-dimensional structure in which, in order to perform classification or similar determination of an image on a computer vision, a pixel value of an arbitrary pixel and a size of pixel values of adjacent pixels adjacent to the arbitrary pixel Dimensional structure defined by associating at least a part of local binary patterns defined on a three-dimensional plane with a three-dimensional structure.

국부이진패턴들은 N(여기서, N은 8 이상의 정수이다) 비트의 정보가 링의 형태로 표현된 패턴으로 정의될 수 있고, 3차원 구조는 상기 국부이진패턴들 간의 형태적 유사도에 따라 상기 3차원 구조상에서 위치시킨 구조로 정의될 수 있다. 국부이진패턴 모두를 3차원상의 구조에 대응시키는 것도 가능은 하나, 본 실시예에 따른 3차원 특징 벡터는 국부이진패턴들 중 적어도 일부를 3차원상의 구조에 대응시킴으로써 정의되는 벡터이다. 3차원 구조상에 대응되는 국부이진패턴은 공간적 천이의 횟수가 일정값 이하인 것이 바람직하다. 특히, 공간적 천이가 0, 2 인 것이 바람직하다. The local binary patterns may be defined as a pattern in which information of N bits (where N is an integer equal to or greater than 8) bits are expressed in the form of a ring, and the three- Can be defined as a structure positioned in the structure. Although it is also possible to make all of the local binary patterns correspond to the three-dimensional structure, the three-dimensional feature vector according to this embodiment is a vector defined by associating at least a part of the local binary patterns with the three-dimensional structure. It is preferable that the number of spatial transitions is equal to or less than a predetermined value in the local binary pattern corresponding to the three-dimensional structure. Particularly, it is preferable that the spatial transition is 0 or 2.

여기에서, 공간적 천이는 국부이진패턴의 값이 0이 1로 바뀌거나, 1이 0으로 바뀌는 것을 의미한다. 3*3 사이즈의 국부이진패턴의 값은 0~255로서 총 국부이진패턴은 256개에 해당하나, 후술하는 도 6b에 도시된 바와 같이 선형적 특성을 갖는 유니폼 특징벡터 58개를 선별하여, 58개의 특징벡터를 8각 기둥형태의 3차원 구조에 대응시키는 것이 가능하다. 본 실시예에서는 대응된 위치에 따른 3차원 벡터값이 3차원의 특징벡터로 정의된다. 후술하는 6b, 6c를 참고하면, 상기 미리 정의된 3차원 구조는 형태적 유사도가 높은 국부이진패턴들 간의 공간상 거리는 상기 형태적 유사도가 낮은 국부이진패턴들 간의 공간상 거리 보다 작도록 정의되는 것이 바람직하다. 8각 기둥 형태의 구조에서, 상기 0 또는 1의 갯수가 같은 패턴들은 일정한 방향으로(시계 방향으로 또는 반시계 방향으로) 배열되는 것이 바람직하다. Here, the spatial transition means that the value of the local binary pattern changes from 0 to 1, or 1 to 0. The value of the 3 * 3 size local binary pattern is 0 to 255, and the total number of local binary patterns is 256, but 58 uniform characteristic vectors having linear characteristics are selected as shown in FIG. It is possible to associate the feature vectors with the three-dimensional structure of the octagonal columnar shape. In this embodiment, the three-dimensional vector value according to the corresponding position is defined as a three-dimensional feature vector. Referring to 6b and 6c to be described later, the predefined three-dimensional structure is defined so that the spatial distance between local binary patterns having high morphological similarity is smaller than the spatial distance between the local binary patterns having low morphological similarity desirable. In the eight columnar structure, it is preferable that the patterns having the same number of 0 or 1 are arranged in a certain direction (clockwise or counterclockwise).

도 2에서 설명하는 특징 벡터 생성 장치의 동작 내용은, 도 1의 특징 벡터 생성 방법과 중복되므로 이에 대한 설명은 생략하기로 한다.The operation contents of the feature vector generating apparatus described in FIG. 2 are duplicated with the feature vector generating method of FIG. 1, so that the description thereof will be omitted.

전처리부(202)에서 영상 정규화 절차 등을 수행할 수 있다. 영상 정규화 절차는 국부이진패턴 인코딩을 진행하기 전에 조명에 의한 영상 인식율 저하를 감소하기 위해 선행하여 진행될 수 있다. 특히 전처리부에서는 감마 보정 영상, DoG(Difference of Gaussian) 필터링,변형 균등화(equalization of variation) 등을 수행할 수 있다. 이와 같은 전처리 과정을 통해 조명에 의한 영상 인식율 저하를 감소시킬 수 있다. The preprocessing unit 202 may perform an image normalization procedure or the like. The image normalization procedure can be performed in advance to reduce the image recognition rate degradation due to illumination before proceeding with the local binary pattern encoding. In particular, the preprocessing unit can perform gamma correction, DoG (Difference of Gaussian) filtering, and equalization of variation. Through such a preprocessing process, degradation of the image recognition rate due to illumination can be reduced.

도 3은 국부이진패턴의 기본 개념을 설명하기 위한 도면이다. 국부이진패턴은 영상에 속한 각 화소별로 계산되며, 본 실시예에서는 국부이진패턴 값을 계산하고자 하는 화소를 목적 화소라하고, 그 화소 주변에 인접한 화소를 인접 화소라 한다. 도 3을 참조하면, 국부이진패턴은 화소 주변의 3×3 인접 화소들의 값(g1 내지 g8)과 중앙에 위치한 목적 화소의 화소값(gc)을 비교해서 크면 1, 작으면 0을 할당함으로써 구성되는 8 비트의 수가 중앙 화소(gc )에 대한 국부이진패턴 값이 된다. 3 is a diagram for explaining the basic concept of a local binary pattern. A local binary pattern is calculated for each pixel belonging to an image. In this embodiment, a pixel for which a local binary pattern value is to be calculated is called a target pixel, and a pixel adjacent to the pixel is called an adjacent pixel. Referring to FIG. 3, the local binary pattern compares the values (g 1 to g 8 ) of the 3 × 3 neighboring pixels around the pixel with the pixel value (g c ) of the target pixel located at the center, The number of 8 bits constituted by the allocation becomes the local binary pattern value for the center pixel g c .

국지적 영역 내에서의 국부이진패턴 값들의 히스토그램이 그 영역에 대한 특징 기술자가 될 수 있다. 아래의 [수학식 1] 과 [수학식 2]에 의해 영상의 모든 픽셀은 8비트 국부이진패턴 값(LBP value)으로 코딩된다.The histogram of local binary pattern values within the local region may be a feature descriptor for that region. All pixels of the image are coded with an 8-bit local binary pattern value (LBP value) by the following equations (1) and (2).

[수학식 1][Equation 1]

Figure 112014019095991-pat00001
Figure 112014019095991-pat00001

[수학식 2]&Quot; (2) "

Figure 112014019095991-pat00002
Figure 112014019095991-pat00002

도 4는 기존의 국부이진패턴 인코딩 방법의 문제점을 설명하기 위한 도면이다. 종래의 인코딩 방법은 비슷한 구조라 하더라도 차이가 큰 국부이진패턴 값을 생성할 수 있고, 이러한 차이는 서로 완전히 다른 구조 사이의 국부이진패턴 값보다 더 커질 수 있는 문제점이 있었다. 4 is a diagram for explaining a problem of a conventional local binary pattern encoding method. The conventional encoding method has a problem in that it can generate a local binary pattern value with a large difference even in a similar structure and this difference can be larger than the value of the local binary pattern between structures which are completely different from each other.

도 4의 (a)를 참조하면, 선택된 영상에서 2개의 국부이진패턴을 추출하면, 2개의 국부이진패턴이 서로 완전히 다름에도 불구하고, 국부이진패턴 값이 서로 비슷함을 알 수 있다. 이러한 국부이진패턴 값으로부터 두 패턴을 비교하면, 두 패턴이 서로 매우 유사한 것으로 결정될 수 있다.Referring to FIG. 4A, if two localized binary patterns are extracted from the selected image, it can be seen that the localized binary pattern values are similar to each other, although the two localized binary patterns are completely different from each other. When comparing two patterns from these local binary pattern values, it can be determined that the two patterns are very similar to each other.

도 4의 (b)는 도 4의 (a)와 반대 경우를 설명하기 위한 도면이다. 도 4의 (b)를 참조하면, 선택된 영상에서 2개의 국부이진패턴을 각각 추출하면, 2개의 국부이진패턴이 서로 유사한 것임에도 불구하고, 기존의 정의에 따른 국부이진패턴 값은 서로 다르며, 영상은 서로 다른 것으로 결정될 수 있다.4 (b) is a view for explaining a case opposite to that of FIG. 4 (a). Referring to FIG. 4B, when two localized binary patterns are extracted from the selected image, although the two localized binary patterns are similar to each other, the local binary pattern values according to the existing definition are different from each other, Can be determined to be different.

도 4의 (a)와 도 4의 (b)에서 설명한 종래의 국부이진패턴 인코딩 방법의 문제점은 조명 변화에 있어 인식 성능 열화에 큰 원인이 된다.The problem of the conventional local binary pattern encoding method described in FIGS. 4 (a) and 4 (b) is a major cause of deterioration in recognition performance in illumination change.

국부이진패턴의 분포 특성을 이용하는 대부분의 방법에서는 히스토그램(histogram) 차이를 활용하기 위해 빈투빈(bin-to-bin) 거리 측정을 이용한다. 이러한 빈투빈 거리 측정을 이용할 때, 전술한 도 4의 (a)와 도 4의 (b) 문제점을 피하는 것은 용이하지 않다. 비록, 국부이진패턴 특징이 특정의 모노토닉 그레이 스케일 변환(monotonic gray scale transformation)에 대해 불변이라 하더라도, 조명 변화에 불변은 아니다. 그러나, 대부분의 경우에 조명 변화는 여전히 유사한 국부이진패턴을 생성한다. 즉, 조명 변화 하에서 국부이진패턴이 불변이 아니라 하더라도 전반적인 구조는 여전히 유사할 수 있다.Most methods that use the distribution characteristics of localized binary patterns use bin-to-bin distance measurements to exploit the histogram difference. It is not easy to avoid the problems of Figs. 4 (a) and 4 (b) described above when using this binocular distance measurement. Although the localized binary pattern feature is invariant to a particular monotonic gray scale transformation, it is not invariant to the illumination change. However, in most cases the illumination change still produces a similar localized binary pattern. That is, even though the localized binary pattern is not invariant under illumination changes, the overall structure may still be similar.

도 5는 서로 다른 조명 하에서 히스토그램 인터섹션(intersection)의 차이를 설명하기 위한 도면이다. 도 5의 (a)와 도 5의 (b)는 서로 다른 조명하에 동일한 사람의 입술부분과 그에 따른 국부이진패턴을 도시한 것이다. 5 is a diagram for explaining a difference of a histogram intersection under different illumination. Figures 5 (a) and 5 (b) show the lips of the same person under different illumination and their corresponding local binary patterns.

도 5의 (a)와 도 5의 (b)를 참조하면, 국부이진패턴에서 조도변화에 따른 조명 변화에도 불구하고 대각선 에지 구조는 유사하게 나타난다. 이 경우, 국부이진패턴 값은 서로 유사하지만, 인코딩된 국부이진패턴 값은 서로 다르게 계산된다. 따라서, 빈투빈 거리 측정을 사용하는 경우, 이러한 유사한 패턴이라도 매칭 절차에서는 낮은 스코어를 얻게 된다. Referring to Figures 5 (a) and 5 (b), the diagonal edge structure is similar in spite of the illumination variation according to the illumination change in the local binary pattern. In this case, the local binary pattern values are similar to each other, but the encoded local binary pattern values are calculated differently. Thus, when using the binovision distance measure, even these similar patterns will result in a lower score in the matching procedure.

예를 들어, 도 5의 (a)와 도 5의 (b)로부터 국부이진패턴 히스토그램을 생성하면, 도 5의 (c)에 도시된 바와 같이 2개의 히스토그램 분포는 서로 유사할 수 있다. 그러나, 이러한 2개의 히스토그램에 히스토그램 인터섹션을 적용하면, 유사한 히스토그램 분포에도 불구하고 유사도 스코어는 낮게 계산될 수 있다. 즉, 조명 변화가 작은 국부 패턴의 변화를 유발하는 반면, 빈투빈 거리 측정은 낮은 유사도 스코어를 생성하게 된다.For example, when the local binary pattern histogram is generated from FIGS. 5A and 5B, the two histogram distributions may be similar to each other, as shown in FIG. 5C. However, applying the histogram intersection to these two histograms, the similarity score can be calculated to be low despite a similar histogram distribution. That is, while illumination changes cause a change in small local patterns, empty distance measurements produce a low similarity score.

따라서, 종래의 국부이진패턴 개념을 이용하여 영상을 인코딩할 경우, 국부이진패턴 값이 1차원에서 스칼라 값으로 인코딩되고, 이에 따라 유사한 패턴임에도 불구하고 국부이진패턴 값에 큰 차이를 발생시킬 수 있게 된다. Therefore, when encoding an image using the conventional local binary pattern concept, local binary pattern values are encoded in a one-dimensional scalar value, so that even though they are similar patterns, a large difference in local binary pattern values do.

이에 따라 본 발명은 이러한 문제를 완화하기 위하여, 3차원 상에 국부이진패턴 값을 인코딩하는 방안을 제시한다. 이러한 방안은 유사한 구조에 대해 유사한 국부이진패턴 값을 할당할 수 있게 한다. Accordingly, in order to alleviate this problem, the present invention proposes a method of encoding a local binary pattern value on three dimensions. This approach makes it possible to assign similar local binary pattern values for similar structures.

도 6a 내지 6c는 종래의 국부이진패턴과 본 발명의 국부이진패턴 간의 관계를 설명하기 위한 도면이다. 도 6a 내지 6c에서는 3X3 국부이진패턴에 대해 8각형 기둥의 3차원 좌표를 예시하고 있으나, 이에 한정되는 것은 아니며, N X N (N은 2 이상의 정수) 패턴에 대해 다각형 또는 원형 기둥에 적용할 수도 있다.6A to 6C are diagrams for explaining a relationship between a conventional local binary pattern and a local binary pattern of the present invention. 6A to 6C illustrate three-dimensional coordinates of an octagonal column with respect to a 3X3 localized binary pattern, but the present invention is not limited thereto, and the present invention can be applied to a polygonal or circular column with N X N (where N is an integer of 2 or more).

우선, 도 6(a)는 종래의 국부이진패턴의 1차원 인코딩 방법을 설명하기 위한 도면이다. 각 이진 패턴에 대해 0부터 255까지 스칼라 값을 갖는다.6 (a) is a diagram for explaining a conventional one-dimensional encoding method of a local binary pattern. It has a scalar value from 0 to 255 for each binary pattern.

도 6(b)는 본 명세서에서 개시하는 국부이진패턴 배열을 도시한 것이다. 도시된 각 국부이진패턴은 유니폼 패턴이다. 도시된 바와 같이, 3 X 3 블록에서, 총 58개의 패턴이 배열될 수 있다. 도 6(b)에 속하는 유니폼 패턴은, 최대 2번의 공간적 천이를 갖는 국부 이진 패턴을 의미한다. 이에 대한 공지 기술에 의한 예시는, Ojala et al, "Multiresolution Gray-Scale and Rotation Invariant Texture Classfication with local Binary Patterns"를 참조 할 수 있다. 6 (b) illustrates the local binary pattern arrangement disclosed herein. Each local binary pattern shown is a uniform pattern. As shown, in the 3 X 3 block, a total of 58 patterns can be arranged. The uniform pattern belonging to Fig. 6 (b) means a localized binary pattern having a maximum of two spatial transitions. An example of this technique can be found in Ojala et al, "Multiresolution Gray-Scale and Rotational Invariant Texture Classification with Local Binary Patterns ".

여기에서, 유니폼 패턴은 최대 2개의 공간적 천이(spatial transitions)를 갖는 국부이진패턴으로서 정의되는데, 예를 들어, 얼굴 영상의 경우 얼굴에서 대부분의 화소들(대략 90% 이상의 화소들)은 유니폼한 패턴으로 분류될 수 있다. 도 6(a)에서 첫번째 패턴(0)은 공간적 천이가 없고, 두번째 패턴(1)은 2번의 공간적 천이가 있으며, 여섯번째 패턴(5)는 4번의 공간적 천이가 있다. 도 6(b)는 도 6(a)의 0~255의 패턴 중에 0->1 또는 1->0으로의 전환이 2회 이하로 발생한 패턴을 유니폼 패턴이라 한다. Here, the uniform pattern is defined as a local binary pattern with a maximum of two spatial transitions. For example, in a face image, most of the pixels (about 90% or more of the pixels) . ≪ / RTI > In FIG. 6 (a), the first pattern (0) has no spatial transition, the second pattern (1) has two spatial transitions, and the sixth pattern (5) has four spatial transitions. 6 (b) is a pattern in which the switching from 0 to> 1 or 1 to> 0 in the patterns 0 to 255 in FIG. 6 (a) occurs twice or less.

공간적 천이와 관련하여 보다 구체적으로, 다음의 예를 들어 설명한다. 아래 패턴은 종래의 국부이진패턴의 예를 나타낸 것이다.More specifically, the following example will be described in connection with the spatial transition. The pattern below shows an example of a conventional localized binary pattern.

0 (시작점) 0 00 (starting point) 0 0

0 10 1

0 0 00 0 0

이 때 좌상점에서 시작하여 다시 원위치로 돌아오는 경우 0->1 전환이 1회, 1->0 전환이 1회 발생하여 총 2회의 전환이 발생한다. 따라서 이는 유니폼 패턴에 해당한다. 다음 경우를 고려하자.In this case, when starting from the upper left point and returning to the original position again, 0-> 1 conversion occurs once and 1 -> 0 conversion occurs once, resulting in a total of 2 conversions. So this corresponds to the uniform pattern. Consider the following cases.

0 (시작점) 0 00 (starting point) 0 0

1 11 1

1 0 01 0 0

이 경우 0->1 전환이 2회, 1->0 전환이 2회 발생하여 총 4회의 전환이 발생하므로 이는 유니폼 패턴이 아니다. 총 256개의 패턴 중, 유내폼 패턴은 모두 58개만 존재한다. 도 6(b)의 58개 유니폼 패턴에서 모든 0인 경우와 1인 경우는 전환이 발생하기 않고, 나머지 56 패턴의 경우, 총 2회의 전환이 발생한다. In this case, 0-> 1 conversion occurs twice and 1-to-0 conversion occurs twice, resulting in a total of 4 conversions, which is not a uniform pattern. Of the total 256 patterns, there are only 58 in-form patterns. In the case of all 0's and 1's in the 58 uniform patterns shown in FIG. 6 (b), no conversion occurs, and in the remaining 56 patterns, a total of two conversions occur.

도 6a에 속하는 종래의 국부이진패턴이, 도 6b에 속하지 않는 경우, 즉 해당 국부이진패턴이 유니폼 패턴이 아닌 경우에, 영상 인식을 위한 이후의 패턴간의 비교 과정에서 해당하는 화소는 제외되도록 정의될 수 있다. 또는 영상의 형태적 유사 정도 또는 패턴의 형태적 유사 정도 정도에 따라 도 6b에 도시된 유니폼 패턴 중 어느 하나의 패턴으로 분류할 수 있다. When the conventional local binary pattern belonging to FIG. 6A does not belong to FIG. 6B, that is, when the corresponding local binary pattern is not a uniform pattern, the corresponding pixel is defined to be excluded in a comparison process between subsequent patterns for image recognition . Or the uniformity degree of the image, or the uniformity degree of the pattern, or a uniformity pattern shown in FIG. 6B.

도 6c는 도 6b에서 첫번째 열에 포함된 8개의 패턴들이 서로 일정한 거리가 되도록 8각형의 구조로 배열시킨 것이다. 도 6c를 참조하면, 국부이진패턴은 8각형의 꼭지점에 원형으로 배치되고, 인접한 패턴들 사이의 거리는 동일하도록 배치할 수 있다. 도 6c에서 각 패턴은 중심으로부터 동일한 거리(k=1)에 배치되어 있다. 이에 따른 각 패턴의 평면 좌표는 도 8에 도시되어 있다.6C is an octagonal structure in which the eight patterns included in the first column in FIG. 6B are arranged at a constant distance from each other. Referring to FIG. 6C, the local binary patterns are arranged in a circular shape at the vertexes of the octagonal shape, and the distances between the adjacent patterns can be arranged to be the same. In Fig. 6C, each pattern is arranged at the same distance (k = 1) from the center. The plane coordinates of each pattern are shown in Fig.

도 7a, 7b는 본 발명의 특징 벡터, 즉 국부이진패턴을 3차원 상에 배치시킨 3차원 구조를 설명하기 위한 도면이다. FIGS. 7A and 7B are diagrams for explaining a three-dimensional structure in which feature vectors of the present invention, that is, local binary patterns are arranged on three dimensions.

도 7a는 인접한 2 개의 평면좌표에 배치된 국부이진패턴을 도시한 것이다. 이는 도 6b에서 제1열 및 제2열의 국부이진패턴과 동일하다. 제1열과 제2열은 3차원 좌표의 높이 좌표 상에 h 만큼의 거리차이를 갖는다. FIG. 7A shows a local binary pattern arranged in two adjacent plane coordinates. This is the same as the local binary pattern of the first and second columns in Fig. 6B. The first and second columns have a distance difference of h on the height coordinates of the three-dimensional coordinates.

도 7b는 도 6b에 배열된 국부이진패턴을 8각형 기둥의 3차원 좌표 상에 모두 배열한 것을 도시한 것이다. 평면좌표 상에 배치된 국부이진패턴은 높이 좌표에 대해 동일한 높이(h)를 가질 수 있다. 각각의 국부이진패턴의 좌표는 8각형 기둥의 옆면에 배치되어 있다. FIG. 7B shows that the local binary patterns arranged in FIG. 6B are all arranged on the three-dimensional coordinates of the octagonal columns. The local binary pattern placed on the plane coordinate may have the same height (h) for the height coordinate. The coordinates of each local binary pattern are arranged on the side of the octagonal column.

도 8은 도 7b의 3차원 구조에서 좌표값을 특정하기 위한 룩업테이블을 나타낸 것이다. 도 8을 참조하면, x-y는 평면 좌표를 의미하고, z는 높이 좌표를 의미한다.FIG. 8 shows a lookup table for specifying a coordinate value in the three-dimensional structure of FIG. 7B. Referring to FIG. 8, x-y denotes plane coordinates and z denotes height coordinates.

이러한 국부이진패턴의 3차원 배열에 의해 유사한 구조의 국부이진패턴은 서로 근접한 위치에 배열되고, 입력영상과 미리 마련된 트레이닝 영상을 비교할 때에 인코딩된 국부이진패턴들간에 거리를 계산함으로써, 대비되는 영상이 서로 유사한 지 여부를 판단할 수 있다. 거리 계산의 방법으로는 유클리디안(Euclidean) 거리계산 등의 방법을 사용될 수 있다.The local binary patterns of the similar structure are arranged at positions close to each other by the three-dimensional arrangement of the local binary patterns, and when the input image is compared with the preliminarily prepared training image, the distance between the encoded local binary patterns is calculated, It is possible to judge whether or not they are similar to each other. Euclidean distance calculation can be used as the distance calculation method.

상술된 3차원의 차원을 갖는 특징 벡터는 입력 영상의 모든 화소별로 계산될 수 있지만, 바람직하게는 유니폼 패턴을 갖는 화소에 대하여 계산되는 것이 바람직하다. 또한, 이후에 수행되는 영상 인식을 고려할 때, 영상 인식에 사용되는 특정 영역에 해당하는 화소들에 대하여 3차원의 특징 벡터를 생성하는 것이 바람직하다. 예를들어, 영상에 대한 전처리(스케일링, 정규화 등) 후 영상 인식에서 중요한 영역, 예를 들어 얼굴 인식의 경우, 턱선, 눈, 코, 입과 관련된 영역에 포함된 특징점에 대하여만 수행되도록 구현될 수 있다.The feature vector having the three-dimensional dimension described above can be calculated for every pixel of the input image, but is preferably calculated for a pixel having a uniform pattern. In consideration of image recognition performed later, it is preferable to generate a three-dimensional feature vector for pixels corresponding to a specific region used for image recognition. For example, it is implemented to be performed only on feature points included in an area important for image recognition after preprocessing (scaling, normalization, etc.) on the image, for example, face recognition, jaw line, eye, nose, and mouth .

도 9는 본 발명의 일 실시예에 따른 특징 벡터를 이용한 영상 인식 방법을 나타내는 흐름도이다. 본 실시예의 영상 인식 방법은, 영상인식장치(400)에서 시계열적으로 수행되는 하기 단계들을 포함한다. 9 is a flowchart illustrating an image recognition method using a feature vector according to an embodiment of the present invention. The image recognition method of this embodiment includes the following steps performed in the image recognition apparatus 400 in a time series manner.

우선, S301단계에서, 입력부(401)는 영상 인식을 위한 목적 영상을 입력 받는다.First, in step S301, the input unit 401 receives a target image for image recognition.

S302단계에서, 특징벡터 생성부(402)는 어떤 화소의 화소값과, 상기 화소에 인접한 인접 화소들의 화소값들간의 대소 비교에 따라 특정되는 국부이진패턴들을 3차원상에 배열시킨 3차원 구조에서 선택되는 특징 벡터를 각각의 화소별로 생성한다. In step S302, the feature vector generation unit 402 generates a feature vector by using the three-dimensional structure in which the local binary patterns specified according to the magnitude comparison between the pixel value of a certain pixel and the pixel values of adjacent pixels adjacent to the pixel are arranged in three dimensions A feature vector to be selected is generated for each pixel.

S303단계에서, 특징벡터 비교부(403)는 S302단계에서 생성된 특징벡터들과, 미리 마련된 저장 영상, 또는 훈련 영상으로부터 생성된 특징벡터들을 비교한다.In step S303, the feature vector comparison unit 403 compares the feature vectors generated in step S302 with previously prepared stored images or feature vectors generated from the training images.

도 9에서 설명하는 3차원 특징 벡터를 이용한 영상인식 방법은, 도 1에 대한 설명과 상당부분 중복되므로, 공통된 설명은 생략한다.Since the image recognition method using the three-dimensional feature vector described in FIG. 9 is substantially the same as the description of FIG. 1, a common description will be omitted.

도 10은 본 발명의 일 실시예에 따른 특징 벡터를 이용한 영상 인식 장치를 나타내는 블록도이다. 10 is a block diagram illustrating an image recognition apparatus using a feature vector according to an embodiment of the present invention.

입력부(401)는 인식하고자 하는 영상을 입력 받는다. The input unit 401 receives an image to be recognized.

특징 벡터 생성부(402)는 입력된 영상 중 적어도 일부의 영역에 포함된 화소 각각에 대하여, 그 화소값과, 상기 화소에 인접한 인접 화소들의 화소값들간의 대소 비교에 따라 특정되는 국부이진패턴들을 3차원상에 배열시킨 3차원 구조에서 선택되는 특징 벡터를 각각의 화소별로 생성한다. 특징벡터 생성부(402)는 자신의 화소값과, 인접 화소의 화소값의 대소를 비교하는 비교부(미도시)와, 상기 비교결과를 이용하여 자신의 화소에 따른 특징 벡터를 생성하는 생성부(미도시)를 더 포함할 수 있다. 도 10에 도시되지는 않았지만, 특징 벡터 생성부(402)와 입력부(401) 사이에 앞서 설명한 전처리 동작을 수행하는 전처리부를 더욱 포함시킬 수 있다. The feature vector generating unit 402 generates a feature vector for each of the pixels included in at least a part of the input image by using the pixel value and the local binary patterns specified by the magnitude comparison between the pixel values of the adjacent pixels adjacent to the pixel A feature vector selected from three-dimensional structures arranged on three dimensions is generated for each pixel. The feature vector generating unit 402 includes a comparator (not shown) for comparing the pixel value of its own with the pixel value of the adjacent pixel, and a generating unit (Not shown). Although not shown in FIG. 10, a pre-processing unit may be further included between the feature vector generating unit 402 and the input unit 401 to perform the pre-processing operation described above.

특징벡터 비교부(403)는 특징벡터 생성부(402)가 생성한 입력 영상에 대한 특징벡터와, 이미 저장된 저장 영상, 또는 트레이닝 영상의 특징벡터를 비교한다. 특징벡터 비교부(403)는 비교 결과에 따라, 특징벡터들 간의 유사도가 미리 정해진 기준을 만족할 경우 대비되는 영상들이 서로 유사한 것으로 결정할 수 있다.The feature vector comparison unit 403 compares the feature vector of the input image generated by the feature vector generation unit 402 with the feature vector of the already stored image or the training image. The feature vector comparing unit 403 can determine that the images to be compared are similar if the similarity between the feature vectors satisfies a predetermined criterion, according to the comparison result.

저장부(404)는 저장 영상 또는 트레이닝 영상들로부터 미리 추출된 특징벡터들을 저장한다.The storage unit 404 stores feature vectors previously extracted from the stored images or training images.

예를 들어, 본 실시예의 영상 인식 장치가 출입 통제를 위한 얼굴 인식 시스템인 경우, 저장부는 출입이 허가된 사람들의 얼굴 영상, 그리고 그 얼굴 영상들로부터 본 발명의 정의에 따라 미리 추출된 3차원 특징벡터에 대한 정보를 저장할 수 있다. For example, when the image recognition apparatus of the present embodiment is a face recognition system for access control, the storage unit stores face images of people who are allowed to enter and leave, and three-dimensional features extracted in advance according to the definition of the present invention from the face images Information about the vector can be stored.

특징벡터 비교부(403)는 대비되는 영상들에 포함된 모든 화소들에 따른 특징벡터들과, 저장된 영상들에 포함된 모든 화소들에 따른 특징벡터를 비교할 필요는 없다. 바람직하게, 특징벡터 비교부(403)는 미리 결정된 기준에 따른 선별된 특징점들, 또는 특정 영역에 포함된 화소들이 갖는 특징벡터들만을 비교할 수 있다. 입력 영상과, 기 저장된 저장영상 또는 트레이닝 영상들간의 비교를 위해서는, 비교 대상이 되는 화소가 각각 특정되어야 하는데, 이는 영상 특징점 추출을 위한 기존의 다양한 방법을 통하여 수행될 수 있다. The feature vector comparing unit 403 does not need to compare the feature vectors according to all the pixels included in the contrast images with the feature vectors according to all the pixels included in the stored images. Preferably, the feature vector comparing unit 403 can compare only the feature points of the selected feature points according to a predetermined reference, or the feature vectors of the pixels included in the specific region. In order to compare an input image with a previously stored image or a training image, each pixel to be compared must be specified. This can be performed through various conventional methods for extracting image feature points.

본 실시예에서는 유니폼 패턴만이 3차원 구조에서 특정되는 벡터인 3차원 특징 벡터로 정의되므로, 유니폼 패턴이 아닌 패턴에 대하여는 비교를 수행하지 않도록 구현될 수 있다. 이를 통해 프로세싱 속도를 개선할 수 있고, 노이즈에 강인한 효과를 가질 수 있다. 대비되는 영상들의 스캐일이 동일하지 않을 경우, 특징벡터들을 비교하기 위해서는 사이즈가 작은 영상에 대한 영상 보간을 통해 영상의 사이즈를 저장 영상의 사이즈와 일치 시키는 방법도 가능하지만, 바람직하게는 저장 영상, 트레이닝 영상의 특징 벡터를 몇개의 스캐일 기준 별로 미리 마련한 후, 스캐일을 동일하게 한 후 특징벡터들을 비교하도록 구현될 수 있다.In this embodiment, since only the uniform pattern is defined as a three-dimensional feature vector, which is a vector specified in the three-dimensional structure, it can be implemented not to perform comparison with respect to a pattern that is not a uniform pattern. This can improve the processing speed and have a strong noise effect. If the scales of the contrast images are not the same, a method of matching the size of the image with the size of the stored image by interpolating the image of a small size image may be used in order to compare the feature vectors. Preferably, The characteristic vectors of the image may be prepared in advance for several scale criteria, and the feature vectors may be compared after comparing the scales.

이하에서는, 수학적 정의를 통해 본 실시예의 특징벡터를 정의하고, 특징벡터들을 비교하는 개념을 설명한다.Hereinafter, the concept of defining the feature vector of the present embodiment and comparing feature vectors will be described through a mathematical definition.

예를 들어, 전술한 실시예에 따라 X 위치의 국부이진패턴 값은 [수학식 3]과 같이 3차원 공간 상에 3차원상의 특징 벡터(OPR: Octagonal Prism Representation)로 표현될 수 있다.For example, according to the above-described embodiment, the local binary pattern value at the X position can be expressed by a three-dimensional feature vector (OPR: Octagonal Prism Representation) on a three-dimensional space as shown in Equation (3).

[수학식 3]&Quot; (3) "

Figure 112014019095991-pat00003
Figure 112014019095991-pat00003

여기서, l(X) 는 X위치에서 국부이진패턴 값을 의미하고,

Figure 112014103049916-pat00004
,
Figure 112014103049916-pat00005
,
Figure 112014103049916-pat00006
은 국부이진패턴 값으로부터 생성된 3차원 벡터를 생성하는 함수를 의미한다. 이러한 함수는 도 8에 의해 정의될 수 있다. h는 1 또는 임의의 값으로 정의할 수 있다.Here, l (X) means a local binary pattern value at the X position,
Figure 112014103049916-pat00004
,
Figure 112014103049916-pat00005
,
Figure 112014103049916-pat00006
Means a function for generating a three-dimensional vector generated from a local binary pattern value. Such a function can be defined by Fig. h can be defined as 1 or any value.

임의의 X 위치에서 테스트 영상의 픽셀(

Figure 112014019095991-pat00007
)과 레퍼런스 영상의 픽셀(
Figure 112014019095991-pat00008
) 간의 OPR 값의 유사도는 [수학식 4]와 같이 유클리디안 거리로 계산될 수 있다.The pixel of the test image at an arbitrary X position
Figure 112014019095991-pat00007
) And the pixel of the reference image
Figure 112014019095991-pat00008
) Can be calculated as an Euclidean distance as shown in Equation (4).

[수학식 4]&Quot; (4) "

Figure 112014019095991-pat00009
Figure 112014019095991-pat00009

국부이진패턴은 8각 프리즘(기둥)에 배치되었기 때문에 유클리디안 거리는 원형 거리 측정과 동등할 수 있다. 레퍼런스 영상과 테스트 영상 사이의 OPR 유사도(SOPR: similarity of the octagonal prism representation)는 [수학식 5]에 의해 계산될 수 있다. Since the localized binary pattern is placed on an octagonal prism (column), the Euclidean distance can be equivalent to the circular distance measurement. The similarity of the octagonal prism representation (SOPR) between the reference image and the test image can be calculated by Equation (5).

[수학식 5]&Quot; (5) "

Figure 112014019095991-pat00010

Figure 112014019095991-pat00010

여기서, N은 레퍼런스 영상과 테스트 영상에서 유니폼 패턴인 픽셀의 개수이고, S는 유니폼 국부이진패턴 세트를 의미하며, B는 비교 영역을 의미한다.Here, N is the number of pixels that are uniform patterns in the reference image and the test image, S is the uniform local pattern set, and B is the comparison area.

본 명세서에 개시되는 발명이 얼굴 인식에 적용되는 경우, 턱과 볼에 비해 눈과 입은 사람의 얼굴을 구별하는 데에 있어 가장 중요한 특징부분이다. 따라서, 이러한 눈과 입의 특징을 강조하기 위해 영상의 해당 영역에 가중치를 부여할 수 있다.When the invention disclosed in this specification is applied to face recognition, it is the most important feature part in distinguishing the eyes from the face of a person compared to the chin and the ball. Therefore, weights can be given to the corresponding regions of the image to emphasize these eye and mouth features.

도 11은 얼굴 영상에서 영역에 따라 가중치를 부여하는 실시예를 도시한 것이다. 11 shows an embodiment in which weights are given according to regions in a face image.

도 11을 참조하면, 눈과 입은 높은 가중치를 가지며, 턱과 볼은 낮은 가중치를 갖는다. SOPR에 이러한 가중치를 부여하면, [수학식 6]이 된다.Referring to Fig. 11, the eyes and mouth have high weights, and the jaws and balls have low weights. When this weight is given to the SOPR, the following equation (6) is obtained.

[수학식 6]&Quot; (6) "

Figure 112014019095991-pat00011
Figure 112014019095991-pat00011

여기서,

Figure 112014019095991-pat00012
는 위치 X에 대한 가중치를 의미한다. here,
Figure 112014019095991-pat00012
Is a weight for position X. [

얼굴 인식의 경우, 인식 결과는 SOPR 값이 최소가 되는 사람으로 나타난다.In the case of face recognition, the recognition result appears as the person whose SOPR value is minimum.

전술한 특징 벡터 생성 방법, 그리고 영상 인식 방법은 컴퓨터로 읽을 수 있는 기록 매체로 구성될 수 있다. The feature vector generation method and the image recognition method described above can be configured as a computer-readable recording medium.

컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 매체를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는, RAM, ROM, CD-ROM, 자기 테이프, 광 데이터 저장장치, 플로피 디스크 등이 있으며, 인터넷을 통한 전송, 캐리어 웨이브 형태로 구현될 수도 있다.A computer-readable recording medium includes all kinds of recording media in which data that can be read by a computer system is stored. Examples of the computer-readable recording medium include a RAM, a ROM, a CD-ROM, a magnetic tape, an optical data storage device, a floppy disk, and the like.

또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 기록 방법을 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의하여 용이하게 추론될 수 있다.In addition, the computer-readable recording medium may be distributed over network-connected computer systems so that computer readable codes can be stored and executed in a distributed manner. And, functional programs, codes, and code segments for implementing the recording method can be easily deduced by programmers in the technical field to which the present invention belongs.

이상에서 실시 예를 중심으로 설명하였으나 이는 단지 예시일 뿐 발명을 한정하는 것이 아니며, 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 예를 들어, 실시 예에 구체적으로 나타난 각 구성 요소는 변형하여 실시할 수 있는 것이다. 그리고 이러한 변형과 응용에 관계된 차이점들은 첨부된 특허 청구 범위에서 규정하는 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, but, on the contrary, is intended to cover various modifications and equivalent arrangements included within the spirit and scope of the appended claims. It can be understood that the modification and application of the present invention are possible. For example, each component specifically shown in the embodiments can be modified and implemented. It is to be understood that the present invention may be embodied in many other specific forms without departing from the spirit or essential characteristics thereof.

201: 입력부
202: 특징벡터 생성부
200: 특징벡터 생성장치
201: input unit
202: Feature vector generating unit
200: Feature vector generation device

Claims (20)

영상을 입력받는 단계; 및
상기 입력된 영상 중 적어도 일부의 영역에 포함된 목적 화소의 화소값과 상기 목적 화소와 인접한 인접 화소들의 화소값들의 크기를 비교하고,
상기 목적 화소에 따른 임의의 화소의 화소값과 상기 임의의 화소와 인접한 인접 화소들의 화소값들의 크기 비교를 통해 정의되는 국부이진패턴(Local Binary Pattern)들 중 적어도 일부를 3차원상에 대응시켜 미리 정의된 3차원 구조에서 선택되는 3차원의 특징 벡터를 생성하는 단계를 포함하는 것을 특징으로 하는 특징 벡터 생성 방법.
Receiving an image; And
Comparing a pixel value of an object pixel included in at least a part of the input image with a size of pixel values of adjacent pixels adjacent to the object pixel,
At least some of the local binary patterns defined through comparison of pixel values of an arbitrary pixel according to the target pixel and pixel values of neighboring pixels adjacent to the arbitrary pixel, And generating a three-dimensional feature vector selected from a defined three-dimensional structure.
삭제delete 제1 항에 있어서,
상기 국부이진패턴들은 N(여기서, N은 8 이상의 정수이다) 비트의 정보가 링의 형태로 표현된 패턴이고,
상기 3차원 구조는 상기 국부이진패턴들 간의 형태적 유사도에 따라 상기 3차원 구조상에서 위치시킨 구조인 것을 특징으로 하는 특징 벡터 생성 방법.
The method according to claim 1,
The local binary patterns are patterns in which information of N bits (where N is an integer of 8 or more) is expressed in the form of a ring,
Wherein the three-dimensional structure is located on the three-dimensional structure according to morphological similarity between the localized binary patterns.
제1 항에 있어서,
상기 국부이진패턴들 중 적어도 일부는,
상기 국부이진패턴들 중 공간적 천이 - 여기에서 공간적 천이는 0이 1로 바뀌거나, 1이 0으로 바뀌는 것을 의미한다 - 의 횟수가 2 이하인 것을 포함하는 것을 특징으로 하는 특징 벡터 생성 방법.
The method according to claim 1,
At least some of the localized binary patterns include
Wherein the spatial transition of the localized binary patterns includes a number of times that the spatial transition of the localized binary patterns changes from 0 to 1 or 1 to 0.
제3 항에 있어서,
상기 미리 정의된 3차원 구조는 상기 형태적 유사도가 높은 국부이진패턴들 간의 공간상 거리가 상기 형태적 유사도가 낮은 국부이진패턴들 간의 공간상 거리 보다 작도록 정의된 구조인 것을 특징으로 하는 특징 벡터 생성 방법.
The method of claim 3,
Wherein the predefined three-dimensional structure is a structure defined such that a spatial distance between local binary patterns with high morphological similarity is smaller than a spatial distance between local binary patterns with low morphological similarity. Generation method.
제3 항에 있어서,
상기 국부이진패턴들은 8 비트의 정보를 가지며 링 형태로 표현된 패턴들이고, 상기 미리 정의된 3차원 구조는 상기 링의 형태로 표현된 국부이진패턴들 간의 상기 형태적 유사도에 따라 상기 국부이진패턴들을 위치시킨 8각 기둥 형태의 구조로 정의되는 것을 특징으로 하는 특징 벡터 생성 방법.
The method of claim 3,
Wherein the localized binary patterns are 8-bit information and are represented in a ring form, and the predefined three-dimensional structure comprises a plurality of local binary patterns corresponding to the local similarity between the local binary patterns expressed in the form of the ring Wherein the shape of the feature vector is defined by an octagonal columnar structure.
제6 항에 있어서,
상기 형태적 유사도에 따라 상기 국부이진패턴들을 위치시킨 8각 기둥 형태의 구조는,
상기 링 형태로 표현된 패턴들 중, 0 또는 1의 갯수가 같은 패턴들은 상기 8각 기둥 형태의 구조의 밑면과 평행하도록 순차적으로 3차원 공간상에 위치시킨 구조인 것을 특징으로 하는 특징 벡터 생성 방법.
The method according to claim 6,
The octagonal column structure in which the localized binary patterns are located according to the morphological similarity,
Wherein the patterns having the same number of 0 or 1 out of the patterns expressed in the ring form are sequentially positioned in a three-dimensional space so as to be parallel to the bottom face of the octagonal columnar structure, .
제7 항에 있어서,
상기 8각 기둥 형태의 구조에서, 상기 0 또는 1의 갯수가 같은 패턴들은 시계 방향으로 또는 반시계 방향으로 배열된 것을 특징으로 하는 특징 벡터 생성 방법.
8. The method of claim 7,
Wherein the patterns having the same number of 0 or 1 are arranged clockwise or counterclockwise in the octagonal columnar structure.
영상을 입력받는 입력부; 및
상기 입력된 영상 중 적어도 일부의 영역에 포함된 목적 화소의 화소값과 상기 목적 화소와 인접한 인접 화소들의 화소값들의 크기를 비교하고,
상기 목적 화소에 따른 임의의 화소의 화소값과 상기 임의의 화소와 인접한 인접 화소들의 화소값들의 크기 비교를 통해 정의되는 국부이진패턴(Local Binary Pattern)들 중 적어도 일부를 3차원상에 대응시켜 미리 정의된 3차원 구조에서 선택되는 3차원의 특징 벡터를 생성하는 특징 벡터 생성부를 포함하는 것을 특징으로 하는 특징 벡터 생성 장치.
An input unit for inputting an image; And
Comparing a pixel value of an object pixel included in at least a part of the input image with a size of pixel values of adjacent pixels adjacent to the object pixel,
At least some of the local binary patterns defined through comparison of pixel values of an arbitrary pixel according to the target pixel and pixel values of neighboring pixels adjacent to the arbitrary pixel, And a feature vector generation unit for generating a feature vector of three dimensions selected from the defined three-dimensional structure.
삭제delete 제9 항에 있어서, 상기 특징 벡터 생성부는,
상기 입력된 영상에 포함된 적어도 일부의 영역에 포함된 화소 각각에 대하여, 상기 화소의 화소값과 상기 화소와 인접한 인접 화소들의 화소값들을 비교하는 비교부와; 상기 비교부의 비교 결과를 이용하여 상기 화소의 특징 벡터를 생성하는 생성부를 더 포함하며,
상기 생성부는 상기 3차원 구조에서 상기 화소의 3차원 특징 벡터를 결정하는 것을 특징으로 하는 특징 벡터 생성 장치.
The apparatus according to claim 9,
A comparison unit for comparing the pixel value of the pixel and the pixel values of adjacent pixels adjacent to the pixel with respect to each of pixels included in at least a part of the area included in the input image; And a generation unit that generates a feature vector of the pixel using the comparison result of the comparison unit,
Wherein the generation unit determines a three-dimensional feature vector of the pixel in the three-dimensional structure.
제9 항에 있어서,
상기 국부이진패턴들은 N (여기서, N은 8 이상의 정수이다) 비트의 정보가 링의 형태로 표현된 패턴들이고, 상기 3차원 구조는 상기 국부이진패턴들 간의 형태적 유사도에 따라 상기 패턴들을 위치시킨 구조이며, 상기 3차원 구조는 상기 형태적 유사도가 높은 패턴들 간의 공간상 거리는 상기 형태적 유사도가 낮은 패턴들 간의 공간상 거리 보다 작도록 정의된 구조인 것을 특징으로 하는 특징 벡터 생성 장치.
10. The method of claim 9,
Wherein the local binary patterns are patterns in which information of N bits (where N is an integer equal to or greater than 8) bits are expressed in the form of a ring, and the three-dimensional structure is a pattern in which the patterns are positioned according to the morphological similarity between the localized binary patterns Wherein the three-dimensional structure is a structure defined such that a spatial distance between patterns having high morphological similarity is smaller than a spatial distance between patterns having low morphological similarity.
제12 항에 있어서,
상기 국부이진패턴들은 8 비트의 정보가 링의 형태로 표현된 패턴들이고, 상기 3차원 구조는 상기 링의 형태로 표현된 패턴들 간의 상기 형태적 유사도에 따라 상기 패턴들을 위치시킨 8각 기둥 형태의 구조인 것을 특징으로 하는 특징 벡터 생성 장치.
13. The method of claim 12,
Wherein the local binary patterns are patterns in which 8-bit information is expressed in the form of a ring, and the 3-dimensional structure is an octagonal columnar shape in which the patterns are arranged according to the morphological similarity between patterns expressed in the form of the ring And a feature vector generating unit for generating the feature vector.
영상을 입력받는 단계;
상기 입력된 영상 중 적어도 일부의 영역에 포함된 목적 화소의 화소값과 상기 목적 화소와 인접한 인접 화소들의 화소값들의 크기를 비교하고, 상기 목적 화소에 따른 임의의 화소의 화소값과 상기 임의의 화소와 인접한 인접 화소들의 화소값들의 크기 비교를 통해 정의되는 국부이진패턴(Local Binary Pattern)들 중 적어도 일부를 3차원상에 대응시켜 미리 정의된 3차원 구조에서 선택되는 3차원의 특징 벡터를 생성하는 단계; 및
상기 생성된 특징 벡터들과 미리 마련된 훈련 영상으로부터 생성된 트레이닝 특징 벡터들을 비교하는 단계를 포함하는 영상 인식 방법.
Receiving an image;
Comparing a pixel value of an object pixel included in at least a part of the input image with a size of pixel values of adjacent pixels adjacent to the object pixel and comparing the pixel value of an arbitrary pixel with the target pixel, Dimensional feature vector corresponding to at least a part of the local binary patterns defined through comparison of pixel values of neighboring pixels adjacent to the neighboring pixels and a predefined three-dimensional structure step; And
And comparing the generated feature vectors with training feature vectors generated from previously prepared training images.
삭제delete 제14 항에 있어서,
상기 국부이진패턴(Local Binary Pattern)들 중 적어도 일부는,
상기 국부이진패턴들 중 공간적 천이 - 여기에서 공간적 천이는 0이 1로 바뀌거나, 1이 0으로 바뀌는 것을 의미한다 - 의 횟수가 2 이하인 것을 포함하는 것을 특징으로 하는 영상 인식 방법.
15. The method of claim 14,
At least some of the Local Binary Patterns may be < RTI ID = 0.0 >
Wherein the spatial transition of the localized binary patterns includes a number of times that the spatial transition is 0 or 1, and the number of times is less than or equal to 2.
제14 항에 있어서,
상기 생성된 특징 벡터들과 미리 마련된 훈련 영상으로부터 생성된 트레이닝 특징 벡터들을 비교하는 것은, 서로 대응되는 특징 벡터들 간의 3차원상 거리를 이용하여 비교하는 것을 특징으로 하는 영상 인식 방법.
15. The method of claim 14,
Wherein comparing the generated feature vectors with training feature vectors generated from a training image prepared in advance is performed using three-dimensional distances between feature vectors corresponding to each other.
영상을 입력받는 입력부;
상기 입력된 영상 중 적어도 일부의 영역에 포함된 목적 화소의 화소값과 상기 목적 화소와 인접한 인접 화소들의 화소값들의 크기를 비교하고,
상기 목적 화소에 따른 임의의 화소의 화소값과 상기 임의의 화소와 인접한 인접 화소들의 화소값들의 크기 비교를 통해 정의되는 국부이진패턴(Local Binary Pattern)들 중 적어도 일부를 3차원상에 대응시켜 미리 정의된 3차원 구조에서 선택되는 3차원의 특징 벡터를 생성하는 특징 벡터 생성부; 및
상기 생성된 특징 벡터들과 미리 마련된 훈련 영상으로부터 생성된 트레이닝 특징 벡터들을 비교하는 특징 벡터 비교부를 포함하는 영상 인식 장치.
An input unit for inputting an image;
Comparing a pixel value of an object pixel included in at least a part of the input image with a size of pixel values of adjacent pixels adjacent to the object pixel,
At least some of the local binary patterns defined through comparison of pixel values of an arbitrary pixel according to the target pixel and pixel values of neighboring pixels adjacent to the arbitrary pixel, A feature vector generation unit for generating a three-dimensional feature vector selected from a defined three-dimensional structure; And
And a feature vector comparing unit for comparing the generated feature vectors with training feature vectors generated from a training image prepared in advance.
삭제delete 제18 항에 있어서, 상기 특징 벡터 생성부는,
상기 입력된 영상 중 적어도 일부의 영역에 포함된 화소 각각에 대하여, 상기 화소의 화소값과 상기 화소와 인접한 인접 화소들의 화소값들을 비교하는 비교부와; 상기 비교부의 비교 결과를 이용하여 상기 화소의 특징 벡터를 생성하는 생성부를 더 포함하며,
상기 생성부는 상기 3차원 구조에서 상기 화소의 3차원 특징 벡터를 생성하는 것을 특징으로 하는 영상 인식 장치.
19. The apparatus according to claim 18,
A comparison unit for comparing the pixel value of the pixel with the pixel values of the adjacent pixels adjacent to the pixel, with respect to each of the pixels included in at least a part of the input image; And a generation unit that generates a feature vector of the pixel using the comparison result of the comparison unit,
Wherein the generation unit generates the three-dimensional feature vector of the pixel in the three-dimensional structure.
KR20140022802A 2014-02-26 2014-02-26 Method and apparatus for generating feature vector, and method and apparatus for Image Recognition using the same KR101479225B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20140022802A KR101479225B1 (en) 2014-02-26 2014-02-26 Method and apparatus for generating feature vector, and method and apparatus for Image Recognition using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20140022802A KR101479225B1 (en) 2014-02-26 2014-02-26 Method and apparatus for generating feature vector, and method and apparatus for Image Recognition using the same

Publications (1)

Publication Number Publication Date
KR101479225B1 true KR101479225B1 (en) 2015-01-05

Family

ID=52587891

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20140022802A KR101479225B1 (en) 2014-02-26 2014-02-26 Method and apparatus for generating feature vector, and method and apparatus for Image Recognition using the same

Country Status (1)

Country Link
KR (1) KR101479225B1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101756352B1 (en) * 2016-10-28 2017-07-10 주식회사 아이오로라 Method for estimating age of face in image using extended local binary pattern
WO2018194204A1 (en) * 2017-04-18 2018-10-25 한국과학기술원 Three-dimensional facial frontalization system and method
KR20200039149A (en) * 2018-10-05 2020-04-16 동의대학교 산학협력단 FACE RECOGNITION METHOD AND DEVICE USING INFRARED AND DEPTH IMAGE, and Non-Transitory COMPUTER READABLE RECORDING MEDIUM
CN111104945A (en) * 2019-12-17 2020-05-05 上海博泰悦臻电子设备制造有限公司 Object identification method and related product
CN113436289A (en) * 2021-08-04 2021-09-24 成都工业学院 Image coding and classifying method based on direction vector correlation coefficient
KR20220099673A (en) * 2021-01-07 2022-07-14 주식회사 엠엘브이 A Door Control System using Face Recognition based on Continual Learning

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120040924A (en) * 2010-10-20 2012-04-30 삼성전자주식회사 Image processing apparatus and method
KR20120048370A (en) * 2010-11-05 2012-05-15 삼성전자주식회사 Object pose recognition apparatus and method using the same

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120040924A (en) * 2010-10-20 2012-04-30 삼성전자주식회사 Image processing apparatus and method
KR20120048370A (en) * 2010-11-05 2012-05-15 삼성전자주식회사 Object pose recognition apparatus and method using the same

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101756352B1 (en) * 2016-10-28 2017-07-10 주식회사 아이오로라 Method for estimating age of face in image using extended local binary pattern
WO2018194204A1 (en) * 2017-04-18 2018-10-25 한국과학기술원 Three-dimensional facial frontalization system and method
KR20180116996A (en) * 2017-04-18 2018-10-26 한국과학기술원 3-dimensional face frontalization system and method
KR101963198B1 (en) 2017-04-18 2019-07-31 한국과학기술원 3-dimensional face frontalization system and method
KR20200039149A (en) * 2018-10-05 2020-04-16 동의대학교 산학협력단 FACE RECOGNITION METHOD AND DEVICE USING INFRARED AND DEPTH IMAGE, and Non-Transitory COMPUTER READABLE RECORDING MEDIUM
KR102174208B1 (en) 2018-10-05 2020-11-04 동의대학교 산학협력단 FACE RECOGNITION METHOD AND DEVICE USING INFRARED AND DEPTH IMAGE, and Non-Transitory COMPUTER READABLE RECORDING MEDIUM
CN111104945A (en) * 2019-12-17 2020-05-05 上海博泰悦臻电子设备制造有限公司 Object identification method and related product
KR20220099673A (en) * 2021-01-07 2022-07-14 주식회사 엠엘브이 A Door Control System using Face Recognition based on Continual Learning
KR102567183B1 (en) * 2021-01-07 2023-08-16 광주과학기술원 A Door Control System using Face Recognition based on Continual Learning
CN113436289A (en) * 2021-08-04 2021-09-24 成都工业学院 Image coding and classifying method based on direction vector correlation coefficient
CN113436289B (en) * 2021-08-04 2023-08-22 成都工业学院 Image coding and classifying method based on direction vector correlation coefficient

Similar Documents

Publication Publication Date Title
KR101479225B1 (en) Method and apparatus for generating feature vector, and method and apparatus for Image Recognition using the same
Davison et al. Objective micro-facial movement detection using facs-based regions and baseline evaluation
US7912253B2 (en) Object recognition method and apparatus therefor
JP5709410B2 (en) Pattern processing apparatus and method, and program
JP5861123B2 (en) Feature extraction device, feature extraction method, feature extraction program, and image processing device
Pflug et al. A comparative study on texture and surface descriptors for ear biometrics
US10216979B2 (en) Image processing apparatus, image processing method, and storage medium to detect parts of an object
US20120213422A1 (en) Face recognition in digital images
KR101314293B1 (en) Face recognition system robust to illumination change
CN103996052B (en) Three-dimensional face gender classification method based on three-dimensional point cloud
US20140147035A1 (en) Hand gesture recognition system
WO2013105513A1 (en) Feature extraction device, feature extraction method, and feature extraction program
WO2012124000A1 (en) Image recognition system, image recognition method, and nontemporary computer- readable medium in which program for image recognition is stored
WO2010043771A1 (en) Detecting and tracking objects in digital images
KR20120089527A (en) Method and system for iris recognition
JP2009211490A (en) Image recognition method and image recognition device
JP5768719B2 (en) Learning device, identification device, learning identification system, and learning identification device
KR101101142B1 (en) A system and method for identifying the iris of persons in unrestricted condition
JP2012150730A (en) Feature extraction device, feature extraction method, feature extraction program and image processing device
KR20150041428A (en) Method for object detection and apparatus thereof
US10115195B2 (en) Method and apparatus for processing block to be processed of urine sediment image
Mantecón et al. Enhanced gesture-based human-computer interaction through a Compressive Sensing reduction scheme of very large and efficient depth feature descriptors
Wang et al. LBP-based edge detection method for depth images with low resolutions
Boruah et al. Different face regions detection based facial expression recognition
US20150279039A1 (en) Object detecting apparatus and method

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171218

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee