KR101681233B1 - Method and apparatus for detecting face with low energy or low resolution - Google Patents

Method and apparatus for detecting face with low energy or low resolution Download PDF

Info

Publication number
KR101681233B1
KR101681233B1 KR1020140091821A KR20140091821A KR101681233B1 KR 101681233 B1 KR101681233 B1 KR 101681233B1 KR 1020140091821 A KR1020140091821 A KR 1020140091821A KR 20140091821 A KR20140091821 A KR 20140091821A KR 101681233 B1 KR101681233 B1 KR 101681233B1
Authority
KR
South Korea
Prior art keywords
window
face
value
region
feature
Prior art date
Application number
KR1020140091821A
Other languages
Korean (ko)
Other versions
KR20150136971A (en
Inventor
노용만
이승호
김형일
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Publication of KR20150136971A publication Critical patent/KR20150136971A/en
Application granted granted Critical
Publication of KR101681233B1 publication Critical patent/KR101681233B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Abstract

본 발명에 따르면, 저 에너지 및 저 해상도 얼굴 검출에 있어서, 입력 영상에 대해 얼굴 검출을 위한 윈도우 크기에 해당하는 해상도까지 영상을 줄이면서 윈도우를 슬라이딩하여 얼굴을 검출하며, 얼굴 검출에 있어서는 각 윈도우의 구조적 특성과 분산을 이용하여 사전 필터링을 수행하여 얼굴이 포함되지 않은 윈도우를 빠르게 제거하고, 사전 필터링을 통과한 윈도우에 대해서는 국부 블록 질감 특징과 특징 템플릿과 매칭하여 최종 관심 영역을 추출한 후 관심 영역에 대해서만 상대적으로 계산량이 큰 분류기를 사용하여 얼굴을 검출함으로써 저 에너지 또는 저 해상도를 가지는 얼굴 및 사람을 보다 효율적으로 검출할 수 있다.According to the present invention, in low-energy and low-resolution face detection, a face is detected by sliding a window while reducing an image to a resolution corresponding to a window size for face detection with respect to an input image, For the windows that have passed through the prefiltering, the final block of interest is extracted by matching with the local block texture feature and feature template. Then, It is possible to more efficiently detect face and person having low energy or low resolution by detecting faces using a classifier having a relatively large amount of calculation.

Description

저 에너지/해상도 가지는 얼굴 검출 방법 및 장치{METHOD AND APPARATUS FOR DETECTING FACE WITH LOW ENERGY OR LOW RESOLUTION}TECHNICAL FIELD [0001] The present invention relates to a method and apparatus for detecting a face having low energy / resolution,

본 발명은 얼굴 및 사람 검출에 관한 것으로, 특히 입력 영상에 대해 얼굴 검출을 위한 윈도우 크기에 해당하는 해상도까지 영상을 줄이면서 윈도우를 슬라이딩하여 얼굴을 검출하며, 얼굴 검출에 있어서는 각 윈도우의 구조적 특성과 분산을 이용하여 사전 필터링을 수행하여 얼굴이 포함되지 않은 윈도우를 빠르게 제거하고, 사전 필터링을 통과한 윈도우에 대해서는 국부 블록 질감 특징과 특징 템플릿과 매칭하여 최종 관심 영역을 추출한 후 관심 영역에 대해서만 상대적으로 계산량이 큰 분류기를 사용하여 얼굴을 검출함으로써 저 에너지 또는 저 해상도를 가지는 얼굴 및 사람을 보다 효율적으로 검출할 수 있도록 하는 저 에너지 및 해상도 얼굴 검출 방법 및 장치에 관한 것이다.
The present invention relates to face and person detection, and more particularly, to detecting a face by sliding a window while reducing an image to a resolution corresponding to a window size for an input image, The window that does not contain the face is removed quickly by using the variance. For the window that passed the pre-filtering, the final block of interest is extracted by matching the local block texture feature and the feature template, And more particularly, to a low energy and resolution face detection method and apparatus that can more efficiently detect faces and persons having low energy or low resolution by detecting faces using a classifier having a large calculation amount.

근래에 들어 공공장소 및 개인 보안의 필요성이 증가됨에 따라 감시카메라의 증가와 더불어 대용량의 감시비디오 분석이 요구되고 있다. 지능형 감시시스템의 일환으로 대용량의 감시비디오 분석 방법은 영상처리 및 컴퓨터 비전 분야에서 지속적으로 연구되어온 분야 중의 하나로 자동적인 사람 검출방법과 추적 등의 지능적인 기능을 요구하고 있다. In recent years, as the need for public places and personal security increases, a large amount of surveillance video analysis is required along with an increase in surveillance cameras. As a part of the intelligent surveillance system, the large-capacity surveillance video analysis method is one of the fields that have been continuously studied in the fields of image processing and computer vision, and requires intelligent functions such as automatic human detection and tracking.

또한, 최근에는 컴퓨터 비전 분야에서 물체검출과 추적에 대해 다양한 방법이 나와있음에도 불구하고 감시카메라가 설치되는 위치의 다변화에 의해 에너지 공급이 제한된 환경에서의 저 에너지 얼굴 및 사람 검출 장치가 요구되고 있다. 보통 얼굴검출은 계산 량이 많아 하드웨어로 구성 시 메모리와 로직 게이트 수가 많이 필요하다고 알려져 있는데, 기존에 가장 많이 쓰이는 얼굴 검출은 adaptive boosting (AdaBoost)와 cascade 분류기 방식으로서 분류기 훈련 시 리소스와 메모리, 그리고 계산 량이 많이 들게 된다. Recently, despite various methods for object detection and tracking in the field of computer vision, there is a demand for a low energy face and person detecting device in an environment where energy supply is restricted by diversification of locations where surveillance cameras are installed. Face detection is usually known to require a large number of memories and logic gates in hardware configuration. The most commonly used face detection is adaptive boosting (AdaBoost) and cascade classifier method. It uses resources, memory, I get a lot.

따라서, 저 에너지에 대한 요구와 감시카메라 환경에서 얼굴 및 사람 검출을 위해 작은 해상도의 얼굴을 검출하면서 적은 메모리와 로직 게이트 수를 갖는 얼굴검출 알고리즘 및 하드웨어가 요구된다.
Therefore, a face detection algorithm and hardware with a small memory and a number of logic gates are required while detecting a small resolution face for demanding low energy and for face and person detection in a surveillance camera environment.

(특허문헌)(Patent Literature)

대한민국 등록특허번호 10-0795160호 (등록일자 2008년 01월 09일)
Korean Registered Patent No. 10-0795160 (Registered Date Jan. 09, 2008)

따라서, 본 발명은 저 에너지 얼굴 및 사람 검출 방법과 효율적인 하드웨어 구성에 관한 것으로, 지능형 감시카메라에서 저 에너지 또는 저 해상도를 갖는 얼굴을 보다 효율적으로 검출할 수 있도록 하는 저 에너지 및 해상도 얼굴 검출 방법 및 장치를 제공하고자 한다.
Accordingly, the present invention relates to a low-energy face and person detection method and an efficient hardware configuration, and more particularly, to a low-energy and resolution face detection method and apparatus capable of more efficiently detecting a face having low energy or low resolution in an intelligent surveillance camera ≪ / RTI >

상술한 본 발명은 저 에너지 및 저 해상도 얼굴 검출 장치로서, 입력 영상에 대해 윈도우 슬라이딩 방식으로 사전 필터링을 수행하며, 각각의 윈도우 영역내에서 산출된 분산값을 기설정된 기준값과 비교한 결과를 참조하여 얼굴이 포함되지 않은 윈도우를 제거하는 사전 필터링부와, 상기 사전 필터링부에서 통과된 각각의 윈도우에 대해 국부블록 질감 특징값을 산출하고, 상기 국부블록 질감 특징값을 이용한 각 윈도우 영역의 히스토그램을 추출하여 각 윈도우에 대한 특징벡터값을 산출하는 특징 추출부와, 상기 특징 추출부에서 추출된 각 윈도우에 대한 특징벡터값과 기설정된 기준 특징벡터의 템플릿과의 차이를 비교하여 해당 윈도우가 얼굴 영역인지를 판단하는 특징 템플릿 매칭부와, 상기 특징 템플릿 매칭부로부터 상기 얼굴 영역으로 판단된 윈도우 중 상기 얼굴 영역이 오검출된 윈도우를 제거하여 최종적으로 상기 입력 영상에서 얼굴 영역을 검출하는 오검출 제거부를 포함한다.The present invention relates to a low-energy and low-resolution face detecting apparatus, which performs prefiltering on an input image in a window sliding manner and refers to a result obtained by comparing a variance value calculated in each window region with a preset reference value A prefilter for removing a window not including a face; a local block texture feature value calculation unit for calculating a local block texture feature value for each window passed by the prefilter unit, and extracting a histogram of each window region using the local block texture feature value And comparing the feature vector values of the respective windows extracted by the feature extraction unit with templates of a predetermined reference feature vector to determine whether the corresponding window is a face region A feature template matching unit for determining the face region from the feature template matching unit, And an erroneous detection removal unit for removing a window of the window from which the face region is erroneously detected and finally detecting a face region in the input image.

또한, 상기 입력 영상은, 상기 얼굴 검출이 가능한 상기 윈도우 크기에 해당하는 해상도로 단계적으로 다운 스케일링되어 상기 사전 필터링부로 입력되는 것을 특징으로 한다.In addition, the input image is down-scaled stepwise to a resolution corresponding to the window size capable of detecting the face, and is input to the pre-filtering unit.

또한, 상기 사전 필터링부는, 얼굴을 포함하는 윈도우에 대해 계산된 제1 분산값을 기준으로 각각의 윈도우에 대해 계산된 제2 분산값과 상기 제1 분산값을 비교하고, 상기 제2 분산값이 상기 제1 분산값보다 기설정된 임계값 이상으로 작거나, 큰 경우 해당 윈도우에 얼굴이 포함되지 않은 것으로 판단하여 제거하는 것을 특징으로 한다.The pre-filtering unit may compare the first variance value with the second variance value calculated for each window based on the first variance value calculated for the window including the face, And determines that the face is not included in the window if the first variance value is smaller than or greater than a preset threshold value.

또한, 상기 특징 추출부는, 상기 각 윈도우 영역에 대해 눈, 코, 입의 3개의 영역으로 나누어 각 영역에서 상기 국부블록 질감 특징값을 이용한 3개의 히스토그램을 추출하고, 상기 3개의 히스토그램을 연결하여 상기 윈도우에 대한 하나의 특징벡터값을 생성하는 것을 특징으로 한다.The feature extracting unit may extract three histograms using the local block texture feature value in each region by dividing the region into three regions of eyes, nose, and mouth for each window region, connecting the three histograms to each other, And generates one feature vector value for the window.

또한, 상기 특징 템플릿 매칭부는, 상기 윈도우에 대한 특징벡터값과 상기 템플릿 사이의 거리를 측정하여 측정된 거리가 기설정된 임계값보다 작은 경우 얼굴 영역으로 판단하며, 좌우 포즈 변화를 갖는 얼굴로부터 3가지의 템플릿을 구성하여 상기 3가지 템플릿에 대하여 상기 윈도우에 대한 특징벡터값과의 거리를 측정하는 것을 특징으로 한다.The feature template matching unit may measure a feature vector value of the window and a distance between the template and determine a face area if the measured distance is less than a preset threshold value. And a distance between the template and the feature vector value for the window is measured for the three templates.

또한, 본 발명은 저 에너지 및 저 해상도 얼굴 검출 방법으로서, 입력 영상에 대해 윈도우 슬라이딩 방식으로 사전 필터링을 수행하여 얼굴이 포함되지 않은 윈도우를 제거하는 단계와, 상기 사전 필터링에서 통과된 각각의 윈도우에 대해 특징벡터값을 산출하는 단계와, 상기 추출된 각 윈도우에 대한 특징벡터값과 기설정된 기준 특징벡터의 템플릿과의 차이를 비교하여 해당 윈도우가 얼굴 영역인지를 판단하는 단계와, 상기 얼굴 영역으로 판단된 윈도우 중 상기 얼굴 영역이 오검출된 윈도우를 제거하여 최종적으로 상기 입력 영상에서 얼굴 영역을 검출하는 단계를 포함한다.According to another aspect of the present invention, there is provided a low energy and low resolution face detection method comprising the steps of: prefiltering an input image in a window sliding manner to remove a window not including a face; Comparing a feature vector value of each extracted window with a template of a predetermined reference feature vector to determine whether the corresponding window is a face region; And removing a window of the determined window from which the face region is erroneously detected to finally detect a face region in the input image.

또한, 상기 입력 영상은, 상기 얼굴 검출이 가능한 상기 윈도우 크기에 해당하는 해상도로 단계적으로 다운 스케일링되는 것을 특징으로 한다.Also, the input image is downscaled stepwise to a resolution corresponding to the window size capable of detecting the face.

또한, 상기 윈도우를 제거하는 단계는, 얼굴을 포함하는 윈도우에 대해 계산된 제1 분산값을 기준값으로 저장하는 단계와, 상기 각각의 윈도우에 대해 분산을 수행하고, 상기 각각의 윈도우에 대해 계산된 제2 분산값과 상기 제1 분산값을 비교하는 단계와, 상기 제2 분산값이 상기 제1 분산값보다 기설정된 임계값 이상으로 작거나 큰거나 경우 해당 윈도우를 제거하는 단계를 포함하는 것을 특징으로 한다.Also, the step of removing the window may include storing a first variance value calculated for a window containing a face as a reference value, performing a variance for each window, Comparing the second variance value with the first variance value; and removing the window if the second variance value is smaller or larger than a predetermined threshold value that is greater than the first variance value .

또한, 상기 특징벡터값을 산출하는 단계는, 상기 각 윈도우 영역에 대해 눈, 코, 입의 3개의 영역으로 나누어 각 영역에서 상기 국부블록 질감 특징값을 산출하는 단계와, 상기 국부블록 질감 특징값을 이용하여 상기 3개의 영역에 대한 3개의 히스토그램을 추출하는 단계와, 상기 3개의 히스토그램을 연결하여 상기 윈도우에 대한 하나의 특징벡터값을 생성하는 단계를 포함하는 것을 특징으로 한다.The step of calculating the feature vector value may further include the steps of: calculating the local block texture feature value in each region by dividing the region into three regions of eyes, nose, and mouth for each window region; Extracting three histograms for the three regions by using the three histograms, and generating one feature vector value for the window by concatenating the three histograms.

또한, 상기 얼굴 영역인지를 판단하는 단계는, 좌우 포즈 변화를 갖는 얼굴로부터 3가지의 템플릿을 구성하는 단계와, 상기 각 윈도우에 대한 특징벡터값과 상기 3가지 템플릿과의 거리를 측정하는 단계와, 상기 측정된 거리를 얼굴 영역의 판단을 위해 설정된 임계값과 비교하여 해당 윈도우가 얼굴 영역인지를 판단하는 단계를 포함하는 것을 특징으로 한다.
The step of determining whether the face region is the face region includes the steps of: constructing three templates from a face having a pose change in the left and right directions; measuring a distance between the feature vector values of the respective windows and the three templates; Comparing the measured distance with a threshold value set for determining a face area, and determining whether the corresponding window is a face area.

본 발명에 따르면, 저 에너지 및 저 해상도 얼굴 검출에 있어서, 윈도우의 구조적 특성과 분산을 이용하여 사전 필터링을 수행하여 얼굴이 포함되지 않은 윈도우를 빠르게 제거하고, 사전 필터링을 통과한 윈도우에 대해서는 국부 블록 질감 특징과 특징 템플릿과 매칭하여 최종 관심 영역을 추출한 후 관심 영역에 대해서만 상대적으로 계산량이 큰 분류기를 사용하여 얼굴을 검출함으로써 저 에너지 또는 저 해상도를 가지는 얼굴 및 사람을 보다 효율적으로 검출할 수 있다.According to the present invention, in the low-energy and low-resolution face detection, prefiltering is performed using structural characteristics and dispersion of windows to quickly remove a window that does not include a face, After extracting the final region of interest by matching the texture feature and feature template, the face and the person having the low energy or the low resolution can be detected more efficiently by detecting the face using the classifier having a relatively large amount of calculation only for the region of interest.

또한, 얼굴 검출을 위해 국부블록 질감 특징(local block texture feature : LBTF)으로 구성된 다수개의 템플릿을 만들고, 템플릿은 특징백터 공간에서 형성하되 환경변화에 강하도록 여러개를 생성한다. 다시 말해 얼굴 템플릿은 조명과 어느 정도 범위 내의 포즈변화에 강인한 LBP(local binary pattern)와 블록 분할에 기반한 특징을 사용하고, 테스트 수행할 시 얼굴변화에 강인한 여러 개의 템플릿을 사용하여 비교함으로써 보다 정확한 얼굴 검출이 가능하다. In addition, for face detection, a plurality of templates composed of local block texture features (LBTF) are created, and templates are formed in characteristic vector space, but several are generated so as to be resistant to environmental changes. In other words, face template uses LBP (local binary pattern) which is robust against illumination and pose change within a certain range, and features based on block partitioning. By using several template robust against face change when testing, Detection is possible.

또한, 다양한 크기의 얼굴을 갖는 영상에서의 효율적인 얼굴 검출을 위하여 관심영역(region of interest : ROI)를 우선적으로 빠르게 검출하고, 관심영역 검출 이후에 검출된 몇 개의 관심영역을 가지고 분류기를 통과시켜 오검출 제거를 수행함으로써 계산량이 상대적으로 적은 국부블록 질감 특징 추출과 템플릿 매칭이 앞에서 이루어지기 때문에 전체 계산 량을 작게 할 수 있다. 이후 검출된 관심영역만을 대상으로 SVM(support vector machine) 등과 같은 분류기를 사용하여 얼굴 검출을 수행하여 저 에너지 얼굴 검출 장치에서 효율적인 에너지 관리가 가능하게 된다.
In order to efficiently detect faces in images having various sizes of faces, ROIs are quickly detected, and a plurality of ROIs detected after ROI detection are passed through a classifier By performing detection and removal, local block texture feature extraction and template matching, which have a relatively small amount of computation, are performed in advance, so that the total amount of calculation can be reduced. Then, face detection is performed using a classifier such as SVM (support vector machine) only for the detected region of interest, thereby enabling efficient energy management in a low energy face detection apparatus.

도 1은 본 발명의 실시예에 따른 저 에너지 및 저 해상도 얼굴 검출 장치의 블록 구성도,
도 2는 본 발명의 실시예에 따른 얼굴 영역에 대한 분산 및 평균 계산 개념도,
도 3은 본 발명의 실시예에 따른 저 에너지 및 저 해상도 얼굴 검출을 위한 동작 제어 흐름도,
도 4는 본 발명의 실시예에 따른 저 에너지 얼굴 검출장치의 하드웨어 논리 회로 구성도.
1 is a block diagram of a low energy and low resolution face detection apparatus according to an embodiment of the present invention;
FIG. 2 is a conceptual diagram of dispersion and average calculation for a face region according to an embodiment of the present invention;
3 is a flow chart of operation control for low energy and low resolution face detection according to an embodiment of the present invention;
4 is a block diagram of a hardware logic circuit of a low energy face detection apparatus according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 동작 원리를 상세히 설명한다. 하기에서 본 발명을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, the operation principle of the present invention will be described in detail with reference to the accompanying drawings. In the following description of the present invention, detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear. The following terms are defined in consideration of the functions of the present invention, and these may be changed according to the intention of the user, the operator, or the like. Therefore, the definition should be based on the contents throughout this specification.

도 1은 본 발명의 실시예에 따른 저 에너지 및 저 해상도 얼굴 검출장치의 상세 블록 구성을 도시한 것이다.FIG. 1 shows a detailed block configuration of a low-energy and low-resolution face detection apparatus according to an embodiment of the present invention.

위 도 1을 참조하면, 저 에너지 및 저 해상도 얼굴 검출장치(100)는 슬라이딩 윈도우 방식으로 입력 영상에 대해 입력 영상의 원래 해상도로부터 윈도우 사이즈에 해당하는 해상도까지 영상을 줄이면서 윈도우를 슬라이딩하여 얼굴 영역인지 아닌지를 구분하게 된다. 1, the low-energy and low-resolution face detection apparatus 100 slides a window in a sliding window manner while reducing an image from an original resolution of the input image to a resolution corresponding to a window size, Whether or not it is.

이러한, 저 에너지 얼굴 검출장치의 동작은 크게 관심영역(region of interest : ROI) 추출부(110)와 오검출(false positive detection) 제거부(120) 등으로 구성될 수 있다.The operation of the low energy face detection apparatus may be largely composed of a region of interest (ROI) extraction unit 110 and a false positive detection removal unit 120.

관심영역 추출부(110)는 사전 필터링(pre-filtering)부(102), 특징 추출부(feature extraction)(104), 그리고 특징 템플릿 매칭부(feature template matching)(106)를 포함하는데, 사전 필터링 단계에서는 각 윈도우의 구조적 특성과 분산을 이용하여 빠르게 비 관심영역을 제거할 수 있다. 또한, 사전 필터링 단계에서 통과된 윈도우에 대해서 얼굴을 표현하는데 유용한 질감(texture) 정보인 국부 블록 질감(local block texture) 특징을 추출하고, 이 특징과 미리 만들어진 3가지의 특징 템플릿과 거리를 측정하여 최종 관심영역 영역들이 추출되게 된다. 다음 오검출 동작에서는 최종 추출된 관심영역 영역에 대해서만 상대적으로 계산 량이 큰 분류기를 사용하여 효율적으로 얼굴 영역인지 아닌지를 최종 판단하고, 후보 영역들의 머징(merging)을 수행하여 얼굴 영역을 검출하게 된다. The region of interest extraction unit 110 includes a pre-filtering unit 102, a feature extraction unit 104, and a feature template matching unit 106, In the step, non-interest areas can be quickly removed using the structural properties and dispersion of each window. In addition, local block texture features, which are texture information useful for expressing facial expressions in the window passed in the prefiltering step, are extracted, and the features and distances between the features and the three feature templates previously created are measured The final region of interest regions are extracted. In the next erroneous detection operation, it is finally determined whether or not the face region is efficiently detected by using a relatively large amount of calculator for the extracted region of interest, and merging of the candidate regions is performed to detect the face region.

이하에서는, 위 도 1을 참조하여 본 발명의 실시예에 따른 저 에너지 및 저 해상도 얼굴 검출 장치의 각 구성요소에서의 보다 구체적인 동작을 상세히 설명하기로 한다.Hereinafter, more detailed operation of each component of the low-energy and low-resolution face detection apparatus according to the embodiment of the present invention will be described in detail with reference to FIG.

먼저, 사전 필터링부(102)는 입력 영상으로부터 얼굴 검출을 위한 윈도우 크기(window size)로 해상도가 줄여진 윈도우에 대해 각 윈도우의 구조적 특징과 분산을 이용하여 얼굴 영역 인지 여부를 빠르게 검사하고, 얼굴 영역이 아닌 윈도우를 제거시킨다. 이러한 사전 필터링 동작은 비교적 간단한 연산에 의해 얼굴 영역인지 아닌지를 걸러낼 수 있는 방법으로, 이것은 시스템 속도 향상에 크게 기여하는 부분이고 동시에 오검출을 낮출 수 있는 방법이다. First, the pre-filtering unit 102 quickly checks whether the face region is a face region using a structural feature and variance of each window for a window whose resolution is reduced from the input image to a window size for face detection, Removes a window that is not a region. Such a prefiltering operation is a method that can filter out whether or not a face region is obtained by a relatively simple operation. This is a part contributing to the improvement of the system speed, and at the same time, can reduce the false detection.

즉 사전 필터링부(102)는 윈도우 영역내의 분산(variance)과 사람 얼굴의 기하학적 성질과 관련된 연산을 수행한다. 예를 들어 얼굴을 포함하는 윈도우에 대해 계산된 제1 분산값을 기준으로 두고, 각각의 윈도우에 대해 계산된 제2 분산값과 상기 제1 분산값을 비교하고, 상기 제2 분산값이 상기 제1 분산값보다 기설정된 임계값 이상으로 작거나, 큰 경우 해당 윈도우에 얼굴이 포함되지 않은 것으로 판단하여 제거하는 등으로 얼굴이 포함되지 않은 윈도우를 빠르게 제거할 수 있다. 즉, 윈도우 영역 내의 분산을 구함으로써 분산이 작은 배경영역이나 배경이 매우 복잡하여 분산이 큰 영역을 제거하는데 도움이 될 수 있다. 또한, 일반적으로 사람의 얼굴은 눈 영역의 밝기가 그 아래 영역의 밝기에 비해 상대적으로 어두운 특성을 지니는데, 이 특성을 이용하여 도 3에서와 같이 흰 사각형 내부 픽셀 값의 평균에서 검은색 사각형 내부 픽셀 값의 평균을 뺀 값이 일정한 값보다 크지 않다면 얼굴이 아니라고 판단을 할 수 있다. That is, the pre-filtering unit 102 performs an operation related to the variance in the window region and the geometric properties of the human face. The first variance value is compared with the second variance value calculated for each window based on the first variance value calculated for the window including the face, 1 < / RTI > variance value is greater than or equal to a predetermined threshold value, it is determined that the face is not included in the corresponding window, and the window is removed. In other words, by obtaining the dispersion in the window area, a background area having a small dispersion or a background can be very complex, which can help to eliminate a large dispersion area. In addition, in general, the face of a person has a characteristic that the brightness of the eye region is relatively dark compared to the brightness of the region below it. Using this characteristic, the average of the pixel values inside the white square, as shown in FIG. 3, If the value obtained by subtracting the average of the pixel values is not larger than a predetermined value, it can be determined that the face is not the face.

특징 추출부(Feature Extraction)(104)는 사전 필터링부(102)에서 통과된 윈도우 영역에 대해서 얼굴 영역인지 아닌지를 평가하기 위해 얼굴 표현에 효과적인 질감 특징을 추출하여 분별한다. 이때, 대표적인 질감 특징으로는 LBP(local binary pattern)이 있는데, LBP는 조명에 강하고, 어느 정도의 범위 내에서는 포즈 변화에도 강인하다고 알려져 있다. 본 발명에서는 질감 뿐아니라 얼굴의 윤곽 및 형태정보를 효과적으로 활용하기 위해 국부 블록 질감 특징(local block texture feature : LBTF)를 사용한다. The feature extraction unit 104 extracts texture features that are effective for facial expression in order to evaluate whether or not the face region is the area of the window passed by the pre-filtering unit 102. At this time, a typical texture feature is LBP (local binary pattern). LBP is strong against illumination, and it is known that it is resistant to pose change within a certain range. In the present invention, a local block texture feature (LBTF) is used to effectively utilize not only texture but also contour and morphological information of a face.

즉, 특징 추출부(104)에서는 사전 필터링부(102)에서 통과된 윈도우 영역에 대해서 3개의 영역으로 나누어 예를 들어 왼쪽 눈, 오른쪽 눈, 그리고 입 영역 등을 각각 포함하도록 한다. 또한, 얼굴아래 목 어깨를 포함하는 영역을 포함 할 수도 있다. 이어, 각 영역에서 LBP 히스토그램을 추출하고 그 결과 나온 3개의 히스토그램을 연결하여 하나의 특징벡터를 생성하게 된다. 이때, 3개의 영역에서 2개 영역의 픽셀 개수는 동일하지만 입 영역에 해당하는 3번째 영역의 픽셀 개수가 다르기 때문에 가중치를 통한 정규화 과정을 수행한다. 또한, 본 발명의 실시예는 얼굴영역의 질감과 형태를 위해 3개의 영역을 나눈 것을 예를 들어 설명하였으나, 목 또는 어깨 등 사람과 관련된 형태를 나타내기 위한 추가 영역을 포함시킬 수도 있다.That is, the feature extracting unit 104 divides the window area passed by the pre-filtering unit 102 into three areas, for example, the left eye, the right eye, and the mouth area. It may also include an area that includes the neck shoulder below the face. Then, an LBP histogram is extracted from each region, and three histograms of the result are connected to generate one feature vector. In this case, since the number of pixels in the two regions in the three regions is the same, the number of pixels in the third region corresponding to the input region are different, so that the normalization process is performed through the weights. In addition, although the embodiment of the present invention has exemplified the division of the three regions for the texture and the shape of the face region, it may include an additional region for representing a shape related to a person such as a neck or a shoulder.

특징 템플릿 매칭부(Feature Template Matching)(106)는 입력 윈도우에 대해 얻은 특징과 미리 구성된 특징 템플릿 사이의 거리에 의해 얼굴 영역인지 또는 아닌지에 대한 분류를 수행하게 된다. 이때, 템플릿 매칭 기반의 방법은 계산이 단순하고 특징 벡터의 템플릿을 정수 형태로 저장해 놓으면 되기 때문에 상대적으로 리소스(resource)가 덜 요구된다. 뿐만 아니라, 하드웨어 구현 시 정수 연산을 수행하기 위해서 거리 측정은 L1-norm을 거리 척도로 사용하게 된다. The feature template matching unit 106 classifies whether the face region is a face region or not according to the distance between the features obtained for the input window and the pre-configured feature template. At this time, the method based on the template matching is relatively simple because the calculation is simple and the template of the feature vector is stored in the integer form. In addition, the distance measure uses L1-norm as distance measure to perform integer operation in hardware implementation.

또한, 본 발명의 실시예에서 템플릿은 얼굴의 포즈(pose) 변화에 대해 톨러런스(tolerance)를 갖기 위해서 정면얼굴, 그리고 좌우 포즈 변화를 갖는 얼굴로부터 3가지의 특징템플릿을 구성하였고, 아래 [수학식 1]과 같이 3가지 템플릿(

Figure 112014068209846-pat00001
)에 대해서 테스트(x)와의 L1-norm(d)이 측정되고, 이 거리가 임계치보다 작을 경우에 얼굴 영역인 것으로 판단할 수 있다. 위와 같은 본 발명의 실시예에서는 3가지 템플릿을 사용하는 것을 예를 들어 설명하였으나, 3개 이외의 탬플릿을 사용하는 것도 포함할 수 있으며 얼굴검출의 강인성을 위해 다수개의 템플릿을 활용하는 것도 포함할 수 있다.In addition, in the embodiment of the present invention, the template has three feature templates from the face having the front face and the face having the pose change in order to have tolerance to the pose change of the face, 1] as shown in Fig.
Figure 112014068209846-pat00001
The L1-norm (d) with respect to the test (x) is measured with respect to the face region, and if the distance is smaller than the threshold value, it can be judged to be the face region. In the above embodiment of the present invention, three templates are used. However, it is possible to use a template other than three, and it is also possible to use a plurality of templates for robustness of face detection have.

[수학식 1][Equation 1]

Figure 112014068209846-pat00002

Figure 112014068209846-pat00002

오검출 제거부(False Positive Reduction)(120)는 특징 템플릿 매칭부(106)에서 최종적으로 얻은 ROI 영역에 대해서 상대적으로 계산 량이 큰 분류기를 이용하여 얼굴 영역인지 아닌지를 판단하게 된다. 이때, 위와 같은 오검출 제거를 위해 오검출 제거부(120)에서는 다양한 알고리즘이 사용할 수 있는데, 본 발명의 실시예에서는 일반화 능력이 뛰어나다고 알려진 SVM(support vector machine)을 사용한다. The False Positive Reduction unit 120 determines whether or not the ROI area obtained by the feature template matching unit 106 is a face area using a relatively large computational amount classifier. At this time, various algorithms can be used in the erroneous detection removal unit 120 for eliminating the erroneous detection. In the embodiment of the present invention, a SVM (support vector machine) known to have excellent generalization capability is used.

후술되는 도 4의 저 에너지 및 저 해상도 얼굴 검출 장치의 하드웨어 논리 회로 구현의 예에서는 계산 및 하드웨어 구조 효율성을 위해 선형 SVM을 채택함을 보인다. SVM은 이진 분류기 중의 하나로서 훈련 집합이 주어졌을 때 하이퍼 플레인(hyperplane)을 이용하여 두 가지 분류를 구분하기 위해 구분 오류를 최소화하고 하이퍼플레인으로부터 가장 가까운 훈련 집합까지의 거리를 의미하는 마진(margin)을 최대화하도록 하이퍼플레인을 선택하도록 한다. 이때, 테스트를 위해서는 아래 [수학식 2]와 같이 하이퍼플레인 주변에 존재하는 서포트 벡터(support vector)들(

Figure 112014068209846-pat00003
)과 테스트 벡터(x) 사이의 내적을 수행한다. 이러한 [수학식 2]에서 볼 수 있듯이 모든 서포트 벡터들과의 내적은 서포트 벡터들의 합에 해당하는 벡터(w)와 테스트 벡터 사이의 한 번의 내적에 의해 간단히 수행될 수 있다. 마지막으로 아래 [수학식 2]를 계산한 후에 이 값이 미리 정한 임계값과 비교해서 얼굴영역인지 얼굴영역이 아닌지를 판단할 수 있다.An example of a hardware logic implementation of the low energy and low resolution face detection apparatus of FIG. 4, described below, shows the adoption of a linear SVM for computational and hardware architectural efficiency. The SVM is one of the binary classifiers, and when given a training set, it uses a hyperplane to minimize the classification error to distinguish the two classes, and a margin, which means the distance from the hyperplane to the training set closest to it, To select the hyperplane. At this time, for the test, support vectors existing around the hyperplane (Equation 2)
Figure 112014068209846-pat00003
) And the test vector (x). As can be seen from this equation (2), the dot product with all the support vectors can be simply performed by one dot product between the test vector and the vector w corresponding to the sum of the support vectors. Finally, after calculating [Equation 2], it is possible to determine whether this value is a face region or not in comparison with a predetermined threshold value.

[수학식 2]&Quot; (2) "

Figure 112014068209846-pat00004

Figure 112014068209846-pat00004

도 3은 본 발명의 실시예에 따른 저 에너지 및 저 해상도 얼굴 검출 장치에서의 동작 제어 흐름을 도시한 것이다. 이하, 도 1 내지 도 3을 참조하여 본 발명의 실시예를 상세히 설명하기로 한다.FIG. 3 shows an operation control flow in a low-energy and low-resolution face detection apparatus according to an embodiment of the present invention. Hereinafter, embodiments of the present invention will be described in detail with reference to FIGS. 1 to 3. FIG.

먼저, 입력 영상은 얼굴 검출이 가능한 윈도우 크기에 해당하는 해상도로 단계적으로 다운 스케일링되어 저 에너지 및 저 해상도 얼굴 검출 장치로 입력될 수 있다(S300).First, the input image can be downscaled down to the resolution corresponding to the window size capable of face detection, and input to the low energy and low resolution face detection apparatus (S300).

그러면, 저 에너지 및 저 해상도 얼굴 검출 장치의 사전 필터링부(102)에서는 입력 영상에 대해 윈도우 슬라이딩 방식으로 사전 필터링을 수행하며, 각각의 윈도우 영역내에서 산출된 분산값을 기설정된 기준값과 비교한 결과를 참조하여 얼굴이 포함되지 않은 윈도우를 제거하는 사전 필터링을 수행하게 된다(S302). 이때, 예를 들어 사전 필터링부(102)는 얼굴을 포함하는 윈도우에 대해 계산된 제1 분산값을 기준으로 각각의 윈도우에 대해 계산된 제2 분산값과 제1 분산값을 비교하고, 제2 분산값이 제1 분산값보다 기설정된 임계값 이상으로 작거나, 큰 경우 해당 윈도우에 얼굴이 포함되지 않은 것으로 판단하여 제거할 수 있다.The pre-filtering unit 102 of the low-energy and low-resolution face detection apparatus performs prefiltering on the input image in a window sliding manner. The result of comparing the variance value calculated in each window region with a predetermined reference value And performs a pre-filtering process for removing a window that does not include a face (S302). In this case, for example, the pre-filtering unit 102 compares the first variance value and the second variance value calculated for each window based on the first variance value calculated for the window including the face, If the variance value is smaller or larger than a predetermined threshold value or larger than the predetermined threshold value, it is determined that the face is not included in the window and can be removed.

위와 같이 사전 필터링이 수행되는 경우, 특징 추출부(104)에서는 사전 필터링을 통과한 각각의 윈도우에 대해 국부블록 질감 특징값을 산출하고, 국부블록 질감 특징값을 이용한 각 윈도우 영역의 히스토그램을 추출하여 각 윈도우에 대한 특징벡터값을 산출한다(S304). When the pre-filtering is performed as described above, the feature extracting unit 104 calculates the local block texture feature value for each window that has passed the pre-filtering and extracts the histogram of each window region using the local block texture feature value A feature vector value for each window is calculated (S304).

이때, 특징 추출부(104)는 예를 들어 각 윈도우 영역에 대해 눈, 코, 입의 3개의 영역으로 나누어 각 영역에서 국부블록 질감 특징값을 산출하고, 국부블록 질감 특징값을 이용하여 상기 3개의 영역에 대한 3개의 히스토그램을 추출할 수 있다. 또한, 3개의 히스토그램을 연결하여 윈도우에 대한 하나의 특징벡터값을 생성할 수 있다.At this time, the feature extracting unit 104 calculates the local block texture feature value in each region by dividing the region into three regions, for example, eyes, nose, and mouth for each window region, Three histograms can be extracted for each region. In addition, three histograms can be concatenated to generate one feature vector value for the window.

이와 같이 특징 추출부(104)로부터 산출된 각 윈도우의 특징벡터값은 특징 템플릿 매칭부로 인가되는데, 그러면, 특징 템플릿 매칭부(106)에서는 각 윈도우에 대한 특징벡터값과 기설정된 기준 특징벡터의 템플릿과의 차이를 비교하는 특징 템플릿 매칭을 통하여 해당 윈도우가 얼굴 영역인지를 판단할 수 있다(S306).In this way, the feature vector value of each window calculated from the feature extraction unit 104 is applied to the feature template matching unit. Then, in the feature template matching unit 106, the feature vector value for each window and the template It is possible to determine whether the corresponding window is a face region through feature template matching (S306).

이때, 특징 템플릿 매칭부(106)는 얼굴 영역인지를 판단함에 있어서, 예를 들어 좌우 포즈 변화를 갖는 얼굴로부터 3가지의 템플릿을 구성하고, 각 윈도우에 대한 특징벡터값과 3가지 템플릿과의 거리를 측정한 후, 측정된 거리를 얼굴 영역의 판단을 위해 설정된 임계값과 비교하여 해당 윈도우가 얼굴 영역인지를 판단할 수 있다.At this time, in determining whether the face region is a face region, the feature template matching unit 106 constructs three templates from, for example, a face having a pose change in the right and left directions, and calculates a distance between the feature vector value for each window and three templates It is possible to determine whether the corresponding window is a face area by comparing the measured distance with a threshold value set for judgment of the face area.

이어, 위와 같이 특징 템플릿 매칭부(106)에서 얼굴 영역이 판단된 이후에는 얼굴 영역으로 오검출된 윈도우를 제거하는 동작이 필요하다. 즉, 오검출 제거부(120)에서는 특징 템플릿 매칭부(106)로부터 상기 얼굴 영역으로 판단된 윈도우 중 상기 얼굴 영역이 오검출된 윈도우를 제거하여 최종적으로 상기 입력 영상에서 얼굴 영역을 검출하게 된다(S308).Then, after the face region is determined by the feature template matching unit 106 as described above, it is necessary to remove the window that is detected as a face region. That is, in the erroneous detection removal unit 120, the window of the window judged as the face region by the feature template matching unit 106 is erroneously detected, and finally the face region is detected in the input image ( S308).

이어, 오검출 제거부(120)를 통해 최종적으로 판단된 얼굴 영역들은 병합부를 통해 병합되어 최종 검출된 얼굴 영역이 출력되게 된다(S310).Then, the face regions finally determined through the erroneous detection removal unit 120 are merged through the merging unit and the finally detected face region is output (S310).

도 4는 본 발명의 실시예에 따른 저 에너지 얼굴 검출장치에 대한 하드웨어 논리 회로 구성을 도시한 것이다. 4 illustrates a hardware logic circuit configuration for a low energy face detection apparatus according to an embodiment of the present invention.

위 도 4를 참조하면, 본 발명의 저 에너지 얼굴 검출 장치의 하드웨어 논리 회로 설계에 있어서는, 알고리즘에 기반하여 하드웨어를 구성할 때 가장 중요한 요소가 가장 많은 에너지 소모와 로직을 차지하는 것이 메모리이기 때문에 메모리를 효율적으로 사용할 있는 하드웨어 구조를 설계한다. Referring to FIG. 4, in the hardware logic circuit design of the low energy face detecting apparatus of the present invention, since memory is the memory that occupies the most energy consumption and logic most important factor in hardware configuration based on the algorithm, Design a hardware structure that can be used efficiently.

즉, 본 발명의 실시예에 있어서 위에서 설명된 알고리즘을 메모리 및 로직 최적화를 통해 구현을 하였고, 전체적인 하드웨어 핵심 코어는 도 4에서와 같이 4개 코어로 이루어져 있다. 하드웨어 구조는 다양한 크기의 얼굴을 검출하기 위해 8 스케일에서 얼굴검출 방법을 적용하는 제1 모듈(400)과 라인단위로 데이터를 불러와 LBTF 특징과 RAW 데이터를 저장하는 제2 모듈(402), 앞에서 저장된 LBTF 특징과 RAW 데이터를 이용하여 누적 히스토그램 계산과 평균 및 분산을 계산하는 제3 모듈(404), 그리고 템플릿과 비교하는 템플릿 매칭 과정과 FP reduction을 수행하는 제4 모듈(406)을 하드웨어로 구현한다. 최종 검출된 얼굴정보는 위치 좌표인 (X, Y, S)가 출력된다. That is, in the embodiment of the present invention, the above-described algorithm is implemented through memory and logic optimization, and the overall hardware core core is composed of four cores as shown in FIG. The hardware structure includes a first module 400 for applying a face detection method on an 8 scale to detect faces of various sizes, a second module 402 for storing LBTF features and RAW data by calling data in units of lines, A third module 404 for calculating a cumulative histogram and an average and variance using the stored LBTF feature and RAW data, a template matching process for comparing the template with the template, and a fourth module 406 for performing FP reduction do. The finally detected face information is (X, Y, S) which is the position coordinate.

제1 모듈(400)은 입력 영상에 대해 얼굴 검출 수행을 위한 윈도우 크기로 다운 스케일링을 수행하는 논리 회로 구현 부분일 수 있으며, 사전 필터링부(102)로 인가되는 입력 영상을 윈도우 크기로 다운 스케일링 수행한다. The first module 400 may be a logic circuit implementing part that performs downscaling to a window size for performing face detection on an input image. The first module 400 downscales an input image applied to the pre-filtering unit 102 to a window size do.

즉, 제1 모듈(400)은 320x240(QVGA 해상도) 영상을 입력 받아서, 8개의 스케일드(scaled) 영상을 생성한 후 이들을 단일 데이터 스트림(data stream)으로 병합한다. 이때, 8개의 스케일드 영상의 해상도는 320x240, 224x171, 160x120, 112x85, 80x60, 56x42, 40x30, 그리고 28x21이며, 입력된 데이터 76,800(=320x240)개는 152,764개로 1.989(=152,764/76,800)배 늘어날 수 있다. 따라서 제1 모듈은 센서 클럭(sensor clock) 보다 항상 2배의 동작주파수로 동작할 수 있다. 이 모듈의 설계에 있어서 메모리 사용을 줄여서 게이트 수를 감소시키기 위해 통합된(unified) SRAM 배치가 설계될 수 있다. That is, the first module 400 receives 320 × 240 (QVGA resolution) images, generates 8 scaled images, and merges them into a single data stream. In this case, the resolution of the eight scaled images is 320x240, 224x171, 160x120, 112x85, 80x60, 56x42, 40x30, and 28x21 and the input data 76,800 (= 320x240) is 152,764, which is 1.989 (= 152,764 / 76,800) have. Thus, the first module can always operate at twice the operating frequency of the sensor clock. In the design of this module, a unified SRAM layout can be designed to reduce memory usage and reduce the number of gates.

제2 모듈(402)과 제3 모듈(404)은 도 1의 사전 필터링부(102)와 특징 추출부(104)의 동작을 위한 논리 회로 구현 부분일 수 있다. 즉, 제2 모듈(402)은 라인 단위의 데이터를 입력으로 받아서 16x1 LBP(local binary pattern) 벡터, 16x1 RAW 벡터를 각각 출력한다. 이 모듈은 510x136 SPSRAM(single ported static random access memory)을 내장하여, 8개의 스케일드 영상 각각에 대해서 18x1 열벡터를 생성한 후에 이로부터 16x1 LBP를 계산하여 RAW 데이터와 함께 출력한다. The second module 402 and the third module 404 may be logic circuit implementation parts for operation of the pre-filtering unit 102 and feature extraction unit 104 of FIG. That is, the second module 402 receives data in units of lines and outputs a 16x1 local binary pattern (LBP) vector and a 16x1 RAW vector. The module has a built-in 510x136 single-ported static random access memory (SPSRAM) to generate 18x1 column vectors for each of the 8 scaled images, and then calculates and outputs 16x1 LBP with RAW data.

제3 모듈(404)은 16x16 LBP 검출 윈도우(detection window)에 대한 히스토그램을 계산하여 출력한다. 16x16 윈도우에 대한 히스토그램은 16x1 열 벡터에 대한 히스토그램을 더하여 생성할 수 있다. LBP 히스토그램 계산과 더불어, 도 2에서와 같이 중심부 6x6 영역에 대한 분산 계산을 수행하고, 도 2에서와 같이 눈과 코에 대응하는 8x3, 8x2 영역에 대응하는 평균을 각각 계산하여 사전 필터링 하는데 사용된다. The third module 404 calculates and outputs a histogram for a 16x16 LBP detection window. The histogram for a 16x16 window can be generated by adding a histogram for a 16x1 column vector. In addition to the LBP histogram calculation, the variance calculation for the 6x6 region is performed as shown in FIG. 2, and an average corresponding to the 8x3 and 8x2 regions corresponding to the eyes and nose is calculated and pre-filtered as shown in FIG. 2 .

제4 모듈(406)은 도 1의 특징 템플릿 매칭부(106)의 동작을 위한 논리 회로 구현 부분일 수 있다. 즉, 제4 모듈(406)은 계산된 히스토그램에 대해서 템플릿 매칭을 수행한다. 최대 6개의 템플릿을 정의할 수 있으며, 이 중 하나 이상의 템플릿에 대해서 얼굴로 간주될 만큼 높은 값(cost)을 가지면, 얼굴이 검출된 것으로 간주한다. The fourth module 406 may be a logic circuit implementation portion for operation of the feature template matching unit 106 of FIG. That is, the fourth module 406 performs template matching on the calculated histogram. A maximum of 6 templates can be defined. If one or more of these templates has a cost that is considered to be a face, the face is considered to be detected.

상술한 바와 같이, 본 발명에 따르면, 저 에너지 및 저 해상도 얼굴 검출에 있어서, 입력 영상에 대해 얼굴 검출을 위한 윈도우 크기에 해당하는 해상도까지 영상을 줄이면서 윈도우를 슬라이딩하여 얼굴을 검출하며, 얼굴 검출에 있어서는 각 윈도우의 구조적 특성과 분산을 이용하여 사전 필터링을 수행하여 얼굴이 포함되지 않은 윈도우를 빠르게 제거하고, 사전 필터링을 통과한 윈도우에 대해서는 국부 블록 질감 특징과 특징 템플릿과 매칭하여 최종 관심 영역을 추출한 후 관심 영역에 대해서만 상대적으로 계산량이 큰 분류기를 사용하여 얼굴을 검출함으로써 저 에너지 또는 저 해상도를 가지는 얼굴 및 사람을 보다 효율적으로 검출할 수 있다.As described above, according to the present invention, in the low energy and low resolution face detection, the face is detected by sliding the window while reducing the image to the resolution corresponding to the window size for the face detection on the input image, The window that does not contain the face is quickly removed by performing prefiltering using the structural characteristics and dispersion of each window, and for the window that has passed through the prefiltering, the local block texture feature and the feature template are matched with each other, It is possible to more efficiently detect faces and persons having low energy or low resolution by detecting faces using a classifier having a relatively large calculation amount only for the region of interest.

한편 상술한 본 발명의 설명에서는 구체적인 실시예에 관해 설명하였으나, 여러 가지 변형이 본 발명의 범위에서 벗어나지 않고 실시될 수 있다. 따라서 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 특허청구범위에 의해 정하여져야 한다.
While the invention has been shown and described with reference to certain preferred embodiments thereof, it will be understood by those skilled in the art that various changes and modifications may be made without departing from the spirit and scope of the invention. Accordingly, the scope of the invention should not be limited by the described embodiments but should be defined by the appended claims.

102 : 사전 필터링부 104 : 특징 추출부
106 : 특징 템플릿 매칭부 110 : 관심영역 추출부
120 : 오검출 제거부 130 : 병합부
102: pre-filtering unit 104: feature extracting unit
106: Feature template matching unit 110:
120: Error detection removal 130:

Claims (10)

입력 영상에 대해 윈도우 슬라이딩 방식으로 사전 필터링을 수행하며, 각각의 윈도우 영역내에서 산출된 분산값을 기설정된 기준값과 비교한 결과를 참조하여 얼굴이 포함되지 않은 윈도우를 제거하는 사전 필터링부와,
상기 사전 필터링부에서 통과된 각각의 윈도우에 대해 국부블록 질감 특징값을 산출하고, 상기 국부블록 질감 특징값을 이용한 각 윈도우 영역의 히스토그램을 추출하여 각 윈도우에 대한 특징벡터값을 산출하는 특징 추출부와,
상기 특징 추출부에서 산출된 각 윈도우에 대한 특징벡터값과 기설정된 기준 특징벡터의 템플릿과의 차이를 비교하여 해당 윈도우가 얼굴 영역인지를 판단하는 특징 템플릿 매칭부와,
상기 특징 템플릿 매칭부로부터 상기 얼굴 영역으로 판단된 윈도우 중 상기 얼굴 영역이 오검출된 윈도우를 제거하여 최종적으로 상기 입력 영상에서 얼굴 영역을 검출하는 오검출 제거부를 포함하며,
상기 특징 추출부는,
상기 각 윈도우 영역에 대해 눈, 코, 입의 3개의 영역으로 나누어 각 영역에서 상기 국부블록 질감 특징값을 이용한 3개의 히스토그램을 추출하고, 상기 3개의 히스토그램을 연결하여 상기 윈도우에 대한 하나의 특징벡터값을 생성하는 것을 특징으로 하는 저 에너지 및 저 해상도 얼굴 검출 장치.
A prefilter for performing prefiltering on an input image in a window sliding manner and removing a window not including a face with reference to a result of comparing a variance value calculated in each window region with a predetermined reference value;
A feature extraction unit for calculating a local block texture feature value for each window passed by the pre-filtering unit and a feature vector value for each window by extracting a histogram of each window region using the local block texture feature value, Wow,
A feature template matching unit for comparing a difference between a feature vector value of each window calculated by the feature extraction unit and a template of a predetermined reference feature vector to determine whether the corresponding window is a face region,
And an erroneous detection removal unit for removing a window of the window determined as the face region from the feature template matching unit and erroneously detecting the face region and finally detecting a face region in the input image,
The feature extraction unit may extract,
Three histograms using the local block texture feature value are extracted in each region, and three histograms are concatenated to form one feature vector for the window Wherein the low-energy and low-resolution face detection apparatus generates the low-energy and low-resolution face detection apparatus.
제 1 항에 있어서,
상기 입력 영상은,
상기 얼굴 검출이 가능한 상기 윈도우 크기에 해당하는 해상도로 단계적으로 다운 스케일링되어 상기 사전 필터링부로 입력되는 것을 특징으로 하는 저 에너지 및 저 해상도 얼굴 검출 장치.
The method according to claim 1,
The input image may include:
Scaled down to a resolution corresponding to the window size capable of face detection, and input to the pre-filtering unit.
제 1 항에 있어서,
상기 사전 필터링부는,
얼굴을 포함하는 윈도우에 대해 계산된 제1 분산값을 기준으로 각각의 윈도우에 대해 계산된 제2 분산값과 상기 제1 분산값을 비교하고, 상기 제2 분산값이 상기 제1 분산값보다 기설정된 임계값 이상으로 작거나, 큰 경우 해당 윈도우에 얼굴이 포함되지 않은 것으로 판단하여 제거하는 것을 특징으로 하는 저 에너지 및 저 해상도 얼굴 검출 장치.
The method according to claim 1,
The pre-
Comparing the first variance value with a second variance value calculated for each window based on the first variance value calculated for the window including the face, and comparing the second variance value with the first variance value, And if it is smaller or larger than the set threshold value, it is judged that the face is not included in the window and is removed.
삭제delete 제 1 항에 있어서,
상기 특징 템플릿 매칭부는,
상기 윈도우에 대한 특징벡터값과 상기 템플릿 사이의 거리를 측정하여 측정된 거리가 기설정된 임계값보다 작은 경우 얼굴 영역으로 판단하며, 좌우 포즈 변화를 갖는 얼굴로부터 3가지의 템플릿을 구성하여 상기 3가지 템플릿에 대하여 상기 윈도우에 대한 특징벡터값과의 거리를 측정하는 것을 특징으로 하는 저 에너지 및 저 해상도 얼굴 검출 장치.
The method according to claim 1,
Wherein the feature template matching unit comprises:
Determining a face area when the measured distance is less than a predetermined threshold by measuring a feature vector value for the window and a distance between the template and constructing three templates from faces having a right and left pose change, And a distance between the template and the feature vector value for the window is measured with respect to the template.
입력 영상에 대해 윈도우 슬라이딩 방식으로 사전 필터링을 수행하여 얼굴이 포함되지 않은 윈도우를 제거하는 단계와,
상기 사전 필터링에서 통과된 각각의 윈도우에 대해 특징벡터값을 산출하는 단계와,
상기 산출된 각 윈도우에 대한 특징벡터값과 기설정된 기준 특징벡터의 템플릿과의 차이를 비교하여 해당 윈도우가 얼굴 영역인지를 판단하는 단계와,
상기 얼굴 영역으로 판단된 윈도우 중 상기 얼굴 영역이 오검출된 윈도우를 제거하여 최종적으로 상기 입력 영상에서 얼굴 영역을 검출하는 단계를 포함하며,
상기 특징벡터값을 산출하는 단계는,
상기 각 윈도우 영역에 대해 눈, 코, 입의 3개의 영역으로 나누어 각 영역에서 국부블록 질감 특징값을 산출하는 단계와,
상기 국부블록 질감 특징값을 이용하여 상기 3개의 영역에 대한 3개의 히스토그램을 추출하는 단계와,
상기 3개의 히스토그램을 연결하여 상기 윈도우에 대한 하나의 특징벡터값을 생성하는 단계
를 포함하는 것을 특징으로 하는 저 에너지 및 저 해상도 얼굴 검출 방법.
Performing a pre-filtering operation on the input image in a window sliding manner to remove a window not including a face;
Computing a feature vector value for each window passed in the prefiltering;
Comparing the calculated feature vector value for each window with a template of a predetermined reference feature vector to determine whether the corresponding window is a face region,
Detecting a face region in the input image by removing a window in which the face region is erroneously detected among the windows determined as the face region,
Wherein the step of calculating the feature vector value comprises:
Calculating local block texture feature values in each region by dividing the region into three regions of eyes, nose, and mouth for each window region;
Extracting three histograms for the three regions using the local block texture feature value;
Connecting the three histograms to generate one feature vector value for the window
Wherein the low energy and low resolution face detection method comprises the steps of:
제 6 항에 있어서,
상기 입력 영상은,
상기 얼굴 검출이 가능한 상기 윈도우 크기에 해당하는 해상도로 단계적으로 다운 스케일링되는 것을 특징으로 하는 저 에너지 및 저 해상도 얼굴 검출 방법.
The method according to claim 6,
The input image may include:
Scaled down to a resolution corresponding to the window size capable of face detection.
제 6 항에 있어서,
상기 윈도우를 제거하는 단계는,
얼굴을 포함하는 윈도우에 대해 계산된 제1 분산값을 기준값으로 저장하는 단계와,
상기 각각의 윈도우에 대해 분산을 수행하고, 상기 각각의 윈도우에 대해 계산된 제2 분산값과 상기 제1 분산값을 비교하는 단계와,
상기 제2 분산값이 상기 제1 분산값보다 기설정된 임계값 이상으로 작거나 큰거나 경우 해당 윈도우를 제거하는 단계
를 포함하는 것을 특징으로 하는 저 에너지 및 저 해상도 얼굴 검출 방법.
The method according to claim 6,
The method of claim 1,
Storing a first variance value calculated for a window containing a face as a reference value;
Performing a variance for each window and comparing the first variance value with a second variance value calculated for each window;
If the second variance value is smaller than or greater than a predetermined threshold value than the first variance value, removing the corresponding window
Wherein the low energy and low resolution face detection method comprises the steps of:
삭제delete 제 6 항에 있어서,
상기 얼굴 영역인지를 판단하는 단계는,
좌우 포즈 변화를 갖는 얼굴로부터 3가지의 템플릿을 구성하는 단계와,
상기 각 윈도우에 대한 특징벡터값과 상기 3가지 템플릿과의 거리를 측정하는 단계와,
상기 측정된 거리를 얼굴 영역의 판단을 위해 설정된 임계값과 비교하여 해당 윈도우가 얼굴 영역인지를 판단하는 단계
를 포함하는 것을 특징으로 하는 저 에너지 및 저 해상도 얼굴 검출 방법.

The method according to claim 6,
The method of claim 1,
Comprising the steps of: constructing three templates from a face having a left-right pose change;
Measuring a feature vector value for each window and a distance between the three templates;
Comparing the measured distance with a threshold value set for determination of a face area and determining whether the window is a face area
Wherein the low energy and low resolution face detection method comprises the steps of:

KR1020140091821A 2014-05-28 2014-07-21 Method and apparatus for detecting face with low energy or low resolution KR101681233B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020140064372 2014-05-28
KR20140064372 2014-05-28

Publications (2)

Publication Number Publication Date
KR20150136971A KR20150136971A (en) 2015-12-08
KR101681233B1 true KR101681233B1 (en) 2016-12-12

Family

ID=54872903

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140091821A KR101681233B1 (en) 2014-05-28 2014-07-21 Method and apparatus for detecting face with low energy or low resolution

Country Status (1)

Country Link
KR (1) KR101681233B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106027931B (en) * 2016-04-14 2018-03-16 平安科技(深圳)有限公司 Video recording method and server
US10152630B2 (en) 2016-08-09 2018-12-11 Qualcomm Incorporated Methods and systems of performing blob filtering in video analytics
TWI696958B (en) * 2018-11-19 2020-06-21 國家中山科學研究院 Image adaptive feature extraction method and its application

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100724932B1 (en) * 2005-08-02 2007-06-04 삼성전자주식회사 apparatus and method for extracting human face in a image
KR100866792B1 (en) * 2007-01-10 2008-11-04 삼성전자주식회사 Method and apparatus for generating face descriptor using extended Local Binary Pattern, and method and apparatus for recognizing face using it
KR100795160B1 (en) 2007-03-22 2008-01-16 주식회사 아트닉스 Apparatus for face detection and recognition and method for face detection and recognition
KR101211872B1 (en) * 2011-04-05 2012-12-13 성균관대학교산학협력단 Apparatus and method for realtime eye detection

Also Published As

Publication number Publication date
KR20150136971A (en) 2015-12-08

Similar Documents

Publication Publication Date Title
Satpathy et al. LBP-based edge-texture features for object recognition
CN106709404B (en) Image processing apparatus and image processing method
US9489566B2 (en) Image recognition apparatus and image recognition method for identifying object
US9575566B2 (en) Technologies for robust two-dimensional gesture recognition
JP6351243B2 (en) Image processing apparatus and image processing method
Tofighi et al. Face detection and recognition using skin color and AdaBoost algorithm combined with Gabor features and SVM classifier
Masmoudi et al. Vision based system for vacant parking lot detection: Vpld
Liu et al. Smoke-detection framework for high-definition video using fused spatial-and frequency-domain features
Kheirkhah et al. A hybrid face detection approach in color images with complex background
Barbu An automatic face detection system for RGB images
KR101681233B1 (en) Method and apparatus for detecting face with low energy or low resolution
KR101174103B1 (en) A face recognition method of Mathematics pattern analysis for muscloskeletal in basics
Tong et al. Upper body human detection and segmentation in low contrast video
Gürel Development of a face recognition system
Tofighi et al. A robust face recognition system in image and video
Ilao et al. Crowd estimation using region-specific HOG With SVM
Mustafah et al. Face detection system design for real time high resolution smart camera
Parvin et al. Improved Face Detection Using Spatial Histogram Features.
Elsayed et al. Hybrid method based on multi-feature descriptor for static sign language recognition
Joshi et al. Histograms of orientation gradient investigation for static hand gestures
Thomas et al. Real Time Face Mask Detection and Recognition using Python
Kim et al. Face detection for low power event detection in intelligent surveillance system
Reddy et al. Driver drowsiness monitoring based on eye map and mouth contour
Hbali et al. Object detection based on HOG features: Faces and dual-eyes augmented reality
CN111353353A (en) Cross-posture face recognition method and device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant