KR101659657B1 - 개선된 리얼 아다부스트 알고리즘에 근거한 새로운 멀티 뷰 얼굴감지방식 - Google Patents

개선된 리얼 아다부스트 알고리즘에 근거한 새로운 멀티 뷰 얼굴감지방식 Download PDF

Info

Publication number
KR101659657B1
KR101659657B1 KR1020140129854A KR20140129854A KR101659657B1 KR 101659657 B1 KR101659657 B1 KR 101659657B1 KR 1020140129854 A KR1020140129854 A KR 1020140129854A KR 20140129854 A KR20140129854 A KR 20140129854A KR 101659657 B1 KR101659657 B1 KR 101659657B1
Authority
KR
South Korea
Prior art keywords
classifier
adaboost algorithm
face detection
real adaboost
weak classifier
Prior art date
Application number
KR1020140129854A
Other languages
English (en)
Other versions
KR20160037424A (ko
Inventor
이응주
Original Assignee
동명대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동명대학교산학협력단 filed Critical 동명대학교산학협력단
Priority to KR1020140129854A priority Critical patent/KR101659657B1/ko
Publication of KR20160037424A publication Critical patent/KR20160037424A/ko
Application granted granted Critical
Publication of KR101659657B1 publication Critical patent/KR101659657B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

본 발명은 얼굴감지 방식에 관한 것으로, 개선된 리얼아다부스트알고리즘에 기반한 새로운 멀티뷰얼굴감지방법(MVFD)에 관한 것으로, 훈련된 Haar 특징을 위한 개선된 리얼 아다부스트 알고리즘은, 동적 무게와 사전에 분할 된 샘플을 고안한다.
기존의 리얼 아다부스트알고리즘과 비교했을 때, 약 분류기의 시간복잡성은 0(M*N)이고, 강 분류기의 시간복잡성은 0(T*M*N)이고, 훈련속도는 0(N)에 의해 강화된다.
멀티 뷰 얼굴인식(MVFD)을 위한, 우리의 Haar 특징의 처리에 근거한, 오직 12개의 카테고리 분류기는 ROP를 생성하고 RIP의 앵글을 변화시키기 위해 필요하다.
상기에서 고안 된 알고리즘은 훈련 복잡성을 대단히 줄여주는 것을 특징으로 한다. 리얼 아다부스트 알고리즘을 사용하기 위해 LUT약 분류기는 Haar 특징을 증진시키는데 사용된다. 각각 훈련된 포즈 측정기를 대신해, 아다부스트 알고리즘에 의해 정의된 강 분류기의 신뢰를 사용한다.
캐스케이드 분류기의 16레이어 중 첫 4개의 레이어는 포즈추정을 위해 사용되고, 포즈추정을 위한 여분의 계산은 불필요하다.
CMU와 MIT 얼굴 테이터 베이스에 근거한 알고리즘 테스트가 이루어 졌고, 실험의 결과는 개선된 리얼 아다부스트 알고리즘의 수렴 성능은 이전의 리얼 아다부스트 알고리즘보다 개선되었다는 점이다.
또한, 본 발명에서 고안된 멀티 뷰 얼굴 감지 시스템은 높은 감지율을 보여주며, 적시성이 뛰어나며, 높은 검출율을 가지는 것을 특징으로 하는 얼굴감지방식을 제공한다.

Description

개선된 리얼 아다부스트 알고리즘에 근거한 새로운 멀티 뷰 얼굴감지방식 {A Novel Multi-view Face Detection Method Based on Improved Real Adaboost Algorithm}
본 발명은 얼굴감지방법에 관한 것으로, 개선된 리얼 아다부스트 알고리즘에 근거한 새로운 멀티 뷰 얼굴감지방식에 관한 것이다.
지난 10 년간, 얼굴 인식은 생체 인식, 감시, 인간 - 컴퓨터 상호 작용, 비디오 매개 통신 및 이미지 및 비디오 데이터베이스의 내용 기반 액세스를 포함한 다수의 잠재적인 응용 프로그램과 컴퓨터 비전의 적극적인 연구 분야로 떠올랐다.
얼굴 인식의 첫 번째 단계는 자동 얼굴 인식 단계이다. 그 신뢰성은 전체 얼굴 인식 시스템의 성능 및 유용성에 큰 영향을 미친다. 주어진 하나의 이미지나 비디오, 이상적인 얼굴 검출기는 이미지나 비디오의 위치, 크기, 방향, 연령, 표정에 관계없이 모든 현재의 얼굴을 찾을 수 있어야 하고, 구별할 수 있어야 한다.
또한, 외부 조명 상태, 이미지와 비디오의 내용에 관계없이 얼굴을 감지해야 한다. 피부색, 움직임, 안면 또는 머리 모양, 얼굴 모양 등의 여러 신호에 기초하여 얼굴 검출이 이루어 진다.
대부분의 성공적인 얼굴 인식 알고리즘은 다른 신호를 사용하지 않고, 외형를 기반으로 하며, 입력 이미지가 하위 창에 의해 가능한 모든 위치 및 규모에서 스캔 되는 단계, 얼굴 검출은 하나의 얼굴 또는 서브 - 윈도우에 패턴이 분류 단계, 통계적 학습 방법을 사용하여 얼굴 또는 비 얼굴 분류가 처리되는 단계를 거쳐 이루어진다.
종래의 얼굴 검출 방법은 통계적 방법이 널리 채택되어왔다. Moghaddam와 Pentland는 DIFS(distance-in-feature-space)과 DFFS(distance-from-feature-space)에 의해 얼굴패턴의 확률이 만들어진 고유얼굴(Eigenface) 인식방법을 도입했다. Osuna는 SVM 기반의 얼굴 검출 방법을 정면의 얼굴을 인식하기 위해 제시 하였다.
단지 양의 밀도를 추정하는 고유 얼굴 (Eigenface) 방법과 달리, 이 방법은 얼굴과 비 얼굴 패턴의 경계를 학습하고자 한다. 학습 후에는, 경계에 위치한 '중요한' 샘플은 결정 함수를 구축하도록 선택된다.
Soulie은 얼굴 검출을 위해 신경망을 사용하는 시스템(NNs)을 도입했다. 그들은 다양한 거부 기준이 거짓 거부에 대한 트레이드 오프의 잘못된 인식에 사용되는 다중 모드 아키텍처를 구현했다.
Sung과 Poggio도 NN 기반 얼굴 검출 시스템을 도입하였다. 그들은 숨겨진 레이어에 여섯 개의 양의 프로토 타입(얼굴)과 여섯 개의 음의 프로토 타입 (얼굴이 아닌 것)을 고안했다.
최근, 비올라와 존스는, 소위 적분 이미지로 불리는 간단한 사각형 기능을 사용하여 효율적으로 계산 할 수 있는 얼굴 감지 방법을 제시하였다. 이 시스템은 회전 불변 정면 얼굴 검출 및 멀티뷰얼굴감지(MVFD)보다 일반적인 시스템으로 개발되었다. 아다부스트와 캐스케이드 방법도, 상기에 설명한 방법과 유사한 기능에 따라 얼굴을 검출하는데 사용된다.
Li는 비슷하지만 좀 더 일반적인 기능(블록의 차이로부터 계산할 수 있는 기능)을 고안했고 Floatboost는 순차 아다부스트알고리즘 학습의 단순성을 극복하기 위한 방법을 제안하였다.
멀티뷰얼굴감지(MVFD)의 기존의 연구는, Bayesian 의사 결정 규칙에 기초한 Schneiderman 등의 연구를 포함한 멀티뷰얼굴감지(MVFD)에 대한 작업 및 첫 번째로 제안된 실시간 멀티뷰얼굴감지(MVFD) 시스템인 Li 피라미드 구조 검출기 등이 있다.
Hongming Zhang의 연구에서, 그들은 앙상블 ECOC 다중 클래스 분류의 에러 율의 최소화를 통해, 유익한 기능의 학습이 이루어진 효과적인 분류 설계를 강조했다.
실시간 회전 불변 멀티뷰얼굴감지(MVFD) 시스템의 궁극적인 목표는 다양한 애플리케이션의 요구를 충족시키기 위한 것이다.
종래의 MVFD 방법이 반복적 절차와 이미지를 회전하는 것 등의 방법으로 문제극복에 적용될 수 있지만, 그 절차는 시간 소비가 크고, 실패율이 커 이에 대한 얼굴감지방식을 연구, 개발해야 할 필요성이 있다.
KR 10-2011-0097794
본 발명은 기존에 제안된 상기와 같은 종래기술의 문제점을 해결하기 위해 고안된 것으로서,
즉, 본 발명의 목적은, Schapire와 Singer가 제안한 개선된 아다부스트분류기를 기반으로 한, 새롭게 개선된 리얼아다부스트알고리즘에 근거한 얼굴감지방식을 제안한다.
LUT 약 분류기는 아다부스트알고리즘에 의해 처리된 Haar 기능(거울 및 회전)을 훈련하는 데 사용된다. 또한, 강 분류기의 신뢰를 기반으로 얼굴 포즈 추정하기 위해 첫 4 개의 레이어를 사용하는 포즈 추정기도 본 발명에서 제안한다. 본 발명은, CMU 및 MIT 얼굴 데이터베이스를 통해 본 발명에서 고안된 멀티뷰얼굴감지(MVFD)방식을 테스트했고, 이 실험적 결과는 상기의 감지기 시스템이 이산아다부스트 및 리얼아다부스트알고리즘보다 더 나은 성능을 가진다는 것을 보여준다. 또한, 본 멀티뷰얼굴감지(MVFD)방식에서는, 강 분류기의 수렴을 가속화하고, 약 분류기의 수를 줄이고 검출 시간을 감소시키는 데 목적이 있다.
개선된 리얼아다부스트알고리즘에 근거한 새로운 멀티뷰얼굴감지방식(MVFD)에 있어서, 상기의 멀티뷰 얼굴감지(MVFD)방식은, 16개의 레이어로 구성되어, 다수의 샘플 얼굴영상으로부터 얼굴의 표정을 추출하는 캐스케이드 분류기; 추출된 표본공간이 약분류기에 의해 골고루 나누어져 형성된 부-윈도우; 강분류기의 신뢰성에 기반한 포즈추정부; 리얼 아다부스트 알고리즘 테스트를 위해 고안된 멀티-뷰얼굴인식(MVFD)부;를 포함하는 것을 특징으로 한다.
이상에서 설명한 바와 같이, 본 발명에 따른 새로운 멀티 뷰 얼굴감지방식(MVFD)은 CMU와 MIT얼굴 데이터베이스를 통해 멀티 뷰 얼굴 감지(MVFD) 실험이 이루어졌고, 그 결과 이산아다부스트와 기존의 리얼아다부스트 알고리즘보다 빨라진 강분류기의 수렴 속도, 약분류기의 수 감소 및 감지시간의 축소 등 성능 면에서 우수하다는 점이 증명되었다.
자세한 결과는 그림1, 그림2, 그림3, 그림4, 표1, 표2에 나타난다.
Figure 112014092325369-pat00001
그림 1. 얼굴감지비율 비교
Figure 112014092325369-pat00002
표 1
Figure 112014092325369-pat00003
그림 2. MIT정면얼굴테스트 세트에서 검출한 ROC곡선비교
Figure 112014092325369-pat00004
그림 3. CMU와 MIT테스트세트에서 실시한 정면얼굴검출 결과
Figure 112014092325369-pat00005
표 2. CMU 프로파일 얼굴테스트 세트로 실험한 멀티뷰얼굴감지 결과
Figure 112014092325369-pat00006
그림 4. CMU프로파일 얼굴테스트 세트로 실험한 멀티뷰 얼굴감지 결과
캐스케이드 분류기의 성능 중 검출시간은, 종전의 리얼아다부스트 알고리즘과 비교했을 때, 검출시간이 8ms 짧아졌고, 훈련 레이어의 수는 16개로 종전의 리얼아다부스트알고리즘 9개, 이산아다부스트알고리즘 62개보다 더 나은 성능을 보여준다. 약분류기의 수는, 종전의 리얼아다부스트 알고리즘과 비교했을 때 상기의 리얼아다부스트 알고리즘을 사용한 캐스캐이드의 실험결과, 742개로 이산아다부스트알고리즘 4297개, 종전의 리얼아다부스트 알고리즘 1784개보다 훨씬 나은 결과로 나타났다.
캐스케이드의 첫 레이어는 포즈검출을 위해 사용되었고, 그 결과 포즈검출기(PE)가 없는 것보다 포즈검출기(PE)가 있는 것이 실패율이 더 낮은 것으로 나타났다. 실험의 결과는 그림 5에 나타나있다.
Figure 112014092325369-pat00007
그림 5. CMU프로파일 얼굴데이터세트로 실험한 ROC곡선 비교
본 발명에서 실시간 얼굴감지를 위해 VS2008과 공공CV라이브러리에 근거해 멀티 뷰 얼굴감지 시스템을 고안하였다. 다른 포즈, 표정, 다른 요소(안경, 머리모양 등등)를 가진 세 사람이 실험표본으로 선택되었고 실험의 결과는 그림 6에 나타나있다.
Figure 112014092325369-pat00008
그림 6. 실시간 멀티뷰 얼굴감지 결과
CMU와 MIT 얼굴 테이터 베이스에 근거한 알고리즘 테스트 결과, 개선된 리얼 아다부스트 알고리즘의 수렴 성능은 이전의 리얼 아다부스트 알고리즘보다 낫다는 점이 실험을 통해 밝혀졌다.
또한, 고안된 멀티 뷰 얼굴 감지 시스템은 얼굴을 감지하는데 높은 감지율을 보여주며, 실시간으로 적용될 수 있으며, 대상이미지의 포즈를 검출하는데도 높은 검출율을 보이는 것을 특징으로 하는 얼굴감지방식을 제공한다.
도 1은 본 발명의 일 실시예에 따른 개선된 리얼아다부스트알고리즘을 이용한 얼굴감지절차를 나타내는 것이다.
도 2은 본 발명의 일 실시예의 리얼아다부스트알고리즘에 의해서 선택된 Haar특징 패턴을 나타내는 것이다.
개선된 리얼아다부스트알고리즘에 근거한 새로운 멀티뷰얼굴감지방식(MVFD)에 있어서, 상기의 멀티뷰 얼굴감지(MVFD)방식은, 16개의 레이어로 구성되어, 다수의 샘플 얼굴영상으로부터 얼굴의 표정을 추출하는 캐스케이드 분류기와; 추출된 표본공간이 약분류기에 의해 골고루 나누어져 형성된 부-윈도우과; 강분류기의 신뢰성에 기반한 포즈추정부와, 리얼 아다부스트 알고리즘 테스트를 위해 고안된 멀티-뷰얼굴인식(MVFD)부를 포함한 것을 특징으로 한다.
상기의 부윈도우는, 약분류기에 각각 대응되는 Haar특징을 처리하여, 약분류기가 상위의 공간을 n개의 하위범주로 균등하게 분배하여 형성되어, 각각의 약분류기는 각각의 하위범주에 대응된다.
본 발명의 목적은 멀티뷰얼굴감지(MVFD0를 해결하기 위한 것으로, 즉 수직의 얼굴이미지(ROP(rotaion-out-of-plane)변화 및 회전불변)를 탐지하기 위한 것으로, 이것은 360RIP(rotaion-in-plane) 포즈변화를 가지는 얼굴을 탐지하는 것을 의미한다.
ROP앵글에 따르면, 180도는 [-90°, -75°], [-75°,-45°],[-45°,-15°],[-15°,+15°],[+15°.+45°],[+45°,+75°],[+75°,+90°]으로 나누어진다. RIP앵글에 따르면, 얼굴은 12개의 카테고리로 나누어지고, 각각의 커버범위는 30도이다. 따라서 총 7*12 뷰 카테고리는 84개의 감지기에 대응된다. 아다부스트알고리즘에 근거해서, 84개의 카테고리 얼굴감지기는 84개의 카테고리 멀티뷰얼굴을 위해 고안되었다. Haar 특징은 수평적으로 뒤집어질 수 있고, 90도로 회전될 수 있기 때문에, 그 이외의 것은 최초의 이미지 변형으로 생성될 수 있다.
Figure 112014092325369-pat00009
상기의 표는 최초의 이미지를 Haar의 특징을 이용하여 기하학적으로 변형한 것을 정리한 표이다.
앞면 뷰의 최초의 감지기는 60도와 90도이다. 최초감지기의 프로파일 뷰의 절반은 남아있는 절반의 프로파일이고, 최초감지기의 프로파일 뷰의 절반은 60도, 90도, 120도이다. 전체의 프로파일 요소는 프로파일의 절반과 같다. 종전의 연구에서 최초의 감지기는 7*12=84 카테고리 분류기로 형성되나, 본 발명에서 최초의 감지기가 필요한 카테고리 분류기는 4*3=12 카테고리이다.
“4”는 수평으로 뒤집어진 7개중 4개의 앵글구역을 의미하고, “3”은 RIP앵글을 따라 12개의 카테고리에서 적어도 0°, 30°, 60°를 포함하는 것을 의미한다. 다른 요소들은 Haar특징을 변형으로 생성된다.
Figure 112014092325369-pat00010
상기의 그림은 이미지를 회전하고 반사시키는 것을 도식화 한 것이다.
아다부스트 알고리즘은 학습알고리즘으로, 가상의 거대한 공간으로부터 약분류기의 세트가 선택되어 강분류기가 형성된다.
강분류기의 성능은 약분류기의 가상공간의 성질에 따라 달라진다. 임계치의 약분류기는 가상공간을 절차를 가속화하기 위한 투입으로 하고, 임계치모델의 주요 단점은 복잡한 분산에 맞추기엔 너무 간단하다는 것이다.
따라서, 본 발명에서는 리얼아다부스트알고리즘을 사용하기 위해 LUT약분류기를 사용하였다.
따라서 본 발명에서는 실제로 평가된 LUT 약분류기를 사용하였다.
fhaar이 Haar특징이고, fhaar이 [0,1]로 규격화된다고 가정하면, 상위범주는 하위범주로 균등하게 나누어지면, j번째 LUT 아이템은 하위범위에 대응된다:
Figure 112014092325369-pat00011
분할된 범주는
Figure 112014092325369-pat00012
의 분할에 대응되고, 약분류기는 아래의 식으로 산출된다.
Figure 112014092325369-pat00013
일때,
Figure 112014092325369-pat00014
여기서
Figure 112014092325369-pat00015
이다.
주어진 지수함수
Figure 112014092325369-pat00016
Figure 112014092325369-pat00017
이고, 여기서
Figure 112014092325369-pat00018
이다.
LUT약분류기는
Figure 112014092325369-pat00019
로 나타낼 수 있다. LUT분류기는 모든 종류의 확률분산을 가능하게 한다. 부-윈도우의 샘플 사이즈가 확정되면, 모든 Haar 특징요소가 정해지고, 각각의 Haar 특징은 하나의 LUT 약분류기에 대응되고, 이것은 약분류기 공간 H를 구성한다.
본 발명에서 캐스케이드의 각각의 레이어는 개선된 리얼아다부스트알고리즘에 의해 훈련된 강 분류기이다. 본 발명에서는 각 레이어의 임계 값을 b로 두고,
Figure 112014092325369-pat00020
로 로 b가 산출되고, 얼굴의 99.9%가 통과하면 반례를 처리하기 위해 노력한다. 후자의 공간에서 분류기는 더욱 복잡하고, 이것은 더 많은 LUT에 기반한 분류기를 포함한다. 따라서 그것들은 강분류기의 성능을 가진다.
개선된 리얼아다부스트 알고리즘은 이산아다부스트 알고리즘과 비교했을 때, 리얼아다부스트 알고리즘이 더욱 연속적인 신뢰값을 산출하기 때문에 종전의 알고리즘보다 개선되었다고 할 수 있다. 또한, 본 발명의 LUT약분류기는 특히 리얼아다부스트알고리즘과 잘 기능한다. 알고리즘 학습절차는 아래와 같다.
1) 각 레이어에 최대의 false positive rate를 입력한 것을 f, 최소의 통과율을 입력한 것을 d, 총 false positive rate를 Ftarget으로 둔다. 주어진 양의 트레이닝 세트를 Pos, 음의 트레이닝 세트는Neg이다.
2) 초기화단계:
Figure 112014092325369-pat00021
3)
Figure 112014092325369-pat00022
A. Pos와 Neg를 사용하여 i번째 레이어를 훈련한다; f보다 낮으면 false positive rate인 fi와 d보다 높이면 통과비율을 두기 위해, 한계값 b를 세팅한다.
B.
Figure 112014092325369-pat00023
C.
Figure 112014092325369-pat00024
A. 이면, 캐스케이드 분류기를 사용하여 비 얼굴이미지를 스캔하고, 수집된 모든 false positive를 Neg로 둔다.
상기의 약분류기는, 얼굴감지의 각각의 단계에서 최적의 약분류기가 선택되면 더 이상의 훈련샘플공간을 재분배하지 않는 것을 특징으로 하며, 약분류기는 부-윈도 샘플의 사이즈가 확정되는 부윈도 사이즈 확정단계; Haar 특징후보가 확정되고 Haar 특징 확정단계; 각각의 Haar특징이 각각의 약분류기에 대응되는 대응단계; 를 거쳐 획득되며, LUT약분류기는 모든 종류의 분배가능성을 실현할 수 있다.
개선된 리얼 아다부스트 알고리즘에 의해 훈련된 강분류기가 캐스케이드 각각의 레이어를 구성한다.
개선된 리얼아다부스트알고리즘의 학습은 데이터세트 구축단계; 초기화 단계; t를 구하는 단계; 강분류기 산출단계로 이루어진다.
1) 데이터세트 구축단계;
데이터세트 S를
Figure 112014092325369-pat00025
로 둔다.
Figure 112014092325369-pat00026
, 약 분류기 풀 H, 약 분류기의 수를 T, 분류기를 위한 특징의 수를 s 일 때,
Figure 112014092325369-pat00027
에 가중치를 준다.
1) 초기화 단계;
(1) 샘플 분배를 초기화한다.
Figure 112014092325369-pat00028
(2) Haar 특징의 그레이 값 분배격차를 초기화한다.
(3) 약분류기에 상응하는 각각의 Haar특징을 처리하고, n개의 하위범주로 균등하고 나눈다. 범주의 분할은
Figure 112014092325369-pat00029
에 대응된다.
3) t(
Figure 112014092325369-pat00030
)를 구하는 단계
(1) H’약분류기 h를 구하기 위해
A. 분포 Dt를 구한다. 식은 다음과 같다.
Figure 112014092325369-pat00031
여기서
Figure 112014092325369-pat00032
이다.
B. h의 결과를 각각의 Xj에 대입한다.
Figure 112014092325369-pat00033
여기서 e는 양의 상수이다.
규격화 요소를 계산한다.
Figure 112014092325369-pat00034
(1) Z’와 h’t
Figure 112014092325369-pat00035
,
Figure 112014092325369-pat00036
의 식으로 구한다.
(2)
Figure 112014092325369-pat00037
의 식으로 샘플분배를 업데이트하고.
Figure 112014092325369-pat00038
으로 훈련가중치
Figure 112014092325369-pat00039
t를 구한다.
(3) 분배함수의 조건부확률을 구하기 위해
Figure 112014092325369-pat00040
를 정규화한다.
4) 강 분류기 산출단계
마지막 강 분류기 H는
Figure 112014092325369-pat00041
이고, 여기서 b는 임계값 디폴트로 0이다.
H의 신뢰도는
Figure 112014092325369-pat00042
로 산출한다.
또한 상기의 리얼 아다부스트 알고리즘은, 기존의 아다부스트 알고리즘에 비해 가중치 조절과 데이터세트 분할 면에서 개선되어 본 발명에서 고안한 캐스케이드 분류기에서 개선된 성능을 보여준다. 개선된 성능은 가중치조절통제로 증명된다.
Figure 112014092325369-pat00043
Figure 112014092325369-pat00044
에 근거하고,
Figure 112014092325369-pat00045
는 상기의 식에서 도출된 값과 같다.
확률적 선행변수는
Figure 112014092325369-pat00046
로 산출되고,
Figure 112014092325369-pat00047
이다.
리얼아다부스트알고리즘의 강분류기는 모든 약분류기의 합과 같다.
강분류기는
Figure 112014092325369-pat00048
으로 산출되고,
Figure 112014092325369-pat00049
t
Figure 112014092325369-pat00050
로 산출된다.
이것의 평균값과 분산은
Figure 112014092325369-pat00051
,
Figure 112014092325369-pat00052
으로 구할 수 있다.
Figure 112014092325369-pat00053
일때, m는 평균값이고, st 2은 분산이다.
본 발명에서 포즈추정부는 분리하여 훈련되지 않고 강분류기의 신뢰도를 이용한다는 점에서, 실시간 얼굴감지가 힘들었던 종전의 방법에서 벗어나도록 하였다.
강분류기의 신뢰도는
Figure 112014092325369-pat00054
으로 산출된다. 멀티 뷰에 근거한 d 감지기와 각각의 감지기는 n개의 레이어를 가진다고 가정할 때, i번째 감지기의 j번째 레이어 신뢰도는
Figure 112014092325369-pat00055
로 산출된다.
첫 k레이어의 신뢰도는
Figure 112014092325369-pat00056
로,
첫 m레이어의 포즈추정기는
Figure 112014092325369-pat00057
로 산출된다.
이러한 과정을 통해, x가 얼굴이 아닌 것으로 추정되면 첫m레이어에 버려지고, 포즈추정은 과정은 다시 수행되지 않는다.
종전의 Rowley의 연구와 달리 포즈추정과 얼굴감지가 분리되어 수행되지 않아 추가적인 계산이 필요하지 않다. 포즈추정절차는 아래의 그림과 같다.
Figure 112014092325369-pat00058
본 발명에서 4개의 뷰베이스탐지기가 있고, 캐스케이드 분류기는 16개의 레이어를 포함하고, 4개의 레이어는 얼굴 포즈검출을 위해 사용된다.

Claims (8)

  1. 개선된 리얼아다부스트알고리즘에 근거한 새로운 멀티뷰얼굴감지방식에 있어서,
    상기 멀티뷰 얼굴감지방식은,
    16개의 레이어로 구성되어, 다수의 샘플 얼굴영상으로부터 얼굴의 표정을 추출하는 캐스케이드 분류기와;
    추출된 표본공간이 약분류기에 의해 골고루 나누어져 형성된 부-윈도우와;
    강분류기의 신뢰성에 기반한 포즈추정부와;
    리얼 아다부스트 알고리즘 테스트를 위해 고안된 멀티-뷰얼굴인식부를 포함하고,
    상기 부윈도우는 상기 약분류기에 대응되는 Haar특징을 처리하여 상기 약분류기가 상위의 공간을 n개의 하위범주로 균등하게 분배하여 형성되어 상기 약분류기는 하위범주에 대응되며,
    상기 약분류기는 얼굴감지 단계에서 최적의 약분류기가 선택되면 더 이상의 훈련샘플공간을 재분배하지 않고 상기 부윈도우 샘플 사이즈가 확정되면 상기 Haar특징 후보가 확정되고 상기 Haar특징이 상기 약분류기에 대응되는 단계를 거쳐 획득되는 LUT약분류기는 모든 종류의 분배가능성을 실현할 수 있으며,
    상기 캐스케이드 분류기는 개선된 리얼 아다부스트 알고리즘에 의해 훈련된 강분류기가 캐스케이드의 레이어를 구성하고, 상기 리얼 아다부스트 알고리즘은 가중치 조절과 데이터세트 분할이 용이하고,
    상기 포즈추정부는 상기 강분류기의 신뢰성을 포즈추정용으로 사용하여 얼굴감지와 포즈추정을 비분리 훈련 방식으로 계산하며,
    상기 리얼 아다부스트 알고리즘 학습절차는 데이터 세트 구축단계; 초기화 단계; t를 구하는 단계; 강분류기 산출 단계;를 더 포함하고, 상기 데이터 세트 구축단계는
    Figure 112016027209865-pat00061
    의 관계를 통해 샘플 분배를 초기화한 후 Haar특징의 그레이 값 분배격차를 초기화하며 약분류기에 상응하는 상기 Haar특징을 처리하고 n개 하위범주로 균등하게 나누며 범주의 분할은
    Figure 112016027209865-pat00062
    에 대응시키는 것을 특징으로 하며, 상기 강분류기 산출 단계에서 강분류기(H)는
    Figure 112016027209865-pat00063
    의 관계로 산출하고 b는 임계값 디폴트로 0인 것으로 간주하며 상기 강분류기(H)의 신뢰도는
    Figure 112016027209865-pat00064
    로 산출하는 것을 특징으로 하는 멀티뷰얼굴감지방식.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
KR1020140129854A 2014-09-29 2014-09-29 개선된 리얼 아다부스트 알고리즘에 근거한 새로운 멀티 뷰 얼굴감지방식 KR101659657B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140129854A KR101659657B1 (ko) 2014-09-29 2014-09-29 개선된 리얼 아다부스트 알고리즘에 근거한 새로운 멀티 뷰 얼굴감지방식

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140129854A KR101659657B1 (ko) 2014-09-29 2014-09-29 개선된 리얼 아다부스트 알고리즘에 근거한 새로운 멀티 뷰 얼굴감지방식

Publications (2)

Publication Number Publication Date
KR20160037424A KR20160037424A (ko) 2016-04-06
KR101659657B1 true KR101659657B1 (ko) 2016-09-23

Family

ID=55790408

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140129854A KR101659657B1 (ko) 2014-09-29 2014-09-29 개선된 리얼 아다부스트 알고리즘에 근거한 새로운 멀티 뷰 얼굴감지방식

Country Status (1)

Country Link
KR (1) KR101659657B1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107796373B (zh) * 2017-10-09 2020-07-28 长安大学 一种基于车道平面几何模型驱动的前方车辆单目视觉的测距方法
CN109918971B (zh) * 2017-12-12 2024-01-05 深圳光启合众科技有限公司 监控视频中人数检测方法及装置
CN108737302B (zh) * 2018-06-04 2020-09-08 中国人民解放军战略支援部队信息工程大学 低信噪比条件下随机共振联合小波变换的符号速率估计方法及其装置
CN109190512A (zh) * 2018-08-13 2019-01-11 成都盯盯科技有限公司 人脸检测方法、装置、设备及存储介质
CN109214436A (zh) * 2018-08-22 2019-01-15 阿里巴巴集团控股有限公司 一种针对目标场景的预测模型训练方法及装置
CN111126444A (zh) * 2019-11-28 2020-05-08 天津津航技术物理研究所 分类器集成方法
CN111598833B (zh) * 2020-04-01 2023-05-26 江汉大学 一种目标样本瑕疵检测的方法、装置及电子设备
CN112600208B (zh) * 2020-11-09 2024-04-30 国网上海能源互联网研究院有限公司 一种区域分布式能源系统的多能流潮流计算方法及系统
CN114882553A (zh) * 2022-04-21 2022-08-09 厦门大学 一种基于深度学习的微表情识别方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101101372B1 (ko) * 2011-06-08 2012-01-02 주식회사 넥스파시스템 샘플 제거 방식의 학습에 기초한 주차면 인식방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008060216A1 (de) 2008-12-04 2010-06-10 Rheinmetall Waffe Munition Gmbh Antrieb und Schnellstopp für eine Waffe mit vorzugsweise linearer Verschluss- bzw. Munitionszuführung
KR101159962B1 (ko) * 2010-05-25 2012-06-25 숭실대학교산학협력단 표정인식을 이용한 휴대 기기의 상호작용 방법
US8532390B2 (en) * 2010-07-28 2013-09-10 International Business Machines Corporation Semantic parsing of objects in video

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101101372B1 (ko) * 2011-06-08 2012-01-02 주식회사 넥스파시스템 샘플 제거 방식의 학습에 기초한 주차면 인식방법

Also Published As

Publication number Publication date
KR20160037424A (ko) 2016-04-06

Similar Documents

Publication Publication Date Title
KR101659657B1 (ko) 개선된 리얼 아다부스트 알고리즘에 근거한 새로운 멀티 뷰 얼굴감지방식
WO2022116282A1 (zh) 基于动态手势识别的人机交互方法及系统
Yang et al. Recognizing hand gestures using motion trajectories
US20120114250A1 (en) Method and system for detecting multi-view human face
WO2009109127A1 (en) Real-time body segmentation system
KR101997479B1 (ko) 사용자 인증을 위한 생체 영역을 검출하는 방법 및 장치
Dong et al. Adaptive cascade deep convolutional neural networks for face alignment
Zakaria et al. Hierarchical skin-adaboost-neural network (h-skann) for multi-face detection
EP2535787B1 (en) 3D free-form gesture recognition system and method for character input
Kawulok Energy-based blob analysis for improving precision of skin segmentation
Li et al. Robust object tracking via multi-feature adaptive fusion based on stability: contrast analysis
KR101676101B1 (ko) 동적보상퍼지신경네트워크(dcfnn)를 기반으로 한 얼굴인식 알고리즘
Lee et al. Reinforced adaboost learning for object detection with local pattern representations
WO2015037973A1 (en) A face identification method
CN113052136A (zh) 一种基于改进Faster RCNN的行人检测方法
Xu et al. A novel multi-view face detection method based on improved real adaboost algorithm
ELBAŞI et al. Control charts approach for scenario recognition in video sequences
Kalliatakis et al. DisplaceNet: Recognising displaced people from images by exploiting dominance level
Bouchrika et al. Cascaded hybrid wavelet network for hand gestures recognition
Singh Review on multibiometrics: classifications, normalization and fusion levels
Rashidan et al. Analysis of artificial neural network and Viola-Jones algorithm based moving object detection
Altun et al. Turkish fingerspelling recognition system using axis of least inertia based fast alignment
Zhang et al. A dual-kernel-based tracking approach for visual target
Thanh et al. A novel template matching method for human detection
Kundu et al. A modified RBFN based on heuristic based clustering for location invariant fingerprint recognition and localization with and without occlusion

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190902

Year of fee payment: 4