KR101598712B1 - 물체 검출을 위한 학습 방법 및 그 물체 검출 방법 - Google Patents

물체 검출을 위한 학습 방법 및 그 물체 검출 방법 Download PDF

Info

Publication number
KR101598712B1
KR101598712B1 KR1020140138878A KR20140138878A KR101598712B1 KR 101598712 B1 KR101598712 B1 KR 101598712B1 KR 1020140138878 A KR1020140138878 A KR 1020140138878A KR 20140138878 A KR20140138878 A KR 20140138878A KR 101598712 B1 KR101598712 B1 KR 101598712B1
Authority
KR
South Korea
Prior art keywords
value
object detection
learning
present
binary
Prior art date
Application number
KR1020140138878A
Other languages
English (en)
Inventor
유상희
Original Assignee
유상희
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유상희 filed Critical 유상희
Priority to KR1020140138878A priority Critical patent/KR101598712B1/ko
Application granted granted Critical
Publication of KR101598712B1 publication Critical patent/KR101598712B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • G06T7/337Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/149Segmentation; Edge detection involving deformable models, e.g. active contour models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/32Determination of transform parameters for the alignment of images, i.e. image registration using correlation-based methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

물체 검출을 위한 학습 방법은, (a-1) 이진수값(j)으로 영상의 특징점을 변환하는 단계; (b-1) 상기 (a-1) 단계의 이진수값(j)을 이용하여, 해당 이진수값(j)이 발생했을 때 분류할 수 있는 능력치인 분류 능력치값(aj)을 산출하는 단계; (c-1) 상기 (b-1) 단계에서 산출된 분류 능력치값(aj)을 소팅(Sorting)하는 단계; 및 (d-1) 상기 (c-1) 단계에서 분류 능력치값(aj)의 소팅된 값(si)의 누적합(ci)을 산출하는 단계;를 포함하는 물체 검출을 위한 학습 방법.를 포함한다. 물체 검출을 위한 학습 방법 및 그 물체 검출 방법에 따르면, 학습 데이터에 대한 압축 및 복원을 통해 요구되는 메모리 용량을 줄일 수 있다.

Description

물체 검출을 위한 학습 방법 및 그 물체 검출 방법{STUDY METHOD FOR OBJECT DETECTION AND THE OBJECT DETECTION METHOD}
본 발명은 물체 검출을 위한 학습 방법 및 그 물체 검출 방법에 관한 것으로, 더욱 상세하게는 학습 데이터의 저장을 위한 필요 메모리를 대폭 감소시킬 수 있는 물체 검출을 위한 학습 방법 및 그 물체 검출 방법에 관한 것이다.
일반적으로 카메라를 이용한 얼굴·보행자·차량과 같은 물체를 검출하는 시스템은, 검출하고자 하는 물체에 대한 학습을 수행하는 학습 단계 및 실제 물체 검출을 수행하는 검출 단계로 나누어진다.
학습 단계는 검출하고자 하는 물체에 대한 데이터(Positive Sample) 및 검출대상이 없는 데이터(Negative Sample)를 준비하는 준비 과정, 분류가 잘 되도록 특징점 변환을 수행하는 변환 과정, 의미 있는 특징점을 골라내는 학습 과정 및 학습된 결과(학습 데이터)를 저장하는 저장 과정으로 이루어진다.
검출 단계는 입력되는 영상에 대해 학습 단계에서 사용되었던 같은 특징점 변환 과정을 동일하게 수행하고 분류기(Classifier)가 저장된 학습 데이터를 이용해 물체 검출을 수행하게 된다.
특징점 변환은 여러 가지 방법이 존재하지만, 특히 MCT(Modified Census Transform) 및 LBP(Local Binary Pattern) 방법이 복잡도 대비 우수한 성능을 보이는 것으로 알려져 있다. 학습기 및 분류기 또한 여러 가지가 존재하지만 AdaBoost(Adative Boosting) 알고리즘은 학습 방법이 비교적 쉽고 분류 성능 및 실시간성이 뛰어나 많이 사용되고 있다.
그러나, MCT와 Adaboost의 조합, 또는 LBP와 Adaboost의 조합을 사용하여 물체 검출을 수행하는 시스템에서는 MCT 및 LBP에 대한 학습 데이터를 저장하기 위해 많은 용량의 메모리가 필요하게 되고 결국 제품의 단가 상승의 요인이 된다.
본 발명은 전술한 바와 같은 기술적 과제를 해결하는 데 목적이 있는 발명으로서, 학습 데이터에 대한 압축 및 복원을 통해 요구되는 메모리 용량을 줄일 수 있는 물체 검출을 위한 학습 방법 및 그 물체 검출 방법을 제공하는 것에 그 목적이 있다.
본 발명의 바람직한 일실시예에 따른 물체 검출을 위한 학습 방법은, (a-1) 이진수값(j)으로 영상의 특징점을 변환하는 단계; (b-1) 상기 (a-1) 단계의 이진수값(j)을 이용하여 해당 이진수값(j)이 발생했을 때 분류할 수 있는 능력치인 분류 능력치값(aj)을 산출하는 단계; 및 (c-1) 상기 (b-1) 단계에서 산출된 분류 능력치값(aj)을 소팅(Sorting)하는 단계;를 포함한다.
본 발명의 물체 검출을 위한 학습 방법은, 상기 j를 매핑 테이블(mi)에 저장하는 단계;를 더 포함하는 것이 바람직하다. 또한, 본 발명의 물체 검출을 위한 학습 방법은, (d-1) 상기 (c-1) 단계에서 분류 능력치값(aj)의 소팅된 값(si)의 누적합(ci)을 산출하는 단계; 및 (e-1) 상기 (d-1) 단계에서 산출된 누적합(ci)을 미리 지정된 N개의 구간으로 등분한 간격 D의 지점의 데이터(Cn)만을 저장하는 단계;를 더 포함하는 것을 특징으로 한다.
바람직하게는, 상기 (a-1) 단계의 이진수값(j)으로 영상의 특징점을 변환하는 것은, MCT(Modified Census Transform) 또는 LBP(Local Binary Pattern) 방법 중 하나에 의해 이루어지는 것을 특징으로 한다. 아울러, 상기 (b-1) 단계에서의 분류 능력치값(aj)의 산출은, AdaBoost(Adative Boosting) 알고리즘에 의해 이루어지는 것이 바람직하다.
본 발명의 바람직한 일실시예에 따른 학습된 데이터를 이용한 물체 검출 방법은, (a-2) 이진수값(j)으로 영상의 특징점을 변환하는 단계; (b-2) 학습 단계에서 소팅 이전에 산출된 이진수값(j)이 저장된 매핑 테이블(mi)을 검색하여, i를 산출하는 단계; 및 (c-2) 상기 (b-2) 단계에서 산출된 결과를 이용하여, 분류 능력치값(aj)의 추정값(
Figure 112014098041685-pat00001
)의 누적합 추정값(
Figure 112014098041685-pat00002
)을 산출하는 단계;를 포함한다. 아울러, 본 발명의 물체 검출 방법은, (d-2) 상기 누적합 추정값(
Figure 112014098041685-pat00003
)을 이용하여 분류 능력치의 추정값(
Figure 112014098041685-pat00004
)을 산출하는 단계; 및 (e-2) 상기 (d-2) 단계에서 산출된 분류 능력치값(aj)의 추정값(
Figure 112014098041685-pat00005
)을 이용하여, 물체를 검출하는 단계;를 더 포함하는 것을 특징으로 한다.
또한, 상기 (c-2) 단계는, 분류 능력치값(aj)의 소팅(Sorting)된 값(si)의 누적합(ci)에 대해 미리 지정된 N개의 구간으로 등분한 간격 D의 지점에 대해 저장된 데이터(Cn)를 이용하여, 선형 보간하는 것에 의해 누적합 추정값(
Figure 112014098041685-pat00006
)을 산출하는 것이 바람직하다.
본 발명의 물체 검출을 위한 학습 방법 및 그 물체 검출 방법에 따르면, 학습 데이터에 대한 압축 및 복원을 통해 요구되는 메모리 용량을 줄일 수 있다.
도 1은 LBP 변환 방법의 설명도.
도 2는 MCT 변환 방법의 설명도.
도 3은 본 발명의 바람직한 일실시예에 따른 물체 검출을 위한 학습 방법의 흐름도.
도 4는 본 발명의 바람직한 일실시예에 따른 학습된 데이터를 이용한 물체 검출 방법의 흐름도.
도 5는 j값에 따른 분류 능력치값(aj)을 나타낸 그래프.
도 6은 S130 단계의 소팅 후의 결과 그래프.
도 7은 소팅 후의 누적합의 결과 그래프.
도 8은 본 발명의 검증 결과 그래프.
이하, 첨부된 도면을 참조하면서 본 발명의 실시예들에 따른 물체 검출을 위한 학습 방법 및 그 물체 검출 방법에 대해 상세히 설명하기로 한다.
본 발명의 하기의 실시예는 본 발명을 구체화하기 위한 것일 뿐 본 발명의 권리 범위를 제한하거나 한정하는 것이 아님은 물론이다. 본 발명의 상세한 설명 및 실시예로부터 본 발명이 속하는 기술 분야의 전문가가 용이하게 유추할 수 있는 것은 본 발명의 권리 범위에 속하는 것으로 해석된다.
일반적으로 카메라를 이용한 얼굴·보행자·차량과 같은 물체를 검출하는 시스템의 경우, 영상을 입력받아 특징점 변환을 수행 후 검출 단계를 거쳐 결과를 출력한다. 분류기는 메모리로부터 학습 데이터를 읽어서 특징점과의 비교 및 연산을 통해 분류 결과를 출력하게 된다.
본 발명에 대한 구체적인 설명에 앞서, 특징점 변환 방법 및 분류기에 대해 설명하기로 한다.
특징점 변환 방법
물체를 분류하기 쉽도록 변환해 주는 특징점 변환은 여러 가지 방법이 존재하지만, 특히 LBP(Local Binary Pattern) 및 MCT(Modified Census Transform) 방법이 복잡도 대비 성능 면에서 우수한 성능을 보이는 것으로 알려져 많이 사용되고 있다.
(1) LBP
도 1은 LBP 변환 방법의 설명도이다.
LBP 변환 방법은, 영상의 각 픽셀 주변 3×3 영역의 상대적인 밝기에 대한 차이 값을 이진수로 코딩한 값이다. 즉, 중앙 픽셀보다 밝으면 1, 어두우면 0으로 하여 이 값들을 연결한 이진수 형태를 취한다.
(2) MCT
도 2는 MCT 변환 방법의 설명도이다.
MCT 변환 방법도, LBP 변환 방법과 유사하지만 3×3 영역의 중간값도 고려하는 방법이다. 역치(Threshold)는 3×3 영역 전체의 평균값이 되고 이를 기준으로 밝으면 1, 어두우면 0으로 표현하는 방법이다.
학습기 및/또는 분류기
학습기 및 분류기 또한 여러 가지가 존재하지만 AdaBoost 알고리즘은 학습 방법이 비교적 쉽고 분류 성능 및 실시간성이 뛰어나 많이 사용되고 있다.
AdaBoost는 잘못 분류된 샘플(Sample)에 대해 더 높은 가중치를 부여하여 다음번 학습 시에 분류가 잘 되도록 가중치를 제어하는 방법이다. 여기서 Boosting 은 여러 개의 약분류기(Weak classifier)를 합쳐서 하나의 강분류기(Strong classifier)를 만드는 알고리즘이다.
(1) 약분류기
물체 검출에 사용되는 LBP 또는 MCT 이외의 특징값들은 연속성을 띄는 경우가 많다. 예를 들어 밝기 정보나 에지(Edge), 색상값 등과 같은 경우가 이에 속한다. 하지만 LBP 또는 MCT는 그 특성상 불연속 특징값(binary)을 출력하게 된다. 즉, 특징값에 대해 수치로 표현하는 것이 무의미함을 뜻한다. 표현할 수 있는 경우의 수는, 3×3 영역을 기준으로 했을 때 LBP의 경우는 256가지이고 MCT의 경우에는 512개에 불과하다. 결국 역치(Threshold)를 적용하여 물체를 분류하는 것이 불가능하므로 이러한 불연속 특성을 지닌 특징값에 대해서는 해당 특징(binary)이 발생했을 때 분류할 수 있는 능력치를 매핑(Mapping)하는 방식을 사용한다.
약분류기의 출력값 fm(x)는 아래 [수학식 1]로 표현할 수 있다.
Figure 112014098041685-pat00007
[수학식 1]에서 aj는 해당 이진수값(xk)이 발생했을 때 분류할 수 있는 능력치인 분류 능력치값을, xk는 특징점 변환결과 출력되는 이진수값을 나타내며, J는 이진수(binary)가 표현할 수 있는 최대 개수로 LBP일 때가 256, MCT일 때는 512 값을 가진다. 하나의 약분류기에 필요한 메모리의 비트(bit) 수는 [수학식 2]와 같이 표현할 수 있다.
Figure 112014098041685-pat00008
[수학식 2]에서, Bw은 하나의 aj를 표현하는데 필요한 비트 수이다. Bw는 너무 작을 경우에는 검출 성능에 영향을 미치게 되므로 일반적으로 소수점을 표현할 수 있는 형태인 32비트 또는 64비트가 주로 사용된다.
(2) 강분류기
[수학식 1]을 메모리 용량 관점에서 보면 한 개의 약분류기는 J개의 능력치 값을 저장하고 있어야 한다는 것을 의미한다. 강분류기는 여러 개의 약분류기의 조합이므로 하나의 강분류기에 필요한 메모리의 비트 수는 [수학식 3]으로 표현할 수 있다.
Figure 112014098041685-pat00009
[수학식 3]에서, nw는 약분류기의 갯수를 나타낸다.
하기에 본 발명의 물체 검출을 위한 학습 방법 및 그 물체 검출 방법에 대해 구체적으로 설명하기로 한다. 본 발명은 불연속적인 aj(학습 데이터)들에 대해 연속성을 띄도록 하여 메모리 용량을 줄이는 것에 그 주요 사상이 있다.
도 3은 본 발명의 바람직한 일실시예에 따른 물체 검출을 위한 학습 방법의 흐름도를 나타낸다. 또한, 도 4는 본 발명의 학습된 데이터를 이용한 물체 검출 방법의 흐름도이다. 도 3 및 도 4로부터 알 수 있는 바와 같이, 학습 단계에서는 압축하고, 검출 단계에서는 도 4와 같은 복원 과정을 통해 추정치(
Figure 112014098041685-pat00010
)를 구하게 된다.
하기에 본 발명의 물체 검출을 위한 학습 방법 및 학습된 데이터를 이용한 물체 검출 방법에 대해 보다 구체적으로 설명하기로 한다.
물체 검출을 위한 학습 방법
도 3으로부터 알 수 있는 바와 같이, 본 발명의 바람직한 일실시예에 따른 물체 검출을 위한 학습 방법은, 이진수값(j)으로 영상의 특징점을 변환하는 단계(S110), S110 단계의 이진수값(j)을 이용하여 0 내지 J-1까지의 J개의 분류 능력치값(aj)을 산출하는 단계(S120) 및 S120 단계에서 산출된 분류 능력치값(aj)을 소팅(Sorting)하는 단계(S130)를 포함한다. J는 S120 단계에서의 이진수값이 표현할 수 있는 최대수를 의미하고, LBP 방식에서는 256을, MCT 방식에서는 512가 된다. 또한, S110 단계에서의 이진수값(j)으로 영상의 특징점을 변환하는 것은, 상술한 MCT 또는 LBP 방법 중 하나에 의해 이루어지는 것이 바람직하다. 아울러, S120 단계에서의 분류 능력치값(aj)의 산출은, AdaBoost 알고리즘에 의해 이루어지는 것을 특징으로 한다.
아울러, 본 발명의 바람직한 일실시예에 따른 물체 검출을 위한 학습 방법은, S130 단계에서 분류 능력치값(aj)의 소팅된 값(si)의 누적합(ci)을 산출하는 단계(S140) 및 S140 단계에서 산출된 누적합(ci)을 미리 지정된 N개의 구간으로 등분한 간격 D의 지점의 데이터(Cn)만을 저장하는 단계(S150)를 더 포함하는 것을 특징으로 한다. 즉, S150 단계는 산출된 누적합(ci)을 압축하여 저장한다.
또한, 본 발명의 바람직한 일실시예에 따른 물체 검출을 위한 학습 방법은, 이진수값(j)을 인덱스로 매핑 테이블(mi)에 저장하는 단계(S160)를 더 포함하는 것이 바람직하다.
도 5는 j값에 따른 분류 능력치값(aj)을 나타낸 그래프이다.
도 5로부터 알 수 있는 바와 같이, S120 단계에서 산출된 분류 능력치값(aj)은, 이진수값, 즉 j값에 대해 상관 관계를 가지지 않는다. 도 5에서, x축은 j이고 y축이 aj를 표현한다. 이와 같이 상관 관계가 없는 값에 대해 연속적인 형태로 만들기 위해서 먼저 [수학식 4]와 같은 S130 단계의 소팅 과정을 거친 후, [수학식 5]와 같은 S140 단계의 누적합(Cumulative summation, ci)을 산출하는 과정을 추가적으로 수행할 필요가 있는 것이다.
Figure 112014098041685-pat00011
[수학식 4]에서 sj는 소팅 과정을 거친 후의 결과이며, sort()는 소팅(Sorting)을 수행하는 함수이다.
도 6은 S130 단계의 소팅 후의 결과를 나타낸다.
도 6과 같이 sj는 아직 연속적이지 못한 형태를 취하므로 근사화하기에는 아직 어려움이 따른다. 따라서 추가적으로 소팅된 값(si)에 대한 S140 단계의 누적합 과정을 거치게 되고 이 과정을 [수학식 5]와 같이 표현할 수 있다.
Figure 112014098041685-pat00012
S140 단계 이후에 도 7과 같은 연속적인 형태의 그래프를 얻을 수 있다.
연속적인 형태의 그래프는 최소자승법을 이용한 근사화를 통해 저장하는 데이터 용량을 줄일 수도 있지만, 본 발명에서는 S150 단계에서 이를 일정한 간격으로 나누어서 선형 보간하는 방법을 사용한다.
S150 단계의 선형 보간 방법에 대해 설명하기로 한다.
J를 N 등분했을 때의 구간의 간격을 D라 정의하면, D는 [수학식 6]과 같이 나타낼 수 있다.
Figure 112014098041685-pat00013
[수학식 6]에서, floor()는 정수 부분만을 취하는 함수이다.
도 7에서, '*' 으로 표현한 것은 J 를 일정한 간격 D로 나누었을 때의 누적합(ci)을 표현한 것이고, 이 값(Cn)들을 최종적인 학습 데이터로서 [수학식 7]과 같이 저장하게 된다.
Figure 112014098041685-pat00014
추가적으로 정의해야 할 사항으로는 Cn을 저항하기 위한 비트 수인데 이를 Bc라 정의하면, [수학식 8]과 같이 나타낼 수 있다.
Figure 112014098041685-pat00015
최종적으로 하나의 약분류기에 필요한 메모리의 비트 수는 [수학식 9]와 같이 된다.
Figure 112014098041685-pat00016
학습 단계에서 복원을 위한 인덱스(Index)를 저장해야 하는데, S130 단계의 소팅 단계 이전의 인덱스인 이진수값(j)이 어느 위치에 존재하는지를 테이블(Table)로 S160 단계에서 기록해 두어야 한다. 이를 매핑 테이블(Mapping table) mi라 정의하고 [수학식 10]과 같이 표현할 수 있다.
Figure 112014098041685-pat00017
다음으로, 하기에 본 발명의 학습된 데이터를 이용한 물체 검출 방법에 대해 구체적으로 설명하기로 한다.
학습된 데이터를 이용한 물체 검출 방법
도 4로부터 알 수 있는 바와 같이, 본 발명의 바람직한 일실시예에 따른 학습된 데이터를 이용한 물체 검출 방법은, 영상의 특징점을 변환하여, 수행한 결과인 이진수값(j)을 구하는 단계(S210) 및 학습 단계에서 소팅 이전에 산출된 이진수값(j)이 저장된 매핑 테이블(mi)을 검색하여, i를 산출하는 단계(S220)를 포함한다.
즉, S220 단계는 현재의 물체 검출 방법에서 산출된 이진수값(j)에 해당하는 i를 구하는 것으로, 이전 학습 단계에서 저장된 이진수값(j)과 i값의 테이블을 이용하는 것이다.
또한, 본 발명의 학습된 데이터를 이용한 물체 검출 방법은, S220 단계에서 산출된 결과를 이용하여, 분류 능력치값(aj)의 추정값(
Figure 112014098041685-pat00018
)의 누적합 추정값(
Figure 112014098041685-pat00019
)을 산출하는 단계(S230) 및 S230 단계에서 산출된 누적합 추정값(
Figure 112014098041685-pat00020
)을 이용하여 분류 능력치값(aj)의 추정값(
Figure 112014098041685-pat00021
)을 산출하는 단계(S240)을 더 포함하는 것이 바람직하다. 아울러, 본 발명의 학습된 데이터를 이용한 물체 검출 방법은, 최종적으로 S240 단계에서 산출된 분류 능력치의 추정값(
Figure 112014098041685-pat00022
)을 이용하여, 물체를 검출하는 단계(S250)를 포함한다. S250 단계는, AdaBoost 알고리즘에 의해 이루어질 수 있다. 또한, S210 단계는, MCT 또는 LBP 방법 중 하나에 의해 이루어지는 것이 바람직하다.
S230 단계는 i 에 대한
Figure 112014098041685-pat00023
및 i-1 에 대한
Figure 112014098041685-pat00024
을 각각 아래 과정을 통해 산출하는 것에 의해 이루어질 수 있다.
먼저, i를 이용해 [수학식 11]에 의해 n을 산출한다(S231).
Figure 112014098041685-pat00025
다음으로, 선형 보간을 위한 보간 계수를 [수학식 12]와 같이 산출한다(S232).
Figure 112014098041685-pat00026
그리고,
Figure 112014098041685-pat00027
는 [수학식 13]과 선형 보간법을 사용하여 산출한다(S233).
Figure 112014098041685-pat00028
최종적으로 구하고자 하는 aj의 추정치
Figure 112014098041685-pat00029
는, [수학식 14]에 의해 산출된다(S234).
Figure 112014098041685-pat00030
상술한 본 발명의 물체 검출을 위한 학습 방법 및 그 물체 검출 방법을 검증해 보기로 한다.
검증
검증을 위해
Figure 112014098041685-pat00031
Figure 112014098041685-pat00032
에 대한 소팅한 결과로 정의하면 [수학식 15]와 같다.
Figure 112014098041685-pat00033
도 8은 본 발명의 검증 결과 그래프를 나타낸다. 도 8에서 si(파란색) 및
Figure 112014098041685-pat00034
(붉은색)를 각각 표현한다. 도 8로부터 복원된 결과가 압축되기 이전의 값을 추정하기에 무리가 없음을 알 수 있다.
상술한 바와 같은 본 발명과 종래 방법과의 차이를 요약하면 다음과 같다.
기존의 방법에서는 하나의 약분류기에 대한 aj값들을 필요한 비트만큼 모두 저장하지만, 본 발명에서는 시스템의 검출 성능을 고려해서 N을 적절히 설정해 주면 메모리의 용량을 줄일 수 있는 방법을 제시한다.
예를 들어 MCT 특징점으로 사용하고 aj를 표현하기 위해 32비트를 사용하는 시스템의 경우에 하나의 약분류기에 필요한 메모리 용량은 아래와 같다.
기존 방법 :
Figure 112014098041685-pat00035

본 발명 :
N을 임의로 32 로 정했을 경우, Bc를 [수학식 8]에 의해 하기와 같이 산출할 수 있다.
Figure 112014098041685-pat00036
최종적으로 본 발명에서 필요한 비트 수를 계산하기 위해 [수학식 10]을 적용하면
Figure 112014098041685-pat00037
이 된다.
하기 [표 1]은 본 발명과 기존 방법에서 필요로 하는 메모리 용량의 비교표이다.
단위 압축 전(기존 방법) 압축 후(본 발명
비트수 16384 5920
기존 방법에서 필요한 메모리 용량과 본 발명에서 제안하는 방법에 의한 용량을 비교해 보면 제안하는 방법이 기존 방법 대비 약 64%의 절감 효과를 가지는 것을 알 수 있다.
발명의 적용예
본 발명을 이용해 실제 얼굴 검출에 적용해 보았다. 얼굴 검출 성능을 평가하기 위한 지표로 많이 이용되는 CMU/MIT 테스트 영상들을 기준으로 하였고, 이때 오검출율이 동일하도록 강분류기의 역치(Threshold)를 조절하였다.
[표 2]는 N값을 변경시키면서 검출 성능을 검증한 결과이다.
비 고 얼굴 검출율
기존 방법 0.792
제안하는 방법
Figure 112014098041685-pat00038
= 8
0.683
Figure 112014098041685-pat00039
= 16
0.758
Figure 112014098041685-pat00040
= 32
0.791
Figure 112014098041685-pat00041
= 64
0.793
Figure 112014098041685-pat00042
= 128
0.793
상술한 바와 같이, 본 발명의 물체 검출을 위한 학습 방법 및 그 물체 검출 방법에 따르면, 학습 데이터에 대한 압축 및 복원을 통해 요구되는 메모리 용량을 줄일 수 있다.

Claims (9)

  1. (a-1) 이진수값(j)으로 영상의 특징점을 변환하는 단계;
    (b-1) 상기 (a-1) 단계의 이진수값(j)을 이용하여, 해당 이진수값(j)이 발생했을 때 분류할 수 있는 능력치인 분류 능력치값(aj)을 산출하는 단계;
    (c-1) 상기 (b-1) 단계에서 산출된 분류 능력치값(aj)을 소팅(Sorting)하는 단계; 및
    (d-1) 상기 (c-1) 단계에서 분류 능력치값(aj)의 소팅된 값(si)의 누적합(ci)을 산출하는 단계;를 포함하는 물체 검출을 위한 학습 방법.
  2. 제1항에 있어서,
    상기 물체 검출을 위한 학습 방법은,
    상기 j를 매핑 테이블(mi)에 저장하는 단계;를 더 포함하는 것을 특징으로 하는 물체 검출을 위한 학습 방법.
  3. 삭제
  4. 제1항에 있어서,
    상기 물체 검출을 위한 학습 방법은,
    (e-1) 상기 (d-1) 단계에서 산출된 누적합(ci)을 미리 지정된 N개의 구간으로 등분한 간격 D의 지점의 데이터(Cn)만을 저장하는 단계;를 더 포함하는 것을 특징으로 하는 물체 검출을 위한 학습 방법.
  5. 제1항 또는 제2항 중 어느 한 항에 있어서,
    상기 (a-1) 단계의 이진수값(j)으로 영상의 특징점을 변환하는 것은,
    MCT(Modified Census Transform) 또는 LBP(Local Binary Pattern) 방법 중 하나에 의해 이루어지는 것을 특징으로 하는 물체 검출을 위한 학습 방법.
  6. 제1항 또는 제2항 중 어느 한 항에 있어서,
    상기 (b-1) 단계에서의 분류 능력치값(aj)의 산출은,
    AdaBoost(Adative Boosting) 알고리즘에 의해 이루어지는 것을 특징으로 하는 물체 검출을 위한 학습 방법.
  7. 삭제
  8. 삭제
  9. 삭제
KR1020140138878A 2014-10-15 2014-10-15 물체 검출을 위한 학습 방법 및 그 물체 검출 방법 KR101598712B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140138878A KR101598712B1 (ko) 2014-10-15 2014-10-15 물체 검출을 위한 학습 방법 및 그 물체 검출 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140138878A KR101598712B1 (ko) 2014-10-15 2014-10-15 물체 검출을 위한 학습 방법 및 그 물체 검출 방법

Publications (1)

Publication Number Publication Date
KR101598712B1 true KR101598712B1 (ko) 2016-02-29

Family

ID=55448576

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140138878A KR101598712B1 (ko) 2014-10-15 2014-10-15 물체 검출을 위한 학습 방법 및 그 물체 검출 방법

Country Status (1)

Country Link
KR (1) KR101598712B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080065866A (ko) * 2007-01-10 2008-07-15 삼성전자주식회사 확장 국부 이진 패턴을 이용한 얼굴 기술자 생성 방법 및장치와 이를 이용한 얼굴 인식 방법 및 장치
KR20110057595A (ko) * 2009-11-24 2011-06-01 포항공과대학교 산학협력단 상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법, 장치 및 그 기록 매체
JP2013097583A (ja) * 2011-11-01 2013-05-20 Nec Corp 特徴量生成装置、方法及びプログラム
JP2013182494A (ja) * 2012-03-02 2013-09-12 Yamaha Motor Co Ltd 対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080065866A (ko) * 2007-01-10 2008-07-15 삼성전자주식회사 확장 국부 이진 패턴을 이용한 얼굴 기술자 생성 방법 및장치와 이를 이용한 얼굴 인식 방법 및 장치
KR20110057595A (ko) * 2009-11-24 2011-06-01 포항공과대학교 산학협력단 상호 정보 최대화 기반의 국부 이진 패턴 코드를 이용한 패턴 인식 방법, 장치 및 그 기록 매체
JP2013097583A (ja) * 2011-11-01 2013-05-20 Nec Corp 特徴量生成装置、方法及びプログラム
JP2013182494A (ja) * 2012-03-02 2013-09-12 Yamaha Motor Co Ltd 対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両

Similar Documents

Publication Publication Date Title
US10607089B2 (en) Re-identifying an object in a test image
Moorthy et al. Statistics of natural image distortions
TWI426774B (zh) 用於針對jpeg壓縮歷史紀錄分類為壓縮影像的方法、及用於針對影像是否已經過jpeg壓縮而分類影像的設備及影像分類方法
US8712154B2 (en) Image processing system and method
JP2004348674A (ja) 領域検出方法及びその装置
WO2017080196A1 (zh) 基于人脸图像的视频分类方法和装置
CN103177099B (zh) 视频比对方法及系统
TWI628623B (zh) 全天候熱影像式行人偵測方法
CN110807756A (zh) 用于检测图像中的车辆光的装置和方法
KR101598712B1 (ko) 물체 검출을 위한 학습 방법 및 그 물체 검출 방법
Jiang et al. The game of countering JPEG anti-forensics based on the noise level estimation
US20200151864A1 (en) Method and device for analyzing image sections for a correspondence calculation
Sarkar et al. Universal skin detection without color information
Anwar et al. Classification of foggy images for vision enhancement
Taha et al. Moving shadow removal for multi-objects tracking in outdoor environments
CN104636495B (zh) 一种基于内容的视频检索方法
KR102263573B1 (ko) 하알 대조 특징을 이용한 카메라 영상의 대상물 검출 방법
KR100893086B1 (ko) 조명 변화에 강인한 얼굴 검출 방법
JP7279817B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
CN113542771A (zh) 一种基于内容权重的视频高效压缩处理方法
Zhang et al. Local binary pattern statistics feature for reduced reference image quality assessment
US20150003728A1 (en) Image processing apparatus
Hsu et al. Combination of SSIM and JND with content-transition classification for image quality assessment
KR20150055481A (ko) 영상 내 그림자 화소 제거를 위한 배경 기반 방법
Varma et al. Hybrid background subtraction in video using bi-level codebook model

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20181203

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20191202

Year of fee payment: 5