KR20100065677A - 고해상도 영상에서의 효과적인 움직이는 다중 물체 검출 방법 및 시스템 - Google Patents

고해상도 영상에서의 효과적인 움직이는 다중 물체 검출 방법 및 시스템 Download PDF

Info

Publication number
KR20100065677A
KR20100065677A KR1020080124121A KR20080124121A KR20100065677A KR 20100065677 A KR20100065677 A KR 20100065677A KR 1020080124121 A KR1020080124121 A KR 1020080124121A KR 20080124121 A KR20080124121 A KR 20080124121A KR 20100065677 A KR20100065677 A KR 20100065677A
Authority
KR
South Korea
Prior art keywords
model
value
processing
image
image data
Prior art date
Application number
KR1020080124121A
Other languages
English (en)
Inventor
원종호
고은진
배창석
Original Assignee
한국전자통신연구원
(주)리캠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원, (주)리캠 filed Critical 한국전자통신연구원
Priority to KR1020080124121A priority Critical patent/KR20100065677A/ko
Priority to US12/615,590 priority patent/US20100142809A1/en
Publication of KR20100065677A publication Critical patent/KR20100065677A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/20Adaptations for transmission via a GHz frequency band, e.g. via satellite
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/67Circuits for processing colour signals for matrixing

Abstract

본 발명은 고해상도 영상에서 움직이는 다중 물체를 검출하는 방법 및 장치에 관한 것으로서 일반 영상 수집 장치를 이용하여 화면에서 움직이는 물체에 대한 검출을 수행한다. 통계학적인 방법을 이용하여 실외 환경에서 나뭇잎의 움직임이나 물결의 반사와 같은 실제 움직이는 물체가 아닌 배경을 효과적으로 제거하는 방법을 제공하며, 고해상도 영상의 고속 처리를 위해 일반적인 컴퓨터에 장착된 GPU를 활용하는 것을 특징으로 한다.
본 발명에서 제공되는 가우시안 혼합 모델(GMM) 기반 영상 데이터 처리 방법은, 영상 데이터를 수집하는 단계; 각 모델의 표준편차, 분산, 평균, 가중치에 대해 초기화를 수행하는 단계; 입력 영상을 목적에 맞는 색공간으로 변환하는 단계; 상기 변환된 색공간에 기반하여 영상 데이터를 처리하는 단계를 포함한다.
가우시안 혼합 모델, 물체 검출, 가중치

Description

고해상도 영상에서의 효과적인 움직이는 다중 물체 검출 방법 및 시스템{Method for detection of multi moving objects in the high resolution image sequences and system thereof}
본 발명은 영상에서 효과적인 다중 물체 검출 방법에 관한 것으로, 더욱 상세하게는 고해상도 영상 수집 장치와 GPU(Graphics Processing Unit)를 이용하여 움직이는 다수의 물체를 동시에 검출할 수 있는 방법에 관한 것이다.
일반적인 움직이는 물체 검출 방법은 감시 시스템, 무인 차량, 물체 인식 등과 같은 다양한 응용분야에서 물체 추적의 중요한 사전단계로 사용된다. 종래에는 배경과의 단순한 차영상 기법만을 사용하여, 실외환경에서 그림자가 서서히 움직인다던가 나뭇잎의 움직임, 물결에서 반사된 빛에 의해서 잘못된 검출을 많이 보여왔다. 또한 이웃한 프레임과의 차이를 이용한 모션 검출 기법과 같은 방법의 물체 추적은 잠시라도 물체가 움직이지 않거나 움직임이 느리면 검출하지 못하는 단점을 가지고 있다.
따라서 이와 같은 단점을 극복하기 위해 배경을 가우시안 혼합으로 모델링하고, 모델 변수를 실시간 학습하는 GMM(Gaussian Mixture Model)과 같은 방법이 제 안되었지만 그러한 기술로도 움직이는 나뭇잎과 물결 등에 간간이 나타나는 잘못된 검출 문제가 완전히 해결된 것은 아니며, 고정된 분산 경계값을 사용하거나 모든 채널이 같은 분포를 가지고 있다고 가정하여 각 채널에 동등한 가중치를 주는 방법은 효과적인 물체 검출에 한계를 가지고 있었다. 또한 각 화소(pixel) 마다 여러 개의 가우시간 분포를 채널의 수만큼 처리해야 했기 때문에 상당히 많은 연산량을 필요로 하였으며 고해상도 영상에서의 실시간 물체 추적에 적용하기에는 무리가 있었다.
본 발명은 전술한 문제점을 해결하기 위하여 안출된 것으로, 통계학적인 방법을 이용하여 지속적인 움직임이 있는 배경을 효과적으로 제거하고, 고해상도 영상의 고속 처리가 가능한 물체 검출 방법 및 시스템을 제공하는 것이 목적이다.
본 발명의 일 측면에 따르면, 가우시안 혼합 모델(GMM) 기반 영상 데이터 처리 방법으로서, 영상 데이터를 수집하는 단계; 각 모델의 표준편차, 분산, 평균, 가중치에 대해 초기화를 수행하는 단계; 입력 영상을 목적에 맞는 색공간으로 변환하는 단계; 상기 변환된 색공간에 기반하여 영상 데이터를 처리하는 단계를 포함하는 영상 데이터 처리 방법이 제공된다.
상기 영상 데이터를 처리하는 단계에서는, 입력 영상의 영상 채널별로 가중치를 설정하여 채널반영 거리값(Dist)를 산출할 수 있다.
상기 영상 데이터를 처리하는 단계에서는, 상기 산출된 채널반영 거리값에 기반하여 픽셀을 배경 또는 물체로 분류할 수 있다.
또한, 상기 영상 데이터를 처리하는 단계는, 복수의 모델을 분산이 작은 순서로 배열하는 단계; 상기 채널반영 거리값을 사전설정된 경계값(S)과 대조하는 단계;상기 대조 결과에 따라, 픽셀을 배경 또는 움직이는 물체로 분류하는 단계를 포함할 수 있다.
상기 영상 데이터를 처리하는 단계는, 상기 대조 결과에 따라, 사전 설정된 조건을 만족하는 모델의 평균, 분산, 표준편차, 가중치를 수정하는 단계를 더 포함할 수 있다.
상기 수정하는 단계에서는, 모델의 표준편차가 사전설정된 값(D) 이상인 범위 내에서 수행되도록 할 수 있다.
상기 수정된 가중치는 정규화를 거쳐 각 모델의 가중치 합이 1이 되도록 할 수 있다.
상기 분류하는 단계는, 상기 채널반영 거리값이 상기 경계값(S)보다 작을 경우, 상기 모델의 가중치의 합이 사전설정된 값보다 크면 픽셀을 배경으로 분류하고, 상기 모델의 가중치의 합이 사전설정된 값보다 크지 않으면 픽셀을 물체로 분류하며, 상기 채널반영 거리값이 상기 경계값(S)보다 크거나 같을 경우, 다음 순서의 모델에 대해 채널반영 거리값을 산출하며, 상기 채널반영 거리값이 산출된 모델이 마지막 순서라고 판단되면, 픽셀을 물체로 분류하도록 할 수 있다.
상기 대조하는 단계는, 각 모델의 픽셀 변화량에 따라 다른 경계값(S)을 적용하도록 할 수 있다.
상기 경계값(S)은 픽셀의 변화가 작을 경우에는 작은 값을, 픽셀의 변화가 클 경우에는 큰 값을 적용하도록 할 수 있다.
상기 영상 데이터 처리 방법은, 상기 표준편차, 분산 평균, 가중치를 포함한 데이터를 주 메모리에서 범용 GPU의 메모리로 복사하는 단계를 더 포함할 수 있다.
또한, 상기 처리 완료된 데이터를 상기 범용 GPU의 메모리에서 상기 주 메모리로 복사하는 단계를 더 포함할 수도 있다.
상기 영상 데이터 처리 방법은, 상기 처리된 영상 데이터의 노이즈를 제거하기 위해 후처리하는 단계를 더 포함할 수 있다.
상기 후처리하는 단계는, 모폴로지 기법을 이용하여 수행될 수 있다.
본 발명의 일 측면에 따르면, 물체 검출 시스템은 입력된 영상의 색공간을 영상 채널별 가중치가 부여되는 목적 색공간으로 변환하는 색공간 변환부; 상기 가중치에 기반하여 입력 영상의 데이터를 처리하는 데이터 처리부; 상기 처리된 영상에서 노이즈를 제거하여 움직이는 물체를 부각시키는 후처리부를 포함할 수 있다.
상기 후처리부는 모폴로지 기법을 사용할 수 있다.
상기 데이터 처리부는 범용 GPU를 포함할 수도 있으며, 상기 데이터 처리부의 외부에서 접속되도록 구성될 수도 있다.
본 발명에 따른 다중 물체 검출 방법에 따르면, 나뭇잎이나 물결 등의 지속적으로 움직이는 배경에서 움직이는 물체만을 효과적으로 분리해 낼 수 있으므로, 여러 악조건 속에서도 실제로 움직이는 물체만을 부각하여 정확한 다중 물체 추적이 가능한 효과가 있다. 또한, 고해상도 영상을 이용하는 경우 생기게 되는 속도 저하를 별도의 장비를 추가함이 없이 GPU를 이용하여 해결함으로써 일반적인 컴퓨터에서도 더 넓은 범위의 영역에서 더 정밀한 감시를 신속하게 수행할 수 있는 효과가 있다.
움직이는 물체를 검출하는 것은 영상 감시 또는 물체 추적을 구현하기 위한 일련의 단계에서 첫 단계에 해당한다. 따라서, 지능형 영상 처리 또는 지능형 영상 추적의 구현을 위해서는 이러한 물체 검출의 정확성 및 효율성이 보장되어야 한다. 물체 검출을 위한 방법으로는, 배경과 객체의 밝기의 차이를 이용하는 배경 분리법(background subtraction)과 연속된 두 영상 프레임을 비교하여 그 차이에서 움직임을 찾는 프레임 차이법(frame difference) 등이 있다.
배경 분리법은 움직이는 물체 검출에 널리 사용되는 방법으로서, 배경이 복잡하고 변화가 심한 경우, 배경을 실시간으로 얼마나 정확하게 학습하는가가 물체 검출의 정확도를 결정하게 된다. 가우시안 혼합 모델(Gaussian Mixture Model:GMM)은 이러한 배경의 모델링에 가장 많이 쓰이는 방법으로서, 확률적 학습 방법을 사용하게 되는데, 영상의 각 화소의 밝기 분포를 가우시안 혼합모델을 사용하여 근사화하고, 근사화된 모델 변수값을 이용하여 측정된 화소가 배경과 객체 중 어디에 속할지를 판단하게 된다. 따라서, 이에 기반한 물체 검출방법에서는 배경을 효과적으로 실시간 갱신하는 것이 중요하다고 할 수 있다.
본 발명에서는 각 영상을 구성하는 채널에 대해, 통계적인 방법을 이용한 통계적 모델링과 각 채널의 특성을 반영하여 위해 채널별 가중치를 부여한 데이터 처리를 결합하여 배경을 정확하게 모델링하고 물체를 검출할 수 있는 방법 및 시스템을 제안한다. 본 발명에서 채널이라 함은 영상을 구성하는 색상 또는 밝기 등의 속성 요소들을 의미한다. 이와 같은 영상 채널의 각각에 대한 가중치를 다르게 함으로써 색상의 변화나 밝기의 변화를 강조하는 등, 각 색공간의 특징을 살릴 수 있으며 더욱 정확한 결과를 얻을 수 있게 된다.
도 1은 본 발명에 따른 다중 물체 검출 시스템을 보여준다. 다중 물체 검출 장치(1)는 영상 수집 장치(5)로부터 입력받은 영상의 색공간을 처리하기 용이한 색공간으로 변환하는 색공간 변환부(2), 입력 영상의 데이터를 처리하는 데이터 처리부(3), 결과 영상에서 효과적으로 노이즈(noise)를 제거하고 움직인 물체는 더욱 부각시키는 후처리부(4)를 포함한다. 다중 물체 검출 장치에 입력 영상을 제공하는 영상수집장치(5)는 다중 물체 검출 시스템과 분리된 별개의 장치일 수 있으나, 다중 물체 검출 시스템에 통합될 수도 있다.
색공간 변환부(2)는, 일반적으로 가우시간 모델을 사용할 때, 각 채널이 같은 분포를 이루고 있다고 가정하고 같은 가중치를 부여하여 처리하는 것을 향상시키기 위해서 입력 영상의 색공간을 처리가 용이한 색공간으로 변환한다. 변환될 목적 색공간은 특정 색공간으로 정해진 것은 아니며 각 목적에 맞게 여러 가지 색공간을 사용할 수 있다. 예를 들어, 화소의 색상을 하나의 채널로 사용하는 HSV 와 같은 색공간이나 밝기를 하나의 채널로 사용하는 YUV 등과 같은 색공간을 사용할 수 있다. 일반적으로 RGB 색공간을 YUV 색공간으로 변환하는 수식은 다음과 같다.
Figure 112008084450979-PAT00001
YUV 에서 Y는 각 화소의 밝기를 의미하여 밝기에 더욱 민감한 물체 추적 시스템을 목적으로 할 때 이 Y 채널에 더 높은 가중치를 주어 목적을 달성할 수 있으며, 이러한 방법은 고해상도 영상에만 적용되는 것이 아니라 일반적인 물체 검출 방법에 사용될 수 있다.
데이터 처리부(3)는 상기 색공간 변환부(2)로부터 색공간 변환된 입력 영상의 데이터를 효과적으로 처리하여 움직이는 물체를 배경에서 분리해 내는 역할을 한다. 이러한 프로세스는 컴퓨터 내에 장착된 범용 GPU를 이용하여 수행될 수 있다. 먼저 물체를 추적하는 내내 유지할 정보들에 대한 메모리를 할당하는데 있어서 각 픽셀은 채널의 개수와 유지해야 할 정규 분포의 개수를 곱한 수만큼의 GMM을 할당한다. 따라서 C를 입력 영상의 채널, W를 입력 영상의 넓이, H를 입력 영상의 높이, K를 유지해야 할 가우시안 모델의 개수, N을 각 모델에서 사용하는 부가 정보의 개수라고 할 때, 일반적으로 W*H*K*(C+N) 개의 메모리 공간이 필요하며 N은 표준 편차, 분산, 모델의 가중치와 같은 3개의 값 등으로 구성된다. 그러나 이러한 모델은 각 응용에 따라 다른 모양으로 구성될 수도 있다.
후처리부(4)는 데이터 처리부의 결과 영상에서 노이즈를 제거하고 움직이는 물체를 더욱 부각시키는 기능을 한다. 일반적으로 배경 분리법을 이용한 연산 후에 이루어지는 영상 이진화 과정에서는 상당한 노이즈가 발생하게 되며 이는 물체 검출의 정확도에 영향을 미치게 된다. 종전에는 이러한 목적을 위해 마르코프 랜덤 필드와 같은 연산이 사용되었지만 이것은 연산량이 많으므로 간단한 모폴로지 연산 방법을 이용하여, 움직이는 물체로 분류된 픽셀의 주변에 다른 움직이는 물체로 분류된 픽셀들의 밀도가 낮으면 이것을 제거하고 밀도가 높으면 주변의 배경으로 분류된 구멍까지도 움직이는 물체의 픽셀로 분류한다. 여러 연산 방법 중 속도를 고려하여 가장 간단한 방법은 Erode 연산과 Dilate 연산을 적절히 섞어서 사용하는 것이다. 이러한 후처리 방법은 고해상도 영상이 아닌 일반적인 응용에도 그대로 적 용될 수 있다.
도 2는 본 발명에 따른 데이터 처리부를 보다 상세히 도시한 것이다. 데이터 처리부(3)는 CPU(6), 메모리(7), GPU(8)를 포함하며, GPU(8)는 도2(a)와 같이 데이터 처리부(3)에 통합되거나 도2(b)와 같이 데이터 처리부의 외부에 위치하여 데이터 처리부와 상호 통신할 수 있을 것이다.
데이터 처리 동안의 CPU(6) 동작에 대해 설명한다. CPU(6)는 먼저 지속적으로 유지되어야 할 값(가중치, 평균, 표준편차 등)에 대한 초기화를 수행한다. 그런 다음, CPU(6)는 매 프레임마다 기본 메모리(7)에서 GPU(8)의 메모리로 복사를 수행한다. GPU에서 내부 복사된 메모리의 값을 이용하여 데이터를 처리하고 값을 변경시킨다. 처리가 완료된 GPU 메모리의 내용을 CPU로 복사해 온다. 이렇게 해서 가중치, 평균, 표준편차, 분산 등의 값을 지속적으로 유지시킨다.
GPU(8)는 그래픽 연산처리를 하는 반도체 칩으로, 코어라고도 한다. 일반적으로 컴퓨터의 그래픽 카드는 영상정보 처리, 가속화, 신호전환, 화면출력을 담당하게 된다. 그래픽카드는 비디오 램과 그래픽 칩에 따라 성능이 달라게 되는데, 그래픽카드 칩셋의 성능이 고도화된 것을 통상 GPU라고 한다. GPU는 CPU의 그래픽 작업으로 인해 생기는 병목 현상을 해결하기 위해 만든 그래픽 가속기능을 위한 것으로서, 그래픽카드를 그래픽 가속기(Graphics Accelerator)라고도 한다. 본 발명에서는 고해상도 영상의 고속처리시 상기 CPU(6)가 처리할 수 있는 핵심적인 기능들을 그래픽 프로세서가 대신 처리하여, CPU의 사이클을 다른 작업을 위해 사용하고 부담을 줄이고 좀 더 자유롭게 사용할 수 있게 된다.
상기 CPU(6)와 GPU(8)는 통합된 프로세서일 수도 있다. 또는 여러 공정에 의해 CPU와 GPU가 같이 패키징되도록 구성할 수도 있다.
도 3은 상기 데이터 처리부의 데이터 처리과정을 간략히 보여준다. 데이터 처리부에서는 먼저 각 모델의 표준편차, 분산, 평균, 가중치에 대해 초기화를 수행한다(S300). 가중치는 정규화되면 모든 모델의 가중치의 합은 1이 된다. 초기화(S300)가 종료되면 입력 영상의 시퀀스가 시작(S310)된다. 그러면, 매 프레임마다 지속적으로 유지하게 되는 데이터를 메모리(7)에서 GPU 메모리(8)로 복사한다(S320). GPU에서 각 데이터를 처리한다(S330). 데이터 처리가 종료되면 GPU에서 지속적으로 유지해야 할 값을 메모리(7)로 복사하는 과정을 반복하게 된다. 더이상 처리할 프레임이 없으면 후처리 과정(S600)이 수행된다.
도 4는 GPU에서 데이터가 처리되는 과정을 보여준다. 우선 각 모델을 분산이 작은 순서로 재배열을 한다(S400). 여기서, 모델의 분산의 수치가 작다는 것은 배경의 화소값들이 평균값 주변에 몰려있다는 것이다. 분산이 작은 경우에는 배경과 객체의 화소값이 조금만 달라도 배경으로부터 객체를 구별할 수 있게 된다. 그런 다음 각 모델에 대한 거리값(Dist)을 산출하게 된다(S410).
통계적으로 변수간의 상관관계가 있는 경우, 이를 고려하는 거리척도로서 마할라노비스(Mahalanobis) 거리값이 널리 사용되어왔다. 마할라노비스 거리값의 산출에는 변수의 분산이 사용된다. 즉, 마할라노비스 거리값의 경우 독립변수의 평균으로부터 각 사례의 거리를 표준화시킨 값이며, 이값이 클수록 독립변수의 분포에서 멀리 떨어져 있다.
본원발명에서는 모델과의 매칭 정도를 판단하기 위한 거리값을 구하는 데 있어, 각 채널에 대한 가중치를 설정하여 부여하게 된다. 이렇게 각 채널의 가중치를 다르게 함으로써 색상의 변화나 밝기의 변화를 강조하는 등 각 색공간의 특징을 살릴 수 있으며 더욱 정확한 결과를 얻을 수 있다. 채널별 가중치가 부여된 거리값을 채널반영 거리값(Dist)이라 한다.
채널반영 거리값(Dist)은 분산이 작은 순서대로 모델의 채널당 평균과 현재 입력된 영상의 픽셀의 채널당 값의 차를 구해서 제곱한 뒤 합해서 분산으로 나눈 값을 말한다. 예를 들어, 입력 영상이 3개의 채널로 구성된다고 가정하고 m을 평균, v를 현재 픽셀의 값, var를 모델의 분산이라고 하면 그 수식은 다음과 같다.
Dist = {w1*(v1-m1)2 + w2*(v2-m2)2 + w3*(v3-m3)2} / var
단계(S420)에서는 단계(S410)에서 각 모델에 대해 산출한 채널반영 거리값(Dist)을 사전 설정된 경계값(S)과 비교하게 된다. 비교 결과, 채널반영 거리값(Dist)이 경계값(S)보다 작으면 현재 픽셀의 값 v는 모델에 매칭되어 이후 단계(S440)에서 모델의 가중치 합이 일정값 이상이 되면 배경으로 분류될 것이다(S450). 하지만, 비교 결과, 채널반영 거리값(Dist)이 경계값(S)보다 크다면 그 다음 분산이 큰 모델에 대한 채널반영 거리값(Dist)을 산출한다(S421, S410). 채널반영 거리값(Dist) 산출에는 상기의 동일한 수식이 적용된다. 상술한 과정이 복수의 모델에 대해 반복되고 그 결과 매칭되는 모델이 없으면(S422) 현재 픽셀은 움직이는 물체로 분류(S460)된다.
현재 픽셀이 움직이는 물체로 분류될 경우, 각 모델 중 가중치 값이 가장 작은 모델의 평균은 픽셀값 v로, 분산과 표준편차는 아주 큰 값으로, 가중치는 아주 작은 값으로 모델을 변경한다(S423).
그러나 이와 같은 분류를 그대로 실행하면 모델이 매칭되지 않아 평균이 수정된 픽셀은 다음 프레임에서는 모델의 평균과 픽셀의 입력 값이 비슷하기 때문에 바로 배경이 되어 버린다. 따라서 매칭되는 모델의 가중치의 합이 일정값(W) 보다 클 경우만 배경으로 분류하고(S440) 매칭이 되는 모델이 존재하더라도 그 가중치가 경계값 보다 작으며 움직이는 물체로 분류한다(S460).
그러나 항상 같은 S값을 모든 픽셀에 적용하는 것은 바람직하지 못하다. 모든 픽셀에 동일한 S를 적용하는 것은, 배경과 물체를 구분하는데 같은 표준편차 영역이 적용되는 것을 의미한다. 이는, 예를 들어 흔들리는 나뭇가지와 같이 화면에서 픽셀의 변화가 많은 부분이나, 출입 금지 지역의 입구 등과 같이 화면에서 픽셀의 변화가 적은 부분을, 동일한 표준편차 영역에서 처리됨을 의미하는 것이므로 정확한 물체검출에 적절치 않을 수도 있을 것이다. 따라서, 동일한 경계값(S)을 적용하기 보다는 픽셀의 변화가 작은 곳에서는 그에 따라 더 작은 S값을 적용하여 움직이는 물체 검출 능력을 높이고 변화가 큰 곳은 더 큰 S를 적용하여 효과적으로 배경을 제거하는 것이 바람직하다.
따라서 S는 고정된 값이 아니며 여러 가지 방법으로 dev와 비례하는 방법으로 사용할 수 있다. 일반적으로는 다음과 같은 수식을 사용하나 이것은 시스템의 목적에 따라 달라질 수 있다.
S = d0 * dev2 * S0
도 5는 매칭되는 모델을 수정하는 알고리즘을 나타낸 것이다. 매칭되는 모델은 지수(d)에 의해 모델수정 과정을 거치게 된다(S510). 즉, 현재 픽셀 값 v에 대해 각 매칭되는 모델은 가중치(weight)와 평균, 분산, 표준편차를 다음과 같은 수식으로 수정한다.
weight = d1 * weight + (1-d1)
m = d2 * m + (1-d2) * v (각 채널에 대해 수정한다.)
var = d3 * var + (1-d3) * Dist
dev =
Figure 112008084450979-PAT00002
이때 종전의 방법은 매칭되는 모든 모델에 대해서 위와 같은 가중치, 평균, 분산, 표준편차에 대한 수정을 가하였다. 그러나 영상에 지속적으로 변화가 없다고 해서 표준편차가 아주 작은 값으로 수렴하도록 놓아둔다면, 이후에 바람이 많이 불어서 나뭇잎이 심하게 흔들린다던가 물결에 반사되는 빛의 변화가 더 심해 지는 경우 잘못된 검출을 하게 된다.
따라서 본 발명에서는 표준편차(dev)를 특정값과 대조하는 단계(S520)가 제공된다. 대조결과, 일정 값보다 작은 경우에는 지수(d)의 값을 조절한다(S500). 이와 같이 지수값(d)을 조절함으로써, 표준 편차가 작은 값으로 수렴해 가는 속도를 느리게 한다. 극단적으로는, 각 d의 값을 1로 만들어 가중치, 평균, 분산, 표준편 차 값들에 아무런 수정을 가하지 않도록 할 수도 있다. 이 경우 각 모델의 표준편차는 일정 수준에 머물러 있게 된다. 가중치를 수정한 뒤에는 반드시 정규화를 거쳐 각 모델의 가중치 합이 1이 되도록 한다(S530).
이러한 물체 검출 방법은 GPU에서 구동된다는 점만 제외하면, 고해상도 영상에서의 물체 검출이 아닌 경우의 일반적인 응용에 그대로 사용될 수 있다. 또한, 상술한 색공간 변환부, 데이터 처리부, 후처리부는 순서적으로만 종속적이며 알고리즘 적으로는 서로 독립적인 관계이므로, 어느 한 과정의 알고리즘이 변경된다고 해서 다른 알고리즘에 반드시 변화가 생겨야 하는 것은 아니다. 따라서 각 과정은 독립적으로 다른 응용에 그대로 사용될 수 있다.
도 1은 본 발명에 따른 다중 물체 검출 시스템을 도시한다.
도 2는 본 발명의 일 실시예에 따라 고해상도 영상의 고속처리를 위해 GPU를 사용하는 데이터 처리부의 구성을 도시한다.
도 3은 본 발명의 물체 검출 방법에 사용되는 데이터 처리 과정에 관한 흐름도이다.
도 4는 본 발명에 따른 데이터 처리 과정을 보다 상세히 나타내는 흐름도이다.
도 5는 본 발명에 따른 매칭 모델의 수정 과정을 도시한다.

Claims (18)

  1. 가우시안 혼합 모델(GMM) 기반 영상 데이터 처리 방법으로서,
    영상 데이터를 수집하는 단계;
    각 모델의 표준편차, 분산, 평균, 가중치에 대해 초기화를 수행하는 단계;
    입력 영상을 목적에 맞는 색공간으로 변환하는 단계;
    상기 변환된 색공간에 기반하여 영상 데이터를 처리하는 단계를 포함하는 영상 데이터 처리 방법.
  2. 청구항 1에 있어서, 상기 영상 데이터를 처리하는 단계는,
    입력 영상의 영상 채널별로 가중치를 설정하여 채널반영 거리값(Dist)를 산출하는 것을 특징으로 하는 영상 데이터 처리 방법.
  3. 청구항 2에 있어서, 상기 영상 데이터를 처리하는 단계는,
    상기 산출된 채널반영 거리값에 기반하여 픽셀을 배경 또는 물체로 분류하는 것을 특징으로 하는 영상 데이터 처리 방법.
  4. 청구항 3에 있어서, 상기 영상 데이터를 처리하는 단계는,
    복수의 모델을 분산이 작은 순서로 배열하는 단계;
    상기 채널반영 거리값을 사전설정된 경계값(S)과 대조하는 단계;
    상기 대조 결과에 따라, 픽셀을 배경 또는 움직이는 물체로 분류하는 단계를 포함하는 데이터 처리 방법.
  5. 청구항 4에 있어서, 상기 영상 데이터를 처리하는 단계는,
    상기 대조 결과에 따라, 사전 설정된 조건을 만족하는 모델의 평균, 분산, 표준편차, 가중치를 수정하는 단계를 더 포함하는 데이터 처리 방법.
  6. 청구항 5에 있어서, 상기 수정하는 단계는,
    모델의 표준편차가 사전설정된 값(D) 이상인 범위 내에서 수행되는 것을 특징으로 하는 데이터 처리 방법.
  7. 청구항 6에 있어서,
    상기 수정된 가중치는 정규화를 거쳐 각 모델의 가중치 합이 1이 되도록 하는 것을 특징으로 하는 데이터 처리 방법.
  8. 청구항 4에 있어서, 상기 분류하는 단계는,
    상기 채널반영 거리값이 상기 경계값(S)보다 작을 경우, 상기 모델의 가중치의 합이 사전설정된 값보다 크면 픽셀을 배경으로 분류하고, 상기 모델의 가중치의 합이 사전설정된 값보다 크지 않으면 픽셀을 물체로 분류하며,
    상기 채널반영 거리값이 상기 경계값(S)보다 크거나 같을 경우, 다음 순서의 모델에 대해 채널반영 거리값을 산출하며,
    상기 채널반영 거리값이 산출된 모델이 마지막 순서라고 판단되면, 픽셀을 물체로 분류하는 것을 특징으로 하는 데이터 처리 방법.
  9. 청구항 4에 있어서, 상기 대조하는 단계는,
    각 모델의 픽셀 변화량에 따라 다른 경계값(S)을 적용하는 것을 특징으로 하는 데이터 처리 방법.
  10. 청구항 9에 있어서,
    상기 경계값(S)은 픽셀의 변화가 작을 경우에는 작은 값을, 픽셀의 변화가 클 경우에는 큰 값을 적용하는 것을 특징으로 하는 데이터 처리 방법.
  11. 청구항 1 내지 10 중 어느 한 항에 있어서,
    상기 표준편차, 분산 평균, 가중치를 포함한 데이터를 주 메모리에서 범용 GPU의 메모리로 복사하는 단계를 더 포함하는 데이터 처리 방법.
  12. 청구항 11에 있어서,
    상기 처리 완료된 데이터를 상기 범용 GPU의 메모리에서 상기 주 메모리로 복사하는 단계를 더 포함하는 데이터 처리 방법.
  13. 청구항 1 내지 10 중 어느 한 항에 있어서,
    상기 처리된 영상 데이터의 노이즈를 제거하기 위해 후처리하는 단계를 더 포함하는 영상 데이터 처리 방법.
  14. 청구항 13에 있어서, 상기 후처리하는 단계는,
    모폴로지 기법을 이용하여 수행되는 것을 특징으로 하는 영상 데이터 처리 방법.
  15. 물체 검출 시스템으로서,
    입력된 영상의 색공간을 영상 채널별 가중치가 부여되는 목적 색공간으로 변환하는 색공간 변환부;
    상기 가중치에 기반하여 입력 영상의 데이터를 처리하는 데이터 처리부;
    상기 처리된 영상에서 노이즈를 제거하여 움직이는 물체를 부각시키는 후처리부를 포함하는 물체 검출 시스템.
  16. 청구항 15에 있어서,
    상기 후처리부는 모폴로지 기법을 사용하는 것을 특징으로 하는 물체 검출 시스템.
  17. 청구항 15에 있어서,
    상기 데이터 처리부는 범용 GPU를 포함하는 것을 특징으로 하는 물체 검출 시스템.
  18. 청구항 17에 있어서,
    상기 GPU는 상기 데이터 처리부의 외부에서 접속되는 것을 특징으로 하는 고해상도 물체 검출 시스템.
KR1020080124121A 2008-12-08 2008-12-08 고해상도 영상에서의 효과적인 움직이는 다중 물체 검출 방법 및 시스템 KR20100065677A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020080124121A KR20100065677A (ko) 2008-12-08 2008-12-08 고해상도 영상에서의 효과적인 움직이는 다중 물체 검출 방법 및 시스템
US12/615,590 US20100142809A1 (en) 2008-12-08 2009-11-10 Method for detecting multi moving objects in high resolution image sequences and system thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080124121A KR20100065677A (ko) 2008-12-08 2008-12-08 고해상도 영상에서의 효과적인 움직이는 다중 물체 검출 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR20100065677A true KR20100065677A (ko) 2010-06-17

Family

ID=42231122

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080124121A KR20100065677A (ko) 2008-12-08 2008-12-08 고해상도 영상에서의 효과적인 움직이는 다중 물체 검출 방법 및 시스템

Country Status (2)

Country Link
US (1) US20100142809A1 (ko)
KR (1) KR20100065677A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200005313A (ko) * 2018-07-06 2020-01-15 세메스 주식회사 물류이송 시스템

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5141317B2 (ja) * 2008-03-14 2013-02-13 オムロン株式会社 対象画像検出デバイス、制御プログラム、および該プログラムを記録した記録媒体、ならびに対象画像検出デバイスを備えた電子機器
DE102011108754A1 (de) * 2011-07-28 2013-01-31 Khs Gmbh Inspektionseinheit
CN103235950B (zh) * 2013-05-14 2016-07-06 南京理工大学 一种目标检测图像处理方法
US9159137B2 (en) * 2013-10-14 2015-10-13 National Taipei University Of Technology Probabilistic neural network based moving object detection method and an apparatus using the same
CN104166841B (zh) * 2014-07-24 2017-06-23 浙江大学 一种视频监控网络中指定行人或车辆的快速检测识别方法
US10217243B2 (en) * 2016-12-20 2019-02-26 Canon Kabushiki Kaisha Method, system and apparatus for modifying a scene model
CN107292905B (zh) * 2017-05-25 2020-08-04 西安电子科技大学昆山创新研究院 基于改进混合高斯模型的运动目标检测方法
CN107544067B (zh) * 2017-07-06 2020-05-19 西北工业大学 一种基于高斯混合近似的高超声速再入飞行器跟踪方法
CN110148089B (zh) * 2018-06-19 2024-04-23 腾讯科技(深圳)有限公司 一种图像处理方法、装置及设备、计算机存储介质
CN109583414B (zh) * 2018-12-10 2020-12-22 江南大学 基于视频检测的室内占道检测方法、设备、介质及处理器

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7190809B2 (en) * 2002-06-28 2007-03-13 Koninklijke Philips Electronics N.V. Enhanced background model employing object classification for improved background-foreground segmentation
US7103584B2 (en) * 2002-07-10 2006-09-05 Ricoh Company, Ltd. Adaptive mixture learning in a dynamic system
KR100474848B1 (ko) * 2002-07-19 2005-03-10 삼성전자주식회사 영상시각 정보를 결합하여 실시간으로 복수의 얼굴을검출하고 추적하는 얼굴 검출 및 추적 시스템 및 방법
WO2005036456A2 (en) * 2003-05-12 2005-04-21 Princeton University Method and apparatus for foreground segmentation of video sequences
US20060170769A1 (en) * 2005-01-31 2006-08-03 Jianpeng Zhou Human and object recognition in digital video
US8150155B2 (en) * 2006-02-07 2012-04-03 Qualcomm Incorporated Multi-mode region-of-interest video object segmentation
US7664329B2 (en) * 2006-03-02 2010-02-16 Honeywell International Inc. Block-based Gaussian mixture model video motion detection

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200005313A (ko) * 2018-07-06 2020-01-15 세메스 주식회사 물류이송 시스템

Also Published As

Publication number Publication date
US20100142809A1 (en) 2010-06-10

Similar Documents

Publication Publication Date Title
KR20100065677A (ko) 고해상도 영상에서의 효과적인 움직이는 다중 물체 검출 방법 및 시스템
CN106683048B (zh) 一种图像超分辨率方法及设备
WO2019114036A1 (zh) 人脸检测方法及装置、计算机装置和计算机可读存储介质
US10445602B2 (en) Apparatus and method for recognizing traffic signs
US20120027252A1 (en) Hand gesture detection
US20120027263A1 (en) Hand gesture detection
KR20160044668A (ko) 얼굴 식별 방법, 얼굴 식별 장치 및 이 방법을 실행시키는 컴퓨터 프로그램
CN111160249A (zh) 基于跨尺度特征融合的光学遥感图像多类目标检测方法
CN104166841A (zh) 一种视频监控网络中指定行人或车辆的快速检测识别方法
CN104036284A (zh) 基于Adaboost算法的多尺度行人检测方法
WO2019026104A1 (ja) 情報処理装置、情報処理プログラム及び情報処理方法
CN111510792B (zh) 基于自适应加权图差异分析的视频摘要生成方法及系统
CN112446379B (zh) 一种动态大场景自适应智能处理方法
Xiang et al. Moving object detection and shadow removing under changing illumination condition
CN106600613B (zh) 基于嵌入式gpu的改进lbp红外目标检测方法
JP2009048240A (ja) 動画像における移動物体の検出方法、検出装置、監視方法および監視システム
CN106056078A (zh) 一种基于多特征回归式集成学习的人群密度估计方法
Wu et al. Automatic gear sorting system based on monocular vision
CN110321808B (zh) 遗留物与盗移物检测方法、设备和存储介质
Kumar et al. Intelligent parking vehicle identification and classification system
CN105574880A (zh) 基于指数矩像素分类的彩色图像分割方法
CN113361422A (zh) 一种基于角度空间损失承数的人脸识别方法
CN112053384A (zh) 基于边界框回归模型的目标跟踪方法
Yang et al. Intelligent collection of rice disease images based on convolutional neural network and feature matching
Mahawan et al. Pattern recognition of balinese carving motif using learning vector quantization (LVQ)

Legal Events

Date Code Title Description
A201 Request for examination
E601 Decision to refuse application