KR20190001341A - 실시간 객체 트래킹 방법 및 장치 - Google Patents

실시간 객체 트래킹 방법 및 장치 Download PDF

Info

Publication number
KR20190001341A
KR20190001341A KR1020170081200A KR20170081200A KR20190001341A KR 20190001341 A KR20190001341 A KR 20190001341A KR 1020170081200 A KR1020170081200 A KR 1020170081200A KR 20170081200 A KR20170081200 A KR 20170081200A KR 20190001341 A KR20190001341 A KR 20190001341A
Authority
KR
South Korea
Prior art keywords
frame
ooi
real
signature
object tracking
Prior art date
Application number
KR1020170081200A
Other languages
English (en)
Other versions
KR101999338B1 (ko
Inventor
김경욱
유근태
무하마드 우스만
Original Assignee
주식회사 아이피엘
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 아이피엘 filed Critical 주식회사 아이피엘
Priority to KR1020170081200A priority Critical patent/KR101999338B1/ko
Publication of KR20190001341A publication Critical patent/KR20190001341A/ko
Application granted granted Critical
Publication of KR101999338B1 publication Critical patent/KR101999338B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06K9/3233
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/12Bounding box

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

실시간 객체 트래킹 방법 및 장치가 개시되어 있다. 실시간 객체 트래킹 방법은 실시간 객체 트래킹 장치가 OOI를 탐색하는 단계, 실시간 객체 트래킹 장치가 OOI의 텍스처를 추출하여 시그니처로 결정하는 단계와 실시간 객체 트래킹 장치가 시그니처의 히스토그램과 최적 매칭되는 HSV 히스토그램을 가지는 영역을 탐색하여 OOI를 트래킹하는 단계를 포함할 수 있다.

Description

실시간 객체 트래킹 방법 및 장치{Method and apparatus for objection tracjing in real time}
본 발명은 객체 트래킹 방법 및 장치에 관한 것으로서, 보다 상세하게는 실시간 객체 트래킹 방법 및 장치에 관한 것이다.
이동 객체의 이동 경로를 추적하는 이동 객체 트래킹(tracking) 기법은 영상 처리 분야에서 중요한 연구 분야 가운데 하나이다. 예를 들어, 센서 네트워크에서 이동 객체의 트래킹에 관한 연구는 크게 이동 객체의 정확한 위치를 측정하는 연구 및 센서 네트워크 내의 데이터 처리 및 데이터 집합에 관한 연구일 수 있다.
이러한 객체 추적은 센서 네트워크 뿐만 아니라, 다양한 분야에서 사용될 수 있다. 최근 발표되고 있는 영상 감시 시스템의 경우 이동 객체의 자동 감지 및 추적, 위험 행동 자동 감지, 차량 번호판 인지 등 지능적인 자동 판별 기능이 포함되고 있다. 또한, 카메라의 FOV를 자유롭게 변경가능한 PTZ 카메라의 개발 및 보급이 확산됨에 따라 목표 객체를 지속적으로 추적하고 객체 영상을 순간적으로 확대하여 특성을 자동 분석 판별하는 등의 PTZ 카메라 기반의 지능형 감시 시스템도 개발되고 있다.
따라서, 보다 정확하게 객체에 대한 추적을 수행하기 위한 방법이 필요하다.
10-2007-0012798
본 발명의 일 측면은 실시간 객체 트래킹 방법을 제공한다.
본 발명의 다른 측면은 실시간 객체 트래킹 방법을 수행하는 장치를 제공한다.
본 발명의 일 측면에 따른 실시간 객체 트래킹 방법은 실시간 객체 트래킹 장치가 OOI(object of interest)를 탐색하는 단계, 상기 실시간 객체 트래킹 장치가 OOI의 텍스처를 추출하여 시그니처(signiture)로 결정하는 단계와 상기 실시간 객체 트래킹 장치가 상기 시그니처의 히스토그램과 최적 매칭되는 HSV(hue saturation and value) 히스토그램을 가지는 영역을 탐색하여 상기 OOI를 트래킹하는 단계를 포함할 수 있다.
한편, 상기 실시간 객체 트래킹 장치가 상기 OOI를 탐색하는 단계는 상기 실시간 객체 트래킹 장치가 프레임 간 차이를 결정하여 D 프레임을 생성하는 단계, 상기 실시간 객체 트래킹 장치가 상기 D 프레임에 대해 제1 임계값 기반 영상 처리, 침식 처리, 팽창 처리를 수행하여 D1 프레임을 생성하는 단계, 상기 실시간 객체 트래킹 장치가 상기 D1 프레임에 대하여 제2 임계값 기반의 영상처리를 통해 D2 프레임을 생성하는 단계와 상기 실시간 객체 트래킹 장치가 상기 D2 프레임 상에서 중요 움직임을 스캐닝하여 상기 OOI를 탐색하는 단계를 포함할 수 있다.
또한, 상기 실시간 객체 트래킹 장치가 상기 D2 프레임 상에서 상기 OOI를 탐색하는 단계는 상기 실시간 객체 트래킹 장치가 상기 D2 프레임 상에서 최대 컨투어 및 상기 최대 컨투어의 바운딩 박스에 대한 정보를 획득하여 상기 D2 프레임 중 상기 OOI에 대한 탐색이 가능한 F 프레임을 결정하는 단계와 상기 실시간 객체 트래킹 장치가 상기 F 프레임 상에서 상기 OOI를 탐색하는 단계를 포함할 수 있다.
또한, 상기 실시간 객체 트래킹 장치가 상기 OOI의 상기 텍스처를 추출하여 상기 시그니처로 결정하는 단계는 상기 실시간 객체 트래킹 장치가 상기 F 프레임 중 상기 OOI의 텍스처를 추출하기 위한 C 프레임을 결정하는 단계, 상기 실시간 객체 트래킹 장치가 상기 C 프레임에 대하여 상기 제1 임계값 기반 영상 처리, 상기 침식 처리, 상기 팽창 처리 및 상기 제2 임계값 기반 영상 처리를 수행하는 단계, 상기 실시간 객체 트래킹 장치가 상기 OOI의 바운더리를 생성하고, 상기 바운더리에 대해 필링 절차 및 마스킹 절차를 통해 상기 OOI의 텍스처를 추출하여 HSV 히스토그램을 기반으로 상기 시그니처를 결정하는 단계를 포함할 수 있다.
또한, 상기 시그니처의 히스토그램과 최적 매칭되는 상기 HSV 히스토그램을 가지는 영역을 탐색하여 상기 OOI를 트래킹하는 단계는 상기 실시간 트래킹 장치가 타겟 프레임에 대하여 서로 다른 사이즈의 마스크를 적용하여 마스킹된 픽셀을 추출하는 단계, 상기 실시간 트래킹 장치가 상기 HSV 히스토그램을 가지는 영역을 탐색하기 위해 상기 마스킹된 픽셀에 대한 타겟 시그니처를 생성하는 단계, 상기 실시간 객체 트래킹 장치가 상기 시그니처와 상기 타겟 시그니처를 기반으로 상기 OOI를 트래킹하는 단계를 포함할 수 있다.
본 발명의 또 다른 측면에 따른 실시간 객체 트래킹을 수행하는 실시간 트래킹 장치는 상기 실시간 트래킹 장치는 프로세서를 포함하고, 상기 프로세서는 OOI(object of interest)를 탐색하고, OOI의 텍스처를 추출하여 시그니처(signiture)로 결정하고, 상기 시그니처의 히스토그램과 최적 매칭되는 HSV(hue saturation and value) 히스토그램을 가지는 영역을 탐색하여 상기 OOI를 트래킹하도록 구현될 수 있다.
한편, 상기 프로세서는 상기 OOI를 탐색을 위해 프레임 간 차이를 결정하여 D 프레임을 생성하고, 상기 D 프레임에 대해 제1 임계값 기반 영상 처리, 침식 처리, 팽창 처리를 수행하여 D1 프레임을 생성하고, 상기 D1 프레임에 대하여 제2 임계값 기반의 영상처리를 통해 D2 프레임을 생성하고, 상기 D2 프레임 상에서 중요 움직임을 스캐닝하여 상기 OOI를 탐색할 수 있다.
또한, 상기 프로세서는 상기 D2 프레임 상에서 상기 OOI를 탐색을 위해, 상기 D2 프레임 상에서 최대 컨투어 및 상기 최대 컨투어의 바운딩 박스에 대한 정보를 획득하여 상기 D2 프레임 중 상기 OOI에 대한 탐색이 가능한 F 프레임을 결정하고, 상기 F 프레임 상에서 상기 OOI를 탐색하도록 구현될 수 있다.
또한, 상기 프로세서는 상기 OOI의 상기 텍스처를 추출하여 상기 시그니처로 결정하기 위하여, 상기 F 프레임 중 상기 OOI의 텍스처를 추출하기 위한 C 프레임을 결정하고, 상기 C 프레임에 대하여 상기 제1 임계값 기반 영상 처리, 상기 침식 처리, 상기 팽창 처리 및 상기 제2 임계값 기반 영상 처리를 수행하고, 상기 OOI의 바운더리를 생성하고, 상기 바운더리에 대해 필링 절차 및 마스킹 절차를 통해 상기 OOI의 텍스처를 추출하여 HSV 히스토그램을 기반으로 상기 시그니처를 결정하도록 구현될 수 있다.
또한, 상기 프로세서는 상기 OOI를 트래킹을 위해 타겟 프레임에 대하여 서로 다른 사이즈의 마스크를 적용하여 마스킹된 픽셀을 추출하고, 상기 HSV 히스토그램을 가지는 영역을 탐색하기 위해 상기 마스킹된 픽셀에 대한 타겟 시그니처를 생성하고, 상기 시그니처와 상기 타겟 시그니처를 기반으로 상기 OOI를 트래킹하도록 구현될 수 있다.
본 발명의 실시예에 따른 실시간 객체 트래킹 방법 및 장치는 영상 내에 존재하는 객체를 보다 효과적으로 정확하게 추적하기 위한 방법을 제공한다.
도 1은 본 발명의 실시예에 따른 화면에서 객체를 탐지하고 트래킹하기 위한 방법을 나타낸 순서도이다.
도 2는 본 발명의 실시예에 따른 D 프레임을 나타낸 개념도이다.
도 3은 본 발명의 실시예에 따른 D2 프레임을 나타낸 개념도이다.
도 4는 본 발명의 실시예에 따른 F 프레임이 개시된다.
도 5는 본 발명의 실시예에 따른 오리지날 이미지(original image)와 오리지날 이미지에서 분리된 칼라 객체를 나타낸 개념도이다.
도 6은 본 발명의 실시예에 따른 실시간 객체 트래킹 장치를 나타낸 개념도이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예와 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조 부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하, 도면들을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명하기로 한다.
본 발명의 실시예에 따른 실시간 객체 트래킹 방법에서는 카메라로부터의 수신한 실시간 비디오 스트림에 대하여 몇 프레임에 지속적으로 남아있는 고려할만 한 크기의 중요 지역화된 움직임 세그먼트(significant localized motion segment)를 찾을 때까지 프레임들을 통해 프레임 차이를 계산할 수 있다.
이러한 지속적으로 움직이는 객체(이하, OOI, object of interest)를 찾은 후에 프레임 차이를 계산하는 반복되는 루프를 중단하고, OOI의 텍스처(texture)를 추출할 수 있다. 추출된 OOI 텍스처를 시그니처(signature)로서 참조 시그니처(reference signiture)로 사용하여 타겟 프레임에 대하여 매칭을 수행할 수 있다.
특정 매칭 임계값을 기반으로 한 최적 매칭 위치 및 사이즈는 현재 프레임 내에서 객체의 새로운 위치로 고려될 수 있다.
도 1은 본 발명의 실시예에 따른 화면에서 객체를 탐지하고 트래킹하기 위한 방법을 나타낸 순서도이다.
도 1을 참조하면, 실시간 객체 트래킹 장치가 OOI(object of interest)를 탐색하고 OOI의 텍스처를 추출하여 시그니처로서 사용한다(단계 S100).
단계S100에서는 실시간 객체 트래킹 장치는 디큐(deque)의 형태로 프레임의 버퍼를 유지할 수 있다. 실시간 객체 트래킹 장치는 각각의 프레임을 카메라로부터 수신하고, 카메라로부터 새롭게 도착한 프레임 각각은 디큐의 상위에 추가되고, 디큐에서 가장 오래된 프레임은 삭제된다. 이러한 방법을 통해 디큐가 특정 사이즈로 유지될 수 있다.
현재 프레임이 n번째 프레임이라고 할 경우, 현재 프레임n과 과거 프레임 n-1, n-2, n-3, n-4? 사이의 프레임 차이(frame difference)가 계산될 수 있다. 그리고 모든 프레임 차이에 대한 정보는 비트와이즈 OR(bitwise OR)을 통해 축적될 수 있다.
프레임 차이는 HSV(hue saturation and value) 칼라 공간 상에서 V(value) 값에 대하여 가장 잘 계산될 수 있다. 이러한 축적된 프레임 차이에 대한 정보를 포함하는 프레임은 D 프레임이라는 용어로 표현될 수 있다.
D 프레임에 대해서 특정한 제1 임계값이 적용될 수 있고, 임계값보다 낮은 노이즈 파워는 제거될 수 있다. 이러한 제1 임계값을 기반으로 한 D 프레임에 대한 영상 처리가 제1 임계값 기반 영상 처리라는 용어로 표현된다.
이후, D 프레임에 대하여 침식 처리(erosion 프로세스)가 적용되고, 침식 처리 프로세서를 통해 임계값의 적용 이후에 남은 고립된 노이즈 영역(isolated noise area)을 제거할 수 있다.
예상되는 ROI(region of interest) 형태(shape) 내의 홀(hole)을 채우기 위해 침식 처리된 이미지 상에 팽창 처리(dilation process)가 수행될 수 있다. 팽창 처리된 결과에 대한 정보를 포함하는 프레임은 D1 프레임이라는 용어로 표현될 수 있다.
D1 프레임이 생성된 경우, 다른 임계값(제2 임계값)을 사용하여 제2 임계값보다 큰 픽셀값를 가지는 픽셀을 칠할(ceiling) 수 있다. 제2 임계값보다 큰 픽셀값를 가지는 픽셀을 칠한(ceiling) 결과에 대한 정보를 포함하는 프레임은 D2 프레임이라는 용어로 표현될 수 있다. 또한, 제2 임계값 기반의 영상 처리는 제2임계값 기반 영상 처리라는 용어로 표현될 수 있다.
D2 프레임의 컨투어(contour)를 찾고, 모든 컨투어 상에 다각형(polygon)을 근사화하고 최대 컨투어 영역을 찾을 수 있다.
최대 컨투어의 바운딩 박스 내부의 D2 프레임의 논제로(non-zero) 픽셀을 카운트하고, D2 프레임 각각에 대하여 논제로 픽셀의 개수를 저장할 수 있다.
ROI(또는 OOI)를 추출하기 위해 중요 움직임(significant motion)을 스캐닝할 수 있다.
스캐닝 프로세스를 위해 아래의 절차가 각각의 프레임에 대해 수행될 수 있다.
1) 프레임을 큐에 저장하고/가장 오래된 프레임을 제거
2) HSV 칼라 공간 상에서 V에 대해 프레임 차이를 계산
3) 제1 임계값 기반 영상 처리, 침식 처리, 팽창처리, 제2 임계값 기반 영상 처리를 기반으로 출력 프레임을 생성
4) 출력 프레임 상에서 최대 사이즈의 컨투어를 탐색
5) 만약
- 최대 컨투어의 높이(height)가 적어도 프레임의 높이의 반(half) 보다 크고,
- 최대 컨투어의 바운딩 박스(bounding box)가 바운딩 박스의 내부에서 50%를 넘는 논-제로 픽셀을 가지고 있고
- 바운딩 박스의 높이가 너비(width)의 1.5배 이상인 경우,
6) 5)의 조건을 만족하는 경우, 바운딩 박스가 프레임에 대하여 ROI 위치를 가지는 프레임 D를 F(found) 프레임이라고 라벨링함.
7) 5)의 조건을 만족하지 못하는 경우, 프레임 상에서 어떠한 ROI를 발견하지 못함. 이러한 프레임은 엠프티(empty)라고 하고 E(empty) 프레임이라고 라벨링함.
만약, 엠프티 프레임(E 프레임)가 일정 횟수 발생한다면, 큐에 저장된 모든 프레임을 무시하고 스캐닝 프로세스를 다시 수행할 수 있다.
만약, 일정 기간 내에 N번 F 프레임이 획득된 경우(100 비디오 프레임 듀레이션 내에서 10개의 프레임이 F 프레임으로 탐색된 경우), 영상에 객체(또는 OOI)의 중요 움직임이 있는 것으로 결정할 수 있다. 중요 객체는 출력 프레임에서 최대 컨투어에 의해 표현될 수 있다. 이러한 경우, F 프레임 및 연관된 ROI 정보가 저장될 수 있다.
F 프레임에 대응되는 오리지날 카메라 프레임의 리스트, F 프레임의 ROI(최대 컨투어에 걸친 바운딩 박스의 리스트), F 프레임에 대응되는 출력 프레임에 대한 정보가 획득될 수 있다.
영상에 관심 움직임의 존재하는 것으로 판단된 이후, 움직임이 있는 객체(또는 OOI)의 텍스처가 추출되고 식별될 수 있다.
이하, 객체의 텍스처를 추출하기 위한 방법이 개시된다.
객체의 텍스처를 추출하기 위해 ROI 바운딩 박스의 내부의 논-제로 픽셀에 대하여 F 프레임에 대응되는 출력 프레임을 스캔할 수 있다. 최대 논제로 픽셀을 가지는 바운딩 박스를 가지는 출력 프레임은 움직이는 객체의 텍스처를 추출하기 위한 후보 프레임(candidate frame)으로 간주될 수 있다. 이하 후보 프레임을 프레임 C프레임이라고 한다.
영상에서 움직이는 객체의 바운더리를 다듬기 위해 제1 임계값 기반 영상 처리, 침식 처리, 팽창 처리, 제2 임계값 기반 영상 처리의 조합이 C 프레임에 대하여 수행될 수 있다.
이러한 동작 이후, 객체의 정의된 바운더리가 생성될 수 있고, 이러한 바운더리 내부에 필링 절차를 수행하여 객체의 청사진(실루엣 형태)이 획득될 수 있다.
실루엣 형태의 객체의 청사진의 획득 이후, 적용된 팽창의 크기와 동일하게 실루엣의 바운더리를 감소시킴으로서 팽창 처리의 부작용이 감소될 수 있다.
다듬어진 실루엣을 획득하고, 후보 프레임에 대응되는 오리지널 칼라 프레임 상에 마스크(M)로서 다듬어진 실루엣이 사용될 수 있다. 이러한 마스킹은 영상 상에서 움직이는 세그먼트화된 칼라 객체의 제공을 위해 활용될 수 있다.
이러한 세그먼트화된 칼라 객체에 대하여 H(Hue) 및 S(saturation) 히스토그램이 생성된다. 이러한 히스토그램은 향후 프레임의 객체에 대해 식별하고 트래킹하기 위한 시그니처(signature)로서 사용될 수 있다. 이러한 시그니처는 Ss(source signature)로 표현될 수 있다.
시그니처의 히스토그램과 최적 매칭되는 HSV 히스토그램을 가지는 영역을 찾기 위해 타겟 프레임 상에서 윈도우윙 기술을 사용한다(단계 S120).
단계 S120에서 Ss를 획득한 이후, 타겟 프레임에 대하여 10개의 다른 사이즈의 마스크를 적용하고 마스킹된 픽셀을 추출하고, 마스킹된 픽셀에 대한 HS 히스토그램 St(타겟 시그니처)를 생성하고, Ss와 히스토그램St를 비교할 수 있다.
각각의 사이즈에 대하여 St를 생성하기 위해 ROI 영역 내에서 윈도우윙을 수행하고, Ss를 St와 비교할 수 있다. 각각의 윈도우에 대하여 8 수직, 4 수직 탐색을 수행할 수 있다.
Ss와 St 사이에 최소 차이를 주는 사이즈와 영역은 실시간 객체가 존재 가능한 타겟 영역일 수 있다.
이러한 멀티-스케일 히스토그램 비교를 최적화하기 위해 한번에 3사이즈를 슬라이드할 수 있다. 예를 들어, 만약 4, 5 및 6과 같은 3사이즈에 대해 윈도우윙하고 최소 히스토그램 차이와 최적 매치가 6인 경우, 다음 사이즈는 6, 7 및 8일 수 있다. 그리고 만약, 최소 히스토그램 차이와 최적 매치가 4인 경우, 다음으로 사이즈는 3, 4 및 5를 기반으로 한 윈도우윙이 수행될 수 있다.
도 2는 본 발명의 실시예에 따른 D 프레임을 나타낸 개념도이다.
도 2에서는 프레임 차이에 대한 정보를 포함하는 D 프레임이 개시된다.
전술한 바와 같이 현재 프레임이 n번째 프레임이라고 할 경우, 현재 프레임n과 과거 프레임 n-1, n-2, n-3, n-4 사이의 프레임 차이(frame difference)가 계산될 수 있다. 그리고 모든 프레임 차이에 대한 정보는 비트와이즈 OR(bitwise OR)을 통해 축적될 수 있다.
프레임 차이는 HSV(hue saturation and value) 칼라 공간 상에서 V(value) 값에 대하여 가장 잘 계산될 수 있다. 이러한 축적된 프레임 차이에 대한 정보를 포함하는 프레임은 D 프레임이라는 용어로 표현될 수 있다.
도 2를 참조하면, 사람이 영상에서 움직이는 경우 발생한 프레임 간 차이에 대한 정보가 D 프레임에 포함될 수 있다.
도 3은 본 발명의 실시예에 따른 D2 프레임을 나타낸 개념도이다.
도 3에서는 D 프레임에 대하여 제1 임계값 기반 영상 처리, 침식 처리, 팽창 처리, 제2 임계값 기반 영상 처리 등을 수행하여 획득된 D2 프레임이 개시된다.
전술한 바와 같이 제1 임계값 기반 영상 처리를 통해 D 프레임에 대해서 특정한 제1 임계값이 적용될 수 있고, 임계값보다 낮은 노이즈 파워는 제거될 수 있다.
이후, 제1 임계값 기반 영상 처리가 적용된 D 프레임에 대하여 침식 처리(erosion 프로세스)가 적용되고, 침식 처리 프로세서를 통해 임계값의 적용 이후에 남은 고립된 노이즈 영역(isolated noise area)을 제거할 수 있다.
예상되는 ROI(region of interest) 형태(shape) 내의 홀(hole)을 채우기 위해 침식 처리된 이미지 상에 팽창 처리(dilation process)가 수행될 수 있다.
즉, 제1 임계값 기반 영상 처리가 적용된 D 프레임에 침식 처리 및 팽창 처리가 수행되어 D1 프레임이 생성될 수 있다.
D1 프레임의 생성 이후, 다른 임계값(제2 임계값)을 사용하여 제2 임계값보다 큰 픽셀값를 가지는 픽셀을 칠하여(ceiling) D2 프레임이 생성될 수 있따.
도 3을 참조하면, 도 2에서 개시한 사람이 영상에서 움직이는 경우 발생한 프레임 간 차이에 대한 정보를 포함하는 D 프레임에 대한 처리를 통해 생성된 D2 프레임이 개시된다.
도 4는 본 발명의 실시예에 따른 F 프레임이 개시된다.
전술한 바와 같이 D2 프레임 상에서 최대 사이즈의 컨투어를 탐색하고, 만약, 1) 최대 컨투어의 높이(height)가 적어도 프레임의 높이의 반(half) 보다 크고, 2) 최대 컨투어의 바운딩 박스(bounding box)가 바운딩 박스의 내부에서 50%를 넘는 논-제로 픽셀을 가지고 있고, 3) 바운딩 박스의 높이가 너비(width)의 1.5배 이상인 경우, 바운딩 박스가 프레임에 대하여 ROI 위치를 가지는 것으로 판단하고, 해당 프레임을 F 프레임이라고 라벨링할 수 있다.
도 4를 참조하면, ROI가 존재하는 것으로 판단되는 프레임이 F 프레임일 수 있다.
도 5는 본 발명의 실시예에 따른 오리지날 이미지(original image)와 오리지날 이미지에서 분리된 칼라 객체를 나타낸 개념도이다.
도 5에서는 영상에 관심 움직임의 존재하는 것으로 판단된 이후, 움직임이 있는 객체의 텍스처가 추출되고 식별되어 추출된 세그먼트화된 칼라 객체가 개시된다.
도 5를 참조하면, 최대 논제로 픽셀을 가지는 바운딩 박스를 가지는 출력 프레임은 움직이는 객체의 텍스처를 추출하기 위한 후보 프레임(candidate frame)에 대해 제1 임계값 기반 영상 처리, 침식 처리, 팽창 처리, 제2 임계값 기반 영상 처리의 조합이 수행될 수 있다.
이러한 동작 이후, 객체의 정의된 바운더리가 생성될 수 있고, 이러한 바운더리 내부에 필링 절차를 수행하여 객체의 청사진(실루엣 형태)이 획득될 수 있다.
실루엣 형태의 객체의 청사진의 획득 이후, 적용된 팽창의 크기와 동일하게 실루엣의 바운더리를 감소시킴으로서 팽창 처리의 부작용이 감소될 수 있다.
다듬어진 실루엣을 획득하고, 후보 프레임에 대응되는 오리지널 칼라 프레임 상에 마스크(M)로서 다듬어진 실루엣이 사용될 수 있다. 이러한 마스킹은 영상 상에서 움직이는 세그먼트화된 칼라 객체의 제공을 위해 활용될 수 있다.
도 6은 본 발명의 실시예에 따른 실시간 객체 트래킹 장치를 나타낸 개념도이다.
도 6을 참조하면, 실시간 객체 트래킹 장치는OOI 탐색부(600), 시그니처 결정부(620), OOI 트래킹부(640) 및 프로세서(660)를 포함할 수 있다.
OOI 탐색부(600)는 OOI(object of interest)를 탐색하도록 구현될 수 있다.
시그니처 결정부(620)는 OOI의 텍스처를 추출하여 시그니처(signiture)로 결정할 수 있다.
OOI 트래킹부(640)는 시그니처의 히스토그램과 최적 매칭되는 HSV(hue saturation and value) 히스토그램을 가지는 영역을 탐색하여 OOI를 트래킹하도록 구현될 수 있다.
프로세서(660)는 OOI 탐색부(600), 시그니처 결정부(620), OOI 트래킹부(640)의 동작을 제어하기 위해 구현될 수 있다.
OOI 탐색부(600), 시그니처 결정부(620), OOI 트래킹부(640) 각각은 도 1 내지 도 5에서 개시된 동작을 수행하기 위해 구현될 수 있아. 예를 들어, OOI 탐색부(600), 시그니처 결정부(620), OOI 트래킹부(640) 각각은 아래의 동작을 수행할 수 있다.
OOI 탐색부(600)는 OOI에 대한 탐색을 위해 프레임 간 차이를 결정하여 D 프레임을 생성하고, D 프레임에 대해 제1 임계값 기반 영상 처리, 침식 처리, 팽창 처리를 수행하여 D1 프레임을 생성하고, D1 프레임에 대하여 제2 임계값 기반의 영상처리를 통해 D2 프레임을 생성하고, D2 프레임 상에서 중요 움직임을 스캐닝하여 OOI를 탐색할 수 있다.
OOI 탐색부(600)는 D2 프레임 상에서 OOI에 대한 탐색을 위해, D2 프레임 상에서 최대 컨투어 및 최대 컨투어의 바운딩 박스에 대한 정보를 획득하여 D2 프레임 중 상기 OOI에 대한 탐색이 가능한 F 프레임을 결정하고, F 프레임 상에서 OOI를 탐색하도록 구현될 수 있다.
시그니처 결정부(620)는 F 프레임 중 OOI의 텍스처를 추출하기 위한 C 프레임을 결정하고, C 프레임에 대하여 제1 임계값 기반 영상 처리, 침식 처리, 팽창 처리 및 제2 임계값 기반 영상 처리를 수행하고, OOI의 바운더리를 생성하고, 바운더리에 대해 필링 절차 및 마스킹 절차를 통해 OOI의 텍스처를 추출하여 HSV 히스토그램을 기반으로 시그니처를 결정하도록 구현될 수 있다.
OOI 트래킹부(640)는 타겟 프레임에 대하여 서로 다른 사이즈의 마스크를 적용하여 마스킹된 픽셀을 추출하고, HSV 히스토그램을 가지는 영역을 탐색하기 위해 상기 마스킹된 픽셀에 대한 타겟 시그니처를 생성하고, 시그니처와 타겟 시그니처를 기반으로 OOI를 트래킹하도록 구현될 수 있다.
전술한 방법은 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.
상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들일 수 있고, 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.
프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서는 실시예들을 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (10)

  1. 실시간 객체 트래킹 방법은,
    실시간 객체 트래킹 장치가 OOI(object of interest)를 탐색하는 단계;
    상기 실시간 객체 트래킹 장치가 OOI의 텍스처를 추출하여 시그니처(signiture)로 결정하는 단계; 및
    상기 실시간 객체 트래킹 장치가 상기 시그니처의 히스토그램과 최적 매칭되는 HSV(hue saturation and value) 히스토그램을 가지는 영역을 탐색하여 상기 OOI를 트래킹하는 단계를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서, 상기 실시간 객체 트래킹 장치가 상기 OOI를 탐색하는 단계는,
    상기 실시간 객체 트래킹 장치가 프레임 간 차이를 결정하여 D 프레임을 생성하는 단계;
    상기 실시간 객체 트래킹 장치가 상기 D 프레임에 대해 제1 임계값 기반 영상 처리, 침식 처리, 팽창 처리를 수행하여 D1 프레임을 생성하는 단계;
    상기 실시간 객체 트래킹 장치가 상기 D1 프레임에 대하여 제2 임계값 기반의 영상처리를 통해 D2 프레임을 생성하는 단계; 및
    상기 실시간 객체 트래킹 장치가 상기 D2 프레임 상에서 중요 움직임을 스캐닝하여 상기 OOI를 탐색하는 단계를 포함하는 것을 특징으로 하는 방법.
  3. 제2항에 있어서, 상기 실시간 객체 트래킹 장치가 상기 D2 프레임 상에서 상기 OOI를 탐색하는 단계는,
    상기 실시간 객체 트래킹 장치가 상기 D2 프레임 상에서 최대 컨투어 및 상기 최대 컨투어의 바운딩 박스에 대한 정보를 획득하여 상기 D2 프레임 중 상기 OOI에 대한 탐색이 가능한 F 프레임을 결정하는 단계; 및
    상기 실시간 객체 트래킹 장치가 상기 F 프레임 상에서 상기 OOI를 탐색하는 단계를 포함하는 것을 특징으로 하는 방법.
  4. 제3항에 있어서, 상기 실시간 객체 트래킹 장치가 상기 OOI의 상기 텍스처를 추출하여 상기 시그니처로 결정하는 단계는,
    상기 실시간 객체 트래킹 장치가 상기 F 프레임 중 상기 OOI의 텍스처를 추출하기 위한 C 프레임을 결정하는 단계;
    상기 실시간 객체 트래킹 장치가 상기 C 프레임에 대하여 상기 제1 임계값 기반 영상 처리, 상기 침식 처리, 상기 팽창 처리 및 상기 제2 임계값 기반 영상 처리를 수행하는 단계;
    상기 실시간 객체 트래킹 장치가 상기 OOI의 바운더리를 생성하고, 상기 바운더리에 대해 필링 절차 및 마스킹 절차를 통해 상기 OOI의 텍스처를 추출하여 HSV 히스토그램을 기반으로 상기 시그니처를 결정하는 단계를 포함하는 것을 특징으로 하는 방법.
  5. 제4항에 있어서, 상기 시그니처의 히스토그램과 최적 매칭되는 상기 HSV 히스토그램을 가지는 영역을 탐색하여 상기 OOI를 트래킹하는 단계는,
    상기 실시간 트래킹 장치가 타겟 프레임에 대하여 서로 다른 사이즈의 마스크를 적용하여 마스킹된 픽셀을 추출하는 단계;
    상기 실시간 트래킹 장치가 상기 HSV 히스토그램을 가지는 영역을 탐색하기 위해 상기 마스킹된 픽셀에 대한 타겟 시그니처를 생성하는 단계;
    상기 실시간 객체 트래킹 장치가 상기 시그니처와 상기 타겟 시그니처를 기반으로 상기 OOI를 트래킹하는 단계를 포함하는 것을 특징으로 하는 방법.
  6. 실시간 객체 트래킹을 수행하는 실시간 트래킹 장치에 있어서,
    상기 실시간 트래킹 장치는 프로세서를 포함하고,
    상기 프로세서는 OOI(object of interest)를 탐색하고,
    OOI의 텍스처를 추출하여 시그니처(signiture)로 결정하고,
    상기 시그니처의 히스토그램과 최적 매칭되는 HSV(hue saturation and value) 히스토그램을 가지는 영역을 탐색하여 상기 OOI를 트래킹하도록 구현되는 것을 특징으로 하는 실시간 트래킹 장치.
  7. 제6항에 있어서,
    상기 프로세서는 상기 OOI에 대한 탐색을 위해
    프레임 간 차이를 결정하여 D 프레임을 생성하고,
    상기 D 프레임에 대해 제1 임계값 기반 영상 처리, 침식 처리, 팽창 처리를 수행하여 D1 프레임을 생성하고,
    상기 D1 프레임에 대하여 제2 임계값 기반의 영상처리를 통해 D2 프레임을 생성하고,
    상기 D2 프레임 상에서 중요 움직임을 스캐닝하여 상기 OOI를 탐색하는 것을 특징으로 하는 실시간 트래킹 장치.
  8. 제7항에 있어서,
    상기 프로세서는 상기 D2 프레임 상에서 상기 OOI에 대한 탐색을 위해,
    상기 D2 프레임 상에서 최대 컨투어 및 상기 최대 컨투어의 바운딩 박스에 대한 정보를 획득하여 상기 D2 프레임 중 상기 OOI에 대한 탐색이 가능한 F 프레임을 결정하고,
    상기 F 프레임 상에서 상기 OOI를 탐색하도록 구현되는 것을 특징으로 하는 실시간 트래킹 장치.
  9. 제8항에 있어서,
    상기 프로세서는 상기 OOI의 상기 텍스처를 추출하여 상기 시그니처로 결정하기 위하여,
    상기 F 프레임 중 상기 OOI의 텍스처를 추출하기 위한 C 프레임을 결정하고,
    상기 C 프레임에 대하여 상기 제1 임계값 기반 영상 처리, 상기 침식 처리, 상기 팽창 처리 및 상기 제2 임계값 기반 영상 처리를 수행하고,
    상기 OOI의 바운더리를 생성하고, 상기 바운더리에 대해 필링 절차 및 마스킹 절차를 통해 상기 OOI의 텍스처를 추출하여 HSV 히스토그램을 기반으로 상기 시그니처를 결정하도록 구현되는 것을 특징으로 하는 실시간 트래킹 장치.
  10. 제9항에 있어서,
    상기 프로세서는 상기 OOI에 대한 트래킹을 위해
    타겟 프레임에 대하여 서로 다른 사이즈의 마스크를 적용하여 마스킹된 픽셀을 추출하고,
    상기 HSV 히스토그램을 가지는 영역을 탐색하기 위해 상기 마스킹된 픽셀에 대한 타겟 시그니처를 생성하고,
    상기 시그니처와 상기 타겟 시그니처를 기반으로 상기 OOI를 트래킹하도록 구현되는 것을 특징으로 하는 실시간 트래킹 장치.
KR1020170081200A 2017-06-27 2017-06-27 실시간 객체 트래킹 방법 및 장치 KR101999338B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170081200A KR101999338B1 (ko) 2017-06-27 2017-06-27 실시간 객체 트래킹 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170081200A KR101999338B1 (ko) 2017-06-27 2017-06-27 실시간 객체 트래킹 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20190001341A true KR20190001341A (ko) 2019-01-04
KR101999338B1 KR101999338B1 (ko) 2019-07-11

Family

ID=65017763

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170081200A KR101999338B1 (ko) 2017-06-27 2017-06-27 실시간 객체 트래킹 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101999338B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230126115A (ko) * 2022-02-22 2023-08-29 국민대학교산학협력단 점자블록 검출 기반 시각장애인 경로 안내 장치 및 이의 구동 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000348186A (ja) * 1999-06-03 2000-12-15 Fujitsu Ltd 物体追跡装置及び方法
KR20060035513A (ko) * 2004-10-22 2006-04-26 이호석 움직임 객체를 추출하는 방법 및 그 시스템
KR20070012798A (ko) 2004-02-10 2007-01-29 비트웨이브 세미콘덕터 프로그램가능 무선 송수신기
JP2017085564A (ja) * 2015-10-23 2017-05-18 株式会社モルフォ 画像処理装置、電子機器、画像処理方法及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000348186A (ja) * 1999-06-03 2000-12-15 Fujitsu Ltd 物体追跡装置及び方法
KR20070012798A (ko) 2004-02-10 2007-01-29 비트웨이브 세미콘덕터 프로그램가능 무선 송수신기
KR20060035513A (ko) * 2004-10-22 2006-04-26 이호석 움직임 객체를 추출하는 방법 및 그 시스템
JP2017085564A (ja) * 2015-10-23 2017-05-18 株式会社モルフォ 画像処理装置、電子機器、画像処理方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ning et al. Robust object tracking using joint color texture histogram. International Journal of PRAI., Vol. 23, No.7, 2009년, pp. 1245-1263. 1부.* *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230126115A (ko) * 2022-02-22 2023-08-29 국민대학교산학협력단 점자블록 검출 기반 시각장애인 경로 안내 장치 및 이의 구동 방법

Also Published As

Publication number Publication date
KR101999338B1 (ko) 2019-07-11

Similar Documents

Publication Publication Date Title
US11302315B2 (en) Digital video fingerprinting using motion segmentation
JP6655878B2 (ja) 画像認識方法及び装置、プログラム
JP4216668B2 (ja) 映像視覚情報を結合してリアルタイムで複数の顔を検出して追跡する顔検出・追跡システム及びその方法
EP1859411B1 (en) Tracking objects in a video sequence
US7916944B2 (en) System and method for feature level foreground segmentation
KR100860988B1 (ko) 시퀀스들에서의 객체 탐지를 위한 방법 및 장치
KR101764845B1 (ko) 다중 이동 물체의 겹침 제거 및 추적을 위한 영상 감시 장치 및 방법
US20180053307A1 (en) Image Target Tracking Method and System Thereof
KR101508310B1 (ko) 영상 감시 시스템에서 다중 이동 물체를 추적하는 방법 및 장치
US20130094700A1 (en) Aerial Survey Video Processing
KR102434397B1 (ko) 전역적 움직임 기반의 실시간 다중 객체 추적 장치 및 방법
JP2010244207A (ja) 移動物体追跡装置、移動物体追跡方法および移動物体追跡プログラム
Nandhini et al. SIFT algorithm-based Object detection and tracking in the video image
KR101999338B1 (ko) 실시간 객체 트래킹 방법 및 장치
KR20140141239A (ko) 평균이동 알고리즘을 적용한 실시간 객체 추적방법 및 시스템
Wang et al. Efficient visual tracking by probabilistic fusion of multiple cues
Monteiro et al. Robust segmentation for outdoor traffic surveillance
KR101595334B1 (ko) 농장에서의 움직임 개체의 이동 궤적 트래킹 방법 및 장치
JP2020144758A (ja) 移動物体検出装置、移動物体検出方法およびコンピュータプログラム
Malavika et al. Moving object detection and velocity estimation using MATLAB
JP2011043863A (ja) 対象領域判定・追跡装置、方法、プログラム及び対象領域判定装置
US20230410467A1 (en) Image processing device and image processing method
KR101997800B1 (ko) 영상 추적 장치 및 그 동작방법
Naito et al. Camera motion detection using video mosaicing
Parekh et al. Centroid based multiple object tracking with shadow removal and occlusion handling

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right