KR101413620B1

KR101413620B1 - 영상 분석을 통한 영상 텍스트화 장치

Info

Publication number: KR101413620B1
Application number: KR1020140019547A
Authority: KR
Inventors: 이강석; 하성욱
Original assignee: 하성욱; (주)리얼허브
Priority date: 2014-02-20
Filing date: 2014-02-20
Publication date: 2014-07-04
Also published as: US20150235089A1; US9508010B2

Abstract

본 발명은 영상 분석을 통한 영상 텍스트화 장치에 관한 것으로, 더욱 상세하게는 영상획득장치로부터 입력되는 영상데이터에 포함되는 적어도 하나의 객체를 분석하여 객체의 움직임 정보와 속성 정보를 패턴에 따라 하나의 문장 또는 단어 배열 형태로 제공하는 영상 분석을 통한 영상 텍스트화 장치에 관한 것이다.
이러한 본 발명은, 영상획득장치로부터 복수 개의 프레임으로 이루어진 영상데이터를 입력받아 영상데이터의 프레임별로 나타나는 적어도 하나의 객체의 영역 정보를 추출하여 상기 객체의 영역 정보로부터 시간대별로 변화하는 객체의 움직임 정보와 함께 객체의 속성 정보를 분석하는 분석부; 상기 분석부에서 분석된 상기 객체의 움직임 정보와 상기 객체의 속성 정보에 따라 복수 개의 패턴으로 분류하여 상기 패턴에 대응되게 복수 개의 이벤트 중 하나의 이벤트를 선택적으로 발생시키는 발생부; 상기 분석부에서 분석된 상기 객체의 움직임 정보와 상기 객체의 속성 정보에 대응되는 단어 집합을 저장하는 데이터베이스부; 및 상기 발생부에서 발생된 상기 이벤트의 주체가 되는 상기 객체의 움직임 정보와 속성 정보에 대응되는 단어들을 상기 데이터베이스부의 단어 집합에서 검색하고 상기 속성 정보와 상기 움직임 정보 및 상기 패턴에 따라 조합하여 하나의 문장 또는 단어 배열을 생성하는 생성부;를 포함하여 구성되는 것을 특징으로 하는 영상 분석을 통한 영상 텍스트화 장치를 기술적 요지로 한다.

Description

영상 분석을 통한 영상 텍스트화 장치{Apparatus for video to text using video analysis}

본 발명은 영상 분석을 통한 영상 텍스트화 장치에 관한 것으로, 더욱 상세하게는 영상획득장치로부터 입력되는 영상데이터에 포함되는 적어도 하나의 객체를 분석하여 객체의 움직임 정보와 속성 정보를 패턴에 따라 하나의 문장 또는 단어 배열 형태로 제공하는 영상 분석을 통한 영상 텍스트화 장치에 관한 것이다.

최근 들어 범죄, 교통사고 등의 사건이 빈번하게 일어나는 장소에는 영상데이터를 실시간으로 획득하여 저장하는 CCTV 등과 같은 영상획득장치를 설치하고 있다.

이러한 영상획득장치에 의해 획득 및 저장되는 상기 장소에 대한 영상데이터를 통해 상기 범죄, 교통사고 등의 사건의 후속 처리를 신속하게 할 수 있게 한다.

즉, 영상획득장치로부터 실시간으로 획득 및 저장된 범죄, 교통사고 등의 사건 사고에 대한 영상데이터를 다양한 방식으로 분석하여 사람, 차량 등과 같은 객체들의 움직임 정보를 추출함으로써 이를 통해 사건에 대한 관련 정보를 용이하게 획득할 수 있도록 하여 신속한 후속 처리를 가능하게 한다.

여기서 영상데이터를 분석하여 객체의 움직임을 추출할 때, 종래에는 영상데이터가 획득되는 장소의 특성에 맞게 영상데이터의 분석환경을 설정하여 그 분석환경을 토대로 하여 영상데이터를 분석하여 객체들의 움직임 정보를 추출하여 사건을 해결하는데 필요한 중요한 단서를 제공하고자 하였다.

즉, 종래의 영상 분석을 위한 검색 장치는 상기와 같은 분석환경을 장소에 맞게 별도로 설정해야 하는 불편함이 있을 뿐만 아니라 분석환경에 따라 사건의 해결을 위한 단서가 되는 객체들의 움직임 정보가 제대로 추출되지 않는 한계점이 있었다.

또한, 종래의 영상 분석을 위한 검색 장치는 사건이 발생한 이후에 관리자의 요청에 따라 영상데이터를 분석하여 객체들의 움직임 정보를 추출하여 사건의 해결 단서를 수동적으로 제공하는 구조이므로 객체들의 움직임 정보를 이용하여 사건의 발생 상황을 능동적으로 알려주지 못하는 단점도 있었다.

이러한 문제점들을 해소하기 위하여 본 출원인에 의해 분석환경을 자동으로 설정하면서 영상데이터를 스케줄링에 따라 자동으로 분석하여 객체들의 움직임 정보를 추출하고 추출된 객체들의 움직임 정보에 따라 복수 개의 이벤트로 분류 및 저장하는 아래의 특허문헌 1의 영상 분석을 위한 지능형 검색 로봇이 기등록되었다.

한편, 상기한 영상 분석을 위한 지능형 검색 로봇에 의해 제공되는 이벤트를 통해 범죄나 교통사고 등의 사건 발생시 단서를 포함하고 있는 영상정보를 관리자가 효과적으로 검색하여 해당 사건을 더욱 신속하게 처리 및 대응하기 위해서는 이벤트를 텍스트 형태로 제공하는 기술이 더 필요하다.

즉, 영상 분석을 통해 영상데이터로부터 분석되는 객체에 따른 이벤트들을 그 속에 포함되는 객체의 정보를 통해 하나의 문장 또는 단어 배열을 생성하여 텍스트화함으로써 더욱 신속 용이하게 해당 이벤트가 포함되는 영상을 검색할 수 있도록 하는 기술이 요구되고 있다.

국내 등록특허공보 제10-1285128호, 2013.07.05.자 등록.

본 발명은 상기한 문제점을 해소하기 위해 발명된 것으로서, 영상획득장치로부터 입력되는 영상데이터에 포함되는 적어도 하나의 객체를 분석하여 객체의 움직임 정보와 속성 정보에 따라 복수 개의 패턴으로 분류하고 패턴에 대응되는 복수 개의 이벤트 중 하나의 이벤트를 발생시킴과 동시에 객체의 움직임 정보와 속성 정보 및 패턴에 대응되는 단어들을 객체의 움직임 정보와 속성 정보 및 패턴에 따라 조합하여 하나의 문장 또는 단어 배열 형태로 제공하는 영상 분석을 통한 영상 텍스트화 장치를 제공하는데 그 목적이 있다.

본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.

상기 목적을 달성하기 위한 본 발명에 따른 영상 분석을 통한 영상 텍스트화 장치는, 영상획득장치로부터 복수 개의 프레임으로 이루어진 영상데이터를 입력받아 영상데이터의 프레임별로 나타나는 적어도 하나의 객체의 영역 정보를 추출하여 상기 객체의 영역 정보로부터 시간대별로 변화하는 객체의 움직임 정보와 함께 객체의 속성 정보를 분석하는 분석부; 상기 분석부에서 분석된 상기 객체의 움직임 정보와 상기 객체의 속성 정보에 따라 복수 개의 패턴으로 분류하여 상기 패턴에 대응되게 복수 개의 이벤트 중 하나의 이벤트를 선택적으로 발생시키는 발생부; 상기 분석부에서 분석된 상기 객체의 움직임 정보와 상기 객체의 속성 정보에 대응되는 단어 집합을 저장하는 데이터베이스부; 및 상기 발생부에서 발생된 상기 이벤트의 주체가 되는 상기 객체의 움직임 정보와 속성 정보에 대응되는 단어들을 상기 데이터베이스부의 단어 집합에서 검색하고 상기 속성 정보와 상기 움직임 정보 및 상기 패턴에 따라 조합하여 하나의 문장 또는 단어 배열을 생성하는 생성부;를 포함하여 구성되는 것을 특징으로 한다.

상기 생성부에서 생성된 상기 하나의 문장 또는 단어 배열을 상기 이벤트가 발생된 시간 정보를 포함하는 인덱스와 함께 저장하는 저장부를 더 포함하는 것을 특징으로 한다.

상기 저장부에 저장된 상기 하나의 문장 또는 단어 배열과 상기 인덱스를 상기 이벤트 발생시 출력하는 출력부;를 포함하여 구성되는 것을 특징으로 한다.

상기 분석부는, 상기 영상데이터의 픽셀 영역에서 프레임에 따라 픽셀값이 변화하는 복수 개의 픽셀을 검출하는 픽셀검출부; 상기 픽셀검출부에서 검출된 상기 복수 개의 픽셀을 상하좌우로 연결하여 상기 객체의 영역 정보를 사각형 형태로 추출하는 객체추출부; 상기 객체추출부에서 추출된 상기 객체의 영역 정보가 상기 영상데이터의 프레임별에 따라 변화하는 형태를 근거로 하여 상기 객체의 움직임 정보를 분석하는 움직임분석부; 및 상기 객체추출부에서 추출된 상기 객체의 영역 정보의 픽셀 크기와 픽셀값을 근거로 하여 상기 객체의 속성 정보를 분석하는 속성분석부;를 포함하여 구성되는 것을 특징으로 한다.

상기 패턴은, 상기 영상데이터의 픽셀 영역에서 분석된 상기 객체의 움직임 정보에 따라 적어도 두 개의 객체가 상호 만나는 제1패턴, 적어도 한 개의 객체의 이동 방향이 전환되는 제2패턴, 적어도 한 개의 객체의 이동 속도가 변하는 제3패턴, 및 적어도 세 개의 객체가 군집하는 제4패턴;을 포함하여 구성되는 것을 특징으로 한다.

상기 객체의 속성 정보는, 상기 객체를 사람과 사물 중의 하나로 구분하는 제1속성, 및 상기 객체를 색상으로 구분하는 제2속성을 포함하여 구성되는 것을 특징으로 한다.

상기 문장 또는 단어 배열은, 상기 객체의 속성 정보를 나타내는 주어부, 및 상기 객체의 움직임 정보를 나타내는 술어부를 포함하여 구성되는 것을 특징으로 한다.

상기한 구성에 의한 본 발명은, 영상획득장치로부터 획득되는 영상데이터에 포함된 적어도 하나의 객체의 속성 정보와 움직임 정보를 분석하여 복수 개의 패턴으로 분류되는 이벤트를 발생하고 상기 이벤트의 주체가 되는 객체의 속성 정보와 움직임 정보 및 패턴에 따라 하나의 문장 또는 단어 배열을 생성하여 텍스트화함으로써 범죄나 교통사고 등의 사건 발생시 단서를 포함하고 있는 영상정보를 더욱 효율적으로 검색하여 해당 사건을 더욱 더 신속하게 처리 및 대응할 수 있는 효과가 있다.

도 1은 본 발명의 바람직한 실시예에 따른 영상 분석을 통한 영상 텍스트화 장치를 도시한 블록도.
도 2는 본 발명의 바람직한 실시예에 따른 영상 분석을 통한 영상 텍스트화 장치의 분석부를 도시한 블록도.

본 발명에 따른 영상 분석을 통한 영상 텍스트화 장치는, 범죄, 교통사고 등의 사건이 빈번하게 일어나는 장소에 설치된 CCTV 등의 영상획득장치에서 획득한 영상데이터에 포함된 객체를 실시간으로 분석하여 사건을 암시하는 복수 개의 패턴에 대응되는 이벤트 중의 하나를 발생한 후 이벤트의 주체가 되는 객체의 속성 정보와 움직임 정보 및 패턴에 따라 하나의 문장 또는 단어 배열 형태로 텍스트화하는 장치이다.

즉, 본 발명에 따른 영상 분석을 통한 영상 텍스트화 장치는, 기존에 이벤트만을 발생하는 방식에서 벗어나 이벤트에 따른 객체의 속성 정보와 움직임 정보를 토대로 하여 하나의 문장 또는 단어 배열 형태로 텍스트화하여 사건의 단서를 포함하고 있는 영상데이터를 더욱 효율적으로 검색하여 해당 사건을 더욱 더 신속하게 처리 및 대응하도록 한 것이다.

이는 영상데이터에 포함되는 객체의 속성 정보와 움직임 정보를 분석하는 분석부, 객체의 속성 정보와 움직임 정보에 따라 복수 개의 패턴으로 분류하여 대응되는 이벤트를 발생시키는 발생부, 객체의 움직임 정보와 상기 객체의 속성 정보에 대응되는 단어 집합을 저장하는 데이터베이스부, 이벤트의 주체가 되는 객체의 움직임 정보와 속성 정보에 대응되는 단어들을 단어 집합에서 검색하여 하나의 문장 또는 단어 배열을 생성하는 생성부를 포함하는 구성에 의해 달성된다.

따라서 영상데이터에 포함된 객체에 대한 분석을 통해 복수 개의 패턴으로 분류되어 발생되는 이벤트들을 하나의 문장 또는 단어 배열 형태로 제공함으로써 사건 발생시 텍스트 방식으로의 검색이 가능하여 이벤트에 기인하는 해당 사건의 단서를 신속 용이하게 획득하여 효과적으로 대응 및 처리할 수 있도록 한다.

이하 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 상세하게 설명하면 다음과 같다.

도 1은 본 발명의 바람직한 실시예에 따른 영상 분석을 통한 영상 텍스트화 장치를 도시한 블록도이고, 도 2는 본 발명의 바람직한 실시예에 따른 영상 분석을 통한 영상 텍스트화 장치의 분석부를 도시한 블록도이다.

본 발명의 바람직한 실시예에 따른 영상 분석을 통한 영상 텍스트화 장치(100)는, 도 1에 도시된 바와 같이, 크게 분석부(110), 발생부(120), 데이터베이스부(130), 생성부(140)를 포함하여 구성될 수 있다.

먼저, 상기 분석부(110)는, 영상획득장치로부터 영상데이터를 입력받아 영상데이터에 나타나는 객체의 움직임 정보와 속성 정보를 분석하는 구성이다.

즉, 분석부(110)는 영상획득장치로부터 적어도 하나의 프레임으로 이루어진 영상데이터를 실시간으로 입력받아 영상데이터의 프레임별로 나타나는 적어도 하나의 객체의 영역 정보를 추출하여 시간대별로 변화하는 객체의 움직임 정보와 함께 객체가 가지는 객체의 속성 정보를 분석하는 것이다.

이때 분석부(110)는 도 2에 도시된 바와 같이 픽셀검출부(111), 객체추출부(112), 움직임분석부(113), 및 속성분석부(114)를 포함하여 구성될 수 있다.

상기 픽셀검출부(111)는, 영상 데이터의 픽셀 영역에서 프레임에 따라 픽셀값이 변화하는 복수 개의 픽셀을 검출하는 구성이다.

즉, t시간 대의 프레임과 t+1시간 대의 프레임을 차분하면 픽셀값이 임계값 이상으로 변화된 픽셀들을 추출하는 것이다.

상기 객체추출부(112)는, 픽셀검출부(111)에서 검출된 복수 개의 픽셀을 상하좌우로 연결하여 객체의 영역 정보를 사각형 형태로 추출하는 구성이다.

즉, 픽셀값이 임계값 이상으로 변화된 픽셀들을 상하좌우로 연결하여 최외각에 존재하는 픽셀들을 기준으로 하여 사각형 형태로 추출하여 객체의 영역 정보를 획득하는 것이다.

단, t+2시간 대의 프레임에서 추출된 객체의 영역 정보 중에서 그 이전 시간 대의 프레임에서 추출된 객체의 영역 정보와 가장 대응되는 픽셀 영역을 갖는 것을 동일한 객체로 판별하여 객체의 영역 정보를 시간대별로 갱신한다.

상기 움직임분석부(113)는, 객체추출부(112)에서 추출된 객체의 영역 정보가 영상 데이터의 프레임에 따라 변화하는 형태를 근거로 하여 객체의 움직임 정보를 분석하는 구성이다.

즉, 객체의 움직임 정보가 후술할 복수 개의 패턴과 같이 두 개의 객체가 상호 만나는 형태인지, 적어도 한 개의 객체의 이동 방향이 전환되는 형태인지, 적어도 한 개의 객체의 이동 속도가 변하는 형태인지, 적어도 세 개의 객체가 군집하는 형태인지를 분석하는 것이다.

상기 속성분석부(114)는, 객체추출부(112)에서 추출된 객체의 영역 정보의 픽셀 크기와 그 픽셀값들을 근거로 하여 객체의 속성 정보를 분석하는 구성이다. 이때 객체의 속성 정보는 체를 사람과 사물 중의 하나로 구분하는 제1속성, 및 상기 객체를 색상으로 구분하는 제2속성을 포함하여 구성될 수 있다.

즉, 객체의 영역 정보의 전체 픽셀 크기에 따라 해당 객체가 사람인지 차량인지를 분석하고 객체의 영역 정보의 픽셀값들에 따라 해당 객체가 어떤 색상을 가지는지를 분석하는 것이다.

예를 들어 객체의 영역 정보의 픽셀 크기가 기설정된 픽셀 크기보다 클 때는 차량으로 기설정된 픽셀 크기보다 작을 때는 사람으로 판별하고, 객체의 영역 정보의 픽셀들이 가지는 픽셀값인 RGB값에 따라 차량 또는 사람으로 분석된 객체의 색상을 결정한다.

이때 영상 데이터는 특정 장소를 기설정된 픽셀 크기로 촬영하여 획득한 것이므로 기설정된 픽셀 크기를 기준으로 하여 사람과 차량으로 구분하는 분석이 가능하다.

다음으로, 상기 발생부(120)는, 분석부(110)에서 분석된 객체의 움직임 정보와 객체의 속성 정보에 따라 복수 개의 패턴으로 분류하여 상기 패턴들에 대응되는 복수 개의 이벤트 중 하나의 이벤트를 선택적으로 발생시키는 구성이다.

이때 상기 패턴은 영상 데이터의 픽셀 영역에서 분석된 객체의 움직임 정보에 따라, 두 개의 객체가 상호 만나는 제1패턴, 적어도 한 개의 객체의 이동 방향이 전환되는 제2패턴, 적어도 한 개의 객체의 이동 속도가 변하는 제3패턴, 및 적어도 세 개의 객체가 군집하는 제4패턴으로 분류될 수 있다.

즉, 상기 제1패턴은 서로 다른 두 개 이상의 객체의 영역 정보가 맞물려지는 것을 포함하여 상기 객체들의 영역 정보가 일정 픽셀 이내로 근접한 상황을 포함하는 것으로, 제1이벤트를 발생하게 된다.

상기 제2패턴은 t시간대와 t+1시간대의 특정 객체의 움직임 정보를 비교하여 이동 방향이 적어도 픽셀 영역 상에서 특정 각도 이상 전환이 발생한 상황을 모두 포함하는 것으로, 제2이벤트를 발생하게 된다.

상기 제3패턴은 t~t+1시간대의 특정 객체의 움직임 정보에 따른 이동 거리보다 t+1~t+2의 이동 거리가 일정 이상 차이가 나면서 이동 속도가 증가 혹은 감소한 상황을 모두 포함하는 것으로, 제3이벤트를 발생하게 된다.

상기 제4패턴은 적어도 세 개 이상의 객체의 영역 정보가 일정 픽셀 영역 내에서 모여 있는 상황을 모두 포함하는 것으로, 제4이벤트를 발생하게 된다.

다음으로, 상기 데이터베이스부(130)는, 분석부(110)에서 분석된 객체의 움직임 정보와 객체의 속성 정보에 대응되는 단어 집합을 저장하는 구성이다.

즉, 데이터베이스부(130)는, 객체의 속성 정보와 움직임 정보를 패턴에 따라 텍스트화하기 위해 필요한 단어들로 이루어진 단어 집합을 데이터 형태로 저장하는 것이다.

예를 들어 객체의 속성 정보 중에서 객체의 종류를 나타내는 "사람"이나 "차량" 등을 포함하는 명사와, 객체의 개수를 나타내는 "한 명", "두 명", "세 명", "한 대" "두 대", "세 대" 등을 포함하는 관사와, 객체의 색상을 나타내는 "검은색", "빨간색", "노란색" 등을 포함하는 명사와, 객체의 움직임 정보를 패턴에 따라 나타내는 "상호 만나다", "이동 방향이 전환되다", "이동 속도가 변하다", "군집하다" 등을 포함하는 동사와, 상기 명사들과 동사들을 자연스럽게 연결하기 위하여 명사들에 붙는 "~가", "~이", "~와", "~의 "등을 포함하는 조사 등의 단어들을 저장하고 있다.

다음으로, 상기 생성부(140)는, 발생부(120)에서 발생된 이벤트의 주체가 되는 객체의 움직임 정보와 속성 정보에 대응되는 단어들을 데이터베이스부(130)의 단어 집합에서 검색하고 상기 속성 정보와 상기 움직임 정보 및 상기 패턴에 따라 조합하여 하나의 문장 또는 단어 배열을 생성하는 구성이다.

즉, 생성부(140)는 해당 이벤트를 하나의 문장 또는 단어 배열로 변환하되 해당 이벤트의 주체가 되는 객체의 움직임 정보와 속정 정보가 포함되면서 해당 이벤트가 분류된 패턴에 따라 하나의 문장 또는 단어 배열을 생성하는 것이다.

이때 상기 문장 또는 단어 배열은, 객체의 속성 정보를 나타내는 주어부, 및 객체의 움직임 정보를 나타내는 술어부를 포함하여 구성될 수 있다.

예를 들어 제1패턴에 대응되는 이벤트가 발생한 경우 "두 명의 사람이 상호 만나다"라는 하나의 완성된 문장을 생성하거나, 또는 "두 명, 사람, 상호 만나다"라는 단어 배열을 생성하는 것이다.

여기서, 본 발명의 바람직한 실시예에 따른 영상 분석을 통한 영상 텍스트화 장치(100)는 도 1에 도시된 바와 같이 생성부(140)에서 생성된 하나의 문장 또는 단어 배열을 이벤트가 발생된 시간 정보를 포함하는 인덱스와 함께 저장하는 저장부(150)를 더 포함하여 구성될 수 있다.

이때 저장부(150)는 생성부(140)에서 생성되는 하나의 문장 또는 단어 배열을 이벤트 발생 시간과 함께 저장함으로써 추후 이벤트들에 따른 문장 또는 단어 배열을 시간을 기준으로 하여 용이하게 검색하기 위한 구성이다.

그리고, 본 발명의 바람직한 실시예에 따른 영상 분석을 통한 영상 텍스트화 장치(100)는 도 1에 도시된 바와 같이 저장부(160)에 저장된 하나의 문장 또는 단어 배열과 인덱스를 이벤트 발생시마다 출력하는 출력부(160);를 포함하여 구성될 수 있다.

상기 출력부(160)는 이벤트의 발생시 해당 이벤트에 대응되는 하나의 문장 또는 단어 배열과 인덱스를 화면으로 자동으로 출력함으로써 관리자의 요청 없이도 이벤트의 발생을 표출하여 관리자가 신속하게 인지하도록 한 구성이다.

상기한 실시예는 예시적인 것에 불과한 것으로, 당해 기술분야에 대한 통상의 지식을 가진 자라면 이로부터 다양하게 변형된 다른 실시예가 가능하다.

따라서 본 발명의 진정한 기술적 보호범위에는 하기의 특허청구범위에 기재된 발명의 기술적 사상에 의해 상기의 실시예뿐만 아니라 다양하게 변형된 다른 실시예가 포함되어야 한다.

100: 영상 텍스트화 장치
110: 분석부 120: 발생부
130: 데이터베이스부 140: 생성부
111: 픽셀검출부 112: 객체추출부
113: 움직임분석부 114: 속성분석부

Claims

영상획득장치로부터 복수 개의 프레임으로 이루어진 영상데이터를 입력받아 영상데이터의 프레임별로 나타나는 적어도 하나의 객체의 영역 정보를 추출하여 상기 객체의 영역 정보로부터 시간대별로 변화하는 객체의 움직임 정보와 함께 객체의 속성 정보를 분석하는 분석부(110);
상기 분석부(110)에서 분석된 상기 객체의 움직임 정보와 상기 객체의 속성 정보에 따라 복수 개의 패턴으로 분류하여 상기 패턴에 대응되게 복수 개의 이벤트 중 하나의 이벤트를 선택적으로 발생시키는 발생부(120);
상기 분석부(110)에서 분석된 상기 객체의 움직임 정보와 상기 객체의 속성 정보에 대응되는 단어 집합을 저장하는 데이터베이스부(130); 및
상기 발생부(120)에서 발생된 상기 이벤트의 주체가 되는 상기 객체의 움직임 정보와 속성 정보에 대응되는 단어들을 상기 데이터베이스부(130)의 단어 집합에서 검색하고 상기 속성 정보와 상기 움직임 정보 및 상기 패턴에 따라 조합하여 하나의 문장 또는 단어 배열을 생성하는 생성부(140);를 포함하여 구성되되,
상기 문장 또는 단어 배열은,
상기 객체의 속성 정보를 나타내는 주어부, 및
상기 객체의 움직임 정보를 나타내는 술어부를 포함하여 구성되는 것을 특징으로 하는 영상 분석을 통한 영상 텍스트화 장치.
제1항에 있어서,
상기 생성부(140)에서 생성된 상기 하나의 문장 또는 단어 배열을 상기 이벤트가 발생된 시간 정보를 포함하는 인덱스와 함께 저장하는 저장부(150)를 더 포함하는 것을 특징으로 하는 영상 분석을 통한 영상 텍스트화 장치.
제2항에 있어서,
상기 저장부(160)에 저장된 상기 하나의 문장 또는 단어 배열과 상기 인덱스를 상기 이벤트 발생시 출력하는 출력부(160);를 포함하여 구성되는 것을 특징으로 하는 영상 분석을 통한 영상 텍스트화 장치.
제1항에 있어서,
상기 분석부(110)는,
상기 영상데이터의 픽셀 영역에서 프레임에 따라 픽셀값이 변화하는 복수 개의 픽셀을 검출하는 픽셀검출부(111);
상기 픽셀검출부(111)에서 검출된 상기 복수 개의 픽셀을 상하좌우로 연결하여 상기 객체의 영역 정보를 사각형 형태로 추출하는 객체추출부(112);
상기 객체추출부(112)에서 추출된 상기 객체의 영역 정보가 상기 영상데이터의 프레임별에 따라 변화하는 형태를 근거로 하여 상기 객체의 움직임 정보를 분석하는 움직임분석부(113); 및
상기 객체추출부(112)에서 추출된 상기 객체의 영역 정보의 픽셀 크기와 픽셀값을 근거로 하여 상기 객체의 속성 정보를 분석하는 속성분석부(114);를 포함하여 구성되는 것을 특징으로 하는 영상 분석을 통한 영상 텍스트화 장치.
제1항에 있어서,
상기 패턴은,
상기 영상데이터의 픽셀 영역에서 분석된 상기 객체의 움직임 정보에 따라
적어도 두 개의 객체가 상호 만나는 제1패턴,
적어도 한 개의 객체의 이동 방향이 전환되는 제2패턴,
적어도 한 개의 객체의 이동 속도가 변하는 제3패턴, 및
적어도 세 개의 객체가 군집하는 제4패턴;을 포함하여 구성되는 것을 특징으로 하는 영상 분석을 통한 영상 텍스트화 장치.
제1항에 있어서,
상기 객체의 속성 정보는,
상기 객체를 사람과 사물 중의 하나로 구분하는 제1속성, 및
상기 객체를 색상으로 구분하는 제2속성을 포함하여 구성되는 것을 특징으로 하는 영상 분석을 통한 영상 텍스트화 장치.
삭제