WO2014092446A1

WO2014092446A1 - 객체 기반 영상 검색시스템 및 검색방법

Info

Publication number: WO2014092446A1
Application number: PCT/KR2013/011451
Authority: WO
Inventors: 김정태; 구경모
Original assignee: 오드컨셉 주식회사
Priority date: 2012-12-12
Filing date: 2013-12-11
Publication date: 2014-06-19
Also published as: CN104903892B; KR101289085B1; US20150310012A1; CN104903892A

Abstract

본 발명은 사용자에 의해 입력된 정보와 객체 기반 정보의 구성이 유사한 등록 이미지 또는 동영상 또는 이와 관련된 정보를 효과적으로 검색할 수 있는 객체 기반 영상 검색시스템에 관한 것이다. 본 발명에 따른 객체 기반 영상 검색시스템은, 등록된 이미지 또는 동영상을 특징점 및 특징점의 속성에　따라 객체 기반으로 분류 또는 클러스터링하여 사용자가 PC, 태블릿, 모바일 및 커넥티드 TV 등의 사용자 단말기를 통해 이미지, 동영상을 업로드하거나 또는 음성, 텍스트로로 검색하면 간단하게 매치되는 등록이미지 또는 등록동영상을 검색하여 사용자 단말기로 해당 결과 또는 관련 정보를 제공하는 것이다.

Description

객체 기반 영상 검색시스템 및 검색방법

본 발명은 사용자에 의해 입력된 정보와 객체 기반 정보의 구성이 유사한 등록 이미지 또는 동영상 또는 이와 관련된 정보를 효과적으로 검색할 수 있는 객체 기반 영상 검색시스템 및 검색방법에 관한 것이다.

일반적으로 인터넷은 많은 컴퓨터 이용자들에게 유효 적절한 통신 및 정보검색수단을 제공한다. 특히, 최근에는 사용자가 이미지 또는 동영상을 업로드하면 이에 대응되는 이미지 또는 동영상을 비교하여 제공하는 검색방법들이 속속 개발되어 인터넷상에서 텍스트나 영상에 대한 정보검색에 상당한 진보를 이루어냈다.

그러나, 이러한 검색방법들은 사용자가 질의한 이미지 또는 동영상 내 다수의 객체들에 대한 정보를 반영하지 못 할뿐더러 유사 영상을 검색하는 과정에서 수반되는 활용 정보의 부족 또는 오인식 등에 의해 최초 사용자의 의도를 정확히 반영하는 결과를 제공하지 못 하는 문제가 있다.

또한 대용량의 이미지 또는 동영상 DB 내에서 정보의 손실을 최소화하면서 빠른 검색을 가능하게 하기 위해서 많은 정보의 요약방법이 거론되어 왔으나 일반적으로 DB의 양에 비례하여 검색속도가 증가할 수밖에 없었고 특정 단위의 메모리 사용량 내에서 더 많은 이미지 정보를 처리하기 위해서는 그에 비례한 정보의 손실이 수반되었다.

이를 극복하기 위해 이미지 또는 동영상으로 구성된 DB를 색상, 모양, 질감, 패턴 등의 1차원적 요소로 카테고리화할 경우 사용이 번거로워지거나 검색의 정확도가 심각히 훼손되는 문제가 있었다.

본 발명이 해결하고자 하는 과제는 사용자의 다양한 질의 수단이 포함하는 복합적인 정보에 대응 가능하기 위해 등록된 이미지 또는 동영상 각각의 객체정보를 검색에 반영하는 객체 기반 영상 검색시스템 및 검색방법을 제공하는 데 있다.

본 발명의 다른 해결과제는 등록된 이미지 또는 동영상을 객체 기반으로 클러스터링 함으로써 정보의 손실을 최소화한 상태에서 특정 단위의 메모리 사용량 내에서 보다 많은 이미지와 동영상의 정보를 빠르게 처리하는 객체 기반 영상 검색시스템 및 검색방법을 제공하는 데 있다.

본 발명의 또다른 해결과제는 단일 검색시스템에 있어 동일한 객체의 인식뿐만 아니라 객체의 구성정보를 활용해 육안과 흡사한 기준의 유사 이미지 또는 동영상 또는 이와 관련된 정보를 검색할 수 있는 객체 기반 영상 검색시스템 및 검색방법을 제공하는 데 있다.

본 발명의 제1실시예에 따른 객체 기반 영상 검색시스템은, 검색대상이 되는 등록된 각종 이미지 또는 동영상을 저장하고 관리하는 제1 등록영상 관리모듈(202)과; 등록된 이미지 또는 동영상으로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하는 제1 등록영상정보 추출모듈(203)과; 제1 등록영상정보 추출모듈(203)을 통해 추출된 영상정보의 유사성에 따라 하나 이상의 클래스를 생성하거나 분류하는 클래스 생성모듈(209)과; 클래스 생성모듈(209)을 통해 생성된 클래스에 대한 정보를 저장하고 관리하는 제1 클래스정보 관리모듈(210)과; 사용자 단말기를 통해 접수된 이미지 또는 동영상 또는 음성 또는 텍스트로부터 검색을 위해 검색콘텐츠의 관련 정보를 추출하는 제1 검색콘텐츠정보 추출모듈(211)과; 제1 검색콘텐츠정보 추출모듈(211)을 통해 추출된 검색콘텐츠정보를 기 분류된 클래스정보와 비교하여 동일 또는 유사하게 매치되는 클래스 또는 등록영상을 검색하는 제1 등록영상 검색모듈(216)과; 제1 등록영상 검색모듈(216)에서 검색된 등록영상 또는 등록영상의 클래스정보를 사용자 단말기에 검색결과로 제공하는 제1 검색결과 표시모듈(219)을 포함하며, 제1 검색콘텐츠정보 추출모듈(211)은 사용자로부터 접수된 검색이미지에 포함된 영상정보를 추출하는 제1 검색이미지 처리부(212), 또는 검색동영상을 분석하여 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하고, 각각의 씬에서 대표되는 하나 이상의 프레임을 대표프레임으로 선정하며, 선정된 대표프레임으로부터 영상정보를 추출하는 제1 검색동영상 처리부(213)를 포함하는 것을 특징으로 한다.

바람직하게, 제1 등록영상정보 추출모듈(203)에서 추출되는 영상정보를 구성하는 특징점은 이미지 또는 동영상에 포함된 윤곽선 또는 코너 또는 극점(주변 밝기보다 어둡거나 또는 밝은 부분)에 의해 생성되는 정보이고, 특징점의 시각적 속성은 특징점 주변의 영상들이 갖는 밝기정보 또는 색상정보 또는 패턴정보인 것을 특징으로 한다.

바람직하게, 제1 등록영상정보 추출모듈(203)은 등록된 이미지들에 포함된 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하고 저장하는 제1 등록이미지 영상정보 추출부(204)와; 등록된 동영상을 분석하여 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하는 제1 씬 분할부(206)와, 각각의 씬에서 대표되는 하나 이상의 프레임을 대표프레임으로 선정하는 제1 대표프레임 선정부(207)와, 선정된 대표프레임으로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하고 저장하는 제1 대표프레임 영상정보 추출부(208)로 이루어진 제1 등록동영상 영상정보 추출부(205)를 포함하는 것을 특징으로 한다.

바람직하게, 제1 씬 분할부(206)는 동영상 콘텐츠의 각 프레임을 HSV(색상/채도/밝기)의 빈도수 그래프로 작성하여 이전 프레임과 현재 프레임의 그래프를 비교하여 정해진 그래프간 거리값을 넘는 경우에는 프레임이 변하는 것으로 판단하여 씬으로 확인하는 것을 특징으로 한다.

바람직하게, 클래스 생성모듈(209)은 영상정보인 특징점 또는 특징점의 시각적 속성이 등록이미지 또는 등록동영상 내의 영상정보가 상호 유사할 경우 이를 군집화 하여 하나 이상의 클래스로 생성하거나 분류하며 이때 생성된 클래스가 기존에 생성된 클래스와 유사한 영상정보를 갖는 경우 동일하거나 유사한 클래스로 함께 분류하는 것을 특징으로 한다.

바람직하게, 제1 클래스정보 관리모듈(210)의 클래스정보는 클래스를 설명하는 텍스트정보, 영상정보, 카테고리정보, 특화정보 중 하나 이상인 것을 특징으로 한다.

바람직하게, 제1 검색콘텐츠정보 추출모듈(211)은 사용자 단말기로부터 제공받은 음성을 분석하여 텍스트로 변환시키는 제1 검색음성 처리부(214)와; 사용자 단말기로부터 제공받은 검색텍스트 또는 제1 검색음성 처리부(214)에서 변환된 텍스트를 분석하는 제1 검색텍스트 처리부(215)를 포함하는 것을 특징으로 한다.

바람직하게, 제1 등록영상 검색모듈(216)은 사용자에 의해 접수된 검색이미지 또는 검색동영상으로부터 추출된 영상정보를 클래스정보 내의 클래스별 영상정보와 비교하여 동일 또는 유사하게 매치되는 클래스를 검색하고, 검색된 클래스를 일부 또는 모두 포함하는 등록이미지 또는 등록동영상을 검색하는 제1 영상 검색부(217)와; 사용자에 의해 접수된 텍스트 또는 음성으로부터 추출되거나 변환된 텍스트정보를 클래스정보 내의 텍스트정보와 비교하여 동일 또는 유사하게 매치되는 클래스를 검색하고, 검색된 클래스를 일부 또는 모두 포함하는 등록이미지 또는 등록동영상을 검색하는 제1 텍스트 검색부(218)를 포함하는 것을 특징으로 한다.

또한, 본 발명의 제2실시예에 따른 객체 기반 영상 검색시스템은, 객체가 하나 이상 포함된 객체이미지를 등록받아 저장하고 등록받은 객체이미지에서 영상정보를 추출하여 저장하는 객체이미지 관리모듈(301)과; 객체이미지 관리모듈(301)을 통해 추출된 객체이미지의 영상정보의 유사성에 따라 군집화 하여 하나 이상의 동일한 클래스로 분류한 후 해당 클래스를 설명하는 클래스의 텍스트를 클래스정보로 함께 저장하는 제2 클래스정보 관리모듈(302)과; 검색대상이 되는 등록된 각종 이미지 또는 동영상을 등록영상으로 저장하고 관리하는 제2 등록영상 관리모듈(303)과; 등록된 이미지 또는 동영상의 전체 또는 일부로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하는 제2 등록영상정보 추출모듈(304)과; 등록된 이미지 또는 등록된 동영상으로부터 각각의 영상정보가 추출되면 해당 영상정보를 기 생성된 클래스의 영상정보와 비교하여 동일하거나 유사한 영상정보를 갖는 클래스에 대한 정보를 등록된 이미지 또는 동영상에 함께 저장하는 등록영상 분류모듈(310)과; 사용자 단말기를 통해 접수된 이미지 또는 동영상 또는 음성 또는 텍스트의 검색콘텐츠로부터 검색콘텐츠정보를 추출하는 제2 검색콘텐츠정보 추출모듈(311)과; 제2 검색콘텐츠정보 추출모듈(216)을 통해 추출된 검색콘텐츠정보를 기 생성된 클래스의 영상정보 또는 클래스의 텍스트와 비교하여 동일 또는 유사하게 매치되는 클래스를 검색하고 검색된 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색하는 제2 등록영상 검색모듈(316)과; 제2 등록영상 검색모듈(316)에서 검색된 클래스정보 또는 등록영상정보를 사용자 단말기에 검색결과로 제공하는 제2 검색결과 표시모듈(319)을 포함하며, 제2 검색콘텐츠정보 추출모듈(311)은 사용자로부터 접수된 검색이미지에 포함된 영상정보를 추출하는 제2 검색이미지 처리부(312), 검색동영상을 분석하여 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하고, 각각의 씬에서 대표되는 하나 이상의 프레임을 대표프레임으로 선정하며, 선정된 대표프레임으로부터 영상정보를 추출하는 제2 검색동영상 처리부(313), 사용자 단말기로부터 제공받은 음성을 분석하여 음성을 텍스트로 변환시키는 제2 검색음성 처리부(314), 사용자 단말기로부터 제공받은 검색텍스트 또는 제2 검색음성 처리부(314)에서 변환된 텍스트를 분석하는 제2 검색텍스트 처리부(315) 중 하나 이상을 포함하는 것을 특징으로 한다.

본 발명에 따른 객체 기반 영상 검색시스템은 이미지 또는 동영상에서 추출된 복수의 객체 기반 정보를 이용함으로써 다양한 질의 수단을 통해 입력된 복합적인 정보에 효과적으로 대응할 수 있는 장점이 있다.

또한, 등록된 이미지 또는 동영상을 객체 기반으로 클러스터링함으로써 정보의 손실을 최소화한 상태에서 특정 단위의 메모리 사용량 내에서 보다 많은 이미지와 동영상의 정보를 빠르게 처리할 수 있는 장점이 있다.

또한, 동일 객체의 인식뿐만 아니라 객체의 구성정보를 활용해 육안과 흡사한 기준의 유사 이미지 또는 동영상 또는 이와 관련된 정보를 단일 시스템에서 검색 가능함으로써 사용자의 의도에 부합하는 입체적인 검색 방법을 제공하는 장점이 있다.

도 1은 본 발명의 제1실시예에 따른 객체 기반 영상 검색시스템의 블록도.

도 2는 본 발명의 제1실시예에 따른 객체 기반 영상 검색시스템을 이용한 영상 콘텐츠 검색과정의 플로차트.

도 3은 본 발명의 제1실시예에 따라 클래스를 생성하는 예시도.

도 4는 본 발명의 제1실시예에 따른 객체 기반 영상 검색시스템을 이용한 음성 또는 텍스트를 이용한 검색과정의 플로차트.

도 5는 본 발명의 제2실시예에 따른 객체 기반 영상 검색시스템의 블록도.

도 6은 본 발명의 제2실시예에 따른 객체 기반 영상 검색시스템을 이용한 영상 콘텐츠 검색과정의 플로차트.

이하, 첨부된 도면을 참조하여 본 발명의 객체 기반 영상 검색시스템에 대하여 자세히 살펴본다.

본 발명의 제1실시예에 따른 영상 콘텐츠 검색시스템의 기본 개념은 등록된 이미지 또는 동영상을 특징점 및 특징점의 속성에　따라 객체 기반으로 분류 또는 클러스터링하여 사용자가 PC, 태블릿, 모바일 및 커넥티드 TV 등의 사용자 단말기를 통해 이미지, 동영상을 업로드하거나 또는 음성, 텍스트로로 검색하면 간단하게 매치되는 등록이미지 또는 등록동영상을 검색하여 사용자 단말기로 해당 결과 또는 관련 정보를 제공하는 것이다.

도 1을 참조하여 영상 콘텐츠 검색시스템에 자세히 살펴보면, 영상 콘텐츠 검색시스템은 제1 등록영상 관리모듈(202), 제1 등록영상정보 추출모듈(203), 클래스 생성모듈(209), 제1 클래스정보 관리모듈(210), 제1 검색콘텐츠정보 추출모듈(211), 제1 등록영상 검색모듈(216), 제1 검색결과 표시모듈(219)을 포함한다.

제1 등록영상 관리모듈(202)은 검색대상이 되는 등록된 각종 이미지 또는 동영상을 제1 등록영상DB(221)에 저장하고 관리한다. 이때, 제1 등록영상 관리모듈(202)은 검색대상이 되는 이미지 또는 동영상을 등록이미지 또는 등록동영상으로 저장하거나 또는 실시간으로 웹을 검색하여 사용할 수 있다. 또한 제1 등록영상 관리모듈(202)에 이미지와 동영상이 등록되는 경우에는 등록된 이미지 또는 동영상의 이름, 저작권자 등을 포함한 관련정보가 함께 저장될 수 있다.

제1 등록영상정보 추출모듈(203)은 등록된 이미지 또는 동영상으로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출한다. 영상정보로 추출되는 특징점은 이미지 또는 동영상에 포함된 윤곽선 또는 코너 또는 극점(주변 밝기보다 어둡거나 또는 밝은 부분)에 의해 생성되는 정보이고, 특징점의 시각적 속성은 특징점 주변의 영상들이 갖는 밝기정보 또는 색상정보 또는 패턴정보 등을 의미한다.

이러한 제1 등록영상정보 추출모듈(203)은 등록된 이미지로부터 영상정보를 추출하는 제1 등록이미지 영상정보 추출부(204)와, 등록된 동영상으로부터 영상정보를 추출하는 제1 등록동영상 영상정보 추출부(205)로 이루어진다.

제1 등록이미지 영상정보 추출부(204)는 등록된 이미지들에 포함된 하나 이상의 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하고 추출된 영상정보를 등록이미지와 함께 저장한다. 이러한 제1 등록이미지 영상정보 추출부(204)를 통해 등록된 각각의 이미지들이 포함하는 영상정보를 모두 추출할 수 있다.

제1 등록동영상 영상정보 추출부(205)는 등록된 동영상을 분석하여 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하는 제1 씬 분할부(206)와, 각각의 씬에서 대표되는 하나 이상의 프레임을 대표프레임으로 선정하는 제1 대표프레임 선정부(207)와, 선정된 대표프레임으로부터 하나 이상의 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하고 등록동영상과 함께 저장하는 제1 대표프레임 영상정보 추출부(208)로 이루어진다. 이때, 제1 씬 분할부(206)는 동영상 콘텐츠의 각 프레임을 HSV(색상/채도/밝기)의 빈도수 그래프로 작성하여 이전 프레임과 현재 프레임의 그래프를 비교하여 정해진 그래프간 거리값을 넘는 경우에는 프레임이 변하는 것으로 판단하여 씬으로 확인할 수 있으며, 확인된 각각의 씬에는 고유 ID가 부여되는 것이 바람직하다. 이때, 변화가 시작되는 프레임은 S(Start)로 표시하고, 변화가 종료되는 프레임은 E(End)로 표시하여 구분하는 것이 바람직하다. 또한, 제1 대표프레임 선정부(207)에서 선정되는 대표프레임은 씬을 구성하는 프레임들이 거의 유사하므로 전단, 중간 또는 후단의 어느 프레임을 선정하더라도 무방하다. 이러한 제1 등록영상정보 추출모듈(203)에 의하여 등록된 이미지의 영상정보 뿐만아니라 등록된 동영상에 포함된 영상정보도 모두 추출할 수 있다.

클래스 생성모듈(209)은 제1 등록영상정보 추출모듈(203)을 통해 추출된 등록이미지 또는 등록동영상의 특징점 또는 특징점의 시각적 속성에 대한 영상정보를 서로 비교하여 동일 또는 유사한 경우 이를 함께 군집화 하여 하나 이상의 클래스로 생성하거나 기존에 생성된 클래스와 동일하면 기존의 클래스로 함께 분류한다. 예를 들면, 클래스는 자연>>산, 바다, 하늘, 땅>>하늘>>푸른하늘, 저녁 하늘 등과 같이 분류될 수 있다.

제1 클래스정보 관리모듈(210)은 클래스 생성모듈(209)을 통해 생성된 클래스의 클래스정보를 클래스정보DB(222)에 저장하고 관리한다. 이때 클래스정보DB(222)에 저장되는 클래스정보는 각 클래스의 영상정보, 카테고리정보, 클래스의 설명에 대한 텍스트정보, 특화정보 중 하나 이상을 포함하여 구성된다. 영상정보는 제1 클래스 생성모듈(209)을 통해 생성된 각 클래스의 특징점 또는 특징점의 시각적 속성을 포함하며, 카테고리정보는 각 클래스 간의 상 하위 개념, 종속성, 연관성 등에 의해 구분된 클래스정보를 의미한다. 예를 들어 상 하위 개념에 의한 카테고리정보의 경우 도 2에 도시된 바와 같이, 이미지의 영상정보로부터 푸른 하늘(sky), 횡단보도가 있는 도로(street), 시가지 고층 빌딩(building), LG, 펩시, 사람들(people), 차량(car) 등을 클래스로 분류할 수 있다. 또한, 푸른 하늘에 대한 클래스는 자연>하늘>푸른 하늘이라는 카테고리로 상 하위 개념에 의해 구분된다. 그리고 종속성에 의한 카테고리정보는 각 클래스 별로 해당 클래스 및 이와 유사한 클래스를 포함하고 있는 DB 내 다른 등록 이미지 또는 등록 동영상의 정보가 포함되며, 연관성에 의한 카테고리정보는 각 클래스별로 해당 클래스와 유사한 DB내 다른 클래스의 정보가 포함된다. 텍스트정보는 각 클래스를 설명하거나 나타내는 키워드 또는 텍스트를 포함하며 이러한 정보는 등록된 이미지 또는 동영상의 이름, 저작권자 정보 등을 함께 저장한 제1 등록영상 관리모듈(202) 또는 관리자로부터 제공받을 수 있다.

제1 검색콘텐츠정보 추출모듈(211)은 사용자 단말기를 통해 접수된 이미지 또는 동영상 또는 음성 또는 텍스트로부터 검색을 위해 검색콘텐츠의 관련 정보를 추출한다. 사용자 단말기는 PC, 태블릿, 모바일 및 커넥티드 TV 등의 단말기를 포함하며, 검색영상은 사용자 단말기에서 재생되거나 촬영 중인 영상 또는 저장된 이미지 파일 또는 영상을 제공받는다.

제1 검색콘텐츠정보 추출모듈(211)은 제1 검색이미지 처리부(212), 제1 검색동영상 처리부(213), 제1 검색음성 처리부(214), 제1 검색텍스트 처리부(215)로 이루어진다.

제1 검색이미지 처리부(212)는 사용자로부터 접수된 검색이미지로부터 영상정보를 추출한다. 이러한, 제1 검색이미지 처리부(212)에서 추출되는 영상정보는 제1 등록이미지 영상정보 추출부(204)에서 영상정보를 추출하는 방법과 동일하게 검색이미지에 포함된 객체의 윤곽선 또는 코너 또는 극점(주변 밝기보다 어둡거나 또는 밝은 부분)에 대한 특징점 정보와 특징점 주변의 영상들이 갖는 밝기정보 또는 색상정보 또는 패턴정보 등의 시각적 정보를 포함한다. 이러한 제1 검색이미지 처리부(212)를 통해 사용자가 접수한 검색이미지에 포함된 영상정보를 추출할 수 있다.

제1 검색동영상 처리부(213)는 검색동영상을 분석하여 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하고, 각각의 씬에서 대표되는 프레임을 대표프레임으로 선정하며, 선정된 대표프레임으로부터 영상정보를 추출한다. 이러한 제1 검색동영상 처리부(213)에서 추출되는 영상정보는 전술한 제1 등록동영상 영상정보 추출부(205)의 제1 씬 분할부(206), 제1 대표프레임 선정부(207), 제1 대표프레임 영상정보 추출부(208)와 동일한 과정으로 검색동영상으로부터 대표프레임에 대한 영상정보를 추출한다. 이에 따라 제1 검색동영상 처리부(213)를 통해 사용자가 접수한 검색동영상에 포함된 영상정보를 추출할 수 있다.

제1 검색음성 처리부(214)는 사용자 단말기로부터 제공받은 음성을 분석하여 음성을 텍스트로 변환시킨다. 이러한 제1 검색음성 처리부(214)는 음성인식기를 이용하여 음성을 텍스트로 변환시킬 수 있다. 예를 들면, "사람과 자동차와 빌딩이 있는 시가지 영상을 찾아줘, 대신 저녁 시간에 촬영된 영상은 제외해"라는 내용이면 이를 텍스트로 변환한다.

제1 검색텍스트 처리부(215)는 사용자 단말기로부터 제공받은 검색텍스트 또는 제1 검색음성 처리부(214)에서 변환된 텍스트를 분석한다.

제1 등록영상 검색모듈(216)은 제1 검색콘텐츠정보 추출모듈(211)을 통해 추출된 검색콘텐츠의 정보를 기 분류된 클래스정보와 비교하여 동일 또는 유사하게 매치되는 하나 이상의 클래스를 검색하고 해당 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색한다. 제1 등록영상 검색모듈(216)은 영상정보를 검색하는 제1 영상 검색부(217)와 텍스트를 비교하는 제1 텍스트 검색부(218)로 이루어진다.

제1 영상 검색부(217)는 사용자에 의해 접수된 검색이미지 또는 검색동영상으로부터 추출된 영상정보를 클래스 내의 클래스별 영상정보와 비교하여 동일 또는 유사하게 매치되는 클래스를 검색하거나 검색된 클래스를 일부 또는 모두 포함하는 등록이미지 또는 등록동영상을 검색한다. 이때, 검색이미지 또는 검색동영상의 영상정보로부터 1차로 각각의 영상정보에 대응되는 하나 이상의 클래스를 검색할 수 있고, 2차로 검색된 하나 이상의 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색할 있다.

제1 텍스트 검색부(218)는 사용자에 의해 접수된 텍스트 또는 음성으로부터 추출되거나 변환된 텍스트정보를 클래스정보 내의 텍스트와 비교하여 동일 또는 유사하게 매치되는 클래스를 검색하고, 검색된 클래스를 일부 또는 모두 포함하는 등록이미지 또는 등록동영상을 검색한다. 이때, 제1 텍스트 검색부(218)가 1차로 동일 또는 유사한 클래스를 검색하고, 2차로 해당 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색한다. 예를 들면 제1 텍스트 검색부(218)가 분석한 텍스트정보가 "사람과 자동차와 빌딩이 있는 시가지 영상을 찾아줘, 대신 저녁 시간에 촬영된 영상은 제외해"인 경우 사람과 자동차와 빌딩에 대한 텍스트정보와 클래스정보로 저장된 텍스트를 비교하여 매치되는 클래스를 검출하되 클래스의 영상정보로부터 추출된 색상에 대한 텍스트 정보를 반영하여 붉은색 계열의 클래스는 제외할 수 있다. 이와 같이 선택과 제어를 통해 검출된 클래스와 동일하거나 유사한 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색할 수 있다.

제1 검색결과 표시모듈(219)은 제1 등록영상 검색모듈(216)에서 검색된 클래스의 정보 또는 등록영상의 정보를 사용자 단말기에 검색결과로 제공한다.

이하, 도 3의 플로차트를 참조하여 본 발명의 제1실시예에 따른 객체기반 영상검색 시스템의 검색과정에 대하여 자세히 살펴한다.

먼저, 제1 등록영상정보 추출모듈(203)을 통해 검색대상이 되는 등록이미지의 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하고(단계 S101), 등록동영상으로부터 각 대표프레임의 특징점 또는 특징점의 시각적 속성을 영상정보로 추출한다(단계 S102). 이때, 영상정보로 추출되는 특징점은 이미지 또는 동영상에 포함된 윤곽선 또는 코너 또는 극점(주변 밝기보다 어둡거나 또는 밝은 부분)에 의해 생성되는 정보이고, 특징점의 시각적 속성은 특징점 주변의 영상들이 갖는 밝기정보 또는 색상정보 또는 패턴정보 등을 의미한다. 또한, 등록동영상은 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하고, 각각의 씬에서 대표되는 프레임을 대표프레임으로 선정하며, 선정된 대표프레임으로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출할 수 있다. 이러한 과정을 통해 등록이미지 또는 대표프레임으로부터 특징점 또는 특징점의 시각적 속성에 대한 영상정보를 추출할 수 있다.

한편, 클래스 생성모듈(209)은 추출된 영상정보의 동일성 또는 유사성에 따라 군집화 하여 하나 이상의 클래스로 생성하거나 분류하고 등록된 이미지 또는 동영상과 등록된 이미지 또는 동영상 내의 각 클래스정보가 상호 호출되기 용이한 형태로 함께 연동하거나 저장한다(단계 S103). 이때, 기존에 생성된 클래스와 유사한 영상정보를 갖는 신규 생성된 클래스는 기존에 생성된 클래스와 동일하거나 유사한 클래스로 함께 분류할 수 있다.

한편, 제1 클래스정보 관리모듈(210)은 클래스 생성모듈(209)을 통해 생성된 클래스의 클래스정보를 클래스정보DB(222)에 저장한다(단계 S104). 클래스정보는 각 클래스 별 영상정보, 카테고리정보, 텍스트정보, 특화정보 중 하나 이상을 포함하며 등록된 이미지 또는 동영상의 이름, 저작권자 정보 등을 함께 저장한 제1 등록영상 관리모듈(202) 또는 제 1 등록영상 관리모듈(202)이 제공하는 데이터로 웹을 통해 2차 검색한 결과 또는 관리자로부터 이러한 정보를 제공받을 수 있다. 이에 따라 등록이미지 또는 동록동영상에 다수의 클래스가 포함되어 있더라도 클래스정보를 함께 저장하여 간단하게 어떠한 클래스가 포함되어 있는 지를 확인할 수 있다.

한편, 사용자 단말기로부터 검색하고자 하는 이미지, 검색동영상 등의 검색콘텐츠를 제공받으면(단계 S105), 제1 검색콘텐츠정보 추출모듈(211)은 사용자로부터 제공받은 검색콘텐츠의 영상정보를 추출한다.

즉, 사용자 단말기로부터 제공받은 검색이미지 또는 검색동영상은 검색영상정보 추출모듈의 제1 검색이미지 처리부(212)에서 검색이미지로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하고(단계 S106), 제1 검색동영상 처리부(213)에서 검색동영상으로부터 대표프레임에 포함된 특징점 또는 특징점의 시각적 속성을 영상정보로 추출한다(단계 S107). 이러한 과정을 통해 검색이미지뿐만 아니라 또는 검색동영상에서도 특징점 및 특징점의 시각적 속성으로부터 영상정보를 추출할 수 있다.

그리고 제1 등록영상 검색모듈(216)은 검색이미지 또는 검색동영상으로부터 추출된 특징점 또는 특징점의 시각적 속성 등의 영상정보를 클래스의 영상정보와 비교하여 동일 또는 유사한 클래스를 검색하고(단계 S108), 검색된 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색한다(단계 S109).

한편, 검색된 클래스정보 또는 등록영상에 대한 정보는 리스트화되어 제1 검색결과 표시모듈(219)을 통해 사용자 단말기에 검색결과로 제공한다(단계 S110).

한편, 도 4에 도시된 바와 같이, 검색콘텐츠 접수모듈을 통해서 사용자 단말기로부터 검색하고자 하는 음성 및 텍스트 등의 검색콘텐츠를 제공받으면(단계 S202), 제1 검색콘텐츠정보 추출모듈(211)의 제1 검색음성 처리부(214)는 제공받은 음성을 음성인식기 등으로 음성을 텍스트로 변환시킨다(단계 S203).

그리고, 제1 등록영상 검색모듈(216)의 제1 텍스트 검색부(218)는 음성에서 변환된 텍스트 또는 사용자 단말기로부터 직접 텍스트로 제공받는 검색텍스트를 클래스정보의 텍스트와 비교하여 동일 또는 유사하게 매치되는 텍스트를 갖는 클래스를 검색하고(단계 S204), 검색된 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색한다(단계 S205). 이에 따라 이미지 또는 동영상을 설명하는 음성 또는 텍스트로부터 관련된 등록이미지 또는 등록동영상을 검색할 수 있다.

한편, 검색된 클래스정보 또는 등록영상에 대한 정보는 리스트화되어 제1 검색결과 표시모듈(219)을 통해 사용자 단말기에 검색결과로 제공된다(단계 S206).

본 발명의 제2 실시예에 따른 영상 콘텐츠 검색시스템의 기본 개념은 영상 콘텐츠 검색시스템에 하나 이상의 객체가 포함된 객체이미지를 입력하고 이로부터 영상정보를 추출하여 영상정보의 유사성 또는 동일성에 따라 하나 이상의 클래스로 생성하거나 분류한 후 생성된 클래스의 영상정보를 검색대상이 되는 등록이미지 또는 등록동영상의 영상정보와 매치시킨 상태에서 사용자가 이미지, 동영상, 음성 또는 텍스트의 검색콘텐츠로 영상의 검색을 요청하면 검색콘텐츠로부터 검색콘텐츠정보를 추출하여 이와 매치되는 클래스정보를 검색한 후 검색된 결과와 유사하거나 동일한 하나 이상의 클래스를 공유하는 등록이미지 또는 등록동영상을 검색하는 것이다.

도 6을 참조하여 본 발명의 제2실시예에 따른 영상 콘텐츠 검색시스템에 자세히 살펴보면, 영상 콘텐츠 검색시스템은 객체이미지 관리모듈(301), 제2 클래스정보 관리모듈(302), 제2 등록영상 관리모듈(303), 제2 등록영상정보 추출모듈(304), 제2 검색콘텐츠정보 추출모듈(311), 제2 등록영상 검색모듈(316), 제2 검색결과 표시모듈(319)을 포함한다.

객체이미지 관리모듈(301)은 하늘, 사람, 빌딩, 거리 등의 각종 객체가 하나 이상 포함된 객체이미지를 등록받아 객체이미지DB(320)에 저장하고 등록받은 객체이미지에서 영상정보를 추출한 후 영상정보의 동일성 또는 유사성에 따라 군집화하여 하나 이상의 클래스로 생성하거나 분류하여 객체이미지DB(320)에 함께 저장한다. 이때, 객체이미지의 영상정보는 이미지에 포함된 객체의 윤곽선 또는 코너 또는 극점(주변 밝기보다 어둡거나 또는 밝은 부분)에 대한 특징점 정보와 특징점의 시각적 속성(특징점 주변의 영상들이 갖는 밝기정보 또는 색상정보 또는 패턴정보 등)에 따라 추출할 수 있다. 추출된 객체 이미지의 영상정보의 유사성에 따라 군집화 하여 하나 이상의 클래스로 생성하거나 분류하며 기존에 생성된 클래스와 유사한 영상정보를 갖는 신규 생성된 클래스는 동일하거나 유사한 클래스로 함께 분류될 수 있다.

제2 클래스정보 관리모듈(302)은 객체이미지 관리모듈(301)을 통해 생성된 클래스의 정보를 객체이미지DB(320)에 함께 저장한다. 이때, 클래스는 각각 고유 ID가 부여될 수 있으며, 클래스정보는 각 클래스 별 영상정보, 카테고리정보, 텍스트정보, 특화정보 중 하나 이상이 포함된다.

제2 등록영상정보 추출모듈(304)은 실시예1의 제1 등록영상정보 추출모듈(203)과 동일하게 등록된 이미지 또는 동영상의 특징점 또는 특징점의 시각적 속성을 영상정보로 추출한다. 제2 등록영상정보 추출모듈(304)은 등록된 이미지로부터 영상정보를 추출하는 제2 등록이미지 영상정보 추출부(305)와, 등록된 동영상으로부터 영상정보를 추출하는 제2 등록동영상 영상정보 추출부(306)로 이루어지고, 또한, 등록동영상 영상정보 추출부(306)는 제2 씬 분할부(307)와, 제2 대표프레임 선정부(308)와, 제2 대표프레임 영상정보 추출부(309)로 이루어진다. 제2 등록이미지 영상정보 추출부(305)와 제2 등록동영상 영상정보 추출부(306)는 실시예1의 제1 등록이미지 영상정보 추출부(204)와 제1 등록동영상 영상정보 추출부(205)와 동일하므로 이에 대한 설명은 생략한다.

등록영상 분류모듈(310)은 제2 등록영상정보 추출모듈(304)을 통해 등록된 이미지 또는 등록된 동영상으로부터 각각의 영상정보가 추출되면 영상정보를 객체이미지DB(320)에 저장된 각 클래스의 영상정보와 비교하여 동일하거나 유사한 영상정보를 갖는 클래스에 대한 정보를 저장한다. 이때, 등록영상 분류모듈(310)은 각각 등록영상에 매치된 클래스의 ID 정보를 함께 저장하여 기록할 수 있다.

제2 검색콘텐츠정보 추출모듈(311)은 실시예1의 제1 검색콘텐츠정보 추출모듈(211)과 동일하게 사용자 단말기를 통해 접수된 이미지 또는 동영상 또는 음성 또는 텍스트로부터 검색을 위해 검색콘텐츠의 정보를 추출한다. 제2 검색콘텐츠정보 추출모듈(311)은 제1 검색콘텐츠정보 추출모듈(211)과 동일하게 제2 검색이미지 처리부(312), 제2 검색동영상 처리부(313), 제2 검색음성 처리부(314), 제2 검색텍스트 처리부(315)로 이루어진다.

제2 등록영상 검색모듈(316)은 제2 검색콘텐츠정보 추출모듈(311)을 통해 추출된 검색콘텐츠의 영상정보를 객체이미지DB(320)에 저장된 클래스의 영상정보와 비교하여 동일 또는 유사하게 매치되는 하나 이상의 클래스를 검색하고 해당 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색한다. 제2 등록영상 검색모듈(316)은 영상정보를 검색하는 제2 영상 검색부(317)와 텍스트를 비교하는 제2 텍스트 검색부(318)로 이루어진다.

제2 영상 검색부(317)는 사용자에 의해 접수된 검색이미지 또는 검색동영상으로부터 추출된 영상정보를 클래스의 영상정보와 비교하여 동일 또는 유사하게 매치되는 클래스를 검색하고, 검색된 클래스를 일부 또는 모두 포함하는 등록이미지 또는 등록동영상을 검색한다. 이때, 1차로 검색이미지 또는 검색동영상의 영상정보에 대응되는 하나 이상의 클래스를 검색할 수 있고, 2차로 해당 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색할 있다.

제2 텍스트 검색부(318)는 사용자에 의해 접수된 텍스트 또는 음성으로부터 추출되거나 변환된 텍스트정보를 클래스정보 내의 텍스트와 비교하여 동일 또는 유사하게 매치되는 클래스를 검색하고, 검색된 클래스를 일부 또는 모두 포함하는 등록이미지 또는 등록동영상을 검색한다. 이때, 제2 텍스트 검색부(318)는 1차로 동일 또는 유사한 클래스를 검색하고, 2차로 등록이미지 또는 등록동영상을 검색한다.

제2 검색결과 표시모듈(319)은 제2 등록영상 검색모듈(316)에서 검색된 클래스의 정보 또는 등록영상의 정보를 사용자 단말기에 검색결과로 제공한다.

이하, 도 5의 플로차트를 참조하여 본 발명에 따른 영상 콘텐츠 검색과정에 대하여 자세히 살펴한다.

먼저, 객체이미지 관리모듈(301)은 하늘, 빌딩, 사람, 거리 등의 각종 객체가 하나 이상 포함된 이미지를 등록받아 객체이미지DB(320)에 저장하고 등록받은 객체이미지의 영상정보를 추출한 후 영상정보의 동일성 또는 유사성에 따라 군집화하여 하나 이상의 클래스로 생성하거나 분류(단계 S301). 이때, 객체이미지는 이미지에 포함된 객체의 윤곽선 또는 코너 또는 극점(주변 밝기보다 어둡거나 또는 밝은 부분)에 대한 특징점 정보와 특징점의 시각적 속성의 유사성에 따라 군집화 하여 클래스로 생성하거나 분류할 수 있다.

그리고, 제2 클래스정보 관리모듈(302)은 클래스의 영상정보와 클래스에 관련된 정보를 객체이미지DB(320)에 함께 저장한다(단계 S302). 이때, 클래스는 각각 고유 ID가 부여될 수 있으며, 클래스에 관련된 정보는 클래스를 설명하는 텍스트정보, 카테고리정보, 특화정보 중 하나 이상으로 구성된다.

한편, 검색대상이 되는 등록이미지 또는 등록동영상은 제2 등록영상 관리모듈(303)을 통해서 등록받아 저장하며(단계 S303), 등록된 등록이미지 또는 등록동영상은 제2 등록영상정보 추출모듈(304)을 통해 등록이미지로부터 영상정보를 추출하고(단계 S304), 등록동영상으로부터 각 대표프레임의 영상정보를 추출한다(단계 S305).

그리고, 제2 등록영상 관리모듈(303)을 통해 추출된 등록된 이미지 또는 동영상의 영상정보를 클래스 내의 영상정보와 비교하여 동일 또는 유사하게 매치되는 클래스를 확인하고(단계 S306), 매치되는 클래스에 대한 정보를 등록영상에 함께 저장한다(단계 S307). 이에 따라 등록이미지 또는 등록동영상에 다수의 객체가 포함되어 있더라도 매치되는 클래스의 ID를 함께 저장하면 간단하게 어떠한 객체가 포함되어 있는 지를 확인할 수 있다.

한편, 사용자 단말기로부터 검색하고자 하는 이미지, 검색동영상의 검색콘텐츠를 제공받으면(단계 S308), 제2 검색콘텐츠정보 추출모듈(311)은 검색을 위해 사용자로부터 제공받은 검색콘텐츠의 영상정보를 추출한다.

즉, 사용자 단말기로부터 제공받은 검색이미지로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하거나(단계 S309), 검색동영상으로부터 대표프레임에 포함된 특징점 또는 특징점의 시각적 속성을 영상정보로 추출한다.(단계 S310). 이러한 과정을 통해 검색이미지뿐만 아니라 검색동영상에서도 영상정보를 추출할 수 있다.

그리고 제2 등록영상 검색모듈(316)은 사용자 단말기를 통해 입력된 검색이미지 또는 검색동영상으로부터 추출된 영상정보를 클래스의 영상정보와 비교하여 매치되는 클래스를 검색하고(단계 S311), 검색된 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색한다(단계 S312).

검색된 클래스정보 또는 등록영상에 대한 정보는 리스트화되어 제2 검색결과 표시모듈(319)을 통해 사용자 단말기에 검색결과로 제공한다(단계 S313).

한편, 실시예2의 객체 기반 영상 검색시스템을 이용하여 검색콘텐츠가 음성 또는 텍스트인 경우에 검색하는 과정은 실시예 1과 동일하므로 이에 대한 설명은 생략한다.

이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.

Claims

검색대상이 되는 등록된 각종 이미지 또는 동영상을 저장하고 관리하는 제1 등록영상 관리모듈(202)과;

등록된 이미지 또는 동영상으로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하는 제1 등록영상정보 추출모듈(203)과;

제1 등록영상정보 추출모듈(203)을 통해 추출된 영상정보의 유사성에 따라 하나 이상의 클래스를 생성하거나 분류하는 클래스 생성모듈(209)과;

클래스 생성모듈(209)을 통해 생성된 클래스에 대한 정보를 저장하고 관리하는 제1 클래스정보 관리모듈(210)과;

사용자 단말기를 통해 접수된 이미지 또는 동영상 또는 음성 또는 텍스트로부터 검색을 위해 검색콘텐츠정보를 추출하는 제1 검색콘텐츠정보 추출모듈(211)과;

제1 검색콘텐츠정보 추출모듈(211)을 통해 추출된 검색콘텐츠정보를 클래스정보와 비교하여 동일 또는 유사하게 매치되는 클래스 또는 등록영상을 검색하는 제1 등록영상 검색모듈(216)과;

제1 등록영상 검색모듈(216)에서 검색된 클래스의 정보 또는 등록영상의 정보를 사용자 단말기에 검색결과로 제공하는 제1 검색결과 표시모듈(219)을 포함하며,

제1 검색콘텐츠정보 추출모듈(211)은 사용자로부터 접수된 검색이미지에 포함된 영상정보를 추출하는 제1 검색이미지 처리부(212), 또는 검색동영상을 분석하여 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하고, 각각의 씬에서 대표되는 하나 이상의 프레임을 대표프레임으로 선정하며, 선정된 대표프레임으로부터 영상정보를 추출하는 제1 검색동영상 처리부(213)를 포함하는 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 1에 있어서, 제1 등록영상 관리모듈(202)은 검색대상이 되는 이미지 또는 동영상을 등록이미지 또는 등록동영상으로 저장하거나 또는 실시간으로 웹을 검색하여 사용하는 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 1에 있어서, 제1 등록영상정보 추출모듈(203)에서 추출되는 영상정보로 추출되는 특징점은 이미지 또는 동영상에 포함된 윤곽선 또는 코너 또는 극점(주변 밝기보다 어둡거나 또는 밝은 부분)에 의해 생성되는 정보이고, 특징점의 시각적 속성은 특징점 주변의 영상들이 갖는 밝기정보 또는 색상정보 또는 패턴정보인 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 1에 있어서, 제1 등록영상정보 추출모듈(203)은 등록된 이미지들에 포함된 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하고 추출된 영상정보를 저장하는 제1 등록이미지 영상정보 추출부(204)와; 등록된 동영상을 분석하여 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하는 제1 씬 분할부(206)와, 각각의 씬에서 대표되는 하나 이상의 프레임을 대표프레임으로 선정하는 제1 대표프레임 선정부(207)와, 선정된 대표프레임으로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하는 제1 대표프레임 영상정보 추출부(208)로 이루어진 제1 등록동영상 영상정보 추출부(205)를 포함하는 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 4에 있어서, 제1 씬 분할부(206)는 동영상 콘텐츠의 각 프레임을 HSV(색상/채도/밝기)의 빈도수 그래프로 작성하여 이전 프레임과 현재 프레임의 그래프를 비교하여 정해진 그래프간 거리값을 넘는 경우에는 프레임이 변하는 것으로 판단하여 씬으로 확인하며, 확인된 각각의 씬에는 고유 ID가 부여되는 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 1에 있어서, 클래스 생성모듈(209)은 영상정보인 특징점 또는 특징점의 시각적 속성이 등록이미지 또는 등록동영상 내의 영상정보가 상호 유사할 경우 이를 군집화 하여 하나 이상의 클래스로 생성하거나 분류하며 이때 생성된 클래스가 기존에 생성된 클래스와 유사한 영상정보를 갖는 경우 동일하거나 유사한 클래스로 함께 분류하는 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 1에 있어서, 제1 클래스정보 관리모듈(210)의 클래스정보는 클래스 별 영상정보, 카테고리정보, 클래스를 설명하는 텍스트정보, 특화정보 중 하나 이상을 포함하는 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 1에 있어서, 제1 검색콘텐츠정보 추출모듈(211)은 사용자 단말기로부터 제공받은 음성을 분석하여 음성을 텍스트로 변환시키는 제1 검색음성 처리부(214)와; 사용자 단말기로부터 제공받은 검색텍스트 또는 제1 검색음성 처리부(214)에서 변환된 텍스트를 분석하는 제1 검색텍스트 처리부(215)를 포함하는 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 1에 있어서, 제1 등록영상 검색모듈(216)은 사용자에 의해 접수된 검색이미지 또는 검색동영상으로부터 추출된 영상정보를 클래스 내의 클래스별 영상정보와 비교하여 동일 또는 유사하게 매치되는 클래스를 검색하고, 검색된 클래스를 일부 또는 모두 포함하는 등록이미지 또는 등록동영상을 검색하는 제1 영상 검색부(217)와; 사용자에 의해 접수된 텍스트 또는 음성으로부터 추출되거나 변환된 텍스트정보를 클래스 내의 텍스트정보와 비교하여 동일 또는 유사하게 매치되는 클래스를 검색하고, 검색된 클래스를 일부 또는 모두 포함하는 등록이미지 또는 등록동영상을 검색하는 제1 텍스트 검색부(218)를 포함하는 것을 특징으로 하는 객체 기반 영상 검색시스템.
하나 이상의 객체가 포함된 객체이미지를 등록받아 저장하고 등록받은 객체이미지에서 영상정보를 추출하여 함께 저장하는 객체이미지 관리모듈(301)과;

객체이미지 관리모듈(301)을 통해 추출된 객체이미지의 영상정보를 유사성에 따라 하나 이상의 클래스로 생성하거나 분류하는 제2 클래스정보 관리모듈(302)과;

검색대상이 되는 등록된 각종 이미지 또는 동영상을 저장하고 관리하는 제2 등록영상 관리모듈(303)과;

등록된 이미지 또는 동영상으로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출하는 제2 등록영상정보 추출모듈(304)과;

제2 등록영상정보 추출모듈(304)을 통해 추출된 영상정보를 클래스의 영상정보와 비교하여 동일하거나 유사한 영상정보를 갖는 클래스에 대한 정보를 등록된 이미지 또는 동영상에 함께 저장하는 등록영상 분류모듈(310)과;

사용자 단말기를 통해 접수된 이미지 또는 동영상 또는 음성 또는 텍스트로부터 검색을 위한 정보를 추출하는 제2 검색콘텐츠정보 추출모듈(311)과;

제2 검색콘텐츠정보 추출모듈(216)을 통해 추출된 검색콘텐츠정보를 클래스의 영상정보와 비교하여 동일 또는 유사하게 매치되는 클래스를 검색하고 검색된 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색하는 제2 등록영상 검색모듈(316)과;

제2 등록영상 검색모듈(316)에서 검색된 클래스의 정보 또는 등록영상의 정보를 사용자 단말기에 검색결과로 제공하는 제2 검색결과 표시모듈(319)을 포함하며,

제2 검색콘텐츠정보 추출모듈(311)은 사용자로부터 접수된 검색이미지에 포함된 영상정보를 추출하는 제2 검색이미지 처리부(312), 검색동영상을 분석하여 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하고, 각각의 씬에서 대표되는 하나 이상의 프레임을 대표프레임으로 선정하며, 선정된 대표프레임으로부터 영상정보를 추출하는 제2 검색동영상 처리부(313), 사용자 단말기로부터 제공받은 음성을 분석하여 음성을 텍스트로 변환시키는 제2 검색음성 처리부(314), 사용자 단말기로부터 제공받은 검색텍스트 또는 제2 검색음성 처리부(314)에서 변환된 텍스트를 분석하는 제2 검색텍스트 처리부(315) 중 하나 이상을 포함하는 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 10에 있어서, 객체이미지의 영상정보는 윤곽선 또는 코너 또는 극점(주변 밝기보다 어둡거나 또는 밝은 부분)에 대한 특징점 정보와 특징점의 시각적 속성에 따라 생성되며, 영상정보를 유사성에 따라 군집화 하여 하나 이상의 클래스로 생성하거나 분류하는 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 10에 있어서, 클래스는 각각 고유 ID가 부여되며, 클래스정보는 클래스 별 영상정보, 카테고리정보, 클래스를 설명하는 텍스트정보, 특화정보 중 하나 이상을 포함하는 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 10에 있어서, 제2 등록영상정보 추출모듈(304)은 등록된 이미지로부터 영상정보를 추출하는 제2 등록이미지 영상정보 추출부(305)와, 등록된 동영상으로부터 영상정보를 추출하는 제2 등록동영상 영상정보 추출부(306)로 이루어진 것을 특징으로 하는 객체 기반 영상 검색시스템.
청구항 10에 있어서, 제2 등록영상 검색모듈(316)은 영상정보를 검색하는 제2 영상 검색부(317)와 텍스트를 비교하는 제2 텍스트 검색부(318)로 이루어진 것을 특징으로 하는 객체 기반 영상 검색시스템.
검색대상이 되는 등록이미지의 특징점 또는 특징점의 시각적 속성을 제1 등록영상정보 추출모듈(203)을 통해 영상정보로 추출하는 단계와;

추출된 영상정보의 동일성 또는 유사성에 따라 클래스 생성모듈(209)은 군집화하여 이를 하나 이상의 클래스로 생성하거나 분류하는 단계와;

제1 클래스정보 관리모듈(210)을 통해 생성된 클래스의 클래스에 대한 정보를 제공받아 클래스정보로 저장하는 단계와;

사용자 단말기로부터 검색하고자 하는 이미지, 검색동영상, 음성 또는 텍스트에서 선택한 어느 하나의 검색콘텐츠를 제공받으면, 제1 검색콘텐츠정보 추출모듈(211)은 제공받은 검색콘텐츠의 영상정보를 추출하는 단계와;

제1 등록영상 검색모듈(216)은 검색콘텐츠에서 추출된 영상정보를 클래스의 영상정보와 비교하여 동일 또는 유사한 클래스와 검색된 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색하는 단계; 및

검색된 클래스정보 또는 등록영상에 대한 정보를 리스트화되어 제1 검색결과 표시모듈(219)을 통해 사용자 단말기에 검색결과로 제공하는 단계; 및

검색콘텐츠가 음성이면 제공받은 음성을 텍스트로 변환시키는 단계를 더 포함하며,

음성에서 변환된 텍스트 또는 사용자 단말기로부터 직접 텍스트로 제공받는 검색텍스트를 클래스정보의 텍스트와 비교하여 동일 또는 유사하게 매치되는 텍스트를 갖는 클래스를 검색하는 것을 특징으로 하는 객체 기반 영상 검색방법
청구항 15에 있어서, 등록이미지 또는 검색이미지의 영상정보로 추출되는 특징점은 이미지 또는 동영상에 포함된 윤곽선 또는 코너 또는 극점(주변 밝기보다 어둡거나 또는 밝은 부분)에 의해 생성되는 정보이고, 특징점의 시각적 속성은 특징점 주변의 영상들이 갖는 밝기정보 또는 색상정보 또는 패턴정보 인 것을 특징으로 하는 객체 기반 영상 검색방법.
청구항 15에 있어서, 등록동영상 또는 검색동영상은 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하고, 각각의 씬에서 대표되는 프레임을 대표프레임으로 선정하며, 선정된 대표프레임으로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출할 수 있다. 이러한 과정을 통해 등록이미지 또는 대표프레임으로부터 특징점 또는 특징점의 시각적 속성에 대한 영상정보를 추출하는 것을 특징으로 하는 객체 기반 영상 검색방법.
각종 객체가 하나 이상 포함된 이미지를 객체이미지 관리모듈(301)을 통해 등록받아 저장하고 등록받은 객체이미지의 영상정보를 추출한 후 영상정보의 동일성 또는 유사성에 따라 군집화하여 하나 이상의 클래스로 생성하거나 분류하는 단계와;

제2 클래스정보 관리모듈(302)을 통해 생성된 클래스의 클래스에 대한 정보를 제공받아 클래스정보로 저장하는 단계와;

검색대상이 되는 이미지 또는 동영상을 등록받으면, 제2 등록영상정보 추출모듈(304)을 통해 등록된 등록이미지 또는 등록동영상으로부터 영상정보를 추출하는 단계와;

제2 등록영상 관리모듈(303)을 통해서 추출된 등록된 이미지 또는 동영상의 영상정보를 클래스 내의 영상정보와 비교하여 동일 또는 유사하게 매치되는 클래스를 확인하고, 매치되는 클래스에 대한 정보를 등록영상에 함께 저장하는 단계와;

사용자 단말기로부터 검색하고자 하는 이미지, 검색동영상, 음성 또는 텍스트에서 선택한 어느 하나의 검색콘텐츠를 제공받으면, 제2 검색콘텐츠정보 추출모듈(311)은 제공받은 검색콘텐츠의 영상정보를 추출하는 단계와;

제2 등록영상 검색모듈(316)은 검색콘텐츠에서 추출된 영상정보를 클래스의 영상정보와 비교하여 매치되는 동일 또는 유사한 클래스와 검색된 클래스를 모두 또는 일부 포함하는 등록이미지 또는 등록동영상을 검색하는 단계와;

검색된 클래스정보 또는 등록영상에 대한 정보를 리스트화되어 제2 검색결과 표시모듈(319)을 통해 사용자 단말기에 검색결과로 제공하는 단계; 및

검색콘텐츠가 음성이면 제공받은 음성을 텍스트로 변환시키는 단계를 더 포함하며,

음성에서 변환된 텍스트 또는 사용자 단말기로부터 직접 텍스트로 제공받는 검색텍스트를 클래스정보의 텍스트와 비교하여 동일 또는 유사하게 매치되는 텍스트를 갖는 클래스를 검색하는 것을 특징으로 하는 객체 기반 영상 검색방법.
청구항 18에 있어서, 등록이미지 또는 검색이미지의 영상정보로 추출되는 특징점은 이미지 또는 동영상에 포함된 윤곽선 또는 코너 또는 극점(주변 밝기보다 어둡거나 또는 밝은 부분)에 의해 생성되는 정보이고, 특징점의 시각적 속성은 특징점 주변의 영상들이 갖는 밝기정보 또는 색상정보 또는 패턴정보 인 것을 특징으로 하는 객체 기반 영상 검색방법.
청구항 18에 있어서, 등록동영상 또는 검색동영상은 시각적 요소가 변환되는 지점을 기준으로 전후의 동영상의 구간을 씬으로 분할하고, 각각의 씬에서 대표되는 프레임을 대표프레임으로 선정하며, 선정된 대표프레임으로부터 특징점 또는 특징점의 시각적 속성을 영상정보로 추출할 수 있다. 이러한 과정을 통해 등록이미지 또는 대표프레임으로부터 특징점 또는 특징점의 시각적 속성에 대한 영상정보를 추출하는 것을 특징으로 하는 객체 기반 영상 검색방법.