KR101137059B1 - 동영상 색인 방법 및 시스템 - Google Patents

동영상 색인 방법 및 시스템 Download PDF

Info

Publication number
KR101137059B1
KR101137059B1 KR1020050085358A KR20050085358A KR101137059B1 KR 101137059 B1 KR101137059 B1 KR 101137059B1 KR 1020050085358 A KR1020050085358 A KR 1020050085358A KR 20050085358 A KR20050085358 A KR 20050085358A KR 101137059 B1 KR101137059 B1 KR 101137059B1
Authority
KR
South Korea
Prior art keywords
video
file
video file
path
search
Prior art date
Application number
KR1020050085358A
Other languages
English (en)
Other versions
KR20070030582A (ko
Inventor
곽용재
천세진
박태헌
김성원
서장원
서범석
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020050085358A priority Critical patent/KR101137059B1/ko
Publication of KR20070030582A publication Critical patent/KR20070030582A/ko
Application granted granted Critical
Publication of KR101137059B1 publication Critical patent/KR101137059B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/60Solid state media
    • G11B2220/65Solid state media wherein solid state memory is used for storing indexing information or metadata

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 동영상 파일의 자막 파일로부터 텍스트 데이터를 추출하고, 상기 추출된 텍스트 데이터를 색인어로 동영상을 검색할 수 있도록 함으로써, 동영상 파일의 내용으로 동영상을 검색할 수 있도록 하는 동영상 색인 방법 및 시스템에 관한 것이다. 본 발명에 따른 동영상 색인 방법은 색인할 동영상 파일의 경로를 식별하여 동영상 여부를 판단하는 단계, 상기 동영상 파일로부터 자막 파일의 경로를 예측하는 단계, 상기 자막 파일로부터 텍스트 데이터를 추출하는 단계, 및 상기 추출된 텍스트 데이터를 색인어로 하여, 인덱스 데이터베이스에 저장하는 단계를 포함한다. 본 발명에 따르면, 동영상 파일의 경로나 파일 등의 메타 정보뿐만 아니라 동영상 파일의 자막 파일을 이용하여 동영상을 검색함으로써, 사용자가 찾고자 하는 동영상 파일을 보다 용이하게 검색해낼 수 있다.
동영상 파일, 자막 파일, 텍스트 데이터, 메타 정보, 검색

Description

동영상 색인 방법 및 시스템{METHOD AND SYSTEM FOR INDEXING MOVING PICTURE}
도 1은 본 발명의 일실시예에 있어서, 로컬 컴퓨터 검색 시스템의 구성을 도시한 블록도이다.
도 2는 본 발명의 일실시예에 있어서, 자막 파일의 텍스트 데이터를 색인어로 저장하는 방법을 도시한 흐름도이다.
도 3은 본 발명의 일실시예에 있어서, 인덱스 데이터베이스의 구조를 도시한 도면이다.
도 4는 본 발명의 일실시예에 있어서, 동영상 검색 방법을 도시한 흐름도이다.
도 5는 본 발명의 일실시예에 있어서, 동영상 색인 시스템의 구성을 도시한 블록도이다.
도 6은 본 발명에 따른 동영상 색인 방법을 수행하는 데 채용될 수 있는 범용 컴퓨터 장치의 내부 블록도이다.
<도면의 주요 부분에 대한 부호의 설명>
500: 동영상 색인 시스템 510: 동영상 판단부
520: 경로 판단부 530: 데이터 추출부
540: 메타 정보 추출부 550: 인덱스 데이터베이스
560: 검색 요청부 570: 색인어 검색부
580: 검색 결과 제공부
본 발명은 동영상 파일의 자막 파일로부터 텍스트 데이터를 추출하고, 상기 추출된 텍스트 데이터를 색인어로 동영상을 검색할 수 있도록 함으로써, 동영상 파일의 내용으로 동영상을 검색할 수 있도록 하는 동영상 색인 방법 및 시스템에 관한 것이다.
인터넷 등의 통신망의 발달로 영화, 드라마 등의 영상 파일을 TV를 시청하거나 영화관을 가지 않고, 사용자 단말기로 다운로드하여 시청할 수 있게 되었다. 따라서, 사용자는 TV 방송 시간에 프로그램을 시청하지 못하거나 영화관에서 영화를 보지 못한 경우, 일정한 금액을 지불하고 영상 제공 서버로부터 영화, 드라마 등의 영상 파일을 다운로드하여, 시공간에 제약 없이 실시간으로 시청할 수 있었다.
사용자는 영상 파일을 다운로드하는데 일정한 금액을 지불하기 때문에, 영상 파일을 한번 시청하고 나서 삭제하지 않고 자신의 단말기에 저장해 놓을 수 있다. 사용자는 다수의 영상 파일을 자신의 단말기에 저장하여 나중에 보고자 하는 영상 파일을 검색하여 시청할 수 있었다.
종래기술에 따르면, 동영상의 텍스트 추출에 의해 만들어진 색인을 기반으로 동영상을 검색할 수 있었다. 이러한 동영상의 검색 대상이 되는 것은 단지 경로나 파일명, 동영상 포맷 별로 지원하는 약간의 메타 정보뿐이었다. 이는, 검색을 수행하는데 충분한 정보가 되지 못하기 때문에 보다 정확한 검색 수행을 위해 동영상의 실제 내용을 기술할 수 있는 정보가 필요한 실정이다. 이를 동영상 자체에서 얻어내는 것은 현 기술로는 무리가 있다. 또한, 오랜 시간 후에 사용자가 모든 영상 파일의 경로명 또는 파일명을 기억한다는 것은 현실적으로 불가능하다.
이때, 영상 파일에 대한 검색에 있어서, 사용자가 찾고자 하는 대사를 직접 입력하는 것만으로 영상 파일을 검색하는 방식이 있다면, 보다 정확한 검색이 보장되도록 할 수 있을 것이다.
따라서, 영상 파일의 메타 정보뿐만 아니라, 영상 파일에 대한 자막 파일의 텍스트 데이터로도 영상 파일이 검색되도록 함으로써, 사용자의 영상 검색 요청을 최적으로 충족시킬 수 있는 새로운 영상 검색 모델이 절실하게 요구되고 있다.
본 발명은 상술한 바와 같은 종래기술의 문제점을 해결하기 위해 안출된 것으로서, 동영상 파일의 자막 파일로부터 텍스트 데이터를 추출하고, 상기 추출된 텍스트 데이터를 색인어로 동영상을 검색할 수 있도록 함으로써, 동영상 파일의 내용으로 동영상을 검색할 수 있도록 하는 동영상 색인 방법 및 시스템을 제공하는 것을 목적으로 한다.
또한, 본 발명은 동영상 파일의 경로나 파일 등의 메타 정보뿐만 아니라 동 영상 파일의 자막 파일을 이용하여 동영상을 검색함으로써, 사용자가 정확하게 찾고자 하는 동영상 파일을 용이하게 검색할 수 있도록 하는 동영상 색인 방법 및 시스템을 제공하는 것을 목적으로 한다.
상기의 목적을 달성하고, 상술한 종래기술의 문제점을 해결하기 위하여, 본 발명의 일실시예에 따른 동영상 색인 방법은 색인할 동영상 파일의 경로를 식별하여 동영상 여부를 판단하는 단계, 상기 동영상 파일로부터 자막 파일의 경로를 예측하는 단계, 상기 자막 파일로부터 텍스트 데이터를 추출하는 단계, 및 상기 추출된 텍스트 데이터를 색인어로 하여, 인덱스 데이터베이스에 저장하는 단계를 포함한다.
이하에서는 첨부된 도면을 참조하여 본 발명에 따른 다양한 실시예를 상세히 설명한다.
도 1은 본 발명의 일실시예에 있어서, 로컬 컴퓨터 검색 시스템의 구성을 도시한 블록도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 로컬 컴퓨터 검색 시스템은 웹 브라우저(110), 미니 웹 서버(120), 웹 문서 생성부(130) 및 검색부(140)를 포함한다. 도 1에 도시된 바와 같이, 로컬 컴퓨터 검색 시스템은 색인부(150), 인덱스 데이터베이스(160) 및 리소스 컴포넌트(170)를 더 포함할 수 있다.
웹 브라우저(110)는 사용자의 컴퓨터가 인터넷에 접속되어 웹 서버로부터 가져온 여러 가지 정보를 볼 수 있도록 도와주는 소프트웨어이다. 예를 들어, 웹 브 라우저(110)는 마이크로소프트(Microsoft)사의 인터넷 익스플로러(Internet Explorer), 넷스케이프(Netscape)사의 커뮤니케이터(Communicator) 또는 모질라(Mozilla)의 파이어폭스(Firefox)일 수 있다.
웹 브라우저(110)는 사용자로부터 검색 명령을 입력 받기 위한 입력 인터페이스를 제공하며, 웹 문서 형식의 검색 결과를 상기 사용자에게 표시한다.
이 때, 입력 인터페이스는 통상의 웹 검색을 위한 입력 인터페이스에 상응하는 것일 수 있다. 즉, 웹 브라우저(110)는 사용자가 통상의 웹 검색을 위한 입력 인터페이스와 동일한 형식으로 키워드를 입력하고, 검색 대상만을 로컬 컴퓨터 검색으로 설정하도록 할 수 있다.
이 때, 웹 브라우저(110)는 사용자가 로컬 컴퓨터 내의 데이터에 대한 검색을 요구하는 경우, 상기 검색 명령의 목적지 주소를 웹 브라우저(110)가 설치된 로컬 컴퓨터 또는 루프백 주소로 하도록 설정될 수 있다.
상기 웹 문서 형식의 검색 결과는 HTML(HyperText Markup Language)문서일 수 있다. 이 때, 상기 웹 문서 형식의 검색 결과는 로컬 컴퓨터 검색 결과에 필요한 이미지나 문구 등의 리소스가 부가된 것일 수 있다. 이 때, 웹 브라우저(110)는 HTML 문서 형식의 검색 결과를 읽어서 화면에 표시한다.
미니 웹 서버(120)는 로컬 컴퓨터 내에 설치되는 일종의 웹 서버로, HTTP 프로토콜에 따라 웹 브라우저(110)와 통신하여 웹 브라우저(110)로부터 사용자의 검색 명령을 제공 받고 상기 웹 문서 형식의 검색 결과를 웹 브라우저(110)로 제공한다.
이 때, 미니 웹 서버(120)는 상기 수신된 검색 명령의 발신 주소를 조사하고, 상기 발신 주소가 미니 웹 서버(120)가 설치된 로컬 컴퓨터와 동일한 주소 또는 루프 백 주소인 경우에만 서비스를 제공하도록 설정될 수 있다.
미니 웹 서버(120)는 루프 백(loop back) 인터페이스를 통하여 미니 웹 서버(120)가 설치된 로컬 컴퓨터에서만 접속이 가능하고, 인터넷 등을 통하여 외부 컴퓨터에서 접속할 수 없도록 할 수도 있다.
웹 문서 생성부(130)는 미니 웹 서버(120)로부터 상기 검색 명령을 제공 받고, 검색부(140)에 의해서 생성되는 로컬 컴퓨터 검색 결과를 웹 문서 형식으로 변환하여 상기 웹 문서 형식의 검색 결과를 생성한다.
이 때, 웹 문서는 HTML 문서일 수 있음은 상술한 바와 같다. 즉, 웹 문서 생성부(130)는 검색부(140)에 의해서 생성되는 로컬 컴퓨터 검색 결과를 HTML 형식으로 변환하여 HTML 형식의 검색 결과를 생성할 수 있다. 또한, 웹 문서 생성부(130)는 로컬 컴퓨터 검색 결과에 필요한 이미지나 문구 등의 리소스를 부가하여 HTML 문서 등의 웹 문서를 생성할 수도 있다.
실시예에 따라, 웹 문서 생성부(130)는 로컬 컴퓨터 검색 결과를 웹 문서 형식으로 변환하는데 필요한 리소스를 리소스 컴포넌트(170)로부터 제공 받을 수 있다.
리소스 컴포넌트(170)는 상기 웹 문서 형식의 검색 결과 또는 검색 결과 이외의 웹 문서를 생성하는데 필요한 리소스를 제공할 수 있다. 이 때, 검색 결과 이외의 웹 문서는 로컬 컴퓨터의 색인 상태를 나타내는 웹 문서나 로컬 컴퓨터 검 색에 관한 안내 웹 문서 등일 수 있다.
리소스 컴포넌트(170)는 언어나 글꼴 별 문자열 등 웹 문서를 생성하는데 필요한 각종 리소스를 저장할 수 있다.
검색부(140)는 웹 문서 생성부(130)로부터 상기 검색 명령을 제공 받고 상기 검색 명령에 포함된 질의어를 이용하여 상기 로컬 컴퓨터 내의 정보를 검색하여 상기 로컬 컴퓨터 검색 결과를 생성한다.
실시예에 따라, 검색부(140)는 웹 문서 생성부(130)로부터 상기 검색 명령을 제공 받지 않고, 미니 웹 서버(120)로부터 직접 상기 검색 명령을 제공 받을 수도 있다.
색인부(150)는 로컬 컴퓨터 내의 정보를 색인하여 인덱스 데이터베이스(160)를 구축한다.
이 때, 검색부(140)는 상기 검색 명령을 제공 받으면 상기 검색 명령에 포함된 질의어를 이용하여 인덱스 데이터베이스(160)를 검색함으로써 상기 로컬 컴퓨터 검색 결과를 생성할 수 있다.
도 1을 통하여 설명한 바와 같이, 미니 웹 서버(120)를 구비하여 HTTP와 같은 클라이언트/서버 프로토콜에 따라 웹 브라우저(110)와 미니 웹 서버(120)가 통신하도록 함으로써 기존의 웹 검색 시스템과 마찬가지로 안정적으로 동작하는 로컬 컴퓨터 검색 시스템을 구축할 수 있다. 나아가, 본 발명에 따른 로컬 컴퓨터 검색 시스템은 웹 서버 기반으로 동작하므로 사용자가 두 대 이상의 컴퓨터를 사용하는 경우에도 각각의 컴퓨터 내에 구비되는 미니 웹 서버에서 수집된 검색 결과들이 HTTP 프로토콜에 따라 용이하게 취합될 수 있어 효과적으로 로컬 컴퓨터 검색을 수행할 수 있다.
도 2는 본 발명의 일실시예에 있어서, 자막 파일의 텍스트 데이터를 색인어로 저장하는 방법을 도시한 흐름도이다.
도 2에서는 상기 로컬 컴퓨터 검색 시스템에서 로컬 컴퓨터에 저장된 동영상 파일을 효율적으로 검색하기 위한 방법이 제시된다. 이하, 도 2에서 설명할 동영상 색인 시스템은 상기 로컬 컴퓨터 검색 시스템에 포함되어 수행될 수 있다.
단계(S201)에서, 동영상 색인 시스템은 색인할 동영상 파일의 경로를 식별하여 동영상 여부를 판단할 수 있다. 상기 동영상 파일의 경로는 로컬 컴퓨터에 저장된 동영상 파일의 위치로서, 예를 들어, "C" 드라이브, "AniCollection" 폴더, "South" 폴더, "이웃집토토로.avi"의 경로를 가질 수 있다.
또한, "이웃집토토로.avi"가 저장된 "South" 폴더에는 동영상 파일을 제외한 다수의 문서 파일, 이미지 파일, 오디오 파일, 실행 파일 등이 저장될 수 있다. 일반적으로, 파일의 형식에 따라 각각 다른 확장자를 가지게 되며, 문서 파일의 확장자는 "hwp", "doc" "txt" 등과 같은 확장자를, 이미지 파일의 확장자는 "jpg", "gif", "bmp" 또는 "tif" 등의 확장자를, 오디오 파일은 "mp3", "wav", "ra" 및 "aac" 등의 확장자를, 동영상 파일은 "mpeg", "avi", "asf", "asx", "dat", "mov" 또는 "rm" 등의 확장자를 가질 수 있다.
따라서, 상기 동영상 색인 시스템은 상기 경로에 저장된 파일의 확장자를 식별하여 저장된 파일이 동영상 파일인지 여부를 판단할 수 있다. 이에 따라, 상기 동영상 색인 시스템은 "mpeg", "avi", "asf", "asx", "dat", "mov" 또는 "rm" 등의 확장자를 가지는 파일을 동영상 파일로 판단할 수 있다.
단계(S202)에서, 상기 동영상 색인 시스템은 상기 동영상 파일로부터 자막 파일의 경로를 예측할 수 있다. 본 발명의 일실시예에 따르면, 상기 동영상 색인 시스템은 상기 동영상 파일의 파일명을 참조하여 자막 파일의 확장자를 가지되 상기 동영상 파일과 파일명이 동일한 자막 파일을 식별할 수 있다. 예컨대, 상기 동영상 색인 시스템은 "smi"의 확장자를 가지는 자막 파일 중 자막 파일의 파일명이 상기 동영상 파일의 파일명과 동일한 자막 파일을 식별할 수 있다. 일례로, 상기 동영상 색인 시스템은 동영상 파일 "이웃집토토로.avi"와 관련하여, 확장자는 자막 파일의 확장자이고 "이웃집토토로"의 파일명을 가지는 자막 파일 "이웃집토토로.smi"을 검색할 수 있는 것이다.
예컨대, 자국의 영화, 드라마, 방송 프로그램 등의 동영상 파일이 아닌 타국의 동영상 파일인 경우에는 타국의 말을 알지 못하면 무슨 내용인지 알 수 없다. 따라서, 타국의 동영상 파일을 자국의 언어로 다시 녹음하거나 동영상 파일과 동기를 맞추어 자국의 언어가 표시되는 자막 파일을 배포하여 시청자의 이해를 돕고 있다. 일반적으로 동영상 파일과 함께 배포되는 상기 자막 파일은 상기 동영상 파일이 저장된 위치에 상기 동영상 파일명과 동일한 파일명으로 저장되어, 상기 동영상 파일과 동기를 맞추어 자막이 출력될 수 있다. 이에 따라, 동영상 파일이 저장된 위치에 상기 자막 파일도 같이 저장되어 있을 수 있다.
단계(S203)에서, 상기 동영상 색인 시스템은 상기 자막 파일로부터 텍스트 데이터를 추출할 수 있다. 상기 텍스트 데이터는 문서 내용을 전부를 포함하거나 중요하다고 판단되는 데이터만을 포함할 수도 있다. 나아가, 상기 텍스트 데이터는 자막 내용의 앞부분에서 추출될 수도 있고, 뒷부분에서 추출될 수도 있으며 일부는 앞부분에서 추출되고, 일부는 뒷부분에서 추출될 수도 있다. 본 발명의 일실시예에 따르면, 상기 동영상 색인 시스템은 SAMI Format 추출기를 이용하여 상기 자막 파일로부터 텍스트 데이터를 추출할 수 있다.
단계(S204)에서, 상기 동영상 색인 시스템은 상기 추출된 텍스트 데이터를 색인어로 하여 인덱스 데이터베이스에 저장할 수 있다. 또한, 본 발명의 일실시예에 따르면, 상기 동영상 색인 시스템은 동영상 파일의 메타 정보를 색인어로 하여 상기 인덱스 데이터베이스에 저장할 수도 있다.
이하, 도 3을 참조하여 설명한다. 도 3은 본 발명의 일실시예에 있어서, 인덱스 데이터베이스의 구조를 도시한 도면이다.
도 3에서 도시한 인덱스 데이터베이스는 동영상 파일의 색인을 위한 데이터베이스로서, 인덱스 데이터베이스(160)에 포함될 수 있다. 상기 인덱스 데이터베이스는 동영상 파일 검색에 이용되는 색인어와 연관하여 동영상 파일의 경로를 저장할 수 있다. 상기 색인어는 텍스트 데이터 및 메타 정보일 수 있으며, 상기 메타 정보는 파일 이름, 확장자, 경로명, 용량정보 및 날짜 중 하나를 포함하고, 상기 텍스트 데이터는 자막 파일의 내용일 수 있다. 또한, 상기 인덱스 데이터베이스는 상기 색인어와 동영상 파일의 경로를 저장함으로써, 상기 동영상 색인 시스템은 사용자의 검색 요청에 따른 검색 결과로 동영상 파일의 경로를 제공할 수 있다.
종래에는 동영상 검색에 메타 정보를 이용하였으나, 본 발명에서는 이러한 메타 정보뿐만 아니라 자막 파일에 대한 텍스트 데이터까지 색인어로 이용함으로써, 보다 용이하게 동영상 파일을 검색할 수 있다. 종래기술과 같이 메타 정보로만 동영상을 검색할 수 있다면, 사용자는 파일 이름, 확장자, 경로명, 용량정보 및 날짜 등의 메타 정보를 꼭 기억해야 하지만, 사실상 오랜 시간이 지난 후에 파일의 이름이나 경로를 기억하는 것은 불가능하다. 따라서, 본 발명에서와 같이 영화나 드라마에 기억에 남는 대사를 떠올려 동영상 검색에 이용한다면, 효율적으로 동영상 검색을 수행할 수 있을 것이다.
이와 같이, 본 발명의 일실시예에 따르면, 상기 동영상 색인 시스템은 영화나 드라마 등의 대사 또는 배우 이름, 감독 이름 등의 자막 파일에서 추출 가능한 텍스트 데이터만을 색인어로 이용할 수 있다. 일례로, 상기 동영상 색인 시스템은 영화, 드라마의 명대사만을 추출하여 색인어로 이용할 수도 있다.
이처럼, 본 발명에 따르면, 동영상 파일의 자막 파일로부터 텍스트 데이터를 추출하고, 상기 추출된 텍스트 데이터를 색인어로 동영상을 검색할 수 있도록 함으로써, 동영상 파일의 내용으로 동영상을 검색할 수 있다.
도 4는 본 발명의 일실시예에 있어서, 동영상 검색 방법을 도시한 흐름도이다.
단계(S401)에서, 상기 동영상 색인 시스템은 사용자로부터 검색어를 포함하는 동영상 검색 요청을 수신할 수 있다. 상기 검색어는 메타 정보 또는 텍스트 데이터와 연관된 것으로 하나의 키워드일 수도 있고, 둘 이상의 키워드가 OR연산자를 통하여 바인딩(binding)된 것일 수도 있다. 예를 들어, 상기 검색어는 "심장", "내말만 귀기울여", "김삼순 + 심장" 등으로 텍스트 데이터에 기반을 둔 것일 수 있다.
단계(S402)에서, 상기 동영상 색인 시스템은 상기 요청에 응답하여, 상기 인덱스 데이터베이스로부터 상기 입력된 검색어를 포함하는 색인어를 식별할 수 있다. 상기 동영상 색인 시스템은 상기 인덱스 데이터베이스에 상기 입력된 검색어와 연관된 색인어가 있는지 식별할 수 있다.
단계(S403)에서, 상기 동영상 색인 시스템은 상기 식별된 색인어와 연관된 동영상 파일의 경로를 상기 사용자에게 제공할 수 있다. 본 발명의 일실시예에 따르면, 상기 동영상 색인 시스템은 상기 동영상 파일의 경로를 링크화하여 사용자가 상기 경로를 클릭하면, 상기 동영상 파일이 저장된 위치로 이동할 수 있도록 한다.
본 발명의 일실시예에 따르면, 상기 동영상 색인 시스템은 도 1의 로컬 컴퓨터 검색 시스템에 포함되어 수행되는 것으로서, 도 4의 동영상 검색 방법은 상기 로컬 컴퓨터 검색 시스템의 검색부(140)에서 수행될 수 있다.
도 5는 본 발명의 일실시예에 있어서, 동영상 색인 시스템의 구성을 도시한 블록도이다.
동영상 색인 시스템(500)은 동영상 판단부(510), 경로 판단부(520), 데이터 추출부(530), 메타 정보 추출부(540), 인덱스 데이터베이스(550), 검색 요청부(560), 색인어 검색부(570), 검색 결과 제공부(580)를 포함한다.
동영상 판단부(510)는 색인할 동영상 파일의 경로를 식별하여 동영상 여부를 판단할 수 있다. 동영상 판단부(510)는 로컬 컴퓨터에 저장된 파일의 확장자를 식별하여, "mpeg", "avi", "asf", "asx", "dat", "mov" 또는 "rm" 등의 확장자를 가지는 파일을 동영상 파일로 판단할 수 있다.
경로 판단부(520)는 상기 동영상 파일로부터 자막 파일의 경로를 예측할 수 있다. 일반적으로 동영상 파일과 함께 배포되는 상기 자막 파일은 상기 동영상 파일이 저장된 위치에 상기 동영상 파일명과 동일한 파일명으로 저장되어, 상기 동영상 파일과 동기를 맞추어 자막이 출력될 수 있다. 이에 따라, 동영상 파일이 저장된 위치에 상기 자막 파일도 같이 저장되어 있을 수 있다. 본 발명의 일실시예에 따르면, 경로 판단부(520)는 상기 동영상 파일의 파일명을 참조하여 자막 파일의 확장자를 가지되 상기 동영상 파일과 파일명이 동일한 자막 파일을 식별할 수 있다. 상기 동영상 색인 시스템은 "smi"의 확장자를 가지는 자막 파일 중 자막 파일의 파일명이 상기 동영상 파일의 파일명과 동일한 자막 파일을 식별할 수 있다.
데이터 추출부(530)는 상기 자막 파일로부터 텍스트 데이터를 추출할 수 있다. 데이터 추출부(530)는 상기 자막 파일의 문서 내용을 전부를 포함하거나 중요하다고 판단되는 데이터, 예를 들어, 영화나 드라마의 명대사만을 포함할 수 있다. 나아가, 상기 텍스트 데이터는 자막 내용의 앞부분에서 추출될 수도 있고, 뒷부분에서 추출될 수도 있으며 일부는 앞부분에서 추출되고, 일부는 뒷부분에서 추출될 수도 있다.
또한, 메타 정보 추출부(540)는 상기 동영상 파일의 메타 정보를 추출할 수 있다. 상기 메타 정보는 파일 이름, 확장자, 경로명, 용량정보 및 날짜 중 하나일 수 있다.
인덱스 데이터베이스(550)는 상기 텍스트 데이터와 메타 정보를 색인어로 하여 동영상 파일의 경로를 저장할 수 있다. 인덱스 데이터베이스(550)는 상기 색인어와 동영상 파일의 경로를 저장함으로써, 사용자의 검색 요청에 따른 검색 결과로 동영상 파일의 경로를 제공하여 동영상 파일이 저장된 위치로 이동할 수 있다.
검색 요청부(560)는 사용자로부터 검색어를 포함하는 동영상 검색 요청을 수신할 수 있다. 상기 검색어는 하나의 키워드일 수도 있고, 둘 이상의 키워드가 OR연산자를 통하여 바인딩된 것일 수도 있다.
색인어 검색부(570)는 상기 요청에 응답하여, 인덱스 데이터베이스(550)로부터 상기 입력된 검색어를 포함하는 색인어를 식별할 수 있다.
검색 결과 제공부(580)는 상기 식별된 색인어와 연관된 동영상 파일의 경로를 상기 사용자에게 제공할 수 있다. 본 발명의 일실시예에 따르면, 상기 동영상 색인 시스템은 상기 동영상 파일의 경로를 링크화하여 상기 사용자가 상기 경로를 클릭하면, 상기 동영상 파일이 저장된 위치로 이동할 수 있도록 한다.
본 발명의 일실시예에 따르면, 동영상 검색을 수행하는 검색 요청부(560), 색인어 검색부(570) 및 검색 결과 제공부(580)는 도 1의 로컬 컴퓨터 검색 시스템의 검색부(140)에 포함될 수 있다.
이처럼, 본 발명은 동영상 파일의 경로나 파일 등의 메타 정보뿐만 아니라 동영상 파일의 자막 파일을 이용하여 동영상을 검색함으로써, 사용자가 정확하게 찾고자 하는 동영상 파일을 용이하게 검색할 수 있다.
본 발명에 따른 동영상 색인 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
도 6은 본 발명에 따른 동영상 색인 방법을 수행하는 데 채용될 수 있는 범용 컴퓨터 장치의 내부 블록도이다.
컴퓨터 장치(600)는 램(RAM: Random Access Memory)(620)과 롬(ROM: Read Only Memory)(630)을 포함하는 주기억장치와 연결되는 하나 이상의 프로세서(610) 를 포함한다. 프로세서(610)는 중앙처리장치(CPU)로 불리기도 한다. 본 기술분야에서 널리 알려져 있는 바와 같이, 롬(630)은 데이터(data)와 명령(instruction)을 단방향성으로 CPU에 전송하는 역할을 하며, 램(620)은 통상적으로 데이터와 명령을 양방향성으로 전송하는 데 사용된다. 램(620) 및 롬(630)은 컴퓨터 판독 가능 매체의 어떠한 적절한 형태를 포함할 수 있다. 대용량 기억장치(Mass Storage)(640)는 양방향성으로 프로세서(610)와 연결되어 추가적인 데이터 저장 능력을 제공하며, 상기된 컴퓨터 판독 가능 기록 매체 중 어떠한 것일 수 있다. 대용량 기억장치(640)는 프로그램, 데이터 등을 저장하는데 사용되며, 통상적으로 주기억장치보다 속도가 느린 하드 디스크와 같은 보조기억장치이다. CD 롬(660)과 같은 특정 대용량 기억장치가 사용될 수도 있다. 프로세서(610)는 비디오 모니터, 트랙볼, 마우스, 키보드, 마이크로폰, 터치스크린 형 디스플레이, 카드 판독기, 자기 또는 종이 테이프 판독기, 음성 또는 필기 인식기, 조이스틱, 또는 기타 공지된 컴퓨터 입출력장치와 같은 하나 이상의 입출력 인터페이스(650)와 연결된다. 마지막으로, 프로세서(610)는 네트워크 인터페이스(670)를 통하여 유선 또는 무선 통신 네트워크에 연결될 수 있다. 이러한 네트워크 연결을 통하여 상기된 방법의 절차를 수행할 수 있다. 상기된 장치 및 도구는 컴퓨터 하드웨어 및 소프트웨어 기술 분야의 당업자에게 잘 알려져 있다. 한편, 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
본 발명에 따르면, 동영상 파일의 자막 파일로부터 텍스트 데이터를 추출하고, 상기 추출된 텍스트 데이터를 색인어로 동영상을 검색할 수 있도록 함으로써, 동영상 파일의 내용으로 동영상을 검색할 수 있다.
또한, 본 발명에 따르면, 동영상 파일의 경로나 파일 등의 메타 정보뿐만 아니라 동영상 파일의 자막 파일을 이용하여 동영상을 검색함으로써, 사용자가 정확하게 찾고자 하는 동영상 파일을 용이하게 검색할 수 있다.

Claims (10)

  1. 동영상 색인 방법에 있어서,
    색인할 동영상 파일의 경로를 식별하는 단계;
    상기 동영상 파일의 경로에 포함된 동영상 파일의 확장자를 이용하여 상기 동영상 파일이 동영상인지 여부를 판단하는 단계;
    상기 동영상 파일로부터 자막 파일의 경로를 예측하는 단계;
    상기 동영상 파일이 동영상인 경우, 상기 동영상 파일의 자막 파일로부터 텍스트 데이터를 추출하는 단계; 및
    상기 추출된 텍스트 데이터를 상기 동영상 파일의 색인어로 하여 인덱스 데이터베이스에 저장하는 단계
    를 포함하고,
    상기 동영상 파일은,
    로컬 컴퓨터를 검색 대상으로 색인된 텍스트 데이터를 통해 검색되는 것을 특징으로 하는 동영상 색인 방법.
  2. 제1항에 있어서,
    상기 동영상 파일로부터 자막 파일의 경로를 예측하는 상기 단계는,
    상기 동영상 파일의 파일명을 참조하여, 자막 파일의 확장자를 가지되 상기 동영상 파일과 파일명이 동일한 자막 파일을 식별하는 것을 특징으로 하는 동영상 색인 방법.
  3. 제1항에 있어서,
    상기 동영상 파일의 메타 정보를 색인어로 하여 상기 인덱스 데이터베이스에 저장하는 단계
    를 더 포함하는 것을 특징으로 하는 동영상 색인 방법.
  4. 제1항에 있어서,
    상기 동영상 파일의 메타 정보와 상기 텍스트 데이터의 색인어를 상기 동영상 파일의 경로와 연관하여 상기 인덱스 데이터베이스에 저장하는 단계
    를 더 포함하는 것을 특징으로 하는 동영상 색인 방법.
  5. 제1항에 있어서,
    사용자로부터 검색어를 포함하는 동영상 검색 요청을 수신하는 단계;
    상기 요청에 응답하여 상기 인덱스 데이터베이스로부터 상기 입력된 검색어를 포함하는 색인어를 식별하는 단계; 및
    상기 식별된 색인어와 연관된 동영상 파일의 경로를 상기 사용자에게 제공하는 단계
    를 더 포함하는 것을 특징으로 하는 동영상 색인 방법.
  6. 제1항 내지 제5항 중 어느 한 항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
  7. 동영상 색인 시스템에 있어서,
    색인할 동영상 파일의 경로를 식별하고, 상기 동영상 파일의 경로에 포함된 동영상 파일의 확장자를 이용하여 상기 동영상 파일이 동영상인지 여부를 판단하는 동영상 판단부;
    상기 동영상 파일이 동영상인 경우, 상기 동영상 파일로부터 자막 파일의 경로를 예측하는 경로 판단부;
    상기 동영상 파일의 자막 파일로부터 텍스트 데이터를 추출하는 데이터 추출부; 및
    상기 추출된 텍스트 데이터를 상기 동영상 파일의 색인어로 하여 저장하는 인덱스 데이터베이스
    를 포함하고,
    상기 동영상 파일은,
    로컬 컴퓨터를 검색 대상으로 색인된 텍스트 데이터를 통해 검색되는 것을 특징으로 하는 것을 특징으로 하는 동영상 색인 시스템.
  8. 제7항에 있어서,
    상기 경로 판단부는 상기 동영상 파일의 파일명을 참조하여, 자막 파일의 확장자를 가지되 상기 동영상 파일과 파일명이 동일한 자막 파일을 식별하는 것을 특징으로 하는 동영상 색인 시스템.
  9. 제7항에 있어서,
    상기 인덱스 데이터베이스는 상기 동영상 파일의 메타 정보를 색인어로 하여 저장하는 것을 특징으로 하는 동영상 색인 시스템.
  10. 제7항에 있어서,
    상기 인덱스 데이터베이스는 상기 동영상 파일의 메타 정보와 상기 텍스트 데이터의 색인어를 상기 동영상 파일의 경로와 연관시켜 저장하는 것을 특징으로 하는 동영상 색인 시스템.
KR1020050085358A 2005-09-13 2005-09-13 동영상 색인 방법 및 시스템 KR101137059B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050085358A KR101137059B1 (ko) 2005-09-13 2005-09-13 동영상 색인 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050085358A KR101137059B1 (ko) 2005-09-13 2005-09-13 동영상 색인 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20070030582A KR20070030582A (ko) 2007-03-16
KR101137059B1 true KR101137059B1 (ko) 2012-04-19

Family

ID=43655171

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050085358A KR101137059B1 (ko) 2005-09-13 2005-09-13 동영상 색인 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101137059B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140089803A1 (en) 2012-09-27 2014-03-27 John C. Weast Seek techniques for content playback
KR101710502B1 (ko) 2014-04-01 2017-03-13 네이버 주식회사 컨텐츠 재생 장치 및 방법,및 컨텐츠 제공 장치 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002056006A (ja) * 2000-08-10 2002-02-20 Nippon Hoso Kyokai <Nhk> 映像・音声検索装置
KR20040003344A (ko) * 2002-07-02 2004-01-13 임우석 통합 컨텐츠 재생기
KR20050041797A (ko) * 2003-10-31 2005-05-04 삼성전자주식회사 확장 검색 기능을 제공하는 메타 정보 및 서브 타이틀정보가 기록된 저장 매체 및 그 재생 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002056006A (ja) * 2000-08-10 2002-02-20 Nippon Hoso Kyokai <Nhk> 映像・音声検索装置
KR20040003344A (ko) * 2002-07-02 2004-01-13 임우석 통합 컨텐츠 재생기
KR20050041797A (ko) * 2003-10-31 2005-05-04 삼성전자주식회사 확장 검색 기능을 제공하는 메타 정보 및 서브 타이틀정보가 기록된 저장 매체 및 그 재생 장치

Also Published As

Publication number Publication date
KR20070030582A (ko) 2007-03-16

Similar Documents

Publication Publication Date Title
RU2491635C2 (ru) Вставка мультимедийного файла через основанное на веб-технологии рабочее приложение для настольной системы
CN101809572B (zh) 在搜索结果页面上包括交互式元素的系统和方法
KR20070019372A (ko) 로컬 컴퓨터 검색 시스템 및 이를 이용한 로컬 컴퓨터 검색방법
KR100656953B1 (ko) 방문 웹사이트 검색 시스템 및 이를 이용한 방문 웹사이트검색 방법
US8046323B2 (en) Context based bookmark
US7844897B1 (en) Blog template generation
US9626369B2 (en) Method and apparatus for collecting and providing information of interest to user regarding multimedia content
US8984414B2 (en) Function extension for browsers or documents
US20110137943A1 (en) Apparatus for deciding word-related keywords, and method and program for controlling operation of same
JPH10198680A (ja) 分散辞書管理方法及びそれを用いた機械翻訳方法
EP2015202A1 (en) Method and apparatus for generating electronic content guide
JP2006065395A (ja) ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム
US8195762B2 (en) Locating a portion of data on a computer network
KR100644159B1 (ko) 검색 컨트롤러 제어 방법 및 그 장치
JP2007114942A (ja) メタデータ生成装置およびメタデータ生成方法
JP6147629B2 (ja) ページコンテンツについて注目箇所を直ぐに表示するページサイトサーバ、プログラム及び方法
KR101503268B1 (ko) 시맨틱 클라이언트, 시맨틱 정보 관리 서버, 시맨틱 정보생성 방법, 시맨틱 정보 검색 방법 및 그 방법들을수행하기 위한 컴퓨터 기록매체
US8121995B2 (en) Service search system, method, and program
JP2007149036A (ja) メタデータ生成装置およびメタデータ生成方法
KR101137059B1 (ko) 동영상 색인 방법 및 시스템
US20160179821A1 (en) Searching Inside Items
JP2010092383A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム
EP2458515A1 (en) Method and apparatus for searching contents in a communication system
US10503773B2 (en) Tagging of documents and other resources to enhance their searchability
KR101174398B1 (ko) 컨텐츠 추천 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 6