KR101014661B1 - System and method for managing multimedia contents - Google Patents

System and method for managing multimedia contents Download PDF

Info

Publication number
KR101014661B1
KR101014661B1 KR1020030076217A KR20030076217A KR101014661B1 KR 101014661 B1 KR101014661 B1 KR 101014661B1 KR 1020030076217 A KR1020030076217 A KR 1020030076217A KR 20030076217 A KR20030076217 A KR 20030076217A KR 101014661 B1 KR101014661 B1 KR 101014661B1
Authority
KR
South Korea
Prior art keywords
multimedia
information
file
word
subtitle
Prior art date
Application number
KR1020030076217A
Other languages
Korean (ko)
Other versions
KR20050041160A (en
Inventor
이예열
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020030076217A priority Critical patent/KR101014661B1/en
Publication of KR20050041160A publication Critical patent/KR20050041160A/en
Application granted granted Critical
Publication of KR101014661B1 publication Critical patent/KR101014661B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Abstract

멀티미디어 콘텐츠로부터 자막 파일 정보를 추출하여 자동으로 멀티미디어 콘텐츠의 내용을 분류해주는 멀티미디어 콘텐츠 관리 시스템 및 그 방법이 개시되어 있다. 본 발명은 검색된 멀티미디어 파일로부터 자막 파일 정보를 추출하는 과정, 추출된 자막 파일 정보의 텍스트 단어와 멀티미디어 사전에 저장된 멀티미디어 단어를 매핑하는 과정, 추출된 자막 파일 정보를 바탕으로 멀티미디어 콘텐츠의 내용별로 카테고리화하는 과정을 포함한다. Disclosed are a multimedia content management system and method for automatically classifying contents of multimedia content by extracting subtitle file information from the multimedia content. According to the present invention, a process of extracting subtitle file information from a retrieved multimedia file, a process of mapping a text word of the extracted subtitle file information and a multimedia word stored in a multimedia dictionary, and categorizing the content into multimedia contents based on the extracted subtitle file information It includes the process of doing.

Description

멀티미디어 콘텐츠 관리 시스템 및 그 방법{System and method for managing multimedia contents}System and method for managing multimedia contents

도 1은 본 발명에 따른 콘텐츠 관리 시스템의 전체 블록도이다.1 is an overall block diagram of a content management system according to the present invention.

도 2a는 도 1의 데이터베이스 관리 모듈의 상세도이다.2A is a detailed view of the database management module of FIG. 1.

도 2b는 데이터베이스 관리 모듈의 주제어 등록 화면을 도시한 것이다. 2B illustrates a main word registration screen of the database management module.

도 2c는 데이터베이스 관리 모듈의 주제어 관련 유사어 등록 화면을 도시한 것이다. FIG. 2C illustrates a synonym-related word registration screen of the database management module. FIG.

도 3은 도 1의 파일 검색 모듈의 상세도이다.3 is a detailed view of the file searching module of FIG. 1.

도 4는 도 1의 정보 추출 모듈의 상세도이다.4 is a detailed view of the information extraction module of FIG. 1.

도 5는 도 1의 정보 매핑 모듈의 상세도이다.FIG. 5 is a detailed view of the information mapping module of FIG. 1.

도 6은 도 1의 파일 분류 모듈의 상세도이다.6 is a detailed view of the file classification module of FIG. 1.

도 7은 정보 검색기의 사용자 화면을 보이는 일실시예이다. 7 illustrates an embodiment of a user screen of an information searcher.

본 발명은 멀티미디어 콘텐츠 관리 시스템에 한 것이며, 특히 영화, 음악과 같은 멀티미디어 콘텐츠로부터 자막 파일 정보를 추출하여 자동으로 멀티미디어 콘 텐츠의 내용을 분류해주는 멀티미디어 콘텐츠 관리 시스템 및 그 방법에 관한 것이다.The present invention relates to a multimedia content management system, and more particularly, to a multimedia content management system and method for automatically classifying contents of multimedia content by extracting subtitle file information from multimedia content such as movies and music.

통상적으로 멀티미디어 컨텐츠의 대량 생산 시대에 따라, 개인용 PC에 저장되어지거나 보관되는 영화와 같은 멀티미디어 파일 데이터는 사용자의 취향에 따라 적게는 수십개에서 수백개가 넘게 되었다. 이에 따라 사용자가 체계적으로 자신의 PC안에 있는 멀티미디어 파일들에 대한 정보를 관리하기가 복잡해졌다. 또한 매니아의 경우 자신이 소장하고 있는 영화 CD만 해도 직접 찾아서 재생해 보기 전 까지는 영화의 내용에 대해 기억하기가 어려워졌다. 또한 PC내에 있는 영화파일들을 검색하고 관리하기가 복잡해졌다.In general, with the times of mass production of multimedia contents, multimedia file data such as movies stored or stored in personal PCs have been reduced to dozens to hundreds according to user's taste. As a result, it is complicated for a user to systematically manage information about multimedia files in his PC. In addition, it is difficult for enthusiasts to remember the contents of the movie until they can find and play it. It also complicates searching and managing movie files on the PC.

본 발명이 이루고자하는 기술적 과제는 멀티미디어 자막 파일의 내용을 자동으로 추출하고, 그 멀티미디어에 대한 콘텐츠 내용을 카테고리화하여 체계적으로 관리할 수 있는 멀티미디어 콘텐츠 관리 시스템 및 그 방법을 제공하는 데 있다. SUMMARY OF THE INVENTION The present invention has been made in an effort to provide a multimedia content management system and method for automatically extracting the contents of a multimedia subtitle file and categorizing and managing the contents of the multimedia.

상기의 기술적 과제를 해결하기 위하여, 본 발명의 멀티미디어 콘텐츠 관리 방법에 있어서, In order to solve the above technical problem, in the multimedia content management method of the present invention,

(a) 소정의 기록 매체로부터 멀티미디어 파일을 검색하는 과정;(a) retrieving a multimedia file from a predetermined recording medium;

(b) 상기 (a)과정에서 검색된 멀티미디어 파일로부터 자막 파일 정보를 추출하는 과정;(b) extracting subtitle file information from the multimedia file retrieved in step (a);

(c) 상기 (b)과정에서 추출된 자막 파일 정보의 텍스트 단어와 멀티미디어 사전에 저장된 멀티미디어 단어를 매핑하는 과정; (c) mapping the text word of the subtitle file information extracted in step (b) and the multimedia word stored in the multimedia dictionary;                         

(d) 상기 (b)과정에서 추출된 자막 파일 정보를 바탕으로 멀티미디어 콘텐츠의 내용별로 카테고리화하는 과정;(d) categorizing the contents according to the contents of the multimedia contents based on the subtitle file information extracted in step (b);

(e) 키워드에 따라 상기 (d)과정에서 카테고리화된 멀티미디어 콘텐츠 정보를 출력하는 과정을 포함하는 것을 특징으로 한다.(e) outputting the multimedia content information categorized in step (d) according to the keyword.

상기의 다른 기술적 과제를 해결하기 위하여, 본 발명의 멀티미디어 콘텐츠 관리 시스템에 있어서, In order to solve the above other technical problem, in the multimedia content management system of the present invention,

멀티미디어 관련 주제어를 편집하고 등록하는 데이터베이스 관리 모듈부;A database management module unit for editing and registering multimedia related subjects;

소정의 기록 매체에 저장되어 있는 멀티미디어 파일을 검색하는 파일 검색 모듈부;A file retrieval module unit for retrieving a multimedia file stored in a predetermined recording medium;

상기 파일 검색 모듈부에서 검색된 멀티미디어 파일에서 자막 정보를 추출하는 정보 추출 모듈부;An information extraction module unit for extracting subtitle information from the multimedia file searched by the file search module unit;

상기 정보 추출 모듈부에서 추출된 자막 정보의 텍스트 단어와 데이터 데이스 관리 모듈부에 등록된 멀티미디어 단어를 매핑하는 정보 매핑 모듈부;An information mapping module unit for mapping the text word of the caption information extracted by the information extraction module unit and the multimedia word registered in the data data management module unit;

상기 정보 추출 모듈부에서 추출된 자막 정보를 사용하여 멀티미디어 컨텐츠를 내용별로 카테고리화하여 그 자막 정보에 해당하는 키워드에 따른 멀티미디어 콘텐츠를 출력하는 파일 분류 모듈부를 포함하는 것을 특징으로 한다.And a file classification module unit for categorizing multimedia contents by content using subtitle information extracted by the information extraction module and outputting multimedia contents according to keywords corresponding to the subtitle information.

이하 첨부된 도면을 참조로하여 본 발명의 바람직한 실시예를 설명하기로 한다. Hereinafter, exemplary embodiments of the present invention will be described with reference to the accompanying drawings.

도 1은 본 발명에 따른 콘텐츠 관리 시스템의 전체 블록도이다. 본 발명에서 는 멀티미디어의 한 실시예로 영화를 이용하여 콘텐츠를 관리한다. 1 is an overall block diagram of a content management system according to the present invention. In the present invention, an embodiment of the multimedia to manage the content using a movie.

도 1을 참조하면, 데이터베이스 관리 모듈(110)은 영화 관련 주제어, 감독, 영화 배우 이름등을 편집하여 자동으로 영화 단어를 생성하고, 검색 정보 요청시 그 정보를 제공한다. Referring to FIG. 1, the database management module 110 automatically generates a movie word by editing a movie related subject, director, and movie actor name, and provides the information when a search information request is made.

파일 검색 모듈(120)은 사용자의 PC나 CD(Compact Disc)에 저장되어 있는 자막이 있는 영화 파일만을 검색하여 데이터 베이스에 저장한다. The file search module 120 searches only the movie file with the subtitle stored in the user's PC or CD (Compact Disc) and stores it in the database.

정보 추출 모듈(130)은 파일 검색 모듈(120)에서 검색된 사용자의 영화 파일에서 자막 파일에 해당하는 SMI(Synchronized Accessible Media Interchange) 파일 정보를 추출한다.The information extraction module 130 extracts Synchronized Accessible Media Interchange (SMI) file information corresponding to the subtitle file from the movie file of the user retrieved by the file retrieval module 120.

정보 매핑 모듈(140)은 정보 추출 모듈(130)에서 추출된 SMI 파일의 자막 텍스트 단어와 데이터 데이스 관리 모듈(110)의 영화 사전에 저장된 단어를 매핑(mapping)시킨다. The information mapping module 140 maps the subtitle text words of the SMI file extracted by the information extraction module 130 and the words stored in the movie dictionary of the data data management module 110.

파일 분류 모듈(150)은 정보 추출 모듈(130)에서 추출된 영화 자막 파일 정보를 사용하여 영화 컨텐츠를 내용별로 카테고리화하여 분류하고, 그 분류된 영화 콘텐츠를 저장 및 관리한다.The file classification module 150 categorizes and categorizes movie contents by content using movie subtitle file information extracted by the information extraction module 130, and stores and manages the classified movie contents.

정보 검색 모듈(160)은 사용자 검색 입력창과 자동 분류 결과 출력창을 구비하여, 사용자가 주제어, 감독, 주인공, 영화 제목등의 키워드(keyword)을 사용자 검색 입력창을 통해 입력하면 파일 분류 모듈(150)에서 분류된 영화의 내용이나 소장하고 있는 영화 콘텐츠 정보를 출력창을 통해 출력한다. The information retrieval module 160 includes a user search input window and an automatic classification result output window. When the user inputs a keyword such as a keyword, a director, a main character, or a movie title through the user search input window, the file classification module 150 is provided. ) Outputs the content of the movie classified in the) or the movie content information owned through the output window.

도 2a는 도 1의 데이터베이스 관리 모듈의 상세도이다. 2A is a detailed view of the database management module of FIG. 1.                     

도 2a를 참조하면, 주제어 편집 관리기(210)는 영화 관련 주제어 예컨대 영화 제목, 영화 감독, 영화 배우등의 정보를 등록(212), 수정(214), 저장(216), 삭제(218)과 같은 편집 작업을 수행한다. Referring to FIG. 2A, the key word editing manager 210 registers information related to a movie-related key word such as a movie title, a movie director, a movie actor, and the like, such as registration 212, modification 214, storage 216, and deletion 218. Perform the editing work.

단어 등록기(220)는 영화관련 주제어 편집 관리기(210)에서 등록/수정된 단어들을 분류하고 등록한다. The word register 220 classifies and registers words registered / modified in the movie-related theme editing manager 210.

DB 관리기(230)는 영화 사전 데이터 베이스를 구비하여 단어 등록기(220)에 의해 등록되는 단어들을 저장한다. The DB manager 230 includes a movie dictionary database to store words registered by the word register 220.

사전검색요청처리기(240)는 정보 매핑 모듈(140)에 의해 SMI 파일에서 추출된 단어와 DB 관리기(230)의 영화 사전 데이터 베이스에 저장된 단어들과 매핑하도록 영화 사전 데이터 베이스내의 단어들을 엑세스할 수 있다.The dictionary search request processor 240 may access the words in the movie dictionary database to map the words extracted from the SMI file by the information mapping module 140 and the words stored in the movie dictionary database of the DB manager 230. have.

여기서 기존의 단순 검색 시스템과 달리 본 발명은 영화사전 데이터베이스를 구성할 때 사용자가 정의한 카테고리 분류방식도 지원한다.Here, unlike the existing simple search system, the present invention also supports a user-defined category classification method when constructing a movie dictionary database.

도 2b 및 도 2b를 참조하여 주제어 및 그 주제 관련 유사어 등록 실시예를 설명한다. Referring to FIG. 2B and FIG. 2B, a main word and a similar word related embodiment of the topic will be described.

사용자가 입력창을 통해 주제어를 입력할 때, "액션" 이라는 카테고리를 설정할 수 있다(도 2b). 그리고 이 "액션"이라는 주제어에 관련된 매핑단어들을 입력할 수가 있다. When the user inputs the main word through the input window, a category called "action" may be set (FIG. 2B). You can also enter mapping words related to this "action" topic.

이에 따라 영화 단어 사전 DB내에는 액션 { "전투", "공격", "싸워라", "사격", ,,, 등 } "액션" 이라는 주제단어에 액션 영화에서 나올 수 있는 대화에서 사용되는 단어들을 유사어로 등록하게 된다(도 2c). 결국 이렇게 구축된 "액션"이 라는 영화 카테고리에 해당되는 영화 컨텐츠들은 정보 매핑 모듈(140)이 수행되면 액션 영화 분류 카테고리가 자동으로 생성되게 된다. 따라서 영화사전 데이터 베이스는 사용자가 정의한 카테고리로 영화 컨텐츠들을 관리할 수가 있다.Therefore, in the movie vocabulary DB, the words {action, battle, attack, fight, fire, fire, etc.} are used in the dialogues that can appear in the action film. It is registered as a synonym (Fig. 2c). Eventually, the movie contents corresponding to the movie category called "action" thus constructed are automatically generated by the action movie classification category when the information mapping module 140 is performed. Therefore, the movie dictionary database can manage movie contents in user-defined categories.

도 3은 도 1의 파일 검색 모듈의 상세도이다.3 is a detailed view of the file searching module of FIG. 1.

도 3을 참조하면, 영화 파일 검색기(320)는 PC(330)에 있는 동영상 파일중에서 주로 자막 파일이 있는 동영상 파일만을 자동 검색한다. Referring to FIG. 3, the movie file finder 320 automatically searches only a video file having a subtitle file among video files in the PC 330.

DB 관리기(310)는 영화 파일 검색기(320)에서 검색된 자막 영화 파일 정보를 저장한다. The DB manager 310 stores subtitle movie file information retrieved from the movie file finder 320.

도 4는 도 1의 정보 추출 모듈의 상세도이다.4 is a detailed view of the information extraction module of FIG. 1.

도 4를 참조하면, 자막 파일 추출기(420)는 PC나 CD에서 검색된 자막 파일을 파싱(parsing)하여 텍스트를 추출하여 데이터베이스에 저장한다. 이때 자막 파일 추출기(420)는 전체 SMI 자막 파일중 헤더 부분은 별도로 저장하도록 하고 바디 부분은 추출된 텍스트중 명사만을 찾아내어 데이터 베이스에 저장하도록한다. Referring to FIG. 4, the subtitle file extractor 420 parses a subtitle file retrieved from a PC or a CD, extracts text, and stores the text in a database. At this time, the subtitle file extractor 420 stores the header part of the entire SMI subtitle file separately, and the body part finds only the nouns in the extracted text and stores the noun in the database.

DB 관리기(410)는 자막 파일 추출기(420)에서 추출된 SMI 자막 파일 텍스트를 데이터 베이스에 저장한다. The DB manager 410 stores the SMI subtitle file text extracted by the subtitle file extractor 420 in the database.

SMI 파일은 바디(BODY) 부분과 헤더(HEADER) 부분으로 구성된다.The SMI file consists of a body part and a header part.

여기서 SMI 파일의 바디(BODY) 부분의 예제를 보면 다음과 같다. Here is an example of the body part of the SMI file:

<BODY><TABLE><BODY> <TABLE>

<SYNC Start=0><SYNC Start = 0>

<P Class=ENUSCC ID=Source>Pres. John F. Kennedy <P Class = ENUSCC ID = Source> Pres. John F. Kennedy                     

<SYNC Start=10><SYNC Start = 10>

<P Class=ENUSCC>Let the word go forth,  <P Class = ENUSCC> Let the word go forth,

from this time and place to friend and foe from this time and place to friend and foe

alike that the torchalike that the torch

<SYNC Start=8800><SYNC Start = 8800>

<P Class=ENUSCC>has been passed to a new generations of Americans, born in this century, tempered by war,<P Class = ENUSCC> has been passed to a new generations of Americans, born in this century, tempered by war,

<SYNC Start=19500><SYNC Start = 19500>

<P Class=ENUSCC>disciplined by a hard and bitter peace, <P Class = ENUSCC> disciplined by a hard and bitter peace,

</TABLE></BODY></ TABLE> </ BODY>

또한 자막파일 추출기(420)에 의해 1차로 추출된 데이터 형태는 표 1와 같다. In addition, the data types extracted by the caption file extractor 420 are shown in Table 1 below.

구분_필드Break_field SYNC(int)SYNC (int) RAW 데이터 (String 배열)RAW data (String array) BODYBODY 1010 Let the word go forthLet the word go forth from this time and place to friend and foefrom this time and place to friend and foe BODYBODY 88008800 has been passed to a new generations of Americanshas been passed to a new generations of Americans born in this century, tempered by warborn in this century, tempered by war

또한 자막파일 추출기(420)에 의해 추출된 바디 부분의 자막 데이터를 데이터 베이스에 저장하는 데이터 형태는 표 2와 같다. In addition, the data format for storing the caption data of the body portion extracted by the caption file extractor 420 in the database is shown in Table 2.

SYNC(int)SYNC (int) SYNC(int)SYNC (int) 추출 데이터 (String 배열)Extract Data (String Array) 1010 1One wordword 1010 22 timetime 1010 33 placeplace 44 friendfriend 55 foefoe 88008800 1One generationsgenerations

또한 SMI 파일의 헤더 부분의 예제를 보면 다음과 같다.The following is an example of header part of SMI file.

<HEAD><HEAD>

<Title>President John F. Kennedy Speech</Title><Title> President John F. Kennedy Speech </ Title>

<SAMIParam><!--<SAMIParam> <!-

Copyright="(C)Copyright 1997, Microsoft Corporation"Copyright = "(C) Copyright 1997, Microsoft Corporation"

Media="JF Kennedy.wav", none Media = "JF Kennedy.wav", none

Length=73000Length = 73000

CaptionMetrics=scaleableCaptionMetrics = scaleable

CaptionLineLength=180CaptionLineLength = 180

CaptionFontSize=12CaptionFontSize = 12

CaptionTextLines=3-->CaptionTextLines = 3->

</SAMIParam>      </ SAMIParam>

<STYLE TYPE="text/css"><!--<STYLE TYPE = "text / css"> <!-

P {margin-left: 29pt; margin-right: 29pt; font-size: 12pt; P {margin-left: 29 pt; margin-right: 29 pt; font-size: 12pt;

text-align: left; font-family: tahoma, arial, sans-serif; text-align: left; font-family: tahoma, arial, sans-serif;

font-weight: normal; color: white; background-color: black;}font-weight: normal; color: white; background-color: black;}

TABLE {Width: "248pt" ;} TABLE {Width: "248pt";}                     

.ENUSCC {Name: "English Captions"; lang: en-US-CC;}.ENUSCC {Name: "English Captions"; lang: en-US-CC;}

#Source {margin-bottom: -15pt; background-color: silver; #Source {margin-bottom: -15pt; background-color: silver;

color: black; vertical-align: normal; font-size: 12pt; color: black; vertical-align: normal; font-size: 12pt;

font-family: tahoma, arial, sans-serif; font-family: tahoma, arial, sans-serif;

font-weight: normal;}font-weight: normal;}

#Youth {color: greenyellow; font-size: 18pt;}#Youth {color: greenyellow; font-size: 18pt;}

#BigPrint-1 {color: yellow; font-size: 24pt;}--># BigPrint-1 {color: yellow; font-size: 24pt;}->

</STYLE></ STYLE>

또한 자막파일 추출기(420)에 의해 추출된 헤더 부분의 자막 데이터를 데이터 베이스에 저장하는 데이터 형태는 표 3와 같다. In addition, the data format for storing the caption data of the header portion extracted by the caption file extractor 420 in the database is shown in Table 3.

구분_필드Break_field sub제목sub title 저장 데이터 (String 배열)Save data (String array) HeaderHeader TitleTitle President John F. Kennedy SpeechPresident John F. Kennedy Speech HeaderHeader MediaMedia JF Kennedy.wavJF Kennedy.wav HeaderHeader LengthLength 7300073000 HeaderHeader CaptionMetricsCaptionmeters scaleablescaleable HeaderHeader CaptionLineLengthCaptionlinelength 180180

도 5는 도 1의 정보 매핑 모듈의 상세도이다.FIG. 5 is a detailed view of the information mapping module of FIG. 1.

도 5를 참조하면, DB 관리기(510)는 SMI 자막 파일의 텍스트 정보를 저장한 데이터 베이스를 구비한다. Referring to FIG. 5, the DB manager 510 includes a database storing text information of an SMI subtitle file.

사전 검색 요청 처리기(530)는 영화 사전 데이터 베이스를 구비하여 단어 검색 요청시 저장된 영화 관련 정보를 출력한다. The dictionary search request processor 530 includes a movie dictionary database and outputs the movie related information stored in the word search request.                     

매핑 처리기(520)는 DB 관리기(510)의 데이터베이스에 저장된 SMI 자막 파일의 텍스트 정보와 사전 검색 요청 처리기(530)의 영화사전 데이터베이스에 저장된 영화 정보에 대해 공통 단어를 비교 검색하여 서로 매핑(mapping)시킨다. 예컨대, 추출된 텍스트 정보가 "사우론"이면 영화사전에서 영화제목인 '반지의 제왕'과 매핑시킨다. The mapping processor 520 compares and searches common words for text information of the SMI subtitle file stored in the database of the DB manager 510 and movie information stored in the movie dictionary database of the dictionary search request processor 530 to map each other. Let's do it. For example, if the extracted text information is "Sauron," it is mapped in the movie dictionary with "Lord of the Rings" which is a movie title.

도 6은 도 1의 파일 분류 모듈의 상세도이다.6 is a detailed view of the file classification module of FIG. 1.

도 6을 참조하면, DB 관리기(620)는 자막 파일과 매핑된 영화 파일의 위치 정보를 저장한 데이터 베이스를 구비한다. Referring to FIG. 6, the DB manager 620 includes a database that stores location information of a movie file mapped to a caption file.

정보데이터베이스(640)는 자막 파일 저장 정보를 저장한다. The information database 640 stores subtitle file storage information.

자동 분류 처리기(630)는 정보데이터베이스(640)의 영화 자막 파일 정보와 DB 관리기(620)의 검색된 영화 파일 위치 정보를 비교하여 자동으로 영화 감독, 영화 배우, 영화 제목, 영화 장르별등을 카테고리화한다. 여기서 영화 파일의 재생 위치 정보는 표 1, 표 2에서 "SYNC(int)"에 해당된다. The automatic classification processor 630 automatically categorizes movie directors, movie stars, movie titles, movie genres, etc. by comparing the movie subtitle file information of the information database 640 with the retrieved movie file location information of the DB manager 620. . Here, the playback position information of the movie file corresponds to "SYNC (int)" in Tables 1 and 2.

도7을 참조하여 사용자에게 자동 분류 결과를 보여주는 일실시예를 설명하면, 자동 분류 처리기(630)는 여러개의 조합된 단어나 주제어 검색을 사용자 검색어 입력창(610)으로부터 받으면 그 검색어에 해당하는 카테고리화된 영화 정보를 분류 결과 출력창(650)에 보여준다. 예컨대, 카테고리 검색 키워드가 '스필버그 감독' 이면, 그에 대한 모든 작품을 영화 파일 위치 정보를 참조하여 결과창에 표시한다. Referring to FIG. 7, the automatic classification processor 630 receives a plurality of combined words or subject searches from the user search term input window 610. The converted movie information is displayed on the classification result output window 650. For example, if the category search keyword is 'Spillberg', all the works about it are displayed in the result window with reference to the movie file location information.

본 발명은 상술한 실시예에 한정되지 않으며, 본 발명의 사상내에서 당업자 에 의한 변형이 가능함은 물론이다. The present invention is not limited to the above-described embodiment, and of course, modifications may be made by those skilled in the art within the spirit of the present invention.

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.The invention can also be embodied as computer readable code on a computer readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, hard disk, floppy disk, flash memory, optical data storage device, and also carrier waves (for example, transmission over the Internet). It also includes the implementation in the form of. The computer readable recording medium may also be distributed over a networked computer system and stored and executed as computer readable code in a distributed manner.

상술한 바와 같이 본 발명에 의하면, 추출된 멀티미디어 자막 파일 정보를 사용하여 사용자에게 자동으로 카테고리화된 멀티미디어 정보를 제공할 수 있다. 또한 멀티미디어 정보의 자동 분류 및 검색 기능을 사용자에게 제공할 수 있다. 또한 자동 추출된 멀티미디어 내용 정보와 자동으로 검색된 멀티미디어 파일의 위치 정보를 데이터 베이스에 저장함으로서 사용자가 콘텐츠 관리를 용이하게 할 수 있다. 또한 영화 사전에 각종 건물이나 고유 명사등을 추가하여 자동 분류를 수행함으로써 이미지 검색과 유사한 효과를 기대할 수 있다. As described above, according to the present invention, the multimedia information categorized automatically may be provided to the user using the extracted multimedia subtitle file information. In addition, an automatic classification and retrieval function of multimedia information may be provided to a user. In addition, the user can easily manage the content by storing the automatically extracted multimedia content information and the location information of the automatically retrieved multimedia file in the database. In addition, by adding various buildings or proper nouns to the movie dictionary and performing automatic classification, an effect similar to image search can be expected.

Claims (8)

멀티미디어 콘텐츠 관리 시스템의 멀티미디어 콘텐츠 관리 방법에 있어서, In the multimedia content management method of the multimedia content management system, (a) 소정의 기록 매체로부터 멀티미디어 파일을 검색하는 과정;(a) retrieving a multimedia file from a predetermined recording medium; (b) 상기 (a)과정에서 검색된 멀티미디어 파일로부터 자막 파일 정보를 추출하는 과정;(b) extracting subtitle file information from the multimedia file retrieved in step (a); (c) 상기 (b)과정에서 추출된 자막 파일 정보의 텍스트 단어와 멀티미디어 사전에 저장된 멀티미디어 단어를 매핑하고, 상기 자막 파일 정보의 텍스트 단어와 매핑된 멀티미디어 파일의 위치 정보를 저장하는 과정;(c) mapping the text word of the subtitle file information extracted in step (b) and the multimedia word stored in the multimedia dictionary, and storing the location information of the mapped multimedia file and the text word of the subtitle file information; (d) 상기 (b)과정에서 추출된 자막 파일 정보와 멀티미디어 파일의 위치 정보를 바탕으로 멀티미디어 콘텐츠의 내용별로 카테고리화하는 과정을 포함하는 멀티미디어 콘텐츠 관리 방법.and (d) categorizing the contents according to the contents of the multimedia contents based on the subtitle file information extracted in step (b) and the location information of the multimedia file. 제1항에 있어서, 상기 (a)과정은 The method of claim 1, wherein step (a) 기록 매체에서 자막파일 정보를 포함하는 멀티미디어 파일을 검색하는 과정;Retrieving a multimedia file including subtitle file information from a recording medium; 상기 검색된 자막 파일 정보를 저장하는 과정을 구비하는 것을 특징으로 하는 멀티미디어 콘텐츠 관리 방법.And storing the retrieved subtitle file information. 제1항에 있어서, 상기 (b)과정은 The method of claim 1, wherein step (b) 검색된 자막 파일을 파싱하여 텍스트를 추출하는 과정;Parsing the retrieved subtitle file to extract text; 상기 과정에서 추출된 자막 파일 텍스트를 데이터 베이스에 저장하는 과정을 구비하는 것을 특징으로 하는 멀티미디어 콘텐츠 관리 방법.And storing the extracted subtitle file text in the database. 제1항에 있어서, 상기 (c)과정은 The method of claim 1, wherein step (c) 자막 파일의 텍스트 정보를 저장하는 과정;Storing text information of the subtitle file; 멀티 미디어 사전을 구비하여 단어 검색 요청시 저장된 멀티미디어 정보를 출력하는 과정;Outputting multimedia information stored in a word search request with a multimedia dictionary; 상기 저장된 자막 파일의 텍스트 정보와 멀티미디어 사전에 저장된 멀티미디어 정보에 대해 공통 단어를 비교 검색하여 서로 매핑하는 과정을 구비하는 것을 특징으로 하는 멀티미디어 콘텐츠 관리 방법.And comparing and searching common words with respect to text information of the stored subtitle file and multimedia information stored in the multimedia dictionary. 제1항에 있어서, 상기(d)과정은 상기 자막 파일 정보와 영화 파일 위치 정보를 비교하여 카테고리화하는 과정임을 특징으로 하는 멀티미디어 콘텐츠 관리 방법.The method of claim 1, wherein the step (d) comprises categorizing the subtitle file information and movie file location information by categorizing them. 제1항에 있어서, 키워드에 따라 상기 (d)과정에서 카테고리화된 멀티미디어 콘텐츠 정보를 출력하는 과정을 더 포함하는 것을 특징으로 하는 멀티미디어 콘텐츠 관리 방법.The method according to claim 1, further comprising the step of outputting the multimedia content information categorized in step (d) according to the keyword. 멀티미디어 콘텐츠 관리 시스템에 있어서, In the multimedia content management system, 멀티미디어 관련 주제어를 편집하고 등록하는 데이터베이스 관리 모듈부;A database management module unit for editing and registering multimedia related subjects; 소정의 기록 매체에 저장되어 있는 멀티미디어 파일을 검색하는 파일 검색 모듈부;A file retrieval module unit for retrieving a multimedia file stored in a predetermined recording medium; 상기 파일 검색 모듈부에서 검색된 멀티미디어 파일에서 자막 정보를 추출하는 정보 추출 모듈부;An information extraction module unit for extracting subtitle information from the multimedia file searched by the file search module unit; 상기 정보 추출 모듈부에서 추출된 자막 정보의 텍스트 단어와 데이터 데이스 관리 모듈부에 등록된 멀티미디어 단어를 매핑하는 정보 매핑 모듈부;An information mapping module unit for mapping the text word of the caption information extracted by the information extraction module unit and the multimedia word registered in the data data management module unit; 상기 자막 정보의 텍스트 단어와 매핑된 멀티미디어 파일의 위치를 저장한 데이터 베이스를 구비하여, 상기 정보 추출 모듈부에서 추출된 자막 정보를 사용하여 멀티미디어 컨텐츠를 내용별로 카테고리화하고 그 자막 정보에 해당하는 키워드에 따른 멀티미디어 콘텐츠를 출력하는 파일 분류 모듈부를 포함하는 멀티미디어 콘텐츠 관리 시스템.A database storing a location of a multimedia file mapped with a text word of the caption information, categorizing multimedia contents by content using caption information extracted by the information extraction module unit, and a keyword corresponding to the caption information Multimedia content management system including a file classification module for outputting the multimedia content according to the. 제7항에 있어서, 상기 데이터베이스 관리 모듈부는The method of claim 7, wherein the database management module unit 멀티미디어 관련 주제어를 편집하는 주제어 편집 관리기;A topic editing manager for editing multimedia related topics; 상기 주제어 편집 관리기에서 편집된 주제어의 단어들을 분류하여 등록하는 단어 등록기;A word register configured to classify and register words of the main word edited in the main word editing manager; 상기 단어 등록기에 의해 등록된 단어들을 영화 사전 데이터 베이스에 저장하는 DB 관리기;A DB manager for storing words registered by the word register in a movie dictionary database; 상기 자막 파일의 단어에 대한 검색 요청시 상기 DB 관리기에 저장된 단어들을 엑세스하는 사전검색처리기를 포함하는 것을 특징으로 하는 멀티미디어 콘텐츠 관리 시스템.And a pre-search processor for accessing the words stored in the DB manager when a search request is made for the words in the subtitle file.
KR1020030076217A 2003-10-30 2003-10-30 System and method for managing multimedia contents KR101014661B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030076217A KR101014661B1 (en) 2003-10-30 2003-10-30 System and method for managing multimedia contents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030076217A KR101014661B1 (en) 2003-10-30 2003-10-30 System and method for managing multimedia contents

Publications (2)

Publication Number Publication Date
KR20050041160A KR20050041160A (en) 2005-05-04
KR101014661B1 true KR101014661B1 (en) 2011-02-16

Family

ID=37242673

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030076217A KR101014661B1 (en) 2003-10-30 2003-10-30 System and method for managing multimedia contents

Country Status (1)

Country Link
KR (1) KR101014661B1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7647332B2 (en) 2006-06-29 2010-01-12 Microsoft Corporation Aggregating content from multiple content delivery types in a discovery interface
US7840979B2 (en) 2006-06-30 2010-11-23 Microsoft Corporation Graphical tile-based expansion cell guide
US8015580B2 (en) 2006-06-30 2011-09-06 Microsoft Corporation Customizing virtual channels in a discovery interface
KR101320022B1 (en) * 2007-02-16 2013-10-18 삼성전자주식회사 Apparatus and method for displaying

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10285528A (en) * 1997-04-03 1998-10-23 Sony Corp Recording and reproducing device for television program
KR20010037652A (en) * 1999-10-19 2001-05-15 서주철 Audio indexing system and method, and audio retrieval system and method
KR20020072922A (en) * 2001-03-13 2002-09-19 (주)이너베이 Wireless internet service system using categorized service and the method thereof
KR100381013B1 (en) * 2000-12-18 2003-04-26 한국전자통신연구원 Apparatus and Method for caption input using speech recognizer and recording media

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10285528A (en) * 1997-04-03 1998-10-23 Sony Corp Recording and reproducing device for television program
KR20010037652A (en) * 1999-10-19 2001-05-15 서주철 Audio indexing system and method, and audio retrieval system and method
KR100381013B1 (en) * 2000-12-18 2003-04-26 한국전자통신연구원 Apparatus and Method for caption input using speech recognizer and recording media
KR20020072922A (en) * 2001-03-13 2002-09-19 (주)이너베이 Wireless internet service system using categorized service and the method thereof

Also Published As

Publication number Publication date
KR20050041160A (en) 2005-05-04

Similar Documents

Publication Publication Date Title
US7890521B1 (en) Document-based synonym generation
US8661012B1 (en) Ensuring that a synonym for a query phrase does not drop information present in the query phrase
US7925498B1 (en) Identifying a synonym with N-gram agreement for a query phrase
US7788084B2 (en) Labeling of work of art titles in text for natural language processing
US6580437B1 (en) System for organizing videos based on closed-caption information
US6751776B1 (en) Method and apparatus for personalized multimedia summarization based upon user specified theme
US8392440B1 (en) Online de-compounding of query terms
GB2379051A (en) System and Method for Combining Voice Annotation and Recognition Search Criteria With Traditional Search Criteria into Metadata
JP2007102819A (en) System and method for segmenting and identifying event in image by using voice annotation
BRPI0400304B1 (en) electronic program guide (epg) data search method and electronic program guide (epg) data search engine
Jaimes et al. Modal keywords, ontologies, and reasoning for video understanding
JP3545824B2 (en) Data retrieval device
US9183297B1 (en) Method and apparatus for generating lexical synonyms for query terms
JP4064902B2 (en) Meta information generation method, meta information generation device, search method, and search device
Kuper et al. Intelligent multimedia indexing and retrieval through multi-source information extraction and merging
KR101014661B1 (en) System and method for managing multimedia contents
Bost et al. Serial speakers: a dataset of tv series
KR100451004B1 (en) Apparatus and Method for Database Construction of News Video based on Closed Caption and Method of Content-based Retrieval/Serching It
Fauzi et al. Image understanding and the web: a state-of-the-art review
JP2020129377A (en) Content retrieval method, apparatus, device, and storage medium
US7949667B2 (en) Information processing apparatus, method, and program
Lee Text-based video genre classification using multiple feature categories and categorization methods
Demirtas et al. Automatic categorization and summarization of documentaries
JPH06231179A (en) Information retrieving system
US20080046488A1 (en) Populating a database

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140128

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150129

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160128

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee