KR20070098396A - Media file format, and method and apparatus for reproducing media using the same - Google Patents

Media file format, and method and apparatus for reproducing media using the same Download PDF

Info

Publication number
KR20070098396A
KR20070098396A KR1020060066512A KR20060066512A KR20070098396A KR 20070098396 A KR20070098396 A KR 20070098396A KR 1020060066512 A KR1020060066512 A KR 1020060066512A KR 20060066512 A KR20060066512 A KR 20060066512A KR 20070098396 A KR20070098396 A KR 20070098396A
Authority
KR
South Korea
Prior art keywords
data
media
information
meta
track
Prior art date
Application number
KR1020060066512A
Other languages
Korean (ko)
Other versions
KR101243965B1 (en
Inventor
김태현
차혁진
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20070098396A publication Critical patent/KR20070098396A/en
Application granted granted Critical
Publication of KR101243965B1 publication Critical patent/KR101243965B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23412Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs for generating or manipulating the scene composition of objects, e.g. MPEG-4 objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44012Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving rendering scenes according to scene graphs, e.g. MPEG-4 scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8146Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
    • H04N21/8153Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics comprising still images, e.g. texture, background image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Abstract

A media file format, and a method and an apparatus for reproducing media using the same are provided to reproduce/search video contents easily by using usable recording information or hierarchically summarized information as meta information for video data. A media file format, and a method and an apparatus for reproducing media using the same comprise a media data region(260), an information region(240), and a meta region(220). The media data region has a video data, at least two audio data, and at least two text data as media data. The information region comprises the tracks by the media data. The meta region includes a first region describing the list of media data and a second region describing the position information of media data.

Description

미디어 파일 포맷과 이를 이용하는 미디어 재생 방법 및 장치{Media file format, and method and apparatus for reproducing media using the same}Media file format and method and apparatus for playing media using same {media file format, and method and apparatus for reproducing media using the same}

도 1은 본 발명에 의한 미디어 파일 포맷의 일 실시예를 설명하기 위한 도면이다.1 is a view for explaining an embodiment of a media file format according to the present invention.

도 2는 본 발명에 의한 미디어 파일 포맷의 다른 실시예를 설명하기 위한 도면이다.2 is a view for explaining another embodiment of a media file format according to the present invention.

도 3은 본 발명에서 사용되는 사용 기록 정보를 설명하기 위한 도면이다.3 is a diagram for explaining usage record information used in the present invention.

도 4는 본 발명에서 사용되는 계층적 요약 정보를 설명하기 위한 도면이다.4 is a diagram for describing hierarchical summary information used in the present invention.

도 5는 본 발명에 의한 미디어 재생 방법의 일 실시예를 설명하기 위한 플로우차트이다.5 is a flowchart for explaining an embodiment of a media playback method according to the present invention.

도 6은 본 발명에 의한 미디어 재생 장치의 일 실시예를 설명하기 위한 블럭도이다.6 is a block diagram illustrating an embodiment of a media playback apparatus according to the present invention.

도면의 주요 부분에 대한 부호의 설명Explanation of symbols for the main parts of the drawings

200 : 파일 식별 영역 220 : 메타 영역200: file identification area 220: meta area

240 : 정보 영역 260 : 미디어 데이터 영역240: information area 260: media data area

242 : 그래픽 트랙 244 : 비디오 트랙242: Graphics Tracks 244: Video Tracks

246 : 오디오 트랙 248 : 텍스트 트랙246: Audio Track 248: Text Track

본 발명은 미디어 파일 포맷과 이를 이용한 미디어 재생 방법 및 장치에 관한 것으로, 특히, 휴대용 비디오 플레이어에 적용하기 위한 비디오 콘텐츠와 관련 메타 정보를 저장하는 미디어 파일 포맷과 이를 이용하는 미디어 재생 방법 및 장치에 관한 것이다.The present invention relates to a media file format and a method and apparatus for playing media using the same, and more particularly, to a media file format for storing video content and related meta information for use in a portable video player, and a method and apparatus for playing a media using the same. .

최근 단말기 처리 속도의 증가, 하드 디스크 등 저장장치의 대용량화 및 배터리 지속시간이 장기화되면서 휴대용 멀티미디어 플레이어가 일생 생활에 널리 사용되고 있는 추세이다. 많은 수의 휴대용 멀티미디어 플레이어는 다양한 형식의 파일 포맷(예를 들어, AVI, MP4) 뿐만 아니라, 비디오(예를 들어, MPEG-1,MPEG-4,AVC) 및 오디오(예를 들어, MP3, AAC) 코덱을 지원한다. 그러나 현재 DVD 플레이어와 같은 용도의 휴대용을 위한 표준 포맷은 존재하지 않는다. 또한 적절한 표준이 없어서 항상 코덱과 미디어 간의 호환성에 문제점이 있다. 따라서, 미디어 파일의 저장, 검색 및 재생에 어려움이 있다.Recently, with the increase in the processing speed of terminals, the increase in the capacity of storage devices such as hard disks and the prolonged battery duration, portable multimedia players are widely used in life. Many portable multimedia players use various formats of file formats (e.g. AVI, MP4), as well as video (e.g. MPEG-1, MPEG-4, AVC) and audio (e.g. MP3, AAC). ) Codecs are supported. However, there is currently no standard format for portable use such as a DVD player. In addition, there is always a problem with compatibility between codecs and media because there is no appropriate standard. Thus, there is a difficulty in storing, retrieving and playing back media files.

본 발명이 이루고자 하는 기술적 과제는, 다양한 미디어 데이터의 저장, 검색 및 재생이 용이한 미디어 파일 포맷을 제공하는 데 있다.An object of the present invention is to provide a media file format that is easy to store, retrieve, and play various media data.

본 발명이 이루고자 하는 다른 기술적 과제는, 다양한 미디어 데이터의 저장, 검색 및 재생이 용이한 미디어 파일을 이용하는 미디어 재생 방법 및 장치를 제공하는 데 있다.Another object of the present invention is to provide a method and apparatus for reproducing a media using a media file that is easy to store, retrieve, and reproduce various media data.

상기 과제를 이루기 위해, 본 발명에 의한 미디어 파일 포맷은, 비디오 데이터, 적어도 두 개의 오디오 데이터 및 적어도 두 개의 텍스트 데이터를 미디어 데이터로서 갖는 미디어 데이터 영역 및 상기 미디어 데이터 별로 트랙을 갖는 정보 영역으로 구성되는 것이 바람직하다.In order to achieve the above object, the media file format according to the present invention comprises a media data area having video data, at least two audio data and at least two text data as media data, and an information area having tracks for each of the media data. It is preferable.

상기 다른 과제를 이루기 위해, 비디오 데이터, 오디오 데이터 및 텍스트 데이터를 포함하는 미디어 파일을 이용하는 미디어 재생 방법은, 상기 미디어 파일에서 목적 트랙을 찾는 단계와, 상기 목적 트랙에 대응하는 목적 미디어 데이터를 찾는 단계와, 상기 찾은 목적 미디어 데이터 중 상기 비디오 데이터에 대한 메타 정보를 상기 목적 트랙에서 찾는 단계 및 상기 찾은 메타 정보에 따라 상기 찾은 목적 미디어 데이터를 이용하여 장면을 생성하는 단계로 이루어지는 것이 바람직하다.According to another aspect of the present invention, there is provided a media playback method using a media file including video data, audio data, and text data, the method comprising: finding a destination track in the media file, and finding destination media data corresponding to the destination track. And searching for the meta information of the video data among the found destination media data in the destination track and generating a scene using the found destination media data according to the found meta information.

또한, 상기 다른 과제를 이루기 위해, 비디오 데이터, 오디오 데이터 및 텍스트 데이터를 포함하는 미디어 파일을 이용하는 미디어 재생 장치는, 상기 미디어 파일에서 상기 목적 트랙을 찾는 트랙 서치부와, 상기 목적 트랙에 대응하는 목적 미디어 데이터를 찾는 미디어 데이터 서치부와, 상기 찾은 미디어 데이터 중 상기 비디오 데이터에 대한 메타 정보를 상기 목적 트랙에서 찾는 메타 정보 서치부 및 상기 찾은 메타 정보에 따라 상기 찾은 목적 미디어 데이터를 이용하여 장면을 생성하는 장면 생성부로 구성되는 것이 바람직하다.Further, in order to achieve the above object, a media playback apparatus using a media file including video data, audio data, and text data includes a track search unit for searching for the destination track in the media file, and a destination corresponding to the destination track. A scene is generated using a media data search unit for searching for media data, a meta information search unit for searching for meta information of the video data among the found media data in the destination track, and the found target media data according to the found meta information. It is preferable that the scene generation unit is configured.

이하, 본 발명에 의한 미디어 파일 포맷의 실시예들을 첨부한 도면들을 참조하여 다음과 같이 설명한다.Hereinafter, embodiments of the media file format according to the present invention will be described with reference to the accompanying drawings.

도 1은 본 발명에 의한 미디어 파일 포맷의 일 실시예를 설명하기 위한 도면으로서, 파일 식별 영역(100), 정보 영역(120) 및 미디어 데이터 영역(140)으로 구성된다. 파일 식별 영역(100)은 파일 식별 정보를 갖는다. 여기서, 파일 식별 정보는 다수 개의 파일들을 서로 구분시키는 정보를 의미하며, 파일의 형식 및/또는 버전으로 표현될 수 있다.FIG. 1 is a view for explaining an embodiment of a media file format according to the present invention, and includes a file identification area 100, an information area 120, and a media data area 140. The file identification area 100 has file identification information. Here, the file identification information refers to information for distinguishing a plurality of files from each other, and may be expressed in the format and / or version of the file.

미디어 데이터 영역(140)은 각종 미디어 데이터가 기록되는 영역이다. 본 발명에 의하면, 각종 미디어 데이터는 비디오 데이터(142), 적어도 두 개의 오디오 데이터(144) 및 적어도 두 개의 텍스트 데이터(146)를 의미한다. 예를 들어, 영화 한 편이 본 발명에 의한 미디어 파일 포맷으로 구성되어 있다고 가정하면, 비디오 데이터(142)는 영화의 동영상 데이터에 해당하고, 적어도 두 개의 오디오 데이터(144)는 동영상 스트림의 배경 음악이나, 여러 나라 언어로 더빙된 음성 데이터에 해당할 수 있으며, 적어도 두 개의 텍스트 데이터(146)는 여러 나라 언어 지원을 위한 자막 데이터에 해당할 수 있다. 또한, 비디오 데이터(142)는 JPEG(Joint Picture Experts Group), MPEG(Moving Picture Experts Group)-1,2 또는 AVC(Advanced Video Coding) 형태로 압축된 형태를 취할 수 있다.The media data area 140 is an area in which various media data is recorded. According to the present invention, various media data means video data 142, at least two audio data 144, and at least two text data 146. For example, assuming that a movie is configured in a media file format according to the present invention, video data 142 corresponds to movie data of a movie, and at least two audio data 144 correspond to background music of a movie stream. The voice data may correspond to dubbed voice data in various languages, and at least two text data 146 may correspond to subtitle data for supporting various languages. In addition, the video data 142 may be compressed in the form of a Joint Picture Experts Group (JPEG), Moving Picture Experts Group (MPEG) -1, 2, or Advanced Video Coding (AVC).

정보 영역(120)은 각종 미디어 데이터에 대한 미디어 정보를 갖는다. 미디어 정보는 미디어 데이터를 기술(description)하는 정보를 의미한다. 만일, 미디어 데이터가 비디오 데이터인 경우, 비디오 데이터를 위한 미디어 정보는 비디오 데이터 에 해당하는 영화의 제목, 감독, 출연 배우 등의 정보를 가질 수 있다. 본 발명에 의한 정보 영역(120)은 미디어 데이터 영역(140)의 데이터 별로 비디오 트랙(122), 적어도 두 개의 오디오 트랙(124) 및 적어도 두 개의 텍스트 트랙(126)을 포함한다.The information area 120 has media information for various media data. Media information refers to information describing media data. If the media data is video data, the media information for the video data may have information such as a title, a director, and an actor of the movie corresponding to the video data. The information area 120 according to the present invention includes a video track 122, at least two audio tracks 124, and at least two text tracks 126 for each data of the media data area 140.

또한, 본 발명에 의하면, 비디오 트랙(122)은 비디오 데이터(142)의 메타 정보(meta data)를 나타내는 메타 박스(1220)를 갖는다. 메타 박스(1220)에는 비디오 데이터(142)에 대한 사용 기록 정보 또는 비디오 데이터(142)의 내용에 대한 요약 정보인 계층적 요약 정보를 포함한다. 여기서, 사용 기록 정보란, 예를 들어, 클라이언트가 이동 중에 영화를 보는 경우 지속적인 시청이 어려우므로, 추후에 다시 보기 위해 이전에 시청을 마친 부분을 기록해 놓은 정보를 의미한다. 그리고, 계층적 요약 정보란, 예를 들어, 비디오 데이터의 내용을 각 시간 구간 별로 구분하고, 이를 계층적으로 정리한 정보를 말한다. 한편, 사용 기록 정보 또는 계층적 요약 정보는 메타 박스(1220) 내의 엑스엠엘(XML;extensible markup language) 박스(1222)에 저장될 수 있다. 또한, 사용 기록 정보 또는 계층적 요약 정보는 MPEG-7 MDS(multimedia description scheme)에 의해 기술될 수도 있다. In addition, according to the present invention, video track 122 has a meta box 1220 that represents meta data of video data 142. The meta box 1220 includes hierarchical summary information that is usage history information about the video data 142 or summary information about the contents of the video data 142. Here, the usage record information refers to information that records a portion previously watched for later viewing because it is difficult to continuously watch when a client watches a movie while moving. The hierarchical summary information, for example, refers to information obtained by dividing the contents of video data for each time interval and organizing them hierarchically. Meanwhile, the usage history information or the hierarchical summary information may be stored in an extensible markup language (XML) box 1222 in the meta box 1220. In addition, the usage record information or the hierarchical summary information may be described by the MPEG-7 multimedia description scheme (MDS).

도 2는 본 발명에 의한 미디어 파일 포맷의 다른 실시예를 설명하기 위한 도면으로서, 파일 식별 영역(200), 메타 영역(220), 정보 영역(240) 및 미디어 데이터 영역(260)으로 구성된다. 도 2에 도시된 파일 식별 영역(200) 정보 영역(240) 및 미디어 데이터 영역(260)은 도 1에 도시된 파일 식별 영역(100), 정보 영역(120) 및 미디어 데이터 영역(140)의 일 실시예에 각각 해당한다. FIG. 2 is a diagram for explaining another embodiment of a media file format according to the present invention, and includes a file identification area 200, a meta area 220, an information area 240, and a media data area 260. The file identification area 200 information area 240 and the media data area 260 shown in FIG. 2 are one of the file identification area 100, the information area 120, and the media data area 140 shown in FIG. 1. It corresponds to an Example, respectively.

도 2에 도시된 메타 영역(220)은 제1영역(222) 및 제2영역(224)로 구성된다. 제1영역(222)은 미디어 데이터 영역(260)에 저장된 각종 미디어 데이터(262,264,266,268)의 목록(list)을 기술하며, 제2영역(224)은 각종 미디어 데이터(262,264,266,268)의 위치 정보를 기술한다. 또한, 제1영역은 MPEG-21 디지털아이템선언(Digital Item Declaration;DID)에 의해 기술될 수도 있으며, 제2영역은 아이템 로케이션/인포메이션(item location/information;iloc/iinf) 박스로 이루어질 수도 있다. 여기서, 디지털 아이템(Digital Item;DI)이란, MPEG-21 멀티미디어 프레임워크 내에서 표준화된 표현, 식별, 그리고 메타데이터를 지니는 구조화된 객체(object)이다. 이는 효과적인 멀티미디어 제공 서비스를 위해 클라이언트로 하여금 콘텐츠에 대한 탐색을 가능하게 하고, 콘텐츠의 이용에 관련된 정보 전달을 위한 메타데이터를 제공한다.The meta region 220 illustrated in FIG. 2 includes a first region 222 and a second region 224. The first region 222 describes a list of various media data 262, 264, 266, 268 stored in the media data region 260, and the second region 224 describes position information of various media data 262, 264, 266, 268. In addition, the first region may be described by MPEG-21 Digital Item Declaration (DID), and the second region may consist of an item location / information (iloc / iinf) box. Herein, a digital item (DI) is a structured object having a standardized representation, identification, and metadata in the MPEG-21 multimedia framework. This enables the client to search for content for effective multimedia providing service, and provides metadata for delivering information related to the use of the content.

미디어 데이터 영역(260)은 그랙픽 데이터(262), 적어도 두 개의 비디오 데이터(264), 적어도 두 개의 오디오 데이터(266) 및 적어도 두 개의 텍스트 데이터(268)로 구성된다. 그래픽 데이터 영역(262)은 메뉴 스크린에 대한 데이터를 저장한다. 예를 들어, DVD와 같은 영화 타이틀을 시청하는 경우에 자막, 더빙의 언어를 메뉴 스크린을 이용하여 설정할 수 있다. 여기서, 그래픽 데이터로는 LASeR(Lightweight Application Scene Representaion) 또는 계층적 벡터 그래픽(Scalable Vector Graphics;SVG)으로 표현될 수 있다. 또한, 적어도 두 개의 비디오 데이터(264)는, 예를 들어, DVD와 같은 영화 타이틀에서 영화뿐만 아니라 추가적인 제작 과정이나 영화의 뒷이야기 등과 같이 여러 가지 클립들을 제공하는 역 할을 한다.The media data area 260 consists of graphical data 262, at least two video data 264, at least two audio data 266, and at least two text data 268. Graphical data area 262 stores data for menu screens. For example, when watching a movie title such as a DVD, subtitles and dubbing languages can be set using a menu screen. Here, the graphic data may be represented as a Lightweight Application Scene Representation (LASeR) or a Scalable Vector Graphics (SVG). In addition, the at least two video data 264 serves to provide various clips, for example, in a movie title such as a DVD, as well as an additional production process or a story behind the movie.

정보 영역(240)은 미디어 데이터 영역(260)의 데이터 별로 그래픽 트랙(242), 적어도 두 개의 비디오 트랙(244), 적어도 두 개의 오디오 트랙(246) 및 적어도 두 개의 텍스트 트랙(248)으로 구성된다. 그래픽 트랙(242)은 메뉴 스크린의 용도로 사용되는 그래픽 데이터에 대한 미디어 속성 정보를 기술한다.The information area 240 is composed of a graphic track 242, at least two video tracks 244, at least two audio tracks 246, and at least two text tracks 248 for each data of the media data area 260. . Graphic track 242 describes the media attribute information for the graphic data used for the purpose of the menu screen.

비디오 트랙(244)은 비디오 데이터(264)의 메타 정보(meta data)를 나타내는 메타 박스(2220,…,2220')를 갖는다. 메타 박스(2220,…,2220')에는 비디오 데이터(264)에 대한 사용 기록 정보 또는 비디오 데이터(264)의 내용에 대한 요약 정보인 계층적 요약 정보를 포함한다.The video track 244 has meta boxes 2220,..., 2220 ′ that represent meta data of the video data 264. The meta boxes 2220,..., 2220 'include hierarchical summary information that is usage record information for the video data 264 or summary information for the contents of the video data 264.

이하, 본 발명에서 사용되는 사용 기록 정보 및 계층적 요약 정보에 대한 이해를 돕기 위해 첨부한 도면들을 참조하여 다음과 같이 설명한다.Hereinafter, with reference to the accompanying drawings to help understand the usage record information and the hierarchical summary information used in the present invention will be described as follows.

도 3은 본 발명에서 사용하는 사용 기록 정보를 설명하기 위한 도면이다. 클라이언트(34)의 조작에 의해 재생 장치(32)는 미디어 파일(30)로부터 목적 미디어 데이터를 재생하게 된다. 여기서, 목적 미디어 데이터란 클라이언트가 시청하기를 원하는 비디오 데이터, 오디오 데이터 또는 텍스트 데이터를 의미한다. 만일, 클라이언트(32)가 이전에 시청을 하다가 중단된 컨텐츠에 대해 계속해서 시청을 하고자 하는 경우에는, 재생 장치(32)는 이전에 중단된 부분이 저장(save)된 사용 기록 정보(36)를 로드(load)하고, 로드된 사용 기록 정보(36)를 이용하여 이전에 중단된 부분 이후부터 재생하게 된다. 여기서, 사용 기록 정보(36)는 MPEG-7 MDS(Multimedia Description Scheme)의 사용자 기록 기술 스킴(UsageHistory Description Scheme;UsageHistory DS)이 사용될 수 있으며, 사용자 기록 기술 스킴은 멀티미디어 콘텐츠를 소비하는 동한 수행된 클라이언트의 동작에 대해 기술하는 도구이다.3 is a diagram for explaining usage record information used in the present invention. By the operation of the client 34, the playback device 32 plays back the target media data from the media file 30. Here, the destination media data means video data, audio data, or text data that the client wants to watch. If the client 32 wants to continue watching the previously interrupted content, the playback device 32 stores the usage record information 36 in which the previously interrupted portion is saved. It loads and reproduces from the part which stopped previously using the loaded usage record information 36. FIG. Here, the usage history information 36 may be a user history description scheme (UsageHistory DS) of the MPEG-7 MDS (Multimedia Description Scheme), the user history description scheme is a client performed while consuming multimedia content It is a tool to describe the operation of.

도 4는 본 발명에서 사용하는 계층적 요약 정보를 설명하기 위한 도면이다. 계층적 요약 정보로는 계층적 요약 기술 스킴(HierarchicalSummary Description Scheme;HierarchicalSummary DS)가 사용될 수 있으며, 계층적 요약 기술 스킴은 여러 계층으로 비디오 콘텐츠를 요약하기 위해 사용되는 도구이다. 예를 들어, 비디오 데이터(Video Data)에서 시간 구간 상의 구간을 나타내는 세그먼트(segment)들은 요약세그먼트(SummarySegment)(412,414,416,422,424,432,434)에 의해 기술되고, 각 요약세그먼트(SummarySegment) 들은 요약세그먼트그룹(SummarySegmentGroup) (410,420,430)으로 그룹화할 수 있고, 요약세그먼트그룹은 다시 계층적 요약 기술자(HierarchicalSummary Descriptor)(40)로 다시 그룹화할 수 있다. 이런, 계층적 요약 정보를 사용함으로써, 고속 진행이나 되돌리기 등을 사용해서 전체 콘텐츠를 보면서 탐색할 필요 없이 클라이언트가 원하는 정보만 취할 수 있다.4 is a diagram for describing hierarchical summary information used in the present invention. Hierarchical Summary Description Scheme (Hierarchical Summary Scheme) may be used as the hierarchical summary information. The hierarchical summary description scheme is a tool used to summarize video content in multiple layers. For example, segments representing segments on a time interval in video data are described by summary segments 412, 414, 416, 422, 424, 432, 434, and each summary segment is summarized by a summary segment group 410, 420, 430. ), And the summary segment group can be grouped again into a hierarchical summary descriptor (40). By using this hierarchical summary information, the client can take only the information the client wants without having to navigate and browse the entire content using fast forward or reverse.

이하, 전술한 미디어 파일 포맷을 이용하는 본 발명에 의한 미디어 재생 방법의 실시예 및 이 방법을 수행하는 장치의 실시예의 구성 및 동작을 첨부한 도면들을 참조하여 다음과 같이 설명한다.Hereinafter, a configuration and an operation of an embodiment of a media playback method according to the present invention using the aforementioned media file format and an embodiment of an apparatus for performing the method will be described with reference to the accompanying drawings.

도 5는 본 발명에 의한 미디어 재생 방법의 일 실시예를 설명하기 위한 플로우차트로서, 목적 트랙을 찾는 단계(S51)와, 목적 미디어 데이터를 찾는 단계(S52)와, 메타 정보를 찾는 단계(S53) 및 장면을 생성하는 단계(S54)로 이루어진다. 도 6은 본 발명에 의한 미디어 재생 장치(600)의 일 실시예를 설명하기 위한 블럭도로서, 트랙 서치부(610), 미디어 데이터 서치부(620), 메타 정보 서치부(630) 및 장면 생성부(640)로 구성된다. 본 발명에 의하면, 트랙 서치부(610)는 미디어 파일에서 목적 트랙을 찾는다(S51). 여기서, 미디어 파일은 도 1 또는 도 2에 도시된 미디어 파일 포맷을 갖는다. 또한, 목적 트랙은 클라이언트가 시청하기를 원하는 미디어 데이터에 해당하는 트랙을 의미한다.FIG. 5 is a flowchart for explaining an embodiment of a media playback method according to the present invention, which includes searching for a target track (S51), searching for target media data (S52), and searching for meta information (S53). And creating a scene (S54). 6 is a block diagram illustrating an embodiment of a media playback apparatus 600 according to the present invention. The track search unit 610, the media data search unit 620, the meta information search unit 630, and the scene generation are described. The unit 640 is configured. According to the present invention, the track search unit 610 finds the target track in the media file (S51). Here, the media file has a media file format shown in FIG. 1 or 2. In addition, the destination track means a track corresponding to the media data that the client wants to watch.

미디어 데이터 서치부(620)는 목적 트랙에 대응하는 목적 미디어 데이터를 찾는다(S52). 목적 미디어 데이터에는 기본적으로 비디오 데이터가 포함되며, 더빙이나 자막이 필요한 경우에는 오디오 데이터나 텍스트 데이터도 포함될 수 있다.The media data search unit 620 finds the target media data corresponding to the target track (S52). The target media data basically includes video data, and may also include audio data or text data when dubbing or subtitles are required.

메타 정보 서치부(630)는 찾은 목적 미디어 데이터(S52) 중 비디오 데이터에 대한 메타 정보를 목적 트렉에서 찾는다(S53). 본 발명에 의하면, 메타 정보는 비디오 데이터에 대한 사용 기록 정보 또는 비디오 데이터의 내용에 대한 요약 정보인 계층적 요약 정보에 해당한다. 여기서, 메타 정보는 비디오 데이터에 해당하는 트랙에 포함된다. 즉, 메타 정보에 해당하는 사용 기록 정보 또는 계층적 요약 정보가 비디오 데이터에 대한 미디어 정보를 기술하는 비디오 트랙에 포함되어 있어서, 클라이언트는 비디오 트랙의 메타 정보를 검색하여 손쉽게 비디오 데이터를 재생할 수 있다.The meta information search unit 630 searches for meta information on video data among the found target media data S52 in the destination track (S53). According to the present invention, the meta information corresponds to hierarchical summary information which is usage record information on the video data or summary information on the content of the video data. Here, the meta information is included in a track corresponding to video data. That is, the usage record information or the hierarchical summary information corresponding to the meta information is included in the video track describing the media information about the video data, so that the client can easily retrieve the meta data of the video track and play the video data.

장면 생성부(640)는 찾은 메타 정보(S53)에 따라 찾은 목적 미디어 데이터(S52)를 이용하여 장면을 생성한다(S54). 예를 들어, 메타 정보가 사용 기록 정보인 경우, 사용 기록 정보에 의하여 클라이언트가 이전에 시청을 마친 부분 이후 부터 장면을 생성한다. 또한, 메타 정보가 계층적 요약 정보인 경우, 계층적 요약 정보에 의하여 클라이언트가 요구하는 내용의 비디오 데이터 장면을 생성한다.The scene generator 640 generates a scene using the found target media data S52 according to the found meta information S53 (S54). For example, when the meta information is the usage record information, the scene is generated after the portion where the client has finished watching previously according to the usage record information. In addition, when the meta information is hierarchical summary information, the video data scene of the content requested by the client is generated by the hierarchical summary information.

전술한 본 발명에 의한 미디어 재생 장치는 네트워크와 접속되어 파일을 입력할 수도 있고, 방송 신호를 파일 형식으로 입력받을 수도 있고, 저장 미디어로부터 파일을 입력받을 수도 있다.The above-described media player according to the present invention may be connected to a network to input a file, may receive a broadcast signal in a file format, or may receive a file from a storage medium.

컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장 장치 등이 있으며, 또한, 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 사용자 추적 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.Computer-readable recording media include all kinds of storage devices that store data that can be read by a computer system. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, and the like, and are also implemented in the form of a carrier wave (for example, transmission over the Internet). It includes being. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion. In addition, functional programs, codes, and code segments for implementing the user tracking method can be easily inferred by programmers in the art to which the present invention belongs.

이상, 전술한 본 발명의 바람직한 실시예는, 예시의 목적을 위해 개시된 것으로, 당업자라면 이하 첨부된 특허청구범위에 개시된 본 발명의 기술적 사상과 그 기술적 범위 내에서, 다양한 다른 실시예들을 개량, 변경, 대체 또는 부가 등이 가능할 것이다.As mentioned above, preferred embodiments of the present invention are disclosed for purposes of illustration, and those skilled in the art can improve and change various other embodiments within the spirit and technical scope of the present invention disclosed in the appended claims below. , Replacement or addition would be possible.

이상에서 설명한 바와 같이, 본 발명에 의한 미디어 파일 포맷과 이를 이용 하는 미디어 재생 방법 및 장치는, 비디오, 오디오, 텍스트 등의 다양한 미디어 데이터들을 저장할 수 있고, 미디어 데이터들을 이용하여 장면을 생성할 수 있으며, 특히, 비디오 데이터에 대한 메타 정보인 사용 기록 정보 또는 계층적 요약 정보를 이용함으로써 비디오 컨테츠에 대한 재생과 검색이 용이하여, 휴대 비디오 플레이어 등과 같은 이동시에 활용할 수 있는 디바이스 등에서 많은 효과를 제공한다.As described above, the media file format according to the present invention and a media playback method and apparatus using the same can store various media data such as video, audio, text, etc., and can generate scenes using the media data. In particular, by using the usage history information or the hierarchical summary information which is meta information about the video data, the video content can be easily played back and searched, thereby providing many effects in devices such as portable video players.

Claims (12)

비디오 데이터, 적어도 두 개의 오디오 데이터 및 적어도 두 개의 텍스트 데이터를 미디어 데이터로서 갖는 미디어 데이터 영역; 및A media data area having video data, at least two audio data and at least two text data as media data; And 상기 미디어 데이터 별로 트랙을 갖는 정보 영역을 포함하는 것을 특징으로 하는 미디어 파일 포맷.And an information area having a track for each of the media data. 제 1 항에 있어서, 상기 미디어 파일 포맷은 상기 미디어 데이터의 목록을 기술하는 제1영역과, 상기 미디어 데이터의 위치 정보를 기술하는 제2영역을 갖는 메타 영역을 더 포함하는 것을 특징으로 하는 미디어 파일 포맷.2. The media file of claim 1, wherein the media file format further comprises a meta area having a first area describing the list of the media data and a second area describing the location information of the media data. format. 제 2 항에 있어서, 상기 미디어 파일 포맷은The method of claim 2, wherein the media file format is 상기 미디어 데이터 영역의 비디오 데이터가 적어도 두 개인 것을 특징으로 하는 미디어 파일 포맷.And at least two video data of the media data area. 제 3 항에 있어서, 상기 미디어 데이터 영역은 그래픽 데이터를 상기 미디어 데이터로서 더 포함하며,The method of claim 3, wherein the media data area further includes graphic data as the media data, 상기 정보 영역은 상기 그래픽 데이터에 대응하는 트랙을 더 포함하는 것을 특징으로 하는 미디어 파일 포맷.The information area further comprises a track corresponding to the graphic data. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서, The method according to any one of claims 1 to 4, 상기 비디오 데이터에 해당하는 트랙은 상기 비디오 데이터의 메타 정보를 기술하는 메타 박스를 포함하는 것을 특징으로 하는 미디어 파일 포맷.And a track corresponding to the video data includes a meta box describing meta information of the video data. 제 5 항에 있어서, 상기 메타 박스에는The method of claim 5, wherein the meta box 사용 기록 정보 또는 계층적 요약 정보를 포함하는 것을 특징으로 하는 미디어 파일 포맷.A media file format comprising usage history information or hierarchical summary information. 비디오 데이터, 오디오 데이터 및 텍스트 데이터를 포함하는 미디어 파일을 이용하는 미디어 재생 방법에 있어서,In a media playback method using a media file containing video data, audio data and text data, 상기 미디어 파일에서 목적 트랙을 찾는 단계;Finding a destination track in the media file; 상기 목적 트랙에 대응하는 목적 미디어 데이터를 찾는 단계;Finding destination media data corresponding to the destination track; 상기 찾은 목적 미디어 데이터 중 상기 비디오 데이터에 대한 메타 정보를 상기 목적 트랙에서 찾는 단계; 및Finding meta information about the video data among the found destination media data in the destination track; And 상기 찾은 메타 정보에 따라 상기 찾은 목적 미디어 데이터를 이용하여 장면을 생성하는 단계를 포함하는 것을 특징으로 하는 미디어 재생 방법.And generating a scene by using the found target media data according to the found meta information. 제 7 항에 있어서, 상기 메타 정보는The method of claim 7, wherein the meta information is 사용 기록 정보 또는 계층적 요약 정보인 것을 특징으로 하는 미디어 재생 방법.And recording information or hierarchical summary information. 제 8 항에 있어서, 상기 미디어 재생 방법은The method of claim 8, wherein the media playback method is 상기 메타 정보를 상기 비디오 데이터에 해당하는 트랙에서 찾는 것을 특징으로 하는 미디어 재생 방법.And the meta information is found in a track corresponding to the video data. 비디오 데이터, 오디오 데이터 및 텍스트 데이터를 포함하는 미디어 파일을 이용하는 미디어 재생 장치에 있어서,A media playback apparatus using a media file containing video data, audio data and text data, 상기 미디어 파일에서 상기 목적 트랙을 찾는 트랙 서치부;A track search unit for finding the destination track in the media file; 상기 목적 트랙에 대응하는 목적 미디어 데이터를 찾는 미디어 데이터 서치부;A media data search unit for searching destination media data corresponding to the destination track; 상기 찾은 미디어 데이터 중 상기 비디오 데이터에 대한 메타 정보를 상기 목적 트랙에서 찾는 메타 정보 서치부; 및A meta information search unit searching for meta information of the video data among the found media data in the destination track; And 상기 찾은 메타 정보에 따라 상기 찾은 목적 미디어 데이터를 이용하여 장면을 생성하는 장면 생성부를 포함하는 것을 특징으로 하는 미디어 재생 장치.And a scene generator for generating a scene using the found target media data according to the found meta information. 제 10 항에 있어서, 상기 메타 정보는The method of claim 10, wherein the meta information is 사용 기록 정보 또는 계층적 요약 정보인 것을 특징으로 하는 미디어 재생 장치.And recording history information or hierarchical summary information. 제 11 항에 있어서, 상기 메타 정보 서치부는The method of claim 11, wherein the meta information search unit 상기 메타 정보를 상기 비디오 데이터에 해당하는 트랙에서 찾는 것을 특징으로 하는 미디어 재생 장치.And the meta information is found in a track corresponding to the video data.
KR1020060066512A 2006-03-30 2006-07-14 Media file format, and method and apparatus for reproducing media using the same KR101243965B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US78717306P 2006-03-30 2006-03-30
US60/787,173 2006-03-30

Publications (2)

Publication Number Publication Date
KR20070098396A true KR20070098396A (en) 2007-10-05
KR101243965B1 KR101243965B1 (en) 2013-03-25

Family

ID=38804463

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060066512A KR101243965B1 (en) 2006-03-30 2006-07-14 Media file format, and method and apparatus for reproducing media using the same

Country Status (1)

Country Link
KR (1) KR101243965B1 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4236630B2 (en) 2004-11-30 2009-03-11 三洋電機株式会社 Content data recording medium
KR20050092688A (en) * 2005-08-31 2005-09-22 한국정보통신대학교 산학협력단 Integrated multimedia file format structure, its based multimedia service offer system and method
KR100686521B1 (en) * 2005-09-23 2007-02-26 한국정보통신대학교 산학협력단 Method and apparatus for encoding and decoding of a video multimedia application format including both video and metadata

Also Published As

Publication number Publication date
KR101243965B1 (en) 2013-03-25

Similar Documents

Publication Publication Date Title
JP5048488B2 (en) Recording medium including metadata, reproducing apparatus and method thereof
CN101777371B (en) Apparatus for reproducing AV data on information storage medium
JP4955567B2 (en) Recording medium on which video data including metadata is recorded, reproducing apparatus thereof, and search method using metadata
KR100607969B1 (en) Method and apparatus for playing multimedia play list and storing media therefor
Pea et al. Video workflow in the learning sciences: Prospects of emerging technologies for augmenting work practices
JP2008508659A5 (en)
CN103181164A (en) Method for content presentation during trick mode operations
KR101369747B1 (en) Information recording medium, appratus and method for reproducing video contents
CN101073119B (en) Apparatus and method for reproduction
KR20040107604A (en) Method for efficiently managing multimedia contents and recording medium therefor
KR20050041797A (en) Storage medium including meta data for enhanced search and subtitle data and display playback device thereof
KR100982517B1 (en) Storage medium recording audio-visual data with event information and reproducing apparatus thereof
KR101243965B1 (en) Media file format, and method and apparatus for reproducing media using the same
KR101049634B1 (en) Apparatus and method for playing multi-format content
CN101015012B (en) Apparatus for reproducing AV data
US8068720B2 (en) Recording device and method, reproduction device and method, and recording medium
JP2004171053A (en) Data processor
Gibbon et al. Video Data Sources and Applications
KR20120097693A (en) Method and apparatus for generating and playing contents, and recorded medium for storing the contents

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160224

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170214

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190214

Year of fee payment: 7