CN101536101B - 编码方法和装置以及解码方法和装置 - Google Patents
编码方法和装置以及解码方法和装置 Download PDFInfo
- Publication number
- CN101536101B CN101536101B CN2007800389499A CN200780038949A CN101536101B CN 101536101 B CN101536101 B CN 101536101B CN 2007800389499 A CN2007800389499 A CN 2007800389499A CN 200780038949 A CN200780038949 A CN 200780038949A CN 101536101 B CN101536101 B CN 101536101B
- Authority
- CN
- China
- Prior art keywords
- data
- district
- menu
- media
- description
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44204—Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44213—Monitoring of end-user related data
- H04N21/44222—Analytics of user selections, e.g. selection of programs or purchase activity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/482—End-user interface for program selection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8456—Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/85406—Content authoring involving a specific file format, e.g. MP4 format
Abstract
所公开的实施例涉及多媒体数据编码/解码方法和装置。在某些方面,解码方法包括:接收多媒体数据,该多媒体数据包括:包含视频数据区和音频数据区的媒体区、包含分别对应于视频数据区和音频数据区的视频轨道区和音频轨道区的媒体信息区、以及包含用于显示在用户和媒体区中的媒体数据之间提供界面的菜单的描述数据的菜单描述区;从多媒体数据提取描述数据,该描述数据是利用场景表示格式描述的;通过从描述数据提取可缩放向量图形格式数据来解码所提取的描述数据;利用经解码的描述数据来渲染菜单;以及基于菜单解码从媒体区提取的媒体数据,其中媒体区、媒体信息区和菜单描述区被合并成单个文件。所公开的实施例包括能够构造包括多个视频/音频内容和针对在用户和媒体数据之间的界面的描述数据的多个媒体数据文件的多媒体数据编码/解码方法和装置。因此,可减少用于处理和发射多媒体数据的时间。
Description
技术领域
本发明涉及用于编码包括视频数据和音频数据的多媒体数据的方法和装置以及用于解码包括视频数据和音频数据的多媒体数据的方法和装置,尤其涉及可使用户能够利用便携媒体播放器有效地管理和播放包括多个视频内容的多个媒体内容的编码方法和装置以及解码方法和装置。
背景技术
包括诸如视频、音频和文本数据的各种类型的媒体数据的多媒体数据一般很大。因此,一般需要很长时间编码/解码和发送多媒体数据。此外,一般很难集成和管理相当大数量的媒体内容。
发明内容
技术问题
本发明提供一种多媒体数据结构,其可使包括视频内容的多个媒体内容能被有效管理和编码/解码,且还提供一种利用多媒体数据结构编码多媒体数据的方法和装置以及一种利用多媒体数据结构解码多媒体数据的方法和装置。
技术方案
根据本发明的一个方面,提供一种解码方法。该解码方法包括:接收多媒体数据,该多媒体数据包括:包含视频数据区和音频数据区的媒体区、包含分别对应于视频数据区和音频数据区的视频轨道区和音频轨道区的媒体信息区、以及包含用于显示在用户和媒体区中的媒体数据之间提供界面的菜单的描述数据的菜单描述区;从多媒体数据提取描述数据,该描述数据是利用场景表示格式描述的;通过从描述数据提取可缩放向量图形格式数据解码所提取的描述数据;利用经解码的描述数据来渲染菜单;以及基于菜单解码从媒体区提取的媒体数据,其中媒体区、媒体信息区和菜单描述区被合并成单个文件。
根据本发明的另一个方面,提供一种编码方法。该编码方法包括:生成包括关于文件格式的信息的文件类型区;生成包括视频数据区和音频数据区的媒体区;生成包括视频轨道区和音频轨道区的媒体信息区,视频轨道区包括关于视频数据区中所包括的视频数据的信息而音频轨道区包括关于音频数据区中所包括的音频数据的信息;以及生成包括菜单描述区的文件信息区,该菜单描述区包括用于显示菜单的描述数据,其中菜单在用户和媒体区中的媒体数据之间提供界面,描述数据是利用场景表示格式描述的,且文件类型区、文件信息区、媒体信息区和媒体区被合并成单个文件。
根据本发明的又一个方面,提供一种解码装置。该解码装置包括:数据输入单元,其接收多媒体数据,该多媒体数据包括:包含视频数据区和音频数据区的媒体区、包含分别对应于视频数据区和音频数据区的视频轨道区和音频轨道区的媒体信息区、以及包含用于显示菜单的描述数据的菜单描述区;第一解码器,其包括从多媒体数据提取描述数据的解析器、通过从描述数据提取可缩放向量图形格式数据解码所提取的描述数据的描述解码器、以及利用经解码的描述数据来渲染菜单的渲染单元,该菜单在用户和所述媒体区中的媒体数据之间提供界面;以及第二解码器,其基于菜单解码所提取的媒体数据,其中描述数据是利用场景表示格式描述的,且媒体区、媒体信息区和菜单描述区被合并成单个文件。
根据本发明的再一个方面,提供一种编码装置。该编码装置包括:多媒体轨道生成器,其生成视频轨道区和音频轨道区,视频轨道区包括关于视频数据的信息且音频轨道区包括关于音频数据的信息;描述区生成器,其生成菜单描述区,该菜单描述区包括用于显示在用户和媒体数据之间提供界面的菜单的描述数据,描述数据是利用场景表示格式描述的;以及文件结构生成器,其将视频和音频轨道区以及菜单描述区合并成单个文件。
有益效果
所公开的实施例包括能够构造包括多个视频/音频内容和对用户和媒体数据之间的界面的描述数据的多个媒体数据文件的多媒体数据编码/解码方法和装置。因此,可减少用于处理和发射多媒体数据所花的时间。
附图简述
通过参考附图详细描述本发明的优选实施例,本发明的以上及其它特征和优点将变得显而易见,附图中:
图1示出根据本发明实施例的多媒体数据文件的格式;
图2示出根据本发明实施例的提供用户界面的菜单;
图3和4示出根据本发明的其它实施例的多媒体数据文件的格式;
图5示出根据本发明实施例的片段元数据中存在的章节信息的格式;
图6示出根据本发明实施例的片段元数据中存在的概要信息的格式;
图7示出根据本发明另一个实施例的多媒体数据文件的格式;
图8示出根据本发明实施例的用于编码多媒体数据的装置的框图;
图9示出根据本发明实施例的用于解码多媒体数据的装置的框图;
图10示出根据本发明另一个实施例的用于解码多媒体数据的装置的框图;
图11示出根据本发明另一个实施例的用于解码多媒体数据的装置的框图;
图12示出根据本发明实施例的解码多媒体数据的方法的流程图;以及
图13示出根据本发明另一个实施例的解码多媒体数据的方法的流程图。
本发明的最佳实施方式
下面将参考示出本发明的示例性实施例的附图详细描述本发明。
图1示出根据本发明实施例的多媒体数据格式。参照图1,多媒体数据文件可包括文件类型区、文件信息区、媒体信息区和媒体区。
文件类型区表示诸如多媒体数据文件的类型和版本的多媒体数据文件的格式。例如,如果多媒体数据文件的类型是“mp42”,则文件类型区可指示多媒体数据文件具有MPEG4版本-2格式。
媒体区可包括诸如视频数据区和音频数据区之类的多个子媒体数据区。每个子媒体数据区包括媒体数据。
媒体区还可包括具有文本数据的文本数据区或具有图像数据的图像数据区。视频数据区可存储包括多个视频内容的视频数据,且音频数据区可存储包括多个音频内容的音频数据。
媒体信息区可包括分别与媒体区的子媒体数据区对应的多个轨道区(track area)。每个轨道区可包括关于相应子媒体数据区中存在的媒体数据的信息(例如,时间/空间信息)。
参照图1,媒体信息区可包括对应于视频数据区的视频轨道区和对应于音频数据区的音频轨道区。
视频轨道区可包括关于视频数据区中所包括的视频数据的时间/空间信息和关于该视频数据的元数据,诸如关于该视频数据的创建信息(例如,视频数据中所包括的视频内容的标题和视频内容的创建者)。
音频轨道区可包括关于音频数据区中所包括的音频数据的时间/空间信息和关于该音频数据的元数据,诸如关于该音频数据的创建信息(例如,音频内容的标题、制片人、歌手和表演者)。
视频轨道区和音频轨道区中所包括的时间/空间信息可以是媒体数据的播放扇区信息、位置信息或大小信息。
文件信息区可包括标识/位置信息区和菜单描述区。
标识/位置信息可包括媒体区中所包括的多个媒体数据中每一个的属性信息,例如,多个媒体数据中的每一个的标识信息和位置信息。
更具体地,标识/位置信息区可包括媒体区中所包括的多个媒体数据中的每一个的名称信息、内容类型信息、标识信息、位置信息和大小信息。
如果媒体数据包括一个视频内容和两个音频内容,则标识/位置信息区中所包括的信息可如下所示:
item_ID=1(视频1)
item_name=<至视频1的rel.uri>
content_type=视频
item_ID=2(音频1)
item_name=<至音频1的rel.uri>
content_type=音频
item_ID=3(音频2)
item_name=<至音频2的rel.uri>
content_type=音频
其中item_ID指媒体内容的标识符,item_name指媒体内容的名称,且content_type指媒体内容的类型。
标识/位置信息区可被分成第一区和第二区,并且将部分媒体数据属性信息存储在第一区中且将其余的媒体数据属性信息存储在第二区中。例如,标识/位置信息区的第一区可包括关于媒体内容的名称和类型的信息,且标识/位置信息区的第二区可包括关于媒体内容的位置和大小的信息。
文件信息区的处理器类型可被指定为“lsr1”。
参照图1,菜单描述区包括菜单描述数据,用于显示在用户和媒体数据之间提供界面的菜单。为了提供对于用户更有趣且更方便的界面,可将动画效果应用于菜单。
菜单显示媒体区中存在的多个媒体内容,并提供一个或多个输入工具以允许用户从媒体内容中选择要播放的媒体内容。用户可利用菜单标识并管理媒体区中包括的媒体内容。
可参考标识/位置信息区中所包括的信息将菜单描述区中包括的菜单描述数据和媒体区中所包括的媒体数据相连接。
图2示出菜单的示例。参照图2,菜单包括背景图像10和一个或多个输入工具20至23。
可将动画效果应用于背景图像10以便将运动可视化,从而引起用户的兴趣。例如,如果利用输入工具20至23之一进行用户输入,则可将动画效果应用于背景图像10,使得能够响应于用户输入修改背景图像10。
可用作背景图像10的图像数据可被存储在媒体区中。
用户可通过点击鼠标或键输入来选择输入工具20至23之一,并利用所选的输入工具管理媒体区中的多个媒体内容。
例如,用户可标识媒体区中的多个媒体内容的列表,并通过使用输入工具21——即‘内容列表’——选择媒体内容之一。然后,用户可通过使用输入工具20——即‘播放’——播放所选媒体内容。
此外,用户可标识通过对媒体区中的媒体内容进行分类获得的若干章节,并利用输入工具22——即‘章节’——来选择章节中的一个。此外,用户可通过输入工具23——即‘概要’——获取媒体区中的每个媒体内容的简要描述。
然而,输入工具20至23是示例性的,因此本发明不限于此。即,除本文所陈述的输入工具以外,菜单还可包括各种类型的输入工具,以便向用户提供能够在用户和多媒体内容之间有效连接的界面。
配置菜单所必需的文本数据可被包括在菜单描述区的菜单描述数据中,或者可存储在媒体区中。
菜单描述数据可包括关于作为菜单的可视元素的图形元素的图形信息、关于可视元素的空间布局的空间布局信息、以及关于将同菜单一起显示的媒体数据的时间布局的时间布局信息。关于媒体数据的时间布局的信息可包括媒体数据的同步信息、关于要应用到菜单的动画效果的动画效果信息、关于诸如发生在用户和菜单之间的点击鼠标或键输入之类的交互事件的交互事件信息。
菜单描述数据可利用LASeR(轻型应用场景表示)、可缩放向量图形(SVG)或场景二进制格式(BIFS)来创建。在这种情形中,菜单描述数据可具有可扩展标记语言(XML)格式或二进制编码格式。
利用LASeR创建的菜单描述数据的示例如下:
<lsru:NewScene>
<svg width=″400″height=″250″viewBox=″0 0 400 250″>
<!-主菜单-->
<g id=″title_page″visibility=″visible″>
<!-背景图像-->
<image id=″title_image″xlink:href=″#item_ID_of_image″
width=″400″height=″250″x=″0″y=″0″>
<!-菜单选项-->
<rect x=″10″y=″109″width=″100″height=″15″rx=″8″
fill=″rgb(255,150,70)″/>
<text id=″play_btn″x=″20″y=″120″font-family=″Verdana″
font-size=″12″fill=″white″>
play</text>
</g>
<!-视频回放-->
<g id=″video_playback″visibility=″hidden″>
<video
xlink:href=″#item_ID_of_video″begin=″play_btn.click″type=″video/mpeg″...>
<audio xlink:href=″#item_ID_of_audio″begin=″play_btn.click″
type=″audio/mpeg″...>
<a xlink:href=″#item_ID_of_text″begin=″play_btn.click″
type=″text/3gpp″...>
</g>
</svg>
</lsru:NewScene>.
利用LASeR创建的菜单描述数据可包括如以上示例所述的可缩放向量图形(SVG)格式数据。
菜单描述数据可包括用于描述图形信息、动画效果信息、空间布局信息、时间布局信息和交互事件信息的多个元素。
例如,菜单描述数据可包括用于同菜单一起显示的图形元素、文本数据和图像数据的元素、用于多媒体数据的元素和用于要应用到菜单的动画效果的元素。
菜单描述数据的元素由以下的表1指示。
表1
菜单描述数据中所包括的动画效果信息可包括:关于一组要被应用至菜单的动画效果的编组信息、要应用动画效果的媒体数据的大小信息、不透明效果信息和几何变换效果信息。大小信息可以是关于图像大小的变化的信息。不透明效果信息可以是关于淡入效果和淡出效果的信息。几何变换效果信息可以是关于诸如图像之间的转换、图像比例的变换、旋转和偏斜之类的效果的信息。
动画区可包括关于图像的运动路径或图像中物体的运动路径的运动路径信息、关于图像颜色的变化的颜色变化信息或图像的形状信息。图像的形状信息可指示图像是矩形、圆形、椭圆、多边形、线性还是多线性的。动画区还可包括针对可应用到媒体数据的各种动画效果改变媒体数据的属性所需的属性控制信息。
包括不透明效果信息、缩放转换信息和大小转换信息的动画效果信息的示例如下:
<lsru:NewScene>
<svg>
<g id=Article_Image″>
<animate attributeName=″opacity″calcmode=″linear″
values=″0.00:1.00:1.00:1.00:1.00:1.00:1.00:1.00″
dur=″8.0″repeatDur=″indefinite″/>
<animate Transform attributeName=″Transform″type=″scale″
additive=″sum″calcmode=″linear″
values=″0.001.00:1.001.00:1.001.00:1.001.00:0.501.00:0.00
1.00:1.001.00″
dur=″8.0″repeatDur=″indefinite″/>
<image width=″200″height=″15-″#sampleID=1>
</image>
</g>
</svg>
</lsru:NewScene>
其中符号′<′指开始,符号′>′指结束,符号′/′指所限定的上下文的结束。例如,<svg>和</svg>之间的上下文可被定义为一个组,上下文<gid=″Article_image″>和</g>可被定义为另一个组,且<image width=″200″height=″150″#sample=1>和</image>之间的上下文可被定义为又一组。参照<gid=″Article_image″>,参考符号g指组,且Article_image指组g的名称。动画属性或动画效果名称“opacity”和“transform”分别指不透明效果和几何变换效果。符号‘sum’指动画属性的数目的和。符号‘dur’指图像数据的播放持续时间。
如果将图像数据视为样本,则由具有标识符1的图像数据(#sampleID=1)实现的图像的宽度和高度分别是200和150。上述的动画效果涉及在8秒(dur=″8.0″)的时间内反复地(repeatDur=″indefinite″)将图像数据(#sampleID=1)的透明度从完全透明度水平(value=0.00)线性(calcMode=″linear″)改变为其原始透明度水平(value=1.00)。同样,上述的动画效果涉及在8秒(dur=″8.0″)的时间内反复地(repeatDur=″indefinite″)将图像数据(#sampleID=1)的比例从其原始尺寸(value=1.00)线性(calcMode=″linear″)变换(″transform″,″scale″)为其原始尺寸的一半(value=y;x=1.00;0.50)。上述的动画效果的特征在于同时(additive=″sum″)执行图像数据(#sampleID=1)的透明度的变化和图像数据(#sampleID=1)的比例的变换。
包括一个或多个样本的图像数据可被分成若干块,且每个块的多个样本可按时间顺序排列。块中的样本具有从1开始的其自身的标识号。在这点上,图像数据(#sampleID=1)可以是具有标识号1的样本,而不是图像数据。
参照图3,视频数据区和音频数据区可包括多个媒体内容,且视频轨道区和音频轨道区可包括分别对应于媒体内容的多个轨道区。
换言之,视频数据区可包括对应于N个视频内容的数据,例如,主要特征、“制作”剪辑、演员访谈或图像集。视频轨道区可包括分别对应于N个视频内容的N个子视频轨道区。
音频数据区可包括对应于M个音频内容的数据,且音频轨道区可包括分别对应于M个音频内容的M个子音频轨道区。
N个子视频轨道区和M个子音频轨道区中的每一个可包括关于媒体内容的时间/空间信息或元信息。
参照图4,媒体信息区可包括媒体元区或轨道元区,用于存储关于媒体区中存在的多个媒体内容的元数据。媒体元区可被包括在与音频轨道区和视频轨道区相同的水平上的媒体信息区中。轨道元区可分别包括在视频轨道区和音频轨道区中。
可被包括在媒体元区中或视频轨道区的或音频轨道区的轨道元区中的元数据可用于向用户提供关于媒体内容的附加信息。
元数据可利用可扩展标记语言(XML)格式进行描述。
元数据可包括关于媒体内容的创建信息或章节/概要信息或关于用户访问媒体内容的的使用历史信息。
创建信息可包括标题、制片人、和媒体内容的剪辑描述、用户对媒体内容的评论、和指示媒体内容包括在媒体数据文件中的日期和时间的文件日期/时间信息。创建信息还可包括关于媒体内容的创建的各种信息和关于媒体内容的各种属性信息,诸如关于视频内容的演员表的信息、视频内容的出品日期、音频内容的歌手和音频内容的表演者。
可将创建信息包括在媒体元区,或者可将其包括在音频轨道区的或音频轨道区的轨道元区中。例如,关于视频数据区中所包括的所有多个视频内容的一般信息可被包括在媒体元区中,且关于各个视频内容的详细信息可被包括在视频轨道区中。
更具体地,包括在多媒体数据文件中的电影的标题或关于该电影的制片人的信息可被包括在媒体数据区中,且包括在电影中的多个视频内容的每一个的标题或关于每一个视频内容的制片人的信息可被包括在视频轨道区中。
同样,关于视频数据区中所包括的多个视频内容的创建信息可被包括在媒体元区或音频轨道区的轨道元区中。
包括在媒体区中的媒体数据可被分层地分类。关于包括在媒体区中的媒体数据的元数据可包括用于搜索媒体区中所包括的媒体数据的片段的片段元数据。片段元数据包括关于一个或多个片段组的信息,媒体信息被归类至该片段组。
包括在媒体区中的媒体数据可被分层地分类,且片段元数据包括关于媒体内容的分层分类的章节的信息。
用户可容易利用片段元数据搜索包括在媒体区中的媒体数据。为此,可连同上述菜单一起显示分层编组信息。
片段元数据可被包括在媒体元区中,且片段元数据的分层编组信息可被包括在相对应的媒体轨道区的轨道元区中。
视频数据区中所包括的多个视频内容可被分成多个章节,且片段元数据可包括关于每个章节的章节信息。例如,片段元数据可包括每个章节的概要信息,关于分类至每个章节的若干场景的信息以及关于每个章节的代表性场景或图像的信息。
图5示出包括在片段元数据中的章节信息的格式。参照图5,视频内容可包括分别对应于L个场景的L个片段,且可将L个片段分类成L个分段组。例如,可将L个场景编组成K个章节。
片段元数据可包括章节的数目(即K),视频内容的索引、视频内容在视频数据中的位置、K个段组中的每一个的概要、K个片段组中的每一个中所包括的一个或多个片段的索引、以及L个片段中的每一个的概要。
用户可基于章节信息容易地确定视频内容的主题,并可容易地搜索并播放感兴趣的视频内容。
L个片段在图5中被示为分成一层片段组。然而,L个片段可被分成两层片段组。换言之,K个片段组中的两个或多个可被重组成J个片段组。在这种情形中,关于K个片段组的重组的信息可包括在片段元数据中。
包括在视频数据区中的多个视频内容可根据其题目分成一个或多个组。在这种情形中,片段元数据可包括关于组的信息,例如,关于组的题目的概要信息。
图6示出包括在片段元数据中的概要信息的格式。在该实施例中,视频数据区中的视频数据可被分成具有不同题目的七个片段。
参照图6,七个片段的题目可以是‘科学’、‘英语’、‘数学’、‘芭蕾舞’、‘歌剧’、‘棒球’和‘足球’。因此,七个片段可被分成三个片段组‘教育’、‘艺术’和‘体育’。
在这种情形中,片段元数据可包括片段组的数目(即,3)、7个片段的索引和7个片段的题目。
同样,包括在视频内容中的多个图像片段可被分成一个或多个图像片段组。在这种情形中,片段元数据可包括每个图像组的概要。
用户可基于片段元数据容易地确定视频内容的主题,并可容易地搜索并播放具有感兴趣的题目的视频内容。
视频数据的多个片段在图6中被示为分成一层片段组。然而,片段可被分成两层片段组。例如,图5所示的片段组可重组成一个或多个片段组,且关于三个片段组的信息可被包括在片段元数据中。
元数据还可包括使用关于用户对包括在媒体区中的多个媒体内容作出的动作的使用历史信息。例如,使用历史信息可以是关于在预定的时间段中用户访问媒体内容的陈述。
使用历史信息可包括关于用户访问媒体内容的各种信息,诸如已经由用户观看的视频内容的标识信息、有关视频内容播放的中断点(如果有的话)的信息、关于用户开始和结束观看视频内容的时间的信息或关于用户观看视频内容的次数的信息。
如果包括多个媒体内容的多媒体文件由一个以上的用户使用,则可针对每个用户生成使用历史信息。为了针对每一个用户管理使用历史信息,可将用户历史信息包括在另外的元数据文件中,而不是多媒体数据文件中。
用户可利用使用历史信息容易地获取关于用户访问多媒体数据文件的多个媒体内容的信息。更具体地,如果包括在视频数据区中的视频内容的播放被中断,则用户可从视频内容的播放的中断点继续播放视频内容。
图7示出根据本发明实施例的多媒体数据文件的格式。参照图7,媒体区可包括视频数据区和音频数据区。媒体区还可包括文本数据区和/或图像数据区。如果媒体区包括文本数据区,则媒体信息区可包括对应于文本数据区的文本轨道区。
包括在文本数据区中的文本数据可以是文本串或歌词。
可通过根据包括在文本轨道区中的定时信息再现包括在文本数据区中的文本串来获取定时文本。文本轨道区可包括文本数据区中所包括的文本串的解码时间信息、位置信息和大小信息。
可利用定时文本使包括在视频数据区中的视频内容与多个文本串同步地再现。定时文本可用于实时地提供子标题,用于为不具有音频设备或具有听力问题的人提供字幕,用于提供自动伴奏服务,或用于滚动新闻项或讲词提示器应用。
为了再现定时文本,多媒体文件可包括字符集信息、字形信息、字体信息、文本颜色信息、闭路字幕信息、动态突出显示信息、文本渲染位置信息和文本组成信息。
统一代码3.0可用于表示各种语言和字形。UTF-8和UTF-16可被解码成所需的字符。用于装饰输入串的字体可通过其名称、大小和类型来指定。字体类型可包括粗体、斜体和粗体-斜体。文本和背景图像的颜色可由RGB值表示。
可在特定区域中渲染文本。外语练习材料的应用可使用imed文本信息来将文本覆盖在图像上。如自动伴奏应用中的文本可被突出显示用以强调。
文本数据区可包括多个文本样本,且文本样本中的每一个可包括文本串和文本修饰符。文本修饰符具有关于相对应文本串的类型信息、突出显示信息、限定的字符信息、动态突出显示信息和闪烁信息中的至少一个。
文本轨道区还可包括关于文本数据区中所包括的文本串的定时信息和样本描述。样本描述数据可具有关于文本串的字体信息、位置信息和背景信息。
例如,定时文本可具有与3GPP TS 26.245或MPEG-4部分-17中公开的文本格式相同的格式,且适用于实现以上的应用情况并支持以上的功能。
文件信息区还可包括定时文本效果的描述数据。可利用定时文本效果描述使包括在视频数据区中的视频内容与多个文本串同步再现。
定时文本效果描述可包括字符集信息、字形信息、字体信息、文本颜色信息、限定的字幕信息、动态突出显示信息、自动伴奏、文本渲染位置信息和文本组成信息。
动态突出显示可通过使用定时文本效果和上述的转换效果来实现。例如,具有两种不同颜色的文本串可在同一位置相互重叠地显示。当突出显示功能开始时,测试弹簧(test spring)中位于其它顶部的任一个可从左向右划出。为此,可将“barWipe”指定为类型,并将leftToRight指定为子类型。
文本数据区可包括多个文本数据,其各自具有多个文本样本。在这种情形中,媒体信息区可包括分别对应于多个文本数据的若干文本轨道区。每个文本轨道区可包括对应的文本数据的采样描述和定时信息。
包括在图像数据区中的图像数据可用作根据菜单描述数据显示的菜单的背景图像。如上所述,在菜单描述数据中指定的动画效果被应用到图像数据区中所包括的图像数据。
包括在视频数据区中的视频数据可以是利用诸如MPEG-4高级视频编码(AVC)、MPEG-2,H.263或MPEG-4部分2等各种视频编码方法获得的压缩数据。具体地,包括在视频数据中的视频数据可以是利用ITU-T H.264中指定的视频编码方法获得的压缩数据。
包括在音频数据区中的音频数据可以是利用诸如MP3或高级音频编码(AAC)等各种音频编码方法获得的压缩数据。具体地,包括在音频数据区中的音频数据可以是利用MPEG-4高效率高级音频编码(HE-AAC)获得的压缩数据。或者,包括在音频数据区中的音频数据可以是利用诸如比特片算法编码(BSAC)之类的可缩放音频编码方法获得的压缩数据。
包括在图像数据区中的图像数据可以是利用诸如联合图像专家组(JPEG)之类的编码方法获得的压缩数据。
图8示出根据本发明实施例的用于编码多媒体数据的装置(在下文中称为多媒体数据编码装置)的框图。多媒体数据编码装置可包括文件结构生成器100、多媒体轨道生成器110、描述区生成器120和元数据生成器130。
文件结构生成器100生成包括文件类型区、文件信息区、媒体信息区和媒体区的多媒体文件。
多媒体轨道生成器110在媒体区中生成多个数据区,并在媒体信息区中生成分别对应于数据区的多个轨道区。每个数据区包括多个媒体数据。例如,多媒体轨道生成器100可生成对应于视频数据区的视频轨道区、对应于音频数据区的音频轨道区、对应于文本数据区的文本轨道区或对应于图像数据区的图像轨道区。
描述区生成器120生成包括用于显示菜单的描述数据的菜单描述区。
元数据生成器130生成元数据并将元数据存储在文件信息区、轨道元区媒体元区中。同样,元数据生成器130可生成菜单描述数据并将菜单描述数据存储在菜单描述区中。
可以与本文阐述的顺序不同的顺序执行文件结构生成器100、多媒体轨道生成器110、描述区生成器120和元数据生成器130的操作。此外,文件结构生成器100、多媒体轨道生成器110、描述区生成器120和元数据生成器130的至少两个的操作可同时执行。
图9示出根据本发明实施例的用于解码多媒体数据的装置(在下文中称为多媒体数据解码装置)的框图。参照图9,多媒体数据解码装置可包括数据输入单元200、解析器210、第一解码器220和第二解码器230。在下文中将参考图12详细描述图9所示的多媒体数据解码装置的操作。
参照图9和12,数据输入单元200接收输入多媒体数据(500)。解析器210从输入多媒体数据提取菜单描述数据(510)。第二解码器230显示用于在用户和媒体数据之间提供界面的菜单(520)。
参照图11,显示用于在用户和媒体数据之间提供界面的菜单的第二解码器430可包括描述解码器431和渲染单元432。描述解码器431通过解码从输入多媒体数据提取的菜单描述数据来提取显示菜单所必需的信息,且渲染单元432基于由描述解码器431提取的信息显示菜单。
如以上示例所描述的,利用LASeR创建的菜单描述数据可包括可缩放向量图形(SVG)格式数据。
在这种情形中,描述解码器431从利用场景表示格式(例如利用LASeR)描述的描述数据提取可缩放向量图形(SVG)格式数据,可缩放向量图形(SVG)格式数据包括显示菜单所必需的信息。
因此,用户可利用渲染单元432所显示的菜单选择包括在输入多媒体数据中的多个媒体内容之一。例如,用户可利用渲染单元432显示的菜单从包括在视频数据区中的多个视频内容中选择期望的内容。
参照图9和12,解析器210提取与用户从输入多媒体数据的媒体区选择的媒体内容对应的媒体内容(530)。
第一解码器220解码所提取的媒体内容(540)。然后,第一解码器220显示由用户选择的媒体内容(550)。
参照图11,解码媒体数据的第一解码器420可包括视频解码器421、音频解码器422、文本解码器423和图像解码器424。视频解码器421、音频解码器422、文本解码器423和图像解码器424分别解码包括在输入多媒体数据的媒体区中的视频数据、音频数据、文本数据和图像数据。
图10示出根据本发明另一个实施例的多媒体数据解码装置的框图。参照图10,多媒体数据解码装置可包括数据输入单元300、第一解析器310、第一解码器320、第二解码器330和第二解析器340。在下文中将参考图13详细描述图10所示的多媒体数据解码装置的操作,更加集中在与图9所示的多媒体数据解码装置的操作的差别上。
参照图10和13,数据输入单元300确定输入多媒体数据是否包括关于用户对输入多媒体数据作出的多个动作的使用历史信息(600)。
如果输入多媒体数据包括使用历史信息,则第一解析器310从输入多媒体数据提取包括使用历史信息的元数据,且第二解码器330从第一解析器310提取的元数据提取使用历史信息。
第一解码器320利用使用历史信息执行解码操作使得视频数据的播放可从视频数据的播放的中断点继续(610)。在执行操作610之前,多媒体数据解码装置可允许用户确定是否从视频数据的播放的中断点继续视频数据的播放。
另一方面,如果输入多媒体数据没有使用历史信息,则确定多媒体数据解码装置是否能够处理利用LASeR创建的菜单描述数据(620)。
如果多媒体数据解码装置能够处理利用LASeR创建的菜单描述数据,则第二解码器330根据第一解析器310提取的菜单描述数据显示菜单(640),并且第一解码器320解码并由此显示用户所选的视频内容(650)。
如果多媒体数据解码装置不能够处理利用LASeR创建的菜单描述数据,则第一解码器320解码并由此显示包括在输入多媒体数据的视频数据区中的多个视频内容的第一视频内容(630)。
即使多媒体数据解码装置能够处理利用LASeR创建的菜单描述数据,如果输入多媒体数据没有菜单描述数据则也可执行操作630。
第一视频内容可以是在视频数据区中首先出现的视频内容或具有最高优先级的视频内容或包括主要特征的视频内容。包括在输入多媒体数据的视频数据区中的视频内容之间的优先级可由用户确定。
根据本发明的多媒体数据编码和解码装置可被包括在诸如数字音频广播(DAB)或数字多媒体广播(DMB)装置的多媒体广播发射/接收装置中,因此可用于编码/解码音频信号或语音信号。根据本发明的多媒体数据编码和解码装置可包括移动通信终端。具有上述格式中的任一种的多媒体数据可被包括在多媒体广播信号中。
可将本发明实现为写在计算机可读记录介质上的计算机可读代码。计算机可读记录介质可以是其中数据以计算机可读方式存储的任何类型的记录设备。计算机可读记录介质的例子包括ROM、RAM、CD-ROM、磁带、软盘、光数据存储器、载波(例如,通过因特网的数据传输)。可将计算机可读记录介质分布在连接至网络的多个计算机系统上,使得计算机可读代码能以分散的方式向其写入或从其执行。实现本发明所需的功能程序、代码和代码片段可由本领域的普通技术人员容易地解释。利用本发明获得的比特流可存储在计算机可读记录介质中或可通过无线或有线通信网络来发射。
根据本发明的多媒体数据解码装置可被包括在移动通信终端、诸如便携多媒体播放器(PMP)的多媒体播放器或诸如个人数字助理(PDA)之类的再现设备中。此外,根据本发明的多媒体数据解码装置可被实现为硬件设备或软件程序,因此可被包括在再现装置中。
工业实用性如上所述,本发明可应用于各种媒体数据再现设备中,诸如多媒体播放器或多媒体编码设备,且可减少处理和发射多媒体数据所花费的时间。
尽管已经参考本发明的示例性实施例具体示出并描述了本发明,但本领域的技术人员将理解可在不背离由以下权利要求所限定的本发明的精神和范围的情况下在形式和细节上进行各种改变。
Claims (22)
1.一种解码方法,包括:
接收多媒体数据,所述多媒体数据包括:包含视频数据区和音频数据区的媒体区、包含分别对应于所述视频数据区和所述音频数据区的视频轨道区和音频轨道区的媒体信息区、以及包含描述数据的菜单描述区,所述描述数据用于显示菜单,该菜单在用户和所述媒体区中的媒体数据之间提供界面;
从所述多媒体数据提取所述描述数据,所述描述数据是利用场景表示格式描述的;
通过从所述描述数据提取可缩放向量图形格式数据来解码所提取的描述数据;
利用所述经解码的描述数据来渲染菜单;以及
基于所述菜单解码从所述媒体区提取的媒体数据,
其中所述媒体区、所述媒体信息区和所述菜单描述区被合并成单个文件。
2.如权利要求1所述的解码方法,其特征在于,所述菜单在所述媒体区中的视频和音频数据与用户之间提供界面。
3.如权利要求1所述的解码方法,其特征在于,所述描述数据是利用可扩展标记语言(XML)格式或二进制编码格式中的至少一种描述的。
4.如权利要求1所述的解码方法,其特征在于,所述菜单表示对应于所述媒体区中的媒体数据的多个内容。
5.如权利要求4所述的解码方法,其特征在于,所述用户利用所述菜单从所述多个内容中选择一个或多个内容。
6.如权利要求1所述的解码方法,其特征在于,所述菜单包括对应于所述描述数据的具有动画效果的背景图像。
7.如权利要求6所述的解码方法,其特征在于,所述媒体区还包括包含图像数据的图像数据区,且所述背景图像通过将动画效果应用到所述图像数据生成。
8.如权利要求1所述的解码方法,其特征在于,所述描述数据包括关于要连同所述菜单一起显示的图形、要应用到所述菜单的动画效果、所述菜单的空间布局、和所述菜单的时间布局中的至少一个的信息。
9.如权利要求8所述的解码方法,其特征在于,所述描述数据还包括关于用户和菜单之间的交互事件的信息。
10.如权利要求8所述的解码方法,其特征在于,所述描述数据还包括要连同菜单一起显示的文本和要连同菜单一起播放的音频内容的信息中的至少一个。
11.如权利要求1所述的解码方法,其特征在于,文件类型区、包括所述菜单描述区的文件信息区、媒体信息区和媒体区被合并成单个文件,
其中所述文件类型区包括关于所述文件的格式的信息,所述文件信息区包括关于所述媒体区中包括的所述媒体数据的标识信息和位置信息。
12.如权利要求1所述的解码方法,其特征在于,所述媒体区还包括文本数据区和图像数据区,且所述媒体信息区还包括对应于所述文本数据区的文本轨道区。
13.如权利要求1所述的解码方法,其特征在于,所述多媒体数据被接收为广播信号。
14.如权利要求1所述的解码方法,其特征在于,所述多媒体数据被存储在数字介质中。
15.一种编码方法,包括:
生成包括关于文件格式的信息的文件类型区;
生成包括视频数据区和音频数据区的媒体区;
生成包括视频轨道区和音频轨道区的媒体信息区,所述视频轨道区包括关于所述视频数据区中所包括的视频数据的信息且所述音频轨道区包括关于所述音频数据区中所包括的音频数据的信息;以及
生成包括菜单描述区的文件信息区,所述菜单描述区包括用于显示菜单的描述数据,
其中所述菜单在用户和所述媒体区中的媒体数据之间提供界面,所述描述数据是利用场景表示格式描述的,且所述文件类型区、所述文件信息区、所述媒体信息区和所述媒体区被合并成单个文件。
16.如权利要求15所述的编码方法,其特征在于,所述菜单表示对应于所述媒体区中的媒体数据的多个内容。
17.如权利要求15所述的编码方法,其特征在于,所述菜单包括对应于所述描述数据的具有动画效果的背景图像。
18.如权利要求17所述的编码方法,其特征在于,所述媒体区还包括包含图像数据的图像数据区,且所述背景图像是通过将动画效果应用到所述图像数据生成的。
19.如权利要求15所述的编码方法,其特征在于,所述描述数据包括关于要连同所述菜单一起显示的图形图像、要应用到所述菜单的动画效果、所述菜单的空间布局、所述菜单的时间布局、以及所述用户和所述菜单之间的交互事件中的至少一个的信息。
20.一种解码装置,包括:
数据输入单元,其接收多媒体数据,所述多媒体数据包括:包含视频数据区和音频数据区的媒体区、包含分别对应于所述视频数据区和所述音频数据区的视频轨道区和音频轨道区的媒体信息区、以及包含用于显示菜单的描述数据的菜单描述区;
解析器,其从所述多媒体数据提取所述描述数据;
第一解码器,其解码从所述解析器提取的媒体内容;以及
第二解码器,其包括描述解码器和渲染单元,
其中,所述描述解码器通过解码从输入多媒体数据提取的所述描述数据来提取用于显示菜单的信息,且所述渲染单元基于由所述描述解码器提取的信息显示菜单;且
其中,所述描述数据是利用场景表示格式进行描述的,且所述媒体区、所述媒体信息区和所述菜单描述区被合并成单个文件。
21.如权利要求20所述的解码装置,其特征在于,所述菜单包括对应于所述描述数据的具有动画效果的背景图像。
22.一种编码装置,包括:
多媒体轨道生成器,其生成视频轨道区和音频轨道区,所述视频轨道区包括关于视频数据的信息且所述音频轨道区包括关于音频数据的信息;
描述区生成器,其生成菜单描述区,所述菜单描述区包括用于显示在用户和媒体数据之间提供界面的菜单的描述数据,所述描述数据是利用场景表示格式描述的;
文件结构生成器,其将所述视频和音频轨道区以及所述菜单描述区合并成单个文件;以及
元数据生成器,其生成元数据并将该元数据存储在文件信息区、轨道元区或媒体元区中。
Applications Claiming Priority (12)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US85269906P | 2006-10-19 | 2006-10-19 | |
US85269806P | 2006-10-19 | 2006-10-19 | |
US60/852,699 | 2006-10-19 | ||
US60/852698 | 2006-10-19 | ||
US60/852,698 | 2006-10-19 | ||
US87957007P | 2007-01-10 | 2007-01-10 | |
US60/879570 | 2007-01-10 | ||
US60/879,570 | 2007-01-10 | ||
US90780907P | 2007-04-18 | 2007-04-18 | |
US60/907,809 | 2007-04-18 | ||
US60/907809 | 2007-04-18 | ||
PCT/KR2007/005127 WO2008048064A1 (en) | 2006-10-19 | 2007-10-19 | Encoding method and apparatus and decoding method and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101536101A CN101536101A (zh) | 2009-09-16 |
CN101536101B true CN101536101B (zh) | 2012-03-28 |
Family
ID=39314241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800389499A Expired - Fee Related CN101536101B (zh) | 2006-10-19 | 2007-10-19 | 编码方法和装置以及解码方法和装置 |
Country Status (6)
Country | Link |
---|---|
US (5) | US8452801B2 (zh) |
EP (5) | EP2089882A4 (zh) |
JP (1) | JP5059867B2 (zh) |
KR (1) | KR101046749B1 (zh) |
CN (1) | CN101536101B (zh) |
WO (5) | WO2008048065A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760376A (zh) * | 2014-12-15 | 2016-07-13 | 深圳Tcl数字技术有限公司 | 提取多媒体文件元信息的方法及装置 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101345284B1 (ko) * | 2005-07-20 | 2013-12-27 | 한국과학기술원 | 멀티미디어 컨텐츠 부호화/재생 방법 및 장치 |
KR20070011092A (ko) * | 2005-07-20 | 2007-01-24 | 삼성전자주식회사 | 멀티미디어 컨텐츠 부호화방법 및 장치와, 부호화된멀티미디어 컨텐츠 응용방법 및 시스템 |
KR101304480B1 (ko) * | 2005-07-20 | 2013-09-05 | 한국과학기술원 | 멀티미디어 컨텐츠 부호화방법 및 장치와, 부호화된멀티미디어 컨텐츠 응용방법 및 시스템 |
KR101406843B1 (ko) * | 2006-03-17 | 2014-06-13 | 한국과학기술원 | 멀티미디어 컨텐츠 부호화방법 및 장치와, 부호화된멀티미디어 컨텐츠 응용방법 및 시스템 |
WO2008137432A2 (en) * | 2007-05-01 | 2008-11-13 | Dyyno | Sharing of information and formatting information for transmission over a communication network |
EP2338289A4 (en) * | 2008-10-23 | 2012-03-07 | Siemens Medical Instr Pte Ltd | HEARING AID |
US20100324895A1 (en) * | 2009-01-15 | 2010-12-23 | K-Nfb Reading Technology, Inc. | Synchronization for document narration |
CN103957448B (zh) * | 2009-04-09 | 2017-05-17 | 瑞典爱立信有限公司 | 生成媒体容器文件的方法、媒体内容服务器、以及媒体处理方法和媒体处理服务器 |
KR101746453B1 (ko) * | 2010-04-12 | 2017-06-13 | 삼성전자주식회사 | 실감 효과 처리 시스템 및 방법 |
US8392186B2 (en) | 2010-05-18 | 2013-03-05 | K-Nfb Reading Technology, Inc. | Audio synchronization for document narration with user-selected playback |
JP5652642B2 (ja) * | 2010-08-02 | 2015-01-14 | ソニー株式会社 | データ生成装置およびデータ生成方法、データ処理装置およびデータ処理方法 |
WO2012037489A1 (en) * | 2010-09-17 | 2012-03-22 | Google Inc. | Moving information between computing devices |
WO2012125006A2 (ko) * | 2011-03-16 | 2012-09-20 | 한국전자통신연구원 | 레프리젠테이션을 사용하는 스트리밍 콘텐츠 제공 장치 및 방법 |
JP6214235B2 (ja) * | 2012-07-02 | 2017-10-18 | キヤノン株式会社 | ファイル生成方法、ファイル生成装置、及びプログラム |
KR102069538B1 (ko) * | 2012-07-12 | 2020-03-23 | 삼성전자주식회사 | 멀티미디어 요소의 배치를 위한 마크업을 구성하는 방법 |
CN103024454B (zh) * | 2013-01-04 | 2013-11-13 | 周珏 | 在广播电视节目中向受众传送互动入口信息的方法及其系统 |
WO2014155537A1 (ja) * | 2013-03-26 | 2014-10-02 | 株式会社東芝 | 表示制御装置、及び表示制御方法 |
HUE059748T2 (hu) * | 2014-09-12 | 2022-12-28 | Sony Group Corp | Hangadatfolyamatok vételére szolgáló eszköz és eljárás |
CN104601177B (zh) * | 2014-12-30 | 2017-08-11 | 飞天诚信科技股份有限公司 | 一种基于base64编码的解码扩展实现方法 |
KR102380979B1 (ko) * | 2015-01-05 | 2022-04-01 | 삼성전자 주식회사 | 이미지의 메타데이터 관리 방법 및 장치 |
CN105100869B (zh) * | 2015-07-13 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 弹幕显示方法及装置 |
CN105405457B (zh) * | 2015-10-29 | 2018-03-16 | 北京威动科技有限公司 | 文件内容读取方法和装置 |
CN105338415B (zh) * | 2015-10-29 | 2018-10-23 | 北京威动科技有限公司 | 文件导航播放方法和装置 |
US11178377B2 (en) | 2017-07-12 | 2021-11-16 | Mediatek Singapore Pte. Ltd. | Methods and apparatus for spherical region presentation |
WO2019070292A1 (en) * | 2017-10-06 | 2019-04-11 | Rovi Guides, Inc. | SYSTEMS AND METHODS FOR PRESENTING CLOSED SUBTITLING AND SUBTITLE DATA DURING QUICK ACCESS READING OPERATIONS |
KR102480372B1 (ko) * | 2018-03-09 | 2022-12-26 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
US10887646B2 (en) * | 2018-08-17 | 2021-01-05 | Kiswe Mobile Inc. | Live streaming with multiple remote commentators |
CN111818295B (zh) * | 2019-04-10 | 2022-02-01 | 杭州海康威视数字技术股份有限公司 | 一种图像获取方法及装置 |
CN113766271B (zh) * | 2020-06-04 | 2022-07-12 | 腾讯科技(深圳)有限公司 | 一种沉浸媒体的数据处理方法、装置及设备 |
WO2022155150A1 (en) * | 2021-01-13 | 2022-07-21 | Arris Enterprises Llc | Rendering scrolling captions |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1298181A (zh) * | 1999-09-30 | 2001-06-06 | 索尼公司 | 记录装置,记录方法,重现装置,重现方法和记录介质 |
JP2001189939A (ja) * | 1999-12-28 | 2001-07-10 | Fujitsu Ltd | Mpegビデオ復号器およびmpegビデオ復号方法 |
US6396500B1 (en) * | 1999-03-18 | 2002-05-28 | Microsoft Corporation | Method and system for generating and displaying a slide show with animations and transitions in a browser |
Family Cites Families (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5703997A (en) * | 1995-04-14 | 1997-12-30 | Kabushiki Kaisha Toshiba | Data recording medium having reproduction timing information, and system for reproducing record data by using the reproduction timing information |
US5956729A (en) * | 1996-09-06 | 1999-09-21 | Motorola, Inc. | Multimedia file, supporting multiple instances of media types, and method for forming same |
US6360234B2 (en) * | 1997-08-14 | 2002-03-19 | Virage, Inc. | Video cataloger system with synchronized encoders |
EP1023807B1 (en) * | 1997-10-14 | 2002-07-24 | Thomson Licensing S.A. | System and method for formatting and processing multimedia program data and program guide information |
US6453459B1 (en) * | 1998-01-21 | 2002-09-17 | Apple Computer, Inc. | Menu authoring system and method for automatically performing low-level DVD configuration functions and thereby ease an author's job |
US6493506B1 (en) | 1998-07-01 | 2002-12-10 | Lsi Logic Corporation | Optical disk system and method for storing disk- and user-specific settings |
JP3417330B2 (ja) | 1999-03-08 | 2003-06-16 | 日本電気株式会社 | シナリオ編集装置及びシナリオ編集プログラムを記録した記録媒体 |
KR100424231B1 (ko) * | 1999-03-08 | 2004-03-25 | 파이쓰, 인크. | 데이터 재생 장치, 데이터 재생 방법 및 정보 단말기 |
US6369835B1 (en) * | 1999-05-18 | 2002-04-09 | Microsoft Corporation | Method and system for generating a movie file from a slide show presentation |
JP4629173B2 (ja) * | 1999-09-17 | 2011-02-09 | ソニー株式会社 | 記録装置および記録方法、並びに記録媒体 |
KR100739357B1 (ko) | 1999-09-30 | 2007-07-18 | 소니 가부시끼 가이샤 | 기록 장치, 기록 방법 및 기록 매체 |
US6523046B2 (en) | 2000-02-25 | 2003-02-18 | Microsoft Corporation | Infrastructure and method for supporting generic multimedia metadata |
JP4411730B2 (ja) * | 2000-02-29 | 2010-02-10 | ソニー株式会社 | ユーザインターフェースシステム、サーバ装置、及び、リモート端末装置 |
US7376155B2 (en) * | 2001-01-30 | 2008-05-20 | Electronics And Telecommunications Research Institute | Method and apparatus for delivery of metadata synchronized to multimedia contents |
EP1374080A2 (en) | 2001-03-02 | 2004-01-02 | Kasenna, Inc. | Metadata enabled push-pull model for efficient low-latency video-content distribution over a network |
US6957389B2 (en) * | 2001-04-09 | 2005-10-18 | Microsoft Corp. | Animation on-object user interface |
US20050005308A1 (en) * | 2002-01-29 | 2005-01-06 | Gotuit Video, Inc. | Methods and apparatus for recording and replaying sports broadcasts |
US7908628B2 (en) * | 2001-08-03 | 2011-03-15 | Comcast Ip Holdings I, Llc | Video and digital multimedia aggregator content coding and formatting |
JP4120194B2 (ja) | 2001-09-28 | 2008-07-16 | ブラザー工業株式会社 | 情報編集システム、コンピュータプログラムおよび記録媒体 |
JP2006507553A (ja) * | 2002-02-25 | 2006-03-02 | ソニー エレクトロニクス インク | Mp4においてavcをサポートするための方法及び装置 |
US20040199565A1 (en) | 2003-02-21 | 2004-10-07 | Visharam Mohammed Zubair | Method and apparatus for supporting advanced coding formats in media files |
JP3918580B2 (ja) * | 2002-02-26 | 2007-05-23 | ヤマハ株式会社 | マルチメディア情報符号化装置、マルチメディア情報再生装置、マルチメディア情報符号化処理プログラム及びマルチメディア情報再生処理プログラム |
US6941324B2 (en) * | 2002-03-21 | 2005-09-06 | Microsoft Corporation | Methods and systems for processing playlists |
JP2003297015A (ja) | 2002-03-29 | 2003-10-17 | Toshiba Corp | コンテンツ保存端末及びこのコンテンツ保存端末にコンテンツを配信する配信サーバ装置 |
EP1496701A4 (en) | 2002-04-12 | 2009-01-14 | Mitsubishi Electric Corp | METADATA EDITING DEVICE, METADATA REPRODUCTION DEVICE, METADATA DISTRIBUTION APPARATUS, METADA SEARCHING DEVICE, METADATA REPRODUCTION STATUS DISPLAYING DEVICE AND METADATA DISTRIBUTION METHOD |
JP4021264B2 (ja) | 2002-07-11 | 2007-12-12 | 株式会社ケンウッド | 再生装置 |
FR2846769B1 (fr) | 2002-11-06 | 2005-04-15 | France Telecom | Procede et systeme d'elaboration dynamique d'images |
CA2474231C (en) | 2002-11-20 | 2012-10-23 | Lg Electronics Inc. | Recording medium having data structure for managing reproduction of data recorded thereon and recording and reproducing methods and apparatuses |
JP2004173118A (ja) * | 2002-11-22 | 2004-06-17 | Matsushita Electric Ind Co Ltd | 音声画像多重化データ生成装置と再生装置および動画像復号化装置 |
US7034835B2 (en) * | 2002-11-29 | 2006-04-25 | Research In Motion Ltd. | System and method of converting frame-based animations into interpolator-based animations |
CA2414378A1 (en) * | 2002-12-09 | 2004-06-09 | Corel Corporation | System and method for controlling user interface features of a web application |
JP3815458B2 (ja) * | 2002-12-18 | 2006-08-30 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
US7509321B2 (en) * | 2003-01-21 | 2009-03-24 | Microsoft Corporation | Selection bins for browsing, annotating, sorting, clustering, and filtering media objects |
US7620301B2 (en) | 2003-04-04 | 2009-11-17 | Lg Electronics Inc. | System and method for resuming playback |
KR20040096718A (ko) * | 2003-05-10 | 2004-11-17 | 삼성전자주식회사 | 멀티미디어 데이터 재생장치, 오디오 데이터 수신방법 및오디오 데이터 구조 |
EP1626351A4 (en) | 2003-05-20 | 2012-08-08 | Jvc Kenwood Corp | ELECTRONIC REPAIR MANUAL DISPLAY CONTROLLER |
US20070168046A1 (en) * | 2003-08-04 | 2007-07-19 | Mitsubishi Denki Kabushiki Kaisha | Image information apparatus and module unit |
US7213036B2 (en) | 2003-08-12 | 2007-05-01 | Aol Llc | System for incorporating information about a source and usage of a media asset into the asset itself |
WO2005034092A2 (en) * | 2003-09-29 | 2005-04-14 | Handheld Entertainment, Inc. | Method and apparatus for coding information |
SE0302778D0 (sv) * | 2003-10-17 | 2003-10-17 | Ericsson Telefon Ab L M | Container format for multimedia presentations |
US8472792B2 (en) * | 2003-12-08 | 2013-06-25 | Divx, Llc | Multimedia distribution system |
US7519274B2 (en) * | 2003-12-08 | 2009-04-14 | Divx, Inc. | File format for multiple track digital data |
FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
EP1708101B1 (en) | 2004-01-14 | 2014-06-25 | Mitsubishi Denki Kabushiki Kaisha | Summarizing reproduction device and summarizing reproduction method |
US7386789B2 (en) * | 2004-02-27 | 2008-06-10 | Hewlett-Packard Development Company, L.P. | Method for determining logical components of a document |
JP2005276344A (ja) | 2004-03-25 | 2005-10-06 | Toshiba Corp | 情報記録媒体及び情報再生装置 |
US20060004699A1 (en) | 2004-06-30 | 2006-01-05 | Nokia Corporation | Method and system for managing metadata |
KR100937045B1 (ko) * | 2004-07-22 | 2010-01-15 | 한국전자통신연구원 | Saf 동기화 계층 패킷 구조 |
KR20060012746A (ko) | 2004-08-04 | 2006-02-09 | 삼성전자주식회사 | 재생 시작 위치를 선택 가능한 영상 재생장치 및 그제어방법 |
JP2006074391A (ja) * | 2004-09-01 | 2006-03-16 | Canon Inc | ファイル記録方法および記録装置 |
WO2006041260A1 (en) | 2004-10-13 | 2006-04-20 | Electronics And Telecommunications Research Institute | Extended multimedia file structure and multimedia file producting method and multimedia file executing method |
US20060123360A1 (en) | 2004-12-03 | 2006-06-08 | Picsel Research Limited | User interfaces for data processing devices and systems |
US8006279B2 (en) * | 2004-12-10 | 2011-08-23 | Alcatel Lucent | Distributive system for marking and blocking video and audio content related to video and audio programs |
US20080189330A1 (en) * | 2004-12-15 | 2008-08-07 | Hoos Holger H | Probabilistic Audio Networks |
JP4380533B2 (ja) * | 2004-12-24 | 2009-12-09 | キヤノン株式会社 | マルチメディアデータ処理装置及びその方法 |
US7725593B2 (en) * | 2005-07-15 | 2010-05-25 | Sony Corporation | Scalable video coding (SVC) file format |
US20070022215A1 (en) | 2005-07-19 | 2007-01-25 | Singer David W | Method and apparatus for media data transmission |
WO2007026258A2 (en) * | 2005-07-21 | 2007-03-08 | Expway | Methods and devices for compressing and decompressing structured documents |
KR101224256B1 (ko) * | 2005-10-14 | 2013-01-18 | 한양대학교 산학협력단 | 레이저 기반의 이동 단말을 위한 다중채널의 장면구성 제어방법 및 장치 |
US20070143664A1 (en) * | 2005-12-21 | 2007-06-21 | Motorola, Inc. | A compressed schema representation object and method for metadata processing |
US20080101456A1 (en) * | 2006-01-11 | 2008-05-01 | Nokia Corporation | Method for insertion and overlay of media content upon an underlying visual media |
US20100225808A1 (en) * | 2006-01-27 | 2010-09-09 | Thomson Licensing | Closed-Captioning System and Method |
KR20080100354A (ko) * | 2006-01-30 | 2008-11-17 | 클리어플레이, 아이엔씨. | 필터 메타데이터를 멀티미디어 표현물과 동기화하는 방법 |
US8874645B2 (en) * | 2006-03-28 | 2014-10-28 | Packetvideo Corp. | System and method for sharing an experience with media content between multiple devices |
US7870142B2 (en) | 2006-04-04 | 2011-01-11 | Johnson Controls Technology Company | Text to grammar enhancements for media files |
-
2007
- 2007-10-19 US US12/311,828 patent/US8452801B2/en not_active Expired - Fee Related
- 2007-10-19 US US12/311,831 patent/US8271554B2/en not_active Expired - Fee Related
- 2007-10-19 EP EP07833436A patent/EP2089882A4/en not_active Withdrawn
- 2007-10-19 WO PCT/KR2007/005128 patent/WO2008048065A1/en active Application Filing
- 2007-10-19 EP EP07833438A patent/EP2084708A4/en not_active Withdrawn
- 2007-10-19 WO PCT/KR2007/005129 patent/WO2008048066A1/en active Application Filing
- 2007-10-19 WO PCT/KR2007/005130 patent/WO2008048067A1/en active Application Filing
- 2007-10-19 EP EP07833437A patent/EP2089883A4/en not_active Withdrawn
- 2007-10-19 EP EP07833439A patent/EP2092739A4/en not_active Withdrawn
- 2007-10-19 US US12/311,827 patent/US8271553B2/en not_active Expired - Fee Related
- 2007-10-19 US US12/311,834 patent/US8176424B2/en not_active Expired - Fee Related
- 2007-10-19 US US12/311,835 patent/US8499011B2/en not_active Expired - Fee Related
- 2007-10-19 WO PCT/KR2007/005127 patent/WO2008048064A1/en active Application Filing
- 2007-10-19 WO PCT/KR2007/005131 patent/WO2008048068A1/en active Application Filing
- 2007-10-19 KR KR1020097010175A patent/KR101046749B1/ko not_active IP Right Cessation
- 2007-10-19 JP JP2009533251A patent/JP5059867B2/ja not_active Expired - Fee Related
- 2007-10-19 EP EP07833440A patent/EP2090096A4/en not_active Withdrawn
- 2007-10-19 CN CN2007800389499A patent/CN101536101B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6396500B1 (en) * | 1999-03-18 | 2002-05-28 | Microsoft Corporation | Method and system for generating and displaying a slide show with animations and transitions in a browser |
CN1298181A (zh) * | 1999-09-30 | 2001-06-06 | 索尼公司 | 记录装置,记录方法,重现装置,重现方法和记录介质 |
JP2001189939A (ja) * | 1999-12-28 | 2001-07-10 | Fujitsu Ltd | Mpegビデオ復号器およびmpegビデオ復号方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760376A (zh) * | 2014-12-15 | 2016-07-13 | 深圳Tcl数字技术有限公司 | 提取多媒体文件元信息的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5059867B2 (ja) | 2012-10-31 |
US8176424B2 (en) | 2012-05-08 |
WO2008048065A1 (en) | 2008-04-24 |
KR20090067220A (ko) | 2009-06-24 |
JP2010507316A (ja) | 2010-03-04 |
US8271554B2 (en) | 2012-09-18 |
US20100100819A1 (en) | 2010-04-22 |
EP2084708A4 (en) | 2010-11-24 |
US8452801B2 (en) | 2013-05-28 |
EP2089883A1 (en) | 2009-08-19 |
US20100174733A1 (en) | 2010-07-08 |
EP2092739A4 (en) | 2011-01-19 |
EP2089883A4 (en) | 2010-11-03 |
US8271553B2 (en) | 2012-09-18 |
EP2090096A1 (en) | 2009-08-19 |
US20100281365A1 (en) | 2010-11-04 |
US8499011B2 (en) | 2013-07-30 |
WO2008048067A1 (en) | 2008-04-24 |
EP2090096A4 (en) | 2010-11-03 |
EP2084708A1 (en) | 2009-08-05 |
EP2092739A1 (en) | 2009-08-26 |
EP2089882A4 (en) | 2010-12-08 |
WO2008048066A1 (en) | 2008-04-24 |
CN101536101A (zh) | 2009-09-16 |
KR101046749B1 (ko) | 2011-07-06 |
EP2089882A1 (en) | 2009-08-19 |
US20100174989A1 (en) | 2010-07-08 |
WO2008048064A1 (en) | 2008-04-24 |
US20100042924A1 (en) | 2010-02-18 |
WO2008048068A1 (en) | 2008-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101536101B (zh) | 编码方法和装置以及解码方法和装置 | |
KR100977578B1 (ko) | 부호화/복호화 방법 및 장치. | |
CN101901619B (zh) | 一种基于视频内容缩影的增强用户体验的视频播放器 | |
CN100546379C (zh) | 基于移动设备的体育视频的个性化定制方法及其装置 | |
US8275814B2 (en) | Method and apparatus for encoding/decoding signal | |
CN1454430A (zh) | 在用于非闯入的视听节目中嵌入可再使用的基于对象的产品信息,观众驱动使用方法 | |
KR100837721B1 (ko) | 개인화된 디지털 방송 콘텐츠의 소비를 위한 통합 형식인코딩 장치와, 이의 디코딩 장치 및 인코딩 방법 | |
KR100937416B1 (ko) | Pvr 장치 및 방법 | |
KR101482099B1 (ko) | 멀티 미디어 데이터의 부호화/복호화 방법 및 장치 | |
CN101313577A (zh) | 编码/解码的方法和装置 | |
JP2010278631A (ja) | 静止画生成方法および静止画生成装置 | |
Lee et al. | Interactive rich media player based on MPEG-4 LASeR |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120328 Termination date: 20161019 |