CN1770865A - 元数据的数据结构及该元数据的处理方法 - Google Patents
元数据的数据结构及该元数据的处理方法 Download PDFInfo
- Publication number
- CN1770865A CN1770865A CNA2005101249934A CN200510124993A CN1770865A CN 1770865 A CN1770865 A CN 1770865A CN A2005101249934 A CNA2005101249934 A CN A2005101249934A CN 200510124993 A CN200510124993 A CN 200510124993A CN 1770865 A CN1770865 A CN 1770865A
- Authority
- CN
- China
- Prior art keywords
- data
- vclick
- time
- mobile image
- space domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- 238000000034 method Methods 0.000 claims description 99
- 238000012545 processing Methods 0.000 claims description 66
- 230000008569 process Effects 0.000 claims description 29
- 238000012856 packing Methods 0.000 claims description 7
- 230000009471 action Effects 0.000 abstract description 23
- 238000002360 preparation method Methods 0.000 abstract description 4
- 230000014509 gene expression Effects 0.000 description 85
- 230000005540 biological transmission Effects 0.000 description 30
- 230000000694 effects Effects 0.000 description 30
- 230000006870 function Effects 0.000 description 11
- 238000012546 transfer Methods 0.000 description 11
- 230000006854 communication Effects 0.000 description 9
- 238000003860 storage Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000005096 rolling process Methods 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 7
- 230000001755 vocal effect Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 230000002708 enhancing effect Effects 0.000 description 5
- 210000003733 optic disk Anatomy 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 230000004397 blinking Effects 0.000 description 4
- 230000008676 import Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000011022 operating instruction Methods 0.000 description 2
- 238000000518 rheometry Methods 0.000 description 2
- LZDYZEGISBDSDP-UHFFFAOYSA-N 2-(1-ethylaziridin-1-ium-1-yl)ethanol Chemical compound OCC[N+]1(CC)CC1 LZDYZEGISBDSDP-UHFFFAOYSA-N 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000007799 cork Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
- G06F16/748—Hypervideo
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
- G06F16/94—Hypermedia
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
公开了元数据的数据结构及该元数据的处理方法。在针对用户指示其中不存在对象的区域的情况进行准备的过程中,希望仍在元数据中描述对于该种情况的动作。从而,在每个访问单元中描述指示对象区域数据在屏幕上的叠加次序的层值数据和对象区域固有的辨别数据。其中的层值数据或辨别数据是一个特定值的访问单元时应于此时的“其中不存在时象的区域”。
Description
相关申请的交叉引用
该申请基于在先的于2004年7月26日提出申请的日本专利申请号2004-217962的优先权权益;其全部内容在此并入以作参考。
技术领域
本发明涉及元数据的数据结构,用于通过将存在于客户设备中的移动图像数据和存在于网络上的客户设备或服务设备中的元数据相结合来实现移动图像超媒体,和用于显示移动图像上的telop或balloon,并且涉及其再现方法。
背景技术
超媒体是一种定义在诸如移动图像、静止图像、音频和文本的媒体之间被称为超链接的连接,并且进行相互的或者从一个到另一个的引用。例如,在用HTML描述的可使用互联网浏览的主页中,排列有文本和静止画面,并且定义的链接遍布全部文本和静止画面。当指定该链接时,作为链接目的地的相关信息可以被立即显示出来。当直接指定有趣的表示时,则访问相关信息,并且因此,操作是容易且直观的。
另一方面,在以移动图像为主而不是以文本和静止画面为主的超链接中,来自于诸如人或物这样的对象定义的链接,出现在相关内容的移动图像上,诸如文本或静止画面,以用于解释它,并且当浏览者指定该对象时,就显示相关内容。此时,为了定义出现在移动图像上的时空域和它的相关内容之间的链接,需要表示在移动图像中的对象的时空域的数据(对象区域数据)。
如同对象区域数据,使用具有二进制值或更高值的掩膜图像系列、MPEG-4的任意形状编码、描述在专利文献1(JP-A-2000-285253)中阐释的图形的特征点的轨迹的方法、在专利文献2(JP-A-2001-111996)中阐释的方法等是可能的。为了实现在其中移动图像居于主要的超媒体,除此之外,还需要描述当指定对象时显示其它相关内容的操作的数据(操作信息)等。这些除了移动图像之外的数据称为元数据。
作为将移动图像和元数据提供给浏览者的方法,首先,存在一种制造记录媒体(视频CD、DVD等)的方法,在该记录媒体中记录移动图像和元数据两者。此外,为了如视频CD或DVD那样提供已经拥有的移动图像的元数据,只有元数据才可以从网络上下载或者通过流来传送。此外,移动图像的数据和元数据两者均可以通过网络传送。此时,需要元数据具有这样一种格式,该格式能够有效使用缓冲器、适于随机存取,以及抵御网络中的数据丢失。
在频繁发生移动图像切换的情况中(例如,在准备用多个摄像机物镜视角摄取的移动图像,且观察者可以随意选择摄像机物镜视角,如DVD视频的多物镜视角视频的情况中),元数据必须相应于移动图像的切换而高速切换。
然而,在背景区域中没有访问单元的情况中,则没有动作发生。用户不期望什么事都不发生,这样很可能产生该设备已发生故障的误解。
因而,在针对用户指示对象并不存在的背景区域的情况进行准备的过程中,需要对于该情况的动作同样可以在该元数据中描述。
于是,作出本发明以解决上述问题。
发明内容
根据本发明实施例的移动图像元数据(它的数据结构)包括一个或多个访问单元,每个访问单元均能够进行独立地处理。这里,访问单元(图4的Vclick AU)包括,指定有效周期的第一数据(402),描述移动图像中的时空域的对象区域数据(400),且包括至少一个数据以指定与时空域有关的显示方法的第二数据(403),以及指定当指定时空域时将要执行的处理的数据,作为关于相对于移动图像的时间轴定义的有效周期的信息。
在每个访问单元中描述有指示屏幕上的对象区域数据的叠加次序的层值数据(layer value data)和对象区域固有的鉴别数据,且访问单元中的层值数据或鉴别数据是一个特定值,此时对应于“其中不存在对象的区域”。访问单元并不包括区域数据。
可以想到这样一种方法代替使用本发明,其中使得访问单元具有“其中不存在对象的区域”作为对象区域数据。然而,对象区域数据的数据量并不小。此外,当使用其中使用了层值数据的访问单元,且在最底层的整个屏幕形成对象区域数据时,可以描述在其中不存在对象的区域中的动作。然而,同样在这种情况中,需要对象区域数据。
此时“其中不存在对象的区域”是通过从整个屏幕上移去此时存在的对象而获得的区域,且可以从其它访问单元的区域数据获得。于是,如在本发明中,相对于用于“其中不存在对象的区域”的访问单元,省略对象区域数据,以便可以减少整个元数据流的数据量。
附图说明
图1A和1B是用于说明根据本发明实施例的超媒体的显示实例的视图。
图2是示出根据本发明实施例的系统的结构实例的方框图。
图3是用于说明根据本发明实施例在对象区域和对象区域数据之间的关系的视图。
图4是用于说明根据本发明实施例的的对象元数据的访问单元的数据结构的实例的视图。
图5是用于说明根据本发明实施例的Vclick流的构造方法的视图。
图6是用于说明根据本发明实施例的Vclick访问表的结构实例的视图。
图7是用于说明根据本发明实施例的传输包的结构实例的视图。
图8是用于说明根据本发明实施例的传输包的另一个结构实例的视图。
图9是用于说明根据本发明实施例的在服务器和客户机之间的通信的实例的视图。
图10是用于说明根据本发明实施例的在服务器和客户机之间的通信的另一个实例的视图。
图11是用于说明根据本发明实施例的Vclick流的标题标题的数据元素的实例的视图。
图12是用于说明根据本发明实施例的Vclick访问单元(AU)的标题标题的数据元素的实例的视图。
图13是用于说明根据本发明实施例的Vclick访问单元(AU)的时间戳的数据元素的实例的视图。
图14是用于说明根据本发明实施例的Vclick访问单元(AU)的时间戳跳跃(skip)的数据元素的实例的视图。
图15是用于说明根据本发明实施例的对象属性信息的数据元素的实例的视图。
图16是用于说明根据本发明实施例的对象属性信息的类型的实例的视图。
图17是用于说明根据本发明实施例的对象的名称属性的数据元素的实例的视图。
图18是用于说明根据本发明实施例的对象的动作属性的数据元素的实例的视图。
图19是用于说明根据本发明实施例的对象的轮廓(contour)属性的数据元素的实例的视图。
图20是用于说明根据本发明实施例的对象的闪烁(blinking)区域属性的数据元素的实例的视图。
图21是用于说明根据本发明实施例的对象的镶嵌(mosaic)区域属性的数据元素的实例的视图。
图22是用于说明根据本发明实施例的对象的填充(filled-in)区域属性的数据元素的实例的视图。
图23是用于说明根据本发明实施例的对象的文本信息数据的数据元素的实例的视图。
图24是用于说明根据本发明实施例的对象的文本属性的数据元素的实例的视图。
图25是用于说明根据本发明实施例的对象的文本高亮效果属性的数据元素的实例的视图。
图26是用于说明根据本发明实施例的对象的文本高亮效果属性的条目(entry)的数据元素的实例的视图。
图27是用于说明根据本发明实施例的对象的文本高亮效果属性的数据元素的实例的视图。
图28是用于说明根据本发明实施例的对象的文本高亮效果属性的条目的数据元素的实例的视图。
图29是用于说明根据本发明实施例的对象的文序滚动效果属性的数据元素的实例的视图。
图30是用于说明根据本发明实施例的对象的文本伴唱(卡拉OK,karaoke)效果属性的数据元素的实例的视图。
图31是用于说明根据本发明实施例的对象的文本伴唱(卡拉OK,karaoke)效果属性的条目的数据元素的实例的视图。
图32是用于说明根据本发明实施例的对象的层属性扩展(layer attributeextension)的数据元素的实例的视图。
图33是用于说明根据本发明实施例的对象的层属性扩展的条目的数据元素的实例的视图。
图34是用于说明根据本发明实施例的Vclick访问单元(AU)的对象区域数据的数据元素的实例的视图。
图35是用于说明根据本发明实施例的增强DVD视频盘中的结构的实例的视图。
图36是用于说明根据本发明实施例的增强DVD视频盘中的目录结构的实例的视图。
图37是示出根据本发明实施例的标准再现的开始处理过程的流程图(在Vclick数据是位于服务器设备中的情况中)。
图38是示出根据本发明实施例的标准再现的另一种开始处理过程的流程图(在Vclick数据是位于服务器设备中的情况中)。
图39是示出根据本发明实施例的标准再现的结束处理过程的流程图(在Vclick数据是位于服务器设备中的情况中)。
图40是示出根据本发明实施例的随机存取再现的开始处理过程的流程图(在Vclick数据是位于服务器设备中的情况中)。
图41是示出根据本发明实施例的随机存取再现的另一种开始处理过程的流程图(在Vclick数据是位于服务器设备中的情况中)。
图42是示出根据本发明实施例的标准再现的开始处理过程的流程图(在Vclick数据是位于客户机设备中的情况中)。
图43是示出根据本发明实施例的随机存取再现的开始处理过程的流程图(在Vclick数据是位于客户机设备中的情况中)。
图44是用于说明根据本发明实施例的超媒体的显示实例的视图。
图45示出了指示除一个对象以外的区域的实例。
图46示出了根据本发明实施例的Vclick访问单元(AU)的数据结构的实例。
图47是根据实施例的流程图。
图48是根据实施例的流程图。
具体实施方式
在下文中,将参考附图说明本发明的实施例。
(1)应用概要
图1示出了一个在通过连同移动图像使用该实施例的对象元数据而实现的应用(移动图像超媒体)的屏幕上的显示范例。
图1A的附图标记100表示移动图像的再现屏幕;101表示鼠标指针。在移动图像的再现屏幕100上再现的该移动图像记录在本地移动图像数据记录媒体中。附图标记102表示在移动图像上出现的对象的区域。当用户将鼠标移动到对象的区域上并通过点击等选择该对象时,就执行指定的功能。例如,在图1B中,显示了在本地磁盘和/或网络上的文档(关于该点击的对象的信息)103。此外,还可能执行这样的功能,跳转到移动图像的另一个场景,再现另一个移动图像文件,以及改变再现模式。
该对象的区域102的数据,在该数据时通过点击等指定的情况中的客户机设备的操作数据等将被整体称作对象元数据或Vclick数据。该Vclick数据可以连同移动图像数据一起被记录在本地移动图像数据记录媒体(光盘、硬盘、半导体存储器等)上,或者可以存储在网络服务器上并通过网络传输给客户机。
图44示出了在不同于图1的屏幕上的通过使用该实施例的Vclick数据连同移动图像所实现的应用(移动图像超媒体)的显示实例。
在图1中,显示移动图像和相关信息的视窗彼此分离,但是,在图44中,移动图像A02和相关信息A03显示在一个视窗A01中。与相关信息相同,不仅可以显示文本,还可以显示不同于A02的静止画面A04和移动图像。
在下文中,将给出如何实现该应用的详细说明。
(2)系统结构
图2是示出根据本发明实施例的流设备(streaming apparatus)(可用于网络(network-capable)的磁盘播放器)。将使用图2来描述结构元件的功能。
附图标记200表示客户机设备;201表示服务器设备;以及221表示链接服务器设备和客户机设备的网络。客户机设备200包括运动画面再现引擎203、Vclick引擎202、磁盘装置230、用户接口240、网络管理器208,以及磁盘装置管理器213。附图标记204至206表示包括在运动画面再现引擎中的装置;207、209至212,以及214至218表示包括在Vclick引擎中的装置;以及219和220,表示包括在服务器设备中的装置。客户机设备200可以再现位于磁盘装置230中的移动图像数据,并且显示用诸如HTML的标示语言描述的文档。还可能显示网络上的HTML等的文档。至于关于记录在移动图像数据记录媒体231上的移动图像数据的Vclick数据,存在数据和移动图像数据一同记录在移动图像数据记录媒体231上的情况,以及存在数据记录在服务器设备201的元数据记录媒体219上的情况。在Vclick数据存在于服务器设备201中的情况下,客户机设备200可以使用磁盘装置230中的Vclick数据和移动图像数据以下述方式来执行再现。首先,响应来自于客户机设备200的请求,服务器设备201将包括Vclick数据的媒体数据M1通过网络221传输给客户机设备200。客户机200与移动图像的再现同步处理传输的Vclick数据,并实现诸如超媒体的附加功能。
运动画面再现引擎203是用于再现位于磁盘装置230中的移动图像数据的引擎,并且包括装置204、205和206。附图标记231表示移动图像数据记录媒体,并特别表示DVD、视频CD、视频带、硬盘、半导体存储器等。在移动图像数据记录媒体231上记录数字和/或模拟移动图像数据。还存在这样一种情况,即关于移动图像数据的元数据连同移动图像数据一起记录在移动图像数据记录媒体231上。附图标记205表示用于移动图像再现控制的控制器,其构造得能够根据从Vclick引擎202的接口处理器(handler)207输出的“控制”信号控制来自移动图像数据记录媒体231的视频/音频/子子视频(sub-video)数据D1的再现。
特别的,在再现移动图像的同时,当一事件(例如,由用户指令执行的菜单调用或标题跳转)发生时,根据从接口处理器207传送来的“控制”信号,移动图像再现控制器205能够向接口处理器207输出一“触发”信号,该信号表示视频/音频/子视频(sub-video)数据D1的再现状态。此时(输出触发信号的同时,或在此之前或之后的适当时刻),移动图像再现控制器205可以向接口处理器207输出一“状态”信号,该信号表示性质信息(例如,在播放器中设置的音频语言、子视频子标题语言、再现操作、再现位置、各种时间信息、磁盘内容等)。通过这些信号的传输/接收,开始和停止读出移动图像数据以及访问移动图像数据中想要的位置变得可能。
AV解码器206具有对移动图像数据记录媒体231上记录的视频数据、音频数据和子视频数据进行解码的功能,并将解码的视频数据(通过合成上述的视频数据和上述的子视频数据而获得)和音频数据分别输出。由此,运动画面再现引擎203具有与基于现行的DVD视频标准制造的标准DVD视频描放器的再现引擎相同的功能。就是说,图2的客户机设备200可以再现数据,诸如类似于标准DVD视频播放器的MPEG 2节目流结构的视频和音频,并且由此,再现当前的DVD视频盘(符合传统的DVD视频标准)(保障与现行的DVD软件的再现兼容性)。
接口处理器207执行模块之间的接口控制,此处的模块诸如运动画面再现引擎203、磁盘装置管理器213、网络管理器208、元数据管理器210、缓冲器管理器211、脚本翻译器212、媒体解码器216(包括元数据解码器217)、布局(layout)管理器215,以及AV再现器218。此外,从用户接口240接收由用户操作(对诸如鼠标、触模板,或者键盘的输入装置的操作)产生的输入事件,并将该事件传送给适当的模块。
接口处理器207包括翻译Vclick访问表单(稍后说明)的访问表单语法分析程序、翻译Vclick信息文件(稍后说明)的信息文件语法分析程序、记录由Vclick引擎管理的特性的特性(property)缓冲器、Vclick引擎的系统时钟、移动图像时钟,在其中复制运动画面再现引擎中的移动图像时钟204,等等。
网络管理器208具有通过网络将HTML文件等和诸如静止画面和音频的数据取入缓冲器209中的功能,并控制互联网连接部222的操作。当由用户操作或通过接口处理器207从元数据管理器210处接收请求而发出连接或断开网络的指令时,网络管理器208在连接互联网连接部222和断开互联网连接部222之间进行切换。此外,当在服务器设备201和互联网连接部222之间建立网络时,执行对诸如控制数据和Vclick数据的媒体数据的传输/接收。该媒体数据包括Vclick数据、HTML等的文档、随附的静止画面和移动图像数据等。
从客户机设备200传输到服务器设备201的数据包括用于对话构造的请求、用于对话结束的请求、用于诸如Vclick数据的元数据的传输的请求,以及诸如OK或者错误的状态信息。此外,可以执行客户机设备的状态信息的传输。另一方面,从服务器设备传输到客户机设备的数据包括诸如Vclick数据的元数据和诸如OK或者错误的状态信息。
磁盘装置管理器213具有将HTML等格式的文档和诸如静止画面和音频的数据采集到缓冲器209中的功能,以及将视频/音频/子视频数据D1传输到运动画面再现引擎203中的功能。磁盘装置管理器213依照元数据管理器210的指令执行数据传输处理。
缓冲器209暂存媒体数据M1,诸如通过网络(借助网络管理器)从服务器设备201传输的Vclick数据。同样在媒体数据M2记录在移动图像数据记录媒体231的情况中,媒体数据M2同样通过磁盘装置管理器存储在缓冲器209中。
在媒体数据M2记录在移动图像数据记录媒体231的情况中,在再现视频/音频/子视频数据D1之前,预先将媒体数据M2从移动图像数据记录媒体231中读出,并且将其存储在缓冲器209中。这成为避免后续缺点的一种措施。也就是说,由于媒体数据M2在移动图像数据记录媒体231上的数据存储位置不同于视频/音频/子视频数据D1的,在执行标准再现的情况中,发生类似于磁盘的搜索,并且不能确保无缝再现。
如上所述,诸如从服务器设备201下载的Vclick数据的媒体数据M1也与诸如记录在移动图像数据记录媒体231上的Vclick数据的媒体数据M2一样存储在缓冲器209中,以使得同时进行视频/音频/子视频数据D1和媒体数据的读取和再现变得可能。
附带地,缓冲器209的存储容量是有限的。也就是说,可以存储在缓冲器209中的媒体数据M1和M2的数据大小是有限的。因而,可以由元数据管理器210和/或缓冲器管理器211的控制(缓冲器控制)来清除不必要的数据。
元数据管理器210管理存储在缓冲器209中的元数据,并从接口处理器207接收与移动图像的再现同步的适当定时,并将具有相应时间戳的元数据从缓冲器209传输到媒体解码器216。
附带地,在具有相应时间戳的Vclick数据不存在于缓冲器209中的情况中,可以不执行向媒体解码器216的传送。元数据管理器210执行控制以读取具有从缓冲器209传输的Vclick数据大小或从服务器设备201或磁盘装置230到缓冲器209的任意大小的数据。作为特定的处理,元数据管理器210将对于具有特定大小的Vclick数据的获取请求通过接口处理器207发送到网络管理器208或磁盘装置管理器213。网络管理器208或磁盘装置管理器213将具有特定大小的Vclick数据读入到缓冲器209中,并通过接口处理器207通知元数据管理器210已经获取了Vclick数据。
缓冲器管理器211管理除存储在缓冲器209中的Vclick数据之外的数据(HTML等格式的文档,随附的静止画面和移动图像数据,等),从接收处理器207接收与移动图像的再现同步的适当定时(“移动图像时钟”信号),并将除存储在缓冲器209中的Vclick数据之外的数据传输到语法分析程序214或媒体解码器216。缓冲器管理器211可以从缓冲器209删除变得不必要的数据。
语法分析程序214执行时用诸如HTML的标记语言书写的文档的语法分析,将脚本传输给脚本解释器212,并传输关于布局的信息到布局管理器215。
脚本解释器212解释从语法分析程序214输入的脚本并执行它,在脚本的执行过程中,同样可以使用从接收处理器207输入的事件和特性信息。在用户指定移动图像中的对象的情况中,脚本从元数据解码器217输入到脚本解释器212。
AV再现器218具有控制视频/音频/文本输出的功能。特别的,根据从布局管理器215输出的“布局控制”信号,例如,AV再现器218控制视频和文本(除此之外,还可以包括显示定时和显示时间)的显示位置和显示尺寸,音频(除此之外,还可以包括输出定时和输出时间)的响度,并根据特定的电动机(motor)的类型和/或将显示的视频类型,执行视频的象素转换。作为控制对象的视频/音频/文本输出是从运动画面再现引擎203和媒体解码器216的输出。此外,AV再现器218具有依照从接口处理器207输出的“AV输出控制”,控制从运动画面再现引擎203输入的视频/音频数据和从媒体触码器输入的视频/音频/文本数据的混合和切换的功能。
布局管理器215将“布局控制”信号输出到AV再现器218。该“布局控制”信号包括关于将要输出的运动画面/静止画面/文本的大小和位置信息(可以包括关于诸如显示开始/结束/连续的显示实现的信息),且该“布局控制”信号是指示AV再现器218对执行显示的布局进行选择的信息。此外,至于从接口处理器207输入的输入信息,如用户的点击,判断指定了哪一个对象,并将指令发送给元数据解码器217以提取为特定对象定义的操作指令,诸如相关信息的显示。将提取的操作指令传输给脚本解释器212,并执行它。
媒体解码器216(包括元数据解码器)对运动画面/静止画面/文本数据进行解码。将该解码的视频数据和文本图像数据从媒体解码器216传输到AV再现器218。此外,由来自于接口处理器207的“媒体控制”信号的指令对解码数据进行解码,并与来自接口处理器207的“定时”信号同步进行解码。
附图标记219表示服务器设备的元数据记录媒体,且是一个硬盘、半导体存储器、磁带等,在其上记录将要传输到客户机设备200的Vclick数据。Vclick数据是关于记录在移动图像数据记录媒体231上的移动图像数据的元数据。Vclick数据包括将在稍后说明的对象元数据。附图标记220表示服务器的网络管理器,并通过网络221执行数据向服务器设备200或者从服务器设备200的传输/接收。
(3)EDVD数据结构和IFO文件
图35是示出当增强的DVD视频盘用作移动图像数据记录媒体231时的数据结构。增强的DVD视频盘的DVD视频区域存储与DVD视频标准相同数据结构的DVD视频内容(具有MPEG 2节目流结构)。此外,增强的DVD视频盘的其它存储区域存储增强的导航(下文中简称为ENAV)内容,其可以丰富视频内容的再现。附带地,上述记录区域的存在于DVD视频标准中同样可以接受。
这里,将说明DVD视频盘的基本数据结构。也就是说,DVD视频盘的记录区域从内缘开始顺序包括导入(lead-in)区域、容量空间和导出(lead-out)区域。容量空间包括容量/文件结构信息区域和DVD视频区域(DVD视频区),并且还可以包括其它任意的记录区域(DVD其它区)。
容量/文件结构信息区域2是分配用于UDF(通用磁盘格式)网桥结构的区域。依照ISO/IEC13346的部分2识别UDF网桥格式的容量。识别容量的空间由连续的扇区组成,并开始于图35的容量空间的第一逻辑扇区。为由ISO9660管理的系统使用而保存第一个16逻辑扇区。为了保证和传统DVD视频标准的兼容性,具有如此内容的容量/文件结构信息区域变得必须。
此外,称为视频管理器VMG的管理信息,以及至少一个称为视频标题组VTS(VTS#1到VTS#n)的视频内容记录在DVD音频区域中。VMG是用于存在于该DVD视频区域中的所有视频标题组VTS的管理信息,并且包括控制数据VMG1、VMG菜单数据VMGM_VOBS(选项)以及VMG的备份数据。此外,每个视频标题组VTS包括控制数据VTS的VTSI、VTS菜单数据VMGM_VOMS(选项)、VTS(标题)的内容(电影,等)的数据VTSTT_VOBS,以及VTSI的备份数据。为了保证和传统DVD视频标准的兼容性,具有如此内容的容量/文件结构信息区域变得必须。
预先由提供者(DVD视盘的制造商)使用VMG给定再现选择菜单和每个标题(VTS#1到VTS#n)的再现选择菜单。预先由提供者使用VTSI给定在特定标题(例如,VTS#1)中的再现章节选择菜单、记录内容(单元)的再现过程等。因而,磁盘的浏览者(DVD视频播放器的用户)可以依照由提供者预先准备的VMG/VTSI的菜单欣赏磁盘1的记录内容和VTSI中的再现控制信息(节目链信息PGCI)。然而,在DVD视频标准中,浏览者(用户)不能通过不同于提供者准备的VMG/VTSI的方法再现VTS的内容(电影或音乐)。
为这样的发明准备图35的增强DVD视盘,以便允许通过不同于提供者准备的VMG/VTSI的方法再现VTS的内容(电影或音乐),并且允许附加和再现不同于提供者准备的VMG/VTSI的内容。包括在该磁盘中的ENAV内容不能被基于DVD视频标准制造的DVD视频播放器访问(即使访问,该内容也不能使用),然而,根据本发明的实施例其可以被DVD视频播放器访问,并使用再现的内容。
ENAV内容被构造为包括诸如音频、静止画面、字体和文本、运动画面、动画和Vclick数据的数据,以及如控制这些内容的再现的信息的ENAV文档(其是用标记/脚本语言描述的)。在控制再现的信息中,ENAV内容(包括音频、静止画面、字体/文本、运动画面、动画和Vclick数据等)的再现方法(显示方法、再现过程、再现切换过程、再现对象的选择等)和/或DVD视频内容用标记语言或脚本语言描述。例如,当将后面所述的语言组合起来时,可以使用作为标记语言的HTML(超文本标记语言)/XHTML(可扩展超文本标记语言)或SMIL(同步的多媒体集成语言),和作为脚本语言的ECMA(欧洲计算机制造协会)脚本或JAVA脚本。
这里,在图35的增强DVD视盘中,由于除其它记录区域的内容之外的内容遵照DVD视频标准,所以即使使用普及的DVD视频播放器,也可以再现记录在DVD视频区域中的视频内容(即,其与传统的DVD视盘兼容)。虽然记录在其它记录区域中的ENAV内容不可以由传统的DVD视频播放器再现(或者不可以被其使用),但是根据本发明的实施例可以由DVD视频播放器再现和使用。因而,当使用根据本发明实施例的DVD视频播放器并再现ENAV内容时,富于变化的视频再现变得可能,而不仅仅局限于预先由提供者准备的VMG/VTSI的内容。
特别的,如图35所示,ENAV内容包括Vclick数据,并且Vclick数据被构造得包括Vclick信息文件(Vclick信息)、Vclick访问表、Vclick流、Vclick信息文件备份(Vclick信息备份),以及Vclick访问表备份。
Vclick信息文件是指示后面提及的Vclick流将添加到DVD视频那同的哪一部分(例如,DVD视频内容的整个标题、整个章节,或者其中的一部分)的数据。Vclick访问表用于每个后面提及的Vclick流,并且是用于访问Vclick流的表单。Vclick流是包括在移动图像中的对象的位置信息和诸如当对象被点击时的操作说明的数据的流。Vclick信息文件备份是前述Vclick信息文件的备份,并且总是具有与Vclick信息文件相同的内容。Vclick访问表备份是前述Vclick访问表的备份,并总是具有与Vclick访问表相同的内容。在图35的实例中,Vclick数据记录在增强DVD视盘上。然而,如前所述,也具有这样一种情况,即将Vclick数据置于网络上的服务器设备中。
图36示出了构成Vclick信息文件、Vclick访问表、Vclick流、Vclick信息文件备份,以及Vclick访问表备份的文件实例。构成Vclick信息文件的文件(VCKINDEX.IFO)是用XML(扩展标记语言)语言描述的,并且描述了将Vclick流添加到DVD视频内容的Vclick流和位置信息(VTS号、标题号、PGC号等)。Vclick访问表由一个或多个文件(VCKSTR01.IFO到VCKSTR99.IFO,或者任意文件名)以及一个相应于一个Vclick流的一个访问表文件构成。
在Vclick流文件中描述Vclick流的位置信息(从文件标题开始的相关字节大小)和时间信息(从文件标题开始的相应移动图像或相关时间信息的时间戳)之间的关系,并且可以检索相应于给定时间的再现开始位置。
Vclick流是由一个或多个文件(VCKSTR01.IFO到VCKSTR99.IFO,或者任意文件名)构成的,并且可以通过参考Vclick信息文件的说明而与所添加的DVD视频内容一同再现。在多个属性存在的情况中(例如,日文的Vclick数据和英文的Vclick数据等),也可能构造各个属性不同的Vclick流,即不同的文件。此外,多路传输各个属性,并且可以构造一个Vclick流,即一个文件。附带地,在前者(由多个Vclick流构造的不同属性)的情况中,当其一旦存储在再现设备(播放器)时,缓冲器占用容量就会减少。在后者(由一个Vclick流构造不同的属性)的情况中,当切换属性时,由于一个文件可以保持一直再现而无需切换该文件,所以切换速度可以很高。
这里,Vclick流和Vclick访问表的关联可以用例如文件名来实现。在前述实例中,一个Vclick访问表(VCKSTRXX.IFO,XX是01至99)分配给一个Vclick流(VCKSTRXX.VCK,XX是01至99),且当除扩展名之外的文件名彼此相同时,Vclick流和Vclick访问表的关联变得可识别。
除此之外,当在Vclick信息文件中描述(并行描述)Vclick流和Vclick访问表的关联时,Vclick流和Vclick访问表的关联变得可识别。
Vclick信息文件备份由VCKINDEX.BUP文件构成,且具有与Vclick信息文件(VCKINDEX.IFO)完全相同的内容。在由于某些原因(由于磁盘的划痕、灰尘等)而不能够读取VCKINDEX.IFO的情况中,代之以读取VCKINDEX.BUP,以便可以执行所需的程序。Vclick访问表备份由VCKSTR01.BUP至VCKSTR99.BUP文件构成,且具有与Vclick访问表(VCKSTR01.IFO至VCKSTR99.IFO)完全相同的内容。一个Vclick访问表备份(VCKSTRXX.BUP,XX是01至99)分配给一个Vclick访问表(VCKSTRXX.IFO,XX是01至99),且当除扩展名之外的文件名彼此相同时,Vclick访问表和Vclick访问表备份的关联变得可识别。在由于某些原因(由于磁盘的划痕、灰尘等)而不能够读取VCKSTRXX.IFO的情况中,代之以读取VCKSTRXX.BUP,以便可以执行所希望的程序。
(4)数据结构和访问表概述
Vclick流包括关于对象区域的数据,其中的对象诸如出现在记录在移动图像数据记录媒体231上的移动图像上的人或物,和在客户机设备200中的对象的显示方法的数据以及当指定该对象时将由客户机设备执行的操作。在下文中,将说明Vclick数据和它的结构单元的概述。
首先,将说明作为关于该对象区域的数据的对象区域数据,诸如出现在移动图像上的人或物。
图3是用于解释对象区域数据的结构的视图。附图标记300表示由一个对象画出的在X(在水平方向上的视频坐标值)、Y(在垂直方向上的视频坐标值)、T(视频的时间)三维坐标表示的轨迹。将对象区域转换成在预先确定的范围(例如,从0.5秒到1.0秒,或者从2秒到5秒)内的时间间隔上的对象区域数据。在图3中,将一个对象区域300转换为五个对象区域数据301至305,并且这些对象区域数据存储在独立的Vclick访问单元(AU)中(稍后说明)。作为此时的转换方法,可以使用例如MPEG-4形编码或MPEG-7时空定位器描述符。由于在MPEG-4形编码或MPEG-7时空定位器的系统,通过使用对象区域的时间相关性来减少数据量,所以存在这样的问题,即数据不可以从中间开始解码,且在某个时间上丢失的数据的情况中,该时间附近的数据也不可以被解码。如图3所示,在时间方向上划分很长时间持续出现在移动图像上的对象的区域,并将其转换成数据,以便容易进行随机存取,并且可以减少部分数据漏失的影响。每个Vclick_AU仅在移动图像中的特定时间段中是有效的。Vclick_AU有效的时间段称为Vclick_AU的有效周期(生存期)。
图4示出了一个单元(Vclick_AU)的结构,该单元在使用在本发明实施例中的Vclick流中可以被独立的访问。附图标记400表示对象区域数据。这里如图3所说明的,将在一个对象区域的某个连续时间段中的轨迹转换为数据。描述了该对象的时间段被称为Vclick_AU的激活(active)周期(激活时间)。通常,Vclick_AU的激活周期与Vclick_AU的有效周期相同。然而,也可能使得Vclick_AU的激活周期成为Vclick_AU的有效周期的一部分。
附图标记401表示Vclick_AU的标题。标题401包括用于识别Vclick_AU的ID,以及用于指明AU的数据大小的数据。附图标记402表示时间戳,并且表示Vclick_AU的有效周期开始的时间戳。通常,由于Vclick_AU的激活周期及其有效周期彼此相等,所以也表明了在对象区域数据400中描述的对象区域相应于移动图像中的时间。如图3所示,由于对象区域遍布时间范围,通常,将对象区域的标题的时间写入时间戳402中。当然,也可以描述在对象区域数据中所描述的对象区域的时间间隔和对象区域的结束的时间。附图标记403表示对象属性信息,并且包括,例如,对象的名称、在对象被指定时的操作说明、对象的显示属性等。在Vclick_AU中的数据将在稍后详细描述。最好按时间戳的顺序依次排列和记录Vclick_AU,以便可以从标题进行处理。
图5是用于解释一种按时间戳顺序排列多个AU和生成Vclick流的方法的视图。在该图中,有两个摄影机物镜视角,即,摄影机物镜视角1和摄影机物镜视角2,且假定当在客户机设备中切换摄影机物镜视角时,将要显示的移动图像也发生切换。此外,假定可选择的语言模式包括两种,即,日语和英语,且为各种语言准备备自的Vclick数据。
在图5中,Vclick_AU 500、501和502对应于摄影机物镜视角1和日文,且Vclick_AU 503对应于摄影机物镜视角2和日文。Vclick_AU 504和505对应于英文。Vclick_AU 500到505中的每一个都是相应于移动图像中的一个对象的数据。即,如图3和4所示,关于一个对象的元数据由一个或多个Vclick_AU构成(在图5中,一个矩形表示一个AU)。该图中的水平轴相应于移动图像中的时间,且Vclick_AU500到505相应的表示对象的出现时间。
虽然每个Vclick_AU的时间分隔符可以是任意的,如图5中的示例,当为所有对象定位Vclick_AU的分隔符时,数据的管理变得简单。附图标记506表示由Vclick_AU(500至705)构成的Vclick流。Vclick流是通过按连续到标题部分507的时间戳的顺序排列Vclick_AU而构造的。
由于用户在浏览期间很有可能改变选定的摄影机物镜视角,所以最好通过复用在Vclick流中带有不同摄影机物镜视角的摄影机物镜视角的Vclick_AU来形成Vclick流。这是因为可以在客户机设备中执行高速的显示切换。例如,当Vclick数据位于服务器设备201中时,且当将Vclick流按照原样传输给窗户机设备时,其中的Vclick流包括有多个摄影机物镜视角的Vclick_AU,由于浏览期间相应于摄影机物镜视角的Vclick_AU总是发送给客户机设备,所以可以立即执行摄影机物镜视角的切换。当然,将客户机设备200的设置信息发送给服务器设备201,并且仅仅从Vclick流中选择必要的Vclick_AU并且可以传输它。然而,在这种情况中,由于需要执行与服务器的通信,处理变得有些慢(但是,当在通信中使用诸如光纤的高速措施时,就可以解决处理滞后的问题了)。
在另一方面,由于诸如移动图像标题、DVD视频的PGC、移动图像的纵横比和浏览区域的属性改变的频率较低,当它们被用作为单独的Vclick流时,客户机设备的处理变得微不足道(light),且网络的负担也变得微不足道。在存在多个Vclick流的情况中,如前所述,通过参考Vclick信息文件,能够确定哪一个Vclick流不应当被选择。
在Vclick数据位于服务器设备201中的情况中,且在从标题开始移动图像的再现的情况中,服务器设备201仅仅需要从标题按顺序将Vclick流发送给客户机设备。然而,在发生随机访问的情况中,需要从Vclick流的中间发送数据。此时,为了高速访问Vclick流中的期望位置,提供Vclick访问表变得有必要。
图6示出了Vclick访问表的示例。该表是预先准备好的,并且与Vclick流一同记录。该表还可以制成和Vclick信息文件相同的文件。附图标记600表示时间戳的排列,并且列出移动图像的时间戳。附图标记601表示访问点的排列,并且列出相应于从移动图像的开标题的时间戳的Vclick流的偏置值。在相应于移动图像的随机访问目的的时间戳的值不存在于Vclick访问表中的情况,则进行对相近值的时间戳的访问点的参照,并且在参考Vclick流中的时间戳时在访问点的附近搜索传输的开始位置。可选择的,在从Vclick访问表中搜索到移动图像的随机访问目的的时间戳之前的某个时间上的时间戳,并且传输来自相应于该时间戳的访问点的Vclick流。
Vclick访问表存储在服务器设备中,并且提供它以协助服务器设备根据来自客户机的随机访问搜索将被传输的Vclick数据。然而,将存储在服务器设备中的Vclick访问表下载到客户机设备中,并且可以使得客户机设备检索Vclick流。特别的,在将Vclick流从服务器设备下载到客户机设备的情况中,可立即将Vclick访问表从服务器设备下载到客户机设备。
另一方面,还存在将Vclick流记录在诸如DVD的移动图像记录媒体上并提供它的情况。同样在该情况中,为了根据再现内容的随机访问而搜索将被使用的数据,客户机设备使用Vclick访问表是有效的。在这种情况中,类似于Vclick流,Vclick访问表记录在移动图像记录媒体中,并且客户机设备从移动图像记录媒体将Vclick访问表读入内部主存诸器等中,并且使用它。
Vclick流的随机再现由元数据解码器217进行处理,其中Vclick流是通过移动图像的随机再现而生成的。在图6的Vclick访问表中,时间戳“时间”是具有记录在移动图像记录媒体上的移动图像的时间戳格式的时间信息。例如,当用MPEG-2压缩移动图像并记录它时,时间戳“时间”具有MPEG-2的PTS格式。此外,在移动图像具有导航结构的情况中,其中导航结构诸如标题和在例如DVD中的节目链,表示它们的参数(TTN、VTS_TTN、TT_PGCN、PTTN等)均包括在时间戳“时间”的格式中。时间戳的值以升序或者降序排列。例如,在PTS用作时间戳的情况中,它们可以按时间顺序排列。同样至于包括DVD参数的时间戳,由于可以依照DVD的自然再现顺序定义顺序关系,所以能够顺序排列时间戳。
在图6的Vclick访问表中,访问点“偏置”指示在Vclick流中的位置。例如,Vclick流是一个文件,且访问点“偏置”指示该文件的文件指针的值。与时间戳“时间”成对的访问点“偏置”之间的关系如下:
i)由“偏置”指示的位置是某个Vclick_AU的标题位置。
ii)某个AU的时间戳的值不比时间戳“时间”的值大。
iii)在某个AU之前的一个AU的时间戳的值确实小于时间戳“时间”。
在Vclick访问表中的时间戳“时间”的排列间隔可以是任意的,且不需要一致。然而,考虑到搜索的便利,把它们统一起来。
接着,将说明在服务器设备和客户机设备之间的协议。作为当Vclick数据从服务器设备201传输到客户机设备200时使用的协议,例如有RTP(实时传输协议)。RTP与UDP/IP相兼容,并且实时特性依附有重要性,以致存在信息包丢失的可能性。当使用RTP时,将Vclick流分割成传输信息包(RTP信息包),并传输它。这里,将说明进入传输信息包的Vclick流的存储方法的实例。
图7和8是用于说明在Vclick_AU的数据大小很小的情况中的传输信息包构造方法和在其数据大小很大的传输信息包构造方法。图7的图标记700表示Vclick流。传输信息包包括信息包的标题701和有效负载。信息包的标题701包括该信息包的序号、传输时间、传输源的特定信息等。有效负载是用于存储传输数据的数据区域。从Vclick_AU 700中顺序提取的Vclick_AU(702)存储在该有效负载中。在下一个Vclick_AU不能够被接收在有效负载内的情况中,则将填充数据703插入到剩余部分。填充数据是用于调节数据大小的伪数据,例如是一串0值。在有效负载的大小可以等于一个或多个Vclick_AU的大小的情况中,则不需要填充数据。
另一方面,图8示出了在一个Vclick_AU不能够被接收在有效负载内的情况中的传输信息包的构造方法。首先,仅有Vclick_AU(800)的一部分(802)存储在有效负载中,其中的Vclick_AU(800)适合第一传输信息包的有效负载。剩余数据(804)存储在第二传输信息包的有效负载中,并且当在有效负载的存储器大小中出现了剩余,则嵌入填充数据805。相似的方法适于将一个Vclick_AU分割成三个或多个信息包的情况。
可以使用除RTP、HTTP(超文本传输协议)或HTTPS之外的协议的。HTTP是与TCP/IP相兼容的,并且在该情况中,由于遗失的数据被中转,所以可以执行高可靠性的数据通信。然而,在网络的总处理能力很低的情况中,存在数据延迟发生的顾虑。由于数据在HTTP中不会丢失,所以不需要考虑图如何将Vclick流分割成信息包并进行存储。
(5)在Vclick数据位于服务器设备中的情况中的再现处理过程
接着,将说明Vclick流位于服务器设备201中的情况中的再现过程。
图37是表示从用户的再现开始的指令到再现开始的再现开始处理过程。首先,在步骤S3700中,由用户输入再现开始的指令。接口处理器207接收该输入,并将移动图像再现准备指令发送给移动图像再现控制器205。接着,作为分支处理步骤S3701,判断是否已经配置了与服务器设备201的对话。当还没有配置对话时,处理过程进行到步骤S3702,当已经配置对话时,进行到步骤S3703。在步骤S3702中,执行在服务器和客户机之间配置对话的过程。
图9示出了在RTP用于服务器和客户机之间的通信协议的情况中从对话配置到对话断开的通信过程。虽然在对话的标题需要在服务器和客户机之间执行谈判,但是在RTP的情况中,经常使用RTSP(实时流协议)。然而,由于RTSP的通信需要高可靠性,最可取的是在RTSP中用TCP/IP和在RTP中用UDP/IP来执行通信。首先,为了配置该对话,客户机设备(在图2的实例中的200)请求服务器设备(在图2的实例中的201)提供关于流动的Vclick数据的信息(RSTP的DESCRIBE方法)。
这里,假定作为发送相应于将被再现的移动图像的数据的服务器地址已借由一种方法由客户机预先得知,该方法例如将地址信息记录在移动图像数据记录媒体上。相应于此,服务器设备将Vclick数据的信息发送给客户机设备。特别的,将诸如对话的协议版本、对话所有人、对话名称、连接信息、对话的时间信息、元数据名称,以及元数据属性的信息发送给客户机设备。作为这些信息说明方法,例如,使用SDP(对话说明协议)。接着,客户机设备请求服务器设备配置该对话(RTSP的SETUP方法)。服务器设备准备提供该流,并将对话ID返回到客户机设备。进行到该点的处理在使用RTP的情况中是步骤S3702的处理。
在使用HTTP而不是RTP的情况中的通信过程如例如图7所示执行。首先,执行在作为低于HTTP的层的TCP上对话配置(3方握手)。这里,类似于前,假定相应于发送将被再现的移动图像的数据的服务器地址对于客户机来说是预先已知的。其后,可以执行对通过使用SDP等将客户机设备的一种状态(例如,制造国家、语言、各种参数的选择状态等)传输给服务器设备的处理。进行到该点的处理在使用HTTP的情况中是步骤S3702的处理。
在步骤S3703中,在服务器设备和客户机设备之间的对话已经配置的状态中,执行请求服务器传输Vclick数据的处理。该处理以这样的一种方式执行,即接口处理器将指令发送给网络管理器208,并且网络管理器208将请求发送给服务器。在RTP的情况中,网络管理器208将RTSP的PLAY方法发送给服务器,并且请求Vclick数据传输。服务器设备参考至此从客户机接收的信息以及位于服务器设备中的Vclick信息,并且指定将被传输的Vclick流。此外,服务器设备使用包括在Vclick数据传输请求中的再现开始位置的时间戳信息和位于服务器设备中的Vclick数据表来指定Vclick流中的传输开始位置,将该Vclick流分割成信息包,并用RTP将其发送给客户机设备。
另一方面,在HTTP的情况中,网络管理器208传输HTTP的GET方法,并且请求Vclick数据传输。该请求包括移动图像的再现开始位置的时间戳信息。服务器设备以与RTP时间相似的方法指定将被传输的Vclick流和在该流中的传输开始位置,并用HTTP将Vclick流发送给客户机设备。
接着,在步骤S3704中,执行将发送自服务器的Vclick流缓冲入缓冲器209的处理。执行该步骤以避免这样一种状态,即在Vclick流再现期间从服务器传输的Vclick流变得不够,并且缓冲器变空。当元数据管理器210通知接口处理器不足的Vclick流已经存储在缓冲器中时,处理进行到步骤S3705。在步骤S3705中,接口处理器向控制器205发出移动图像的再现开始指令,并指示元数据管理器210开始向元数据解码器217传输Vclick流。
图38是用于说明不同于图37的再现开始处理过程的流程图。在图37的流程图说明的处理中,根据网络的状态和服务器及客户机设备的处理能力,在步骤S3704中执行缓冲固定量的Vclick流的处理需要花费大量的时间。即,从用户的再现指令到实际再现的开始需要很长时间。在图38的处理过程中,当在步骤S3800中用户指示再现开始时,在下一个步骤S3801中立即开始移动图像的再现。即,从用户处接收再现开始指令的接口处理器207立即将再现开始指令发送给控制器205。借此,用户在发出再现指令之后到其可以浏览到移动图像之间不需要等待。从下一个步骤S3802到步骤S3805的处理与图37的步骤S3701到步骤S3704相同。
在步骤S3806中,在再现期间与移动图像同步进行对Vclick流的解码处理。即,当从元数据管理器210接收定量的Vclick流已经存储在缓冲器中的通知时,接口处理器207指示元数据管理器210开始向元数据解码器传输Vclick流。元数据管理器210在再现期间从接口处理器接收移动图像的时间戳,从存储在缓冲器中的数据中指定相应于时间戳的Vclick_AU,并将其传输给元数据解码器。
在图38的处理过程中,虽然用户发出再现指令之后在能够浏览到移动图像之前不用一直等待,但是有这样一个问题,即由于Vclick流的解码不是在再现开始之后立即执行,所以关于对象的显示还未执行,或者即使点击对象,也不会发生任何操作。
在移动图像的再现期间,客户机设备的网络管理器208接收从服务器设备顺序发送的Vclick流,并将其存储在缓冲器209中。将该存储的对象元数据在合适的时间发送给元数据解码器217。即,元数据管理器208参考在再现期间发送自元数据管理器210的移动图像的时间戳,从存储在缓冲器209中的数据指定相应于该时间戳的Vclick_AU,并将指定的对象元数据发送给AU单元中的元数据解码器217。元数据解码器217对接收的数据进行解码。然而,取自不同于不久前由客户机设备选定的摄影机物镜视角的摄影机物镜视角的数据可能使得不被解码。在抑制相应于再现期间的移动图像的时间戳的Vclick_AU位于元数据解码器217中的情况中,可以使得对象元数据被发送到元数据解码器。
从接口处理器顺序将再现期间的移动图像的时间戳顺序发送给元数据解码器217。该元数据解码器与时间戳同步进行Vclick_AU的解码,并将所需的数据发送给AV再现器218。例如,在由Vclick_AU中描述的属性信息指示的对象区域的显示的情况中,创建掩膜图像和对象区域的轮廓,并在再现期间与移动图像的时间戳同步将其发送给AV再现器218。此外,元数据解码器将再现期间的移动图像的时间戳与Vclick_AU的有效时间进行比较以判断哪一个旧的对象元数据时是不必要的,并删除该数据。
图39是用于解释再现停止处理的过程的流程图。在步骤S3900中,用户指示移动图像再现期间的再现停止。接着,在步骤S3901中,执行停止移动图像的再现的处理。其以这样的方式执行,即接口处理器207将停止指令发送给控制器205。同时,接口处理器指示元数据管理器210停止树象元数据传输给元数据解码器。
步骤S3902是断开与服务器的对话的处理。在使用RTP的情况中,如图9所示,将RTSP的TEARDOWN方法发送给服务器。当接收TEARDOWN的消息时,服务器设备停止数据传输,结束对话,并将确认消息发送给客户机设备。通过该处理,用于对话的对话ID变得无效。另一方面,在使用HTTP的情况中,如图10所示,将HTTP的相近方法发送给服务器,并结束对话。
(6)在Vclick数据位于服务器设备中的情况中的随机访问过程
接着,将说明在Vclick数据位于服务器设备201中的情况中的随机访问再现的过程。
图40是示出用户对再现开始的随机访问再现的标题的指令的处理过程的流程图。首先,在步骤S4000中,由用户输入随机访问再现的开始指令。作为输入方法,由用户从诸如章节的可访问位置的列表中进行选择的方法、用户从相应于移动图像的时间戳的滑杆指定一个点的方法,或直接输入移动图像的时间戳的方法。接口处理器207接收输入的时间戳,并将移动图像再现准备的指令发送给移动图像再现控制器205。在移动图像已经被再现的情况中,在指示再现期间的移动图像的再现停止,并发送移动图像再现准备的指令。接着,作为分支处理步骤S4001,其判断是否已经配置了与服务器设备201的对话。在对话已经配置的情况中,例如与在移动图像已经被再现的情况相同,执行步骤S4002的对话断开处理。当对话还没有被配置时,则不执行步骤S4002的处理,且处理进行到步骤S4003。在步骤S4003中,执行对在服务器和客户机之间的对话的配置。该处理是与图37的步骤S3702相同的处理。
接着,在步骤S4004中,在服务器设备和客户机设备之间已经配置了对话的状态中,为服务器指定再现开始位置的时间戳,并执行对请求Vclick数据传输的处理。该处理以这样的方式执行,即接口处理器将指令发送给网络管理器208,且网络管理器208将该请求发送给服务器。在RTP的情况中,网络管理器208将RTSP的PLAY方法发送给服务器,并且请求Vclick数据传输。此时,指定再现开始位置的时间戳使用Range说明的方法同样被发送给服务器。服务器设备参考至此从客户机接收的信息以及位于服务器设备中的Vclick信息,并且指定将被传输的Vclick流。此外,服务器设备使用包括在Vclick数据传输请求中的再现开始位置的时间戳信息和位于服务器设备中的Vclick数据表来指定Vclick流中的传输开始位置,将该Vclick流分割成信息包,并用RTP将其发送给客户机设备。
另一方面,在HTTP的情况中,网络管理器208传输HTTP的GET方法,并且请求Vclick数据传输。该请求包括移动图像的再现开始位置的时间戳信息。类似于RTP,服务器设备参考Vclick信息指定将被传输的Vclick流,还使用位于服务器设备中的时间戳信息和Vclick访问表指定在Vclick流中的传输开始位置,并用HTTP将Vclick流发送给客户机设备。
接着,在步骤S4005中,执行将发送自服务器的Vclick流缓冲入缓冲器209的处理。执行该步骤以避免这样一种状态,即在Vclick流再现期间从服务器传输的Vclick流变得不够,并且缓冲器变空。当元数据管理器210通知接口处理器不足的Vclick流已经存储在缓冲器中时,处理进行到步骤S4006。在步骤S4006中,接口处理器向控制器205发出移动图像的再现开始指令,还发送指示元数据管理器210开始向元数据解码器传输Vclick流的指令。
图41是用于说明不同于图40的随机访问再现开始处理过程的流程图。在图40的流程图说明的处理中,根据网络的状态和服务器及客户机设备的处理能力,在步骤S4005中执行缓冲固定量的Vclick流的处理需要花费大量的时间。即,从用户的再现指令到实际再现的开始需要很长时间。
另一方面,在图41的处理过程中,在步骤S4100中,当用户指示再现开始时,在步骤S4101中立即开始移动图像的再现。即,从用户处接收再现开始指令的接口处理器207立即将再现开始指令发送给控制器205。借此,用户在发出再现指令之后到其可以浏览到移动图像之间不需要等待。从下一个步骤S4102到步骤S4106的处理与图40的步骤S4001到步骤S4005相同。
在步骤S4107中,在再现期间与移动图像同步进树Vclick流的解码处理。即,当从元数据管理器210接收定量的Vclick流已经存储在缓冲器中的通知时,接口处理器207指示元数据管理器210开始向元数据解码器传输Vclick流。元数据管理器210在再现期间从接口处理器接收移动图像的时间戳,从存储在缓冲器中的数据中指定相应于时间戳的Vclick_AU,并将其传输给元数据解码器。
在图41的处理过程中,虽然用户发出再现指令之后在能够浏览到移动图像之前不用保持等待,但是由于Vclick流的解码不是在再现开始之后立即执行,所以存在这样一个问题,即,关于对象的显示还未执行,或者即使点击对象,也不会发生任何操作。
附带地,由于对移动图像再现期间的处理和移动图像停止处理与通用的再现处理相同,所以省略对它们的说明。
(7)在Vclick数据位于客户机设备中的情况中的再现过程
接着,将说明在Vclick数据位于移动图像数据记录媒体231中的情况中的再现处理的过程。
图42是示出了用户对再现开始的再现开始的指令的再现开始处理过程的流程图。首先,在步骤S4200中,由用户输入再现开始的指令。接口处理器207接收该输入并将移动图像再现准备指令发送给移动图像再现控制器205。接着,在步骤S4201中,执行对指定将被使用的Vclick流的处理。在该处理中,接口处理器参考移动图像数据记录媒体231上的Vclick信息文件,并指定相应于用户指示再现的移动图像的Vclick流。
在步骤S4202中,执行在缓冲器中存储Vclick流的处理。为了执行该处理,接口处理器207首先指示元数据管理器210分配缓冲器,虽然将被分配的缓冲器的大小被确定为存储特定Vclick流的有效大小,通常,描述该大小的缓冲器初始化文档记录在移动图像数据记录媒体231中。在没有初始化文档的情况中,则可以应用预先确定的大小。当完成缓冲器的分配时,接口处理器207将指令发送给控制器205以读取特定的Vclick流并将其存储在缓冲器中。
当Vclick流存储在缓冲器中时,接着在步骤S4203中执行再现开始处理。在该处理中时,接口处理器207将移动图像的再现指令发送给移动图像再现控制器205,并同时将指令发送给元数据管理器210以开始将Vclick流发送给元数据解码器。
在移动图像的再现期间,从移动图像数据记录媒体231中读取的Vclick_AU存储在缓冲器209中。将该存储的Vclick流在合适的时间发送给元数据解码器217。即,元数据管理器208参考从元数据管理器210中送出的再现期间的移动图像的时间戳,从存储在缓冲器209中的数据中指定相应于该时间戳的Vclick_AU,并将该指定的Vclick_AU发送给元数据解码器217。元数据解码器217对接收的数据进行解码。然而,不能解码不同于预先由客户机设备选定的摄影机物镜视角的摄影机物镜视角的数据。在已知相应于再现期间的移动图像的时间戳的Vclick_AU已经位于元数据解码器217中,Vclick流可能不发送给元数据解码器。
从接口处理器将再现期间移动图像的时间戳顺序发送到元数据解码器217。该元数据解码器与时间戳同步进行Vclick_AU的解码,并将所需的数据发送给AV再现器218。例如,在由Vclick_AU中描述的属性信息指示的对象区域的显示的情况中,创建掩膜图像和对象区域的轮廓,并在再现期间与移动图像的时间戳同步将其发送给AV再现器218。此外,元数据解码器将再现期间的移动图像的时间戳与Vclick_AU的有效时间进行比较以比较哪一个对象元数据时是不必要的,并删除该数据。
当移动图像在再现期间由用户指示了再现停止时,接口处理器207将移动图像再现的停止指令和Vclick流的读出停止指令发送给控制器205。借助这些指令,结束移动图像的再现。
(8)在Vclick数据位于客户机设备中的情况中的随机访问过程
接着,将说明在Vclick流位于移动图像数据记录媒体231的情况中的随机访问再现过程。
图43是示出了用户对再现开始的随机访问再现的开始的指令的处理过程的流程图。首先,在步骤S4300中,由用户输入随机访问再现的开始指令。作为输入方法,由用户从诸如章节的可访问位置的列表中进行选择的方法、用户从相应于移动图像的时间戳的滑杆指定一个点的方法,或直接输入移动图像的时间戳的方法。接口处理器207接收输入的时间戳,并将移动图像再现准备的指令发送给移动图像再现控制器205。
接着,在步骤S4301,执行指定将被使用的Vclick流的处理。在该处理中,接口处理器参考在移动图像数据记录媒体231上的Vclick信息文件,并指定由用户指示的哪一个相应于该移动图像的Vclick流的再现。此外,接口处理器参考移动图像数据记录媒体231上的Vclick访问表或者将Vclick访问表读入到内存中,并指示在相应于移动图像的随机访问目的的Vclick流中的访问点。
步骤S4302是一个分支处理,其判断当前是否将特定的Vclick流读入缓冲器209中。在其还未读入缓冲器的情况中,在执行步骤S4303的处理之后,处理进行到步骤S4304。在当前已将其读入缓冲器的情况中,则不执行步骤S4303的处理,且处理进行到步骤S4304。在步骤S4304中,开始移动图像的随机访问再现,且开始对Vclick流的解码。在该处理中,接口处理器207将移动图像的随机访问再现指令发送给移动图像再现控制器205,并且同时将该指冷发送给元数据管理器210以开始将Vclick流传输给元数据解码器。其后,与移动图像的再现同步执行Vclick流的解码处理。由于移动图像再现期间的处理和移动图像再现停止处理在通常的再现处理的情况中是相同的,所以省略对它们的说明。
(9)从对相关信息显示的点击开始的过程
接着,将说明在用户使用诸如鼠标的指示装置来点击对象区域的情况中的客户机设备的操作。当用户点击时,将在移动图像上点击的坐标位置输入到接口处理器207中。接口处理器将该时间戳和点击的同时的移动图像的坐标发送给元数据解码器217。从该时间戳和坐标,元数据解码器执行处理以识别由用户指示的对象。
元数据解码器与移动图像的再现同步对Vclick流进行解码。从而,由于产生了点击同时的时间戳的对象区域,所以可以轻松地执行该处理。在多个对象区域位于的点击的坐标上的情况中,对包括在Vclick_AU中的层信息进行参照,并识别最前面的对象。
当识别了用户指定的对象时,元数据解码器217将在对象属性信息403中描述的动作说明(指示操作的脚本)发送给脚本解释器212。具有接收的动作说明的脚本解释器解释操作内容并执行它。例如,显示指定的HTML文件,或者开始对指定的移动图像的再现。HTML文件和移动图像数据可以记录在客户机设备200中,并且可以通过网络从服务器设备201中发送出,或者可以位于网络上的另一个服务器中。
(10)数据结构的详细内容
接着,将说明数据结构的更为特殊的结构实例。如图5所示,Vclick流506包括Vclick流的标题和多个Vclick AU。图11示出Vclick流的标题的数据结构的实例。每个数据元素的意义如下:
“vclick_version”表示Vclick流的标题的开始,并且指明格式的版本;以及
“vclick_length”表示以字节为单位的在Vclick流中的“vclick_length”之后部分的数据长度。
接着,将说明Vclick AU的详细数据结构。在图4中已经说明了Vclick AU的大体数据结构。
图12示出了Vclick AU的标题401的数据结构的实例。每个数据元素的意义如下:
“vau_start_code”表示每个Vclick_AU的开始;
“vau_length”表示以字节为单位的在Vclick_AU的标题中的“vau_length”之后部分的数据长度;
“vau_id”表示Vclick_AU的标识ID,并且通过由表示客户机设备状态的参数以及ID来判断,该Vclick_AU是否应当被解码;
“object_id”表示在Vclick数据中描述的对象的标识码,并且在相同值的“object_id”用在两个Vclick_AU中的情况中,两者在语义上表示相同对象的数据;
“object_subid”表示对象的语义连贯性,且在“object_id”和“object_subid”两者的两个Vclick_AU相同的情况中,它表示两者是连续的(出现在相同的场景中并且相同)对象;
“continue_flag”表示标志(在第一个比特是“1”的情况中,它表示在Vclick_AU中描述的对象区域与在前面的具有相同object_id的Vclick_AU中描述的对象区域是连续的。如果不是,该标志变为“0”。类似地,第二个比特表示Vclick_AU中描述的对象区域和在下一个Vclick_AU中描述的且具有相同object_id的对象区域的连续性);且
“layer”表示对象的层值。当层值很大(和很小)时,它表示对象的位置在屏幕前方。在有多个对象位于点击位置上的情况中,判断具有最大(或最小)层值的对象被点击。
图13示出了Vclick_AU的时间戳402的数据结构的实例。在该实例中,假定将DVD用作移动图像记录媒体204。通过使用后续时间戳,在DVD上指定任意时间的移动图像变得可能,且可以实现移动图像和Vclick数据的同步。每个数据元素的意义如下:
“time_type”表示DVD的时间戳的开始;
“VTSN”表示DVD视频的VTS(视频标题组)号;
“TTN”表示DVD视频的标题域中的标题号,且相应于存储在DVD播放器的系统参数SPRM(4)中的值;
“VTS_TTN”表示DVD视频的标题域中的VTS标题号,且相应于存储在DVD播放器的系统参数SPRM(5)中的值;
“TT_PGCN”表明DVD视频的标题域中的标题PGC(节目链)号,且相应于存储在DVD播放器的系统参数SPRM(6)中的值;
“PTTN”表示DVD视频的部分标题(Part_of_Title)号,且相应于存储在DVD播放器的系统参数SPRM(7)中的值;
“CN”表示DVD视频的单元号;
“AGLN”表示DVD视频的角度号;且
“PTS[s...e]”表示在DVD视频的显示时间戳中的从第七比特到第八比特的数据。
图14示出了Vclick_AU的时间戳跳跃的数据结构的实例。在Vclick_AU中描述的时间戳跳跃取代时间戳描述的情况中,它表示Vclick_AU的时间戳与刚好之前的Vclick_AU的时间戳相同。每个数据元素的意义如下:
“time_type”表示DVD的时间戳跳跃的开始。
图15示出了Vclick_AU的对象属性信息403的数据结构实例。每个数据元素的意义如下:
“attribute_length”表示以字节为单位的在对象属性信息中的“attribute_length”之后部分的数据长度;
“data_bytes”表示对象属性信息的数据部分。在该部分中描述图16中所示的一个或多个属性数据。在图16的“maximum value”的列中指明关于每个属性的可以在一个Vclick_AU中描述的数据最大数量的实例。数据元素“attribute_id”表示包括在每个属性数据中的ID,并且表示用于区分属性的种类。“name”属性表明用于指明对象名称的信息。在“action”属性中,描述当点击移动图像中的对象区域时将执行哪一个动作。“contour”属性表明如何显示对象轮廓的属性。“blinking area”属性指示在对象区域闪烁和显示时的闪烁色彩。在“mosaic area”属性中,说明当对象区域向前并显示时形成镶嵌的方式。“filled-inarea”属性指示当给对象区域涂上颜色并显示时的色彩。
属于“文本”类的属性定义了当想要将字符显示在移动图像上时关于将显示的字符的属性。在“text information”中描述将显示的文本。“text attribute”指示将显示的文本的色彩、字体等属性。“highlight effect”属性指示当该文本的一部分或全部以高亮显示时哪一个字符以何方式进行高亮显示。“blinking effect”属性指示当该文本的一部分或全部以闪烁显示时哪一个字符以何方式进行闪烁显示。在“scroll effect”属性中,其描述当滚动将显示的文本时在哪一个方向上和以何速度执行滚动。在“karaoke effect”属性中,其指示当顺序改变文本的色彩时,应当在何时改变那一种颜色的字符。最后,“layer extension”属性用于定义层值改变的时间和在一个对象的层值在Vclick_AU中改变的情况中它的值。上述属性的数据结构将在下面分别说明。
图17示出了该对象的名称属性的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于名称属性的值设为00h。
“data_length”表示以字节为单位的名称属性数据的“data_length”之后的数据长度;
“language”表示用于说明后续元素(名称和注释)所使用的语言,以及用于指示语言的ISO-639“用于表示语言名称的编码”。
“name_length”表示以字节为单位的“name”元素的数据长度;
“name”表示字符串,并且表示在Vclick_AU中描述的对象的名称;
“annotation_length”表示“annotation”元素的数据长度;以及
“annotation”表示字符串,并且表示关于在Vclick_AU中描述的关于该对象的注释。
图18示出该对象的动作属性的数据结构的实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于“attribute”属性的值设为01h。
“data_length”表示以字节为单位的动作属性数据的“data_length”之后部分的数据长度;
“script_language”表示一种在“scrpt”元素中描述的脚本语言;
“script_length”表示以字节为单位的“script”元素的数据长度;
“script”表示字符串,以及用户指示在Vclick_AU中描述的对象时将被执行的动作,该动作在由“script_language”指定的脚本语言描述。
图19示出了该对象的轮廓属性的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性的类型,且关于“attribute”属性的值设为02h。
“data_length”表示轮廓属性数据的“data_length”之后部分的数据长度;
“color_r”、“color_g”、“color_b”以及“color_a”表示在对象元数据AU中描述的对象的轮廓的显示色彩;
“color_r”、“color_g”和“color_b”分别表示色彩RGB中表示的红、绿和蓝,且“color_a”表示透明;
“line_type”表示在Vclick_AU中描述的对象的轮廓的类型(实线、虚线等);以及
“thickness”表示在Vclick_AU中描述的对象的轮廓的厚度。
图20示出了一个对象的闪烁区域属性的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于闪烁区域属性的值设为03h。
“data_length”表示闪烁区域属性数据的“data_length”之后部分的数据长度;
“color_r”、“color_g”、“color_b”以及“color_a”表示在Vclick_AU中描述的对象的区域的显示色彩(“color_r”、“color_g”和“color_b”分别表示色彩RGB中表示的红、绿和蓝。另一方面,“color_a”表示透明。通过交替显示在填充区域属性中指定的色彩和由该属性指定的色彩而实现对象区域的闪烁);以及
“interval”表示闪烁的时间间隔。
图21示出了该对象的镶嵌区域属性的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于镶嵌区域属性数据的值设为04h。
“data_length”表示镶嵌区域属性数据的“data_length”之后部分的数据长度;
“mosaic_size”表示以像素为单位的镶嵌块的大小;以及
“randomness”表示交换镶嵌块的位置的情况中的随机交换的等级。
图22示出了该对象的镶嵌区域属性的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于镶嵌区域属性数据的值设为04h。
“data_length”表示填充属性数据的“data_length”之后部分的数据长度;
“color_r”、“color_g”、“color_b”以及“color_a”表示在Vclick_AU中描述的对象的区域的显示色彩,且“color_r”、“color_g”和“color_b”分别表示色彩RGB中表示的红、绿和蓝,且另一方面,“color_a”表示透明。
图23示出了该对象的文本信息的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于对象的文本信息的值设为06h。
“data_length”表示以字节为单位的在对象的文本信息中的“data_length”之后部分的数据长度;
“language”表示说明的文本的语言,并且作为语言指示方法,例如可以使用ISO-639“用于表示语言名称的编码”;
“char_code”表示文本的代码类型,以及指定例如,UTF-18/UTF-16/ASCII或者Shift_JIS;
“direction”表示作为排列字符方向的向左方向、向右方向、向下方向,或向上方向(例如,在英文或法文中,通常向左排列。另一方面,在阿拉伯语中,字符向右排列,且在日文中,字符向左或者向下排列。然而,可以指定除为各种语言确定的排列方向之外的方向。此外,还可以指定斜向。):
“text_length”表示以字节为单位的“时间控制的文本”的长度;以及
“text”表示字符串,并且表示使用由“char_code”指定的字符码描述的文本。
图24示出了该对象的文本属性的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于该对象的文本属性的值设为07h。
“data_length”表示以字节为单位的该对象的文本属性中“data_length”之后部分的数据长度;
“font_length”表示以字节为单位的字体的描述符长度;
“font”表示字符串,并且指定当显示文本时使用的字体;以及“color_r”、“color_g”、“color_b”以及“color_a”表示当显示文本时所使用的显示色彩。用RGB来表现色彩,且“color_r”、“color_g”和“color_b”分别表示红、绿和蓝的值,且“color_a”表示透明。
图25示出了该对象的文本高亮效果属性的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于该对象的文本高亮效果属性的值设为08h。
“data_length”表示以字节为单位的该对象的文本高亮效果属性中“data_length”之后部分的数据长度;
“entry”表示在文本高亮效果属性数据中的“highlight_effect_entry”;以及
“highlight_entries”包括“bighlight_effect_entry”的“entry”数。
以下将详细说明“highlight_effect_entry”。
图26示出了该对象的文本高亮效果属性的条目的数据结构实例。每个数据元素的意义如下:
“start_position”表示用从标题到该字符的字符数强调的字符的起始位置;
“end_position”表示用从标题到该字符的字符数强调的字符的结束位置;以及
“color_r”、“color_g”、“color_b”以及“color_a”表示强调之后的字符的显示色彩。用RGB来表现色彩。此外,“color_r”、“color_g”和“color_b”分别表示红、绿和蓝的值,且“color_a”表示透明。
图27示出了该对象的文本高亮效果属性的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于该对象的闪烁效果属性的值设为09h。
“data_length”表示以字节为单位的该对象的文闪烁效果属性中“data_length”之后部分的数据长度;
“entry”表示在文本闪烁效果属性数据中的“blink_effect_entry”数目;以及
“blink_entries”包括“blink_effect_entry”的“entry”数目。
以下将详细说明“blink_effect_entry”的。
图28示出了该对象的文本闪烁效果属性的条目的数据结构实例。每个数据元素的意义如下:
“start_position”表示按从标题该字符的字符数闪烁的字符的起始位置;
“end_position”表示按从标题到该字符的字符数闪烁的字符的结束位置;以及
“color_r”、“color_g”、“color_b”以及“color_a”表示闪烁字符的显示色彩(用RGB表现色彩。此外,“color_r”、“color_g”和“color_b”分别表示红、绿和蓝的值,且“color_a”表示透明。通过交替显示这里指定的色彩和由文本属性指定的色彩而实现字符的闪烁);以及
“interval”表示闪烁的时间间隔。
图29示出了该对象的文本滚动效果的条目的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于对象的文本滚动效果属性数据的值设为0ah。
“data_length”表示以字节为单位的在对象的文本滚动效果属性数据中的“data_length”之后部分的数据长度;
“direction”表示字符的滚动方向,例如,0表示从右至左,1表示从左至右,2表示从上至下,且3表示从下至上;且
“delay”表示在显示将显示的第一个字符到最后一个字符的显示之间的时间差所表示的滚动速度。
图30示出了该对象的文本伴唱(卡拉OK,karaoke)效果属性条目的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于该对象的文本伴唱(卡拉OK,karaoke)效果属性的值设为0bh。
“data_length”表示以字节为单位的文本伴唱(卡拉OK,karaoke)效果属性中“data_length”之后部分的数据长度;
“start_time”表示由包括在属性数据的“data_bytes”中的第一个“karaoke_effect_entry”指定的字符串的字符色彩的改变开始时间;
“entry”表示在文本伴唱(卡拉OK,karaoke)效果属性数据中的“karaoke_effect_entry”数目;以及
“karaoke_entries”包括“karaoke_effect_entry”的“entry”数。
以下将详细说明“karaoke_effect_entry”的。
图31示出了该对象的文本伴唱(卡拉OK,karaoke)效果属性的条目(“karaoke_effect_entry”)的数据结构实例。每个数据元素的意义如下:
“end_time”表示由该条目指定的字符串的字符色彩的变化结束时间,且在该条目之后存在一个条目时,它还表示由下一个条目指定的字符串的字符色彩的变化开始时间;
“start_position”表示按从标题到该字符的字符数改变的字符色彩的字符串的第一个字符的位置;
“end_position”表示按从标题到该字符的字符数改变的字符色彩的字符串的最后字符的位置。
图32示出了该对象的层属性扩展的数据结构实例。每个数据元素的意义如下:
“attribute_id”表示属性数据的类型,且关于该对象的层属性扩展数据的值设为0ch。
“data_length”表示以字节为单位的层属性扩展数据中“data_length”之后部分的数据长度;
“start_time”表示由包括在属性数据的“data_bytes”中的第一个“layer_extension_entry”指定的层值变得有效时的开始时间;
“entry”表示包括在层属性扩展数据中的“layer_extension_entry”数目;以及
“layer_entries”包括“layer_extension_entry”的“entry”数目。
以下将详细说明“layer_extension_entry”的。
图33示出了该对象的层属性扩展的条目(“layer_extension_entry”)的数据结构实例。每个数据元素的意义如下:
“end_time”表示当由“layer_extension_entry”指定的层值变得无效时的时间,且在该条目之后存在一个条目时,它同时还表示由下一个条目指定的层值变得元效时的时间;以及
“layer”表示该对象的层值。
图34示出了该对象无数据的AU的对象区域数据400的数据结构实例。每个数据元素的意义如下:
“vcr_start_code”表示对象区域的数据的起始;
“data_length”表示以字节为单位的在对象区域数据中“data_length”之后部分的数据长度;
“data_bytes”表示描述对象数据的数据部分。例如,MPEG-7的“Spatio Temporal Locator”的二值格式可以用于对象区域的说明。
(11)背景对象
(11-1)访问单元的结构
图46示出了根据本发明的访问单元的结构实例。
标题401包括指出屏幕上的对象区域数据的重叠顺序的层值数据(图12的层)。例如,当层值数据是0时,访问单元是背景对象,且在如图46所示的情况中,访问单元仅包括时间戳402和对象属性信息403。在除在对象属性信息403中描述这样一个动作,即当指定在当时存在的对象之外的区域时所发生的动作。在层值不为0的情况中,访问单元的结构与图4相同。由于前面已经说明了标题401、时间戳402和对象属性信息403,所以详细说明将被省略。
(11-2)访问单元的解码过程
图47示出了根据本发明的访问单元的解码过程。
首先,在S4701中读出标题,且接着在S4702读出时间戳。然后,在S4703读出对象属性信息,且过程进行到S4704。在S4704中,检验包括在标题部的层值,当为0时,处理结束,且当不是0时,过程进行到S4705。在S4705中,对对象区域数据进行解码。
图45示出了当用户用鼠标指针101指示除对象区域102之外的区域的情况。例如,这样的状况发生,在虽然想要指示对象102,它却高速移动,以致指示点发生改变。此时,自然不执行相应于对象102的动作。此外,在没有背景区域的访问单元的情况中,则没有动作发生。用户不期望没有任何事发生,且存在误解设备发生故障的可能性。
从而,使用背景区域的访问单元,例如,且当显示了,“选定了对象之外的区域”,或者“在该部分中没有任何信息”,或者显示不相应于该对象102却关于该视频内容的信息时,则不会发生前述误解。其表现在用户再次小心地指示该对象102。同样在指示虽然显示在屏幕上却未设置对象区域的一个人的情况中,“在该部分中没有任何信息”,以使得用户立刻明白。可替换的,当设置该动作以使得当指示背景时显示该系统的操作方法时,用户可以立即通过有意识地点击背景而理解操作方法。虽然可以想到一种方法,即当指示背景时由客户机设备预先确定的动作,该动作包括在元数据中,以使得可以反映内容产生器的目的。
当然,当由用户指示背景时,可以显示关于背景本身的信息。例如可能呈现关于视频发生的位置和地点的信息,或者当场景发生在建筑物中时可能显示建筑物的信息。此外,将该背景解释为整个视频场景,且当指示该背景时,可以显示关于该视频场景的说明和相当于该场景的故事。
(11-3)当指示屏幕上的一个点时的处理过程
图48示出了当指示屏幕上的一个点时的处理过程。
首先,255可代替在S4801中的变量i。其次,在S4802中检测指示点(点击点)是否在层为i(layer=i)的对象区域中。当该点不在对象区域中时,过程进行到S4803,且当其位于对象区域中时,过程进行到S4805。在S4803中,i的值逐一减少1。接着,在S4804中判断i是否是0。当i不是0时,过程返回S4802,且当是0时,过程进行到S4805。在S4805中,执行相应于层为i(layer=i)的访问单元中描述的动作。根据该处理,在位于点击点的对象之中,选择一个具有最大层值的对象,且执行相应于此的动作。当点击点不包括在任何对象中时,层为0(layer=0),即执行背景的动作。
(11-4)背景对象的改进实例
这里,表示背景区域的层值不限于0。例如,可以是255。在该情况中,在图48的S4801中使得i=0,其在S4803中使得i=i+1,此外,i在S4804中与255相比。
此外,还有一种方法,即不用层,而是用图12的object_id来表现背景区域。当object_id是确定值时,判断访问单元是背景区域。
(12)改进实例
本发明并不严格限于前述实施例,且在实践阶段,结构元件可以有各种变型,且可以在不脱离本发明精髓的范围内进行改变。
例如,本发明不仅可以应用于现今全球普及的DVD-ROM视频中,还可以应用于需求在近年来迅速增长的可记录/可再现DVD-VR中。此外,本发明还可以应用于将在不久的将来变得普及的下一代HD-DVD的再现系统或者记录和再现系统中。
此外,通过适当地组合在该实施例中公开的多个结构元件,可以构造出各种发明。例如,可以从所有在该实施例中公开的结构元件中删除一些结构元件。此外,还可以适当组合一些不同实施例的结构元件。
Claims (6)
1、一种关于移动图像的元数据的数据结构,包括:
流数据结构,其包括一个或多个访问单元,每个访问单元均能够被独立地处理,
其中每个访问单元包括:
第一数据,用于指定关于移动图像的时间轴定义的有效周期;
对象区域数据,其描述移动图像中的时空域;
第二数据,包括用于指定与时空域有关的显示方法的数据和用于指定当指定了时空域时将要执行的处理的数据中的一种或两种都包括:
背景对象辨别数据,用于指示时空域是否关于指示移动图像背景的背景对象,且
其中当背景对象辨别数据指示背景对象时,访问单元不包括对象区域数据。
2、根据权利要求1的元数据的数据结构,其中
背景对象辨别数据是在屏幕上指示对象区域数据的叠加次序的层值数据,且
当层值数据是预先确定的值时,将时空域辨别为背景对象。
3、根据权利要求1的元数据的数据结构,其中
背景对象辨别数据是辨认访问单元的对象的对象辨别数据,且
当对象辨别数据是预先确定的值时,将时空域辨认为背景区域。
4、一种元数据处理方法,
其中关于移动图像的元数据具有包括一个或多个访问单元的流数据结构,其中每个访问单元为能够被独立处理的数据单元,
其中每个访问单元包括:
第一数据,用于指定关于移动图像的时间轴定义的有效周期;
对象区域数据,其描述移动图像中的时空域;
第二数据,包括用于指定与时空域有关的显示方法的数据和用于指定当指定了时空域时将要执行的处理的数据中的一种或两种都包括;
背景对象辨别数据,用于指示时空域是否关于指示移动图像背景的背景对象,且
其中元数据的处理方法包括如下步骤,当相应于包括由用户指示的点击点的时空域的访问单元的背景区域辨别数据是关于背景对象的数据时,执行预先确定的关于背景对象的处理。
5、一种使得计算机实现元数据处理方法的程序,
其中关于移动图像的元数据具有包括一个或多个访问单元的流数据结构,其中每个访问单元为能够被独立处理的数据单元,
其中每个访问单元包括:
第一数据,用于指定关于移动图像的时间轴定义的有效周期;
对象区域数据,其描述移动图像中的时空域;
第二数据,包括用于指定与时空域有关的显示方法的数据和用于指定当指定了时空域时将要执行的处理的数据中的一种或两种都包括;
背景对象辨别数据,用于指示时空域是否关于指示移动图像背景的背景对象,且
其中元数据的处理方法的程序实现如下功能,当相应于包括由用户指示的点击点的时空域的访问单元的背景区域辨别数据是关于背景对象的数据时,执行预先确定的关于背景对象的处理。
6、一种元数据处理设备,
其中关于移动图像的元数据具有包括一个或多个访问单元的流数据结构,其中每个访问单元为能够被独立处理的数据单元,
其中每个访问单元包括:
第一数据,用于指定关于移动图像的时间轴定义的有效周期;
对象区域数据,其描述移动图像中的时空域;
第二数据,包括用于指定与时空域有关的显示方法的数据和用于指定当指定了时空域时将要执行的处理的数据中的一种或两种都包括;
背景区域辨别数据,用于指示时空域是否关于指示移动图像背景的背景对象,且
其中元数据的处理设备包括执行如下操作的单元,当相应于包括由用户指示的点击点的时空域的访问单元的背景区域辨别数据是关于背景对象的数据时,执行预先确定的关于背景对象的处理。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004217962A JP2006041844A (ja) | 2004-07-26 | 2004-07-26 | メタデータのデータ構造及びそのメタデータの処理方法 |
JP2004217962 | 2004-07-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1770865A true CN1770865A (zh) | 2006-05-10 |
CN100468403C CN100468403C (zh) | 2009-03-11 |
Family
ID=35758628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005101249934A Expired - Fee Related CN100468403C (zh) | 2004-07-26 | 2005-07-26 | 图像再现设备 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20060031244A1 (zh) |
JP (1) | JP2006041844A (zh) |
CN (1) | CN100468403C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108873860A (zh) * | 2018-05-31 | 2018-11-23 | 梧州井儿铺贸易有限公司 | 一种服务机器人的数据采集系统 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005318471A (ja) * | 2004-04-30 | 2005-11-10 | Toshiba Corp | 動画像のメタデータ |
CN101490738A (zh) * | 2006-08-02 | 2009-07-22 | 松下电器产业株式会社 | 视频显示装置和视频显示方法 |
JP6270086B1 (ja) * | 2017-06-12 | 2018-01-31 | パロニム株式会社 | 動画再生プログラム、動画再生装置、動画再生方法及び動画配信システム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5687249A (en) * | 1993-09-06 | 1997-11-11 | Nippon Telephone And Telegraph | Method and apparatus for extracting features of moving objects |
US5802361A (en) * | 1994-09-30 | 1998-09-01 | Apple Computer, Inc. | Method and system for searching graphic images and videos |
TW303570B (zh) * | 1995-09-29 | 1997-04-21 | Matsushita Electric Ind Co Ltd | |
US6091772A (en) * | 1997-09-26 | 2000-07-18 | International Business Machines, Corporation | Black based filtering of MPEG-2 compliant table sections |
TWI230858B (en) * | 2000-12-12 | 2005-04-11 | Matsushita Electric Ind Co Ltd | File management method, content recording/playback apparatus and content recording program |
US7110569B2 (en) * | 2001-09-27 | 2006-09-19 | Koninklijke Philips Electronics N.V. | Video based detection of fall-down and other events |
US7409644B2 (en) * | 2003-05-16 | 2008-08-05 | Microsoft Corporation | File system shell |
JP2006050275A (ja) * | 2004-08-04 | 2006-02-16 | Toshiba Corp | メタデータの構造及びその再生方法 |
-
2004
- 2004-07-26 JP JP2004217962A patent/JP2006041844A/ja active Pending
-
2005
- 2005-04-07 US US11/100,540 patent/US20060031244A1/en not_active Abandoned
- 2005-07-26 CN CNB2005101249934A patent/CN100468403C/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108873860A (zh) * | 2018-05-31 | 2018-11-23 | 梧州井儿铺贸易有限公司 | 一种服务机器人的数据采集系统 |
Also Published As
Publication number | Publication date |
---|---|
JP2006041844A (ja) | 2006-02-09 |
US20060031244A1 (en) | 2006-02-09 |
CN100468403C (zh) | 2009-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1735199A (zh) | 元数据的数据结构及其再现方法 | |
CN1717054A (zh) | 元数据的数据结构及其复制方法 | |
CN1820269A (zh) | 运动图像中对象的元数据流的数据结构,及其搜索方法和重放方法 | |
CN1260970C (zh) | 用于多媒体光盘的记录方法、再生装置及再生方法 | |
CN1222177C (zh) | 用于记录或再现数据的信息记录装置及方法 | |
CN1240217C (zh) | 与信息介质一起使用的增强导航系统及使用该系统的方法 | |
CN1099806C (zh) | 多媒体光盘及其再生装置、再生方法 | |
CN1237822C (zh) | 光盘、光盘记录方法和装置,以及光盘再现方法和装置 | |
CN1735206A (zh) | 元数据和再现设备的结构以及制造这种设备的方法 | |
CN1694521A (zh) | 用于运动图像的元数据 | |
CN1617575A (zh) | 再现设备和再现方法 | |
CN1694520A (zh) | 用于运动图像的元数据 | |
CN1121675C (zh) | 数据通信系统的数据变换装置 | |
CN100351911C (zh) | 根据交互控制实现意外性场景展开的多媒体光盘再生装置 | |
CN1700331A (zh) | 信息记录媒介、向/从记录媒介记录/重放信息的方法 | |
CN1306483C (zh) | 信息再现装置及信息再现方法 | |
CN1674134A (zh) | 信息记录介质,把信息记录到记录介质上/从记录介质重放信息的方法 | |
CN1925049A (zh) | 使用信息存储介质的信息重放系统 | |
CN1767609A (zh) | 用于运动图像的元数据的搜索表 | |
CN101053033A (zh) | 信息存储介质、信息再现设备、和信息再现方法 | |
CN1757074A (zh) | 再现设备、再现方法、再现程序、和记录介质 | |
CN1738430A (zh) | 活动图像的元数据的数据结构及其再现方法 | |
CN1754225A (zh) | 记录介质、再现设备、记录方法、再现方法以及计算机程序 | |
CN1906694A (zh) | 再现装置、再现方法、程序、记录介质和数据结构 | |
CN1449189A (zh) | 提高进行交互式再生的性能的多媒体光盘、再生装置和再生方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090311 Termination date: 20120726 |