CN101401060B - 内容访问树 - Google Patents

内容访问树 Download PDF

Info

Publication number
CN101401060B
CN101401060B CN200680053766XA CN200680053766A CN101401060B CN 101401060 B CN101401060 B CN 101401060B CN 200680053766X A CN200680053766X A CN 200680053766XA CN 200680053766 A CN200680053766 A CN 200680053766A CN 101401060 B CN101401060 B CN 101401060B
Authority
CN
China
Prior art keywords
scene
frame
fragment
simplified image
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200680053766XA
Other languages
English (en)
Other versions
CN101401060A (zh
Inventor
哈桑·H·沃顿-阿利
阿南德·卡普尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN101401060A publication Critical patent/CN101401060A/zh
Application granted granted Critical
Publication of CN101401060B publication Critical patent/CN101401060B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/322Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 

Abstract

公开了一种用于通过图形用户界面(301)中的分级格式(100)可视化、处理和编码视频流数据的系统(600)和方法,其中至少一个片段简化图像(306)代表视频流的顺序部分,每个片段具有至少一个场景;至少一个场景简化图像(309)代表每个片段中的场景,每个场景具有至少一个帧;以及显示至少一个帧简化图像(314),每个帧简化图像代表该场景中的帧。该系统和方法还包括显示允许用户编码该视频流的至少一部分的按钮(606)。在该系统中,至少一个片段是活动片段(307),并且所显示的场景是该活动片段(307)的一部分。另外,一个场景是活动场景(307),并且所显示的帧是该活动场景(307)的一部分。

Description

内容访问树
相关申请的交叉引用
本申请要求于2006年3月9日提交的、美国临时申请序列号为第60/780,818号的权益,其整体以引用的方式并入本文。
技术领域
本原理一般涉及图像显示系统和方法,更具体地,涉及用于对视频流的片段、场景和各个帧的图像和属性进行分类并显示的系统和方法。
背景技术
近来,消费视频产品已从模拟盒式磁带演变为数字格式。数字视频光盘(DVD)形式的视频是目前最流行的格式。近来已引入了新的较高密度的视频格式,例如Blu-RayTM和高清晰度数字视频光盘(HD-DVD)。
被翻译成某一格式以供消费者使用的数字视频数据在出售之前一般被数字压缩并编码。通常,该编码包括某种形式的压缩。在DVD的情况下,使用MPEG-2标准来对视频进行编码。另外,Blu-RayTM和HD-DVD格式也将数据以编码后的形式存储在光盘上。但是,由于压缩系统的复杂性,以及期望达到最高压缩同时又保持最高的视频质量,因此必须进行一次对一帧或一个场景的大量编码。通常,特征长度的戏剧发行物的Blu-RayTM和HD-DVD压缩可以花去8小时以上的时间来编码。
在视频场景被编码后,为了精确,产生的编码后的视频必须被校验。一般来说,具有大量运动物体的场景需要较低的编码速率,以确保编码后的帧每个都正确显示在最终的产品中。因此,通常使用用于查看和编码视频的软件程序。
传统上,与图像制作工作有关的大多数用户界面包括两个主要的特征:时间轴(timeline)和预览窗口。一般来说,当用户通过沿着时间轴的轴来移动时间轴光标直到期望的帧出现在预览窗口中,从而使用时间轴来随机访问单个不同的帧时,用户能够仅查看来自视频内容流的一帧。尽管这为用户提供了对视频流内容的随机访问,但是其需要用户注意时间轴和预览窗口两者。另外,用户必须通过滚动时间轴来搜索特定的帧或场景。这样的访问效率低下又可以是耗时的。
2003年4月22日公告的Ishikawa的美国专利No.6,552,721描述了一种用于切换包括由正被编辑的文件参考的多组节点的文件显示器(file scope)的系统。另外,场景图编辑工具允许用户显示参考正被编辑的VRML内容的节点的分级树格式。
2004年8月10日公告的Bates等人的美国专利No.6,774,908公开了一种用于允许用户指定连续帧中要被跟踪的视频帧的部分以使得可以补偿重放、照明和解压缩的质量的图像处理系统。
2006年1月26日提交的Stark等人的美国专利申请No.20060020962公开了一种用于展示与各种形式的多媒体内容有关的信息的图形用户界面。
1999年10月14日提交的French等人的美国专利申请No.1999052050公开了使用说明相关可视元素的时间和空间值的图来代表可视场景。French等人的申请还公开了通过缩放和剪辑时间事件时刻来进行可视场景数据的时间变换。
没有现有技术提供用于高效并随机地访问视频流的已知部分的任何系统和方法。所需要的是能够以分级方式显示视频内容数据的用户友好界面。另外,这样的用户界面应当允许用户或者自动或者手动地将场景、帧等分成逻辑组,这些逻辑组可以基于被这样的场景或帧包括的可视数据的属性来被访问和分析。由于处理完整的特征长度的视频所需的时间,理想的系统也将允许用户有选择地处理视频的任何部分并显示故事情节以便高效导航。
发明内容
本原理的目的在于以分级式显示视频内容的各部分。
根据本发明的一方面,提供了一种如下的方法:表示具有至少一个片段的视频流的一部分,该片段具有至少一个场景,该场景具有至少一个帧;以及格式化该至少一个片段、场景和帧,以使得该视频流的至少一个片段被指定为活动片段,并且用于显示的场景是该活动片段的一部分。
根据本发明的另一方面,提供了一种用户界面,其通过分级格式来处理并编码视频流数据。该分级格式包括:代表来自视频流的多个场景的至少一个类(class)缩略(thumbnail)图像,每个类缩略图像具有至少一个相关信息条;代表类中的场景的至少一个场景缩略图像,每个场景具有至少一个帧,每个场景缩略图像具有至少一个相关信息条;至少一个帧缩略图像,每个帧缩略图像代表场景中的帧,每个帧缩略图像具有至少一个相关信息条。此外,此方面可以包括显示相关缩略图像的帧号、帧时间和类信息的每个信息条。
根据本发明的另一方面,提供了一种用于通过分级格式在图形用户界面中显示视频流数据的方法,该方法包括:显示代表场景的至少一个场景缩略图像,每个场景具有至少一个帧;显示至少一个帧缩略图像,每个帧缩略图像代表所述场景中的帧;以及显示至少一个类别(category),每个类别具有至少一个场景。此方面还可以包括:显示代表顺序数字图像的片段的至少一个片段缩略图像,每个片段具有至少一个场景,其中所显示的每个场景是片段的一部分。在这个方面中,该方法可选地包括加载视频流数据,自动确定每个片段的起始和末尾,以及自动确定每个场景的起始和末尾。此方面还可以包括:显示至少一个用于允许用户对视频流的至少一部分进行编码的按钮。
附图说明
在考虑了现在将结合附图详细描述的示范性实施例时,本原理的优点、特性和各个附加特征将变得更加完整,附图中:
图1是根据本原理的实施例的内容访问树的元素层级的示范性实施例的框图;
图2是根据本原理的一个实施例的通过内容访问树显示视频内容的示范性系统的流程图;
图3是根据本原理的显示和处理内容访问树的数据的配置的示范性实施例的框图;
图4是示出根据本原理的单个内容访问树元素的详细示范性实施例的框图;
图5是示出包含本原理的用户界面的详细示范性实施例的图;
图6是根据本原理的用于显示和处理内容访问树的数据的配置的替换详细示范性实施例的框图。
应当理解,附图是用于示出本原理的构思的目的,不必须是示出本原理的仅仅可能的配置。
具体实施方式
本原理提供一种用于以可分级访问树显示来自视频流的图像以及允许编码和随后的视频质量的评估和处理的系统和方法。
应当理解,根据视频显示系统来描述本原理;但是,本原理的范围宽得多并且可以包括能够显示或进行用户交互的任何数字多媒体系统。此外,本原理可应用于任何视频显示或编辑方法,包括由计算机、电话、机顶盒、卫星链路等显示的数据的处理。根据个人计算机来描述本原理;但是,本原理的构思可以被扩展到其它交互式电子显示设备。
应当理解,附图中所示的元件可以被实现为各种形式的硬件、软件或它们的结合。优选地,这些元件被实现为一个或多个适当编程的通用设备上的硬件和软件的结合,这些设备可以包括处理器、存储器和输入/输出接口。
本说明书示出了本原理。因而应当理解,本领域技术人员将能够设计尽管这里没有明显描述或示出、但是包含本原理并包括在其精神和范围之内的各种配置。
这里所述的所有示例和条件语言是为了教导目的,以便帮助读者理解本原理和发明人为促进本领域技术发展做出贡献的构思,以及应当被理解为不限于这样特定描述的示例和条件。
此外,这里描述本原理的原理、方面和实施例的所有描述及其特定示例意欲包含其结构和功能等价物二者。另外,这样的等价物意欲包括当前已知的等价物以及将来发展的等价物,即任何执行相同功能的发展的元件,而不管其结构如何。
因而,例如本领域技术人员应当理解,这里所示出的框图代表包含本原理的原理的示范性模块的构思图。相似地,应当理解,任何流程表、流程图、状态转换图、伪代码等代表各种基本上可以表示在计算机可读介质中并因而由计算机或处理器执行的过程,而不管这样的计算机或处理器是否被明显地示出。
可以通过使用专用硬件以及能够联合适当的软件执行软件的硬件来提供图中所示的各个元素的功能。当由处理器提供时,可以由单个专用处理器、单个共享处理器或其中的一些可以共享的多个单独处理器来提供这些功能。此外,术语“处理器”或“控制器”的明显使用不应当被解释为专指能够执行软件的硬件,其可以非限制性地暗含包括数字信号处理器(DSP)硬件、用于存储软件的只读存储器(ROM)、随机存取存储器(RAM)以及非易失性存储器。另外,当在显示器上提供时,该显示器可以是用于呈现可视信息的任意类型的硬件,其可以非限制性地包括CRT、LCD、等离子体或LED显示器、有机或非有机、以及任何其它已知或还未被开发出来的显示设备。
这里描述的编码或压缩功能可以采用任何形式的数字兼容编码或压缩。这可以包括、但不限于任何MPEG视频或音频编码、任何无损或有损压缩或编码、或任何其它私有或开放标准编码或压缩。还应当理解,术语编码和压缩可以互换使用,这两个术语都指准备数据流为由任意类型的数字软件、硬件或软件和硬件的结合读取。
也可以包括其它传统的和/或定制的硬件。相似地,附图中所示的任何开关、按钮或判决块只是概念性的。它们的功能可以通过程序逻辑的操作、通过专用逻辑、通过程序控制和专用逻辑的交互、或者甚至是手动地执行,具体的技术可由实施者来选择,其从上下文可以更具体地理解。
在其权利要求中,被表达为用于执行特定功能的装置的任何元件意欲包含执行该功能的任何方式,包括例如a)执行该功能的电路元件的结合或b)任何形式的软件,因此包括固件、微代码等,其与用于执行该软件的适当的电路结合以执行该功能。由这样的权利要求限定的本原理归于这样的事实:由各种所述装置提供的功能以权利要求要求的方式结合和集合在一起。因而应当认为任何能够提供这些功能的装置等效于这里所示出的那些装置。
现在详细参照附图,其中贯穿几个视图中,相似的参考数字指代相似或相等的元件。首先参照图1,描述了根据本原理的实施例的内容访问树的元素层级100的示范性实施例的框图。首先,对至少一个完整的视频流101进行操作。该完整的视频流可以包括多个文件并且也可以是较大视频流的一部分。
开始时,应当注意,完整的视频流101包括一组片段102,其中每个片段103继而包括一组场景104,其中每个场景105继而包括一组帧106。
完整的视频流101包括一组片段102,组102具有多个片段103,其中片段103的总数包含原始的完整视频流101的整体。
片段103可以是完整视频流101的一部分的线性表示。例如,每个片段可以默认地代表五分钟的视频流,或者可以代表完整视频流101的至少五分钟,但是在五分钟标记之后的第一个场景末尾处结束。用户可以决定默认的片段长度,用户也可以编辑自动产生的片段周期。此外,片段可以代表固定数量的场景,或者其它合理的分组。
例如,在一个有用实施例中,每个片段可以是基于相似的视频属性被分类的场景105的非线性类别。在另一个有用实施例中,每个片段103可以是包括一组根据任意其它准则逻辑分类的场景104的类。
每个片段103包括一组场景104,其中该组场景104包括多个单独的场景105。在一个有用实施例中,该场景可以代表完整视频流101的连续、线性部分。
相似地,每个场景105包括一组帧106,该组106包括多个单独的帧107。在一个具体的有用实施例中,每个帧107是标准视频帧。
参照图2,描述了用于以分级格式产生和显示视频流的内容的系统200的示范性实施例的流程图。该系统200在块201中可以具有非交互部分,在块202中具有交互部分。
组成该系统结构的单独的块组件的细节对本领域技术人员是公知的,将仅对其详细描述到足以理解本原理即可。
在该系统的块201中的非交互部分中,该系统可以在块203中输入视频内容,在块204中产生视频内容数据,以及在块205中产生内容访问树的数据。块201中该系统的非交互部分可以以自动式执行,或者可以已经存在,例如由系统200的先前操作来创建,或者由其它辅助或单机系统来创建。
当在块203中输入视频内容时,该视频内容可以被加载到存储介质中,例如但是不限于加载到随机存取存储器(RAM)、任意类型的计算机可存取存储介质、计算机网络或实时馈入中。系统200然后可以在块204中产生视频内容数据。在块204中的此产生步骤可以包括检测场景,产生直方图,基于颜色、场景的相似度、比特率、帧分类来对场景和帧进行分类,以及产生缩略图。目前,用于自动检测场景之间的转换的软件和算法被频繁使用,并且对本领域技术人员是公知的。
该系统还可以在块205中产生可用于显示内容访问树的数据。该数据可以包括但是不限于例如产生管理数据元素之间的关系所需的索引、标记或其它数据,用于当显示视频内容时默认显示选项,或者用于注解任何视频数据。在块204和205中产生的任何数据也可以被保存以用作将来使用或再使用,这样的保存可以在产生过程期间的任何时刻发生。这样的保存特征对本领域技术人员来说是显而易见的,因此可以以任何已知方式或未开发的方式来实现。
系统200的交互部分、即块202然后可以对先前由块201中的非交互部分准备的数据进行操作。内容访问树系统200可以在块206中输入由系统200的块201中的非交互部分产生的数据。显示的数据可以在块207中采用线性的形式或时间轴表示,并且在块209中也可以包括逻辑类别和/或分类显示。在一个有用实施例中,显示时间轴表示和逻辑表示二者以使得用户可以手动对根据时间轴选择的场景进行分类。
当在块208产生时间轴表示时,显示时间轴,根据该时间轴,在块209中允许对片段、场景和帧进行随机访问。在块211中,视频片段、场景和帧作为显示元素显示给用户。
当在块209中产生逻辑(分类)表示时,显示类别或类的表示,并且在块210中允许随机访问。表示可以由用户改变或定义,或者可以可替换地自动产生。
例如,可以利用用户界面向用户展示自动分类后的类或场景,其中用户界面允许对类或场景的自动分类的手动改变。
在块207中的线性(时间轴)表示和块209中的逻辑(分类)表示两者的情况下,则在块211中显示片段、场景和帧。在一个有用实施例中,片段可以被做成活动的,其中场景从活动的片段开始显示,以及场景可以被做成活动的,以使得显示的帧将依赖该活动的场景。
另外,可以在块212中显示视频数据。在具体的有用实施例中,该视频数据可以是每个场景和片段的类别或分类属性。在另一个具体有用的实施例中,可以显示与每个帧有关的数据。在一个实施例中,这可以利用颜色数据、帧比特率数据或任何其它有用的数据的形式。
然后在块213中允许用户导航并选择显示器内的数据。在一个有用实施例中,可以允许用户选择活动的片段,其中所显示的场景和帧改变为反映活动片段的内容。相似地,在此有用实施例中,用户可以通过选择来改变活动场景,例如通过在期望的场景上点击鼠标,从而使得帧包括新选择的要被显示的活动场景。
在块214中,用户可以修改与每个片段、场景、帧或类别有关的数据。在一个有用实施例中,每个类别可以具有与其相关的默认参数,例如但是不限于颜色信息、编码比特率等等。在一个这样的有用实施例中,默认参数可以是这样的参数:当场景增加到类别中时,默认参数被应用于新增加的场景。用户也可以在块214中将场景合并到类别中。在一个有用实施例中,包括多个场景的类别可以在编码过程期间被类似对待。在另一个有用实施例中,用户也可以改变场景标记,也就是,指示哪些帧属于场景,而不考虑自动场景检测过程。
在块213中用户有机会导航可用的视频数据并且在块214中做出任何修改之后,用户可以在块215中编码或再编码任意一个或所有片段、场景或类别。编码或再编码过程可以发生在远程计算机上,或者可以发生在用户的计算机终端上。在一个有用实施例中,片段、场景或类别排队等候编码。当特定部分正被编码或再编码时,用户然后可以查看并验证视频数据的其它部分。可以为场景的编码分配优先级,以允许编码以非线性的方式进行。在块215的编码和再编码后,然后再次显示新编码的片段、场景或类别。在一个有用实施例中,用户然后可以验证在块215中的编码或再编码适当发生,其中编码后的视频部分适当显示。在用户对所有视频场景已被适当编码满意并且用户不再需要在块214中执行数据的修改之后,在块216中完成视频编码工作。在一个有用实施例中,然后可以将视频放置于主光盘上,用于再现介质的复制和随后出售。
现在参照图3,描述了用于以分级格式显示视频流的内容的界面300的示范性实施例的图。组成该系统结构的单独组件的细节对本领域技术人员是已知的,将仅对其详细描述足以理解本原理即可。诸如菜单、按钮以及其它类似交互项的可选界面元素对本领域技术人员来说是已知可以互换的,并且不意欲限制本原理。
界面300的元素显示在可查看的显示区域301或显示器内。在一个具体有用的实施例中,显示器301可以是但不限于,连接到个人计算机的计算机监视器、膝上型计算机屏幕等等。该显示器可以包括代表完整视频流的时间顺序的时间轴302和显示的片段、场景和帧代表的时间点。时间轴可以包括时间轴指示器304,其代表当前活动的片段或类以及场景的位置。可以手动移动时间轴指示器304以访问与时间轴指示器304移动到的时间对应的片段和场景。时间轴302还可以包括时间轴条303,其代表视频流内容的长度总数。
一个具体有用的实施例可以包括显示包括多个片段显示元素306的一组片段显示元素305的显示器。该片段显示元素306可以显示缩略图或代表片段的其它可视信息。另外,片段显示元素306之一可以具有一个或多个附加可视元素307,以指示由片段显示元素306表示的片段是活动片段,场景309是该活动片段的一部分。在一个有用实施例中,指示活动片段的附加可视元素307可以是活动片段周围的框(block)、轮廓或有色背景。在另一个有用实施例中,附加可视元素307可以用于指示活动场景或帧。
该组片段也可以具有与该组相关的一组或多组导航按钮310。每组导航按钮310可以包括单个移动按钮312和跳跃按钮311。该单个移动按钮312可以左右滚动作为场景组308的一部分被显示的场景,以允许用户访问作为活动片段或类的一部分但是未被显示的场景。另外,跳跃按钮311可以允许用户直接前进到片段的起始或末尾处的场景。在一个具体有用的实施例中,当在片段或类中的场景数超过可用于显示场景的空间时,这些按钮可以是有用的。另外,一组这样的导航按钮可以与场景和帧相关,并且也可以用于滚动场景以及帧。
一个具体有用的实施例也可以包括显示包括多个场景显示元素309的一组场景显示元素308的显示器。该显示的场景是来自于当前活动的片段或类的场景,并且可以用附加可视元素307来表示。该场景显示元素309可以显示缩略图或代表场景的其它可视信息。另外,场景显示元素309之一可以具有一个或多个附加可视元素307,以指示由场景显示元素309表示的场景是活动场景,显示的场景314是该活动场景的一部分。
在另一个具体有用的实施例中,该显示器也可以显示具有多个帧显示元素314的一组帧313,每个元素显示不同的帧。在帧显示元素314中所示的帧是来自于活动场景的帧,并且通过演变(descendancy)也来自于活动片段或类。
另一个具体有用的实施例可以包括具有多个直方图316的一组直方图315。每个直方图可以与单独的帧显示元素314对应,并且可以显示与帧显示元素314中显示的帧有关的信息。例如,直方图可以显示与比特率、帧颜色信息等有关的信息。
现在参照图4,描述了界面显示元素306的示范性实施例的详细图。界面显示元素可以用于显示片段、类、场景的缩略图表示或单个帧的缩略图。该缩略图可以显示在缩略图显示区域403中。界面显示元素306也可以具有上信息条401和下信息条405。在一个具体有用的实施例中,上信息条401可以显示信息402,诸如显示的缩略图所代表的在视频内容流内的时间。同样,一个具体有用的实施例可以具有下信息条405,显示诸如在界面显示元素306中显示的缩略图的帧号的信息。另外,上和下信息条401和405可以用来传达与类有关的信息或其它类似信息。例如,信息条401和405可以被着色,以基于与片段、类、场景或帧有关的属性来指示分类。
界面显示元素306可以另外具有用于显示附加界面可视元素404的区域。可以可选地包括该附加可视元素,以指示哪个片段或类当前是活动的。
现在参照图5,描述了用户界面300的一个示范性实施例的图。在这样的用户界面中,用户可以能够通过移动时间轴光标来导航片段、场景和帧。可替换地,用户可以简单地点击片段以使得场景活动,并且改变显示的场景和帧,该显示的场景和帧是所选片段的一部分。同样,用户可以简单地点击场景以选择该场景作为活动场景,改变所显示的帧,其中该帧是活动场景的一部分。
现在参照图6,描述了根据本原理的用于显示和处理内容访问树的数据的配置的替换示范性实施例的详细图。在此实施例中,图3的界面300可以包括附加动作或显示元素。
可以显示一组类别604,该组类别604具有多个类别605。每个类别可以由附加可视元素来表示,并且属于每个类别605的场景314可以显示附加可视元素以便于用户仔细观察。在一个有用实施例中,用户可以能够通过拖拉场景显示元素309并将其放在相关类别显示元素605上来对场景309进行分类。在一个替换实施例中,用户可以使用鼠标点击场景显示元素309并从下拉菜单中选择类别605。
界面300也可以具有一组或多组动作按钮601,其包括多个动作按钮606。一个或多个动作按钮606可以与每个场景或类别相关。动作按钮606可以允许用户对场景或类别进行排队,以用于初始编码、再编码或滤波。在一个具体有用的实施例中,初始未被编码的场景或类别将具有与按钮606相关的、用于编码场景或类别的动作按钮606。在另一个有用的实施例中,动作按钮也可以允许用户过滤场景或类别。另外,用户可以右键点击任何缩略图或信息条,以允许用户对所选的缩略图或信息条采取动作或查看与所选的缩略图或信息条有关的信息。
界面300也可以显示场景标记602。在一个有用实施例中,场景标记602以允许用户可视地辨别出场景的边界、例如在场景中的帧的分组的方式放置。在另一个有用实施例中,用户可以用鼠标点击场景标记602以创建或去除场景边界。在此实施例中,用户可以选择场景标记602,以纠正当输入原始视频数据时执行的自动场景检测。
也可以在界面中显示帧信息标记603,并且该帧信息标记603与帧314有关。帧信息标记603可以是帧显示元素314的一部分,或者可以以关于帧314的任何其它逻辑关系来显示帧信息标记603。在一个具体有用的实施例中,帧编码类型可以被显示为文本。例如,帧信息标记可以指示帧被作为总体压缩,帧从两个其它帧中内插,或帧作为另一个帧的接续(progression)而被压缩。
已经描述了以分级方式显示视频内容的系统和方法的优选实施例(其意在示范且不是限制性的),应当注意,本领域技术人员根据上述教导可以做出修改和变化。因此应当理解,可以对所公开的本原理的具体实施例做出改变,其落入由所附权利要求书概括的本原理的范围和精神之内。已经由此按照专利法要求的细节和具体特征描述了本原理,专利权所要求的和所期望保护的在所附的权利要求书中进行阐述。

Claims (18)

1.一种用于通过图形用户界面中的分级格式显示视频流数据的方法,包括:
输入视频内容;
处理输入的视频内容以生成视频内容数据和用于内容访问树的数据;
输入所生成的数据;
使用所生成的数据来生成具有分级格式的显示,其中该分级格式包括:
代表视频流的顺序部分的至少一个片段简化图像,每个片段具有至少一个场景;
代表每个片段中的场景的至少一个场景简化图像,每个场景具有至少一个帧;
代表该场景中的帧的至少一个帧简化图像;以及
交互式用户界面,显示至少一个片段简化图像、至少一个场景简化图像和至少一个帧简化图像,其中至少一个片段被指定为活动片段,以使得所显示的场景是该活动片段的一部分,以及其中一个场景被指定为活动场景,所显示的帧是该活动场景的一部分。
2.如权利要求1所述的方法,其中,该至少一个片段简化图像是可选择的,以选择该活动片段,以及其中片段简化图像的选择允许用户查看该活动片段的至少一个场景。
3.如权利要求2所述的方法,其中,该方法还包括指示该活动片段的可视元素。
4.如权利要求1所述的方法,其中,该至少一个场景简化图像是用户可选择的,以选择该活动场景并允许用户查看该活动场景的至少一个帧。
5.如权利要求4所述的方法,其中,该方法还包括指示该活动场景的可视元素。
6.如权利要求1所述的方法,还包括至少一个直方图,每个直方图与每个显示的帧简化图像相关联,每个直方图代表该相关帧的至少一个属性。
7.如权利要求1所述的方法,还包括用于允许用户编码该视频流的至少一个场景的至少一个按钮。
8.如权利要求7所述的方法,其中,该简化图像显示编码后的视频流,该方法还包括用于再编码该视频流的至少一个场景的至少一个按钮。
9.如权利要求1所述的方法,还包括代表场景标记的可视元素,其中该场景标记是用户可选择的,以确定包括场景的帧。
10.如权利要求1所述的方法,还包括至少一个类别,每个类别包括至少一个场景,其中包括该类别的场景是用户可选择的。
11.如权利要求10所述的方法,其中,该至少一个类别能够根据用户的选择被编码,包括被选类别的场景被单独编码。
12.如权利要求1所述的方法,还包括时间轴,其中利用该时间轴能够选择该活动片段,其中该活动场景是能够使用该时间轴选择的。
13.一种用于通过图形用户界面中的分级格式显示视频流数据的方法,该方法包括:
输入视频内容;
处理输入的视频内容以生成视频内容数据和用于内容访问树的数据;
使用生成的数据来显示代表场景的至少一个场景简化图像,每个场景具有至少一个帧;
使用生成的数据来显示至少一个帧简化图像,每个帧简化图像代表该场景中的帧;以及
使用生成的数据来显示至少一个类别,每个类别包括至少一个场景;
显示交互式用户界面、至少一个场景简化图像以及至少一个帧简化图像,其中一个场景被指定为活动场景,并且所显示的帧是该活动场景的一部分;以及
显示允许用户编码至少一个场景的至少一个按钮。
14.如权利要求13所述的方法,该方法还包括显示代表顺序数字图像的片段的至少一个片段简化图像,每个片段具有至少一个场景,其中所显示的每个场景是片段的一部分。
15.如权利要求14所述的方法,该方法还包括:
加载视频流数据;
自动确定每个片段的起始和末尾;以及
自动确定每个场景的起始和末尾。
16.如权利要求13所述的方法,还包括:
显示时间轴,该时间轴代表视频流数据的至少一部分的长度;
允许用户通过选择该时间轴上的时间来确定所显示的至少一个场景简化图像和所显示的至少一个帧简化图像。
17.如权利要求13所述的方法,还包括显示用于允许用户对至少一个类别内的所有场景进行编码的至少一个按钮。
18.如权利要求13所述的方法,还包括手动编辑每个场景的起始和末尾。
CN200680053766XA 2006-03-09 2006-12-01 内容访问树 Expired - Fee Related CN101401060B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US78081806P 2006-03-09 2006-03-09
US60/780,818 2006-03-09
PCT/US2006/046210 WO2007102862A1 (en) 2006-03-09 2006-12-01 Content access tree

Publications (2)

Publication Number Publication Date
CN101401060A CN101401060A (zh) 2009-04-01
CN101401060B true CN101401060B (zh) 2012-09-05

Family

ID=38475179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680053766XA Expired - Fee Related CN101401060B (zh) 2006-03-09 2006-12-01 内容访问树

Country Status (6)

Country Link
US (1) US20090100339A1 (zh)
EP (1) EP1991923A4 (zh)
JP (1) JP2009529726A (zh)
KR (1) KR20080100434A (zh)
CN (1) CN101401060B (zh)
WO (1) WO2007102862A1 (zh)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9088576B2 (en) 2001-01-11 2015-07-21 The Marlin Company Electronic media creation and distribution
US9665839B2 (en) 2001-01-11 2017-05-30 The Marlin Company Networked electronic media distribution system
JP4061285B2 (ja) * 2004-03-31 2008-03-12 英特維數位科技股▲ふん▼有限公司 画像編集装置、プログラムおよび記録媒体
US8438646B2 (en) * 2006-04-28 2013-05-07 Disney Enterprises, Inc. System and/or method for distributing media content
JP4552943B2 (ja) * 2007-01-19 2010-09-29 ソニー株式会社 年表提供方法、年表提供装置および年表提供プログラム
US7992104B2 (en) * 2007-11-13 2011-08-02 Microsoft Corporation Viewing data
CN101868977B (zh) * 2007-11-15 2014-07-30 汤姆森特许公司 用于对视频进行编码的系统和方法
WO2010118528A1 (en) * 2009-04-16 2010-10-21 Xtranormal Technology Inc. Visual structure for creating multimedia works
US8533598B2 (en) * 2009-04-30 2013-09-10 Apple Inc. Media editing with a segmented timeline
US8875025B2 (en) 2010-07-15 2014-10-28 Apple Inc. Media-editing application with media clips grouping capabilities
US8910046B2 (en) 2010-07-15 2014-12-09 Apple Inc. Media-editing application with anchored timeline
US8725758B2 (en) 2010-11-19 2014-05-13 International Business Machines Corporation Video tag sharing method and system
US8891935B2 (en) * 2011-01-04 2014-11-18 Samsung Electronics Co., Ltd. Multi-video rendering for enhancing user interface usability and user experience
US20120198319A1 (en) 2011-01-28 2012-08-02 Giovanni Agnoli Media-Editing Application with Video Segmentation and Caching Capabilities
US8954477B2 (en) 2011-01-28 2015-02-10 Apple Inc. Data structures for a media-editing application
US9997196B2 (en) 2011-02-16 2018-06-12 Apple Inc. Retiming media presentations
US8966367B2 (en) 2011-02-16 2015-02-24 Apple Inc. Anchor override for a media-editing application with an anchored timeline
US11747972B2 (en) 2011-02-16 2023-09-05 Apple Inc. Media-editing application with novel editing tools
US20130073960A1 (en) 2011-09-20 2013-03-21 Aaron M. Eppolito Audio meters and parameter controls
US9959522B2 (en) * 2012-01-17 2018-05-01 The Marlin Company System and method for controlling the distribution of electronic media
US8731339B2 (en) 2012-01-20 2014-05-20 Elwha Llc Autogenerating video from text
US9113089B2 (en) * 2012-06-06 2015-08-18 Apple Inc. Noise-constrained tone curve generation
BR112015016664A2 (pt) * 2013-01-11 2017-07-11 Zoll Medical Corp interface de apoio à decisão ems, evento histórico, e respectivas ferramentas
US9389765B2 (en) * 2013-03-12 2016-07-12 Google Inc. Generating an image stream
US9736526B2 (en) * 2013-04-10 2017-08-15 Autodesk, Inc. Real-time scrubbing of videos using a two-dimensional grid of thumbnail images
USD770480S1 (en) * 2013-06-19 2016-11-01 Advanced Digital Broadcast S.A. Display screen with graphical user interface
USD770483S1 (en) * 2013-06-19 2016-11-01 Advanced Digital Broadcast S.A. Display screen with graphical user interface
USD755857S1 (en) * 2013-06-19 2016-05-10 Advanced Digital Broadcast S.A. Display screen with graphical user interface
CN103442300A (zh) * 2013-08-27 2013-12-11 Tcl集团股份有限公司 一种音视频跳转播放方法以及装置
USD755217S1 (en) * 2013-12-30 2016-05-03 Samsung Electronics Co., Ltd. Display screen or portion thereof with graphical user interface
US10284790B1 (en) * 2014-03-28 2019-05-07 Google Llc Encoding segment boundary information of a video for improved video processing
US9418311B2 (en) 2014-09-04 2016-08-16 Apple Inc. Multi-scale tone mapping
US9841883B2 (en) 2014-09-04 2017-12-12 Home Box Office, Inc. User interfaces for media application
USD768704S1 (en) * 2014-12-31 2016-10-11 Samsung Electronics Co., Ltd. Display screen or portion thereof with graphical user interface
USD757082S1 (en) 2015-02-27 2016-05-24 Hyland Software, Inc. Display screen with a graphical user interface
GB2598065B (en) 2016-04-15 2022-07-06 Grass Valley Ltd Methods of storing media files and returning file data for media files and media file systems
USD829755S1 (en) * 2017-08-11 2018-10-02 Sg Gaming Anz Pty Ltd Display screen with graphical user interface
USD892831S1 (en) * 2018-01-04 2020-08-11 Samsung Electronics Co., Ltd. Display screen or portion thereof with graphical user interface
CN110913167A (zh) * 2018-09-14 2020-03-24 北汽福田汽车股份有限公司 车辆的监控方法、云服务器及车辆
US11853340B2 (en) 2020-11-30 2023-12-26 Oracle International Corporation Clustering using natural language processing

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1430159A (zh) * 2001-12-29 2003-07-16 Lg电子株式会社 多媒体数据搜索和浏览系统
CN1531339A (zh) * 2003-03-13 2004-09-22 Lg 视频重现方法和装置及使用该方法的系统

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5513306A (en) * 1990-08-09 1996-04-30 Apple Computer, Inc. Temporal event viewing and editing system
JPH0530463A (ja) * 1991-07-19 1993-02-05 Toshiba Corp 動画像管理装置
US5434678A (en) * 1993-01-11 1995-07-18 Abecassis; Max Seamless transmission of non-sequential video segments
EP0899694A1 (en) 1997-01-24 1999-03-03 Sony Corporation Pattern data generator, pattern data generating method, and its medium
CA2289757A1 (en) 1997-05-16 1998-11-19 Shih-Fu Chang Methods and architecture for indexing and editing compressed video over the world wide web
JPH11266431A (ja) * 1997-12-17 1999-09-28 Tektronix Inc ビデオ編集方法及び装置
US6278446B1 (en) * 1998-02-23 2001-08-21 Siemens Corporate Research, Inc. System for interactive organization and browsing of video
US6266053B1 (en) * 1998-04-03 2001-07-24 Synapix, Inc. Time inheritance scene graph for representation of media content
JP3436688B2 (ja) * 1998-06-12 2003-08-11 富士写真フイルム株式会社 画像再生装置
US6912327B1 (en) * 1999-01-28 2005-06-28 Kabushiki Kaisha Toshiba Imagine information describing method, video retrieval method, video reproducing method, and video reproducing apparatus
JP2001145103A (ja) * 1999-11-18 2001-05-25 Oki Electric Ind Co Ltd 送信装置及び通信システム
US20010045965A1 (en) * 2000-02-14 2001-11-29 Julian Orbanes Method and system for receiving user input
JP3574606B2 (ja) * 2000-04-21 2004-10-06 日本電信電話株式会社 映像の階層的管理方法および階層的管理装置並びに階層的管理プログラムを記録した記録媒体
US7600183B2 (en) * 2000-06-16 2009-10-06 Olive Software Inc. System and method for data publication through web pages
US20040125124A1 (en) * 2000-07-24 2004-07-01 Hyeokman Kim Techniques for constructing and browsing a hierarchical video structure
US6774908B2 (en) 2000-10-03 2004-08-10 Creative Frontier Inc. System and method for tracking an object in a video and linking information thereto
US6741648B2 (en) * 2000-11-10 2004-05-25 Nokia Corporation Apparatus, and associated method, for selecting an encoding rate by which to encode video frames of a video sequence
AUPR212600A0 (en) * 2000-12-18 2001-01-25 Canon Kabushiki Kaisha Efficient video coding
US7039784B1 (en) * 2001-12-20 2006-05-02 Info Value Computing Inc. Video distribution system using dynamic disk load balancing with variable sub-segmenting
KR100464076B1 (ko) * 2001-12-29 2004-12-30 엘지전자 주식회사 동영상 비디오 브라우징 방법과 장치
US20030222901A1 (en) * 2002-05-28 2003-12-04 Todd Houck uPrime uClient environment
US20050125419A1 (en) * 2002-09-03 2005-06-09 Fujitsu Limited Search processing system, its search server, client, search processing method, program, and recording medium
TW200425090A (en) * 2002-12-10 2004-11-16 Koninkl Philips Electronics Nv Editing of real time information on a record carrier
US7242809B2 (en) * 2003-06-25 2007-07-10 Microsoft Corporation Digital video segmentation and dynamic segment labeling
US20050096980A1 (en) * 2003-11-03 2005-05-05 Ross Koningstein System and method for delivering internet advertisements that change between textual and graphical ads on demand by a user
WO2005109905A2 (en) * 2004-04-30 2005-11-17 Vulcan Inc. Time-based graphical user interface for television program information
JP3753726B1 (ja) * 2004-10-13 2006-03-08 シャープ株式会社 動画像再符号化装置、動画像編集装置、プログラム、及び記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1430159A (zh) * 2001-12-29 2003-07-16 Lg电子株式会社 多媒体数据搜索和浏览系统
CN1531339A (zh) * 2003-03-13 2004-09-22 Lg 视频重现方法和装置及使用该方法的系统

Also Published As

Publication number Publication date
KR20080100434A (ko) 2008-11-18
WO2007102862A1 (en) 2007-09-13
US20090100339A1 (en) 2009-04-16
CN101401060A (zh) 2009-04-01
JP2009529726A (ja) 2009-08-20
EP1991923A4 (en) 2009-04-08
EP1991923A1 (en) 2008-11-19

Similar Documents

Publication Publication Date Title
CN101401060B (zh) 内容访问树
CN101884221B (zh) 用于对视频进行编码的系统和方法
US9984725B2 (en) Apparatus and method for editing
US6539163B1 (en) Non-linear editing system and method employing reference clips in edit sequences
CN103503070B (zh) 与高画质有关的记录介质、再现装置、记录装置、编码方法、及解码方法
JP4652462B2 (ja) メタデータ処理方法
TWI355645B (zh)
CN101329892B (zh) 信息记录装置和方法
TWI413017B (zh) 用於混合式物件屬性關鍵製格模組之方法與電腦系統
CN100431029C (zh) 再现装置、再现方法以及记录方法
CN104281362A (zh) 信息处理装置和信息处理方法
WO2000045600A1 (en) Method of image feature encoding and method of image search
JP2003507988A5 (zh)
US20130287364A1 (en) Data generating device and data generating method, and data processing device and data processing method
CN111310041B (zh) 图文发布的方法、模型的训练方法、装置及存储介质
CN103546713B (zh) 运动图像编辑设备和方法
CN101789257A (zh) 再现设备、再现方法、记录设备和记录介质的生产方法
US20080320046A1 (en) Video data management apparatus
CN101681661A (zh) 编辑装置和编辑方法
CN102682817B (zh) 剧本编辑装置、方法和系统以及图像拍摄装置及其控制方法
US20210264686A1 (en) Method implemented by computer for the creation of contents comprising synthesis images
CN100559490C (zh) 记录和再生装置、记录和再生方法
CN101868977B (zh) 用于对视频进行编码的系统和方法
JP4732418B2 (ja) メタデータ処理方法
Guerrini et al. Interactive film recombination

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120905

Termination date: 20131201