CN102203770A

CN102203770A - 组织视频数据

Info

Publication number: CN102203770A
Application number: CN2008801318014A
Authority: CN
Inventors: A.S.米切尔; M.特罗特; A.W.沃尔鲍
Original assignee: Hewlett Packard Development Co LP
Current assignee: Hewlett Packard Development Co LP
Priority date: 2008-10-31
Filing date: 2008-10-31
Publication date: 2011-09-28
Also published as: EP2345251A1; EP2345251A4; US20110184955A1; WO2010050984A1

Abstract

描述了组织视频数据[110]。接收[205]包括元数据[120]的视频数据[110]，其中，元数据[120]提供视频数据[110]的视频内标签。将元数据[120]与多个视频简档[130]相比较[210]。基于比较[210]，将视频数据[110]与多个视频简档[130]中的相应的一个视频简档相关联[215]。

Description

组织视频数据

技术领域

本技术的领域涉及计算系统。更特别地，本技术的实施例涉及视频流。

背景技术

参与共享在线视频的世界可能是丰富且有益的体验。例如，一个人可以很容易地与朋友、家人、以及甚至是陌生人共享在线视频。通常，现代计算机允许用户组织并存储许多在线视频。然而，为了存储并共享几百个在线视频，用户花费很多时间和努力进行几百次组织判定。

附图说明

被结合到本说明书中并构成其一部分的附图举例说明了用于组织视频数据的技术的实施例并连同说明一起用于解释下文所讨论的原理：

图1是依照本技术的实施例的组织视频数据的示例性系统的方框图。

图2是依照本技术的实施例的组织视频数据的示例性方法的图示。

图3是依照本技术的实施例的用于组织视频数据的示例性计算机系统的图。

图4是依照本技术的实施例的组织视频数据的示例性方法的流程图。

不应将在本说明中所参考的附图理解为按比例绘制，除非特别地说明。

具体实施方式

现在将详细地对本技术的实施例进行参考，其示例在附图中被示出。虽然将结合各种实施例来描述本技术，但应理解的是，其不旨在将本技术局限于这些实施例。相反，本技术旨在覆盖替换、修改和等价物，其可以被包括在如由所附权利要求限定的各种实施例的精神和范围内。

此外，在以下详细说明中，阐述许多特定细节是为了提供对本技术的透彻理解。然而，可以在没有这些特定细节的情况下实施本技术的实施例。在其它实例中，未详细地描述众所周知的方法、程序、组件和电路，以免不必要地使本实施例的各方面晦涩。

除非如由下述讨论显而易见的那样以其他方式特别地说明，否则应认识到遍及本详细说明，利用诸如“接收”、“比较”、“关联”、“识别”、“去除”、“利用”等术语的讨论指的是计算机系统或类似电子计算设备的动作和处理。计算机系统或类似电子计算设备操纵被表示为计算机系统的寄存器和存储器内的物理（电子）量的数据并将该数据变换成同样地被表示为计算机系统存储器或寄存器或其它此类信息存储、传输或显示器件内的物理量的其它数据。本技术的实施例还非常适合于诸如例如光学和机械计算机之类的其它计算机系统的使用。

讨论概述

依照本技术的实施例关于用于组织视频数据的系统及其使用。在依照本技术的一个实施例中，本文所述的系统使得能够利用视频内的用户故意创建的元数据来在数据库内组织该视频。

更特别地，在一个实施例中，包括视觉和/或音频提示的元数据被用户包括在视频中，并且随后被用来寻找具有匹配的视觉和/或音频提示的相应视频简档（video profile）。此视频简档可以被存储在多个视频简档的数据库内。如将描述的那样，每个视频简档是从视频提取的特征的组合，所述特征适合于进行与视频的后续比较。这些特征可以包括整个视频或其部分以及到原始视频的参考点。然后将视频与找到的任何相应视频简档相关联。因此，基于由用户包括在视频中的元数据来组织视频。

例如，用户可以在摄像机正在记录的同时首先盖上和揭开摄像机的镜头以在视频“A”内产生“暗时间”。此“暗时间”表示不久将发生重要的视觉和/或音频提示。然后，用户可以通过记录对象（诸如钻石）的短视频作为视频“A”的一部分来将视觉提示放在视频“A”内。然后用户可以通过将口头语言“关于钻石的研究项目”记录在视频“A”内来将音频提示放在视频“A”内。然后可以将视觉提示和音频提示作为与视频“A”相关联的视频简档的一部分存储在与本文所述的系统耦合的数据库中。

然后，当用户创建要共享的新视频（视频“B”）时，用户可以在视频“B”的开头处进行钻石的视频记录。然后，本技术的实施例接收包括钻石的记录的视频“B”。视频“B”及其内部的视觉和音频提示随后被与多个视频简档的数据库比较，以便找到具有匹配的视觉和音频提示的视频简档。

一旦找到与视频“B”的视觉和音频提示匹配的视频简档“C”，则将视频“B”与也与视频简档“C”相关联的一个或多个其它视频的组相关联。例如，用于视频“B”的适当关联是与具有视觉和/或音频提示、钻石和口头语言“关于钻石的研究项目”的一个或多个视频的组。另外，在一个实施例中，可以在与其他人共享视频“B”之前从视频“B”中去除钻石和口头语言“关于钻石的研究项目”的记录。

因此，本技术的实施例使得能够基于此视频内的元数据与多个存储的视频简档的比较来组织视频。这种组织方法使得能够在没有用户的手动交互的情况下将视频与包含匹配元数据的视频相关联。

用于组织视频数据的系统

图1是依照本技术的实施例的示例性系统100的方框图。系统100包括输入端105、元数据检测器115、视频比较器135、视频关联器140、对象识别器165、对象去除器170和声音关联器175。

仍参考图1，在一个实施例中，系统100经由输入端105来接收视频数据110。视频数据110是音频/视频流且可以是整个视频或小于整个视频的一部分。出于简洁和明了的目的，本文的讨论和示例将最通常指的是视频数据110。然而，应理解的是，视频数据110可以包括整个视频或其部分。

视频数据110包括用来组织视频数据110的元数据120。元数据120被作为音频/视频系统的一部分而包括。元数据120可以包括视觉提示145和/或音频提示160。视频数据110可以具有一个或多个视觉提示145和/或音频提示160的视频内标签。

视觉提示145指的是可以被观看的触发系统100的动作和/或无动作的任何事物。音频提示160指的是触发系统100的动作和/或无动作的任何声音。“视频内标签”指的是经由记录包括诸如视觉提示145和音频提示160的元数据120作为视频数据110的一部分。换言之，视频数据110包括包含元数据120作为其音频/视频流的一部分的视频或其各部分。此元数据帮助系统100将视频数据110组织成相关组。

在一个实施例中，视觉提示145包括对象150和/或视频中的中断155。例如，视频数据110可以具有对象150的视频内标签，诸如但不限于一件珠宝、紫色钢笔、鞋、耳机等。

视频中的中断155指的是与其前一节或其后一节不同的一节视频数据110。例如，视频中的中断155可以是用户在处于记录过程中时盖上照相机的镜头、由此产生“暗时间”的结果。在另一示例中，视频中的中断155也可以是其中视频数据110全部为白色的“亮”时间段。在另一示例中，视频中的中断155可以是特定的声音，诸如可听拍手声或可听关键字，其被预先确定以表示一节视频数据110的开始或结束。

在一个实施例中，音频提示160包括声音180。声音180例如可以是但不限于嗽叭声、蜂鸣器蜂鸣或钢琴键发出的声音。

与系统100耦合的是多个视频简档130。在一个实施例中，多个视频简档130与数据存储器125耦合。多个视频简档130包括一个或多个视频简档，例如视频简档132a、132b和132n...。

操作

更一般地，在依照本技术的实施例中，系统100利用诸如一个或多个视觉提示145和/或音频提示160的元数据120，以通过将视频数据110与多个视频简档130中的相应的一个视频简档相关联来自动地组织视频数据110。组织视频数据110的此类方法特别地可用于使视频数据110与类似视频数据匹配，而用户不必手动地组织视频数据110，因此节省时间和资源。

例如，视频数据110可以具有元数据120的视频内标签。例如，在一个实施例中，视频数据110可以具有视觉提示145的视频内标签，诸如对象150、钻石。在另一实施例中，视频数据110可以具有音频提示160的视频内标签，诸如特定作者“Tom Twain”的口语描述。在另一示例中，视频数据110可以具有多于一个对象150的视频内标签，诸如紫色钢笔和笔记本，其被设置为相互紧挨着。

在一个实施例中，用户可以盖上照相机的镜头并开始视频记录，因此在用视频数据“D”表示的视频数据110中产生“暗时间”。视频数据“D”的内容类似于贝多芬第三交响曲的重演。此“暗时间”被视为是视频“D”中的中断。在此“暗时间”期间，用户可以通过播放钢琴音符的声音180、“中央C音”的声音来在视频数据“D”内包括音频提示160。然后，用户可以在结束记录时将照相机的镜头盖打开。包括此视频中的中断155、其相关“暗时间”和“中央C音”的声音的元数据120被连同多个视频简档130一起存储在数据存储器125内。

仍参考图1并继续视频数据“D”的示例，输入端105接收视频数据“D”。元数据检测器115检测视频数据“D”内的元数据120。例如，元数据检测器115检测视频中的中断155及其相关“暗时间”和“中央C音”的声音。值得注意的是，视频中的中断155及其相关“暗时间”以及“中央C音”的声音中的每一个单独地或组合地提供视频数据“D”的视频内标签。

视频比较器135将元数据120与多个视频简档130相比较。多个视频简档130被存储在数据存储器125中，其中，数据存储器125在内部或在外部与系统100耦合。例如，视频比较器135将视频中的中断155及其相关“暗时间”和“中央C音”的声音与多个视频简档130相比较，以便找到具有匹配的视频中的中断155及其相关“暗时间”和“中央C音”的声音的视频简档。

然后，视频关联器140基于该比较将视频数据“D”与多个视频简档130中的相应的一个相关联。例如，如果在比较之后，系统100找到与视频数据“D”匹配的视频简档132b，则视频数据“D”与视频简档132b相关联。通过被关联，视频数据“D”被放在具有类似视频简档的其它视频旁边。换言之，在一个实施例中，视频数据“D”被连同与视频数据“D”的视频简档匹配的一组一个或多个其它视频一起列出。

例如，基于其视频简档，可以将视频数据“D”与一组视频一起列出，其中，该组视频的内容包括以下各项：孩子的“Twinkle, Twinkle, Little Star”的钢琴表演、由学校乐队执行的向学校旗帜吹号敬礼、由热心的女演员演唱的德语催眠曲、和用户喜爱的商业小曲的配口型版本。值得注意的是，视频组中的每一个包含视频中的中断及其相关“暗时间”和“中央C音”的声音的元数据。

在一个实施例中，如果匹配超过相似性和/或差别的阈值水平，则找到匹配。相似性和/或差别的阈值水平可以基于任何数目的变量，诸如但不限于：色彩、照明、分贝水平、音调范围、移动检测、以及经由声音与特定主题（例如，色彩、数目、年龄）的关联。例如，即使视频简档的口头语言“紫色钢笔”不同于口头语言“蓝色钢笔”，系统100仍可以找到“紫色钢笔”以与包含“蓝色钢笔”的音频提示的视频简档匹配。例如，可以将阈值水平预定为使得与色彩的描述匹配的任何声音将被包括在与包含“蓝色钢笔”的音频提示的视频简档相关联的一组视频的列表内。

在另一实施例中，系统100将视频数据110与多个视频简档130中的最密切地与视频数据110内的元数据120匹配的相应的一个视频简档相关联。例如，视频数据110（用视频数据“E”表示）内的元数据120可以是作为对象150的鹦鹉的元数据。在本示例中，在多个视频简档130内存在三个视频简档，即132a、132b和132c。多个视频简档130的视频简档132a包括作为对象150的青蛙。多个视频简档130的视频简档132b包括作为对象150的蛇。多个视频简档130的视频简档132c包括作为对象150的小鸡。系统100将视频数据“E”与视频简档132c相关联，因为视频简档132c的小鸡最接近于视频数据“E”、鹦鹉的元数据。小鸡和鹦鹉两者都具有羽毛和比鹦鹉对比青蛙或鹦鹉对比蛇的体型更相似的体型。

如本文所述，视觉提示145可以是诸如莱茵石的对象。此外，在使用莱茵石作为视觉提示145一次之后，可以使用莱茵石作为视频内标签来创建新的视频。例如，用户可以用所记录的莱茵石的视觉图像来创建新的视频，其被与包含莱茵石的相同视频内标签的其它视频一起组织。

在一个实施例中，认为关于制作蛋糕的相同主题的一组视频是相关的，并且全部具有在制作名厨喜爱的黄油调和物时用面粉覆盖的名厨的图像的视频内标签。在另一示例中，用户可以为一组视频中的每一个提供音频提示的视频内标签“九岁”，所述一组视频包含踢足球赛的Fred Jones、进入四年级的Susie Smith和喂他的新小狗的Jeff Johnson的看起来无关的主题。

在一个实施例中，正在创建的新视频、视频数据“F”具有多于一个元数据120的视频内标签。例如，视频数据“F”可以具有滑板（视觉提示145）和口头语言“九岁”（音频提示160）的视频内标签。

在另一实施例中，声音关联器175将声音180与对象150相关联。在一个示例中，用户在第一视频上记录作为对象150的紫色钢笔以及作为声音180的口头语言“报税”。声音关联器175将声音180“报税”与对象150、即紫色钢笔相关联。换言之，创建将紫色钢笔与口头语言“报税”链接在一起的视频简档。

此外，关于报税的一组视频对话中的每一个可以具有“紫色钢笔”的视频内标签。希望在具有“紫色钢笔”的视频内标签的当前视频组内包括新视频、即其内容涉及“2008报税对话”的视频“G”的用户可以简单地在视频“G”内记录“紫色钢笔”的视觉图像。

在另一实施例中，用户创建具有口头语言“关于珠宝的研究项目”的新视频作为其音频提示160。例如，用户可以在新视频中创建“暗时间”并说出话语“关于珠宝的研究项目”。该新视频的视频简档然后包括“暗时间”和口头语言“关于珠宝的研究项目”。在一个实施例中，可以向此视频简档添加更多的元数据120。例如，可以将钻石的视觉提示记录在视频中并将其与口头语言的音频提示“关于珠宝的研究项目”链接。

在一个实施例中，对象识别器165识别包括元数据120的视频数据110的一部分，所述元数据120诸如视觉提示145和/或音频提示160。对象去除器170然后能够从视频数据110去除此元数据120。例如，对象识别器165识别包括口头语言“钻石”的那部分视频数据110。然后，对象去除器170可以从视频数据110去除口头语言“钻石”。值得注意的是，本技术的实施例非常适合于使得能够根据预编程指令或来自用户的指令在任何时间去除元数据120。例如，可以在与其他人共享视频数据110之前或之后去除元数据120。

在另一实施例中，系统100与多于一个的对象150匹配，所述多于一个的对象150诸如铅笔和笔记本，具有包含这两个对象的视频简档。

图2是依照本技术的实施例的、组织视频数据的示例性方法的流程图。现在参考205，接收包括元数据120的视频数据110，其中，元数据120提供视频数据110的视频内标签。

参考图2的210，在本技术的一个实施例中，将元数据120与多个视频简档130相比较。参考图2的215，基于该比较，将视频数据110与多个视频简档130中的相应的一个相关联。

因此，本技术的实施例提供了用于在没有用户的任何手动交互的情况下组织视频数据的方法。另外，实施例提供了基于视频和/或音频提示来自动组织视频数据的方法。此外，本技术的实施例使得用户能够自动地将视频数据与包含匹配的视频数据的视频相关联，因此在用户上传视频数据以便共享时不要求手动交互。另外，可以在上传视频数据之前识别并去除使得能够实现此组织的视频数据的各部分。

示例性计算机系统环境

现在参考图3，用于组织视频数据的本技术的实施例的各部分由存在于例如计算机系统的计算机可使用介质中的计算机可读和计算机可执行指令构成。也就是说，图3举例说明了能够用来实现本技术的下文讨论的实施例的一种计算机的一个示例。

图3举例说明了依照本技术的实施例所使用的示例性计算机系统300。应认识到，图3的系统300仅仅是示例，并且本技术的实施例可以在许多不同的计算机系统上或内操作，所述不同的计算机系统包括通用联网计算机系统、嵌入式计算机系统、路由器、交换机、服务器设备、用户设备、各种中间设备/人工制品、独立计算机系统等等。如图3中所示，图3的计算机系统300很好地适合于具有与之耦合的诸如例如致密盘等外围计算机可读介质302。

图3的系统300包括用于传送信息的地址/数据总线304和耦合到总线304以便处理信息和指令的处理器306A。如图3中所描绘的，系统300也非常适合于其中存在多个处理器306A、306B和306C的多处理器环境。相反，系统300还非常适合于具有诸如例如处理器306A之类的单处理器。处理器306A、306B和306C可以是各种类型的微处理器中的任一种。系统300还包括数据存储特征，诸如计算机可用易失性存储器308，例如随机存取存储器（RAM），其被耦合到总线304以便存储用于处理器306A、306B和306C的信息和指令。

系统300还包括计算机可用非易失性存储器310，例如只读存储器（ROM），其被耦合到总线304以便存储用于处理器306A、306B和306C的静态信息和指令。还存在于系统300中的是耦合到总线304以便存储信息和指令的数据存储单元312（例如，磁盘或光盘和磁盘驱动器）。系统300还包括可选的字母数字输入设备314，其包括耦合到总线304以便向处理器306A或处理器306A、306B和306C传送信息和命令选择的字母数字和功能键。系统300还包括耦合到总线304以便向处理器306A或处理器306A、306B和306C传送用户输入信息和命令选择的可选光标控制设备316。本技术的实施例的系统300还包括耦合到总线304以便显示信息的可选显示设备318。

仍参考图3，图3的可选显示设备318可以是液晶设备、阴极射线管、等离子体显示设备或适合于创建用户可识别的图形图像和字母数字字符的其它显示设备。可选光标控制设备316允许计算机用户在显示设备318的显示屏上动态地用信号通知可见符号（光标）的移动。光标控制设备316的许多实现在本领域中是已知的，包括轨迹球、鼠标、触摸板、操纵杆或字母数字输入设备314上的能够用信号通知给定位移方向或方式的移动的特殊键。可替换地，将认识到，能够使用特殊键和键序列命令经由来自字母数字输入设备314的输入来指引和/或激活光标。

系统300还非常适合于具有由诸如例如语音命令之类的其它手段指引的光标。系统300还包括用于将系统300与外部实体耦合的I/O设备320。

仍参考图3，描绘了用于系统300的各种其它组件。具体地，当存在时，操作系统322、应用程序324、模块326和数据328被示为通常存在于例如随机存取存储器（RAM）的计算机可用易失性存储器308和数据存储单元312的一个或某组合中。然而，应认识到，在某些实施例中，可以将操作系统322存储在诸如网络上或闪速驱动器上的其它位置中；并且此外，可以经由例如到因特网的耦合从远程位置访问操作系统322。在一个实施例中，本技术例如被作为应用程序324或模块326存储在RAM 308内的存储位置和数据存储单元312内的存储区域中。

计算系统300仅仅是适合的计算环境的一个示例，并且其并不旨在暗示对本技术的功能或使用范围的任何限制。不应将计算环境300解释为具有与在示例性计算系统300中举例说明的组件中的任何一个组件或组件的组合有关的任何依赖性或要求。

可以在由计算机执行的诸如程序模块的计算机可执行指令的一般背景下描述本技术的实施例。通常，程序模块包括执行特定任务或实现特定抽象数据类型的例行程序、程序、对象、组件、数据结构等。还可以在分布式计算环境中实施本技术的实施例，在所述分布式计算环境中，由通过通信网络链接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储器存储设备的本地和远程计算机存储介质二者中。

图4是举例说明了依照本技术的一个实施例的用于组织视频数据的过程400的流程图。在一个实施例中，在计算机可读和计算机可执行指令的控制下由处理器和电气组件来执行过程400。计算机可读和计算机可执行指令例如存在于诸如计算机可用易失性和非易失性存储器之类的数据存储部件中。然而，计算机可读和计算机可执行指令可以存在于任何类型的计算机可读介质中。在一个实施例中，由图1的系统100来执行过程300。

参考图4的405，在一个实施例中，接收第一视频数据。参考图4的410，在一个实施例中，接收包含元数据120的第二视频数据，其中，元数据120提供第一视频数据的视频内标签。现在参考图4的415，将元数据120与多个视频简档130相比较。参考图4的420，基于该比较，将第一视频数据与多个视频简档中的相应的一个相关联。

例如，用户创建两个视频。第一视频数据“H”包含用户的结婚礼服的视频。第二视频“I”包含结婚戒指的记录。然后，用户能够上传第一视频数据“H”和第二视频数据“I”，并基于结婚戒指的第二视频数据“I”的元数据来组织第一视频数据“H”。

例如，接收第一视频数据“H”。还接收第二视频数据“I”，其中，第二视频数据“I”包括提供第一视频数据“H”的本文所述的视频内标签的元数据120。本质上，第二视频数据“I”出于组织的目的表示第一视频数据“H”的元数据。在一个实施例中，第一视频数据“H”包括第二视频数据“I”。

另外，在另一实施例中，用户决定创建用于结婚的花卉布置的第三视频，即视频数据“J”。根据本技术的实施例，用户能够上传第三视频数据“J”并基于结婚戒指的第二视频数据“I”的元数据来组织第三视频数据“J”。

在另一实施例中，利用视觉提示145作为元数据120来组织第一视频数据“H”。在另一实施例中，利用音频提示160作为元数据120来组织第一视频数据“H”。

因此，本技术的实施例使得能够在没有手动交互的情况下组织视频数据。此类组织方法对于在短时间段内将大量的视频分类而言特别有用。

虽然已经以专用于结构特征和/或方法动作的语言描述了本主题，但应理解的是，在所附权利要求中限定的主题不一定局限于上述特定特征或动作。相反，上述特定特征和动作是作为实现权利要求的示例性形式而公开的。

Claims

1. 一种用于组织视频数据的系统[100]，所述系统[100]包括：

输入端[105]，其用于接收视频数据[110]；

元数据检测器[115]，其被配置为检测所述视频数据[110]内的元数据[120]，其中，所述元数据[120]提供所述视频数据[110]的视频内标签；

数据存储器[125]，其用于存储多个视频简档[ 130]；

视频比较器[135]，其被配置为将所述元数据[120]与所述多个视频简档[130]相比较；以及

视频关联器[140]，其被配置为基于所述比较将所述视频数据[110]与所述多个视频简档[130]中的相应的一个视频简档相关联。

2. 权利要求1的系统[100]，其中，所述元数据检测器[115]被配置为检测所述视频数据[110]中的指示视觉提示[145]的元数据[120]。

3. 权利要求2的系统[100]，其中，所述元数据检测器[115]被配置为检测所述视频数据[110]中的指示对象[150]的元数据[120]。

4. 权利要求2的系统[100]，其中，所述元数据检测器[115]被配置为检测所述视频数据[110]中的指示所述视频数据中的中断[155]的元数据[120]。

5. 权利要求1的系统[100]，其中，所述元数据检测器[115]被配置为检测所述视频数据[110]中的指示音频提示[160]的元数据[120]。

6. 权利要求1的系统[100]，还包括：

对象识别器[165]，其被配置为识别包括所述元数据[120]的所述视频数据[110]的一部分；以及

对象去除器[170]，其被配置为从所述视频数据[110]中去除所述元数据[120]。

7. 权利要求3的系统[100]，还包括：

声音关联器[175]，其被配置为将声音[180]与所述对象[150]相关联。

8. 一种组织视频数据的计算机实现方法[200]，所述方法包括：

接收[205]包括元数据[120]的视频数据[110]，其中，所述元数据[120]提供所述视频数据[110]的视频内标签；

将所述元数据[120]与多个视频简档[130]相比较[210]，基于所述比较，将所述视频数据[110]与所述多个视频简档[130]中的相应的一个视频简档相关联[215]。

9. 权利要求8的方法[200]，其中，所述去除还包括：

识别包括所述元数据[120]的所述视频数据[110]的一部分；以及

从所述视频数据[110]中去除所述元数据[120]。

10. 权利要求8的方法[200]，还包括：

利用视觉提示[145]作为所述元数据[120]以组织所述视频数据[110]。

11. 权利要求8的方法[200]，还包括：

利用音频提示[145]作为所述元数据[120]以组织所述视频数据[110]。

12. 一种包括在被执行时促使计算机系统执行组织视频数据[110]的方法[400]的指令的计算机可用介质，所述方法[400]包括：

接收[405]第一视频数据；

接收[410]包括元数据[120]的第二视频数据，其中，所述元数据[120]提供至少所述第一视频数据的视频内标签；

将所述元数据[120]与多个视频简档[130]相比较；以及

基于所述比较，将所述第一视频数据与所述多个视频简档[130]中的相应的一个视频简档相关联[420]。

13. 权利要求12的方法[400]，其中，所述第一视频数据包括所述第二视频数据。

14. 权利要求12的方法[400]，还包括：

利用视觉提示[145]作为所述元数据[120]以组织所述第一视频数据。

15. 权利要求12的方法[400]，还包括：

利用音频提示[160]作为所述元数据[120]以组织所述第一视频数据。