CN109565621B

CN109565621B - 用于实现视频管理的方法、系统和计算机存储介质

Info

Publication number: CN109565621B
Application number: CN201780048587.5A
Authority: CN
Inventors: O·贾辛; A·勒维; O·尼尔; O·齐夫
Original assignee: Microsoft Technology Licensing LLC
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2016-08-01
Filing date: 2017-07-25
Publication date: 2021-06-18
Anticipated expiration: 2037-07-25
Also published as: US20180035152A1; US10560734B2; CN109565621A; EP3491832A1; WO2018026566A1

Abstract

在各种实施例中，提供了用于实现视频分段的方法和系统。视频管理系统实现了视频分段管理器，该视频分段管理器支持生成增强的分段视频。增强的分段视频是视频内容的基于时间的分段。基于视频内容认知索引、分段维度、分段规则和分段重建规则来生成增强的分段视频。视频内容认知索引被构建用于对视频内容进行索引。将分段规则应用于视频内容以将视频内容分解为基于时间的分段，基于时间的分段与视频内容的对应分段维度相关联。然后将分段重建规则应用于基于时间的分段，以将基于时间的分段重建为增强的分段视频。增强的分段视频和分段维度的对应值可以用作视频内容的不同部分，以用于视频管理系统中的不同类型的功能。

Description

用于实现视频管理的方法、系统和计算机存储介质

背景技术

视频托管服务支持视频内容的共享。视频可包括短视频剪辑和长视频内容。视频内容的范围可以从报告到长篇电影。视频托管服务的用户可以将视频上传到视频托管服务，并允许其他用户访问和观看视频。视频托管服务的用户可以使用不同类型的视频播放器应用来回放视频内容。用户与视频内容的交互还可以包括搜索和标识视频内容的特定部分和元素。搜索视频内容的特定部分和元素有助于规避观看整个视频内容。这样，支持视频内容的搜索功能并辅助用户标识视频内容的部分和元素的视频托管服务中的构造对视频托管服务和视频内容管理是不可缺少的。

发明内容

本文描述的实施例涉及视频管理系统的视频分段。在高级别，视频管理系统实现视频分段管理器，视频分段管理器支持生成增强的分段视频。增强的分段视频是视频内容的基于时间的分段。具体地，用于生成增强的分段视频的基于时间的视频分段基于使用视频内容和分段维度的值的逻辑分段。基于分段维度、分段规则和分段重建规则生成增强的分段视频。分段维度是用于将视频内容特征或视频内容元素存储为视频内容认知索引中的分段维度的值的类别。视频内容认知索引是为索引视频内容而构建的。视频内容认知索引是基于分段维度来布置视频内容的数据结构，其中视频内容的基于时间的分段随视频内容的持续时间而不同。

分段规则是指示如何选择视频内容的基于时间的分段的规则。分段规则应用于视频内容，以将视频内容分解为基于时间的分段。基于时间的分段与视频内容的对应部分的对应分段维度和视频内容作为整体相关联。分段重建规则是指示如何重建视频内容的基于时间的分段的规则。然后，将分段重建规则应用于基于时间的分段，以将基于时间的分段重建(例如合并或分割)为增强的分段视频。一个表示中的增强分段视频可以是具有多个属性(例如分段维度的值)的索引数据条目。索引数据条目存储在数据结构(例如表)中并引用原始视频内容。增强的分段视频和分段维度的对应值可以用作视频内容的不同部分，以用于视频管理系统中的不同类型的功能。

本文描述的实施例还涉及视频管理系统的视频分段播放列表生成。在高级别，视频管理系统实现视频分段管理器。视频分段管理器支持生成针对视频内容的视频分段播放列表。生成视频分段播放列表是基于与分段维度相关联的增强的分段视频。增强的分段视频是基于分段维度、分段规则和分段重建规则生成的视频内容的基于时间的分段。增强的分段视频和对应的分段维度促进基于视频内容的分段维度的值来搜索视频内容。在操作中，视频分段管理器接收视频内容的搜索查询。视频分段管理器标识满足搜索查询的多个相关增强分段视频。接收对多个相关增强分段视频的至少一个子集的选择以生成视频分段播放列表。视频分段管理器生成视频分段播放列表，其包括对多个相关增强分段视频的子集的引用。包括引用的视频分段播放列表被传送(例如作为文件或链接)并且可以被选择或执行以回放多个相关增强的分段视频的子集。

提供本发明内容是为了以简化的形式介绍将在以下具体实施方式中进一步描述的一些概念的选择。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征，也不旨在单独使用以辅助确定所要求保护的主题的范围。

附图说明

以下参照附图详细描述本发明，在附图中：

图1是可以采用本文描述的实施例的示例性视频管理系统环境的框图；

图2A-2B是根据本文描述的实施例的视频管理系统的过程和输出索引的示意性示例性表示；

图3A-3B是根据本文描述的实施例的视频管理系统的特征的示意性示例性表示；

图3C-3D是根据本文描述的实施例的视频管理系统的示例性图形用户界面；

图4是示出根据本文描述的实施例的用于实现视频管理系统的示例性方法的流程图；

图5是示出根据本文描述的实施例的用于实现视频管理系统的示例性方法的流程图；

图6是示出根据本文描述的实施例的用于实现视频管理系统的示例性方法的流程图；

图7是示出根据本文描述的实施例的用于实现视频管理系统的示例性方法的流程图；以及

图8是适用于实现本文描述的实施例的示例性计算环境的框图。

具体实施方式

视频托管服务支持视频内容的共享。视频可包括短视频剪辑和长视频内容。如本文所使用的，视频内容涉及视频的其他固有特征，诸如音轨、元数据、时间码等。视频内容的范围可以从报告到长篇电影。视频托管服务的用户可以将视频上传到视频托管服务，并允许其他用户访问和观看视频。视频托管服务的用户可以使用不同类型的视频播放器应用来回放视频内容。用户与视频内容的交互还可以包括搜索和标识视频内容的特定部分和元素。搜索特定部分和元素有助于规避观看整个视频内容。因此，支持视频内容的搜索功能并辅助用户标识视频部分和元素的视频托管服务中的构造对视频托管服务和视频内容管理是不可缺少的。

举例来说，视频内容包括在限定的时间段(例如视频内容的持续时间)内一起编译的视频部分(例如视频场景)。视频场景可以包括不同的视频特性或视频元素(例如扬声器、位置、一天中的时间等)。用户通常对视频内容中的特定视频部分和视频元素感兴趣。例如用户可以尝试找到包含类似场景或主题的视频内容的有意义部分。用户依赖于不同类型的搜索机制来标识具有不同成功水平的视频部分和视频元素。通常情况下，用户只会回退到效率低下的选项，诸如高速回放视频以标识视频内容中的视频部分和视频元素。此外，当有意义的视频内容可用作多个视频中的部分时，这对尝试使用不同视频内容的部分的大多数用户提出了挑战。例如它通常需要视频编辑工具和源视频内容的特定知识，以将视频内容的选定部分组合成单个连续视频。因此，用于搜索、标识、共享和回放相关视频内容的综合系统可以改进用户与视频内容交互的体验。

本发明的实施例提供用于视频管理系统的视频分段的简单并且高效的方法和系统。在高级别，视频管理系统实现视频分段管理器，其支持生成增强的分段视频。生成增强的分段视频的过程在理论上可以被理解为视频内容的反向拼接回到具有若干增强的分段视频的概念性故事板。增强的分段视频是指基于分段维度、分段规则和分段重建规则来生成的视频内容的基于时间的分段。分段维度是为视频内容构建的视频内容认知索引的一部分。视频内容认知索引是基于分段维度来布置视频内容的数据结构。将分段规则应用于视频内容以将视频内容分解为具有与分段维度相关联的值的视频内容的基于时间的分段。然后，将分段重建规则应用于基于时间的分段，以将基于时间的分段重建(例如合并或分割)为增强的分段视频。一个表示中的增强分段视频可以是具有多个属性(例如分段维度的值)的索引数据条目。索引数据条目存储在数据结构中并引用原始视频内容。增强的分段视频以及针对增强视频内容的分段维度和对应值可以用作视频内容的不同部分，用于视频管理系统中的不同类型的功能。作为类比，基于时间的分段可以对应于文章中的段落，并且与段落相关联的注释可以是进一步描述增强的分段视频的分段维度的值。

本发明的实施例还提供用于视频管理系统的视频分段播放列表生成的简单且高效的方法和系统。在较高级别，视频管理系统实现视频分段管理器，其支持生成视频内容的视频分段播放列表。生成视频分段播放列表基于与分段维度相关联的增强的分段视频。增强的分段视频内容是基于分段维度、分段规则和分段重建规则来生成的视频内容的基于时间的分段。增强的分段视频有助于基于与视频内容相关联的分段维度和对应的分段维度值来搜索视频内容。由于视频内容已经被分解为值，基于分段维度和顺序的基于时间的分段，用户可以执行对作为增强的分段视频提供的视频内容的改进搜索。

在操作中，视频分段管理器接收针对视频内容的搜索查询。视频分段管理器标识满足搜索查询的多个相关增强分段视频。接收对多个相关增强分段视频的至少一个子集的选择以生成视频分段播放列表。视频分段管理器生成视频分段播放列表，其包括对多个相关增强分段视频的子集的引用。视频分段播放列表可以被配置为不包含视频数据，并且仅用作对多个相关增强分段视频的子集的引用。具有引用的视频分段播放列表被传送，并且可以被选择以回放多个相关增强分段视频的子集。在回放期间，视频分段管理器可以操作以计算多个相关增强分段视频的子集的总持续时间。视频分段管理器同步针对回放的进度条以模拟视频内容的统一视频回放。视频分段管理器进一步操作以从视频分段播放列表预加载增强的分段视频的序列以用于流传输而不中断。

总之，有利地，视频管理系统以改进的技术效率操作。由于视频分段管理器不再将编译的播放列表编码为视频，因此减少了计算资源的使用。由于不重复存储不同的播放列表和分段，因此还改进了存储资源的使用。由于视频分段播放列表是建立在其他播放列表之上的增量播放列表，所以所有者的内容权利被尊重，因为当修改原始分段(例如校正视频转录本)时，所有派生的播放列表都受到影响。

首先参考图1，图1示出了示例性视频管理系统100，其中可以采用本公开的实现。特别地，图1示出了具有视频分段管理器110的视频管理系统100的高级架构。根据本公开的实现，视频分段管理器110具有认知索引120、分段规则130、分段重建规则140和视频分段播放列表引用管理器150。视频管理系统100还包括具有多个视频服务(或分析器)(例如视频服务180A、180B、180C和180D)、视频内容存储库170和客户端设备190的视频服务180。

下面参考诸如视频管理系统的示例详细描述本公开的实施例，该视频管理系统具有用于视频分段和视频分段播放列表生成的视频分段管理器110。视频分段管理器110负责生成增强的分段视频。视频分段管理器110使用认知索引120、分段规则130和分段重建规则140来生成增强的分段视频。视频分段管理器110实现视频分段过程，其包括访问视频内容和构建与视频内容的视频内容维度相关联的认知索引。此外，视频分段管理器110使用分段规则将视频内容分段为基于时间的分段，并使用分段重建规则来生成增强的分段视频。可以经由视频内容存储库170访问视频内容，视频内容存储库170用作视频内容集合的数据存储库或存储仓库。数据存储库和用于取回视频内容的访问机制的其他变体和组合在本文描述的实施例中是预期的。

视频分段管理器110负责构建视频内容的认知索引120。视频内容认知索引可以指基于视频内容的视频元素的视频内容的布置。认知索引120可以是以允许至少部分地基于视频和视频内容认知索引来搜索、分析和标识视频内容的部分的方式来布置视频元素的数据结构。特别地，可以基于分段维度来存储视频内容的视频元素。该过程可以称为认知处理序列。分段维度是用于将视频内容特征或视频元素存储为视频内容认知索引中的分段维度的值的类别。在一个实施例中，类别可以具体是隐藏在视频中的语义信号通道。作为示例，分段维度可以包括时间、转录本、情绪、主题、面部、情感愤怒、情感高兴、说话的语音活动、语音活动欢呼、背景。这样，分段维度可以包括具有单个面(例如转录本)的维度和具有多个面(例如情感)的维度。本发明的实施例考虑了分段维度的其他变化和组合。

视频分段管理器110可依赖视频服务(例如认知服务和对应的应用程序编程接口-API)来对视频内容执行分析(即，认知处理序列)以生成视频认知索引。认知序列处理从视频内容本身中提取认知见解。视频服务180是执行视频分析并支持多个认知服务(例如180A、180B、180C和180C)以生成认知索引的示例性视频服务。在示例性实施例中，认知处理序列将视频内容分析为并行的基于时间的分段维度。

如图2A所示，一个实施例中的认知索引可以是表格，其中列210表示分段维度(例如语义信号通道)，而行220表示在整个时间轴上发现的认知见解。例如时间210A、转录本210B、OCR(光学字符识别)210C、情绪210D、主题210E、面部210F、情感(愤怒)210G、情感(高兴)210H、扬声器210I、语音活动(音乐)210J、语音活动(欢呼)210K、和背景210L是表示分段维度的列和时间分段行(220A、220B、220C和220D)表示与分段维度相对应的认知见解或值。基于认知服务导出和利用这些能力可以在视觉上表示为图2B，序列图200示意性地示出了本公开的特征。具体地，左侧的视频202通过以下各项被处理：用于代码转换和自然语言处理(NLP)的音频通道230；用于面部识别的视觉通道240；和用于提供多比特率和优化流传输质量的流传输通道250。音频通道230B可以支持来自以下过程的输出：扬声器二值化230A、转录230B、文本内容调节230C、关键词提取230D和情绪分析230E。如图所示，来自某些过程的输出基于分段规则作为分段的一部分被输入到其他过程中。视觉通道240可以支持来自以下过程的输出：编码(处理)240A、面部检测240B、最佳面部选择240C、视觉内容调节240D、面部分组240E、面部标识240G和OCR 240F。流传输通道250可用于经由MBR编码(流传输)250A支持多比特率(MBR)流传输。组合输出用于支持分解204功能，如本文更详细讨论的。由于网络上载结束和分解可用性之间的周转时间对于用户体验是基本的，并且为了优化性能，一些步骤在多个视频块或多个面部图像上并行地应用(例如并行调用208)，并稍后级联回原始序列顺序。

视频分段管理器110负责将视频内容分段为基于时间的分段。在高级别，分段视频内容包括将视频内容分成顺序的基于时间的分段，每个分段包含其跨度内的视频内容维度。使用与认知索引相关联的分段维度来分段视频内容尤其可以基于多个分段规则。分段规则定义了一个事件，其当为真时，是应当为视频内容创建一个分段的指示。分段规则可以从分段规则130存储和取回。基于时间的分段可以使用起点和终点来定义。分段规则可以基于认知索引的分段维度。分段规则可以包括以下任意内容的变化、组合和优先级-扬声器改变、场景改变(即，基于如背景、面部的视觉效果，以及如背景噪音、音乐等的音频方面)、主题改变、定义的长期沉默期。在这方面，将视频内容分段成基于时间的分段可以包括标识分段维度的值以选择基于时间的分段。

视频分段管理器110还负责生成增强的分段视频。所生成的增强分段视频可以被生成并存储在视频内容存储库(例如视频内容存储库170)中。增强的分段视频可以是具有多个属性(例如分段维度的值)的索引数据条目，索引数据条目被存储在数据结构中并且引用原始视频内容。增强的分段视频和分段维度的对应值可以用作视频内容的不同部分，用于视频管理系统中的不同类型的功能。生成增强的分段视频可以具体地基于从多个基于时间的分段重建一个或多个基于时间的分段，重建一个或多个基于时间的分段基于指示如何重建视频内容的基于时间的分段的分段重建规则。

因此，视频分段管理器110还负责基于时间的分段的重建。分段的重建可以指基于段重建规则来重新创建或重建基于时间的分段。重建可以特别针对在分段过程中标识的基于时间的分段。分段重建规则定义了一个事件，其当为真时是分段应当被重建的指示。基于时间的分段可以通过将基于时间的分段与一个或多个其他基于时间的分段合并来重建。基于时间的分段还可以通过将分段分割成一个或多个分段来重建。分段重建规则可以包括以下项中的任意项的变化、组合和优先级：如果存在同一个扬声器、场景和主题的两个非常短的相邻的基于时间的分段，则将它们合并为一个；如果基于时间的分段达到预定义的持续时间限制，则关于在转录行末尾进行分割，在增强分段视频中对基于时间的分段进行分割。可以在基于时间的分段的总持续时间的绝对或预定义百分位数中应用重建规则。在本公开的实施例中考虑了基于时间的分段的其他变体和组合。

继续参考图3A-3D，视频分段管理器110负责生成在图3A、3B、3C和3D中的不同图示中表示的视频分段播放列表。视频分段管理器110支持生成视频内容的视频分段播放列表。视频分段管理器110支持对增强的分段视频的访问。增强的分段视频是基于分段维度、分段规则和分段重建规则来生成的基于时间的视频分段。视频分段管理器可以从存储增强的分段视频的视频内容存储库(例如视频内容存储库180)访问与增强的分段视频相关联的视频内容。如本文所述，增强的分段视频与分段维度和分段维度的值相关联。

当在视频分段管理器110处接收到对视频内容的搜索查询时，视频分段管理器110可以访问增强的分段视频和对应的视频内容。计算设备(例如客户端设备190)可以用于访问与视频分段管理器110相关联的图形用户界面(未示出)以输入搜索查询。在一个实施例中，视频管理系统100和视频分段管理器110是视频托管服务的一部分。视频托管服务将与认知索引相关联的视频内容存储为增强的分段视频以用于执行搜索。

如图3C和3D所示，视频分段管理器110可以与图形用户界面310(例如视频托管界面)一起操作以支持与视频分段管理器的用户交互。视频分段管理器110可以经由图形用户界面310接收搜索查询，并且经由搜索输入312执行搜索以标识相关的增强的分段视频。视频分段管理器110操作以标识相关增强分段视频以用于搜索查询。相关增强分段视频是满足搜索查询的增强分段视频(例如索引数据条目)。满足搜索查询可以至少部分地基于与搜索查询相匹配的增强分段视频的分段维度的值。例如搜索可以与分段维度相关联-转录本314：“是的，我们可以”或OCR 316“Jason Bourne”或场景：“海滩”或主题318：“NBA”面部320：“Lebron”和情绪322：“积极的”或扬声器324。上面的搜索的格式是示例性的并且不意味着限制。然而，预期可以结合分段维度的指示接收搜索查询以在指示的分段维度中执行搜索查询。在这方面，搜索查询可用于标识相关的增强分段视频。

继续参考图3C和3D，例如使用图形用户界面310，用户可以选择相关增强分段视频的至少一个子集以生成视频分段播放列表。经由图形用户界面310的选择可以支持选择一个或多个相关的增强的分段视频，并且将选择的指示传送到视频分段管理器110。图形用户界面310包括支持查询、标识、过滤、为“分解视频”选择与增强的分段视频相对应的视频内容并共享分解视频的若干界面元素。视频内容可以显示在图形用户界面310的视频查看器部分330上，并且附加功能(例如自动滚动326和“在转录本中搜索”搜索栏328)可以经由图形用户界面310获得。具体地，引用图形用户界面310的增强的分段视频界面部分340，若干界面元素支持可视化增强的分段视频和突出显示视频元素或特征。例如可以将标识的增强分段视频(例如分段气泡)添加到最终分解视频，其中增强分段视频可以被视为分段气泡(例如分段气泡340-1和分段气泡340-2)。另外，音频图标340-1B和音频图标340-2B可以是与对应的分段气泡相关联的可选音频图标。类似地，分段气泡中的扬声器图标340-2C和OCR图标340-2D和OCR文本也可以是视频界面340的一部分，用于使分段尺寸可视化并利用本文描述的实施例执行交互操作。然后，视频分段管理器110从一个或多个增强的分段视频生成并保存视频分段播放列表。特别地，基于增强的分段视频的视频播放列表包括对多个相关增强分段视频的子集的引用。在一个实施例中，视频分段播放列表不包含任意实际数据或视频，而是作为经由增强的分段视频的对原始视频内容的引用(例如指针)进行操作。

作为示例，参考图3A，视频分段播放列表可以包括来自3个视频的4个分段，其中每个分段是具有属性360(例如分段#360A、源URL 360B、开始时间360C和结束时间360D)的数据条目350(即，增强的分段视频350A、350B、350C和350D)，如图3A所示。在图3B中，示出了关系模型370，其具有视频管理系统的特征之间的关系。例如视频372具有1个索引，并且每个索引属于1个视频(1：1)382。每个分段中N个分段的索引374和每个段属于1个索引(1：N)384。分段376可以通过N个视频分段播放列表引用，并且视频分段播放列表378可以引用N个分段(N：N)386。如上所述，视频分段播放列表引用管理器150可以在索引中管理关系模型370，以跟踪去往和来自用于一个或多个视频内容分段的视频分段播放列表的引用。

视频分段播放列表引用管理器150还可以根据需要存储和传送视频分段播放列表，以基于视频分段播放列表来共享视频分段播放列表和回放视频内容。具有引用的视频分段播放列表被传送，并且可以被选择以回放多个相关增强分段视频的子集。在回放期间，视频分段管理器110可以操作以计算与多个相关增强分段视频的子集相关联的视频内容的总持续时间。视频分段管理器110同步用于回放的进度条以模拟视频内容的统一视频回放。视频分段管理器110还操作以从视频分段播放列表预加载增强的分段视频的序列以用于流传输而不中断。

现在转向图4，提供了示出用于实现视频管理系统的功能的方法的流程图。最初在框410，使用视频内容认知索引来访问视频内容。视频内容与多个分段维度相关联。基于视频分析器服务来生成视频认知索引，该视频分析器服务将视频内容分析成并行的基于时间的维度，以标识与多个分段维度相关联的视频元素。分段规则至少部分地基于视频认知指数的分段维度。在框420处，将视频内容被分段为多个基于时间的分段。对视频内容进行分段基于分段规则，该分段规则指示如何选择视频内容的基于时间的分段。将视频内容分段为多个基于时间的分段包括标识多个分段维度的值以选择基于时间的分段。在框430处，基于从多个基于时间的分段重建一个或多个基于时间的分段来生成增强的分段视频，重建一个或多个基于时间的分段是基于分段重建规则，其指示如何重建视频内容的基于时间的分段。分段重建规则至少部分地基于视频内容认知索引的多个维度。重建一个或多个基于时间的分段包括分割或合并所选择的基于时间的分段。可以至少部分地基于增强分段视频的多个分段维度和多个分段维度的值来搜索增强分段视频。

现在转向图5，提供了示出用于实现视频管理系统的功能的方法的流程图。计算机存储介质具有在其上体现的计算机可执行指令，该计算机可执行指令当由一个或多个处理器执行时，使得一个或多个处理器执行用于实现视频管理系统的功能的方法。最初在框510处，访问视频内容。在框520处，基于视频内容和多个分段维度生成视频内容认知索引。在框530处，将视频内容分段为多个基于时间的分段。对视频内容进行分段基于分段规则，该分段规则指示如何选择视频内容的基于时间的分段。在框540处，基于从多个基于时间的分段重建一个或多个基于时间的分段来生成增强的分段视频，重建一个或多个基于时间的分段基于分段重建规则，分段重建规则指示如何重建视频内容的基于时间的分段。

现在转向图6，提供了示出实现视频管理系统的功能的流程图。最初在框610，接收对视频内容的搜索查询。增强的分段视频是基于分段维度、分段规则和分段重建规则来生成的基于时间的视频分段。结合分段维度的指示接收搜索查询以在指示的分段维度中执行搜索查询。在框620处，标识多个相关的增强分段视频。相关增强视频分段是增强分段视频，其至少部分地基于对应的多个分段维度来满足搜索查询。在框630处，接收对多个相关增强分段视频的至少一个子集的选择以生成视频分段播放列表。接收对多个相关增强视频分段中的至少一个子集的选择是基于图形用户界面，该图形用户界面支持显示多个相关增强分段视频的表示以及基于其表示的多个相关增强分段视频的子集的选择。在框640处，生成视频分段播放列表。视频分段播放列表包括对多个相关增强分段视频的子集的引用。在框650处，引起基于视频分段播放列表中的引用来对多个相关增强分段视频的子集的回放。回放包括基于与多个分段维度相关联的增强分段视频来访问视频内容。具体地，引起回放包括计算多个相关增强分段视频的子集的总持续时间并同步用于回放的进度条以模拟统一视频回放，使得多个相关增强分段视频的子集被顺序预加载用于不间断的流传输。

现在转到图7，提供了流程图，其示出了视频管理系统的实现功能。计算机存储介质具有在其上体现的计算机可执行指令，该计算机可执行指令当由一个或多个处理器执行时，导致一个或多个处理器执行用于实现视频管理系统功能的方法。最初在框710处，接收视频分段播放列表。视频分段播放列表包括对多个增强的分段视频的引用。增强的分段视频是基于分段维度、分段规则和分段重建规则来生成的基于时间的视频分段。基于用于搜索查询的多个相关增强分段视频的至少一个子集的选择来生成视频分段播放列表。相关增强分段视频是增强分段视频，其至少部分地基于多个分段维度的对应值来满足搜索查询。在框720处，引起基于视频分段播放列表中的引用的多个增强分段视频的回放。

引用视频管理系统100，本文描述的实施例可以改进相关视频内容的搜索、标识、共享和回放。视频管理系统组件是指实现视频管理的集成组件。集成组件指的是使用视频管理系统组件来支持功能的硬件架构和软件框架。硬件架构指的是物理组件及其相互关系，并且软件框架指的是提供可以用在设备上操作的硬件实现的功能的软件。端到端的基于软件的视频管理系统可以在其他组件内操作以操作计算机硬件以提供视频管理系统功能。这样，视频管理系统组件可以管理资源并为视频管理系统功能提供服务。本发明的实施方案考虑了任意其他变体和组合。

作为示例，视频管理系统可以包括API库，其包括例程、数据结构、对象类的规范，并且变量可以支持设备的硬件架构和视频管理系统的软件框架的交互。这些API包括视频管理系统的配置规范，使得其中的组件可以在视频管理中彼此通信，如本文所述。

在标识出视频管理系统100的各种组件之后，应注意，可以采用任意数量的组件来实现本公开范围内的期望功能。尽管为了清楚起见用线示出了图1的各种部件，但实际上，描绘各种部件并不是那么清楚，并且比喻地，线可以更准确地是灰色或模糊的。此外，尽管图1的一些组件被描绘为单个组件，但是描述本质上和数量上是示例性的，并且不应被解释为限制本公开的所有实现。可以基于上面列出的组件的功能和特征来进一步描述视频管理系统100的功能。

除了所示的那些之外或代替所示的那些，可以使用其他布置和元件(例如机器、接口、功能、顺序和功能分组等)，并且可以完全省略一些元件。此外，本文描述的许多元件是功能实体，其可以实现为离散或分布式组件或者结合其他组件一起实现，并且可以以任意合适的组合和位置实现。本文描述的由一个或多个实体执行的各种功能可以由硬件、固件和/或软件执行。例如各种功能可以由执行存储在存储器中的指令的处理器执行。

已经描述了本发明的实施例，下面描述其中可以实现本发明的实施例的示例性操作环境，以便提供本发明的各个方面的一般上下文。具体参考图8，用于实现本发明的实施例的示例性操作环境被示出，并且通常被指定为计算设备800。计算设备800仅是合适的计算环境的一个示例，并且不旨在启示对本发明的使用或功能范围的任何限制。也不应将计算设备800解释为具有对所示组件中的任意一个或组合有关的任意依赖性或要求。

本发明可以在计算机代码或机器可用指令的一般上下文中描述，包括计算机可执行指令，诸如程序模块，由计算机或其他机器执行，诸如个人数据助理或其他手持设备。通常，包括例程、程序、对象、组件、数据结构等的程序模块指代执行特定任务或实现特定抽象数据类型的代码。本发明可以在各种系统配置中实施，包括手持设备、消费电子产品、通用计算机、更多专业计算设备等。本发明还可以在分布式计算环境中实施，其中任务由通过通信网络链接的远程处理设备执行。

参考图8，计算设备800包括直接或间接耦合以下设备的总线810：存储器812、一个或多个处理器814、一个或多个呈现组件816、输入/输出端口818、输入/输出组件820和示意性电源822。总线810表示可以是一个或多个总线(诸如地址总线、数据总线或其组合)。尽管为了清楚起见，图8的各个框用线条示出，但实际上，描绘各种组件并不是那么清楚，并且比喻地，线条将更准确地是灰色和模糊的。例如可以将诸如显示设备的呈现组件视为I/O组件。此外，处理器有存储器。我们认识到这是本领域的本质，并且重申图8的图仅仅是可以结合本发明的一个或多个实施例使用的示例性计算设备的说明。在诸如“工作站”、“服务器”、“膝上型计算机”、“手持设备”、“移动设备”、“可穿戴设备”等类别之间没有区别，因为所有这些都被考虑在图8的范围内，并参考“计算设备”。

计算设备800通常包括各种计算机可读介质。计算机可读介质可以是可由计算设备800访问的任意可用介质，并且包括易失性和非易失性介质、可移动和不可移动介质。作为示例而非限制，计算机可读介质可包括计算机存储介质和通信介质。

计算机存储介质包括以用于诸如计算机可读指令、数据结构、程序模块或其他数据的信息的存储的任意方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储技术、CD-ROM、数字通用盘(DVD)或其他光盘存储器、磁带盒、磁带、磁盘存储器或其他磁存储设备、或可用于存储所需信息并且可由计算设备100访问的任意其他介质。计算机存储介质本身排除信号。

通信介质通常以诸如载波或其他传输机制的已调制数据信号来体现计算机可读指令、数据结构、程序模块或其他数据，并且包括任意信息传递介质。术语“已调制数据信号”表示以对信号中的信息进行编码的方式设置或改变其一个或多个特征的信号。作为示例而非限制，通信介质包括诸如有线网络或直接有线连接的有线介质，以及诸如声学、RF、红外和其他无线介质的无线介质。上述任意的组合也应包括在计算机可读介质的范围内。

存储器812包括易失性和/或非易失性存储器形式的计算机存储介质。存储器可以是可移除的、不可移除的或其组合。示例性硬件设备包括固态存储器、硬盘驱动器、光盘驱动器等。计算设备800包括从诸如存储器812或I/O组件820的各种实体读取数据的一个或多个处理器。呈现组件816向用户或其他设备呈现数据指示。示例性呈现组件包括显示设备、扬声器、打印组件、振动组件等。

I/O端口818允许计算设备800在逻辑上耦合到包括I/O组件820的其他设备，其中一些可以内置。示例性组件包括麦克风、操纵杆、游戏手柄、卫星天线、扫描仪、打印机、无线设备等

本文中具体描述了本公开的实施例的主题以满足法定要求。然而，描述本身并不旨在限制本专利的范围。相反，发明人已经预期所要求保护的主题还可以结合其他现有或未来技术以其他方式体现，以包括与本文档中描述的步骤类似的不同步骤或步骤组合。此外，尽管本文可以使用术语“步骤”和/或“框”来表示所采用的方法的不同元素，但是这些术语不应被解释为暗示本文公开的各个步骤之中或之间的任意特定顺序，除非和当单独步骤的顺序被明确地描述。

本文描述的实施例可以与一个或多个具体描述的替代方案组合。特别地，在替代方案中，要求保护的实施例可以包含对多于一个其他实施例的引用。要求保护的实施例可以指定所要求保护的主题的进一步限制。

出于详细讨论的目的，视频管理系统100被描述为与多个组件相关联的机制。本文使用的机制是指任意设备、过程或服务或其组合。可以使用诸如硬件、软件、固件、专用设备或其任意组合的组件来实现机制。机制可以集成到单个设备中，或者可以分布在多个设备上。机制的各种组件可以共同定位或分布。该机制可以从其他机制及其组件形成。资源管理系统100的组件有助于提供本文描述的功能。

出于以上详细讨论的目的，参考分布式计算设备、组件和视频管理系统组件来描述实施例。组件可以被配置为执行本文描述的实施例的新颖方面，其中“被配置为”包括被编程为使用计算机代码执行特定任务或实现特定抽象数据类型的组件。预期本文描述的方法可以在具有本文描述的功能组件的替代配置的不同类型的操作环境中执行。这样，本文描述的实施例仅仅是示例性的，并且可以预期这些技术可以扩展到其他实现上下文。

出于本公开的目的，词语“包括”具有与词语“包含”相同的广义含义，并且词语“访问”涉及“接收”、“引用”或“取回”。此外，除非另有相反指示，否则诸如“一”和“一个”的词语包括复数以及单数。此外，词语“通信”具有与使用本文所述的通信介质的软件或基于硬件的总线、接收器或发射器促进的词语“接收”或“发送”相同的广义含义。因此，例如在存在一个或多个特征的情况下满足“特征”的约束。此外，术语“或”包括联合、分离和两者(a或b因此包括a或b、以及a和b)。

已经关于特定实施例描述了本文呈现的实施例，这些实施例在所有方面都旨在是示意性的而不是限制性的。在不脱离本发明的范围的情况下，替代实施例对于本发明所属领域的普通技术人员将变得显而易见。

从前述内容可以看出，本发明很好地适用于实现上文所述的所有目标和目的，该目标和目的与显而易见的且结构固有的其他优点一起被阐述。

应当理解，某些特征和子组合是有用的，并且可以在不参考其他特征或子组合的情况下使用。这是由权利要求的范围预期的并且在权利要求的范围内。

Claims

1.一种用于实现视频管理的系统，所述系统包括：

一个或多个硬件处理器和存储器，所述存储器存储在其上体现的计算机可执行指令和组件，所述计算机可执行指令和组件在由所述一个或多个硬件处理器执行时，使得所述硬件处理器：

基于视频内容和多个分段维度来生成视频内容认知索引；

针对所述视频内容内的多个点，经由一个或多个视频分析器针对所述多个分段维度中的每个分段维度来量化所述视频内容，使得所述视频内容内的每个点具有针对所述多个分段维度中的每个分段维度的值；

将所述视频内容分段为多个基于时间的分段；

在将所述视频内容分段为所述多个基于时间的分段时，基于分段重建规则来生成增强的分段视频，所述分段重建规则包括以下一个或者两个：用于将短于第一阈值长度的两个或更多个基于时间的分段合并成较长的基于时间的分段的分段重建规则、和用于将长于第二阈值长度的基于时间的分段分割成两个或更多个较短的基于时间的分段的分段重建规则；

接收针对视频内容的搜索查询；

基于针对所述多个基于时间的分段中的每个基于时间的分段的所述多个分段维度的值，标识与所述搜索查询有关的增强的分段视频；以及

从与所述搜索查询有关的所述增强的分段视频生成视频分段播放列表。

2.根据权利要求1所述的系统，其中生成所述视频内容认知索引是基于视频分析器服务的，所述视频分析器服务分析所述视频内容，以标识与所述多个分段维度相关联的视频元素。

3.根据权利要求1所述的系统，其中生成所述视频内容认知索引是基于将所述视频内容分析为针对所述多个分段维度的并行的基于时间的维度的。

4.根据权利要求1所述的系统，其中所述分段重建规则是至少部分地基于所述视频内容认知索引的所述多个分段维度的。

5.一种用于视频管理的计算机实现的方法，所述方法包括：

使用视频内容认知索引来访问视频内容，其中所述视频内容与多个分段维度相关联，使得所述视频内容的不同部分具有针对所述多个分段维度中的每个分段维度的不同值，并且所述视频内容认知索引包括所述多个分段维度；

将所述视频内容分段为多个基于时间的分段；

接收针对视频内容的搜索查询；以及

基于针对所述多个基于时间的分段中的每个基于时间的分段的所述多个分段维度的值，标识与所述搜索查询有关的增强的分段视频。

6.根据权利要求5所述的方法，其中所述视频内容认知索引是基于视频分析器服务而被生成的，所述视频分析器服务将所述视频内容分析为并行的基于时间的维度，以标识与所述多个分段维度相关联的视频元素。

7.根据权利要求5所述的方法，其中所述分段重建规则是至少部分地基于所述视频内容认知索引的所述多个分段维度的。

8.一个或多个计算机存储介质，具有在其上体现的计算机可执行指令，所述计算机可执行指令当由一个或多个处理器执行时，使得所述一个或多个处理器执行用于视频管理的方法，所述方法包括：

访问视频内容；

基于视频内容和多个分段维度来生成视频内容认知索引，使得所述视频内容的不同部分具有针对所述多个分段维度中的每个分段维度的不同值；

将所述视频内容分段为多个基于时间的分段；

接收针对视频内容的搜索查询；以及