CN104246656A

CN104246656A - 建议的视频编辑的自动检测

Info

Publication number: CN104246656A
Application number: CN201380020912.9A
Authority: CN
Inventors: 约翰·格雷格; 威廉·布伦德尔; 托马斯·本顿·布里奇瓦特
Original assignee: Google LLC
Current assignee: Google LLC
Priority date: 2012-02-23
Filing date: 2013-02-23
Publication date: 2014-12-24
Anticipated expiration: 2033-02-23
Also published as: WO2013126854A1; EP2817691A4; US9003289B2; CN104246656B; EP2817691B1; EP2817691A1; US20130227415A1

Abstract

在此提供了涉及视频分类的系统和方法。经训练的分类器能够针对建议的编辑而分析视频。可以对该视频的多个特征进行分析，基于此确定该视频是否是用于各种类型编辑的良好候选。建议的编辑能够自动执行或者利用提交该视频的用户的授权而执行。用户能够查看所编辑的视频并且许可或拒绝该编辑。使用自动过程来建议并执行视频编辑能够提高视频数据存储内的视频的质量。

Description

建议的视频编辑的自动检测

相关申请的交叉引用

本申请要求于2012年2月23日提交的题为“AUTOMATICDETECTION OF SUGGESTED VIDEO EDITS”的美国专利申请序列号13/403,936的权益。其全文内容通过引用结合于此。

技术领域

本申请涉及视频分类，更具体地涉及建议的视频编辑的自动检测。

背景技术

随着更快的连接速度已经允许消费者上传其自己的个人视频，视频共享服务已经在互联网上变得很常见。大多数视频共享服务完全作为中介机构，因为它们为用户提供论坛来显示用户的个人视频。该论坛能够允许其他用户或公众能够观看所共享的视频。然而，一些上传的视频的质量可能存在疑问并且受到使得其他用户或公众难以或无法满意观看所共享视频的的问题的困扰。

虽然用户可能已经拥有了上传并共享视频的必备知识，但是一些用户没有针对已知问题而对视频进行编辑的知识或能力。例如，视频可能被不当旋转、照明不良、对比度不良、色彩平衡不正确或者存在晃动的问题。许多视频编辑软件套件能够对许多共享视频中存在的这些和其它问题进行校正；然而，用户可能不知道其视频中存在问题，其中特定问题对其所上传的视频具有不良印象，或者并不知道使用视频编辑软件校正任何问题的适当处理。

发明内容

以下给出说明书的简要发明内容以便提供对说明书的一些方面的基本理解。该发明内容不是说明书的扩展性概述。其不是意在识别说明书中的关键或必要要素也不是对说明书中的任意特定实施方式的范围或者权利要求的任何范围加以界定。其仅是用于以简化方式给出说明书的一些概念而作为本公开中所提供的更为详细的描述的前序。

这里所公开的系统和方法涉及视频分类，更具体地涉及建议的视频编辑的自动检测。接收组件能够从用户接收视频。分类器能够确定该视频是否是供编辑的良好候选。如果该视频是供编辑的良好候选，则分类器能够生成用于对该视频执行的建议编辑的列表。编辑组件能够基于该建议编辑的列表而生成编辑的视频。

附图说明

图1A图示了依据本公开的实施方式的示例分类器训练系统的高级别功能框图；

图1B图示了依据本公开的实施方式的建议的视频编辑的自动检测以及用于执行建议的视频编辑的选项的图形示例图示；

图2图示了依据本公开的实施方式的生成建议的视频编辑的示例系统的高级别功能框图；

图3图示了依据本公开的实施方式的包括编辑组件的子组件的生成建议的视频编辑的示例系统的高级别功能框图；

图4图示了依据本公开的实施方式的包括界面组件的生成建议的视频编辑的示例系统的高级别功能框图；

图5图示了依据本公开的实施方式的包括显示组件的生成建议的视频编辑的示例系统的高级别功能框图；

图6图示了依据本公开的实施方式的包括更新组件的生成建议的视频编辑的示例系统的高级别功能框图；

图7图示了依据本公开的实施方式的用于训练分类器以建议视频编辑的示例方法；

图8图示了依据本公开的实施方式的用于训练分类器以建议视频编辑的示例方法，包括利用新的训练数据更新数据存储；

图9图示了依据本公开的实施方式的用于处理用户视频提交的示例方法；

图10图示了依据本公开的实施方式的用于处理包括编辑的修改的用户视频提交的示例方法；

图11图示了依据本公开的实施方式的可操作以执行所公开的架构的计算机的示例框图；和

图12图示了依据本公开的实施方式的依据主题说明的计算环境的示例示意性框图。

具体实施方式

现在将参考附图对本发明进行描述，其中同样的附图标记在通篇中被用来指代相同的要素。在以下描述中，出于解释的目的而给出了许多具体细节以便提供对本发明的全面理解。然而，本发明显然能够在没有这些具体细节的情况下进行实践。在其它情况下，公知结构和设备以框图形式示出以便促成对本发明的描述。

被上传至视频共享站点的许多视频存在着能够通过软件进行校正的视觉问题。这些问题中的一些包括不当旋转、照明不良、对比度不良、色彩平衡不正确或晃动。视频编辑软件能够校正这些问题；然而，许多上传视频的用户不知道哪些视频是供编辑的良好候选或者如何对视频进行编辑。

在一个实施方式中，这里的系统和方法提供了从视频集合提取特征并且基于所提取的特征使用机器学习技术识别供视频编辑的良好候选。能够对分类器进行训练以将良好候选与不良候选加以区分，所述良好候选例如是将通过编辑而获益的视频，而所述不良候选则例如将不会通过编辑获益的视频。

这里的系统和方法进一步提供了接收所上传的视频并且在接收时对视频进行分类。上传视频的用户能够被通知针对该视频的建议的编辑。当用户授权时，该视频能够被自动编辑。可替换地，该视频能够在没有授权的情况下被自动编辑。通过自动检测上传视频中的错误并且针对所检测的错误对上传视频进行校正，能够提高所存储的上传视频的全域内的视频质量。

现在转向图1A，图示了依据本公开的实施方式的分类器训练系统的示例的高级别功能框图。特征提取组件130能够从视频数据集110中的视频提取特征集合。特征提取组件130能够使用过滤器组件120来提取特征集合。过滤器组件120能够识别视频的视觉属性，诸如指示明亮和暗淡像素分布的直方图(例如，对比度水平)、建议的相机运动(例如，晃动)或对象方位(不正确旋转)。能够意识到的是，能够采用其它类型的过滤器，例如包括用于红眼校正、色彩平衡、压缩校正、音视频同步等的过滤器。

例如，过滤器组件120能够采用与指示明亮和暗淡像素分布的直方图相关联的滤波器集合，并且能够被用来提取对比度水平特征。所提取的相应特征能够与单个过滤器或多个过滤器相关联。所提取的特征的示例可以包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征、音频特征等。

特征提取组件130能够从视频数据集110内的多个视频提取特征。在提取后，数据存储组件150能够将所提取的特征作为特征数据104的一部分存储在存储器102中。

训练组件140能够使用之前所识别并作为特征数据104的一部分存储的供编辑的已知良好候选和供编辑的已知不良候选从视频集110中识别之前未知的良好候选或之前未知的不良候选。新识别的良好候选和/或不良候选随后能够被数据存储组件150存储为特征数据的一部分并且添加至与个体特征相关联的良好和不良候选的已知集合。在一个实施方式中，训练组件140能够使用独立的标记源来识别供编辑的良好候选和/或不良候选。例如，独立源可以是其中用户或自动算法识别供编辑的良好候选和/或供编辑的不良候选的用户注释或自动注释。一般地，针对每个特征的已知良好和不良编辑候选的样本越大，分类器160就能更好地进行训练。

分类器160随后能够使用存储在特征数据104内的供编辑的良好候选的集合和供编辑的不良候选的集合(包括训练组件140新识别的候选)对新的视频进行分类并且确定新的视频是供编辑的良好候选还是不良候选。

能够结合与所请求保护主题相结合的执行自动和/或推导动作来采用各种分类(明确和/或隐含训练的)方案和/或系统(例如，支撑矢量机、神经网络、专家系统、贝叶斯置信网络、模糊逻辑、数据融合引擎、AdaBoost分类器…)。为了提供或辅助这里所描述的多种推论，这里所描述的组件能够对可用数据的全体或子集进行检查并且能够从如经由事件和/或数据捕捉的观察集合提供与系统、环境和/或客户端相关的理由或推导状态。例如，推论能够被用来识别具体的情境(context)或动作，或者能够生成状态的概率分布。该推论能够是概率性的—也就是基于对数据和事件的考虑而对感兴趣状态进行的概率分布计算。推论还能够指代被用来将来自事件和/或数据的集合的高级别事件进行组合的技术。这样的推论能够从所观察的事件和/或所存储的事件数据的集合、事件是否与时间接近度紧密相关以及事件和数据是否来自一个或多个事件和数据源而导致新的事件或动作的构造。

分类器可以使将输入属性矢量x＝(x1,x2,x3,x4,xn)映射至该输入属于一个分类的置信度的函数，也就是f(x)＝confidence(class)。这样的分类能够采用概率性和/或基于统计的分析(例如，将利用和成本纳入分析的考虑之中)以预测或推导用户期望自动执行的动作。支撑矢量机(SVM)是能够被采用的分类器的一个示例。SVM通过找出可能输入空间中的超表面而进行操作，其中该超表面试图将触发标准与非触发标准分离开来。直观地，这使分值类对于与训练数据想接近但不相同的测试数据是正确的。其它的指向性和非指向性模型分类方法例如包括AdaBoost、贝叶斯、贝叶斯网络、决策树、神经网络、模糊逻辑模型，并且能够使用提供不同独立性模式的概率分类模型。如这里所使用的分类还包括被用来开发优先级模型的统计回归。

现在转向图1B，图示了依据本公开的实施方式的建议的视频编辑的自动检测以及用于执行建议的视频编辑的选项的图形示例图示。用户170能够将视频172提交至视频分享服务。能够意识到，用户170能够通过各种不同手段来提交视频172，诸如通过个人计算机、服务器、路由器、网络PC、工作站、基于微处理器的器件、对等设备、智能电话、平板电脑或其它基于网络的设备。在180，例如使用如关于图1A所描述的分类器160，能够通过对视频提交172的特征进行分析而确定所建议的编辑的列表。能够意识到的是，能够确定多于一个的编辑列表。例如，能够创建多个建议的编辑列表以表示不同的变化程度或者变化的独立方向。

在一个实施方式中，编辑能够被自动执行182并且所编辑的视频能够被存储以便进行分享190。在另一个实施方式中，用户能够对编辑进行授权184，并且基于用户授权而编辑的视频能够被存储以便进行分享190。在一个实施方式中，用户能够撤销一个或多个所建议的编辑。在一个实施方式中，用户能够被呈现多个所建议的编辑列表并且能够观看执行一个或多个所建议的编辑列表的效果。用户随后能够确定其希望保留哪些所建议的编辑以及哪些其希望撤销。

现在转向图2，图示了依据本公开的实施方式的生成建议的视频编辑的示例系统的高级别功能框图。用户202能够向系统200提交视频204。能够意识到的是，视频204不局限于特定的大小、文件类型、压缩技术或内容类型。

接收组件210能够从用户202接收视频204。分类器220能够确定该视频是否为供编辑的良好候选。分类器220在对视频204进行分类时能够使用存储在存储器206中的特征数据207。如果分类器220确定该视频为供编辑的良好候选，则分类器220能够生成要对视频204执行的建议的编辑。例如，建议的编辑可以包括视频204应当被旋转以及视频所处的方向也应当进行旋转。

能够针对多个特征训练分类器220，包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征、以及音频特征中的至少一个。例如，分类器220能够向视频分配其是否为供编辑的良好候选的置信度分值，例如视频作为稳定化编辑的良好候选具有0.6的置信度分值。分类器220随后能够将该置信度分值与阈值进行比较以确定多个特征中的特征是否使得该视频成为供编辑的良好候选。在一个实施方式中，该阈值可以由用户、管理员或者经训练的分类器来确定。

编辑组件230随后能够基于该建议生成编辑视频。例如，分类器220能够因为视频204被检测为定向不当而将该视频204确定为供旋转编辑的良好候选。此外，分类器220能够为视频204确定正确方位，以及用于将该视频正确定向的建议旋转。编辑组件230随后能够基于分类器将其确定为旋转编辑的良好候选以及建议的旋转而生成正确定向的编辑视频。

现在转向图3，图示了依据本公开的实施方式的包括编辑组件的子组件的生成建议的视频编辑的示例系统的高级别功能框图。编辑组件230可以包括针对视频所存在的特定问题进行训练的子组件。能够意识到的是，图3所描绘的四个字组件仅是编辑组件230能够用来进行建议的编辑的可能子组件的示例。

旋转组件310能够基于建议的编辑对原始视频进行旋转。例如，所建议的编辑可以是以例如顺时针或逆时针的某个方向将视频旋转某个度数。照明组件320可以基于建议的编辑调整原始视频的对比度水平。例如，所建议的编辑可以是将与视频相关联的对比率增加或降低某个水平。稳定化组件330能够基于所建议的编辑对原始视频进行稳定化。例如，能够对晃动的图像进行稳定化以防止晃动视频的观看者感到迷失方向。

色彩平衡组件340能够基于所建议的编辑对原始视频的色彩平衡进行调节。例如，一些视频设备可能利用不正确的色彩记录视频，从而类似消防车的物体为栗色而不是红色。校正色彩平衡能够正确地呈现诸如自然色彩的特定颜色。

旋转组件310、照明组件320、稳定化组件330和色彩平衡组件340能够互相独立操作。在一个实施方式中，所有子组件或子组件的子集能够进行操作而对视频进行编辑。

现在转向图4，图示了依据本公开的实施方式的包括界面组件410的生成所建议的视频编辑的示例系统的高级别功能框图。界面组件410能够向用户呈现所建议的编辑。例如，能够向用户呈现所建议的编辑的列表。该列表可以是所有编辑的全局列表，用户能够在其中授权所有编辑的执行或者不对任何编辑进行授权。在另一个实施方式中，用户能够选择其期望对视频204执行的个体编辑。

在一个实施例中，接收组件210能够接收用于执行所建议的编辑的子集的用户授权。该用户授权可以基于所建议的编辑的整个集合或者所建议的编辑的子集。编辑组件230能够进一步基于该用户授权生成编辑视频。

在一个实施例中，界面组件410能够呈现编辑的视频以便向用户进行显示。用户随后能够观看编辑的视频并且确定由编辑组件230所进行的编辑是否是其所期望的。在一个实施例中，用户能够选择去除由编辑组件230所进行的任何编辑并且被重新呈现基于用户去除了个体编辑的经修改的编辑视频。用户能够对哪些建议编辑最终被结合到编辑视频中加以控制。

在一个实施例中，该界面组件能够向用户通知存储在相应应用日志中并且传送至服务器的信息类型，并且向用户提供选择退出收集和/或与服务器共享这样的信息的机会。

现在转向图5，图示了依据本公开的实施方式的包括显示组件510的生成所建议的视频编辑的示例系统的高级别功能框图。显示组件510能够向用户显示所编辑的视频。例如，在分类器220所确定的建议编辑由编辑组件230自动执行的实施方式中，显示组件510能够在不与用户对接和交互的情况下显示所编辑的视频。在这个实施方式中，视频分享服务提供商可能期望对任何所上传的视频拥有更多控制并且期望在不由用户进行选择的情况下进行所有所建议的编辑。显示组件510随后能够显示经编辑的视频而不是界面组件410。

现在转向图6，图示了依据本公开的实施方式的包括更新组件610的生成所建议的视频编辑的示例系统的高级别功能框图。更新组件610能够通过将编辑视频存储到存储器206中的共享视频存储602中而用编辑的视频替代低质量视频204。能够意识到的是，通过将视频204替换为编辑视频，能够使得存储空间要求最小化，因为仅保留编辑视频以供分享。在一个实施方式中，更新组件610能够自动将低质量视频204替换为编辑视频。在一个实施方式中，用户能够选择分享原始视频204还是由编辑组件230所生成的编辑视频。能够意识到的是，所存储的分享视频的全域可以不存在于如图6所描绘的系统200之内，而是可以作为如关于图11和图12更为全面描述的分布式计算环境的一部分。

图7-10图示了依据本公开的方法和/或流程图。为了便于解释，该方法被描绘并描述为一系列的动作。然而，依据本公开的动作能够以各种顺序和/或同时发生，并且可以具有这里没有给出并描述的其它动作。此外，并非所有所图示的动作都被需要来实施依据所公开主题的方法。此外，本领域技术人员将会理解并意识到，该方法可替换地可以经由状态图或实际而被表示为一系列中间状态。此外，应当意识到的是，本说明书中所公开的方法能够存储在制造品上以促成将这样的方法传输或输送至计算设备。如这里所使用的术语制造品意在包含能够从任意计算机可读设备或存储介质进行访问的计算机程序。

此外，以上已经结合相应系统示图对各种动作进行了详细描述。所要意识到的是，之前附图中对这样的动作的详细描述能够并且意在依据以下方法进行实施。

图7图示了依据本公开的实施方式的用于训练分类器以建议视频编辑的示例方法。在702，能够从视频提取特征集合(例如，使用特征提取组件)。该特征集合能够包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征、音频特征等。

在704，能够针对该特征集合中的每个特征从数据存储检索(例如，使用数据存储组件)良好候选特征的集合或不良候选特征的集合。例如，能够检索与不正确定向的视频相关联的良好候选特征的集合以及与正确定向的视频相关联的不良候选特征的集合。在该示例中，良好候选意味着用于建议编辑的良好候选。该过程然后能够针对在702所提取的所有特征进行重复。

在706，能够基于将来自视频的特征与关联于该特征的良好候选特征的集合和不良候选特征的集合进行比较而针对所提取的特征中的每个特征确定视频特征评级(例如，使用训练组件)。例如，如果视频的边缘特征的直方图与关联于供编辑的良好候选的边缘特征的直方图更加密切相似，则该视频特征的评级为高。如果相反，边缘特征的直方图与不良候选的边缘特征的直方图更加密切相似，则该特征评级将为低。能够意识到，能够针对分类器自行训练以进行测量的每个特征计算单独的特征评级。

在708，能够针对特征集合中的每个特征训练分类器(例如，使用训练组件)以识别该视频是供编辑的良好候选还是不良候选。

图8图示了依据本公开的实施方式的用于训练分类器以建议视频编辑的示例方法，其包括用新的训练数据更新数据存储。在802，能够从视频提取特征集合(例如，使用特征提取组件)。该特征集合能够包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征、音频特征等。

在804，能够针对该特征集合中的每个特征从数据存储检索(例如，使用数据存储组件)良好候选特征的集合或不良候选特征的集合。例如，能够检索与不正确定向的视频相关联的良好候选特征的集合以及与正确定向的视频相关联的不良候选特征的集合。在该示例中，良好候选意味着用于所建议的编辑的良好候选。

在806，能够基于将来自视频的特征与关联于该特征的良好候选特征集合和不良候选特征集合进行比较而针对所提取的特征集合中的每个特征确定视频特征评级(例如，使用训练组件)。例如，如果视频的边缘特征的直方图与关联于供编辑的良好候选的边缘特征的直方图更加密切相似，则该视频特征的评级为高。如果相反，边缘特征的直方图与不良候选的边缘特征的直方图更加密切相似，则该特征评级将为低。能够意识到，能够针对分类器自行训练以进行测量的每个特征计算单独的特征评级。

在808，能够针对特征集合中的每个特征训练分类器(例如，使用训练组件)以识别该视频是供编辑的良好候选还是不良候选。

在810，能够基于针对所提取的特征的集合中的每个特征的视频特征评级对视频进行分类(例如，使用分类器)。例如，每个特征能够被用来针对相关联的特征将视频关联为供编辑的良好候选或供编辑的不良候选。在812，如果视频被认为是良好或不良候选，则所提取的视频的特征能够被添加至相关联的特征的已知良好候选或已知不良候选的现有集合或者与其进行聚合(例如，使用数据存储组件)。例如，将特征与良好候选特征集合相关联的特征评级能够被添加至包含已知良好候选特征的集合的数据存储。类似地，将特征与不良候选特征集合相关联的特征评级能够被添加至包含已知不良候选特征的集合的数据存储。在视频未被认为是良好候选或不良候选的情况下，分类器能够忽略与视频相关联的特征数据。能够意识到的是，有越多良好候选示例和不良候选示例可用于分类器，其就越可能检测到建议编辑。

图9图示了依据本公开的实施方式的用于处理用户视频提交的示例方法。在902，能够(例如，由接收组件)从用户接收视频。

在904，能够(例如，使用分类器)对视频的多个特征进行分析。该多个特征可以包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征和音频特征。在906，分类器能够基于所分析的特征确定建议编辑。

在908，能够向用户显示所建议的编辑(例如，使用界面组件)。在910，能够(例如，由接收组件)从用户接收用于执行至少一个建议的编辑的授权。在912，能够(例如，使用编辑组件)生成编辑视频。

图10图示了依据本公开的实施方式的用于对包括编辑的修改的用户视频提交进行处理的示例方法。在1002，能够(例如，使用接收组件)从用户接收视频。

在1004，能够(例如，使用分类器)对视频的多个特征进行分析。该多个特征可以包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征、和音频特征。在1006，分类器能够基于所分析的特征确定建议编辑。

在1008，能够向用户显示所建议的编辑(例如，使用界面组件)。在1010，能够(例如，使用接收组件)从用户接收用于执行至少一个所建议的编辑的授权。在1012，能够(例如，使用编辑组件)生成编辑视频。

在1014，能够(例如，使用界面组件)向用户显示编辑视频。在1016，能够(例如，使用接收组件)从用户接收至少一个编辑去除请求。例如，用户可能不喜欢在步骤1012所进行的编辑的效果并且决定从所生成的编辑视频去除特定编辑。在一个实施方式中，用户能够单独选择哪些所建议编辑要被保留而哪些则被丢弃。

在1018，能够(例如，使用编辑组件)生成经修改的编辑视频。在1020，能够(例如，使用界面组件)向用户显示经修改的编辑视频。能够意识到的是，用户能够继续在经修改的编辑视频中选择或取消选择所建议的编辑以便得到最终的编辑视频。

贯穿该说明书对“一个实施方式”或“实施方式”的引用意味着结合该实施方式所描述的特定特征、结构或特性包括在至少一个实施方式中。因此，根据情境，短语“在一个实施方式中”或“在实施方式中”在贯穿该说明书各处的出现并非必然指代同样的实施方式。此外，特定特征、结构或特性可以以任意适当方式在一个或多个实施方式中进行组合。

就术语“包括”、“包含”、“具有”、“含有”、其各种变化形式以及其它类似词语在详细描述或权利要求使用的范围而言，这些术语意在以类似于术语“包含”的方式而是包含性的，其作为开放性的过度词语而不排除任何附加或其它的要素。

如本申请中所使用的，术语“组件”、“模块”、“系统”等通常意在指代计算机相关实体，其为硬件(例如，电路)、硬件和软件的组合，或者与具有一个或多个特定功能的操作机器相关的实体。例如，组件可以是但不局限于在处理器(例如，数字信号处理器)上运行的过程、处理器、对象、可执行程序、执行线程、程序和/或计算机。作为说明，在控制器上运行的应用与该控制器都可以是组件。一个或多个组件可以处于过程和/或执行线程之内，并且组件可以位于一台计算机上和/或在两台或更多计算机之间进行分布。另外，“设备”可以为特殊设计的硬件的形式；通过在其上执行使得硬件能够执行特定功能(例如，生成兴趣点和/或指纹)的软件而专门制造的通用硬件；计算机可读介质上的软件；或者它们的组合。

以上所提到的系统、电路、模块等已经关于若干组件和/或块之间的交互进行了描述。能够意识到的是，这样的系统、电路、组件、块等可以包括那些组件或所指定的子组件、一些所指定的组件或子组件，和/或另外的组件，而且取决于它们的各种置换和组合形式。子组件也可以被实施为通信耦合至其它组件而不是包括在父组件(层级)内的组件。此外，应当注意的是，一个或多个组件可以被组合为提供聚合功能的单个组件或者被划分为若干单独的子组件，并且可以提供诸如管理层之类的任意一个或多个中间层以通信耦合至这样的子组件以便提供聚合功能。这里所描述的任意组件还可以与这里并未专门描述但是被本领域技术人员所知的一个或多个其它组件交互。

此外，词语“示例”或“示例性”在这里被用来表示用作示例、实例或说明。这里被描述为“示例性”的任意方面或设计不必然被理解为相比其它方面或设计是优选或有利的。相反，使用词语“示例”或“示例性”是为了以具体的方式给出概念。如本申请中所使用的，术语“或”意在表示包含“或”而非排它性“或”。也就是说，除非以其它方式指出或者从上下文所清楚，否则“X采用A或B”意在表示任意的自然包含的置换形式。也就是说，如果X采用A；X采用B；或者X采用A和B，则“X采用A或B”在任意的上述实例下都得到满足。此外，除非以其它方式指出或者从上下文所清楚是针对单数形式，否则冠词“一个”(“a”和“an”)在本申请和所附权利要求中一般应当被理解为表示“一个或多个”。

参考图11，用于实施所请求保护的主题的各个方面的适当环境1100包括计算机1102。计算机1102包括处理单元1104、系统存储器1106、编解码器1105和系统总线1108。系统总线1108将包括但不限于系统存储器1106的系统组件耦合至处理单元1104。处理单元1104可以是各种可获得的处理器中的任何一个。双微处理器或其它多处理器架构也能够被采用作为处理单元1104。能够意识到的是，计算机1102能够被用来实施如关于图1A、图2、图3、图4、图5和图6更为全面描述的系统。

系统总线1108可以是若干类型的总线结构中的任意一种，包括存储器总线或存储器控制器、外围总线或外部总线和/或局部总线，它们使用各种可用的总线架构，包括但并不限于工业标准架构(ISA)、微通道架构(MSA)、扩展ISA(EISA)、智能驱动电子设备(IDE)、VESA局部总线(VLB)、外围组件互连(PCI)、卡总线、通用串行总线(USB)、高级图形端口(AGP)、个人计算机存储卡国际协会总线(PCMCIA)、火线(IEEE 1394)和小型计算机系统接口(SCSI)。

系统存储器1106包括易失性存储器1110和非易失性存储器1112。包含用于诸如在启动期间在计算机1102内的部件之间传输信息的基本例程的基本输入/输出系统(BIOS)存储在非易失性存储器1112中。作为说明而非限制，非易失性存储器1112可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器1110包括随机存取存储器(RAM)，其用作外部高速缓存存储器。根据该方面，易失性存储器可以存储写操作重试逻辑(图11中未示出)等。作为说明而非限制，RAM能够以许多形式获得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据速率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)。

计算机1102还可以包括可移动/非可移动、易失性/非易失性计算机存储介质。例如，图11图示了盘式存储1114。盘式存储1114包括但并不限于如磁盘驱动器、固态硬盘(SSD)、软盘驱动器、带式驱动器、Jaz驱动器、Zip驱动器、LS-100驱动器、闪存卡或记忆棒之类的设备。此外，盘式存储1114可以包括与其它存储介质独立或组合的存储介质，包括但并不限于光盘驱动器，诸如压缩ROM设备(CD-ROM)、CD可记录驱动器(CD-R驱动器)、CD可重写驱动器(CD-RW驱动器)或数字多功能盘ROM驱动器(DVD-ROM)。为了促成盘式存储设备1114到系统总线1108的连接，通常使用诸如接口1116的可移动或非可移动接口。

所要意识到的是，图11描述了用作用户和适当操作环境1100中所描述的基本计算机资源之间的中介的软件。这样的软件包括操作系统1118。能够存储在盘式存储1114上的操作系统1118用来控制并且分配计算机系统1102的资源。应用1120利用操作系统1118通过存储在系统存储器1106或盘式存储1114中的程序模块1124以及诸如引导/关机事务表等的程序数据1126对资源进行的管理。应用的示例包括分类操作、通过网络连接接收和存储视频、执行视频编辑任务以及生成所编辑的视频等。所要意识到的是，请求保护的主题能够利用各种操作系统或操作系统的组合来实施。

用户通过输入设备1128向计算机1102中输入命令或信息。输入设备1128包括但并不限于诸如鼠标的指示设备、轨迹球、触笔、触摸板、键盘、麦克风、操纵杆、游戏垫、卫星天线、扫描仪、TV调频卡、数码相机、数码摄像机、web相机等。这些和其它输入设备经由接口端口1130通过系统总线1108连接至处理单元1104。接口端口1130例如包括串行端口、并行端口、游戏端口和通用串行总线(USB)。输出设备1136使用一些与输入设备1128相同类型的端口。因此，例如，USB端口可以被用来向计算机1102提供输入，以及从计算机1102向输出设备1136输出信息。输出适配器1134被提供以图示存在一些输出设备1136，除其它输出设备1136之外，如监视器、扬声器和打印机，它们需要特殊的适配器。作为说明而非限制，输出适配器1134包括在输出设备1136和系统总线1108之间提供连接的装置的视频卡和声卡。应当注意的是，其它设备和/或设备的系统提供输入和输出能力，诸如远程计算机1138。

计算机1102可以使用到诸如远程计算机1138的一个或多个远程计算机的逻辑连接而在联网环境中进行操作。远程计算机1138可以是个人计算机、服务器、路由器、网络PC、工作站、基于微处理器的器件、对等设备、智能电话、平板电脑或其它网络节点，并且通常包括关于计算机1102所描述的许多部件。出于简明的目的，仅用远程计算机1138图示出了存储器存储设备1140。远程计算机1138通过网络接口逻辑连接至计算机1102并且随后经由通信连接1144进行连接。网络接口1142包含有线和/或无线通信网络，诸如局域网(LAN)和广域网(WAN)以及蜂窝网络。LAN技术包括光纤分布式数据接口(FDDI)、铜线分布式数据接口(CDDI)、以太网、令牌环等。WAN技术包括但并不限于点对点链接、如综合服务数字网(ISDN)及其变化形式的电路交换网络、分组交换网络以及数字订户线路(DSL)。

通信连接1144是指被用来将网络接口1142连接至总线1108的硬件/软件。虽然通信连接1144出于图示清楚的目的而被示为处于计算机1102内，但是其也可能处于计算机1102之外。仅出于示例性的目的，用于连接至网络接口1142必需的硬件/软件例如包括内部和外部技术，诸如包括常规电话级调制解调器、有线调制解调器和DSL调制解调器在内的调制解调器、ISDN适配器，以及有线和无线以太网卡、集线器和路由器。

现在参考图12，图示了依据主题说明书的计算环境1200的示例示意性框图。系统1200包括一个或多个客户端1202，它们可以包括访问服务器1204上的服务的应用或系统。客户端1202可以是硬件和/或软件(例如，线程、过程、计算设备)。例如通过采用该说明书，客户端1202可以含有cookie、元数据和/或相关联的上下文信息。

系统1200还包括一个或多个服务器1204。服务器1204也可以是硬件或者与软件(例如，线程、过程、计算设备)相结合的硬件。服务器1204可以含有例如用于执行依据本主题公开的视频分类、视频编辑、特征提取、视频存储或视频显示的线程。客户端1202和服务器1024之间的一种可能通信可以为数据分组的形式，其适于在两个或更多计算机过程之间进行传送，其中该数据分组例如包含音频样本。数据分组例如可以包括cookie和/或相关联的上下文信息。系统1200包括通信架构1206(例如，诸如互联网的全局通信网络)，其能够被用来促成客户端1202和服务器1204之间的通信。

通信能够经由有线(包括光纤)和/或无线技术来进行。客户端1202操作地耦合至一个或多个客户端数据存储1208，其能够被用来存储客户端1202本地的信息(例如，cookie和/或相关联的上下文信息)。类似地，服务器1204操作地连接至一个或多个服务器数据存储1210，其能够被用来存储服务器1204本地的信息。

本公开所说明的方面也能够在分布式计算环境中进行实践，其中某些任务由通过通信网络进行链接的远程处理设备来执行。在分布式计算环境中，程序模块能够位于本地和远程的存储器存储设备中。

以下所描述的系统和过程能够在硬件内体现，诸如单个集成电路(IC)芯片、多个IC、专用集成电路(ASIC)等。另外，一些或所有过程块在每个过程中出现的顺序不应当被认为是限制。相反，应当理解的是，一些过程块能够以各种顺序来执行，而非所有这些顺序都在这里被明确图示。

以上所描述的内容包括本发明的实施方式的示例。显然，不可能以描述所请求保护的主题为目的而对组件或方法的每种可预期的组合都进行描述，但是主题创新的许多另外的组合和置换形式都是可能的。因此，所请求保护的主题意在涵盖落入所附权利要求的精神和范围之内的所有这些改变、修改和变化。此外，以上对包括摘要中所描述的本公开所图示的实施方式的描述都不意在是穷尽的或者将所公开的实施方式限于所公开的精确形式。虽然这里出于说明的目的描述了具体的实施方式和示例，但是如相关领域的技术人员所能够认识到的，被认为处于这样的实施方式和示例的范围之内的各种修改都是可能的。

具体地并且有关以上所描述的组件、设备、电路、系统等所执行的各种功能，除非以其它方式指出，否则用来描述这样的组件的术语意在对应于执行所描述组件的指定功能的任意组件(例如，功能等同形式)，即使其在结构上与所公开的结构并不等同，但是执行这里所说明的所请求保护主题的示例性方面中的功能。就此而言，还要认识到的是，本发明包括系统以及具有计算机可执行指令的计算机可读存储介质，上述指令用于执行所请求保护的主题的各种方法的动作和/或事件。

权利要求书(按照条约第19条的修改)

1.一种系统，包括：

存储器，所述存储器存储计算机可执行组件；和

处理器，所述处理器执行所述存储器内的以下计算机可执行组件：

接收组件，所述接收组件接收视频；

分类器：

通过将所述视频与已知为供编辑的良好候选的视频的集合和已知为供编辑的不良候选的视频的集合进行比较，来确定所述视频是否为供编辑的良好候选；以及

响应于确定所述视频是供编辑的良好候选，生成用于对所述视频执行的建议编辑；和

编辑组件，所述编辑组件基于所述建议编辑自动生成编辑视频。

2.根据权利要求1所述的系统，所述编辑组件进一步包括：

旋转组件，所述旋转组件基于所述建议编辑对原始视频进行旋转。

3.根据权利要求1所述的系统，所述编辑组件进一步包括：

照明组件，所述照明组件基于所述建议编辑对原始视频的对比度或亮度水平进行调节。

4.根据权利要求1所述的系统，所述编辑组件进一步包括：

稳定化组件，所述稳定化组件基于所述建议编辑对原始视频进行稳定化。

5.根据权利要求1所述的系统，所述编辑组件进一步包括：

色彩平衡组件，所述色彩平衡组件基于所述建议编辑对原始视频的色彩平衡进行调节。

6.根据权利要求1所述的系统，进一步包括：

界面组件，所述界面组件在所述编辑组件自动生成所述编辑视频之前呈现所述建议编辑以供授权。

7.根据权利要求6所述的系统，其中所述接收组件进一步接收执行所述建议编辑的子集的用户授权输入。

8.根据权利要求7所述的系统，其中所述编辑组件自动生成所述编辑视频进一步限于所述建议编辑的所述子集。

9.根据权利要求8所述的系统，其中所述界面组件呈现所述编辑视频。

10.根据权利要求1所述的系统，进一步包括：

显示组件，所述显示组件显示所述编辑视频。

11.根据权利要求1所述的系统，其中所述分类器针对多个特征进行训练，所述多个特征包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征或音频特征中的至少一个。

12.一种用于训练分类器的方法，包括：

采用处理器执行存储器中所存储的计算机可执行指令以实施以下动作：

从视频提取特征集合；

针对所述特征集合中的每个特征从数据存储检索良好候选特征的集合以及不良候选特征的集合；

基于来自所述视频的特征与针对所述特征检索到的所述良好候选特征的集合以及所述不良候选特征的集合的比较来针对所提取的特征集合中的每个特征确定视频特征评级；以及

针对特征集合中的每个特征训练分类器以识别所述视频是供编辑的良好候选还是不良候选。

13.根据权利要求12所述的方法，进一步包括：

针对所述特征集合中的每个特征基于所述视频特征评级对所述视频进行分类。

14.根据权利要求13所述的方法，进一步包括：

基于所述分类将所述视频存储在所述数据存储中。

15.根据权利要求12所述的方法，其中所述特征集合包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征或音频特征中的至少一个。

16.一种视频编辑方法，包括：

接收视频；

对所述视频的多个特征进行分析；

使用分类器基于所分析的特征与来自已知为供编辑的良好候选的视频的第一特征集合和来自已知为供编辑的不良候选的视频的第二特征集合的比较来确定建议编辑；以及

基于所述建议编辑生成编辑视频。

17.根据权利要求16所述的视频编辑方法，其中生成编辑视频包括：

显示所述建议编辑以供授权；

接收指定要执行的所述建议编辑的子集的授权输入；以及

使用所述建议编辑的所述子集生成所述编辑视频。

18.根据权利要求16所述的视频编辑方法，进一步包括：

显示所述编辑视频。

19.根据权利要求18所述的视频编辑方法，进一步包括：

接收指定要从所述建议编辑的所述子集去除的至少一个编辑的至少一个编辑去除请求；以及

基于所述至少一个编辑去除请求生成经修改的编辑视频。

20.根据权利要求19所述的视频编辑方法，进一步包括：

显示所述经修改的编辑视频。

21.根据权利要求16所述的视频编辑方法，其中所述多个特征包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征或音频特征中的至少一个。

Claims

1.一种系统，包括：

存储器，所述存储器存储计算机可执行组件；和

接收组件，所述接收组件从用户接收视频；

分类器，所述分类器确定所述视频是否为供编辑的良好候选，并且如果所述视频是供编辑的良好候选，则所述分类器生成用于对所述视频执行的建议编辑；和

2.根据权利要求1所述的系统，所述编辑组件进一步包括：

3.根据权利要求1所述的系统，所述编辑组件进一步包括：

4.根据权利要求1所述的系统，所述编辑组件进一步包括：

5.根据权利要求1所述的系统，所述编辑组件进一步包括：

6.根据权利要求1所述的系统，进一步包括：

界面组件，所述界面组件向用户呈现所述建议编辑。

7.根据权利要求6所述的系统，其中所述接收组件进一步接收执行所述建议编辑的子集的用户授权。

8.根据权利要求7所述的系统，其中所述编辑组件进一步基于所述用户授权自动生成所述编辑视频。

9.根据权利要求8所述的系统，其中所述界面组件呈现所述编辑视频以便向用户进行显示。

10.根据权利要求1所述的系统，进一步包括：

显示组件，所述显示组件向用户显示所述编辑视频。

11.根据权利要求1所述的系统，其中所述分类器针对多个特征进行训练，所述多个特征包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征和音频特征中的至少一个。

12.一种用于训练分类器的方法，包括：

从视频提取特征集合；

针对所述特征集合中的每个特征从数据存储中检索良好候选特征的集合以及不良候选特征的集合；

基于来自所述视频的特征与关联于所述特征的所述良好候选特征的集合以及所述不良候选特征的集合的比较，来针对所提取的特征集合中的每个特征确定视频特征评级；以及

13.根据权利要求12所述的方法，进一步包括：

14.根据权利要求13所述的方法，进一步包括：

基于所述分类将所述视频存储在所述数据存储中。

15.根据权利要求12所述的方法，其中所述特征集合包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征和音频特征中的至少一个。

16.一种视频编辑方法，包括：

从用户接收视频；

对所述视频的多个特征进行分析；

使用分类器基于所分析的特征确定建议编辑；以及

生成编辑视频。

17.根据权利要求16所述的视频编辑方法，进一步包括：

向用户显示所述建议编辑；以及

在生成所述编辑视频之前，从用户接收执行所述建议编辑中的至少一个的授权。

18.根据权利要求16所述的视频编辑方法，进一步包括：

向用户显示所述编辑视频。

19.根据权利要求18所述的视频编辑方法，进一步包括：

从用户接收至少一个编辑去除请求；以及

基于所述至少一个编辑去除请求生成经修改的编辑视频。

20.根据权利要求19所述的视频编辑方法，进一步包括：

向用户显示所述经修改的编辑视频。

21.根据权利要求16所述的视频编辑方法，其中所述多个特征包括局部特征的直方图、色彩直方图、边缘特征、纹理基元直方图、面部特征、相机运动、镜头边界特征和音频特征中的至少一个。