CN104782138B

CN104782138B - 缩略图图像选择系统、方法及计算机可读介质

Info

Publication number: CN104782138B
Application number: CN201380057176.4A
Authority: CN
Inventors: 贾斯汀·刘易斯; 亨利·本杰明; 斯坦利·查尔斯·罗斯·沃尔夫
Original assignee: Google LLC
Current assignee: Google LLC
Priority date: 2012-09-13
Filing date: 2013-09-13
Publication date: 2018-10-16
Anticipated expiration: 2033-09-13
Also published as: EP2896213A4; US11308148B2; US9274678B2; WO2014043438A1; US20140074759A1; EP2896213A1; US20160170985A1; CN104782138A

Abstract

示出用于从媒体呈现生成图像帧，使用选择过程从所生成的图像帧选择候选缩略图，并且测试每个所选候选缩略图相对于目标度量的成功排名的技术。选择具有比所有其他所选缩略图更高的成功排名的所选候选缩略图作为用于呈现给用户的最佳缩略图的概率至少部分地基于具有最高成功排名的所选候选缩略图的成功排名与所有所选候选缩略图的成功排名的总和的比率。提交本摘要是理解，其将不用于解释或限制权利要求的范围或意义。

Description

缩略图图像选择系统、方法及计算机可读介质

背景技术

视频共享网站可以仅示出用于给定视频的中间帧或某个其他随机选择帧，作为视频的假设“典型(representative)”帧。这样的随机选择和缩略图图像的呈现可以是用户是否观看视频的确定因素、以及从用户体验获得的其他目标的满意或实现的水平。

发明内容

所公开的技术提供典型缩略图图像帧用于媒体呈现，例如，呈现在视频共享网站上的视频或静止或流送图像的其他分组。缩略图图像选择系统包括图像帧生成工具，该图像帧生成工具从媒体呈现生成一个或多个图像帧的集合。缩略图选择工具从该图像帧集合选择一个或多个候选缩略图图像。候选缩略图排名计算器相对于目标度量，测试并且排列每个所选候选缩略图。概率学习工具作为所选候选缩略图的成功排名与由缩略图选择工具选择的所有缩略图图像的成功排名的总和之间的比率的函数，确定选择候选缩略图作为最佳候选缩略图的概率。最终，呈现器将最佳候选缩略图显示给用户。

实现可以包括对应系统、装置和计算机程序，其被配置成执行方法的动作，并且被编码在计算机存储设备上。本发明内容不旨在引入所要求主题的关键特征或必要特征，而是仅提供将在具体实施方式中进一步描述的思想的选择。将在以下参考附图详细地描述进一步实现、特征、和优点、以及各种实现的结构和操作。

附图说明

参考附图描述实现。在附图中，类似参考数字可以指示相同或功能相似元件。元件首次出现的附图通常由对应参考数字中的最左阿拉伯数字指示。

图1是图示根据本公开的一种实现的组件的框图。

图2是图示根据本公开的一种实现的技术的流程图。

图3是图示根据本公开的另一种实现的技术的流程图。

图4是图示根据本公开的又一种实现的技术的流程图。

图5是根据本公开的一种或多种实现采用的示例性计算机系统的示意图。

具体实施方式

所公开的机制识别最佳缩略图图像，以表示(to represent)在视频共享网站上呈现的视频，或者识别最佳缩略图图像，以表示静止或流送图像的任何分组或集合。最佳缩略图图像是相对于目标度量得到最佳成功排名的图像，其中，依据在表示媒体呈现并且实现用户或媒体传播者的目标时缩略图多么有用，来测量成功。

所公开的技术识别最佳缩略图图像，以表示媒体呈现，例如，呈现在视频共享网站上的视频，或者静止或流送图像、图标、文本对象等的一些其他分组或集合。特定缩略图是用于表示特定媒体呈现的“最佳”缩略图的确定包括：用于最佳缩略图相对于目标度量的分值与其他候选缩略图的分值相比的比较。概率学习工具使用模拟退火法的形式确定用于给定媒体呈现、用于特定用户、用于生成缩略图(用于缩略图的源)的特定方法、或用于特定搜索项、网页、web信道、或搜索结果的主题的结果的最佳缩略图。由学习过程采用的计算方法的特征在于，通过用随机解决方案替换该解决方案并且相对于目标度量测量进展，迭代地尝试改善该方案。如在此使用的随机包括伪随机，其可以不是100％随机，100％的时间。

作为由本公开的实现完成的一些说明性结果，当与其他候选缩略图相比较被测量时，来自视频或静止或流送图像的其他分组的所选最佳候选缩略图图像产生更高点击率(CTR)，或者帮助用户更好地识别视频，由此产生比CTR更高的关注完成(Watchcompletion)。可能选择的典型缩略图图像还可以直接绑定到期望参数，例如，由视频生成的收入(revenue)，并且所公开的技术可以被用于选择产生最多收入的候选缩略图图像。可以找到特定缩略图图像，以吸引更适合于示出更赚钱广告的用户的人口。类似地，用于生成用于特定用户的缩略图的方法可以是用于特定用户的最佳缩略图源。用于使用用于该用户的最佳源生成的缩略图的排名大于使用用于该用户的不同源生成的其他缩略图的排名。作为一个实例，具有名人的脸的缩略图图像可以相对于诸如用于一个特定用户的CRT的度量，实现更好的结果，而具有风景快照的缩略图图像可以相对于用于不同用户的相同度量，实现更好的结果。

数字技术对媒体节目的传播和回放具有显著影响。首先，数字技术允许数字视频录像机(DVR)的使用。DVR提供包括直播暂停的多个有用功能、在回放一个节目的同时记录另一个节目的能力、以及电子节目指南与DVR功能的集成(使得媒体节目的记录可以很早预先被调度)。第二，技术还允许媒体节目经由互联网的传播和回放，包括通过视频共享网站。通过改善的信号处理和越来越多的具有高速互联网接入(例如，电缆、DSL、光纤、卫星)的家庭，该传播和回放的方法变得普通。

媒体节目经由互联网传播可以通过简单下载、渐进下载或流送发生。对于渐进下载，具有媒体节目的媒体文件使用拨号、DSL(数字用户线)、ADSL(异步数字用户线)、电缆或其他高速互联网连接，经由互联网被下载。简单下载按照任何方便顺序下载多个字节的媒体文件，而渐进下载在文件的开始处下载字节，并且继续依序地下载文件，直到最后字节为止。在渐进下载期间的任何特定时间，文件的多个部分不立即可用于回放。在一些情况下，整个文件必须在媒体播放器可以开始回放之前首先被下载。在其他情况下，一旦已下载文件开始的足够内容，媒体播放器就能够开始回放，然而在回放可以发生之前，媒体播放器必须下载足够信息，以支持某种形式的回放。回放通常由慢互联网连接被延迟，并且可能是波动的，并且具有在仅几秒钟之后停止的可能性。下载的材料还可以被存储在终端用户计算机上。

流送将媒体内容连续地传递至媒体播放器，并且媒体回放同时发生。当由内容提供商传递时，终端用户能够立即播放媒体。源自诸如视频共享网站的拥有者的单个提供商的传统流送技术将数据流传递至终端用户集合。要求高带宽和CPU功率，将单个流传递至大批听众，并且当终端用户的数量增加时，提供商的所要求带宽增加。

不像渐进下载那样，流送媒体在点播或直播时被传送。其中，渐进下载要求下载整个文件或者下载整个文件的足够内容以在开始时开始回放，流送使得能够在文件内的任何点处的立即回放。终端用户可以跳过媒体文件，以开始回放或将回放改变至媒体文件中的任何点。因此，终端用户不需要等待文件以渐进地下载。通常，从具有高带宽能力的专用服务器传递媒体。

诸如由视频共享网站、电影传递网络等提供的点播流送媒体服务允许宽频谱媒体节目可用于用户立即查看。提供点播流送媒体服务的挑战之一是给用户提供接口，该接口允许用户有效率地和有效地选择他们想要查看的媒体节目。

给用户提供关于可用媒体节目的信息的一种方式是使用元数据或者摘要数据。这样的元数据可以包括诸如媒体节目的源、演员、流派 (戏剧、戏剧)、目标年龄组、和/或媒体节目的一个或多个缩略图(媒体节目的小静止视频帧)的因素。然后，使用元数据帮助用户搜索感兴趣的媒体节目，或者帮助媒体节目传播者以便于允许用户找到感兴趣的媒体节目的方式组织媒体节目。

可以使用视觉元数据(诸如缩略图)在客户端设备上的用户指南或其他呈现中图示或表示媒体节目。如果缩略图的选择不是关键的或者如果提供媒体节目的一方还提供缩略图，则获得这样的缩略图是相对简单的事情。然而，在提供大量媒体节目的媒体传播范例中，媒体节目提供商可能不提供缩略图，并且缩略图选择是关键的，生成缩略图也不是简单的事情。例如，视频的随机选择帧可以提供关于媒体节目的很少信息或不提供该信息，或者这样的随机帧可能错误表示节目的内容。点击这样的随机选择帧的用户可能对所得到的视频或静止或流送图像的呈现失望。效果可能是很差的用户体验、以及不及用于视频或者其他媒体呈现的提供商的最佳结果。随机选择的缩略图还可以包括对视频的传播者希望触及的该类型的用户没有吸引力的图像。

即使给用户提供在时间上通过媒体节目均匀分布的多个可能缩略图，这些缩略图也不可能充分表示潜在媒体节目。而且，虽然可以允许用户一帧一帧地扫描媒体节目，以识别合适缩略图，但是当识别缩略图的实体是必须处理成百上千个媒体节目的媒体传播者时，这是一个耗时的过程。需要一种允许快速地和容易地识别最佳缩略图的方法和装置，其中，从期望目标度量的角度看，所选缩略图提供媒体节目的有用表示。

可以扫描视频数据或其他图像数据，以识别图像帧和可能候选缩略图。然后，使用多个不同选择方法中的任何一个，从图像帧或可能候选缩略图中选择候选缩略图。然后，通过作为选择的函数测量相对于特定度量获得的结果，向所选候选缩略图给予分值。因为必须关于特定度量被估计和评分以达到用于特定视频的最佳缩略图的可能大量候选缩略图，所以元启发式学习过程可以被应用至问题解决方案。元启发方法是用于使用不同方法探究搜索空间的高级策略。

模拟退火法(SA)是提供明确策略以避免集中于局部明显最佳值上而不是期望的全局最佳值上的解决方案。当被应用至寻找最佳缩略图的解决方案时，SA学习过程允许后续的从一个可能候选缩略图至另一个的随机移动，可能得到更差质量的解决方案(相对于度量具有更差分值的缩略图)，由此避免集中在假局部最佳值上。特别是在解决方案过程的早期，跳至远离和/或与在前测试值不同方向的随机值的能力避免了集中在假局部最佳值上。

SA学习过程允许在固定量时间内确定可接受的良好解决方案，而不是在无限量时间内确定最佳可能解决方案。SA学习过程的每个步骤都试图用随机解决方案代替当前解决方案(根据通常被构造成接近当前解决方案的解决方案的采样的候选分布被选择)。然后，新的解决方案可以被接受，具有取决于当前所选解决方案的分值与用于所有先前解决方案的总分之比、以及全局参数的概率，其可以在该过程期间逐渐改变。该依赖性使得当全局参数小于1时，先前和当前解决方案几乎是随机的，但是当全局参数从1增加时，日益增加地选择更好的解决方案。当全局参数小于1时，对表面上使解决方案远离最佳值的移动的允许可能避免使方法变得坚持局部最小值，而不是接近期望的全局最佳解决方案。当应用至在一种实现中寻找用于最佳候选缩略图的解决方案时，SA学习过程通过以下方程A表示：

方程A：(CT^指数)/总计(用于S中的所有Si的Si^指数)，其中， CT^指数是提升至指数的最高得分候选缩略图的分值，其中，指数是以上参考的全局参数。Si^指数是提升至用于被选择和评分的缩略图的集合S的每个成员的指数的缩略图得分。通过方程A计算示出来自候选缩略图的集合S的给定候选缩略图CT的概率。

在相对于特定度量的候选缩略图的得分CT与从缩略图集合中选择候选缩略图呈现给用户的可能性之间的映射可能不是线性的。在本公开的一种可能实现中，如由应用以上方程A的学习过程所示，在计算选择和呈现特定缩略图的概率之前，候选缩略图的分值可以具有应用至它们的某个指数(全局参数)。

指数>1将较高优先级给予相对于目标度量的具有高成功速率、或高分值的缩略图，并且将较低优先级给予未经证明的缩略图、或者相对于目标度量具有较低成功速率或较低分值的缩略图。指数<1将较高优先级给予未经证明的缩略图。指数<1在选择候选缩略图的迭代过程的早期可以被使用，以便避免在足够数据已被聚集之前，太快地集中在明显最佳候选缩略图上。甚至通过指数<1，最成功缩略图比不太成功缩略图仍然更频繁地出现，但是用于最成功缩略图和不太成功缩略图的出现次数之间的差距将小很多。在一些实现中，被使用的指数对于每个视频可能是唯一的，用于特定视频的所有候选缩略图都使用相同指数。指数还可以是动态的。例如，指数可以相对于用于特定视频或静止或流送图像的其他分组的多个视图而变化。在该实现中，具有更多视图的视频具有更高指数，并且从而以上公式将产生特定缩略图的更一致显示。另一方面，具有较少视图的新视频将倾向于具有较低指数，并且从而具有较低得分、未经证明或实验的缩略图。

当在选择候选缩略图时应用的以上参考的公式提供用于执行选择过程的全局最优化的方法。该公式在计算方法中应用，该计算方法通过迭代地尝试改善最终结果来优化要选择哪个候选缩略图的问题。如果当以远离先前选择相同距离和/或在远离先前选择相同的方向上选择每个后续候选缩略图时，结果持续改善，则能够继续以每个选择都是远离相同的距离和/或在相同方向上来迭代地选择缩略图。但是如果结果停止改善，则学习过程可以在更远距离和/或在不同方向上，随机地选择下一个候选缩略图。

模拟退火法过程的每个步骤的特征在于，上述方程相对简单，但是该方程还可以包括多种其他因数。例如，新的候选缩略图可以开始于给定初始分值。该初始分值是相对于已经存在的候选缩略图的平均分值。类似地，候选缩略图分值不需要开始于0。

用于对候选缩略图评分的目标度量

在确定用于候选缩略图的特定选择的分值时使用的目标度量可以包括：

点击率(CTR)，点击率是在按照示出缩略图的次数划分的所选缩略图上的点击的次数，表示为百分比；

观看完成，观看完成是在用户查看表示视频、或静止或流送图像的其他分组的所选缩略图之后，观看视频、或静止或流送图像的其他分组直到完成为止的次数；

短观看，短观看是仅在短时间段内观看视频或者在用户查看所选缩略图之后不观看到完成为止的次数；

所生成的收入，所生成的收入是从在看到特定所选缩略图之后查看的视频、或图像的其他分组生成的收入的量，例如，从到广告、或在视频或静止或流送图像的其他分组中提供的其他收入生成机制的链接；

每会话速率的观看计数，诸如，在特定时间段内或者特定在线会话期间等观看视频的次数。

根据本公开的一个示例实现应用的技术的一部分是从视频数据、或将被呈现为流送或静止图像帧的其他媒体数据生成N个缩略图图像的集合S。在该过程中的任何时间点，更多缩略图可以被添加至该集合或者从缩略图的该集合去除。缩略图的该集合可以以很多不同方式被生成。缩略图的该集合S可以被生成用于特定媒体呈现，诸如呈现在视频共享网站上的视频，而不管任何搜索项或用户，用于在使用特定搜索项或一组项或短语的搜索中发现的媒体呈现，用于诸如web搜索页面、信道网页或静止或流送图像或其他媒体的其他同质分组的特定位置、用于特定用户、或者用于生成的特定方法或缩略图的源-诸如，根据特定用户的行为偏好等。

用于从图像帧选择候选缩略图的示例方法

用于从多个图像帧选择可能候选缩略图的方法的一些非限制性实例可以包括以下：

按时间帧选择-其中，选择是每个第N帧或每一个帧，其是图像帧的总数的x％；

随机帧选择；

由特定用户或广泛用户基础(base)查看最多的帧；

提供脸、或脸的最清晰视图的帧；

具有特定演员、运动员的轮廓、或其他名人的图片的帧；

提供颜色或阴影的最高对比的帧；

提供最亮或最柔和色调、颜色等的帧；

具有与周围帧的最低、或最高Δ或差值的帧；

具有特定属性、或期望种类或主题专有的特征的帧；

最突出显示在网页上的帧；

具有所描述的最多动作、或极端动作的帧；

具有建筑结构的帧；

具有动物的帧；

具有孩子的帧；

具有风景的帧；等。

在替代实现中，所采用的人类或用户可以建议候选缩略图帧。视频共享网站可以使得当用户在社交网络上共享视频时，用户挑选哪个帧被示出为典型缩略图。在一种实现中，缩略图选择工具搜索多种通信网络，诸如，互联网，以找到特定用户或一组用户最频繁挑选为视频的表示的图像帧，并且缩略图选择工具使用那些挑选作为可能候选缩略图图像。类似地，很多博客都评论视频和TV情节。它们频繁地将具有它们自己的视频的屏幕快照。缩略图选择工具可以可操作地被配置成搜查互联网或其他通信网络，以寻找这些屏幕快照，并且使用放在网页上的最显著位置上的屏幕快照。新闻报道将频繁地具有伴随视频的其他图像。代替从视频本身挑选图像帧，由博客、新闻组织、或其他第三方选择的这些其他帧或屏幕快照可以在选择过程中使用，以达到最佳候选缩略图图像。

每个所选候选缩略图都可以与分值相关联。该分值反映该缩略图关于一个或多个度量的最新成功。显示为例如视频、或静止或运动图像、图标、对象的集合、或者任何类型的静止或流媒体的媒体呈现的表示的缩略图可以从缩略图的列表或集合中被随机地选择，使得选择任何特定缩略图的概率与该缩略图的分值相对于用于缩略图的集合的总分成比例。以此方式，具有较高分值的缩略图被更频繁地选择，但是有时挑选和测试其他缩略图。分值与目标度量的增加成比例地增加。例如，如果测试度量是点击率(CTR)，则每次候选缩略图由用户使用或点击时，用于给定缩略图的分值增加。

示例实现

最初参考图1，缩略图图像选择系统100包括图像帧生成工具110 和缩略图图像处理器120。虽然图像帧生成工具110用图表示出为独立于缩略图图像处理器120的框或模块，但是多种组件可以一起被组合到一个服务器、或一组服务器、或跨过网络可通信地耦合在一起的一个或多个服务器与一个或多个客户端的某种组合上。

图像帧生成工具110从视频共享网站或者用于静止或流送图像、图标、对象或其他媒体的分组的其他位置或源上的媒体呈现，生成图像帧集合112、114、116、118。

缩略图图像处理器120包括缩略图选择工具130、候选缩略图排名计算器132、候选缩略图分值比较器134、概率学习工具136、以及最佳缩略图呈现工具138。

缩略图选择工具130采用用于从由图像帧生成工具110生成的图像帧选择候选缩略图的以上列出的方法中的一个或多个。例如，缩略图选择工具可以使用非随机按时间选择方法，并且选择所生成的图像帧中的每个第N帧，或者是所生成的图像帧的总数的N％的每一个帧，作为将被测试的候选缩略图图像。可替换地，缩略图选择工具可以使用选择图像帧的完全随机方法。

候选缩略图排名计算器132测试每个所选候选缩略图相对于例如 CTR、观看完成、由通过候选缩略图表示的媒体呈现生成的收入等的一个或多个上述目标度量的成功排名。合适目标度量可以从存储器被选择或者是由用户或开发者作出的选择。除了计算用于每个新选择的候选缩略图的成功排名之外，还计算用于所有所选候选缩略图的成功排名的总和。

候选缩略图分值比较器134聚集用于所有所选缩略图的所有成功排名，并且确定用于最高排名缩略图的成功排名和用于所有所选缩略图的成功排名之间的比率。

概率学习工具136将迭代解决方案应用至根据诸如由以上方程A 表示的计算分析寻找最典型缩略图的问题。当选择每个候选缩略图时，候选缩略图排名计算器132确定用于该缩略图的相关联成功排名，候选缩略图分值比较器134聚集所有缩略图成功排名，并且概率学习工具136控制附加候选缩略图的选择，以便试图集中在最佳解决方案。最佳缩略图呈现工具138通过客户端设备上的用户接口或者其他显示器或呈现机构，将用于显示所确定的最佳缩略图的数据提供给用户。最佳缩略图呈现工具被示出为缩略图图像处理器120的一部分，但是可以被提供为一个或多个服务器的一部分、客户端的一部分、或者两者的组合。

用于每个所选候选缩略图的成功排名可以每个都提升至诸如方程 A中所示的指数，并且指数可以从小于1的值改变为大于1的值。在估计过程的早期，在足够数据被计算之前，存在集中在仅为局部最佳的假最佳值而不是期望的全局最佳候选缩略图上的可能性。当每个后续选择的缩略图的成功排名继续提高时，这可能发生，每个后续缩略图都以远离先前缩略图相同距离和/或在相同方向上的方式被选择。如果在选择过程的早期，指数大于1，选择最高排名缩略图作为最佳缩略图的概率可能快速地增加，并且在足够数据被聚集之前，知晓其是否真是用于整个媒体呈现的最佳缩略图。为了避免集中在假的局部最佳上，指数可以保持小于1，直到聚集了特定量数据，并且已经聚集缩略图的充分典型选择的成功排名。构成缩略图的充分典型选择的值可以根据媒体呈现的类型和/或尺寸、所得到的所选缩略图的成功排名、在选择过程期间花费的时间、以及其他变量而变化。

另外，如果候选缩略图的后续迭代的选择不能继续提高缩略图的分值或成功排名，则概率学习工具可以跳至在比用于先前选择的情况更远的距离、和/或以不同方向的随机缩略图。

用于媒体呈现的示例实现

参考图2，示出实现根据本公开的技术的示例过程200。所示示例实现学习用于例如呈现在媒体共享网站上的视频、或静止或流送图像的其他分组的媒体呈现的最佳典型缩略图，用于该媒体呈现的所有用户和位置。可以结合每个候选缩略图的分值相对于上述一个或多个目标度量的比较来确定最佳典型缩略图图像。在多种替代实现中，可以考虑最佳结果为具有用于任何一个度量的最高分值、用于任何一个度量的最低分值、用于多于一个度量的最高累积分值、用于多于一个度量的最低累积分值等的缩略图图像。

在210处，图像帧生成工具从例如呈现在媒体共享网站上的视频、或流送或静止图像的其他分组的媒体呈现，生成图像帧。图像帧可以通过能够处理来自媒体呈现的视频序列的处理元件生成，以自动地生成那些序列的缩略图图像表示。来自媒体呈现的视频的每个序列可以包括多个帧，其每个都包括可以包括一个或多个对象的场景的图像。诸如媒体共享网站的图像源能够以多种不同格式提供一个或多个视频序列，包括例如第三代平台(3GP)、AVI(音频视频交互)、Windows MPEG(运动图像专家组)、等。

在212处，缩略图选择工具使用从多个图像帧选择缩略图候选者的方法中的任何一个选择候选缩略图，如以上列出的。用于从所生成的图像帧选择候选缩略图的方法可以基于不特定于任何特定用户并且跨过广泛用户基础被应用于任何一个特定视频、一组流送或静止图像、或其他媒体呈现的因素。

在213处，可以通过从存储器检索度量，选择合适目标度量。该选择还可以由用户或开发者随机地作出。用于选择合适目标度量的其他替代方法可以包括使选择基于媒体传播者的期望目标的分析。例如，如果主要目标是最大化由通过缩略图表示的媒体呈现生成的收入，则所选择的目标度量是所生成的收入。如果主要目标是仅确保用户观看整个媒体呈现，则所选目标对象可以是观看完成。选择点击率作为目标度量可以从期望得出，以基于CTR增加特定排名。

在214处，候选缩略图排名计算器相对于上述一个或多个目标度量，确定用于最后所选候选缩略图的分值或排名。作为一个实例，如果用于排列缩略图的期望度量是点击率(CTR)，则候选缩略图排名计算器可以存储用于确定CTR的必要处理技术。如果期望度量是所生成的收入的量，则用于确定该数据的合适处理技术可以由候选缩略图排名计算器存储。例如，候选缩略图排名计算器可以将候选缩略图最初呈现在视频共享网站上作为视频的表示，并且跟踪用于该候选缩略图的点击率(CTR)、用于该候选缩略图的观看完成、或者结合在第一次呈现该候选缩略图之后的特定时间段内由候选缩略图表示的视频的呈现生成的收入的量中的一个或多个，用于所有用户和所有显示位置。

在216处，候选缩略图分值比较器确定如由候选缩略图排名计算器计算的到目前为止的最高排名或得分候选缩略图与用于由缩略图选择工具在212处选择的所有候选缩略图的分值的总和之间的比率。

在218处，概率学习工具应用诸如由以上方程A表示的学习过程，以便计算候选缩略图被选择为用于呈现为视频或其他媒体呈现的表示的最佳缩略图的概率。如上所述，被表示为方程A中的指数的全局参数可以被改变，以便于尽可能快地接近全局最佳值。在缩略图选择过程的早期，指数可以从小于1的值变化，以便避免当更多数据被聚集时，在足够数据被聚集之前，给予初始高得分候选缩略图到大于1的值的太多权重。

增加如由概率学习工具应用的方程A中的指数的效果可以由以下假定实例示出：假设由候选缩略图选择工具选择10个候选缩略图，并且由候选缩略图排名计算器确定这十个中的一个，以相对于目标度量具有分值10，同时其他九个候选缩略图每个都具有分值1。如果在方程A中指数是1，则高得分缩略图具有仅为10/19的选择概率、或者约 1/2的可能性。然而，如果指数增加至2，则方程A现在产生100/109 的概率，或者几乎非常接近1/1的被选择的可能性。结果是对于大于1 的指数，选择高得分缩略图作为最佳缩略图的概率以非线性方式增加，并且如在220处所示，当概率足够高时，所选高得分缩略图被认为是最佳缩略图，并且迭代过程结束，在228处将最佳缩略图呈现给用户。

如果在220处，选择最高排名缩略图的概率不足够高，则在222 处完成检验，以确定最近选择的缩略图的分值是否已经提高。如果分值已经提高，则在224处，候选缩略图选择工具继续以相同距离和/或相同方向作出选择。如果分值未提高，则在226处，概率学习工具可以决定跳至离先前选择更远和/或在不同方向上的随机图像帧。该过程返回到212，以使用从多个图像帧选择缩略图候选者的方法中的任何一个选择候选缩略图，如以上列出的。

用于特定搜索位置或主题的示例实现

参考图3，示出采用根据本公开的一种实现的技术的示例过程300。所示示例实现学习用于例如呈现在媒体共享网站上的视频、或静止或流送图像的其他分组的媒体呈现的最佳典型缩略图，用于所有用户和用于特定搜索结果，或者用于那些媒体呈现的显示位置。最佳典型缩略图图像可以结合每个候选缩略图的分值相对于上述一个或多个目标度量的比较被确定。在多种替代实现中，最佳结果可以被认为是具有用于任何一个度量的最高分值、用于任何一个度量的最低分值、用于多于一个度量的最高累积分值、用于多于一个度量的最低累积分值等的缩略图图像。

用于根据本示例实现生成图像帧并且选择最佳候选缩略图的方法基于对特定主题或搜索项的搜索的结果，例如，媒体呈现的收集、位于特定搜索结果页面上的视频或静止或流送图像的其他分组、信道页面等。

在该实现中，诸如上述SA学习过程的元启发方法被应用，以学习用于特定显示位置、主题页面、或搜索结果的最佳缩略图，多个视频可以具有相同候选缩略图图像。这是因为对于任何特定主题或搜索项，可以是参考或包括来自关于相同主题的其他视频的剪辑的视频。可以给每个视频提供与出现在相同主题页面上或者在相同列表上并且共享相等(或类似)缩略图的每个其他视频相关联的分值。该分值将被称为“冲突分值”。

由于视频可以包括来自其他视频的剪辑，所以诸如出现在相同搜索页面上的视频、或流送或静止图像的其他分组可以共享相同典型缩略图。在该特定实现中，复制缩略图特别相关，这是因为用户将很可能相同地响应相同候选缩略图。为了挑选单个缩略图以显示，缩略图选择学习过程可以从所生成的图像帧，随机地选择候选缩略图，使得候选缩略图被选择的概率是相对于候选缩略图的分值与用于所有所选缩略图的集合的总分的比率。

在缩略图选择过程的早期，在足够数据已被获得用于有意义分值之前，在上述方程A中可以使用小于1的指数，以避免集中在除了期望全局最佳值之外的局部最佳值。如上所述，小于1的指数增加了较低得分候选缩略图被选择为典型缩略图的概率，并且可以防止在足够数据被聚集之前，集中在最佳缩略图。

当从由共同搜索主题得到的视频的图像帧选择候选缩略图，用于挑选相同缩略图的每一个视频集合时，缩略图选择学习过程检索用于所有这些对视频的冲突分值。如果冲突分值还不存在，则作为代替，学习过程可以挑选用于两个缩略图的开始分值。然后，学习过程计算每缩略图的分值，并且分别总计用于所选缩略图的集合的总分。如由以上方程A所示的候选缩略图的分值与总集合分值的比率表示缩略图将被挑选为最佳缩略图的概率。写一个步骤可以包括对来自相同位置的剩余视频或搜索结果递归地运行学习过程，以从它们挑选除了已经挑选的缩略图之外的缩略图。

可能存在用于特定主题的搜索结果或搜索项发现太多相关视频或媒体呈现，空间太大以致不期望SA学习过程合理地集中在具有期望业务模式或者由用户的访问次数的最佳值上的情况。问题可能增加为在选择过程期间上载到空间的新视频的结果。在该情况下，可选变化将是从空间或搜索位置确定用于仅一个视频的最佳缩略图。当更多用户访问该位置，使得存在用于学习过程的足够业务，以集中在最佳解决方案时，结果可以被用于将基于单个视频的模型插入基于整个搜索位置的模型。

用于所选缩略图的分值或成功排名与目标度量的增加成比例地增加。所以，当仅测试点击率(CTR)时，每次使用和点击候选缩略图时，用于给定缩略图的分值增加。用于缩略图的分值还可以被负加权。例如，如果用户不观看整个视频，或者在开始观看视频之后快速地击中回钮，则这可以被认为是用于缩略图的负加权。在该情况下，分值可能减小。这取决于在训练选择学习过程中使用的度量。用于负得分的度量不需要与用于正得分的那些相同。在多种替代实现中，缩略图选择工具可以基于挑选缩略图的顺序来调节用于具有相同或类似典型缩略图的两个以上视频的冲突分值。例如，如果用户点击视频集合(视频A、视频B、视频C)中的视频B，因为B在A之后被挑选，所以分值AB减小，并且因为B在C之前被挑选，所以用于BC的分值增加。

在图3中的310处，图像帧生成工具从由共同主题、搜索结果或显示位置发现的媒体呈现，例如，呈现在搜索页面、信道页面上的视频、或流送或静止图像的其他分组等，生成图像帧。可以通过能够处理来自媒体呈现的视频序列的处理元件生成图像帧，以自动地生成那些序列的缩略图图像表示。来自媒体呈现的视频的每个序列都可以包括多个帧，每个帧都包括可以包括一个或多个对象的场景的图像。诸如媒体共享网站的图像源能够以多种不同格式提供一个或多个视频序列，包括例如第三代平台(3GP)、AVI(视频音频交互)、Windows MPEG(运动图像专家组)、等。

在312处，缩略图选择工具使用从如以上列出的多个图像帧选择缩略图候选的任何随机或非随机方法，在搜索位置处选择典型候选缩略图。用于从所生成的图像帧选择候选缩略图的方法可以基于不特定于任何特定用户的并且跨过用于流送或静止图像的分组、或被发现用于搜索主题或者在特定搜索位置处的其他媒体呈现的广泛用户基础应用的因素。在该示例实现中，所选候选缩略图还适用于主题或搜索结果。

在313处，合适目标度量可以通过从存储器检索度量被选择。选择还可以由用户或开发者随机地作出。用于选择合适目标度量的其他替代方法可以包括使选择基于媒体传播者的期望目标的分析。例如，如果主要目标是最大化由通过缩略图表示的媒体呈现生成的收入，则所选目标度量可以是所生成的收入。如果主要目标是仅确保用户观看整个媒体呈现，则所选目标度量可以是观看完成。点击率(CTR)作为目标度量的选择可以遵循基于CTR增加特定排名的期望。

在314处，候选缩略图排名计算器相对于上述一个或多个目标度量，确定用于最新选择的候选缩略图的分值或排名。例如，候选缩略图排名计算器可以在搜索位置处最初呈现候选缩略图，作为视频或其他媒体呈现的表示，并且跟踪用于该候选缩略图的点击率(CTR)、用于该候选缩略图的观看完成、或者结合在首先呈现该候选缩略图之后的特定时间段内由候选缩略图表示的视频的呈现生成的收入的量中的一个或多个，用于所有用户并且在特定显示位置或搜索结果页面处。

在316处，候选缩略图分值比较器确定如由候选缩略图排名计算器计算的到目前为止的最高排名或得分候选缩略图与用于在312处由缩略图选择工具选择的所有候选缩略图的分值的总和之间的比率。

在318处，概率学习工具应用诸如由以上方程A表示的学习过程，以便计算候选缩略图被选择为用于呈现为在特定显示位置或搜索结果页面处的视频或其他媒体呈现的表示的最佳缩略图的概率。如上所述，被表示为方程A中的指数的全局参数可以变化，以便于尽可能快地接近全局最佳值。在缩略图选择过程的早期，指数可以从小于1的值变化，以便避免在足够数据被聚集之前，当更多数据被聚集时，给予最初高得分候选缩略图太多权重到大于1的值。结果是，对于大于1的指数，选择高得分缩略图作为最佳缩略图的概率以非线性方式增加，并且如在320处所示，当概率足够高时，所选高得分缩略图被认为是最佳缩略图，并且迭代过程结束，在328处将最佳缩略图呈现给用户。

如果在320处，选择最高排名缩略图的概率不足够高，则在322 处进行检验，以确定最新选择的缩略图的分值是否提高。如果分值已经提高，则在324处，候选缩略图选择工具继续以相同距离和/或相同方向进行选择。如果分值未提高，则在326处，概率学习工具可以决定跳至远离先前选择和/或在不同方向上的图像帧。过程返回到312，以使用从以上列出的多个图像帧选择缩略图候选的任何随机或非随机方法，在特定搜索位置处选择候选缩略图。

用于特定用户的最佳源的示例实现

参考图4，示出实现根据本公开的技术的示例过程400。所示示例实现根据该特定用户的行为偏好，学习用于特定用户的媒体呈现的最佳典型缩略图，例如，呈现在媒体共享网站上的视频、或静止或流送图像的其他分组。最佳典型缩略图图像可以结合每个候选缩略图的分值相对于上述一个或多个目标度量的比较被确定。在多种替代实现中，最佳结果可以被认为是具有用于任何一个度量的最高分值、用于任何一个度量的最低分值、用于多于一个度量的最高累积分值、用于多于一个度量的最低累积分值等的缩略图图像。用于选择最佳候选缩略图的方法可以适用于该特定用户，并且基于用户的行为偏好以及什么选择方法或缩略图的源对于该特定用户工作最好。

在图4的替代实现中，其中，用于选择候选缩略图的方法适用于特定用户并且基于该用户的行为偏好，每个缩略图源和用户都可以与分值相关联。该分值反映用于该特定用户的缩略图源的成功。不同用户可以具有不同行为偏好，并且因此不同缩略图源在选择用于每个用户的最佳候选缩略图时，可能是最有效的。例如，一个用户可以通常点击具有脸的图片的缩略图。对于该特定用户，具有脸的图片的缩略图可以具有比包括风景快照的缩略图更高的分值或成功排名。另一个用户可能被具有亮颜色、动物的图片等的缩略图图像吸引。

甚至当用户不自觉地知晓它们自己的偏好时，上述SA学习过程到不同缩略图源或者根据特定用户的行为偏好生成缩略图图像的方法的应用允许集中在用于该用户的最佳缩略图源。在该情况下，其中，寻找最佳源或生成缩略图的方法，更频繁地选择带有具有较高分值的源的缩略图。但是有时，随机选择过程导致缩略图选择工具选择具有较低得分结果的其他缩略图源或其他缩略图。

示例过程400实现学习最佳源或用于生成用于特定用户的典型缩略图的方法的技术。可以结合每个候选缩略图的分值相对于上述一个或多个目标度量的比较来确定最佳典型缩略图图像。在各种替代实现中，最佳结果可以被认为是具有用于任何一个度量的最高分值、用于任何一个度量的最低分值、用于多于一个度量的最高累积分值、用于多于一个度量的最低累积分值等的缩略图图像。

在410处，图像帧生成工具从诸如呈现在媒体共享网站上的视频、或流送或静止图像的其他分组的媒体呈现，生成图像帧。通过能够处理来自媒体呈现的视频序列的处理元件，可以生成图像帧，以自动地生成那些序列的缩略图图像表示。来自媒体呈现的视频的每个序列可以包括多个帧，每个帧都包括可以包括一个或多个对象的场景的图像。诸如媒体共享网站的图像源能够以多种不同格式提供一个或多个视频序列，包括例如第三代平台(3GP)、AVI(音频视频交互)、Windows MPEG(运动图像专家组)、等。

在412处，缩略图选择工具使用从多个图像帧生成缩略图的源或方法选择候选缩略图，其特征在于特定用户的行为偏好。在该实现中，候选缩略图的选择适用于特定用户，并且涉及确定用于该特定用户的缩略图的最佳源。

在413处，合适目标度量可以通过从存储器检索度量被选择。选择还可以由用户或开发者随机地作出。用于选择合适目标度量的其他替代方法可以包括使选择基于媒体传播者的期望目标的分析。例如，如果主要目标是最大化由通过缩略图表示的媒体呈现生成的收入，则所选的目标度量可以是所生成的收入。如果主要目标是仅确保用户观看整个媒体呈现，则所选目标度量可以是观看完成。选择点击率(CTR) 作为目标度量可以遵循基于CTR增加特定排名的期望。

在414处，候选缩略图排名计算器确定用于使用用于特定用户的特定源选择的候选缩略图的分值或排名。例如，候选缩略图排名计算器可以在视频共享网站上呈现使用用于特定用户的特定源选择的候选缩略图，作为视频的表示，并且跟踪用于该候选缩略图的点击率(CTR)、用于该候选缩略图的观看完成、或者结合在第一次将该候选缩略图呈现给用户之后的特定时间段内由候选缩略图表示的视频的呈现生成的收入的量中的一个或多个。

在416处，候选缩略图分值比较器确定如由候选缩略图排名计算器计算的由用于特定用户的特定源选择的最高排名或得分候选缩略图的排名与用于由用于该特定用户的所有其他源选择的候选缩略图的分值的总和之间的比率。作为一个实例，如果具有脸的图片的缩略图产生用于特定用户的最高成功排名，则比较器将确定用于使用具有脸的图像的源选择的缩略图的分值与用于使用诸如具有风景的图像、具有建筑物的图像等的其他源选择的所有缩略图的分值之间的比率。

在418处，概率学习模块应用诸如由以上方程A表示的学习过程，以便计算用于特定用户的缩略图的特定源被选择为用于呈现为视频、或其他媒体呈现的表示的用于该特定用户的缩略图的最佳源的概率。如上所述，被表示为方程A中的指数的全局参数可以变化，以便于尽可能快地接近全局最佳值。在缩略图源选择过程的早期，指数可以从小于1的值变化，以便避免在充足数据被聚集之前，当更多数据被聚集时，给予最初高得分缩略图源太多权重到大于1的值。

结果是对于大于1的指数，选择用于特定用户的缩略图的高得分源作为用于该用户的最佳源的概率以非线性方式增加，并且如在420 处所示，当概率足够高时，用于该用户的缩略图的所选高得分源被认为是用于该用户的最佳源，并且该迭代过程结束，在428处，将使用用于特定用户的最佳源选择的缩略图呈现给该特定用户。

如果在420处，选择用于该用户的缩略图的最高排名源的概率不充分高，则在422处进行检验，以确定缩略图的最新选择源的分值是否提高。如果分值提高，则在424处，用于该特定用户的候选缩略图的不同源的选择以远离在前选择相同的距离和/或与其相同方向继续。如果分值未提高，则在426处，概率学习工具可以决定跳至远离先前选择和/或在不同方向上的候选缩略图的随机源。该过程返回至412，以从所生成的图像帧，使用用户的行为偏好的新源特征，选择候选缩略图。

示例架构

本公开的实现可以包括关于机器的方法、作为机器的一部分或关于机器的系统或装置、或者在一个或多个机器上执行的在计算机可读介质中具体化的计算机程序产品。一个或多个处理器可以是服务器、客户端、网络架构、移动计算平台、固定计算平台、或其他计算平台的一部分。

处理器可以是能够执行程序指令、代码、二进制指令等的任何种类的计算或处理设备。处理器可以包括存储如在此和别处描述的方法、代码、指令和程序的存储器。处理器可以通过接口访问可以存储在此和别处描述的方法、代码和指令的存储介质。与处理器相关联的用于存储方法、程序、代码、程序指令或能够由计算或处理设备执行的其他类型的指令的存储介质可以包括但不限于CD-ROM、DVD、存储器、硬盘、闪盘驱动器、RAM、ROM、高速缓存等中的一个或多个。

图5是图示可以实现图1的组件和图2、3和4的技术的示例性计算机系统500的框图。在特定方面，可以使用在专用服务器中、或集成到另一个实体中、或者跨过多个实体分布的硬件或者软件和硬件的组合来实现计算机系统500。

计算机系统500包括总线508或用于传输信息的其他通信机制、以及与总线508耦合用于处理信息的处理器502。举例来说，可以通过一个或多个处理器502实现计算机系统500。

除了硬件之外，计算机系统500可以包括创建用于正被讨论的计算机程序的执行环境的代码，例如，构成处理器固件、协议栈、数据库管理系统、操作系统、或存储在所包括的存储器504中的它们的一个或多个的组合的代码，诸如，随机存取存储器(RAM)、闪存、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除PROM (EPROM)、寄存器、硬盘、可拆卸盘、CD-ROM、DVD、或任何其他合适存储设备，其耦合至总线508用于存储将由处理器502执行的信息和指令。处理器502和存储器504可以由逻辑电路补充或者合并在逻辑电路中。

可以通过在服务器、客户端、防火墙、网关、集线器、路由器或其他这样的计算机和/或连网硬件上执行计算机软件的机器，部分地或整体部署在此描述的方法和系统。软件程序可以与服务器相关联，服务器可以包括文件服务器、打印服务器、域服务器、互联网服务器、内联网服务器、以及诸如辅助服务器、主服务器、分布式服务器等的其他变体。服务器可以包括存储器、处理器、计算机可读介质、存储介质、端口(物理和虚拟)、通信设备、以及能够通过有线或无线介质访问其他服务器、客户端、机器和设备等的接口。在此和别处描述的方法、程序或代码可以由服务器执行。另外，要求用于执行如在本申请中描述的方法的其他设备可以被认为是与服务器相关联的架构的一部分。

服务器可以将接口提供给其他设备，包括但不限于客户端、其他服务器、打印机、数据库服务器、打印服务器、文件服务器、通信服务器、分布式服务器等。另外，该耦合和/或连接可以便于跨过网络远程执行程序。一些或所有这些设备的连网可以便于在一个或多个位置处并行处理程序或方法，而不偏离所公开的主题的范围。另外，通过接口附着到服务器的任何设备都可以包括能够存储方法、程序、代码和/或指令的至少一个存储介质。中央储存库可以提供要在不同设备上执行的程序指令。在该实现中，远程储存库可以用作用于程序代码、指令和程序的存储介质。

在此描述的方法和系统可以通过网络架构被部分或整体部署。网络架构可以包括诸如本领域中已知的计算设备、服务器、路由器、集线器、防火墙、客户端、个人计算机、通信设备、路由设备和其他有源和无源设备、模块和/或组件的元件。除了其他组件之外，与网络架构相关联的计算和/或非计算设备可以包括诸如闪存、缓冲器、堆栈、 RAM、ROM等的存储介质。在此和别处描述的过程、方法、程序代码、指令可以由一个或多个网络架构元件执行。

计算机软件、程序代码、和/或指令可以在机器可读介质上被存储和/或访问，机器可读介质可以包括：计算机组件、设备、和保持用于在某个时间间隔内计算的数字数据的记录介质；被已知为随机存取存储器(RAM)的半导体存储器；通常用于更多永久储存器的大容量储存器，诸如，光盘、类似硬盘、磁带、鼓、卡和其他类型的磁性储存器的形式；处理器寄存器、高速缓冲存储器、易失性存储器、非易失性存储器；光学存储器，诸如CD、DVD；可拆卸介质，诸如闪存(例如，USB棒-钥匙)、软盘、磁带、纸带、穿孔卡片、独立RAM盘、 Zip驱动器、可拆卸大容量储存器、离线等；其他计算机存储器，诸如动态存储器、静态存储器、读取/写入储存器、易变储存器、只读、随机存取、依序存取、位置可寻址、文件可寻址、内容可寻址、网络附着储存器、存储区域网络、条形码、磁墨水等。

包括在贯穿附图的流程图和框图中的在此描述和描绘的元件暗示元件之间的逻辑边界。然而，根据软件或硬件工程实践，所描述的元件及其功能可以通过计算机可执行介质在机器上被实现，计算机可执行介质具有能够将在其上存储的程序指令执行为单片软件结构、独立软件模块或者采用外部例程、代码、服务等的模块、或这些的任何组合的处理器，并且所有这样的实现都可以在本公开的范围内。

从而，虽然以上附图和说明书阐述了所公开系统的功能方面，但是除非明确阐述或者另外从上下文清楚地看出，不应当从这些说明推断用于实现这些功能方面的软件的特定布置。类似地，将想到，以上识别和描述的各种技术可以变化，并且技术的顺序可以适于在此公开的技术的特定应用。所有这样的变化和修改都旨在落在本公开的范围内。同样地，除非特定应用要求，或者被明确阐述或另外从上下文清楚地看出，用于各种技术的顺序的叙述和/或说明不应该被理解为要求用于那些技术的执行的特定顺序。

以上描述的方法和/或过程、以及其技术可以在硬件、或适合特定应用的硬件和软件的任何组合中被实现。硬件可以包括通用计算机和/ 或专用计算设备或者特定计算设备或特定计算设备的特定方面或组件。与内部和/或外部存储器一起，所述过程可以在一个或多个微处理器、微控制器、嵌入式微控制器、可编程数字信号处理器或其他可编程设备中被实现。所述过程还可以或者作为代替在专用集成电路、可编程门阵列、可编程阵列逻辑、或者可以被配置成处理电子信号的任何其他设备或设备的组合中具体化。将进一步想到，一个或多个过程可以被实现为能够在机器可读介质上执行的计算机可执行代码。

指令可以被存储在存储器504中并且在一个或多个计算机程序产品中被实现，即，在计算机可读介质上被编码用于由计算机系统500 执行或者控制计算机系统500的操作的计算机程序指令的一个或多个模块，并且根据本领域技术人员熟知的任何方法，包括但不限于诸如面向数据的语言(例如，SQL、dBase)、系统语言(例如，C、Obective-C、 C++、Assembly)、架构语言(例如，Java、.NET)、以及应用语言(例如，PHP、Ruby、Perl、Python)的计算机语言。

如在此所述的计算机程序不必须对应于文件系统中的文件。程序可以被存储在保持其他程序或数据(例如，存储在标记语言文档中的一个或多个脚本)的文件的一部分中、专用于正在讨论的程序的单个文件中、或者多个协调文件中(例如，存储一个或多个模块、子程序、或代码的一部分的文件)。计算机程序可以被部署为要在一个计算机上或者在位于一个站点处或者跨过多个站点分布并且由通信网络互连的多个计算机上被执行。可以通过一个或多个可编程处理器执行一个或多个计算机程序，以通过在对输入数据操作并且生成输出执行功能，来执行在本说明书中描述的过程和逻辑流程。

计算机系统500进一步包括耦合至总线508的数据存储设备506，诸如，磁盘或光盘，用于存储信息和指令。计算机系统500可以经由输入/输出模块510耦合至各种设备。输入/输出模块510可以是任何输入/输出模块。示例输入/输出模块510包括诸如USB端口的数据端口。输入/输出模块510被配置成连接至通信模块512。示例通信模块512 包括网络接口卡，诸如，以太网卡和调制解调器。在特定方面，输入/ 输出模块510被配置成连接至多个设备，诸如输入设备514和/或输出设备516。示例输入设备514包括键盘和定点设备，例如，鼠标或跟踪球，用户可以通过其将输入提供给计算机系统500。其他种类的输入设备514可以被用于提供与用户的交互，诸如触觉输入设备、视觉输入设备、音频输入设备、或脑机接口设备。例如，提供给用户的反馈可以是任何形式的传感反馈，例如，视觉反馈、听觉反馈或触觉反馈；以及来自用户的输入可以以任何形式被接收，包括声学、语音、触觉、或脑波输入。示例输出设备516包括显示设备，诸如CRT(阴极射线管)或LCD(液晶显示器)监视器，用于将信息显示给用户。

根据本公开的一方面，可以响应于处理器502执行包含在存储器 504中的一个或多个指令的一个或多个序列，使用计算机系统500来实现如图1中所示的缩略图图像选择系统100。这样的指令可以从诸如数据存储设备506的另一个机器可读介质被读入存储器504中。包含在主存储器504中的指令的序列的执行使得处理器502执行在此描述的过程。还可以采用在多处理布置中的一个或多个处理器，以执行包含在存储器504中的指令的序列。在替代方面中，硬线电路可以代替或结合软件指令被使用，以实现本公开的各个方面。从而，本公开的所述方面不限于硬件电路和软件的任何特定组合。

在本说明书中描述的主题的各个方面可以在计算系统中被实现，计算系统包括例如作为数据服务器的后端组件或者包括例如应用服务器的中间件组件、或者包括例如具有用户可以通过其与在本说明书中描述的主题的实现交互的图形用户界面或网页浏览器的客户端计算机的前端组件、或一个或多个这样的后端、中间件、或前端组件的任何组合。系统的组件可以通过例如通信网络的数字数据通信的任何形式或介质互连。通信网络可以包括例如个域网(PAN)、局域网(LAN)、校园网(CAN)、城域网(MAN)、广域网(WAN)、宽带网络(BBN)、互联网等中的任何一个或多个。而且，通信网络可以包括但不限于例如以下网络拓扑中的任何一个或多个，包括总线网络、星形网络、环形网络、网状网络、星形总线网络、树或分层网络等。通信模块可以是例如调制解调器或以太网卡。

如上所述，计算系统500可以包括客户端和服务器。客户端和服务器可以通常相互远离，并且通常通过通信网络交互。客户端和服务器的关系借助于在各个计算机上运行并且相互之间具有客户端-服务器关系的计算机程序产生。计算机系统500可以是例如但不限于企业服务器或一组服务器、一个或多个桌上型计算机、一个或多个膝上型计算机等。计算机系统500还可以嵌入另一个设备中，例如但不限于移动电话、个人数字助理(PDA)、移动音频播放器、全球定位系统(GPS) 接收器、视频游戏控制器、和/或电视机顶盒。

如在此使用的术语“机器可读存储介质”或“计算机可读介质”是指参与将指令提供给处理器502以用于执行的任何媒介或介质。这样的媒介可以采用多种形式，包括但不限于非易失性介质、易失性介质、以及传输介质。非易失性介质包括例如光学或磁盘，诸如，数据存储设备506。易失性介质包括动态存储器，诸如，存储器504。传输介质包括同轴电缆、铜线、以及光纤，包括包含总线508的电线。机器可读介质的常见形式包括例如软盘、柔性盘、硬盘、磁带、任何其他磁性介质、CD-ROM、DVD、任何其他光学介质、穿孔卡、纸带、具有孔的图案的任何其他物理介质、RAM、PROM、EPROM、FLASH EPROM、任何其他存储器芯片或盒、或计算机可读取的任何其他介质。机器可读存储介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的事务的组合、或者它们中的一个或多个的组合。

虽然本说明书包含多个方面，但是这些不应该被解释为对可以要求的事务的范围的限制，而是被解释为主题的特定实现的描述。还可以结合单个实施例或实现实现在单独实施例或实现的上下文中的本说明书中描述的特定特征。相反，还可以分别在多个实施例中或者任何合适子结合中实现在单个实施例或实现的上下文中描述的多种特征。而且，虽然以上描述了在特定实施例中起作用并且甚至最初同样被要求的特征，但是来自所要求的组合的一个或多个特征在一些情况下可以从该组合被去除，并且所要求的组合可以是子组合或者子组合的变体。

虽然在附图中以特定顺序描述了操作，但是这不应该被理解为要求这样的操作以所示的特定顺序或者有序顺序执行，或者所有所示操作都被执行，以实现期望结果。在特定情况下，多任务和并行处理可以是有利的。而且，以上描述的方面中的多种系统组件的分离不应该被理解为在所有方面要求这样的分离，并且应该理解，所描述的程序组件和系统通常可以一起集成在单个软件产品中或者封装到多个软件产品中。

根据特定方面描述了本说明书的主题，但是其他方面可以被实现并且在以下权利要求的范围内。例如，在权利要求中阐述的动作可以以不同顺序被执行，并且仍然实现期望结果。作为一个实例，在附图中所示的过程不必须要求所示的特定顺序、或者有序顺序，以实现期望结果。在特定实现中，多任务和并行处理可能是有利的。其他变体在所附权利要求的范围内。

在在此所附的权利要求中，仅当在权利要求中使用词“用于…的装置”或“用于…的步骤”时，发明人援引35U.S.C.§112，第六段。如果在权利要求中不使用这样的词，则发明人不期望权利要求被解释为根据35U.S.C.§112，第六段，覆盖相应结构、材料或在此描述的动作(或其等同物)。

Claims

1.一种缩略图图像选择系统，包括：

处理器；

图像帧生成工具，所述图像帧生成工具被可操作地配置成从包括多个图像帧的媒体呈现生成图像帧集合；

缩略图选择工具，所述缩略图选择工具被可操作地配置成从由所述图像帧生成工具生成的所述图像帧集合选择缩略图图像，作为表示所述媒体呈现的候选缩略图；

候选缩略图排名计算器，所述候选缩略图排名计算器被可操作地配置成相对于目标度量计算由所述缩略图选择工具选择的每个候选缩略图的成功排名，所述目标度量包括以下中的至少一个：点击率、观看完成、短观看、收入或每会话速率的观看计数；

概率学习工具，所述概率学习工具被可操作地配置成：根据所选候选缩略图的成功排名与所有所选缩略图图像的成功排名的总和之间的比率，确定最佳候选缩略图；以及

候选缩略图呈现工具，所述候选缩略图呈现工具被可操作地配置成将用于显示所述最佳候选缩略图的数据提供给用户，作为所述媒体呈现的表示。

2.根据权利要求1所述的系统，其中：

所述概率学习工具进一步被可操作地配置成：如果后续候选缩略图的成功排名从在前候选缩略图提高，则当从紧接在其之前的候选缩略图选择所述在前选择候选缩略图时，以与所选择的所述在前候选缩略图相同的方向或者相对于所选择的所述在前候选缩略图远离相同距离中的一个或多个，迭代地选择所述后续候选缩略图。

3.根据权利要求1所述的系统，其中：

所述概率学习工具进一步被可操作地配置成：如果后续候选缩略图的成功排名不从在前候选缩略图提高，则当从紧接在其之前的候选缩略图选择所述在前选择候选缩略图时，以与所选择的所述在前候选缩略图不同的方向或者相对于所选择的所述在前候选缩略图远离不同距离中的一个或多个，迭代地选择所述后续候选缩略图。

4.根据权利要求1所述的系统，其中：

所述概率学习工具进一步被可操作地配置成：将具有最高成功排名的候选缩略图的成功排名提升至大于1的指数，并且将由所述缩略图选择工具选择的所有缩略图图像的成功排名提升至大于1的相同指数，使得选择具有所述最高成功排名的所述候选缩略图的概率相对于选择其他所选缩略图图像中的任何一个的概率以非线性方式更快地增加。

5.根据权利要求1所述的系统，其中：

所述概率学习工具进一步被可操作地配置成：在所述选择过程的早期，将具有最高成功排名的候选缩略图的成功排名提升至小于1的指数，并且将由所述缩略图选择工具选择的所有缩略图图像的成功排名提升至小于1的相同指数，使得在足够有代表性的数量的缩略图图像已由所述缩略图选择工具选择之前，选择具有所述最高成功排名的所述候选缩略图的概率相对于其他所选缩略图图像中的任何一个的概率以非线性方式更慢地增加。

6.根据权利要求1所述的系统，其中：

所述图像帧生成工具进一步被可操作地配置成从位于搜索结果页面上的媒体呈现生成一个或多个图像帧的集合，所述一个或多个图像帧包含至少部分地基于所述搜索结果页面的主题的一个或多个对象、或至少部分地基于所述搜索结果页面的主题的视觉信息。

7.根据权利要求1所述的系统，其中：

所述缩略图选择工具进一步被可操作地配置成从由所述图像帧生成工具生成的所述图像帧集合选择一个或多个缩略图图像，作为表示所述媒体呈现的一个或多个候选缩略图，其中所述选择至少部分地基于用户的行为偏好。

8.根据权利要求7所述的系统，其中：

所述用户的行为偏好是最可能使该用户观看所述媒体呈现的一种图像类型。

9.根据权利要求7所述的系统，其中：

所述用户的所述行为偏好是脸的图像、风景或植物的图像、建筑物的图像、动物的图像、描绘动作的图像、具有亮颜色的图像、具有鲜明对比的图像、或对于用户有吸引力的其他视觉可区分特征中的一个或多个。

10.根据权利要求1所述的系统，其中：

所述缩略图选择工具进一步被可操作地配置成使用以下中的一个或多个来选择一个或多个缩略图图像：按时间图像帧选择，随机图像帧选择，停顿最多的图像帧的选择，选择最多被观看的图像帧，选择具有最清晰脸视图的图像帧，选择具有最高对比度、最亮颜色或色调中的一个或多个的图像帧，选择与周围图像帧在主题上具有最少量不同的图像帧，选择具有期望种类特有的属性的图像帧，或者选择最显著地显示在网页上的图像帧。

11.一种便于从构成媒体呈现的多个图像帧选择典型缩略图的计算机实现的方法，所述方法包括：

由处理设备从包括所述多个图像帧的所述媒体呈现生成图像帧集合；

从所述图像帧集合选择候选缩略图；

选择据以测量所选候选缩略图成功表示所述媒体呈现的目标度量，所述目标度量包括以下中的至少一个：点击率、观看完成、短观看、收入或每会话速率的观看计数；

由所述处理设备测试每个所选候选缩略图相对于所述目标度量的成功排名；

根据所选候选缩略图的成功排名与所有所选缩略图图像的成功排名的总和之间的比率，确定具有比其他所选缩略图图像更高的成功排名的所选候选缩略图是最佳候选缩略图的概率；以及

将用于显示所选候选缩略图的数据提供给用户，作为所述媒体呈现的表示。

12.根据权利要求11所述的方法，其中：

确定所述概率包括：如果后续候选缩略图的成功排名从在前候选缩略图提高，当从紧接在其之前的候选缩略图选择所选择的所述在前候选缩略图时，以与所选择的所述在前候选缩略图相同的方向或者相对于所选择的所述在前候选缩略图远离相同的距离中的一个或多个，迭代地选择所述后续候选缩略图。

13.根据权利要求11所述的方法，其中：

确定所述概率包括：如果后续候选缩略图的成功排名不从在前候选缩略图提高，当从紧接在其之前候选缩略图选择所选择的所述在前候选缩略图时，以与所选择的所述在前候选缩略图不同的方向或相对于所选择的所述在前候选缩略图不同的距离中的一个或多个，迭代地选择所述后续候选缩略图。

14.根据权利要求11所述的方法，其中：

确定所述概率包括：将具有最高成功排名的所述候选缩略图的成功排名提升至大于1的指数，并且将所有所选缩略图图像的成功排名提升至大于1的相同指数，使得选择具有所述最高成功排名的所述候选缩略图的概率相对于选择其他所选缩略图图像中的任何一个的概率以非线性方式更快速地增加。

15.根据权利要求11所述的方法，其中：

确定所述概率包括：在所述选择过程的早期，将具有最高成功排名的所述候选缩略图的成功排名提升至小于1的指数，并且将所有所选缩略图图像的成功排名提升至小于1的相同指数，使得在足够有代表性的数量的缩略图图像已被选择之前，选择具有所述最高成功排名的所述候选缩略图的概率相对于选择其他所选缩略图图像中的任何一个的概率以非线性方式更慢地增加。

16.根据权利要求11所述的方法，其中：

生成所述图像帧集合包括从位于搜索结果页面上的媒体呈现生成一个或多个图像帧的集合，所述一个或多个图像帧包含至少部分地基于所述搜索结果页面的主题的一个或多个对象、或至少部分地基于所述搜索结果页面的主题的视觉信息。

17.根据权利要求11所述的方法，其中：

选择所述候选缩略图包括：从所述图像帧集合选择一个或多个缩略图图像，作为表示所述媒体呈现的一个或多个候选缩略图，其中，所述选择至少部分地基于用户的行为偏好。

18.根据权利要求17所述的方法，其中：

所述用户的所述行为偏好是最可能使该用户观看所述媒体呈现的图像类型。

19.根据权利要求17所述的方法，其中：

所述用户的所述行为偏好是以下中的一个或多个：脸的图像、风景或植物的图像、建筑物的图像、动物的图像、描述动作的图像、具有亮颜色的图像、具有鲜明对比的图像、或吸引用户的其他视觉可区分特征。

20.根据权利要求11所述的方法，其中：

选择所述候选缩略图包括使用以下中的一个或多个来选择一个或多个缩略图图像：按时间图像帧选择、随机图像帧选择、停顿最多的图像帧的选择、选择被最多观看的图像帧、选择具有最清晰脸视图的图像帧、选择具有最高对比度、最亮颜色或色调中的一个或多个的图像帧、选择与周围图像帧在主题上具有最小量差异的图像帧、选择具有期望种类特有的属性的图像帧、或者选择最显著显示在网页上的图像帧。

21.一种存储指令的非暂时性计算机可读介质，所述指令在由计算设备执行时使所述计算设备执行便于从构成媒体呈现的多个图像帧中选择典型缩略图的操作，所述操作包括：

从包括所述多个图像帧的所述媒体呈现生成图像帧集合；

从所述图像帧集合选择候选缩略图；

测试每个所选候选缩略图相对于目标度量的成功排名，所述目标度量包括以下中的至少一个：点击率、观看完成、短观看、收入或每会话速率的观看计数；

将用于显示所述最佳候选缩略图的数据提供给用户，作为所述媒体呈现的表示。

22.根据权利要求21所述的非暂时性计算机可读介质，其中：

确定所述概率包括：如果后续候选缩略图的成功排名从在前候选缩略图提高，则当从紧接在其之前的候选缩略图选择所选择的所述在前候选缩略图时，以与所选择的所述在前候选缩略图相同的方向或者相对于所选择的所述在前候选缩略图远离相同的距离中的一个或多个，迭代地选择所述后续候选缩略图。

23.根据权利要求21所述的非暂时性计算机可读介质，其中：

确定所述概率包括：如果后续候选缩略图的成功排名不从在前候选缩略图提高，则当从紧接在其之前的候选缩略图选择所选择的所述在前候选缩略图时，以与所选择的所述在前候选缩略图不同的方向或者相对于所选择的所述在前候选缩略图远离不同的距离中的一个或多个，迭代地选择所述后续候选缩略图。

24.根据权利要求21所述的非暂时性计算机可读介质，其中：

确定所述概率包括：将具有最高成功排名的所述候选缩略图的成功排名提升至大于1的指数，并且将所有所选缩略图图像的成功排名提升至大于1的相同指数，使得选择具有所述最高成功排名的所述候选缩略图的概率相对于选择其他所选缩略图图像中的任何一个的概率以非线性方式更快地增加。

25.根据权利要求21所述的非暂时性计算机可读介质，其中：

确定所述概率包括：在所述选择过程的早期，将具有最高成功排名的所述候选缩略图的成功排名提升至小于1的指数，并且将所有所选缩略图图像的成功排名提升至小于1的相同指数，使得在足够有代表性的数量的缩略图图像已被选择之前，选择具有所述最高成功排名的所述候选缩略图的概率相对于选择其他所选缩略图中的任何一个的概率以非线性方式更慢地增加。

26.根据权利要求21所述的非暂时性计算机可读介质，其中：

生成所述图像帧集合包括：从位于搜索结果页面上的媒体呈现生成一个或多个图像帧的集合，所述一个或多个图像帧包含至少部分地基于所述搜索结果页面的主题的一个或多个对象、或至少部分地基于所述搜索结果页面的主题的视觉信息。

27.根据权利要求21所述的非暂时性计算机可读介质，其中：

选择所述候选缩略图包括：从所述图像帧集合选择一个或多个缩略图图像，作为表示所述媒体呈现的一个或多个候选缩略图，其中所述选择至少部分地基于用户的行为偏好。