CN110809187B

CN110809187B - 视频选择方法、视频选择装置、存储介质与电子设备

Info

Publication number: CN110809187B
Application number: CN201911056883.7A
Authority: CN
Inventors: 黄凯
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2019-10-31
Filing date: 2019-10-31
Publication date: 2022-04-05
Anticipated expiration: 2039-10-31
Also published as: CN110809187A

Abstract

本公开提供了一种视频选择方法、视频选择装置、存储介质与电子设备，涉及人机交互技术领域。该方法包括：获取由图像采集单元采集的当前图像；检测历史图像中与所述当前图像匹配度最高的目标历史图像；选择与所述目标历史图像对应的视频作为待播放视频。本公开通过为用户选择基于当前场景的可回放视频，能够满足用户处于当前场景中的即时兴趣，并且用户观看视频的沉浸感和交互感较强。

Description

视频选择方法、视频选择装置、存储介质与电子设备

技术领域

本公开涉及人机交互技术领域，尤其涉及一种视频选择方法、视频选择装置、计算机可读存储介质与电子设备。

背景技术

观看视频是人们日常生活中获取信息和娱乐的重要方式。用户在观看视频时，大多数视频网站、平台等会根据用户的兴趣推荐视频，以供用户选择播放。

在上述推荐视频的方式中，主要基于用户的历史观看行为推测用户的兴趣，进而推荐用户感兴趣的视频。然而，每个用户的兴趣点不是一成不变的，特别是在不同的场景中，其所希望观看到的视频内容通常也不同，因此上述方式难以满足用户即时的需求和兴趣。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开提供了一种视频选择方法、视频选择装置、计算机可读存储介质与电子设备，进而至少在一定程度上改善现有的视频选择方法难以满足用户即时兴趣的问题。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开的第一方面，提供一种视频选择方法，包括：获取由图像采集单元采集的当前图像；检测历史图像中与所述当前图像匹配度最高的目标历史图像；选择与所述目标历史图像对应的视频作为待播放视频。

根据本公开的第二方面，提供一种视频选择装置，包括：图像获取模块，用于获取由图像采集单元采集的当前图像；匹配检测模块，用于检测历史图像中与所述当前图像匹配度最高的目标历史图像；视频选择模块，用于选择与所述目标历史图像对应的视频作为待播放视频。

根据本公开的第三方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述视频选择方法。

根据本公开的第四方面，提供一种电子设备，包括：处理器；存储器，用于存储所述处理器的可执行指令；以及图像采集单元；其中，所述处理器配置为经由执行所述可执行指令来执行上述视频选择方法。

本公开的技术方案具有以下有益效果：

根据上述视频选择方法、视频选择装置、存储介质和电子设备，当用户拍摄当前图像时，通过检测当前图像和历史图像的匹配度，以查找匹配度最高的目标历史图像，选择与目标历史图像对应的视频作为待播放视频。一方面，当前图像和历史图像均为包含场景的图像，图像的匹配检测是为了确定当前图像和目标历史图像拍摄于同一场景，由此向用户推荐基于该场景的可回放视频，能够满足用户处于当前场景中的即时兴趣，提高视频服务的质量。另一方面，本公开实际上提供了一种基于视频回放的交互方式，通过场景的关联，为用户选择当前场景的历史拍摄视频，提供“身临其境”的观看体验，具有较强的沉浸感和交互感。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施方式，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出本示例性实施方式中一种视频选择方法的流程图；

图2示出本示例性实施方式中一种AR眼镜的硬件组成示意图；

图3示出本示例性实施方式中一种AR眼镜的NED系统的示意图；

图4示出本示例性实施方式中一种视频选择方法的子流程图；

图5示出本示例性实施方式中当前图像的示意图；

图6示出本示例性实施方式中一种视频选择装置的结构框图；

图7示出本示例性实施方式中一种用于实现上述方法的计算机可读存储介质；

图8示出本示例性实施方式中一种用于实现上述方法的电子设备。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

当用户处于特定的场景中时，可能希望看到与当前场景相匹配的视频，例如：用户位于旅游景区的某一位置，希望看到该位置在不同季节、不同气候下的视频(可以是其他旅游者拍摄并上传的视频)；用户位于自家的客厅中，希望看到其他家庭成员在同一位置拍摄的历史视频(如前一天拍摄的儿童在客厅中玩耍的视频)。

有鉴于此，本公开的示例性实施方式首先提供一种视频选择方法，该方法可以应用于智能手机、平板电脑、数码相机或VR(Virtual Reality，虚拟现实)/AR(AugmentedReality，增强现实)中的头戴式设备等终端电子设备。参考图1所示，该方法可以包括以下步骤S110至S130：

步骤S110，获取由图像采集单元采集的当前图像。

本示例性实施方式中，电子设备包括图像采集单元，例如可以是内置的摄像模组，也可以是外接的摄像头等。在执行步骤S110时，电子设备可以启动图像采集单元以采集当前图像，将图像传输到处理器。当前图像是包含场景的图像，通常用户手持或佩戴电子设备以拍摄当前的场景时，如果设备识别所拍摄的图像中包含场景，则可以保留当前图像并进入后续处理，如果设备识别所拍摄的图像中不包含场景，例如是人脸图像或单独某个物体的图像等，则可以不保留该图像，随着用户的移动继续拍摄下一帧图像。

步骤S120，检测历史图像中与当前图像匹配度最高的目标历史图像。

步骤S130，选择与目标历史图像对应的视频作为待播放视频。

由上可知，本示例性实施方式实际上是以视频回放的方式为用户选择合适的待播放视频。为了实现这一目的，可以预先构建可回放视频的文件库。可回放视频是与场景相关的视频，例如可以是用户以某一场景为背景拍摄的历史视频，也可以是基于某一现实场景制作的动画视频等。文件库可以建立在本地，例如本设备拍摄视频后，同步存储到文件库中，也可以建立在云端，例如特定几个用户之间通过云存储等方式形成可共享的文件库，或者通过平台的方式允许用户上传视频并观看其他用户上传的视频等。

在文件库中，可以为每个视频对应生成历史图像，历史图像是体现视频中场景内容的代表性图像，可以通过多种方式生成，下面提供几个具体实施方式，但下述内容不应对本公开的保护范围造成限定：

(1)从视频中选取一帧图像作为该视频对应的历史图像，可以按照帧数选取视频中的第一帧、1/2位置帧、最后一帧等，也可以通过检测视频内容选取重复度最高的一帧，还可以由拍摄、存储或上传该视频的用户指定其中的一帧等。基于该方式，在历史图像对应的视频中，存在至少一帧图像和该历史图像相同。

(2)在上述方式(1)的基础上，选取视频中的一帧图像后，提取图像中的背景部分，例如将前景部分减除等，得到背景图像，作为该视频对应的历史图像。

(3)与上述方式(2)类似，可以从视频中提取连续的多帧图像，将其中发生变化的部分减除，例如通过光流识别变化的区域并进行减除，则保留的未变化的部分为背景图像，作为该视频对应的历史图像。

由此，实际上形成了具有历史图像和视频对应关系的文件库。需要说明的是，每个视频中可以对应生成一张历史图像，也可以生成多张历史图像(例如在场景移动或发生变化的情况下)，不同视频也可以是基于同一场景拍摄或制作的，因此，历史图像和视频之间的对应关系可以是“一对一”、“多对一”、“一对多”等等，本公开对此不做限定。

基于上述文件库，可以将当前图像和历史图像进行对比，以判断历史图像中是否存在当前图像的场景。本示例性实施方式可以通过检测当前图像和历史图像的匹配度进行对比判断，将与当前图像匹配度最高的历史图像确定为目标历史图像，可以认为当前图像和目标历史图像中的场景为同一场景。进而判断用户当前处于目标历史图像的场景中，因此选择目标历史图像对应的视频作为待播放视频，以推荐用户观看，例如可以在用户界面中弹出提示信息“检测到当前场景的视频”，或者显示待播放视频的封面和简介等。目标历史图像也可能对应多个视频，因此本公开对于待播放视频的数量不做特别限定。

在确定待播放视频后，可以直接播放该视频，或者在用户进行确认播放的操作后播放该视频。

基于同一场景的视频回放可以满足用户即时的需求和兴趣，并使用户产生“身临其境”的感受，提高观看视频的沉浸感和交互感。

本示例性实施方式可以应用于AR领域，在用户佩戴AR眼镜(或AR头盔等头戴式设备)的情况下实现视频的选择与回放，其沉浸感更强。图2示出了AR眼镜200的硬件组成，包括处理器210、显示单元220、图像采集单元230、通信单元240以及其他部分(如供电模块、感应模块等，与本示例性实施方式关系较小，因而未示出)。其中，图像采集单元230包括设置于镜片上的摄像头，用于从人眼观看的视角采集当前图像；处理器210可以执行图1所示的方法步骤；通信单元240用于获取历史图像及其对应的视频；显示单元220用于播放待播放视频。

显示单元220的形态类似于玻璃镜片，用户透过镜片看到真实场景，而处理器210将虚拟信息传输到显示单元220上显示，使用户看到真实和虚拟叠加的影像效果。因此，AR眼镜200需要具备“透视”(See-Through)的功能，既要看到真实的外部世界，也要看到虚拟信息，以实现现实和虚拟的融合与“增强”。

图3示出了AR眼镜的NED系统300(Near Eye Display，近眼显示，属于显示单元220的一部分)示意图，由微型显示屏(Display)310、透镜(Lens)320、光学组合器(OpticalCombiner)330构成。微型显示屏310用于提供显示内容，可以是自发光的有源器件，如发光二极管面板、或具有外部光源照明的液晶显示屏等；透镜320用于对显示的光路进行控制和调节；光学组合器330通常具有“层叠”的形式，包括棱镜、自由曲面、光波导等不同的光学方案，可以对真实场景影像和虚拟影像进行叠加，是实现上述融合效果的关键部分。

当用户佩戴AR眼镜观看待播放视频时，待播放视频是通过上述光学组合器显示在外部的真实场景中的，而待播放视频中的场景和当前的真实场景是同一场景，使得用户如同置身于待播放视频中，具有更强的“身临其境”感，用户体验更好。

需要说明的是，为了保证视频播放的适配性，用于AR眼镜上播放的视频可以是用户通过AR眼镜拍摄的历史视频。

此外，本示例性实施方式也可以应用于智能手机或平板电脑上。以手机为例，当用户手持手机拍摄环境场景图像时，通过执行图1所示的方法步骤，选择与当前场景相关的可回放视频作为待播放视频，后续可以单独播放待播放视频，或者也可以将待播放视频和当前图像叠加后播放。叠加播放的方式包括但不限于以下几种：

(1)为待播放视频增加透明度，以当前图像为背景，显示并播放待播放视频，可以呈现出场景叠加的效果。

(2)对待播放视频进行背景减除处理(例如将连续帧中未发生变化的部分减除)，以保留前景部分(主要是动态对象，如人等)的视频，以当前图像为背景，显示播放待播放视频，可以呈现出视频中的动态对象在当前场景中运动的效果。

(3)将待播放视频和当前图像分别进行裁剪，待播放视频保留具有动态对象的中间区域，当前图像保留对应的外围区域，两者嵌套在一起进行播放，相当于将当前图像做成了视频的边框，呈现出两部分场景拼接的效果。

通过上述方式将待播放视频和当前图像叠加后播放，可以在手机上呈现出类似于AR眼镜上的现实与虚拟融合的感觉，以提高用户的沉浸感和代入感。

在上述步骤S120中，需要检测当前图像和历史图像的匹配度，这也是判断场景是否为同一场景的重要途径。关于如何检测当前图像和历史图像的匹配度，下面提供几个具体实施方式：

在一种实施方式中，参考图4所示，可以通过以下步骤S410至S430检测当前图像和历史图像的匹配度：

步骤S410，对当前图像进行识别，以对当前图像中的对象生成标签，得到当前图像的特征标签集。其中，对当前图像进行识别是为了识别出其中的对象(人或物)，并识别每个对象的类别，以生成标签，例如可以采用语义分割模型、目标检测模型等进行处理，将当前图像中对象的标签形成集合，得到特征标签集。参考图5为例说明，识别出图5中包括沙发、茶几、灯、靠枕等对象，根据每个对象的类别生成特征标签集。可见，特征标签集是对当前图像中内容信息的表征。除了对象标签外，还可以在特征标签集中增加其他维度的信息，例如对当前图像场景类别的识别结果，如属于客厅、厨房、办公室、树林、街道等，外部环境信息，如位置、天气等。

步骤S420，获取各历史图像的样本标签集。其中，样本标签集为历史图像中对象的标签形成的集合，其获取方式和上述获取特征标签集的方式相同，并且样本标签集和特征标签集的维度可以相同。在获取历史图像时可以对应生成样本标签集，如用户上传视频时，生成该视频对应的历史图像，并基于图像识别，确定历史图像中的对象标签，得到其对应的样本标签集。每个历史图像对应于一个样本标签集。

步骤S430，将特征标签集分别和各样本标签集进行匹配，得到当前图像和样本标签集对应的历史图像之间的匹配度。具体而言，可以将特征标签集和样本标签集中的信息进行标准化、数值化处理(该处理过程也可以在获取特征标签集或样本标签集时进行)，以转换为数组或向量的形式，再进行匹配度的计算，例如可以通过计算欧式距离、余弦相似度等表征匹配度。特征标签集和样本标签集之间的匹配度，代表了当前图像和历史图像之间的匹配度。

进一步的，如果当前图像和历史图像的匹配度均低于预设阈值，则可以确定历史图像中不存在目标历史图像。其中，预设阈值可以根据经验或实际情况设定，用于衡量特征标签集和样本标签集(即当前图像和历史图像)是否足够匹配。因此，特征标签集和样本标签集的匹配度达到预设阈值时，表示当前图像和历史图像匹配，两图像中的场景为同一场景。若当前图像和每个历史图像的匹配度均低于预设阈值，说明历史图像中不存在和当前图像为同一场景的图像，即不存在目标历史图像。在此情况下，可以显示相应的提示信息，例如“未检测到当前场景的可回放视频”，或者采用其他方式提供待播放视频等。

通过上述以特征标签集和样本标签集匹配的方式量化当前图像和历史图像的匹配度，处理方式较为简单，便于快速查找目标历史图像，并且有利于在当前图像和历史图像的拍摄角度不同时，识别出同一场景的情况，鲁棒性较高。

在另一种实施方式中，也可以通过卷积神经网络从当前图像或历史图像中提取特征向量，通过特征向量之间的相似度计算，度量当前图像和历史图像的匹配度。例如：预先训练用于图像分类的卷积神经网络，选取其中一个中间层(通常位于卷积层之后)作为特征提取层，将当前图像输入该卷积神经网络，从特征提取层获取数值，作为当前图像的特征向量，采用同样方式处理历史图像，得到历史图像的特征向量，再将当前图像的特征向量分别和历史图像的特征向量进行匹配度计算，确定匹配度最该的历史图像为目标历史图像。

在另一种实施方式中，还可以通过图像比较模型进行匹配度检测。例如：构建以双通道图像为输入的神经网络模型，分别用于输入两张待检测的图像，以两张图像的匹配度为标签，训练该模型。在应用中，将当前图像和历史图像分别输入到双通道，可以输出匹配度的结果。

在上述实施方式中，历史图像及其对应的视频来自于预先建立的文件库。作为补充的，该文件库也可以允许用户存储或上传历史图像(只上传图像，不上传对应的视频)，以便于日后回看或者分享给其他用户，即文件库中一部分历史图像可能没有对应的视频。基于此，在步骤S120后，还可以执行以下过程：

当检测到目标历史图像对应的视频为空时，确定目标历史图像为待显示图像；

当检测到目标历史图像对应的视频不为空时，将与目标历史图像对应的视频确定为待播放视频(即执行步骤S130)。

其中，目标历史图像对应的视频为空，即上述用户仅存储了目标历史图像(未拍摄对应的视频)的情况，在此情况下，将目标历史图像作为待显示图像推荐给用户，由于目标历史图像和当前图像中的场景为同一场景，目标历史图像也可能引起用户的观看兴趣，后续可以直接显示，或者在用户确认后显示目标历史图像。

在一种可选的实施方式中，在显示目标历史图像时，也可以参考上述将待播放视频和当前图像叠加后显示的方式，将目标历史图像和当前图像叠加后显示，例如将两图像增加透明度后叠加、分区域叠加等，以进一步提高用户的观看体验。

下面再结合图5对本示例性实施方式的实现场景做具体说明：用户在图5所示的客厅场景中拍摄了一段儿童玩耍的视频，将该视频存储在本地或上传到指定的云端服务器；此后，如有该用户或其他用户启动视频回放的相关功能，可以执行本示例性实施方式，当检测到用户当前所拍摄图像中的场景为上述客厅场景时，可以为用户选择上述视频作为待播放视频，使用户可以观看到该场景中的历史影像。

综上所述，本示例性实施方式中，当用户拍摄当前图像时，通过检测当前图像和历史图像的匹配度，以查找匹配度最高的目标历史图像，选择与目标历史图像对应的视频作为待播放视频。一方面，当前图像和历史图像均为包含场景的图像，图像的匹配检测是为了确定当前图像和目标历史图像拍摄于同一场景，由此向用户推荐基于该场景的可回放视频，能够满足用户处于当前场景中的即时兴趣，提高视频服务的质量。另一方面，本示例性实施方式实际上提供了一种基于视频回放的交互方式，通过场景的关联，为用户选择当前场景的历史拍摄视频，提供“身临其境”的观看体验，具有较强的沉浸感和交互感。

本公开的示例性实施方式还提供了一种视频选择装置。如图6所示，该视频选择装置600可以包括：图像获取模块610，用于获取由图像采集单元采集的当前图像；匹配检测模块620，用于检测历史图像中与所述当前图像匹配度最高的目标历史图像；视频选择模块630，用于选择与目标历史图像对应的视频作为待播放视频。

在一种可选的实施方式中，匹配检测模块620，可以用于通过以下方式检测当前图像和历史图像的匹配度：对当前图像进行识别，以对当前图像中的对象生成标签，得到当前图像的特征标签集；获取各历史图像的样本标签集，样本标签集为历史图像中对象的标签形成的集合；将特征标签集分别和各样本标签集进行匹配，得到当前图像和样本标签集对应的历史图像之间的匹配度。

进一步的，匹配检测模块620，还可以用于如果检测当前图像和历史图像的匹配度均低于预设阈值，则确定历史图像中不存在目标历史图像。

在一种可选的实施方式中，视频选择模块630，还可以用于在选择与目标历史图像对应的视频作为待播放视频后，播放待播放视频。

进一步的，视频选择模块630在播放待播放视频时，可以将待播放视频和当前图像叠加后播放。

在一种可选的实施方式中，视频选择装置600还可以包括：图像选择模块，用于在匹配检测模块620确定目标历史图像后，如果目标历史图像对应的视频为空，则确定目标历史图像为待显示图像；视频选择模块630，还用于如果目标历史图像对应的视频不为空，则选择与目标历史图像对应的视频作为待播放视频。

在一种可选的实施方式中，目标历史图像对应的视频中包括至少一帧图像和目标历史图像相同。

上述装置中各模块的具体细节在方法部分实施方式中已经详细说明，未披露的细节内容可以参见方法部分的实施方式内容，因而不再赘述。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

本公开的示例性实施方式还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本公开的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在电子设备上运行时，程序代码用于使电子设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。

参考图7所示，描述了根据本公开的示例性实施方式的用于实现上述方法的程序产品700，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在电子设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

本公开的示例性实施方式还提供了一种能够实现上述方法的电子设备，例如可以是智能手机、平板电脑、数码相机、VR/AR中的头戴式设备(如AR眼镜、AR头盔)等。下面参照图8来描述根据本公开的这种示例性实施方式的电子设备800。图8显示的电子设备800仅仅是一个示例，不应对本公开实施方式的功能和使用范围带来任何限制。

如图8所示，电子设备800可以以通用计算设备的形式表现。电子设备800的组件可以包括但不限于：至少一个处理单元810、至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830、显示单元840和图像采集单元870。

存储单元820存储有程序代码，程序代码可以被处理单元810执行，使得处理单元810执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如，处理单元810可以执行图1或图4所示的方法步骤。

存储单元820可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)821和/或高速缓存存储单元822，还可以进一步包括只读存储单元(ROM)823。

存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824，这样的程序模块825包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线830可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备800也可以与一个或多个外部设备900(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备800交互的设备通信，和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且，电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器860通过总线830与电子设备800的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备800使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开示例性实施方式的方法。

此外，上述附图仅是根据本公开示例性实施方式的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的示例性实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施方式。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。

Claims

1.一种视频选择方法，其特征在于，包括：

获取由图像采集单元采集的包含场景的当前图像；

检测历史图像中与所述当前图像匹配度最高的目标历史图像；

在预先构建的可回放视频的文件库中，选择与所述目标历史图像对应的视频作为待播放视频；所述可回放视频是与场景相关的视频，所述可回放视频对应的历史图像用于体现所述可回放视频的场景；

其中，所述可回放视频对应的历史图像通过以下方式获得：

基于所述可回放视频中的一帧或多帧图像提取背景图像，得到所述可回放视频对应的历史图像。

2.根据权利要求1所述的方法，其特征在于，通过以下方式检测所述当前图像和所述历史图像的匹配度：

对所述当前图像进行识别，以对所述当前图像中的对象生成标签，得到所述当前图像的特征标签集；

获取各所述历史图像的样本标签集，所述样本标签集为所述历史图像中对象的标签形成的集合；

将所述特征标签集分别和各所述样本标签集进行匹配，得到所述当前图像和所述样本标签集对应的历史图像之间的匹配度。

3.根据权利要求2所述的方法，其特征在于，所述检测历史图像中与所述当前图像匹配度最高的目标历史图像，包括：

如果所述当前图像和所述历史图像的匹配度均低于预设阈值，则确定所述历史图像中不存在所述目标历史图像。

4.根据权利要求1所述的方法，其特征在于，在选择与所述目标历史图像对应的视频作为待播放视频后，所述方法还包括：

播放所述待播放视频。

5.根据权利要求4所述的方法，其特征在于，所述播放所述待播放视频，包括：

将所述待播放视频和所述当前图像叠加后播放。

6.根据权利要求1所述的方法，其特征在于，在检测到所述目标历史图像后，所述方法还包括：

当检测到所述目标历史图像对应的视频为空时，确定所述目标历史图像为待显示图像；

当检测到所述目标历史图像对应的视频不为空时，执行选择与所述目标历史图像对应的视频作为待播放视频的步骤。

7.根据权利要求1所述的方法，其特征在于，所述基于所述可回放视频中的一帧或多帧图像提取背景图像，得到所述可回放视频对应的历史图像，包括：

从所述可回放视频中提取连续多帧图像，并减除所述连续多帧图像中发生变化的部分，将得到的背景图像作为所述可回放视频对应的历史图像。

8.一种视频选择装置，其特征在于，包括：

图像获取模块，用于获取由图像采集单元采集的包含场景的当前图像；

匹配检测模块，用于检测历史图像中与所述当前图像匹配度最高的目标历史图像；

视频选择模块，用于在预先构建的可回放视频的文件库中，选择与所述目标历史图像对应的视频作为待播放视频；所述可回放视频是与场景相关的视频，所述可回放视频对应的历史图像用于体现所述可回放视频的场景；

其中，所述可回放视频对应的历史图像通过以下方式获得：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。

10.一种电子设备，其特征在于，包括：

处理器；

存储器，用于存储所述处理器的可执行指令；以及

图像采集单元；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的方法。