WO2019129075A1

WO2019129075A1 - 视频检索的方法和装置以及计算机可读存储介质

Info

Publication number: WO2019129075A1
Application number: PCT/CN2018/123938
Authority: WO
Inventors: 贾嘉; 俞婷婷
Original assignee: 中兴通讯股份有限公司
Priority date: 2017-12-27
Filing date: 2018-12-26
Publication date: 2019-07-04
Also published as: CN110110147A

Abstract

本公开提供了一种视频检索的方法和装置以及计算机可读存储介质，该方法包括：接收到用户选择的目标图像后，对所述目标图像进行图形识别，提取出特征信息，并将所述特征信息保存为视频标识；对当前播放的视频或指定视频或本地存储的全部视频的每一帧或抽样帧进行图像识别，当识别到存在与所述特征信息相同或近似的特征信息时，更新所述视频标识；接收到检索指令后，根据所述检索指令携带的信息对所述视频标识进行检索。

Description

视频检索的方法和装置以及计算机可读存储介质

技术领域

本公开实施例涉及但不限于信息处理领域，尤其涉及一种视频检索的方法和装置以及计算机可读存储介质。

背景技术

在手机等终端中视频检索的现有方法例如为：用户针对视频某一特定帧标注文字信息，后续通过该文字信息检索该图像帧。该方法存在以下缺点：用户只能手动一个个标注文字信息，工作量大，且标注不全；只能在该视频文件中检索已标记的文字标签，无法跨视频进行检索；无法根据现有的标记进行自动分类，可维护性差，检索难度大。

发明内容

本公开的一方面提供了一种视频检索的方法，包括步骤：接收到用户选择的目标图像后，对所述目标图像进行图形识别，提取出特征信息，并将所述特征信息保存为视频标识；对当前播放的视频或指定视频或本地存储的全部视频的每一帧或抽样帧进行图像识别，当识别到存在与所述特征信息相同或近似的特征信息时，更新所述视频标识；以及接收到检索指令后，根据所述检索指令携带的信息对所述视频标识进行检索。

本公开的另一方面提供了一种视频检索的装置，其中，包括：识别模块，配置为接收到用户选择的目标图像后，对所述目标图像进行图形识别，提取出特征信息，并将所述特征信息保存为视频标识；标识模块，配置为对当前播放的视频或指定视频或本地存储的全部视频的每一帧或抽样帧进行图像识别，当识别到存在与所述特征信息相同或近似的特征信息时，更新所述视频标识；以及检索模块，配置为接收到检索指令后，根据所述检索指令携带的信息对所述视频标识进行检索。

本公开的另一方面提供了一种计算机可读存储介质，其存储有指令，当所述指令被处理器执行时，实现如上所述的方法。

本公开的另一方面提供了一种视频检索的装置，其包括处理器和计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令被所述处理器执行时，实现如上所述的方法。

附图说明

图1为本公开实施例的一种视频检索的方法的流程图；

图2为安卓系统原有的系统结构框图；

图3为本公开实施例提供的一种视频检索的方法的系统结构框；

图4为本公开实施例提供的一种视频检索的方法的目标标记引擎框图；

图5为本公开实施例提供的一种视频检索的装置的示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚明白，下文中将结合附图对本公开的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

图1为本公开实施例的一种视频检索的方法的流程图。

如图1所示的，根据本公开实施例的视频检索的方法包括步骤S10-S30。

在步骤S10中，接收到用户选择的目标图像后，对所述目标图像进行图形识别，提取出特征信息，并将所述特征信息保存为视频标识。

在步骤S20中，对当前播放的视频或指定视频或本地存储的全部视频的每一帧或抽样帧进行图像识别，当识别到存在与所述特征信息相同或近似的特征信息时，更新所述视频标识。

在步骤S30中，接收到检索指令后，根据所述检索指令携带的信息(即，所述检索指令的信息)对所述视频标识进行检索。

本实施例中，可由用户标记目标图像，并针对用户标记的对象进行图形识别，识别出其特征信息，并保存为视频标识。所述目标图像可以是在视频录制或者播放过程中选择的，也可以是用户自己选择的图像。

相对于现有技术的只能由用户手动一个个标注文字信息的方法，本实施例的方法只需用户进行一次标识，即可针对该视频乃至所有本地视频文件更新该视频标识，记录下所有涉及到的视频文件信息和各视频中视频标识出现的时间点/时间范围。而且，本实施例的方法便于用户通过文字或者图片的方式，快速地检索视频，找到目标对象出现的所有视频时间点，并快速定位和查看。此外，由于是根据“特征信息”针对视频来更新视频标识的，所以在对象视频涉及到人脸的时候，不会受到对象年龄或者打扮的影响，由此使得结果更为准确。

因此，本公开的方法可加快视频文件检索速度，提高视频文件检索准确度，提升用户体验，尤其是安卓系统手机用户的体验。

在一实施例中，所述对所述目标图像进行图形识别，提取出特征信息，包括以下步骤：确定所述目标图像的标识区域，对所述标识区域进行边缘检测，提取出主要对象的特征信息。

所述主要对象可以包括以下的任一种：占区域面积最大的对象，颜色与其他颜色色差区别最大的对象，清晰度最高的对象或其他某一识别因素最大的对象。

所述主要对象的特征信息可以包括以下的一项或多项：主要对象的类型、主要对象的色彩、主要对象占整帧图像的面积比例、主要对象位于整帧图像的所在区域。

在一实施例中，所述对所述目标图像进行图形识别，提取出特征信息，还包括以下步骤：识别所述标识区域内的一个或多个次要对象，获得对应的次要特征信息。

可借助“主要特征信息(类别指针)”、“次要特征信息(类别指针)”、以及下面描述的“辅助特征信息(类别指针)”的一种或多种，对视频标识增加若干个类别标记，通过对所有视频标识进行自动分类，便于后续的归类和用户检索。

在一实施例中，所述对所述目标图像进行图形识别，提取出特征信息，还包括：接收用户标注的特征信息。

本公开的方案还能对用户标注的对象识别出多个特征信息(类别指针)，如：主要特征信息(类别指针)、次要特征信息(类别指针)、辅助特征信息(类别指针)，并进行记录，便于后续使用中的视频分类，以及便于用户进行检索。

在一实施例中，所述对所述目标图像进行图形识别，提取出特征信息，还包括：对标识区域进行增大，识别增大的标识区域内的辅助特征信息。

在一实施例中，所述视频标识对应的信息包括以下的一项或多项：所述特征信息对应的特征图片、所述特征信息位于视频中的时间信息、视频文件的文件信息。

在一实施例中，步骤S10可以包括步骤S11-S14。

在步骤S11中，录制视频或播放视频过程中，接收用户的选定操作。具体的，选定操作可以为点选、框选、圈选，也可以为通过压力大小选择对应的选定区域。

在步骤S12中，根据用户的选定操作，确定标识区域。

在步骤S13中，对标识区域进行图像分析，提取其特征信息。

在步骤S14中，将该标识区域的特征信息保存为视频标识，记录该标识区域的特征信息、标识区域位于该视频的时间点信息，还可进一步记录该视频文件的文件信息和/或该标识区域的特征图片。

在一实施例中，步骤S13中“对标识区域进行图像分析，提取其特征信息”可以包括：步骤S1300：在用户选定的区域内，进行边缘检测，识别出主要对象。根据该主要对象识别出相应的“类别指针”，即主要特征信息(类别指针)。

在一实施例中，步骤S13还可以包括下述“步骤S1301”、“步骤S1302”、“步骤S1303”中的一个或多个，而先后顺序不做限定。

在步骤S1301中，识别该标识区域内的一个或多个次要对象，获得对应的次要特征信息(类别指针)。

在步骤S1302中，在用户事先标记或者事后编辑视频标识信息的情况下，进一步获得用户标注的“类别指针”，即手动特征信息(类别指针)。

在步骤S1303中，扩大标记对象范围，识别辅助特征信息(类别指针)。

在一实施例中，在步骤S20中，可以对视频的每一帧/抽样帧(如：每隔10帧，或者20帧，抽样一帧，或每隔一段时间，如2秒抽样一帧)进行图像分析，当识别到存在与现有视频标识相同或近似的特征信息时，更新该视频标识，具体为，在视频标识信息中，增加该标识区域在该视频中出现的新的时间点信息。

在一实施例中，局部/全局扫描部分/全部视频文件，根据视频标识的特征信息对每帧/抽样帧进行检索，以更新视频标识。

在一实施例中，所述检索指令携带的信息包括特征图像。在接收到检索指令之前，所述方法包括：显示所有视频标识对应的特征图片。所述根据所述检索指令携带的信息对所述视频标识进行检索，包括以下步骤：根据所述特征图像获取对应的标识名称，根据所述标识名称查找数据库中的所有视频标识，获取所述标识名称对应的视频文件信息。

步骤S30的视频标识检索流程，可以包括以下方法：

方法一：图片检索接口

该方法可以包括步骤S3011-S3013。

在步骤S3011中，向用户显示所有/部分视频标识对应的特征图片。

在一实施例中，根据特征信息的类别指针进行分类显示，当同类别图片超出一定数量时，可部分进行隐藏。

在步骤S3012中，接收用户的选择，并获得该特征图片对应的标识名称。

标识名称包含了特征图片相关信息，以此与待检索的视频进行检索匹配。标识名称属于特征图片范畴，视频标识属于特征视频范畴，特征视频包含多幅图片，其中若干图片为特征图片(并非所有图片为标识图片)。

在步骤S3013中，根据上述标识名称对所有视频标识进行检索，获得对应的“视频文件信息”，并显示给用户。具体呈现方式可以为文件的方式，也可以为缩略视频文件的方式。所述视频文件信息可以包括：视频文件路径，视频文件名称，视频文件缩略图，视频文件内容简介等。

在一实施例中，视频文件打开后，在进度条上视频标识出现的位置显示特殊标记。

在一实施例中，在进行图像分类时，主要特征信息(类别指针)的优先级大于次要特征信息(类别指针)，次要特征信息(类别指针)的优先级大于辅助特征信息(类别指针)，或主要特征信息(类别指针)的优先级大于辅助特征信息(类别指针)，辅助特征信息(类别指针)的优先级大于次要特征信息(类别指针)，手动特征信息(类别指针)的优先级不进行限定。

方法二：文字检索接口

该方法可以包括步骤S3021-3023。

在步骤S3021中，接收用户输入的文字检索信息。

在步骤S3022中，根据文字检索信息，对所有视频标识进行检索。

在一实施例中，检索视频标识的“主要特征信息(类别指针)”、“次要特征信息(类别指针)”字段、“手动特征信息(类型指针)”、“辅助特征信息(类别指针)”的一种或多种。

在步骤S3023中，将检索命中的视频标识的“视频文件信息”显示给用户。可以为文件的方式，也可以为缩略视频文件的方式。

在一实施例中，也可根据用户输入的文字检索词，在所有视频标识中查找其近似词。

本公开实施例的应用环境可以为安卓系统手机，也可以为其他操作系统。以下，以安卓系统为例进行说明。

在安卓系统手机中，存在各种多媒体应用，涉及拍照/查看图片、录制/播放视频、录制/播放音频等。若用户进行拍照/查看图片、录制/播放视频、录制/播放音频等，安卓系统手机会在存储设备中生成相应的图片、视频、音频等文件，同时，安卓系统手机采用SQLite数据库管理多媒体文件，其会扫描存储设备，为新生成的图片、视频、音频等文件建立基于文件头信息的数据库索引。文件头信息可包括例如视频文件名、视频格式、视频尺寸、视频时长、视频分辨率、视频帧率等信息。安卓系统手机包含文件管理器应用，其通过查询SQLite数据库，创建文件列表视图并呈现给用户，供用户选择，例如，通过点击视频文件名进行视频播放。

图2为安卓系统原有的系统结构框图。如图2所示，视频录制应用(Camcorder)、视频播放应用(Video Player)、文件管理器应用(File Explorer)等模块通过媒体提供者(Media Provider)与SQLite引擎(Engine)交互，创建多媒体文件数据索引。视频录制应用录制视频完成后，将视频文件索引信息(如：视频文件名、视频格式、视频尺寸、视频时长、视频分辨率、视频帧率等)写媒体提供者数据库。视频播放应用和文件管理器应用从媒体提供者数据库读取视频文件索引信息，用户根据索引信息选择所需的视频文件。

现有安卓系统手机中的视频文件中包含通过压缩算法进行压缩后的多帧图像，若需获取完整视频内容，则须对视频文件进行解压。由于视频文件的压缩特性，以及图像的图形化表现形式，导致视频文件无法像图片一样，通过缩略图获取完整信息，也无法像文本文件一样，直接搜索文本文件中的内容。同时，安卓系统手机采用的SQLite数据库仅通过读取多媒体文件头信息建立数据索引，故无法准确描述视频文件内容，导致用户无法有效管理视频文件，无法快速检索目标视频文件。

图3为本实施例提供的一种视频检索的方法的系统结构框图。如图3所示，视频录制应用(Camcorder)、视频播放应用(Video Player)、文件管理器应用(File Explorer)等模块通过与目标标记(Object Marker)模块交互，实现视频标记和视频检索，视频标记数据通过媒体提供者写入多媒体文件数据库。

视频录制应用在录制视频过程中/视频播放应用在播放视频过程中，Object Marker获取每帧/抽样帧图像数据，由用户进行标记，对其进行目标检测、目标追踪、目标识别，并记录为视频标识。

文件管理器应用从媒体提供者获取视频文件索引，并根据媒体提供者数据库中的视频标记信息，为用户显示更为详细的视频内容信息，同时会显示已标记的目标图像缩略图，从而为用户提供更为直观的视频索引。

图4为本实施例提供的一种视频检索的方法的目标标记引擎框图。如图4所示，目标标记引擎(Object Marker Engine)对目标检测(Object Detection)、目标追踪(Object Tracking)、目标识别(Object Recognize)、目标标记(Object Mark)等模块进行调度。目标标记引擎与视频编/解码器(Video Encoder/Decoder)交互，获取视频每帧/抽样帧图像。目标标记引擎与媒体提供者交互，将视频标识信息写入多媒体数据库索引中。

下面通过具体实施例对本公开的方法及装置进一步说明。

实施例1：

接收用户的标记操作，如在“视频文件1”的00：44秒选定框区域(例如一男子头像)，对框区域内的图像进行图像识别，提取特征信息，并保存为视频标识A，如表1所示：

表1

对“视频文件1”的每一帧/抽样帧(如：每隔10帧，或者20帧，抽样一帧，或每隔一段时间，如2秒抽样一帧)进行图像分析，当出现与特征信息A相同的信息时，更新视频标识A。举例，如果该男子在视频的00：15，00：44，01:35开始出现，则更新视频标识A，如表2所示：

表2

所在时间位置信息，还可以以时间区间的方式进行记录，如【00：44-01:10】。

在步骤S1300中，在用户选定的区域内，进行边缘检测，识别出主要对象。

其中，如上所述，主要对象的选择可以是所占区域面积最大的对象，可以是颜色与其他颜色色差区别最大的对象，也可以是清晰度最高的对象或其他某一识别因素最大的对象。

根据该主要对象识别出相应的“类别指针”，“类别指针”具体可以为为：主要对象的类型、主要对象的色彩、主要对象占整帧图像的面积比例、主要对象位于整帧图像的所在区域中的一项或多项。类别指针可以是具体数值、具体类别，也可以是区间范围。示例如表3所示：

表3

在步骤S13中，使用的图像分析方法可以为：尺度不变特征变换 (Scale-invariant feature transform，SIFT)/加速稳健特征(Speeded Up Robust Features，SURF)、哈尔小波转换(haar)特征、广义霍夫(hough)变换等方法。

在步骤S1301中，识别该标识区域内的一个或多个次要对象，获得对应的次要特征信息(类别指针)。例如：

例1：可根据视频标识A的特征信息A进一步识别出次要对象，如“棕色眼睛”、“棕色短发”、“黄色帽子”，并将该信息更新到视频标识A中，如保存字段次要特征信息(类别指针1_1)：眼睛；次要特征信息(类别指针1_2)：棕色；次要特征信息(类别指针2_1)：短发；次要特征信息(类别指针2_2)：棕色；次要特征信息(类别指针3_1)：帽子；次要特征信息(类别指针3_2)：黄色。保存信息如表4所示：

表4

例2：用户标识了一个海滩，海滩上还有“占图像比例12％的褐色礁石”、“占图像比例5％的白色贝壳”，则识别次要对象后，保存次要特征信息(类别指针如下)，如表5所示：

表5

在步骤S1302中，在用户事先标记或者事后编辑视频标识信息的情况下，进一步获得用户标注的手动特征信息(类别指针)，或将已识别到的类别指针提供给用户确认。如：用户标记“James”，“记者”或其他标签。如表6所示：

表6

步骤S1303中，扩大标记对象范围，识别辅助特征信息，获得对应的“类别指针”。具体可以是，根据边缘检测，对选定标记对象的区域范围进行增大，从而增加可识别的信息，例如：原用户圈选的对象A的人脸部分，除了识别人脸部分的特征信息得出类别指针外，还可利用边缘识别技术将标记对象扩展到对象A的全身，并提取新的特征信息进行识别，并将结果作为辅助特征信息进行存储，例如，特征“蓝色衬衫”，“工卡”。同理，视频标识B(橙色橘子、蓝色西装)、视频标识C(黄色帽子、红色领结)经识别以后，保存信息如表7所示：

表7

当系统新增新的视频标识后，可以针对部分视频文件或者全部视频文件更新该视频标识信息。例如，新增视频标识A且已针对“视频文件1”更新视频标识A后，进一步针对其他视频如“视频文件2”、“视频文件3”、“视频文件4”等视频文件，更新视频标识A，如表8所示：

表8

实施例2：

根据视频标识中的各种特征信息(类别指针)字段，向用户分类显示所有视频标识的特征图片。

用户点击某一特征图片，检索与其相关的视频信息。具体为，获得该特征图片对应的标识名称，根据标识名称查找数据库中的所有视频标识信息，获得该标识名称对应的视频文件信息，或视频文件信息及其所在时间位置。将检索结果呈现给用户。具体呈现方式可以为：文件夹的方式，也可以为缩略视频文件的方式。

特征图片为用户选择的图片，包含了用户感兴趣的信息；标识名称可认为是数据库索引，用于通过特征图片来查找/匹配数据库中所有标识名称所对应的视频标识。视频标识与视频文件一一对应，视频信息包括：视频文件路径，视频文件名称，视频文件缩略图，视频文件内容简介等。

实施例3：

用户输入文字检索词进行检索，如“手机”，则检索数据库中所有视频标识的“主要特征信息(类别指针)”字段，查找与手机相关的视频标识信息，并将检索结果的特征图片呈现给用户，即，显示视频标识E与视频标识F对应的特征图片。也可以根据用户输入的文字检索词，在所有视频标识中查找其近似词。如表9所示：

表9

检索时，也可以同时检索视频标识的“主要特征信息(类别指针)”字段、“次要特征信息(类别指针)”字段、“手动特征信息(类别指针)”字段”、“辅助特征信息(类别指针)”字段的一种或多种。优先级上，“主要特征信息(类别指针)”大于“次要特征信息(类别指针)”大于“辅助特征信息(类别指针)”，或优先级主要特征信息(类别指针)”大于“辅助特征信息(类别指针)”大于“次要特征信息(类别指针)”，“特征信息(类别指针)”的优先级本公开不进行限制。

系统接收用户输入的关键词/关键语句，对关键词/关键语句进行分词，得到若干个字/词。针对获得的字/词分别在所有视频标识的“主要特征信息(类别指针)”、“次要特征信息(类别指针)”、“手动特征信息(类别指针)”、“辅助特征信息(类别指针)”的一种或多种中进行检索，每命中一个字/词，即在该视频标识的相关指数上进行累加或乘以一定比例系数或两者的组合。对所有视频标识的相关指数进行排序，优先向用户呈现与检索结果相关度较大的视频文件。

本公开的上述实施例可以通过用户的一次标记，对标记图像进行图像分析，提取特征信息，并根据特征信息查找当前视频或者其他视频中相同或相关的图像，并据此更新视频标识。更新后的视频标识信息中记录了本地所有出现该图像的全部视频的所有时间点信息，还包括根据特征信息得到的“特征信息(类别指针)”。借助视频标识，用户可通过文字或者图片快速检索并定位到所有相关视频的所有时间点，达到快速检索的技术效果。

此外，本公开的上述实施例还能对用户标记的对象识别出多个特征信息(类别指针)，如：主要特征信息(类别指针)、次要特征信息(类别指针)、辅助特征信息(类别指针)，并进行记录，便于后续使用中的视频分类，以及便于用户进行检索。

图5为本公开实施例的一种视频检索的装置的示意图。如图5所示，本实施例的装置可以包括：识别模块，配置为接收到用户选择的目标图像后，对所述目标图像进行图形识别，提取出特征信息，并将所述特征信息保存为视频标识；标识模块，配置为对当前播放的视频或指定视频或本地存储的全部视频的每一帧或抽样帧进行图像识别，当识别到存在与所述特征信息相同或近似的特征信息时，更新所述视频标识；以及检索模块，配置为接收到检索指令后，根据所述检索指令携带的信息对所述视频标识进行检索。

在一实施例中，所述识别模块对所述目标图像进行图形识别，提取出特征信息，包括步骤：确定所述目标图像的标识区域，对所述标识区域进行边缘检测，提取出主要对象的特征信息。

所述主要对象可以包括以下的任一种：占区域面积最大的对象，颜色与其他颜色色差区别最大的对象，清晰度最高的对象。所述主要对象的特征信息可以包括以下的一项或多项：主要对象的类型、主要对象的色彩、主要对象占整帧图像的面积比例、主要对象位于整帧图像的所在区域。

在一实施例中，所述识别模块对所述目标图像进行图形识别，提取出特征信息，还包括：识别所述标识区域内的一个或多个次要对象，获得对应的次要特征信息。

在一实施例中，所述识别模块对所述目标图像进行图形识别，提取出特征信息，还包括：接收用户标注的特征信息。

在一实施例中，所述识别模块对所述目标图像进行图形识别，提取出特征信息，还包括：对所述标识区域进行增大，识别增大的标识区域内的辅助特征信息。

在一实施例中，所述装置还包显示模块。

所述显示模块配置为，在所述检索模块接收到检索指令之前，显示所有视频标识对应的特征图片，所述检索指令携带的信息包括特征图像，

所述检索模块根据所述检索指令携带的信息对所述视频标识进行检索，包括步骤：根据所述特征图像获取对应的标识名称，根据所述标识名称查找数据库中的所有视频标识，获取所述标识名称对应的视频文件信息。

本发明实施例还提供一种视频检索的装置，包括处理器和计算机可读存储介质，所述计算机可读存储介质中存储有指令，其中，当所述指令被所述处理器执行时，实现上述视频检索的方法。

本发明实施例还提供了一种计算机可读存储介质，其存储有计算机可执行指令，所述计算机可执行指令被执行时实现所述视频检索的方法。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

以上仅为本公开的优选实施例，当然，本公开还可有其他多种实施例，在不背离本公开精神及其实质的情况下，熟悉本领域的技术人员当可根据本公开作出各种相应的改变和变形，但这些相应的改变和变形都应属于本公开所附的权利要求的保护范围。

Claims

一种视频检索的方法，包括：

接收到用户选择的目标图像后，对所述目标图像进行图形识别，提取出特征信息，并将所述特征信息保存为视频标识；

对当前播放的视频或指定视频或本地存储的全部视频的每一帧或抽样帧进行图像识别，当识别到存在与所述特征信息相同或近似的特征信息时，更新所述视频标识；以及

接收到检索指令后，根据所述检索指令携带的信息对所述视频标识进行检索。
如权利要求1所述的方法，其中，所述对所述目标图像进行图形识别，提取出特征信息，包括：

确定所述目标图像的标识区域，对所述标识区域进行边缘检测，提取出主要对象的特征信息，

所述主要对象包括以下的任一种：占区域面积最大的对象，颜色与其他颜色色差区别最大的对象，清晰度最高的对象。
如权利要求2所述的方法，其中，所述主要对象的特征信息包括以下的一项或多项：

主要对象的类型、主要对象的色彩、主要对象占整帧图像的面积比例、主要对象位于整帧图像的所在区域。
如权利要求2所述的方法，其中，所述对所述目标图像进行图形识别，提取出特征信息，还包括：

识别所述标识区域内的一个或多个次要对象，获得对应的次要特征信息。
如权利要求2所述的方法，其中，所述对所述目标图像进行图形识别，提取出特征信息，还包括：

接收用户标注的特征信息。
如权利要求2所述的方法，其中，所述对所述目标图像进行图形识别，提取出特征信息，还包括：

对所述标识区域进行增大，识别增大的标识区域内的辅助特征信息。
如权利要求1所述的方法，其中，所述视频标识对应的信息包括以下的一项或多项：

所述特征信息对应的特征图片、所述特征信息位于视频中的时间信息、视频文件的文件信息。
如权利要求1所述的方法，其中，

所述检索指令携带的信息包括特征图像，在接收到所述检索指令之前，所述方法包括：显示所有视频标识对应的特征图片；并且

所述根据所述检索指令携带的信息对所述视频标识进行检索，包括：根据所述特征图像获取对应的标识名称，根据所述标识名称查找数据库中的所有视频标识，获取所述标识名称对应的视频文件信息。
一种视频检索的装置，包括：

识别模块，配置为接收到用户选择的目标图像后，对所述目标图像进行图形识别，提取出特征信息，并将所述特征信息保存为视频标识；

标识模块，配置为对当前播放的视频或指定视频或本地存储的全部视频的每一帧或抽样帧进行图像识别，当识别到存在与所述特征信息相同或近似的特征信息时，更新所述视频标识；以及

检索模块，配置为接收到检索指令后，根据所述检索指令携带的信息对所述视频标识进行检索。
如权利要求9所述的装置，其中，

所述识别模块对所述目标图像进行图形识别，提取出特征信息，包括：确定所述目标图像的标识区域，对所述标识区域进行边缘检测，提取出主要对象的特征信息，

所述主要对象包括以下的任一种：

占区域面积最大的对象，颜色与其他颜色色差区别最大的对象，清晰度最高的对象，

所述主要对象的特征信息包括以下的一项或多项：

主要对象的类型、主要对象的色彩、主要对象占整帧图像的面积比例、主要对象位于整帧图像的所在区域。
如权利要求10所述的装置，其中，

所述识别模块对所述目标图像进行图形识别，提取出特征信息，还包括：识别所述标识区域内的一个或多个次要对象，获得对应的次要特征信息。
如权利要求10所述的装置，其中，

所述识别模块对所述目标图像进行图形识别，提取出特征信息，还包括：接收用户标注的特征信息。
如权利要求10所述的装置，其中，

所述识别模块对所述目标图像进行图形识别，提取出特征信息，还包括：对所述标识区域进行增大，识别增大的标识区域内的辅助特征信息。
如权利要求9所述的装置，其中，所述视频标识对应的信息包括以下的一项或多项：

所述特征信息对应的特征图片、所述特征信息位于视频中的时间信息、视频文件的文件信息。
如权利要求9所述的装置，其中，所述装置还包显示模块，

所述显示模块配置为在所述检索模块接收到检索指令之前，显示所有视频标识对应的特征图片，所述检索指令携带的信息包括特征图像，

所述检索模块根据所述检索指令携带的信息对所述视频标识进行检索，包括：根据所述特征图像获取对应的标识名称，根据所述标识名称查找数据库中的所有视频标识，获取所述标识名称对应的视频文件信息。
一种计算机可读存储介质，其存储有指令，其中，当所述指令被处理器执行时，实现如权利要求1-8任一项所述的方法。
一种视频检索的装置，包括处理器和计算机可读存储介质，所述计算机可读存储介质中存储有指令，其中，当所述指令被所述处理器执行时，实现如权利要求1-8任一项所述的方法。