CN105843930A

CN105843930A - 一种检索视频的方法及装置

Info

Publication number: CN105843930A
Application number: CN201610189270.0A
Authority: CN
Inventors: 蔡炜
Original assignee: Leshi Zhixin Electronic Technology Tianjin Co Ltd; LeTV Holding Beijing Co Ltd
Current assignee: Leshi Zhixin Electronic Technology Tianjin Co Ltd; LeTV Holding Beijing Co Ltd
Priority date: 2016-03-29
Filing date: 2016-03-29
Publication date: 2016-08-10

Abstract

本发明实施例提供一种检索视频的方法及装置，用以解决现有技术中检索视频时计算量大、检索效率低的问题，减小计算量，提高检索视频的效率。所述检索视频的方法，包括：接收用户输入的用于检索视频的原始图像；确定所述原始图像的元数据，分别计算所述原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，利用预设规则从所述多个交互信息量中确定目标交互信息量，并将所述目标交互信息量所对应元数据的帧图像所在的视频确定为所述原始图像所在的视频；其中，所述视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。

Description

一种检索视频的方法及装置

技术领域

本发明实施例涉及视频技术领域，尤其涉及一种检索视频的方法及装置。

背景技术

随着计算机和通信技术的高速发展，视频资源的数量也随之迅速增加，随着视频资源的积累，如何在海量视频资源中快速检索出所需的视频显得至关重要。由于视频数据量大，且具有时间及空间结构，其表达、存储、传输、组织具有更大的难度，只有合理地组织视频数据，才能有效地浏览和检索。

现有的视频图像检索技术，大多是基于两幅图像的整个信息进行比较，也即在进行检索时，将用户输入的原始图像的颜色直方图与视频中每帧图像的颜色直方图整个进行比较，计算量大，另外，由于用户通常提供的是一幅图片中的一个部分，因此，在进行检索时，其他无关信息会影响计算量，进而影响判断图片相关性的准确性，影响检索结果。

综上所述，现有技术在检索视频时，基于两幅图像的整个信息进行比较，计算量大，检索效率低。

发明内容

本发明实施例提供一种检索视频的方法及装置，用以解决现有技术中检索视频时计算量大、检索效率低的问题，减小计算量，提高检索视频的效率。

本发明实施例提供一种检索视频的方法，该方法包括：接收用户输入的用于检索视频的原始图像；确定所述原始图像的元数据，分别计算所述原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，利用预设规则从所述多个交互信息量中确定目标交互信息量，并将所述目标交互信息量所对应元数据的帧图像所在的视频确定为所述原始图像所在的视频；其中，所述视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。

本发明实施例提供一种检索视频的装置，该装置包括：接收单元，用于接收用户输入的用于检索视频的原始图像；处理单元，用于确定所述原始图像的元数据，分别计算所述原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，利用预设规则从所述多个交互信息量中确定目标交互信息量，并将所述目标交互信息量所对应元数据的帧图像所在的视频确定为所述原始图像所在的视频；其中，所述视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。

本发明实施例提供的一种检索视频的方法及装置，接收用户输入的用于检索视频的原始图像，确定原始图像的元数据，分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，由于视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据，因此，在计算得到多个交互信息量之后，利用预设规则从多个交互信息量中确定目标交互信息量，将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频，与现有技术中基于两幅图像的整个信息进行比较，计算量大，且检索结果不准确相比，通过构造元数据，计算原始图像的元数据与每个视频的视频摘要中每帧图像的元数据的交互信息量，进而根据交互信息量确定原始图像所在的视频，减小了计算量，提高检索视频的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种检索视频的方法的示意流程图；

图2为本发明实施例提供的一种计算视频的视频元数据的示意流程图；

图3为本发明实施例提供的一种检索视频的方法的具体流程的示意流程图；

图4为本发明实施例提供的一种检索视频的装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

首先对本发明实施例中提到的一些名词进行解释：

本发明实施例中提到的灰度直方图(Histogram)，相机上显示的直方图和位图图像处理软件(Photoshop，PS)使用的直方图都是灰度直方图，从图形上说，它是一个二维图，用坐标表示，横坐标表示图像中各个像素点的灰度级，0到255个级别，纵坐标为各个灰度级上像素点出现的次数或概率。灰度直方图具有一下特点：

(1)灰度直方图表征了图像的一维信息，只反映图像中像素不同灰度值出现的次数(或频数)而未反映像素所在位置；

(2)灰度直方图与图像之间的关系是多对一的映射关系，一幅图像唯一确定出与之对应的灰度直方图，但不同图像可能有相同的灰度直方图。

(3)子图灰度直方图之和为整图的灰度直方图。

本发明实施例中提到的概率密度函数可以由图像的灰度直方图中各个灰度值上像素点的统计次数除以图像总的像素个数得到。概率是指事件随机发生的机率，对于均匀分布函数，概率密度等于一段区间(事件的取值范围)的概率除以该段区间的长度，它的值是非负的，可以很大也可以很小。单纯的讲概率密度没有实际的意义，它必须有确定的有界区间为前提，可以把概率密度看成是纵坐标，区间看成是横坐标，概率密度对区间的积分就是面积，而这个面积就是事件在这个区间发生的概率，所有面积的和为1。所以单独分析一个点的概率密度是没有任何意义的，它必须要有区间作为参考和对比。

元数据是具有描述、解释、定位信息资源功能的结构化信息，即元数据是描述数据的数据，或者描述信息的信息。本发明实施例中利用与视频相关的元数据描述视频的主要内容，从视频中提取信息生成元数据，在进行检索时，使用元数据进行比较。

本发明实施例提供一种检索视频的方法，如图1所示，该方法包括：

步骤11，接收用户输入的用于检索视频的原始图像；

步骤13，确定原始图像的元数据，分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，利用预设规则从多个交互信息量中确定目标交互信息量，并将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频；其中，视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。

本发明实施例提供的方法中，接收用户输入的用于检索视频的原始图像，确定原始图像的元数据，分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，由于视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据，因此，在计算得到多个交互信息量之后，利用预设规则从多个交互信息量中确定目标交互信息量，将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频，与现有技术中基于两幅图像的整个信息进行比较，计算量大，且检索结果不准确相比，通过构造元数据，计算原始图像的元数据与每个视频的视频摘要中每帧图像的元数据的交互信息量，进而根据交互信息量确定原始图像所在的视频，减小了计算量，提高检索视频的效率。

具体实施时，在计算得到多个交互信息量之后，利用预设规则从多个交互信息量中确定目标交互信息量，并将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频，需要说明的是，目标交互信息量可以是一个，也可以是多个，根据预设规则的不同，确定出的目标交互信息量也有不同，例如：预设规则是取最大值时，能确定出一个目标交互信息量，但若预设规则是交互信息量的值大于预设阈值(根据经验值设定，例如：90)，能确定出多个目标交互信息量。当然，本领域技术人员应当理解的是，预设规则还可以是其它规则，例如：将交互信息量按大小排序，取预设数量个交互信息量作为目标交互信息量。较为优选地，为了提高检索视频的准确率，预设规则为取最大值，也即在计算得到多个交互信息量之后，确定多个交互信息量中的最大交互信息量，并将最大交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频。

具体实施时，任一图像的元数据包括该图像的灰度直方图和概率密度函数，概率密度函数为该图像灰度直方图中各个灰度值上像素点的统计数量与该图像的总像素点数之比。

值得说明的是，在计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量时，可以基于整张图像的元数据计算交互信息量，但是由于用户通常提供的只是一张图像的一部分，因此，为了避免图像中其它无关信息的影响，可以将图像的元数据分为主题部分的元数据和背景部分的元数据，具体来说：

在一种可能的实施方式中，本发明实施例提供的方法中，任一图像的元数据包括：该图像主题部分的元数据以及该图像背景部分的元数据；计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，包括：计算原始图像主题部分的元数据与视频元数据库中每帧图像主题部分的元数据的交互信息量，和/或计算原始图像背景部分的元数据与视频元数据库中每帧图像背景部分的元数据的交互信息量。

本发明实施例提供的方法中，将原始图像和视频元数据库中每帧图像均划分成由主题部分和背景部分两部分组成，根据用户提供的原始图像，选取其中一个或者全部计算交互信息量，并根据交互信息量确定原始图像所在的视频，避免了检索视频时无关信息的影响，提高了检索视频的准确性，同时，由于选取其中的一个或全部计算交互信息量，进一步减小了计算量。

在一种可能的实施方式中，本发明实施例提供的方法中，当任一图像的元数据包括：图像主题部分的元数据以及图像背景部分的元数据时，在确定原始图像的元数据之前，该方法还包括：利用预设比例参数将原始图像分为主题部分和背景部分；确定原始图像的元数据，包括：确定原始图像的主题部分的元数据以及原始图像的背景部分的元数据。

具体实施时，将图像中的场景作为该帧图像的背景部分，将人物的面部作为该帧图像的主题部分，每个人物都有独特的特征，如人脸图像，目前人脸检测算法已日益成熟。面部识别可用现在较为成熟的贝叶斯可区分特征(Bayesian Discriminating Features，BDF)的方法来检测人脸，在该算法中，首先对输入图像进行一维Harr小波变换后投影到水平和垂直坐标上，得到输入图像的概率统计信息，再运用贝叶斯分类器进行人脸检测，通过该方法检测人物的面部特征，并利用预设比例参数对检测出的目标区域进行向外扩展，从而分割出图像中的主题部分，分割主题部分之后剩下的就是背景部分。其中，预设比例参数可以根据经验值设定，例如：预设比例参数取值为0.29。

具体实施时，在检索视频时，首先需要建立视频元数据库，视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据，在建立视频元数据库时，首先需要建立视频的视频摘要，视频摘要是对视频中的关键帧进行合理排序(例如：按时间顺序排列)得到的镜头级的视频摘要，建立视频摘要的方法可以采用现有技术中的方法，此处不再赘述。其中，关键帧代表镜头的主要内容。

对于任一视频，建立视频摘要之后，生成视频元数据的步骤，如图2所示，包括：

步骤21，读取视频摘要帧序列中的第i帧，其中，i初始化值为1，并且i≤N，N为视频摘要的总帧数，N＝1000；

步骤23，利用预设比例参数将该帧划分为主题部分和背景部分，预设比例参数可以根据经验值设定，例如：预设比例参数取值为0.29；

步骤25，分别计算主题部分和背景部分的灰度直方图和概率密度函数；

步骤27，将得到的计算结果存入视频元数据库中。

为更方便地管理和使用视频元数据库中存储的每帧图像的元数据，对每个视频的元数据进行结构化处理。具体实施时，定义图像的灰度直方图和概率密度函数为该图像的元数据，保存元数据的格式描述为：视频元数据结构由文件序列号、视频文件名、背景数据结构和主题数据结构4个部分组成，其中，背景数据结构由背景名和背景元数据构成，主题数据结构由主题名和主题元数据构成，背景元数据和主题元数据由视频摘要中每帧图像的灰度直方图和概率密度函数组成。

将每个视频的元数据结构化处理后，利用元数据来计算用户输入的原始图像与视频元数据库中每帧图像的背景部分和/或主题部分的交互信息量，通过交互信息量判断二者的相似性，进而利用预设规则从计算得到的多个交互信息量中确定目标交互信息量，并将目标交互信息量所对应元数据的帧图像所在的视频，确定为用户输入的原始图像所在的视频，具体实施时，原始图像的元数据与视频元数据库中任一帧图像的元数据的交互信息量，等于原始图像的元数据与视频元数据库中该帧图像的元数据在红R、绿G、蓝B分量上的交互信息量之和，其中，原始图像的元数据与视频元数据库中该帧图像的元数据在任一分量上的交互信息量通过如下公式计算得到：

I = - \underset{a = 0}{Σ} \underset{b = 0}{Σ} P_{A B} (a, b) \times \lg \frac{P_{A B} (a, b)}{P_{A} (a) \times P_{B} (b)};

其中，I表示交互信息量，P_A(a)表示原始图像在该分量上的概率密度函数，P_B(b)表示视频元数据库中该帧图像在该分量上的概率密度函数，P_AB(a，b)表示原始图像和视频元数据库中该帧图像在该分量上的联合概率密度函数。以R分量为例，P_A(a)表示原始图像在R分量上的概率密度函数，P_B(b)表示视频元数据库中该帧图像在R分量上的概率密度函数，P_AB(a，b)表示原始图像和视频元数据库中该帧图像在R分量上的联合概率密度函数。

作为较为具体的实施时，本发明实施例提供的检索视频的方法，以计算原始图像的元数据与视频元数据库中第i帧图像的元数据的交互信息量为例，基于元数据检索视频的步骤，如图3所示，包括：

步骤31，接收用户输入用于检索视频的原始图像；

步骤32，计算原始图像的元数据，即计算原始图像的灰度直方图和概率密度函数；

步骤33，计算原始图像与视频元数据库中第i帧图像的联合概率密度函数，具体来说，根据原始图像的灰度直方图以及第i帧图像的灰度直方图计算联合概率密度；

步骤34，计算原始图像的元数据与视频元数据库中第i帧图像的元数据在R、G、B分量上的交互信息量；

步骤35，计算原始图像的元数据与视频元数据库中第i帧图像的元数据的交互信息量，具体来说，原始图像的元数据与视频元数据库中第i帧图像的元数据的交互信息量，等于原始图像的元数据与视频元数据库中第i帧图像的元数据在R、G、B分量上的交互信息量之和；

步骤36，通过计算得到的交互信息量，判断原始图像与第i帧图像的相关性，判断是否检索完成。具体来说，当计算得到多个交互信息量时，利用预设规则从多个交互信息量中确定目标交互信息量，例如：预设规则为取最大值，则取多个交互信息量中最大交互信息量所对应元数据的帧图像作为检索到的相似性最大的图像，将多个交互信息量中最大交互信息量所对应元数据的帧图像所在的视频确定为用户输入的原始图像所在的视频。

本发明实施例提供一种检索视频的装置，如图4所示，该装置包括：接收单元41，用于接收用户输入的用于检索视频的原始图像；处理单元43，用于确定原始图像的元数据，分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，利用预设规则从多个交互信息量中确定目标交互信息量，并将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频；其中，视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。

本发明实施例提供的装置中，接收用户输入的用于检索视频的原始图像，确定原始图像的元数据，分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，由于视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据，因此，在计算得到多个交互信息量之后，利用预设规则从多个交互信息量中确定目标交互信息量，将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频，与现有技术中基于两幅图像的整个信息进行比较，计算量大，且检索结果不准确相比，通过构造元数据，计算原始图像的元数据与每个视频的视频摘要中每帧图像的元数据的交互信息量，进而根据交互信息量确定原始图像所在的视频，减小了计算量，提高检索视频的效率。

在一种可能的实施方式中，本发明实施例提供的装置中，任一图像的元数据包括：该图像主题部分的元数据以及该图像背景部分的元数据；处理单元43计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，具体用于：计算原始图像主题部分的元数据与视频元数据库中每帧图像主题部分的元数据的交互信息量，和/或计算原始图像背景部分的元数据与视频元数据库中每帧图像背景部分的元数据的交互信息量。

在一种可能的实施方式中，本发明实施例提供的装置中，当任一图像的元数据包括：图像主题部分的元数据以及图像背景部分的元数据时，处理单元43在确定原始图像的元数据之前，还用于：利用预设比例参数将原始图像分为主题部分和背景部分；处理单元43确定原始图像的元数据，具体应用：确定原始图像的主题部分的元数据以及原始图像的背景部分的元数据。

在一种可能的实施方式中，本发明实施例提供的装置中，原始图像的元数据与视频元数据库中任一帧图像的元数据的交互信息量，等于原始图像的元数据与视频元数据库中该帧图像的元数据在红R、绿G、蓝B分量上的交互信息量之和，其中，处理单元43通过如下公式计算原始图像的元数据与视频元数据库中该帧图像的元数据在任一分量上的交互信息量：

I = - \underset{a = 0}{Σ} \underset{b = 0}{Σ} P_{A B} (a, b) \times \lg \frac{P_{A B} (a, b)}{P_{A} (a) \times P_{B} (b)};

其中，I表示交互信息量，P_A(a)表示原始图像在该分量上的概率密度函数，P_B(b)表示视频元数据库中该帧图像在该分量上的概率密度函数，P_AB(a，b)表示原始图像和视频元数据库中该帧图像在该分量上的联合概率密度函数。

在一种可能的实施方式中，本发明实施例提供的装置中，任一图像的元数据包括该图像的灰度直方图和概率密度函数，概率密度函数为该图像灰度直方图中各个灰度值上像素点的统计数量与该图像的总像素点数之比。

本发明实施例提供的一种检索视频的装置，可以集成在视频软件中，用于根据用户输入的原始图像检索视频，其中，接收单元41可以采用接收机或信号接收器，处理单元43可以采用CPU处理器等。

本发明实施例提供的一种检索视频的方法及装置，接收用户输入的用于检索视频的原始图像，确定原始图像的元数据，分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，由于视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据，因此，在计算得到多个交互信息量之后，利用预设规则从多个交互信息量中确定目标交互信息量，将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频，通过构造元数据，计算原始图像的元数据与每个视频的视频摘要中每帧图像的元数据的交互信息量，进而根据交互信息量确定原始图像所在的视频，减小了计算量，提高检索视频的效率。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种检索视频的方法，其特征在于，该方法包括：

接收用户输入的用于检索视频的原始图像；

确定所述原始图像的元数据，分别计算所述原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，利用预设规则从所述多个交互信息量中确定目标交互信息量，并将所述目标交互信息量所对应元数据的帧图像所在的视频确定为所述原始图像所在的视频；

其中，所述视频元数据库中存储多个视频的元数据，每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。

2.根据权利要求1所述的方法，其特征在于，任一图像的元数据包括：该图像主题部分的元数据以及该图像背景部分的元数据；

所述计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，包括：

计算原始图像主题部分的元数据与视频元数据库中每帧图像主题部分的元数据的交互信息量，和/或

计算原始图像背景部分的元数据与视频元数据库中每帧图像背景部分的元数据的交互信息量。

3.根据权利要求2所述的方法，其特征在于，当任一图像的元数据包括：图像主题部分的元数据以及图像背景部分的元数据时，在确定所述原始图像的元数据之前，该方法还包括：

利用预设比例参数将所述原始图像分为主题部分和背景部分；

所述确定原始图像的元数据，包括：确定原始图像的主题部分的元数据以及所述原始图像的背景部分的元数据。

4.根据权利要求1所述的方法，其特征在于，原始图像的元数据与视频元数据库中任一帧图像的元数据的交互信息量，等于原始图像的元数据与视频元数据库中该帧图像的元数据在红R、绿G、蓝B分量上的交互信息量之和，其中，原始图像的元数据与视频元数据库中该帧图像的元数据在任一分量上的交互信息量通过如下公式计算得到：

I = - \underset{a = 0}{Σ} \underset{b = 0}{Σ} P_{A B} (a, b) \times \lg \frac{P_{A B} (a, b)}{P_{A} (a) \times P_{B} (b)};

5.根据权利要求1-4中任一项所述的方法，其特征在于，任一图像的元数据包括该图像的灰度直方图和概率密度函数，所述概率密度函数为该图像灰度直方图中各个灰度值上像素点的统计数量与该图像的总像素点数之比。

6.一种检索视频的装置，其特征在于，该装置包括：

接收单元，用于接收用户输入的用于检索视频的原始图像；

处理单元，用于确定所述原始图像的元数据，分别计算所述原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，得到多个交互信息量，利用预设规则从所述多个交互信息量中确定目标交互信息量，并将所述目标交互信息量所对应元数据的帧图像所在的视频确定为所述原始图像所在的视频；

7.根据权利要求6所述的装置，其特征在于，任一图像的元数据包括：该图像主题部分的元数据以及该图像背景部分的元数据；

所述处理单元计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量，具体用于：

8.根据权利要求7所述的装置，其特征在于，当任一图像的元数据包括：图像主题部分的元数据以及图像背景部分的元数据时，所述处理单元在确定所述原始图像的元数据之前，还用于：

所述处理单元确定原始图像的元数据，具体应用：确定原始图像的主题部分的元数据以及所述原始图像的背景部分的元数据。

9.根据权利要求6所述的装置，其特征在于，原始图像的元数据与视频元数据库中任一帧图像的元数据的交互信息量，等于原始图像的元数据与视频元数据库中该帧图像的元数据在红R、绿G、蓝B分量上的交互信息量之和，其中，所述处理单元通过如下公式计算原始图像的元数据与视频元数据库中该帧图像的元数据在任一分量上的交互信息量：

I = - \underset{a = 0}{Σ} \underset{b = 0}{Σ} P_{A B} (a, b) \times \lg \frac{P_{A B} (a, b)}{P_{A} (a) \times P_{B} (b)};

10.根据权利要求6-9中任一项所述的装置，其特征在于，任一图像的元数据包括该图像的灰度直方图和概率密度函数，所述概率密度函数为该图像灰度直方图中各个灰度值上像素点的统计数量与该图像的总像素点数之比。