CN105843930A - 一种检索视频的方法及装置 - Google Patents

一种检索视频的方法及装置 Download PDF

Info

Publication number
CN105843930A
CN105843930A CN201610189270.0A CN201610189270A CN105843930A CN 105843930 A CN105843930 A CN 105843930A CN 201610189270 A CN201610189270 A CN 201610189270A CN 105843930 A CN105843930 A CN 105843930A
Authority
CN
China
Prior art keywords
metadata
video
original image
image
field picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610189270.0A
Other languages
English (en)
Inventor
蔡炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leshi Zhixin Electronic Technology Tianjin Co Ltd
LeTV Holding Beijing Co Ltd
Original Assignee
Leshi Zhixin Electronic Technology Tianjin Co Ltd
LeTV Holding Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leshi Zhixin Electronic Technology Tianjin Co Ltd, LeTV Holding Beijing Co Ltd filed Critical Leshi Zhixin Electronic Technology Tianjin Co Ltd
Priority to CN201610189270.0A priority Critical patent/CN105843930A/zh
Publication of CN105843930A publication Critical patent/CN105843930A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7335Graphical querying, e.g. query-by-region, query-by-sketch, query-by-trajectory, GUIs for designating a person/face/object as a query predicate

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种检索视频的方法及装置,用以解决现有技术中检索视频时计算量大、检索效率低的问题,减小计算量,提高检索视频的效率。所述检索视频的方法,包括:接收用户输入的用于检索视频的原始图像;确定所述原始图像的元数据,分别计算所述原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,利用预设规则从所述多个交互信息量中确定目标交互信息量,并将所述目标交互信息量所对应元数据的帧图像所在的视频确定为所述原始图像所在的视频;其中,所述视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。

Description

一种检索视频的方法及装置
技术领域
本发明实施例涉及视频技术领域,尤其涉及一种检索视频的方法及装置。
背景技术
随着计算机和通信技术的高速发展,视频资源的数量也随之迅速增加,随着视频资源的积累,如何在海量视频资源中快速检索出所需的视频显得至关重要。由于视频数据量大,且具有时间及空间结构,其表达、存储、传输、组织具有更大的难度,只有合理地组织视频数据,才能有效地浏览和检索。
现有的视频图像检索技术,大多是基于两幅图像的整个信息进行比较,也即在进行检索时,将用户输入的原始图像的颜色直方图与视频中每帧图像的颜色直方图整个进行比较,计算量大,另外,由于用户通常提供的是一幅图片中的一个部分,因此,在进行检索时,其他无关信息会影响计算量,进而影响判断图片相关性的准确性,影响检索结果。
综上所述,现有技术在检索视频时,基于两幅图像的整个信息进行比较,计算量大,检索效率低。
发明内容
本发明实施例提供一种检索视频的方法及装置,用以解决现有技术中检索视频时计算量大、检索效率低的问题,减小计算量,提高检索视频的效率。
本发明实施例提供一种检索视频的方法,该方法包括:接收用户输入的用于检索视频的原始图像;确定所述原始图像的元数据,分别计算所述原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,利用预设规则从所述多个交互信息量中确定目标交互信息量,并将所述目标交互信息量所对应元数据的帧图像所在的视频确定为所述原始图像所在的视频;其中,所述视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。
本发明实施例提供一种检索视频的装置,该装置包括:接收单元,用于接收用户输入的用于检索视频的原始图像;处理单元,用于确定所述原始图像的元数据,分别计算所述原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,利用预设规则从所述多个交互信息量中确定目标交互信息量,并将所述目标交互信息量所对应元数据的帧图像所在的视频确定为所述原始图像所在的视频;其中,所述视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。
本发明实施例提供的一种检索视频的方法及装置,接收用户输入的用于检索视频的原始图像,确定原始图像的元数据,分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,由于视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据,因此,在计算得到多个交互信息量之后,利用预设规则从多个交互信息量中确定目标交互信息量,将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频,与现有技术中基于两幅图像的整个信息进行比较,计算量大,且检索结果不准确相比,通过构造元数据,计算原始图像的元数据与每个视频的视频摘要中每帧图像的元数据的交互信息量,进而根据交互信息量确定原始图像所在的视频,减小了计算量,提高检索视频的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种检索视频的方法的示意流程图;
图2为本发明实施例提供的一种计算视频的视频元数据的示意流程图;
图3为本发明实施例提供的一种检索视频的方法的具体流程的示意流程图;
图4为本发明实施例提供的一种检索视频的装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先对本发明实施例中提到的一些名词进行解释:
本发明实施例中提到的灰度直方图(Histogram),相机上显示的直方图和位图图像处理软件(Photoshop,PS)使用的直方图都是灰度直方图,从图形上说,它是一个二维图,用坐标表示,横坐标表示图像中各个像素点的灰度级,0到255个级别,纵坐标为各个灰度级上像素点出现的次数或概率。灰度直方图具有一下特点:
(1)灰度直方图表征了图像的一维信息,只反映图像中像素不同灰度值出现的次数(或频数)而未反映像素所在位置;
(2)灰度直方图与图像之间的关系是多对一的映射关系,一幅图像唯一确定出与之对应的灰度直方图,但不同图像可能有相同的灰度直方图。
(3)子图灰度直方图之和为整图的灰度直方图。
本发明实施例中提到的概率密度函数可以由图像的灰度直方图中各个灰度值上像素点的统计次数除以图像总的像素个数得到。概率是指事件随机发生的机率,对于均匀分布函数,概率密度等于一段区间(事件的取值范围)的概率除以该段区间的长度,它的值是非负的,可以很大也可以很小。单纯的讲概率密度没有实际的意义,它必须有确定的有界区间为前提,可以把概率密度看成是纵坐标,区间看成是横坐标,概率密度对区间的积分就是面积,而这个面积就是事件在这个区间发生的概率,所有面积的和为1。所以单独分析一个点的概率密度是没有任何意义的,它必须要有区间作为参考和对比。
元数据是具有描述、解释、定位信息资源功能的结构化信息,即元数据是描述数据的数据,或者描述信息的信息。本发明实施例中利用与视频相关的元数据描述视频的主要内容,从视频中提取信息生成元数据,在进行检索时,使用元数据进行比较。
本发明实施例提供一种检索视频的方法,如图1所示,该方法包括:
步骤11,接收用户输入的用于检索视频的原始图像;
步骤13,确定原始图像的元数据,分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,利用预设规则从多个交互信息量中确定目标交互信息量,并将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频;其中,视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。
本发明实施例提供的方法中,接收用户输入的用于检索视频的原始图像,确定原始图像的元数据,分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,由于视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据,因此,在计算得到多个交互信息量之后,利用预设规则从多个交互信息量中确定目标交互信息量,将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频,与现有技术中基于两幅图像的整个信息进行比较,计算量大,且检索结果不准确相比,通过构造元数据,计算原始图像的元数据与每个视频的视频摘要中每帧图像的元数据的交互信息量,进而根据交互信息量确定原始图像所在的视频,减小了计算量,提高检索视频的效率。
具体实施时,在计算得到多个交互信息量之后,利用预设规则从多个交互信息量中确定目标交互信息量,并将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频,需要说明的是,目标交互信息量可以是一个,也可以是多个,根据预设规则的不同,确定出的目标交互信息量也有不同,例如:预设规则是取最大值时,能确定出一个目标交互信息量,但若预设规则是交互信息量的值大于预设阈值(根据经验值设定,例如:90),能确定出多个目标交互信息量。当然,本领域技术人员应当理解的是,预设规则还可以是其它规则,例如:将交互信息量按大小排序,取预设数量个交互信息量作为目标交互信息量。较为优选地,为了提高检索视频的准确率,预设规则为取最大值,也即在计算得到多个交互信息量之后,确定多个交互信息量中的最大交互信息量,并将最大交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频。
具体实施时,任一图像的元数据包括该图像的灰度直方图和概率密度函数,概率密度函数为该图像灰度直方图中各个灰度值上像素点的统计数量与该图像的总像素点数之比。
值得说明的是,在计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量时,可以基于整张图像的元数据计算交互信息量,但是由于用户通常提供的只是一张图像的一部分,因此,为了避免图像中其它无关信息的影响,可以将图像的元数据分为主题部分的元数据和背景部分的元数据,具体来说:
在一种可能的实施方式中,本发明实施例提供的方法中,任一图像的元数据包括:该图像主题部分的元数据以及该图像背景部分的元数据;计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,包括:计算原始图像主题部分的元数据与视频元数据库中每帧图像主题部分的元数据的交互信息量,和/或计算原始图像背景部分的元数据与视频元数据库中每帧图像背景部分的元数据的交互信息量。
本发明实施例提供的方法中,将原始图像和视频元数据库中每帧图像均划分成由主题部分和背景部分两部分组成,根据用户提供的原始图像,选取其中一个或者全部计算交互信息量,并根据交互信息量确定原始图像所在的视频,避免了检索视频时无关信息的影响,提高了检索视频的准确性,同时,由于选取其中的一个或全部计算交互信息量,进一步减小了计算量。
在一种可能的实施方式中,本发明实施例提供的方法中,当任一图像的元数据包括:图像主题部分的元数据以及图像背景部分的元数据时,在确定原始图像的元数据之前,该方法还包括:利用预设比例参数将原始图像分为主题部分和背景部分;确定原始图像的元数据,包括:确定原始图像的主题部分的元数据以及原始图像的背景部分的元数据。
具体实施时,将图像中的场景作为该帧图像的背景部分,将人物的面部作为该帧图像的主题部分,每个人物都有独特的特征,如人脸图像,目前人脸检测算法已日益成熟。面部识别可用现在较为成熟的贝叶斯可区分特征(Bayesian Discriminating Features,BDF)的方法来检测人脸,在该算法中,首先对输入图像进行一维Harr小波变换后投影到水平和垂直坐标上,得到输入图像的概率统计信息,再运用贝叶斯分类器进行人脸检测,通过该方法检测人物的面部特征,并利用预设比例参数对检测出的目标区域进行向外扩展,从而分割出图像中的主题部分,分割主题部分之后剩下的就是背景部分。其中,预设比例参数可以根据经验值设定,例如:预设比例参数取值为0.29。
具体实施时,在检索视频时,首先需要建立视频元数据库,视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据,在建立视频元数据库时,首先需要建立视频的视频摘要,视频摘要是对视频中的关键帧进行合理排序(例如:按时间顺序排列)得到的镜头级的视频摘要,建立视频摘要的方法可以采用现有技术中的方法,此处不再赘述。其中,关键帧代表镜头的主要内容。
对于任一视频,建立视频摘要之后,生成视频元数据的步骤,如图2所示,包括:
步骤21,读取视频摘要帧序列中的第i帧,其中,i初始化值为1,并且i≤N,N为视频摘要的总帧数,N=1000;
步骤23,利用预设比例参数将该帧划分为主题部分和背景部分,预设比例参数可以根据经验值设定,例如:预设比例参数取值为0.29;
步骤25,分别计算主题部分和背景部分的灰度直方图和概率密度函数;
步骤27,将得到的计算结果存入视频元数据库中。
为更方便地管理和使用视频元数据库中存储的每帧图像的元数据,对每个视频的元数据进行结构化处理。具体实施时,定义图像的灰度直方图和概率密度函数为该图像的元数据,保存元数据的格式描述为:视频元数据结构由文件序列号、视频文件名、背景数据结构和主题数据结构4个部分组成,其中,背景数据结构由背景名和背景元数据构成,主题数据结构由主题名和主题元数据构成,背景元数据和主题元数据由视频摘要中每帧图像的灰度直方图和概率密度函数组成。
将每个视频的元数据结构化处理后,利用元数据来计算用户输入的原始图像与视频元数据库中每帧图像的背景部分和/或主题部分的交互信息量,通过交互信息量判断二者的相似性,进而利用预设规则从计算得到的多个交互信息量中确定目标交互信息量,并将目标交互信息量所对应元数据的帧图像所在的视频,确定为用户输入的原始图像所在的视频,具体实施时,原始图像的元数据与视频元数据库中任一帧图像的元数据的交互信息量,等于原始图像的元数据与视频元数据库中该帧图像的元数据在红R、绿G、蓝B分量上的交互信息量之和,其中,原始图像的元数据与视频元数据库中该帧图像的元数据在任一分量上的交互信息量通过如下公式计算得到:
I = - Σ a = 0 Σ b = 0 P A B ( a , b ) × lg P A B ( a , b ) P A ( a ) × P B ( b ) ;
其中,I表示交互信息量,PA(a)表示原始图像在该分量上的概率密度函数,PB(b)表示视频元数据库中该帧图像在该分量上的概率密度函数,PAB(a,b)表示原始图像和视频元数据库中该帧图像在该分量上的联合概率密度函数。以R分量为例,PA(a)表示原始图像在R分量上的概率密度函数,PB(b)表示视频元数据库中该帧图像在R分量上的概率密度函数,PAB(a,b)表示原始图像和视频元数据库中该帧图像在R分量上的联合概率密度函数。
作为较为具体的实施时,本发明实施例提供的检索视频的方法,以计算原始图像的元数据与视频元数据库中第i帧图像的元数据的交互信息量为例,基于元数据检索视频的步骤,如图3所示,包括:
步骤31,接收用户输入用于检索视频的原始图像;
步骤32,计算原始图像的元数据,即计算原始图像的灰度直方图和概率密度函数;
步骤33,计算原始图像与视频元数据库中第i帧图像的联合概率密度函数,具体来说,根据原始图像的灰度直方图以及第i帧图像的灰度直方图计算联合概率密度;
步骤34,计算原始图像的元数据与视频元数据库中第i帧图像的元数据在R、G、B分量上的交互信息量;
步骤35,计算原始图像的元数据与视频元数据库中第i帧图像的元数据的交互信息量,具体来说,原始图像的元数据与视频元数据库中第i帧图像的元数据的交互信息量,等于原始图像的元数据与视频元数据库中第i帧图像的元数据在R、G、B分量上的交互信息量之和;
步骤36,通过计算得到的交互信息量,判断原始图像与第i帧图像的相关性,判断是否检索完成。具体来说,当计算得到多个交互信息量时,利用预设规则从多个交互信息量中确定目标交互信息量,例如:预设规则为取最大值,则取多个交互信息量中最大交互信息量所对应元数据的帧图像作为检索到的相似性最大的图像,将多个交互信息量中最大交互信息量所对应元数据的帧图像所在的视频确定为用户输入的原始图像所在的视频。
本发明实施例提供一种检索视频的装置,如图4所示,该装置包括:接收单元41,用于接收用户输入的用于检索视频的原始图像;处理单元43,用于确定原始图像的元数据,分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,利用预设规则从多个交互信息量中确定目标交互信息量,并将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频;其中,视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。
本发明实施例提供的装置中,接收用户输入的用于检索视频的原始图像,确定原始图像的元数据,分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,由于视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据,因此,在计算得到多个交互信息量之后,利用预设规则从多个交互信息量中确定目标交互信息量,将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频,与现有技术中基于两幅图像的整个信息进行比较,计算量大,且检索结果不准确相比,通过构造元数据,计算原始图像的元数据与每个视频的视频摘要中每帧图像的元数据的交互信息量,进而根据交互信息量确定原始图像所在的视频,减小了计算量,提高检索视频的效率。
在一种可能的实施方式中,本发明实施例提供的装置中,任一图像的元数据包括:该图像主题部分的元数据以及该图像背景部分的元数据;处理单元43计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,具体用于:计算原始图像主题部分的元数据与视频元数据库中每帧图像主题部分的元数据的交互信息量,和/或计算原始图像背景部分的元数据与视频元数据库中每帧图像背景部分的元数据的交互信息量。
在一种可能的实施方式中,本发明实施例提供的装置中,当任一图像的元数据包括:图像主题部分的元数据以及图像背景部分的元数据时,处理单元43在确定原始图像的元数据之前,还用于:利用预设比例参数将原始图像分为主题部分和背景部分;处理单元43确定原始图像的元数据,具体应用:确定原始图像的主题部分的元数据以及原始图像的背景部分的元数据。
在一种可能的实施方式中,本发明实施例提供的装置中,原始图像的元数据与视频元数据库中任一帧图像的元数据的交互信息量,等于原始图像的元数据与视频元数据库中该帧图像的元数据在红R、绿G、蓝B分量上的交互信息量之和,其中,处理单元43通过如下公式计算原始图像的元数据与视频元数据库中该帧图像的元数据在任一分量上的交互信息量:
I = - Σ a = 0 Σ b = 0 P A B ( a , b ) × lg P A B ( a , b ) P A ( a ) × P B ( b ) ;
其中,I表示交互信息量,PA(a)表示原始图像在该分量上的概率密度函数,PB(b)表示视频元数据库中该帧图像在该分量上的概率密度函数,PAB(a,b)表示原始图像和视频元数据库中该帧图像在该分量上的联合概率密度函数。
在一种可能的实施方式中,本发明实施例提供的装置中,任一图像的元数据包括该图像的灰度直方图和概率密度函数,概率密度函数为该图像灰度直方图中各个灰度值上像素点的统计数量与该图像的总像素点数之比。
本发明实施例提供的一种检索视频的装置,可以集成在视频软件中,用于根据用户输入的原始图像检索视频,其中,接收单元41可以采用接收机或信号接收器,处理单元43可以采用CPU处理器等。
本发明实施例提供的一种检索视频的方法及装置,接收用户输入的用于检索视频的原始图像,确定原始图像的元数据,分别计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,由于视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据,因此,在计算得到多个交互信息量之后,利用预设规则从多个交互信息量中确定目标交互信息量,将目标交互信息量所对应元数据的帧图像所在的视频确定为原始图像所在的视频,通过构造元数据,计算原始图像的元数据与每个视频的视频摘要中每帧图像的元数据的交互信息量,进而根据交互信息量确定原始图像所在的视频,减小了计算量,提高检索视频的效率。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种检索视频的方法,其特征在于,该方法包括:
接收用户输入的用于检索视频的原始图像;
确定所述原始图像的元数据,分别计算所述原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,利用预设规则从所述多个交互信息量中确定目标交互信息量,并将所述目标交互信息量所对应元数据的帧图像所在的视频确定为所述原始图像所在的视频;
其中,所述视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。
2.根据权利要求1所述的方法,其特征在于,任一图像的元数据包括:该图像主题部分的元数据以及该图像背景部分的元数据;
所述计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,包括:
计算原始图像主题部分的元数据与视频元数据库中每帧图像主题部分的元数据的交互信息量,和/或
计算原始图像背景部分的元数据与视频元数据库中每帧图像背景部分的元数据的交互信息量。
3.根据权利要求2所述的方法,其特征在于,当任一图像的元数据包括:图像主题部分的元数据以及图像背景部分的元数据时,在确定所述原始图像的元数据之前,该方法还包括:
利用预设比例参数将所述原始图像分为主题部分和背景部分;
所述确定原始图像的元数据,包括:确定原始图像的主题部分的元数据以及所述原始图像的背景部分的元数据。
4.根据权利要求1所述的方法,其特征在于,原始图像的元数据与视频元数据库中任一帧图像的元数据的交互信息量,等于原始图像的元数据与视频元数据库中该帧图像的元数据在红R、绿G、蓝B分量上的交互信息量之和,其中,原始图像的元数据与视频元数据库中该帧图像的元数据在任一分量上的交互信息量通过如下公式计算得到:
I = - Σ a = 0 Σ b = 0 P A B ( a , b ) × lg P A B ( a , b ) P A ( a ) × P B ( b ) ;
其中,I表示交互信息量,PA(a)表示原始图像在该分量上的概率密度函数,PB(b)表示视频元数据库中该帧图像在该分量上的概率密度函数,PAB(a,b)表示原始图像和视频元数据库中该帧图像在该分量上的联合概率密度函数。
5.根据权利要求1-4中任一项所述的方法,其特征在于,任一图像的元数据包括该图像的灰度直方图和概率密度函数,所述概率密度函数为该图像灰度直方图中各个灰度值上像素点的统计数量与该图像的总像素点数之比。
6.一种检索视频的装置,其特征在于,该装置包括:
接收单元,用于接收用户输入的用于检索视频的原始图像;
处理单元,用于确定所述原始图像的元数据,分别计算所述原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,得到多个交互信息量,利用预设规则从所述多个交互信息量中确定目标交互信息量,并将所述目标交互信息量所对应元数据的帧图像所在的视频确定为所述原始图像所在的视频;
其中,所述视频元数据库中存储多个视频的元数据,每个视频的元数据包括该视频的视频摘要中多帧图像的元数据。
7.根据权利要求6所述的装置,其特征在于,任一图像的元数据包括:该图像主题部分的元数据以及该图像背景部分的元数据;
所述处理单元计算原始图像的元数据与视频元数据库中每帧图像的元数据的交互信息量,具体用于:
计算原始图像主题部分的元数据与视频元数据库中每帧图像主题部分的元数据的交互信息量,和/或
计算原始图像背景部分的元数据与视频元数据库中每帧图像背景部分的元数据的交互信息量。
8.根据权利要求7所述的装置,其特征在于,当任一图像的元数据包括:图像主题部分的元数据以及图像背景部分的元数据时,所述处理单元在确定所述原始图像的元数据之前,还用于:
利用预设比例参数将所述原始图像分为主题部分和背景部分;
所述处理单元确定原始图像的元数据,具体应用:确定原始图像的主题部分的元数据以及所述原始图像的背景部分的元数据。
9.根据权利要求6所述的装置,其特征在于,原始图像的元数据与视频元数据库中任一帧图像的元数据的交互信息量,等于原始图像的元数据与视频元数据库中该帧图像的元数据在红R、绿G、蓝B分量上的交互信息量之和,其中,所述处理单元通过如下公式计算原始图像的元数据与视频元数据库中该帧图像的元数据在任一分量上的交互信息量:
I = - Σ a = 0 Σ b = 0 P A B ( a , b ) × lg P A B ( a , b ) P A ( a ) × P B ( b ) ;
其中,I表示交互信息量,PA(a)表示原始图像在该分量上的概率密度函数,PB(b)表示视频元数据库中该帧图像在该分量上的概率密度函数,PAB(a,b)表示原始图像和视频元数据库中该帧图像在该分量上的联合概率密度函数。
10.根据权利要求6-9中任一项所述的装置,其特征在于,任一图像的元数据包括该图像的灰度直方图和概率密度函数,所述概率密度函数为该图像灰度直方图中各个灰度值上像素点的统计数量与该图像的总像素点数之比。
CN201610189270.0A 2016-03-29 2016-03-29 一种检索视频的方法及装置 Pending CN105843930A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610189270.0A CN105843930A (zh) 2016-03-29 2016-03-29 一种检索视频的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610189270.0A CN105843930A (zh) 2016-03-29 2016-03-29 一种检索视频的方法及装置

Publications (1)

Publication Number Publication Date
CN105843930A true CN105843930A (zh) 2016-08-10

Family

ID=56584516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610189270.0A Pending CN105843930A (zh) 2016-03-29 2016-03-29 一种检索视频的方法及装置

Country Status (1)

Country Link
CN (1) CN105843930A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018107601A1 (zh) * 2016-12-13 2018-06-21 深圳创维-Rgb电子有限公司 动态演示使用说明的方法、装置及系统
CN111651635A (zh) * 2020-05-28 2020-09-11 拾音智能科技有限公司 一种基于自然语言描述的视频检索方法
CN112486923A (zh) * 2020-12-11 2021-03-12 北京梧桐车联科技有限责任公司 文件更新方法、装置及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101369281A (zh) * 2008-10-09 2009-02-18 湖北科创高新网络视频股份有限公司 基于视频摘要元数据的检索方法
CN103198110A (zh) * 2013-03-28 2013-07-10 广州中国科学院软件应用技术研究所 一种视频数据快速特征检索的方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101369281A (zh) * 2008-10-09 2009-02-18 湖北科创高新网络视频股份有限公司 基于视频摘要元数据的检索方法
CN103198110A (zh) * 2013-03-28 2013-07-10 广州中国科学院软件应用技术研究所 一种视频数据快速特征检索的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
魏小莉 等: "基于视频元数据信息的快速图像检索", 《计算机工程》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018107601A1 (zh) * 2016-12-13 2018-06-21 深圳创维-Rgb电子有限公司 动态演示使用说明的方法、装置及系统
CN111651635A (zh) * 2020-05-28 2020-09-11 拾音智能科技有限公司 一种基于自然语言描述的视频检索方法
CN112486923A (zh) * 2020-12-11 2021-03-12 北京梧桐车联科技有限责任公司 文件更新方法、装置及系统

Similar Documents

Publication Publication Date Title
US9940655B2 (en) Image processing
CN104424634B (zh) 对象跟踪方法和装置
US11250250B2 (en) Pedestrian retrieval method and apparatus
CN102509118B (zh) 一种监控视频检索方法
US8340412B2 (en) Image processing
CN106228554A (zh) 基于多属性约简的模糊粗糙集煤粉尘图像分割方法
CN103020265A (zh) 图像检索的方法和系统
CN112287884B (zh) 一种考试异常行为检测方法、装置及计算机可读存储介质
JP2011018238A (ja) 画像検索システム及び画像検索方法
CN111444362B (zh) 恶意图片拦截方法、装置、设备和存储介质
CN105843930A (zh) 一种检索视频的方法及装置
CN104410867A (zh) 改进的视频镜头检测方法
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
US20150058579A1 (en) Systems and methods for memory utilization for object detection
CN106682669A (zh) 一种图像处理方法及移动终端
CN109741351A (zh) 一种基于深度学习的类别敏感型边缘检测方法
CN112989098A (zh) 一种图像类侵权实体自动化检索方法、装置和电子设备
CN110110594B (zh) 一种产品分布识别方法和装置
CN114648683B (zh) 基于不确定性分析的神经网络性能提升方法和设备
CN114418988B (zh) 一种基于注意力机制的拼接图像篡改检测方法及系统
CN104616302A (zh) 一种目标实时识别方法
CN115905846A (zh) 一种样本选取方法及装置
GB2552969A (en) Image processing system
CN109993178B (zh) 一种特征数据生成和特征匹配方法及装置
CN111209428A (zh) 图像检索方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160810

WD01 Invention patent application deemed withdrawn after publication