CN108170791A - 视频图像检索方法 - Google Patents

视频图像检索方法 Download PDF

Info

Publication number
CN108170791A
CN108170791A CN201711446363.8A CN201711446363A CN108170791A CN 108170791 A CN108170791 A CN 108170791A CN 201711446363 A CN201711446363 A CN 201711446363A CN 108170791 A CN108170791 A CN 108170791A
Authority
CN
China
Prior art keywords
image
video image
vision
region
retrieved
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711446363.8A
Other languages
English (en)
Inventor
孙兴波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University of Science and Engineering
Original Assignee
Sichuan University of Science and Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University of Science and Engineering filed Critical Sichuan University of Science and Engineering
Priority to CN201711446363.8A priority Critical patent/CN108170791A/zh
Publication of CN108170791A publication Critical patent/CN108170791A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种视频图像检索方法,为了提高视频图像检索速度而设计。本发明视频图像检索方法,包括计算待检索图像的视觉突出显著图,找到显著值最大的区域,确定包含该区域的最小矩形的长和宽,记为M和N。逐一计算视频关键帧图像的视觉突出显著图,找到每帧视频关键帧图像的显著值最大的区域,确定包含该区域的最小矩形的长和宽,记为M’和N’,拉伸到和待检索图像显著值最大区域相同的大小M和N;将两个提取区域进行相关运算,若相关系数矩阵值50%以上超过阈值T,则检索成功,否则视频图像与待检索图像无关。本发明按照视觉突出区域进行视频图像检索,提高了视频图像的检索速度。

Description

视频图像检索方法
技术领域
本发明涉及图像处理领域,具体涉及一种视频图像检索方法。
背景技术
视频图像背景和前景复杂,变化快,因此其分类或者检索是非常困难的。采用全局的颜色、纹理或者形状等特征进行视频图像检索,往往效果欠佳,有很多无意义的输出结果。采用局部区域特征进行视频图像检索,通常区域的划分是一个难题,而划分结果直接影响检索结果。
人类能对外部视觉激励快速地划分优先顺序,并且聚焦在场景的某一感兴趣目标,即有其对应的视觉突出区域。在这类视觉注意中,场景中具有突出特征的目标吸引注意,指的是与其周围易于区别的、特殊的、容易被注意到的特征区域,也就是说在一个场景中视觉会注意到注意焦点处。当人们观看视频图像序列时,不仅对视频中的有趣事件感兴趣,同时会被其中静态图像的感兴趣目标吸引。这些人们关注的目标区域往往和视频中的事件是一一对应的。因此,视频图像按照视觉突出区域进行检索是非常合理的。
发明内容
为解决上述技术问题,本发明的目的是提供一种在保证图像检索结果能够被接受的前提下,最大限度地降低重复或者无意义的检索结果,提高视频图像检索速度。
本发明视频图像检索方法,包括:
计算待检索图像的视觉突出显著图,找到显著值最大的区域确定包含该区域的最小矩形的长和宽,记为M和N;
逐一计算视频关键帧图像视觉突出显著图,找到每帧视频关键帧图像的显著值最大的区域,确定包含该区域的最小矩形的长和宽,记为M’和N’,拉伸到和待检索图像显著值最大区域相同的大小M和N;
将两个提取区域进行相关运算,若相关系数矩阵值50%以上超过阈值T,则检索成功,否则视频图像与待检索图像无关,相关系数矩阵计算如下:
其中,s是待检索图像,是平均值,g是待检索图像,是平均值,M、N以及M’、N’代表图像尺寸。
进一步地,所述的视觉突出显著图的具体计算方法包括:
将图像转换为HSI格式,分解为色调、色饱和度、亮度三个通道,对每个通道进行多个不同尺度、不同方向局部熵特征的计算,获得一系列不同尺度不同方向的H、S、I三个分量熵特征表示,构成对应特征向量;
将图像中逐个像素特征向量与图像所有剩余像素征向量求取欧拉距离,并求和;
其中Sa(Ik)表示图像中Ik像素的视觉突出显著值,Vk表示图像中Ik像素的视觉突出显著性特征矢量,Vi表示图像中Ii像素的视觉突出显著性特征矢量,||||表示求欧拉距离。
进一步地,在三个尺度,每个尺度两个方向上进行局部熵计算,每个像素形成18个反映不同尺寸不同方向特定局部区域H、S、I三个分量的局部熵值,
图像局部熵定义为:
其中f(i,j)是图像H、S、I三个分量对应的函数值,上述公式通过泰勒级数展开也可以约等于:
其中,E代表局部熵;Pij代表f(i,j)灰度概率。
分别对每个像素形成18个反映不同尺寸不同方向特定局部区域H、S、I三个分量的局部熵值,形成对应的特征向量V,
V=[EH1 … EH18 ES1 … ES18 EI1 … EI18]
其中,EHk表示色调H分量的局部熵,ESk表示色饱和度S分量的局部熵,EIk表示亮度I分量的局部熵。
借由上述方案,本发明视频图像检索方法至少具有以下优点:
将视觉突出区域引入视觉图像检索中,直接对视频图像提取显著区域,经拉伸后与待检索图像显著区域进行比较,因而与显著区域的出现的位置,以及区域目标大小都是没有关系的,因此,最大限度地降低重复或者无意义的检索结果,提高视频图像检索速度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
图1是图像像素H、S、I三个分量计算局部熵的模板,其中,包含三个尺度,每个尺度上包含两个方向,每个像素形成18个反映不同尺寸不同方向特定局部区域H、S、I三个分量的局部熵值。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明一较佳实施例所述的视频图像检索方法,包括:
首先计算待检索图像的视觉突出显著图。找到显著值最大的区域,确定包含该区域的最小矩形的长和宽,记着M和N。
逐一计算视频关键帧图像的视觉突出显著图。找到每帧显著值最大的区域,确定包含该区域的最小矩形的长和宽,记着M,和N,。拉伸到和待检索图像显著值最大区域相同的大小M和N。
将两个提取区域进行相关运算,如果相关系数矩阵值50%以上超过阈值T,则检索成功,否则视频图像与待检索图像无关。相关系数矩阵计算如下:
其中,s是待检索图像,是平均值,g是待检索图像,是平均值,M和N是图像尺寸。
将待检索图像和视频图像转换为HSI格式,得到H、S、I三个分量,分别进行局部熵特征提取。
设计三个尺度,每个尺度两个方向的局部熵计算模板,以便采用这些不同尺寸不同方向模板分别对亮度图像、色调图像和色饱和图像进行局部熵提取。
应用上述模板逐个像素计算局部熵,每个像素形成18个反映不同尺寸不同方向特定局部区域H、S、I三个分量的局部熵值。
图像局部熵定义为:
其中f(i,j)是图像H、S、I三个分量对应的函数值,上述公式通过泰勒级数展开也可以约等于:
其中,E代表局部熵;Pij代表f(i,j)灰度概率。
分别对每个像素形成18个反映不同尺寸不同方向特定局部区域H、S、I三个分量的局部熵值,形成对应的特征向量,
V=[EH1 … EH18 ES1 … ES18 EI1 … EI18]
其中,EHk表示色调H分量的局部熵,ESk表示色饱和度S分量的局部熵,EIk表示亮度I分量的局部熵。
计算视觉突出显著图。将图像中逐个像素的特征向量与图像所有剩余像素特征向量求取欧拉距离,并求和。
其中Sa(Ik)表示图像中Ik像素的视觉突出显著值,Vk表示图像中Ik像素的视觉突出显著性特征矢量,Vi表示图像中Ii像素的视觉突出显著性特征矢量,||||表示求欧拉距离。
以上所述仅是本发明的优选实施方式,并不用于限制本发明,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (3)

1.一种视频图像检索方法,其特征在于,包括:
计算待检索图像的视觉突出显著图,找到显著值最大的区域确定包含该区域的最小矩形的长和宽,记为M和N;
逐一计算视频关键帧图像视觉突出显著图,找到每帧视频关键帧图像的显著值最大的区域,确定包含该区域的最小矩形的长和宽,记为M’和N’,拉伸到和待检索图像显著值最大区域相同的大小M和N;
将两个提取区域进行相关运算,若相关系数矩阵值50%以上超过阈值T,则检索成功,否则视频图像与待检索图像无关,相关系数矩阵计算如下:
其中,s是待检索图像,是平均值,g是待检索图像,是平均值,M、N以及M’、N’代表图像尺寸。
2.根据权利要求1所述的视频图像检索方法,其特征在于,所述的视觉突出显著图的具体计算方法包括:
将图像转换为HSI格式,分解为色调、色饱和度、亮度三个通道,对每个通道进行多个不同尺度、不同方向局部熵特征的计算,获得一系列不同尺度不同方向的H、S、I三个分量熵特征表示,构成对应特征向量;
将图像中逐个像素特征向量与图像所有剩余像素征向量求取欧拉距离,并求和;
其中Sa(Ik)表示图像中Ik像素的视觉突出显著值,Vk表示图像中Ik像素的视觉突出显著性特征矢量,Vi表示图像中Ii像素的视觉突出显著性特征矢量,||||表示求欧拉距离。
3.根据权利要求1所述的视频图像检索方法,其特征在于,在三个尺度,每个尺度两个方向上进行局部熵计算,每个像素形成18个反映不同尺寸不同方向特定局部区域H、S、I三个分量的局部熵值,
图像局部熵定义为:
其中f(i,j)是图像H、S、I三个分量对应的函数值,上述公式通过泰勒级数展开也可以约等于:
其中,E代表局部熵;Pij代表f(i,j)灰度概率。
分别对每个像素形成18个反映不同尺寸不同方向特定局部区域H、S、I三个分量的局部熵值,形成对应的特征向量V,
V=[EH1…EH18ES1…ES18EI1…EI18]
其中,EHk表示色调H分量的局部熵,ESk表示色饱和度S分量的局部熵,EIk表示亮度I分量的局部熵。
CN201711446363.8A 2017-12-27 2017-12-27 视频图像检索方法 Pending CN108170791A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711446363.8A CN108170791A (zh) 2017-12-27 2017-12-27 视频图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711446363.8A CN108170791A (zh) 2017-12-27 2017-12-27 视频图像检索方法

Publications (1)

Publication Number Publication Date
CN108170791A true CN108170791A (zh) 2018-06-15

Family

ID=62518568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711446363.8A Pending CN108170791A (zh) 2017-12-27 2017-12-27 视频图像检索方法

Country Status (1)

Country Link
CN (1) CN108170791A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399847A (zh) * 2019-07-30 2019-11-01 北京字节跳动网络技术有限公司 关键帧提取方法、装置及电子设备
CN112149568A (zh) * 2020-09-23 2020-12-29 创新奇智(合肥)科技有限公司 短视频定位方法、装置、电子设备及计算机可读存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030009674A (ko) * 2001-07-23 2003-02-05 주식회사 오픈비주얼 내용 기반 영상 검색 장치 및 방법
CN1514644A (zh) * 2003-08-04 2004-07-21 北京大学计算机科学技术研究所 一种通过视频片段进行视频检索的新方法
CN101211356A (zh) * 2006-12-30 2008-07-02 中国科学院计算技术研究所 一种基于显著区域的图像查询方法
CN101789005A (zh) * 2010-01-22 2010-07-28 深圳创维数字技术股份有限公司 一种基于感兴趣区域的图像检索方法
CN102495998A (zh) * 2011-11-10 2012-06-13 西安电子科技大学 基于视觉选择性注意计算模型的静态目标检测方法
CN102779184A (zh) * 2012-06-29 2012-11-14 中国科学院自动化研究所 一种近似重复视频片段自动定位方法
CN103309982A (zh) * 2013-06-17 2013-09-18 武汉大学 一种基于视觉显著点特征的遥感影像检索方法
CN103514595A (zh) * 2012-06-28 2014-01-15 中国科学院计算技术研究所 图像显著区域检测方法
CN103747259A (zh) * 2013-12-27 2014-04-23 华为技术有限公司 视频处理方法及装置
CN103793925A (zh) * 2014-02-24 2014-05-14 北京工业大学 融合时空特征的视频图像视觉显著程度检测方法
CN103870597A (zh) * 2014-04-01 2014-06-18 北京奇虎科技有限公司 一种无水印图片的搜索方法及装置
CN105138672A (zh) * 2015-09-07 2015-12-09 北京工业大学 一种多特征融合的图像检索方法
CN105427242A (zh) * 2015-10-28 2016-03-23 南京工业大学 基于内容感知的交互式网格约束变形图像自适应缩放方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030009674A (ko) * 2001-07-23 2003-02-05 주식회사 오픈비주얼 내용 기반 영상 검색 장치 및 방법
CN1514644A (zh) * 2003-08-04 2004-07-21 北京大学计算机科学技术研究所 一种通过视频片段进行视频检索的新方法
CN101211356A (zh) * 2006-12-30 2008-07-02 中国科学院计算技术研究所 一种基于显著区域的图像查询方法
CN101789005A (zh) * 2010-01-22 2010-07-28 深圳创维数字技术股份有限公司 一种基于感兴趣区域的图像检索方法
CN102495998A (zh) * 2011-11-10 2012-06-13 西安电子科技大学 基于视觉选择性注意计算模型的静态目标检测方法
CN103514595A (zh) * 2012-06-28 2014-01-15 中国科学院计算技术研究所 图像显著区域检测方法
CN102779184A (zh) * 2012-06-29 2012-11-14 中国科学院自动化研究所 一种近似重复视频片段自动定位方法
CN103309982A (zh) * 2013-06-17 2013-09-18 武汉大学 一种基于视觉显著点特征的遥感影像检索方法
CN103747259A (zh) * 2013-12-27 2014-04-23 华为技术有限公司 视频处理方法及装置
CN103793925A (zh) * 2014-02-24 2014-05-14 北京工业大学 融合时空特征的视频图像视觉显著程度检测方法
CN103870597A (zh) * 2014-04-01 2014-06-18 北京奇虎科技有限公司 一种无水印图片的搜索方法及装置
CN105138672A (zh) * 2015-09-07 2015-12-09 北京工业大学 一种多特征融合的图像检索方法
CN105427242A (zh) * 2015-10-28 2016-03-23 南京工业大学 基于内容感知的交互式网格约束变形图像自适应缩放方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
GUO LI-HUA 等: "基于局部直方图差异的视觉显著区域提取算法", 《立体图象技术学术研讨会 中国图象图形学学会》 *
孙兴波 等: "基于塔形分解的局部熵差图像配准", 《光电工程》 *
李俊山 等: "局部熵差图象匹配并行算法", 《小型微型计算机系统》 *
钟光辉 等: "基于视觉兴趣区域的相似性分析与图像推荐", 《南京大学》 *
钱丁丁: "图像显著性区域检测算法研究", 《山东大学》 *
黄岚: "基于关键人物的分布式视频检索系统设计与实现", 《电脑编程技巧与维护》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399847A (zh) * 2019-07-30 2019-11-01 北京字节跳动网络技术有限公司 关键帧提取方法、装置及电子设备
CN110399847B (zh) * 2019-07-30 2021-11-09 北京字节跳动网络技术有限公司 关键帧提取方法、装置及电子设备
CN112149568A (zh) * 2020-09-23 2020-12-29 创新奇智(合肥)科技有限公司 短视频定位方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
Brand et al. A comparative assessment of three approaches to pixel-level human skin-detection
Du et al. Saliency-guided color-to-gray conversion using region-based optimization
Berezhnoy et al. Computer analysis of van Gogh’s complementary colours
CN104835114A (zh) 一种图像自适应显示方法
CN109903257A (zh) 一种基于图像语义分割的虚拟头发染色方法
CN102521616B (zh) 基于稀疏表示的行人检测方法
CN108848422A (zh) 一种基于目标检测的视频摘要生成方法
CN108170791A (zh) 视频图像检索方法
CN103218600B (zh) 一种实时人脸检测算法
Li et al. Estimating visual saliency through single image optimization
Sidorov Artificial color constancy via GoogleNet with angular loss function
CN112633392A (zh) 一种太赫兹人体安检图像目标检测模型训练数据增广方法
CN108122225A (zh) 基于自适应特征点的数字图像篡改检测方法
CN110751606A (zh) 一种基于神经网络算法的泡沫图像处理方法及系统
Zhang et al. An improved watershed algorithm for color image segmentation
CN107358244B (zh) 一种快速局部不变特征提取与描述方法
CN105512663A (zh) 一种基于全局与局部对比度的显著性检测方法
CN102402687A (zh) 基于深度信息的刚体部件方向检测方法和装置
Xu et al. Edge detection of color image using mathematical morphology in HSV color space
Ueng et al. An improved skin color model
CN104915677B (zh) 一种三维视频目标跟踪方法
Jiang et al. Single image haze removal on complex imaging background
CN108304863A (zh) 一种利用学习不变特征变换的兵马俑图像匹配方法
Movia et al. Land use classification from VHR aerial images using invariant colour components and texture
Ganesh et al. Extraction of Text from Images of Big Data

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180615

RJ01 Rejection of invention patent application after publication