CN103279578B - 一种基于上下文空间的视频检索方法 - Google Patents

一种基于上下文空间的视频检索方法 Download PDF

Info

Publication number
CN103279578B
CN103279578B CN201310252617.8A CN201310252617A CN103279578B CN 103279578 B CN103279578 B CN 103279578B CN 201310252617 A CN201310252617 A CN 201310252617A CN 103279578 B CN103279578 B CN 103279578B
Authority
CN
China
Prior art keywords
concept
vector
rightarrow
space
context space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310252617.8A
Other languages
English (en)
Other versions
CN103279578A (zh
Inventor
魏骁勇
杨震群
徐浩然
孙洋
黄劲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201310252617.8A priority Critical patent/CN103279578B/zh
Publication of CN103279578A publication Critical patent/CN103279578A/zh
Application granted granted Critical
Publication of CN103279578B publication Critical patent/CN103279578B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提出一个基于上下文空间的视频检索方法。该系统通过对基础的概念空间对象进行分析,构建一个概念相似度矩阵,然后对其进行谱分解,得到一组基本的概念基,最后将已知的概念映射至该组概念基张成的空间上,并在此空间上度量概念对象之间的相似度。该发明构建概念空间的方式避免了传统本体概念集下度量测度所带来的局部性、不一致性等问题,使得映射至该空间上的概念对象之间的度量测度统一并且全局一致,为视频检索问题提供了一种有效的解决方案,使得基本抽象概念之间的关系更加紧致,有效地提高了视频检索的精度。

Description

一种基于上下文空间的视频检索方法
技术领域
本发明涉及多媒体语义挖掘领域,提出了一种基于上下文空间的视频检索方法。
背景技术
语义概念挖掘正逐渐成为提高视频检索精度的主流研究方向,但是传统语义概念挖掘大多针对单一概念进行探测,而忽略了大多概念对象在视频中共发这一客观事实。简而言之,概念之间并不是彼此独立、毫无关联的,它们之间在视频单元中往往是紧密联系的。正是概念对象相互关联这一客观事实提供了进一步挖掘上下文信息的线索,以增强视频检索的精度。特别是在一些已知概念对象存在的前提下,可以在上下文信息(概念相关性)的指引下挖掘一些本身客观存在但是在传统语义概念挖掘中并未发现的概念知识。比如,“飞机”、“天空”、“云彩”等概念对象经常在视频单元中共同出现,因此当系统检测出该视频单元中包含如“天空”、“云彩”等概念提供的上下文信息会有效提升系统检索“飞机”这一概念对象的效果。
发明内容
本发明的目的是克服现有视频语义挖掘技术的不足,提出了一种构建语义概念上下文空间的方法,使得映射至此空间上的语义概念之间的测度统一并且全局一致,可以在一定程度上提高现有视频检索的精度。
本发明为了实现上述目的采用以下技术方案:
一种基于上下文空间的视频检索方法,其特征在于:
给定一组基础的概念词汇集A=[C1,C2,C3…Cn];
构造上下文空间的过程:
步骤A1基础的概念词汇集A进行Agglomerative层次聚类形成紧致概念集A‘,去除了原始概念集的冗余,增强了后期矩阵分解的计算稳定性。是对原始概念集的一个提炼处理。
步骤A2采用皮尔森积差系数作为A‘概念集中任意一组概念对之间相关性的度量标准,构造相关性矩阵R,
步骤A3、对构造好的矩阵R,将其表达为:
R=CTC(2),
对其进行谱分解得到:
其中,∧为对角矩阵,其值由矩阵R分解后所有特征值组成,V为对应特征值的特征向量所组成的矩阵,
由等式(2)和(3)得到C的向量表示:
步骤A4、通过计算得到的一组基向量,将其在向量空间中构造张成一个正交的上下文空间;
概念表达及检索比对:
步骤B1、将由基本概念集抽象而成的本体概念集之外的概念映射至构建好的上下文空间中得到向量对Ci,Cj,映射方法如下,对于Cu¢V将其向量化为:
C T C u → = R u →
C u → = ( C T ) - 1 R u → ,
其中由概念Cu与上下文空间中的概念基通过皮尔森积差系数构成,利用Moore-Penrose违逆法计算(CT)-1
将映射得到的向量对Ci,Cj,用向量空间余弦相似度度量如:
S e m a n t i c ( C i , C j ) = C i → . C j → | C i → | | C j → | ;
得到的概念对之间的差异可以为后期的检索比对提供一个全局一致的响应值;
步骤B2、对于查询请求的视频样本抽象出的概念集按照1中的方式映射至上下文空间并在上下文空间内进行概念的识别、匹配,将各个概念对其的响应值构造成一组查询向量组其中qi(1≤i≤m)为上下文空间中基概念对单个查询概念的响应值,将查询组作为原始查询概念的加权系数与样本库中的视频片段进行比对得出最终的查询结果。
上述方案中,步骤A2中所述的皮尔森积差系数描述如下:
P M ( C i , C j ) Σ k = 1 | τ | ( O i k - μ i ) ( O j k - μ i ) ( | τ | - 1 ) σ i σ j - - - ( 1 )
其中,如果在视频序列中第k个视频帧检测出了概念Ci,那么令Oik为1,否则为0,μi和σi分别表示样本的均值和方差,|τ|表示训练样本的个数。
本发明具有以下有益效果:
一、相对于传统基于内容的视频检索技术,该发明以语义概念检索为基础,有效地填补了现实世界与低层特征空间的语义鸿沟。
二、相对于传统的语义空间的构建方法,该发明更多注重的是语义概念之间的相关性,语义概念并不是彼此独立存在的,它们之间的存在一定的共发性和相关性。简而言之,概念的推理并不是彼此隔离的个体行为,而是彼此相互关联的客观事实。因此,该发明充分挖掘了语义概念之间的关系,促进了视频检索的精度。
三、传统的本体概念空间在概念度量上存在局部性、不一致性等问题,并不能够保证概念之间差异的有效性。该发明提出的由一组基向量张成空间的思想方法,使得映射至该空间上的概念之间的差异全局一致并且有效。
四、传统的基向量的构建往往采用诸如流行学习、因子分析、聚类等方案,本发明先对原始概念集进行Agglomerative层次聚类,在此基础上构建关系矩阵进行谱分解,由此产生的基向量是对原始概念集最紧致的一种描述表达。
五、传统的查询往往采用基于经验、基于数据分布、基于监督学习等方式对查询请求进行处理,本发明采用将查询请求映射至上下文空间得到概念空间的响应作为加权向量,再对原始查询进行处理,能够有效避免传统处理方式带来的不客观、不能保证准确刻画类内的语义一致性和类间差异等问题。
附图说明
图1为本发明的样本检索图
图2为本发明的流程图;
图3为本发明的构造上下文空间的过程流程图。
具体实施方式
本发明提供了一种基于上下文空间的视频检索方法:
给定一组基础的概念词汇集A=[C1,C2,C3…Cn]。
构造上下文空间的过程:
步骤A1、基础的概念词汇集A进行Agglomerative层次聚类形成紧致概念集A‘,去除了原始概念集的冗余,增强了后期矩阵分解的计算稳定性。是对原始概念集的一个提炼处理。
步骤A2、采用皮尔森积差系数(Pearsonproduct-moment)作为A‘概念集中任意一组概念对(conceptpair)之间相关性的度量标准构造相关性矩阵R。皮尔森积差系数描述如下:
P M ( C i , C j ) Σ k = 1 | τ | ( O i k - μ i ) ( O j k - μ i ) ( | τ | - 1 ) σ i σ j - - - ( 1 )
其中,如果在视频序列中第k个视频帧检测出了概念Ci,那么令Oik为1,否则为0,μi和σi分别表示样本的均值和方差,|τ|表示训练样本的个数。
步骤A3、对构造好的矩阵R,可将其表达为:
R=CTC(2),
对其进行谱分解得到:
其中,∧为对角矩阵,其值由矩阵R分解后所有特征值组成,V为对应特征值的特征向量所组成的矩阵。由等式(2)和(3)得到:
步骤A4、将得到的一组向量基张成一个上下文空间,由于构成该空间的向量基彼此正交,因此它对于原始本体概念集的表达能力更加丰富。
概念表达及检索比对:
步骤B1、将由基础的概念词汇集抽象而成的本体概念集之外,也就是将基础概念集聚类抽象而成,是对基础概念更加精简的表达的概念映射至构建好的上下文空间中得到向量对Ci,Cj,映射方法如下,对于Cu¢V将其向量化如:
C T C u → = R u →
C u → = ( C T ) - 1 R u → ,
其中由概念Cu与上下文空间中的概念基通过皮尔森积差系数构成,利用Moore-Penrose违逆法计算(CT)-1;V为对应特征值的特征向量所组成的矩阵。将映射得到的向量对Ci,Cj,用向量空间余弦相似度度量如:
S e m a n t i c ( C i , C j ) = C i → . C j → | C i → | | C j → | ;
这样得到的概念对之间的差异可以为后期的检索比对提供一个全局一致的响应值。
步骤B2、对于查询请求的视频样本抽象出的概念集按照步骤B1中的方式映射至上下文空间内进行概念的识别、匹配,也就是将查询请求投影在上下文空间中,这样就可以在一个可度量的空间中进行相似度匹配了,其实就是一个比对的过程,将各个概念对其的响应值构造成一组查询向量组其中qi(1≤i≤m)为上下文空间中基概念对单个查询概念的响应值,将查询组作为原始查询概念的加权系数与样本库中的视频片段进行比对得出最终的查询结果。

Claims (1)

1.一种基于上下文空间的视频检索方法,其特征在于:
给定一组基础的概念词汇集A=[C1,C2,C3…Cn];
构造上下文空间的过程:
步骤A1、基础的概念词汇集A进行Agglomerative层次聚类形成紧致概念集A‘;
步骤A2、采用皮尔森积差系数作为A‘概念集中任意一组概念对之间相关性的度量标准,构造相关性矩阵R,
步骤A3、对构造好的矩阵R,将其表达为:
R=CTC(2),
对其进行谱分解得到:
其中,∧为对角矩阵,其值由矩阵R分解后所有特征值组成,V为对应特征值的特征向量所组成的矩阵,
由等式(2)和(3)得到C的向量表示:
步骤A4、通过计算得到的一组基向量,将其在向量空间中构造张成一个正交的上下文空间;
概念表达及检索比对:
步骤B1、将由基础的概念词汇集抽象而成的本体概念集之外的概念映射至构建好的上下文空间中得到向量对Ci,Cj,映射方法如下,对于将其向量化为:
C T C u → = R u →
C u → = ( C T ) - 1 R u → ,
其中由概念Cu与上下文空间中的概念集通过皮尔森积差系数构成,利用Moore-Penrose违逆法计算(CT)-1;V为对应特征值的特征向量所组成的矩阵,
将映射得到的向量对Ci,Cj,用向量空间余弦相似度度量如:
S e m a n t i c ( C i , C j ) = c i → · c j → | c i → | | c j → | ;
得到的概念对之间的差异可以为后期的检索比对提供一个全局一致的响应值;
步骤B2、对于查询请求的视频样本抽象出的概念集按照步骤B1中的方式映射至上下文空间并在上下文空间内进行概念的识别、匹配,将各个概念对其的响应值构造成一组查询向量组其中qi(1≤i≤m)为上下文空间中集概念对单个查询概念的响应值,将查询组作为原始查询概念的加权系数与样本库中的视频片段进行比对得出最终的查询结果;
步骤A2中所述的皮尔森积差系数描述如下:
P M ( C i , C j ) = Σ k = 1 | τ | ( O i k - μ i ) ( O j k - μ i ) ( | τ | - 1 ) σ i σ j - - - ( 1 )
其中,如果在视频序列中第k个视频帧检测出了概念Ci,那么令Oik为1,否则为0,μi和σi分别表示样本的均值和方差,|τ|表示训练样本的个数。
CN201310252617.8A 2013-06-24 2013-06-24 一种基于上下文空间的视频检索方法 Active CN103279578B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310252617.8A CN103279578B (zh) 2013-06-24 2013-06-24 一种基于上下文空间的视频检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310252617.8A CN103279578B (zh) 2013-06-24 2013-06-24 一种基于上下文空间的视频检索方法

Publications (2)

Publication Number Publication Date
CN103279578A CN103279578A (zh) 2013-09-04
CN103279578B true CN103279578B (zh) 2016-04-06

Family

ID=49062095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310252617.8A Active CN103279578B (zh) 2013-06-24 2013-06-24 一种基于上下文空间的视频检索方法

Country Status (1)

Country Link
CN (1) CN103279578B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6469890B2 (ja) * 2015-09-24 2019-02-13 グーグル エルエルシー 高速直交射影
CN110287369B (zh) * 2019-06-25 2022-02-22 中科软科技股份有限公司 一种基于语义的视频检索方法及系统
CN112182292B (zh) * 2020-09-30 2024-02-09 百度(中国)有限公司 视频检索模型的训练方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402612A (zh) * 2011-12-20 2012-04-04 广州中长康达信息技术有限公司 一种视频语义网关

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630972B2 (en) * 2007-01-05 2009-12-08 Yahoo! Inc. Clustered search processing

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402612A (zh) * 2011-12-20 2012-04-04 广州中长康达信息技术有限公司 一种视频语义网关

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于Adaboost-SVM的高层次语义概念提取方法;高荣星,魏骄勇 等;《计算机应用于软件》;20120430;第29卷(第4期);24-26 *

Also Published As

Publication number Publication date
CN103279578A (zh) 2013-09-04

Similar Documents

Publication Publication Date Title
CN104462253B (zh) 一种面向网络文本大数据的话题检测或跟踪方法
CN103023927B (zh) 一种稀疏表达下的基于非负矩阵分解的入侵检测方法及系统
CN108763377B (zh) 基于卫星故障诊断多源遥测大数据特征提取预处理方法
CN103106616B (zh) 基于资源整合与信息传播特征的社区发现及演化方法
CN106909537B (zh) 一种基于主题模型和向量空间的一词多义分析方法
CN113393474B (zh) 一种基于特征融合的三维点云的分类和分割方法
CN111858940B (zh) 一种基于多头注意力的法律案例相似度计算方法及系统
CN104574192A (zh) 在多个社交网络中识别同一用户的方法及装置
CN103412903B (zh) 基于兴趣对象预测的物联网实时搜索方法及系统
CN113254716B (zh) 视频片段检索方法、装置、电子设备和可读存储介质
CN103412878B (zh) 基于领域知识地图社区结构的文档主题划分方法
CN103279578B (zh) 一种基于上下文空间的视频检索方法
CN114169442A (zh) 基于双原型网络的遥感图像小样本场景分类方法
CN113254580B (zh) 一种特殊群体搜索方法及系统
Zhao et al. Hybrid generative/discriminative scene classification strategy based on latent Dirichlet allocation for high spatial resolution remote sensing imagery
Bliznyuk et al. Variogram estimation in the presence of trend
CN105631462A (zh) 结合置信度和贡献度的基于时空上下文的行为识别方法
Leng et al. Audio scene recognition based on audio events and topic model
CN116646001A (zh) 基于联合式跨域注意力模型预测药物靶标结合性的方法
CN115952493A (zh) 一种黑盒模型的逆向攻击方法、攻击装置以及存储介质
CN115130570A (zh) 一种脉冲星搜索模型的训练方法、应用方法、装置及设备
Zhang Network public opinion data mining model of hierarchical multi level
CN112861474A (zh) 一种信息标注方法、装置、设备及计算机可读存储介质
Caillault et al. DTW-Approach for uncorrelated multivariate time series imputation
Bond et al. An unsupervised machine learning approach for ground‐motion spectra clustering and selection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant