CN103279580B - 基于新型语义空间的视频检索方法 - Google Patents
基于新型语义空间的视频检索方法 Download PDFInfo
- Publication number
- CN103279580B CN103279580B CN201310253044.0A CN201310253044A CN103279580B CN 103279580 B CN103279580 B CN 103279580B CN 201310253044 A CN201310253044 A CN 201310253044A CN 103279580 B CN103279580 B CN 103279580B
- Authority
- CN
- China
- Prior art keywords
- space
- concept
- semantic
- video
- steps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一个基于新型语义空间的视频检索方法。该方法首先会将所有的概念构建一个概念空间,并且对每个概念构建一个检测器,用于将视频中的低级特征映射到概念空间中。针对构建好的概念空间,对其进行谱分解,得到多个“关键概念”张成的语义空间。再根据该语义空间,构建一个全局的本体语义空间,该空间用来衡量不同概念之间的相似度。该发明解决了检索过程中,对于不同概念之间无法直接进行统一和全局的比较的问题,从而提高了检索视频的精度。
Description
技术领域
本发明涉及多媒体检索领域,提出基于新型语义空间的视频检索方法。
背景技术
传统的视频检索是基于视频的文本标签进行检索的,没有将视频特征和文本特征的相关性结合起来,导致检索结果不佳。基于概念的语义的视频检索成为了主流趋势,然而当前的技术主要是基于单一概念的语义进行视频检索,忽略了概念之间的从属关系,推导关系,并没有充分发挥概念语义之间的关系的能力。比如“坦克”,“迫击炮”,“轰炸机”等概念从属于“武器”这个概念,而“武器”这个概念对“战争”这个概念又有一定的推导能力。对于检索“战争”相关的视频时,当视频中出现了“坦克”,“迫击炮”,那么就有一定程度说明该视频与“战争”相关,即语义之间的关系网对于提高视频检索精度具有很大意义。
发明内容
本发明充分利用多个概念的语义之间从属关系和推导关系,构建一个全局统一的语义空间,在该空间上进行基于语义的检索,解决了当前基于单一概念的语义的方法进行视频检索的不足,从而提高检索精度。
本发明为了实现上述目的采用以下技术方案:
基于新型语义空间的视频检索方法,其特征在于:
给定一组基础的概念语义,构成传统概念语义空间C=[C1,C2,……·CN],其中每个Ci为一个概念的语义,每个概念Ci对应一个检测器di,用以将视频的低级特征映射到概念空间中。
构建新的语义空间B的过程如下:
步骤A1:对语义空间进行转换,得到新的完备和紧致的语义空间P,可以根据C空间的情况来选择方法,线性空间可采用PCA,SVD,非负矩阵分解等,非线性空间可采用manifold方法。
步骤A2:将C空间中的语义映射到P空间中,然后的进行层次聚类,可使用BrownCluster或其他算法。该聚类的结果可以构建一个树形结构,用来表达概念之间的从属和推广能力。
步骤A3:选择表达P空间中每个概念之间相似度度量的策略,使用WUP来表达具有从属和推广能力的相似度。其中表示概念i和概念j的最短路径的树的深度,L(Ci,Cj)表示最短路径的长度。
步骤A4:采用步骤A3计算每个概念与其他概率的相似度,可以构造一个关系矩阵R,R为对称矩阵。对R进行谱分解,抽取其中的基向量构造新的语义空间B;
其中V为R的特征向量矩阵,Λ为特征值对角矩阵。
检索过程,具体包括以下步骤:
步骤B1:对于一个属于原始语义概念空间C的未知语义将其映射到P空间中,形成将映射到新的B空间中,映射公式为:计算B空间中向量间的相似度,这里采用余弦相似度来计算,计算公式为:
步骤B2:对每个视频的关键帧,使用每个检测器di(如:这里使用MediaMil-101,Columbia-374和Vireo-374这些检测器集合中的概念检测器),响应超过一定阈值,则将其对应的Ci加入到集合S中,并对S中的每个语义概念进行步骤B1中的映射,形成新的语义集合N,计算与N中的相似度,进行排序,选取前K个视频作为返回视频。
本发明具有以下有益效果:
本发明充分利用多个概念的语义之间从属关系和推导关系,构建一个全局统一的语义空间,在该空间上进行基于语义的检索,解决了当前基于单一概念的语义的方法进行视频检索的不足,从而提高检索精度。
附图说明
图1为本发明的系统流程图。
具体实施方式
基于新型语义空间的视频检索方法,其特征在于:
给定一组基础的概念语义,构成传统概念语义空间C=[C1,C2,……·CN],其中每个Ci为一个概念的语义,每个概念Ci对应一个检测器di,用以将视频的低级特征映射到概念空间中。
构建新的语义空间B的过程如下:
步骤A1:对语义空间进行转换,得到新的完备和紧致的语义空间P,可以根据C空间的情况来选择方法,线性空间可采用PCA,SVD,非负矩阵分解等,非线性空间可采用manifold方法。
步骤A2:将C空间中的语义映射到P空间中,然后的进行层次聚类,可使用BrownCluster或其他算法。该聚类的结果可以构建一个树形结构,用来表达概念之间的从属和推广能力。
步骤A3:选择表达P空间中每个概念之间相似度度量的策略,使用WUP来表达具有从属和推广能力的相似度。其中表示概念i和概念j的最短路径的树的深度,L(Ci,Cj)表示最短路径的长度。
步骤A4:计算每个概念与其他概率的相似度,可以构造一个关系矩阵R,R为对称矩阵。对R进行谱分解,抽取其中的基向量构造新的语义空间B。
其中V为R的特征向量矩阵,∧为特征值对角矩阵。
检索过程,包括以下步骤:
步骤B1:对于一个属于原始语义概念空间C的未知语义将其映射到P空间中,形成将映射到新的B空间中,映射公式为:计算B空间中向量间的相似度,这里采用余弦相似度来计算,计算公式为:
步骤B2:对每个视频的关键帧,使用每个检测器di,响应超过一定阈值,则将其对应的Ci加入到集合S中,并对S中的每个语义概念进行步骤B1中的映射,形成新的语义集合N,计算与N中的相似度,进行排序,选取前K个视频作为返回视频。
实施的流程简单介绍如下:
1:首先采用一些原始概念检测器,每个概念检测器对应一个概念,由多个概念构成定义原始概念空间C。
2:将系统预定义的原始概念组成的原始概念空间C进行变换(如PCA),转变为一个紧致的关键概念空间P。
3:构建原始概念之间的关系矩阵,该关系矩阵由每对概念之间的相似度WUP构成,对该矩阵进行谱分解,获得一个变化矩阵T。
4:使用T矩阵将P空间进行变换,变化后获得新的B空间,该B空间即为新型的本体语义空间。Ci,Cj
Ci,Cj
5:对新来的query,即来至于原始语义空间C中的未知向量,对query这个向量先投影到空间P中得到Qp向量,再将Qp向量使用T变化矩阵投影到B空间,最后得到一个属于B空间中的Qb向量。
6:对所有的视频关键帧的样本使用原始概念检测器进行检测,获得关键帧在B空间中的向量集合,然后同样进行与5中一致的变换,得到B空间中关键帧的向量集合S。
7:使用余弦相似度对Qb和S中的每个向量计算相似度,排序后,取得相似度最大的K个视频即可。
Claims (1)
1.基于新型语义空间的视频检索方法,其特征在于:
构建传统概念语义空间:
给定一组基础的概念语义,构成传统概念语义空间C=[C1,C2,.......CN],其中每个Ci为一个概念的语义,每个概念Ci对应一个检测器di,用以将视频的低级特征映射到概念空间中;
构建新的语义空间B,其步骤包括以下步骤:
步骤A1:对传统概念语义空间进行转换,得到新的完备和紧致的语义空间P,
步骤A2:将C空间中的语义映射到P空间中,然后的进行层次聚类,该聚类的结果构建一个树形结构,用来表达概念之间的从属和推广能力;
步骤A3:选择表达P空间中本体的概念之间相似度度量的策略,使用WUP来表达具有从属和推广能力的相似度,其中表示概念Ci和概念Cj的最低的公共父亲节点的深度,L(Ci,Cj)表示Ci和Cj之间的路径的长度;
步骤A4:采用步骤A3计算P空间中的每个概念与其他概念的相似度,构造一个关系矩阵R,R为对称矩阵,对R进行谱分解,公式如下:
V为R的特征向量矩阵,Λ为特征值对角矩阵;
抽取其中的基向量构造新的语义空间B,公式如下:
检索过程,具体包括以下步骤:
步骤B1:对于一个属于传统语义概念空间C的未知语义将其映射到P空间中,形成将映射到新的B空间中,映射公式为:计算B空间中向量间的相似度,这里采用余弦相似度来计算,计算公式为:
公式中Bi、Bj新的语义空间B中的向量;
步骤B2:对每个视频的关键帧,使用每个传统语义概念Ci所对应的概念检测器di,响应超过一定阈值,则将其对应的Ci加入到集合S中,并对S中的每个语义概念进行步骤B1中的映射,形成新的语义集合N,计算与N中的余弦相似度,进行排序,选取前K个视频作为返回视频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310253044.0A CN103279580B (zh) | 2013-06-24 | 2013-06-24 | 基于新型语义空间的视频检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310253044.0A CN103279580B (zh) | 2013-06-24 | 2013-06-24 | 基于新型语义空间的视频检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103279580A CN103279580A (zh) | 2013-09-04 |
CN103279580B true CN103279580B (zh) | 2016-05-11 |
Family
ID=49062097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310253044.0A Active CN103279580B (zh) | 2013-06-24 | 2013-06-24 | 基于新型语义空间的视频检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103279580B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104156433B (zh) * | 2014-08-11 | 2017-05-17 | 合肥工业大学 | 一种基于语义映射空间构建的图像检索方法 |
CN105868366B (zh) * | 2016-03-30 | 2019-02-01 | 浙江工业大学 | 基于概念关联的概念空间导航方法 |
CN110598048B (zh) * | 2018-05-25 | 2021-01-29 | 中科寒武纪科技股份有限公司 | 视频检索方法及视频检索映射关系生成方法、装置 |
CN109272533B (zh) * | 2018-10-12 | 2021-08-17 | 山东大学 | 一种基于紧致表达的物体鲁棒跟踪装置及跟踪方法 |
CN115630191B (zh) * | 2022-12-22 | 2023-03-28 | 成都纵横自动化技术股份有限公司 | 基于全动态视频的时空数据集检索方法、装置及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0406504D0 (en) * | 2004-03-23 | 2004-04-28 | British Telecomm | Method and system for detecting audio and video scene changes |
US7630972B2 (en) * | 2007-01-05 | 2009-12-08 | Yahoo! Inc. | Clustered search processing |
CN101281520B (zh) * | 2007-04-05 | 2010-04-21 | 中国科学院自动化研究所 | 基于非监督学习和语义匹配特征交互式体育视频检索方法 |
CN102117313A (zh) * | 2010-12-29 | 2011-07-06 | 天脉聚源(北京)传媒科技有限公司 | 一种视频检索方法和系统 |
CN102222111B (zh) * | 2011-06-30 | 2012-10-31 | 山东神戎电子股份有限公司 | 一种高清视频内容检索方法 |
-
2013
- 2013-06-24 CN CN201310253044.0A patent/CN103279580B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN103279580A (zh) | 2013-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103279580B (zh) | 基于新型语义空间的视频检索方法 | |
CN104008174B (zh) | 一种海量图像检索的隐私保护索引生成方法 | |
CN108563690B (zh) | 一种基于面向对象聚类的协同过滤推荐方法 | |
CN101201822B (zh) | 基于内容的视频镜头检索方法 | |
Cuzzocrea | Retrieving accurate estimates to olap queries over uncertain and imprecise multidimensional data streams | |
CN103617157A (zh) | 基于语义的文本相似度计算方法 | |
CN103226585B (zh) | 面向图像检索的自适应哈希重排方法 | |
CN105574212B (zh) | 一种多索引磁盘哈希结构的图像检索方法 | |
CN105045826A (zh) | 一种基于图模型的实体链接算法 | |
CN104572965A (zh) | 基于卷积神经网络的以图搜图系统 | |
CN102902826B (zh) | 一种基于基准图像索引的图像快速检索方法 | |
WO2019192120A1 (zh) | 轨迹查询方法、电子设备及存储介质 | |
CN108171071B (zh) | 一种面向云计算的多关键字可排序密文检索方法 | |
CN105022752A (zh) | 图像检索方法与装置 | |
CN104391908B (zh) | 一种图上基于局部敏感哈希的多关键字索引方法 | |
CN106372073A (zh) | 一种数学公式检索方法与装置 | |
Cuzzocrea | Accuracy control in compressed multidimensional data cubes for quality of answer-based OLAP tools | |
Huang et al. | A Low‐Cost Named Entity Recognition Research Based on Active Learning | |
CN104933143A (zh) | 获取推荐对象的方法及装置 | |
CN104077419B (zh) | 结合语义与视觉信息的长查询图像检索重排序方法 | |
CN103064907A (zh) | 基于无监督的实体关系抽取的主题元搜索系统及方法 | |
CN106570196A (zh) | 视频节目的搜索方法和装置 | |
CN104156431A (zh) | 一种基于实体图社团结构的rdf关键词查询方法 | |
CN103186674A (zh) | 一种基于XML的Web数据快速查询方法 | |
Yue | Design of HBase and hybrid hadoop ecosystem architecture in transportation data management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |