CN102542024B - 一种视频资源语义标签的标定方法 - Google Patents

一种视频资源语义标签的标定方法 Download PDF

Info

Publication number
CN102542024B
CN102542024B CN 201110433167 CN201110433167A CN102542024B CN 102542024 B CN102542024 B CN 102542024B CN 201110433167 CN201110433167 CN 201110433167 CN 201110433167 A CN201110433167 A CN 201110433167A CN 102542024 B CN102542024 B CN 102542024B
Authority
CN
China
Prior art keywords
tag
semantic label
video resource
semantic
frame sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201110433167
Other languages
English (en)
Other versions
CN102542024A (zh
Inventor
孙健
徐杰
隆克平
谢发川
艾丽丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN 201110433167 priority Critical patent/CN102542024B/zh
Publication of CN102542024A publication Critical patent/CN102542024A/zh
Application granted granted Critical
Publication of CN102542024B publication Critical patent/CN102542024B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种视频资源语义标签的标定方法,通过训练得到“标签-帧序列”样本集合,在这个样本集合的基础上,通过待标定视频资源关键帧序列提取,并与“标签-帧序列”中语义标签对应的帧序列进行相似度计算,然后再阀值判定,最终将语义标签集合K中合适的语义标签标定给待标定视频资源。本发明视频资源语义标签的标定方法克服了大量视频资源语义标签标定过程中人工操作的繁琐,并提高了标定的完备性及准确性,同时将语义标签限定到一个可控的范围中,即语义标签集合K中,另外,标定的语义标签可以根据对应的序列帧与待标定视频资源的相似度进行排序,因而可以实现列表化。

Description

一种视频资源语义标签的标定方法
技术领域
本发明属于多媒体处理技术领域,更为具体来讲,涉及一种应用于视频内容描述的视频资源语义标签的标定方法。
背景技术
网络应用的不断发展,各种各样的业务呈现出几何级数的增长。这其中视频类业务受到用户的广泛青睐,并积累了海量的视频资源。怎样准确、精炼的使用语义标签来描述这些视频资源的内容,在各种视频业务系统中都有较大价值及需求。基于这些语义标签,视频业务系统不仅可以更好的对视频资源进行整理分类,把视频资源有序的组织起来,还可以通过计算并向用户推荐其更感兴趣的视频资源,减少用户搜索的时间以及筛选的过程。当然,用户也可以自主的在海量资源中搜索筛选自己想要的。
互联网上一些共享视频网站,如优酷、土豆等为了获取更好的视频资源描述,允许用户为特定的视频资源提供描述性的标签,如短语、关键词等作为描述视频内容的语义标签,这些语义标签在海量视频资源的分类整理中发挥着重要的作用。但是,由于这些语义标签是用户主观自由标定的,没有任何可遵循的规则可言,也就不可避免的会遇到诸如:同义词、一词多义、同音异议词以及主观判定等问题,而且用户不太可能给出数量充足的语义标签,也即在完整性上无法保证。
当前,在这些视频网站中,用户标定的语义标签存在的问题归结为:1)不完备性,未能对视频资源进行充分描述;2)不准确性,语义标签的表达本身不准确,这些是由用户主观感受的不同而导致不准确;3)没有语义强度的相关性排序,语义标签列表杂乱无序。
近年来,针对上述问题已做出了一些尝试,大致的方法可以分为两类:标签的注解和标签的精炼。
1、注解法
注解法主要通过寻找已有语义标签的相关语义标签来完善视频资源的描述,进而解决视频资源描述的不完备性。
2、精炼法
精练法是通过剔除噪音语义标签或依据语义标签与视频资源的相关度来排序进而优化已有的语义标签,最终得到高质量的语义标签列表。
在语义标签的标定技术领域中,虽然已取得进展,但现有的标定方法仍存在着问题:1)没有同时考虑完备性,准确性,列表化;2)依赖于实际不符的一些假设,如标签注解法假定原始标签列表是准确的,精炼法假定原始标签列表是完备的。
在视频资源推荐技术领域,对于描述视频资源的语义标签还需要一定的规范性,即需要将语义标签限定在一定的可控范围之内,并满足语义标签数据的维度要求,以便于推荐计算。目前已有的研究进展主要集中在将语义资源更完备,更准确的描述出来,对于语义标签的规范性关注程度有待提高。
发明内容
本发明的目的在于克服现有技术的不足,提供一种视频资源语义标签的标定方法,使得对视频资源的描述更加完备、准确,并能对语义标签进行列表化,同时,还能将使用的语义标签限定在一个可控范围之内,更有利于作为视频推荐技术的基础。
为实现上述发明目的,本发明视频资源语义标签的标定方法,其特征在于,包括以下步骤:
(1)、采用传统语义标签标定方法对部分视频资源进行语义标签标定,得到标定的视频资源集{vold},剩余部分视频资源为待标定视频资源集{vnew};其中,语义标签为能够有效表达用户兴趣度的关键词;
(2)、形成带语义细分的语义标签集合K
在视频资源集{vold}中,首先根据语义标签在标定视频资源集{vold}的描述过程中出现的频率,由高到低排序后,选取前n个的语义标签,构成语义标签集合K={tag1,tag2,tag3......tagn},其中,tag1,tag2,tag2,…,tagn为依次排序的语义标签;
然后,经过语义相似度分析,将语义标签集合K细分为:
K={k1,k2,k3......kp}
其中:
…… k 1 = { tag k 1 _ 1 , tag k 1 _ 2 , . . . . . . , tag k 1 _ l 1 }
k 2 = { tag k 2 _ 1 , tag k 2 _ 2 , . . . . . . , tag k 2 _ l 2 }
k p = { tag kp _ 1 , tag kp _ 2 , . . . . . . , tag kp _ l p }
Σ i = 1 p l i = n ;
每个子集合ki,i∈{1,2......p}中的语义标签具有相似的语义信息;
(3)、“标签-帧序列”样本训练
3.1)、以语义标签tagh∈K,h=1,2,…,n为依据,在标定的视频资源集{vold}中收集cnt个具有较高代表性的视频资源{vo-1,vo-2......vo-cnt},每个视频资源提取出一个长度为m的关键帧序列KeyFSj,组成一个长度为z=m*cnt的帧序列KeyFSinit
FS init = Σ j = 1 cnt KeyFS j = { FS 1 , FS 2 . . . . . . FS z }
3.2)、以两个关键帧之间的相似度距离值为基础,对帧序列FSinit进行聚类分析,得到若干组,并选取关键帧个数最多的一组作为语义标签tagh的帧序列:
FS tag h = { FS tag h _ 1 , FS t ag h _ 2 , . . . . . . , FS tag h _ fcnt } , fcnt为关键帧个数;
3.3)、由上得到一个“标签-帧序列”
Figure BDA0000123346010000037
重复步骤3.1)、3.2)得到语义标签集合K中每个语义标签对应的“标签-帧序列”构成的样本集合 { tag h - FS tag h ; h = 1,2 . . . . . . n } ;
(4)、在待标定视频资源集{vnew}中,选取一个待标定视频资源vw,并提取关键帧序列KeyFSw
(5)、取语义标签tagx,x=1,2......n中对应的帧序列
Figure BDA0000123346010000039
计算帧序列
Figure BDA00001233460100000310
与关键帧序列KeyFSw的相似度值,得到αw-x,取值范围[0~1];
(6)、判定语义标签tagx是否标定给视频资源vw
6.1)、如果存在已标定给视频资源vw的语义标签tagy,且tagy、tagx∈ki,tagy对应的帧序列
Figure BDA00001233460100000311
帧序列
Figure BDA00001233460100000312
与关键帧序列KeyFSw的相似度值为αw-y
则:
A.当 α w - x ≥ α std + ( 1 - α w - y ) × cos ( α w - y π / 2 ) 2 时,语义标签tagx标定给视频资源vw
B.当 &alpha; w - x < &alpha; std + ( 1 - &alpha; w - y ) &times; cos ( &alpha; w - y &pi; / 2 ) 2 时,语义标签tagx不标定给资源vw
6.2)、如果不存在已标定给资源vw的tagy∈ki且tagx∈ki,则:
A.当αw-x≥αstd时,语义标签tagx标定给资源vw
B.当αw-x<αstd时,语义标签tagx不标定给资源vw
(7)、重复步骤(5)、(6),遍历语义标签集合K中所有语义标签,判定其是否标定给视频资源vw,最终形成视频资源vw的语义标签{tagw_1,tagw_2……};
(8)、重复步骤(4)~(7),遍历待标定视频资源集{vnew}中的所有待标定视频资源并进行标定。
本发明的发明目的是这样实现的:
本发明视频资源语义标签的标定方法,通过训练得到“标签-帧序列”样本集合,在这个样本集合的基础上,通过待标定视频资源关键帧序列提取,并与“标签-帧序列”中语义标签对应的帧序列进行相似度计算,然后再阀值判定,最终将语义标签集合K中合适的语义标签标定给待标定视频资源。本发明视频资源语义标签的标定方法克服了大量视频资源语义标签标定过程中人工操作的繁琐,并提高了标定的完备性及准确性,同时将语义标签限定到一个可控的范围中,即语义标签集合K中,另外,标定的语义标签可以根据对应的序列帧与待标定视频资源的相似度进行排序,因而可以实现列表化。
附图说明
图1是本发明视频资源语义标签的标定方法一种具体实施方式流程图;
图2是图1所示的“标签-帧序列”样本训练一具体实施方式流程图;
图3是图1中帧序列相似度计算及阀值判定流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明视频资源语义标签的标定方法一种具体实施方式流程图;
在本实施例中,如图1所示,它包括两个主要功能模块,分别是“标签-帧序列”样本训练和帧序列相似度计算及阀值判定。
“标签-帧序列”样本训练,通过不断的训练和优化得到语义标签与帧序列的对应关系,其训练过程如图2所示,包括以下几个具体步骤:
步骤1:在已进行传统方法标定过的视频资源集{vdd}中,收集并整理能够有效表达用户对视频资源的兴趣程度的语义标签集合,如{足球、西甲、英超、新闻、剧情、故事片、暴力、京剧}。
在本实施例中,标定的视频资源集{vold}中有6个视频资源,用传统方法进行标定为:
vo-1:{足球、西甲}
vo-2:{足球、英超、新闻}
vo-3:{西甲、新闻}
vo-4:{剧情、故事片}
vo-5:{京剧、新闻}
vo-6:{剧情、暴力、故事片}
步骤2:统计语义标签出现频率如下:{足球(2)、西甲(2)、英超(1)、新闻(3)、剧情(2)、故事片(2)、暴力(1)、京剧(1)}。假设我们需要n=5个语义标签,那么最终选定的前5个语义标签,构成语义标签集合K={足球、西甲、新闻、剧情、故事片}。
根据语义相似度分析,将该标签集合细分为:
K={k1,k2,k3}
k1={足球、西甲}
k2={新闻}
k3={剧情、故事片}
步骤3:3.1、语义标签tagh选为“足球”,标定的视频资源集{vdd}中收集cnt=3具有较高代表性足球视频{vo-1,vo-2,vo-3},分别提取出关键帧序列,每个视频提取m=5关键帧:
vo-1:KeyFS1={FS11,FS12,FS13,FS14,FS15}
vo-2:KeyFS2={FS21,FS22,FS23,FS24,FS25}
vo-3:KeyFS3={FS31,FS32,FS33,FS34,FS35}
将三组关键帧序列融合,得到:
FSinit={FS11,FS12,FS13,FS14,FS15,FS21,FS22,FS23,FS24,FS25,FS31,FS32,FS33,FS34,FS35}
3.2)、对帧序列FSinit进行基于相似度的关键帧聚类分析,聚类结果中有一类含有最多的fcnt=6个帧,那么就以这6个帧组成一个帧序列:
FS足球={FS足球_1,FS足球_2,FS足球_3,FS足球_4,FS足球_5,FS足球_6}
3.3)、由上得到一个标签-帧序列足球-FS足球,分别选取“西甲”、“新闻”、“剧情”、“故事片”重复步骤本步骤,即可得到“标签-帧序列”样本集合:
{足球-FS足球、西甲-FS西甲、新闻-FS新闻、剧情-FS剧情、故事片-FS故事片}
第二个重要部分是在“标签-帧序列”样本集的基础上进行帧序列相似度计算及阀值判定,以对待标定资源vw进行语义标签标定,如图3所示,语义标签标定步骤如下:
步骤1:在本实施例中,选取的待标定资源vw为一个西甲足球集锦视频,提取它的关键帧序列,在本实施例中提取3个关键帧:
KeyFSw={FSw1,FSw2,FSw3}
步骤2:计算KeyFSw与{tagi-FSi;i=1,2......n}中每个“标签-帧序列”对应的帧序列FSi的相似度值,得到αw-足球=0.82,αw-西甲=0.75,αw-新闻=0.40,αw-剧情=0.07,αw-故事片=0.01。
步骤3:在本实施例中,相似度判定阀值αstd=0.70。
A.判定是否将标签“足球”标定给待标定资源vw
因为不存在已标定语义标签和“足球”同属于K的某个子集,因此判定阀值直接取αstd=0.70,由于αw-足球=0.82>αstd=0.70,因此“足球”标定给待标定资源vw
B.判定是否将语义标签“西甲”标定给待标定资源资源vw
因为存在已标定语义标签“足球”和待判定语义标签“西甲”同属于k1,因此判定阀值变为:
&alpha; std &prime; = &alpha; std + ( 1 - &alpha; w - y ) &times; cos ( &alpha; w - y &pi; / 2 ) 2 = 0.70 + ( 1 - 0.82 ) &times; cos ( 0.82 * &pi; / 2 ) 2 = 0.725 , 由αw-西甲=0.75>α′std=0.725,因此“西甲”标定给资源vw
按照上述方法,判定语义标签“新闻”、“剧情”、“故事片”三个标签是否标定给视频资源vw,由于αw-新闻=0.40,αw-剧情=0.07,αw-故事片=0.01都小于判定阀值α′std,因此,不标定给视频资源vw
步骤4:形成视频资源vw的语义标签描述{“足球”,“西甲”}。
重复步骤1~4,遍历待标定视频资源集{vnew}中的所有待标定视频资源并进行标定。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (1)

1.一种视频资源语义标签的标定方法,其特征在于,包括以下步骤:
(1)、采用传统语义标签标定方法对部分视频资源进行语义标签标定,得到标定的视频资源集{vold},剩余部分视频资源为待标定视频资源集{vnew};其中,语义标签为能够有效表达用户兴趣度的关键词;
(2)、形成带语义细分的语义标签集合K
在视频资源集{vold}中,首先根据语义标签在标定视频资源集{vold}的描述过程中出现的频率,由高到低排序后,选取前n个的语义标签,构成语义标签集合K={tag1,tag2,tag3......tagn},其中,tag1,tag2,tag3,…,tagn为依次排序的语义标签;
然后,经过语义相似度分析,将语义标签集合K细分为p个子集合:
K={k1,k2,k3......kp};
每个子集合ki,i∈{1,2......p}中的语义标签具有相似的语义信息;
(3)、“标签-帧序列”样本训练
3.1)、以语义标签tagh∈K,h=1,2,···,n为依据,在标定的视频资源集{vold}中收集cnt个具有较高代表性的视频资源{vo-1,vo-2......vo-cnt},每个视频资源提取出一个长度为m的关键帧序列KeyFSj,组成一个长度为z=m*cnt的帧序列KeyFSinit
KeyF S init = &Sigma; j = 1 cnt Ksy FS j ;
3.2)、以两个关键帧之间的相似度距离值为基础,对帧序列KeyFSinit进行聚类分析,得到若干组,并选取关键帧个数最多的一组作为语义标签tagh的帧序列: FS tag h = { FS tag h _ 1 , FS tag h _ 2 , . . . . . . , FS tag h _ fcnt } , fcnt 为关键帧个数;
3.3)、由上得到一个“标签-帧序列”tagh-
重复步骤3.1)、3.2)得到语义标签集合K中每个语义标签对应的“标签-帧序列”构成的样本集合{tagh-
Figure FDA00002882864700013
;h=1,2......n};
(4)、在待标定视频资源集{vnew}中,选取一个待标定视频资源vw,并提取关键帧序列KeyFSw
(5)、取语义标签tagx,x=1,2......n中对应的帧序列
Figure FDA00002882864700014
,计算帧序列
Figure FDA00002882864700015
与关键帧序列KeyFSw的相似度值,得到αw-x,取值范围[0~1];
(6)、判定语义标签tagx是否标定给视频资源vw
6.1)、如果存在已标定给视频资源vw的语义标签tagy,且tagy、tagx∈ki,tagy对应的帧序列
Figure FDA00002882864700023
与关键帧序列KeyFSw的相似度值为αw-y,则:
A.当 &alpha; w - x &GreaterEqual; &alpha; std + ( 1 - &alpha; w - y ) &times; cos ( &alpha; w - y &pi; / 2 ) 2 时,语义标签tagx标定给视频资源vw
B.当 &alpha; w - x < &alpha; std + ( 1 - &alpha; w - y ) &times; cos ( &alpha; w - y &pi; / 2 ) 2 时,语义标签tagx不标定给资源vw
6.2)、如果不存在已标定给资源vw的tagy∈ki且tagx∈ki,则:
A.当αw-x≥αstd时,语义标签tagx标定给资源vw
B.当αw-xstd时,语义标签tagx不标定给资源vw
其中,相似度判定阀值αstd=0.7;
(7)、重复步骤(5)、(6),遍历语义标签集合K中所有语义标签,判定其是否标定给视频资源vw,最终形成视频资源vw的语义标签{tagw_1,tagw_2,......};
(8)、重复步骤(4)~(7),遍历待标定视频资源集{vnew}中的所有待标定视频资源并进行标定。
CN 201110433167 2011-12-21 2011-12-21 一种视频资源语义标签的标定方法 Expired - Fee Related CN102542024B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110433167 CN102542024B (zh) 2011-12-21 2011-12-21 一种视频资源语义标签的标定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110433167 CN102542024B (zh) 2011-12-21 2011-12-21 一种视频资源语义标签的标定方法

Publications (2)

Publication Number Publication Date
CN102542024A CN102542024A (zh) 2012-07-04
CN102542024B true CN102542024B (zh) 2013-09-25

Family

ID=46348906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110433167 Expired - Fee Related CN102542024B (zh) 2011-12-21 2011-12-21 一种视频资源语义标签的标定方法

Country Status (1)

Country Link
CN (1) CN102542024B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354861B (zh) * 2016-09-06 2019-09-20 中国传媒大学 电影标签自动标引方法及自动标引系统
CN106649855B (zh) * 2016-12-30 2019-06-21 中广热点云科技有限公司 一种视频标签的添加方法和添加系统
CN107995523B (zh) * 2017-12-21 2019-09-03 Oppo广东移动通信有限公司 视频播放方法、装置、终端及存储介质
CN108417205B (zh) * 2018-01-19 2020-12-18 苏州思必驰信息科技有限公司 语义理解训练方法和系统
CN108446731B (zh) * 2018-03-16 2021-01-08 聚好看科技股份有限公司 一种内容去重的方法及装置
CN108960316B (zh) * 2018-06-27 2020-10-30 北京字节跳动网络技术有限公司 用于生成模型的方法和装置
CN112148964B (zh) * 2019-06-29 2022-11-18 阿里巴巴集团控股有限公司 信息处理、推荐方法、系统及设备
CN110519654B (zh) * 2019-09-11 2021-07-27 广州荔支网络技术有限公司 一种标签确定方法、装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008001305A2 (en) * 2006-06-29 2008-01-03 Koninklijke Philips Electronics N.V. Method and system of key frame extraction
WO2009143648A1 (en) * 2008-05-27 2009-12-03 Multi Base Ltd Non-linear representation of video data

Also Published As

Publication number Publication date
CN102542024A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN102542024B (zh) 一种视频资源语义标签的标定方法
CN104834686B (zh) 一种基于混合语义矩阵的视频推荐方法
CN111339306B (zh) 分类模型训练方法、分类方法及装置、设备和介质
TWI653542B (zh) 一種基於網路媒體資料流程發現並跟蹤熱點話題的方法、系統和裝置
CN109165294B (zh) 一种基于贝叶斯分类的短文本分类方法
CN103970729B (zh) 一种基于语义类的多主题提取方法
CN102902821B (zh) 基于网络热点话题的图像高级语义标注、检索方法及装置
CN106407484B (zh) 一种基于弹幕语义关联的视频标签提取方法
CN104199833B (zh) 一种网络搜索词的聚类方法和聚类装置
CN104933113A (zh) 一种基于语义理解的表情输入方法和装置
CN114723528A (zh) 基于知识图谱的商品个性化推荐方法及系统
CN105069080B (zh) 一种文献检索方法及系统
CN101853470A (zh) 一种基于社会化标签的协同过滤方法
CN105930469A (zh) 基于Hadoop的个性化旅游推荐系统及方法
CN103729360A (zh) 一种兴趣标签推荐方法及系统
CN101834837A (zh) 基于宽带网络的旅游景区景点在线景观视频主动信息服务系统
CN105893585B (zh) 一种结合标签数据的二部图模型学术论文推荐方法
CN106951471A (zh) 一种基于svm的标签发展趋势预测模型的构建方法
CN112749330B (zh) 信息推送方法、装置、计算机设备和存储介质
CN104035955B (zh) 搜索方法和装置
CN103869999B (zh) 对输入法所产生的候选项进行排序的方法及装置
CN107330557A (zh) 一种基于社区划分和熵的舆情热点跟踪及预测方法与装置
CN103761286B (zh) 一种基于用户兴趣的服务资源检索方法
CN107391565A (zh) 一种基于主题模型的跨语言层次分类体系匹配方法
CN109299248A (zh) 一种基于自然语言处理的商业情报收集方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130925

Termination date: 20151221

EXPY Termination of patent right or utility model