CN103049479B - 一种在线视频标签生成方法和系统 - Google Patents

一种在线视频标签生成方法和系统 Download PDF

Info

Publication number
CN103049479B
CN103049479B CN201210488982.4A CN201210488982A CN103049479B CN 103049479 B CN103049479 B CN 103049479B CN 201210488982 A CN201210488982 A CN 201210488982A CN 103049479 B CN103049479 B CN 103049479B
Authority
CN
China
Prior art keywords
online video
matrix
label
candidate
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210488982.4A
Other languages
English (en)
Other versions
CN103049479A (zh
Inventor
杨浩
吴凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201210488982.4A priority Critical patent/CN103049479B/zh
Publication of CN103049479A publication Critical patent/CN103049479A/zh
Application granted granted Critical
Publication of CN103049479B publication Critical patent/CN103049479B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例公开了一种在线视频标签生成方法和系统,解决了需要标注每个在线视频的标签内容,以及标签强度不准确的问题。其中,所述在线视频标签生成方法包括:计算各在线视频的原始标签矩阵和相似度矩阵;基于相似度矩阵和原始标签矩阵,计算得到候选标签矩阵;基于原始标签矩阵和候选标签矩阵,判断候选标签矩阵是否符合预置条件;当符合预置条件时,基于候选标签矩阵,确定各在线视频的更新的标签。本发明实施例节省了标注标签内容的成本,提高了标签内容和标签强度准确率。

Description

一种在线视频标签生成方法和系统
技术领域
本发明实施例涉及互联网领域,具体涉及一种在线视频标签生成方法和系统。
背景技术
在线视频标签的生成是描述在线视频特征的有效方法,被广泛应用到在线视频搜索和在线视频推荐系统中。一个在线视频标签由标签内容和标签强度组成,标签内容描述在线视频特征,标签强度说明该特征的重要性。终端通过查看标签内容,能够分辨出该在线视频的特征,确认是否可能满足自己的观影需求。而通过对一个在线视频的全部标签的标签强度进行比较,可以知道该在线视频的主要特征和次要特征。如果主要特征与观影需求一致,则可以确定该在线视频最满足终端的观影需求;否则,虽然一定程度上该在线视频满足观影需求,但可能不是最佳匹配的影片。
传统的在线视频标签生成方法包括三个步骤,如图1所示:
步骤00、建设在线视频标签库。
通过领域知识建立一个在线视频标签库。
步骤02、为每个在线视频标注标签内容。
对每一个在线视频,选择标签库中的一个或多个标签作为在线视频的标签内容。
步骤04、基于终端的评分计算在线视频所有标签的标签强度。
对于每一个在线视频,通过终端对在线视频的全部标签内容进行投票或打分,用得到的分数,通过计算得到全部标签内容的标签强度。
由于传统的在线视频标签生成方法需要对每个在线视频标注标签内容,工作量巨大,成本高;而且部分在线视频可能缺少标签内容,或者部分在线视频的标签强度不准确。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种在线视频标签生成系统和相应的标签生成方法。
根据本发明的一个方面,提供了一种在线视频标签生成方法。
本发明实施例中,计算各在线视频的原始标签矩阵,并计算各在线视频的相似度矩阵;其中,各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵,各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵;基于各在线视频的相似度矩阵和各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵;基于各在线视频的原始标签矩阵和各在线视频的候选标签矩阵,判断各在线视频的候选标签矩阵是否符合预置条件;当符合预置条件时,基于各在线视频的候选标签矩阵,确定各在线视频的更新的标签。
根据本发明的另一个方面,提供了一种在线视频标签生成系统。
本发明实施例中,原始标签矩阵计算模块,适于计算各在线视频的原始标签矩阵;其中,各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵;相似度矩阵计算模块,适于计算各在线视频的相似度矩阵;其中,各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵;候选标签矩阵计算模块,适于基于各在线视频的相似度矩阵和各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵;循环操作模块,适于基于各在线视频的原始标签矩阵和各在线视频的候选标签矩阵,判断各在线视频的候选标签矩阵是否符合预置条件;当符合预置条件时,基于各在线视频的候选标签矩阵,确定各在线视频的更新的标签。
根据本发明实施例的在线视频标签生成方法和系统,可以基于各在线视频的观看数据和评分数据,确定各在线视频中相似的在线视频;在相似的在线视频之间,确定在线视频的相似度矩阵和传递的标签内容;根据在线视频的相似度矩阵逐步计算得到候选标签矩阵,进一步判断候选标签矩阵是否符合预置条件,基于符合预置条件的候选标签矩阵确定各在线视频的新的标签内容和标签强度,由此解决了背景技术中需要标注每个在线视频的标签内容,以及标签强度不准确的问题,取得了节省标注标签内容的成本,提高了标签内容和标签强度准确率的有益效果。
而且,根据本发明实施例的在线视频标签生成方法和系统,可以基于各在线视频的观看数据和评分数据,确定各在线视频中相似的在线视频;在相似的在线视频之间,确定在线视频的相似度矩阵和传递的标签内容;根据在线视频的相似度矩阵逐步计算得到候选标签矩阵,进一步判断候选标签矩阵是否符合预置条件,基于符合预置条件的候选标签矩阵确定各在线视频的新的标签内容和标签强度;再结合符合预置条件的候选标签矩阵和对应终端的终端在线视频矩阵,计算得到所述终端的在线视频推荐矩阵,将各在线视频中权值高的在线视频作为推荐的在线视频。由此解决了背景技术中需要标注每个在线视频的标签内容,以及标签强度不准确和在线视频推荐结果不准确的问题,取得了节省标注标签内容的成本,提高了标签内容、标签强度和在线视频推荐准确率的有益效果。
并且,根据本发明实施例的在线视频标签生成方法和系统,可以基于各在线视频的观看数据和评分数据,确定各在线视频中相似的在线视频;在相似的在线视频之间,确定在线视频的相似度矩阵和传递的标签内容;根据在线视频的相似度矩阵逐步计算得到候选标签矩阵,进一步判断候选标签矩阵是否符合预置条件,基于符合预置条件的候选标签矩阵确定各在线视频的新的标签内容和标签强度;再结合符合预置条件的候选标签矩阵和对应终端的终端在线视频矩阵,计算得到所述终端的在线视频推荐矩阵,将各在线视频中权值高的在线视频作为推荐的在线视频;根据数据库中的查询结果,将推荐的在线视频发送至终端。由此解决了背景技术中需要标注每个在线视频的标签内容,以及标签强度不准确和在线视频推荐结果不准确的问题,取得了节省标注标签内容的成本,提高了标签内容、标签强度和在线视频推荐准确率的有益效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了背景技术中在线视频标签生成方法示意图;
图2示出了根据本发明一个实施例的一种在线视频标签生成方法流程图;
图3示出了根据本发明一个实施例的一种在线视频标签生成方法流程图;
图4示出了根据本发明一个实施例的一种在线视频标签生成方法示意图;
图5示出了根据本发明一个实施例的一种在线视频标签生成系统结构图;
图6示出了根据本发明一个实施例的一种在线视频标签生成系统结构图;
图7示出了根据本发明一个实施例的一种在线视频标签生成系统示意图;
图8示出了根据本发明一个实施例的一种在线视频推荐方法流程图;
图9示出了根据本发明一个实施例的一种在线视频推荐方法流程图;
图10示出了根据本发明一个实施例的一种在线视频推荐系统结构图;
图11示出了根据本发明一个实施例的一种在线视频推荐系统结构图;
图12示出了根据本发明一个实施例的一种在线视频处理系统示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例可以应用于计算机系统/服务器,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与计算机系统/服务器一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
随着在线视频数量的快速增长,对在线视频标注标签内容的工作量也明显增多,付出的成本相应地提高。而且还可能出现在线视频缺少标签内容的情况,例如,在线视频“无间道”,因为不确定会拍系列剧集,标注的标签内容为“香港”、“警匪”、“动作”;在线视频“无间道2”和“无间道3”上线后,标注“无间道2”的标签内容为“无间道系列”、“香港”、“动作”;在线视频“无间道3”的标签内容为“无间道系列”、“香港”、“警匪”。在线视频“无间道”也属于“无间道系列”,但是在线视频“无间道”缺少标签内容“无间道系列”。当终端搜索“无间道系列”时,无法找到在线视频“无间道”。
虽然一个在线视频的标签内容的标签强度可以基于终端的评分动态更新,但是对于新上线的在线视频和低热度的在线视频来说,由于主动打分的终端的比率偏低,打分数据存在数据稀疏问题,例如:在线视频“无间道2”刚上线时,只有一个终端对其标签内容“无间道系列”、“香港”、“动作”进行了评分,未对标签内容“警匪”进行评分。根据各标签内容的终端评分计算得到的标签强度分别为“无间道系列”:0.57,“动作”:0.57,“香港”:0.57,“警匪”:0。因此在搜索“香港警匪电影”时,由于在线视频“无间道2”的标签内容“警匪”的标签强度为0,所以搜索结果中不会返回“无间道2”,标签内容“警匪”的标签强度准确率低。
为此,本发明实施例公开了一种在线视频标签生成方法和系统。
下面通过列举几个具体的实施例详细介绍本发明公开的一种在线视频推荐及标签生成方法和系统、处理系统。
实施例一
详细介绍本发明实施例公开的一种在线视频标签生成方法。
参考图2,示出了本发明实施例中一种在线视频标签生成方法流程图。
步骤100,计算各在线视频的原始标签矩阵。
上述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵。
上述各在线视频可以指几个标签内容相似的在线视频,各在线视频的标签内容是从已经创建的标签库中选择出来,各在线视频的标签内容可以完全相同,也可以部分相同。
例如,在在线视频的标签库中,为3个在线视频V1、V2和V3选择5个标签作为3个在线视频的标签内容,分别为标签t1、t2、t3、t4和t5。具体对应关系为:
V1的标签内容为t1、t3、t4、t5;
V2的标签内容为t1、t2、t4、t5;
V3的标签内容为t1、t2、t3、t5。
由于上述3个在线视频V1、V2和V3的标签内容均从标签t1、t2、t3、t4和t5中选择,可以认为上述3个在线视频V1、V2和V3为相似的在线视频。
通过获取各在线视频的标签内容的评分数据,进行归一化处理后,计算得到各在线视频的原始标签矩阵。
例如,获取5个在线视频的标签内容的评分数据,得到矩阵D。
D = 1 2 3 0 0 0 3 0 7 0 0 0 5 0 0 0 0 0 10 4 0 0 3 0 4
其中,第一行的数值表示在线视频V1的标签内容t1、t2、t3的评分分别是1、2、3分,标签内容t4和t5没有评分数据;第二行的数值表示在线视频V2的标签内容t2和t4的评分分别为3和7,标签内容t1、t3和t5没有评分数据;其他同理。
对矩阵D进行归一化处理后得到各在线视频的原始标签矩阵,即VIDEO_TAG矩阵。
VIDEO _ TAG = 0.26 0.53 0.80 0 0 0 0.39 0 0.91 0 0 0 1 0 0 0 0 0 0.92 0.37 0 0 0.6 0 0.8
上述原始标签矩阵VIDEO_TAG中的各行为各在线视频,各列的列名为各在线视频的标签内容,各列的数值为标签强度。
上述归一化处理是一种简化计算的方式,即将有量纲的各在线视频的评分数据,经过变换,化为无量纲的评分数据,成为纯量。
上述归一化处理的目的是为了保证后续步骤计算得到的相似度矩阵的稳定性,每个视频与所有视频相似度之和应该为1,即VIDEO_TAG矩阵每行平方和为1。实际计算时,只需要计算每行相似度的平方和,用每个相似度值除以该平方和即可保证相似度之和为1。
步骤102,计算各在线视频的相似度矩阵。
上述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵。
可以通过获取终端观看在线视频的历史记录,形成终端在线视频矩阵,再根据终端在线视频矩阵得到在线视频终端矩阵,然后根据终端在线视频矩阵和在线视频终端矩阵,计算得到各在线视频的相似度矩阵。
上述终端在线视频矩阵中的各行为各终端,各列为各在线视频,各列的数值表示该终端是否观看过该在线视频。上述在线视频终端矩阵中的各行为各在线视频,各列为各终端,各列的数值表示该在线视频是否被该终端观看过。上述各在线视频的相似度矩阵中的各行各列均为各在线视频,各数值为某在线视频与其他在线视频的相似度。
上述步骤100和上述步骤102可以并列执行也可以顺序执行。
步骤104,基于上述各在线视频的相似度矩阵和上述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵。
在上述步骤100和上述步骤102分别计算得到各在线视频的原始标签矩阵和各在线视频的相似度矩阵之后,根据上述各在线视频的相似度矩阵和上述各在线视频的原始标签矩阵,通过逐步计算,得到各在线视频的候选标签矩阵。
上述各在线视频的候选标签矩阵中各行为各在线视频,各列的列名为各在线视频的候选标签内容,各列的数值为候选标签强度。
步骤106,基于上述各在线视频的原始标签矩阵和上述各在线视频的候选标签矩阵,判断上述各在线视频的候选标签矩阵是否符合预置条件。
上述预置条件可以是矩阵的每个值均小于某相似性阈值。相似性阈值可以基于动态相似性计算的相关学术论文设定为0.5。相似性阈值越小,计算时间越长,实际方法使用时可以结合具体情况适当调整。
根据上述步骤100计算得到的各在线视频的原始标签矩阵,和上述步骤104计算得到的各在线视频的候选标签矩阵,综合判断上述步骤104计算得到的各在线视频的候选标签矩阵是否可以为合适的、准确的候选标签矩阵。
判断的条件可以在本发明实施例公开的一种在线视频标签生成方法之前,根据实际情况预先设置,例如,可以将上述各在线视频的候选标签矩阵中的每个数值与一个预先设置的数值进行比较,根据具体的比较结果,确定上述各在线视频的候选标签矩阵是否为合适的、准确的标签矩阵。
步骤108,当符合上述预置条件时,基于上述各在线视频的候选标签矩阵,确定各在线视频的更新的标签。
如果上述步骤106判断上述各在线视频的候选标签矩阵符合预先设置的判断条件,如,矩阵中的每个值均小于0.5,则可以根据上述各在线视频的候选标签矩阵得到各在线视频的更新的标签。
上述更新的标签区别于各在线视频的原始标签。可以表现在更新了标签内容和标签强度,或者只更新了标签内容或标签强度中的其中一种。
综上所述,本发明实施例公开的一种在线视频标签生成方法,与背景技术相比,具有以下优点:
首先,在相似的在线视频之间,通过计算得到各在线视频与其他在线视频的相似度,根据各在线视频的原始标签和各在线视频的相似度,确定各在线视频的候选标签,进一步判断候选标签是否为准确的标签。可以根据各在线视频的原始标签动态确定各在线视频的新的标签,减少了对每个在线视频分别标注标签内容和计算标签强度的工作量,降低的工作成本。
其次,通过确定各在线视频的新的标签,新的标签相比原始标签,可以增加了标签内容,同时,根据新的标签计算得到的新的标签的标签强度,提高了标签内容和标签强度的准确率。
实施例二
详细介绍本发明实施例公开的一种在线视频标签生成方法。
参考图3,示出了本发明实施例中一种在线视频标签生成方法流程图。
步骤200,计算各在线视频的原始标签矩阵。
上述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵。
各在线视频的原始标签矩阵可以表示为VIDEO_TAG,原始标签矩阵中的每行数值对应一个在线视频,原始标签矩阵包括几行数值,表示有几个在线视频;原始标签矩阵中的每列数值的列名为各在线视频的标签内容;每列数值为标签内容的标签强度。例如,通过各在线视频的标签评分数据,得到矩阵D。
D = 1 2 3 0 0 0 3 0 7 0 0 0 5 0 0 0 0 0 10 4 0 0 3 0 4
再根据矩阵D进行归一化处理后,得到各在线视频的原始标签矩阵VIDEO_TAG。
VIDEO _ TAG = 0.26 0.53 0.80 0 0 0 0.39 0 0.91 0 0 0 1 0 0 0 0 0 0.92 0.37 0 0 0.6 0 0.8
步骤202,计算各在线视频的相似度矩阵。
上述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵。
上述步骤202,具体可以包括:
子步骤2021,获取终端在线视频矩阵。
上述终端在线视频矩阵的各行表示各终端,上述终端在线视频矩阵的各列表示各在线视频,上述终端在线视频矩阵的各数值表示各终端与各在线视频的对应关系。
上述终端可以通过识别终端的cookies或者身份识别号码(Identity,ID)进行确定。
可以根据终端在一定时间内的观看在线视频的历史记录,确定终端在线视频矩阵。
例如,统计得到4个终端C1、C2、C3和C4在10天内观看的在线视频分别为:
C1:V1、V2、V3;
C2:V2、V3、V4;
C3:V2、V3、V5;
C4:V1、V4、V5;
其表示终端C1在10天的时间内观看了在线视频V1、V2和V3;终端C2在10天的时间内观看了在线视频V2、V3、V4;终端C3在10天的时间内观看了在线视频V2、V3、V5;终端C4在10天的时间内观看了在线视频V1、V4、V5。并且,这5个在线视频为相似的在线视频。
由此,可以得到终端在线视频矩阵COOKIE_VIDEO。
COOKIE _ VIDEO = 1 1 1 0 0 0 1 1 1 0 0 1 1 0 1 1 0 0 1 1
其中,终端在线视频矩阵COOKIE_VIDEO的第一行数值表示终端C1观看了在线视频V1、V2和V3;第二行数值表示终端C2观看了在线视频V2、V3和V4;第三行数值表示终端C3观看了在线视频V2、V3和V5;第四行数值表示终端C4观看了在线视频V1、V4和V5。
上述一定时间也可以为其他规定或者设定的时间,如1个月、20天等等。也可以统计8个或5个终端的观看在线视频的历史记录,此处不应该理解为对时间和终端数量的限定。
子步骤2022,将上述终端在线视频矩阵进行转置操作,得到在线视频终端矩阵。
上述在线视频终端矩阵的各行表示各在线视频,上述在线视频终端矩阵的各列表示各终端,上述在线视频终端矩阵的各数值表示各在线视频与各终端的对应关系。
例如,将上述子步骤2021中得到的终端在线视频矩阵COOKIE_VIDEO,进行转置操作,得到在线视频终端矩阵VIDEO_COOKIE。
VIDEO _ COOKIE = 1 0 0 1 1 1 1 0 1 1 1 0 0 1 0 1 0 0 1 1
其中,在线视频终端矩阵VIDEO_COOKIE的第一行数值表示在线视频V1的观看终端为C1和C4;第二行数值表示在线视频V2的观看终端为C1、C2和C3;第三行数值表示在线视频V3的观看终端为C1、C2和C3;第四行数值表示在线视频V4的观看终端为C2和C4;第五行数值表示在线视频V5的观看终端为C3和C4。
子步骤2023,根据上述终端在线视频矩阵和上述在线视频终端矩阵,基于关联规则计算得到上述各在线视频的相似度矩阵。
上述子步骤2023,具体可以包括:
(a)计算每个在线视频与其他在线视频的相似度。
根据上述在线视频终端矩阵,依次确定各在线视频中的每个在线视频i与各在线视频中除该在线视频之外的在线视频j共现终端的数量。将上述共现终端的数量与上述在线视频j的终端数量相除,得到该在线视频i与在线视频j的相似度。其中,i=1、2……n,j=1、2……n,n为各在线视频的数量,n为正整数,i≠j。
具体可以为,根据公式Sim(Vi|Vj)=Vi,Vj共现的终端数/Vj含有终端数,Sim(Vi|Vj)表示Vi与Vj的相似度。
例如,在线视频V1和V2共现的终端为C1,则共现的终端数为1。在线视频V2的观看终端为C1、C2和C3,则在线视频V2含有的终端数为3。Sim(V1|V2)=1/3。
如果两个在线视频共现的终端数为0,则Sim(Vi|Vj)=0,否则Sim(Vi|Vj)>0。
(b)对上述相似度进行归一化处理,得到相似度矩阵VIDEO_VIDEO。
VIDEO _ VIDEO = _ 0.25 0.25 0.25 0.25 0.17 _ 0.50 0.17 0.17 0 . 17 0.50 _ 0.17 0.17 0.25 0.25 0.25 _ 0.25 0.25 0.25 0.25 0.25 _
其中,相似度矩阵VIDEO_VIDEO的第一行数值表示在线视频V1与在线视频V2、V3、V4和V5的相似度均为0.25;第二行数值表示在线视频V2与在线视频V1、V3、V4和V5的相似度分别为0.17、0.50、0.17和0.17;第三行数值表示在线视频V3与在线视频V1、V2和V4、V5的相似度分别为0.17、0.50、0.17和0.17;第四行数值表示在线视频V4与在线视频V1、V2、V3和V5的相似度均为0.25;第五行数值表示在线视频V5与在线视频V1、V2、V3和V4的相似度均为0.25。
步骤204,基于上述各在线视频的相似度矩阵和上述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵。
上述步骤204,具体可以包括:
子步骤2041,基于上述各在线视频的原始标签矩阵和上述各在线视频的相似度矩阵,计算得到各在线视频的传递的标签矩阵。
上述子步骤2041,具体可以包括:
(a)对原始标签矩阵中各在线视频中的每个在线视频,遍历各在线视频中除该在线视频之外的在线视频;基于相似度矩阵判断该在线视频与各在线视频中除该在线视频之外的在线视频的相似度是否大于0。
对于每个在线视频Vi,遍历其他的在线视频,判断相似度Sim(Vi|Vj)是否大于0。
当相似度大于0时,将该在线视频的当前标签内容作为传递的标签内容,将相似度与该在线视频的当前标签强度相乘作为传递的标签强度。
如果Sim(Vi|Vj)>0,进行如下传递计算:
将各在线视频的标签内容加入到传递的标签的标签内容。
视频相似度乘以标签强度为传递的标签的标签强度。
当相似度等于0时,表示两个在线视频不相似,不确定传递的标签内容和传递的标签强度。
(b)生成传递的标签矩阵TRANS_VIDEO_TAG。
将上述各在线视频的原始标签矩阵和上述各在线视频的相似度矩阵相乘,计算得到各在线视频的传递的标签矩阵。
TRANS_VIDEO_TAG=VIDEO_TAG×VIDEO_VIDEO。
TRANS _ VIDEO _ TAG = 0 0.1 0.4 0.46 0.29 0.04 0.09 0.74 0.16 0.20 0.04 0.29 0.24 0.61 0.20 0.07 0.23 0.6 0.23 0.2 0.65 0.23 0.45 0.46 0.1
其中,传递的标签矩阵TRANS_VIDEO_TAG第一行数值表示在线视频V1传递的标签内容和标签强度分别为t1:0、t2:0.1、t3:0.4、t4:0.46、t5:0.29(t1至t5为标签内容);第二行数值表示在线视频V2传递的标签内容和标签强度分别为t1:0.04、t2:0.09、t3:0.74、t4:0.16、t5:0.20;第三行数值表示在线视频V3传递的标签内容和标签强度分别为t1:0.04、t2:0.09、t3:0.24、t4:0.61、t5:0.20;第四行数值表示在线视频V4传递的标签内容和标签强度分别为t1:0.07、t2:0.23、t3:0.6、t4:0.23、t5:0.2;第五行数值表示在线视频V5传递的标签内容和标签强度分别为t1:0.65、t2:0.23、t3:0.45、t4:0.46、t5:0.1。
子步骤2042,基于上述各在线视频的原始标签矩阵和上述各在线视频的传递的标签矩阵,计算得到各在线视频的候选标签矩阵。
根据h=y×q+c×(1-q)×y计算得到各在线视频的候选标签矩阵。
其中,h为各在线视频的候选标签矩阵,y为各在线视频的原始标签矩阵,q为原始标签权值,0<q<1,c为各在线视频的传递的标签矩阵。
例如,设定原始标签权值q为0.5,则各在线视频的候选标签矩阵NEW_VIDEO_TAG=VIDEO_TAG×0.5+TRANS_VIDEO_TAG×(1-0.5)VIDEO_TAG。
NEW _ VIDEO _ TAG = 0.13 0.32 0.6 0.23 0.15 0.02 0.24 0.37 0.53 0.10 0.02 0.14 0.62 0.30 0.10 0.03 0.12 0.30 0.57 0.28 0.03 0.12 0.52 0.23 0.45
其中,候选标签矩阵NEW_VIDEO_TAG的第一行数值表示在线视频V1的新的标签内容和标签强度分别为t1:0.13、t2:0.32、t3:0.6、t4:0.23、t5:0.15;第二行数值表示在线视频V2的新的标签内容和标签强度分别为t1:0.02、t2:0.24、t3:0.37、t4:0.53、t5:0.10;第三行数值表示在线视频V3的新的标签内容和标签强度分别为t1:0.02、t2:0.14、t3:0.62、t4:0.30、t5:0.10;第四行数值表示在线视频V4的新的标签内容和标签强度分别为t1:0.03、t2:0.12、t3:0.30、t4:0.57、t5:0.28;第五行数值表示在线视频V5的新的标签内容和标签强度分别为t1:0.03、t2:0.12、t3:0.52、t4:0.23、t5:0.45。
上述各在线视频的候选标签矩阵的标签内容为上述各在线视频的原始标签矩阵的标签内容和上述各在线视频的传递的标签矩阵的标签内容的合集。
上述各在线视频的候选标签矩阵的标签强度为上述各在线视频的原始标签矩阵的标签强度和上述各在线视频的传递的标签矩阵的标签强度的线性组合。
步骤206,基于上述各在线视频的原始标签矩阵和上述各在线视频的候选标签矩阵,判断上述各在线视频的候选标签矩阵是否符合预置条件。
上述步骤206,具体可以包括:
子步骤2061,基于上述各在线视频的原始标签矩阵和上述各在线视频的候选标签矩阵,计算得到各在线视频的差异标签矩阵。
将上述各在线视频的候选标签矩阵和上述各在线视频的原始标签矩阵中对应的标签强度做差,计算得到各在线视频的差异标签矩阵。
例如,各在线视频的差异标签矩阵为
DIFF_VIDEO_TAG=NEW_VIDEO_TAG-VIDEO_TAG。
DIFF _ VIDEO _ TAG = - 0.13 - 0.21 - 0.2 0.23 0.15 0.02 - 0.15 0.37 - 0.37 0.10 0.02 0.14 - 0.38 0.30 0.10 0.03 0.11 0.30 - 0.35 - 0.08 0.03 0.11 - 0.07 0.22 - 0.35
子步骤2062,将上述各在线视频的差异标签矩阵中的各个数值与预置的差异阈值进行比较;基于比较结果判断上述各在线视频的候选标签矩阵是否符合预置条件。
其中,差异阈值的具体取值可以根据实际情况确定。
例如,上述预置的差异阈值为0.05,将上述各在线视频的差异标签矩阵中的每个数值与预置的差异阈值进行比较。
当上述各在线视频的差异标签矩阵中的各个数值均小于上述差异阈值时,上述各在线视频的候选标签矩阵符合预置条件。
当上述各在线视频的差异标签矩阵中的各个数值中,至少一个数值大于等于上述差异阈值时,上述各在线视频的候选标签矩阵不符合预置条件。
上述比较具体可以为将上述各在线视频的差异标签矩阵中的各个数值的绝对值与预置的差异阈值进行比较。
上述各在线视频的差异标签矩阵DIFF_VIDEO_TAG中的每个数值与上述预置的差异阈值0.05进行比较后得知,上述各在线视频的候选标签矩阵不符合预置条件。
步骤208,当符合上述预置条件时,基于上述各在线视频的候选标签矩阵,确定各在线视频的更新的标签。
如果上述各在线视频的差异标签矩阵符合预置条件,上述各在线视频的候选标签矩阵中的标签内容和标签强度为各在线视频的新的标签内容和标签强度。
步骤210,当不符合上述预置条件时,将上述各在线视频的候选标签矩阵作为上述各在线视频的原始标签矩阵,进入计算各在线视频的下一个候选标签矩阵和判断各在线视频的下一个候选标签矩阵是否符合预置条件的循环操作,直至各在线视频的下一个候选标签矩阵符合预置条件为止。
上述子步骤2061中计算得到的各在线视频的差异标签矩阵中,包含大于上述阈值的差异阈值0.05的数值,则上述各在线视频的差异标签矩阵不符合上述预置条件。
将上述各在线视频的候选标签矩阵NEW_VIDEO_TAG作为上述各在线视频的原始标签矩阵VIDEO_TAG进行上述步骤204至上述步骤206。如果计算得到的差异标签矩阵任然不符合预置条件,重复上述操作。
通过上述3轮重复操作后,得到各在线视频的差异标签矩阵DIFF_VIDEO_TAG3。
DIFF _ VIDEO _ TAG 3 = - 0.02 - 0.03 - 0.03 0.04 0.01 0.00 - 0.01 0.02 - 0.03 0.02 0.00 0.01 - 0.02 0.01 0.02 0.00 0.02 0.04 - 0.04 - 0.02 0.00 0.02 - 0.01 0.04 - 0.03
上述各在线视频的差异标签矩阵DIFF_VIDEO_TAG3中各个数值的绝对值均小于差异阈值0.05,上述各在线视频的差异标签矩阵DIFF_VIDEO_TAG3符合上述预置条件。
此时的候选标签矩阵NEW_VIDEO_TAG3为
NEW _ VIDEO _ TAG 3 = 0.06 0.21 0.50 0.36 0.20 0.04 0.20 0.48 0.40 0.17 0.04 0.19 0.49 0.38 0.17 0.04 0.17 0.45 0.40 0.22 0.04 0.17 0.49 0.36 0.24
则在线视频V1的新标签的标签内容和标签强度分别为t1:0.06、t2:0.21、t3:0.50、t4:0.36、t5:0.20;在线视频V2的新标签的标签内容和标签强度分别为t1:0.04、t2:0.20、t3:0.48、t4:0.40、t5:0.17;在线视频V3的新标签的标签内容和标签强度分别为t1:0.04、t2:0.19、t3:0.49、t4:0.38、t5:0.17;在线视频V4的新标签的标签内容和标签强度分别为t1:0.04、t2:0.17、t3:0.45、t4:0.40、t5:0.22;在线视频V5的新标签的标签内容和标签强度分别为t1:0.04、t2:0.17、t3:0.49、t4:0.36、t5:0.24。
将上述候选标签矩阵NEW_VIDEO_TAG3与上述步骤200获取到的原始标签矩阵相比,可以发现:
在线视频V1新增了标签(t4:0.36和t5:0.20),即标签t4和t5能够通过相似的在线视频传递给在线视频V1。
在线视频V1的新标签(t1:0.06和t4:0.36)相对于原始标签(t1:0.26和t4:0)更新了标签强度。
如果按照背景技术中的方法,需要对在线视频V1增加标签t4和t5,并且要计算t1至t5各个标签的新的标签强度。尤其是在各个标签的评分数据稀疏时,很难计算得到各个标签的新的标签强度,即使计算出来,也不准确。本发明实施例公开的一种在线视频标签生成方法通过在各相似在线视频之间动态传递标签内容,计算得到新的标签内容的标签强度,不需要对每个在线视频标注标签内容且计算各标签内容的标签强度,减少了标注标签的工作量,节省了工作成本;而且通过确定各在线视频的新的标签,根据新的标签计算得到的新的标签的标签强度,提高了标签内容和标签强度的准确率。
实施例三
详细介绍本发明实施例公开的一种在线视频标签生成方法。
参考图4,示出了本发明实施例中一种在线视频标签生成方法示意图。
步骤300,基于在线视频领域知识,建设在线视频标签库。
上述在线视频标签库中包括标签内容。步骤302,统计一个周期内的终端观看在线视频的历史记录,形成终端在线视频矩阵。
步骤304,将终端在线视频矩阵转置,形成在线视频终端矩阵。
步骤306,计算在线视频相似度,生成在线视频相似度矩阵。
步骤308,计算原始标签矩阵,并结合相似度矩阵,计算得到传递的标签矩阵。
步骤310,基于原始标签矩阵和传递的标签矩阵,生成新标签矩阵。
步骤312,基于原始标签矩阵和新标签矩阵,生成差异标签矩阵。
步骤314,判断差异标签矩阵是否小于预置的差异阈值。
步骤316,如果大于等于,用新标签矩阵替代原始标签矩阵。返回步骤308进行迭代计算。
步骤318,如果小于,将新标签发布到在线视频搜索和推荐系统。
综上所述,本发明实施例公开的一种在线视频标签生成方法,与现有技术相比,具有以下优点:
本发明实施例通过计算各在线视频相似度,得到各在线视频相似度矩阵,将各在线视频的标签在相似的在线视频间进行转移,实现了各在线视频标签的动态生成,不需要专家人工标注,节省了标注在线视频标签的成本。
而且,根据各在线视频的相似度矩阵,实现了标签内容的动态生成,提高了标签内容的准确性。
并且,通过对标签内容和标签强度的迭代计算,动态修正了标签强度,提高了标签强度的准确率。
实施例四
详细介绍本发明实施例公开的一种在线视频标签生成系统。
参考图5,示出了本发明实施例中一种在线视频标签生成系统结构图。
上述一种在线视频标签生成系统,具体可以包括:
原始标签矩阵计算模块10,相似度矩阵计算模块12,候选标签矩阵计算模块14,以及,循环操作模块16。
下面分别详细介绍各模块的功能以及各模块之间的关系。
原始标签矩阵计算模块10,适于计算各在线视频的原始标签矩阵。
其中,上述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵。
上述各在线视频可以指几个标签内容相似的在线视频。
上述原始标签矩阵计算模块10通过获取各在线视频的标签内容的评分数据,进行归一化处理后,计算得到各在线视频的原始标签矩阵。
上述原始标签矩阵中的各行为各在线视频,各列的列名为各在线视频的标签内容,各列的数值为标签强度。
相似度矩阵计算模块12,适于计算各在线视频的相似度矩阵。
其中,上述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵。
上述相似度矩阵计算模块12可以通过获取终端观看在线视频的历史记录,形成终端在线视频矩阵,再根据终端在线视频矩阵得到在线视频终端矩阵,然后根据终端在线视频矩阵和在线视频终端矩阵,计算得到各在线视频的相似度矩阵。
上述终端在线视频矩阵中的各行为各终端,各列为各在线视频,各列的数值表示该终端是否观看过该在线视频。上述在线视频终端矩阵中的各行为各在线视频,各列为各终端,各列的数值表示该在线视频是否被该终端观看过。上述各在线视频的相似度矩阵中的各行各列均为各在线视频,各数值为某在线视频与其他在线视频的相似度。
候选标签矩阵计算模块14,适于基于上述各在线视频的相似度矩阵和上述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵。
上述各在线视频的候选标签矩阵中各行为各在线视频,各列的列名为各在线视频的候选标签内容,各列的数值为候选标签强度。
循环操作模块16,适于基于上述各在线视频的原始标签矩阵和上述各在线视频的候选标签矩阵,判断上述各在线视频的候选标签矩阵是否符合预置条件;当符合上述预置条件时,基于上述各在线视频的候选标签矩阵,确定各在线视频的更新的标签。
实施例五
详细介绍本发明实施例公开的一种在线视频标签生成系统。
参考图6,示出了本发明实施例中一种在线视频标签生成系统结构图。
上述一种在线视频标签生成系统,具体可以包括:
原始标签矩阵计算模块20,相似度矩阵计算模块22,候选标签矩阵计算模块24,以及,循环操作模块26。
其中,上述相似度矩阵计算模块22,具体可以包括:
终端在线视频矩阵获取子模块221,在线视频终端矩阵确定子模块222,共现终端数量确定子模块223,相似度确定子模块224,以及,归一化处理子模块225。
上述候选标签矩阵计算模块24,具体可以包括:
传递的标签矩阵计算子模块241,以及,候选标签矩阵计算子模块242。
上述循环操作模块26,具体可以包括:
差异标签矩阵计算子模块261,比较子模块262,候选标签矩阵判断子模块263。
其中,上述传递的标签矩阵计算子模块241,具体可以包括:
遍历子单元2411,判断子单元2412,以及,传递的标签确定子单元2413。
下面分别详细介绍各模块、子模块和子单元的功能以及之间的关系。
原始标签矩阵计算模块20,适于计算各在线视频的原始标签矩阵。
其中,上述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵。
例如,上述原始标签矩阵计算模块20通过各在线视频的标签评分数据,得到矩阵D。
D = 1 2 3 0 0 0 3 0 7 0 0 0 5 0 0 0 0 0 10 4 0 0 3 0 4
上述原始标签矩阵计算模块20再根据矩阵D进行归一化处理后,得到各在线视频的原始标签矩阵VIDEO_TAG。
VIDEO _ TAG = 0.26 0.53 0.80 0 0 0 0.39 0 0.91 0 0 0 1 0 0 0 0 0 0.92 0.37 0 0 0.6 0 0.8
相似度矩阵计算模块22,适于计算各在线视频的相似度矩阵。
其中,上述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵。
上述相似度矩阵计算模块22,具体可以包括:
终端在线视频矩阵获取子模块221,适于获取终端在线视频矩阵。
其中,上述终端在线视频矩阵的各行表示各终端,上述终端在线视频矩阵的各列表示各在线视频,上述终端在线视频矩阵的各数值表示各终端与各在线视频的对应关系。
上述终端在线视频矩阵获取子模块221可以根据终端在一定时间内的观看在线视频的历史记录,确定终端在线视频矩阵。
例如,上述终端在线视频矩阵获取子模块221统计得到4个终端C1、C2、C3和C4在10天内观看的在线视频分别为:
C1:V1、V2、V3;
C2:V2、V3、V4;
C3:V2、V3、V5;
C4:V1、V4、V5;
上述终端在线视频矩阵获取子模块221可以得到终端在线视频矩阵COOKIE_VIDEO。
COOKIE _ VIDEO = 1 1 1 0 0 0 1 1 1 0 0 1 1 0 1 1 0 0 1 1
其中,终端在线视频矩阵COOKIE_VIDEO的第一行数值表示终端C1观看了在线视频V1、V2和V3;其他同理。
在线视频终端矩阵确定子模块222,适于将上述终端在线视频矩阵进行转置操作,得到在线视频终端矩阵。
其中,上述在线视频终端矩阵的各行表示各在线视频,上述在线视频终端矩阵的各列表示各终端,上述在线视频终端矩阵的各数值表示各在线视频与各终端的对应关系。
例如,上述在线视频终端矩阵确定子模块222将上述终端在线视频矩阵COOKIE_VIDEO,进行转置操作,得到在线视频终端矩阵VIDEO_COOKIE。
VIDEO _ COOKIE = 1 0 0 1 1 1 1 0 1 1 1 0 0 1 0 1 0 0 1 1
其中,在线视频终端矩阵VIDEO_COOKIE的第一行数值表示在线视频V1的观看终端为C1和C4;其他同理。
共现终端数量确定子模块223,适于根据上述在线视频终端矩阵,依次确定各在线视频中的每个在线视频i与各在线视频中除该在线视频之外的在线视频j共现终端的数量;其中,i=1、2……n,j=1、2……n,n为各在线视频的数量,n为正整数,i≠j。
例如,在线视频V1和V2共现的终端为C1,则上述共现终端数量确定子模块223确定在线视频V1和V2共现的终端数为1。
相似度确定子模块224,适于将上述共现终端的数量与上述在线视频j的终端数量相除,得到该在线视频i与在线视频j的相似度。
具体可以为,相似度确定子模块224根据公式Sim(Vi|Vj)=Vi,Vj共现的终端数/Vj含有终端数,Sim(Vi|Vj)表示Vi与Vj的相似度。
例如,在线视频V2的观看终端为C1、C2和C3,则在线视频V2含有的终端数为3。上述相似度确定子模块224在线视频V1和V2共现的终端数1与在线视频V2含有的终端数3相除,得到在线视频V1与在线视频V2的相似度为1/3。
如果两个在线视频共现的终端数为0,则这两个在线视频的相似度为0。
归一化处理子模块225,适于对上述相似度进行归一化处理,得到上述各在线视频的相似度矩阵。
上述归一化处理子模块225对上述相似度进行归一化处理,得到相似度矩阵VIDEO_VIDEO。
VIDEO _ VIDEO = _ 0.25 0.25 0.25 0.25 0.17 _ 0.50 0.17 0.17 0 . 17 0.50 _ 0.17 0.17 0.25 0.25 0.25 _ 0.25 0.25 0.25 0.25 0.25 _
其中,相似度矩阵VIDEO_VIDEO的第一行数值表示在线视频V1与在线视频V2、V3、V4和V5的相似度均为0.25;其他同理。
候选标签矩阵计算模块24,适于基于上述各在线视频的相似度矩阵和上述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵。
上述候选标签矩阵计算模块24,具体可以包括:
传递的标签矩阵计算子模块241,适于基于上述各在线视频的原始标签矩阵和上述各在线视频的相似度矩阵,计算得到各在线视频的传递的标签矩阵。
上述传递的标签矩阵计算子模块241,具体可以包括:
遍历子单元2411,适于对原始标签矩阵中各在线视频中的每个在线视频,遍历各在线视频中除该在线视频之外的在线视频。
上述遍历子单元2411对于每个在线视频Vi,遍历其他的在线视频。
判断子单元2412,适于基于相似度矩阵判断该在线视频与各在线视频中除该在线视频之外的各在线视频的相似度是否大于0。
上述判断子单元2412判断在线视频Vi和在线视频Vj的相似度是否大于0。
传递的标签确定子单元2413,适于当相似度大于0时,将该在线视频的当前标签内容作为传递的标签内容,将相似度与该在线视频的当前标签强度相乘作为传递的标签强度。
上述传递的标签矩阵计算子模块241将上述各在线视频的原始标签矩阵和上述各在线视频的相似度矩阵相乘,计算得到各在线视频的传递的标签矩阵。
TRANS_VIDEO_TAG=VIDEO_TAG×VIDEO_VIDEO。
TRANS _ VIDEO _ TAG = 0 0.1 0.4 0.46 0.29 0.04 0.09 0.74 0.16 0.20 0.04 0.29 0.24 0.61 0.20 0.07 0.23 0.6 0.23 0.2 0.65 0.23 0.45 0.46 0.1
其中,传递的标签矩阵TRANS_VIDEO_TAG第一行数值表示在线视频V1传递的标签内容和标签强度分别为t1:0、t2:0.1、t3:0.4、t4:0.46、t5:0.29(t1至t5为标签内容);其他同理。
候选标签矩阵计算子模块242,适于基于上述各在线视频的原始标签矩阵和上述各在线视频的传递的标签矩阵,计算得到各在线视频的候选标签矩阵。
上述候选标签矩阵计算子模块242根据h=y×q+c×(1-q)×y计算得到各在线视频的候选标签矩阵。
其中,h为各在线视频的候选标签矩阵,y为各在线视频的原始标签矩阵,q为原始标签权值,c为各在线视频的传递的标签矩阵。
例如,设定原始标签权值q为0.5,则上述候选标签矩阵计算子模块242计算得到的各在线视频的候选标签矩阵NEW_VIDEO_TAG=VIDEO_TAG×0.5+TRANS_VIDEO_TAG×(1-0.5)VIDEO_TAG。
NEW _ VIDEO _ TAG = 0.13 0.32 0.6 0.23 0.15 0.02 0.24 0.37 0.53 0.10 0.02 0.14 0.62 0.30 0.10 0.03 0.12 0.30 0.57 0.28 0.03 0.12 0.52 0.23 0.45
其中,候选标签矩阵NEW_VIDEO_TAG的第一行数值表示在线视频V1的新的标签内容和标签强度分别为t1:0.13、t2:0.32、t3:0.6、t4:0.23、t5:0.15;其他同理。
上述各在线视频的候选标签矩阵的标签内容为上述各在线视频的原始标签矩阵的标签内容和上述各在线视频的传递的标签矩阵的标签内容的合集。
上述各在线视频的候选标签矩阵的标签强度为上述各在线视频的原始标签矩阵的标签强度和上述各在线视频的传递的标签矩阵的标签强度的线性组合。
循环操作模块26,适于基于上述各在线视频的原始标签矩阵和上述各在线视频的候选标签矩阵,判断上述各在线视频的候选标签矩阵是否符合预置条件;当符合上述预置条件时,基于上述各在线视频的候选标签矩阵,确定各在线视频的更新的标签;当不符合上述预置条件时,将上述各在线视频的候选标签矩阵作为上述各在线视频的原始标签矩阵,并进入上述候选标签矩阵计算模块计算各在线视频的下一个候选标签矩阵和上述循环操作模块判断各在线视频的下一个候选标签矩阵是否符合预置条件的循环操作,直至各在线视频的下一个候选标签矩阵符合预置条件为止。
上述循环操作模块26,具体可以包括:
差异标签矩阵计算子模块261,适于基于上述各在线视频的原始标签矩阵和上述各在线视频的候选标签矩阵,计算得到各在线视频的差异标签矩阵。
例如,上述差异标签矩阵计算子模块261将上述各在线视频的候选标签矩阵和上述各在线视频的原始标签矩阵中对应的标签强度做差,计算得到各在线视频的差异标签矩阵DIFF_VIDEO_TAG。
DIFF_VIDEO_TAG=NEW_VIDEO_TAG-VIDEO_TAG。
DIFF _ VIDEO _ TAG = - 0.13 - 0.21 - 0.2 0.23 0.15 0.02 - 0.15 0.37 - 0.37 0.10 0.02 0.14 - 0.38 0.30 0.10 0.03 0.11 0.30 - 0.35 - 0.08 0.03 0.11 - 0.07 0.22 - 0.35
比较子模块262,适于将上述各在线视频的差异标签矩阵中的各个数值与预置的差异阈值进行比较。
例如,上述预置的差异阈值为0.05,上述比较子模块262将上述各在线视频的差异标签矩阵中的每个数值与预置的差异阈值进行比较。
上述比较具体可以为将上述各在线视频的差异标签矩阵中的各个数值的绝对值与预置的差异阈值进行比较。
候选标签矩阵判断子模块263,适于基于比较结果判断上述各在线视频的候选标签矩阵是否符合预置条件。
当上述各在线视频的差异标签矩阵中的各个数值均小于上述差异阈值时,上述各在线视频的候选标签矩阵符合预置条件。
当上述各在线视频的差异标签矩阵中的各个数值中,至少一个数值大于等于上述差异阈值时,上述各在线视频的候选标签矩阵不符合预置条件。
上述各在线视频的差异标签矩阵DIFF_VIDEO_TAG中的每个数值与上述预置的差异阈值0.05进行比较后得知,上述各在线视频的候选标签矩阵不符合预置条件。
上述循环操作模块26将上述各在线视频的候选标签矩阵NEW_VIDEO_TAG作为上述各在线视频的原始标签矩阵VIDEO_TAG后,重复了3轮操作,得到各在线视频的差异标签矩阵DIFF_VIDEO_TAG3。
DIFF _ VIDEO _ TAG 3 = - 0.02 - 0.03 - 0.03 0.04 0.01 0.00 - 0.01 0.02 - 0.03 0.02 0.00 0.01 - 0.02 0.01 0.02 0.00 0.02 0.04 - 0.04 - 0.02 0.00 0.02 - 0.01 0.04 - 0.03
上述各在线视频的差异标签矩阵DIFF_VIDEO_TAG3中各个数值的绝对值均小于差异阈值0.05,上述各在线视频的差异标签矩阵DIFF_VIDEO_TAG3符合上述预置条件。
此时的候选标签矩阵NEW_VIDEO_TAG3为
NEW _ VIDEO _ TAG 3 = 0.06 0.21 0.50 0.36 0.20 0.04 0.20 0.48 0.40 0.17 0.04 0.19 0.49 0.38 0.17 0.04 0.17 0.45 0.40 0.22 0.04 0.17 0.49 0.36 0.24
则在线视频V1的新标签的标签内容和标签强度分别为t1:0.06、t2:0.21、t3:0.50、t4:0.36、t5:0.20;其他同理。
实施例六
详细介绍本发明实施例公开的一种在线视频标签生成系统。
参考图7,示出了本发明实施例中一种在线视频标签生成系统示意图。
上述一种在线视频标签生成系统,具体可以包括:
在线视频标签库建设模块300,终端观影历史获取模块302,视频相似度计算模块304,传递标签生成模块306,新标签生成模块308,标签差异比较模块310,以及,标签发布模块312。
下面分别详细介绍各模块的功能以及各模块之间的关系。
在线视频标签库建设模块300,适于建设视频标签库全集。
终端观影历史获取模块302,适于从终端历史数据库,统计一段周期内,所有终端COOKIE观看在线视频VIDEO的历史记录,形成终端观影行为矩阵COOKIE_VIDEO。
视频相似度计算模块304,将终端行为观影矩阵COOKIE_VIDEO进行转置计算,生成视频终端矩阵VIDEO_COOKIE。然后基于关联规则,计算视频相似度矩阵VIDEO_VIDEO。
传递标签生成模块306,基于视频相似度矩阵VIDEO_VIDEO和原始标签矩阵VIDEO_TAG,计算传递标签矩阵TRANS_VIDEO_TAG。
新标签生成模块308,基于传递标签矩阵TRANS_VIDEO_TAG和原始标签矩阵VIDEO_TAG,线性组合为新标签矩阵NEW_VIDEO_TAG。
上述原始标签矩阵VIDEO_TAG可以预先计算得到。
标签差异比较模块310,比较原始标签矩阵VIDEO_TAG和新标签矩阵NEW_VIDEO_TAG的差异,生成标签差异矩阵DIFF_VIDEO_TAG。
如果标签差异矩阵DIFF_VIDEO_TAG中的差异值小于某预置的阈值,则说明新标签生成成功,可以用新标签矩阵NEW_VIDEO_TAG替代原始标签矩阵VIDEO_TAG,得到在线视频的新的标签内容和标签强度。否则,用新标签矩阵NEW_VIDEO_TAG替代原始标签矩阵VIDEO_TAG,返回到传递标签生成模块306,迭代计算下一个传递标签矩阵和下一个新标签矩阵。
标签发布模块312,将生成成功的新标签矩阵VIDEO_TAG发布到在线视频搜索系统中。
使用在线视频搜索或在线视频推荐功能时,可以调用最新的标签内容和标签强度,返回终端需求的在线视频结果。
综上所述,本发明实施例公开的一种在线视频标签生成系统,与现有技术相比,具有以下优点:
本发明实施例通过计算各在线视频相似度,得到各在线视频相似度矩阵,将各在线视频的标签在相似的在线视频间进行转移,实现了各在线视频标签的动态生成,不需要对每个在线视频进行标注,节省了标注在线视频标签的成本。
而且,根据各在线视频的相似度矩阵,实现了标签内容的动态生成,提高了标签内容的准确性。
并且,通过对标签内容和标签强度的迭代计算,动态修正了标签强度,提高了标签强度的准确率。
实施例七
详细介绍本发明实施例公开的一种在线视频推荐方法。
参考图8,示出了本发明实施例中一种在线视频推荐方法流程图。
步骤700,计算各在线视频的原始标签矩阵。
其中,所述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵。
步骤702,计算各在线视频的相似度矩阵。
所述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵。
步骤704,基于所述各在线视频的相似度矩阵和所述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵。
步骤706,基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件;当符合所述预置条件时,所述各在线视频的候选标签矩阵为各在线视频的候选矩阵。
步骤708,基于所述各在线视频的候选矩阵和预先获取到的对应终端的终端在线视频矩阵,计算得到所述终端的偏好矩阵。
所述预先获取到的对应终端的终端在线视频矩阵可以为某个终端对应的在线视频矩阵,表现为1行m列的形式,m为在线视频的数量。
在预先获取对应终端的终端在线视频矩阵时,可以根据所述各在线视频的候选矩阵的行数确定对应终端的终端在线视频矩阵的列数,保证所述各在线视频的候选矩阵的行数等于对应终端的终端在线视频矩阵的列数。
步骤710,基于所述各在线视频的候选矩阵和所述终端的偏好矩阵,计算得到所述终端的在线视频推荐矩阵。
所述终端的在线视频推荐矩阵的行表示所述终端,列表示推荐的在线视频,数值为推荐的在线视频的权重。
例如,所述终端的偏好矩阵为1行m列,所述各在线视频的候选矩阵为m行n列,计算得到的所述终端的在线视频推荐矩阵为1行n列。
步骤712,将所述终端的在线视频推荐矩阵中权重排序靠前的至少一个在线视频作为最终推荐的在线视频,显示在所述终端。
例如,所述终端的在线视频推荐矩阵为1行n列的矩阵,其中包括n个数值。将n个数值从大到小排列,可以选择排列靠前的至少一个数值,将这至少一个数值对应的在线视频作为推荐的在线视频显示在所述终端上。
综上所述,本发明实施例公开的一种在线视频推荐方法,与背景技术相比,具有以下优点:
首先,在相似的在线视频之间,通过计算得到各在线视频与其他在线视频的相似度,根据各在线视频的原始标签和各在线视频的相似度,确定各在线视频的候选标签,进一步判断候选标签是否为准确的标签。可以根据各在线视频的原始标签动态确定各在线视频的新的标签,减少了对每个在线视频分别标注标签内容和计算标签强度的工作量,降低的工作成本。
其次,通过确定各在线视频的新的标签,新的标签相比原始标签,可以增加了标签内容,同时,根据新的标签计算得到的新的标签的标签强度,提高了标签内容和标签强度的准确率。
再次,由于各在线视频的标签内容和标签强度的准确率提高,相应地也提高了推荐在线视频准确率。
实施例八
详细介绍本发明实施例公开的一种在线视频推荐方法。
参考图9,示出了本发明实施例中一种在线视频推荐方法流程图。
步骤800,计算各在线视频的原始标签矩阵。
其中,所述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵。
步骤802,计算各在线视频的相似度矩阵。
所述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵。
步骤804,基于所述各在线视频的相似度矩阵和所述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵。
步骤806,基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件;当符合所述预置条件时,所述各在线视频的候选标签矩阵为各在线视频的候选矩阵。
步骤808,基于所述各在线视频的候选矩阵和预先获取到的对应终端的终端在线视频矩阵,计算得到所述终端的偏好矩阵。
所述预先获取到的对应终端的终端在线视频矩阵可以为某个终端对应的在线视频矩阵,表现为1行m列的形式,m为在线视频的数量。
在预先获取对应终端的终端在线视频矩阵时,可以根据所述各在线视频的候选矩阵的行数确定对应终端的终端在线视频矩阵的列数,保证所述各在线视频的候选矩阵的行数等于对应终端的终端在线视频矩阵的列数。
其中,所述对应终端的终端在线视频矩阵的行表示所述终端,列表示在线视频,数值为在线视频的权重。所述终端的偏好矩阵的行表示所述终端,列表示标签内容,数值为标签内容的权重。
具体地,将所述对应终端的终端在线视频矩阵和所述各在线视频的候选矩阵相乘,计算得到所述终端的偏好矩阵。
例如,所述对应终端的终端在线视频矩阵为A=(1×m),所述各在线视频的候选矩阵为B=(m×n),将A×B计算得到所述终端的偏好矩阵C=(1×n)。
步骤810,基于所述各在线视频的候选矩阵和所述终端的偏好矩阵,计算得到所述终端的在线视频推荐矩阵。
所述终端的在线视频推荐矩阵的行表示所述终端,列表示推荐的在线视频,数值为推荐的在线视频的权重。
例如,所述终端的偏好矩阵为1行m列,所述各在线视频的候选矩阵为n行m列,计算得到的所述终端的在线视频推荐矩阵为1行n列。
所述步骤810具体可以包括:
子步骤8101,将所述各在线视频的候选矩阵进行转置操作,得到标签在线视频矩阵。
例如,所述各在线视频的候选矩阵为B=(m×n),将矩阵B进行转置得到标签在线视频矩阵D=(n×m)。
子步骤8102,将所述终端的偏好矩阵与所述标签在线视频矩阵相乘,计算得到所述终端的终端在线视频推荐矩阵。
例如,将所述终端的偏好矩阵C=(1×n)与所述标签在线视频矩阵D=(n×m)相乘,计算得到所述终端的终端在线视频推荐矩阵E=(1×m)。
步骤812,将所述终端的在线视频推荐矩阵中权重排序靠前的至少一个在线视频作为最终推荐的在线视频,显示在所述终端。
例如,所述终端的在线视频推荐矩阵为1行n列的矩阵,其中包括n个数值。将n个数值从大到小排列,选择排序靠前的至少一个数值,将这至少一个数值对应的在线视频作为推荐的在线视频。
步骤814,当不符合所述预置条件时,将所述各在线视频的候选标签矩阵作为所述各在线视频的原始标签矩阵,进入计算各在线视频的下一个候选标签矩阵和判断各在线视频的下一个候选标签矩阵是否符合预置条件的循环操作,直至各在线视频的下一个候选标签矩阵符合预置条件为止。
如果按照背景技术推荐在线视频,推荐过程及结果为:
ID为12345的终端的终端偏好矩阵为:“警匪”0.33、“刘德华”0.33、“梁朝伟”0.33。
各在线视频的原始标签为:“无间道1”:“警匪”、“刘德华”、“梁朝伟”;“无间道3”:“无间道系列”、“刘德华”;“黑金”:“警匪”、“刘德华”。
推荐的在线视频为:“黑金”。
如果按照本发明实施例公开的一种在线视频推荐方法推荐在线视频:
ID为12345的终端的终端偏好矩阵为:“警匪”0.33、“刘德华”0.33、“梁朝伟”0.33。
计算得到各在线视频的新的标签为:“无间道1”:“无间道系列”、“警匪”、“刘德华”、“梁朝伟”;“无间道3”:“无间道系列”、“刘德华”、“警匪”、“梁朝伟”;“黑金”:警匪”、“刘德华”。
推荐的在线视频为:“无间道3”。
显然,在线视频“无间道3”更符合ID为12345的终端的偏好,本发明实施例公开的一种在线视频推荐方法推荐的在线视频更准确。
综上所述,本发明实施例公开的一种在线视频推荐方法,与背景技术相比,具有以下优点:
首先,在相似的在线视频之间,通过计算得到各在线视频与其他在线视频的相似度,根据各在线视频的原始标签和各在线视频的相似度,确定各在线视频的候选标签,进一步判断候选标签是否为准确的标签。可以根据各在线视频的原始标签动态确定各在线视频的新的标签,减少了对每个在线视频分别标注标签内容和计算标签强度的工作量,降低的工作成本。
其次,通过确定各在线视频的新的标签,新的标签相比原始标签,可以增加了标签内容,同时,根据新的标签计算得到的新的标签的标签强度,提高了标签内容和标签强度的准确率。
再次,由于各在线视频的标签内容和标签强度的准确率提高,相应地也提高了推荐在线视频准确率。
实施例九
详细介绍本发明实施例公开的一种在线视频推荐系统。
参考图10,示出了本发明实施例中一种在线视频推荐系统结构图。
所述一种在线视频推荐系统,具体可以包括:
原始标签矩阵计算模块90,相似度矩阵计算模块92,候选标签矩阵计算模块94,循环操作模块96,以及,在线视频推荐模块98。
下面分别详细介绍各模块的功能以及各模块之间的关系。
原始标签矩阵计算模块90,适于计算各在线视频的原始标签矩阵。
其中,所述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵。
相似度矩阵计算模块92,适于计算各在线视频的相似度矩阵。
其中,所述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵。
候选标签矩阵计算模块94,适于基于所述各在线视频的相似度矩阵和所述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵。
循环操作模块96,适于基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件;当符合所述预置条件时,所述各在线视频的候选标签矩阵为各在线视频的候选矩阵。
在线视频推荐模块98,适于基于预先生成的各在线视频的候选矩阵和预先获取到的对应终端的终端在线视频矩阵,计算得到所述终端的偏好矩阵;基于所述各在线视频的候选矩阵和所述终端的偏好矩阵,计算得到所述终端的在线视频推荐矩阵;所述终端的在线视频推荐矩阵的行表示所述终端,列表示推荐的在线视频,数值为推荐的在线视频的权重;将所述终端的在线视频推荐矩阵中权重排序靠前的至少一个在线视频作为最终推荐的在线视频,显示在所述终端。
具体地,所述在线视频推荐模块98可以在预先获取对应终端的终端在线视频矩阵时,可以根据所述各在线视频的候选矩阵的行数确定对应终端的终端在线视频矩阵的列数,保证所述各在线视频的候选矩阵的行数等于对应终端的终端在线视频矩阵的列数。所述预先获取到的对应终端的终端在线视频矩阵可以表现为1行m列的形式,m为在线视频的数量。
所述终端的在线视频推荐矩阵的行表示所述终端,列表示推荐的在线视频,数值为推荐的在线视频的权重。
例如,所述终端的偏好矩阵为1行m列,所述各在线视频的候选矩阵为m行n列,所述在线视频推荐模块98计算得到的所述终端的在线视频推荐矩阵为1行n列。所述终端的在线视频推荐矩阵为1行n列的矩阵,其中包括n个数值。所述在线视频推荐模块98可以将n个数值从大到小排列,可以选择排列靠前的至少一个数值,将这至少一个数值对应的在线视频作为推荐的在线视频显示在所述终端上。
综上所述,本发明实施例公开的一种在线视频推荐系统,与背景技术相比,具有以下优点:
首先,在相似的在线视频之间,通过计算得到各在线视频与其他在线视频的相似度,根据各在线视频的原始标签和各在线视频的相似度,确定各在线视频的候选标签,进一步判断候选标签是否为准确的标签。可以根据各在线视频的原始标签动态确定各在线视频的新的标签,减少了对每个在线视频分别标注标签内容和计算标签强度的工作量,降低的工作成本。
其次,通过确定各在线视频的新的标签,新的标签相比原始标签,可以增加了标签内容,同时,根据新的标签计算得到的新的标签的标签强度,提高了标签内容和标签强度的准确率。
再次,由于各在线视频的标签内容和标签强度的准确率提高,相应地也提高了推荐在线视频准确率。
实施例十
详细介绍本发明实施例公开的一种在线视频推荐系统。
参考图11,示出了本发明实施例中一种在线视频推荐系统结构图。
所述一种在线视频推荐系统,具体可以包括:
原始标签矩阵计算模块100,相似度矩阵计算模块102,候选标签矩阵计算模块104,循环操作模块106,以及,在线视频推荐模块108。
其中,所述在线视频推荐模块108,具体可以包括:
矩阵转置子模块1081,以及,推荐矩阵计算子模块1082。
下面分别详细介绍各模块、子模块的功能以及之间的关系。
原始标签矩阵计算模块100,适于计算各在线视频的原始标签矩阵。
其中,所述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵。
相似度矩阵计算模块102,适于计算各在线视频的相似度矩阵;其中,所述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵。
候选标签矩阵计算模块104,适于基于所述各在线视频的相似度矩阵和所述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵。
循环操作模块106,适于基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件;当符合所述预置条件时,所述各在线视频的候选标签矩阵为各在线视频的候选矩阵。
在线视频推荐模块108,适于基于预先生成的各在线视频的候选矩阵和预先获取到的对应终端的终端在线视频矩阵,计算得到所述终端的偏好矩阵;基于所述各在线视频的候选矩阵和所述终端的偏好矩阵,计算得到所述终端的在线视频推荐矩阵;所述终端的在线视频推荐矩阵的行表示所述终端,列表示推荐的在线视频,数值为推荐的在线视频的权重;将所述终端的在线视频推荐矩阵中权重排序靠前的至少一个在线视频作为最终推荐的在线视频,显示在所述终端。
其中,所述对应终端的终端在线视频矩阵的行表示所述终端,列表示在线视频,数值为在线视频的权重。所述终端的偏好矩阵的行表示所述终端,列表示标签内容,数值为标签内容的权重。
具体地,所述在线视频推荐模块108将所述对应终端的终端在线视频矩阵和所述各在线视频的候选矩阵相乘,计算得到所述终端的偏好矩阵。例如,所述对应终端的终端在线视频矩阵为A=(1×m),所述各在线视频的候选矩阵为B=(m×n),所述在线视频推荐模块108将A×B计算得到所述终端的偏好矩阵C=(1×n)。
所述终端的在线视频推荐矩阵的行表示所述终端,列表示推荐的在线视频,数值为推荐的在线视频的权重。
例如,所述终端的偏好矩阵为1行m列,所述各在线视频的候选矩阵为n行m列,所述在线视频推荐模块108计算得到的所述终端的在线视频推荐矩阵为1行n列。
所述在线视频推荐模块108,具体可以包括:
矩阵转置子模块1081,适于将所述各在线视频的候选矩阵进行转置操作,得到标签在线视频矩阵。
例如,所述各在线视频的候选矩阵为B=(m×n),所述矩阵转置子模块1061将矩阵B进行转置得到标签在线视频矩阵D=(n×m)。
推荐矩阵计算子模块1082,适于将所述终端的偏好矩阵与所述标签在线视频矩阵相乘,计算得到所述终端的终端在线视频推荐矩阵。
例如,所述推荐矩阵计算子模块1082将所述终端的偏好矩阵C=(1×n)与所述标签在线视频矩阵D=(n×m)相乘,计算得到所述终端的终端在线视频推荐矩阵E=(1×m)。
所述在线视频推荐模块108可以在所述终端的终端在线视频推荐矩阵E=(1×m)中,将m个数值从大到小排列,选择排序靠前的至少一个数值,将这至少一个数值对应的在线视频作为推荐的在线视频。
而且,所述循环操作模块106还适于当不符合所述预置条件时,将所述各在线视频的候选标签矩阵作为所述各在线视频的原始标签矩阵,进入计算各在线视频的下一个候选标签矩阵和判断各在线视频的下一个候选标签矩阵是否符合预置条件的循环操作,直至各在线视频的下一个候选标签矩阵符合预置条件为止。
综上所述,本发明实施例公开的一种在线视频推荐系统,与背景技术相比,具有以下优点:
首先,在相似的在线视频之间,通过计算得到各在线视频与其他在线视频的相似度,根据各在线视频的原始标签和各在线视频的相似度,确定各在线视频的候选标签,进一步判断候选标签是否为准确的标签。可以根据各在线视频的原始标签动态确定各在线视频的新的标签,减少了对每个在线视频分别标注标签内容和计算标签强度的工作量,降低的工作成本。
其次,通过确定各在线视频的新的标签,新的标签相比原始标签,可以增加了标签内容,同时,根据新的标签计算得到的新的标签的标签强度,提高了标签内容和标签强度的准确率。
再次,由于各在线视频的标签内容和标签强度的准确率提高,相应地也提高了推荐在线视频准确率。
实施例十一
详细介绍本发明实施例公开的一种在线视频处理系统。
参考图12,示出了本发明实施例中一种在线视频处理系统示意图。
所述一种在线视频处理系统,具体可以包括:
服务器1100,以及,终端1102。
其中,所述服务器1100,具体可以包括:
数据库11001,以及,在线视频推荐系统11002。
下面分别详细介绍各设备的功能以及之间的关系。
所述数据库11001,适于保存所述在线视频推荐系统最终推荐的在线视频。
而且,所述所述数据库11001可以实现在缓存服务器和/或自然搜索服务器。
所述在线视频推荐系统11002,适于推荐在线视频。
所述服务器1100,根据在数据库中的查询结果,向所述终端发送最终推荐的在线视频。
所述终端1102,适于显示最终推荐的在线视频。
综上所述,本发明实施例公开的一种在线视频处理系统,与背景技术相比,具有以下优点:
首先,在相似的在线视频之间,通过计算得到各在线视频与其他在线视频的相似度,根据各在线视频的原始标签和各在线视频的相似度,确定各在线视频的候选标签,进一步判断候选标签是否为准确的标签。可以根据各在线视频的原始标签动态确定各在线视频的新的标签,减少了对每个在线视频分别标注标签内容和计算标签强度的工作量,降低的工作成本。
其次,通过确定各在线视频的新的标签,新的标签相比原始标签,可以增加了标签内容,同时,根据新的标签计算得到的新的标签的标签强度,提高了标签内容和标签强度的准确率。
再次,由于各在线视频的标签内容和标签强度的准确率提高,相应地也提高了推荐在线视频准确率。
需要说明的是,对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明所必需的。
对于上述系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如上面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的系统中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个系统中。可以把实施例中的模块或单元组合成一个模块或单元,以及此外可以把它们分成多个子模块或子单元。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在上面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

Claims (12)

1.一种在线视频标签生成方法,包括:
计算各在线视频的原始标签矩阵,并计算各在线视频的相似度矩阵;其中,所述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵,所述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵;
基于所述各在线视频的相似度矩阵和所述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵;
基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件,包括:基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,计算得到各在线视频的差异标签矩阵;将所述各在线视频的差异标签矩阵中的各个数值与预置的差异阈值进行比较,基于比较结果判断所述各在线视频的候选标签矩阵是否符合预置条件;当所述各在线视频的差异标签矩阵中的各个数值均小于所述差异阈值时,所述各在线视频的候选标签矩阵符合预置条件;当所述各在线视频的差异标签矩阵中的各个数值中,至少一个数值大于等于所述差异阈值时,所述各在线视频的候选标签矩阵不符合预置条件;
当符合所述预置条件时,基于所述各在线视频的候选标签矩阵,确定各在线视频的更新的标签。
2.根据权利要求1所述的方法,所述基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件之后,还包括:
当不符合所述预置条件时,将所述各在线视频的候选标签矩阵作为所述各在线视频的原始标签矩阵,进入计算各在线视频的下一个候选标签矩阵和判断各在线视频的下一个候选标签矩阵是否符合预置条件的循环操作,直至各在线视频的下一个候选标签矩阵符合预置条件为止。
3.根据权利要求1所述的方法,所述计算各在线视频的相似度矩阵,包括:
获取终端在线视频矩阵;其中,所述终端在线视频矩阵的各行表示各终端,所述终端在线视频矩阵的各列表示各在线视频,所述终端在线视频矩阵的各数值表示各终端与各在线视频的对应关系;
将所述终端在线视频矩阵进行转置操作,得到在线视频终端矩阵;所述在线视频终端矩阵的各行表示各在线视频,所述在线视频终端矩阵的各列表示各终端,所述在线视频终端矩阵的各数值表示各在线视频与各终端的对应关系;
根据所述在线视频终端矩阵,依次确定各在线视频中的每个在线视频i与各在线视频中除该在线视频之外的在线视频j共现终端的数量;其中,i=1、2……n,j=1、2……n,n为各在线视频的数量,n为正整数,i≠j;
将所述共现终端的数量与所述在线视频j的终端数量相除,得到该在线视频i与在线视频j的相似度;
对所述相似度进行归一化处理,得到所述各在线视频的相似度矩阵。
4.根据权利要求1所述的方法,所述基于所述各在线视频的相似度矩阵和所述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵,包括:
基于所述各在线视频的原始标签矩阵和所述各在线视频的相似度矩阵,计算得到各在线视频的传递的标签矩阵;
基于所述各在线视频的原始标签矩阵和所述各在线视频的传递的标签矩阵,计算得到各在线视频的候选标签矩阵。
5.根据权利要求4所述的方法,所述基于所述各在线视频的原始标签矩阵和所述各在线视频的相似度矩阵,计算得到各在线视频的传递的标签矩阵,包括:
对原始标签矩阵中的每个在线视频,遍历各在线视频中除该在线视频之外的在线视频;
基于相似度矩阵判断该在线视频与各在线视频中除该在线视频之外的各在线视频的相似度是否大于0;
当相似度大于0时,将该在线视频的当前标签内容作为传递的标签内容,将相似度与该在线视频的当前标签强度相乘作为传递的标签强度。
6.根据权利要求4所述的方法,所述基于所述各在线视频的原始标签矩阵和所述各在线视频的传递的标签矩阵,计算得到各在线视频的候选标签矩阵,包括:
根据h=y×q+c×(1-q)×y计算得到各在线视频的候选标签矩阵;
其中,h为各在线视频的候选标签矩阵,y为各在线视频的原始标签矩阵,q为原始标签权值,c为各在线视频的传递的标签矩阵;
所述各在线视频的候选标签矩阵的标签内容为所述各在线视频的原始标签矩阵的标签内容和所述各在线视频的传递的标签矩阵的标签内容的合集;
所述各在线视频的候选标签矩阵的标签强度为所述各在线视频的原始标签矩阵的标签强度和所述各在线视频的传递的标签矩阵的标签强度的线性组合。
7.一种在线视频标签生成系统,包括:
原始标签矩阵计算模块,适于计算各在线视频的原始标签矩阵;其中,所述各在线视频的原始标签矩阵包括各在线视频的当前标签内容和当前标签强度的矩阵;
相似度矩阵计算模块,适于计算各在线视频的相似度矩阵;其中,所述各在线视频的相似度矩阵包括各在线视频的当前标签内容相似程度的矩阵;
候选标签矩阵计算模块,适于基于所述各在线视频的相似度矩阵和所述各在线视频的原始标签矩阵,计算得到各在线视频的候选标签矩阵;
循环操作模块,适于基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,判断所述各在线视频的候选标签矩阵是否符合预置条件;当符合所述预置条件时,基于所述各在线视频的候选标签矩阵,确定各在线视频的更新的标签;所述循环操作模块,包括:差异标签矩阵计算子模块,适于基于所述各在线视频的原始标签矩阵和所述各在线视频的候选标签矩阵,计算得到各在线视频的差异标签矩阵;比较子模块,适于将所述各在线视频的差异标签矩阵中的各个数值与预置的差异阈值进行比较,候选标签矩阵判断子模块,适于基于比较结果判断所述各在线视频的候选标签矩阵是否符合预置条件;当所述各在线视频的差异标签矩阵中的各个数值均小于所述差异阈值时,所述各在线视频的候选标签矩阵符合预置条件;当所述各在线视频的差异标签矩阵中的各个数值中,至少一个数值大于等于所述差异阈值时,所述各在线视频的候选标签矩阵不符合预置条件。
8.根据权利要求7所述的系统,所述循环操作模块还适于当所述各在线视频的候选标签矩阵不符合所述预置条件时,将所述各在线视频的候选标签矩阵作为所述各在线视频的原始标签矩阵,并进入所述候选标签矩阵计算模块计算各在线视频的下一个候选标签矩阵和所述循环操作模块判断各在线视频的下一个候选标签矩阵是否符合预置条件的循环操作,直至各在线视频的下一个候选标签矩阵符合预置条件为止。
9.根据权利要求7所述的系统,所述相似度矩阵计算模块,包括:
终端在线视频矩阵获取子模块,适于获取终端在线视频矩阵;其中,所述终端在线视频矩阵的各行表示各终端,所述终端在线视频矩阵的各列表示各在线视频,所述终端在线视频矩阵的各数值表示各终端与各在线视频的对应关系;
在线视频终端矩阵确定子模块,适于将所述终端在线视频矩阵进行转置操作,得到在线视频终端矩阵;其中,所述在线视频终端矩阵的各行表示各在线视频,所述在线视频终端矩阵的各列表示各终端,所述在线视频终端矩阵的各数值表示各在线视频与各终端的对应关系;
共现终端数量确定子模块,适于根据所述在线视频终端矩阵,依次确定各在线视频中的每个在线视频i与各在线视频中除该在线视频之外的在线视频j共现终端的数量;其中,i=1、2……n,j=1、2……n,n为各在线视频的数量,n为正整数,i≠j;
相似度确定子模块,适于将所述共现终端的数量与所述在线视频j的终端数量相除,得到该在线视频i与在线视频j的相似度;
归一化处理子模块,适于对所述相似度进行归一化处理,得到所述各在线视频的相似度矩阵。
10.根据权利要求7所述的系统,所述候选标签矩阵计算模块,包括:
传递的标签矩阵计算子模块,适于基于所述各在线视频的原始标签矩阵和所述各在线视频的相似度矩阵,计算得到各在线视频的传递的标签矩阵;
候选标签矩阵计算子模块,适于基于所述各在线视频的原始标签矩阵和所述各在线视频的传递的标签矩阵,计算得到各在线视频的候选标签矩阵。
11.根据权利要求10所述的系统,所述传递的标签矩阵计算子模块,包括:
遍历子单元,适于对原始标签矩阵中的每个在线视频,遍历各在线视频中除该在线视频之外的在线视频;
判断子单元,适于基于相似度矩阵判断该在线视频与各在线视频中除该在线视频之外的各在线视频的相似度是否大于0;
传递的标签确定子单元,适于当相似度大于0时,将该在线视频的当前标签内容作为传递的标签内容,将相似度与该在线视频的当前标签强度相乘作为传递的标签强度。
12.根据权利要求10所述的系统:
所述候选标签矩阵计算子模块根据h=y×q+c×(1-q)×y计算得到各在线视频的候选标签矩阵;
其中,h为各在线视频的候选标签矩阵,y为各在线视频的原始标签矩阵,q为原始标签权值,c为各在线视频的传递的标签矩阵;
所述各在线视频的候选标签矩阵的标签内容为所述各在线视频的原始标签矩阵的标签内容和所述各在线视频的传递的标签矩阵的标签内容的合集;
所述各在线视频的候选标签矩阵的标签强度为所述各在线视频的原始标签矩阵的标签强度和所述各在线视频的传递的标签矩阵的标签强度的线性组合。
CN201210488982.4A 2012-11-26 2012-11-26 一种在线视频标签生成方法和系统 Expired - Fee Related CN103049479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210488982.4A CN103049479B (zh) 2012-11-26 2012-11-26 一种在线视频标签生成方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210488982.4A CN103049479B (zh) 2012-11-26 2012-11-26 一种在线视频标签生成方法和系统

Publications (2)

Publication Number Publication Date
CN103049479A CN103049479A (zh) 2013-04-17
CN103049479B true CN103049479B (zh) 2016-01-13

Family

ID=48062120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210488982.4A Expired - Fee Related CN103049479B (zh) 2012-11-26 2012-11-26 一种在线视频标签生成方法和系统

Country Status (1)

Country Link
CN (1) CN103049479B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463231A (zh) * 2014-12-31 2015-03-25 合一网络技术(北京)有限公司 对表情识别内容标注后进行纠错的方法
CN105117449B (zh) * 2015-08-14 2019-08-16 百度在线网络技术(北京)有限公司 一种用于生成内容项的标签的方法和装置
CN105354261A (zh) * 2015-10-23 2016-02-24 北大方正集团有限公司 一种数字资源推荐方法及装置
CN105809478B (zh) * 2016-03-07 2020-02-18 优酷网络技术(北京)有限公司 一种广告标签的标注方法及系统
CN105912682A (zh) * 2016-04-14 2016-08-31 乐视控股(北京)有限公司 一种视频分类标签的生成方法和装置
CN106547921B (zh) * 2016-12-07 2019-11-15 东软集团股份有限公司 标签生成方法及装置
CN106599194B (zh) * 2016-12-14 2021-03-30 北京小米移动软件有限公司 标签确定方法及装置
CN108076036A (zh) * 2017-01-06 2018-05-25 哈尔滨安天科技股份有限公司 一种威胁向量提取与标签标注的系统及方法
CN107368584B (zh) * 2017-07-21 2020-07-03 山东大学 一种个性化视频推荐方法及系统
CN109033219B (zh) * 2018-06-29 2022-03-11 北京奇虎科技有限公司 兴趣点poi分类方法和装置
CN110674349B (zh) * 2019-09-27 2023-03-14 北京字节跳动网络技术有限公司 视频poi识别方法、装置及电子设备
CN114064975A (zh) * 2021-11-26 2022-02-18 四川长虹电器股份有限公司 视频的标签生成方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944218A (zh) * 2010-01-27 2011-01-12 北京大学 社会网络下的基于图的个性化推荐方法及其系统
CN102043781A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 一种网页资源推荐方法及装置
CN102207954A (zh) * 2010-03-31 2011-10-05 索尼公司 电子设备、内容推荐方法及其程序
CN102495837A (zh) * 2011-11-01 2012-06-13 中国科学院计算技术研究所 一种数字信息推荐预测模型的训练方法和系统
CN102654860A (zh) * 2011-03-01 2012-09-05 北京彩云在线技术开发有限公司 一种个性化音乐推荐方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120297038A1 (en) * 2011-05-16 2012-11-22 Microsoft Corporation Recommendations for Social Network Based on Low-Rank Matrix Recovery

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102043781A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 一种网页资源推荐方法及装置
CN101944218A (zh) * 2010-01-27 2011-01-12 北京大学 社会网络下的基于图的个性化推荐方法及其系统
CN102207954A (zh) * 2010-03-31 2011-10-05 索尼公司 电子设备、内容推荐方法及其程序
CN102654860A (zh) * 2011-03-01 2012-09-05 北京彩云在线技术开发有限公司 一种个性化音乐推荐方法及系统
CN102495837A (zh) * 2011-11-01 2012-06-13 中国科学院计算技术研究所 一种数字信息推荐预测模型的训练方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《一种基于分众分类的协同过滤推荐算法》;吴春旭等;《计算机系统应用》;20101231;第19卷(第5期);正文第183-186页 *
《基于标签的歌曲相似性研究》;刘璇等;《计算机与数字工程》;20111231;第39卷(第10期);正文第4-8、117页 *

Also Published As

Publication number Publication date
CN103049479A (zh) 2013-04-17

Similar Documents

Publication Publication Date Title
CN103020161B (zh) 在线视频推荐方法和推荐系统及处理系统
CN103049479B (zh) 一种在线视频标签生成方法和系统
CN110046304B (zh) 一种用户推荐方法和装置
CN111444394B (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
CN104239571A (zh) 一种进行应用推荐的方法和装置
CN104331459A (zh) 一种基于在线学习的网络资源推荐方法及装置
CN105447145A (zh) 一种基于项目的迁移学习推荐方法及其推荐装置
Fang et al. A stochastic production planning problem in hybrid manufacturing and remanufacturing systems with resource capacity planning
Wang et al. The use of improved TOPSIS method based on experimental design and Chebyshev regression in solving MCDM problems
CN104156433A (zh) 一种基于语义映射空间构建的图像检索方法
CN111259222A (zh) 物品推荐方法、系统、电子设备及存储介质
CN103473128A (zh) 一种用于mashup应用推荐的协同过滤方法
Mumtaz et al. Hybrid spider monkey optimisation algorithm for multi-level planning and scheduling problems of assembly lines
US20170287023A1 (en) Blacklisting Based on Image Feature Analysis and Collaborative Filtering
CN111507076B (zh) 一种用于教学系统的共案课件制作方法、装置和终端
Zhong et al. Design of a personalized recommendation system for learning resources based on collaborative filtering
CN113343091A (zh) 面向产业和企业的科技服务推荐计算方法、介质及程序
CN112883265A (zh) 信息推荐方法、装置、服务器及计算机可读存储介质
Chen et al. Mind the gap between research and practice in operations management
CN116701791B (zh) 基于人工智能的课程推荐方法及系统
Kumar et al. User session interaction-based recommendation system using various machine learning techniques
CN105045827A (zh) 基于熟悉度的信息推荐方法及装置
CN115222433A (zh) 一种信息推荐方法、装置及存储介质
CN111222663B (zh) 数据处理方法及其系统、计算机系统及计算机可读介质
Han et al. Developing smart service concepts: morphological analysis using a Novelty-Quality map

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160113

Termination date: 20211126

CF01 Termination of patent right due to non-payment of annual fee