CN105512331B - 一种视频推荐方法及装置 - Google Patents
一种视频推荐方法及装置 Download PDFInfo
- Publication number
- CN105512331B CN105512331B CN201510993874.6A CN201510993874A CN105512331B CN 105512331 B CN105512331 B CN 105512331B CN 201510993874 A CN201510993874 A CN 201510993874A CN 105512331 B CN105512331 B CN 105512331B
- Authority
- CN
- China
- Prior art keywords
- video
- videos
- weight
- category
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 239000000203 mixture Substances 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- WDQNIWFZKXZFAY-UHFFFAOYSA-M fentin acetate Chemical compound CC([O-])=O.C1=CC=CC=C1[Sn+](C=1C=CC=CC=1)C1=CC=CC=C1 WDQNIWFZKXZFAY-UHFFFAOYSA-M 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种视频推荐方法及装置,解决了现有技术中无法针对用户需求和兴趣,为其推荐合适的视频,推荐准确性不高的问题。该方法包括:获取视频属性信息,所述视频属性信息包括视频标签及视频标签所属类别;根据所述视频属性信息及预设的视频标签所属类别权重,计算目标视频与其他视频之间的权重得分,其中,视频标签所属类别权重反映视频标签所属类别的优先级;根据所述目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。
Description
技术领域
本发明涉及推荐技术领域,尤其涉及一种视频推荐方法及装置。
背景技术
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代,推荐系统应运而生。推荐系统为用户找到其已知范围之外的感兴趣的视频,拓展其观影体验。
已有视频推荐系统中,一种是基于视频标签来计算视频间的相似度,即根据一定数目固有标签是否匹配来计算视频间的相似度,根据视频间的相似度生成推荐列表为用户推荐未观看的视频。但是,已有技术中这种基于视频标签计算视频间相似度的方法存在两个问题:一是,标签存在信息量过载、无序、垃圾标签等问题,这会影响推荐系统的准确度和个性化程度;二是,对于视频推荐,各个固有标签对于用户的重要程度是有差别的,如果一律同等对待,会导致推荐准确度不高,影响用户体验。
发明内容
本发明的实施例提供一种视频推荐方法及装置,能够针对用户需求和兴趣,为其推荐合适的视频,提高推荐的准确性。
为达到上述目的,本发明的实施例采用如下技术方案:
本发明实施例提供一种视频推荐方法,包括以下步骤:
获取视频属性信息,所述视频属性信息包括视频标签及视频标签所属类别;
根据所述视频属性信息及预设的视频标签所属类别权重,计算目标视频与其他视频之间的权重得分,其中,视频标签所属类别权重反映视频标签所属类别的优先级;
根据所述目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。
本发明实施例还提供了一种视频推荐装置,包括:
获取模块,用于获取视频属性信息,所述视频属性信息包括视频标签及视频标签所属类别;
权重得分计算模块,用于根据所述视频属性信息及预设的视频标签所属类别权重,计算目标视频与其他视频之间的权重得分,其中,视频标签所属类别权重反映视频标签所属类别优先级;
推荐模块,用于根据所述目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。
本发明实施例所提供的视频推荐方法及装置,根据视频属性信息及预设的视频标签所属类别权重,来计算目标视频与其他视频之间的权重得分,根据计算的目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。因为对视频标签进行了类别划分,所以视频标签就不会出现无序、垃圾标签等问题,因为对视频标签所属类别设置了权重,视频标签所属类别权重反映了视频标签类别的优先级,所以在计算目标视频与其他视频之间权重得分时,也体现了视频标签所属类别的优先级,视频标签所属类别优先级高的,在权重得分中也会占用较高的权重,表明和目标视频越类似,在对用户进行视频推荐时,则更倾向于用户喜欢的视频类型,从而提高了推荐的准确性,用户体验更好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种视频推荐方法的方法流程图;
图2为本发明实施例提供的一种视频推荐装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种视频推荐方法,如图1所示,该方法包括:
101、视频推荐装置获取视频属性信息。
本发明实施例中的视频推荐装置可以为管理所有终端设备的服务器,也可以为某一终端设备,该终端设备可以是智能电视或便携式、袖珍式或手持式的电子设备,例如,智能手机、平板电脑以及个人数字助理等。
本发明实施例中的视频属性信息包括视频标识、视频标签及视频标签所属类别。其中,上述的视频标识可以为视频的名称或其他可唯一表示该视频的标识,本实施例中采用v1、v2、v3、……、vm表示不同视频的标识。
每个视频包括以下属性信息:视频ID、名称、类型、国家、导演、演员、简介等。对简介进行文本分词处理,并去除停用词(介词、连接词、语气词等虚词),将剩下的实词和名称、类型、国家、导演、演员等信息,作为视频标签。视频标签为体现视频特性的元素,如几何数学,武侠,爱情等。
需要说明的是,具体视频的属性信息根据视频的类型会有所变化,以上只是一种示例说明。
首先,在数据库中存储有所有视频的数据信息。
示例性的,通过遍历每一条视频数据信息,枚举出所有这些视频标签,并进行去重处理,来进行分析,并把他们按照视频涉及的内容进行自然分类,即根据视频标签所属类别进行分类。
具体地,影视类视频标签所属类别可以为题材、年代、国家、关键词,教育类视频标签所属类别可以为年级、科目、适用人群、版本、关键词,一般来说,可以把视频标签分成4、5个左右的类别属性。
下面以视频标签所属类别为5为例进行说明。
假设这五个视频标签所属类别所描述的集合为N1,N2,N3,N4,N5。每个视频标签所属类别中会包含着很多的子类别,假设每个视频标签所属类别中的子类别所代表的集合分别是n1i、集合n2i、集合n3i、集合n4i、集合n5i(其中,n1i代表N1中的子集元素,i从1到m),每一条视频都含有这五个视频标签所属类别,每个视频标签所属类别里的元素对应着属于n1i、n2i、n3i、n4i、n5i里的元素,每个元素相当于视频标签。这五个集合需要满足如下特点:
(1)每个视频都可以按照视频标签所属类别进行分类。
(2)任意两个集合中的子集:nik∪njl>nik(i!=j),即任意两个视频标签所属类别所包含的子集中的视频标签之间是没有包含关系的。
(3) 存在n1i∩n2i∩n3i∩n4i∩n5i=∅的情况,即任意视频标签所属类别所包含的子集中的视频标签之间是不重叠的。
(4)这些类别属性(N1、N2、N3、N4、N5)之间存在着优先级高低的顺序。
为了增加推荐视频的准确度,可以再给每一个视频标签所属类别添加关键词类别。
最终,在视频推荐装置上实现的视频分类后的存储结构是如下格式的:
_id:Number
N1:n1i
N2:n2i
N3:n3i
N4:n4i
N5:n5i
M:keyword
示例性的,根据上述格式的视频存储结构生成视频集合存储到字典数据结构中,存储格式为:{视频标识:“XXX”,视频标签所属类别1:“视频标签”,视频标签所属类别2:“视频标签”,视频标签所属类别3:“视频标签”,…,视频标签所属类别n-1:“视频标签”,关键词:[“关键词1”,“关键词2”, …,“关键词m”]},n、m为自然数。
对上述视频集合进行处理,按照视频标识、视频标签所属类别及视频标签,生成列表1,其中视频标签所属类别不包括关键词类别。
将视频标识和关键词类别及关键词视频标签等信息进行整理,生成列表2。
将列表1和列表2分别存储到一个新的字典结构中。将原字典拆分为两个新字典,主要是为了方便后续通过视频标识来获取关键词信息及其他视频标签信息。
其中,列表1的存储格式为:{视频标识:“XXX”,视频标签1,视频标签2,…,视频标签n},视频标签1对应视频标签1所属类别,视频标签2对应视频标签2所属类别,…,视频标签n对应视频标签n所属类别。视频标签所属类别不包括关键词类别。
列表2的存储格式为:{视频标识:“XXX”,关键词1,关键词2,…,关键词m}。关键词1,关键词2,…,关键词m属于关键词类别。
优选的,在步骤101中,可以设置一个更新周期,更新周期的长短可以根据视频数据的数据库更新情况进行设定,例如,可以设为一个月,一周或一天,本发明对此不进行限制,在每个更新周期内获取所述每个更新周期内的视频数据的属性信息并进行更新。本实施例下述各步骤均以当前周期为例进行说明。
102、视频推荐装置根据所述视频属性信息及预设的视频标签所属类别权重,计算目标视频与其他视频之间的权重得分,其中,视频标签所属类别权重反映视频标签所属类别的优先级。
具体地,所述视频标签所属类别权重为二进制权重,视频标签所属类别优先级高,则设置的二进制权重大。
示例性的,影视类视频标签所属类别题材的优先级可以高于年代的优先级高于国家高于关键词优先级,教育类视频标签所属类别设置可以适用人群的优先级高于适用年级的优先级高于科目的优先级高于版本的优先级高于关键词的优先级。
视频标签所属类别要严格体现出优先级,那么设置的权重也要恰当。
所述根据所述视频属性信息及预设的视频标签所属类别权重,获取目标视频与其他视频之间的权重得分具体为:将目标视频中的每项视频标签与其他视频中的每项视频标签进行匹配,匹配成功,则值为1,匹配失败,则值为0,将获得的每项视频标签匹配值乘以预设的视频标签所属类别权重,求和即为该两视频之间的权重得分。
示例性的,教育视频的视频标签所属类别可以为适用人群、适用年级、科目、版本四个类别。适用人群的优先级高于适用年级的优先级高于科目的优先级高于版本的优先级。对目标视频中的每项视频标签与其他视频中的每项视频标签进行匹配,匹配成功,值为1,匹配失败,值为0,将获得的每项视频标签匹配值乘以预设的视频标签所属类别权重,求和即为该两视频之间的权重得分。
可以用目标视频与其他视频之间的权重得分计算公式计算:
;
表示两视频的视频标签是否匹配,匹配成功,则为1,匹配失败,则为0,分别表示各视频标签所属类别权重。
假设所设置的视频标签所属类别权重由低到高的顺序为:,最终的相似度计算公式为各个视频标签匹配成功的视频标签所属类别权重的累加,即:
(1)
表示两视频的视频标签是否匹配,匹配成功,则为1,匹配失败,则为0。
假设有两个视频分别和目标视频进行匹配,计算这两个视频与目标视频的权重得分,按照公式计算结果如下:
; (2)
; (3)
其中,,m为自然数,n为视频标签个数。
假设这两个视频当中有某些视频标签和目标视频的视频标签不匹配,在这些不匹配的视频标签中,优先级最高的视频标签所属类别对应的权重为,且第二个视频中,对应的视频标签与目标视频的视频标签不匹配,。因为在与目标视频的视频标签不匹配的视频标签中对应的视频标签优先级最高,而在进行视频推荐的时候,优先级比较高的视频标签所属类别与用户的需求相关度比较大,在第一个视频与第二个视频的视频标签m+1项到n项均与目标视频标签的m+1到n项匹配的前提下,第一个视频对应的视频标签与目标视频的视频标签匹配,则第一个视频与目标视频最相关,那么。
为了满足这一结果,最苛刻的条件就是在中,中除了为1外,其他的都是0,在中,中除 外,其他的都是1。所以转化为:
; (4)
将上述公式转化为:
; (5)
其中为大于零的某个常数,在公式中作为一个辅助变量。
根据公式(5)可以演变得到以下公式:
; (6)
公式(6)与公式(5)相减,得到以下公式:
; (7)
综上,视频标签所属类别权重设置需满足公式(7)。
满足该公式的解决方案可能有很多种,考虑到最终还要涉及到权重得分的归一化问题,权重之间的大小变化尽量小,取一种最可行和方便的一种,即取,那么,,则为公比为二的等比数列。
所以最终的公式变成了:
。
二进制权重的特点在于:当优先级高的视频标签所属类别对应的视频标签没有匹配成功的时候,即使剩下的优先级级别比它低的视频标签所属类别中的视频标签全部匹配成功,得到权重得分也不会大于该优先级高的视频标签所属类别中的视频标签匹配成功时的权重,这样,所计算出的视频间的权重得分就可以体现出优先级的特点,在为用户推荐时,首先推荐优先级比较高的视频,同时也更倾向于是用户喜欢的视频。
另外,为了避免根据视频标签所属类别中视频标签匹配计算视频间权重得分,出现目标视频与其他两个视频之间的权重得分相同的情况,所以,视频标签所属类别增加关键词属性。相应的,目标视频与其他视频之间的权重得分计算公式变为如下:
;
其中,h为关键词类别中的视频标签匹配的个数,,f为预设视频的关键词类别中视频标签个数,表示目标视频与其他视频中对应项视频标签是否匹配成功,匹配成功,值为1,匹配失败,值为0,k、m、n为自然数,取满足大于的最小值。
该公式不仅体现出了标签的优先级的属性(基于二进制的特性),还体现出了关键词匹配的个数的属性。这样,假设两个视频与目标视频中除去关键词之外的视频标签所属类别匹配值相等,则还可以根据关键词属性进行区分,从而可以更加精确地将相关视频选取出来,推荐给用户。
需要注意的是:此公式中,参数k、m需满足关系,如果预设视频关键词类别中视频标签个数为5,则,考虑后面的归一化处理,为了尽量使得到的权重得分差距小一些,k取最小值0,则m最小为3。
需要说明的是:k和m的数值根据f的值的不同相应调整,调整的原则是在关键词类别中视频标签全部匹配和与关键词类别高一优先级的视频标签所属类别中的视频标签匹配的前提下,尽量使关键词类别所占的权重与比它高一优先级的视频标签所属类别所占的权重差距小一些。这样的目的是:在目标视频与其他两个视频除去关键词类别属性,其余视频标签所属类别中的视频标签全部匹配的前提下,如果关键词类别属性所占的权重与比它高一优先级的视频标签所属类别所占的权重差距不大的话,则对得到的权重得分归一化后,关键词类别属性在整个权重得分所占的比重可以区分开来,这样目标视频与这两个视频中的哪个视频比较类似就可以根据归一化后的值挑选出来。反之,如果关键词类别属性所占的权重与比它高一优先级的视频标签所属类别所占的权重差距大的话,那么在进行归一化后,目标视频与其他两个视频的相似度很可能会出现因为小数点位置取舍导致相同的情况,这样,就无法区分目标视频与这两个视频中的哪个视频比较相似。
下面以教育视频推荐作为实施例进行详细描述:
在教育视频中,首先获取教育视频的属性信息,属性信息包括教育视频标识、教育视频标签及教育视频标签所属类别,并将所有教育视频标识及教育视频标签、教育视频标签所属类别以数据表的格式存储到数据库中。
本实施例将教育视频标签所属类别划分为5类,分别为适用人群、适用年级、科目、版本、关键词。
其中,适用人群可以分为:幼儿园、小学、中学、大学、研究生等;适用年级可以为:小班、中班、大班、一年级、初一、高二、大一、研二等;科目可以分为:语文、数学、英语、哲学等;版本可以分为:人教版、苏教版;关键词可以为:童话、奥数、诗词、作文、立体几何等。
按照用户的实际需求,在推荐的时候,适用人群的优先级大于适用年级的优先级大于科目的优先级大于版本的优先级大于关键词的优先级。
因为按照用户的需求来说,首先需要给用户推荐相同适用人群的视频,如当科目或者版本一样时,给用户推荐科目或者版本相同但是适用人群不相同的视频,显然给用户推荐的结果不是适合用户的视频。
再比如:一部视频是小学一年级语文苏教版,适用人群是小学生,年级为一年级,课程名称为语文,版本为苏教版,在根据该目标视频的视频信息给用户进行相关视频推荐的时候,假如其他的视频中所有的视频标签与该目标视频的视频标签进行匹配,得到以下几种情况:1.视频标签当中没有一个匹配成功的(该视频被定义为不相关)。2.视频标签中有且只有一个标签匹配成功。3.视频标签当中有两个视频标签匹配成功。4.视频标签当中有三个视频标签匹配成功。5.视频标签当中有四个视频标签匹配成功(该视频被定义为最相关)。如果有相关视频和目标视频的视频标签匹配,其中一个视频中的视频标签所属类别为年级、科目和版本中的视频标签均匹配,另外一个视频中的视频标签匹配对应的视频标签所属类别为适用人群和年级,如果纯粹按照传统的做法,根据匹配视频标签所属类别的数目进行推荐的话,首先需要为用户推荐的是第一个视频,即三个视频标签所属类别中的视频标签匹配,但是这个视频中最重要的视频标签所属类别适用人群中的视频标签不匹配,用户观看的目标视频为小学,此视频适用人群为中学,显然,这不是用户想要和适合的视频。第二个视频虽然只有两个视频标签所属类别中的视频标签与目标视频相匹配,但是适用人群和适用年级中的视频标签均匹配,也为小学一年级相关的视频,那么,首先应该推荐第二个视频给用户。
本发明采用视频标签所属类别设置优先级权重就是考虑了上述情况,显然比原来传统的根据固定标签所属类别中的固定标签匹配个数多少来选择推荐哪些视频,推荐准确度得到了提高,用户体验也更好。
另外,通过多次的实践之后确定了给用户推荐教育视频的视频标签所属类别优先级顺序,适用人群>适用年级>科目>版本>关键词。
再次举例,比如有5个教育视频,分别为v1、v2、v3、v4、v5,他们的视频标签所属类别分别为:适用人群、适用年级、科目、版本、关键词。假设预设视频中关键词中的视频标签个数为5,则因为要满足,取满足大于的最小值,f为5,k最小取0,则m为3。那么视频标签所属类别权重可以设置为:适用人群、适用年级、科目、版本、关键词。
假设这5个视频的视频标签所属类别和视频标签分别为:
{v1,适用人群:小学,适用年级:一年级,科目:语文,版本:苏教版,关键词:拼音、作文};
{v2,适用人群:中学,适用年级:初一,科目:语文,版本:苏教版,关键词:诗词、作文};
{v3,适用人群:小学,适用年级:二年级,科目:语文,版本:苏教版,关键词:拼音、作文};
{v4,适用人群:小学,适用年级:一年级,科目:数学,版本:苏教版,关键词: 奥数};
{v5,适用人群:小学,适用年级:一年级,科目:语文,版本:人教版,关键词: 成语故事、童话};
以v1作为目标视频,分别计算其他视频与目标视频的权重得分,计算公式为:
,h为关键词中视频标签匹配个数,代表适用人群,代表适用年级,代表科目,代表版本。
得到:
;
;
;
。
因为,所以与目标视频v1的相似度v5>v4>v3>v2。
为用户推荐教育视频的话,顺序也将是v5,v4,v3,v2。
而根据这5个视频的视频标签所属类别及视频标签,也可看出,v5与目标视频v1最相关,用户看了目标视频v1之后,最大可能会想看视频v5,而视频v1最不相关,也并不适合用户观看,推荐的话,用户体验最差。
需要说明的是,本发明实施例并不局限于教育视频,也可应用于影视视频的推荐,对于影视视频的推荐,视频标签所属类别可以根据用户对于影视视频的重视程度进行设置和划分。
具体地,用户在计算目标视频与其他视频之间的权重得分时,首先会根据目标视频的视频标签进行过滤,缩小待推荐视频集合的范围。如:目标视频为教育类视频,则在数据库中将教育类视频选取出来,构成待推荐视频集合,计算目标视频与待推荐视频集合中每个视频之间的权重得分。如果目标视频为影视类视频,则在数据库中将影视类视频选取出来构成待推荐视频集合,计算目标视频与待推荐视频集合中每个视频之间的权重得分。这样大大减少了计算量,提高了推荐效率。
103、视频推荐装置根据所述计算的目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。
具体地,视频推荐装置根据所述计算的目标视频与其他视频之间的权重得分,对所述权重得分进行归一化处理,得到目标视频与其他视频之间的相似度,根据所述目标视频与其他视频之间的相似度,生成视频推荐列表,对用户进行推荐。
具体地,对目标视频与其他视频之间的权重得分进行归一化处理具体为:首先获得目标视频与其他视频之间的权重得分的最大值,然后将目标视频与其他视频之间的权重得分除以所述获取的最大值,即得到目标视频与其他视频之间的相似度。
示例性的,以上述5个教育视频计算得到的权重得分为例进行详细说明。
目标视频v1与其他视频v2、v3、v4、v5之间的权重得分分别为25,90,104,112,最大值为112,那么目标视频与其他视频v2、v3、v4、v5的权重得分均除以112,得到结果:0.223,0.804,0.929,1。即v1与v2的相似度为0.223,v1与v3的相似度为0.804,v1与v4的相似度为0.929,v1与v5的相似度为1。
具体地,对目标视频与其他视频之间的相似度进行排序,根据需要推荐的视频个数生成推荐列表对用户进行推荐。
示例性的,如果用户需要2个视频,则因为v1v5的相似度>v1v4的相似度>v1v3的相似度>v1v2的相似度,取排名前两位的视频v5、v4构成推荐列表为用户进行推荐。
综上所述,本发明实施例所提供的视频推荐方法,根据视频属性信息及预设的视频标签所属类别权重,来计算目标视频与其他视频之间的权重得分,根据计算的目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。因为对视频标签进行了类别划分,所以视频标签就不会出现无序、垃圾标签等问题,因为对视频标签所属类别设置了权重,视频标签所属类别权重反映了视频标签类别的优先级,所以在计算目标视频与其他视频之间权重得分时,也体现了视频标签所属类别的优先级,视频标签所属类别优先级高的,在相似度中也会占用较高的权重,表明和目标视频越类似,在对用户进行视频推荐时,则更倾向于用户喜欢的视频类型,从而提高了推荐的准确性,用户体验更好。
另一方面,本发明实施例还提供了一种视频推荐装置,该装置用于实现上述的栏目推荐方法,如图2所示,该装置包括:获取模块,相似度计算模块,推荐模块,其中:
获取模块,用于获取视频属性信息,所述视频属性信息包括视频标签及视频标签所属类别;
权重得分计算模块,用于根据所述视频属性信息及预设的视频标签所属类别权重,计算目标视频与其他视频之间的权重得分,其中,视频标签所属类别权重反映视频标签所属类别优先级;
推荐模块,用于根据所述计算的目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。
具体地,视频属性信息包括视频标识、视频标签及视频标签所属类别。
可选的,该装置中的权重得分计算模块具体为:将目标视频的视频标签与其他视频中的每项视频标签进行匹配,匹配成功,则值为1,匹配失败,则值为0,将获得的每项视频标签匹配值乘以预设的视频标签所属类别权重,求和即为该两视频之间的相似度。
可选的,该装置中的权重得分计算模块具体为:根据权重得分计算公式计算目标视频与其他视频之间的权重得分,其中,权重得分计算公式为:,h为该项标签特征所属类别中的视频标签匹配的个数,,f为预设视频关键词类别中视频标签个数,表示任意两视频中对应项标签特征是否匹配成功,匹配成功,值为1,匹配失败,值为0,k、m、n为自然数,取满足大于的最小值。
本发明实施例所提供的视频推荐装置,根据视频属性信息及预设的视频标签所属类别权重,来计算目标视频与其他视频之间的权重得分,根据计算的目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。因为对视频标签进行了类别划分,所以视频标签就不会出现无序、垃圾标签等问题,因为对视频标签所属类别设置了权重,视频标签所属类别权重反映了视频标签类别的优先级,所以在计算目标视频与其他视频之间权重得分时,也体现了视频标签所属类别的优先级,视频标签所属类别优先级高的,在权重得分中也会占用较高的权重,表明和目标视频越类似,在对用户进行视频推荐时,则更倾向于用户喜欢的视频类型,从而提高了推荐的准确性,用户体验更好。
在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种视频推荐方法,其特征在于,包括以下步骤:
获取视频属性信息,所述视频属性信息包括视频标签及视频标签所属类别,所述视频标签为体现视频特性的元素;
根据所述视频属性信息及预设的视频标签所属类别权重,计算目标视频与其他视频之间的权重得分,其中,视频标签所属类别权重反映视频标签所属类别的优先级;
根据所述目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。
2.根据权利要求1所述的视频推荐方法,其特征在于,所述根据所述视频属性信息及预设的视频标签所属类别权重,计算目标视频与其他视频之间的权重得分具体为:将目标视频的视频标签分别与其他视频中的每项视频的视频标签进行匹配,匹配成功,则值为1,匹配失败,则值为0,将获得的每项视频标签匹配值乘以预设的视频标签所属类别权重,求和即为该两视频之间的权重得分。
3.根据权利要求1所述的视频推荐方法,其特征在于,所述视频标签所属类别权重为二进制权重,视频标签所属类别优先级高,则设置的二进制权重大。
4.根据权利要求1所述的视频推荐方法,其特征在于,所述根据所述视频属性信息及预设的视频标签所属类别权重,计算目标视频与其他视频之间的权重得分,其中,视频标签所属类别权重反映视频标签所属类别的优先级具体为:根据权重得分计算公式计算目标视频与其他视频之间的权重得分,其中,权重得分计算公式为:,h为关键词类别中的视频标签匹配的个数,,f为预设关键词类别视频标签个数,表示目标视频与其他视频中对应项视频标签是否匹配成功,匹配成功,值为1,匹配失败,值为0,k、m、n为自然数,取满足大于的最小值。
5.根据权利要求1所述的视频推荐方法,其特征在于,所述视频为教育视频,所述视频标签所属类别为适用人群、适用年级、科目、版本、关键词,适用人群的优先级大于适用年级的优先级大于科目的优先级大于版本的优先级大于关键词的优先级。
6.根据权利要求5所述的视频推荐方法,其特征在于,所述根据所述目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐具体为:对所述目标视频与其他视频之间的权重得分进行归一化处理,得到目标视频与其他视频之间的相似度,根据得到的目标视频与其他视频之间的相似度生成视频推荐列表进行推荐。
7.一种视频推荐装置,其特征在于,包括:
获取模块,用于获取视频属性信息,所述视频属性信息包括视频标签及视频标签所属类别,所述视频标签为体现视频特性的元素;
权重得分计算模块,用于根据所述视频属性信息及预设的视频标签所属类别权重,计算目标视频与其他视频之间的权重得分,其中,视频标签所属类别权重反映视频标签所属类别优先级;
推荐模块,用于根据所述目标视频与其他视频之间的权重得分,生成视频推荐列表进行推荐。
8.根据权利要求7所述的视频推荐装置,其特征在于,所述权重得分计算模块具体为:将目标视频中的每项视频标签与其他视频中的每项视频标签进行匹配,匹配成功,则值为1,匹配失败,则值为0,将获得的每项视频标签匹配值乘以预设的视频标签所属类别权重,求和即为该两视频之间的权重得分。
9.根据权利要求7所述的视频推荐装置,其特征在于,所述权重得分计算模块具体为:根据权重得分计算公式计算目标视频与其他视频之间的权重得分,其中,权重得分计算公式为:,h为关键词类别中的视频标签匹配的个数,,f为预设关键词类别视频标签个数,表示目标视频与其他视频之间对应项视频标签是否匹配成功,匹配成功,值为1,匹配失败,值为0,k、m、n为自然数,取满足大于的最小值。
10.根据权利要求7所述的视频推荐装置,其特征在于,所述视频标签所属类别权重为二进制权重,视频标签所属类别优先级高,则设置的二进制权重大。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510993874.6A CN105512331B (zh) | 2015-12-28 | 2015-12-28 | 一种视频推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510993874.6A CN105512331B (zh) | 2015-12-28 | 2015-12-28 | 一种视频推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105512331A CN105512331A (zh) | 2016-04-20 |
CN105512331B true CN105512331B (zh) | 2019-03-26 |
Family
ID=55720311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510993874.6A Active CN105512331B (zh) | 2015-12-28 | 2015-12-28 | 一种视频推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105512331B (zh) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451148A (zh) * | 2016-05-31 | 2017-12-08 | 北京金山安全软件有限公司 | 一种视频分类方法、装置及电子设备 |
CN106250557A (zh) * | 2016-08-16 | 2016-12-21 | 青岛海信传媒网络技术有限公司 | 应用的推荐方法及装置 |
CN106791963B (zh) * | 2016-12-08 | 2020-08-18 | Tcl科技集团股份有限公司 | 一种电视节目推荐方法及系统 |
CN106777053A (zh) * | 2016-12-09 | 2017-05-31 | 国网北京市电力公司 | 媒体内容的分类方法和装置 |
CN108268540A (zh) * | 2016-12-31 | 2018-07-10 | 深圳市优朋普乐传媒发展有限公司 | 一种基于视频相似度的视频推荐方法、系统及终端 |
CN107426610B (zh) * | 2017-03-29 | 2020-04-28 | 聚好看科技股份有限公司 | 视频信息同步方法及装置 |
CN108733737B (zh) * | 2017-04-25 | 2021-02-09 | 阿里巴巴(中国)有限公司 | 视频库的建立方法及装置 |
CN109002446B (zh) * | 2017-06-07 | 2021-06-01 | 联芯科技有限公司 | 一种智能排序方法、终端与计算机可读存储介质 |
CN107368584B (zh) * | 2017-07-21 | 2020-07-03 | 山东大学 | 一种个性化视频推荐方法及系统 |
CN107995517A (zh) * | 2017-12-21 | 2018-05-04 | 知而行(上海)营销咨询有限公司 | 一种基于实时购物篮信息的视频广告播放方法及系统 |
CN108012192A (zh) * | 2017-12-25 | 2018-05-08 | 北京奇艺世纪科技有限公司 | 一种视频资源的识别和聚合的方法及系统 |
CN108229552B (zh) * | 2017-12-29 | 2021-07-09 | 咪咕文化科技有限公司 | 一种模型处理方法、装置及存储介质 |
CN108228911A (zh) * | 2018-02-11 | 2018-06-29 | 北京搜狐新媒体信息技术有限公司 | 一种相似视频的计算方法及装置 |
CN108334640A (zh) * | 2018-03-21 | 2018-07-27 | 北京奇艺世纪科技有限公司 | 一种视频推荐方法及装置 |
CN108549727B (zh) * | 2018-05-02 | 2021-11-23 | 上海财经大学 | 基于网络爬虫以及大数据分析的用户获利信息推送方法 |
CN111385659B (zh) * | 2018-12-29 | 2021-08-17 | 广州市百果园信息技术有限公司 | 一种视频推荐方法、装置、设备及存储介质 |
CN112118486B (zh) * | 2019-06-21 | 2022-07-01 | 北京达佳互联信息技术有限公司 | 内容项投放方法、装置、计算机设备及存储介质 |
CN110737833B (zh) * | 2019-09-29 | 2022-09-13 | 安徽火蓝数据有限公司 | 一种基于推荐度的商品推送方法 |
CN110851709B (zh) * | 2019-10-17 | 2022-10-14 | 浙江大搜车软件技术有限公司 | 资讯推送方法、装置、计算机设备和存储介质 |
CN111368138A (zh) * | 2020-02-10 | 2020-07-03 | 北京达佳互联信息技术有限公司 | 视频类别标签的排序方法、装置、电子设备及存储介质 |
CN111415328B (zh) * | 2020-02-20 | 2023-07-11 | 北京三快在线科技有限公司 | 物品分析数据确定方法、装置、电子设备 |
CN112016613B (zh) * | 2020-08-26 | 2024-08-13 | 广州市百果园信息技术有限公司 | 视频内容分类模型的训练方法、装置、计算机设备及介质 |
CN112291624B (zh) * | 2020-09-23 | 2023-10-17 | 咪咕视讯科技有限公司 | 视频处理方法、装置、电子设备及存储介质 |
CN112188295B (zh) * | 2020-09-29 | 2022-07-05 | 有半岛(北京)信息科技有限公司 | 一种视频推荐方法及装置 |
CN114219586A (zh) * | 2022-01-14 | 2022-03-22 | 平安普惠企业管理有限公司 | 基于视频的购物推荐方法、装置、设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102957949A (zh) * | 2012-05-18 | 2013-03-06 | 华东师范大学 | 为用户推荐视频的装置及方法 |
CN103186595A (zh) * | 2011-12-29 | 2013-07-03 | 盛乐信息技术(上海)有限公司 | 音视频推荐方法及系统 |
CN103731738A (zh) * | 2014-01-23 | 2014-04-16 | 哈尔滨理工大学 | 基于用户群组行为分析的视频推荐方法及装置 |
CN104053023A (zh) * | 2014-06-13 | 2014-09-17 | 海信集团有限公司 | 一种确定视频相似度的方法及装置 |
CN104199896A (zh) * | 2014-08-26 | 2014-12-10 | 海信集团有限公司 | 基于特征分类的视频相似度确定及视频推荐方法 |
EP2864907A1 (en) * | 2012-06-26 | 2015-04-29 | AOL Inc. | Systems and methods for identifying electronic content using video graphs |
CN104731950A (zh) * | 2015-03-31 | 2015-06-24 | 北京奇艺世纪科技有限公司 | 一种视频推荐方法和装置 |
-
2015
- 2015-12-28 CN CN201510993874.6A patent/CN105512331B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186595A (zh) * | 2011-12-29 | 2013-07-03 | 盛乐信息技术(上海)有限公司 | 音视频推荐方法及系统 |
CN102957949A (zh) * | 2012-05-18 | 2013-03-06 | 华东师范大学 | 为用户推荐视频的装置及方法 |
EP2864907A1 (en) * | 2012-06-26 | 2015-04-29 | AOL Inc. | Systems and methods for identifying electronic content using video graphs |
CN103731738A (zh) * | 2014-01-23 | 2014-04-16 | 哈尔滨理工大学 | 基于用户群组行为分析的视频推荐方法及装置 |
CN104053023A (zh) * | 2014-06-13 | 2014-09-17 | 海信集团有限公司 | 一种确定视频相似度的方法及装置 |
CN104199896A (zh) * | 2014-08-26 | 2014-12-10 | 海信集团有限公司 | 基于特征分类的视频相似度确定及视频推荐方法 |
CN104731950A (zh) * | 2015-03-31 | 2015-06-24 | 北京奇艺世纪科技有限公司 | 一种视频推荐方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105512331A (zh) | 2016-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105512331B (zh) | 一种视频推荐方法及装置 | |
US11334635B2 (en) | Domain specific natural language understanding of customer intent in self-help | |
CN106649818B (zh) | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 | |
US9830386B2 (en) | Determining trending topics in social media | |
US11019017B2 (en) | Social media influence of geographic locations | |
US20210056571A1 (en) | Determining of summary of user-generated content and recommendation of user-generated content | |
CN105404698A (zh) | 一种教育视频推荐方法及装置 | |
Shi et al. | Learning-to-rank for real-time high-precision hashtag recommendation for streaming news | |
US10657170B2 (en) | System and method for automatically selecting images to accompany text | |
CN105095508A (zh) | 一种多媒体内容推荐方法和多媒体内容推荐装置 | |
CN110019794B (zh) | 文本资源的分类方法、装置、存储介质及电子装置 | |
CN109885773A (zh) | 一种文章个性化推荐方法、系统、介质及设备 | |
US11640420B2 (en) | System and method for automatic summarization of content with event based analysis | |
US20150379610A1 (en) | Recommendation information presentation device, recommendation information presentation method, and recommendation information presentation program | |
EP2741220A1 (en) | Apparatus and method for indexing electronic content | |
EP3443486A1 (en) | Query optimizer for combined structured and unstructured data records | |
CN104881447A (zh) | 搜索方法及装置 | |
CN114255067A (zh) | 数据定价方法和装置、电子设备、存储介质 | |
US11232325B2 (en) | Data analysis system, method for controlling data analysis system, and recording medium | |
CN115544369A (zh) | 数据搜索方法、装置、计算机设备以及存储介质 | |
CN112487276B (zh) | 一种对象获取方法、装置、设备及存储介质 | |
Omar et al. | Machine Learning Model for Personalizing Online Arabic Journalism | |
CN110659419A (zh) | 确定目标用户的方法及相关装置 | |
CN108509459B (zh) | 数据处理方法和装置 | |
CN110765771A (zh) | 用于确定广告语句的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |