CN104199896B - 基于特征分类的视频相似度确定及视频推荐方法 - Google Patents

基于特征分类的视频相似度确定及视频推荐方法 Download PDF

Info

Publication number
CN104199896B
CN104199896B CN201410423523.7A CN201410423523A CN104199896B CN 104199896 B CN104199896 B CN 104199896B CN 201410423523 A CN201410423523 A CN 201410423523A CN 104199896 B CN104199896 B CN 104199896B
Authority
CN
China
Prior art keywords
video
similarity
feature
subclass
reference video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410423523.7A
Other languages
English (en)
Other versions
CN104199896A (zh
Inventor
王洁
高雪松
胡伟凤
谢杰
许丽星
于旭
周翚
张帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Group Co Ltd
Original Assignee
Hisense Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Group Co Ltd filed Critical Hisense Group Co Ltd
Priority to CN201410423523.7A priority Critical patent/CN104199896B/zh
Publication of CN104199896A publication Critical patent/CN104199896A/zh
Application granted granted Critical
Publication of CN104199896B publication Critical patent/CN104199896B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7343Query language or query format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Abstract

本发明公开了一种基于特征分类的视频相似度确定及视频推荐方法,视频相似度确定方法包括:获取参考视频的主特征和所有次特征;根据获取到的所述参考视频的主特征从特征视频集合中查找具有该主特征的特征视频子集合;从所述特征视频子集合中查找与所述参考视频具有相同次特征的视频,并作为相关视频;计算所述相关视频与所述参考视频的内容相似度,确定为特征分类相似度。可以解决现有技术基于视频内容确定视频相似度时因遍历所有视频记录而存在的计算量大、耗时长的问题。将本发明获得的特征分类相似度与操作相似度及人物相似度融合,确定总视频相似度来推荐视频,可以解决现有技术视频推荐结果单一、无法满足多样化需求的问题。

Description

基于特征分类的视频相似度确定及视频推荐方法
技术领域
本发明属于数据处理技术领域,具体地说,是涉及视频相似度的确定及视频推荐,更具体地说,是涉及基于特征分类的视频相似度确定及视频推荐方法。
背景技术
目前,视频平台基本都具有智能视频推荐系统。用户在通过视频平台查看某视频的介绍或观看某视频,平台的智能视频推荐系统会自动为用户推荐并呈现与用户所查看或观看的视频相关的视频,可以在避免用户手动搜索的情况下,帮助用户找到自己感兴趣的视频,不但方便了用户,而且增加了用户在视频网站上的停留时间。而且,现有智能视频推荐系统大都是通过搜索相关视频、确定视频之间的相似度,进而根据相似度的大小向用户推荐视频。
现有智能视频推荐系统确定视频之间的相似度时,常用的方法是基于视频内容来实现。具体而言,首先提取每个视频的视频标签;然后,针对当前视频的每个视频标签,依次遍历除当前视频之外的所有视频的视频标签,查找到具有相同视频标签的视频作为相关视频;然后,根据每个相同视频标签的权重计算当前视频与相关视频的相似度。在该过程中,针对当前视频的每个视频标签,均需要遍历当前视频之外的所有视频。视频标签越多,遍历次数越多,视频推荐速度就越慢。
上述确定视频相似度的方法在视频数量、视频标签数量较少的情况下是能够接受的。但是,面对信息爆炸时代产生的海量视频及高匹配度视频推荐的需求,如果仍采用多次遍历所有视频的方法来获取相关视频,耗时长,速度慢,对视频推荐系统的处理能力和处理速度提出了严苛的要求,严重影响视频推荐的速度。
此外,单纯基于视频内容进行视频推荐,在视频数量较少的情况下,各个视频的基础信息可能会存在很大差异。即使视频数量较多,也会使得推荐结果单纯依赖于视频基础信息,推荐的视频单一,无法实现多样化的推荐需求。虽然现有智能视频推荐系统中出现了一种基于用户操作行为确定视频的操作相似度的技术,例如,根据用户观看视频的行为、用户收藏视频的行为、用户浏览视频详情介绍的行为等,确定视频的操作相似度。但是,不管是基于视频内容进行推荐,还是基于用户操作行为进行推荐,均与用户及其所看的作品具有很强的相关性,无法实现与当前热点的关联,仍无法实现多样化的视频推荐,也难以充分挖掘和利用视频中的长尾数据。
发明内容
本发明的目的之一是提供一种基于特征分类的视频相似度确定方法,以解决现有技术基于视频内容确定视频相似度时因多次遍历视频而存在的耗时长、速度慢的问题。
为解决上述技术问题,本发明提供的基于特征分类的视频相似度确定方法采用下述技术方案来实现:
一种基于特征分类的视频相似度确定方法,所述方法包括:
获取参考视频的主特征和所有次特征;
根据获取到的所述参考视频的主特征从特征视频集合中查找具有该主特征的特征视频子集合;
从所述特征视频子集合中查找与所述参考视频具有相同次特征的视频,并作为相关视频;
计算所述相关视频与所述参考视频的内容相似度,确定为特征分类相似度;
其中,所述主特征和所述次特征均为视频的视频标签,所述特征视频集合为根据视频标签中的主特征和次特征将视频分类后形成的集合,所述特征视频集合包括若干与主特征一一对应的所述特征视频子集合。
本发明的目的之二是提供一种基于特征分类的视频推荐方法,以解决现有技术视频推荐结果单一、无法满足多样化需求的问题。
为解决上述发明目的,本发明提供的基于特征分类的视频推荐方法采用下述技术方案予以实现:
一种基于特征分类的视频推荐方法,所述方法包括:
获取参考视频的相关视频;
获取所述相关视频与所述参考视频的特征分类相似度、操作相似度及人物相似度;
根据所述特征分类相似度、所述操作相似度及所述人物相似度确定所述相关视频与所述参考视频的总视频相似度;
根据所述总视频相似度推荐视频;
其中,所述参考视频的相关视频及所述特征分类相似度根据上述权利要求1至3中任一项所述的方法获得;
获取所述人物相似度的具体过程为:
为每个视频设置指定人物的人物相关信息属性,获取所述参考视频中的人物相关信息属性值和所述相关视频中的人物相关信息属性值,按照设定准则对所述人物相关信息属性值进行量化,分别获得所述参考视频的人物属性向量和所述相关视频的人物属性向量,利用两个所述人物属性向量、采用余弦相似度方法获得所述相关视频与所述参考视频的人物相似度。
与现有技术相比,本发明的优点和积极效果是:
1、本发明根据视频标签的主特征和次特征将视频进行分类处理,形成特征视频集合,在确定参考视频的相关视频时,仅需要遍历与参考视频具有相同主特征的特征视频子集合中的次特征,无需遍历所有视频中的所有视频标签,极大减少了根据视频标签确定视频内容相似度的时间和数据处理量,有助于视频推荐系统快速地确定视频相似度,并向用户推荐相关视频;
2、本发明将基于视频内容的特征分类相似度、基于用户操作行为的操作相似度及基于人物相关信息的人物相似度相结合来确定总视频相似度,并根据总视频相似度向用户推荐视频,实现了与用户及所看作品内容具有强相关的相似度和与当前热点信息相关的相似度结合,能够满足用户多样化的观看需求,且通过多相似度的融合,更容易将海量视频中用户未看过或极少观看的视频推荐给用户,有助于充分挖掘和利用视频中的长尾数据。
结合附图阅读本发明的具体实施方式后,本发明的其他特点和优点将变得更加清楚。
附图说明
图1是本发明基于特征分类的视频相似度确定方法一个实施例的流程图;
图2是图1中特征视频集合的一个示意图;
图3是本发明基于特征分类的视频推荐方法一个实施例的流程图;
图4是图3中获取操作相似度的一个具体流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下将结合附图和实施例,对本发明作进一步详细说明。
简要说明本发明的技术思路:
本发明从与视频内容相关性较强的视频标签中提取出一个典型视频标签作为主特征,其余视频标签作为次特征,根据主特征和次特征对视频进行特征分类,形成特征视频集合;在确定某个视频(即参考视频)的相关视频时,仅需从特征视频集合中查找与参考视频主特征相同的特征视频子集合,在特征视频子集合中对参考视频的次特征进行匹配,确定出相关视频,然后再计算得到参考视频与相关视频的内容相似度,实现基于特征分类的视频特征分类相似度确定。应用该方法确定视频相似度时,无需多次遍历大量视频,查找针对的数据量少,查找相关视频的速度快,数据处理量少,从而可以快速、准确地确定出视频相似度。
此外,本发明在确定了基于特征分类的特征分类视频相似度之后,再与基于用户操作行为的操作相似度和基于人物相关信息的人物相似度相结合,作为两个视频的总视频相似度,并根据总视频相似度得到某一参考视频的一系列相关视频的排名,向用户推荐排名结果靠前的视频,提高了视频推荐结果的多样性。
请参见图1,该图所示为本发明基于特征分类的视频相似度确定方法一个实施例的流程图。
如图1所示,该实施例确定视频相似度的具体过程如下:
步骤101:获取参考视频的主特征和所有次特征。
其中,参考视频是指当前用户正在观看视频,确定视频相似度是确定其他视频与该参考视频的相似度,从而实现根据参考视频进行相关视频推荐。主特征和次特征均为视频的视频标签。而且,主特征为一个典型视频标签,主特征之外的其余视频标签均作为次特征。举例来说,将视频标签中的视频类型标签作为主特征,其余视频标签例如演员、导演等均作为次特征。对于一个视频集合而言,集合中的所有视频的主特征均为同类视频标签。
具体而言,视频标签可以通过对视频的基础描述信息进行分词处理后得到。具体来说,视频的基础描述信息中包括有视频名称、视频类型、国家、演员、导演、影片简介等。将视频的基础描述信息进行分词处理,处理结果去重后生成视频标签。然后,根据推荐需要或预先设定,确定主特征和次特征,并进行标记。
步骤102:根据获取到的参考视频的主特征从特征视频结合中查找具有该主特征的特征视频子集合。
其中,特征视频集合和特征视频子集合是预先形成并存储的。特征视频集合是根据视频标签中的主特征和次特征将视频分类后形成的集合,因而,特征视频集合是对原视频集合中的视频基于视频标签特征重新分类处理后的一个视频集合。特征视频集合中具有相同主特征的所有视频构成一个特征视频子集合,且,特征视频子集合与主特征一一对应。
若要基于参考视频推荐其他视频,首先要确定参考视频的相关视频。也即,从特征视频集合中确定该原始视频的相关视频。在该实施例中,基于视频内容来确定相关视频。而且,以视频内容中的视频标签作为相关视频的判断要素。由于特征视频子集合与主特征一一对应,因此,首先,根据步骤101所获取的参考视频的主特征,从特征视频集合中查找出具有该主特征的特征视频子集合。
步骤103:从特征视频子集合中查找与参考视频具有相同次特征的视频,并作为该参考视频的相关视频。
步骤104:计算相关视频与参考视频的内容相似度,确定为特征分类相似度。
步骤103查找出参考视频的相关视频之后,即可计算相关视频与参考视频的内容相似度,并将该内容相似度确定为基于特征分类的特征分类相似度。
两个视频的内容相似度的计算方法可以采用现有技术来实现,优选采用下面所描述的计算方法,详见后续技术内容的描述。
在该实施例中,先根据视频标签将原始的视频集合中的所有视频进行特征分类,形成基于主特征的多个特征分类视频子集合。在确定参考视频的相关视频时,仅需要从与参考视频具有相同主特征的特征分类视频子集合中进行相关视频查找。而且,由于特征分类视频子集合已根据主特征进行了分类,方便根据参考视频的主特征进行相关视频的查找匹配。因而,整个相关视频确定过程无需对所有视频均进行操作,只需遍历有限视频即可,查找速度快,数据处理量少,计算复杂度小。
具体而言,在按照视频标签对视频进行特征分类时,先根据视频标签中的主特征将所有视频进行分类,形成与主特征一一对应的多个特征视频子集合。然后,在每个特征视频子集合中存储对应的主特征以及具有该主特征的所有视频所具有的所有次特征。同时,在每个次特征下存储该主特征下、具有该次特征的视频的视频ID,从而形成特征视频子集合。所有的特征视频子集合构成所有视频的特征视频集合。
图2示出了采用上述方法所形成的特征视频集合的一个示意图。
如图2所示的特征视频集合中,“电影”、“电视剧”、“综艺”、“动漫”、“其他”等为视频类型标签,将该视频类型标签作为主特征,不同内容的主特征构成不同的特征视频子集合。对于主特征内容为“电影”的这个特征视频子集合,tag11,…,tag1n是“电影”这一主特征下的所有视频所具有的所有次特征,共有n个,n个次特征依次排列。例如,次特征包括“喜剧”、“剧情”等。对于主特征为“电影”的视频,具有tag11这个次特征的视频有n个,对应的视频ID分别为mediaid11,…,mediaid1n,这n个视频ID依次排列,存储在tag11这个次特征下。
同样的,对于主特征内容为“电视剧”的这个特征视频子集合,tag21,…,tag2n是“电视剧”这一主特征下的所有视频所具有的所有次特征,共有n个,n个次特征依次排列。对于主特征为“电视剧”的视频,具有tag21这个次特征的视频也有n个,对应的视频ID分别为mediaid21,…,mediaid2n,且这n个视频ID依次排列,存储在tag21这个次特征下。
其余主特征、次特征及视频ID也均按照上述数据格式依次排列、存储。
基于图2的特征视频集合示意图,步骤102及103在获取参考视频的相关视频时,先定位到与参考视频同主特征的特征视频子集合。例如,参考视频的主特征为“电影”,则定位到的特征视频子集合为图2中的第一个“电影”子集合。然后,根据参考视频的次特征从“电影”特征视频子集合中查找相关视频。具体来说,如果参考视频具有tag11次特征,则在“电影”特征视频子集合中,tag11下的所有视频ID对应的视频均认为是参考视频的相关视频。
确定相关视频后,还需要确定相关视频与参考视频的视频相似度。也即,步骤104所执行的计算相关视频与参考视频的内容相似度。在该实施例中,优选采用下述方式计算相关视频与参考视频的内容相似度:
获取参考视频中的每个次特征的权重,将所有次特征的权重求和,得到第一权重求和值;获取相关视频中与参考视频相同的所有次特征及对应的权重,将该相同的所有次特征的权重求和,得到第二权重求和值;将第二权重求和值与第一权重求和值相比,得到的比值作为相关视频与该参考视频的内容相似度,也即特征分类相似度。其中,每个次特征的权重为预设值,可以根据需要对不同的次特征设置相同、不相同或不完全相同的权重。例如,可以对演员、导演等相关性强的次特征设置较大的权重值,对剧情等相关性略弱的次特征设置略小的权重值。
具体来说,设为参考视频与其任一相关视频的特征分类相似度,为参考视频的次特征列表长度,为参考视频的第个次特征的权重,为任一相关视频的第个次特征的权重。若任一相关视频具有该第个次特征,则任一相关视频的第个次特征的权重与参考视频的第个次特征的权重相等;若任一相关视频不具有该第个次特征,则任一相关视频的第个次特征的权重为0。则,采用下述公式来计算:
举例来说,从图2示出的特征视频集合中查找到参考视频对应的特征视频子集合后,根据参考视频的次特征进行匹配,判断特征视频子集合中对应参考视频的次特征下是否存储相关视频的视频ID。如果某个次特征下存储有相关视频的视频ID,则将该次特征的权重加到分子上,作为相关视频的权重求和的一份子。如果某个次特征下没有相关视频的视频ID,则认为相关视频对应该次特征的权重为0。通过上述过程和上述公式处理后,计算得到的参考视频与其任一相关视频的特征分类相似度的值为一个不大于1的数值,也即,特征分类相似度的取值范围为[0,1]。
通过上述实施例得到相关视频与参考视频基于特征分类的特征分类相似度后,可以基于该特征分类相似度与其他视频相似度融合进行视频推荐。
图3示出了本发明基于特征分类的视频推荐方法一个实施例的流程图,具体来说,是将特征分类相似度、操作相似度及人物相似度相融合,实现基于综合相似度的视频推荐方法的一个实施例的流程图。
如图3所示,该实施例的具体实现过程如下:
步骤301:获取参考视频的相关视频。
相关视频的获取可以采用图1实施例中的方法来实现。
步骤302:获取相关视频与参考视频的特征分类相似度、操作相似度及人物相似度。
其中,特征分类相似度也采用图1实施例中的方法来实现。而操作相似度是指基于用户操作行为获取的两个视频的相似度,可以采用现有技术来实现,优选采用下面所描述的计算方法,详见后续技术内容的描述。
人物相似度,是指基于人物相关信息而获取的两个视频的相似度。这里的人物,可以为视频的导演、演员等演职员真实人物,也可以指视频内容中所讲述的历史人物或抽象人物。人物相关信息又可根据人物进行区分。例如,若人物是视频演职员等真实人物,人物相关信息可以为与之有亲属(或绯闻)关系的其他人物,该真实人物的年龄(所处的年龄段)、派别(实力派、偶像派)、戏风(动作、爱情、历史)等。若人物为视频内容所讲述的历史人物,人物相关信息可以为人物所处历史时代、该历史人物历史典故中的涉及人物等。
在该实施例中,为确定视频的人物相似度,首先为每个视频设置指定人物的人物相关信息属性,并为每个人物相关信息属性填充相应的属性值。而且,人物相关信息属性值优选根据社交网络中的实时信息定时进行更新,从而,使得人物相关信息属性保持与热点的同步。在确定相关视频与参考视频的人物相似度时,获取参考视频中的人物相关信息属性值和相关视频中的人物相关信息属性值,按照设定准则对人物相关信息属性值进行量化,分别获得参考视频的人物属性向量和相关视频的人物属性向量。然后,利用两个人物属性向量、采用余弦相似度方法获得参考视频与相关视频的人物相似度。
以计算参考视频与其任一相关视频的人物相似度为例,说明人物相似度获取的具体实现方法如下:
设定视频的人物相关信息属性包括主演的四个属性,分别为亲属(或绯闻)关系、主演年龄段、主演派别和主演戏风。分别获取参考视频和相关视频的人物相关信息属性值。其中,人物相关信息属性值可以作为视频内容的一部分存储;也可以存储在指定数据库中,而视频内容中仅包含人物相关信息属性字段。将参考视频的人物相关信息属性值与相关视频的人物相关信息属性值一一进行比较,然后进行量化。具体量化过程为:若相同的属性的值相同,则将两个视频的该属性值均量化为1;若相同的属性的值不相同,则将两个视频的属性值分别用0和1进行量化,使得两个视频的量化属性值不同。譬如,经过比较和量化,参考视频量化后的人物属性向量为,而相关视频的人物属性向量为。然后,采用余弦相似度方法获得参考视频与相关视频的人物相似度如下:
通过上述计算公式获得的人物相似度,取值范围为[0,1],与上述的特征分类相似度的值处于同一个区间上。
步骤303:根据特征分类相似度、操作相似度及人物相似度确定相关视频与参考视频的总视频相似度。
也即,相关视频与参考视频的最终总视频相似度与两个视频的特征分类相似度、操作相似度及人物相似度均相关,是融合三个相似度之后的一个综合相似度。
步骤304:根据总视频相似度推荐视频。
按照步骤302和步骤303确定出参考视频与每个相关视频的总视频相似度,将总视频相似度由大到小排序,取出排名靠前的指定数量的视频,作为相关推荐视频,并呈现给用户,实现根据视频相似度推荐视频。
在该实施例中,特征分类相似度本质上是基于视频内容的相似度,与视频内容相关性强,操作相似度是基于用户操作行为的相似度,与观看视频作品的用户相关性强,而人物相似度与用户及作品内容的相关性略弱,但与当前热点信息相关性强。因而,将基于视频内容的特征分类相似度、基于用户操作行为的操作相似度及基于人物相关信息的人物相似度相结合来确定总视频相似度,能够满足用户多样化的视频推荐和观看需求,且更容易将海量视频中用户未看或极少观看的作品推荐给用户,有助于充分挖掘和利用视频中的长尾数据,提高视频提供方利益的最大化。
具体而言,步骤303中,根据特征分类相似度、操作相似度及所述人物相似度确定相关视频与参考视频的总视频相似度的具体过程如下:
为参考视频和相关视频的视频相似度,分别为参考视频和相关视频的特征分类相似度、人物相似度和操作相似度,设定参数为平衡该三个相似度对总视频相似度影响的调节因子,则,参考视频和相关视频的总视频相似度将通过下述公式来确定:
也即,通过融合而获得。而且,参数的值在初始赋予初始值后,可以根据用户对视频推荐系统的反馈结果不断进行自适应调整,以使得视频推荐结果达到最优。
在该实施例中,基于用户操作行为的操作相似度的获取方法,优选采用图4的流程来实现。
如图4示出的图3中获取操作相似度的一个具体流程图所示,操作相似度的获取过程如下:
步骤401:获取对视频具有操作行为的用户及用户数量。
步骤402:根据不同的操作行为,将视频以及与视频对应的用户及用户数量划分为不同操作视频子集合。
步骤403:根据每个操作视频子集合中与参考视频对应的用户及用户数量以及与相关视频对应的用户及用户数量,得到相关视频和参考视频的操作相似度。
具体而言,在步骤401中,可以在设定的一段时间内,获取对视频具有操作行为的用户及用户数量,并对基础数据进行降噪处理,剔除掉非优质视频的数据以及终端用户没有发生实际操作行为的数据,例如,用户观看视频的时间低于设定的时间阈值。
在步骤402中,根据终端用户的操作行为的不同,将视频以及与视频对应的用户及用户数量划分为不同的操作视频子集合。其中,终端用户的操作行为包括显性行为和隐性行为,例如用户观看视频的行为、用户收藏视频的行为、用户浏览视频详情介绍的行为、用户在社交网络中关注视频的行为等,此处不再一一列举。
可选的,获取对视频具有操作行为的用户及用户数量后,按照用户的显性行为和隐性行为,将视频以及与视频对应的用户及用户数量分为两类,分别为显性行为对应的类别和隐性行为对应的类别;进一步的,在上述两个类别中,根据操作行为的不同,将视频以及与视频对应的用户及用户数量划分成不同操作视频子集合。
在步骤403中,根据每个操作视频子集合中与原始视频对应的用户及用户数量以及与相关视频对应的用户及用户数量,得到参考视频和相关视频的操作相似度的具体过程为:
对于要确定操作相似度的参考视频和相关视频,在一个指定的操作视频子集合中,例如用户观看视频行为对应的集合中,根据对参考视频具有观看行为的用户及用户数量,以及对相关视频具有观看行为的用户及用户数量,得到参考视频和相关视频的相似度。
然后,根据每个操作视频子集合对应的参考视频和相关视频的相似度,得到参考视频和相关视频的操作相似度。
优选的,根据一个操作视频子集合中与参考视频对应的用户及用户数量以及与相关视频对应的用户及用户数量,根据下列方式确定该操作视频子集合对应的参考视频和相关视频的相似度:
其中,为该操作视频子集合对应的参考视频和相关视频的相似度,为操作视频子集合对应的所有视频集,为该操作视频子集合中的任意两部视频,为对参考视频和相关视频都存在相同操作行为的用户数量,为对任意两部视频都存在相同操作行为的用户数量。同理,可得到每个操作视频子集合对应的参考视频和相关视频的相似度,进而得到参考视频和相关视频的操作相似度。
更优选的,在步骤403中,根据每个操作视频子集合对应的参考视频和相关视频的相似度,以及每个操作视频子集合对应的权重,通过加权求和的方式,得到参考视频和相关视频的操作相似度。
具体的,分别采用上述方法计算出每个操作视频子集合对应的参考视频和相关视频的相似度,并对每个子集合设定权重,权重可以设定为0-1中的任意值,这样可使得到的操作相似度的值在[0, 1]范围内,与特征分类相似度、人物相似度的值处于同一个区间上,实现了三个相似度的归一化处理。根据所设定的权重,将每个操作视频子集合对应的参考视频和相关视频的相似度加权求和,确定出参考视频和相关视频的操作相似度。
以上实施例仅用以说明本发明的技术方案,而非对其进行限制;尽管参照前述实施例对本发明进行了详细的说明,对于本领域的普通技术人员来说,依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明所要求保护的技术方案的精神和范围。

Claims (10)

1.一种基于特征分类的视频相似度确定方法,其特征在于,所述方法包括:
获取参考视频的主特征和所有次特征;
根据获取到的所述参考视频的主特征从特征视频集合中查找具有该主特征的特征视频子集合;
从所述特征视频子集合中查找与所述参考视频具有相同次特征的视频,并作为相关视频;
计算所述相关视频与所述参考视频的内容相似度,确定为特征分类相似度;
其中,所述主特征为一个视频标签,所述主特征之外的其余视频标签均为所述次特征,所述特征视频集合为根据视频标签中的主特征和次特征将视频分类后形成的集合,所述特征视频集合包括若干与主特征一一对应的所述特征视频子集合。
2.根据权利要求1所述的视频相似度确定方法,其特征在于,所述根据视频标签中的主特征和次特征将视频分类、形成所述特征视频集合具体为:
根据所述主特征将所有视频进行分类,形成与主特征一一对应的多个特征视频子集合,在每个所述特征视频子集合中存储对应的主特征及具有该主特征的所有视频所具有的所有次特征,并在每个所述次特征下存储该主特征下、具有该次特征的视频的视频ID。
3.根据权利要求1所述的视频相似度确定方法,其特征在于,所述计算所述相关视频与所述参考视频的内容相似度,确定为特征分类相似度具体为:
获取所述参考视频中每个次特征的权重,将所有次特征的权重求和,得到第一权重求和值;获取所述相关视频中与所述参考视频相同的所有次特征及对应的权重,将该相同的所有次特征的权重求和,得到第二权重求和值;将所述第二权重求和值与所述第一权重求和值相比,得到的比值作为所述相关视频与所述参考视频的特征分类相似度。
4.一种基于特征分类的视频推荐方法,其特征在于,所述方法包括:
获取参考视频的相关视频;
获取所述相关视频与所述参考视频的特征分类相似度、操作相似度及人物相似度;
根据所述特征分类相似度、所述操作相似度及所述人物相似度确定所述相关视频与所述参考视频的总视频相似度;
根据所述总视频相似度推荐视频;
其中,所述参考视频的相关视频及所述特征分类相似度根据上述权利要求1至3中任一项所述的方法获得;所述操作相似度是指基于用户操作行为获取的两个视频的相似度;
获取所述人物相似度的具体过程为:
为每个视频设置指定人物的人物相关信息属性,获取所述参考视频中的人物相关信息属性值和所述相关视频中的人物相关信息属性值,按照设定准则对所述人物相关信息属性值进行量化,分别获得所述参考视频的人物属性向量和所述相关视频的人物属性向量,利用两个所述人物属性向量、采用余弦相似度方法获得所述相关视频与所述参考视频的人物相似度。
5.根据权利要求4所述的视频推荐方法,其特征在于,所述视频的人物相关信息属性值定时进行更新。
6.根据权利要求4所述的视频推荐方法,其特征在于,获取所述操作相似度的具体过程为:
获取对视频具有操作行为的用户及用户数量;
根据不同的操作行为,将视频以及与视频对应的用户及用户数量划分为不同操作视频子集合;
根据每个所述操作视频子集合中与所述参考视频对应的用户及用户数量以及与所述相关视频对应的用户及用户数量,得到所述相关视频和所述参考视频的操作相似度。
7.根据权利要求6所述的视频推荐方法,其特征在于,所述根据每个所述操作视频子集合中与所述参考视频对应的用户及用户数量以及与所述相关视频对应的用户及用户数量,得到所述相关视频和所述参考视频的操作相似度的具体过程为:
针对一个所述操作视频子集合,根据该操作视频子集合中与所述参考视频对应的用户及用户数量以及与所述相关视频对应的用户及用户数量,得到所述相关视频和所述参考视频的相似度;
根据每个所述操作视频子集合对应的所述相关视频和所述参考视频的相似度,得到所述相关视频和所述参考视频的操作相似度。
8.如权利要求7所述的视频推荐方法,其特征在于,所述根据该操作视频子集合中与所述参考视频对应的用户及用户数量以及与所述相关视频对应的用户及用户数量,得到所述相关视频和所述参考视频的相似度的具体过程为:
根据以下方式确定所述操作视频子集合对应的所述相关视频和所述参考视频的相似度:
<mrow> <msub> <mi>sim</mi> <mrow> <mn>3</mn> <mi>p</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msub> <mi>n</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mo>{</mo> <msub> <mi>n</mi> <mrow> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> <mo>,</mo> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>|</mo> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> <mo>,</mo> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <mo>&amp;Element;</mo> <msub> <mi>S</mi> <mi>p</mi> </msub> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mi> </mi> <msup> <mi>i</mi> <mo>&amp;prime;</mo> </msup> <mo>&amp;NotEqual;</mo> <msup> <mi>j</mi> <mo>&amp;prime;</mo> </msup> <mo>}</mo> </mrow> </mfrac> </mrow>
其中,sim3p(i,j)为所述操作视频子集合对应的所述参考视频i和所述相关视频j的相似度,Sp为所述操作视频子集合对应的所有视频集,i′、j′为该操作视频子集合中的任意两部视频,ni,j为对所述参考视频i和所述相关视频j都存在相同操作行为的用户数量,ni′,j′为对任意两部视频i′和j′都存在相同操作行为的用户数量。
9.如权利要求7所述的视频推荐方法,其特征在于,所述根据每个所述操作视频子集合对应的所述相关视频和所述参考视频的相似度,得到所述相关视频和所述参考视频的操作相似度的具体过程为:
根据每个所述操作视频子集合对应的所述相关视频和所述参考视频的相似度,以及每个所述操作视频子集合对应的权重,通过加权求和的方式,得到所述相关视频和所述参考视频的操作相似度。
10.根据权利要求4至9中任一项所述的视频推荐方法,其特征在于,所述根据所述特征分类相似度、所述操作相似度及所述人物相似度确定所述相关视频与所述参考视频的总视频相似度的具体过程为:
将所述相关视频与所述参考视频的所述特征分类相似度、所述操作相似度及所述人物相似度通过下述公式进行融合,确定所述相关视频与所述参考视频的总视频相似度:
sim(i,j)=α·sim1(i,j)+β·sim2(i,j)+(1-α-β)·sim3(i,j)
其中,sim(i,j)、sim1(i,j)、sim2(i,j)和sim3(i,j)分别为所述参考视频i和所述相关视频j的所述总视频相似度、所述特征分类相似度、所述人物相似度和所述操作相似度,所述α和β为平衡所述特征分类相似度、所述人物相似度和所述操作相似度对所述总视频相似度影响的参数。
CN201410423523.7A 2014-08-26 2014-08-26 基于特征分类的视频相似度确定及视频推荐方法 Active CN104199896B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410423523.7A CN104199896B (zh) 2014-08-26 2014-08-26 基于特征分类的视频相似度确定及视频推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410423523.7A CN104199896B (zh) 2014-08-26 2014-08-26 基于特征分类的视频相似度确定及视频推荐方法

Publications (2)

Publication Number Publication Date
CN104199896A CN104199896A (zh) 2014-12-10
CN104199896B true CN104199896B (zh) 2017-09-01

Family

ID=52085189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410423523.7A Active CN104199896B (zh) 2014-08-26 2014-08-26 基于特征分类的视频相似度确定及视频推荐方法

Country Status (1)

Country Link
CN (1) CN104199896B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808537A (zh) * 2014-12-29 2016-07-27 Tcl集团股份有限公司 一种基于Storm的实时推荐方法及系统
CN104636505A (zh) * 2015-03-13 2015-05-20 北京世纪互联宽带数据中心有限公司 一种视频检索方法及装置
CN104750839B (zh) * 2015-04-03 2019-02-15 魅族科技(中国)有限公司 一种数据推荐方法、终端及服务器
CN104809218B (zh) * 2015-04-30 2018-09-28 北京奇艺世纪科技有限公司 一种ugc视频分类方法及装置
CN105389329B (zh) * 2015-09-21 2019-02-12 中国人民解放军国防科学技术大学 一种基于群体评论的开源软件推荐方法
CN105282565A (zh) * 2015-09-29 2016-01-27 北京奇艺世纪科技有限公司 一种视频推荐方法和装置
CN105893436A (zh) * 2015-12-14 2016-08-24 乐视网信息技术(北京)股份有限公司 视频网站单账号多喜好推荐方法和装置
CN105512331B (zh) * 2015-12-28 2019-03-26 海信集团有限公司 一种视频推荐方法及装置
CN105718524A (zh) * 2016-01-15 2016-06-29 合一网络技术(北京)有限公司 确定视频正本的方法和装置
CN105843857B (zh) * 2016-03-16 2019-08-27 合一网络技术(北京)有限公司 视频推荐方法和装置
CN105760544A (zh) * 2016-03-16 2016-07-13 合网络技术(北京)有限公司 视频推荐方法和装置
CN105872590A (zh) * 2016-03-31 2016-08-17 乐视控股(北京)有限公司 一种视频媒体发行方法和系统
CN107451148A (zh) * 2016-05-31 2017-12-08 北京金山安全软件有限公司 一种视频分类方法、装置及电子设备
CN106484810A (zh) * 2016-09-23 2017-03-08 广州视源电子科技股份有限公司 一种多媒体节目的推荐方法及系统
CN107426610B (zh) * 2017-03-29 2020-04-28 聚好看科技股份有限公司 视频信息同步方法及装置
CN107193893A (zh) * 2017-05-03 2017-09-22 聚好看科技股份有限公司 处理视频资源的方法及装置
CN107506456A (zh) * 2017-08-29 2017-12-22 环球智达科技(北京)有限公司 一种基于影片剧情信息的相似度计算方法
CN110598045B (zh) * 2019-09-06 2021-03-19 腾讯科技(深圳)有限公司 视频推荐方法、装置
CN112786015A (zh) * 2019-11-06 2021-05-11 阿里巴巴集团控股有限公司 一种数据处理方法以及装置
CN111182332B (zh) * 2019-12-31 2022-03-22 广州方硅信息技术有限公司 视频处理方法、装置、服务器及存储介质
CN113676760A (zh) * 2020-05-14 2021-11-19 聚好看科技股份有限公司 视频播放方法及显示设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186550A (zh) * 2011-12-27 2013-07-03 盛乐信息技术(上海)有限公司 一种视频的相关视频列表的生成方法及系统
CN103442271A (zh) * 2013-09-11 2013-12-11 东莞市远峰科技有限公司 一种用于电视盒的节目分类搜索的方法
CN103440335A (zh) * 2013-09-06 2013-12-11 北京奇虎科技有限公司 视频推荐方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110184955A1 (en) * 2008-10-31 2011-07-28 April Sleyoen Mitchell Organizing data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186550A (zh) * 2011-12-27 2013-07-03 盛乐信息技术(上海)有限公司 一种视频的相关视频列表的生成方法及系统
CN103440335A (zh) * 2013-09-06 2013-12-11 北京奇虎科技有限公司 视频推荐方法及装置
CN103442271A (zh) * 2013-09-11 2013-12-11 东莞市远峰科技有限公司 一种用于电视盒的节目分类搜索的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向网络视频的组合推荐系统模型研究;李默等;《计算机工程与设计》;20131231;第34卷(第12期);第4379-4383页 *

Also Published As

Publication number Publication date
CN104199896A (zh) 2014-12-10

Similar Documents

Publication Publication Date Title
CN104199896B (zh) 基于特征分类的视频相似度确定及视频推荐方法
CN104935963B (zh) 一种基于时序数据挖掘的视频推荐方法
CN111061946B (zh) 场景化内容推荐方法、装置、电子设备及存储介质
US8301624B2 (en) Determining user preference of items based on user ratings and user features
CN104899273B (zh) 一种基于话题和相对熵的网页个性化推荐方法
Anwaar et al. HRS-CE: A hybrid framework to integrate content embeddings in recommender systems for cold start items
CN103038769B (zh) 用于将内容导引到社交网络引擎用户的系统和方法
CN103577549A (zh) 一种基于微博标签的人群画像系统和方法
Park et al. Online video recommendation through tag-cloud aggregation
CN106062743A (zh) 用于关键字建议的系统和方法
CN105023178B (zh) 一种基于本体的电子商务推荐方法
CN106354855A (zh) 一种推荐方法及系统
CN108021700A (zh) 一种用户标签生成方法、装置及服务器
CN112100513A (zh) 基于知识图谱的推荐方法、装置、设备及计算机可读介质
CN104050243A (zh) 一种将搜索与社交相结合的网络搜索方法及其系统
Prando et al. Content-based Recommender System using Social Networks for Cold-start Users.
CN109587527A (zh) 一种个性化视频推荐的方法及装置
Neve et al. Hybrid reciprocal recommender systems: Integrating item-to-user principles in reciprocal recommendation
CN106651520A (zh) 电商平台长尾服务推荐方法和系统
CN110879863B (zh) 跨领域搜索方法和跨领域搜索装置
CN104641386A (zh) 使用户人群统计信息混淆的方法和装置
Kang et al. Advertisement Recommendation System Based on User Preference in Online Broadcasting
Souza Cabral et al. Combining multiple metadata types in movies recommendation using ensemble algorithms
Zhong et al. An interpretable recommendations approach based on user preferences and knowledge graph
Fakhfakh et al. Fuzzy User Profile Modeling for Information Retrieval.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant