CN103164405A - 相关视频数据库生成方法、相关视频推荐方法及系统 - Google Patents

相关视频数据库生成方法、相关视频推荐方法及系统 Download PDF

Info

Publication number
CN103164405A
CN103164405A CN 201110407290 CN201110407290A CN103164405A CN 103164405 A CN103164405 A CN 103164405A CN 201110407290 CN201110407290 CN 201110407290 CN 201110407290 A CN201110407290 A CN 201110407290A CN 103164405 A CN103164405 A CN 103164405A
Authority
CN
China
Prior art keywords
video
database
video information
information
corresponding relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110407290
Other languages
English (en)
Inventor
纪达麒
陈运文
刘作涛
宋海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shengle Information Technolpogy Shanghai Co Ltd
Original Assignee
Shengle Information Technolpogy Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengle Information Technolpogy Shanghai Co Ltd filed Critical Shengle Information Technolpogy Shanghai Co Ltd
Priority to CN 201110407290 priority Critical patent/CN103164405A/zh
Publication of CN103164405A publication Critical patent/CN103164405A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及一种相关视频数据库生成方法、相关视频推荐方法及系统,所述相关视频推荐的方法包括:定期获取最新上传的视频,将每个所述最新上传的视频的ID及其视频信息建立对应关系并存入一正排数据库中;将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入一倒排数据库中;将所述历史有播放的视频的ID和所述对应的第一视频信息建立对应关系并存入一推荐数据库中;将所述正在播放的视频的ID和所述对应的第二视频信息建立对应关系,将所述对应关系实时显示并存入所述推荐数据库中。本发明能够适用于高吞吐量、大数据量的视频网站进行相关视频的快速推荐。

Description

相关视频数据库生成方法、相关视频推荐方法及系统
技术领域
本发明涉及一种相关视频数据库生成方法、相关视频推荐方法及系统。
背景技术
视频网站中的相关推荐,指的是用户在观看一个视频的时候,在其附近展现和这个视频相关的视频(也称相关视频),帮助用户发现他感兴趣的视频,从而增加用户在视频网站上的停留时间。
然而,对于一些大的视频网站而言,其拥有的视频数目有几千万,而且每天都有几十万的视频上传,每天视频的观看数也有几亿之多,如何在如此大的请求压力下,不仅保证从海量的视频库中推荐出某个视频的相关视频,并且实现每天新上传的视频也在比较短的时间内被推荐出来,是一个亟待解决的问题。
发明内容
本发明的目的在于提供一种相关视频数据库生成方法、相关视频推荐的方法及系统,该方法及系统能够适用于高吞吐量、大数据量的视频网站进行相关视频的快速推荐。
为解决上述问题,本发明提供一种相关视频数据库生成方法,包括:
定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入一正排数据库中;
将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入一倒排数据库中。
进一步的,在上述方法中,所述视频信息包括标题、描述、Tag、缩略图地址、链接地址、分类信息中的一种或多种。
本发明提供一种相关视频推荐方法,包括:
定期获取历史有播放的视频的ID及其视频信息,将历史有播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID;
根据所述对应的视频ID从所述正排数据库中获取对应的视频信息;
将所述历史有播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系并存入一推荐数据库中。
进一步的,在上述方法中,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID步骤之后,还包括对所述视频ID进行归并。
本发明提供另一种相关视频推荐方法,包括:
获取正在播放的视频的ID及其视频信息,将正在播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID;
根据所述对应的视频ID从所述正排数据库中获取对应的视频信息;
将所述正在播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系,将所述对应关系实时显示并存入一推荐数据库中。
进一步的,在上述方法中,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID步骤之后,还包括对所述视频ID进行归并。
本发明提供另一种相关视频推荐方法,包括:
定期获取最新上传的视频,将每个最新上传的视频的ID及其视频信息建立对应关系并存入一正排数据库中;
将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入一倒排数据库中;
定期获取历史有播放的视频的ID及其视频信息,将所述历史有播放的视频的视频信息进行分词,得到若干第一检索关键词,根据所述若干第一检索关键词从所述倒排数据库中获取对应的第一视频ID;
根据所述对应的第一视频ID从所述正排数据库中获取对应的第一视频信息;
将所述历史有播放的视频的ID和所述对应的第一视频信息建立对应关系并存入一推荐数据库中;
获取正在播放的视频的ID,在所述推荐数据库中查找与正在播放的视频的ID相同的历史有播放的视频的ID;
若查找到,则根据查找到的历史有播放的视频的ID从所述推荐数据库中获取所述对应的视频信息并显示;
若未查找到,则获取正在播放的视频的ID及其视频信息,将所述正在播放的视频的视频信息进行分词,得到若干第二检索关键词,根据所述若干第二检索关键词从所述倒排数据库中获取对应的第二视频ID;
根据所述对应的第二视频ID从所述正排数据库中获取对应的第二视频信息;
将所述正在播放的视频的ID和所述对应的第二视频信息建立对应关系,将所述对应关系实时显示并存入所述推荐数据库中。
进一步的,在上述方法中,所述视频信息包括标题、描述、Tag、缩略图地址、链接地址、分类信息中的一种或多种。
进一步的,在上述方法中,根据所述若干第一检索关键词从所述倒排数据库中获取对应的第一视频ID步骤之后,还包括对所述第一视频ID进行归并。
进一步的,在上述方法中,根据所述若干第二检索关键词从所述倒排数据库中获取对应的第二视频ID步骤之后,还包括对所述第二视频ID进行归并。
根据本发明的另一面,提供一种相关视频数据库生成系统,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
正排模块,用于定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入所述正排数据库中;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
倒排模块,用于将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入所述倒排数据库中。
根据本发明的另一面,还提供一种相关视频推荐系统,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
推荐数据库,用于存储历史有播放的视频的ID及与其对应的推荐视频的视频信息;
第一ID获取模块,用于定期获取历史有播放的视频的ID及其视频信息,将历史有播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频的ID;
第一视频信息获取模块,用于根据所述第一ID获取模块获取的对应的视频的ID从所述正排数据库中获取对应的视频信息;
第一推荐模块,用于将所述历史有播放的视频的ID和第一视频信息获取模块获取的对应的视频信息建立对应关系并存入所述推荐数据库中。
进一步的,在上述系统中,还包括一归并模块,用于将第一ID获取模块获取的对应的视频的ID进行归并。
本发明提供另一种视频推荐系统,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
推荐数据库,用于存储正在播放的视频的ID及与其对应的推荐视频的视频信息;
第二ID获取模块,用于获取正在播放的视频的ID及其视频信息,将正在播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID;
第二视频信息获取模块,用于根据所述对应的视频ID从所述正排数据库中获取对应的视频信息;
第二推荐模块,用于将所述正在播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系,将所述对应关系实时显示并存入所述推荐数据库中。
进一步的,在上述系统中,还包括一归并模块,用于将第二ID获取模块获取的对应的视频的ID进行归并。
本发明还提供另一种视频推荐系统,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
正排模块,用于定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入所述正排数据库中;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
倒排模块,用于将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入所述倒排数据库中;
推荐数据库,用于存储历史有播放的视频的ID及与其对应的推荐视频的视频信息,以及存储正在播放的视频的ID及与其对应的推荐视频的视频信息;
第一ID获取模块,用于定期获取历史有播放的视频的ID及其视频信息,将所述历史有播放的视频的视频信息进行分词,得到若干第一检索关键词,根据所述若干第一检索关键词从所述倒排数据库中获取对应的第一视频ID;
第一视频信息获取模块,用于根据所述对应的第一视频ID从所述正排数据库中获取对应的第一视频信息;
第一推荐模块,将所述历史有播放的视频的ID和所述对应的第一视频信息建立对应关系并存入所述推荐数据库中;
查找模块,用于获取正在播放的视频的ID,在所述推荐数据库中查找与正在播放的视频的ID相同的历史有播放的视频的ID;
显示模块,用于在所述查找模块查找到与正在播放的视频的ID相同的历史有播放的视频的ID时,根据查找到的历史有播放的视频的ID从所述推荐数据库中获取所述对应的视频信息并显示;
第二ID获取模块,用于在所述查找模块未查找到与正在播放的视频的ID相同的历史有播放的视频的ID时,获取正在播放的视频的ID及其视频信息;将所述正在播放的视频的视频信息进行分词,得到若干第二检索关键词,根据所述若干第二检索关键词从所述倒排数据库中获取对应的第二视频ID;
第二视频信息获取模块,用于根据所述对应的第二视频ID从所述正排数据库中获取对应的第二视频信息;
第二推荐模块,用于将所述正在播放的视频的ID和所述对应的第二视频信息建立对应关系,将所述对应关系实时显示并存入所述推荐数据库中。
进一步的,在上述系统中,还包括一归并模块,用于将第一ID获取模块及第二ID获取模块获取的对应的视频的ID进行归并。
与现有技术相比,本发明通过定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入一正排数据库中,将所述正排数据库中每个所述视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入一倒排数据库中,从而实现了可以通过视频的ID快速查找与检索关键词对应的视频信息。
另外,通过定期获取历史有播放的视频的ID及其视频信息,将历史有播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID,根据所述对应的视频ID从所述正排数据库中获取对应的视频信息,将所述历史有播放的视频的ID和从所述正排数据库中获取对应的视频信息建立对应关系并存入一推荐数据库中,从而实现在推荐数据库快速查找到正在播放的视频的相关推荐视频,并向用户进行推荐显示的目的。
此外,通过获取正在播放的视频的ID及其视频信息,将正在播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID,根据所述对应的视频ID从所述正排数据库中获取对应的视频信息,将所述正在播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系,将所述对应关系实时显示并存入一推荐数据库中,从而可以在推荐数据库查找不到正在播放的视频的相关推荐视频时,实时快速计算正在播放的视频的相关推荐视频,并向用户进行推荐显示。
附图说明
图1是本发明实施例一的相关视频数据库生成方法的流程图;
图2是本发明实施例二的相关视频推荐方法的流程图;
图3是本发明实施例三的相关视频推荐方法的流程图;
图4是本发明实施例四的相关视频推荐方法的流程图;
图5是本发明实施例五的相关视频推荐系统的功能模块示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一
如图1所示,本发明提供一种相关视频数据库生成方法,包括:
步骤S11,定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入一正排数据库中;
步骤S12,将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入一倒排数据库中。
具体来说,正排数据库存储有以视频的ID为键值的视频信息,倒排数据库存储有以检索关键词为键值的视频的ID,所述视频信息包括标题、描述、Tag、缩略图地址、链接地址、分类信息中的一种或多种,可以定期(如10分钟)取出最新上传的视频,对每个最新上传视频的视频信息如标题、描述、分类、用户tag信息存储到VideoInfo数据库中,并且进行分词,得到视频的检索关键词列表存入InvInfo数据库中,将包含有该检索关键词的视频的ID添加到倒排数据库中。
由于不同视频的视频信息被分词后可能产生部分相同的检索关键词,所以一个检索关键词可能对应有多个不同视频的ID,同样的,由于每个视频的的视频信息被分词后可能产生多个检索关键词,所以不同的关键词可能会对应相同的视频的ID。
正排数据库和倒排数据库的建立,可以实现通过视频的ID快速查找与检索关键词对应的视频信息。
实施例二
如图2所示,本发明还提供一种相关视频推荐方法,该方法应用实施例一中生成的数据库,包括:
步骤S21,定期获取历史有播放的视频的ID及其视频信息,将历史有播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID;
步骤S22,根据所述对应的视频ID从所述正排数据库中获取对应的视频信息;
步骤S23,将所述历史有播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系并存入一推荐数据库中。
具体来说,推荐数据库是存储视频相关推荐结果的数据库,可以设置线下定期(如10分钟)取出历史有播放的视频或最近播放的视频,将其标题、描述、分类、用户tag信息进行分词,得到该视频的检索关键词列表,从倒排数据库中取出这些检索关键词对应的视频的ID,由于取出视频的ID会出现重复的情况,可以将重复的视频的ID进行归并得到和该最近播放的视频相关的视频的ID,通过检索关键词对应的视频的ID从正排数据库中取出检索关键词对应的视频的ID对应的视频信息如标题、描述、分类、tag信息等,并它们插入到推荐数据库(RecommenderCache)中与历史有播放的视频或最近播放的视频的ID建立对应关系,推荐数据库以历史有播放的视频或最近播放的视频的ID为键值存储有与每个历史有播放的视频或最近播放的视频的相关推荐视频。
由于一般在视频网站上,用户都是通过首页或者一些排行榜的视频进行查看,所以虽然网站每天的观看数目很大,但很大比例(经常是90%以上)集中在史有播放的视频或最近播放的视频这些热门视频中(通常有几万个),当前台(FrontWeb)接收到推荐请示时,可以根据正在播放的视频的ID在推荐数据库中快速查找到相关推荐视频向用户进行推荐显示,所以这部分推荐数据库可以满足很大部分的推荐请求。
实施例三
如图3所示,本发明还提供另一种相关视频推荐方法,该方法应用实施例一中生成的数据库,包括:
步骤S31,获取正在播放的视频的ID及其视频信息,将正在播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID;
步骤S32,根据所述对应的视频ID从所述正排数据库中获取对应的视频信息;
步骤S33,将所述正在播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系,将所述对应关系实时显示并存入一推荐数据库中。
具体来说,本实施例与实施例二的区别在于通过线上实时计算获得相关视频的推荐结果,当前台(FrontWeb)接收到推荐请求,先将正在播放的视频的视频信息如标题、描述、分类和tag进行分词,得到该视频的检索关键词列表,从倒倒排数据库中取出这些检索关键词对应的视频的ID,由于取出视频的ID会出现重复的情况,可以将重复的视频的ID进行归并,得到正在播放的视频的检索关键词对应的视频的ID,通过这些正在播放的视频的检索关键词对应的视频的ID从正排数据库中取出对应的视频信息如标题、描述、分类、tag信息返回给前台(FrontWeb)进行显示,并且将其存到推荐数据库中,从而当再次出现相同的推荐请求时,无须再进行线上实时计算,即可从推荐数据库中调取推荐信息,加快了推荐速度。
实施例四
如图4所示,本发明还提供另一种相关视频推荐方法,包括:
步骤S41,定期获取最新上传的视频,将每个最新上传的视频的ID及其视频信息建立对应关系并存入一正排数据库中;
步骤S42,将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入一倒排数据库中;
步骤S43,定期获取历史有播放的视频的ID及其视频信息,将所述历史有播放的视频的视频信息进行分词,得到若干第一检索关键词,根据所述若干第一检索关键词从所述倒排数据库中获取对应的第一视频ID;
步骤S44,根据所述对应的第一视频ID从所述正排数据库中获取对应的第一视频信息;
步骤S45,将所述历史有播放的视频的ID和所述对应的第一视频信息建立对应关系并存入一推荐数据库中;
步骤S46,获取正在播放的视频的ID,判断在所述推荐数据库中是否查找与正在播放的视频的ID相同的历史有播放的视频的ID;
若查找到,则根据查找到的历史有播放的视频的ID从所述推荐数据库中获取所述对应的视频信息并显示(如图4中步骤S471);
若未查找到,则获取正在播放的视频的ID及其视频信息,将所述正在播放的视频的视频信息进行分词,得到若干第二检索关键词,根据所述若干第二检索关键词从所述倒排数据库中获取对应的第二视频ID(如图4中步骤S472);
步骤S48,根据所述对应的第二视频ID从所述正排数据库中获取对应的第二视频信息;
步骤S49,将所述正在播放的视频的ID和所述对应的第二视频信息建立对应关系,将所述对应关系实时显示并存入所述推荐数据库中。
具体来说,所述视频信息包括标题、描述、Tag、缩略图地址、链接地址、分类信息中的一种或多种;根据所述若干第一检索关键词从所述倒排数据库中获取对应的第一视频ID步骤之后,还包括对所述第一视频ID进行归并;根据所述若干第二检索关键词从所述倒排数据库中获取对应的第二视频ID步骤之后,还包括对所述第二视频ID进行归并。
本实施例通过定期(如10分钟)将最新上传的视频添加到正排数据库中,定期进行热门视频的重新计算,使得新上传的视频在短时间内(10分钟)内就可以被推荐出来,另外,当前台响应用户相关推荐请求时,先在推荐数据库中查找是否存在相关推荐视频,如果存在则取出返回,否则通过在线实时在线计算来返回相关推荐视频,这样可以保证在推荐数据库对小部分的推荐请求不能满足时,通过在线实时计算的方式来满足这一小部分的推荐请求。
实施例五
根据本发明的另一面,还提供一种相关视频数据库生成系统,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
正排模块,用于定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入所述正排数据库中;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
倒排模块,用于将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入所述倒排数据库中。
本实施例中正排数据库和倒排数据库的建立,可以实现通过视频的ID快速查找与检索关键词对应的视频信息。
实施例六
根据本发明的另一面,还提供一种相关视频推荐系统,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
推荐数据库,用于存储历史有播放的视频的ID及与其对应的推荐视频的视频信息;
第一ID获取模块,用于定期获取历史有播放的视频的ID及其视频信息,将历史有播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频的ID;
第一视频信息获取模块,用于根据所述第一ID获取模块获取的对应的视频的ID从所述正排数据库中获取对应的视频信息;
第一推荐模块,用于将所述历史有播放的视频的ID和第一视频信息获取模块获取的对应的视频信息建立对应关系并存入所述推荐数据库中。
归并模块,用于将第一ID获取模块获取的对应的视频的ID进行归并。
由于一般在视频网站上,用户都是通过首页或者一些排行榜的视频进行查看,所以虽然网站每天的观看数目很大,但很大比例(经常是90%以上)集中在史有播放的视频或最近播放的视频这些热门视频中(通常有几万个),当前台(FrontWeb)接收到推荐请示时,可以根据正在播放的视频的ID在推荐数据库中快速查找到相关推荐视频向用户进行推荐显示,所以这部分推荐数据库可以满足很大部分的推荐请求。
实施例七
根据本发明的另一面,还提供一种相关视频推荐系统,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
推荐数据库,用于存储正在播放的视频的ID及与其对应的推荐视频的视频信息;
第二ID获取模块,用于获取正在播放的视频的ID及其视频信息,将正在播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID;
第二视频信息获取模块,用于根据所述对应的视频ID从所述正排数据库中获取对应的视频信息;
第二推荐模块,用于将所述正在播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系,将所述对应关系实时显示并存入所述推荐数据库中。
归并模块,用于将第二ID获取模块获取的对应的视频的ID进行归并。
本实施例中,通过将实时计算推荐视频的结果进行显示,并将计算的推荐视频的结果存到推荐数据库中,从而当再次出现相同的推荐请求时,无须再进行线上实时计算,即可从推荐数据库中调取推荐信息,加快了推荐速度。
实施例八
如图5所示,根据本发明的另一面,还提供一种相关视频推荐系统,包括正排数据库51、正排模块52、倒排数据库53、倒排模块54、推荐数据库55、第一ID获取模块56、第一视频信息获取模块57、第一推荐模块58、查找模块59、显示模块60、第二ID获取模块61、第二视频信息获取模块62、第二推荐模块63及归并模块64,其中,
正排数据库51用于存储视频的ID与视频信息的对应关系。
正排模块52用于定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入所述正排数据库中。
倒排数据库53用于存储检索关键词与视频的ID的对应关系。
倒排模块54用于将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入所述倒排数据库中。
推荐数据库55用于存储历史有播放的视频的ID及与其对应的推荐视频的视频信息,以及存储正在播放的视频的ID及与其对应的推荐视频的视频信息。
第一ID获取模块56用于定期获取历史有播放的视频的ID及其视频信息,将所述历史有播放的视频的视频信息进行分词,得到若干第一检索关键词,根据所述若干第一检索关键词从所述倒排数据库中获取对应的第一视频ID。
第一视频信息获取模块57用于根据所述对应的第一视频ID从所述正排数据库中获取对应的第一视频信息。
第一推荐模块58将所述历史有播放的视频的ID和所述对应的第一视频信息建立对应关系并存入所述推荐数据库中。
查找模块59用于获取正在播放的视频的ID,在所述推荐数据库中查找与正在播放的视频的ID相同的历史有播放的视频的ID。
显示模块60用于在所述查找模块查找到与正在播放的视频的ID相同的历史有播放的视频的ID时,根据查找到的历史有播放的视频的ID从所述推荐数据库中获取所述对应的视频信息并显示;
第二ID获取模块61用于在所述查找模块未查找到与正在播放的视频的ID相同的历史有播放的视频的ID时,获取正在播放的视频的ID及其视频信息,将所述正在播放的视频的视频信息进行分词,得到若干第二检索关键词,根据所述若干第二检索关键词从所述倒排数据库中获取对应的第二视频ID。
第二视频信息获取模块62用于根据所述对应的第二视频ID从所述正排数据库中获取对应的第二视频信息。
第二推荐模块63用于将所述正在播放的视频的ID和所述对应的第二视频信息建立对应关系,将所述对应关系实时显示并存入所述推荐数据库中。
归并模块64用于将第一ID获取模块及第二ID获取模块获取的对应的视频的ID进行归并。
本实施例通过定期(如10分钟)将最新上传的视频添加到正排数据库中,定期进行热门视频的重新计算,使得新上传的视频在短时间内(10分钟)内就可以被推荐出来,另外,当前台响应用户相关推荐请求时,先在推荐数据库中查找是否存在相关推荐视频,如果存在则取出返回,否则通过在线实时在线计算来返回相关推荐视频,这样可以保证在推荐数据库对小部分的推荐请求不能满足时,通过在线实时计算的方式来满足这一小部分的推荐请求。
本发明通过定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入一正排数据库中,将所述正排数据库中每个所述视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入一倒排数据库中,从而实现了可以通过视频的ID快速查找与检索关键词对应的视频信息。
另外,通过定期获取历史有播放的视频的ID及其视频信息,将历史有播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID,根据所述对应的视频ID从所述正排数据库中获取对应的视频信息,将所述历史有播放的视频的ID和从所述正排数据库中获取对应的视频信息建立对应关系并存入一推荐数据库中,从而实现在推荐数据库快速查找到正在播放的视频的相关推荐视频,并向用户进行推荐显示的目的。此外,通过获取正在播放的视频的ID及其视频信息,将正在播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID,根据所述对应的视频ID从所述正排数据库中获取对应的视频信息,将所述正在播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系,将所述对应关系实时显示并存入一推荐数据库中,从而可以在推荐数据库查找不到正在播放的视频的相关推荐视频时,实时快速计算正在播放的视频的相关推荐视频,并向用户进行推荐显示。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
显然,本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (17)

1.一种相关视频数据库生成方法,其特征在于,包括:
定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入一正排数据库中;
将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入一倒排数据库中。
2.如权利要求1所述的相关视频数据库生成方法,其特征在于,所述视频信息包括标题、描述、Tag、缩略图地址、链接地址、分类信息中的一种或多种。
3.一种相关视频推荐方法,应用如权利要求1或2所述方法生成的数据库,其特征在于,包括:
定期获取历史有播放的视频的ID及其视频信息,将历史有播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID;
根据所述对应的视频ID从所述正排数据库中获取对应的视频信息;
将所述历史有播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系并存入一推荐数据库中。
4.如权利要求3所述的相关视频推荐方法,其特征在于,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID步骤之后,还包括对所述视频ID进行归并。
5.一种相关视频推荐方法,应用如权利要求1或2所述方法生成的数据库,其特征在于,包括:
获取正在播放的视频的ID及其视频信息,将正在播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID;
根据所述对应的视频ID从所述正排数据库中获取对应的视频信息;
将所述正在播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系,将所述对应关系实时显示并存入一推荐数据库中。
6.如权利要求5所述的相关视频推荐方法,其特征在于,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID步骤之后,还包括对所述视频ID进行归并。
7.一种相关视频推荐方法,其特征在于,包括:
定期获取最新上传的视频,将每个最新上传的视频的ID及其视频信息建立对应关系并存入一正排数据库中;
将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入一倒排数据库中;
定期获取历史有播放的视频的ID及其视频信息,将所述历史有播放的视频的视频信息进行分词,得到若干第一检索关键词,根据所述若干第一检索关键词从所述倒排数据库中获取对应的第一视频ID;
根据所述对应的第一视频ID从所述正排数据库中获取对应的第一视频信息;
将所述历史有播放的视频的ID和所述对应的第一视频信息建立对应关系并存入一推荐数据库中;
获取正在播放的视频的ID,在所述推荐数据库中查找与正在播放的视频的ID相同的历史有播放的视频的ID;
若查找到,则根据查找到的历史有播放的视频的ID从所述推荐数据库中获取所述对应的视频信息并显示;
若未查找到,则获取正在播放的视频的ID及其视频信息,将所述正在播放的视频的视频信息进行分词,得到若干第二检索关键词,根据所述若干第二检索关键词从所述倒排数据库中获取对应的第二视频ID;
根据所述对应的第二视频ID从正排数据库中获取对应的第二视频信息;
将所述正在播放的视频的ID和所述对应的第二视频信息建立对应关系,将所述对应关系实时显示并存入所述推荐数据库中。
8.如权利要求7所述的相关视频推荐方法,其特征在于,所述视频信息包括标题、描述、Tag、缩略图地址、链接地址、分类信息中的一种或多种。
9.如权利要求7所述的相关视频推荐方法,其特征在于,根据所述若干第一检索关键词从所述倒排数据库中获取对应的第一视频ID步骤之后,还包括对所述第一视频ID进行归并。
10.如权利要求7所述的相关视频推荐方法,其特征在于,根据所述若干第二检索关键词从所述倒排数据库中获取对应的第二视频ID步骤之后,还包括对所述第二视频ID进行归并。
11.一种相关视频数据库生成系统,其特征在于,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
正排模块,用于定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入所述正排数据库中;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
倒排模块,用于将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入所述倒排数据库中。
12.一种相关视频推荐系统,其特征在于,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
推荐数据库,用于存储历史有播放的视频的ID及与其对应的推荐视频的视频信息;
第一ID获取模块,用于定期获取历史有播放的视频的ID及其视频信息,将历史有播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频的ID;
第一视频信息获取模块,用于根据所述第一ID获取模块获取的对应的视频的ID从所述正排数据库中获取对应的视频信息;
第一推荐模块,用于将所述历史有播放的视频的ID和第一视频信息获取模块获取的对应的视频信息建立对应关系并存入所述推荐数据库中。
13.如权利要求12所述的相关视频推荐系统,其特征在于,还包括一归并模块,用于将第一ID获取模块获取的对应的视频的ID进行归并。
14.一种相关视频推荐系统,其特征在于,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
推荐数据库,用于存储正在播放的视频的ID及与其对应的推荐视频的视频信息;
第二ID获取模块,用于获取正在播放的视频的ID及其视频信息,将正在播放的视频的视频信息进行分词,得到若干检索关键词,根据所述若干检索关键词从所述倒排数据库中获取对应的视频ID;
第二视频信息获取模块,用于根据所述对应的视频ID从所述正排数据库中获取对应的视频信息;
第二推荐模块,用于将所述正在播放的视频的ID和从所述正排数据库中获取的对应的视频信息建立对应关系,将所述对应关系实时显示并存入所述推荐数据库中。
15.如权利要求14所述的相关视频推荐系统,其特征在于,还包括一归并模块,用于将第二ID获取模块获取的对应的视频的ID进行归并。
16.一种相关视频推荐系统,其特征在于,包括:
正排数据库,用于存储视频的ID与视频信息的对应关系;
正排模块,用于定期获取最新上传的视频,将每个所述最新上传的视频的ID与其视频信息建立对应关系并存入所述正排数据库中;
倒排数据库,用于存储检索关键词与视频的ID的对应关系;
倒排模块,用于将所述正排数据库中每个视频的ID对应的视频信息进行分词,得到若干检索关键词,将每个检索关键词与所述视频的ID建立对应关系并存入所述倒排数据库中;
推荐数据库,用于存储历史有播放的视频的ID及与其对应的推荐视频的视频信息,以及存储正在播放的视频的ID及与其对应的推荐视频的视频信息;
第一ID获取模块,用于定期获取历史有播放的视频的ID及其视频信息,将所述历史有播放的视频的视频信息进行分词,得到若干第一检索关键词,根据所述若干第一检索关键词从所述倒排数据库中获取对应的第一视频ID;
第一视频信息获取模块,用于根据所述对应的第一视频ID从所述正排数据库中获取对应的第一视频信息;
第一推荐模块,将所述历史有播放的视频的ID和所述对应的第一视频信息建立对应关系并存入所述推荐数据库中;
查找模块,用于获取正在播放的视频的ID,在所述推荐数据库中查找与正在播放的视频的ID相同的历史有播放的视频的ID;
显示模块,用于在所述查找模块查找到与正在播放的视频的ID相同的历史有播放的视频的ID时,根据查找到的历史有播放的视频的ID从所述推荐数据库中获取所述对应的视频信息并显示;
第二ID获取模块,用于在所述查找模块未查找到与正在播放的视频的ID相同的历史有播放的视频的ID时,获取正在播放的视频的ID及其视频信息;将所述正在播放的视频的视频信息进行分词,得到若干第二检索关键词,根据所述若干第二检索关键词从所述倒排数据库中获取对应的第二视频ID;
第二视频信息获取模块,用于根据所述对应的第二视频ID从所述正排数据库中获取对应的第二视频信息;
第二推荐模块,用于将所述正在播放的视频的ID和所述对应的第二视频信息建立对应关系,将所述对应关系实时显示并存入所述推荐数据库中。
17.如权利要求16所述的相关视频推荐系统,其特征在于,还包括一归并模块,用于将第一ID获取模块及第二ID获取模块获取的对应的视频的ID进行归并。
CN 201110407290 2011-12-08 2011-12-08 相关视频数据库生成方法、相关视频推荐方法及系统 Pending CN103164405A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110407290 CN103164405A (zh) 2011-12-08 2011-12-08 相关视频数据库生成方法、相关视频推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110407290 CN103164405A (zh) 2011-12-08 2011-12-08 相关视频数据库生成方法、相关视频推荐方法及系统

Publications (1)

Publication Number Publication Date
CN103164405A true CN103164405A (zh) 2013-06-19

Family

ID=48587501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110407290 Pending CN103164405A (zh) 2011-12-08 2011-12-08 相关视频数据库生成方法、相关视频推荐方法及系统

Country Status (1)

Country Link
CN (1) CN103164405A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103442001A (zh) * 2013-08-22 2013-12-11 百度在线网络技术(北京)有限公司 信息推荐方法、装置和服务器
CN103475914A (zh) * 2013-08-28 2013-12-25 小米科技有限责任公司 视频播放方法、装置、终端设备和服务器
CN103605808A (zh) * 2013-12-10 2014-02-26 合一网络技术(北京)有限公司 基于搜索的ugc推荐的方法及系统
CN103955449A (zh) * 2014-04-21 2014-07-30 安一恒通(北京)科技有限公司 定位目标样本的方法和装置
CN104065981A (zh) * 2014-06-20 2014-09-24 海信集团有限公司 一种视频推荐方法和装置
CN104427361A (zh) * 2013-09-02 2015-03-18 大同股份有限公司 电视服务系统与提供影音服务的方法
WO2015043389A1 (zh) * 2013-09-30 2015-04-02 北京奇虎科技有限公司 一种基于视频搜索的分词信息推送方法和装置
CN104699696A (zh) * 2013-12-05 2015-06-10 深圳市腾讯计算机系统有限公司 文件推荐方法和装置
CN105072459A (zh) * 2015-07-28 2015-11-18 无锡天脉聚源传媒科技有限公司 一种视频信息的处理方法及装置
CN105279155A (zh) * 2014-05-28 2016-01-27 腾讯科技(深圳)有限公司 一种访问对象的数据处理方法及装置
CN105279392A (zh) * 2015-09-28 2016-01-27 深圳华大基因科技服务有限公司 一种基于云平台的大数据分析装置
CN105389482A (zh) * 2015-09-28 2016-03-09 深圳华大基因科技服务有限公司 一种基于云平台的大数据分析方法
CN105930484A (zh) * 2016-04-29 2016-09-07 合网络技术(北京)有限公司 多媒体资源的推荐方法和装置
CN106162351A (zh) * 2016-08-02 2016-11-23 合网络技术(北京)有限公司 一种视频推荐方法及装置
CN106303719A (zh) * 2016-08-02 2017-01-04 合网络技术(北京)有限公司 一种按顺序推荐视频的方法及装置
CN110737774A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 图书知识图谱的构建、图书推荐方法、装置、设备及介质
CN111625617A (zh) * 2020-06-01 2020-09-04 Oppo广东移动通信有限公司 一种数据索引方法、装置及计算机可读存储介质
CN112231513A (zh) * 2020-10-15 2021-01-15 北京爱论答科技有限公司 一种学习视频推荐方法、装置及系统
CN112235603A (zh) * 2020-10-15 2021-01-15 脸萌有限公司 视频分发系统、方法、计算设备以及用户设备

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103442001B (zh) * 2013-08-22 2019-05-17 百度在线网络技术(北京)有限公司 信息推荐方法、装置和服务器
CN103442001A (zh) * 2013-08-22 2013-12-11 百度在线网络技术(北京)有限公司 信息推荐方法、装置和服务器
CN103475914A (zh) * 2013-08-28 2013-12-25 小米科技有限责任公司 视频播放方法、装置、终端设备和服务器
CN104427361A (zh) * 2013-09-02 2015-03-18 大同股份有限公司 电视服务系统与提供影音服务的方法
WO2015043389A1 (zh) * 2013-09-30 2015-04-02 北京奇虎科技有限公司 一种基于视频搜索的分词信息推送方法和装置
CN104699696A (zh) * 2013-12-05 2015-06-10 深圳市腾讯计算机系统有限公司 文件推荐方法和装置
CN104699696B (zh) * 2013-12-05 2018-12-28 深圳市腾讯计算机系统有限公司 文件推荐方法和装置
CN103605808B (zh) * 2013-12-10 2016-03-30 合一网络技术(北京)有限公司 基于搜索的ugc推荐的方法及系统
CN103605808A (zh) * 2013-12-10 2014-02-26 合一网络技术(北京)有限公司 基于搜索的ugc推荐的方法及系统
CN103955449A (zh) * 2014-04-21 2014-07-30 安一恒通(北京)科技有限公司 定位目标样本的方法和装置
CN105279155A (zh) * 2014-05-28 2016-01-27 腾讯科技(深圳)有限公司 一种访问对象的数据处理方法及装置
CN105279155B (zh) * 2014-05-28 2019-06-25 腾讯科技(深圳)有限公司 一种访问对象的数据处理方法及装置
CN104065981A (zh) * 2014-06-20 2014-09-24 海信集团有限公司 一种视频推荐方法和装置
CN105072459A (zh) * 2015-07-28 2015-11-18 无锡天脉聚源传媒科技有限公司 一种视频信息的处理方法及装置
CN105389482A (zh) * 2015-09-28 2016-03-09 深圳华大基因科技服务有限公司 一种基于云平台的大数据分析方法
CN105279392A (zh) * 2015-09-28 2016-01-27 深圳华大基因科技服务有限公司 一种基于云平台的大数据分析装置
CN105279392B (zh) * 2015-09-28 2018-07-24 深圳华大基因科技服务有限公司 一种基于云平台的大数据分析装置
CN105930484A (zh) * 2016-04-29 2016-09-07 合网络技术(北京)有限公司 多媒体资源的推荐方法和装置
CN106162351A (zh) * 2016-08-02 2016-11-23 合网络技术(北京)有限公司 一种视频推荐方法及装置
CN106303719A (zh) * 2016-08-02 2017-01-04 合网络技术(北京)有限公司 一种按顺序推荐视频的方法及装置
CN106303719B (zh) * 2016-08-02 2019-09-17 优酷网络技术(北京)有限公司 一种按顺序推荐视频的方法及装置
CN110737774A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 图书知识图谱的构建、图书推荐方法、装置、设备及介质
CN110737774B (zh) * 2018-07-03 2024-05-24 百度在线网络技术(北京)有限公司 图书知识图谱的构建、图书推荐方法、装置、设备及介质
CN111625617A (zh) * 2020-06-01 2020-09-04 Oppo广东移动通信有限公司 一种数据索引方法、装置及计算机可读存储介质
CN112231513A (zh) * 2020-10-15 2021-01-15 北京爱论答科技有限公司 一种学习视频推荐方法、装置及系统
CN112235603A (zh) * 2020-10-15 2021-01-15 脸萌有限公司 视频分发系统、方法、计算设备以及用户设备
CN112235603B (zh) * 2020-10-15 2022-04-05 脸萌有限公司 视频分发系统、方法、计算设备、用户设备及视频播放方法
US11838576B2 (en) 2020-10-15 2023-12-05 Lemon Inc. Video distribution system, method, computing device and user equipment

Similar Documents

Publication Publication Date Title
CN103164405A (zh) 相关视频数据库生成方法、相关视频推荐方法及系统
CN110941740B (zh) 视频推荐方法及计算机可读存储介质
US20210271975A1 (en) User tag generation method and apparatus, storage medium, and computer device
CN107515909B (zh) 一种视频推荐方法及系统
US7685200B2 (en) Ranking and suggesting candidate objects
CN111444394B (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
CN111444395B (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
CN108304512B (zh) 一种视频搜索引擎粗排序方法、装置及电子设备
US8589434B2 (en) Recommendations based on topic clusters
CN111680219A (zh) 内容推荐方法、装置、设备及可读存储介质
US11537657B2 (en) Systems, methods, and computer-readable products for track selection
US8515953B2 (en) Temporal visualization of query results
CN104090963A (zh) 查询信息推荐方法和装置
CN111400609B (zh) 用户推荐方法、装置、存储介质及服务器
CN105760443A (zh) 项目推荐系统、项目推荐装置以及项目推荐方法
CN112446727B (zh) 广告触发的方法、装置、设备及计算机可读存储介质
CN112507163B (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
CN110781377B (zh) 一种文章推荐方法、装置
CN111831924A (zh) 内容推荐方法、装置、设备及可读存储介质
WO2013041529A1 (en) Ranking of heterogeneous information objects
Hajri et al. MORS: A system for recommending OERs in a MOOC
CN105117482A (zh) 一种实现网站导航的方法和装置
CN104035964A (zh) 一种用于提供信誉相关信息的方法和设备
CN112749296A (zh) 一种视频推荐方法、装置、服务器及存储介质
JP5667959B2 (ja) 影響度分析方法、影響度分析装置及びそのプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130619