CN104965903A - 一种资源的推荐方法和装置 - Google Patents
一种资源的推荐方法和装置 Download PDFInfo
- Publication number
- CN104965903A CN104965903A CN201510377907.4A CN201510377907A CN104965903A CN 104965903 A CN104965903 A CN 104965903A CN 201510377907 A CN201510377907 A CN 201510377907A CN 104965903 A CN104965903 A CN 104965903A
- Authority
- CN
- China
- Prior art keywords
- serial
- resource
- feature information
- resource group
- related resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种资源的推荐方法和装置,其中的方法包括:确定用户浏览的当前资源的文本特征信息;依据所述文本特征信息在系列相关索引表中进行检索,得到与所述文本特征信息匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;将所述系列相关资源组中的资源推荐给用户。本发明实施例能够提高推荐结果的准确性和相关性。
Description
技术领域
本发明涉及网络技术领域,特别是涉及一种资源的推荐方法和装置。
背景技术
目前视频网站主要分为两种,一种是以用户生成内容为主的网站,即UGC(User Generated Content,用户生成内容)网站;另一种是专业视频内容为主的网站。相比较而言,UGC网站具有以短视频为主、视频数量较多、内容比较丰富的优点。
在用户观看视频时,视频网站通常会为用户推荐与用户当前观看的视频内容相关的其它视频,用户可以方便地从中选择接下来想要观看的视频,从而可以提升用户体验以及增加用户的点击率,还可以提高视频网站的流量。
然而,对于以UGC业务为主的视频网站,每天都有大量的视频被上传,用户上传的视频内容往往具有随意性和重复性,这使得用户上传的视频内容被零散地分布在视频网站中的各个位置。在这种情况下,在为用户推荐视频时,需要在大量的、杂乱无章的视频中进行查找,不但会影响视频推荐的效率,而且使得推荐结果的准确性和相关性也无法得到保证。
发明内容
本发明实施例所要解决的技术问题是提供一种资源的推荐方法和装置,能够提高推荐结果的准确性和相关性。
为了解决上述问题,本发明公开了一种资源的推荐方法,包括:
确定用户浏览的当前资源的文本特征信息;
依据所述文本特征信息在系列相关索引表中进行检索,得到与所述文本特征信息匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;
将所述系列相关资源组中的资源推荐给用户。
优选地,通过如下步骤建立所述系列相关索引表:
提取资源的文本特征信息和数字特征信息;
依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
生成所述系列相关资源组的系列关键词;
依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
优选地,所述方法还包括:
依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
优选地,所述方法还包括:
将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
优选地,所述方法还包括:
在所述系列相关索引表中不存在与所述文本特征信息匹配的系列相关资源组时,采用基于本文内容的方法和/或基于协同过滤的方法进行资源的推荐。
依据本发明的另一个方面,提供了一种资源的推荐装置,包括:
文本特征确定模块,用于确定用户浏览的当前资源的文本特征信息;
在线搜索模块,用于依据所述文本特征信息在系列相关索引表中进行检索,得到与所述文本特征信息匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;及
第一推荐模块,用于将所述系列相关资源组中的资源推荐给用户。
优选地,所述装置还包括:用于建立系列相关索引表的系列相关索引表建立模块;
所述系列相关索引表建立模块包括:系列相关资源组生成子模块和索引表建立子模块;
其中,所述系列相关资源组生成子模块包括:
特征提取单元,用于提取资源的文本特征信息和数字特征信息;及
资源聚合单元,用于依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
所述索引表建立子模块包括:
关键词生成单元,用于生成所述系列相关资源组的系列关键词;及
索引表建立单元,用于依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
优选地,所述装置还包括:
优化模块,用于依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
优选地,所述装置还包括:
排序模块,用于将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
优选地,所述装置还包括:
第二推荐模块,用于在所述系列相关索引表中不存在与所述文本特征信息匹配的系列相关资源组时,采用基于本文内容的方法和/或基于协同过滤的方法进行资源的推荐。
与现有技术相比,本发明实施例包括以下优点:
本发明实施例依据用户浏览的当前资源的文本特征信息,在已建立的系列相关索引表中,检索出与该文本特征信息匹配的系列相关资源组,并将所述系列相关资源组中的资源推荐给用户。本发明实施例在用户浏览资源的过程中,可以为用户提供与用户浏览资源具有系列关系的一组资源,由于具有系列关系的资源通常具有强关联性,因此,该系列相关资源组中的资源内容都是具有强关联性的资源,从而可以提高推荐结果的准确性和相关性。
附图说明
图1示出了本发明的一种资源的推荐系统的结构示意图;
图2示出了本发明的一种资源的推荐方法实施例的步骤流程图;
图3示出了本发明的一种建立系列相关索引表的步骤流程图;
图4示出了本发明的一种创建系列播单的步骤流程图;及
图5示出了本发明的一种资源的推荐装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
在实际应用中,本发明的一种资源的推荐系统具体可以包括:系列相关索引表建立模块、在线搜索模块、以及第一/二推荐模块。参照图1,示出了本发明的一种资源的推荐系统的结构示意图,其中,系列相关索引表建立模块用于在库存的所有资源中挖掘出系列相关资源组,以及建立对应的系列相关索引表供在线搜索模块检索使用;在线搜索模块用于依据用户浏览的当前资源的文本特征信息在系列相关索引表中检索出匹配的系列相关资源组;第一推荐模块用于将在线搜索模块检索出的系列相关资源组中的资源推荐给用户;第二推荐模块用于在不存在与用户浏览的资源相匹配的系列相关资源组时,依据传统的资源推荐方法为用户推荐弱关联的资源。
本发明实施例中的资源可以包括视频、书籍、图片等各种可以在网络上供用户查询浏览的资源,本发明对于资源的具体内容不加以限制,本发明实施例主要以视频资源为例进行说明,对于其它资源的情况相互参照即可
实施例一
参照图2,示出了本发明的一种资源的推荐方法实施例的步骤流程图,具体可以包括:
步骤201、确定用户浏览的当前资源的文本特征信息;
具体地,例如对于用户浏览的当前资源为用户正在观看的某一视频,可以对该视频的元信息(如资源的标题、描述等)进行分词操作,提取出重要的文本特征信息,例如,用户正在观看标题为“游泳教学视频-蛙泳教学完整版-01”的视频,对该标题进行分词,可以得到以下文本特征信息:“游泳教学视频”、“蛙泳教学”、“完整版”。
在实际应用中,对于用户浏览的视频资源,可以包括用户在浏览器中浏览的视频资源或者在视频播放器的客户端中浏览的视频资源,本发明对于用户浏览资源的具体场景不加以限制。
步骤202、依据所述文本特征信息在系列相关索引表中进行检索,得到与所述文本特征信息匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;
其中,系列相关资源组中的各个资源的内容具有系列关系,即该系列相关资源组中的所有资源能够组成一个完整的内容。在本发明的一种应用示例中,以视频资源为例,例如“游泳教学视频-蛙泳教学完整版-01”,“游泳教学视频-蛙泳教学完整版-02”,“游泳教学视频-蛙泳教学完整版-03”等视频可以组成蛙泳教学完整版的完整内容,因此,这些视频属于一个系列,对于用户来说,一个系列中的单个视频只能提供部分信息,并不完整,而该系列中的全部视频能够给用户提供完整的观看体验。
依据系列相关索引表可以检索到与用户浏览的当前资源具有系列关系的系列相关资源组。具体地,可以将用户浏览的当前资源的文本特征信息作为系列关键词在系列相关索引表中进行检索,查找匹配的表项。参见表1,示出了本发明的一种系列相关索引表的结构示意图。当然,本领域技术人员在实际应用中可以根据需要灵活设置系列相关索引表,本发明对于系列相关索引表的具体结构及检索方法不加以限制。
表1
系列关键词 | 系列相关资源组 | 系列编号 |
蛙泳教学 | 游泳教学视频-蛙泳教学完整版-01 | 01 |
蛙泳教学 | 游泳教学视频-蛙泳教学完整版-02 | 02 |
蛙泳教学 | 游泳教学视频-蛙泳教学完整版-03 | 03 |
南禅七日 | 南禅七日-1(全套) | 01 |
南禅七日 | 南禅七日-2(全套) | 02 |
南禅七日 | 南禅七日-3(全套)-高清 | 03 |
南禅七日 | 南禅七日-4(全套)-高清 | 04 |
南禅七日 | 南禅七日-5(全套) | 05 |
依据用户浏览的当前资源的文本特征信息在系列相关索引表中进行检索,例如,用户正在观看名称为“南禅七日-1(全套)”的视频,可以先对该视频名称进行分词,得到文本特征信息“南禅七日”,在系列相关索引表中检索到与“南禅七日”匹配的系列关键词,其对应的系列相关资源组中包括视频:南禅七日-1(全套),南禅七日-2(全套),南禅七日-3(全套)-高清,南禅七日-4(全套)-高清,南禅七日-5(全套)。可以将该系列相关资源中的上述视频推荐给用户,当用户观看完当前视频时,可以直接点击并观看系统推荐的上述视频。由于用户在观看完视频“南禅七日-1(全套)”之后,再观看“南禅七日-2(全套)”等系列相关视频的可能性很大,而本发明实施例在用户浏览资源时,主动获取用户浏览资源的文本特征信息,并且向用户推荐与该资源匹配的系列相关资源组,其中包括一系列内容相关的资源,用户可以方便快捷地从中选择所需要的系列相关资源,不但可以提高资源推荐的效率以及准确性;而且可以避免用户再次进行搜索的过程,例如,当用户观看完“南禅七日-1(全套)”之后,又想观看“南禅七日-2(全套)”,则需要输入查询词进行搜索,系统依据该查询词在数据库中进行检索,再将检索到的资源返回给用户,通过本发明实施例可以省去上述搜索过程,从而可以节省用户搜索系列相关资源的时间,减轻系统的负担。
步骤203、将所述系列相关资源组中的资源推荐给用户。
在现有的视频推荐方法中,通常会检索出许多弱关联的视频并推荐给用户,例如用户在观看“游泳教学视频-蛙泳教学完整版-01”时,视频网站会向用户返回弱关联的视频,如“游泳教学视频蛙式换气动作教学”等,一般来说,弱关联仅能保证有一定关联关系,比如都是与“游泳”相关,但是关联关系不够紧密。通常,用户在观看“游泳教学视频-蛙泳教学完整版-01”时,接下来观看“游泳教学视频-蛙泳教学完整版-02”的可能性更大,本发明实施例为用户推荐与用户浏览的当前资源具有系列关系的系列相关资源组,系列相关资源组中包括的各资源具有系列关系,也即具有强关联的关系,能够提高了推荐结果的准确性和相关性。
在本发明的一种优选实施例中,在所述系列相关索引表中不存在与用户浏览的当前资源的文本特征信息匹配的系列相关资源组时,可以采用传统的基于关键词的弱关联的资源推荐的方法,如基于本文内容的方法和/或基于协同过滤的方法进行资源的搜索及推荐。
例如,在用户浏览“游泳教学视频-蛙泳教学完整版-01”时,优先向用户返回系列相关资源组,如“游泳教学视频-蛙泳教学完整版-01”,“游泳教学视频-蛙泳教学完整版-02”,“游泳教学视频-蛙泳教学完整版-03”等。在不存在上述匹配的系列相关资源组时,可以采用基于本文内容的方法和/或基于协同过滤的方法进行相关资源的搜索及推荐。
其中,基于文本内容的方法可以保证推荐结果在文本内容具有一定的关联,例如,用户在观看视频“游泳教学视频-蛙泳教学完整版-01”,采用基于文本内容的方法为用户检索并推荐以下视频:“游泳教学视频-蝶泳教学完整版-02”,“夏天游泳教学视频-蛙泳教学完整版-分解动作教学”等,可以看出,推荐的视频与用户观看的视频没有系列关系,但是也具有一定的关联,都是与游泳相关的。
基于协同过滤的方法不能保证推荐结果在本文上跟当前视频存相关性,例如,用户在观看视频“游泳教学视频-蛙泳教学完整版-01”,采用基于协同过滤的方法为用户检索并推荐以下视频:“青奥会-游泳:游泳收官-中国斩获10金”,“体育结合真人秀《冠军家生活》走进奥运冠军家”等,可以看出,推荐的视频与用户观看的视频不具有系列关系,也没有文本关联性,但都是体育类的视频。
在不存在与用户观看的资源相匹配的系列相关资源组时,可以采用传统的视频推荐方法为用户推荐文本或者类型尽可能相关的视频内容,以保证推荐结果的准确性和相关性。
本发明实施例依据用户浏览的当前资源的文本特征信息,在已建立的系列相关索引表中,检索出与该文本特征信息匹配的系列相关资源组,并将所述系列相关资源组中的资源推荐给用户。本发明实施例在用户浏览资源的过程中,可以为用户提供与用户浏览资源具有系列关系的一组资源,由于具有系列关系的资源通常具有强关联性,因此,该系列相关资源组中的资源内容都是具有强关联性的资源,从而可以提高推荐结果的准确性和相关性。
实施例二
本实施例的资源的推荐方法在上述实施例一的基础上,进一步还可以包括如下可选技术方案。
参照图3,示出了本发明的一种建立系列相关索引表的步骤流程图,具体可以包括:
步骤301、提取资源的文本特征信息和数字特征信息;
具体地,可以对资源库等数据库中存储的资源的元信息(如资源的标题、描述等)进行分词操作,提取出重要的文本特征信息和数字特征信息,例如,对于标题“游泳教学视频-蛙泳教学完整版-01”进行分词,可以得到文本特征信息:“游泳教学视频”、“蛙泳教学”、“完整版”,以及数字特征信息:“01”。
步骤302、依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
具体地,在聚合过程中,首先挑选出具有数字特征信息的资源,然后将文本特征信息相同或相似的资源聚合在一起,以生成系列相关资源组,该系列相关资源组中的资源属于同一个系列。
由于具有数字特征信息的标题通常具有系列关系,因此,本发明对于具有数字特征信息的资源进行聚合,例如,资源“游泳教学视频-蛙泳教学完整版-01”具有数字特征信息,而资源“夏天游泳教学视频-蛙泳教学完整版-分解动作教学”没有数字特征信息,因此,在聚合时,可以丢弃资源“夏天游泳教学视频-蛙泳教学完整版-分解动作教学”。
在排除了不具有数字特征信息的资源之后,可以按照文本特征信息相接近的原则对具有数字特征信息的资源进行聚合。优选地,可以通过设置聚合参数确定资源是否属于同一个系列,例如,设置聚合参数为3,则对于两个待聚合的资源,在具有三个以上相同的文本特征信息时,可以确定这这两个资源属于同一个系列,可以聚合到同一个系列相关资源组。当然,上述通过设置聚合参数对于文本特征信息相同或相似的资源进行聚合只是作为一种应用示例,在具体应用中,本领域技术人员可以根据实际情况使用不同的方法聚合系列相关资源组,本发明对此不加以限制。
步骤303、生成所述系列相关资源组的系列关键词;
在本发明的一种应用示例中,可以依据系列相关资源组中资源的文本特征信息来生成系列关键词,例如,可以使用出现次数最多的一个或多个文本特征信息来作为系列关键词。
此外,还可以生成与系列关键词对应的系列编号,系列编号可以通过数字特征信息进行提取。例如,对于下面这些视频可以聚合为一个系列相关资源组:南禅七日-1(全套),南禅七日-2(全套),南禅七日-3(全套)-高清,南禅七日-4(全套)-高清,南禅七日-5(全套),以及可以确定该系列相关资源组的系列关键词为“南禅七日”,而每个资源对应的系列编号分别是:1、2、3、4、5。
在本发明的一种优选实施例中,所述方法还可以包括:依据所述数字特征信息将聚合后的系列相关资源组中的资源进行排序。具体地,例如可以将上述应用示例中“南禅七日”系列相关资源组中的资源依据系列编号从小大到进行排序,以及将该系列相关视频组作为一个整体放在结果列表中推荐给用户,其中的视频资源按照系列编号排序,使得用户可以直接按顺序播放资源组中的各视频资源,从而可以提高用户的点击率。
步骤304、依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
优选地,所述系列相关索引表具体可以为倒排索引表。倒排索引源于实际应用中需要根据属性的值来查找记录。倒排索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引。带有倒排索引的文件称为倒排索引文件,简称倒排文件。
在本发明的一种应用示例中,可以建立如下倒排索引表:“游泳教学视频”→系列1,“蛙泳教学”→系列1,“南禅七日”→系列2。其中,系列1、系列2为系列名称,“游泳教学视频”,“蛙泳教学”,“南禅七日”为系列关键词。当用户输入查询词“南禅七日5(全套)”时,可以先对该查询词进行分词,得到文本特征信息“南禅七日”,在上述倒排索引表中检索到系列2对应的系列关键词与该查询词匹配,则可以把系列2对应的系列相关资源组返回给用户。
在具体应用中,本领域技术人员还可以根据实际情况选用其它方法来建立系列相关索引表,上述使用倒排索引的方法仅作为一种应用示例,本发明对于建立系列相关索引表的方法不加以限制。
在本发明的另一种优选实施例中,所述方法还可以包括:依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
在具体应用中,所述预置点击条件可以为点击率,例如,对于点击率不超过80%的视为不满足预置点击条件,可以从所述系列相关资源组中删除不满足预置点击条件的资源,或者根据需要删除当前的系列相关资源组。当然,对应预置点击条件的具体设置方法本发明不加以限制。
在建立系列相关索引表的过程中,通过资源的文本特征信息对具有系列关系的资源进行聚合,但是聚合后的资源中可能会存在一些脏数据,因此,本发明实施例可以通过查询用户的历史点击记录以及设置预置点击条件来清除这些脏数据以修正聚合的结果。例如,视频A和视频B被聚合到同一个系列相关资源组中,但是,通过查询用户对于视频A和视频B的历史点击记录发现,在用户浏览的过程中,只会点击视频A,而从未点击过视频B,说明视频A和视频B不属于同一个系列,因此,可以将视频B从该系列相关资源组中删除,如果当前的系列相关资源组中只包括视频A和视频B,则可以删除该系列相关资源组,从而可以对已建立的系列相关资源组进行优化,进一步提高推荐结果的准确性和相关性。
实施例三
本实施例的资源的推荐方法在上述实施例一的基础上,进一步还可以包括如下可选技术方案。
在本发明实施例中,在将系列相关资源组中的资源推荐给用户之后,还可以为用户创建系列播单,在用户下次登陆系统时,可以直接对已建立的系列播单中的视频连续播放,避免用户再检索相关的视频,从而可以提高用户检索资源的效率。
参照图4,示出了本发明的一种创建系列播单的步骤流程图,具体可以包括:
步骤401、在用户浏览的当前资源和系列相关资源组中确定目标资源;
步骤402、将所述目标资源添加到系列播单中。
其中,在用户浏览的当前资源和系列相关资源组中确定目标资源具体可以通过系统与用户的交互操作来实现;所述交互操作具体可以包括以下子步骤:
子步骤A1、展示用户浏览的当前资源以及与所述当前资源匹配的系列相关资源组中的资源;
子步骤A2、依据用户对于所展示资源的选择操作确定目标资源。
在本发明的一种应用示例中,用户正在观看视频“南禅七日-1(全套)”,经过检索后得到一个与用户观看视频具有系列关系的系列相关资源组,该系列相关资源组具体包括以下视频:南禅七日-1(全套),南禅七日-2(全套),南禅七日-3(全套)-高清,南禅七日-4(全套)-高清。系统可以将上述视频展示给用户,用户在其中选择合适的视频,例如,用户发现展示的视频都符合需求,则可以选择上述系列相关资源组中的四个视频,系统确定用户选择的视频为目标视频,以及依据目标视频创建系列播单。
在本发明的另一种应用示例中,在用户浏览资源时,检索到与该资源匹配的系列相关资源组,可以依据该系列相关资源组中的资源为用户建立一个默认的系列播单,以及提供一个默认的系列播单名称。例如,对于上述应用示例,系统依据检索得到的系列相关资源组,为用户展示一个默认的系列播单,该默认的系列播单可以包括以下视频:南禅七日-1(全套),南禅七日-2(全套),南禅七日-3(全套)-高清,南禅七日-4(全套)-高清,以及默认的系列播单名称为:南禅七日(全套)。如果用户认为系统提供的默认的系列播单符合要求,则可以直接使用该播单,无需再进行创建,可以避免建立重复的系列播单。
在本发明的又一种应用示例中,用户正在观看视频“南禅七日-5(全套)”,系统依据检索得到匹配的系列相关资源组,并为用户展示一个默认的系列播单,该默认的系列播单可以包括以下视频:南禅七日-1(全套),南禅七日-2(全套),南禅七日-3(全套)-高清,南禅七日-4(全套)-高清,以及默认的系列播单名称为:南禅七日(全套)。用户发现该默认的系列播单中不包括用户正在观看的视频,则可以将用户正在观看的视频“南禅七日-5(全套)”也添加的默认的系列播单中,并且可以修改默认的系列播单名称,如将“南禅七日(全套)”修改为“南禅七日”。此外,用户还可以根据实际需求调整系列播单中各资源的顺序。
在具体应用中,用户根据浏览的当前资源以及系统推荐的系列相关资源组创建系列播单后,系统可以将该系列播单与该用户进行关联,在用户下次登陆系统时,可以直接对已建立的系列播单中的视频连续播放,从而可以提高用户检索资源的效率。
在本发明的一种优选实施例中,所述方法还可以包括:
在用户浏览资源时,若检索出已经存在包含用户浏览的当前资源或与所述当前资源系列相关的系列播单,则向用户返回所述系列播单。
具体地,在用户创建系列播单之后,系统可以保存该系列播单并生成对应的播单名称标识,以使得用户下次可以直接使用该系列播单,或者在其他用户浏览资源时,若检索到包含该浏览资源的系列播单,则直接向用户返回该系列播单,可以提高用户创建系列播单的效率,以及防止用户创建重复的系列播单造成资源的浪费。
例如,在上述应用示例中,用户创建了名称为“南禅七日”的系列播单,其中包括视频:南禅七日-1(全套),南禅七日-2(全套),南禅七日-3(全套)-高清,南禅七日-4(全套)-高清,南禅七日-5(全套)。当有用户浏览名称为“南禅七日-1(全套)”的视频时,系统检索出已经存在包含该视频的系列播单,则可以直接向用户返回该系列播单。
在本发明的另一种优选实施例中,所述方法还可以包括:对所述系列播单中的资源执行增加和/或删除和/或调整顺序的操作。在本优选实施例中,用户可以对已建立的系列播单进行更新操作,如对系列播单中的资源执行增加和/或删除和/或调整顺序的操作。
在本发明的又一种优选实施例中,所述方法还可以包括:依据所述增加和/或删除和/或调整顺序的操作信息,更新所述系列相关索引表。在对系列播单中的资源进行了增加和/或删除和/或调整顺序的修改之后,可以对已建立的系列相关索引表中对应的信息进行更新,如对系列相关索引表中对应的系列相关资源组中的资源也进行相应的增加和/或删除和/或调整顺序的修改,从而可以在用户浏览资源的过程中,不断更新并优化系列相关资源组及系列相关索引表,使得搜索资源的准确性和相关性得到提高。
装置实施例
参照图5,示出了本发明的一种资源的推荐装置实施例的结构框图,具体可以包括:
文本特征确定模块510,用于确定用户浏览的当前资源的文本特征信息;
在线搜索模块520,用于依据所述文本特征信息在系列相关索引表中进行检索,得到与所述文本特征信息匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;及
第一推荐模块530,用于将所述系列相关资源组中的资源推荐给用户。
在本发明的一种优选实施例中,所述装置还可以包括:用于建立系列相关索引表的系列相关索引表建立模块;
所述系列相关索引表建立模块包括:系列相关资源组生成子模块和索引表建立子模块;
其中,所述系列相关资源组生成子模块包括:
特征提取单元,用于提取资源的文本特征信息和数字特征信息;及
资源聚合单元,用于依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
所述索引表建立子模块包括:
关键词生成单元,用于生成所述系列相关资源组的系列关键词;及
索引表建立单元,用于依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
在本发明的另一种优选实施例中,所述装置还可以包括:
优化模块,用于依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
在本发明的又一种优选实施例中,所述装置还可以包括:
排序模块,用于将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
在本发明的再一种优选实施例中,所述装置还可以包括:
第二推荐模块,用于在所述系列相关索引表中不存在与所述文本特征信息匹配的系列相关资源组时,采用基于本文内容的方法和/或基于协同过滤的方法进行资源的推荐。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种资源的推荐方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种资源的推荐方法,其特征在于,所述方法包括:
确定用户浏览的当前资源的文本特征信息;
依据所述文本特征信息在系列相关索引表中进行检索,得到与所述文本特征信息匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;
将所述系列相关资源组中的资源推荐给用户。
2.如权利要求1所述的方法,其特征在于,通过如下步骤建立所述系列相关索引表:
提取资源的文本特征信息和数字特征信息;
依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
生成所述系列相关资源组的系列关键词;
依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
在所述系列相关索引表中不存在与所述文本特征信息匹配的系列相关资源组时,采用基于本文内容的方法和/或基于协同过滤的方法进行资源的推荐。
6.一种资源的推荐装置,其特征在于,所述装置包括:
文本特征确定模块,用于确定用户浏览的当前资源的文本特征信息;
在线搜索模块,用于依据所述文本特征信息在系列相关索引表中进行检索,得到与所述文本特征信息匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;及
第一推荐模块,用于将所述系列相关资源组中的资源推荐给用户。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:用于建立系列相关索引表的系列相关索引表建立模块;
所述系列相关索引表建立模块包括:系列相关资源组生成子模块和索引表建立子模块;
其中,所述系列相关资源组生成子模块包括:
特征提取单元,用于提取资源的文本特征信息和数字特征信息;及
资源聚合单元,用于依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
所述索引表建立子模块包括:
关键词生成单元,用于生成所述系列相关资源组的系列关键词;及
索引表建立单元,用于依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
8.如权利要求6所述的装置,其特征在于,所述装置还包括:
优化模块,用于依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
9.如权利要求7所述的装置,其特征在于,所述装置还包括:
排序模块,用于将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
10.如权利要求6所述的装置,其特征在于,所述装置还包括:
第二推荐模块,用于在所述系列相关索引表中不存在与所述文本特征信息匹配的系列相关资源组时,采用基于本文内容的方法和/或基于协同过滤的方法进行资源的推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510377907.4A CN104965903A (zh) | 2015-06-30 | 2015-06-30 | 一种资源的推荐方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510377907.4A CN104965903A (zh) | 2015-06-30 | 2015-06-30 | 一种资源的推荐方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104965903A true CN104965903A (zh) | 2015-10-07 |
Family
ID=54219941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510377907.4A Pending CN104965903A (zh) | 2015-06-30 | 2015-06-30 | 一种资源的推荐方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104965903A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105260459A (zh) * | 2015-10-13 | 2016-01-20 | 百度在线网络技术(北京)有限公司 | 搜索方法和装置 |
CN105930484A (zh) * | 2016-04-29 | 2016-09-07 | 合网络技术(北京)有限公司 | 多媒体资源的推荐方法和装置 |
CN105956148A (zh) * | 2016-05-12 | 2016-09-21 | 北京奇艺世纪科技有限公司 | 资源信息的推荐方法和装置 |
CN106156351A (zh) * | 2016-07-26 | 2016-11-23 | 合网络技术(北京)有限公司 | 多媒体资源推荐信息生成方法及装置 |
CN106570031A (zh) * | 2015-10-13 | 2017-04-19 | 阿里巴巴集团控股有限公司 | 一种业务对象的推荐方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102685566A (zh) * | 2012-05-28 | 2012-09-19 | 北京网尚数字电影院线有限公司 | 一种音视频节目推荐方法 |
CN103559286A (zh) * | 2013-11-08 | 2014-02-05 | 北京奇虎科技有限公司 | 视频搜索结果的处理方法及装置 |
WO2014146265A1 (en) * | 2013-03-20 | 2014-09-25 | Nokia Corporation | Method and apparatus for personalized resource recommendations |
-
2015
- 2015-06-30 CN CN201510377907.4A patent/CN104965903A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102685566A (zh) * | 2012-05-28 | 2012-09-19 | 北京网尚数字电影院线有限公司 | 一种音视频节目推荐方法 |
WO2014146265A1 (en) * | 2013-03-20 | 2014-09-25 | Nokia Corporation | Method and apparatus for personalized resource recommendations |
CN103559286A (zh) * | 2013-11-08 | 2014-02-05 | 北京奇虎科技有限公司 | 视频搜索结果的处理方法及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105260459A (zh) * | 2015-10-13 | 2016-01-20 | 百度在线网络技术(北京)有限公司 | 搜索方法和装置 |
CN106570031A (zh) * | 2015-10-13 | 2017-04-19 | 阿里巴巴集团控股有限公司 | 一种业务对象的推荐方法和装置 |
CN105260459B (zh) * | 2015-10-13 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 搜索方法和装置 |
CN105930484A (zh) * | 2016-04-29 | 2016-09-07 | 合网络技术(北京)有限公司 | 多媒体资源的推荐方法和装置 |
CN105956148A (zh) * | 2016-05-12 | 2016-09-21 | 北京奇艺世纪科技有限公司 | 资源信息的推荐方法和装置 |
CN106156351A (zh) * | 2016-07-26 | 2016-11-23 | 合网络技术(北京)有限公司 | 多媒体资源推荐信息生成方法及装置 |
CN106156351B (zh) * | 2016-07-26 | 2019-07-23 | 合一网络技术(北京)有限公司 | 多媒体资源推荐信息生成方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10572565B2 (en) | User behavior models based on source domain | |
US20170188102A1 (en) | Method and electronic device for video content recommendation | |
CN103248960B (zh) | 基于电视终端的用户桌面实现方法及系统 | |
CN105516821B (zh) | 弹幕筛选的方法及装置 | |
CN103984740B (zh) | 基于组合标签的检索页显示的方法和系统 | |
US10621187B2 (en) | Methods, systems, and media for providing a media search engine | |
US20150109342A1 (en) | Information processing apparatus, information processing method, and program | |
CN104965903A (zh) | 一种资源的推荐方法和装置 | |
US9015170B2 (en) | Entropy-based mixing and personalization | |
US11789960B2 (en) | Systems and methods for grouping search results from multiple sources | |
EP1505521A2 (en) | Setting user preferences for an electronic program guide | |
US20120084657A1 (en) | Providing content to a user from multiple sources based on interest tag(s) that are included in an interest cloud | |
CN104504059A (zh) | 多媒体资源推荐方法 | |
CN103686231A (zh) | 影片的集成管理、失效替换与续播的方法及系统 | |
CN103678668A (zh) | 相关搜索结果的提示方法、服务器及系统 | |
US9542395B2 (en) | Systems and methods for determining alternative names | |
CN105354283A (zh) | 一种资源的搜索方法和装置 | |
CN104144181A (zh) | 一种网络视频终端聚合方法及系统 | |
US10509836B2 (en) | Systems and methods for presenting search results from multiple sources | |
CN105574030A (zh) | 一种信息搜索方法及装置 | |
US10592831B2 (en) | Methods and systems for recommending actors | |
CN104331434A (zh) | 一种生成搜索提示词服务的方法及其装置 | |
CN103970813A (zh) | 多媒体内容的搜寻方法与系统 | |
KR20240089234A (ko) | 비디오 콘텐츠의 팟캐스트 에피소드들에 대한 매칭 | |
CN104978419A (zh) | 一种用户资源的上传处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151007 |