CN103559206B - 一种信息推荐方法及系统 - Google Patents
一种信息推荐方法及系统 Download PDFInfo
- Publication number
- CN103559206B CN103559206B CN201310469257.7A CN201310469257A CN103559206B CN 103559206 B CN103559206 B CN 103559206B CN 201310469257 A CN201310469257 A CN 201310469257A CN 103559206 B CN103559206 B CN 103559206B
- Authority
- CN
- China
- Prior art keywords
- information
- recommendation
- element characteristic
- recommendation information
- program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/458—Scheduling content for creating a personalised stream, e.g. by combining a locally stored advertisement with an incoming stream; Updating operations, e.g. for OS modules ; time-related management operations
- H04N21/4586—Content update operation triggered locally, e.g. by comparing the version of software modules in a DVB carousel to the version stored locally
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/462—Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
- H04N21/4622—Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet
Abstract
本发明公开一种信息推荐方法及系统,其中,方法包括步骤:获取与正在播放的节目相关的网络来源推荐信息,并对获取到的网络来源推荐信息按照正在播放的节目的要素特征类别进行分类,统计分类后的各类别推荐信息的信息条数及信息发布时间;综合信息条数及信息发布时间计算出正在播放节目的要素特征权重;根据正在播放的节目的要素特征及要素特征权重与推荐信息的信息特征及信息特征权重计算出网络来源的推荐信息与正在播放的节目的相似度,并按照基于相似度的排序策略对网络来源推荐信息进行排序;按照各类别推荐信息的数量及各类别对应各网络来源所占比例,向用户推荐提取出各类别的推荐信息,使用户能直观、有条理的阅读到相关信息。
Description
技术领域
本发明涉及信息推荐领域,尤其涉及一种信息推荐方法及系统。
背景技术
随着信息技术的飞速发展,各种各样的网络信息充斥着人们的生活,面对这样庞大数量的信息,人们也渐渐变得无从下手,必须依靠搜索引擎等其它辅助的工具才能找到自己需要的内容。在智能时代,这种冗余繁琐的操作已经无法适应人们的生活,人们更希望智能电子产品能够更加聪明、智能一点,能够更懂用户所想,准确学习用户习惯、喜好,并给用户推荐所需要的信息。在这种背景下,推荐系统应运而生,推荐系统通过智能分析用户的历史行为给用户的行为建模,从而主动给用户推荐能够满足他们兴趣和需求的信息。
目前智能电视等智能终端中推荐应用普遍存在,以视频推荐应用为例,这种推荐应用普遍都是根据用户观看的视频给用户推荐观看该视频的其它用户也观看的视频,但用户在观看一个视频时,可能对视频相关的人、事、物等信息感兴趣(如这个视频的导演、演员,视频讲述的事件,视频出现的物品等感兴趣),用户希望了解与视频相关的其他信息。而现有的推荐方式都还无法满足用户的更多需求,所以,现有的推荐方式有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种信息推荐方法及系统,旨在解决现有的推荐方法无法向用户推荐正在播放的节目相关的更多信息的问题。
本发明的技术方案如下:
一种信息推荐方法,其中,包括步骤:
A、获取与正在播放的节目相关的网络来源推荐信息,并对获取到的各网络来源推荐信息按照正在播放的节目的要素特征类别进行分类,统计分类后的各类别推荐信息的信息条数及信息发布时间;
B、综合信息条数及信息发布时间计算出正在播放的节目的要素特征权重;
C、从获取的推荐信息中提取出信息特征及信息特征权重,根据正在播放的节目的要素特征及要素特征权重与推荐信息的信息特征及信息特征权重计算出推荐信息与正在播放的节目的相似度,并按照基于相似度的排序策略对各网络来源推荐信息进行排序;
D、根据正在播放的节目的要素特征权重计算各类别推荐信息的数量,并按照各类别推荐信息的数量及各要素特征类别对应各网络来源所占比例,从各网络来源推荐信息中提取出相应数量的推荐信息,并向用户推荐提取出的推荐信息。
所述的信息推荐方法,其中,所述步骤A具体包括:
A1、获取正在播放的节目的简介信息,对正在播放的节目的简介信息进行数据预处理,提取出正在播放的节目的要素特征;
A2、获取与正在播放的节目相关的网络来源推荐信息;
A3、按照正在播放的节目的要素特征类别对获取到的各网络来源推荐信息进行分类;
A4、统计分类后的各类别推荐信息的信息条数及信息发布时间。
所述的信息推荐方法,其中,所述步骤B中,要素特征权重的计算公式为:
,,;
其中,为正在播放的节目第i类的要素特征的权重值,、为0~1之间的参数,为正在播放的节目第i类的推荐信息的信息条数,为数量衰减参数,为时间衰减参数,是推荐信息的信息发布时间,是当前时间。
所述的信息推荐方法,其中,所述步骤C具体包括:
C1、从获取的推荐信息中提取出各推荐信息的信息特征,然后计算出各信息特征权重;
C2、按照相似度算法计算出各条推荐信息与正在播放的节目的相似度,然后按照基于相似度的排序策略对各网络来源推荐信息进行排序;
C3、判断各网络来源推荐信息的信息条数是否超过一预定阀值,当是时,将排列在后的推荐信息剔除得到各网络来源推荐信息的推荐列表,使各推荐列表的信息条数保持在预定阀值范围内。
所述的信息推荐方法,其中,所述步骤C2中,所述相似度算法公式如下:
,;
其中,是第i个正在播放的节目的特征,是第j个推荐信息的特征,是特征的第k个要素特征的权重,是特征的第k个信息特征的权重,k为1到n之间的整数,n为特征、的特征数量, 是第i个正在播放的节目的信息发布时间,是第j个推荐信息的信息发布时间,是热门度衰减因子,是推荐信息的点击数,是间隔衰减因子。
所述的信息推荐方法,其中,所述步骤D具体包括步骤:
D1、计算每个要素特征类别的推荐信息中不同网络来源所占的比例;
D2、按照要素特征权重及预设的总推荐列表长度计算各要素特征类别的推荐数量;
D3、按照各要素特征类别的推荐数量以及每个要素特征类别的推荐信息中不同网络来源所占比例,计算出从各推荐列表中所需提取各网络来源的推荐信息数量。
一种信息推荐系统,其中,包括:
分类统计模块,用于获取与正在播放的节目相关的网络来源推荐信息,并对获取到的各网络来源推荐信息按照正在播放的节目的要素特征类别进行分类,统计分类后的各类别推荐信息的信息条数及信息发布时间;
要素特征权重计算模块,用于综合信息条数及信息发布时间计算出正在播放的节目的要素特征权重;
相似度计算模块,用于从获取的推荐信息中提取出信息特征及信息特征权重,根据正在播放的节目的要素特征及要素特征权重与推荐信息的信息特征及信息特征权重计算出推荐信息与正在播放的节目的相似度,并按照基于相似度的排序策略对各网络来源推荐信息进行排序;
信息推荐模块,用于根据正在播放的节目的要素特征权重计算各类别推荐信息的数量,并按照各类别推荐信息的数量及各要素特征类别对应各网络来源所占比例,从各网络来源推荐信息中提取出相应数量的推荐信息,并向用户推荐提取出的推荐信息。
所述的信息推荐系统,其中,所述分类统计模块包括:
要素特征提取单元,用于获取正在播放的节目的简介信息,对正在播放的节目的简介信息进行数据预处理,提取出正在播放的节目的要素特征;
推荐信息获取单元,用于获取与正在播放的节目相关的网络来源推荐信息;
分类单元,用于按照正在播放的节目的要素特征类别对获取到的各网络来源推荐信息进行分类;
统计单元,用于统计分类后的各类别推荐信息的信息条数及信息发布时间。
所述的信息推荐系统,其中,所述相似度计算模块包括:
特征提取计算单元,用于从获取的推荐信息中提取出各推荐信息的信息特征,然后计算出各信息特征权重;
相似度计算单元,用于按照相似度算法计算出各条推荐信息与正在播放的节目的相似度,然后按照基于相似度的排序策略对各网络来源推荐信息进行排序;
剔除单元,用于判断各网络来源推荐信息的信息条数是否超过一预定阀值,当是时,将排列在后的推荐信息剔除得到各网络来源推荐信息的推荐列表,使各推荐列表的信息条数保持在预定阀值范围内。
所述的信息推荐系统,其中,所述信息推荐模块包括:
比例计算单元,用于计算每个要素特征类别的推荐信息中不同网络来源所占的比例;
数量计算单元,用于按照要素特征权重及预设的总推荐列表长度计算各要素特征类别的推荐数量;
推荐单元,用于按照各要素特征类别的推荐数量以及每个要素特征类别的推荐信息中不同网络来源所占比例,计算出从各推荐列表中所需提取各网络来源的推荐信息数量。
有益效果:本发明根据正在播放的节目的要素特征类别对各类别推荐信息进行分类,然后综合信息条数及信息发布时间计算得到各要素特征权重,根据要素特征及要素特征权重计算出推荐信息与正在播放的节目的相似度,再根据要素特征权重计算得到各类别的信息推荐条数,为用户推荐各类别的推荐信息。本发明的推荐方法,能让用户快捷、高效的获取正在播放的节目的人物、时间、地点、事件、原因等要素特征的相关信息,使用户能直观、有条理的阅读到相关信息,提升了用户的使用体验。
附图说明
图1为本发明一种信息推荐方法较佳实施例的流程图。
图2为图1所示方法中步骤S101的具体流程图。
图3为图1所示方法中步骤S103的具体流程图。
图4为图1所示方法中步骤S104的具体流程图。
图5为本发明中总推荐列表的结构示意图。
图6为本发明一种信息推荐系统较佳实施例的结构框图。
图7为图6所示系统中分类统计模块的具体结构框图。
图8为图6所示系统中相似度计算模块的具体结构框图。
图9为图6所示系统中信息推荐模块的具体结构框图。
具体实施方式
本发明提供一种信息推荐方法及系统,为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,图1为本发明信息推荐方法较佳实施例的流程图,如图所示,其包括步骤:
S101、获取与正在播放的节目相关的网络来源推荐信息,并对获取到的各网络来源推荐信息按照正在播放的节目的要素特征类别进行分类,统计分类后的各类别推荐信息的信息条数及信息发布时间;
S102、综合信息条数及信息发布时间计算出正在播放的节目的要素特征权重;
S103、从获取的推荐信息中提取出信息特征及信息特征权重,根据正在播放的节目的要素特征及要素特征权重与推荐信息的信息特征及信息特征权重计算出推荐信息与正在播放的节目的相似度,并按照基于相似度的排序策略对各网络来源推荐信息进行排序;
S104、根据正在播放的节目的要素特征权重计算各类别推荐信息的数量,并按照各类别推荐信息的数量及各要素特征类别对应各网络来源所占比例,从各网络来源推荐信息中提取出相应数量的推荐信息,并向用户推荐提取出的推荐信息。
在步骤S101中,首先获取与正在播放的节目相关的各种不同网络来源的推荐信息,然后对推荐信息进行分类,统计分类后得到的各类别推荐信息的信息条数及信息发布时间,具体来说,如图2所示,其包括步骤:
S201、获取正在播放的节目的简介信息,对正在播放的节目的简介信息进行数据预处理,提取出正在播放的节目的要素特征;
以正在播放的节目是直播电视节目为例,其简介信息可以是EPG信息中节目简介等信息,对于电影,其简介信息则可以是内容简介。对于获取到的简介信息提取要素特征的过程,需先对简介信息进行数据预处理,例如对数据进行清洗、去噪处理,将简介信息转换成后续要素特征提取所需的数据格式。要素特征是用于表征正在播放的节目的特征,可以是很多类别,例如一个正在播放的节目所包含的要素的特征可能有内容性质(例如新闻性节目、教育性节目、文艺性节目)、受众对象(例如老年人节目、少儿节目、军事节目、农民节目)、播出方式(例如直播节目、录播节目)等等,也可能是时间、地点、人物等等这样的要素特征,任何可用来表征正在播放的节目的特征均可作为本发明中的要素特征。在本实施例中,要素特征优选为5w特征:时间(when)、地点(where)、人物(who)、事件(what)、原因(why)。以电影《2012》为例,其5w特征是:时间:2012;人物:罗兰·艾默里奇;事件:灾难、世界末日;地点:西藏、黄石公园。
本发明之所以提出以5w特征作为正在播放的节目的要素特征,其是基于这样的经验认识出发:人们对事物的认知就是从事物的时间、地点、人物、事件、原因这5个方面获得的,通过这5方面的信息就可以对事物能有一个全面、透彻的理解。
S202、获取与正在播放的节目相关的网络来源推荐信息;
此步骤是根据正在播放的节目的简介信息中的关键信息,例如节目名称或标题等等,利用信息获取接口从网络获取相关的推荐信息,其推荐信息也可根据正在播放的节目的5w特征来获取,网络来源推荐信息可通过正在播放的节目中各种内置的信息中获取,其获取方法不受限制。以正在播放的节目为直播节目为例,所述的推荐信息可以是视频、新闻、百科、商品、微博等多个来源类别的推荐信息,并形成相应的视频数据库、新闻数据库、百科数据库、商品数据库、微博数据库,各数据库中包含了获取到相应来源类别的推荐信息。
S203、按照正在播放的节目的要素特征类别对获取到的各网络来源推荐信息进行分类;
此步骤是将获取到的不同网络来源推荐信息进行分类,前述步骤中的推荐信息其分类是基于来源的不同,本步骤的分类则是根据正在播放的节目的要素特征类别进行分类,即进行5w分类,在具体分类时,可采用现有技术中的Bayes(贝叶斯)、svm(支持向量机)等分类方法对推荐信息进行分类。
S204、统计分类后的各类别推荐信息的信息条数及信息发布时间。
在本实施例中,一个改进之处在于对要素特征进行权重分析获得要素特征权重,而要素特征权重的获得,首先要统计各类别(要素特征类别)的推荐信息的信息条数及信息发布时间。信息条数的不同及信息发布时间的不同均会导致各要素特征权重的不同,要素特征权重的计算过程在下文描述。
在步骤S102中,其为计算要素特征权重的具体过程,在本实施例中,要素特征权重的计算既考虑到了各推荐信息的信息数量又考虑了时间因素。
对于信息条数而言,若某一个w类的信息条数越多,那么说明越多的用户关注这个w类的信息,同时由于用户更偏向于阅读最新发布的新闻、微博等信息,所以在5w权重计算的过程中也考虑到了信息发布时间因素,即从信息条数和信息发布时间两个因素来设计要素特征权重计算公式。
1、对于信息条数因素
信息数量函数公式如下:
其中,是每一个要素特征类别(具体即为每一w类)的信息条数,其为自然数,为数量衰减参数。信息数量函数的含义即为每个要素特征类别的信息条数越多,那么其权重越大。
2、对于信息发布时间因素
时间衰减函数如下:
其中,为时间衰减参数,是推荐信息(例如微博、新闻等)的信息发布时间,是当前时间(是当前系统计算要素特征权重的时间),时间衰减函数的含义是越新发布的信息用户可能越喜欢,那么其权重也越大。
综合信息条数和信息发布时间这两个因素,线性组合信息数量函数和时间衰减函数,得到要素特征权重的计算公式如下:。
其中,、为0~1之间取值的参数,代表信息条数和信息发布时间这两个因素的权重,二者相加为1,二者大小可根据实际情况或者通过实验来计算,为各要素特征类别(5w类)中某个要素特征类别的权重值,5w权重值进行归一化,使各要素特征类别的权值值在0~1之间取值,在本实施例中,i取值范围为1~5,分别为5个w类。
在步骤S103中,其需要根据前述步骤中得到的正在播放的节目的要素特征及要素特征权重计算出推荐信息与正在播放的节目的相似度,从而得到推荐列表。具体来说,如图3所示,其包括步骤:
S301、从获取的推荐信息中提取出各推荐信息的信息特征,然后计算出各信息特征权重;
对于不同网络来源的推荐信息,其具有不同的信息特征以及信息特征权重。
例如,对于视频数据,首先要对所有视频数据进行数据预处理,数据预处理方法与对前述简介信息的数据预处理类似,即进行去噪、清洗处理,将所有视频数据统一转成本实施例中相似度算法所需的数据格式。然后提取每个视频的信息特征,计算信息特征的权重,再输入到相似度算法中计算相似度。
对于百科数据,同样进行类似的数据预处理,然后提取每条百科词条的信息特征,如每个百科信息进行分词之后的词组,然后采用现有技术中的tf-idf方法(一种用于资讯检索与资讯探勘的常用加权技术,用于评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度)计算每个信息特征的权重【即该信息特征出现的频率等】。
对于新闻数据,可采用分词方法,例如使用Apache的开源软件Lucene(全文检索引擎)对百科内容进行分词得到信息特征,然后计算出每个信息特征的权重。
对于商品数据,同样对商品数据进行数据预处理,提取商品数据的信息特征,然后计算信息特征的权重。
对于微博数据,也先对商品数据进行数据预处理,采用前述的分词方法对微博内容进行分词得到信息特征,然后计算每个信息特征的权重。
按照上述方法,对每一网络来源类别的推荐信息都提取出相应的信息特征,并计算出相应的信息特征权重。
S302、按照相似度算法计算出各条推荐信息与正在播放的节目的相似度,然后按照基于相似度的排序策略对各网络来源推荐信息进行排序;
在获得了正在播放的节目的要素特征及要素特征权重,以及推荐信息的信息特征及信息特征权重之后,可按照相似度计算公式计算出每一条推荐信息与正在播放的节目的相似度,从而对推荐信息进行排序。
现有技术中的相似度计算公式其未考虑到时间、热门度这两个因子,而在信息推荐过程中,时间和热门度这两个因子会影响到给用户推荐何种信息,尤其是对于直播节目来说,在短时间内发布的推荐信息以及热门的推荐信息与正在播放的节目应具有更高的相似度,基于此,本实施例对现有技术中的相似度计算公式进行改进,如下所示:
其中,是第i个正在播放的节目的特征,是第j个推荐信息的特征,是特征的第k个属性特征的权重,是特征的第k个信息特征的权重,k为1到n之间的整数,n为特征、的特征(属性特征或信息特征)数量, 是第i个正在播放的节目的信息发布时间,是第j个推荐信息的信息发布时间,是热门度衰减因子,是推荐信息的点击数,是间隔衰减因子。
在上述公式中,其引入了与时间相关的衰减项,f函数的含义是,正在播放的节目与要计算的推荐信息的时间间隔,间隔越短,则越小。f函数如下:,是间隔衰减参数。
此外,还引入了与热门度有关的衰减项,是热门度衰减因子,是推荐信息(微博、新闻等)的(,通过信息获取接口中可以得到该属性值)点击数。
通过对相似度算法进行改进,引入了分别与时间、热门度相关的衰减项,从而能使在短时间内发布的相关新闻、微博等推荐信息、以及最热门的推荐信息与正在播放的节目具有更高的相似度,以便为用户推荐最新发布且最热门的信息。
在计算出每一条推荐信息与正在播放的节目的相似度之后,可按照基于相似度的排序策略对各网络来源推荐信息进行排序,例如对于微博来源的推荐信息按照相似度高低进行排序,将相似度高的推荐信息排列在前,对于百科来源的推荐信息按照相似度高低进行排序,将相似度高的推荐信息排列在前,依次类推。在本实施例中,排序策略可以是按照相似度高低进行排序,当然也可对相似度、信息发布时间再分别设置一权重,从而得到一个综合的排序指标,以将信息发布时间再次考虑进来,让用户能获得最新发布的推荐信息。在排序过程中,还对推荐信息进行过滤,例如将重复的推荐信息删除、去掉下线视频或过滤新闻、去掉下架或缺货等商品等等。
S303、判断各网络来源推荐信息的信息条数是否超过一预定阀值,当是时,将排列在后的推荐信息剔除得到各网络来源推荐信息的推荐列表,使各推荐列表的信息条数保持在预定阀值范围内。
本步骤的目的是为了使得到各网络来源推荐信息的的推荐列表的信息条数能够保持在预定阀值范围之内,这样能使最后推荐给用户的都是相似度最高的信息,各推荐列表包括视频推荐列表、新闻推荐列表、百科推荐列表、微博推荐列表、商品推荐列表等等,各推荐列表的长度受到检索到的相应网络来源推荐信息的数量影响,以视频推荐列表为例,如果没有搜索到相关的视频信息,则该视频推荐列表长度为0,若搜索到的推荐列表的信息为m,大于预设的阀值n,那么将视频推荐列表中排列在后的信息剔除,使视频推荐列表的长度为n。
在步骤S104中,需根据正在播放的节目的要素特征权重计算每一要素特征类别所需的网络来源推荐信息的信息推荐条数,推荐各种推荐信息。
具体来说,如图4所示,此步骤具体包括:
S401、计算每个要素特征类别的推荐信息中不同网络来源所占的比例;
例如计算在人物这个类别的推荐信息中,计算视频、微博、百科、新闻、商品等各网络来源推荐信息所占的比例,具体对于视频网络来源所占比例通过视频推荐信息量与视频、微博、百科、新闻、商品等总推荐信息量的比值得到。
S402、按照要素特征权重及预设的总推荐列表长度计算各要素特征类别的推荐数量;
例如在《非诚勿扰》这个直播节目中,预设的总推荐列表长度为30(即向用户推荐30个结果),而人物这个要素特征所占的权重为0.5,这说明用户最想了解的是节目中人物的信息,那么人物这个要素特征类别的推荐信息的推荐数量应为15,同理计算出其他要素特征类别的推荐信息的推荐数量。
S403、按照各要素特征类别的推荐数量以及每个要素特征类别的推荐信息中不同网络来源推荐信息所占比例,计算出从各推荐列表中所需提取各网络来源的推荐信息数量。
例如对于人物这个要素特征类别的推荐信息的推荐数量为15,这15条推荐信息可能包含在微博、百科、新闻等各种网络来源的推荐信息中。而在视频推荐列表中,其属于人物这个类别的信息数量为10条,在微博推荐列表中,其属于人物这个类别的信息数量为15条,在新闻推荐列表中,其属于人物这个类别的信息数量为5条,其他推荐列表中,人物这个类别的信息数量为0,这样在人物这个类别的推荐信息数量为30条。而目前所需的人物这个类别的信息数量为15条,那么,应从视频推荐列表中提取出15*10/30的人物这个类别的信息条数,同时从微博推荐列表中提取出15*5/30的人物这个类别的信息条数,新闻推荐列表中提取出15*5/30的人物这个类别的信息条数,在提取之后,还应按照相似度高低进行排序,从而得到一个数量为15条的属于人物这个要素特征类别的推荐信息。按照上述方法,即可获得其他各要素特征类别的推荐信息。
本发明最后形成的总推荐列表是多维的,以电影《2012》为例,如图5所示,总推荐列表里可能首先排放2012导演(w1类)的微博、百科、视频信息,再排放黄石公园(w2类)的百科、新闻信息,其他要素特征类别的信息类似,最后提供给用户一个按照要素特征类别进行排列的总推荐列表。
基于上述系统,本发明还提供一种信息推荐系统,如图6所示,其包括:
分类统计模块100,用于获取与正在播放的节目相关的网络来源推荐信息,并对获取到的各网络来源推荐信息按照正在播放的节目的要素特征类别进行分类,统计分类后的各类别推荐信息的信息条数及信息发布时间;
要素特征权重计算模块200,用于综合信息条数及信息发布时间计算出正在播放的节目的要素特征权重;
相似度计算模块300,用于从获取的推荐信息中提取出信息特征及信息特征权重,根据正在播放的节目的要素特征及要素特征权重与推荐信息的信息特征及信息特征权重计算出推荐信息与正在播放的节目的相似度,并按照基于相似度的排序策略对各网络来源推荐信息进行排序;
信息推荐模块400,用于根据正在播放的节目的要素特征权重计算各类别推荐信息的数量,并按照各类别推荐信息的数量及各要素特征类别对应各网络来源所占比例,从各网络来源推荐信息中提取出相应数量的推荐信息,并向用户推荐提取出的推荐信息。关于上述模块单元的技术细节在前面的方法中已有详述,故不再赘述。
进一步,如图7所示,所述分类统计模块100包括:
要素特征提取单元110,用于获取正在播放的节目的简介信息,对正在播放的节目的简介信息进行数据预处理,提取出正在播放的节目的要素特征;
推荐信息获取单元120,用于获取与正在播放的节目相关的网络来源推荐信息;
分类单元130,用于按照正在播放的节目的要素特征类别对获取到的各网络来源推荐信息进行分类;
统计单元140,用于统计分类后的各类别推荐信息的信息条数及信息发布时间。关于上述模块单元的技术细节在前面的方法中已有详述,故不再赘述。
进一步,如图8所示,所述相似度计算模块300包括:
特征提取计算单元310,用于从获取的推荐信息中提取出各推荐信息的信息特征,然后计算出各信息特征权重;
相似度计算单元320,用于按照相似度算法计算出各条推荐信息与正在播放的节目的相似度,然后按照基于相似度的排序策略对各网络来源推荐信息进行排序;
剔除单元330,用于判断各网络来源推荐信息的信息条数是否超过一预定阀值,当是时,将排列在后的推荐信息剔除得到各网络来源推荐信息的推荐列表,使各推荐列表的信息条数保持在预定阀值范围内。关于上述模块单元的技术细节在前面的方法中已有详述,故不再赘述。
进一步,如图9所示,所述信息推荐模块400包括:
比例计算单元410,用于计算每个要素特征类别的推荐信息中不同网络来源所占的比例;
数量计算单元420,用于按照要素特征权重及预设的总推荐列表长度计算各要素特征类别的推荐数量;
推荐单元430,用于按照各要素特征类别的推荐数量以及每个要素特征类别的推荐信息中不同网络来源所占比例,计算出从各推荐列表中所需提取各网络来源的推荐信息数量。关于上述模块单元的技术细节在前面的方法中已有详述,故不再赘述。
综上所述,本发明根据正在播放的节目的要素特征类别对各类别推荐信息进行分类,然后综合信息条数及信息发布时间计算得到各要素特征权重,根据要素特征及要素特征权重计算出推荐信息与正在播放的节目的相似度,再根据要素特征权重计算得到各类别的信息推荐条数,为用户推荐各类别的推荐信息。本发明的推荐方法,能让用户快捷、高效的获取正在播放的节目的相关信息,使用户能直观、有条理的阅读到相关信息,提升了用户的使用体验。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (10)
1.一种信息推荐方法,其特征在于,包括步骤:
A、获取与正在播放的节目相关的网络来源推荐信息,并对获取到的各网络来源推荐信息按照正在播放的节目的要素特征类别进行分类,统计分类后的各类别推荐信息的信息条数及信息发布时间;
B、综合信息条数及信息发布时间计算出正在播放的节目的要素特征权重;
C、从获取的推荐信息中提取出信息特征及信息特征权重,根据正在播放的节目的要素特征及要素特征权重与推荐信息的信息特征及信息特征权重计算出推荐信息与正在播放的节目的相似度,并按照基于相似度的排序策略对各网络来源推荐信息进行排序;
D、根据正在播放的节目的要素特征权重计算各类别推荐信息的数量,并按照各类别推荐信息的数量及各要素特征类别对应各网络来源所占比例,从各网络来源推荐信息中提取出相应数量的推荐信息,并向用户推荐提取出的推荐信息。
2.根据权利要求1所述的信息推荐方法,其特征在于,所述步骤A具体包括:
A1、获取正在播放的节目的简介信息,对正在播放的节目的简介信息进行数据预处理,提取出正在播放的节目的要素特征;
A2、获取与正在播放的节目相关的网络来源推荐信息;
A3、按照正在播放的节目的要素特征类别对获取到的各网络来源推荐信息进行分类;
A4、统计分类后的各类别推荐信息的信息条数及信息发布时间。
3.根据权利要求1所述的信息推荐方法,其特征在于,所述步骤B中,要素特征权重的计算公式为:
,,;
其中,为正在播放的节目第i类的要素特征的权重值,、为0~1之间的参数,为正在播放的节目第i类的推荐信息的信息条数,为数量衰减参数,为时间衰减参数,是推荐信息的信息发布时间,是当前时间。
4.根据权利要求1所述的信息推荐方法,其特征在于,所述步骤C具体包括:
C1、从获取的推荐信息中提取出各推荐信息的信息特征,然后计算出各信息特征权重;
C2、按照相似度算法计算出各条推荐信息与正在播放的节目的相似度,然后按照基于相似度的排序策略对各网络来源推荐信息进行排序;
C3、判断各网络来源推荐信息的信息条数是否超过一预定阀值,当是时,将排列在后的推荐信息剔除得到各网络来源推荐信息的推荐列表,使各推荐列表的信息条数保持在预定阀值范围内。
5.根据权利要求4所述的信息推荐方法,其特征在于,所述步骤C2中,所述相似度算法公式如下:
,;
其中,是第i个正在播放的节目的特征,是第j个推荐信息的特征,是特征的第k个要素特征的权重,是特征的第k个信息特征的权重,k为1到n之间的整数,n为特征、的特征数量, 是第i个正在播放的节目的信息发布时间,是第j个推荐信息的信息发布时间,是热门度衰减因子,是推荐信息的点击数,是间隔衰减因子。
6.根据权利要求4所述的信息推荐方法,其特征在于,所述步骤D具体包括步骤:
D1、计算每个要素特征类别的推荐信息中不同网络来源所占的比例;
D2、按照要素特征权重及预设的总推荐列表长度计算各要素特征类别的推荐数量;
D3、按照各要素特征类别的推荐数量以及每个要素特征类别的推荐信息中不同网络来源所占比例,计算出从各推荐列表中所需提取各网络来源的推荐信息数量。
7.一种信息推荐系统,其特征在于,包括:
分类统计模块,用于获取与正在播放的节目相关的网络来源推荐信息,并对获取到的各网络来源推荐信息按照正在播放的节目的要素特征类别进行分类,统计分类后的各类别推荐信息的信息条数及信息发布时间;
要素特征权重计算模块,用于综合信息条数及信息发布时间计算出正在播放的节目的要素特征权重;
相似度计算模块,用于从获取的推荐信息中提取出信息特征及信息特征权重,根据正在播放的节目的要素特征及要素特征权重与推荐信息的信息特征及信息特征权重计算出推荐信息与正在播放的节目的相似度,并按照基于相似度的排序策略对各网络来源推荐信息进行排序;
信息推荐模块,用于根据正在播放的节目的要素特征权重计算各类别推荐信息的数量,并按照各类别推荐信息的数量及各要素特征类别对应各网络来源所占比例,从各网络来源推荐信息中提取出相应数量的推荐信息,并向用户推荐提取出的推荐信息。
8.根据权利要求7所述的信息推荐系统,其特征在于,所述分类统计模块包括:
要素特征提取单元,用于获取正在播放的节目的简介信息,对正在播放的节目的简介信息进行数据预处理,提取出正在播放的节目的要素特征;
推荐信息获取单元,用于获取与正在播放的节目相关的网络来源推荐信息;
分类单元,用于按照正在播放的节目的要素特征类别对获取到的各网络来源推荐信息进行分类;
统计单元,用于统计分类后的各类别推荐信息的信息条数及信息发布时间。
9.根据权利要求7所述的信息推荐系统,其特征在于,所述相似度计算模块包括:
特征提取计算单元,用于从获取的推荐信息中提取出各推荐信息的信息特征,然后计算出各信息特征权重;
相似度计算单元,用于按照相似度算法计算出各条推荐信息与正在播放的节目的相似度,然后按照基于相似度的排序策略对各网络来源推荐信息进行排序;
剔除单元,用于判断各网络来源推荐信息的信息条数是否超过一预定阀值,当是时,将排列在后的推荐信息剔除得到各网络来源推荐信息的推荐列表,使各推荐列表的信息条数保持在预定阀值范围内。
10.根据权利要求7所述的信息推荐系统,其特征在于,所述信息推荐模块包括:
比例计算单元,用于计算每个要素特征类别的推荐信息中不同网络来源所占的比例;
数量计算单元,用于按照要素特征权重及预设的总推荐列表长度计算各要素特征类别的推荐数量;
推荐单元,用于按照各要素特征类别的推荐数量以及每个要素特征类别的推荐信息中不同网络来源所占比例,计算出从各推荐列表中所需提取各网络来源的推荐信息数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310469257.7A CN103559206B (zh) | 2013-10-10 | 2013-10-10 | 一种信息推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310469257.7A CN103559206B (zh) | 2013-10-10 | 2013-10-10 | 一种信息推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103559206A CN103559206A (zh) | 2014-02-05 |
CN103559206B true CN103559206B (zh) | 2017-08-08 |
Family
ID=50013453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310469257.7A Active CN103559206B (zh) | 2013-10-10 | 2013-10-10 | 一种信息推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103559206B (zh) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951956A (zh) * | 2014-03-31 | 2015-09-30 | Tcl集团股份有限公司 | 一种电影排名方法和装置 |
CN104021163B (zh) * | 2014-05-28 | 2017-10-24 | 深圳市盛讯达科技股份有限公司 | 产品推荐系统及方法 |
CN104809218B (zh) * | 2015-04-30 | 2018-09-28 | 北京奇艺世纪科技有限公司 | 一种ugc视频分类方法及装置 |
CN104899266B (zh) * | 2015-05-22 | 2017-10-24 | 广东欧珀移动通信有限公司 | 一种应用推荐方法及装置 |
CN105159910A (zh) * | 2015-07-03 | 2015-12-16 | 安一恒通(北京)科技有限公司 | 信息推荐方法和装置 |
CN105045852A (zh) * | 2015-07-06 | 2015-11-11 | 华东师范大学 | 一种教学资源的全文搜索引擎系统 |
CN105096161B (zh) * | 2015-07-17 | 2017-12-29 | 腾讯科技(深圳)有限公司 | 一种进行信息展示的方法和装置 |
CN105049942B (zh) * | 2015-07-30 | 2018-01-12 | 四川长虹电器股份有限公司 | 为点播影视节目标签增加权重系数的方法及装置 |
CN105245922A (zh) * | 2015-09-30 | 2016-01-13 | 北京酷云互动科技有限公司 | 一种获取品牌与节目的关联度的方法及系统 |
CN105868332A (zh) * | 2016-03-28 | 2016-08-17 | 百度在线网络技术(北京)有限公司 | 一种热点概念的推荐方法和装置 |
CN105872780A (zh) * | 2016-03-30 | 2016-08-17 | 乐视控股(北京)有限公司 | 一种关联信息的推荐方法和系统 |
CN106454536B (zh) * | 2016-09-19 | 2019-07-26 | 广州视源电子科技股份有限公司 | 信息推荐度的确定方法及装置 |
CN108632669A (zh) * | 2017-03-23 | 2018-10-09 | 北京小唱科技有限公司 | 一种网络主播实时工作量获取方法和系统 |
CN107368533B (zh) * | 2017-06-15 | 2020-04-03 | 北京奇艺世纪科技有限公司 | 一种内容项推荐方法、装置及电子设备 |
CN107463698B (zh) * | 2017-08-15 | 2020-11-20 | 北京百度网讯科技有限公司 | 基于人工智能推送信息的方法和装置 |
CN107944001A (zh) * | 2017-12-05 | 2018-04-20 | 北京金山安全软件有限公司 | 热点新闻的检测方法、装置及电子设备 |
CN110019802B (zh) * | 2017-12-08 | 2021-09-03 | 北京京东尚科信息技术有限公司 | 一种文本聚类的方法和装置 |
CN108664564B (zh) * | 2018-04-13 | 2021-12-21 | 东华大学 | 一种基于物品内容特征的改进协同过滤推荐方法 |
CN108846005A (zh) * | 2018-04-23 | 2018-11-20 | 北京奇艺世纪科技有限公司 | 漫画资源推荐方法及装置 |
CN108683734B (zh) * | 2018-05-15 | 2021-04-09 | 广州虎牙信息科技有限公司 | 品类推送方法、装置及存储设备、计算机设备 |
CN109033133A (zh) * | 2018-06-01 | 2018-12-18 | 杭州电子科技大学 | 基于特征项权重增长趋势的事件检测与跟踪方法 |
CN109460514A (zh) * | 2018-11-02 | 2019-03-12 | 北京京东尚科信息技术有限公司 | 用于推送信息的方法和装置 |
CN109816495B (zh) * | 2019-02-13 | 2020-11-24 | 北京达佳互联信息技术有限公司 | 商品信息推送方法、系统及服务器和存储介质 |
CN112637629B (zh) * | 2020-12-25 | 2023-06-20 | 百度在线网络技术(北京)有限公司 | 直播内容推荐方法及装置、电子设备和介质 |
CN113779403A (zh) * | 2021-09-16 | 2021-12-10 | 掌阅科技股份有限公司 | 书籍资讯的获取方法、展示方法、服务端以及用户终端 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101287082A (zh) * | 2008-05-16 | 2008-10-15 | 华东师范大学 | 一种引入节目热门度权重的协作过滤推荐方法 |
US8301624B2 (en) * | 2009-03-31 | 2012-10-30 | Yahoo! Inc. | Determining user preference of items based on user ratings and user features |
CN102957969A (zh) * | 2012-05-18 | 2013-03-06 | 华东师范大学 | 为iptv终端用户推荐节目的装置及方法 |
CN102970605A (zh) * | 2012-11-21 | 2013-03-13 | Tcl集团股份有限公司 | 一种节目推荐方法 |
-
2013
- 2013-10-10 CN CN201310469257.7A patent/CN103559206B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101287082A (zh) * | 2008-05-16 | 2008-10-15 | 华东师范大学 | 一种引入节目热门度权重的协作过滤推荐方法 |
US8301624B2 (en) * | 2009-03-31 | 2012-10-30 | Yahoo! Inc. | Determining user preference of items based on user ratings and user features |
CN102957969A (zh) * | 2012-05-18 | 2013-03-06 | 华东师范大学 | 为iptv终端用户推荐节目的装置及方法 |
CN102970605A (zh) * | 2012-11-21 | 2013-03-13 | Tcl集团股份有限公司 | 一种节目推荐方法 |
Non-Patent Citations (2)
Title |
---|
"Hybrid music recommendation based on different dimensions of audio content and an entropy measure";Berna Altinel et al.;《2007 15th European Signal Processing Conference》;20070907;全文 * |
"基于显性用户特征的数字电视节目推荐系统";徐江山 等;《清华大学学报(自然科学版)》;20070131;第47卷(第1期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103559206A (zh) | 2014-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103559206B (zh) | 一种信息推荐方法及系统 | |
CN110704674B (zh) | 一种视频播放完整度预测方法及装置 | |
Basu et al. | Recommendation as classification: Using social and content-based information in recommendation | |
CN106503014B (zh) | 一种实时信息的推荐方法、装置和系统 | |
CN105159932B (zh) | 一种数据检索引擎和排序系统和方法 | |
US20150205580A1 (en) | Method and System for Sorting Online Videos of a Search | |
Cremonesi et al. | Hybrid algorithms for recommending new items | |
CN109511015B (zh) | 多媒体资源推荐方法、装置、存储介质及设备 | |
CN106407241A (zh) | 视频推荐方法及系统 | |
KR20130119246A (ko) | 감성 기반 콘텐츠 추천 장치 및 방법 | |
CN102265276A (zh) | 基于上下文的推荐系统 | |
CN110717093B (zh) | 一种基于Spark的电影推荐系统及方法 | |
KR20130090344A (ko) | Tv 프로그램 콘텐츠와 웹 콘텐츠의 연계추천 장치, 시스템, 방법 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체 | |
Elsawy et al. | Tweetmogaz v2: Identifying news stories in social media | |
Blanco et al. | IntoNews: Online news retrieval using closed captions | |
Nakajima et al. | Early detection of buzzwords based on large-scale time-series analysis of blog entries | |
CN112163163B (zh) | 多算法融合的信息推荐方法、装置和设备 | |
CN114461879A (zh) | 基于文本特征整合的语义社交网络多视角社区发现方法 | |
Cremonesi et al. | Evaluating top-n recommendations" when the best are gone" | |
Li et al. | Personalized TV recommendation with mixture probabilistic matrix factorization | |
Hölbling et al. | Content-based tag generation to enable a tag-based collaborative tv-recommendation system. | |
He et al. | Multi-model or Single Model? A Study of Movie Box-Office Revenue Prediction | |
Krishnamoorthy et al. | TV shows popularity and performance prediction using CNN algorithm | |
KR101909267B1 (ko) | 열독률 제공 장치 및 방법 | |
Kagie et al. | Including item characteristics in the probabilistic latent semantic analysis model for collaborative filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |