CN111897861A - 一种内容推荐方法、装置、计算机设备及存储介质 - Google Patents

一种内容推荐方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111897861A
CN111897861A CN202010619530.XA CN202010619530A CN111897861A CN 111897861 A CN111897861 A CN 111897861A CN 202010619530 A CN202010619530 A CN 202010619530A CN 111897861 A CN111897861 A CN 111897861A
Authority
CN
China
Prior art keywords
recommendation
real
behavior data
current user
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010619530.XA
Other languages
English (en)
Inventor
张刘彬
史进
张侦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suning Financial Technology Nanjing Co Ltd
Original Assignee
Suning Financial Technology Nanjing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Financial Technology Nanjing Co Ltd filed Critical Suning Financial Technology Nanjing Co Ltd
Priority to CN202010619530.XA priority Critical patent/CN111897861A/zh
Publication of CN111897861A publication Critical patent/CN111897861A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种内容推荐方法、装置、计算机设备及存储介质,属于互联网技术领域,方法包括:获取当前用户的实时行为数据及实时行为数据对应的业务场景信息,并存储至数据库;根据业务场景信息配置的最优推荐算法以及当前用户的实时行为数据,从业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序;从数据库中抽取业务场景信息对应的所有用户的实时行为数据,根据所有用户的实时行为数据,从候选推荐列表中筛选多个热点内容并排序;对排序后的多个待推荐内容和排序后的多个热点内容进行融合,获得目标推荐列表,并将目标推荐列表中的推荐内容推荐给当前用户。本发明能够提高内容推荐的准确性。

Description

一种内容推荐方法、装置、计算机设备及存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种内容推荐方法、装置、计算机设备及存储介质。
背景技术
随着时代的发展,互联网已经逐渐走入大众的生活,通过网络获取信息变得日常化。近年来,互联网数据信息呈指数型爆炸增长,海量信息充斥着互联网,用户越来越难找到自己所需要的商品信息。作为信息消费者,从大量信息中找到自己需要和感兴趣的东西往往不是一件容易的事情。而对于信息生产者,能够让自己的商品信息为大家所关注,也是一件非常困难的事情。
在信息过载的时代,推荐技术通过自动将内容推荐给用户,帮助用户发现对自己有价值的信息,同时让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。
现有的内容推荐方案,推送的很多内容没有针对性,无法准确地推荐内容。
发明内容
为了解决相关技术中存在的问题,本发明实施例提供了一种内容推荐方法、装置、计算机设备及存储介质,可以提高内容推荐的准确性。
本发明实施例的具体技术方案如下:
第一方面,本发明实施例提供了一种内容推荐方法,所述方法包括:
获取当前用户的实时行为数据及所述实时行为数据对应的业务场景信息,并存储至数据库;
根据所述业务场景信息配置的最优推荐算法以及所述当前用户的实时行为数据,从所述业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序;
从所述数据库中抽取所述业务场景信息对应的所有用户的实时行为数据,根据所述所有用户的实时行为数据,从所述候选推荐列表中筛选多个热点内容并排序;
对排序后的所述多个待推荐内容和排序后的所述多个热点内容进行融合,获得目标推荐列表,并将所述目标推荐列表中的推荐内容推荐给所述当前用户。
进一步地,述获取当前用户的实时行为数据及所述实时行为数据对应的业务场景信息,并存储至数据库,包括:
通过Kafka分布式消息中间件获取实时数据流,通过第一计算引擎从所述实时数据流中解析出所述当前用户的实时行为数据以及业务场景信息,并将所述实时行为数据与所述业务场景信息对应存储到Hbase数据库中。
进一步地,所述方法还包括:
判断所述业务场景信息是否预先配置有指定的推荐列表;
若是,则将所述指定的推荐列表中的推荐内容推荐给所述当前用户;
若否,则根据所述业务场景信息配置的最优推荐算法以及所述当前用户的实时行为数据,从所述业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序。
进一步地,所述方法还包括:
确定所述业务场景信息配置的最优推荐算法,包括:
对所述业务场景信息预先配置至少两个推荐算法及每个所述推荐算法的用户群;
统计每个所述推荐算法的用户群对每个所述推荐算法所推荐内容的反馈数据,以获取每个所述推荐算法的推荐效果;
根据每个所述推荐算法对应的推荐效果,确定所述业务场景信息配置的最优推荐算法。
进一步地,所述方法还包括:
通过第二计算引擎利用ETL工具从所述数据库中批量抽取用户行为数据,并保存至Hive离线数据仓库中。
进一步地,所述方法还包括:
通过所述第二计算引擎从所述Hive离线数据仓库中抽取所述当前用户在当前更新周期内的历史行为数据;
从所述历史行为数据提取所述当前用户的历史行为特征;
将所述当前用户的历史行为特征输入到预先训练的推荐模型中,通过所述推荐模型从候选产品推荐列表中筛选出多个产品信息;
将所述多个产品信息确定为所述当前更新周期内的推荐内容以推荐给所述当前用户;
其中,所述推荐模型预先通过多个样本用户的行为特征数据和各个所述样本用户针对推荐内容的操作结果进行训练得到。
进一步地,所述方法还包括:
在将所述推荐内容推荐给所述当前用户之前,将所述推荐内容与所述当前用户的用户标识关联保存至Redis服务器中。
第二方面,提供一种内容推荐装置,所述装置包括:
获取模块,用于获取当前用户的实时行为数据及所述实时行为数据对应的业务场景信息;
存储模块,用于将当前用户的实时行为数据及所述实时行为数据对应的业务场景信息存储至数据库;
第一筛选模块,用于根据所述业务场景信息配置的最优推荐算法以及所述当前用户的实时行为数据,从所述业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序;
第二筛选模块,用于从所述数据库中抽取所述业务场景信息对应的所有用户的实时行为数据,并根据所述所有用户的实时行为数据,从所述候选推荐列表中筛选多个热点内容并排序;
融合模块,用于对排序后的所述多个待推荐内容和排序后的所述多个热点内容进行融合,获得目标推荐列表;
推荐模块,用于将所述目标推荐列表中的推荐内容推荐给所述当前用户。
进一步地,所述获取模块具体用于:
通过Kafka分布式消息中间件获取所述当前用户的实时行为数据以及业务场景信息;
所述存储模块具体用于:
通过第一计算引擎将所述实时行为数据与所述业务场景信息对应存储到Hbase数据库中。
进一步地,所述装置还包括判断模块;
所述判断模块,用于判断所述业务场景信息是否预先配置有指定的推荐列表;
所述推荐模块,还用于在所述判断模块的判断结果为是时,将所述指定的推荐列表中的推荐内容推荐给所述当前用户。
进一步地,所述装置还包括:
确定模块,用于确定所述业务场景信息配置的最优推荐算法;
所述确定模块具体用于:
对所述业务场景信息预先配置至少两个推荐算法及每个所述推荐算法的用户群;
统计每个所述推荐算法的用户群对每个所述推荐算法所推荐内容的反馈数据,以获取每个所述推荐算法的推荐效果;
根据每个所述推荐算法对应的推荐效果,确定所述业务场景信息配置的最优推荐算法。
进一步地,所述存储模块具体还用于:
通过第二计算引擎利用ETL工具从所述数据库中批量抽取用户行为数据,并保存至Hive离线数据仓库中。
进一步地,所述装置还包括第三筛选模块;
所述第三筛选模块,用于从所述Hive离线数据仓库中抽取所述当前用户在当前更新周期内的历史行为数据,从所述历史行为数据提取所述当前用户的历史行为特征,并将所述当前用户的历史行为特征输入到预先训练的推荐模型中,通过所述推荐模型从候选产品推荐列表中筛选出多个产品信息;
所述推荐模块,还用于将所述多个产品信息确定为所述当前更新周期内的推荐内容以推荐给所述当前用户;
其中,所述推荐模型预先通过多个样本用户的行为特征数据和各个所述样本用户针对推荐内容的操作结果进行训练得到。
进一步地,所述存储模块具体还用于:
在将所述推荐内容推荐给所述当前用户之前,将所述推荐内容与所述当前用户的用户标识关联保存至Redis服务器中。
第三方面,提供一种计算机设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的内容推荐方法。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述的内容推荐方法。
本发明提供一种内容推荐方法、装置、计算机设备及存储介质,通过根据当前用户的实时行为数据以及对应的业务场景信息配置的最优推荐算法,从业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序,并根据业务场景信息对应的所有用户的实时行为数据,从业务场景信息对应的候选推荐列表中筛选多个热点内容并排序,最后对多个待推荐内容和多个热点内容进行融合,获得目标推荐列表,由此能够有快速准确地推荐出用户感兴趣的信息,避免为用户提供无用的内容,避免信息过多造成用户获取信息困难,提高了用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例提供的一种内容推荐方法的流程图;
图2示出了本发明实施例提供的一种内容推荐装置的结构图;
图3示出了本发明实施例提供的一种计算机设备的内部结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
此外,在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
如前述背景技术所述,现有的内容推荐方案,推送的很多内容没有针对性,无法准确地推荐内容。为此,本发明实施例提供一种内容推荐方法,通过根据当前用户的实时行为数据以及对应的业务场景信息配置的最优推荐算法,从业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序,并根据业务场景信息对应的所有用户的实时行为数据,从业务场景信息对应的候选推荐列表中筛选多个热点内容并排序,最后对多个待推荐内容和多个热点内容进行融合,获得目标推荐列表,由此能够有快速准确地推荐出用户感兴趣的信息,避免为用户提供无用的内容,避免信息过多造成用户获取信息困难,提高了用户体验。其中,本发明提供的内容推荐方法可以应用于金融内容推荐场景中,向用户推荐金融相关的资讯文章或金融产品,例如股票、基金、理财等,此外还可以应用于其他推荐场景中,本发明对此不作具体限定。
图1示出了本发明实施例提供的一种内容推荐方法的流程图。本发明实施例以该内容推荐方法应用于内容推荐装置中来举例说明,该资讯推荐装置可以被配置于任一计算机设备中,计算机设备可以是独立的服务器或服务器集群。
参照图1所示,本发明实施例提供的内容推荐方法可以包括如下步骤:
101,获取当前用户的实时行为数据及实时行为数据对应的业务场景信息,并存储至数据库。
这里,当前用户是指当前在客户端的交互页面上产生行为操作的用户,实时行为例如可以是用户在当前时间前的10分钟内或半小时内的行为操作,其中,行为操作包括但不限于用户对于资讯文章的浏览、点击、评论、收藏、转发、分享以及商品下单等,这一系列的行为数据可以被实时地采集到用户行为日志中,并发送给服务器。其中,资讯文章可以是股票资讯、基金资讯等金融类资讯,也可以其他类别资讯。
其中,业务场景信息可以是业务场景的标识,业务场景是指当前用户产生行为操作的交互页面的页面场景,例如基金业务场景、股票业务场景、借贷业务场景等。
具体地,上述步骤101的实现过程可以包括:
通过Kafka分布式消息中间件获取实时数据流,通过第一计算引擎从实时数据流中解析出当前用户的实时行为数据以及业务场景信息,并将实时行为数据与业务场景信息对应存储到Hbase数据库中。
本实施例中,可以通过Flume等工具实时采集前端生成的日志文件形成数据流,将该数据流写入Kafka消息队列中,通过Storm计算引擎对Kafka消息队列中的数据流进行解析得到多条数据,其中,每条数据均包括用户ID、实时行为数据以及业务场景信息,将用户ID、实时行为数据与业务场景信息对应存储到Hbase数据库中。
102,根据业务场景信息配置的最优推荐算法以及当前用户的实时行为数据,从业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序。
这里,针对不同的业务场景可以预先设置不同的候选推荐列表,例如股票业务场景的候选推荐列表只包含股票类的资讯。可以将业务场景的标识与该业务场景对应的候选推荐列表进行关联。
其中,多个推荐算法可以包括基于内容的推荐算法、基于商品的协同过滤推荐算法、基于用户的协同过滤推荐算法以及基于邻域的协同过滤算法。
示例性地,通过当前用户的实时行为数据可以分析出用户浏览资讯文章的行为和文章特征的信息,即:在一定的时间内,如半个小时、一个小时等,将用户浏览资讯文章的类型、每种资讯文章类型浏览时长、浏览的是股票类型的资讯还是基金等类型的资讯,分别做统计和分析,并结合业务信息配置的最优推荐算法可以分析出需要给当前用户推送哪些类型的资讯文章,针对不同用户的行为和资讯偏好,分析出不同用户偏好的资讯文章。
例如,用户近一个小时浏览的多数是基金类型的资讯文章,则可认为本用户偏好基金方面的产品,可向用户推荐基金资讯,此外,针对每篇资讯文章还可以附带最优的基金产品,引导用户购买。
在一个示例中,当业务场景信息配置的最优推荐算法是基于内容的推荐算法时,上述步骤102的实现过程可以包括:
根据当前用户的实时行为数据,确定当前用户的偏好内容;
获取当前用户的偏好内容与业务场景信息对应的候选推荐列表中的每个候选内容之间的相似度;
将与偏好内容的相似度超过预设阈值的多个候选内容作为多个待推荐内容,并对多个待推荐内容按相似度由大到小进行降序排序。
其中,业务场景信息配置的最优推荐算法可以通过如下过程确定,包括:
对业务场景信息预先配置至少两个推荐算法及每个推荐算法的用户群;
统计每个推荐算法的用户群对每个推荐算法所推荐内容的反馈数据,以获取每个推荐算法的推荐效果;
根据每个推荐算法对应的推荐效果,确定业务场景信息配置的最优推荐算法。
在具体实施中,对业务场景A预先配置第一推荐算法和第一推荐算法,并且配置前50%的用户量访问的数据是第一推荐算法推荐的数据,剩下50%的用户量访问的是第二推荐算法推荐的数据。通过对用户号进行hash算法后,若用户号的哈希值落到前50%,则按第一推荐算法计算该用户的推荐内容,否则,按第二推荐算法计算该用户的推荐内容。统计预设时间段内的第一推荐算法所推荐的推荐内容的转化率指标结果是否大于第二推荐算法所推荐的推荐内容的转化率指标结果,若是,则确定第一推荐算法作为业务场景当前配置的最优推荐算法。可以理解的是,还可以新增其他一些推荐算法进行比对,以便实时做调整。
本实施例中,通过对各个业务场景预先配置多个推荐算法,并验证不同推荐算法在该业务场景下的推荐效果,确定该业务场景的最优推荐算法,使得在该业务场景下使用最优推荐算法对用户进行内容推荐,从而能够提高推荐的转化率。
103,从数据库中抽取业务场景信息对应的所有用户的实时行为数据,根据所有用户的实时行为数据,从候选推荐列表中筛选多个热点内容并排序。
本实施例中,可以针对同一个业务场景下的所有用户的实时行为数据进行分析,获取该业务场景对应的候选推荐列表中各个候选推荐内容的热度值,并对各个候选推荐内容按热度值由大到小进行降序排序。其中,热点内容可以是热点文章或者热点产品。
以候选推荐内容为资讯为例,可以对用户行为数据的类型分配不同的权重值,例如对收藏、点赞和浏览赋上由高到低的权重,并统计各个资讯的收藏总次数、点赞总次数和浏览总次数文章,加权计算各个资讯的热度值。
需要说明的是,本发明实施例对步骤102与步骤103的执行顺序不作具体限定,以同时执行步骤102与步骤103作为优选方案。
104,对排序后的多个待推荐内容和排序后的多个热点内容进行融合,获得目标推荐列表,并将目标推荐列表中的推荐内容推荐给当前用户。
具体地,对排序后的多个待推荐内容与排序后的多个热点内容取交集,并对交集中的资讯进行排序,得到目标推荐列表以推荐给当前用户。
本实施例中,通过执行步骤101至步骤104,能够不断对用户实时行为数据进行分析,结合业务场景信息对待推荐内容进行筛选以及对业务场景下的热点内容进行筛选,以及通过对待推荐内容和热点内容进行融合并排序,能够实时更新推荐给用户的推荐内容,并实现更加精准的内容推送。
在一个实施例中,方法还可以包括步骤:
判断业务场景信息是否预先配置有指定的推荐列表;
在判断的结果为是时,将指定的推荐列表中的推荐内容推荐给当前用户。
本实施例中,为了达到对推荐结果数据进行控制,可以针对某个业务场景配置指定推荐列表。通过判断业务场景是否预先配置有指定的推荐列表,若判断为是,则直接将指定的推荐类别中的推荐内容推荐给当前用户,否则,则执行步骤102或步骤103的过程。
在一个实施例中,方法还可以包括步骤:
根据预设的内容过滤列表,对推荐给当前用户的推荐内容进行过滤。
本实施例中,可以对推荐结果进行数据过滤,例如一篇资讯文章比较火爆,但由于特殊原因,业务后期不想下架,但又不想对用户进行推荐,可以通过在后台管理页面将该资讯文章的ID添加到内容过滤列表中。
在一个实施例中,方法还包括:
通过第二计算引擎利用ETL工具从数据库中批量抽取用户行为数据,并保存至Hive离线数据仓库中。
本实施例中,将用户行为数据保存至Hive数据库,通过Hive能够对用户行为数据进行快速查询。
在一个实施例中,方法还可以包括步骤:
通过第二计算引擎从Hive离线数据仓库中抽取当前用户在当前更新周期内的历史行为数据;
从历史行为数据提取当前用户的历史行为特征;
将当前用户的历史行为特征输入到预先训练的推荐模型中,通过推荐模型从候选产品推荐列表中筛选出多个产品信息;
将多个产品信息确定为当前更新周期内的推荐内容以推荐给当前用户;
其中,推荐模型预先通过多个样本用户的行为特征数据和各个样本用户针对推荐内容的操作结果进行训练得到。
其中,可以预先使用线性回归、随机森林、决策树、xgboost等方法建立初始推荐模型,并通过多个样本用户的行为特征数据和各个样本用户针对推荐内容的操作结果对初始推荐模型进行训练,得到推荐模型。
其中,第二计算引擎可以是Spark计算引擎,可以通过Spark计算引擎基于当前用户的历史行为数据进行周期性的分析,并通过预先训练的推荐模型从候选产品推荐列表中筛选出多个产品信息推荐给当前用户。这里,更新周期可以设置为每天更新一次。
本实施例中,通过Spark计算引擎对用户历史行为数据进行离线分析,并通过预先训练的推荐模型筛选产品信息周期性地推荐给当前用户,能够提高推荐的准确性。
在一个实施例中,方法还可以包括步骤:
在将推荐内容推荐给当前用户之前,将推荐内容与当前用户的用户标识关联保存至Redis服务器中。
本实施例中,通过将推荐给当前用户的推荐内容缓存在Redis服务器中,能够加快后续推荐内容的读取速度。
在一个实施例中,方法还包括:
通过java应用系统提供的统一接口以提供接口数据。
本实施例中,可以通过统一接口提供实现多业务场景下的接口数据,接口数据例如是:Storm计算引擎实时推荐的推荐数据,Spark计算引擎离线推荐的推荐数据;此外,还可以通过Spark计算引擎基于当前用户的历史行为数据进行周期性的分析,计算出历史时间段内的真实热销和热点商品,并通过将计算出的热点数据抛到Hive数据库中,由其他系统或者客户端通过统一接口各自读取数据进行调用。
在一个实施例中,方法还包括:
通过第三方触点系统,将各个业务场景下的用户针对推荐内容的操作结果推送到第三方基础服务平台以生成推荐报表。
示例性地,业务场景A中对用户推荐了推荐内容1,若用户点击推荐内容1或者产生购买等行为,通过触点系统把用户行为数据抛送到第三方基础服务平台,生成业务场景A对应的相关报表数据,以便检测各个业务场景的推荐情况。
本实施例中,通过将各个业务场景的推荐数据推送到第三方基础服务平台,使得第三方基础服务平台能够及时获得推荐效果,并及时做策略调整。
图2示出了本发明实施例提供的一种内容推荐装置的框图。本发明实施例提供的内容推荐装置用于执行上述实施例中的内容推荐方法,参照图2所示,该装置可以包括:
获取模块21,用于获取当前用户的实时行为数据及实时行为数据对应的业务场景信息;
存储模块22,用于将当前用户的实时行为数据及实时行为数据对应的业务场景信息存储至数据库;
第一筛选模块23,用于根据业务场景信息配置的最优推荐算法以及当前用户的实时行为数据,从业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序;
第二筛选模块24,用于从数据库中抽取业务场景信息对应的所有用户的实时行为数据,并根据所有用户的实时行为数据,从候选推荐列表中筛选多个热点内容并排序;
融合模块25,用于对排序后的多个待推荐内容和排序后的多个热点内容进行融合,获得目标推荐列表;
推荐模块26,用于将目标推荐列表中的推荐内容推荐给当前用户。
在一个实施例中,获取模块21具体用于:
通过Kafka分布式消息中间件获取当前用户的实时行为数据以及业务场景信息;
存储模块22具体用于:
通过第一计算引擎将实时行为数据与业务场景信息对应存储到Hbase数据库中。
在一个实施例中,装置还包括判断模块;
判断模块,用于判断业务场景信息是否预先配置有指定的推荐列表;
推荐模块,还用于在判断模块的判断结果为是时,将指定的推荐列表中的推荐内容推荐给当前用户。
在一个实施例中,装置还包括:
确定模块,用于确定业务场景信息配置的最优推荐算法;
确定模块具体用于:
对业务场景信息预先配置至少两个推荐算法及每个推荐算法的用户群;
统计每个推荐算法的用户群对每个推荐算法所推荐内容的反馈数据,以获取每个推荐算法的推荐效果;
根据每个推荐算法对应的推荐效果,确定业务场景信息配置的最优推荐算法。
在一个实施例中,存储模块具体还用于:
通过第二计算引擎利用ETL工具从数据库中批量抽取用户行为数据,并保存至Hive离线数据仓库中。
在一个实施例中,装置还包括第三筛选模块;
第三筛选模块,用于从Hive离线数据仓库中抽取当前用户在当前更新周期内的历史行为数据,从历史行为数据提取当前用户的历史行为特征,并将当前用户的历史行为特征输入到预先训练的推荐模型中,通过推荐模型从候选产品推荐列表中筛选出多个产品信息;
推荐模块,还用于将多个产品信息确定为当前更新周期内的推荐内容以推荐给当前用户;
其中,推荐模型预先通过多个样本用户的行为特征数据和各个样本用户针对推荐内容的操作结果进行训练得到。
在一个实施例中,存储模块具体还用于:
在将推荐内容推荐给当前用户之前,将推荐内容与当前用户的用户标识关联保存至Redis服务器中。
在一个实施例中,存储模块具体还用于:
在将推荐内容推荐给当前用户之前,将推荐内容与当前用户的用户标识关联保存至Redis服务器中。
在一个实施例中,装置还包括接口模块,接口模块用于:
通过java应用系统提供的统一接口以提供接口数据。
本实施例中,可以通过统一接口提供实现多业务场景下的接口数据,接口数据可以是第一计算引擎实时推荐的推荐数据,可以是第二计算引擎离线推荐的推荐数据。
在一个实施例中,装置还包括推送模块,推送模块用于:
通过第三方触点系统,将各个业务场景下的用户针对推荐内容的操作结果推送到第三方基础服务平台以生成推荐报表。
本实施例提供的内容推荐装置,与本发明实施例所提供的内容推荐方法属于同一发明构思,可执行本发明任意实施例所提供的内容推荐方法,具备执行内容推荐方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例提供的内容推荐方法,此处不再加以赘述。
图3示出了本发明实施例提供的一种计算机设备的内部结构图。该计算机设备可以是服务器,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种内容推荐方法。
在一个实施例中,提供了一种计算机设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器执行计算机程序时实现以下步骤:
获取当前用户的实时行为数据及实时行为数据对应的业务场景信息,并存储至数据库;
根据业务场景信息配置的最优推荐算法以及当前用户的实时行为数据,从业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序;
从数据库中抽取业务场景信息对应的所有用户的实时行为数据,根据所有用户的实时行为数据,从候选推荐列表中筛选多个热点内容并排序;
对排序后的多个待推荐内容和排序后的多个热点内容进行融合,获得目标推荐列表,并将目标推荐列表中的推荐内容推荐给当前用户。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现以下步骤:
获取当前用户的实时行为数据及实时行为数据对应的业务场景信息,并存储至数据库;
根据业务场景信息配置的最优推荐算法以及当前用户的实时行为数据,从业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序;
从数据库中抽取业务场景信息对应的所有用户的实时行为数据,根据所有用户的实时行为数据,从候选推荐列表中筛选多个热点内容并排序;
对排序后的所述多个待推荐内容和排序后的所述多个热点内容进行融合,获得目标推荐列表,并将所述目标推荐列表中的推荐内容推荐给所述当前用户。
本临域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、物理分库分表或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种内容推荐方法,其特征在于,所述方法包括:
获取当前用户的实时行为数据及所述实时行为数据对应的业务场景信息,并存储至数据库;
根据所述业务场景信息配置的最优推荐算法以及所述当前用户的实时行为数据,从所述业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序;
从所述数据库中抽取所述业务场景信息对应的所有用户的实时行为数据,根据所述所有用户的实时行为数据,从所述候选推荐列表中筛选多个热点内容并排序;
对排序后的所述多个待推荐内容和排序后的所述多个热点内容进行融合,获得目标推荐列表,并将所述目标推荐列表中的推荐内容推荐给所述当前用户。
2.根据权利要求1所述的方法,其特征在于,所述获取当前用户的实时行为数据及所述实时行为数据对应的业务场景信息,并存储至数据库,包括:
通过Kafka分布式消息中间件获取实时数据流;
通过第一计算引擎从所述实时数据流中解析出所述当前用户的实时行为数据以及业务场景信息,并将所述实时行为数据与所述业务场景信息对应存储到Hbase数据库中。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
判断所述业务场景信息是否预先配置有指定的推荐列表;
在所述判断的结果为是时,将所述指定的推荐列表中的推荐内容推荐给所述当前用户。
4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
确定所述业务场景信息配置的最优推荐算法,包括:
对所述业务场景信息预先配置至少两个推荐算法及每个所述推荐算法的用户群;
统计每个所述推荐算法的用户群对每个所述推荐算法所推荐内容的反馈数据,以获取每个所述推荐算法的推荐效果;
根据每个所述推荐算法对应的推荐效果,确定所述业务场景信息配置的最优推荐算法。
5.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
通过第二计算引擎利用ETL工具从所述数据库中批量抽取用户行为数据,并保存至Hive离线数据仓库中。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
通过所述第二计算引擎从所述Hive离线数据仓库中抽取所述当前用户在当前更新周期内的历史行为数据;
从所述历史行为数据提取所述当前用户的历史行为特征;
将所述当前用户的历史行为特征输入到预先训练的推荐模型中,通过所述推荐模型从候选产品推荐列表中筛选出多个产品信息;
将所述多个产品信息确定为所述当前更新周期内的推荐内容以推荐给所述当前用户;
其中,所述推荐模型预先通过多个样本用户的行为特征数据和各个所述样本用户针对推荐内容的操作结果进行训练得到。
7.根据权利要求1或6所述的方法,其特征在于,所述方法还包括:
在将所述推荐内容推荐给所述当前用户之前,将所述推荐内容与所述当前用户的用户标识关联保存至Redis服务器中。
8.一种内容推荐装置,其特征在于,所述装置包括:
获取模块,用于获取当前用户的实时行为数据及所述实时行为数据对应的业务场景信息;
存储模块,用于将当前用户的实时行为数据及所述实时行为数据对应的业务场景信息存储至数据库;
第一筛选模块,用于根据所述业务场景信息配置的最优推荐算法以及所述当前用户的实时行为数据,从所述业务场景信息对应的候选推荐列表中筛选多个待推荐内容并排序;
第二筛选模块,用于从所述数据库中抽取所述业务场景信息对应的所有用户的实时行为数据,并根据所述所有用户的实时行为数据,从所述候选推荐列表中筛选多个热点内容并排序;
融合模块,用于对排序后的所述多个待推荐内容和排序后的所述多个热点内容进行融合,获得目标推荐列表;
推荐模块,用于将所述目标推荐列表中的推荐内容推荐给所述当前用户。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1~7任意一项所述的内容推荐方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~7任意一项所述的内容推荐方法。
CN202010619530.XA 2020-06-30 2020-06-30 一种内容推荐方法、装置、计算机设备及存储介质 Pending CN111897861A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010619530.XA CN111897861A (zh) 2020-06-30 2020-06-30 一种内容推荐方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010619530.XA CN111897861A (zh) 2020-06-30 2020-06-30 一种内容推荐方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN111897861A true CN111897861A (zh) 2020-11-06

Family

ID=73191799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010619530.XA Pending CN111897861A (zh) 2020-06-30 2020-06-30 一种内容推荐方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111897861A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763502A (zh) * 2018-05-30 2018-11-06 腾讯科技(深圳)有限公司 信息推荐方法和系统
CN112364248A (zh) * 2020-11-20 2021-02-12 北京达佳互联信息技术有限公司 推荐信息列表的生成方法、装置、服务器及存储介质
CN112836162A (zh) * 2021-02-07 2021-05-25 上海哔哩哔哩科技有限公司 内容投放方法和系统
CN112948450A (zh) * 2021-02-25 2021-06-11 苏宁金融科技(南京)有限公司 用于实时推荐的Flink流式处理引擎方法、装置及计算机设备
CN113190758A (zh) * 2021-05-21 2021-07-30 聚好看科技股份有限公司 服务器及媒资推荐方法
CN113592530A (zh) * 2021-06-24 2021-11-02 青岛海尔科技有限公司 用于业务提供方的推荐方法、装置及电子设备
CN113807920A (zh) * 2021-09-17 2021-12-17 未鲲(上海)科技服务有限公司 基于人工智能的产品推荐方法、装置、设备及存储介质
CN114202380A (zh) * 2021-12-07 2022-03-18 中国建设银行股份有限公司 金融产品的推荐方法、装置和设备
CN114357294A (zh) * 2021-12-30 2022-04-15 北京达佳互联信息技术有限公司 内容推荐方法、装置、电子设备及存储介质
WO2022105129A1 (zh) * 2020-11-17 2022-05-27 平安科技(深圳)有限公司 内容数据推荐方法、装置、计算机设备及存储介质
WO2022150152A1 (en) * 2021-01-06 2022-07-14 Capital One Services, Llc Methods and systems for dynamically selecting alternative content based on real-time events during device sessions using cross-channel, time-bound deep reinforcement machine learning
CN115080833A (zh) * 2021-03-10 2022-09-20 阿里巴巴新加坡控股有限公司 一种信息流推荐方法、设备、系统及存储介质
WO2023284531A1 (zh) * 2021-07-13 2023-01-19 富途网络科技(深圳)有限公司 目标推荐方法、装置及存储介质
CN115866313A (zh) * 2021-09-24 2023-03-28 聚好看科技股份有限公司 显示设备、服务器及推荐窗口显示方法
CN116010588A (zh) * 2023-03-28 2023-04-25 北京创新乐知网络技术有限公司 实时与离线结合的文档推荐方法、装置、设备及介质
CN116700736A (zh) * 2022-10-11 2023-09-05 荣耀终端有限公司 一种应用推荐算法的确定方法及装置
CN116700736B (zh) * 2022-10-11 2024-05-31 荣耀终端有限公司 一种应用推荐算法的确定方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193831A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 信息推荐方法及装置
CN107203530A (zh) * 2016-03-16 2017-09-26 北大方正集团有限公司 信息推荐方法
CN107609198A (zh) * 2017-10-20 2018-01-19 咪咕互动娱乐有限公司 一种推荐方法、装置及计算机可读存储介质
CN110097412A (zh) * 2018-01-31 2019-08-06 阿里巴巴集团控股有限公司 物品推荐方法、装置、设备以及存储介质
CN110140135A (zh) * 2017-08-28 2019-08-16 北京嘀嘀无限科技发展有限公司 信息处理方法、信息处理系统和信息处理装置
CN110532479A (zh) * 2019-09-05 2019-12-03 北京思维造物信息科技股份有限公司 一种信息推荐方法、装置及设备
CN111199428A (zh) * 2020-01-03 2020-05-26 江苏苏宁物流有限公司 商品推荐方法、装置、存储介质及计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193831A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 信息推荐方法及装置
CN107203530A (zh) * 2016-03-16 2017-09-26 北大方正集团有限公司 信息推荐方法
CN110140135A (zh) * 2017-08-28 2019-08-16 北京嘀嘀无限科技发展有限公司 信息处理方法、信息处理系统和信息处理装置
CN107609198A (zh) * 2017-10-20 2018-01-19 咪咕互动娱乐有限公司 一种推荐方法、装置及计算机可读存储介质
CN110097412A (zh) * 2018-01-31 2019-08-06 阿里巴巴集团控股有限公司 物品推荐方法、装置、设备以及存储介质
CN110532479A (zh) * 2019-09-05 2019-12-03 北京思维造物信息科技股份有限公司 一种信息推荐方法、装置及设备
CN111199428A (zh) * 2020-01-03 2020-05-26 江苏苏宁物流有限公司 商品推荐方法、装置、存储介质及计算机设备

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763502A (zh) * 2018-05-30 2018-11-06 腾讯科技(深圳)有限公司 信息推荐方法和系统
WO2022105129A1 (zh) * 2020-11-17 2022-05-27 平安科技(深圳)有限公司 内容数据推荐方法、装置、计算机设备及存储介质
CN112364248A (zh) * 2020-11-20 2021-02-12 北京达佳互联信息技术有限公司 推荐信息列表的生成方法、装置、服务器及存储介质
WO2022150152A1 (en) * 2021-01-06 2022-07-14 Capital One Services, Llc Methods and systems for dynamically selecting alternative content based on real-time events during device sessions using cross-channel, time-bound deep reinforcement machine learning
CN112836162A (zh) * 2021-02-07 2021-05-25 上海哔哩哔哩科技有限公司 内容投放方法和系统
CN112836162B (zh) * 2021-02-07 2022-11-25 上海哔哩哔哩科技有限公司 内容投放方法和系统
CN112948450A (zh) * 2021-02-25 2021-06-11 苏宁金融科技(南京)有限公司 用于实时推荐的Flink流式处理引擎方法、装置及计算机设备
CN112948450B (zh) * 2021-02-25 2023-04-14 苏宁金融科技(南京)有限公司 用于实时推荐的Flink流式处理引擎方法、装置及计算机设备
CN115080833A (zh) * 2021-03-10 2022-09-20 阿里巴巴新加坡控股有限公司 一种信息流推荐方法、设备、系统及存储介质
CN115080833B (zh) * 2021-03-10 2024-02-27 阿里巴巴新加坡控股有限公司 一种信息流推荐方法、设备、系统及存储介质
CN113190758A (zh) * 2021-05-21 2021-07-30 聚好看科技股份有限公司 服务器及媒资推荐方法
CN113592530A (zh) * 2021-06-24 2021-11-02 青岛海尔科技有限公司 用于业务提供方的推荐方法、装置及电子设备
CN113592530B (zh) * 2021-06-24 2023-08-22 青岛海尔科技有限公司 用于业务提供方的推荐方法、装置及电子设备
WO2023284531A1 (zh) * 2021-07-13 2023-01-19 富途网络科技(深圳)有限公司 目标推荐方法、装置及存储介质
CN113807920A (zh) * 2021-09-17 2021-12-17 未鲲(上海)科技服务有限公司 基于人工智能的产品推荐方法、装置、设备及存储介质
CN115866313A (zh) * 2021-09-24 2023-03-28 聚好看科技股份有限公司 显示设备、服务器及推荐窗口显示方法
CN114202380A (zh) * 2021-12-07 2022-03-18 中国建设银行股份有限公司 金融产品的推荐方法、装置和设备
CN114357294A (zh) * 2021-12-30 2022-04-15 北京达佳互联信息技术有限公司 内容推荐方法、装置、电子设备及存储介质
CN114357294B (zh) * 2021-12-30 2023-02-17 北京达佳互联信息技术有限公司 内容推荐方法、装置、电子设备及存储介质
CN116700736A (zh) * 2022-10-11 2023-09-05 荣耀终端有限公司 一种应用推荐算法的确定方法及装置
CN116700736B (zh) * 2022-10-11 2024-05-31 荣耀终端有限公司 一种应用推荐算法的确定方法及装置
CN116010588A (zh) * 2023-03-28 2023-04-25 北京创新乐知网络技术有限公司 实时与离线结合的文档推荐方法、装置、设备及介质
CN116010588B (zh) * 2023-03-28 2023-08-18 北京创新乐知网络技术有限公司 实时与离线结合的文档推荐方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN111897861A (zh) 一种内容推荐方法、装置、计算机设备及存储介质
CN109241427B (zh) 信息推送方法、装置、计算机设备和存储介质
CN110543598B (zh) 信息推荐方法、装置及终端
CN109902708B (zh) 一种推荐模型训练方法及相关装置
CN110163647B (zh) 一种数据处理方法及装置
CN107797894B (zh) App用户行为分析方法和装置
CN110458324B (zh) 风险概率的计算方法、装置和计算机设备
CN111311136A (zh) 风控决策方法、计算机设备及存储介质
CN112632405B (zh) 一种推荐方法、装置、设备及存储介质
CN111143655A (zh) 一种新闻热度的计算方法
Boldt et al. Anomaly detection of event sequences using multiple temporal resolutions and Markov chains
CN114329207A (zh) 多业务信息排序系统、方法、存储介质及电子设备
CN114371946B (zh) 基于云计算和大数据的信息推送方法及信息推送服务器
Wang et al. Concept drift-aware temporal cloud service APIs recommendation for building composite cloud systems
CN113157898B (zh) 候选问题的推荐方法、装置、计算机设备及存储介质
CN110968780A (zh) 页面内容推荐方法、装置、计算机设备和存储介质
CN111178421B (zh) 检测用户状态的方法、装置、介质以及电子设备
CN112418893A (zh) 一种基于机器学习的供应链调整方法、装置及电子设备
CN111949852A (zh) 一种基于互联网大数据的宏观经济分析方法及系统
CN116402546A (zh) 店铺风险归因方法及其装置、设备、介质、产品
Hoti et al. Identifying Fake News written on Albanian language in social media using Naïve Bayes, SVM, Logistic Regression, Decision Tree and Random Forest algorithms
CN110751526A (zh) 广告推送方法、装置、计算机设备以及存储介质
Alghofaily et al. Meta-feature based data mining service selection and recommendation using machine learning models
CN112669128B (zh) 一种实时聚类推荐的方法、设备及介质
CN112749851B (zh) 基于人工智能的大数据需求预测方法及大数据云服务中心

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201106