CN112163163B - 多算法融合的信息推荐方法、装置和设备 - Google Patents
多算法融合的信息推荐方法、装置和设备 Download PDFInfo
- Publication number
- CN112163163B CN112163163B CN202011098502.4A CN202011098502A CN112163163B CN 112163163 B CN112163163 B CN 112163163B CN 202011098502 A CN202011098502 A CN 202011098502A CN 112163163 B CN112163163 B CN 112163163B
- Authority
- CN
- China
- Prior art keywords
- information
- list
- scoring
- standby list
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000004927 fusion Effects 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0263—Targeted advertisements based upon Internet or website rating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种多算法融合的信息推荐方法、装置和设备,通过在预设的数据库中加载数据参数,基于数据参数,利用als预测算法在预设的信息库中确定评分备用列表,利用余弦相似度算法在信息库中确定关于目标信息的相似备用列表,按照预设的规则分别为评分备用列表和相似备用列表分配权重,根据权重构建包含评分备用列表中第一信息和相似备用列表中第二信息的实时推荐列表,保存并在前端页面显示实时推荐列表,以供用户浏览参考,实现了多算法融合的信息推荐,提高了推荐效果的多样性,能够充分体现出用户的个性化需求,推荐准确率高。
Description
技术领域
本发明涉及信息推荐技术领域,具体涉及一种多算法融合的信息推荐方法、装置和设备。
背景技术
互联网时代也是信息爆炸的时代,内容多,而用户的时间少,给用户造成了选择难题。对海量信息进行筛选、过滤,将用户最关注最感兴趣的信息展现在用户面前,不仅能降低用户选择的难度,还能够大大增加这些内容的转化率,对各类应用系统都有非常巨大的价值。
搜索引擎和推荐系统的出现在一定程度上解决了信息筛选问题。搜索引擎需要用户主动提供关键词来对海量信息进行筛选,当用户无法准确描述自己的需求时,搜索引擎的筛选效果将大打折扣,而用户将自己的需求和意图转化成关键词的过程有时也会具有一定的困难,搜索引擎的搜索结果往往会照顾大多数用户的点击习惯,以热门结果为主,很难充分体现出个性化需求。而基于推荐算法开发的推荐系统主要分为两种,一种是基于内容的推荐算法,另一种是基于统计思想的算法。基于内容的推荐算法虽然实现简单方便,但基于内容的推荐算法缺少用户行为的分析,同时该算法往往受限于对文本、图像或音视频内容分析的技术深度,很难准确把握住用户真正关注的“内容点”。基于统计思想的算法计算速度快,但是对用户个性化偏好的描述能力弱。
因此,目前信息推荐过程中存在推荐准确率低的问题。
发明内容
有鉴于此,本发明的目的在于提供一种多算法融合的信息推荐方法、装置和设备,以克服目前信息推荐过程中存在推荐准确率低的问题。
为实现以上目的,本发明采用如下技术方案:
一种多算法融合的信息推荐方法,包括:
在预设的数据库中加载数据参数;其中,所述数据参数包括用户的用户参数,所述用户已评分的信息的信息参数,以及所述已评分的信息的评分参数;
基于所述数据参数,利用als预测算法在预设的信息库中确定评分备用列表,以及,基于所述数据参数,利用余弦相似度算法在所述信息库中确定关于目标信息的相似备用列表;
按照预设的规则分别为所述评分备用列表和所述相似备用列表分配权重;
根据所述权重,构建包含所述评分备用列表中第一信息和所述相似备用列表中第二信息的实时推荐列表;
保存并在前端页面显示所述实时推荐列表。
进一步地,以上所述的多算法融合的信息推荐方法,基于所述数据参数,利用als预测算法在预设的信息库中确定评分备用列表,包括:
根据所述评分参数,训练得到隐语义模型;
计算所述信息参数和所述评分参数的笛卡尔积;
基于所述隐语义模型和所述笛卡尔积,使用所述als预测算法预测所述用户对所述信息库中信息的预测评分;
将大于0的所述预测评分对应的信息组成评分推荐列表;
将所述评分推荐列表中选择符合第一预设标准的信息组成所述评分备用列表。
进一步地,以上所述的多算法融合的信息推荐方法,所述基于所述数据参数,利用余弦相似度算法在所述信息库中确定关于目标信息的相似备用列表,包括:
根据所述隐语义模型和所述信息库中信息的类型,确定所述信息库中信息的相似度矩阵;
所述相似度矩阵之间做笛卡尔乘积,通过所述余弦相似度算法,确定所述信息库中信息的相似度列表;
在所述相似度列表中,提取与所述目标信息的相似度符合第二预设标准的信息组成所述相似备用列表。
进一步地,以上所述的多算法融合的信息推荐方法,所述按照预设的规则分别为所述评分备用列表和所述相似备用列表分配权重,包括:
确定所述评分备用列表中已评分信息所占的第一比例,以及,确定所述相似备用列表中所述已评分信息所占的第二比例;
判断所述第一比例是否大于所述第二比例;
若所述第一比例大于所述第二比例,则为所述评分备用列表分配高权重;
若所述第一比例小于所述第二比例,则为所述相似备用列表分配高权重。
进一步地,以上所述的多算法融合的信息推荐方法,所述方法还包括:
若获取到来自用户端的所述数据参数,将所述数据参数存储在所述数据库中。
进一步地,以上所述的多算法融合的信息推荐方法,所述若获取到来自用户端的所述数据参数,将所述数据参数存储在所述数据库中,包括:
基于flume采集所述数据参数,并制定kafka的接收地址;
所述kafka接收所述flume发送的所述数据参数,并实时保存到所述数据库中。
本发明还提供了一种多算法融合的信息推荐装置,包括:加载模块、确定模块、配权模块、列表构建模块和输出模块;
所述加载模块,用于在预设的数据库中加载数据参数;其中,所述数据参数包括用户的用户参数,所述用户已评分的信息的信息参数,以及所述已评分的信息的评分参数;
所述确定模块,用于基于所述数据参数,利用als预测算法在预设的信息库中确定评分备用列表,以及,基于所述数据参数,利用余弦相似度算法在所述信息库中确定关于目标信息的相似备用列表;
所述配权模块,用于按照预设的规则分别为所述评分备用列表和所述相似备用列表分配权重;
所述列表构建模块,用于根据所述权重,构建包含所述评分备用列表中第一信息和所述相似备用列表中第二信息的实时推荐列表;
所述输出模块,用于保存并在前端页面显示所述实时推荐列表。
进一步地,以上所述的多算法融合的信息推荐装置,所述确定模块,具体用于根据所述评分参数,训练得到隐语义模型,计算所述信息参数和所述评分参数的笛卡尔积,基于所述隐语义模型和所述笛卡尔积,使用所述als预测算法预测所述用户对所述信息库中信息的预测评分,将大于0的所述预测评分对应的信息组成评分推荐列表,将所述评分推荐列表中选择符合第一预设标准的信息组成所述评分备用列表。
进一步地,以上所述的多算法融合的信息推荐装置,所述确定模块,具体还用于根据所述隐语义模型和所述信息库中信息的类型,确定所述信息库中信息的相似度矩阵,所述相似度矩阵之间做笛卡尔乘积,通过所述余弦相似度算法,确定所述信息库中信息的相似度列表,在所述相似度列表中,提取与所述目标信息的相似度符合第二预设标准的信息组成所述相似备用列表。
本发明还提供了一种多算法融合的信息推荐设备,包括处理器和存储器,所述处理器与所述存储器相连:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储所述程序,所述程序至少用于执行以上任一项所述的多算法融合的信息推荐方法。
本发明的多算法融合的信息推荐方法、装置和设备,通过在预设的数据库中加载数据参数,基于数据参数,利用als预测算法在预设的信息库中确定评分备用列表,利用余弦相似度算法在信息库中确定关于目标信息的相似备用列表,按照预设的规则分别为评分备用列表和相似备用列表分配权重,根据权重构建包含评分备用列表中第一信息和相似备用列表中第二信息的实时推荐列表,保存并在前端页面显示实时推荐列表,以供用户浏览参考,实现了多算法融合的信息推荐,提高了推荐效果的多样性,能够充分体现出用户的个性化需求,推荐准确率高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明多算法融合的信息推荐方法一种实施例提供的流程图;
图2是本发明多算法融合的信息推荐装置一种实施例提供的结构示意图;
图3是本发明多算法融合的信息推荐设备一种实施例提供的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
图1是本发明多算法融合的信息推荐方法一种实施例提供的流程图。请参阅图1,本实施例可以包括以下步骤:
S101、在预设的数据库中加载数据参数。
本实施例的多算法融合的信息推荐方法可以应用在书籍推荐、商品推荐、电影推荐和和电视剧推荐等多种场景下,本实施例不做限定。
可以预先在预设的数据库中加载数据参数。其中,数据参数可以包括用户的用户参数,用户已评分的信息的信息参数,以及已评分的信息的评分参数。
在一种具体地实施方式中,本实施例的多算法融合的信息推荐方法应用在书籍推荐场景中,即信息为书籍信息。那么,数据参数可以包括用户的用户参数,用户已评分的书籍的信息参数,以及已评分的书籍的评分参数。
在另外一种具体地实施方式中,本实施例的多算法融合的信息推荐方法应用在电影推荐场景中,即信息为电影信息。那么,数据参数可以包括用户的用户参数,用户已评分的电影的信息参数,以及已评分的电影的评分参数。
一般的,用户参数为用户的id,信息参数为该项信息的id,例如书籍的名称、电影的名称、电视剧的名称等,评分参数为用户针对该项信息的评分。
S102、基于数据参数,利用als预测算法在预设的信息库中确定评分备用列表。
本实施例可以根据以上步骤获取的数据参数,利用Spark Mllib算法库中的交替最小二乘预测算法(Alternating Least Squares,ALS)在预设的信息库中确定评分备用列表,具体可以通过如下子步骤实现:
子步骤一:根据评分参数,训练得到隐语义模型;
子步骤二:计算信息参数和评分参数的笛卡尔积;
子步骤三:基于隐语义模型和笛卡尔积,使用als预测算法预测用户对信息库中信息的预测评分;
子步骤四:将大于0的预测评分对应的信息组成评分推荐列表;
子步骤五:将评分推荐列表中选择符合第一预设标准的信息组成评分备用列表。
具体地,可以根据数据库中信息以及信息对应的评分参数训练隐语义模型。其中,隐含语义模型采用基于用户行为统计的自动聚类,解决了如何给信息分类,如何确定用户感兴趣的类以及感兴趣程度,对于一个给定的类,如何选择属于这个类的信息推荐给用户,以及如何确定这些信息在一个类中的权重等问题。隐含语义模型是现有技术中非常成熟的模型,其训练过程本领域的技术人员参照现有技术即可获取,本实施例不做赘述。
还可以计算信息参数和评分参数的笛卡尔积,基于预先训练好的隐含语义模型和笛卡尔积,通过als预测算法即可预测用户对信息库中信息的预测评分。过滤出预测评分矩阵中大于0的数据预测评分对应的信息,将预测评分矩阵中大于0的数据预测评分对应的信息组合,得到评分推荐列表。
将评分推荐列表中选择符合第一预设标准的信息组成评分备用列表。具体地,可以选取预测评分较高的若干个信息组成评分备用列表,也可以选择预测评分大于预设预测评分的若干个信息组成评分备用列表,本实施例不做赘述。
在一种具体地实施方式中,本实施例的多算法融合的信息推荐方法应用在电影推荐场景中,可以基于从数据库中获取的电影以及电影对应的评分训练隐语义模型。
用户的id和电影的id之间做笛卡尔积,则可以得到一个针对电影的空评分矩阵。
基于预先训练好的隐含语义模型,通过als预测算法即可预测用户对信息库中电影的预测评分,即可得到预测评分矩阵。
将预测评分矩阵中大于0的数据预测评分对应的电影组合,得到评分推荐列表。可以选取预测评分较高的若干个电影组成评分备用列表,也可以选择预测评分大于预设预测评分的若干个电影组成评分备用列表,本实施例不做赘述。
需要说明的是,本实施例中只是举例进行说明,并不会限定本发明,当存在多个用户,以及,数据库中存储有海量的信息时,依旧按照本实施例提供的技术方案生成针对每个用户的评分备用列表即可,本实例不做限定。
S103、基于数据参数,利用余弦相似度算法在信息库中确定关于目标信息的相似备用列表。
本实施例可以根据以上步骤获取的数据参数,利用Spark Mllib算法库中的余弦相似度算法信息库中确定关于目标信息的相似备用列表,具体可以通过如下子步骤实现:
子步骤一:根据隐语义模型和信息库中信息的类型,确定信息库中信息的相似度矩阵;
子步骤二:相似度矩阵之间做笛卡尔乘积,通过余弦相似度算法,确定信息库中信息的相似度列表;
子步骤三:在相似度列表中,提取与目标信息的相似度符合第二预设标准的信息组成相似备用列表。
具体地,本实施例可以基于以上实施例确定的隐语义模型,以及,信息库中信息的类型,生成信息库中信息的相似度矩阵。使用余弦相似度对相似度矩阵做笛卡尔积,得到由信息库中两两信息之间的相似度组成的相似度列表。
可以获取用户上一个点击的目标信息,或者用户正在浏览的目标信息,在相似度列表中,提取与目标信息的相似度符合第二预设标准的信息,将与目标信息的相似度符合第二预设标准的信息组合,得到相似备用列表。可以从相似度列表中提取相似度最高的若干个信息组成相似备用列表,还可以从相似度列表中提取相似度大于预设标准相似度值的若干个信息组成相似备用列表,本实施例不做限定。
在一种具体地实施方式中,本实施例的多算法融合的信息推荐方法应用在电影推荐场景中,可以基于以上实施例确定的隐语义模型,以及,信息库中电影的类型,生成电影的相似度矩阵。使用余弦相似度对相似度矩阵做笛卡尔积,得到电影的相似度列表。
获取用户正在观看的目标影片,或者用户上一个观看的目标影片,在相似度列表中,提取与目标影片的相似度符合第二预设标准的电影。其中,可以从相似度列表中提取相似度最高的20个电影组成相似备用列表,还可以从相似度列表中提取相似度大于预设标准相似度值的若干个电影组成相似备用列表,例如提取相似度大于0.7的若干个电影组成相似备用列表,本实施例不做限定。
需要说明的是,本实施例并没有限定S102和S103的执行顺序,可以先执行S102,再执行S103,还可以先执行S103,再执行S102,还可以在条件允许的情况下同时执行S102和S103,本实施例不做限定。
S104、按照预设的规则分别为评分备用列表和相似备用列表分配权重。
为评分备用列表和相似备用列表分配权重,权重的分配需要遵循预设的规则。一般的,可以计算评分备用列表中已评分信息所占的第一比例,以及,确定相似备用列表中已评分信息所占的第二比例,判断第一比例是否大于第二比例,若第一比例大于第二比例,则为评分备用列表分配高权重;若第一比例小于第二比例,则为相似备用列表分配高权重。
S105、根据权重,构建包含评分备用列表中第一信息和相似备用列表中第二信息的实时推荐列表。
根据以上步骤分配的权重,构建实时推荐列表。实时推荐列表包含评分备用列表中第一信息和相似备用列表中第二信息。
需要说明的是,若为评分备用列表分配高权重,那么评分备用列表中的第一信息则可以在实时推荐列表中占有更高的比重,其排列次序可以更加靠前。
若相似备用列表分配高权重,那么相似备用列表中的第二信息则可以在实时推荐列表中占有更高的比重,其排列次序可以更加靠前。
S106、保存并在前端页面显示实时推荐列表。
保存实时推荐列表,并将实时推荐列表推送到前端页面显示,以使该实时推荐列表对应的用户能够浏览到该实时推荐列表。
本实施例的多算法融合的信息推荐方法,通过在预设的数据库中加载数据参数,基于数据参数,利用als预测算法在预设的信息库中确定评分备用列表,利用余弦相似度算法在信息库中确定关于目标信息的相似备用列表,按照预设的规则分别为评分备用列表和相似备用列表分配权重,根据权重构建包含评分备用列表中第一信息和相似备用列表中第二信息的实时推荐列表,保存并在前端页面显示实时推荐列表,以供用户浏览参考,实现了多算法融合的信息推荐,提高了推荐效果的多样性,能够充分体现出用户的个性化需求,推荐准确率高。
进一步地,本实施例的多算法融合的信息推荐方法,在以上实施例的基础上,还可以包括以下步骤:
若获取到来自用户端的数据参数,将数据参数存储在数据库中。
具体地,用户在观看电影、电视剧或者阅读书籍后,可以对其观看的电影、电视剧或者阅读的书籍进行打分。本实施例可以将打分的用户的用户参数、被打分的电影、电视剧或者书籍的信息参数、以及评分参数上传到数据库中。
当有新的数据参数上传到数据库中,使得数据库被更新后,可以更新隐语义模型,以及评分推荐列表、评分备用列表、相似度列表、相似备用列表和实时推荐列表。
在一种具体地实施方式中,基于flume采集数据参数,并制定kafka的接收地址,kafka接收flume发送的数据参数,并实时保存到数据库中。
本发明还提供了一种多算法融合的信息推荐装置,用于实现上述方法实施例。图2是本发明多算法融合的信息推荐装置一种实施例提供的结构示意图。如图2所示,本实施例的多算法融合的信息推荐装置可以包括:加载模块11、确定模块12、配权模块13、列表构建模块14和输出模块15;
加载模块11,用于在预设的数据库中加载数据参数;其中,数据参数包括用户的用户参数,用户已评分的信息的信息参数,以及已评分的信息的评分参数;
确定模块12,用于基于数据参数,利用als预测算法在预设的信息库中确定评分备用列表,以及,基于数据参数,利用余弦相似度算法在信息库中确定关于目标信息的相似备用列表;
配权模块13,用于按照预设的规则分别为评分备用列表和相似备用列表分配权重;
列表构建模块14,用于根据权重,构建包含评分备用列表中第一信息和相似备用列表中第二信息的实时推荐列表;
输出模块15,用于保存并在前端页面显示实时推荐列表。
本实施例的多算法融合的信息推荐装置实现了多算法融合的信息推荐,提高了推荐效果的多样性,能够充分体现出用户的个性化需求,推荐准确率高。
进一步地,本实施例的多算法融合的信息推荐装置,确定模块12,具体用于根据评分参数,训练得到隐语义模型,计算信息参数和评分参数的笛卡尔积,基于隐语义模型和笛卡尔积,使用als预测算法预测用户对信息库中信息的预测评分,将大于0的预测评分对应的信息组成评分推荐列表,将评分推荐列表中选择符合第一预设标准的信息组成评分备用列表。
进一步地,本实施例的多算法融合的信息推荐装置,确定模块12,具体还用于根据隐语义模型和信息库中信息的类型,确定信息库中信息的相似度矩阵,相似度矩阵之间做笛卡尔乘积,通过余弦相似度算法,确定信息库中信息的相似度列表,在相似度列表中,提取与目标信息的相似度符合第二预设标准的信息组成相似备用列表。
进一步地,本实施例的多算法融合的信息推荐装置,配权模块13,具体用于确定评分备用列表中已评分信息所占的第一比例,以及,确定相似备用列表中已评分信息所占的第二比例,判断第一比例是否大于第二比例,若第一比例大于第二比例,则为评分备用列表分配高权重,若第一比例小于第二比例,则为相似备用列表分配高权重。
进一步地,本实施例的多算法融合的信息推荐装置,还包括获取模块;
获取模块,用于若获取到来自用户端的数据参数,将数据参数存储在数据库中。
进一步地,本实施例的多算法融合的信息推荐装置,获取模块,具体用于基于flume采集数据参数,并制定kafka的接收地址,kafka接收flume发送的数据参数,并实时保存到数据库中。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明还提供了一种多算法融合的信息推荐设备,用于实现上述方法实施例。图3是本发明多算法融合的信息推荐设备一种实施例提供的结构示意图。如图3所示,本实施例的多算法融合的信息推荐设备包括处理器21和存储器22,处理器21与存储器22相连。其中,处理器21用于调用并执行存储器22中存储的程序;存储器22用于存储程序,程序至少用于执行以上实施例中的多算法融合的信息推荐方法。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (5)
1.一种多算法融合的信息推荐方法,其特征在于,包括:
在预设的数据库中加载数据参数;其中,所述数据参数包括用户的用户参数,所述用户已评分的信息的信息参数,以及所述已评分的信息的评分参数;
基于所述数据参数,利用als预测算法在预设的信息库中确定评分备用列表,以及,基于所述数据参数,利用余弦相似度算法在所述信息库中确定关于目标信息的相似备用列表;
按照预设的规则分别为所述评分备用列表和所述相似备用列表分配权重;
根据所述权重,构建包含所述评分备用列表中第一信息和所述相似备用列表中第二信息的实时推荐列表;
保存并在前端页面显示所述实时推荐列表;
其中,所述基于所述数据参数,利用als预测算法在预设的信息库中确定评分备用列表,包括:
根据所述评分参数,训练得到隐语义模型;
计算所述信息参数和所述评分参数的笛卡尔积;
基于所述隐语义模型和所述笛卡尔积,使用所述als预测算法预测所述用户对所述信息库中信息的预测评分;
将大于0的所述预测评分对应的信息组成评分推荐列表;
将所述评分推荐列表中选择符合第一预设标准的信息组成所述评分备用列表;
以及,所述基于所述数据参数,利用余弦相似度算法在所述信息库中确定关于目标信息的相似备用列表,包括:
根据所述隐语义模型和所述信息库中信息的类型,确定所述信息库中信息的相似度矩阵;
所述相似度矩阵之间做笛卡尔乘积,通过所述余弦相似度算法,确定所述信息库中信息的相似度列表;
在所述相似度列表中,提取与所述目标信息的相似度符合第二预设标准的信息组成所述相似备用列表;
以及,所述按照预设的规则分别为所述评分备用列表和所述相似备用列表分配权重,包括:
确定所述评分备用列表中已评分信息所占的第一比例,以及,确定所述相似备用列表中所述已评分信息所占的第二比例;
判断所述第一比例是否大于所述第二比例;
若所述第一比例大于所述第二比例,则为所述评分备用列表分配高权重;
若所述第一比例小于所述第二比例,则为所述相似备用列表分配高权重。
2.根据权利要求1所述的多算法融合的信息推荐方法,其特征在于,所述方法还包括:
若获取到来自用户端的所述数据参数,将所述数据参数存储在所述数据库中。
3.根据权利要求2所述的多算法融合的信息推荐方法,其特征在于,所述若获取到来自用户端的所述数据参数,将所述数据参数存储在所述数据库中,包括:
基于flume采集所述数据参数,并制定kafka的接收地址;
所述kafka接收所述flume发送的所述数据参数,并实时保存到所述数据库中。
4.一种多算法融合的信息推荐装置,其特征在于,包括:加载模块、确定模块、配权模块、列表构建模块和输出模块;
所述加载模块,用于在预设的数据库中加载数据参数;其中,所述数据参数包括用户的用户参数,所述用户已评分的信息的信息参数,以及所述已评分的信息的评分参数;
所述确定模块,用于基于所述数据参数,利用als预测算法在预设的信息库中确定评分备用列表,以及,基于所述数据参数,利用余弦相似度算法在所述信息库中确定关于目标信息的相似备用列表;
所述配权模块,用于按照预设的规则分别为所述评分备用列表和所述相似备用列表分配权重;
所述列表构建模块,用于根据所述权重,构建包含所述评分备用列表中第一信息和所述相似备用列表中第二信息的实时推荐列表;
所述输出模块,用于保存并在前端页面显示所述实时推荐列表;
其中,所述确定模块,具体用于根据所述评分参数,训练得到隐语义模型,计算所述信息参数和所述评分参数的笛卡尔积,基于所述隐语义模型和所述笛卡尔积,使用所述als预测算法预测所述用户对所述信息库中信息的预测评分,将大于0的所述预测评分对应的信息组成评分推荐列表,将所述评分推荐列表中选择符合第一预设标准的信息组成所述评分备用列表;
以及,所述确定模块,具体还用于根据所述隐语义模型和所述信息库中信息的类型,确定所述信息库中信息的相似度矩阵,所述相似度矩阵之间做笛卡尔乘积,通过所述余弦相似度算法,确定所述信息库中信息的相似度列表,在所述相似度列表中,提取与所述目标信息的相似度符合第二预设标准的信息组成所述相似备用列表;
以及,所述配权模块,具体用于确定所述评分备用列表中已评分信息所占的第一比例,以及,确定所述相似备用列表中所述已评分信息所占的第二比例;
判断所述第一比例是否大于所述第二比例;
若所述第一比例大于所述第二比例,则为所述评分备用列表分配高权重;
若所述第一比例小于所述第二比例,则为所述相似备用列表分配高权重。
5.一种多算法融合的信息推荐设备,其特征在于,包括处理器和存储器,所述处理器与所述存储器相连:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储所述程序,所述程序至少用于执行权利要求1-3任一项所述的多算法融合的信息推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011098502.4A CN112163163B (zh) | 2020-10-14 | 2020-10-14 | 多算法融合的信息推荐方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011098502.4A CN112163163B (zh) | 2020-10-14 | 2020-10-14 | 多算法融合的信息推荐方法、装置和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112163163A CN112163163A (zh) | 2021-01-01 |
CN112163163B true CN112163163B (zh) | 2024-03-19 |
Family
ID=73866925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011098502.4A Active CN112163163B (zh) | 2020-10-14 | 2020-10-14 | 多算法融合的信息推荐方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112163163B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113112333A (zh) * | 2021-04-27 | 2021-07-13 | 湖南云畅网络科技有限公司 | 一种数据流处理方法及系统 |
CN114359502A (zh) * | 2021-11-30 | 2022-04-15 | 圣都家居装饰有限公司绍兴分公司 | 一种家装方案推荐方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160049401A (ko) * | 2014-10-27 | 2016-05-09 | 서울대학교산학협력단 | 사용자 맞춤형 항목 추천 방법 및 장치 |
CN106682114A (zh) * | 2016-12-07 | 2017-05-17 | 广东工业大学 | 一种融合用户信任关系和评论信息的个性化推荐方法 |
CN107314778A (zh) * | 2017-08-04 | 2017-11-03 | 广东工业大学 | 一种相对姿态的标定方法、装置及系统 |
CN107341204A (zh) * | 2017-06-22 | 2017-11-10 | 电子科技大学 | 一种融合物品标签信息的协同过滤推荐方法及系统 |
CN109410008A (zh) * | 2018-10-31 | 2019-03-01 | 中国石油大学(华东) | 一种融合频繁项集的油田业务服务推荐方法 |
CN109740064A (zh) * | 2019-01-18 | 2019-05-10 | 北京化工大学 | 一种融合矩阵分解和挖掘用户项目信息的cf推荐方法 |
CN110866180A (zh) * | 2019-10-12 | 2020-03-06 | 平安国际智慧城市科技股份有限公司 | 资源推荐方法、服务器及存储介质 |
CN111159549A (zh) * | 2019-12-27 | 2020-05-15 | 飞狐信息技术(天津)有限公司 | 一种信息推荐方法及系统 |
-
2020
- 2020-10-14 CN CN202011098502.4A patent/CN112163163B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160049401A (ko) * | 2014-10-27 | 2016-05-09 | 서울대학교산학협력단 | 사용자 맞춤형 항목 추천 방법 및 장치 |
CN106682114A (zh) * | 2016-12-07 | 2017-05-17 | 广东工业大学 | 一种融合用户信任关系和评论信息的个性化推荐方法 |
CN107341204A (zh) * | 2017-06-22 | 2017-11-10 | 电子科技大学 | 一种融合物品标签信息的协同过滤推荐方法及系统 |
CN107314778A (zh) * | 2017-08-04 | 2017-11-03 | 广东工业大学 | 一种相对姿态的标定方法、装置及系统 |
CN109410008A (zh) * | 2018-10-31 | 2019-03-01 | 中国石油大学(华东) | 一种融合频繁项集的油田业务服务推荐方法 |
CN109740064A (zh) * | 2019-01-18 | 2019-05-10 | 北京化工大学 | 一种融合矩阵分解和挖掘用户项目信息的cf推荐方法 |
CN110866180A (zh) * | 2019-10-12 | 2020-03-06 | 平安国际智慧城市科技股份有限公司 | 资源推荐方法、服务器及存储介质 |
CN111159549A (zh) * | 2019-12-27 | 2020-05-15 | 飞狐信息技术(天津)有限公司 | 一种信息推荐方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于增量学习的混合推荐算法;任磊;;计算机应用(05);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112163163A (zh) | 2021-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7104244B2 (ja) | ユーザタグ生成方法並びにその、装置、コンピュータプログラム及びコンピュータ機器 | |
WO2021042826A1 (zh) | 一种视频播放完整度预测方法及装置 | |
CN107832437B (zh) | 音/视频推送方法、装置、设备及存储介质 | |
CN109511015B (zh) | 多媒体资源推荐方法、装置、存储介质及设备 | |
CN110717093B (zh) | 一种基于Spark的电影推荐系统及方法 | |
CN109889891B (zh) | 获取目标媒体文件的方法、装置及存储介质 | |
CN106326391A (zh) | 多媒体资源推荐方法及装置 | |
JP2009099145A (ja) | 対象領域におけるディジタル情報開示方法 | |
CN112052387A (zh) | 一种内容推荐方法、装置和计算机可读存储介质 | |
CN112163163B (zh) | 多算法融合的信息推荐方法、装置和设备 | |
CN111191133B (zh) | 业务搜索处理方法、装置及设备 | |
CN112749330B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN113111222B (zh) | 短视频模板的生成方法、装置、服务器以及存储介质 | |
CN112131456A (zh) | 一种信息推送方法、装置、设备及存储介质 | |
CN111062527B (zh) | 一种视频集流量预测方法及装置 | |
CN112464100A (zh) | 信息推荐模型训练方法、信息推荐方法、装置及设备 | |
CN102016782B (zh) | 操作支援装置以及操作支援方法 | |
JP2009500764A (ja) | 情報価値を反映した情報検索方法及びその装置 | |
CN114461853B (zh) | 视频场景分类模型的训练样本生成方法、装置及设备 | |
CN111581435A (zh) | 一种视频封面图像生成方法、装置、电子设备及存储介质 | |
CN106156351A (zh) | 多媒体资源推荐信息生成方法及装置 | |
CN112182414A (zh) | 文章推荐方法、装置及电子设备 | |
CN113220974A (zh) | 点击率预测模型训练、搜索召回方法、装置、设备及介质 | |
CN114329167A (zh) | 超参数学习、智能推荐、关键词和多媒体推荐方法及装置 | |
CN110569447B (zh) | 一种网络资源的推荐方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |