CN109670104A - 基于机器学习的信息推送方法、设备、装置及存储介质 - Google Patents
基于机器学习的信息推送方法、设备、装置及存储介质 Download PDFInfo
- Publication number
- CN109670104A CN109670104A CN201811342474.9A CN201811342474A CN109670104A CN 109670104 A CN109670104 A CN 109670104A CN 201811342474 A CN201811342474 A CN 201811342474A CN 109670104 A CN109670104 A CN 109670104A
- Authority
- CN
- China
- Prior art keywords
- user
- behavioral data
- interest value
- data
- online
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明公开了一种基于机器学习的信息推送方法,该方法包括:获取用于建立用户行为分析模型的数据集,其中,所述数据集由多个离线用户行为数据组成;以所述数据集为训练样本,建立用户行为分析模型;接收终端实时采集的在线用户行为数据,并基于所述用户行为分析模型,对所述在线用户行为数据进行行为分析,得到所述在线用户行为数据的兴趣值;根据所述在线用户行为数据的兴趣值,进行内容关联与推荐。本发明还公开了一种设备、装置及存储介质。本发明通过人工智能技术中的机器学习建立用户行为分析模型,用以对用户实时在线的行为数据进行分析,进而提高了用户实时行为分析的准确率,并为用户提供高质量的个性化内容推荐。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种基于机器学习的信息推送方法、设备、装置及存储介质。
背景技术
随着科学技术的进步及计算机信息业务量的快速增长,用户使用网络应用也日益增加,进而产生大量的信息数据。目前,利用大数据对用户行为进行分析,提取用户兴趣,不仅可以为用户提供个性化定制与推送等高质量服务,还可以优化改善应用平台,进而提高应用平台的生存周期和营收,降低应用平台的运营成本。但海量网络用户,产生的实时行为数据巨大,导致对用户行为的分析,其业务针对性不够,没有定位的目标群体,因而如何实现高效分析、提高分析精准率仍然是当今重要的研究课题。
发明内容
本发明的主要目的在于提供一种基于机器学习的信息推送方法、设备、装置及存储介质,旨在解决如何提高用户实时行为分析的准确率,并实现个性化内容推荐的技术问题。
为实现上述目的,本发明提供的一种基于机器学习的信息推送方法,所述基于机器学习的信息推送方法包括以下步骤:
获取用于建立用户行为分析模型的数据集,其中,所述数据集由多个离线用户行为数据组成;
以所述数据集为训练样本,建立用户行为分析模型;
接收终端实时采集的在线用户行为数据,并基于所述用户行为分析模型,对所述在线用户行为数据进行行为分析,得到所述在线用户行为数据的兴趣值;
根据所述在线用户行为数据的兴趣值,进行内容关联与推荐。
优选地,所述以所述数据集为训练样本,建立用户行为分析模型包括:
对离线用户行为数据进行特征提取,得到若干特征参数,其中,所述特征参数至少包括用户属性、访问次数、访问时段、停留板块、停留时间、处理耗时中的任一项;
基于预设的维度分类规则,对特征参数进行维度划分,其中,所述维度至少包括用户、产品、报价、活跃、黏性中的任一项;
根据各维度的特征参数,计算兴趣值,并将所述兴趣值作为分析结果;
以离线用户行为数据为输入量、以分析结果为输出量,建立用户行为分析模型。
优选地,所述根据各维度的特征参数,计算兴趣值作为分析结果包括:
对各维度的特征参数进行类别概率分布处理和相似度处理,得到概率分布矩阵和相似度矩阵;
对所述概率分布矩阵和所述相似度矩阵进行线性加权组合,得到离线用户的兴趣值,并将所述兴趣值作为离线用户行为数据的分析结果,其中,所述兴趣值对应表示离线用户高关注度的预设板块内容。
优选地,在所述对所述在线用户行为数据进行行为分析,得到所述在线用户行为数据的兴趣值之后,所述基于机器学习的信息推送方法还包括:
根据所述在线用户行为数据及分析所述在线用户行为数据得到的兴趣值,对所述用户行为分析模型进行更新。
优选地,所述根据所述在线用户行为数据的兴趣值,进行内容关联与推荐包括:
根据所述在线用户行为数据的兴趣值,得到与所述在线用户行为数据兴趣相似的K个离线用户关注度高所对应的预设板块内容;
以所述在线用户行为数据的兴趣值为中心,根据所述中心与K个离线用户兴趣值之间的差值大小,确定K个预设板块内容的关联匹配度;
按照所述关联匹配度由高至低的顺序输出预设板块内容至所述终端,以供所述终端进行显示。
优选地,所述基于机器学习的信息推送方法还包括:
在预设时间段内,根据接收的在线用户行为数据及其输出的预设板块内容,生成推荐报表,以供后台人员进行查看和/或更新板块内容。
此外,为实现上述目的,本发明还提供一种个性化推荐设备,所述个性化推荐设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的个性化推荐程序,所述个性化推荐程序被所述处理器执行时实现如上述中任一项所述的基于机器学习的信息推送方法的步骤。
此外,为实现上述目的,本发明还提供一种个性化推荐装置,所述个性化推荐装置包括:
获取模块,用于获取用于建立用户行为分析模型的数据集,其中,所述数据集由多个离线用户行为数据组成;
建模模块,用于以所述数据集为训练样本,建立用户行为分析模型;
分析模块,用于接收终端实时采集的在线用户行为数据,并基于所述用户行为分析模型,对所述在线用户行为数据进行行为分析,得到所述在线用户行为数据的兴趣值;
推荐模块,用于根据所述在线用户行为数据的兴趣值,进行内容关联与推荐。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有个性化推荐程序,所述个性化推荐程序被处理器执行时实现如上述中任一项所述的基于机器学习的信息推送方法的步骤。
本发明首先获取由多个离线用户行为数据组成的数据集,然后以该数据集为训练样本,建立用户行为分析模型,进而当接收到终端实时采集的在线用户行为数据时,即可通过建立的用户行为分析模型,对在线用户行为数据进行行为分析,得到该在线用户行为数据的兴趣值,最后根据兴趣值为在线用户行为数据对应的用户进行内容关联与推荐。本发明以多个用户的离线行为数据为基础通过人工智能技术中的机器学习构建用户行为分析模型,进而对用户实时在线的行为数据进行分析,提高了用户实时行为分析的准确率,进而为用户提供高质量的个性化内容推荐,从而提高了用户的使用体验。
附图说明
图1为本发明实施例方案涉及的个性化推荐设备运行环境的结构示意图;
图2为本发明基于机器学习的信息推送方法一实施例的流程示意图;
图3为图2步骤S20一实施例的细化流程示意图;
图4为图3步骤S23一实施例的细化流程示意图;
图5为本发明个性化推荐装置一实施例的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的个性化推荐设备运行环境的结构示意图。
如图1所示,该个性化推荐设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的个性化推荐设备的硬件结构并不构成对个性化推荐设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。其中,操作系统是管理和控制个性化推荐设备和软件资源的程序,支持个性化推荐程序以及其它软件和/或程序的运行。
在图1所示的个性化推荐设备的硬件结构中,网络接口1004主要用于接入网络;用户接口1003主要用于侦测确认指令和编辑指令等。而处理器1001可以用于调用存储器1005中存储的个性化推荐程序,并执行以下操作:
获取用于建立用户行为分析模型的数据集,其中,所述数据集由多个离线用户行为数据组成;
以所述数据集为训练样本,建立用户行为分析模型;
接收终端实时采集的在线用户行为数据,并基于所述用户行为分析模型,对所述在线用户行为数据进行行为分析,得到所述在线用户行为数据的兴趣值;
根据所述在线用户行为数据的兴趣值,进行内容关联与推荐。
进一步地,所述个性化推荐设备通过处理器1001调用存储器1005中存储的个性化推荐程序,以执行下述操作:
对离线用户行为数据进行特征提取,得到若干特征参数,其中,所述特征参数至少包括用户属性、访问次数、访问时段、停留板块、停留时间、处理耗时中的任一项;
基于预设的维度分类规则,对特征参数进行维度划分,其中,所述维度至少包括用户、产品、报价、活跃、黏性中的任一项;
根据各维度的特征参数,计算兴趣值,并将所述兴趣值作为分析结果;
以离线用户行为数据为输入量、以分析结果为输出量,建立用户行为分析模型。
进一步地,所述个性化推荐设备通过处理器1001调用存储器1005中存储的个性化推荐程序,以执行下述操作:
对各维度的特征参数进行类别概率分布处理和相似度处理,得到概率分布矩阵和相似度矩阵;
对所述概率分布矩阵和所述相似度矩阵进行线性加权组合,得到离线用户的兴趣值,并将所述兴趣值作为离线用户行为数据的分析结果,其中,所述兴趣值对应表示离线用户高关注度的预设板块内容。
进一步地,所述个性化推荐设备通过处理器1001调用存储器1005中存储的个性化推荐程序,以执行下述操作:
根据所述在线用户行为数据及分析所述在线用户行为数据得到的兴趣值,对所述用户行为分析模型进行更新。
进一步地,所述个性化推荐设备通过处理器1001调用存储器1005中存储的个性化推荐程序,以执行下述操作:
根据所述在线用户行为数据的兴趣值,得到与所述在线用户行为数据兴趣相似的K个离线用户关注度高所对应的预设板块内容;
以所述在线用户行为数据的兴趣值为中心,根据所述中心与K个离线用户兴趣值之间的差值大小,确定K个预设板块内容的关联匹配度;
按照所述关联匹配度由高至低的顺序输出预设板块内容至所述终端,以供所述终端进行显示。
进一步地,所述个性化推荐设备通过处理器1001调用存储器1005中存储的个性化推荐程序,以执行下述操作:
在预设时间段内,根据接收的在线用户行为数据及输出的预设板块内容,生成推荐报表,以供后台人员进行查看和/或更新板块内容。
基于上述个性化推荐设备硬件结构,提出本发明基于机器学习的信息推送方法的各个实施例。
参照图2,图2为本发明基于机器学习的信息推送方法一实施例的流程示意图。
本实施例中,基于机器学习的信息推送方法包括:
步骤S10,获取用于建立用户行为分析模型的数据集,其中,数据集由多个离线用户行为数据组成;
本实施例中,模型是运用数理逻辑方法和数学语言构建的数学模型,是让计算机从已有的数据中学习出新的知识,也就是根据数据集处理得到的训练数据进行系统的学习,比如如何分析用户喜好什么,如何区分用户感兴趣的内容。用户行为由最简单的五个元素构成:时间、地点、人物、交互、交互的内容。用户行为数据就是用于记录用户登录并使用平台的行为操作,如浏览、停留、点击、输入搜索词等。在线用户行为数据,顾名思义就是实时记录用户行为操作的数据,而离线用户行为数据是历史备份在线用户行为数据的数据,不需要实时性。进一步地,在线用户行为数据为当前用户登录并使用平台产生的使用数据,而离线用户行为数据为用户登录并使用平台产生的历史使用数据。数据集就是所有离线用户行为数据的集合,其数据的数量成百上千,具体根据实际情况而定。
步骤S20,以数据集为训练样本,建立用户行为分析模型;
本实施例中,以数据集为训练样本,也就是将数据集中所有离线用户行为数据进行处理,得到训练数据作为训练样本,供机器进行系统学习。机器学习是指不依赖人类来总结经验、输入逻辑,开发员只需要把大量数据,即将离线用户行为数据输入给计算机,然后由计算机自己总结出其中的数据分析逻辑,归纳出相应的逻辑代码,从而得到一个用户行为分析模型。而训练的过程就是利用已有的数据确定模型参数的过程。
本实施例中,机器学习的步骤具体为:1、预处理:把数据处理成一些有意义的特征,这一步的目的主要是为了降维。2、建模:这部分主要是建立模型(通常是曲线的拟合),为分类器搭建一个可能的边界。3、分类器处理:根据模型把数据分类,并进行数据结论的预测。具体地,对数据集中所有离线用户行为数据进行预处理的技术与现有的用户画像分析技术一致,如抽取用户的行为特征,然后打标签进行特征标识,通过特征勾勒出用户在计算机语言中的立体“图像”。进一步地,通过大数据学习如何分析用户行为,得出用户感兴趣的地方在哪,比如对哪类型的产品关注度高、哪类报价有兴趣等,具体根据实际情况进行设置。具体建模过程在下文实施例中详述。
步骤S30,接收终端实时采集的在线用户行为数据,并基于用户行为分析模型,对在线用户行为数据进行行为分析,得到在线用户行为数据的兴趣值;
本实施例中,终端监测用户的行为操作,生成在线用户行为数据并实时上传至平台,即传给本个性化推荐设备接收。当接收到在线用户行为数据时,将在线用户行为数据导入用户行为分析模型中,机器自动分析以得到分析结果,即用户的兴趣值或偏好。进一步地,通过机器学习分析用户行为数据,不仅能够提高分析效率,还能够避免人为主观判断,提高分析准确率。
步骤S40,根据在线用户行为数据的兴趣值,进行内容关联与推荐。
本实施例中,采用用户行为分析模型据分析在线用户行为数据,得到在线用户行为数据的兴趣值,根据分析的兴趣值,查找与之匹配度高的产品或报价等内容,并推荐给用户。需要补充说明的是,关联与推荐的内容为平台开发人员预先开发设计好的业务内容,如功能项、产品项、报价单、咨询信息等,具体根据实际情况进行设置。不同业务内容又可细分多类别,比如报价单包括多个范围选择,产品项包括投资理财、保险业务、衣物饰品等,每一级分类可逐级进行细分。投资理财又可细分为基金、股票、贵金属等。具体地,比如用户当前浏览投资理财频道,终端实时采集数据并上传平台进行分析,平台分析得到用户偏好高风险的股票理财方式,进而将有关股票理财的内容推荐给用户进行查看,进而提高了用户的使用体验。
本发明首先获取由多个离线用户行为数据组成的数据集,然后以该数据集为训练样本,建立用户行为分析模型,进而当接收到终端实时采集的在线用户行为数据时,即可通过建立的用户行为分析模型,对在线用户行为数据进行行为分析,得到该在线用户行为数据的兴趣值,最后根据兴趣值为在线用户行为数据对应的用户进行内容关联与推荐。本发明以多个用户的离线行为数据为基础通过人工智能技术中的机器学习构建用户行为分析模型,进而对用户实时在线的行为数据进行分析,提高了用户实时行为分析的准确率,进而为用户提供高质量的个性化内容推荐,从而提高了用户的使用体验。
参照图3,图3为图2步骤S20一实施例的细化流程示意图。
基于上述实施例,本实施例中,步骤S20,以数据集为训练样本,建立用户行为分析模型,包括:
步骤S21,对离线用户行为数据进行特征提取,得到若干特征参数,其中,特征参数至少包括用户属性、访问次数、访问时段、停留板块、停留时间、处理耗时中的任一项;
本实施例中,离线用户行为数据是用户使用平台所产生行为操作的历史使用数据,比如平台上发布有多个产品,如投资理财、保险业务等,投资理财又细分为基金、股票、贵金属等,将平台展示的基金、股票、贵金属等产品内容各自划分为一个板块。用户通过终端打开浏览界面对平台进行访问,相应地记录访问次数和访问时段。用户是否使用账户登录平台,若是则为会员或注册用户,若否则为普通访客。若为会员或注册用户,相应地,可得到用户的注册时间、昵称、性别、联系方式等基本信息。用户浏览某一板块内容,相应地记录用户停留的板块信息和停留时间。用户购买产品相应的处理耗时等内容。
本实施例中,特征提取主要是将原始数据转换为一组具有明显物理意义(Gabor、几何特征[角点、不变量]、纹理[LBP HOG])或者统计意义的特征,也就是从原始的离线用户行为数据中提取出有效信息,或把数据处理成一些有意义的特征。有效信息或有意义的特征,即为特征参数。值得说明的是,对离线用户行为数据进行特征提取的过程,当然还包括以下内容删除,如删去一些原始数据源的语法规则所必须的格式代码,或删去一些不需要的内容信息。
步骤S22,基于预设的维度分类规则,对特征参数进行维度划分,其中,维度至少包括用户、产品、报价、活跃、黏性中的任一项;
本实施例中,数据类型标识可用于对数据类型进行标记。维度分类规则就是预先设置多个不同维度类型,包括产品、用户、报价、活跃、黏性等。其中,用户可划分为注册或访客用户,还可以划分为重要客户、较重要客户、一般客户,还可以划分为活跃用户、流失用户、新老客户等,具体根据实际情况进行设置。产品是平台业务推出的如理财产品、视频等产品内容。活跃是考察用户访问的参与度,包括停留时间、访问次数等。而黏性是用户在一段时间内持续访问和使用平台的情况,这里包括访问频率、访问间隔时间、包括停留时间、访问次数等。对特征参数进行维度划分,也就是对提取的特征参数按维度进行归类和标记。如特征参数为用户属性的划分为用户维度;特征参数为停留板块的,将对应的板块划分为产品维度,将对应的停留时间划分为活跃维度和/或黏性维度。上述提取特征参数并进行维度划分举例说明,并不代表对本实施例技术方案的限定。
步骤S23,根据各维度的特征参数,计算兴趣值,并将兴趣值作为分析结果;
本实施例中,不同用户的操作使用对应不同离线用户行为数据,而每一个离线用户行为数据可提取出若干特征参数。以一个离线用户行为数据为例,提取出若干特征参数,每个特征参数对应一个或多个维度,根据特征参数及其对应的维度信息,计算兴趣值,也就是分析出用户的偏好,具体计算兴趣值的过程在下文实施例中详述。
步骤S24,以离线用户行为数据为输入量、以分析结果为输出量,建立用户行为分析模型。
本实施例中,以数据集中所有离线用户行为数据为输入量、以各离线用户行为数据对应的分析结果为输出量,将输入量和输出量输入至初始计算机学习模型,基于该输入量和输出量对初始机器学习模型进行分析训练,计算机自动对这两种数据结构形式和数据内容等方面进行对比和分析,总结出转换规律,归纳出转换逻辑,得出用户行为分析模型(包括分析逻辑)。例如输入离线用户行为数据是A,兴趣值是B,将A和B输入至初始机器学习模型,由计算机自己根据输入和输出去确定分析逻辑X,以使得A->X->B。
当然对于训练得到的用户行为分析模型和分析逻辑规律,工作人员可以进行手动调整或修改;还可根据实际使用情况对初始模型进行修正,以对模型进行完善。
参照图4,图4为图3步骤S23一实施例的细化流程示意图。
基于上述实施例,本实施例中,步骤S23,根据各维度的特征参数,计算兴趣值作为分析结果,包括:
步骤S231,对各维度的特征参数进行类别概率分布处理和相似度处理,得到概率分布矩阵和相似度矩阵;
步骤S232,对概率分布矩阵和相似度矩阵进行线性加权组合,得到离线用户的兴趣值,并将兴趣值作为离线用户行为数据的分析结果,其中,兴趣值对应表示离线用户高关注度的预设板块内容。
本实施例中,概率分布是指随机变量X小于任何已知实数x的事件可以表示成的函数。用以表述随机变量取值的概率规律。描述不同类型的随机变量有不同的概率分布形式。具体地,不同维度下的特征参数的分布个数是随机变量,此处类别概率分布处理是采用分布函数求取得到概率分布矩阵。相似度,即综合评定两个事物之间相近程度的一种度量。两个事物越接近,它们的相似度也就越大,而两个事物越疏远,它们的相似度也就越小。特征参数的类型不同,相似性的含义也不同。此处相似度处理是采用相似系数函数、相关系数函数或距离函数等求取得到相似度矩阵。
本实施例中,时间对用户兴趣有着深入而广泛的影响,用户兴趣随时间和访问次数变化而变化,停留时间越久越感兴趣,停留时间越短越不感兴趣;同样的访问次数对用户兴趣有影响,次数越多越感兴趣,次数越少越不感兴趣。不同用户产生不同兴趣,而同一个用户在不同时期也产生不同兴趣。同时平台设有多个页面,每个页面有多个板块内容,因而根据处理得到的概率分布矩阵和相似度矩阵进行线性加权组合,组合得到用户的兴趣值,并将计算得到的兴趣值作为离线用户行为数据的分析结果。线性加权组合就是将两个矩阵中的阵列元素加权,重新组合得到的数值即为兴趣值,映射到特征向量空间表示用户的行为,从而反应该用户关注的内容具体是哪个板块内容,从而根据多个离线用户信息,可分析得到从用户角度得知用户比较关心哪种类型的产品,对哪个价格(价格范围)比较兴趣;而从产品角度得知哪种类型的产品被用户关注最多,哪个价格用户被用户接受的最多,其他维度依次类推。
进一步可选地,在本发明另一实施例中,在步骤S30之后,基于机器学习的信息推送方法还包括:根据在线用户行为数据及分析在线用户行为数据得到的兴趣值,对用户行为分析模型进行更新。
本实施例中,将在线用户行为数据加入数据集以生成更新后的数据集,同时由于在线用户行为数据已经分析出兴趣值作为分析结果,因而可以理解的是,为扩展和丰富数据集中的数据内容,方便计算机优化模型,利用不断新增的在线用户行为数据及其分析得到的兴趣值,对用户行为分析模型不断进行调整和优化,有助于分析用户实时在线的行为数据时,提供了典型以及精确度高的分析依据,提高在线用户行为的分析准确度。
进一步可选地,基于上述实施例,本实施例中,步骤S40,根据在线用户行为数据的兴趣值,进行内容关联与推荐,包括:
1、根据在线用户行为数据的兴趣值,得到与在线用户行为数据兴趣相似的K个离线用户关注度高所对应的预设板块内容;
2、以在线用户行为数据的兴趣值为中心,确定K个预设板块内容的关联匹配度;
3、按照关联匹配度由高至低的顺序输出预设板块内容至终端,以供终端进行显示。
本实施例中,为提高推荐准确率,根据分析得到用户实时在线的兴趣值,同时需要了解的模型中用户的兴趣值是已知的,且兴趣值对应表示用户高关注度的板块内容,因而根据在线用户兴趣值即可得到相似的K个离线用户的兴趣值,进而得到和在线用户兴趣最相似的K个用户喜欢的内容。以在线用户行为数据的兴趣值为中心,中心与K个离线用户兴趣值之间的差值大小,确定K个预设板块内容的关联匹配度,也就是差值大小决定关联匹配度大小,进而根据匹配度高低按顺序将板块内容输出,即将top-N个匹配度高的板块内容作为向在线用户进行个性化推荐的内容。终端在接收到平台发送的推荐信息时,即可加载显示供在线用户查看浏览。
进一步可选地,在本发明另一实施例中,基于机器学习的信息推送方法还包括:在预设时间段内,根据接收的在线用户行为数据及输出的预设板块内容,生成推荐报表,以供后台人员进行查看和/或更新板块内容。
本实施例中,由于对接收的在线用户行为数据进行行为分析,并根据分析结果输出预设板块内容,因此在线用户行为数据及其输出的预设板块内容一一对应。须知,预设时间段内可设为近三天、一周内9点至18点、一个月等,具体根据实际需要进行设置,因而在预设时间段内,平台会接收到多个终端上传的数据。生成推荐报表可以是将预设时间段内的在线用户行为数据及其输出的预设板块内容一一对应,并以表格形式罗列供后台人员查看;也可以是对预设时间段内的在线用户行为数据及其输出的预设板块内容进行统计和分析,得到哪类产品输出的次数多,哪类产品没被推荐过等。后台人员通过查看推荐报表,即可清楚了解平台的运营情况,得到用户偏好,进而制定更好的服务内容,优化平台。
参照图5,图5为本发明个性化推荐装置一实施例的结构示意图。
本实施例中,个性化推荐装置包括:
获取模块10,用于获取用于建立用户行为分析模型的数据集,其中,所述数据集由多个离线用户行为数据组成;
建模模块20,用于以所述数据集为训练样本,建立用户行为分析模型;
分析模块30,用于接收终端实时采集的在线用户行为数据,并基于所述用户行为分析模型,对所述在线用户行为数据进行行为分析,得到所述在线用户行为数据的兴趣值;
推荐模块40,用于根据所述在线用户行为数据的兴趣值,进行内容关联与推荐。
本发明个性化推荐装置具体实施例与上述基于机器学习的信息推送方法的各实施例基本相同,在此不再详细赘述。
在本发明另一实施例中,个性化推荐系统包括如上所述的个性化推荐设备,还包括若干终端。
终端用于,当接收到个性化推荐设备下发的离线用户行为数据的获取指令时,调用本地数据库中存储的与个性化推荐设备关联的历史用户行为数据、将历史用户行为数据作为离线用户行为数据并上传至个性化推荐设备。
本实施例中,个性化推荐设备为服务器,提供一个服务平台,并与终端建立通信连接,以实现信息交互。用户每次登录使用平台,相应采集的在线数据备份至本地数据库,累积记录为历史行为数据。当接收到个性化推荐设备下发的离线用户行为数据的获取指令时,将历史行为数据上传至个性化推荐设备。
进一步可选地,终端还用于,当检测到登录预设平台界面时,实时采集用户在预设平台界面上的行为操作,以生成在线用户行为数据;将生成的在线用户行为数据上传至个性化推荐设备,以供个性化推荐设备进行相关处理。
本实施例中,用户通过终端登录服务平台预设的平台界面,即访问服务器,此时终端实时采集用户在界面上的行为操作,包括登录、点击、浏览、下拉等,以生成在线用户行为数据,进而实时上传至服务平台进行处理。
此外,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有个性化推荐程序,所述个性化推荐程序被处理器执行时实现如上述中任一项所述的基于机器学习的信息推送方法的步骤。
本发明计算机可读存储介质具体实施例与上述基于机器学习的信息推送方法的各实施例基本相同,在此不再详细赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本发明的保护之内。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (9)
1.一种基于机器学习的信息推送方法,其特征在于,所述基于机器学习的信息推送方法包括以下步骤:
获取用于建立用户行为分析模型的数据集,其中,所述数据集由多个离线用户行为数据组成;
以所述数据集为训练样本,建立用户行为分析模型;
接收终端实时采集的在线用户行为数据,并基于所述用户行为分析模型,对所述在线用户行为数据进行行为分析,得到所述在线用户行为数据的兴趣值;
根据所述在线用户行为数据的兴趣值,进行内容关联与推荐。
2.如权利要求1所述的基于机器学习的信息推送方法,其特征在于,所述以所述数据集为训练样本,建立用户行为分析模型包括:
对离线用户行为数据进行特征提取,得到若干特征参数,其中,所述特征参数至少包括用户属性、访问次数、访问时段、停留板块、停留时间、处理耗时中的任一项;
基于预设的维度分类规则,对特征参数进行维度划分,其中,所述维度至少包括用户、产品、报价、活跃、黏性中的任一项;
根据各维度的特征参数,计算兴趣值,并将所述兴趣值作为分析结果;
以离线用户行为数据为输入量、以分析结果为输出量,建立用户行为分析模型。
3.如权利要求2所述的基于机器学习的信息推送方法,其特征在于,所述根据各维度的特征参数,计算兴趣值作为分析结果包括:
对各维度的特征参数进行类别概率分布处理和相似度处理,得到概率分布矩阵和相似度矩阵;
对所述概率分布矩阵和所述相似度矩阵进行线性加权组合,得到离线用户的兴趣值,并将所述兴趣值作为离线用户行为数据的分析结果,其中,所述兴趣值对应表示离线用户高关注度的预设板块内容。
4.如权利要求1至3中任一项所述的基于机器学习的信息推送方法,其特征在于,在所述对所述在线用户行为数据进行行为分析,得到所述在线用户行为数据的兴趣值之后,所述基于机器学习的信息推送方法还包括:
根据所述在线用户行为数据及分析所述在线用户行为数据得到的兴趣值,对所述用户行为分析模型进行更新。
5.如权利要求1所述的基于机器学习的信息推送方法,其特征在于,所述根据所述在线用户行为数据的兴趣值,进行内容关联与推荐包括:
根据所述在线用户行为数据的兴趣值,得到与所述在线用户行为数据兴趣相似的K个离线用户关注度高所对应的预设板块内容;
以所述在线用户行为数据的兴趣值为中心,根据所述中心与K个离线用户兴趣值之间的差值大小,确定K个预设板块内容的关联匹配度;
按照所述关联匹配度由高至低的顺序输出预设板块内容至所述终端,以供所述终端进行显示。
6.如权利要求5所述的基于机器学习的信息推送方法,其特征在于,所述基于机器学习的信息推送方法还包括:
在预设时间段内,根据接收的在线用户行为数据及输出的预设板块内容,生成推荐报表,以供后台人员进行查看和/或更新板块内容。
7.一种个性化推荐设备,其特征在于,所述个性化推荐设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的个性化推荐程序,所述个性化推荐程序被所述处理器执行时实现如权利要求1至6中任一项所述的基于机器学习的信息推送方法的步骤。
8.一种个性化推荐装置,其特征在于,所述个性化推荐装置包括:
获取模块,用于获取用于建立用户行为分析模型的数据集,其中,所述数据集由多个离线用户行为数据组成;
建模模块,用于以所述数据集为训练样本,建立用户行为分析模型;
分析模块,用于接收终端实时采集的在线用户行为数据,并基于所述用户行为分析模型,对所述在线用户行为数据进行行为分析,得到所述在线用户行为数据的兴趣值;
推荐模块,用于根据所述在线用户行为数据的兴趣值,进行内容关联与推荐。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有个性化推荐程序,所述个性化推荐程序被处理器执行时实现如权利要求1至6中任一项所述的基于机器学习的信息推送方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811342474.9A CN109670104A (zh) | 2018-11-12 | 2018-11-12 | 基于机器学习的信息推送方法、设备、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811342474.9A CN109670104A (zh) | 2018-11-12 | 2018-11-12 | 基于机器学习的信息推送方法、设备、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109670104A true CN109670104A (zh) | 2019-04-23 |
Family
ID=66142775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811342474.9A Pending CN109670104A (zh) | 2018-11-12 | 2018-11-12 | 基于机器学习的信息推送方法、设备、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109670104A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110287418A (zh) * | 2019-06-26 | 2019-09-27 | 拉扎斯网络科技(上海)有限公司 | 数据处理及倾向特征值识别方法、装置、电子设备 |
CN110362728A (zh) * | 2019-06-19 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 基于大数据分析的信息推送方法、装置、设备及存储介质 |
CN110516151A (zh) * | 2019-08-27 | 2019-11-29 | 咪咕文化科技有限公司 | 有效行为检测和个性化推荐方法 |
CN110555170A (zh) * | 2019-09-12 | 2019-12-10 | 山东爱城市网信息技术有限公司 | 一种优化用户体验的系统及方法 |
CN110570279A (zh) * | 2019-09-04 | 2019-12-13 | 深圳创新奇智科技有限公司 | 一种基于用户实时行为的策略化推荐方法及装置 |
CN110837587A (zh) * | 2019-09-30 | 2020-02-25 | 北京健康之家科技有限公司 | 一种基于机器学习的数据匹配方法和系统 |
CN110995944A (zh) * | 2019-12-19 | 2020-04-10 | 易谷网络科技股份有限公司 | 一种客服坐席推荐方法、装置、客服设备和存储介质 |
CN111209417A (zh) * | 2019-12-24 | 2020-05-29 | 北京达佳互联信息技术有限公司 | 一种信息展示方法、服务器、终端及存储介质 |
CN111695030A (zh) * | 2020-04-26 | 2020-09-22 | 北京奇艺世纪科技有限公司 | 参数获取方法、装置、电子设备及计算机可读存储介质 |
CN111914182A (zh) * | 2020-09-11 | 2020-11-10 | 福州淘股吧互联网股份有限公司 | 一种个性化内容推荐系统及其方法 |
CN112102095A (zh) * | 2020-09-17 | 2020-12-18 | 中国建设银行股份有限公司 | 一种基金产品推荐方法、装置及设备 |
CN116578755A (zh) * | 2022-03-30 | 2023-08-11 | 江苏控智电子科技有限公司 | 基于人工智能和大数据的信息分析系统及方法 |
-
2018
- 2018-11-12 CN CN201811342474.9A patent/CN109670104A/zh active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020253364A1 (zh) * | 2019-06-19 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 基于大数据分析的信息推送方法、装置、设备及存储介质 |
CN110362728A (zh) * | 2019-06-19 | 2019-10-22 | 深圳壹账通智能科技有限公司 | 基于大数据分析的信息推送方法、装置、设备及存储介质 |
CN110287418A (zh) * | 2019-06-26 | 2019-09-27 | 拉扎斯网络科技(上海)有限公司 | 数据处理及倾向特征值识别方法、装置、电子设备 |
CN110287418B (zh) * | 2019-06-26 | 2021-10-19 | 拉扎斯网络科技(上海)有限公司 | 数据处理及倾向特征值识别方法、装置、电子设备 |
CN110516151A (zh) * | 2019-08-27 | 2019-11-29 | 咪咕文化科技有限公司 | 有效行为检测和个性化推荐方法 |
CN110516151B (zh) * | 2019-08-27 | 2022-03-22 | 咪咕文化科技有限公司 | 有效行为检测和个性化推荐方法 |
CN110570279A (zh) * | 2019-09-04 | 2019-12-13 | 深圳创新奇智科技有限公司 | 一种基于用户实时行为的策略化推荐方法及装置 |
CN110555170A (zh) * | 2019-09-12 | 2019-12-10 | 山东爱城市网信息技术有限公司 | 一种优化用户体验的系统及方法 |
CN110837587A (zh) * | 2019-09-30 | 2020-02-25 | 北京健康之家科技有限公司 | 一种基于机器学习的数据匹配方法和系统 |
CN110995944A (zh) * | 2019-12-19 | 2020-04-10 | 易谷网络科技股份有限公司 | 一种客服坐席推荐方法、装置、客服设备和存储介质 |
CN111209417A (zh) * | 2019-12-24 | 2020-05-29 | 北京达佳互联信息技术有限公司 | 一种信息展示方法、服务器、终端及存储介质 |
CN111695030A (zh) * | 2020-04-26 | 2020-09-22 | 北京奇艺世纪科技有限公司 | 参数获取方法、装置、电子设备及计算机可读存储介质 |
CN111914182A (zh) * | 2020-09-11 | 2020-11-10 | 福州淘股吧互联网股份有限公司 | 一种个性化内容推荐系统及其方法 |
CN112102095A (zh) * | 2020-09-17 | 2020-12-18 | 中国建设银行股份有限公司 | 一种基金产品推荐方法、装置及设备 |
CN116578755A (zh) * | 2022-03-30 | 2023-08-11 | 江苏控智电子科技有限公司 | 基于人工智能和大数据的信息分析系统及方法 |
CN116578755B (zh) * | 2022-03-30 | 2024-01-09 | 张家口微智网络科技有限公司 | 基于人工智能和大数据的信息分析系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670104A (zh) | 基于机器学习的信息推送方法、设备、装置及存储介质 | |
CN111008278B (zh) | 内容推荐方法及装置 | |
CN108021929A (zh) | 基于大数据的移动端电商用户画像建立与分析方法及系统 | |
CN109582875B (zh) | 一种在线医疗教育资源的个性化推荐方法及系统 | |
CN111160992A (zh) | 一种基于用户画像体系的营销系统 | |
CN110245213A (zh) | 调查问卷生成方法、装置、设备和存储介质 | |
CN109783632A (zh) | 客服信息推送方法、装置、计算机设备及存储介质 | |
CN107273436A (zh) | 一种推荐模型的训练方法和训练装置 | |
CN108681970A (zh) | 基于大数据的理财产品推送方法、系统及计算机存储介质 | |
Li et al. | Dynamic mapping of design elements and affective responses: a machine learning based method for affective design | |
CN110163647A (zh) | 一种数据处理方法及装置 | |
CN110837551A (zh) | 一种在线数据采集的方法及系统 | |
CN109544197A (zh) | 一种用户流失预测方法和装置 | |
CN109272408A (zh) | 车贷款金融产品智能推荐方法、装置、设备及介质 | |
CN106663258A (zh) | 通过混合的基于统计和用户测量方法测量多屏幕互联网用户概况、交易行为和用户群体结构 | |
US20100223099A1 (en) | Method and apparatus for a multi-dimensional offer optimization (mdoo) | |
US20220172260A1 (en) | Method, apparatus, storage medium, and device for generating user profile | |
CN108549973B (zh) | 识别模型构建及评估的方法、装置、存储介质及终端 | |
US8046278B2 (en) | Process of selecting portfolio managers based on automated artificial intelligence techniques | |
CN114371946B (zh) | 基于云计算和大数据的信息推送方法及信息推送服务器 | |
CN113515699A (zh) | 信息推荐方法及装置、计算机可读存储介质、处理器 | |
CN107844874A (zh) | 企业营运问题分析系统及其方法 | |
CN116228274A (zh) | 标签信息处理方法、装置、存储介质、电子设备及系统 | |
CN115809889A (zh) | 基于营销效果的智能客群筛选方法、系统、介质及设备 | |
CN115880077A (zh) | 基于客户标签的推荐方法及其装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |