CN111429203A - 基于用户行为数据的商品推荐方法和装置 - Google Patents

基于用户行为数据的商品推荐方法和装置 Download PDF

Info

Publication number
CN111429203A
CN111429203A CN202010135390.9A CN202010135390A CN111429203A CN 111429203 A CN111429203 A CN 111429203A CN 202010135390 A CN202010135390 A CN 202010135390A CN 111429203 A CN111429203 A CN 111429203A
Authority
CN
China
Prior art keywords
commodity
user
determining
value
purchased
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010135390.9A
Other languages
English (en)
Inventor
周广一
白硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mininglamp Software System Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN202010135390.9A priority Critical patent/CN111429203A/zh
Publication of CN111429203A publication Critical patent/CN111429203A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种基于用户行为数据的商品推荐方法和装置。所述方法包括:从预先获取的用户最近预设时间内浏览的商品信息得到待选择的商品;根据所述待选择的商品以及预先获取的所述用户已购买的商品,确定所述待选择的商品与已购买的商品之间的关联特征的评分值;根据所述关联特征的评分值,确定所述用户的推荐商品。

Description

基于用户行为数据的商品推荐方法和装置
技术领域
本申请实施例涉及信息处理领域,尤指一种基于用户行为数据的商品推荐方法和装置。
背景技术
互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,这就是所谓的信息超载问题。
解决信息超载问题一个非常有潜力的办法是推荐系统,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、商品等推荐给用户的个性化推荐系统。和搜索引擎相比推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。一个好的推荐系统不仅能为用户提供个性化服务,还能和用户之间建立密切关系,让用户对推荐产生依赖。
相关技术中,根据所有用户的商品浏览记录和购买记录,计算具体热销的商品有哪些,选取浏览量最多,销售量最多的前十名或更多商品最为热销商品。然后在具体的商城首页或醒目位置集中推荐这些商品。因为这些商品是根据大部分用户的需求以及实际的购买行动选出来的。所以满足绝大部分用户的基本需求和切中用户痛点。用户只要登陆商场首页,随着而来的便是这些被推荐的、热门的、销售量火爆的商品。从而刺激了用户的购买热情,增加商品的销售量和收益。
发明内容
为了解决上述任一技术问题,本申请实施例提供了一种基于用户行为数据的商品推荐方法和装置。
为了达到本申请实施例目的,本申请实施例提供了一种基于用户行为数据的商品推荐方法,包括:
从预先获取的用户最近预设时间内浏览的商品信息得到待选择的商品;
根据所述待选择的商品以及预先获取的所述用户已购买的商品,确定所述待选择的商品与已购买的商品之间的关联特征的评分值;
根据所述关联特征的评分值,确定所述用户的推荐商品。
在一个示例性实施例中,所述确定所述待选择的商品与已购买的商品之间的关联特征的评分值,包括:
确定每个所述待选择的商品与已购买的商品信息组成的关联商品组,得到每个待选择的商品对应的关联商品组;
从预先存储的关联商品组的权重值中,查询每个待选择的商品对应的每个关联商品组的权重值;
对同一个待选择的商品对应的每个关联商品组的权重值进行求和计算,所述待选择的商品的关联商品组的总权重值;
根据所述待选择的商品的总权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的关联特征的评分值。
在一个示例性实施例中,所述在确定所述待选择的商品与已购买的商品之间的关联特征的评分值之前,所述方法还包括:
为每个用户建立预设时间范围内操作行为中每个商品与所述用户的历史购买行为中的每个商品的关联关系,组成每个用户的关联商品组,其中操作行为包括浏览但未购买的商品和已购买的商品;
以关联商品组进行分类统计,得到每个关联商品组的记录条数;
根据每个关联商品组的记录条数,确定每个关联商品组的权重值。
在一个示例性实施例中,所述以关联商品组进行分类统计,得到每个关联商品组的记录条数,包括:
以数值0和1分别表示浏览但未购买的商品和已购买的商品,得到每个关联商品组在浏览但未购买的行为和购买行为上的取值,得到每个关联商品组为0或1的取值的记录;
利用预先设置的逻辑回归算法,将每个用户的每条记录作为输入,对关联商品组进行分类。
在一个示例性实施例中,所述根据所述关联特征的评分值,确定所述用户的推荐商品之前,所述方法还包括:
获取所述待选择的商品的各个属性信息的权重值;
对各个属性信息的权重值进行求和,得到待选择的商品的基本特征的权重值;
利用所述待选择的商品的基本特征的权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的基本特征的评分值;
所述根据所述关联特征的评分值,确定所述用户的推荐商品,包括:
根据所述基本特征的评分值和所述关联特征的评分值,确定所述商品的总体评分值;
根据所述商品的总体评分值,确定所述用户的推荐商品。
一种基于用户行为数据的商品推荐装置,包括:
第一获取模块,用于从预先获取的用户最近预设时间内浏览的商品信息得到待选择的商品;
第一确定模块,用于根据所述待选择的商品以及预先获取的所述用户已购买的商品,确定所述待选择的商品与已购买的商品之间的关联特征的评分值;
第二确定模块,用于根据所述关联特征的评分值,确定所述用户的推荐商品。
在一个示例性实施例中,所述第一确定模块包括:
第一确定单元,用于确定每个所述待选择的商品与已购买的商品信息组成的关联商品组,得到每个待选择的商品对应的关联商品组;
查询单元,用于从预先存储的关联商品组的权重值中,查询每个待选择的商品对应的每个关联商品组的权重值;
第一计算单元,用于对同一个待选择的商品对应的每个关联商品组的权重值进行求和计算,所述待选择的商品的关联商品组的总权重值;
第二确定单元,用于根据所述待选择的商品的总权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的关联特征的评分值。
在一个示例性实施例中,所述装置还包括:
建立模块,用于在确定所述待选择的商品与已购买的商品之间的关联特征的评分值之前,为每个用户建立预设时间范围内操作行为中每个商品与所述用户的历史购买行为中的每个商品的关联关系,组成每个用户的关联商品组,其中操作行为包括浏览但未购买的商品和已购买的商品;
分类模块,用于以关联商品组进行分类统计,得到每个关联商品组的记录条数;
第三确定模块,用于根据每个关联商品组的记录条数,确定每个关联商品组的权重值。
在一个示例性实施例中,所述分类模块包括:
处理单元,用于以数值0和1分别表示浏览但未购买的商品和已购买的商品,得到每个关联商品组在浏览但未购买的行为和购买行为上的取值,得到每个关联商品组为0或1的取值的记录;
分类单元,用于利用预先设置的逻辑回归算法,将每个用户的每条记录作为输入,对关联商品组进行分类。
在一个示例性实施例中,所述装置还包括:
第二获取模块,用于在确定所述用户的推荐商品之前,获取所述待选择的商品的各个属性信息的权重值;
第一计算模块,用于对各个属性信息的权重值进行求和,得到待选择的商品的基本特征的权重值;
第二计算模块,用于利用所述待选择的商品的基本特征的权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的基本特征的评分值;
所述第一确定模块包括:
第三确定单元,用于根据所述基本特征的评分值和所述关联特征的评分值,确定所述商品的总体评分值;
第四确定单元,用于根据所述商品的总体评分值,确定所述用户的推荐商品。
本申请实施例提供的方案,从预先获取的用户最近预设时间内浏览的商品信息得到待选择的商品,根据所述待选择的商品以及预先获取的所述用户已购买的商品,确定所述待选择的商品与已购买的商品之间的关联特征的评分值,并根据所述关联特征的评分值,确定所述用户的推荐商品,实现基于用户的购买历史的商品的相关性来确定用户的推荐商品,提高对用户的商品的推荐的准确性。
本申请实施例的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例而了解。本申请实施例的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请实施例技术方案的进一步理解,并且构成说明书的一部分,与本申请实施例的实施例一起用于解释本申请实施例的技术方案,并不构成对本申请实施例技术方案的限制。
图1为本申请实施例提供的基于用户行为数据的商品推荐方法的流程图;
图2为本申请实施例提供的应用商城中应用推荐方法的示意图;
图3为本申请实施例提供的基于用户行为数据的商品推荐装置的结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请实施例的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请实施例中的实施例及实施例中的特征可以相互任意组合。
在实现本发明过程中,发明人发现相关技术存在如下问题,包括:
相关技术通过大量数据的筛选,找出全网全用户共同浏览量和购买量最多的商品,将这些热销品作为推荐给每个用户。
一方面,每个用户收到的推荐都是一样的,没有做到千人千面,不能满足个性化的需求。虽然对于绝大多数用户来说感兴趣,最想去购买的商品。但是对于存在的一部分少数群体来说这些被推荐的商品是无意义的,没有这方面的需求,不能做到私人订制。
另一方面,基于全网用户共同的需求去推荐商品,存在更新不及时的风险。如果生产出一件网红商品,由于消息传递的滞后性,只能在一部分人圈中流传。对于绝大多数人来说,根本就不知道有这件商品,自然也就不存在去搜索或者购物这件商品,那么推荐的前十热销品是根据大部分用户的需求定制的,此时就缺乏及时的更新,对商品的销售量、收入等造成重大影响。
基于上述分析,本申请提出如下解决方案,包括:
区别于相关技术中通过统计所有人的喜好和偏爱来计算前十名销售量或购买量最多的商品,本申请能够从用户的实际出发,能够针对每一个用户提供不同的推荐商品服务,实现千人千面。通过获取每个人的浏览记录、购买记录添加收藏的记录以及加入购物车等行为,让用户能够根据自己的行为去确定最终推荐给用户的商品是什么,可能推荐的商品不是最近热销的商品,但是最符合用户近期想要购买的商品。利用该方法,可以针对每个用户提供个性化的推荐系统服务,促进销售量的增加和收入的递增。
另外,由于用户的行为不是一成不变的,可能短时间内发生多次变化。那么本发明还能根据用户近期行为的变化及时的调整推荐策略,满足用户的购买需求,刺激销售量和收入的增加。
下面以本申请实施例提供的方法进行说明:
图1为本申请实施例提供的基于用户行为数据的商品推荐方法的流程图。如图1所示,图1所示方法包括:
步骤101、从预先获取的用户最近预设时间内浏览的商品信息得到待选择的商品;
在一个示例性实施例中,最近预设时间内为距离当前一段时间,该段时间的时长可以根据需要自由设置。用户浏览的商品可以为点击浏览的、增加收藏的、点击关注的商品等用户有购买意愿的商品。
步骤102、根据所述待选择的商品以及预先获取的所述用户已购买的商品,确定所述待选择的商品与已购买的商品之间的关联特征的评分值;
在一个示例性实施例中,关联特征是一种组合方式,每一个组合都可以叫做一个特征,因为形成是通过关联行为得到的,所以叫做关联特征。通过待选择的商品和已购买的每个商品组成的关联商品组,通过对关联商品组的信息来确定待选择的商品的评分值。在有n个App时,分为App1、App2、App3、AppN。这些App两两之间都可以形成一种组合,比如App1&App2,App1&App3,App2&App3。
步骤103、根据所述关联特征的评分值,确定所述用户的推荐商品。
在一个示例性实施例中,可以按照关联特征的评分值从高到低的顺序,选择前十个商品作为用户的推荐商品。
本申请实施例提供的方法,从预先获取的用户最近预设时间内浏览的商品信息得到待选择的商品,根据所述待选择的商品以及预先获取的所述用户已购买的商品,确定所述待选择的商品与已购买的商品之间的关联特征的评分值,并根据所述关联特征的评分值,确定所述用户的推荐商品,实现基于用户的购买历史的商品的相关性来确定用户的推荐商品,提高对用户的商品的推荐的准确性。
下面对本申请实施例提供的方法进行说明:
在一个示例性实施例中,所述确定所述待选择的商品与已购买的商品之间的关联特征的评分值,包括:
确定每个所述待选择的商品与已购买的商品信息组成的关联商品组,得到每个待选择的商品对应的关联商品组;
从预先存储的关联商品组的权重值中,查询每个待选择的商品对应的每个关联商品组的权重值;
对同一个待选择的商品对应的每个关联商品组的权重值进行求和计算,所述待选择的商品的关联商品组的总权重值;
根据所述待选择的商品的总权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的关联特征的评分值。
以计算商品为应用商店的某一应用App100的关联特征权重分值为例进行说明。将App100与这个用户历史购买过的商品ID进行关联形成关联特征。如App1&App100、App2&App100、App3&App100...。从预先存储的关联商品组的权重值中,根据这个关联形式到模型文件中寻找匹配的记录,找到匹配的记录后就可以获取对应的权重值。将前后权重值累加求和即可得到商品关联的总权重,即对App100这件商品的关联特征权重分值。
在一个示例性实施例中,所述在确定所述待选择的商品与已购买的商品之间的关联特征的评分值之前,所述方法还包括:
为每个用户建立预设时间范围内操作行为中每个商品与所述用户的历史购买行为中的每个商品的关联关系,组成每个用户的关联商品组,其中操作行为包括浏览但未购买的商品和已购买的商品;
以关联商品组进行分类统计,得到每个关联商品组的记录条数;
根据每个关联商品组的记录条数,确定每个关联商品组的权重值。
其中,预设时间范围内操作行为中的数据可以通过表1记录,包括:
用户标识 商品名称 时间 购买/浏览
userid1 App1 T1 1
userid2 App2 T2 0
userid3 App3 T3 1
表1
其中,1/0分别代表购买和浏览行为。
App商品词表内容主要是包含这件商品的所有属性信息。比如App的开发商、上架时间、售价等包含商品属性的一些数据值。可以通过表2记录,包括:
商品名称 名称 版本信息
App1 Baidu Version1
App2 Alibaba Version2
App3 tencent Version3
表2
其中,用户历史下载表用于记录该用户记载的商品的信息。以某一个用户在商城内购买了某个App,这些信息和数据都会以记录的形式存放在业务数据库中,类似与excel中会出现一条记录。某个用户在什么时间购买或浏览了哪一个App,当然还有一些额外的列属性值。具体可以通过表3来记录,包括:
用户标识 商品名称
userid1 App10、App20、App30
userid2 App100、App200、App300
userid3 App1000、App200、App3000
表3
其中,各个关联特征的权重值可以周期性的计算来确定。
可以根据每个关联商品组的数量,为每个关联商品组进行权重的设置,数量越多,权重越大;相反,数量越少,权重越小。
在一个示例性实施例中,所述以关联商品组进行分类统计,得到每个关联商品组的记录条数,包括:
以数值0和1分别表示浏览但未购买的商品和已购买的商品,得到每个关联商品组在浏览但未购买的行为和购买行为上的取值,得到每个关联商品组为0或1的取值的记录;
利用预先设置的逻辑回归算法,将每个用户的每条记录作为输入,对关联商品组进行分类。
以用户userid1最近浏览未购买App1(取值为0)和购买App2(取值为1)为例进行说明,该用户已下载App10、App20和App30(取值均为1),则该用户的关联商品组有6个,分别为包括App1*App10、App1*App20、App1*App30、App3*App10、App2*App20和App2*App30;可以得出,前三个的取值均为0,后三个的取值均为1。以此类推,可以得到每个用户的关联商品组。
利用逻辑回归算法对收集到的关联商品组进行分类,统计得到每个关联商品组的数量。其中逻辑回归算法是一种机器学习算法中的二分类算法。通常被用来处理分类问题,其分类边界不一定都是线性的,也可以是非线性的。通过调整对其参数的优化,输入固定格式的数据,可以得到经过算法训练后输出的模型数据。
在一个示例性实施例中,所述根据所述关联特征的评分值,确定所述用户的推荐商品之前,所述方法还包括:
获取所述待选择的商品的各个属性信息的权重值;
对各个属性信息的权重值进行求和,得到待选择的商品的基本特征的权重值;
利用所述待选择的商品的基本特征的权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的基本特征的评分值;
所述根据所述关联特征的评分值,确定所述用户的推荐商品,包括:
根据所述基本特征的评分值和所述关联特征的评分值,确定所述商品的总体评分值;
根据所述商品的总体评分值,确定所述用户的推荐商品。
商品的评分值可以通过两部分来确定,一部分是用户的偏好,这部分评分主要是由浏览记录中的商品和历史购买的商品进行关联特征体现的;另一部分是取决于这个App的热度,即推荐商品的总评分=关联特征评分+基本特征评分;最后,对这个总的评分进行降序排序,取前十的商品进行推荐服务即可。
其中,基本特征的权重计算是通过如下方式得到,包括:
以计算商品App100的基本特征权重分值为例进行说明,根据其商品ID可以到商品词表中获取此商品对应的属性值有哪些。如开发者、版本号、价格等。这些信息对应的权重也可以在模型文件中拿到对应的权重。将各个属性的前后权重值累加之和作为商品App100的基本特征权重分值。再通过该商品的评分与该基本特征权重分值,可以得到该商品App100的基本特征评分值。
下面以某品牌手机中应用商城为例进行说明:
图2为本申请实施例提供的应用商城中应用推荐方法的示意图。如图2所示,所述方法具体如下,包括:
手机应用商城主要是用于购买商城内App,App分为免费的和收费的。通过购买和下载到手机后才能使用其功能。本申请提供的方法的实现分为线上实时阶段和线下离线阶段两方面。具体内容如下:
线上实时阶段
线上实时功能的实现主要依靠三个文件,包括:
1、模型文件,模型文件中有关联特征、基本特征和对应的权重值。关于生成这个文件在线下阶段会进行详细阐述。
2、用户历史购买数据表。某一个用户在商城内购买了某个App,这些信息和数据都会以记录的形式存放在业务数据库中,类似与excel中会出现一条记录。某个用户在什么时间购买或浏览了哪一个App,当然还有一些额外的列属性值。
3、商品词表。内容主要是包含这件商品的所有属性信息,包括App的开发者、上架时间、售价、数量等包含商品属性的一些数据值。
有了上述三张表就可以进行线上推荐服务功能的实现。
首先一个用户访问一个商城,因为用户是注册过的,可以根据用户的访问记录及时的拿到用户对应的ID,标志这这个用户的唯一属性,类似于身份证。通过这个用户ID就可以到业务数据中拿到这个用户的历史购买记录和最近浏览记录。根据这个记录就可以计算这个用户对商城内所有App的一个总的评分。
这个评分包含两部分:
一部分是用户的偏好,这部分评分主要是由浏览记录中的App和历史购买的App进行关联特征体现的;
另一部分是取决于这个App的质量,该质量可以通过用户的评价来获取,或者通过用户的热度来确定。
这部分是由App的基本特征体现的。最后,总的评分=关联特征评分+基本特征评分,最后对这个总的评分进行降序排序,取前十进行推荐服务即可。
其中,关联特征的权重计算是通过如下方式得到,包括:
以计算商品App100的关联特征权重分值为例进行说明,将App100与这个用户历史购买过的商品ID进行关联形成关联特征。如App1&App100、App2&App100、App3&App100...。根据这个关联形式到模型文件中寻找匹配的记录,找到匹配的记录后就可以获取对应的权重值。将前后权重值累加求和即可得到商品关联的总权重,即对App100这件商品的关联特征权重分值。
其中,基本特征的权重计算是通过如下方式得到,包括:
以计算商品App100的基本特征权重分值为例进行说明,根据其商品ID可以到商品词表中获取此商品对应的属性值有哪些。如开发者、版本号、价格等。这些信息对应的权重也可以在模型文件中拿到对应的权重。将各个属性的前后权重值累加之和作为商品App100的基本特征权重分值。
经过上述操作后,商品App100的最终评分的分值后,再计算其他商品的分值,如App99、App98。。。最后根据总分值降序排序,取排名前十的商品进行推荐服务即可。
线下离线阶段:
其中,线下离线阶段主要目的是生成模型文件。线上是实时的,根据用户的访问即刻给出推荐的商品。线下阶段不用实时的响应。通常每隔一周进行更新下模型文件即可。通常分以下两个阶段:
正负例样本表的构建:
因为逻辑回归是有监督的机器学习算法,所以必须有y(lable)这一列。而这一列的取值是根据用户是浏览了和购买了进行决定的。整个正负例样本表的数据是根据用户浏览记录表和用户历史下载表中的数据关联得到的。用户浏览行为数据指某个用户在某个时间对于某个App是浏览了还是购买下载了。用户历史下载数据指某个用户曾经下载了哪些App。
如用户浏览行为数据:
Figure BDA0002397101910000131
如用户历史下载数据:
Figure BDA0002397101910000132
基于这个浏览行为数据就可以构架正负例样本表,如表4所示。关联特征指用户浏览行为中的App和用户历史下载中的App进行一对一关联得到的。基本特征由商品对应的商品词表中的属性值获取而来。如果记录数据包含商品和商品之间的关联特征或者商品的基本特征。如有这些特征标志为1。经过多条行为数据记录就可以得到一个完整的正负例样本表。
Figure BDA0002397101910000133
表4
经过上述操作后,就可以得到逻辑回归算法的输入格式数据。通过大数据计算框架spark计算引擎处理输入格式数据,通过调整逻辑回归算法参数进行调优,利用代码处理、格式转化、服务器提交程序就可以得到输出的模型结果文件。最后将这个模型结果文件进行保存方便线上实时推荐服务。模型结果文件格式包括每个关联特征或者基本特征以及各个特征对应的一个权重值。
本申请实施例提供的方法,通过结合用户自己的浏览行为数据记录和购买记录去筛选用户本身感兴趣的商品,能够根据每一个用户的喜爱和偏好去推荐给用户最想要的商品,并且推荐的商品曾是用户浏览过的或是购买过的商品,从而实现用户之间接收到的推荐商品服务内容不同,达到差异化服务的目的。另外,由于用户自身想法的改变,短时间感兴趣和浏览的商品发生变化。推荐系统服务也能够及时的根据用户近期的操作行为去推荐符合用户的商品和服务。相比较与传统的去统计所有用户共同喜好的商品,更加具有智能化、及时性和可靠性。通过长时间刺激用户购买需求,引导用户进行购买,对用户个体更加具有针对性,更能切中用户的需求点,提高推荐的准确度,促进商品销售量的增加。
图3为本申请实施例提供的基于用户行为数据的商品推荐装置的结构图。如图3所示,图3所示装置包括:
第一获取模块,用于从预先获取的用户最近预设时间内浏览的商品信息得到待选择的商品;
第一确定模块,用于根据所述待选择的商品以及预先获取的所述用户已购买的商品,确定所述待选择的商品与已购买的商品之间的关联特征的评分值;
第二确定模块,用于根据所述关联特征的评分值,确定所述用户的推荐商品。
在一个示例性实施例中,所述第一确定模块包括:
第一确定单元,用于确定每个所述待选择的商品与已购买的商品信息组成的关联商品组,得到每个待选择的商品对应的关联商品组;
查询单元,用于从预先存储的关联商品组的权重值中,查询每个待选择的商品对应的每个关联商品组的权重值;
第一计算单元,用于对同一个待选择的商品对应的每个关联商品组的权重值进行求和计算,所述待选择的商品的关联商品组的总权重值;
第二确定单元,用于根据所述待选择的商品的总权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的关联特征的评分值。
在一个示例性实施例中,所述装置还包括:
建立模块,用于在确定所述待选择的商品与已购买的商品之间的关联特征的评分值之前,为每个用户建立预设时间范围内操作行为中每个商品与所述用户的历史购买行为中的每个商品的关联关系,组成每个用户的关联商品组,其中操作行为包括浏览但未购买的商品和已购买的商品;
分类模块,用于以关联商品组进行分类统计,得到每个关联商品组的记录条数;
第三确定模块,用于根据每个关联商品组的记录条数,确定每个关联商品组的权重值。
在一个示例性实施例中,所述分类模块包括:
处理单元,用于以数值0和1分别表示浏览但未购买的商品和已购买的商品,得到每个关联商品组在浏览但未购买的行为和购买行为上的取值,得到每个关联商品组为0或1的取值的记录;
分类单元,用于利用预先设置的逻辑回归算法,将每个用户的每条记录作为输入,对关联商品组进行分类。
在一个示例性实施例中,所述装置还包括:
第二获取模块,用于在确定所述用户的推荐商品之前,获取所述待选择的商品的各个属性信息的权重值;
第一计算模块,用于对各个属性信息的权重值进行求和,得到待选择的商品的基本特征的权重值;
第二计算模块,用于利用所述待选择的商品的基本特征的权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的基本特征的评分值;
所述第一确定模块包括:
第三确定单元,用于根据所述基本特征的评分值和所述关联特征的评分值,确定所述商品的总体评分值;
第四确定单元,用于根据所述商品的总体评分值,确定所述用户的推荐商品
本申请实施例提供的装置,从预先获取的用户最近预设时间内浏览的商品信息得到待选择的商品,根据所述待选择的商品以及预先获取的所述用户已购买的商品,确定所述待选择的商品与已购买的商品之间的关联特征的评分值,并根据所述关联特征的评分值,确定所述用户的推荐商品,实现基于用户的购买历史的商品的相关性来确定用户的推荐商品,提高对用户的商品的推荐的准确性。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (10)

1.一种基于用户行为数据的商品推荐方法,其特征在于,包括:
从预先获取的用户最近预设时间内浏览的商品信息得到待选择的商品;
根据所述待选择的商品以及预先获取的所述用户已购买的商品,确定所述待选择的商品与已购买的商品之间的关联特征的评分值;
根据所述关联特征的评分值,确定所述用户的推荐商品。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待选择的商品与已购买的商品之间的关联特征的评分值,包括:
确定每个所述待选择的商品与已购买的商品信息组成的关联商品组,得到每个待选择的商品对应的关联商品组;
从预先存储的关联商品组的权重值中,查询每个待选择的商品对应的每个关联商品组的权重值;
对同一个待选择的商品对应的每个关联商品组的权重值进行求和计算,所述待选择的商品的关联商品组的总权重值;
根据所述待选择的商品的总权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的关联特征的评分值。
3.根据权利要求2所述的方法,其特征在于,所述在确定所述待选择的商品与已购买的商品之间的关联特征的评分值之前,所述方法还包括:
为每个用户建立预设时间范围内操作行为中每个商品与所述用户的历史购买行为中的每个商品的关联关系,组成每个用户的关联商品组,其中操作行为包括浏览但未购买的商品和已购买的商品;
以关联商品组进行分类统计,得到每个关联商品组的记录条数;
根据每个关联商品组的记录条数,确定每个关联商品组的权重值。
4.根据权利要求3所述的方法,其特征在于,所述以关联商品组进行分类统计,得到每个关联商品组的记录条数,包括:
以数值0和1分别表示浏览但未购买的商品和已购买的商品,得到每个关联商品组在浏览但未购买的行为和购买行为上的取值,得到每个关联商品组为0或1的取值的记录;
利用预先设置的逻辑回归算法,将每个用户的每条记录作为输入,对关联商品组进行分类。
5.根据权利要求1至4任一所述的方法,其特征在于:
所述根据所述关联特征的评分值,确定所述用户的推荐商品之前,所述方法还包括:
获取所述待选择的商品的各个属性信息的权重值;
对各个属性信息的权重值进行求和,得到待选择的商品的基本特征的权重值;
利用所述待选择的商品的基本特征的权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的基本特征的评分值;
所述根据所述关联特征的评分值,确定所述用户的推荐商品,包括:
根据所述基本特征的评分值和所述关联特征的评分值,确定所述商品的总体评分值;
根据所述商品的总体评分值,确定所述用户的推荐商品。
6.一种基于用户行为数据的商品推荐装置,其特征在于,包括:
第一获取模块,用于从预先获取的用户最近预设时间内浏览的商品信息得到待选择的商品;
第一确定模块,用于根据所述待选择的商品以及预先获取的所述用户已购买的商品,确定所述待选择的商品与已购买的商品之间的关联特征的评分值;
第二确定模块,用于根据所述关联特征的评分值,确定所述用户的推荐商品。
7.根据权利要求6所述的装置,其特征在于,所述第一确定模块包括:
第一确定单元,用于确定每个所述待选择的商品与已购买的商品信息组成的关联商品组,得到每个待选择的商品对应的关联商品组;
查询单元,用于从预先存储的关联商品组的权重值中,查询每个待选择的商品对应的每个关联商品组的权重值;
第一计算单元,用于对同一个待选择的商品对应的每个关联商品组的权重值进行求和计算,所述待选择的商品的关联商品组的总权重值;
第二确定单元,用于根据所述待选择的商品的总权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的关联特征的评分值。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
建立模块,用于在确定所述待选择的商品与已购买的商品之间的关联特征的评分值之前,为每个用户建立预设时间范围内操作行为中每个商品与所述用户的历史购买行为中的每个商品的关联关系,组成每个用户的关联商品组,其中操作行为包括浏览但未购买的商品和已购买的商品;
分类模块,用于以关联商品组进行分类统计,得到每个关联商品组的记录条数;
第三确定模块,用于根据每个关联商品组的记录条数,确定每个关联商品组的权重值。
9.根据权利要求8所述的装置,其特征在于,所述分类模块包括:
处理单元,用于以数值0和1分别表示浏览但未购买的商品和已购买的商品,得到每个关联商品组在浏览但未购买的行为和购买行为上的取值,得到每个关联商品组为0或1的取值的记录;
分类单元,用于利用预先设置的逻辑回归算法,将每个用户的每条记录作为输入,对关联商品组进行分类。
10.根据权利要求6至9任一所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于在确定所述用户的推荐商品之前,获取所述待选择的商品的各个属性信息的权重值;
第一计算模块,用于对各个属性信息的权重值进行求和,得到待选择的商品的基本特征的权重值;
第二计算模块,用于利用所述待选择的商品的基本特征的权重值和预先获取的所述待选择的商品的评分信息,得到所述待选择的商品的基本特征的评分值;
所述第一确定模块包括:
第三确定单元,用于根据所述基本特征的评分值和所述关联特征的评分值,确定所述商品的总体评分值;
第四确定单元,用于根据所述商品的总体评分值,确定所述用户的推荐商品。
CN202010135390.9A 2020-03-02 2020-03-02 基于用户行为数据的商品推荐方法和装置 Withdrawn CN111429203A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010135390.9A CN111429203A (zh) 2020-03-02 2020-03-02 基于用户行为数据的商品推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010135390.9A CN111429203A (zh) 2020-03-02 2020-03-02 基于用户行为数据的商品推荐方法和装置

Publications (1)

Publication Number Publication Date
CN111429203A true CN111429203A (zh) 2020-07-17

Family

ID=71547352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010135390.9A Withdrawn CN111429203A (zh) 2020-03-02 2020-03-02 基于用户行为数据的商品推荐方法和装置

Country Status (1)

Country Link
CN (1) CN111429203A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881361A (zh) * 2020-09-28 2020-11-03 北京每日优鲜电子商务有限公司 物品信息推送方法、装置、电子设备和计算机可读介质
CN111984869A (zh) * 2020-08-25 2020-11-24 北京每日优鲜电子商务有限公司 物品信息推送方法、装置、电子设备和计算机可读介质
CN112001777A (zh) * 2020-08-24 2020-11-27 知小二(广州)科技有限公司 一种基于云计算的电子商务平台数据分析系统
CN112102037A (zh) * 2020-09-16 2020-12-18 汤涛 一种基于大数据的直播电商平台商品内容智能推送管理系统
CN112950256A (zh) * 2021-02-02 2021-06-11 广东便捷神科技股份有限公司 一种基于App推送定制广告形式的方法和系统
CN113052651A (zh) * 2021-03-17 2021-06-29 广东便捷神科技股份有限公司 一种基于大数据的智能零售管理方法及系统
CN113362141A (zh) * 2021-06-25 2021-09-07 上海浦东发展银行股份有限公司 一种关联商品的推荐方法、装置、介质及电子设备
CN113744019A (zh) * 2021-01-12 2021-12-03 北京沃东天骏信息技术有限公司 一种商品推荐方法、装置、设备及存储介质
CN113763092A (zh) * 2020-11-10 2021-12-07 北京沃东天骏信息技术有限公司 推荐商品的方法、装置、设备和计算机可读介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411754A (zh) * 2011-11-29 2012-04-11 南京大学 一种基于商品属性熵值的个性化推荐方法
CN105469263A (zh) * 2014-09-24 2016-04-06 阿里巴巴集团控股有限公司 一种商品推荐方法及装置
US20160239867A1 (en) * 2015-02-16 2016-08-18 Adobe Systems Incorporated Online Shopping Cart Analysis
CN106485562A (zh) * 2015-09-01 2017-03-08 苏宁云商集团股份有限公司 一种基于用户历史行为的商品信息推荐方法及系统
CN108109056A (zh) * 2018-01-10 2018-06-01 北京思特奇信息技术股份有限公司 一种商品的推荐方法及系统
CN108665329A (zh) * 2017-03-29 2018-10-16 北京京东尚科信息技术有限公司 一种基于用户浏览行为的商品推荐方法
CN110490691A (zh) * 2019-07-24 2019-11-22 深圳市梦想家联盟科技有限公司 信息推荐方法、装置、计算机设备及存储介质
CN110827114A (zh) * 2019-10-01 2020-02-21 榕知科技(武汉)有限公司 一种商品推荐方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411754A (zh) * 2011-11-29 2012-04-11 南京大学 一种基于商品属性熵值的个性化推荐方法
CN105469263A (zh) * 2014-09-24 2016-04-06 阿里巴巴集团控股有限公司 一种商品推荐方法及装置
US20160239867A1 (en) * 2015-02-16 2016-08-18 Adobe Systems Incorporated Online Shopping Cart Analysis
CN106485562A (zh) * 2015-09-01 2017-03-08 苏宁云商集团股份有限公司 一种基于用户历史行为的商品信息推荐方法及系统
CN108665329A (zh) * 2017-03-29 2018-10-16 北京京东尚科信息技术有限公司 一种基于用户浏览行为的商品推荐方法
CN108109056A (zh) * 2018-01-10 2018-06-01 北京思特奇信息技术股份有限公司 一种商品的推荐方法及系统
CN110490691A (zh) * 2019-07-24 2019-11-22 深圳市梦想家联盟科技有限公司 信息推荐方法、装置、计算机设备及存储介质
CN110827114A (zh) * 2019-10-01 2020-02-21 榕知科技(武汉)有限公司 一种商品推荐方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
吴喜之等: "基于关联规则的个体化推荐在传统商业中的应用", 《兰州学刊》 *
张勇杰等: "基于关联规则的商品智能推荐算法", 《现代计算机(专业版)》 *
艾黎: "基于商品属性与用户聚类的个性化服装推荐研究", 《现代情报》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112001777A (zh) * 2020-08-24 2020-11-27 知小二(广州)科技有限公司 一种基于云计算的电子商务平台数据分析系统
CN112001777B (zh) * 2020-08-24 2023-12-08 珠海以备科技有限责任公司 一种基于云计算的电子商务平台数据分析系统
CN111984869A (zh) * 2020-08-25 2020-11-24 北京每日优鲜电子商务有限公司 物品信息推送方法、装置、电子设备和计算机可读介质
CN112102037A (zh) * 2020-09-16 2020-12-18 汤涛 一种基于大数据的直播电商平台商品内容智能推送管理系统
CN112102037B (zh) * 2020-09-16 2021-05-07 广州伊的家网络科技有限公司 一种基于大数据的直播电商平台商品内容智能推送管理系统
CN111881361A (zh) * 2020-09-28 2020-11-03 北京每日优鲜电子商务有限公司 物品信息推送方法、装置、电子设备和计算机可读介质
CN111881361B (zh) * 2020-09-28 2021-01-05 北京每日优鲜电子商务有限公司 物品信息推送方法、装置、电子设备和计算机可读介质
CN113763092A (zh) * 2020-11-10 2021-12-07 北京沃东天骏信息技术有限公司 推荐商品的方法、装置、设备和计算机可读介质
CN113744019A (zh) * 2021-01-12 2021-12-03 北京沃东天骏信息技术有限公司 一种商品推荐方法、装置、设备及存储介质
CN112950256B (zh) * 2021-02-02 2023-05-23 广东便捷神科技股份有限公司 一种基于App推送定制广告形式的方法和系统
CN112950256A (zh) * 2021-02-02 2021-06-11 广东便捷神科技股份有限公司 一种基于App推送定制广告形式的方法和系统
CN113052651A (zh) * 2021-03-17 2021-06-29 广东便捷神科技股份有限公司 一种基于大数据的智能零售管理方法及系统
CN113052651B (zh) * 2021-03-17 2024-04-23 广东便捷神科技股份有限公司 一种基于大数据的智能零售管理方法及系统
CN113362141A (zh) * 2021-06-25 2021-09-07 上海浦东发展银行股份有限公司 一种关联商品的推荐方法、装置、介质及电子设备

Similar Documents

Publication Publication Date Title
CN111429203A (zh) 基于用户行为数据的商品推荐方法和装置
CN108629665B (zh) 一种个性化商品推荐方法和系统
CN107424043B (zh) 一种产品推荐方法及装置,电子设备
US8364528B2 (en) System and process for improving product recommendations for use in providing personalized advertisements to retail customers
US8583524B2 (en) System and process for improving recommendations for use in providing personalized advertisements to retail customers
US8407104B2 (en) Catalog based price search
US8108329B2 (en) System and process for boosting recommendations for use in providing personalized advertisements to retail customers
CN107332910B (zh) 信息推送方法和装置
CN106557480B (zh) 查询改写的实现方法及装置
US10853424B1 (en) Content delivery using persona segments for multiple users
WO2018040069A1 (zh) 信息推荐系统及方法
CN108537596B (zh) 搜索框内车型推荐的方法、装置、系统及存储器
CN104679771A (zh) 一种个性化数据搜索方法和装置
US20090281884A1 (en) System and process for receiving boosting recommendations for use in providing personalized advertisements to retail customers
CN104239338A (zh) 信息推荐方法及装置
CN103823908A (zh) 基于用户偏好的内容推荐方法和服务器
CN105630836A (zh) 搜索结果的排序方法和装置
CN116308684B (zh) 一种网购平台店铺信息推送方法及系统
CN112150227A (zh) 商品推荐方法、系统、设备及介质
CN113077317A (zh) 基于用户数据的物品推荐方法、装置、设备及存储介质
CN116089745A (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
CN110020118B (zh) 一种计算用户之间相似度的方法及装置
CN115860865A (zh) 商品组合构造方法及其装置、设备、介质、产品
CN113704630B (zh) 一种信息推送方法、装置、可读存储介质和电子设备
JP7249375B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200717