CN110570233A - 用于电商平台的用户回购时间预测方法及装置 - Google Patents
用于电商平台的用户回购时间预测方法及装置 Download PDFInfo
- Publication number
- CN110570233A CN110570233A CN201910759670.4A CN201910759670A CN110570233A CN 110570233 A CN110570233 A CN 110570233A CN 201910759670 A CN201910759670 A CN 201910759670A CN 110570233 A CN110570233 A CN 110570233A
- Authority
- CN
- China
- Prior art keywords
- user
- daily
- commodities
- commodity
- consumption
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种用于电商平台的用户回购时间预测方法及装置,涉及电子商务技术领域,能够准确预测用户的回购周期,进而实施精准营销。该方法包括获取用户的历史购物数据;基于历史购物数据计算所购商品的净含量,汇总同类商品后得到各类商品的总含量;根据用户n天次内所购某类商品的总含量及历史购物日期,计算待预测用户对该类商品的日均消耗量,其中n≥2,且n为整数;结合日均消耗量及历史购物时间测算待预测用户对该类商品的再次回购时间。该装置应用有上述方案所提的方法。
Description
技术领域
本发明涉及电子商务技术领域,尤其涉及一种用于电商平台的用户回购时间预测方法及装置。
背景技术
随着电子技术和网络技术的不断发展,越来越多的用户喜欢网络购物。但现有用户的历史购物数据没有被充分利用,尤其对于用户需要周期购物的商品,需要用户自己想去才能去下单购物,不仅给用户带来使用的不便,而且影响电商平台的销售量。
发明内容
本发明的目的在于提供一种用于电商平台的用户回购时间预测方法及装置,能够准确预测用户的回购周期,进而实施精准营销。
为了实现上述目的,本发明的一方面提供一种用于电商平台的用户回购时间预测方法,包括:
获取用户的历史购物数据;
基于历史购物数据计算所购商品的净含量,汇总同类商品后得到各类商品的总含量;
根据用户n天次内所购某类商品的总含量及历史购物日期,计算待预测用户对该类商品的日均消耗量,其中n≥2,且n为整数;
结合所述日均消耗量及历史购物时间测算待预测用户对该类商品的再次回购时间。
优选地,在获取用户的历史购物数据之后还包括:
清洗所述历史购物数据,去除刷单订单、退货订单和代购订单。
较佳地,基于历史购物数据计算所购商品的净含量,汇总同类商品后得到各类商品的总含量之前还包括:
预设商品合并规则,将相同类目或相似类目的商品标记为同类可合并商品。
进一步地,基于历史购物数据计算所购商品的净含量的方法包括:
从订单商品名称中提取所购商品的净含量;
若提取结果为空,根据订单商品名称从商品参数关系表中查找所购商品的净含量;
若查找结果为空,根据订单商品名称依据同品牌同类商品的单位元购买量与历史购物数据中所购商品的实际付款金额,预估所购商品的净含量;
若预估结果为空,根据订单商品名称依据非同品牌同类商品的单位元购买量与历史购物数据中所购商品的实际付款金额,预估所购商品的净含量。
优选地,根据用户n天次内所购某类商品的总含量及历史购物日期,计算待预测用户对该类商品的日均消耗量的方法包括:
按照用户ID、商品种类和购买日期三个维度,分别统计每个用户在指定时间段内购买某类商品的总含量及购买日期;
对于购买了n天次的用户,获取至少一个间隔段的日均消耗数据,n≥2;
以商品种类维度汇总全部日均消耗数据,排序并去除极值干扰后绘制每类商品的概率密度曲线;
将概率密度曲线的最高点作为对应类商品的日最佳消耗单位数,同时基于日最佳消耗单位数换算对应类商品的日合理消耗单位区间;
判断待预测用户是否为有效老用户,所述有效老用户是指购买该类商品的天次大余2且截至当前商品未用尽的用户;
当判断结果为是时,获取待预测用户对该类商品的购买日期及每天次购买的总含量,并计算每个间隔段的日均消耗数据;
将待预测用户在该类商品上的各日均消耗数据分别与所述日合理消耗单位区间比较,并在比较结果不处于所述日合理消耗单位区间内时动态调整待预测用户在该类商品上的日均消耗数据;
对多个所述日均消耗数据求均值得到待预测用户对该类商品的日均消耗量;
当判断结果为否时,将该类商品下所有用户日均消耗量的均值作为待预测用户的日均消耗量。
示例性地,间隔段的设置原则为:
当2≤n<m时,则对应划分n-1个间隔段,其中m>2,且m为整数;
当n≥m时,选取就近的m天次划分为m-1个间隔段。
优选地,将待预测用户在该类商品上的各日均消耗数据分别与所述日合理消耗单位区间比较,并在比较结果不处于所述日合理消耗单位区间内时动态调整待预测用户在该类商品上的日均消耗数据的方法包括:
S1,统计待预测用户对该类商品的日均消耗数据AVGp,按购物发生时间逆序排序后得到AVG1至AVGn-1,1≤p≤n-1,且p为整数;;
S2,当AVGn-1小于所述日合理消耗单位区间的最小值时,剔除日均消耗数据AVGn-1,同时保留第n天次的购买总含量;
S3,当AVGn-1大于所述日合理消耗单位区间的最大值时,将第n天次与第n-1天次的购买总含量之和定义为第n-1天次的购买总含量,同时剔除日均消耗数据AVGn-1后重新计算日均消耗数据AVGn-2,若更新后的AVGn-2仍大于所述日合理消耗单位区间的最大值,则还原步骤S3的操作,仅将原始的日均消耗数据AVGn-1剔除,同时保留第n天次的购买总含量。
较佳地,结合所述日均消耗量及历史购物时间测算待预测用户对该类商品的再次回购时间的方法包括:
将第n天次的购买总含量与所述日均消耗量做商计算,求得待预测用户对该类商品的再次回购天数;
判断当前日期距第n天次的购物日期的间隔是否大于所述再次回购天数,若是则将当前时间定义为再次回购时间,若否则在第n天次的购物日期基础之上加上所述再次回购天数推算出再次回购时间。
与现有技术相比,本发明提供的用于电商平台的用户回购时间预测方法具有以下有益效果:
本发明提供的用于电商平台的用户回购时间预测方法中,通过采集用户的全部历史购物数据,汇总归类后预先统计每个用户在历史时段中所购各类商品的总含量,然后选定待预测用户并调取其在一段时间内,也即n天次内所购某类商品的总含量及历史购物日期,分析计算出该待预测用户对该类商品的日均消耗量,并基于最近一天次的购买时间及购买量,推算出该批次购买量能够被持续消耗的天数,进而测算出该类商品的用尽日期,也即对该类商品的再次回购时间。
可见,使用上述用于电商平台的用户回购时间预测方法,通过实时跟踪电商平台中每个会员的历史购物数据,能够准确预测出其对某类商品的再次回购时间,以供电商平台实施精准营销。
本发明的另一方面提供一种用于电商平台的用户回购时间预测装置,应用有上述技术方案提到的用于电商平台的用户回购时间预测方法中,该装置包括:
数据采集单元,用于获取用户的历史购物数据;
数据清洗单元,用于清洗所述历史购物数据,去除刷单订单、退货订单和代购订单;
规则设定单元,用于预设商品合并规则,将相同类目或相似类目的商品标记为同类可合并商品;
分类汇总单元,用于基于历史购物数据计算所购商品的净含量,汇总同类商品后得到各类商品的总含量;
计算处理单元,用于根据用户n天次内所购某类商品的总含量及历史购物日期,计算待预测用户对该类商品的日均消耗量;
回购预测单元,用于结合所述日均消耗量及历史购物时间测试待预测用户对该类商品的再次回购时间。
与现有技术相比,本发明提供的用于电商平台的用户回购时间预测装置的有益效果与上述技术方案提供的用于电商平台的用户回购时间预测方法的有益效果相同,在此不做赘述。
本发明的第三方面提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述用于电商平台的用户回购时间预测方法的步骤。
与现有技术相比,本发明提供的计算机可读存储介质的有益效果与上述技术方案提供的用于电商平台的用户回购时间预测方法的有益效果相同,在此不做赘述。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例一中用于电商平台的用户回购时间预测方法的流程示意图;
图2为本发明实施例一中基于商品的功能用途将相同类目或相似类目的商品划分为同类商品的示例图;
图3为本发明实施例一中客户日均消耗数据的示例图;
图4为本发明实施例一中概率密度曲线的示例图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本发明保护的范围。
实施例一
请参阅图1,本实施例提供一种用于电商平台的用户回购时间预测方法,包括:
获取用户的历史购物数据;基于历史购物数据计算所购商品的净含量,汇总同类商品后得到各类商品的总含量;根据用户n天次内所购某类商品的总含量及历史购物日期,计算待预测用户对该类商品的日均消耗量,其中n≥2,且n为整数;结合所述日均消耗量及历史购物时间测算待预测用户对该类商品的再次回购时间。
本实施例提供的用于电商平台的用户回购时间预测方法中,通过采集用户的全部历史购物数据,汇总归类后预先统计每个用户在历史时段中所购各类商品的总含量,然后选定待预测用户并调取其在一段时间内,也即n天次内所购某类商品的总含量及历史购物日期,此处的某类商品可以理解为上述各类商品中的一种,然后分析计算出该待预测用户对该类商品的日均消耗量,并基于最近一天次的购买时间及购买量,推算出该批次购买量能够被持续消耗的天数,进而测算出该类商品的用尽日期,也即对该类商品的再次回购时间。
可以理解的是,上述天次购买量是指以天数为单位,汇总一天内所购某类商品的总含量,例如,一天内5次购买了某类商品,且每次购买量均为1千克,则该天次的购买量为5千克。另外,获取用户的历史购物数据,此处的“用户”是指平台注册的所有老用户,而上述待预测用户是指目标预测用户,目标预测用户既可以为平台的老用户也可以为平台的新用户,本实施例对此不做限制。
可见,使用上述用于电商平台的用户回购时间预测方法,通过实时跟踪电商平台中每个会员的历史购物数据,能够准确预测出其对某类商品的再次回购时间,以供电商平台实施精准营销。
需要说明的是,上述实施例所述的用于电商平台的用户回购时间预测方法,尤其适用于周期性消耗品,例如食品、卫生用品、酒水等。
考虑到底层获取的历史购物数据噪音过多,上述实施例中在获取用户的历史购物数据之后还包括:
清洗历史购物数据,去除刷单订单、退货订单和代购订单。
具体实施的过程中,对于刷单订单的去燥可采用设置刷单阈值的方式,如将单次订单商品数量大于99的订单识别为刷单订单,由于有效的购物数据仅为正向订单数据,因此需将退货订单剔除以保证数据的真实有效性,考虑到代购订单包括了多人的购物数据,故在去除代购订单时,可依据用户ID和城市代码进行分组,分析每个用户ID在每个城市的订单数量,选取数量最多的城市作为该用户ID所在城市,最终只保留用户ID所在城市的订单。
上述实施例中基于历史购物数据计算所购商品的净含量,汇总同类商品后得到各类商品的总含量之前还包括:
预设商品合并规则,将相同类目或相似类目的商品标记为同类可合并商品。
商品合并规则可基于商品的功能用途来划分,本实施例对此不做限制。如图2所示,将进口天然饮用水、进口天然矿泉水、进口矿物质水、进口纯净水、进口苏打水、纯净水、矿泉水、苏打水、蒸馏水等归类为饮用水类,玉米油、菜籽油、茶油、大豆油、色拉油等归类为食用油类。
具体地,上述实施例中基于历史购物数据计算所购商品的净含量的方法包括:
方式一、从订单商品名称中提取所购商品的净含量;若提取结果为空,根据订单商品名称从商品参数关系表中查找所购商品的净含量;方式三、若查找结果为空,根据订单商品名称依据同品牌同类商品的单位元购买量与历史购物数据中所购商品的实际付款金额,预估所购商品的净含量;方式四、若预估结果为空,根据订单商品名称依据非同品牌同类商品的单位元购买量与历史购物数据中所购商品的实际付款金额,预估所购商品的净含量。
具体实施时,所购商品净含量按照上述方式的优先级来确定,为了便于理解现依次对上述方式举例说明:
对于方式一,如订单商品名称为**品牌330ml瓶装矿泉水,则提取出所购商品的净含量为330ml;
对于方式二,对于订单商品名称不含有净含量的情况,则判断能否从电商平台的商品参数关系表中查找所购商品的净含量,若能查找到则提取使用,其中商品参数关系表在商品上线时由采购运营人员输入建立;
对于方式三,若商品参数关系表仍未查找到结果,则采用同品牌同类商品维度下的净含量参数补全,如**品牌500ml瓶装矿泉水的价格为A元,则单位元购买量应为而用户所购商品的实际付款金额为B元,则预估所购同品牌瓶装矿泉水的净含量应为unit_net×B;
对于方式四,预估结果继续为空,则采用非同品牌同类商品维度下的净含量参数补全,如500ml瓶装矿泉水的价格为C元,则单位元购买量为而用户所购商品的实际付款金额为D元,则预估所购瓶装矿泉水的净含量应为unit_net×D。
上述四种方式获取到的所购商品净含量的准确度依次递减,因此优先级越高的方式得到的所购商品净含量的准确度也越高,其中,方式四为兜底策略,避免无法预估所购商品净含量事件的发生,以扩大本实施例方法的应用场景。
具体地,上述实施例中根据一段时间所购某类商品的总含量及历史购物日期,计算待预测用户对该类商品的日均消耗量的方法包括:
按照用户ID、商品种类和购买日期三个维度,分别统计每个用户在指定时间段内购买某类商品的总含量及购买日期;对于购买了n天次的用户,获取至少一个间隔段的日均消耗数据;以商品种类维度汇总全部日均消耗数据,排序并去除极值干扰后绘制每类商品的概率密度曲线;将概率密度曲线的最高点作为对应类商品的日最佳消耗单位数,同时基于日最佳消耗单位数换算对应类商品的日合理消耗单位区间;判断待预测用户是否为有效老用户,有效老用户是指购买该类商品的天次大余2且截至当前商品未用尽的用户;当判断结果为是时,获取待预测用户对该类商品的购买日期及每天次购买的总含量,并计算每个间隔段的日均消耗数据;将待预测用户在该类商品上的各日均消耗数据分别与日合理消耗单位区间比较,并在比较结果不处于日合理消耗单位区间内时动态调整待预测用户在该类商品上的日均消耗数据;对多个日均消耗数据求均值得到待预测用户对该类商品的日均消耗量;当判断结果为否时,将该类商品下所有用户日均消耗量的均值作为待预测用户的日均消耗量。
具体实施时,按照用户ID、商品种类和购买日期三个维度,计算平台每个用户在某一天次内购买某类商品的总含量,对于购买了n天次的用户,获取对应间隔段的日均消耗数据,当2≤n<m时,则对应划分n-1个间隔段,其中m>2,且m为整数;当n≥m时,选取就近的m天次划分为m-1个间隔段,为了便于理解,请参阅图3,现以购买天次在5次及以上的一个客户为例说明,也即m取值等于5:5个天次由远及近分别为时间点1、时间点2、时间点3、时间点4和时间点5,相邻时间点构建的间隔段对应为间隔段1、间隔段2、间隔段3和间隔4,基于间隔点1购买某类商品的总含量及间隔段1,做商计算求得日均消耗数据1,以此类推,再分别求得日均消耗数据2、日均消耗数据3和日均消耗数据4,同样的采用上述方法再对全网的其他用户计算同类商品的日均消耗数据,最终将所有用户的日均消耗数据由大到小排序,去除极值干扰后绘制该类商品的概率密度曲线,例如,去除日均消耗数据最小值的5%和日均消耗数据最大值的5%,如图4所述,取概率密度曲线的最高点作为对应类商品的日最佳消耗单位数,并以日最佳消耗单位数的二分之一作为日合理消耗单位区间的最小值,以日最佳消耗单位数的二倍作为日合理消耗单位区间的最大值,最终换算得到对应类商品的日合理消耗单位区间。
继续以购买天次在5次及以上的待预测客户为例进行说明,获取其购买商品的5个时间点和4个间隔段,其中,第5个时间点也即为最近购买的天次日期,4个间隔段对应的日均消耗数据分别为日均消耗数据1、日均消耗数据2、日均消耗数据3和日均消耗数据4,当上述4个日均消耗数据全部处于日合理消耗单位区间时,直接对日均消耗数据求均值作为该待预测用户的日均消耗量,当上述4个日均消耗数据没有全部处于日合理消耗单位区间时,动态调整待预测用户在该类商品上的日均消耗数据。
对于不属于有效老用户的待预测用户来说,取该类商品下所有用户日均消耗量的均值作为待预测用户的日均消耗量。
通过上述实施过程可知,将待预测用户区分为有效老用户和非有效老用户,分别采取不同的计算手段来测算其日均消耗量,尽可能的保证有效老用户日均消耗量的测算精度,同时在对有效老用户日均消耗量的测算过程中,采取分区方式独立测算各间隔段对应的日均消耗数据,进一步的提高了测算精度,而选择将就近的5个天次是为了在保证数据精度可信的前提下减少数据计算量,在提高测算速度的同时减少计算资源的占用。同时,全网中的日均消耗数据实时动态修正,有效降低了异常日均消耗数据对计算结果带来的影响。
进一步地,上述实施例中将待预测用户在某类商品上的各日均消耗数据分别与日合理消耗单位区间比较,并在比较结果不处于日合理消耗单位区间内时动态调整待预测用户在该类商品上的日均消耗数据的方法包括:
S1,统计待预测用户对该类商品的日均消耗数据AVGp,按购物发生时间逆序排序后得到AVG1至AVGn-1,1≤p≤n-1,n≥2,且p和n均为整数;
S2,当AVGn-1小于日合理消耗单位区间的最小值时,剔除日均消耗数据AVGn-1,同时保留第n天次的购买总含量;
S3,当AVGn-1大于日合理消耗单位区间的最大值时,将第n天次与第n-1天次的购买总含量之和定义为第n-1天次的购买总含量,同时剔除日均消耗数据AVGn-1后重新计算日均消耗数据AVGn-2,若更新后的AVGn-2仍大于日合理消耗单位区间的最大值,则还原步骤S3的操作,仅将原始的日均消耗数据AVGn-1剔除,同时保留第n天次的购买总含量。
具体实施时,继续以购买天次在5次及以上的待预测客户为例进行说明,按购物发生时间逆序排序后得到日均消耗数据AVG4、日均消耗数据AVG3、日均消耗数据AVG2和日均消耗数据AVG1,如果日均消耗数据AVG4小于日合理消耗单位区间的最小值时,则说明间隔段的区间设置过大,此时需采取措施剔除日均消耗数据AVG4,仅保留第5天次的购买总含量;如果日均消耗数据AVG4大于日合理消耗单位区间的最大值时,则说明间隔段的区间设置过小,此时需将第5天次与第4天次的购买总含量之和定义为第4天次的购买总含量,同时剔除日均消耗数据AVG4,然后将上述定义的第4天次的购买总含量除以间隔段4与间隔段3之和重新计算日均消耗数据AVG3,若更新后的日均消耗数据AVG3处于日合理消耗单位区间内则保留该数据,同时保留第5天次的购买总含量,若更新后的日均消耗数据AVG3仍不处于日合理消耗单位区间内,则还原该步骤的操作,仅将原始的日均消耗数据AVG4剔除,仍旧保留第5天次的购买总含量。
上述实施例中结合日均消耗量及历史购物时间测算待预测用户对该类商品的再次回购时间的方法包括:
将第n天次的购买总含量与日均消耗量做商计算,求得待预测用户对该类商品的再次回购天数;判断当前日期距第n天次的购物日期的间隔是否大于再次回购天数,若是则说明待预测用户现处于缺货状态,可将当前时间定义为再次回购时间,若否则说明待预测用户现不缺货,则在第n天次的购物日期基础之上加上再次回购天数推算出再次回购时间。
实施例二
本实施例提供一种用于电商平台的用户回购时间预测装置,包括:
数据采集单元,用于获取用户的历史购物数据;
数据清洗单元,用于清洗所述历史购物数据,去除刷单订单、退货订单和代购订单;
规则设定单元,用于预设商品合并规则,将相同类目或相似类目的商品标记为同类可合并商品;
分类汇总单元,用于基于历史购物数据计算所购商品的净含量,汇总同类商品后得到各类商品的总含量;
计算处理单元,用于根据用户n天次内所购某类商品的总含量及历史购物日期,计算待预测用户对该类商品的日均消耗量;
回购预测单元,用于结合所述日均消耗量及历史购物时间测试待预测用户对该类商品的再次回购时间。
与现有技术相比,本发明实施例提供的用于电商平台的用户回购时间预测装置的有益效果与上述实施例一提供的用于电商平台的用户回购时间预测方法的有益效果相同,在此不做赘述。
实施例三
本实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述用于电商平台的用户回购时间预测方法的步骤。
与现有技术相比,本实施例提供的计算机可读存储介质的有益效果与上述技术方案提供的用于电商平台的用户回购时间预测方法的有益效果相同,在此不做赘述。
本领域普通技术人员可以理解,实现上述发明方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,上述程序可以存储于计算机可读取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,上述的存储介质可以是:ROM/RAM、磁碟、光盘、存储卡等。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种用于电商平台的用户回购时间预测方法,其特征在于,包括:
获取用户的历史购物数据;
基于历史购物数据计算所购商品的净含量,汇总同类商品后得到各类商品的总含量;
根据用户n天次内所购某类商品的总含量及历史购物日期,计算待预测用户对该类商品的日均消耗量,其中n≥2,且n为整数;
结合所述日均消耗量及历史购物时间测算待预测用户对该类商品的再次回购时间。
2.根据权利要求1所述的方法,其特征在于,在获取用户的历史购物数据之后还包括:
清洗所述历史购物数据,去除刷单订单、退货订单和代购订单。
3.根据权利要求1或2所述的方法,其特征在于,基于历史购物数据计算所购商品的净含量,汇总同类商品后得到各类商品的总含量之前还包括:
预设商品合并规则,将相同类目或相似类目的商品标记为同类可合并商品。
4.根据权利要求3所述的方法,其特征在于,基于历史购物数据计算所购商品的净含量的方法包括:
从订单商品名称中提取所购商品的净含量;
若提取结果为空,根据订单商品名称从商品参数关系表中查找所购商品的净含量;
若查找结果为空,根据订单商品名称依据同品牌同类商品的单位元购买量与历史购物数据中所购商品的实际付款金额,预估所购商品的净含量;
若预估结果为空,根据订单商品名称依据非同品牌同类商品的单位元购买量与历史购物数据中所购商品的实际付款金额,预估所购商品的净含量。
5.根据权利要求1所述的方法,其特征在于,根据用户n天次内所购某类商品的总含量及历史购物日期,计算待预测用户对该类商品的日均消耗量的方法包括:
按照用户ID、商品种类和购买日期三个维度,分别统计每个用户在指定时间段内购买某类商品的总含量及购买日期;
对于购买了n天次的用户,获取至少一个间隔段的日均消耗数据;
以商品种类维度汇总全部日均消耗数据,排序并去除极值干扰后绘制每类商品的概率密度曲线;
将概率密度曲线的最高点作为对应类商品的日最佳消耗单位数,同时基于日最佳消耗单位数换算对应类商品的日合理消耗单位区间;
判断待预测用户是否为有效老用户,所述有效老用户是指购买该类商品的天次大余2且截至当前商品未用尽的用户;
当判断结果为是时,获取待预测用户对该类商品的购买日期及每天次购买的总含量,并计算每个间隔段的日均消耗数据;
将待预测用户在该类商品上的各日均消耗数据分别与所述日合理消耗单位区间比较,并在比较结果不处于所述日合理消耗单位区间内时动态调整待预测用户在该类商品上的日均消耗数据;
对多个所述日均消耗数据求均值得到待预测用户对该类商品的日均消耗量;
当判断结果为否时,将该类商品下所有用户日均消耗量的均值作为待预测用户的日均消耗量。
6.根据权利要求5所述的方法,其特征在于,间隔段的设置原则为:
当2≤n<m时,则对应划分n-1个间隔段,其中m>2,且m为整数;
当n≥m时,选取就近的m天次划分为m-1个间隔段。
7.根据权利要求5所述的方法,其特征在于,将待预测用户在该类商品上的各日均消耗数据分别与所述日合理消耗单位区间比较,并在比较结果不处于所述日合理消耗单位区间内时动态调整待预测用户在该类商品上的日均消耗数据的方法包括:
S1,统计待预测用户对该类商品的日均消耗数据AVGp,按购物发生时间逆序排序后得到AVG1至AVGn-1,1≤p≤n-1,且p为整数;
S2,当AVGn-1小于所述日合理消耗单位区间的最小值时,剔除日均消耗数据AVGn-1,同时保留第n天次的购买总含量;
S3,当AVGn-1大于所述日合理消耗单位区间的最大值时,将第n天次与第n-1天次的购买总含量之和定义为第n-1天次的购买总含量,同时剔除日均消耗数据AVGn-1后重新计算日均消耗数据AVGn-2,若更新后的AVGn-2仍大于所述日合理消耗单位区间的最大值,则还原步骤S3的操作,仅将原始的日均消耗数据AVGn-1剔除,同时保留第n天次的购买总含量。
8.根据权利要求7所述的方法,其特征在于,结合所述日均消耗量及历史购物时间测算待预测用户对该类商品的再次回购时间的方法包括:
将第n天次的购买总含量与所述日均消耗量做商计算,求得待预测用户对该类商品的再次回购天数;
判断当前日期距第n天次的购物日期的间隔是否大于所述再次回购天数,若是则将当前时间定义为再次回购时间,若否则在第n天次的购物日期基础之上加上所述再次回购天数推算出再次回购时间。
9.一种用于电商平台的用户回购时间预测装置,其特征在于,包括:
数据采集单元,用于获取用户的历史购物数据;
数据清洗单元,用于清洗所述历史购物数据,去除刷单订单、退货订单和代购订单;
规则设定单元,用于预设商品合并规则,将相同类目或相似类目的商品标记为同类可合并商品;
分类汇总单元,用于基于历史购物数据计算所购商品的净含量,汇总同类商品后得到各类商品的总含量;
计算处理单元,用于根据用户n天次内所购某类商品的总含量及历史购物日期,计算待预测用户对该类商品的日均消耗量;
回购预测单元,用于结合所述日均消耗量及历史购物时间测试待预测用户对该类商品的再次回购时间。
10.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,计算机程序被处理器运行时执行上述权利要求1至8任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910759670.4A CN110570233A (zh) | 2019-08-16 | 2019-08-16 | 用于电商平台的用户回购时间预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910759670.4A CN110570233A (zh) | 2019-08-16 | 2019-08-16 | 用于电商平台的用户回购时间预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110570233A true CN110570233A (zh) | 2019-12-13 |
Family
ID=68775514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910759670.4A Pending CN110570233A (zh) | 2019-08-16 | 2019-08-16 | 用于电商平台的用户回购时间预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110570233A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428143A (zh) * | 2020-06-11 | 2020-07-17 | 北京每日优鲜电子商务有限公司 | 一种商品推荐方法及系统、服务器及存储介质 |
CN111461632A (zh) * | 2020-06-18 | 2020-07-28 | 北京每日优鲜电子商务有限公司 | 商品供需平衡方法及系统、服务器及介质 |
CN111476626A (zh) * | 2020-03-04 | 2020-07-31 | 珠海市百岛科技有限公司 | 智能订水方法及智能水站系统 |
CN111695937A (zh) * | 2020-05-29 | 2020-09-22 | 北京慧博科技有限公司 | 分析用户回购的方法、装置以及计算机可读存储介质 |
CN113128739A (zh) * | 2019-12-31 | 2021-07-16 | 马上消费金融股份有限公司 | 用户触达时间的预测方法、预测模型训练方法及相关装置 |
CN115471302A (zh) * | 2022-11-14 | 2022-12-13 | 山东智豆数字科技有限公司 | 基于大数据分析的电子营销数据处理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107437203A (zh) * | 2017-08-07 | 2017-12-05 | 北京京东尚科信息技术有限公司 | 信息推送方法、装置、电子装置及计算机可读介质 |
CN108520469A (zh) * | 2018-06-19 | 2018-09-11 | 南京新贝金服科技有限公司 | 一种基于电商平台的用户重购行为分析方法 |
CN108764974A (zh) * | 2018-05-11 | 2018-11-06 | 国网电子商务有限公司 | 一种基于深度学习的商品采购量预测方法及装置 |
CN109064261A (zh) * | 2018-07-12 | 2018-12-21 | 北京京东金融科技控股有限公司 | 推荐商品的方法、装置和计算机可读存储介质 |
CN109146533A (zh) * | 2017-06-28 | 2019-01-04 | 北京京东尚科信息技术有限公司 | 信息推送方法和装置 |
-
2019
- 2019-08-16 CN CN201910759670.4A patent/CN110570233A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146533A (zh) * | 2017-06-28 | 2019-01-04 | 北京京东尚科信息技术有限公司 | 信息推送方法和装置 |
CN107437203A (zh) * | 2017-08-07 | 2017-12-05 | 北京京东尚科信息技术有限公司 | 信息推送方法、装置、电子装置及计算机可读介质 |
CN108764974A (zh) * | 2018-05-11 | 2018-11-06 | 国网电子商务有限公司 | 一种基于深度学习的商品采购量预测方法及装置 |
CN108520469A (zh) * | 2018-06-19 | 2018-09-11 | 南京新贝金服科技有限公司 | 一种基于电商平台的用户重购行为分析方法 |
CN109064261A (zh) * | 2018-07-12 | 2018-12-21 | 北京京东金融科技控股有限公司 | 推荐商品的方法、装置和计算机可读存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113128739A (zh) * | 2019-12-31 | 2021-07-16 | 马上消费金融股份有限公司 | 用户触达时间的预测方法、预测模型训练方法及相关装置 |
CN111476626A (zh) * | 2020-03-04 | 2020-07-31 | 珠海市百岛科技有限公司 | 智能订水方法及智能水站系统 |
CN111695937A (zh) * | 2020-05-29 | 2020-09-22 | 北京慧博科技有限公司 | 分析用户回购的方法、装置以及计算机可读存储介质 |
CN111428143A (zh) * | 2020-06-11 | 2020-07-17 | 北京每日优鲜电子商务有限公司 | 一种商品推荐方法及系统、服务器及存储介质 |
CN111461632A (zh) * | 2020-06-18 | 2020-07-28 | 北京每日优鲜电子商务有限公司 | 商品供需平衡方法及系统、服务器及介质 |
CN115471302A (zh) * | 2022-11-14 | 2022-12-13 | 山东智豆数字科技有限公司 | 基于大数据分析的电子营销数据处理方法 |
CN115471302B (zh) * | 2022-11-14 | 2023-02-14 | 山东智豆数字科技有限公司 | 基于大数据分析的电子营销数据处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110570233A (zh) | 用于电商平台的用户回购时间预测方法及装置 | |
CN108629665B (zh) | 一种个性化商品推荐方法和系统 | |
CN107146089B (zh) | 一种刷单识别方法及装置,电子设备 | |
CN103778214B (zh) | 一种基于用户评论的商品属性聚类方法 | |
CN111445134B (zh) | 商品的销量预测方法、装置、计算机设备和存储介质 | |
CN107562818A (zh) | 信息推荐系统及方法 | |
CN106844787A (zh) | 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法 | |
CN107230098A (zh) | 一种业务对象的分时推荐方法和系统 | |
CN108921398B (zh) | 店铺质量评价方法及装置 | |
CN103092877A (zh) | 一种关键词推荐方法和装置 | |
CN102902691A (zh) | 推荐方法及系统 | |
KR20140056731A (ko) | 구매추천 시스템 및 방법 | |
CN109447762A (zh) | 商品推荐方法及其装置、服务器、商品推荐系统 | |
CN104835057A (zh) | 一种获取网络用户的消费特征信息的方法及装置 | |
CN107679103B (zh) | 用于实体的属性分析方法及系统 | |
CN111737418B (zh) | 搜索词和商品的相关性预测方法、设备和存储介质 | |
CN115496566B (zh) | 基于大数据的地区特产推荐方法及系统 | |
CN111352976B (zh) | 一种针对购物节的搜索广告转化率预测方法及装置 | |
CN110197404A (zh) | 可降低流行度偏差的个性化长尾商品推荐方法和系统 | |
CN110880127A (zh) | 消费水平的预测方法、装置、电子设备及存储介质 | |
CN110647679A (zh) | 一种o2o场景下的搜索结果综合排序方法 | |
CN103903148A (zh) | C2c系统、b2c系统及其使用方法 | |
CN110910207A (zh) | 一种提升商品推荐多样性的方法及系统 | |
CN107133811A (zh) | 一种目标用户的识别方法和装置 | |
CN116029637A (zh) | 跨境电商物流渠道智能推荐方法及装置、设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191213 |
|
RJ01 | Rejection of invention patent application after publication |