CN111861556A - 一种消费者购买强度的预测方法 - Google Patents

一种消费者购买强度的预测方法 Download PDF

Info

Publication number
CN111861556A
CN111861556A CN202010686233.7A CN202010686233A CN111861556A CN 111861556 A CN111861556 A CN 111861556A CN 202010686233 A CN202010686233 A CN 202010686233A CN 111861556 A CN111861556 A CN 111861556A
Authority
CN
China
Prior art keywords
purchase
interval
user
average
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010686233.7A
Other languages
English (en)
Other versions
CN111861556B (zh
Inventor
陈新宇
周健文
蒲继强
陈新伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Yunxi Technology Co ltd
Original Assignee
Guangzhou Yunxi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Yunxi Technology Co ltd filed Critical Guangzhou Yunxi Technology Co ltd
Priority to CN202010686233.7A priority Critical patent/CN111861556B/zh
Publication of CN111861556A publication Critical patent/CN111861556A/zh
Application granted granted Critical
Publication of CN111861556B publication Critical patent/CN111861556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种消费者购买强度的预测方法,包括:S1,获取有过购买行为的用户在预设时间段内的购买数据;S2,判断用户的购买次数是否大于等于3;若是,则执行步骤S3;S3,将购买日期转化为购买间隔,根据购买间隔计算出个人平均购买间隔和整体平均购买间隔;S4,将个人平均购买间隔和整体平均购买间隔进行加权得到最优个人购买间隔;S5,从半正态分布Half‑Normal,得到用户的half_norm分布参数;S6,根据用户最后一次购买时间、个人最优购买和对应的half_norm分布参数计算用户未来预设时间内的购买强度函数。本发明计算出用户未来一段时间的购买强度,从而圈定目标用户,提升精准营销的效果。

Description

一种消费者购买强度的预测方法
技术领域
本发明涉及电商平台大数据技术领域,具体涉及一种消费者购买强度的预测方法。
背景技术
随着电商平台的高速发展,沉淀了数亿的忠实用户,积累了海量的真实数据。如何从历史数据中找出规律,去预测用户未来的购买需求,让最合适的商品遇见最需要的人,是大数据应用在精准营销中的关键问题,也是所有电商平台在做智能化升级时所需要的核心技术。
当前电商平台的营销和推荐主要是根据用户在电商平台上的行为,包括:搜索、浏览、购买等行为进行分析,然后进行商品推荐。但是往往用户的这些行为是即性或者是一次性的刚性需求,不能准确代表用户的多次购买需求,更无法准确的预测用户的后续购买时间段及对应的商品。
因此,行业内急需研发一种基于用户重复购买行为准确预测用户未来一段时间会产生购买行为的强度的方法或者系统。
发明内容
本发明的目的是为了克服以上现有技术存在的不足,提供了一种能计算出用户未来一段时间的购买强度的消费者购买强度的预测方法。
本发明的目的通过以下的技术方案实现:
一种消费者购买强度的预测方法,包括:
S1,获取有过购买行为的用户在预设时间段内的购买数据,对所述购买数据进行清洗,所述购买数据包括会员ID、购买日期,购买次数;
S2,判断用户的购买次数是否大于等于3;若是,则执行步骤S3;
S3,将购买日期转化为购买间隔,根据购买间隔计算出个人平均购买间隔和整体平均购买间隔;
S4,将个人平均购买间隔和整体平均购买间隔进行加权得到最优个人购买间隔;其中,个人最优购买间隔服从半正态分布Half-Normal;
S5,从半正态分布Half-Normal,得到用户的half_norm分布参数;
S6,根据用户最后一次购买时间、个人最优购买和对应的half_norm分布参数计算用户未来预设时间内的购买强度函数;
S7,将购买强度值大于预设值的用于定义为最具潜在购物倾向的消费者,对其进行精准消费人群触达。
优选地,对所述购买数据进行清洗包括:判断所有的购买日期是否格式一致,若不一致,则通过日期格式转换的方法标准化所有的购买日期格式;判断购买金额是否正常,若购买金额异常,则剔除所述购买金额数据。
优选地,购买金额异常为购买金额为负数或0,且经过判断负数或0的情况不合理。
优选地,在步骤S2中,若判断为否,则直接根据整体平均购买间隔得到个人最优购买间隔。
优选地,直接根据整体平均购买间隔得到个人最优购买间隔包括:根据整体平均购买间隔得到整体平均购买间隔方差,根据整体最优购买间隔和整体平均购买间隔方差得到个人最优购买间隔。
优选地,所述购买数据还包括购买数量和购买金额。
本发明相对于现有技术具有如下优点:
本发明通过对有过购买行为的用户在预设时间段内的购买数据进行清洗、转换成购买间隔,根据购买间隔计算出服从半正态分布Half-Normal的最优个人购买间隔,从半正态分布Half-Normal,得到用户的half_norm分布参数;然后根据用户最后一次购买时间、个人最优购买和对应的half_norm分布参数计算用户未来预设时间内的购买强度函数;最终将购买强度值大于预设值的用于定义为最具潜在购物倾向的消费者,对其进行精准消费人群触达。本发明显式的计算出用户未来一段时间的购买强度,从而圈定目标用户,提升精准营销的效果。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明的消费者购买强度的预测方法的结构示意图。
图2为本发明的购买强度函数hazard function的预测图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
参见图1、一种消费者购买强度的预测方法,包括:
S1,获取有过购买行为的用户在预设时间段内的购买数据,对所述购买数据进行清洗;所述购买数据包括会员ID、购买日期,购买次数、购买数量和购买金额;购买数据原始订单明细中获取,原始数据里面存在很多噪声,第一步先要对数据清洗。
具体地,对所述购买数据进行清洗包括:判断所有的购买日期是否格式一致,比如是否都为YYYY/MM/DD格式。若不一致,则通过日期格式转换的方法标准化所有的购买日期格式;判断购买金额是否正常,若购买金额异常,则剔除所述购买金额数据。购买金额异常为购买金额为负数或0,且经过判断负数或0的情况不合理。
S2,判断用户的购买次数是否大于等于3;若是,则执行步骤S3;若判断为否,则直接根据整体平均购买间隔得到个人最优购买间隔。具体地,直接根据整体平均购买间隔得到个人最优购买间隔包括:根据整体平均购买间隔得到整体平均购买间隔方差,根据整体最优购买间隔和整体平均购买间隔方差得到个人最优购买间隔。
S3,将购买日期转化为购买间隔,根据购买间隔计算出个人平均购买间隔和整体平均购买间隔;
将购买日期转化为购买间隔的实施代码为inter_purchase_time_dict[user_id_i]=[inter_t_i_1,inter_t_i_2,inter_t_i_3…inter_t_i_n],inter_t_i_j代表user_id_i第j次购买间隔。
S4,将个人平均购买间隔和整体平均购买间隔进行加权得到最优个人购买间隔;其中:根据个人平均购买间隔得到个人平均购买间隔方差,根据整体平均购买间隔得到整体平均购买间隔方差。根据个人平均购买间隔、个人平均购买间隔方差、整体最优购买间隔和整体平均购买间隔方差得到个人最优购买间隔。
其中,个人最优购买间隔服从半正态分布Half-Normal;
个人最优购买间隔gap_mean_adj=w1×(IM)+w2×(GM)
其中,IM为个人平均购买间隔,w1为个人平均购买间隔的权重,GM为整体平均购买间隔,w2为整体平均购买间隔的权重,当该用户重复购买次数多(ni大):w1权重高,主要参考IM;当该用户重复购买次数少(ni小):w2权重高,主要参考GM;个人平均购买间隔为个人所有的购买间隔之和除以购买间隔的个数。整体平均购买间隔为所有用户的个人平均购买间隔之和除以用户数。
当该用户只购买过一次时:w1=0,此时完全以GM为主;假设整体平均购买间隔为186天:
cust rep_counts gap_mean gap_mean_adj
1 0 NA 186
2 4 62 105
3 3 152 166
4 17 57 71
5 3 176 180
S5,从半正态分布Half-Normal,得到用户的half_norm分布参数;
个人购买间隔均值参数:mu_star_dict,
个人购买间隔方差参数:sigma_star_dict
间隔个数参数:num_dict
E参数:E_dict
half_norm分布参数:half_norm_dict
整体购买间隔均值参数:mu=mean(mu_star_dict)
sigma=var(mu_star_dict)
alpha=mu**2/sigma+2
theta=sigma/mu/(mu**2+sigma)
E_dict[i]=num_dict[i]*mu_star_dict[i]/(num_dict[i]+alpha-1)+1.0/(num_dict[i]+alpha-1)/theta
half_norm_dict[i]=E_dict[i]*(pi**0.5)/(2**0.5)
至此可以得到每个用户的half_norm分布参数
S6,根据用户最后一次购买时间、个人最优购买和对应的half_norm分布参数计算用户未来预设时间内的购买强度函数hazard function;在本实施例,为计算用户未来7天内的购买强度函数hazard function。
Hazard(i)=half-normal.pdf(i),
Hazard_7days=Hazard(1)+Hazard(2)+Hazard(3)+Hazard(4)+
Hazard(5)+Hazard(6)+Hazard(7),
其中,pdf是指概率密度函数:在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。probability density function,简称PDF。如图2所示。
假设如图2为某用户半正态分布曲线,b点为今天,a点为这个用户最后一次购买日期,c点为7天后的日期,那么这个用户未来7天的购买强度Hazard_7days的值为这7天(即b和c之间(阴影部分))的面积。
步骤S6之后还包括结果输出,具体为,输出会员ID,购买强度函数hazardfunction,是否购买标签等。
S7,将购买强度值大于预设值的用于定义为最具潜在购物倾向的消费者,对其进行精准消费人群触达,提升复购率。
综上,所以本方案主要以研究有重复购买行为的用户为主,通过算法预测用户未来一段时间是否会产生购买行为,而非商品推荐。比如说:在最近一年时间内,用户A和B的平均购买间隔为30天和40天,假设用户A最近一次购买行为距离今天25天,用户B最近一次购买行为距离今天5天;那么可以大胆的判断,未来7天用户A产生购买行为的可能性比用户B大。
通过本发明,可以达到以下效果:
(1)提升电商平台筛选营销用户效率及准确率:可通过使用算法前和使用算法后准确率进行对比。如:某电商平台未来有一档活动,需要通过广告投放(短信触达)来吸引顾客购买,假设平台圈定目标人群20000人,最终有1000人产生了购买;通过使用本算法可能只需要圈定10000人,就有1000人产生购买,从而提升筛选营销用户的效率。
(2)提升电商平台营销活动的转化率:可通过使用算法前和使用算法后营销活动的转化率进行对比。如:某电商平台有一档活动,活动整体的转化率为5%,在使用本算法后,可能活动整体转化率达到8%(甚至更高),从而提升营销活动的整体转化率。
(3)提升电商平台在推广活动投放的广告的转化率:可通过使用算法前和使用算法后投放广告的转化率进行对比。如:某电商平台未来有一档活动,需要通过广告投放(短信触达)来吸引顾客购买,假设平台圈定目标人群20000人,最终有1000人产生了购买;通过使用本算法圈定20000人,可能2000人产生购买,同样的投放成本,转化率得到提升。
上述具体实施方式为本发明的优选实施例,并不能对本发明进行限定,其他的任何未背离本发明的技术方案而所做的改变或其它等效的置换方式,都包含在本发明的保护范围之内。

Claims (6)

1.一种消费者购买强度的预测方法,其特征在于,包括:
S1,获取有过购买行为的用户在预设时间段内的购买数据,对所述购买数据进行清洗,所述购买数据包括会员ID、购买日期,购买次数;
S2,判断用户的购买次数是否大于等于3;若是,则执行步骤S3;
S3,将购买日期转化为购买间隔,根据购买间隔计算出个人平均购买间隔和整体平均购买间隔;
S4,将个人平均购买间隔和整体平均购买间隔进行加权得到最优个人购买间隔;其中,个人最优购买间隔服从半正态分布Half-Normal;
S5,从半正态分布Half-Normal,得到用户的half_norm分布参数;
S6,根据用户最后一次购买时间、个人最优购买和对应的half_norm分布参数计算用户未来预设时间内的购买强度函数;
S7,将购买强度值大于预设值的用于定义为最具潜在购物倾向的消费者,对其进行精准消费人群触达。
2.根据权利要求1所述的消费者购买强度的预测方法,其特征在于,对所述购买数据进行清洗包括:
判断所有的购买日期是否格式一致,若不一致,则通过日期格式转换的方法标准化所有的购买日期格式;
判断购买金额是否正常,若购买金额异常,则剔除所述购买金额数据。
3.根据权利要求2所述的消费者购买强度的预测方法,其特征在于,购买金额异常为购买金额为负数或0,且经过判断负数或0的情况不合理。
4.根据权利要求1所述的消费者购买强度的预测方法,其特征在于,在步骤S2中,若判断为否,则直接根据整体平均购买间隔得到个人最优购买间隔。
5.根据权利要求4所述的消费者购买强度的预测方法,其特征在于,直接根据整体平均购买间隔得到个人最优购买间隔包括:根据整体平均购买间隔得到整体平均购买间隔方差,根据整体最优购买间隔和整体平均购买间隔方差得到个人最优购买间隔。
6.根据权利要求1所述的消费者购买强度的预测方法,其特征在于,所述购买数据还包括购买数量和购买金额。
CN202010686233.7A 2020-07-16 2020-07-16 一种消费者购买强度的预测方法 Active CN111861556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010686233.7A CN111861556B (zh) 2020-07-16 2020-07-16 一种消费者购买强度的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010686233.7A CN111861556B (zh) 2020-07-16 2020-07-16 一种消费者购买强度的预测方法

Publications (2)

Publication Number Publication Date
CN111861556A true CN111861556A (zh) 2020-10-30
CN111861556B CN111861556B (zh) 2024-05-24

Family

ID=72983621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010686233.7A Active CN111861556B (zh) 2020-07-16 2020-07-16 一种消费者购买强度的预测方法

Country Status (1)

Country Link
CN (1) CN111861556B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140222653A1 (en) * 2011-09-08 2014-08-07 Tokyo Institute Of Technology Method and program for detecting change-point of time-series data, and method and program for predicting probability density distribution of future time-series data values
CN106485536A (zh) * 2015-08-31 2017-03-08 功典资讯股份有限公司 决定下次购买时间区间的方法以及系统
JP6253744B1 (ja) * 2016-11-04 2017-12-27 ヤフー株式会社 情報解析装置、情報解析方法、および情報解析プログラム
CN107993088A (zh) * 2017-11-20 2018-05-04 北京三快在线科技有限公司 一种购买周期预测方法及装置,电子设备
CN110009457A (zh) * 2019-04-09 2019-07-12 昆山古鳌电子机械有限公司 一种基于大数据的商品推荐系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140222653A1 (en) * 2011-09-08 2014-08-07 Tokyo Institute Of Technology Method and program for detecting change-point of time-series data, and method and program for predicting probability density distribution of future time-series data values
CN106485536A (zh) * 2015-08-31 2017-03-08 功典资讯股份有限公司 决定下次购买时间区间的方法以及系统
JP6253744B1 (ja) * 2016-11-04 2017-12-27 ヤフー株式会社 情報解析装置、情報解析方法、および情報解析プログラム
CN107993088A (zh) * 2017-11-20 2018-05-04 北京三快在线科技有限公司 一种购买周期预测方法及装置,电子设备
CN110009457A (zh) * 2019-04-09 2019-07-12 昆山古鳌电子机械有限公司 一种基于大数据的商品推荐系统

Also Published As

Publication number Publication date
CN111861556B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
US11055640B2 (en) Generating product decisions
Hadden et al. Computer assisted customer churn management: State-of-the-art and future trends
Chien et al. Manufacturing intelligence for semiconductor demand forecast based on technology diffusion and product life cycle
US20200051099A1 (en) Sales prediction systems and methods
US9165270B2 (en) Predicting likelihood of customer attrition and retention measures
US7577579B2 (en) Method of predicting sales based on triple-axis mapping of customer value
CN102156932A (zh) 一种客户再次购买意向预测方法及装置
US20200311748A1 (en) Consumer response intelligent spend prediction system
Letham et al. Latent variable copula inference for bundle pricing from retail transaction data
Shin et al. Multi-attribute scoring method for mobile telecommunication subscribers
Aminu et al. Perceived risk barriers to internet shopping
Danaher et al. Bacon with your eggs? Applications of a new bivariate beta-binomial distribution
CN111861679A (zh) 一种基于人工智能的商品推荐方法
Kazmi et al. Generic framework to predict repeat behavior of customers using their transaction history
CN111861556A (zh) 一种消费者购买强度的预测方法
Tarokh et al. A new model to speculate CLV based on Markov chain model
CN111127072A (zh) 一种新产品需求的多阶段实时预测方法
Yu et al. A new approach to customer targeting under conditions of information shortage
CN114463085A (zh) 自动化营销的通用沟通互动方法、装置、电子设备及存储介质
Gung et al. The use of hybrid analytics to establish effective strategies for household energy conservation
Chee et al. Data Analytics Approach for Short-term Sales Forecasts Using Limited Information in E-commerce Marketplace
Iwata et al. Extracting innovative buyers by scoring using Innovator Theory
Katrodia A Study of Indentity Consumer Purchasing Behavior and Factors that Influence Consumer Purchse Decision: With Reference to Durban
Kroekbodin The Effectiveness of Email Marketing Toward Purchasing Intention
US20240185272A1 (en) Sales prediction systems and methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant