CN111861556A - 一种消费者购买强度的预测方法 - Google Patents
一种消费者购买强度的预测方法 Download PDFInfo
- Publication number
- CN111861556A CN111861556A CN202010686233.7A CN202010686233A CN111861556A CN 111861556 A CN111861556 A CN 111861556A CN 202010686233 A CN202010686233 A CN 202010686233A CN 111861556 A CN111861556 A CN 111861556A
- Authority
- CN
- China
- Prior art keywords
- purchase
- interval
- user
- average
- optimal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 12
- 230000006399 behavior Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种消费者购买强度的预测方法,包括:S1,获取有过购买行为的用户在预设时间段内的购买数据;S2,判断用户的购买次数是否大于等于3;若是,则执行步骤S3;S3,将购买日期转化为购买间隔,根据购买间隔计算出个人平均购买间隔和整体平均购买间隔;S4,将个人平均购买间隔和整体平均购买间隔进行加权得到最优个人购买间隔;S5,从半正态分布Half‑Normal,得到用户的half_norm分布参数;S6,根据用户最后一次购买时间、个人最优购买和对应的half_norm分布参数计算用户未来预设时间内的购买强度函数。本发明计算出用户未来一段时间的购买强度,从而圈定目标用户,提升精准营销的效果。
Description
技术领域
本发明涉及电商平台大数据技术领域,具体涉及一种消费者购买强度的预测方法。
背景技术
随着电商平台的高速发展,沉淀了数亿的忠实用户,积累了海量的真实数据。如何从历史数据中找出规律,去预测用户未来的购买需求,让最合适的商品遇见最需要的人,是大数据应用在精准营销中的关键问题,也是所有电商平台在做智能化升级时所需要的核心技术。
当前电商平台的营销和推荐主要是根据用户在电商平台上的行为,包括:搜索、浏览、购买等行为进行分析,然后进行商品推荐。但是往往用户的这些行为是即性或者是一次性的刚性需求,不能准确代表用户的多次购买需求,更无法准确的预测用户的后续购买时间段及对应的商品。
因此,行业内急需研发一种基于用户重复购买行为准确预测用户未来一段时间会产生购买行为的强度的方法或者系统。
发明内容
本发明的目的是为了克服以上现有技术存在的不足,提供了一种能计算出用户未来一段时间的购买强度的消费者购买强度的预测方法。
本发明的目的通过以下的技术方案实现:
一种消费者购买强度的预测方法,包括:
S1,获取有过购买行为的用户在预设时间段内的购买数据,对所述购买数据进行清洗,所述购买数据包括会员ID、购买日期,购买次数;
S2,判断用户的购买次数是否大于等于3;若是,则执行步骤S3;
S3,将购买日期转化为购买间隔,根据购买间隔计算出个人平均购买间隔和整体平均购买间隔;
S4,将个人平均购买间隔和整体平均购买间隔进行加权得到最优个人购买间隔;其中,个人最优购买间隔服从半正态分布Half-Normal;
S5,从半正态分布Half-Normal,得到用户的half_norm分布参数;
S6,根据用户最后一次购买时间、个人最优购买和对应的half_norm分布参数计算用户未来预设时间内的购买强度函数;
S7,将购买强度值大于预设值的用于定义为最具潜在购物倾向的消费者,对其进行精准消费人群触达。
优选地,对所述购买数据进行清洗包括:判断所有的购买日期是否格式一致,若不一致,则通过日期格式转换的方法标准化所有的购买日期格式;判断购买金额是否正常,若购买金额异常,则剔除所述购买金额数据。
优选地,购买金额异常为购买金额为负数或0,且经过判断负数或0的情况不合理。
优选地,在步骤S2中,若判断为否,则直接根据整体平均购买间隔得到个人最优购买间隔。
优选地,直接根据整体平均购买间隔得到个人最优购买间隔包括:根据整体平均购买间隔得到整体平均购买间隔方差,根据整体最优购买间隔和整体平均购买间隔方差得到个人最优购买间隔。
优选地,所述购买数据还包括购买数量和购买金额。
本发明相对于现有技术具有如下优点:
本发明通过对有过购买行为的用户在预设时间段内的购买数据进行清洗、转换成购买间隔,根据购买间隔计算出服从半正态分布Half-Normal的最优个人购买间隔,从半正态分布Half-Normal,得到用户的half_norm分布参数;然后根据用户最后一次购买时间、个人最优购买和对应的half_norm分布参数计算用户未来预设时间内的购买强度函数;最终将购买强度值大于预设值的用于定义为最具潜在购物倾向的消费者,对其进行精准消费人群触达。本发明显式的计算出用户未来一段时间的购买强度,从而圈定目标用户,提升精准营销的效果。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明的消费者购买强度的预测方法的结构示意图。
图2为本发明的购买强度函数hazard function的预测图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
参见图1、一种消费者购买强度的预测方法,包括:
S1,获取有过购买行为的用户在预设时间段内的购买数据,对所述购买数据进行清洗;所述购买数据包括会员ID、购买日期,购买次数、购买数量和购买金额;购买数据原始订单明细中获取,原始数据里面存在很多噪声,第一步先要对数据清洗。
具体地,对所述购买数据进行清洗包括:判断所有的购买日期是否格式一致,比如是否都为YYYY/MM/DD格式。若不一致,则通过日期格式转换的方法标准化所有的购买日期格式;判断购买金额是否正常,若购买金额异常,则剔除所述购买金额数据。购买金额异常为购买金额为负数或0,且经过判断负数或0的情况不合理。
S2,判断用户的购买次数是否大于等于3;若是,则执行步骤S3;若判断为否,则直接根据整体平均购买间隔得到个人最优购买间隔。具体地,直接根据整体平均购买间隔得到个人最优购买间隔包括:根据整体平均购买间隔得到整体平均购买间隔方差,根据整体最优购买间隔和整体平均购买间隔方差得到个人最优购买间隔。
S3,将购买日期转化为购买间隔,根据购买间隔计算出个人平均购买间隔和整体平均购买间隔;
将购买日期转化为购买间隔的实施代码为inter_purchase_time_dict[user_id_i]=[inter_t_i_1,inter_t_i_2,inter_t_i_3…inter_t_i_n],inter_t_i_j代表user_id_i第j次购买间隔。
S4,将个人平均购买间隔和整体平均购买间隔进行加权得到最优个人购买间隔;其中:根据个人平均购买间隔得到个人平均购买间隔方差,根据整体平均购买间隔得到整体平均购买间隔方差。根据个人平均购买间隔、个人平均购买间隔方差、整体最优购买间隔和整体平均购买间隔方差得到个人最优购买间隔。
其中,个人最优购买间隔服从半正态分布Half-Normal;
个人最优购买间隔gap_mean_adj=w1×(IM)+w2×(GM)
其中,IM为个人平均购买间隔,w1为个人平均购买间隔的权重,GM为整体平均购买间隔,w2为整体平均购买间隔的权重,当该用户重复购买次数多(ni大):w1权重高,主要参考IM;当该用户重复购买次数少(ni小):w2权重高,主要参考GM;个人平均购买间隔为个人所有的购买间隔之和除以购买间隔的个数。整体平均购买间隔为所有用户的个人平均购买间隔之和除以用户数。
当该用户只购买过一次时:w1=0,此时完全以GM为主;假设整体平均购买间隔为186天:
cust | rep_counts | gap_mean | gap_mean_adj |
1 | 0 | NA | 186 |
2 | 4 | 62 | 105 |
3 | 3 | 152 | 166 |
4 | 17 | 57 | 71 |
5 | 3 | 176 | 180 |
S5,从半正态分布Half-Normal,得到用户的half_norm分布参数;
个人购买间隔均值参数:mu_star_dict,
个人购买间隔方差参数:sigma_star_dict
间隔个数参数:num_dict
E参数:E_dict
half_norm分布参数:half_norm_dict
整体购买间隔均值参数:mu=mean(mu_star_dict)
sigma=var(mu_star_dict)
alpha=mu**2/sigma+2
theta=sigma/mu/(mu**2+sigma)
E_dict[i]=num_dict[i]*mu_star_dict[i]/(num_dict[i]+alpha-1)+1.0/(num_dict[i]+alpha-1)/theta
half_norm_dict[i]=E_dict[i]*(pi**0.5)/(2**0.5)
至此可以得到每个用户的half_norm分布参数
S6,根据用户最后一次购买时间、个人最优购买和对应的half_norm分布参数计算用户未来预设时间内的购买强度函数hazard function;在本实施例,为计算用户未来7天内的购买强度函数hazard function。
Hazard(i)=half-normal.pdf(i),
Hazard_7days=Hazard(1)+Hazard(2)+Hazard(3)+Hazard(4)+
Hazard(5)+Hazard(6)+Hazard(7),
其中,pdf是指概率密度函数:在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。probability density function,简称PDF。如图2所示。
假设如图2为某用户半正态分布曲线,b点为今天,a点为这个用户最后一次购买日期,c点为7天后的日期,那么这个用户未来7天的购买强度Hazard_7days的值为这7天(即b和c之间(阴影部分))的面积。
步骤S6之后还包括结果输出,具体为,输出会员ID,购买强度函数hazardfunction,是否购买标签等。
S7,将购买强度值大于预设值的用于定义为最具潜在购物倾向的消费者,对其进行精准消费人群触达,提升复购率。
综上,所以本方案主要以研究有重复购买行为的用户为主,通过算法预测用户未来一段时间是否会产生购买行为,而非商品推荐。比如说:在最近一年时间内,用户A和B的平均购买间隔为30天和40天,假设用户A最近一次购买行为距离今天25天,用户B最近一次购买行为距离今天5天;那么可以大胆的判断,未来7天用户A产生购买行为的可能性比用户B大。
通过本发明,可以达到以下效果:
(1)提升电商平台筛选营销用户效率及准确率:可通过使用算法前和使用算法后准确率进行对比。如:某电商平台未来有一档活动,需要通过广告投放(短信触达)来吸引顾客购买,假设平台圈定目标人群20000人,最终有1000人产生了购买;通过使用本算法可能只需要圈定10000人,就有1000人产生购买,从而提升筛选营销用户的效率。
(2)提升电商平台营销活动的转化率:可通过使用算法前和使用算法后营销活动的转化率进行对比。如:某电商平台有一档活动,活动整体的转化率为5%,在使用本算法后,可能活动整体转化率达到8%(甚至更高),从而提升营销活动的整体转化率。
(3)提升电商平台在推广活动投放的广告的转化率:可通过使用算法前和使用算法后投放广告的转化率进行对比。如:某电商平台未来有一档活动,需要通过广告投放(短信触达)来吸引顾客购买,假设平台圈定目标人群20000人,最终有1000人产生了购买;通过使用本算法圈定20000人,可能2000人产生购买,同样的投放成本,转化率得到提升。
上述具体实施方式为本发明的优选实施例,并不能对本发明进行限定,其他的任何未背离本发明的技术方案而所做的改变或其它等效的置换方式,都包含在本发明的保护范围之内。
Claims (6)
1.一种消费者购买强度的预测方法,其特征在于,包括:
S1,获取有过购买行为的用户在预设时间段内的购买数据,对所述购买数据进行清洗,所述购买数据包括会员ID、购买日期,购买次数;
S2,判断用户的购买次数是否大于等于3;若是,则执行步骤S3;
S3,将购买日期转化为购买间隔,根据购买间隔计算出个人平均购买间隔和整体平均购买间隔;
S4,将个人平均购买间隔和整体平均购买间隔进行加权得到最优个人购买间隔;其中,个人最优购买间隔服从半正态分布Half-Normal;
S5,从半正态分布Half-Normal,得到用户的half_norm分布参数;
S6,根据用户最后一次购买时间、个人最优购买和对应的half_norm分布参数计算用户未来预设时间内的购买强度函数;
S7,将购买强度值大于预设值的用于定义为最具潜在购物倾向的消费者,对其进行精准消费人群触达。
2.根据权利要求1所述的消费者购买强度的预测方法,其特征在于,对所述购买数据进行清洗包括:
判断所有的购买日期是否格式一致,若不一致,则通过日期格式转换的方法标准化所有的购买日期格式;
判断购买金额是否正常,若购买金额异常,则剔除所述购买金额数据。
3.根据权利要求2所述的消费者购买强度的预测方法,其特征在于,购买金额异常为购买金额为负数或0,且经过判断负数或0的情况不合理。
4.根据权利要求1所述的消费者购买强度的预测方法,其特征在于,在步骤S2中,若判断为否,则直接根据整体平均购买间隔得到个人最优购买间隔。
5.根据权利要求4所述的消费者购买强度的预测方法,其特征在于,直接根据整体平均购买间隔得到个人最优购买间隔包括:根据整体平均购买间隔得到整体平均购买间隔方差,根据整体最优购买间隔和整体平均购买间隔方差得到个人最优购买间隔。
6.根据权利要求1所述的消费者购买强度的预测方法,其特征在于,所述购买数据还包括购买数量和购买金额。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010686233.7A CN111861556B (zh) | 2020-07-16 | 2020-07-16 | 一种消费者购买强度的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010686233.7A CN111861556B (zh) | 2020-07-16 | 2020-07-16 | 一种消费者购买强度的预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111861556A true CN111861556A (zh) | 2020-10-30 |
CN111861556B CN111861556B (zh) | 2024-05-24 |
Family
ID=72983621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010686233.7A Active CN111861556B (zh) | 2020-07-16 | 2020-07-16 | 一种消费者购买强度的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111861556B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140222653A1 (en) * | 2011-09-08 | 2014-08-07 | Tokyo Institute Of Technology | Method and program for detecting change-point of time-series data, and method and program for predicting probability density distribution of future time-series data values |
CN106485536A (zh) * | 2015-08-31 | 2017-03-08 | 功典资讯股份有限公司 | 决定下次购买时间区间的方法以及系统 |
JP6253744B1 (ja) * | 2016-11-04 | 2017-12-27 | ヤフー株式会社 | 情報解析装置、情報解析方法、および情報解析プログラム |
CN107993088A (zh) * | 2017-11-20 | 2018-05-04 | 北京三快在线科技有限公司 | 一种购买周期预测方法及装置,电子设备 |
CN110009457A (zh) * | 2019-04-09 | 2019-07-12 | 昆山古鳌电子机械有限公司 | 一种基于大数据的商品推荐系统 |
-
2020
- 2020-07-16 CN CN202010686233.7A patent/CN111861556B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140222653A1 (en) * | 2011-09-08 | 2014-08-07 | Tokyo Institute Of Technology | Method and program for detecting change-point of time-series data, and method and program for predicting probability density distribution of future time-series data values |
CN106485536A (zh) * | 2015-08-31 | 2017-03-08 | 功典资讯股份有限公司 | 决定下次购买时间区间的方法以及系统 |
JP6253744B1 (ja) * | 2016-11-04 | 2017-12-27 | ヤフー株式会社 | 情報解析装置、情報解析方法、および情報解析プログラム |
CN107993088A (zh) * | 2017-11-20 | 2018-05-04 | 北京三快在线科技有限公司 | 一种购买周期预测方法及装置,电子设备 |
CN110009457A (zh) * | 2019-04-09 | 2019-07-12 | 昆山古鳌电子机械有限公司 | 一种基于大数据的商品推荐系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111861556B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11055640B2 (en) | Generating product decisions | |
Hadden et al. | Computer assisted customer churn management: State-of-the-art and future trends | |
Chien et al. | Manufacturing intelligence for semiconductor demand forecast based on technology diffusion and product life cycle | |
US20200051099A1 (en) | Sales prediction systems and methods | |
US9165270B2 (en) | Predicting likelihood of customer attrition and retention measures | |
US7577579B2 (en) | Method of predicting sales based on triple-axis mapping of customer value | |
CN102156932A (zh) | 一种客户再次购买意向预测方法及装置 | |
US20200311748A1 (en) | Consumer response intelligent spend prediction system | |
Letham et al. | Latent variable copula inference for bundle pricing from retail transaction data | |
Shin et al. | Multi-attribute scoring method for mobile telecommunication subscribers | |
Aminu et al. | Perceived risk barriers to internet shopping | |
Danaher et al. | Bacon with your eggs? Applications of a new bivariate beta-binomial distribution | |
CN111861679A (zh) | 一种基于人工智能的商品推荐方法 | |
Kazmi et al. | Generic framework to predict repeat behavior of customers using their transaction history | |
CN111861556A (zh) | 一种消费者购买强度的预测方法 | |
Tarokh et al. | A new model to speculate CLV based on Markov chain model | |
CN111127072A (zh) | 一种新产品需求的多阶段实时预测方法 | |
Yu et al. | A new approach to customer targeting under conditions of information shortage | |
CN114463085A (zh) | 自动化营销的通用沟通互动方法、装置、电子设备及存储介质 | |
Gung et al. | The use of hybrid analytics to establish effective strategies for household energy conservation | |
Chee et al. | Data Analytics Approach for Short-term Sales Forecasts Using Limited Information in E-commerce Marketplace | |
Iwata et al. | Extracting innovative buyers by scoring using Innovator Theory | |
Katrodia | A Study of Indentity Consumer Purchasing Behavior and Factors that Influence Consumer Purchse Decision: With Reference to Durban | |
Kroekbodin | The Effectiveness of Email Marketing Toward Purchasing Intention | |
US20240185272A1 (en) | Sales prediction systems and methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |