CN117455545A - 一种电商消费者流失概率的预测方法、系统和电子设备 - Google Patents
一种电商消费者流失概率的预测方法、系统和电子设备 Download PDFInfo
- Publication number
- CN117455545A CN117455545A CN202311199300.2A CN202311199300A CN117455545A CN 117455545 A CN117455545 A CN 117455545A CN 202311199300 A CN202311199300 A CN 202311199300A CN 117455545 A CN117455545 A CN 117455545A
- Authority
- CN
- China
- Prior art keywords
- commerce
- consumer
- order data
- consumers
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000010801 machine learning Methods 0.000 claims abstract description 19
- 238000012216 screening Methods 0.000 claims abstract description 14
- 230000006399 behavior Effects 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 7
- 238000007405 data analysis Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 5
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及电商数据分析技术领域,尤其涉及一种电商消费者流失概率的预测方法、系统和电子设备,方法包括:获取目标行业的电商消费者订单数据;基于目标行业对应的流失行为判定标准,对目标行业的电商消费者订单数据进行分析,标注出所有的已流失电商消费者和所有的未流失电商消费者;从目标行业的电商消费者订单数据中,筛选出所有未流失电商消费者的订单数据;将任一未流失电商消费者的订单数据输入训练好的机器学习预测模型,得到该电商消费者的流失概率。通过数据分析,能够客观确定每个电商消费者的流失概率,为商家后续的促销活动等提供数据支持。
Description
技术领域
本发明涉及电商数据分析技术领域,尤其涉及一种电商消费者流失概率的预测方法、系统和电子设备。
背景技术
电商的场景属于非合约类交易,不同于电话卡这类合约制的交易,电商场景下的消费者没有明确的“流失”日期。例如,消费者可以在第一单成交后n个月再次回购,但这期间内商家难以判断消费者是否还会回购或是否已经流失。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供了一种电商消费者流失概率的预测方法、系统和电子设备。
本发明的一种电商消费者流失概率的预测方法的技术方案如下:
获取目标行业的电商消费者订单数据;
基于所述目标行业对应的流失行为判定标准,对所述目标行业的电商消费者订单数据进行分析,标注出所有的已流失电商消费者和所有的未流失电商消费者;
从目标行业的电商消费者订单数据中,筛选出所有未流失电商消费者的订单数据;
将任一未流失电商消费者的订单数据输入训练好的机器学习预测模型,得到该电商消费者的流失概率。
本发明的一种电商消费者流失概率的预测方法的有益效果如下:
通过数据分析,能够客观确定每个电商消费者的流失概率,为商家后续的促销活动等提供数据支持。
在上述方案的基础上,本发明的一种电商消费者流失概率的预测方法还可以做如下改进。
进一步,还包括:
当任一未流失电商消费者的订单数据更新后,将该未流失电商消费者的更新后的订单数据输入训练好的机器学习预测模型,得到该未流失电商消费者的新的流失概率。
进一步,所述训练好的机器学习预测模型为:训练好的xgboost分类器。
本发明的一种电商消费者流失概率的预测系统的技术方案如下:
包括获取模块、标注模块、筛选模块和预测模块;
所述获取模块用于:获取目标行业的电商消费者订单数据;
所述标注模块用于:基于所述目标行业对应的流失行为判定标准,对所述目标行业的电商消费者订单数据进行分析,标注出所有的已流失电商消费者和所有的未流失电商消费者;
所述筛选模块用于:从目标行业的电商消费者订单数据中,筛选出所有未流失电商消费者的订单数据;
所述预测模块用于:将任一未流失电商消费者的订单数据输入训练好的机器学习预测模型,得到该电商消费者的流失概率。
本发明的一种电商消费者流失概率的预测系统的有益效果如下:
通过数据分析,能够客观确定每个电商消费者的流失概率,为商家后续的促销活动等提供数据支持。
在上述方案的基础上,本发明的一种电商消费者流失概率的预测系统还可以做如下改进。
进一步,所述预测模块还用于:
当任一未流失电商消费者的订单数据更新后,将该未流失电商消费者的更新后的订单数据输入训练好的机器学习预测模型,得到该未流失电商消费者的新的流失概率。
进一步,所述训练好的机器学习预测模型为:训练好的xgboost分类器。
本发明的一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行上述任一项所述的一种电商消费者流失概率的预测方法。
本发明的一种电子设备,包括处理器和上述的存储介质,所述处理器执行所述存储介质中的指令。
附图说明
图1为本发明实施例的一种电商消费者流失概率的预测方法的流程示意图;
图2为模型训练的流程示意图;
图3为本发明实施例的一种电商消费者流失概率的预测系统的结构示意图。
具体实施方式
如图1所示,本发明实施例的一种电商消费者流失概率的预测方法,包括如下步骤:
S1、获取目标行业的电商消费者订单数据;
S2、基于目标行业对应的流失行为判定标准,对目标行业的电商消费者订单数据进行分析,标注出所有的已流失电商消费者和所有的未流失电商消费者;
其中,基于专家对不同行业的电商消费者行为的研判,制定各行业的流失行为判定标准。例如,大快消行业(FMCG)下,通常复购周期较短,因此会定义6~12个月间某值为流失阈值。
S3、从目标行业的电商消费者订单数据中,筛选出所有未流失电商消费者的订单数据;
S4、将任一未流失电商消费者的订单数据输入训练好的机器学习预测模型,得到该电商消费者的流失概率,以此类推,得到每个电商消费者的流失概率。然后,通过流失概率,将这部份未流失电商消费者进行聚类分组,例如低、中、高三种流失风险等级小组。市场营销部可针对各小组分别制定不同的市场营销策略。例如,针对低流失风险组可进行维护型沟通,推荐新品信息等。针对高流失风险组可进行产品反馈调研,及时了解消费者的诉求,从而对产品优化提供有效的信息基础。
本发明通过数据分析,能够客观确定每个电商消费者的流失概率,为商家后续的促销活动等提供数据支持。
可选地,在上述技术方案中,还包括:
S5、当任一未流失电商消费者的订单数据更新后,将该未流失电商消费者的更新后的订单数据输入训练好的机器学习预测模型,得到该未流失电商消费者的新的流失概率。
可选地,在上述技术方案中,训练好的机器学习预测模型为:训练好的xgboost分类器。训练好的xgboost分类器的训练流程如图2所示,包括:
S100、获取目标行业在2年内的电商消费者订单数据;
S101、基于目标行业对应的流失行为判定标准,对S100中获取的电商消费者订单数据进行分析,标注出所有的已流失电商消费者;
S102、从S100中获取的电商消费者订单数据中,筛选出所有的已流失电商消费者的订单数据,并分为训练集和测试集;
S103、数据准备;
S104、基于训练集对xgboost分类器进行训练;
S105、利用测试集进行验证,验证通过后,得到训练好的xgboost分类器,并保存。
消费者订单数据包含如下内容:下单时间、支付时间、支付金额、商品、品类、件数、退货/退款状态等。
训练数据包含消费者的所有在目标品牌/行业下的订单数据。
用于训练的样本以如下方式构成:将全部标注数据以20%和80%比例随机分成2组,其中80%用于训练模型,剩余20%不参与训练,而是用于对模型的检测。
在上述各实施例中,虽然对步骤进行了编号S1、S2等,但只是本申请给出的具体实施例,本领域的技术人员可根据实际情况调整S1、S2等的执行顺序,此也在本发明的保护范围内,可以理解,在一些实施例中,可以包含如上述各实施方式中的部分或全部。
如图3所示,本发明实施例的一种电商消费者流失概率的预测系统200,包括获取模块210、标注模块220、筛选模块230和预测模块240;
获取模块210用于:获取目标行业的电商消费者订单数据;
标注模块220用于:基于目标行业对应的流失行为判定标准,对目标行业的电商消费者订单数据进行分析,标注出所有的已流失电商消费者和所有的未流失电商消费者;
筛选模块230用于:从目标行业的电商消费者订单数据中,筛选出所有未流失电商消费者的订单数据;
预测模块240用于:将任一未流失电商消费者的订单数据输入训练好的机器学习预测模型,得到该电商消费者的流失概率。
本发明通过数据分析,能够客观确定每个电商消费者的流失概率,为商家后续的促销活动等提供数据支持。
可选地,在上述技术方案中,预测模块240还用于:
当任一未流失电商消费者的订单数据更新后,将该未流失电商消费者的更新后的订单数据输入训练好的机器学习预测模型,得到该未流失电商消费者的新的流失概率。
可选地,在上述技术方案中,训练好的机器学习预测模型为:训练好的xgboost分类器。
上述关于本发明的一种电商消费者流失概率的预测系统200中的各参数和各个单元模块实现相应功能的步骤,可参考上文中关于一种电商消费者流失概率的预测方法的实施例中的各参数和步骤,在此不做赘述。
本发明实施例的一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行上述任一项所述的一种电商消费者流失概率的预测方法。
本发明实施例的一种电子设备,包括处理器和上述的存储介质,所述处理器执行所述存储介质中的指令。其中,电子设备可以选用电脑、手机等。
所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。
因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一一但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM),只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种电商消费者流失概率的预测方法,其特征在于,包括:
获取目标行业的电商消费者订单数据;
基于所述目标行业对应的流失行为判定标准,对所述目标行业的电商消费者订单数据进行分析,标注出所有的已流失电商消费者和所有的未流失电商消费者;
从目标行业的电商消费者订单数据中,筛选出所有未流失电商消费者的订单数据;
将任一未流失电商消费者的订单数据输入训练好的机器学习预测模型,得到该电商消费者的流失概率。
2.根据权利要求1所述的一种电商消费者流失概率的预测方法,其特征在于,还包括:
当任一未流失电商消费者的订单数据更新后,将该未流失电商消费者的更新后的订单数据输入训练好的机器学习预测模型,得到该未流失电商消费者的新的流失概率。
3.根据权利要求1或2所述的一种电商消费者流失概率的预测方法,其特征在于,所述训练好的机器学习预测模型为:训练好的xgboost分类器。
4.一种电商消费者流失概率的预测系统,其特征在于,包括获取模块、标注模块、筛选模块和预测模块;
所述获取模块用于:获取目标行业的电商消费者订单数据;
所述标注模块用于:基于所述目标行业对应的流失行为判定标准,对所述目标行业的电商消费者订单数据进行分析,标注出所有的已流失电商消费者和所有的未流失电商消费者;
所述筛选模块用于:从目标行业的电商消费者订单数据中,筛选出所有未流失电商消费者的订单数据;
所述预测模块用于:将任一未流失电商消费者的订单数据输入训练好的机器学习预测模型,得到该电商消费者的流失概率。
5.根据权利要求4所述的一种电商消费者流失概率的预测系统,其特征在于,所述预测模块还用于:
当任一未流失电商消费者的订单数据更新后,将该未流失电商消费者的更新后的订单数据输入训练好的机器学习预测模型,得到该未流失电商消费者的新的流失概率。
6.根据权利要求4或5所述的一种电商消费者流失概率的预测系统,其特征在于,所述训练好的机器学习预测模型为:训练好的xgboost分类器。
7.一种存储介质,其特征在于,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如权利要求1至3中任一项所述的一种电商消费者流失概率的预测方法。
8.一种电子设备,其特征在于,包括处理器和权利要求7所述的存储介质,所述处理器执行所述存储介质中的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311199300.2A CN117455545A (zh) | 2023-09-15 | 2023-09-15 | 一种电商消费者流失概率的预测方法、系统和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311199300.2A CN117455545A (zh) | 2023-09-15 | 2023-09-15 | 一种电商消费者流失概率的预测方法、系统和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117455545A true CN117455545A (zh) | 2024-01-26 |
Family
ID=89593665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311199300.2A Pending CN117455545A (zh) | 2023-09-15 | 2023-09-15 | 一种电商消费者流失概率的预测方法、系统和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117455545A (zh) |
-
2023
- 2023-09-15 CN CN202311199300.2A patent/CN117455545A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108921569B (zh) | 一种确定用户投诉类型的方法及装置 | |
CN110992167A (zh) | 银行客户业务意图识别方法及装置 | |
CN108764705A (zh) | 一种数据质量评估平台以及方法 | |
CN113837596B (zh) | 一种故障确定方法、装置、电子设备及存储介质 | |
CN111402017A (zh) | 一种基于大数据的信用评分方法和系统 | |
US20200184398A1 (en) | Data Analytics Model Selection through Champion Challenger Mechanism | |
CN109544014B (zh) | 基于历史数据回放的反欺诈方法及装置 | |
US20170178149A1 (en) | Method and system for purchase pattern extraction from point of sale data | |
CN111652655A (zh) | 商品销量预测方法、装置、电子设备及可读存储介质 | |
CN113591900A (zh) | 一种高需求响应潜力用户的识别方法、装置及终端设备 | |
CN110070383B (zh) | 基于大数据分析的异常用户识别方法及装置 | |
CN117455545A (zh) | 一种电商消费者流失概率的预测方法、系统和电子设备 | |
CN110544166A (zh) | 样本生成方法、装置及存储介质 | |
CN107622408A (zh) | 购车线索交易转化的预估方法和预估装置 | |
CN114638503A (zh) | 一种资产风险压力测试方法、装置、设备及存储介质 | |
CN114285896A (zh) | 信息推送方法、装置、设备、存储介质及程序产品 | |
CN115062687A (zh) | 企业信用监控方法、装置、设备及存储介质 | |
CN110766544A (zh) | 信用风险的检测方法及装置、存储介质、电子装置 | |
CN112149450A (zh) | 排面检查系统及方法 | |
CN110414186B (zh) | 数据资产切分校验方法以及装置 | |
CN113409025B (zh) | 一种业务数据提取方法、装置及存储介质 | |
CN112396513B (zh) | 一种数据处理的方法及装置 | |
CN111881355B (zh) | 对象的推荐方法、装置、存储介质和处理器 | |
CN112308295B (zh) | 违约概率预测方法及装置 | |
CN114757788A (zh) | 用户交易行为识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |