CN110210913A - 一种基于大数据的商家回头客预测方法 - Google Patents
一种基于大数据的商家回头客预测方法 Download PDFInfo
- Publication number
- CN110210913A CN110210913A CN201910516387.9A CN201910516387A CN110210913A CN 110210913 A CN110210913 A CN 110210913A CN 201910516387 A CN201910516387 A CN 201910516387A CN 110210913 A CN110210913 A CN 110210913A
- Authority
- CN
- China
- Prior art keywords
- feature
- businessman
- data
- consumer
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000006399 behavior Effects 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 26
- 230000004927 fusion Effects 0.000 claims abstract description 16
- 238000010801 machine learning Methods 0.000 claims abstract description 8
- 230000003542 behavioural effect Effects 0.000 claims abstract description 7
- 238000010276 construction Methods 0.000 claims abstract description 6
- 238000012163 sequencing technique Methods 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 9
- 238000012417 linear regression Methods 0.000 claims description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 3
- 241000196324 Embryophyta Species 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims description 2
- 230000001737 promoting effect Effects 0.000 abstract description 6
- 230000009467 reduction Effects 0.000 abstract description 5
- 238000004458 analytical method Methods 0.000 abstract description 3
- 239000000284 extract Substances 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 206010021703 Indifference Diseases 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Abstract
本发明请求保护一种基于大数据的商家回头客预测方法,包括:101对消费者的历史行为数据进行预处理操作;102根据历史行为划分训练集数据、验证集数据;103对消费者历史行为数据进行特征工程操作;104对构建特征完成的样本集进行特征选择;105建立多个机器学习模型,并进行模型融合操作;106通过建立的模型,根据消费者历史行为数据对新买家在未来六个月内是否会再次在同一商家购买商品进行预测。本发明通过预处理和分析,提取特征,特征选择工作,建立多个机器学习模型,根据消费者在双十一之前半年的消费行为数据对新买家在未来六个月内是否会再次在同一商家购买商品进行预测,为商家精准定位潜在忠实客户、减少促销成本和提高投资回报提供服务。
Description
技术领域
本发明涉及机器学习、大数据处理领域,尤其是特征构建、模型设计、模型融合方案等。
背景技术
随着全球经济飞速发展,经济信息化时代稳步前行,作为兴起于信息经济时代的一种全新的商务流通运行与人们交流的方式的电子商务。飞速发展的电子商务也给各商家带来了巨大的竞争压力,因此商家有些时候会在一些特定的日期和时间点进行大促销活动,通过这种方式来吸引大量新买家。但不幸的是,许多被促销活动吸引的买家属于只是一次性消费的“交易猎手”,导致商家进行的这些促销活动无法得到长期的收益,达不到促销的真正目的。
在这些电子商务的实施过程中产生了海量的交易数据,如何处理并且进一步运用这些数据中隐藏的信息,使这些沉寂在数据海洋中的数据具有经济价值,进一步帮助商家提高促销效果。使商家明确哪些消费者可以转化为回头客,通过瞄准这些潜在的“忠诚”客户,商家可以降低促销成本,提高促销效果,提高投资回报率。
但在信息化时代下,各个电商平台开始对用户的信息进行记录并整合,那么如何利用这些数据来高效准确地挖掘潜在的忠实客户,是人工智能和大数据在电子商务场景中需要急需解决的技术难题。
在现有的大数据处理中主要使用均值、众数等统计值来填充缺失值,忽略了具体特征的内在含义,这使得填充值和真实值之间存在很大的误差。使用统计特征和聚合特征来表现数据的内在联系,比如用户的购买倾向或商家的受欢迎程度等,但这类特征对于预测的表现力有限。模型融合中采用传统的线性加权融合,主要是根据模型表现效果和个人经验手动赋予各个模型权重,会带来较大的误差。
发明内容
为了解决上述问题,本发明提供了一种基于大数据的商家回头客预测方法,旨在根据消费者在过去6个月的消费行为数据对新买家在未来六个月内是否会再次在同一商家购买商品进行预测,为商家精准定位潜在忠实客户、减少促销成本和提高投资回报提供服务。
为实现上述目的本发明采用的技术方案如下:一种基于大数据的商家回头客预测方法,包括以下步骤:
101.对消费者的历史行为数据进行预处理操作;
102.根据历史行为数据划分训练集数据、验证集数据;
103.对消费者历史行为数据进行特征工程构建,包括构建业务特征和排序特征;
104.对构建特征完成的样本集进行特征选择;
105.建立多个机器学习模型,并进行模型融合操作;
106.通过建立的模型,根据消费者历史行为数据对新买家在未来六个月内是否会再次在同一商家购买商品进行预测。
进一步,所述步骤101对消费者的历史行为数据进行预处理操作的具体步骤为:
1011.对缺失值进行填充:
首先,对年龄范围字段的缺失值进行填充,其中年龄范围字段共有8类:①小于18岁为第1类;②18岁至24岁为第2类;③25岁至29岁为第3类;④30岁至34岁为第4类;⑤35岁至39岁为第5类;⑥40岁至49岁为第6类;⑦50岁至59岁为第7类;⑧60岁以上为第8类。分别计算每个类别的平均购物数量,其中ki(i=1,2,3,...,8)表示第i类年龄范围的平均购物数量;统计缺失了年龄范围字段值的用户的购物数量,记为xuid;找出距离xuid最近的年龄范围种类,将该类别值填充为该用户的年龄范围值。其中di表示xuid与ki的差值的绝对值,age_fill_valueuid表示当前用户的年龄范围字段的最终填充值,公式如下所示:
di=|xuid-ki|(i=1,2,...8) (1)
age_fill_valueuid=min(d1,d2,...,d8) (2)
其次,对性别字段的缺失值进行填充。通常情况下,女性较男性更偏爱购物,基于此事实,使用如下方法对性别字段进行填充:分别计算男性消费者和女性消费者的平均购物数量,分别记为m和f;设置阈值K为m和f的均值;x表示为缺失了性别字段值的用户的购物数量;若当前缺失性别字段值的用户的购物数量大于K,则将缺失值填充为0,即女性,否则将缺失值填充为1,即男性。性别字段的最终填充值gender_fill_valueuid由如下公式决定:
最后,对品牌编号字段的缺失值进行填充。品牌编号与商品编号相关联,若消费记录的品牌编号为缺失值,可查询商品编号为当前消费记录的商品编号的所有消费记录,以此获得当前商品编号对应的品牌编号的值,使用该值对缺失值进行填充;使用上述方法对缺失值进行填充后,若品牌编号字段仍为缺失值,则使用-1替代缺失值。
在现有的方法中,主要使用均值、众数等统计值来填充缺失值,忽略了具体特征的内在含义,这使得填充值和真实值之间存在很大的误差。本方法对各个包含缺失值的特征进行分析,根据非缺失值的分布情况和生活常识设计规则,对缺失值进行填充,减小了误差,对模型性能影响极小。
1012.对离散字段进行编码操作:在该步骤中,执行如下操作:由于商品类别编码字段的种类较多,可使用embedding编码以较少的元素表现数据。通常情况下,embedding向量的长度可由式子(5)计算得出,其中ed表示embedding向量的长度,number_of_cat表示该属性的类别数量。
传统的处理方法通常使用one-hot对离散字段进行编码。若离散字段的值种类较多,使用one-hot进行编码后,数据过于稀疏,过大的特征维度会使得模型训练较慢。而embedding编码能以较少的元素表征数据,不会因过量增加特征维度而影响模型的训练速度。
进一步,所述步骤102根据历史行为数据划分训练集数据、验证集数据具体步骤为:①将用户基本信息表通过用户编号字段、将用户日志表通过用户编号和商家编号合并到原始的训练集和测试集上;②从拓展后的训练集和测试集上提取步骤103中的业务特征、排序特征,以及基本的统计特征,形成最终的训练集和测试集。
具体地,所述步骤103对消费者历史行为数据进行特征工程的步骤为:
根据对消费者历史行为数据的分析,对训练集和测试集进行特征工程构建,所述的特征工程构建是指对消费者历史行为数据构建业务特征和排序特征。
1031.业务特征:用户双十一促销期间与促销前一个月的平均点击次数/购买次数/添加购物车的次数/添加至收藏次数对比特征,提取步骤为:①统计双十一促销期间的平均点击次数/购买次数/添加购物车的次数/添加至收藏次数;②统计双十一前一个月的平均点击次数/购买次数/添加购物车的次数/添加至收藏次数;③使用①求得结果减去②求得结果即为该类特征值。该特征通过对比上述两个时间段的用户行为数据,寻找潜在关联。
1032.排序特征:各个商品的平均购买时间间隔的排序特征,提取步骤如下:①对数据的时间戳进行标准化;②计算每次相邻购买行为之间的间隔天数,若该商品只被购买了一次商品,则值设置为-1;③对②中的间隔天数取平均,并按照平均间隔天数值按降序排序,并对排序值进行归一化。通过排序为每个商品赋予不同权重,即商品被购买越频繁,其权重越大。
在现有的方法中,通常使用统计特征和聚合特征来表现数据的内在联系,比如用户的购买倾向或商家的受欢迎程度等,但这类特征的表现力有限。本方法在上述特征的基础上,加入了业务特征和排序特征,其中业务特征同时考虑了用户平时和双十一期间的消费行为,对比这两个时间段的行为数据,对预测双十一之后的消费行为有一定帮助。例如,用户在双十一之前没有购买某商品,但在双十一期间购买了很多该商品,可以推测在未来一段时间内该用户不会再购买此商品。
此外,上述的排序特征在一定程度上反映了商品的消耗速度,若用户所购买商品的消耗速度很快,那么就算用户在双十一期间购买较多该商品,那么未来一段时间内用户仍可能购买该类商品。业务特征结合排序特征,即用户行为表现和商品特性相结合,很好地表达了数据的内在联系。
进一步,所述步骤104对构建特征完成的样本集进行特征选择的具体步骤为:
从如下方面考虑来选择特征:计算每个特征的方差,若该值较小,则说明样本在该特征上无差异,即该特征对于样本的区分没有作用,故筛去方差小于0.99的特征。
通过统计各个特征的方差,得到了方差的筛选阈值0.99,通过该阈值可过滤掉许多对模型没有用处的特征,从而达到特征降维的效果,不仅能加快模型的训练速度,而且对模型的性能没有影响。
进一步,所述步骤105建立多个机器学习模型,并进行模型融合操作的具体步骤为:
1051.线性加权融合:分别构建基于xgb、RF和SVR的分类模型。
1052.采用线性加权融合方法将各个单模型的预测结果整合为最终结果,过程如下:①将三个模型的预测结果与xgb模型重要度top10的特征进行整合;②使用整合的数据集和真实标记训练出一个线性回归模型,获得三个模型预测结果列的权重;③对三个权重值进行归一化,使这三个权重值的和为1。
权重归一化公式如(7)所示,融合公式如(8)所示,其中N为单模型个数,用户u在商户m重复购买的概率p为各个单模型i预测出的概率pi的加权和,其中为各个子模型的权重,为归一化前的子模型权重。
传统的线性加权融合是根据模型表现效果和个人经验手动赋予各个模型权重。本方法对传统的线性加权融合进行改进,使用top10特征和各个模型的预测结果作为整体特征,使用真实标记作为整体标记,训练一个线性模型,通过这个线性模型为各个模型的预测结果赋予权重,避免了通过个人经验赋权带来的误差。
所述步骤106通过建立的模型,根据消费者历史行为数据对新买家在未来六个月内是否会再次在同一商家购买商品进行预测的具体步骤为:
当线性加权融合输出的预测概率大于0.835时,认为该新买家会在未来6个月内重复在某商家进行购买,为商家精准定位潜在的忠实客户,较少促销成本,提高投资回报率提供了有效途径。
本发明主要是通过对消费者历史数据进行预处理和分析,提取特征,特征选择工作,并根据已处理的历史数据建立多个机器学习模型,根据消费者在双十一之前半年的消费行为数据对新买家在未来六个月内是否会再次在同一商家购买商品进行预测,为商家精准定位潜在忠实客户、减少促销成本和提高投资回报提供服务。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例。
图1为本发明实施例一提供的一种基于大数据的商家回头客预测方法的流程图。
图2为本发明实施例一提供的一种基于大数据的商家回头客预测方法中特征提取方法概念图。
图3为本发明实施例一提供的一种基于大数据的商家回头客预测方法中xgb模型训练完成后输出所有特征的重要性。
图4为本发明实施例一提供的一种基于大数据的商家回头客预测方法中线性加权融合图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参考图1,本发明具体包括:
101.从电商的官方平台下载获取消费者的历史行为数据,对消费者的历史行为数据进行预处理操作,具体如下:1011.①对缺失值进行填充:按照公式(1)计算当前用户的购物数量与各类年龄范围的平均购物数量的距离,选出最小的距离,使用该类年龄范围对缺失值进行填充;②分别统计男性与女性的平均购物数量,将二者均值作为阈值,若大于该阈值则标识为女性,否则为男性,如公式(3)和(4)所示;③使用商品编号查询是否有对应的品牌编号,并使用其对缺失值进行填充,否则,使用-1替代缺失值。1012.对商品类别编码字段进行embedding编码。
本方法对各个包含缺失值的特征进行分析,根据非缺失值的分布情况和生活常识设计规则,对缺失值进行填充,减小误差。此外,embedding编码能以较少的元素表征数据,不会因过量增加特征维度而影响模型的训练速度。
102.根据历史行为数据划分训练集数据、验证集数据,具体如下:①将用户基本信息表通过用户编号字段、将用户日志表通过用户编号和商家编号合并到原始的训练集和测试集上;②从拓展后的训练集和测试集上提取特征,形成最终的训练集和测试集。参见图2。
103.根据对消费者历史行为数据的分析,对训练集和测试集进行特征工程构建,所述的特征工程构建是指对消费者历史行为数据构建统计特征、聚合特征、业务特征和排序特征。
1031.业务特征:用户双十一促销期间与促销前一个月的平均点击次数/购买次数/添加购物车的次数/添加至收藏次数对比特征,提取步骤为:①统计双十一促销期间的平均点击次数/购买次数/添加购物车的次数/添加至收藏次数;②统计双十一前一个月的平均点击次数/购买次数/添加购物车的次数/添加至收藏次数;③使用①求得结果减去②求得结果即为该类特征值。该特征通过对比上述两个时间段的用户行为数据,寻找潜在关联。
1032.排序特征:各个商品的平均购买时间间隔的排序特征,提取步骤如下:①对数据的时间戳进行标准化;②计算每次相邻购买行为之间的间隔天数,若该商品只被购买了一次商品,则值设置为-1;③对②中的间隔天数取平均,并按照平均间隔天数值按降序排序,并对排序值进行归一化。通过排序为每个商品赋予不同权重,即商品被购买越频繁,其权重越大。
104.对构建特征完成的样本集进行特征选择,具体如下:计算每个特征的方差,若该值较小,则说明样本在该特征上无差异,即该特征对于样本的区分没有作用,故筛去方差小于0.99的特征。
通过统计各个特征的方差,得到了方差的筛选阈值0.99,通过该阈值可过滤掉许多对模型没有用处的特征,从而达到特征降维的效果,不仅能加快模型的训练速度,而且对模型的性能没有影响。
105.建立多个机器学习模型,并进行模型融合操作,具体如下:
线性加权融合:分别构建基于xgb、RF和SVR的分类模型。xgb模型训练完成后输出所有特征的重要性,如图3所示。采用线性加权融合方法将各个单模型的预测结果整合为最终结果,融合过程如图4所示。
本方法对传统的线性加权融合进行改进,使用top10特征和各个模型的预测结果作为整体特征,使用真实标记作为整体标记,训练一个线性模型,通过这个线性模型为各个模型的预测结果赋予权重,避免了通过个人经验赋权带来的误差。
106.通过建立的模型,根据消费者历史行为数据对新买家在未来六个月内是否会再次在同一商家购买商品进行预测,具体如下:
当线性加权融合输出的预测概率大于0.835时,认为该新买家会在未来6个月内重复在某商家进行购买,为商家精准定位潜在的忠实客户,较少促销成本,提高投资回报率提供了有效途径。
Claims (8)
1.一种基于大数据的商家回头客预测方法,其特征在于包括以下步骤:
101.对消费者的历史行为数据进行预处理操作;
102.根据历史行为数据划分训练集数据、验证集数据;
103.对消费者历史行为数据进行特征工程构建,包括构建业务特征和排序特征;
104.对构建特征完成的样本集进行特征选择;
105.建立多个机器学习模型,并进行模型融合操作;
106.通过建立的模型,根据消费者历史行为数据对新买家在未来六个月内是否会再次在同一商家购买商品进行预测。
2.根据权利要求1所述一种基于大数据的商家回头客预测方法,其特征在于,所述预处理操作包括:
(1)对缺失值进行填充:对年龄范围字段的缺失值进行填充,对性别字段的缺失值进行填充,以及对品牌编号字段的缺失值进行填充;
(2)使用embedding编码对离散字段进行编码操作。
3.根据权利要求2所述一种基于大数据的商家回头客预测方法,其特征在于:所述对年龄范围字段的缺失值进行填充,将年龄范围字段共分为8类,分别计算每个类别的平均购物数量,其中ki(i=1,2,3,...,8)表示第i类年龄范围的平均购物数量;统计缺失了年龄范围字段值的用户的购物数量,记为xuid;找出距离xuid最近的年龄范围种类,将该类别值填充为该用户的年龄范围值;
所述对性别字段的缺失值进行填充,分别计算男性消费者和女性消费者的平均购物数量,分别记为m和f;设置阈值K为m和f的均值;若当前缺失性别字段值的用户的购物数量大于K,则将缺失值填充为0,即女性,否则将缺失值填充为1,即男性;
所述对品牌编号字段的缺失值进行填充,查询商品编号为当前消费记录的商品编号的所有消费记录,以此获得当前商品编号对应的品牌编号的值,使用该值对缺失值进行填充。
4.根据权利要求2所述一种基于大数据的商家回头客预测方法,其特征在于:所述embedding编码中embedding向量的长度由下式计算得出,其中ed表示embedding向量的长度,number_of_cat表示该属性的类别数量;
5.根据权利要求1所述一种基于大数据的商家回头客预测方法,其特征在于:所述划分训练集数据、验证集数据的具体步骤为:①将用户基本信息表通过用户编号字段、将用户日志表通过用户编号和商家编号合并到原始的训练集和测试集上;②从拓展后的训练集和测试集上提取特征,形成最终的训练集和测试集。
6.根据权利要求1所述一种基于大数据的商家回头客预测方法,其特征在于:所述业务特征:提取用户双十一促销期间与促销前一个月的平均点击次数/购买次数/添加购物车的次数/添加至收藏次数对比特征的步骤为:①统计双十一促销期间的平均点击次数/购买次数/添加购物车的次数/添加至收藏次数;②统计双十一前一个月的平均点击次数/购买次数/添加购物车的次数/添加至收藏次数;③使用①求得结果减去②求得结果即为该业务特征值;
所述排序特征:提取各个商品的平均购买时间间隔的排序特征的步骤如下:①对数据的时间戳进行标准化;②计算每次相邻购买行为之间的间隔天数,若该商品只被购买了一次商品,则值设置为-1;③对②中的间隔天数取平均,并按照平均间隔天数值按降序排序,并对排序值进行归一化;④通过排序为每个商品赋予不同权重,即商品被购买越频繁,其权重越大。
7.根据权利要求1所述一种基于大数据的商家回头客预测方法,其特征在于:所述特征选择中,计算每个特征的方差,筛去方差小于0.99的特征。
8.根据权利要求1所述一种基于大数据的商家回头客预测方法,其特征在于:所述模型融合操作包括:
分别构建基于xgb、RF和SVR的分类模型;
将三个模型的预测结果与xgb模型重要度top10的特征进行整合;
使用整合的数据集和真实标记训练出一个线性回归模型,获得三个模型预测结果列的权重;
对三个权重值进行归一化,使这三个权重值的和为1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910516387.9A CN110210913A (zh) | 2019-06-14 | 2019-06-14 | 一种基于大数据的商家回头客预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910516387.9A CN110210913A (zh) | 2019-06-14 | 2019-06-14 | 一种基于大数据的商家回头客预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110210913A true CN110210913A (zh) | 2019-09-06 |
Family
ID=67792790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910516387.9A Pending CN110210913A (zh) | 2019-06-14 | 2019-06-14 | 一种基于大数据的商家回头客预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110210913A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144935A (zh) * | 2019-12-17 | 2020-05-12 | 武汉海云健康科技股份有限公司 | 基于大数据的睡眠会员唤醒方法及系统、服务器及介质 |
CN112101611A (zh) * | 2020-07-31 | 2020-12-18 | 重庆锐云科技有限公司 | 房地产客户复购时间的预测方法、服务器及存储介质 |
CN112381560A (zh) * | 2020-10-23 | 2021-02-19 | 东北石油大学 | 一种共享设备产品市场预测系统及方法 |
CN112581158A (zh) * | 2019-09-27 | 2021-03-30 | 治略资讯整合股份有限公司 | 会员回购商品的信息处理系统与方法 |
CN113469730A (zh) * | 2021-06-08 | 2021-10-01 | 北京化工大学 | 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置 |
CN113673866A (zh) * | 2021-08-20 | 2021-11-19 | 上海寻梦信息技术有限公司 | 农作物决策方法、模型训练方法以及相关设备 |
CN113706195A (zh) * | 2021-08-26 | 2021-11-26 | 东北大学秦皇岛分校 | 一种基于两阶段组合的在线消费行为预测方法及系统 |
CN113781128A (zh) * | 2021-10-15 | 2021-12-10 | 北京明略软件系统有限公司 | 高潜质消费者识别方法、系统、电子设备及介质 |
CN115841345A (zh) * | 2023-02-16 | 2023-03-24 | 杭州柚果供应链管理有限公司 | 跨境大数据智能化分析方法、系统以及存储介质 |
CN113656702B (zh) * | 2021-08-27 | 2023-07-14 | 建信基金管理有限责任公司 | 用户行为的预测方法及装置 |
CN117852507A (zh) * | 2024-03-07 | 2024-04-09 | 南京信息工程大学 | 一种餐馆回头客预测模型、方法、系统及设备 |
CN117852507B (zh) * | 2024-03-07 | 2024-05-17 | 南京信息工程大学 | 一种餐馆回头客预测模型、方法、系统及设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080270209A1 (en) * | 2007-04-25 | 2008-10-30 | Michael Jon Mauseth | Merchant scoring system and transactional database |
CN102156932A (zh) * | 2010-02-11 | 2011-08-17 | 阿里巴巴集团控股有限公司 | 一种客户再次购买意向预测方法及装置 |
WO2015001558A1 (en) * | 2013-07-01 | 2015-01-08 | Salespredict Sw Ltd. | System and method for predicting sales |
CN107844921A (zh) * | 2017-12-11 | 2018-03-27 | 四川新网银行股份有限公司 | 一种基于embedding技术的客户行为预估方法 |
CN107895283A (zh) * | 2017-11-07 | 2018-04-10 | 重庆邮电大学 | 一种基于时间序列分解的商家客流量大数据预测方法 |
CN107909433A (zh) * | 2017-11-14 | 2018-04-13 | 重庆邮电大学 | 一种基于大数据移动电子商务的商品推荐方法 |
CN107944913A (zh) * | 2017-11-21 | 2018-04-20 | 重庆邮电大学 | 基于大数据用户行为分析的高潜在用户购买意向预测方法 |
CN108256052A (zh) * | 2018-01-15 | 2018-07-06 | 成都初联创智软件有限公司 | 基于tri-training的汽车行业潜在客户识别方法 |
CN109034658A (zh) * | 2018-08-22 | 2018-12-18 | 重庆邮电大学 | 一种基于大数据金融的违约用户风险预测方法 |
CN109255638A (zh) * | 2017-07-13 | 2019-01-22 | 北京融和友信科技股份有限公司 | 一种挖掘潜在客户的数学模型 |
CN109509040A (zh) * | 2019-01-03 | 2019-03-22 | 广发证券股份有限公司 | 预测基金潜在客户的建模方法、营销方法及装置 |
CN109636446A (zh) * | 2018-11-16 | 2019-04-16 | 北京奇虎科技有限公司 | 用户流失预测方法、装置及电子设备 |
CN109657832A (zh) * | 2018-05-04 | 2019-04-19 | 美味不用等(上海)信息科技股份有限公司 | 一种回头客的预测方法及装置 |
-
2019
- 2019-06-14 CN CN201910516387.9A patent/CN110210913A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080270209A1 (en) * | 2007-04-25 | 2008-10-30 | Michael Jon Mauseth | Merchant scoring system and transactional database |
CN102156932A (zh) * | 2010-02-11 | 2011-08-17 | 阿里巴巴集团控股有限公司 | 一种客户再次购买意向预测方法及装置 |
WO2015001558A1 (en) * | 2013-07-01 | 2015-01-08 | Salespredict Sw Ltd. | System and method for predicting sales |
CN109255638A (zh) * | 2017-07-13 | 2019-01-22 | 北京融和友信科技股份有限公司 | 一种挖掘潜在客户的数学模型 |
CN107895283A (zh) * | 2017-11-07 | 2018-04-10 | 重庆邮电大学 | 一种基于时间序列分解的商家客流量大数据预测方法 |
CN107909433A (zh) * | 2017-11-14 | 2018-04-13 | 重庆邮电大学 | 一种基于大数据移动电子商务的商品推荐方法 |
CN107944913A (zh) * | 2017-11-21 | 2018-04-20 | 重庆邮电大学 | 基于大数据用户行为分析的高潜在用户购买意向预测方法 |
CN107844921A (zh) * | 2017-12-11 | 2018-03-27 | 四川新网银行股份有限公司 | 一种基于embedding技术的客户行为预估方法 |
CN108256052A (zh) * | 2018-01-15 | 2018-07-06 | 成都初联创智软件有限公司 | 基于tri-training的汽车行业潜在客户识别方法 |
CN109657832A (zh) * | 2018-05-04 | 2019-04-19 | 美味不用等(上海)信息科技股份有限公司 | 一种回头客的预测方法及装置 |
CN109034658A (zh) * | 2018-08-22 | 2018-12-18 | 重庆邮电大学 | 一种基于大数据金融的违约用户风险预测方法 |
CN109636446A (zh) * | 2018-11-16 | 2019-04-16 | 北京奇虎科技有限公司 | 用户流失预测方法、装置及电子设备 |
CN109509040A (zh) * | 2019-01-03 | 2019-03-22 | 广发证券股份有限公司 | 预测基金潜在客户的建模方法、营销方法及装置 |
Non-Patent Citations (2)
Title |
---|
KHODABANDEHLOU,S.等: "Comparison of supervised machine learning techniques for customer churn prediction based on analysis of customer behavior", 《JOURNAL OF SYSTEMS AND INFORMATION TECHNOLOGY》 * |
张鹏等: "基于客户业务行为的潜在换机客户挖掘模型研究与应用", 《信息通信技术》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112581158A (zh) * | 2019-09-27 | 2021-03-30 | 治略资讯整合股份有限公司 | 会员回购商品的信息处理系统与方法 |
CN111144935A (zh) * | 2019-12-17 | 2020-05-12 | 武汉海云健康科技股份有限公司 | 基于大数据的睡眠会员唤醒方法及系统、服务器及介质 |
CN112101611A (zh) * | 2020-07-31 | 2020-12-18 | 重庆锐云科技有限公司 | 房地产客户复购时间的预测方法、服务器及存储介质 |
CN112101611B (zh) * | 2020-07-31 | 2022-11-18 | 重庆锐云科技有限公司 | 房地产客户复购时间的预测方法、服务器及存储介质 |
CN112381560B (zh) * | 2020-10-23 | 2022-10-21 | 东北石油大学 | 一种共享设备产品市场预测系统及方法 |
CN112381560A (zh) * | 2020-10-23 | 2021-02-19 | 东北石油大学 | 一种共享设备产品市场预测系统及方法 |
CN113469730A (zh) * | 2021-06-08 | 2021-10-01 | 北京化工大学 | 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置 |
CN113673866A (zh) * | 2021-08-20 | 2021-11-19 | 上海寻梦信息技术有限公司 | 农作物决策方法、模型训练方法以及相关设备 |
CN113706195A (zh) * | 2021-08-26 | 2021-11-26 | 东北大学秦皇岛分校 | 一种基于两阶段组合的在线消费行为预测方法及系统 |
CN113706195B (zh) * | 2021-08-26 | 2023-10-31 | 东北大学秦皇岛分校 | 一种基于两阶段组合的在线消费行为预测方法及系统 |
CN113656702B (zh) * | 2021-08-27 | 2023-07-14 | 建信基金管理有限责任公司 | 用户行为的预测方法及装置 |
CN113781128A (zh) * | 2021-10-15 | 2021-12-10 | 北京明略软件系统有限公司 | 高潜质消费者识别方法、系统、电子设备及介质 |
CN115841345A (zh) * | 2023-02-16 | 2023-03-24 | 杭州柚果供应链管理有限公司 | 跨境大数据智能化分析方法、系统以及存储介质 |
CN115841345B (zh) * | 2023-02-16 | 2023-05-16 | 杭州柚果供应链管理有限公司 | 跨境大数据智能化分析方法、系统以及存储介质 |
CN117852507A (zh) * | 2024-03-07 | 2024-04-09 | 南京信息工程大学 | 一种餐馆回头客预测模型、方法、系统及设备 |
CN117852507B (zh) * | 2024-03-07 | 2024-05-17 | 南京信息工程大学 | 一种餐馆回头客预测模型、方法、系统及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110210913A (zh) | 一种基于大数据的商家回头客预测方法 | |
Edelstein | Building profitable customer relationships with data mining | |
Dzyabura et al. | Leveraging the power of images in managing product return rates | |
CN106611344A (zh) | 挖掘潜在客户的方法及装置 | |
WO2008067543A2 (en) | Techniques for targeted offers | |
US20030033195A1 (en) | Retail site location void analysis system and method | |
CN108648038B (zh) | 一种基于子图挖掘的信用炒作与恶意评价识别方法 | |
CN110704730A (zh) | 基于大数据的产品数据推送方法、系统及计算机设备 | |
CN112001754A (zh) | 用户画像生成方法、装置、设备及计算机可读介质 | |
Alazab et al. | Maximising competitive advantage on E-business websites: A data mining approach | |
CN113781139A (zh) | 物品推荐方法、物品推荐装置、设备和介质 | |
CN111242732A (zh) | 一种基于商品推荐模型的推荐方法 | |
Pradana | Investigating the Repurchase Intention of E-Commerce Users from Service Quality and Expectation-Confirmation Theory Perspective | |
Goldberg et al. | Measuring consumer willingness to pay for a health risk reduction of salmonellosis and campylobacteriosis | |
CN112330373A (zh) | 用户行为分析方法、装置及计算机可读存储介质 | |
CN114266594A (zh) | 一种基于东南亚跨境电商平台的大数据分析方法 | |
Butler et al. | Customer behaviour classification using simulated transactional data | |
CN111143575A (zh) | 一种店铺商品结构的优化方法及系统 | |
JP4413056B2 (ja) | 評価対象の評価方法及び評価システム | |
Carneiro et al. | Applying Data Mining Techniques and Analytic Hierarchy Process to the Food Industry: Estimating Customer Lifetime Value | |
Huang | Using RFM model to construct customer value by making segment in different service industries:. | |
JP7228208B2 (ja) | 潜在顧客発掘支援システム | |
US11948181B2 (en) | Systems and methods for using SKU vector information | |
CN111144996B (zh) | 一种购物社交的方法和装置 | |
US11386470B2 (en) | Partner fee recommendation service |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190906 |
|
RJ01 | Rejection of invention patent application after publication |