CN113538021A - 一种商场门店存续预测机器学习算法 - Google Patents

一种商场门店存续预测机器学习算法 Download PDF

Info

Publication number
CN113538021A
CN113538021A CN202010272542.XA CN202010272542A CN113538021A CN 113538021 A CN113538021 A CN 113538021A CN 202010272542 A CN202010272542 A CN 202010272542A CN 113538021 A CN113538021 A CN 113538021A
Authority
CN
China
Prior art keywords
store
data
machine learning
rate
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010272542.XA
Other languages
English (en)
Other versions
CN113538021B (zh
Inventor
王泽铭
徐辰晨
孙文龙
王盛
张函
柏林森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Bingsheng Technology Co ltd
Original Assignee
Shanghai Bingsheng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Bingsheng Technology Co ltd filed Critical Shanghai Bingsheng Technology Co ltd
Priority to CN202010272542.XA priority Critical patent/CN113538021B/zh
Publication of CN113538021A publication Critical patent/CN113538021A/zh
Application granted granted Critical
Publication of CN113538021B publication Critical patent/CN113538021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种,一种商场门店存续预测机器学习算法,包括如下步骤:1)采集数据;2)原始数据和数据处理;3)指标计算算法;4)评价标准;5)模型训练;6)结果分析;7)总结。本发明属于商场门店存续预测技术领域,具体是一种商场门店存续预测机器学习算法,通过建立了一个基于商场大数据的机器学习框架,用以预测商场中门店存续情况,从而辅助商场经营者进行科学合理的决策;基于商场大数据,使用数据驱动的方式自动生成门店存续预测,此方式可以简化门店评价体系,并且有利于弱化甚至最终消除商场经营者主观判断带来的偏差;相对于简单的对指标的排序,机器学习算法能够综合门店各项经营指标,将F1‑score提高14.8%。

Description

一种商场门店存续预测机器学习算法
技术领域
本发明属于商场门店存续预测技术领域,具体是指一种商场门店存续预测机器学习算法。
背景技术
目前,大多数商场在经营过程中可以采集每个门店的客流、销售额、租金、门店面积、是否继续经营等数据,但是这些数据并没有得到充分地利用,例如,购物商场在选择租户、调整租金、优化场内业态分布、以及优化店铺位置时,往往是依照商场经营者以往的经营经验来进行决策。依据人的经营经验进行的决策可能会在经营者经验不足或者有个人利益冲突时造成决策偏差,从而对商场的经营造成不利的影响。
发明内容
针对上述情况,为克服现有技术的缺陷,本发明提供一种商场门店存续预测机器学习算法,通过建立了一个基于商场大数据的机器学习框架,用以预测商场中门店存续情况,从而辅助商场经营者进行科学合理的决策;基于商场大数据,使用数据驱动的方式自动生成门店存续预测,此方式可以简化门店评价体系,并且有利于弱化甚至最终消除商场经营者主观判断带来的偏差;相对于简单的对指标的排序,机器学习算法能够综合门店各项经营指标,将F1-score提高14.8%。
本发明采取的技术方案如下:本发明一种商场门店存续预测机器学习算法,包括如下步骤:
1)采集数据:采集每个门店的客流、销售额、租金、门店面积、门店续存等数据;
2)原始数据和数据处理:将采集的数据进行记录;
其中,如果门店数据在历经一个月以上的时间跨度后还未录入系统,那么门店续存就为否,即关店;在原始数据里,会遇到缺失某些天的销售额、客流等数据的情况,所以在数据处理中,我们使用已有的销售额、客流,通过时间序列算法预测该天的销售额、客流,并进行记录;
3)指标计算算法:使用步骤2中记录的数据计算出4个商场经营中的重要指标,根据上述计算方法,我们可以得到今年售租比、去年售租比、今年客租比、去年客租比、销售增长率、客流增长率,再加上去年平均日销售额、今年平均日销售额、今年平均日客流、去年平均日客流,共有10个指标;
4)评价标准:为了衡量算法预测的准确度,我们使用了精确率、召回率、和F1-score这三个标准;
精确率用以预测关店的样本中有多少是真正关店的样本,其定义为:
Figure BDA0002443615180000021
其中,P为精确率,TP表示将真正关店样本预测为关店,FP表示将未关店样本预测为关店;
召回率R是真正关店的样本中有多少是预测关店的样本,其定义为:
Figure BDA0002443615180000022
其中,TP表示将真正关店样本预测为关店,FP表示将真正关店样本预测为开店;
人们通常使用精确率P和召回率R这两个指标,来评价二分类模型的分析效果,但是当这两个指标发生冲突时,我们很难在模型之间进行比较,F1-score是统计学中用来衡量二分类模型精确度的一种指标,是精确率和召回率的调和平均数,兼顾了分类模型的精确率和召回率,精确率和召回率较小的那个将会决定F1-score结果,即具有短板效应,可以避免出现一个指标过高而另外一个指标过低的情况,因此主要使用F1-score作为评价指标的定义为:
Figure BDA0002443615180000031
5)模型训练:选取20组数据分别进行划分,随机选取70%作为训练集,30%作为测试集,根据10个指标分别利用逻辑回归、SVM、随机森林、xgboost、GBDT五种机器学习算法在训练集进行训练,同时在测试集上查看召回率、精确率和F1-score;我们利用Python的第三方模块Sklearn和xgboost对逻辑回归、SVM、随机森林、GBDT、xgboost五种算法进行训练,此外,在各种模型中,还有许多参数(比如随机森林中的决策树个数)需要设定,且参数的设定对模型的结果起至关重要的作用,因此我们通过Sklearn中的GridSearchCV网格搜索寻找每个模型的最优参数;
6)结果分析:通过对销售额增长率、客流增长率、售租比等指标进行由小到大进行排序,可以用来预测门店存续情况,根据20家广场的每年平均换店率,我们将13%选取为预测关店的比率,这里将这一系列对指标排序来进行预测的算法统称为排序算法;对于机器学习算法,我们采用多次随机试验的平均结果来反映模型的效果,我们重复20次模型训练过程,并将测试集上面的精确率、召回率F1-score求平均,与使用单一指标预测存续进行比较;
7)总结:我们提出的一种商场门店存续预测机器学习算法,在这个算法中,输入的特征为商场门店近两年的销售额、租金、客流、面积、以及门店存续情况,测试了使用逻辑回归、SVM、随机森林、xgboost、GBDT五种机器学习算法来预测门店存续状况,与使用单一指标预测存续相比,xgboost、GBDT、随机森林的精确率较高,逻辑回归、SVM、随机森林的召回率较高,综合来看随机森林的效果最好,对于机器学习算法而言,不同特征之间可能存在强关联,接下来可以考虑采取特征工程进行降维,现有样本在应用机器学习算法时,存在样本不平均问题,可以考虑使用过采样、欠采样等方法解决。
进一步地,步骤3)所述的重要指标为销售额增长率、客流增长率、售租比和客租比。
进一步地,步骤3)所述的销售额增长率为今年平均日销售额与去年平均日销售额的差除以去年平均日销售额。
进一步地,步骤3)所述的售租比为平均日销售额除以日租金。
进一步地,步骤3)所述的售租比为平均日客流除以日租金。
采用上述结构本发明取得的有益效果如下:本方案一种商场门店存续预测机器学习算法,通过建立了一个基于商场大数据的机器学习框架,用以预测商场中门店存续情况,从而辅助商场经营者进行科学合理的决策;基于商场大数据,使用数据驱动的方式自动生成门店存续预测,此方式可以简化门店评价体系,并且有利于弱化甚至最终消除商场经营者主观判断带来的偏差;相对于简单的对指标的排序,机器学习算法能够综合门店各项经营指标,将F1-score提高14.8%。
附图说明
图1为本发明商场门店存续预测机器学习算法的学习框架。
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明商场门店存续预测机器学习算法,本发明一种商场门店存续预测机器学习算法,包括如下步骤:
1)采集数据:采集每个门店的客流、销售额、租金、门店面积、门店续存等数据;
2)原始数据和数据处理:将采集的数据进行记录;
其中,如果门店数据在历经一个月以上的时间跨度后还未录入系统,那么门店续存就为否,即关店;在原始数据里,会遇到缺失某些天的销售额、客流等数据的情况,所以在数据处理中,我们使用已有的销售额、客流,通过时间序列算法预测该天的销售额、客流,并进行记录;
3)指标计算算法:使用步骤2中记录的数据计算出4个商场经营中的重要指标,根据上述计算方法,我们可以得到今年售租比、去年售租比、今年客租比、去年客租比、销售增长率、客流增长率,再加上去年平均日销售额、今年平均日销售额、今年平均日客流、去年平均日客流,共有10个指标;
4)评价标准:为了衡量算法预测的准确度,我们使用了精确率、召回率、和F1-score这三个标准;
精确率用以预测关店的样本中有多少是真正关店的样本,其定义为:
Figure BDA0002443615180000061
其中,P为精确率,TP表示将真正关店样本预测为关店,FP表示将未关店样本预测为关店;
召回率R是真正关店的样本中有多少是预测关店的样本,其定义为:
Figure BDA0002443615180000062
其中,TP表示将真正关店样本预测为关店,FP表示将真正关店样本预测为开店;
人们通常使用精确率P和召回率R这两个指标,来评价二分类模型的分析效果,但是当这两个指标发生冲突时,我们很难在模型之间进行比较,F1-score是统计学中用来衡量二分类模型精确度的一种指标,是精确率和召回率的调和平均数,兼顾了分类模型的精确率和召回率,精确率和召回率较小的那个将会决定F1-score结果,即具有短板效应,可以避免出现一个指标过高而另外一个指标过低的情况,因此主要使用F1-score作为评价指标的定义为:
Figure BDA0002443615180000063
5)模型训练:选取20组数据分别进行划分,随机选取70%作为训练集,30%作为测试集,根据10个指标分别利用逻辑回归、SVM、随机森林、xgboost、GBDT五种机器学习算法在训练集进行训练,同时在测试集上查看召回率、精确率和F1-score;我们利用Python的第三方模块Sklearn和xgboost对逻辑回归、SVM、随机森林、GBDT、xgboost五种算法进行训练,此外,在各种模型中,还有许多参数(比如随机森林中的决策树个数)需要设定,且参数的设定对模型的结果起至关重要的作用,因此我们通过Sklearn中的GridSearchCV网格搜索寻找每个模型的最优参数;
6)结果分析:通过对销售额增长率、客流增长率、售租比等指标进行由小到大进行排序,可以用来预测门店存续情况,根据20家广场的每年平均换店率,我们将13%选取为预测关店的比率,这里将这一系列对指标排序来进行预测的算法统称为排序算法;对于机器学习算法,我们采用多次随机试验的平均结果来反映模型的效果,我们重复20次模型训练过程,并将测试集上面的精确率、召回率F1-score求平均,与使用单一指标预测存续进行比较;
7)总结:我们提出的一种商场门店存续预测机器学习算法,在这个算法中,输入的特征为商场门店近两年的销售额、租金、客流、面积、以及门店存续情况,测试了使用逻辑回归、SVM、随机森林、xgboost、GBDT五种机器学习算法来预测门店存续状况,与使用单一指标预测存续相比,xgboost、GBDT、随机森林的精确率较高,逻辑回归、SVM、随机森林的召回率较高,综合来看随机森林的效果最好,对于机器学习算法而言,不同特征之间可能存在强关联,接下来可以考虑采取特征工程进行降维,现有样本在应用机器学习算法时,存在样本不平均问题,可以考虑使用过采样、欠采样等方法解决。
步骤3)所述的重要指标为销售额增长率、客流增长率、售租比和客租比。
步骤3)所述的销售额增长率为今年平均日销售额与去年平均日销售额的差除以去年平均日销售额。
步骤3)所述的售租比为平均日销售额除以日租金。
步骤3)所述的售租比为平均日客流除以日租金。
实施例1
本发明商场门店存续预测机器学习算法,本发明一种商场门店存续预测机器学习算法,包括如下步骤:
1)采集数据:采集每个门店的客流、销售额、租金、门店面积、门店续存等数据;
2)原始数据和数据处理:原始数据来自于10个省市20个广场约5000个门店的经营面积、租金、销售和客流数据(见表1),如果门店数据在历经一个月以上的时间跨度后还未录入系统,那么该门店就被标记为关店;
Figure BDA0002443615180000081
表1:门店数据样例
在原始数据里,会遇到缺失某些天的销售、客流等数据的情况。所以在数据处理中,我们使用已有的销售、客流数据,通过时间序列算法预测该天的销售、客流,并在上表中补齐;
3)指标计算算法:使用表1中的门店销售额、客流、面积、租金等基础数据,我们计算了4个商场经营中的重要指标,分别是:
销售增长率:今年平均日销售与去年平均日销售的差除以去年平均日销售;
客流增长率:今年平均日客流与去年平均日客流的差除以去年平均日客流;
售租比:售租比是平均日销售除以日租金;
客租比:售租比是平均日客流除以日租金;
根据上述计算方法,我们可以得到今年售租比、去年售租比、今年客租比、去年客租比、销售增长率、客流增长率,再加上去年平均日销售、今年平均日销售、今年平均日客流、去年平均日客流,共有10个指标;
4)评价标准:为了衡量算法预测的准确度,我们使用了精确率、召回率、和F1-score这三个标准;
精确率用以预测关店的样本中有多少是真正关店的样本,其定义为:
Figure BDA0002443615180000091
其中,P为精确率,TP表示将真正关店样本预测为关店,FP表示将未关店样本预测为关店;
召回率R是真正关店的样本中有多少是预测关店的样本,其定义为:
Figure BDA0002443615180000101
其中,TP表示将真正关店样本预测为关店,FP表示将真正关店样本预测为开店;
人们通常使用精确率P和召回率R这两个指标,来评价二分类模型的分析效果,但是当这两个指标发生冲突时,我们很难在模型之间进行比较,F1-score是统计学中用来衡量二分类模型精确度的一种指标,是精确率和召回率的调和平均数,兼顾了分类模型的精确率和召回率,精确率和召回率较小的那个将会决定F1-score结果,即具有短板效应,可以避免出现一个指标过高而另外一个指标过低的情况,因此主要使用F1-score作为评价指标,的定义为:
Figure BDA0002443615180000102
5)模型训练:选取20组数据分别进行划分,随机选取70%作为训练集,30%作为测试集,根据10个指标分别利用逻辑回归、SVM、随机森林、xgboost、GBDT五种机器学习算法在训练集进行训练,同时在测试集上查看召回率、精确率和F1-score;我们利用Python的第三方模块Sklearn和xgboost对逻辑回归、SVM、随机森林、GBDT、xgboost五种算法进行训练,此外,在各种模型中,还有许多参数(比如随机森林中的决策树个数)需要设定,且参数的设定对模型的结果起至关重要的作用,因此我们通过Sklearn中的GridSearchCV网格搜索寻找每个模型的最优参数;
6)结果分析:通过对销售额增长率、客流增长率、售租比等指标进行由小到大进行排序,可以用来预测门店存续情况,根据20家广场的每年平均换店率,我们将13%选取为预测关店的比率,这里将这一系列对指标排序来进行预测的算法统称为排序算法;对于机器学习算法,我们采用多次随机试验的平均结果来反映模型的效果,我们重复20次模型训练过程,并将测试集上面的精确率、召回率F1-score求平均,与使用单一指标预测存续进行比较,结果如表2所示:
Figure BDA0002443615180000111
表2:各种算法的精确率、召回率、F1-Score
其中*表示排序算法中的各项指标最大值,^表示机器学习算法中各项指标的最大值。从表2中可以发现,SVM的F1-score仅为10%左右,且精确率过低,因此不考虑用SVM算法进行存续预测。xgboost和GBDT的F1-score在26%左右,略高于单独使用平均得分和客流增长率。二者相比之下,xgboost的精确率较高,GBDT的召回率较高,综合来看这两种算法的效果较好,但是和随机森林相比有一定差距。逻辑回归和随机森林的F1-score均超过使用单一指标预测存续的结果,但是逻辑回归更加偏重召回率。相比之下随机森林较好地平衡了精确率和召回率的关系,且精确率,召回率,F1-score均超过使用单一指标排序预测存续的结果,因此综合来看随机森林的效果最好。
7)总结:我们提出的一种商场门店存续预测机器学习算法,在这个算法中,输入的特征为商场门店近两年的销售额、租金、客流、面积、以及门店存续情况,测试了使用逻辑回归、SVM、随机森林、xgboost、GBDT五种机器学习算法来预测门店存续状况,与使用单一指标预测存续相比,xgboost、GBDT、随机森林的精确率较高,逻辑回归、SVM、随机森林的召回率较高,综合来看随机森林的效果最好,对于机器学习算法而言,不同特征之间可能存在强关联,接下来可以考虑采取特征工程进行降维,现有样本在应用机器学习算法时,存在样本不平均问题,可以考虑使用过采样、欠采样等方法解决。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

Claims (5)

1.一种商场门店存续预测机器学习算法,其特征在于,包括如下步骤:
1)采集数据:采集每个门店的客流、销售额、租金、门店面积、门店续存等数据;
2)原始数据和数据处理:将采集的数据进行记录;
其中,如果门店数据在历经一个月以上的时间跨度后还未录入系统,那么门店续存就为否,即关店;在原始数据里,会遇到缺失某些天的销售额、客流等数据的情况,所以在数据处理中,我们使用已有的销售额、客流,通过时间序列算法预测该天的销售额、客流,并进行记录;
3)指标计算算法:使用步骤2中记录的数据计算出4个商场经营中的重要指标,根据上述计算方法,我们可以得到今年售租比、去年售租比、今年客租比、去年客租比、销售增长率、客流增长率,再加上去年平均日销售额、今年平均日销售额、今年平均日客流、去年平均日客流,共有10个指标;
4)评价标准:为了衡量算法预测的准确度,我们使用了精确率、召回率、和F1-score这三个标准;
精确率用以预测关店的样本中有多少是真正关店的样本,其定义为:
Figure FDA0002443615170000011
其中,P为精确率,TP表示将真正关店样本预测为关店,FP表示将未关店样本预测为关店;
召回率R是真正关店的样本中有多少是预测关店的样本,其定义为:
Figure FDA0002443615170000021
其中,TP表示将真正关店样本预测为关店,FP表示将真正关店样本预测为开店;
人们通常使用精确率P和召回率R这两个指标,来评价二分类模型的分析效果,但是当这两个指标发生冲突时,我们很难在模型之间进行比较,F1-score是统计学中用来衡量二分类模型精确度的一种指标,是精确率和召回率的调和平均数,兼顾了分类模型的精确率和召回率,精确率和召回率较小的那个将会决定F1-score结果,即具有短板效应,可以避免出现一个指标过高而另外一个指标过低的情况,因此主要使用F1-score作为评价指标的定义为:
Figure FDA0002443615170000022
5)模型训练:选取20组数据分别进行划分,随机选取70%作为训练集,30%作为测试集,根据10个指标分别利用逻辑回归、SVM、随机森林、xgboost、GBDT五种机器学习算法在训练集进行训练,同时在测试集上查看召回率、精确率和F1-score;我们利用Python的第三方模块Sklearn和xgboost对逻辑回归、SVM、随机森林、GBDT、xgboost五种算法进行训练,此外,在各种模型中,还有许多参数(比如随机森林中的决策树个数)需要设定,且参数的设定对模型的结果起至关重要的作用,因此我们通过Sklearn中的GridSearchCV网格搜索寻找每个模型的最优参数;
6)结果分析:通过对销售额增长率、客流增长率、售租比等指标进行由小到大进行排序,可以用来预测门店存续情况,根据20家广场的每年平均换店率,我们将13%选取为预测关店的比率,这里将这一系列对指标排序来进行预测的算法统称为排序算法;对于机器学习算法,我们采用多次随机试验的平均结果来反映模型的效果,我们重复20次模型训练过程,并将测试集上面的精确率、召回率F1-score求平均,与使用单一指标预测存续进行比较;
7)总结:我们提出的一种商场门店存续预测机器学习算法,在这个算法中,输入的特征为商场门店近两年的销售额、租金、客流、面积、以及门店存续情况,测试了使用逻辑回归、SVM、随机森林、xgboost、GBDT五种机器学习算法来预测门店存续状况,与使用单一指标预测存续相比,xgboost、GBDT、随机森林的精确率较高,逻辑回归、SVM、随机森林的召回率较高,综合来看随机森林的效果最好,对于机器学习算法而言,不同特征之间可能存在强关联,接下来可以考虑采取特征工程进行降维,现有样本在应用机器学习算法时,存在样本不平均问题,可以考虑使用过采样、欠采样等方法解决。
2.根据权利要求1所述的一种商场门店存续预测机器学习算法,其特征在于,步骤3)所述的重要指标为销售额增长率、客流增长率、售租比和客租比。
3.根据权利要求1所述的一种商场门店存续预测机器学习算法,其特征在于,步骤3)所述的销售额增长率为今年平均日销售额与去年平均日销售额的差除以去年平均日销售额。
4.根据权利要求1所述的一种商场门店存续预测机器学习算法,其特征在于,步骤3)所述的售租比为平均日销售额除以日租金。
5.根据权利要求1所述的一种商场门店存续预测机器学习算法,其特征在于,步骤3)所述的售租比为平均日客流除以日租金。
CN202010272542.XA 2020-04-09 2020-04-09 一种商场门店存续预测机器学习方法 Active CN113538021B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010272542.XA CN113538021B (zh) 2020-04-09 2020-04-09 一种商场门店存续预测机器学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010272542.XA CN113538021B (zh) 2020-04-09 2020-04-09 一种商场门店存续预测机器学习方法

Publications (2)

Publication Number Publication Date
CN113538021A true CN113538021A (zh) 2021-10-22
CN113538021B CN113538021B (zh) 2023-11-10

Family

ID=78087742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010272542.XA Active CN113538021B (zh) 2020-04-09 2020-04-09 一种商场门店存续预测机器学习方法

Country Status (1)

Country Link
CN (1) CN113538021B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511822A (zh) * 2022-04-19 2022-05-17 广州市方连科技有限公司 一种根据监控画面预测销售额的日用杂品销售系统
CN117829902A (zh) * 2024-03-04 2024-04-05 山东鲁商科技集团有限公司 一种基于模型的连锁超市门店经营风险预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360022A (zh) * 2018-10-15 2019-02-19 广东工业大学 一种基于数据挖掘的商场商品销量预测方法、装置及设备
CN109919184A (zh) * 2019-01-28 2019-06-21 中国石油大学(北京) 一种基于测井数据的多井复杂岩性智能识别方法及系统
CN110533342A (zh) * 2019-09-04 2019-12-03 上海丙晟科技有限公司 一种基于大数据的商场门店评价方法
CN110580639A (zh) * 2019-08-08 2019-12-17 江苏荣泽信息科技股份有限公司 一种基于连锁业态的门店经营预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360022A (zh) * 2018-10-15 2019-02-19 广东工业大学 一种基于数据挖掘的商场商品销量预测方法、装置及设备
CN109919184A (zh) * 2019-01-28 2019-06-21 中国石油大学(北京) 一种基于测井数据的多井复杂岩性智能识别方法及系统
CN110580639A (zh) * 2019-08-08 2019-12-17 江苏荣泽信息科技股份有限公司 一种基于连锁业态的门店经营预测方法
CN110533342A (zh) * 2019-09-04 2019-12-03 上海丙晟科技有限公司 一种基于大数据的商场门店评价方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511822A (zh) * 2022-04-19 2022-05-17 广州市方连科技有限公司 一种根据监控画面预测销售额的日用杂品销售系统
CN117829902A (zh) * 2024-03-04 2024-04-05 山东鲁商科技集团有限公司 一种基于模型的连锁超市门店经营风险预测方法及系统

Also Published As

Publication number Publication date
CN113538021B (zh) 2023-11-10

Similar Documents

Publication Publication Date Title
CN113360358B (zh) 一种自适应计算it智能运维健康指数的方法及系统
CN112966962A (zh) 一种电商企业评优方法
US20200193340A1 (en) Business default prediction system and operation method thereof
CN113538021A (zh) 一种商场门店存续预测机器学习算法
WO2017071369A1 (zh) 一种预测用户离网的方法和设备
Xu et al. Novel key indicators selection method of financial fraud prediction model based on machine learning hybrid mode
TWI464700B (zh) 信用違約預測方法與裝置
CN113869768A (zh) 产业链强弱度的评价方法、装置、设备及可读介质
CN116048912A (zh) 一种基于弱监督学习的云服务器配置异常识别方法
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
CN113222255B (zh) 一种合同履约表现量化及短期违约预测的方法及装置
KR102499182B1 (ko) 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템
CN113688506B (zh) 基于微站等多维数据的潜在大气污染源识别方法
Basha et al. Enhancing red wine quality prediction through Machine Learning approaches with Hyperparameters optimization technique
KR102543211B1 (ko) 비정형 기업 데이터를 이용한 기업성장 예측 시스템
CN111080365A (zh) 一种基于大数据的商场门店存续预测方法
CN114778485A (zh) 基于近红外光谱和注意力机制网络的品种鉴定方法及系统
CN114612239A (zh) 基于算法、大数据、人工智能的股票舆情监测和风控系统
CN112116139A (zh) 一种电力需求预测方法及系统
KR102478555B1 (ko) 농산물 원산지 단속 후보 선정을 수행하는 서버 및 이의 동작 방법
CN113435655B (zh) 扇区动态管理决策方法、服务器及系统
CN112581036B (zh) 一种大数据案件评价模型的设计方法、人才评价方法、人才库构建及推荐方法
Arisanti et al. A NARX-NN optimization algorithm for forecasting inflation during a potential recession period using longitudinal data
CN115828735A (zh) 一种高成长型企业评价方法和系统
KR20230062257A (ko) 기업 정보를 이용한 기업 미래 성장지수 분석 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant