CN112669069A - 一种线下零售店销售预测方法 - Google Patents

一种线下零售店销售预测方法 Download PDF

Info

Publication number
CN112669069A
CN112669069A CN202011590738.XA CN202011590738A CN112669069A CN 112669069 A CN112669069 A CN 112669069A CN 202011590738 A CN202011590738 A CN 202011590738A CN 112669069 A CN112669069 A CN 112669069A
Authority
CN
China
Prior art keywords
data
store
sales
model
predicting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011590738.XA
Other languages
English (en)
Inventor
张玥
胡军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xiaoling Network Technology Co ltd
Original Assignee
Shanghai Xiaoling Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xiaoling Network Technology Co ltd filed Critical Shanghai Xiaoling Network Technology Co ltd
Priority to CN202011590738.XA priority Critical patent/CN112669069A/zh
Publication of CN112669069A publication Critical patent/CN112669069A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的一种线下零售店销售预测方法,获取目标门店列表,并对目标门店数据和目标门店一定区域内的门店信息和数据进行收集,对收集的数据进行处理后建立预测模型,根据预测模型预测门店销量。使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数,可以方便快速的对模型进行训练,且前期数据采集比较简单,不需要高近似度的同类型门店作为对比,预测更加方便,结果也较为准确。

Description

一种线下零售店销售预测方法
技术领域
本发明属于门店管理技术领域,具体来说是一种线下零售店销售预测方法。
背景技术
目前来说,为了获取线下零售店的具体销量或销量范围,通常有两种方法,一种是通过人工采集数据,通常需要投入较多时间和金钱;一种是通过其他门店数据利用算法进行预测,通常需要比较大量的数据,且要求较高的店铺间相似度。
要收集如此多门店的数据需要很高的人工已经时间投入;店铺数据集质量和数量通常不足以支持根据店铺相似度使用算法预测。
发明内容
1.发明要解决的技术问题
本发明的目的在于解决现有的门店销量预测成本高且要求复杂的问题。
2.技术方案
为达到上述目的,本发明提供的技术方案为:
本发明的一种线下零售店销售预测方法,获取目标门店列表,并对目标门店数据和目标门店一定区域内的门店信息和数据进行收集,对收集的数据进行处理后建立预测模型,根据预测模型预测门店销量。
优选的,所述方法具体包括如下步骤:
S100、采集数据;
S200、数据整理;
S300、数据分析;
S400、数据二次整理;
S500、建立模型;
S600、模型训练;
S700、模型预测。
优选的,所述步骤S100中,采集数据具体为采集门店名称、门店地址、门店经纬度、门店周边1km范围内住宅、交通、商业、学校信息和门店周边2km范围内住宅、交通、商业、学校信息。
优选的,所述步骤S200中的数据整理具体为根据门店名称和经营类型对门店进行分类、计算门店到门店所在区中心和市中心的距离、计算门店周边2km内所有其它门店的数量。
优选的,所述步骤S300中的数据分析具体为根据步骤S100获取的信息计算门店人流量。
优选的,所述步骤S400中的数据二次整理具体为对数值型的数据进行归一化处理和对文本型的数据进行one-hot-encoding处理,处理后的数据统计为数据集。
优选的,所述步骤S500中建立模型具体包括如下步骤:
S510、筛选数据集,对二次整理后的数据集使用K-Means算法进行聚类;计算每个数据点离自己从属的聚类中心的相对距离,并设定阈值,筛选出可训练的数据集;
S520、数据集分类,对于筛选出来的数据集,根据是否有销量标签进行二次分类,有销量的数据作为训练集和验证集,无销量的数据作为预测集;
S530、模型训练,使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数;
S540、预测,根据模型参数和模型对其余数据进行预测得到预测销量。
优选的,所述数据二次整理还包括对统计好的数据计算缺失比例,对于缺失大于60%的数据进行丢弃;对缺失数值变量,根据数据集该变量的均值去进行填补;对缺失分类变量,根据数据集该变量的众数去进行填补。
优选的,所述数据整理还包括数据去重,将收集到的数据中距离在200米以内的门店中重复率高的进行去除。
3.有益效果
采用本发明提供的技术方案,与现有技术相比,具有如下有益效果:
本发明的一种线下零售店销售预测方法,获取目标门店列表,并对目标门店数据和目标门店一定区域内的门店信息和数据进行收集,对收集的数据进行处理后建立预测模型,根据预测模型预测门店销量。使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数,可以方便快速的对模型进行训练,且前期数据采集比较简单,不需要高近似度的同类型门店作为对比,预测更加方便,结果也较为准确。
附图说明
图1为本发明的一种线下零售店销售预测方法的流程图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述,附图中给出了本发明的若干实施例,但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件;当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件;本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同;本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明;本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例1
参照附图1,本实施例的一种线下零售店销售预测方法,获取目标门店列表,并对目标门店数据和目标门店一定区域内的门店信息和数据进行收集,对收集的数据进行处理后建立预测模型,根据预测模型预测门店销量。使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数,可以方便快速的对模型进行训练,且前期数据采集比较简单,不需要高近似度的同类型门店作为对比,预测更加方便,结果也较为准确。
优选的,所述方法具体包括如下步骤:
S100、采集数据;
S200、数据整理;
S300、数据分析;
S400、数据二次整理;
S500、建立模型;
S600、模型训练;
S700、模型预测。
优选的,所述步骤S100中,采集数据具体为采集门店名称、门店地址、门店经纬度、门店周边1km范围内住宅、交通、商业、学校信息和门店周边2km范围内住宅、交通、商业、学校信息;具体为:
门店名称,门店地址,门店经纬度,进店人次,门店所在区中心经纬度,门店所在市中心经纬度,门店周边1km住宅区数量,门店周边2km住宅区数量,门店周边1km地铁站数量,门店周边2km地铁站数量,门店周边1km公交车站数量,门店周边2km公交车站数量,门店周边1km幼儿园和小学数量,门店周边2km幼儿园和小学数量,门店周边1km中学数量,门店周边2km中学数量,门店周边1km大学数量,门店周边2km大学数量,门店周边1km肯德基数量,门店周边2km肯德基数量,门店周边1km商业建筑数量,门店周边2km商业建筑数量。
优选的,所述步骤S200中的数据整理具体为根据门店名称和经营类型对门店进行分类、计算门店到门店所在区中心和市中心的距离、计算门店周边2km内所有其它门店的数量。
优选的,所述步骤S300中的数据分析具体为根据步骤S100获取的信息计算门店人流量。
门店周边住宅区数量的多少直接影响门店周边的人流量;
门店周边地铁站和公交车数量的多少,意味着门店周边交通的方便与否,对于大型综合超市,周边交通方便与否直接影响该门店覆盖范围;同时周边交通方便与否也会影响周边住户的多少;
幼儿园、小学和中学,通常是住宅区的配套机构,教育机构的完善,通常意味着社区的成熟,也会影响周边住户的多少;
大学周边的门店,往往客户类型特征比较鲜明,经营品类会比较集中,管理成本和损耗成本可能会比较低;
计算门店周边2km各种门店的数量,是确认门店周边是否已形成一个成熟的商圈;门店周边其他门店变多,一方面可能会降低门店营业额,但往往也意味着周边社区的成熟。
优选的,所述步骤S400中的数据二次整理具体为对数值型的数据进行归一化处理和对文本型的数据进行one-hot-encoding处理,处理后的数据统计为数据集。
优选的,所述步骤S500中建立模型具体包括如下步骤:
S510、筛选数据集,对二次整理后的数据集使用K-Means算法进行聚类;计算每个数据点离自己从属的聚类中心的相对距离,并设定阈值,筛选出可训练的数据集;
S520、数据集分类,对于筛选出来的数据集,根据是否有销量标签进行二次分类,有销量的数据作为训练集和验证集,无销量的数据作为预测集;
S530、模型训练,使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数;
S540、预测,根据模型参数和模型对其余数据进行预测得到预测销量。
优选的,所述数据二次整理还包括对统计好的数据计算缺失比例,对于缺失大于60%的数据进行丢弃;对缺失数值变量,根据数据集该变量的均值去进行填补;对缺失分类变量,根据数据集该变量的众数去进行填补。
优选的,所述数据整理还包括数据去重,将收集到的数据中距离在200米以内的门店中重复率高的进行去除。
以上所述实施例仅表达了本发明的某种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围;因此,本发明专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种线下零售店销售预测方法,其特征在于:获取目标门店列表,并对目标门店数据和目标门店一定区域内的门店信息和数据进行收集,对收集的数据进行处理后建立预测模型,根据预测模型预测门店销量。
2.根据权利要求1所述的一种线下零售店销售预测方法,其特征在于,所述方法具体包括如下步骤:
S100、采集数据;
S200、数据整理;
S300、数据分析;
S400、数据二次整理;
S500、建立模型;
S600、模型训练;
S700、模型预测。
3.根据权利要求1所述的一种线下零售店销售预测方法,其特征在于:所述步骤S100中,采集数据具体为采集门店名称、门店地址、门店经纬度、门店周边1km范围内住宅、交通、商业、学校信息和门店周边2km范围内住宅、交通、商业、学校信息。
4.根据权利要求1所述的一种线下零售店销售预测方法,其特征在于:所述步骤S200中的数据整理具体为根据门店名称和经营类型对门店进行分类、计算门店到门店所在区中心和市中心的距离、计算门店周边2km内所有其它门店的数量。
5.根据权利要求3所述的一种线下零售店销售预测方法,其特征在于:所述步骤S300中的数据分析具体为根据步骤S100获取的信息计算门店人流量。
6.根据权利要求1所述的一种线下零售店销售预测方法,其特征在于:所述步骤S400中的数据二次整理具体为对数值型的数据进行归一化处理和对文本型的数据进行one-hot-encoding处理,处理后的数据统计为数据集。
7.根据权利要求6所述的一种线下零售店销售预测方法,其特征在于,所述步骤S500中建立模型具体包括如下步骤:
S510、筛选数据集,对二次整理后的数据集使用K-Means算法进行聚类;计算每个数据点离自己从属的聚类中心的相对距离,并设定阈值,筛选出可训练的数据集;
S520、数据集分类,对于筛选出来的数据集,根据是否有销量标签进行二次分类,有销量的数据作为训练集和验证集,无销量的数据作为预测集;
S530、模型训练,使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数;
S540、预测,根据模型参数和模型对其余数据进行预测得到预测销量。
8.根据权利要求6所述的一种线下零售店销售预测方法,其特征在于:所述数据二次整理还包括对统计好的数据计算缺失比例,对于缺失大于60%的数据进行丢弃;对缺失数值变量,根据数据集该变量的均值去进行填补;对缺失分类变量,根据数据集该变量的众数去进行填补。
9.根据权利要求4所述的一种线下零售店销售预测方法,其特征在于:所述数据整理还包括数据去重,将收集到的数据中距离在200米以内的门店中重复率高的进行去除。
CN202011590738.XA 2020-12-29 2020-12-29 一种线下零售店销售预测方法 Pending CN112669069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011590738.XA CN112669069A (zh) 2020-12-29 2020-12-29 一种线下零售店销售预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011590738.XA CN112669069A (zh) 2020-12-29 2020-12-29 一种线下零售店销售预测方法

Publications (1)

Publication Number Publication Date
CN112669069A true CN112669069A (zh) 2021-04-16

Family

ID=75411727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011590738.XA Pending CN112669069A (zh) 2020-12-29 2020-12-29 一种线下零售店销售预测方法

Country Status (1)

Country Link
CN (1) CN112669069A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116579796A (zh) * 2023-05-11 2023-08-11 广州一小时科技有限公司 基于深度学习实现智慧门店的效益分析方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111028016A (zh) * 2019-12-12 2020-04-17 腾讯科技(深圳)有限公司 销量数据预测方法、装置以及相关设备
CN111724211A (zh) * 2020-06-30 2020-09-29 名创优品(横琴)企业管理有限公司 一种线下门店商品销量预测方法、装置和设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111028016A (zh) * 2019-12-12 2020-04-17 腾讯科技(深圳)有限公司 销量数据预测方法、装置以及相关设备
CN111724211A (zh) * 2020-06-30 2020-09-29 名创优品(横琴)企业管理有限公司 一种线下门店商品销量预测方法、装置和设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116579796A (zh) * 2023-05-11 2023-08-11 广州一小时科技有限公司 基于深度学习实现智慧门店的效益分析方法及装置

Similar Documents

Publication Publication Date Title
CN106897420B (zh) 一种基于手机信令数据的用户出行驻留行为识别方法
CN104834977B (zh) 基于距离度量学习的交通警情等级预测方法
CN109800916B (zh) 一种高速公路服务区驶入车流量的建模方法
CN107578277B (zh) 用于电力营销的出租房客户定位方法
CN110634080A (zh) 异常用电检测方法、装置、设备及计算机可读存储介质
CN108256724B (zh) 一种基于动态行业系数的配电网可开放容量规划方法
CN105894089A (zh) 一种征信模型的建立方法、征信确定方法及对应装置
CN107016042B (zh) 一种基于用户位置日志的地址信息校验系统
CN107766983B (zh) 一种城市轨道交通车站应急救援驻车点的设置方法
CN114325879B (zh) 一种基于分级概率的定量降水订正方法
CN110889092A (zh) 一种基于轨道交易数据的短时大型活动周边轨道站点客流量预测方法
CN112101132B (zh) 一种基于图嵌入模型和度量学习的交通状况预测方法
CN111598333A (zh) 客流数据的预测方法及装置
CN106846082A (zh) 基于硬件信息的旅游冷启动用户产品推荐系统及方法
CN111985576B (zh) 基于决策树的店铺选址方法
CN108898244B (zh) 一种耦合多源要素的数字标牌位置推荐方法
CN111797188B (zh) 一种基于开源地理空间矢量数据的城市功能区定量识别方法
CN109146563A (zh) 一种基于迁移学习的城市住宅地价评估方法
CN107290714B (zh) 一种基于多标识指纹定位的定位方法
CN109614450A (zh) 基于多维数据的人员去向分析的方法及系统
CN112669069A (zh) 一种线下零售店销售预测方法
CN116542708A (zh) 一种智能优质商业门店规模推荐及其分级评分方法
CN117938716A (zh) 一种基于云计算的网络监测数据处理系统、方法及储存介质
CN115083161A (zh) 车辆停留点的评估方法、装置、电子设备及可读存储介质
KR20100123408A (ko) Gis 기반의 가맹점 마케팅 지원 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination