CN116151861A - 基于间断时间序列样本构建的销量预测模型及构建方法 - Google Patents

基于间断时间序列样本构建的销量预测模型及构建方法 Download PDF

Info

Publication number
CN116151861A
CN116151861A CN202310432576.4A CN202310432576A CN116151861A CN 116151861 A CN116151861 A CN 116151861A CN 202310432576 A CN202310432576 A CN 202310432576A CN 116151861 A CN116151861 A CN 116151861A
Authority
CN
China
Prior art keywords
data
commodity
sales
date
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310432576.4A
Other languages
English (en)
Other versions
CN116151861B (zh
Inventor
郭文宾
周瑞
李舒宁
曾云
张金银
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Bizhi Technology Co ltd
Original Assignee
Hangzhou Bizhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Bizhi Technology Co ltd filed Critical Hangzhou Bizhi Technology Co ltd
Priority to CN202310432576.4A priority Critical patent/CN116151861B/zh
Publication of CN116151861A publication Critical patent/CN116151861A/zh
Application granted granted Critical
Publication of CN116151861B publication Critical patent/CN116151861B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于间断时间序列样本构建的销量预测模型及构建方法,包括:S1:数据收集,所述数据包括过去设定时间内真实的销售数据、商品数据和天气数据;S2:数据预处理,包括数据清洗、数据筛选与数据类型统一转换;S3:数据建模,通过间断时间序列数据建模方法建模,获得数据样本;所述间断时间序列数据建模方法通过补充天数增加数据样本量S4:特征构建;S5:数据集构建,得到最终数据集;S6:模型训练,利用最终数据集进行模型训练,获得未来销量预测数据。本方法能有效提升算法模型进行商品销量预测的预测精度。

Description

基于间断时间序列样本构建的销量预测模型及构建方法
技术领域
本发明涉及计算机及大数据处理技术领域,尤其是涉及一种基于间断时间序列样本构建的销量预测模型及构建方法。
背景技术
在市场竞争日益白热化的今天,精细化运营、降本提效是大势所趋,而对毛利率本身就不算很高的零售行业来说,更是重中之重。销量预测是零售行业内进行精细化运营、降本提效的主要手段。销量预测主要是通过商品过去一段时间内的销量记录,来预测商品在未来某个时间的销量。帮助零售企业减少不必要的库存资金占用、或减少因库存不足而带来的销售亏损。
零售企业需要对在架售卖的多种商品进行销量预测,但不同商品的销量波动有比较大的差异,某些商品仅在部分时间段内有销量(例如:烟花爆竹在春节期间销量大幅度增加;冰淇淋在夏天销量会大幅度增加等情况)。根据零售商品销售的二八原则(20%的商品贡献了80%的销量),可以的得出80%的商品销量仅占所有销量的20%,这80%的商品在多个日期内都没有销量。若对所有商品的所有日期进行数据建模,补全所有商品没有销量的所有日期作为数据样本,会造成严重的数据稀疏,并且存储建模过后的数据样本会造成大量存储空间的浪费。同时数据建模过后的数据样本,由于存在大比例的销量为0的商品与日期的组合,使得数据分布不均匀,这种情况下算法模型无法很好的学习到数据样本中潜在的商品售卖特性,同时也会影响算法模型的学习效率。若不对所有商品进行建模,会舍弃大量商品特征,算法模型无法很好的学习到大部分商品的销售特性。
期刊文章“基于遗传神经网络下新零售目标产品的销量预测研究”,提出了一种通过遗传神经网络实现对目标产品短期销量预测的方法。该方法中数据处理部分通过商品与目标小类的对应关系,分析销售量变化趋势与所属目标小类变化趋势的关系。具体的做法是:依据商品与目标小类的对应关系,求出该段时间内销售额排名前10的小类,得到目标小类每个月的平均价格、库存、价格变化、销售量变化和销售量等维度的数据,由于目标小类中的商品过多,以累计销售额排名前50的商品来代表目标小类中所有的商品,分析2019年国庆节、双十一、双十二和元旦这四个节假日内各种相关因素对目标小类中商品的销售量的影响。
期刊文章“基于遗传神经网络下新零售目标产品的销量预测研究”,所提出的方法在数据处理阶段以累计销售额排名前50的商品来代表目标小类中所有的商品。该方法由于目标小类中的商品过多,仅选取累计销售额排名前50的商品来代表目标小类中所有的商品。这种数据处理方法用少数商品代表全部数据,将一些时令/长尾商品(例如:冰淇淋、烟花爆竹等)排除在外,由于这种方法在数据样本构建阶段舍去了大量商品,即舍去了大量的数据样本,致使用于算法模型训练阶段的数据样本较少,算法模型在销量预测阶段预测精度降低。
发明内容
针对现有技术存在的问题,本发明的目的在解决现有技术中因商品过多无法对所有商品进行数据建模的问题。提出一种基于间断时间序列样本构建的销量预测算法模型的构建方法,将所有商品用于数据建模,考虑每个商品的销量特征,能够有效增加数据样本的数量,并且有效提升算法模型进行商品销量预测的预测精度。
为实现上述目的,本发明提供一种基于间断时间序列样本构建的销量预测模型的构建方法,所述方法包括以下步骤:
S1:数据收集,所述数据包括过去设定时间内真实的销售数据、商品数据和天气数据;
S2:数据预处理,对S1所得销售数据、商品数据和天气数据进行数据清洗、数据筛选与数据类型统一转换;
S3:数据建模,通过间断时间序列数据建模方法对步骤S2预处理后的数据进行数据建模,获得数据样本;所述间断时间序列数据建模方法通过补充天数增加数据样本量;
S4:特征构建,对步骤S3所得数据样本进行销量特征构建;对S2所得预处理后的数据进行商品特征构建、零售商户特征构建、天气特征构建和日期特征构建;
S5:数据集构建,将S3所得数据样本与S4所得所有特征进行组合,得到最终数据集;
S6:模型训练,利用最终数据集进行模型训练,获得未来销量预测数据。
进一步,步骤S2实现过程如下:
S21:对S1所得的销售数据进行数据清洗,去除退货数据,得到零售商户设定时间内所有商品的销量数据,对销量数据进行数据筛选,筛选出“零售商户编码-在售商品编码-销售日期-商品销量”4者组合数据;然后对该组合数据进行数据类型统一转换,将零售商户编码、在售商品编码与商品销量转换为整数类型数据,将销售日期转换为字符串类型数据;
S22:对S1所得零售商户的设定时间内售卖所有商品数据进行数据清洗,去除已停售商品得到目前在售商品数据;之后对在售商品数据进行数据筛选,筛选出“商品编码-商品类目编码”组合数据;之后对该组合数据进行数据类型统一转换,将商品编码与商品类目转换为整数类型数据;
S23:对S1所得零售商户设定时间内历史天气数据进行数据筛选,筛选出“零售商户编码-日期-天气-最高温度-最低温度”组合数据;之后对组合数据进行数据类型统一转换,将零售商户编码与日期转换为字符串类型数据,将天气按照天气的中文代表字词的首字母进行排序,每个天气的排序值作为该天气的编码,将该编码转换为整数类型数据,天气编码示意图如图3所示;将最高温度与最低温度转换为整数类型数据。
S24:对S1所得零售商户过去2年内常规促销活动数据筛选,筛选出零售商户编码-日期-常规促销活动编码-促销活动优惠力度组合数据;对组合数据进行数据类型统一转换,将零售商户编码与常规促销活动编码转换为字符串类型数据,将促销活动优惠力度转换为浮点数类型数据。
进一步,步骤S3中所述的间断时间序列数据建模方法实现过程如下:
S31:将S21所得“零售商户编码-在售商品编码-销售日期-商品销量”4者组合数据按日期递增顺序进行排序,其中不包含商品销量为0的日期,由此形成间断时间序列;
S32:对S31所得间断时间序列中每个商品出现销量的日期之后的n天内,补充该商品没有销量的日期的商品销量值为0,作为新的数据样本,数据样本为“零售商户编码-在售商品编码-销售日期-商品销量”组合数据;使得建模后数据样本量和数据稀疏度满足要求;其中,n的取值范围为[1,+∞);
S33:将S32所得数据样本与S21所得“零售商户编码-在售商品编码-销售日期-商品销量”组合数据按日期递增顺序进行排序,作为全部商品的所有数据样本。
进一步,步骤S32中,数值n的最优取值策略如下:
首先,建模后数据样本量计算方式如公式(1)所示;
Figure SMS_1
(1)
其中,
Figure SMS_2
与/>
Figure SMS_3
代表数据建模后的数据样本总数;/>
Figure SMS_4
代表时间序列总数;/>
Figure SMS_5
代表第i个时间序列真实商品销量的数据样本量;/>
Figure SMS_6
代表数据建模想要填充销量值为0的日期总数;/>
Figure SMS_7
代表第i个序列每个有销量日期之后/>
Figure SMS_8
天内销量值不为0的数据样本总量;其次,数据样本的数据稀疏度计算规则如公式(2)所示:
Figure SMS_9
其中,SR代表数据样本的数据稀疏度;B代表原始真实数据样本量;A代表数据建模后数据样本量;
最后,数值n的取值规则如公式(3)所示:
Figure SMS_12
其中,/>
Figure SMS_15
代表数据建模想要填充销量值为0的日期总数;/>
Figure SMS_19
代表在约束条件/>
Figure SMS_11
下,/>
Figure SMS_16
值达到最大时/>
Figure SMS_20
的取值;/>
Figure SMS_22
代表数据建模后数据样本量A应多于原始数据样本量B;/>
Figure SMS_10
代表数据建模后数据样本的数据稀疏度/>
Figure SMS_14
应小于0.5;/>
Figure SMS_18
代表数据建模后数据样本存储占用空间/>
Figure SMS_21
小于0.5倍的机器内存资源/>
Figure SMS_13
;在约束条件/>
Figure SMS_17
下,计算得到n的最优取值。
进一步,步骤S4实现过程如下:
S41:对S33所得数据样本进行销量特征构建,所述销量特征为零售商户每个日期每个商品前3、5、7、15、30、45、60、90、180和360天内的销量最大值、最小值、平均值和累计值,作为零售商户与商品组合的销量特征;
S42:对S22“商品编码-商品类目编码”组合数据进行商品特征构建,对“商品编码-商品类目编码”组合数据中将商品按上架售卖的时间进行排序,之后将每个商品的排序值作为商品编码特征;将商品类目编码按类目编码数字递增顺序进行排序,之后将该排序值作为商品类目编码的商品类目特征;将商品编码特征与商品类目特征进行组合作为商品特征;
S43:对S23所得“零售商户编码-日期-天气-最高温度-最低温度”组合数据进行零售商户特征构建;将零售商户按照零售商户编码数字递增顺序进行排序,之后将该排序值作为零售商户特征;
S44:对S23所得“零售商户编码-日期-天气-最高温度-最低温度”组合数据进行天气特征构建;
S45:对S23所得“零售商户编码-日期-天气-最高温度-最低温度”组合数据进行日期特征构建;对设定时间内每个日期是否为节假日、是否为工作日、是一年中的第几月、是一年中的第几周、是一周中的周几进行统计,作为日期特征。
进一步,步骤S44中,将天气按首字母进行排序,将每个天气排序值、日期、最高温度与最低温度4者组合作为天气特征。
进一步,步骤S5实现过程如下:
S51:将S33所得数据样本与S41所得零售商户与商品的组合销量特征按零售商户编码-商品编码-日期进行拼接得到第一临时数据集;
S52:将S51所得第一临时数据集与S42所得商品特征按商品编码进行拼接得到第二临时数据集;
S53:将S52所得第二临时数据集与S43所得零售商户特征按零售商户编码进行拼接得到第三临时数据集;
S54:将S53所得第三临时数据集与S44所得天气特征按日期进行拼接得到第四临时数据集;
S55:将S54所得第四临时数据集与S45所得日期特征按日期进行拼接得到最终数据集。
进一步,预测销量值与实际销量值之间的均方误差MSE计算公式如下:
Figure SMS_23
其中,/>
Figure SMS_24
为商品预测销量值,/>
Figure SMS_25
为商品实际销量值。
进一步,步骤S6实现过程如下:
S61:在训练前将S55所得最终数据集划分为训练集与测试集,利用训练集上零售商户中商品的销量信息作为标签进行模型训练,在训练完成后得到训练好的模型;
S62:使用S61所得测试集以预测销量与实际销量之间的加权平均绝对百分比误差来衡量模型性能进行评估。
另一方面,本发明提供一种基于间断时间序列样本构建的销量预测模型,所述销量预测模型通过本发明所述的构建方法实现。
本发明的有益效果如下:本发明通过基于间断时间序列样本构建的销量预测算法模型及构建方法,解决了现有技术中因商品过多没有很好的方法对所有商品进行数据建模的问题,解决了对所有商品所有日期进行数据建模所带来的数据样本过多的问题。将所有商品用于数据建模,对每个零售商户每个商品出现销量的日期之后的n天内没有销量的日期填充销量值为0,通过计算最优补充天数n的数值,根据此方式能够有效增加用于模型训练的数据样本的总量,在保障样本稀疏度和内存占用空间满足条件的情况下使得算法模型可以更好的学习到所有商品的特征,能够有效提升算法模型进行商品销量预测的预测精度。可以有效增多用于模型训练的数据样本总量,并且与工业界常用的商品销量预测方法进行对比,本发明构建的模型可以有效地提升商品销量预测性能。
附图说明
图1为根据本发明的基于间断时间序列样本构建的销量预测模型的构建方法的流程示意图;
图2为根据本发明基于间断时间序列样本构建的销量预测模型的数据处理示意图;
图3为根据本发明基于间断时间序列样本构建的销量预测模型的天气编码示意图;
图4为根据本发明的数据转换示意图;
图5为根据本发明基于间断时间序列样本构建的销量预测模型中补充天数n的取值规则流程图。
具体实施方式
下面将结合附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
以下结合图1-图5对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
如图1所示,本发明实施例提供一种基于间断时间序列样本构建的销量预测模型的构建方法,包括以下步骤:
S1:数据收集,数据包括过去预定时间内真实的销售数据、商品数据和天气数据。本实施例中,如图2所示,收集了某地区一批零售商户的过去2年内真实销售数据、零售商户过去2年内售卖的所有商品数据;这些数据包括原始数据样本和数据建模补充12天后数据样本,原始数据样本、数据建模补充12天后数据样本均包括日期、商店编码、商品编码和销量的相关数据。
S2:数据预处理:对S1所得销售数据、商品数据、常规促销活动数据和天气数据进行数据清洗、数据筛选与数据类型统一转换。包括以下子步骤:
S21:对S1所得一批零售商户的过去2年内真实销售数据进行数据清洗,去除退货数据,得到零售商户2年内所有商品的销量数据,对销量数据进行数据筛选,筛选出(零售商户编码-在售商品编码-销售日期-商品销量)4者组合数据。然后对该组合数据进行数据类型统一转换,将零售商户编码、在售商品编码与商品销量转换为整数类型数据,将销售日期转换为字符串类型数据。
S22:对S1所得零售商户的过去2年内售卖所有商品数据进行数据清洗,去除已停售商品得到目前在售商品数据。之后对在售商品数据进行数据筛选,筛选出(商品编码-商品类目编码)组合数据。之后对该组合数据进行数据类型统一转换,将商品编码与商品类目转换为整数类型数据。
S23:对S1所得零售商户过去2年内历史天气数据进行数据筛选,筛选出(零售商户编码-日期-天气-最高温度-最低温度)组合数据。之后对组合数据进行数据类型统一转换,将零售商户编码与日期转换为字符串类型数据,将天气按照天气的中文代表字词的首字母进行排序,每个天气的排序值作为该天气的编码,将该编码转换为整数类型数据,天气编码示意图如图3所示,其包括大雪、大雨、晴、小雨、阴天等相关数据;将最高温度与最低温度转换为整数类型数据。
S24:对S1所得零售商户过去2年内常规促销活动数据筛选,筛选出(零售商户编码-日期-常规促销活动编码-促销活动优惠力度)组合数据。如图4所示,之后对组合数据进行数据类型统一转换,将零售商户编码与常规促销活动编码转换为字符串类型数据,将促销活动优惠力度转换为浮点数类型数据。
S3:数据建模:通过本发明提出的间断时间序列数据建模方法对S21(零售商户编码-在售商品编码-销售日期-商品销量)4者组合数据进行数据建模。具体过程如下:
S31:将S21所得(零售商户编码-在售商品编码-销售日期-商品销量)4者组合数据按日期递增顺序进行排序,作为时间序列。
S32:对S31所得时间序列中每个商品出现销量的日期之后的n天内,补充该商品没有销量的日期的商品销量为值0,作为新的数据样本,数据样本为(零售商户编码-在售商品编码-销售日期-商品销量)组合数据。
S33:将S32所得数据样本与S21所得(零售商户编码-在售商品编码-销售日期-商品销量)组合数据按日期递增顺序进行排序,作为全部商品的所有数据样本。
其中,步骤S32中的补充天数n并不是固定数值,而是根据数据样本的特征进行最优取值,补充天数n的最优取值策略如下:
首先,建模后数据样本量计算方式如公式(1)所示;n的取值范围为[1,+∞),数据建模示例如图2所示。
Figure SMS_28
其中,/>
Figure SMS_29
与/>
Figure SMS_31
代表数据建模后的数据样本总;/>
Figure SMS_27
代表时间序列总数;/>
Figure SMS_30
代表第i个时间序列真实商品销量的数据样本量;/>
Figure SMS_32
代表数据建模想要填充销量值为0的日期总数;/>
Figure SMS_33
代表第i个序列每个有销量日期之后/>
Figure SMS_26
天内销量值不为0的数据样本总量。
其次,数据样本的数据稀疏度计算规则如公式(2)所示。
Figure SMS_34
其中,SR代表数据样本的数据稀疏度;B代表原始真实数据样本量;A代表数据建模后数据样本量。由该公式可以看出SR越大,数据样本的数据稀疏度越大,说明数据样本中真实的销量值越少,即数据建模补充的销量值为0的数据集样本越多。
最后,数值n的取值规则如公式(3)所示:
Figure SMS_36
其中,/>
Figure SMS_39
代表数据建模想要填充销量值为0的日期总数;/>
Figure SMS_43
代表在约束条件/>
Figure SMS_38
下,/>
Figure SMS_42
值达到最大时/>
Figure SMS_45
的取值;/>
Figure SMS_47
代表数据建模后数据样本量A应多于原始数据样本量B;/>
Figure SMS_35
代表数据建模后数据样本的数据稀疏度/>
Figure SMS_40
应小于0.5,若数据建模后的数据样本数据稀疏度大于0.5,说明数据建模后的数据样本中销量值为0的数据样本超过50%,即数据建模生成的销量值为0的数据样本多于原始真实销量数据样本,对原始数据样本分布影响较大,会造成算法偏差;/>
Figure SMS_44
代表数据建模后数据样本存储占用空间/>
Figure SMS_46
小于0.5倍的机器内存资源/>
Figure SMS_37
,否则模型将会由于机器内存资源不足而无法完成模型训练。在约束条件/>
Figure SMS_41
下,n的取值规则流程如图5所示,补充天数n的取值具体包括如下步骤:
S321.确定补充天数n的初始取值;
S322.对每个商品出现销量的日期之后的n天内进行数据建模;
S323.判断数据建模后数据样本量A是否大于原始数据样本量B;若是则进入下一步骤,若否则将n的取值加1,返回步骤S322;
S324.判断数据建模后数据样本的数据稀疏度是否小于0.5;若是则进入下一步骤,若否则将n的取值加1,返回步骤S322;
S325.判断数据建模后数据样本存储空间是否小于0.5倍机器内存资源;若是则进入下一步骤,若否则将n的取值加1,返回步骤S322;
S326.判断数据建模后数据样本量是否达到最大,若否则将n的取值加1,返回步骤S322;若是,输出建模后数据样本与最优补充天数n的数值。
如此,获得最优补充天数n的数值,根据此方式能够有效增加用于模型训练的数据样本的总量,在保障样本稀疏度和内存占用空间满足条件的情况下使得算法模型可以更好的学习到所有商品的特征,能够有效提升算法模型进行商品销量预测的预测精度。
S4:特征构建:对S33所得数据样本进行销量特征构建;对S22所得(商品编码-商品类目编码)组合数据进行商品特征构建;对S23所得(零售商户编码-日期-天气-最高温度-最低温度)组合数据进行零售商户特征构建、天气特征构建、日期特征构建。具体构建过程如下:
S41:对S33所得数据样本进行销量特征构建,所述销量特征为零售商户每个日期每个商品前3、5、7、15、30、45、60、90、180和360天内的销量最大值、最小值、平均值和累计值,作为零售商户与商品组合的销量特征。
S42:对S22(商品编码-商品类目编码)组合数据进行商品特征构建,对(商品编码-商品类目编码)组合数据中将商品按上架售卖的时间进行排序,之后将每个商品的排序值作为商品编码特征;将商品类目编码按类目编码数字递增顺序进行排序,之后将该排序值作为商品类目编码的商品类目特征;将商品编码特征与商品类目特征进行组合作为商品特征。
S43:对S23所得(零售商户编码-日期-天气-最高温度-最低温度)组合数据进行零售商户特征构建。将零售商户按照零售商户编码数字递增顺序进行排序,之后将该排序值作为零售商户特征。
S44:对S23所得(零售商户编码-日期-天气-最高温度-最低温度)组合数据进行天气特征构建。将天气按首字母进行排序,将每个天气排序值、日期、最高温度与最低温度4者组合作为天气特征。对于零售商户来说,每天的天气在一定程度上会影响来到零售商户的客流量,零售商户当天客流量减少,会对零售商户在售卖的常规商品销量造成一定影响。同时若当天天气属于某些极端天气,则会对零售商户在售卖的特殊商品销量产生影响,例如:下雨天的雨伞销量通常会大量增加;夏天的高温会带来冰淇淋与饮料等商品销量的大量增加等。故需要在商品销量预测时考虑相关天气特征,可以是的商品销量预测更加准确。
S45:对S23所得(零售商户编码-日期-天气-最高温度-最低温度)组合数据进行日期特征构建。对2年内每个日期是否为节假日、是否为工作日、是一年中的第几月、是一年中的第几周、是一周中的周几进行统计,作为日期特征。
S46:对S24所得(零售商户编码-日期-常规促销活动编码-促销活动优惠力度)组合数据进行促销活动特征构建。统计2年内每个常规促销活动的促销力度,即折扣力度。将常规促销活动编码与折扣力度进行组合,作为促销活动特征。
S5:数据集构建:将S33所得数据样本与S4所得所有特征进行组合,得到最终数据集,具体实现过程如下:
S51:将S33所得数据样本与S41所得零售商户与商品的组合销量特征按零售商户编码-商品编码-日期进行拼接得到第一临时数据集;
S52:将S51所得第一临时数据集与S42所得商品特征按商品编码进行拼接得到第二临时数据集;
S53:将S52所得第二临时数据集与S43所得零售商户特征按零售商户编码进行拼接得到第三临时数据集;
S54:将S53所得第三临时数据集与S44所得天气特征按日期进行拼接得到第四临时数据集;
S55:将S54所得第四临时数据集与S45所得日期特征按日期进行拼接得到第五临时数据集;
S56:将S55所得第五临时数据集与S46所得促销活动特征按日期进行拼接得到最终数据集。
S6:模型训练:利用S5获得的最终数据集进行模型训练,获得未来销量预测数据。
在训练前将S5所得最终数据集划分为训练集与测试集,利用训练集上零售商户中商品的销量信息作为标签,选取lightgbm算法(Light Gradient Boosting Machine,lightgbm是一个实现GBDT(Gradient Boosting Decision Tree)算法的框架,支持高效率的并行训练,并且具有更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以快速处理海量数据等优点),将训练集作为lightgbm算法输入,以预测销量值与实际销量值之间的均方误差((Mean Square Error,MSE))如公式4所示)作为损失函数,进行模型训练。
Figure SMS_48
其中,/>
Figure SMS_49
为商品预测销量值,/>
Figure SMS_50
为商品实际销量值。
S61:在训练前将S55所得最终数据集划分为训练集与测试集,利用训练集上零售商户中商品的销量信息作为标签进行模型训练,在训练完成后得到训练好的模型。
S62:使用S61所得测试集以预测销量与实际销量之间的加权平均绝对百分比误差来衡量模型性能进行评估。
为了验证本发明的有效性,采用了某地区一批零售商户2年内的真实销售数据对本发明模型进行了性能测试,包括以下步骤。
A. 数据集
某地区一批零售商户2年内的真实销售数据、零售商户过去2年内售卖的所有商品数据与零售商户所在地区过去2年内历史天气数据。
B. 对比方法
移动平均法:移动平均法是用一组最近的实际数据值来预测未来一期或几期内公司产品的需求量、公司产能等的一种常用方法。移动平均法适用于即期预测。是一种简单平滑预测技术,它的基本思想是:根据时间序列资料、逐项推移,依次计算包含一定项数的序时平均值,以反映长期趋势的方法。
1. 1日移动平均法:以每个零售商户每个商品前1天销量值作为其对应的每个零售商户每个商品后1天的预测销量值。
2. 2日移动平均法:以每个零售商户每个商品前2天销量的平均值向下取整数作为其对应的每个零售商户每个商品后1天的预测销量值。
3. 3日移动平均法:以每个零售商户每个商品前3天销量的平均值向下取整数作为其对应的每个零售商户每个商品后1天的预测销量值。
4. 5日移动平均法:以每个零售商户每个商品前5天销量的平均值向下取整数作为其对应的每个零售商户每个商品后1天的预测销量值。
5. 7日移动平均法:以每个零售商户每个商品前7天销量的平均值向下取整数作为其对应的每个零售商户每个商品后1天的预测销量值。
C. 评价指标
评价指标采用销量预测中广泛应用的加权平均绝对百分比误差(Weighted MeanAbsolute Error,WMAPE)模型的性能。WMAPE计算公式如(5)所示。
Figure SMS_51
其中,/>
Figure SMS_52
为商品预测销量值,/>
Figure SMS_53
为商品实际销量值。显然,WMAPE的值越小,算法的性能就越好。
另外为验证本发明所提出的基于间断时间序列样本构建方法的有效性,还对比了未进行数据样本构建的数据集对模型进行训练所得模型在测试集上的表现情况。
D. 实验结果
表1给出了本发明所提出的基于间断时间序列样本构建方法补充不同的天数(即n的取值为7,10,12,13,14)之后的数据样本总量、补充全部商品全部时间的无销量日期的数据样本总量与原始数据样本总量的对比。
表1:原始数据样本总量与本发明数据建模后数据样本总量对比
数据样本总量 数据稀疏度 存储占用空间
原始数据样本 976636条 0 18.7MB
补充全部商品全部时间的无销量日期的数据样本 44407740条 0.9780 1035.7MB
本发明数据建模n=7天时数据样本 1807597条 0.4597 45.7MB
本发明数据建模n=10天时数据样本 1895774条 0.4848 48MB
本发明数据建模n=12天时数据样本 1940458条 0.4966 49.1MB
本发明数据建模n=13天时数据样本 1960047条 0.5017 49.6MB
本发明数据建模n=14天时数据样本 1978458条 0.5036 50.1MB
可以从表1中看出,经过本发明数据建模n=7/10/12/13/14天时,都可以有效增加数据样本总量。当补充全部商品全部时间的无销量日期的数据样本时,数据样本量由976636条提升到44407740条,数据建模后样本量是原数据样本量的4547.07%,数据稀疏度为0.9780,占用存储空间为1035.7MB;本发明数据建模n=7天时数据样本总量由976636条提升到1807597条,数据建模后样本量是原数据样本量的185.08%,数据稀疏度为0.4597,占用存储空间为45.9MB;本发明数据建模n=10天时数据样本总量由976636条提升到1895774条,数据建模后样本量是原数据数据量的194.11%,数据稀疏度为0.4848,占用存储空间为48MB;本发明数据建模n=12天时数据样本总量由976636条提升到1940458条,数据建模后样本量是原数据数据量的198.68%,数据稀疏度为0.4966,占用存储空间为49.1MB;本发明数据建模n=13天时数据样本总量由976636条提升到1960047条,数据建模后样本量是原数据数据量的200.69%,数据稀疏度为0.5017,占用存储空间为49.6MB;本发明数据建模n=14天时数据样本总量由976636条提升到1978458条,数据建模后样本量是原数据数据量的202.57%,数据稀疏度为0.5036,占用存储空间为50.1MB。根据公式(3)可得,n的最佳取值为12,故本实施例最终n的取值选择为12,此时数据建模后数据样本与补充全部商品全部时间的无销量日期的数据样本对比,数据稀疏度由降到多少,存储占用空间由降为。以上数据说明本发明所提出的基于间断时间序列样本构建方法可以有效增多用于模型训练的数据样本量,并且不会造成严重的数据稀疏,也不会造成大量存储空间的浪费。
表2给出了本发明模型与所选对比方法在真实数据集上的WMAPE的实验结果。
表2:本发明模型与所选对比方法在真实数据集上的WMAPE的实验结果
1日移动平均法 2日移动平均法 3日移动平均法 5日移动平均法 7日移动平均法 本发明模型
原数据样本 0.9336 0.8912 0.8495 0.8356 0.8021 0.5293
数据建模后数据样本 0.9936 0.8912 0.8495 0.8356 0.8021 0.4176
由表2可以看出,本发明模型与所选对比方法在数据建模后的数据样本上比较,在商品预测销量值与商品实际销量值之间的WMAPE比对比方法均有所下降。本发明模型较1日移动平均法,WMAPE下降0.516;较2日移动平均法,WMAPE下降0.4736;较3日移动平均法,WMAPE下降0.4319;较5日移动平均法,WMAPE下降0.418;较7日移动平均法,WMAPE下降0.3845。本发明模型在利用本发明所提出的数据建模方法构建的数据样本与原始数据样本上进行对比,WMAPE下降0.1017。
本发明的提出一种基于间断时间序列样本构建的销量预测算法模型的构建方法,将所有商品用于数据建模,对每个零售商户每个商品出现销量的日期之后的n天内没有销量的日期填充销量值为0,能够有效增加用于模型训练的数据样本的总量,使得算法模型可以更好的学习到所有商品的特征,能够有效提升算法模型进行商品销量预测的预测精度。
本发明流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为表示包括一个或多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,可以实现在任何计算机刻度介质中,以供指令执行系统、装置或设备,所述计算机可读介质可以是任何包含存储、通信、传播或传输程序以供执行系统、装置或设备使用。包括只读存储器、磁盘或光盘等。
在本说明书的描述中,参考术语“实施例”、“示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。此外,本领域的技术人员可以在不产生矛盾的情况下,将本说明书中描述的不同实施例或示例以及其中的特征进行结合或组合。
上述内容虽然已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型等更新操作。

Claims (10)

1.基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,所述方法包括以下步骤:
S1:数据收集,所述数据包括过去设定时间内真实的销售数据、商品数据和天气数据;
S2:数据预处理,对S1所得销售数据、商品数据和天气数据进行数据清洗、数据筛选与数据类型统一转换;
S3:数据建模,通过间断时间序列数据建模方法对步骤S2预处理后的数据进行数据建模,获得数据样本;所述间断时间序列数据建模方法通过补充天数增加数据样本量;
S4:特征构建,对步骤S3所得数据样本进行销量特征构建;对S2所得预处理后的数据进行商品特征构建、零售商户特征构建、天气特征构建和日期特征构建;
S5:数据集构建,将S3所得数据样本与S4所得所有特征进行组合,得到最终数据集;
S6:模型训练,利用最终数据集进行模型训练,获得未来销量预测数据。
2.根据权利要求1所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,步骤S2实现过程如下:
S21:对S1所得的销售数据进行数据清洗,去除退货数据,得到零售商户设定时间内所有商品的销量数据,对销量数据进行数据筛选,筛选出零售商户编码-在售商品编码-销售日期-商品销量4者组合数据;然后对该组合数据进行数据类型统一转换,将零售商户编码、在售商品编码与商品销量转换为整数类型数据,将销售日期转换为字符串类型数据;
S22:对S1所得零售商户的设定时间内售卖所有商品数据进行数据清洗,去除已停售商品得到目前在售商品数据;之后对在售商品数据进行数据筛选,筛选出商品编码-商品类目编码组合数据;之后对该组合数据进行数据类型统一转换,将商品编码与商品类目转换为整数类型数据;
S23:对S1所得零售商户设定时间内历史天气数据进行数据筛选,筛选出零售商户编码-日期-天气-最高温度-最低温度组合数据;之后对组合数据进行数据类型统一转换,将零售商户编码与日期转换为字符串类型数据,将天气按照天气的中文代表字词的首字母进行排序,每个天气的排序值作为该天气的编码,将该编码转换为整数类型数据;将最高温度与最低温度转换为整数类型数据;
S24:对S1所得零售商户过去2年内常规促销活动数据筛选,筛选出零售商户编码-日期-常规促销活动编码-促销活动优惠力度组合数据;对组合数据进行数据类型统一转换,将零售商户编码与常规促销活动编码转换为字符串类型数据,将促销活动优惠力度转换为浮点数类型数据。
3.根据权利要求2所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,步骤S3中所述的间断时间序列数据建模方法实现过程如下:
S31:将S21所得零售商户编码-在售商品编码-销售日期-商品销量4者组合数据按日期递增顺序进行排序,其中不包含商品销量为0的日期,由此形成间断时间序列;
S32:对S31所得间断时间序列中每个商品出现销量的日期之后的n天内,补充该商品没有销量的日期的商品销量值为0,作为新的数据样本,数据样本为零售商户编码-在售商品编码-销售日期-商品销量组合数据;使得建模后数据样本量和数据稀疏度满足要求;其中,n的取值范围为[1,+∞);
S33:将S32所得数据样本与S21所得零售商户编码-在售商品编码-销售日期-商品销量组合数据按日期递增顺序进行排序,作为全部商品的所有数据样本。
4.根据权利要求3所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,步骤S32中,数值n的最优取值策略如下:
首先,建模后数据样本量计算方式如公式(1)所示;
Figure QLYQS_2
其中,/>
Figure QLYQS_4
与/>
Figure QLYQS_6
代表数据建模后的数据样本总数;/>
Figure QLYQS_3
代表时间序列总数;/>
Figure QLYQS_5
代表第i个时间序列真实商品销量的数据样本量;/>
Figure QLYQS_7
代表数据建模想要填充销量值为0的日期总数;/>
Figure QLYQS_8
代表第i个序列每个有销量日期之后/>
Figure QLYQS_1
天内销量值不为0的数据样本总量;
其次,数据样本的数据稀疏度计算规则如公式(2)所示:
Figure QLYQS_9
其中,SR代表数据样本的数据稀疏度;B代表原始真实数据样本量;A代表数据建模后数据样本量;
最后,数值n的取值规则如公式(3)所示:
Figure QLYQS_12
其中,/>
Figure QLYQS_14
代表数据建模想要填充销量值为0的日期总数;/>
Figure QLYQS_17
代表在约束条件/>
Figure QLYQS_13
下,/>
Figure QLYQS_16
值达到最大时/>
Figure QLYQS_18
的取值;/>
Figure QLYQS_19
代表数据建模后数据样本量A应多于原始数据样本量B;/>
Figure QLYQS_10
代表数据建模后数据样本的数据稀疏度/>
Figure QLYQS_15
应小于0.5;/>
Figure QLYQS_21
代表数据建模后数据样本存储占用空间/>
Figure QLYQS_22
小于0.5倍的机器内存资源/>
Figure QLYQS_11
;在约束条件/>
Figure QLYQS_20
下,计算得到n的最优取值。
5.根据权利要求4所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,步骤S4实现过程如下:
S41:对S33所得数据样本进行销量特征构建,所述销量特征为零售商户每个日期每个商品前3、5、7、15、30、45、60、90、180和360天内的销量最大值、最小值、平均值和累计值,作为零售商户与商品组合的销量特征;
S42:对S22商品编码-商品类目编码组合数据进行商品特征构建,对商品编码-商品类目编码组合数据中将商品按上架售卖的时间进行排序,之后将每个商品的排序值作为商品编码特征;将商品类目编码按类目编码数字递增顺序进行排序,之后将该排序值作为商品类目编码的商品类目特征;将商品编码特征与商品类目特征进行组合作为商品特征;
S43:对S23所得零售商户编码-日期-天气-最高温度-最低温度组合数据进行零售商户特征构建;将零售商户按照零售商户编码数字递增顺序进行排序,之后将该排序值作为零售商户特征;
S44:对S23所得零售商户编码-日期-天气-最高温度-最低温度组合数据进行天气特征构建;
S45:对S23所得零售商户编码-日期-天气-最高温度-最低温度组合数据进行日期特征构建;对设定时间内每个日期是否为节假日、是否为工作日、是一年中的第几月、是一年中的第几周、是一周中的周几进行统计,作为日期特征。
6.根据权利要求5所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,步骤S44中,将天气按首字母进行排序,将每个天气排序值、日期、最高温度与最低温度4者组合作为天气特征。
7.根据权利要求6所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,步骤S5实现过程如下:
S51:将S33所得数据样本与S41所得零售商户与商品的组合销量特征按零售商户编码-商品编码-日期进行拼接得到第一临时数据集;
S52:将S51所得第一临时数据集与S42所得商品特征按商品编码进行拼接得到第二临时数据集;
S53:将S52所得第二临时数据集与S43所得零售商户特征按零售商户编码进行拼接得到第三临时数据集;
S54:将S53所得第三临时数据集与S44所得天气特征按日期进行拼接得到第四临时数据集;
S55:将S54所得第四临时数据集与S45所得日期特征按日期进行拼接得到最终数据集。
8.根据权利要求7所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,预测销量值与实际销量值之间的均方误差MSE计算公式如下:
Figure QLYQS_23
其中,/>
Figure QLYQS_24
为商品预测销量值,/>
Figure QLYQS_25
为商品实际销量值。
9.根据权利要求8所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,步骤S6实现过程如下:
S61:在训练前将S55所得最终数据集划分为训练集与测试集,利用训练集上零售商户中商品的销量信息作为标签进行模型训练,在训练完成后得到训练好的模型;
S62:使用S61所得测试集以预测销量与实际销量之间的加权平均绝对百分比误差来衡量模型性能进行评估。
10.一种基于间断时间序列样本构建的销量预测模型,其特征在于,所述销量预测模型通过权利要求1-9任一项所述的基于间断时间序列样本构建的销量预测模型的构建方法来实现。
CN202310432576.4A 2023-04-21 2023-04-21 基于间断时间序列样本构建的销量预测模型的构建方法 Active CN116151861B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310432576.4A CN116151861B (zh) 2023-04-21 2023-04-21 基于间断时间序列样本构建的销量预测模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310432576.4A CN116151861B (zh) 2023-04-21 2023-04-21 基于间断时间序列样本构建的销量预测模型的构建方法

Publications (2)

Publication Number Publication Date
CN116151861A true CN116151861A (zh) 2023-05-23
CN116151861B CN116151861B (zh) 2023-07-18

Family

ID=86352878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310432576.4A Active CN116151861B (zh) 2023-04-21 2023-04-21 基于间断时间序列样本构建的销量预测模型的构建方法

Country Status (1)

Country Link
CN (1) CN116151861B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008176662A (ja) * 2007-01-19 2008-07-31 Toyo Eng Corp 販売予測システム、方法及びコンピュータプログラム
US20120303411A1 (en) * 2011-05-25 2012-11-29 International Business Machines Corporation Demand modeling and prediction in a retail category
US20130346150A1 (en) * 2012-06-21 2013-12-26 Data Ventures, Inc. System, method, and computer program product for forecasting sales
US20140108094A1 (en) * 2012-06-21 2014-04-17 Data Ventures, Inc. System, method, and computer program product for forecasting product sales
US8738421B1 (en) * 2013-01-09 2014-05-27 Vehbi Koc Foundation Koc University Driver moderator method for retail sales prediction
CN109509030A (zh) * 2018-11-15 2019-03-22 北京旷视科技有限公司 销量预测方法及其模型的训练方法、装置和电子系统
WO2020086872A1 (en) * 2018-10-26 2020-04-30 Target Brands, Inc. Method and system for generating ensemble demand forecasts
CN111133460A (zh) * 2018-08-30 2020-05-08 甲骨文国际公司 需求预测参数的优化
CN113344671A (zh) * 2021-06-23 2021-09-03 昆明理工大学 一种融合信任因素的个性化推荐模型及构建方法
CN113469595A (zh) * 2020-03-31 2021-10-01 株式会社日立制作所 智慧供应链系统及服务器平台
CN113553540A (zh) * 2020-04-24 2021-10-26 株式会社日立制作所 一种商品销量的预测方法
CN114549046A (zh) * 2022-01-17 2022-05-27 北京滴普科技有限公司 基于融合模型的销售预测方法、系统、设备及存储介质
CN114782065A (zh) * 2022-01-21 2022-07-22 北京数势云创科技有限公司 一种基于模型组合的商品销量预测方法、装置及存储介质
CN115099842A (zh) * 2022-05-30 2022-09-23 城云科技(中国)有限公司 一种商品销量预测模型、构建方法及其应用
CN115115416A (zh) * 2022-07-21 2022-09-27 湖南大学 一种商品销量预测方法
CN115860800A (zh) * 2022-12-22 2023-03-28 北京数势云创科技有限公司 一种节假日商品销量预测方法、装置及计算机存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008176662A (ja) * 2007-01-19 2008-07-31 Toyo Eng Corp 販売予測システム、方法及びコンピュータプログラム
US20120303411A1 (en) * 2011-05-25 2012-11-29 International Business Machines Corporation Demand modeling and prediction in a retail category
US20130346150A1 (en) * 2012-06-21 2013-12-26 Data Ventures, Inc. System, method, and computer program product for forecasting sales
US20140108094A1 (en) * 2012-06-21 2014-04-17 Data Ventures, Inc. System, method, and computer program product for forecasting product sales
US8738421B1 (en) * 2013-01-09 2014-05-27 Vehbi Koc Foundation Koc University Driver moderator method for retail sales prediction
CN111133460A (zh) * 2018-08-30 2020-05-08 甲骨文国际公司 需求预测参数的优化
WO2020086872A1 (en) * 2018-10-26 2020-04-30 Target Brands, Inc. Method and system for generating ensemble demand forecasts
CN109509030A (zh) * 2018-11-15 2019-03-22 北京旷视科技有限公司 销量预测方法及其模型的训练方法、装置和电子系统
CN113469595A (zh) * 2020-03-31 2021-10-01 株式会社日立制作所 智慧供应链系统及服务器平台
CN113553540A (zh) * 2020-04-24 2021-10-26 株式会社日立制作所 一种商品销量的预测方法
CN113344671A (zh) * 2021-06-23 2021-09-03 昆明理工大学 一种融合信任因素的个性化推荐模型及构建方法
CN114549046A (zh) * 2022-01-17 2022-05-27 北京滴普科技有限公司 基于融合模型的销售预测方法、系统、设备及存储介质
CN114782065A (zh) * 2022-01-21 2022-07-22 北京数势云创科技有限公司 一种基于模型组合的商品销量预测方法、装置及存储介质
CN115099842A (zh) * 2022-05-30 2022-09-23 城云科技(中国)有限公司 一种商品销量预测模型、构建方法及其应用
CN115115416A (zh) * 2022-07-21 2022-09-27 湖南大学 一种商品销量预测方法
CN115860800A (zh) * 2022-12-22 2023-03-28 北京数势云创科技有限公司 一种节假日商品销量预测方法、装置及计算机存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
SWAMI,D等: "Predicting future sales of retail products using machine learning", 《ARXIV》 *
吴琳洁;郑钰洁;范云飞;: "新零售目标产品的精准需求分析与预测", 科技与创新, no. 18 *
杨艳霞;: "复合神经网络模型在汽车配件销售预测中的应用", 科技创业月刊, no. 08 *
梁议丹: "基于组合模型的酒店线上销量预测的研究", 《中国优秀硕士学位论文全文数据库 (经济与管理科学辑)》 *
魏芳怡 等: "基于遗传神经网络下新零售目标产品的销量预测研究", 《中国商论》 *

Also Published As

Publication number Publication date
CN116151861B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN110392899B (zh) 用于模型生成的动态特征选择
CN111652657A (zh) 商品销量预测方法、装置、电子设备及可读存储介质
CN109784979B (zh) 一种大数据驱动的供应链需求预测方法
JP7120649B2 (ja) 情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム
CN113553540A (zh) 一种商品销量的预测方法
CN111178624A (zh) 一种新产品需求预测的方法
CN101783004A (zh) 快速智能化的商品推荐系统
CN108389069A (zh) 基于随机森林和逻辑回归的优质客户识别方法及装置
CN108388955A (zh) 基于随机森林和逻辑回归的客户服务策略制定方法、装置
CN108388974A (zh) 基于随机森林和决策树的优质客户优化识别方法及装置
CN108154311A (zh) 基于随机森林和决策树的优质客户识别方法及装置
CN114548871B (zh) 一种大数据驱动的供应链ai智能补货系统
CN111815348A (zh) 一种基于各门店商品相似度聚类的区域商品生产计划方法
CN115145993A (zh) 基于自学习规则运算的铁路货运大数据可视化展示平台
CN112785057A (zh) 基于指数平滑的件量预测方法、装置、设备及存储介质
CN116187808A (zh) 一种基于虚拟电厂用户-套餐标签画像的电力套餐推荐方法
CN116579804A (zh) 一种节假日商品销量预测方法、装置及计算机存储介质
CN114372848A (zh) 一种基于机器学习的烟草行业智能营销系统
CN113469595A (zh) 智慧供应链系统及服务器平台
CN115147144A (zh) 数据处理方法及电子设备
CN116151861B (zh) 基于间断时间序列样本构建的销量预测模型的构建方法
CN113450141A (zh) 一种基于电力大客户群体售电量特征的智能预测方法及装置
JP4279004B2 (ja) 天候デリバティブ商品推奨装置及び天候デリバティブ商品推奨方法及びプログラム
CN116308494A (zh) 供应链需求预测方法
CN116228280A (zh) 基于大数据的用户需求预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant