CN116739652A - 一种服装电商销量预测建模方法 - Google Patents
一种服装电商销量预测建模方法 Download PDFInfo
- Publication number
- CN116739652A CN116739652A CN202310756839.7A CN202310756839A CN116739652A CN 116739652 A CN116739652 A CN 116739652A CN 202310756839 A CN202310756839 A CN 202310756839A CN 116739652 A CN116739652 A CN 116739652A
- Authority
- CN
- China
- Prior art keywords
- model
- sales
- data
- different
- commodities
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 45
- 238000012360 testing method Methods 0.000 claims abstract description 32
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000012937 correction Methods 0.000 claims description 35
- 230000004927 fusion Effects 0.000 claims description 14
- 238000012384 transportation and delivery Methods 0.000 claims description 14
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 13
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 11
- 230000001932 seasonal effect Effects 0.000 claims description 11
- 238000007726 management method Methods 0.000 claims description 6
- 239000003086 colorant Substances 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 238000007418 data mining Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 239000004744 fabric Substances 0.000 claims description 3
- 238000012880 independent component analysis Methods 0.000 claims description 3
- 230000007774 longterm Effects 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 230000009471 action Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种服装电商销量预测建模方法,该方法包括以下步骤:步骤一:收集不同商品的历史销售数据并进行数据预处理;步骤二:从销售数据中提取相关特征;步骤三:基于历史销售数据和相关特征进行模型训练;步骤四:使用单独的测试数据集验证和测试模型,以确保模型的准确性与可靠性;步骤五:使用模型融合,实现销售数据预测,所述数据处理模块,用于将历史销售数据进行预处理并提取特征;所述模型训练模块,用于根据各特征数据训练模型;所述模型测试模块,用于将训练好的模型进行测试,查看其准确性;所述特征提取模块,用于从销售数据中提取相关特征;本发明,具有服装销量预测准确和有效提高工作效率的特点。
Description
技术领域
本发明涉及服装电商领域,具体为一种服装电商销量预测建模方法。
背景技术
随着电商平台的普及,越来越多的消费者选择在网上购买服装商品。然而,由于消费者行为的复杂性、季节性趋势和影响销售的外部因素,服装电商平台管理库存和预测未来销售可能具有挑战性。在电子商务领域,销量预测是不可缺少的参考指标,销量预测影响到包括计划、预算和补货等确定在内的销售管理的各方面工作。
但是现有的技术方案中由于对数据的非全面的笼统分析,导致销量预测结果并不准确,从而导致由销量预测结果得到的补货量也不准确,而补货量的值不准确就很可能造成货品积压而影响资金周转,或者货品数量不足而使消费者无法购得商品。因此,设计服装电商销量预测准确和提高业务效率的一种服装电商销量预测建模方法是很有必要的。
发明内容
本发明的目的在于提供一种服装电商销量预测建模方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种服装电商销量预测建模方法,该方法包括以下步骤:
步骤一:收集不同商品的历史销售数据并进行数据预处理;
步骤二:从销售数据中提取相关特征;
步骤三:基于历史销售数据和相关特征进行模型训练;
步骤四:使用单独的测试数据集验证和测试模型,以确保模型的准确性与可靠性;
步骤五:使用模型融合,实现销售数据预测。
根据上述技术方案,所述收集不同商品的历史销售数据并进行数据预处理的步骤,包括:
收集不同商品在指定时间段内的历史销售数据;
针对收集到的数据采用“削峰填谷”的方法进行数据修正;
进行数据错误处理。
根据上述技术方案,所述针对收集到的数据采用“削峰填谷”的方法进行数据修正的步骤,包括:
商品在某段时间内缺货,那么销量数据可能会受到影响,在进行削峰填谷时,需要将缺货期间的销量数据进行修正,以反映商品真实的销售情况;预售销量修正:有些商品会进行预售活动,这些预售销量也需要在数据中进行修正;购买多件商品销量修正:对于一些商品,顾客可能会购买多件商品,这也会对销量数据产生影响。在进行削峰填谷时,需要将这些多件商品的销量数据进行修正;周趋势修正:销售额往往在一周中的不同时间段有不同的表现;节假日修正:不同的节假日也会对销售额产生影响,如双十一、圣诞节等,需要对这些节假日进行修正;全站营销活动修正:全站营销活动会对整个网站的销售额产生影响,因此需要对这些活动进行修正,以反映商品真实的销售情况,通过对以上修正,可以得到更加准确的销售数据,帮助企业更好地了解商品的销售情况并做出更明智的决策。
根据上述技术方案,所述从销售数据中提取相关特征的步骤,包括:
使用主成分分析、独立成分分析、特征选择等方法对销售数据进行特征提取,提取的特征有:销售数量特征:包括每个产品的销售量、订单量、销售额等指标;渠道特征:包括线上渠道、线下渠道、直播渠道等;投放特征:包括不同广告渠道、不同广告位等,这些特征可以帮助我们优化广告投放策略;营销特征:包括不同促销方式、促销力度等;用户特征:包括用户的年龄、性别、地域等信息;网红特征:包括不同网红的影响力、关注度等信息;季节特征:包括不同季节和节假日的销售情况和趋势,这些特征可以帮助我们了解不同季节和节假日的消费习惯和需求变化,以及针对不同季节和节假日制定不同的销售策略;商品属性特征:商品属性是指不同商品的属性信息,可以包括商品的品类、型号、颜色,特征提取是机器学习和数据挖掘中非常重要的一步,其目的是从原始数据中提取出能够表征数据特征的有用信息,随后根据提取到的数据特征进行模型训练。
根据上述技术方案,所述基于历史销售数据和相关特征进行模型训练的步骤,包括:
进行模型输出对齐,即保证每个模型的输出维度和时间粒度一致;
针对不同的数据特征使用不同的模型进行训练。
根据上述技术方案,所述针对不同的数据特征使用不同的模型进行训练的步骤,包括:
首先将销售数量特征进行模型训练,根据商品的上架时间不同分别采用ETS模型和Prophet模型进行训练,ETS模型用于上架28天内的新品,Prophet模型用于上架超过28天的商品。ETS模型输入特征为天粒度的时序销量,Prophet模型输入特征为天粒度的时序销量和价格特征,模型输出为天粒度的时序销量;多渠道投放趋势模型:采用LightGBM模型进行训练,输入特征包括销售数量、渠道、投放、营销、用户、季节和商品属性等,模型输出未来7天投放趋势增加的概率;营销趋势模型:采用LightGBM模型进行训练,输入特征包括销售数量、渠道、投放、营销、用户、季节和商品属性等,模型输出未来7天营销改价的概率;长期季节趋势模型:采用LR模型进行训练,输入特征包括往年天粒度的时序销量和GoogleTrends往年同期周维度时序搜索量,模型输出今年销量趋势;分层模型:分为两步,第一步预测拆分到颜色,第二步在拆分到颜色的基础上继续拆分到尺码,预测拆分到颜色时,主要考虑三个因素:各个颜色近期销量占比,反季商品的销量占比,以及上新计划对颜色销量的影响。拆分到尺码时,主要考虑当前款的累计销量和尺码分布,以及当前款所在类目的尺码分布。
根据上述技术方案,所述使用单独的测试数据集验证和测试模型,以确保模型的准确性与可靠性的步骤,包括:
使用单独的测试数据集验证和测试模型;
识别模型中的潜在错误或问题,提高预测的准确性。
根据上述技术方案,所述使用单独的测试数据集验证和测试模型的步骤,包括:
基本销量趋势模型采用MAPE和WMAPE指标进行评价:该模型是以款式粒度进行预测,参考照片是销售量的N天移动平均值,通常取N=3,预测周定期设置为14天,即成衣下单到成衣交易的平均时长;多渠道投放态势模型采用AUC指标进入行情评价:该模型是以款式颗粒度分渠预测,在最重要的两个渠道上,该模型的AUC通常在0.75~0.80之间,AUC越接近1,则其检测方法真实性越高,模型预测越准确;营销趋势模型采用AUC指标进入行情评价:该模型是以款式为颗粒度进行预测,同时该模型的AUC在0.70左右;季节趋势模型采用MAPE和WMAPE指标进行评价:该模型是以款式为颗粒度进行预测,参考照片是销售量的N天移动平均值,通常取N=3,预测周定期设置为35天,即面料下单到成衣交易的平均时,MAPE指标通常使用针对具体款式的预测对比,相对于销量的3天移动平均值,在TOP100商品上应该指标较小的比例为76%,WMAPE指标通常用于所有商品或部分维数的总体对比。相对于销量的3天移动平均值,在所有商品上,该模型相对提了WMAPE指标约3%,分层模型与融合模型也采用MAPE和WMAPE指标进行评价,且同样拆分到颜色、尺码的最小粒度预测。
根据上述技术方案,所述使用模型融合,实现销售数据预测的步骤,包括:
通过融合后的模型实现数据预测,可以根据融合模型进行投放趋势以及营销趋势预测,并可根据预测结果调整基础销量,同时可预测未来一段时间内售卖的款式,包括款式的颜色、尺码等信息,根据预测数据可进行库存管理的优化,来确定不同商品的最佳库存水平。
根据上述技术方案,所述该系统包括:
数据处理模块,用于将历史销售数据进行预处理并提取特征;
模型训练模块,用于根据各特征数据训练模型;
模型测试模块,用于将训练好的模型进行测试,查看其准确性。
与现有技术相比,本发明所达到的有益效果是:本发明,通过设置有数据处理模块、模型训练模块、模型测试模块实现服装销量的预测,首先采集历史销售数据,对采集到的数据进行预处理,包括数据修正、数据错误处理等操作,随后进行数据特征提取,提取的特征包括:销售数量特征、渠道特征、投放特征、营销特征、用户特征、网红特征、季节特征、商品属性特征等,利用提取的特征值进行模型训练、模型验证,随后进行模型融合,该模型最终可实现服装销量预测,其中包含款式、颜色等特征预测,该方法预测准确可有效提高库存管理。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例一提供的一种服装电商销量预测建模方法的流程图;
图2为本发明实施例二提供的一种服装电商销量预测建模系统的模块组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:图1为本发明实施例一提供的一种服装电商销量预测建模方法的流程图,本实施例可应用服装电商销量预测的场景,该方法可以由本实施例提供的一种服装电商销量预测建模系统来执行,如图1所示,该方法具体包括以下步骤:
步骤一:收集不同商品的历史销售数据并进行数据预处理;
在本发明实施例中,收集不同商品在指定时间段内的历史销售数据,销售数据包括商品编号、颜色、尺码、价格、销售数量和销售日期等信息;
示例性的,对收集到的销售数据进行预处理,首先进行数据修正,针对收集到的数据采用“削峰填谷”的方法进行数据修正,该方法包括了多种修正方式,例如:缺货修正、预售销量修正、购买多件商品销量修正、周趋势修正、节假日修正以及全站营销活动修正等,随后进行数据错误处理:包括难以归因的异常值修正、因数据传输等问题产生的缺失值填充、其他错误应对等,通过这些修正方式,我们能够更准确地反映出商品销售的真实情况,为后续的业务决策提供更有价值的数据支持。
示例性的,缺货修正指的是:如果商品在某段时间内缺货,那么销量数据可能会受到影响,在进行削峰填谷时,需要将缺货期间的销量数据进行修正,以反映商品真实的销售情况;预售销量修正:有些商品会进行预售活动,这些预售销量也需要在数据中进行修正;购买多件商品销量修正:对于一些商品,顾客可能会购买多件商品,这也会对销量数据产生影响。在进行削峰填谷时,需要将这些多件商品的销量数据进行修正;周趋势修正:销售额往往在一周中的不同时间段有不同的表现,例如周末销售额可能比平日高。在进行削峰填谷时,需要将这些周趋势进行修正;节假日修正:不同的节假日也会对销售额产生影响,例如双十一、圣诞节等,需要对这些节假日进行修正;全站营销活动修正:全站营销活动会对整个网站的销售额产生影响,因此需要对这些活动进行修正,以反映商品真实的销售情况,通过对以上修正,可以得到更加准确的销售数据,帮助企业更好地了解商品的销售情况并做出更明智的决策。
步骤二:从销售数据中提取相关特征;
在本发明实施例中,从销售数据中提取相关特征,用于下一步中机器学习算法和统计模型的训练。
示例性的,使用主成分分析、独立成分分析、特征选择等方法对销售数据进行特征提取,提取的特征有:销售数量特征:包括每个产品的销售量、订单量、销售额等指标;渠道特征:包括线上渠道、线下渠道、直播渠道等;投放特征:包括不同广告渠道、不同广告位等,这些特征可以帮助我们优化广告投放策略;营销特征:包括不同促销方式、促销力度等;用户特征:包括用户的年龄、性别、地域等信息;网红特征:包括不同网红的影响力、关注度等信息;季节特征:包括不同季节和节假日的销售情况和趋势,这些特征可以帮助我们了解不同季节和节假日的消费习惯和需求变化,以及针对不同季节和节假日制定不同的销售策略;商品属性特征:商品属性是指不同商品的属性信息,可以包括商品的品类、型号、颜色,特征提取是机器学习和数据挖掘中非常重要的一步,其目的是从原始数据中提取出能够表征数据特征的有用信息,随后根据提取到的数据特征进行模型训练。
步骤三:基于历史销售数据和相关特征进行模型训练;
在本发明实施例中,针对不同的数据特征使用不同的模型进行训练,随后根据训练结果将模型融合;
示例性的,为了方便理解本申请技术方案,以下为本申请对技术方案中所涉及的专业术语的解释:ETS:ExponentialSmoothing,指数平滑,一种常用的时间序列预测局部统计算法;Prophet:Facebook提出的一种基于趋势分解的时间序列预测算法;LR:线性回归算法;LightGBM:微软开发的一种梯度提升树集成工具;MAPE:MeanAbsolutePercentageError,平均绝对误差,一种常见的预测评价指标,一般绝对误差指的是实际值与预测值的差值的绝对值,平均绝对误差就是对该差值的绝对值取平均;WMAPE:WeightedMeanAbsolute PercentageError,加权平均绝对百分比误差,一种常见的预测误差指标,一般绝对百分比误差指的是实际值与预测值的差值的绝对值再与实际值的比值,平均绝对百分比误差就是对该比值取平均,加权就是根据实际销量进行加权平均;AUC:一种评价二分类模型效果的指标;
示例性的,在上述步骤二中,对历史销售数据进行了特征提取,本步骤根据提取的特征值不同进行模型训练;首先将销售数量特征进行模型训练,根据商品的上架时间不同分别采用ETS模型和Prophet模型进行训练,ETS模型用于上架28天内的新品,Prophet模型用于上架超过28天的商品。ETS模型输入特征为天粒度的时序销量,Prophet模型输入特征为天粒度的时序销量和价格特征,模型输出为天粒度的时序销量;多渠道投放趋势模型:采用LightGBM模型进行训练,输入特征包括销售数量、渠道、投放、营销、用户、季节和商品属性等,模型输出未来7天投放趋势增加的概率;营销趋势模型:采用LightGBM模型进行训练,输入特征包括销售数量、渠道、投放、营销、用户、季节和商品属性等,模型输出未来7天营销改价的概率;长期季节趋势模型:采用LR模型进行训练,输入特征包括往年天粒度的时序销量和GoogleTrends往年同期周维度时序搜索量,模型输出今年销量趋势;分层模型:分为两步,第一步预测拆分到颜色,第二步在拆分到颜色的基础上继续拆分到尺码,预测拆分到颜色时,主要考虑三个因素:各个颜色近期销量占比,反季商品的销量占比,以及上新计划对颜色销量的影响。拆分到尺码时,主要考虑当前款的累计销量和尺码分布,以及当前款所在类目的尺码分布;
示例性的,对上述模型进行融合,首先进行模型输出对齐,即保证每个模型的输出维度和时间粒度一致,每个模型输出的预测结果必须包含相同的时间戳和目标变量,以方便后续的融合,因此融合模型输出时间粒度选择天粒度,以提高融合精度和鲁棒性,接下来需要对每个模型的特征进行选择和缩放,特征选择可以根据各个模型的特征重要性和相关性进行,只选择最具有代表性和判别力的特征,特征缩放可以采用常用的标准化和归一化方法,以保证不同特征之间的度量尺度一致,以及加速模型训练和收敛,最后进行模型加权融合,通过将这些模型进行融合,可以更加准确地预测未来的销售趋势和营销改价情况,提高销售效率,减少库存积压,降低经营风险。
步骤四:使用单独的测试数据集验证和测试模型,以确保模型的准确性与可靠性;
在本发明实施例中,使用单独的测试数据集验证和测试模型,识别模型中的潜在错误或问题,提高预测的准确性;
示例性的,基本销量趋势模型采用MAPE和WMAPE指标进行评价:该模型是以款式粒度进行预测,参考照片是销售量的N天移动平均值,通常取N=3,预测周定期设置为14天,即成衣下单到成衣交易的平均时长;多渠道投放态势模型采用AUC指标进入行情评价:该模型是以款式颗粒度分渠预测,在最重要的两个渠道上,该模型的AUC通常在0.75~0.80之间,AUC越接近1,则其检测方法真实性越高,模型预测越准确;营销趋势模型采用AUC指标进入行情评价:该模型是以款式为颗粒度进行预测,同时该模型的AUC在0.70左右;季节趋势模型采用MAPE和WMAPE指标进行评价:该模型是以款式为颗粒度进行预测,参考照片是销售量的N天移动平均值,通常取N=3,预测周定期设置为35天,即面料下单到成衣交易的平均时,MAPE指标通常使用针对具体款式的预测对比,相对于销量的3天移动平均值,在TOP100商品上应该指标较小的比例为76%,WMAPE指标通常用于所有商品或部分维数的总体对比。相对于销量的3天移动平均值,在所有商品上,该模型相对提了WMAPE指标约3%,分层模型与融合模型也采用MAPE和WMAPE指标进行评价,且同样拆分到颜色、尺码的最小粒度预测。
步骤五:使用模型融合,实现销售数据预测。
在本发明实施例中,根据训练模型和相关外部因素生成不同商品和时间段的销售预测;
示例性的,通过融合后的模型实现数据预测,可以根据融合模型进行投放趋势以及营销趋势预测,并可根据预测结果调整基础销量,同时可预测未来一段时间内售卖的款式,包括款式的颜色、尺码等信息,根据预测数据可进行库存管理的优化,来确定不同商品的最佳库存水平;
示例性的,该方法可以作为软件应用程序或基于Web的平台实现,与电商平台集成并提供实时销售预测。该方法为服装电商企业提供了强大的工具,以优化库存管理和定价策略,从而提高收入和改善盈利能力。
实施例二:本发明实施例二提供了一种服装电商销量预测建模系统,图2为本发明实施例二提供的一种服装电商销量预测建模系统的模块组成示意图,如图2所示,该系统包括:
数据处理模块,用于将历史销售数据进行预处理并提取特征;
模型训练模块,用于根据各特征数据训练模型;
模型测试模块,用于将训练好的模型进行测试,查看其准确性;
在本发明的一些实施例中,数据处理模块包括:
数据收集模块,用于采集历史销售数据;
数据修正模块,用于将采集历史销售数据进行“削峰填谷”;
特征提取模块,用于从销售数据中提取相关特征;
在本发明的一些实施例中,模型训练模块包括:
多模型训练模块,用于将提取特征进行多模型训练;
分层模型模块,用于将款式粒度进行拆分;
模型融合模块,用于将训练出的模型进行融合;
在本发明的一些实施例中,模型测试模块包括:
各模型评测模块,用于评测训练模型的优劣;
优化库存管理模块,用于根据模型的预测结果进行库存优化。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种服装电商销量预测建模方法,包括,其特征在于:该方法包括以下步骤:
步骤一:收集不同商品的历史销售数据并进行数据预处理;
步骤二:从销售数据中提取相关特征;
步骤三:基于历史销售数据和相关特征进行模型训练;
步骤四:使用单独的测试数据集验证和测试模型,以确保模型的准确性与可靠性;
步骤五:使用模型融合,实现销售数据预测。
2.根据权利要求1所述的一种服装电商销量预测建模方法,其特征在于:所述收集不同商品的历史销售数据并进行数据预处理的步骤,包括:
收集不同商品在指定时间段内的历史销售数据;
针对收集到的数据采用“削峰填谷”的方法进行数据修正;
进行数据错误处理。
3.根据权利要求2所述的一种服装电商销量预测建模方法,其特征在于:所述针对收集到的数据采用“削峰填谷”的方法进行数据修正的步骤,包括:
商品在某段时间内缺货,那么销量数据可能会受到影响,在进行削峰填谷时,需要将缺货期间的销量数据进行修正,以反映商品真实的销售情况;预售销量修正:有些商品会进行预售活动,这些预售销量也需要在数据中进行修正;购买多件商品销量修正:对于一些商品,顾客可能会购买多件商品,这也会对销量数据产生影响。在进行削峰填谷时,需要将这些多件商品的销量数据进行修正;周趋势修正:销售额往往在一周中的不同时间段有不同的表现;节假日修正:不同的节假日也会对销售额产生影响,如双十一、圣诞节等,需要对这些节假日进行修正;全站营销活动修正:全站营销活动会对整个网站的销售额产生影响,因此需要对这些活动进行修正,以反映商品真实的销售情况,通过对以上修正,可以得到更加准确的销售数据,帮助企业更好地了解商品的销售情况并做出更明智的决策。
4.根据权利要求1所述的一种服装电商销量预测建模方法,其特征在于:所述从销售数据中提取相关特征的步骤,包括:
使用主成分分析、独立成分分析、特征选择等方法对销售数据进行特征提取,提取的特征有:销售数量特征:包括每个产品的销售量、订单量、销售额等指标;渠道特征:包括线上渠道、线下渠道、直播渠道等;投放特征:包括不同广告渠道、不同广告位等,这些特征可以帮助我们优化广告投放策略;营销特征:包括不同促销方式、促销力度等;用户特征:包括用户的年龄、性别、地域等信息;网红特征:包括不同网红的影响力、关注度等信息;季节特征:包括不同季节和节假日的销售情况和趋势,这些特征可以帮助我们了解不同季节和节假日的消费习惯和需求变化,以及针对不同季节和节假日制定不同的销售策略;商品属性特征:商品属性是指不同商品的属性信息,可以包括商品的品类、型号、颜色,特征提取是机器学习和数据挖掘中非常重要的一步,其目的是从原始数据中提取出能够表征数据特征的有用信息,随后根据提取到的数据特征进行模型训练。
5.根据权利要求1所述的一种服装电商销量预测建模方法,其特征在于:所述基于历史销售数据和相关特征进行模型训练的步骤,包括:
进行模型输出对齐,即保证每个模型的输出维度和时间粒度一致;
针对不同的数据特征使用不同的模型进行训练。
6.根据权利要求5所述的一种服装电商销量预测建模方法,其特征在于:所述针对不同的数据特征使用不同的模型进行训练的步骤,包括:
首先将销售数量特征进行模型训练,根据商品的上架时间不同分别采用ETS模型和Prophet模型进行训练,ETS模型用于上架28天内的新品,Prophet模型用于上架超过28天的商品。ETS模型输入特征为天粒度的时序销量,Prophet模型输入特征为天粒度的时序销量和价格特征,模型输出为天粒度的时序销量;多渠道投放趋势模型:采用LightGBM模型进行训练,输入特征包括销售数量、渠道、投放、营销、用户、季节和商品属性等,模型输出未来7天投放趋势增加的概率;营销趋势模型:采用LightGBM模型进行训练,输入特征包括销售数量、渠道、投放、营销、用户、季节和商品属性等,模型输出未来7天营销改价的概率;长期季节趋势模型:采用LR模型进行训练,输入特征包括往年天粒度的时序销量和GoogleTrends往年同期周维度时序搜索量,模型输出今年销量趋势;分层模型:分为两步,第一步预测拆分到颜色,第二步在拆分到颜色的基础上继续拆分到尺码,预测拆分到颜色时,主要考虑三个因素:各个颜色近期销量占比,反季商品的销量占比,以及上新计划对颜色销量的影响。拆分到尺码时,主要考虑当前款的累计销量和尺码分布,以及当前款所在类目的尺码分布。
7.根据权利要求1所述的一种服装电商销量预测建模方法,其特征在于:所述使用单独的测试数据集验证和测试模型,以确保模型的准确性与可靠性的步骤,包括:
使用单独的测试数据集验证和测试模型;
识别模型中的潜在错误或问题,提高预测的准确性。
8.根据权利要求7所述的一种服装电商销量预测建模方法,其特征在于:所述使用单独的测试数据集验证和测试模型的步骤,包括:
基本销量趋势模型采用MAPE和WMAPE指标进行评价:该模型是以款式粒度进行预测,参考照片是销售量的N天移动平均值,通常取N=3,预测周定期设置为14天,即成衣下单到成衣交易的平均时长;多渠道投放态势模型采用AUC指标进入行情评价:该模型是以款式颗粒度分渠预测,在最重要的两个渠道上,该模型的AUC通常在0.75~0.80之间,AUC越接近1,则其检测方法真实性越高,模型预测越准确;营销趋势模型采用AUC指标进入行情评价:该模型是以款式为颗粒度进行预测,同时该模型的AUC在0.70左右;季节趋势模型采用MAPE和WMAPE指标进行评价:该模型是以款式为颗粒度进行预测,参考照片是销售量的N天移动平均值,通常取N=3,预测周定期设置为35天,即面料下单到成衣交易的平均时,MAPE指标通常使用针对具体款式的预测对比,相对于销量的3天移动平均值,在TOP100商品上应该指标较小的比例为76%,WMAPE指标通常用于所有商品或部分维数的总体对比。相对于销量的3天移动平均值,在所有商品上,该模型相对提了WMAPE指标约3%,分层模型与融合模型也采用MAPE和WMAPE指标进行评价,且同样拆分到颜色、尺码的最小粒度预测。
9.根据权利要求1所述的一种服装电商销量预测建模方法,其特征在于:所述使用模型融合,实现销售数据预测的步骤,包括:
通过融合后的模型实现数据预测,可以根据融合模型进行投放趋势以及营销趋势预测,并可根据预测结果调整基础销量,同时可预测未来一段时间内售卖的款式,包括款式的颜色、尺码等信息,根据预测数据可进行库存管理的优化,来确定不同商品的最佳库存水平。
10.一种服装电商销量预测建模系统,其特征在于:所述该系统包括:
数据处理模块,用于将历史销售数据进行预处理并提取特征;
模型训练模块,用于根据各特征数据训练模型;
模型测试模块,用于将训练好的模型进行测试,查看其准确性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310756839.7A CN116739652A (zh) | 2023-06-26 | 2023-06-26 | 一种服装电商销量预测建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310756839.7A CN116739652A (zh) | 2023-06-26 | 2023-06-26 | 一种服装电商销量预测建模方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116739652A true CN116739652A (zh) | 2023-09-12 |
Family
ID=87907882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310756839.7A Pending CN116739652A (zh) | 2023-06-26 | 2023-06-26 | 一种服装电商销量预测建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116739652A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117974217A (zh) * | 2024-03-29 | 2024-05-03 | 北京京东乾石科技有限公司 | 直播销量预测的方法、装置、电子设备及介质 |
CN118014627A (zh) * | 2024-04-08 | 2024-05-10 | 武汉凯明德科技文化有限公司 | 一种基于区块链的电商交易平台智能管理系统 |
-
2023
- 2023-06-26 CN CN202310756839.7A patent/CN116739652A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117974217A (zh) * | 2024-03-29 | 2024-05-03 | 北京京东乾石科技有限公司 | 直播销量预测的方法、装置、电子设备及介质 |
CN118014627A (zh) * | 2024-04-08 | 2024-05-10 | 武汉凯明德科技文化有限公司 | 一种基于区块链的电商交易平台智能管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111445134B (zh) | 商品的销量预测方法、装置、计算机设备和存储介质 | |
CN108573432B (zh) | 用于电子商务的交易监管系统和方法 | |
US20230081051A1 (en) | Systems and methods using inventory data to measure and predict availability of products and optimize assortment | |
CN107665448A (zh) | 用于确定消费贡献价值的方法、装置以及存储介质 | |
KR20190086173A (ko) | 온라인 쇼핑몰의 판매 상품 분석 및 판매 촉진 시스템 | |
CN108256802B (zh) | 基于人群搜索算法的多供应商订单分配云处理方法 | |
Chernonog et al. | How to set price and quality in a supply chain of virtual products under bi-criteria and risk consideration | |
CN116739652A (zh) | 一种服装电商销量预测建模方法 | |
BenMark et al. | How retailers can drive profitable growth through dynamic pricing | |
CN111445133B (zh) | 一种材料管理方法、装置、计算机设备和存储介质 | |
CN116187808A (zh) | 一种基于虚拟电厂用户-套餐标签画像的电力套餐推荐方法 | |
CN116611796B (zh) | 一种店铺交易数据的异常检测方法及装置 | |
CN114372848A (zh) | 一种基于机器学习的烟草行业智能营销系统 | |
CN116452299A (zh) | 一种电商智能化推荐系统及方法 | |
CN114219547B (zh) | 一种门店订货量的确定方法、装置、设备及存储介质 | |
CN114971083A (zh) | 一种货物购买预测出售的方法 | |
CN114266594A (zh) | 一种基于东南亚跨境电商平台的大数据分析方法 | |
Huang et al. | Sales forecast for O2O services-based on incremental random forest method | |
Anand et al. | Retail Analysis—Walmart’s Trend Assessment | |
CN113421148A (zh) | 商品数据处理方法、装置、电子设备及计算机存储介质 | |
CN113744024A (zh) | 一种商家匹配方法、装置、计算机设备及存储介质 | |
KR20220160828A (ko) | 수산물 유통 도매업 인터넷 판매관리 시스템 | |
Ogundunmade et al. | Modelling E-commerce Data Using Pareto Principle | |
CN115760223B (zh) | 一种基于数据分析的服装电商智能监测分析系统 | |
KR102624667B1 (ko) | 전력 사용량 예측 및 누진 단계 예측을 이용한 이웃간 전력 거래 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |