CN107180362A - 基于深度学习的零售商品销售预测方法 - Google Patents

基于深度学习的零售商品销售预测方法 Download PDF

Info

Publication number
CN107180362A
CN107180362A CN201710304049.XA CN201710304049A CN107180362A CN 107180362 A CN107180362 A CN 107180362A CN 201710304049 A CN201710304049 A CN 201710304049A CN 107180362 A CN107180362 A CN 107180362A
Authority
CN
China
Prior art keywords
mrow
data
subset
sales
random
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710304049.XA
Other languages
English (en)
Inventor
肖亮
王璐雅
许翀寰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Gongshang University
Original Assignee
Zhejiang Gongshang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Gongshang University filed Critical Zhejiang Gongshang University
Priority to CN201710304049.XA priority Critical patent/CN107180362A/zh
Publication of CN107180362A publication Critical patent/CN107180362A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于深度学习的零售商品销售预测方法,包括:步骤1.数据预处理;步骤2.构建随机森林的基分类器;步骤3.随机选择特征子集;步骤4.预测零售商品的销售趋势。本发明研究零售商品的精准销售预测问题,挖掘出各种非线性因素对销售结果的影响,同时避免部分非线性模型容易陷入局部极小值、收敛速度慢的缺点,帮助企业进行高效、准确的预测销售趋势。本发明基于深度学习,构建随机森林的集成分类器销售预测模型。通过该方法科学合理的提高销售预测的精确性。

Description

基于深度学习的零售商品销售预测方法
技术领域
本发明包括人工智能、数据挖掘技术领域知识,具体涉及基于深度学习的零售商品销售预测方法。适用于各类零售企业,实现精准的销售预测,提升企业的业绩。
技术背景
随着互联网的飞速发展,传统行业经受着巨大的压力和挑战,线下零售业受到了网络零售的不断冲击。网购已逐步成为人们购买商品的主要方式,而且商品品类从大型家电、家具家私到居家用品、零食饮料应有尽有。许多电商企业更是根据用户的消费行为和商品的特点划分出各种细分领域,进行精细化的销售。传统的线下实体店消费模式正在转型升级,网络零售店也在汲取实体店的优势,不断创新。面对诸如“双十一”、“双十二”等的购物狂欢节,消费者的参与度空前火热。无论是线上零售企业还是线下零售企业都需要做好充分的准备,采取有效的应对措施。因此,零售企业迫切需要一种有效的方式来对未来的销售趋势进行精准预测,为决策提供可靠的支持。
由于商品销售除了受商品自身品质、市场供求关系等因素的影响,还跟诸如节假日效应、产品宣传与推广促销活动、同类型商家竞争布局等客观环境因素息息相关,这部分的变化往往是非线性和随机的,单纯使用线性模型很难预测出良好的结果。
因此,本发明研究零售商品的精准销售预测问题,挖掘出各种非线性因素对销售结果的影响,同时避免部分非线性模型容易陷入局部极小值、收敛速度慢的缺点,帮助企业进行高效、准确的预测销售趋势。本发明基于深度学习,构建随机森林的集成分类器销售预测模型。通过该方法科学合理的提高销售预测的精确性。
发明内容
本发明要克服现有零售商品销售预测方法精确性差、计算效率低的缺点,提出基于深度学习的零售商品销售预测方法。通过随机森林多分类器的构建,。本方法能支持电商企业更好得开展个性化服务。
本发明提出的基于深度学习的零售商品销售预测方法,包括以下步骤:
1)数据预处理:对获取到的数据集中的缺失数据进行处理。首先对数据维度进行分析整理,删除对分类预测结果无作用的维度;然后对剩下的数据维度对应的数据进行清理,量化非结构化的数据,补充缺失值,例如某些服从正态分布的数据,可以采用均值进行填补。
2)构建随机森林的基分类器:随机森林是Bagging算法和Random Subspace算法的组合,基本构成单元是决策树也就是基分类器。假设经过数据预处理后的集合D={(xi1,xi2,…,xiM,yi)},i∈(1,N),其中N表示数据样本的个数,M表示数据的属性或者特征个数,Y={yi}表示类别标签。本发明将构建CART决策树,组成随即森林的基分类器,该决策树使用基尼系数来选择划分属性,公式如下:
其中Pi表示类别i数据样本占总数据样本量的比例,Dj表示第j个数据样本的属性集合,A表示特征即Gini(D,A)表示在特征A下的D集合,基尼系数越小,分类效果越好。
3)随机选择特征子集:在树的节点分裂时,随机无放回地选择子集,其中子集的大小远小于属性特征M。假设从M个特征中随机选择包含k个特征的子集,然后再从这个子集中选择一个最优属性用于划分。对该子集进行计算,选取最佳分类节点,最佳分类的选择公式依然为基尼系数。
通过该公式挑选出最佳属性作为最佳分裂属性,若属性值为离散的即可进行下一步分裂,为连续变量则需要再选取最佳分裂点。
4)预测零售商品的销售趋势:将得到的数据应用到训练好的随机森林上,单棵树的叶子节点实质是对训练集样本划分后的集合,预测结果由集合中的样本求均值得到,对每棵树的预测结果求均值就能得到森林的预测结果。
本发明基于深度学习的思想,采用随机森林方法预测零售商品的销售情况,通过基分类器构建和随机属性选择,提升商品销售趋势预测的精确性。
本发明的有益效果在于:
本发明有效地克服了传统零售商品销售预测的缺点,通过深度学习方法大大提高了销售预测的精确度,该方法具有良好的应用价值。
附图说明
图1是本发明方法的随机森林的基分类器的随机森林结构图。
具体实施方式
下面结合附图说明和具体实施方式对本发明做进一步详细说明。
本发明提出的基于深度学习的零售商品销售预测方法,包括以下步骤:
1)数据预处理:对获取到的数据集中的缺失数据进行处理。首先对数据维度进行分析整理,删除对分类预测结果无作用的维度;然后对剩下的数据维度对应的数据进行清理,量化非结构化的数据,补充缺失值,例如某些服从正态分布的数据,可以采用均值进行填补。
2)构建随机森林的基分类器:随机森林是Bagging算法和Random Subspace算法的组合,基本构成单元是决策树也就是基分类器。假设经过数据预处理后的集合D={(xi1,xi2,…,xiM,yi)},i∈(1,N),其中N表示数据样本的个数,M表示数据的属性或者特征个数,Y={yi}表示类别标签。本发明将构建CART决策树,组成随即森林的基分类器,该决策树使用基尼系数来选择划分属性,公式如下:
其中Pi表示类别i数据样本占总数据样本量的比例,Dj表示第j个数据样本的属性集合,A表示特征即Gini(D,A)表示在特征A下的D集合,基尼系数越小,分类效果越好。
3)随机选择特征子集:在树的节点分裂时,随机无放回地选择子集,其中子集的大小远小于属性特征M。假设从M个特征中随机选择包含k个特征的子集,然后再从这个子集中选择一个最优属性用于划分。对该子集进行计算,选取最佳分类节点,最佳分类的选择公式依然为基尼系数。
通过该公式挑选出最佳属性作为最佳分裂属性,若属性值为离散的即可进行下一步分裂,为连续变量则需要再选取最佳分裂点。
4)预测零售商品的销售趋势:将得到的数据应用到训练好的随机森林上,单棵树的叶子节点实质是对训练集样本划分后的集合,预测结果由集合中的样本求均值得到,对每棵树的预测结果求均值就能得到森林的预测结果。

Claims (1)

1.基于深度学习的零售商品销售预测方法,包括以下步骤:
步骤1.数据预处理:对获取到的数据集中的缺失数据进行处理。首先对数据维度进行分析整理,删除对分类预测结果无作用的维度;然后对剩下的数据维度对应的数据进行清理,量化非结构化的数据,补充缺失值;
步骤2.构建随机森林的基分类器:随机森林是Bagging算法和Random Subspace算法的组合,基本构成单元是决策树也就是基分类器;假设经过数据预处理后的集合D={(xi1,xi2,…,xiM,yi)},i∈(1,N),其中N表示数据样本的个数,M表示数据的属性或者特征个数,Y={yi}表示类别标签;构建CART决策树,组成随即森林的基分类器,该决策树使用基尼系数来选择划分属性,公式如下:
<mrow> <mtable> <mtr> <mtd> <mrow> <mi>G</mi> <mi>i</mi> <mi>n</mi> <mi>i</mi> <mrow> <mo>(</mo> <mi>D</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>1</mn> <mo>-</mo> <munderover> <mo>&amp;Sigma;</mo> <mi>i</mi> <mi>c</mi> </munderover> <msubsup> <mi>P</mi> <mi>i</mi> <mn>2</mn> </msubsup> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>G</mi> <mi>i</mi> <mi>n</mi> <mi>i</mi> <mo>(</mo> <mrow> <mi>D</mi> <mo>,</mo> <mi>A</mi> </mrow> <mo>)</mo> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mfrac> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>D</mi> <mo>|</mo> </mrow> </mfrac> <mi>G</mi> <mi>i</mi> <mi>n</mi> <mi>i</mi> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中Pi表示类别i数据样本占总数据样本量的比例,Dj表示第j个数据样本的属性集合,A表示特征即Gini(D,A)表示在特征A下的D集合,基尼系数越小,分类效果越好;
步骤3.随机选择特征子集:在树的节点分裂时,随机无放回地选择子集,其中子集的大小远小于属性特征M;假设从M个特征中随机选择包含k个特征的子集,然后再从这个子集中选择一个最优属性用于划分;对该子集进行计算,选取最佳分类节点,最佳分类的选择公式依然为基尼系数;
通过该公式挑选出最佳属性作为最佳分裂属性,若属性值为离散的即可进行下一步分裂,为连续变量则需要再选取最佳分裂点;
步骤4.预测零售商品的销售趋势:将得到的数据应用到训练好的随机森林上,单棵树的叶子节点实质是对训练集样本划分后的集合,预测结果由集合中的样本求均值得到,对每棵树的预测结果求均值就能得到森林的预测结果。
CN201710304049.XA 2017-05-03 2017-05-03 基于深度学习的零售商品销售预测方法 Pending CN107180362A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710304049.XA CN107180362A (zh) 2017-05-03 2017-05-03 基于深度学习的零售商品销售预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710304049.XA CN107180362A (zh) 2017-05-03 2017-05-03 基于深度学习的零售商品销售预测方法

Publications (1)

Publication Number Publication Date
CN107180362A true CN107180362A (zh) 2017-09-19

Family

ID=59831240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710304049.XA Pending CN107180362A (zh) 2017-05-03 2017-05-03 基于深度学习的零售商品销售预测方法

Country Status (1)

Country Link
CN (1) CN107180362A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403345A (zh) * 2017-09-22 2017-11-28 北京京东尚科信息技术有限公司 畅销商品预测方法及系统、存储介质及电子终端
CN108399748A (zh) * 2018-03-08 2018-08-14 重庆邮电大学 一种基于随机森林与聚类算法的道路旅行时间预测方法
CN108764974A (zh) * 2018-05-11 2018-11-06 国网电子商务有限公司 一种基于深度学习的商品采购量预测方法及装置
CN109255480A (zh) * 2018-08-30 2019-01-22 中国平安人寿保险股份有限公司 间佣率预测方法、装置、计算机设备及存储介质
CN109727078A (zh) * 2019-01-18 2019-05-07 创新奇智(南京)科技有限公司 一种基于商品类别树的销量预测修正方法
CN109767249A (zh) * 2017-11-09 2019-05-17 北京京东尚科信息技术有限公司 预测性价比的方法和装置
CN109886328A (zh) * 2019-02-14 2019-06-14 国网浙江省电力有限公司电力科学研究院 一种电动汽车充电设施故障预测方法与系统
CN109978612A (zh) * 2019-03-18 2019-07-05 北京工业大学 一种基于深度学习的便利店销量预测方法
CN109978358A (zh) * 2019-03-18 2019-07-05 中国科学院自动化研究所 基于半监督学习的销售风险点检测方法、系统、装置
CN110135167A (zh) * 2019-05-14 2019-08-16 电子科技大学 一种随机森林的边缘计算终端安全等级评估方法
CN110503447A (zh) * 2018-05-16 2019-11-26 杉数科技(北京)有限公司 用于确定商品销量预测值的方法及装置
CN110517059A (zh) * 2019-07-08 2019-11-29 广东工业大学 一种基于随机森林的时尚手袋销售预测方法
CN111428808A (zh) * 2020-04-08 2020-07-17 成都爱科特科技发展有限公司 一种利用随机森林进行业务分类的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160071117A1 (en) * 2014-09-09 2016-03-10 Fliptop Inc. System and method for using marketing automation activity data for lead prioritization and marketing campaign optimization
US20160225017A1 (en) * 2015-01-30 2016-08-04 Linkedln Corporation Size of prize predictive model
CN105844300A (zh) * 2016-03-24 2016-08-10 河南师范大学 一种基于随机森林算法的优化分类方法及装置
CN106127525A (zh) * 2016-06-27 2016-11-16 浙江大学 一种基于分类算法的电视购物商品推荐方法
CN106228389A (zh) * 2016-07-14 2016-12-14 武汉斗鱼网络科技有限公司 基于随机森林算法的网络潜力用户挖掘方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160071117A1 (en) * 2014-09-09 2016-03-10 Fliptop Inc. System and method for using marketing automation activity data for lead prioritization and marketing campaign optimization
US20160225017A1 (en) * 2015-01-30 2016-08-04 Linkedln Corporation Size of prize predictive model
CN105844300A (zh) * 2016-03-24 2016-08-10 河南师范大学 一种基于随机森林算法的优化分类方法及装置
CN106127525A (zh) * 2016-06-27 2016-11-16 浙江大学 一种基于分类算法的电视购物商品推荐方法
CN106228389A (zh) * 2016-07-14 2016-12-14 武汉斗鱼网络科技有限公司 基于随机森林算法的网络潜力用户挖掘方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A AJESH ETAL.: "A random forest approach for rating-based recommender system", 《2016 INTERNATIONAL CONFERENCE ON ADVANCES IN COMPUTING, COMMUNICATIONS AND INFORMATICS (ICACCI)》 *
侯璐: "大型连锁超市部门层销售预测方法研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *
温廷新 等: "露天煤矿边坡稳定性的随机森林预测模型", 《科技导报》 *
田帅: "基于组合模型的销售预测应用研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403345A (zh) * 2017-09-22 2017-11-28 北京京东尚科信息技术有限公司 畅销商品预测方法及系统、存储介质及电子终端
CN109767249A (zh) * 2017-11-09 2019-05-17 北京京东尚科信息技术有限公司 预测性价比的方法和装置
CN108399748A (zh) * 2018-03-08 2018-08-14 重庆邮电大学 一种基于随机森林与聚类算法的道路旅行时间预测方法
CN108399748B (zh) * 2018-03-08 2020-12-22 重庆邮电大学 一种基于随机森林与聚类算法的道路旅行时间预测方法
CN108764974A (zh) * 2018-05-11 2018-11-06 国网电子商务有限公司 一种基于深度学习的商品采购量预测方法及装置
CN110503447A (zh) * 2018-05-16 2019-11-26 杉数科技(北京)有限公司 用于确定商品销量预测值的方法及装置
CN109255480A (zh) * 2018-08-30 2019-01-22 中国平安人寿保险股份有限公司 间佣率预测方法、装置、计算机设备及存储介质
CN109727078A (zh) * 2019-01-18 2019-05-07 创新奇智(南京)科技有限公司 一种基于商品类别树的销量预测修正方法
CN109886328A (zh) * 2019-02-14 2019-06-14 国网浙江省电力有限公司电力科学研究院 一种电动汽车充电设施故障预测方法与系统
CN109978358A (zh) * 2019-03-18 2019-07-05 中国科学院自动化研究所 基于半监督学习的销售风险点检测方法、系统、装置
CN109978612A (zh) * 2019-03-18 2019-07-05 北京工业大学 一种基于深度学习的便利店销量预测方法
CN109978358B (zh) * 2019-03-18 2021-08-13 中国科学院自动化研究所 基于半监督学习的销售风险点检测系统、装置
CN110135167A (zh) * 2019-05-14 2019-08-16 电子科技大学 一种随机森林的边缘计算终端安全等级评估方法
CN110517059A (zh) * 2019-07-08 2019-11-29 广东工业大学 一种基于随机森林的时尚手袋销售预测方法
CN111428808A (zh) * 2020-04-08 2020-07-17 成都爱科特科技发展有限公司 一种利用随机森林进行业务分类的方法

Similar Documents

Publication Publication Date Title
CN107180362A (zh) 基于深度学习的零售商品销售预测方法
Wong et al. A hybrid intelligent model for medium-term sales forecasting in fashion retail supply chains using extreme learning machine and harmony search algorithm
CN109685583A (zh) 一种基于大数据的供应链需求预测方法
Sohn et al. Decision tree based on data envelopment analysis for effective technology commercialization
CN109784979A (zh) 一种大数据驱动的供应链需求预测方法
CN106611344A (zh) 挖掘潜在客户的方法及装置
CN108038629A (zh) 一种基于协同过滤的优化方法
CN106600039A (zh) 一种电商商品消息推送优化方法
CN109727078A (zh) 一种基于商品类别树的销量预测修正方法
CN108921602A (zh) 一种基于集成神经网络的用户购买行为预测方法
CN109711907A (zh) 一种基于顶端排序的在线广告排序方法
CN109740624A (zh) 一种基于大数据的物流供应链需求预测方法
CN108932648A (zh) 一种预测商品属性数据及训练其模型的方法和装置
CN110503186A (zh) 商品排序神经网络模型训练方法、装置、电子设备
Hasan et al. Solving onion market instability by forecasting onion price using machine learning approach
Bala Decision tree based demand forecasts for improving inventory performance
CN109858770A (zh) 对象质量评估方法和装置
Teller et al. Physical and digital market places–where marketing meets operations
Mazurkiewicz et al. System of a complex assessment of technological innovative solutions
Namburu et al. Product pricing solutions using hybrid machine learning algorithm
Sharma et al. Comparative analysis of machine learning techniques in sale forecasting
Yada et al. Is this brand ephemeral? A multivariate tree-based decision analysis of new product sustainability
Zhang et al. Demand forecasting: From machine learning to ensemble learning
Meulstee et al. Food sales prediction:" If only it knew what we know"
Agarwal Benefits and issues surrounding data mining and its application in the retail industry

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170919