CN113393279A - 一种订单数量的预估方法及系统 - Google Patents
一种订单数量的预估方法及系统 Download PDFInfo
- Publication number
- CN113393279A CN113393279A CN202110771812.6A CN202110771812A CN113393279A CN 113393279 A CN113393279 A CN 113393279A CN 202110771812 A CN202110771812 A CN 202110771812A CN 113393279 A CN113393279 A CN 113393279A
- Authority
- CN
- China
- Prior art keywords
- order
- emotion
- influence factor
- prediction
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000008451 emotion Effects 0.000 claims abstract description 122
- 238000013528 artificial neural network Methods 0.000 claims abstract description 89
- 238000012545 processing Methods 0.000 claims abstract description 45
- 230000011218 segmentation Effects 0.000 claims abstract description 25
- 238000004458 analytical method Methods 0.000 claims abstract description 21
- 238000003066 decision tree Methods 0.000 claims abstract description 4
- 230000006399 behavior Effects 0.000 claims description 42
- 238000004422 calculation algorithm Methods 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 16
- 238000011156 evaluation Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 5
- 230000002996 emotional effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 8
- 230000007547 defect Effects 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种订单数量的预估方法及系统,本发明实施例采用多层前馈(BP)神经网络及梯度提升决策树(GBDT)神经网络结合构建预测模型,获取订单的直接影响因素参数及订单的间接影响因素参数,对订单的间接影响因素参数进行分词及情感分析后,得到订单的间接影响因素参数的情感值;将订单的直接影响因素参数及订单的间接影响因素参数的情感值输入到所构建的预测模型中,通过所述预测模型中的BP神经网络及GBDT神经网络进行预估处理,分别输出第一订单预估数量值及第二订单预估数量值,通过所述预测模型的合并处理,得到订单预估数据值。这样,本发明实施例就准确预估订单数量,提高了预估准确性。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种订单数量的预估方法及系统。
背景技术
随着计算机网络技术的发展,可以通过计算机网络实现各种应用。比如:在计算机网络侧上设置货品或服务的交易平台,用户终端通过计算机网络接入到该交易平台上,通过该交易平台进行货品或服务的预订。货品或服务的交易平台为了能够更好的服务用户终端,需要对一些信息进行预估,比如对货品或服务的预订订单进行预估,以提前做好货品或服务的准备。
目前,交易平台对订单数量进行预估时,有两种方法,以下分别说明。
第一种方法,主观预测方法。交易平台的管理者或运营人员通过以往的货品或服务的交易信息,及自身的工作经验,对订单数量进行主观预测,得到订单数量。
第二种方法,定量预测方法。设置神经网络模型,该神经网络模型是基于时间序列设置的线性预测模型,或者是采用多层前馈(BP)神经网络的预测模型,或者是将线性预测模型与神经网络相结合的预测模型,在预估定订单数量时,将所设置的神经网络模型所需的预估订单数量的相关信息输入到该模型中,经过该模型的处理得到所预估的订单数量。由于该方法采用了神经网络,所以在预估订单数量时能够提高泛化能力及提高预估准确性。
但是,采用这两种方法也存在明显的缺陷。针对第一种方法,在预估订单数量时,带有一定的主观性,对交易平台的涉及订单的历史多维度的相关信息挖掘不全,对波动性的涉及订单的外界因素考虑不到位,使得预估的订单数量和实际的订单数量有较大的差异,预估准确性低,无法适应交易平台的订单波动带来的机遇与挑战。针对第二种方法,虽然采用了神经网络模型进行订单预估,但是预估的准确性还是不能满足要求。比如基于时间序列的线性预测模型主要是关注时间与订单涉及的信息之间的关系,而忽略了其他影响,当该线性预测模型遇到非线性关系的实际问题时,预估的准确性就会下降。比如单独采用BP神经网络的预测模型,则该模型在收敛过程中存在速度慢,很有可能陷入局部极小值及稳定性差等缺点,导致了预估准性低。
发明内容
有鉴于此,本发明实施例提供一种订单数量的预估方法,该方法能够准确预估订单数量,提高预估准确性。
本发明实施例提供一种订单数量的预估系统,该系统能够准确预估订单数量,提高预估准确性。
本发明实施例是这样实现的:
一种订单数量的预估方法,包括:
获取订单的直接影响因素参数及订单的间接影响因素参数;
对订单的间接影响因素参数进行分词及情感分析,得到订单的间接影响因素参数的情感值;
将订单的直接影响因素参数及订单的间接影响因素参数的情感值输入到预测模型中,所述预测模型由多层前馈BP神经网络及梯度提升决策树GBDT神经网络结合构建;
通过所述预测模型中的BP神经网络及GBDT神经网络进行预估处理,分别输出第一订单预估数量值及第二订单预估数量值,通过所述预测模型的合并处理,得到订单预估数据值。
较佳地,所述获取订单的直接影响因素参数及订单的间接影响因素参数包括:
获取订单的用户行为相关因素、订单的商家行为相关因素及订单的交易行为相关因素;其中,所述订单的用户行为相关因素包括货品或服务的浏览量、货品或服务的加购量、以及货品或服务的收藏量中的一种或多种组合;所述订单的商家行为相关因素包括货品或服务的单价信息、以及货品或服务的折扣力度信息中的一种或多种组合;所述订单的交易行为相关因素包括货品或服务的销售量,或/和,货品或服务的销售额信息;
获取订单包括的货品或服务的评价信息。
较佳地,所述对订单的间接影响因素参数进行分词及情感分析包括:
采用设置的分词数据库,对订单的间接影响因素参数进行分词,得到订单的情感词典;
基于订单的情感词典进行计算,得到订单的情感词典中的各个情感词的情感值;
计算订单的情感词典中的各个情感词的情感值的平均值,得到订单的间接影响因素参数的情感值。
较佳地,所述通过所述预测模型中的BP神经网络输出第一订单预估数量值包括:通过所述预测模型中的采用迭代算法Adaboots的BP神经网络输出第一订单预估数量值。
较佳地,所述通过所述预测模型的合并处理,得到订单预估数据值包括:
采用沙普利shapley算法,为第一订单预估数量值及第二订单预估数据值分别确定对应的权重后,根据所对应的权重进行合并,得到订单预估数据值。
一种订单数量的预估系统,包括:获取单元、情感值分析单元及预估模型处理单元,其中,
获取单元,用于获取订单的直接影响因素参数及订单的间接影响因素参数,将订单的直接影响因素参数发送给预估模型处理单元;
情感分析单元,用于对订单的间接影响因素参数进行分词及情感分析,得到订单的间接影响因素参数的情感值,发送给预估模型处理单元;
预估模型处理单元,用于接收订单的直接影响因素参数及订单的间接影响因素参数的情感值,输入到预测模型中,所述预测模型由BP神经网络及GBDT神经网络结合构建;通过所述预测模型中的BP神经网络及GBDT神经网络进行预估处理,分别输出第一订单预估数量值及第二订单预估数量值,通过所述预测模型的合并处理,得到订单预估数据值。
较佳地,所述订单的直接影响因素参数包括订单的用户行为相关因素、订单的商家行为相关因素及订单的交易行为相关因素;订单的间接影响因素为订单包括的货品或服务的评价信息;
所述订单的用户行为相关因素包括货品或服务的浏览量、货品或服务的加购量、以及货品或服务的收藏量中的一种或多种组合;所述订单的商家行为相关因素包括货品或服务的单价信息、以及货品或服务的折扣力度信息中的一种或多种组合;所述订单的交易行为相关因素包括货品或服务的销售量,或/和,货品或服务的销售额信息。
较佳地,所述情感分析单元,还用于采用设置的分词数据库,对订单的间接影响因素参数进行分词,得到订单的情感词典;基于订单的情感词典进行计算,得到订单的情感词典中的各个情感词的情感值;计算订单的情感词典中的各个情感词的情感值的平均值,得到订单的间接影响因素参数的情感值;
所述预估模型处理单元,还用于通过所述预测模型中的采用迭代算法的BP神经网络输出第一订单预估数量值;
所述预估模型处理单元,还用于采用沙普利shapley算法,为第一订单预估数量值及第二订单预估数据值分别确定对应的权重后,根据所对应的权重进行合并,得到订单预估数据值。
一种订单数量的预估装置,包括:
存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行上述任一所述的订单数量的预估方法。
一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时实现上述任一所述的订单数量的预估方法。
如上所见,本发明实施例采用BP神经网络及梯度提升决策树(GBDT)神经网络结合构建预测模型,获取订单的直接影响因素参数及订单的间接影响因素参数,对订单的间接影响因素参数进行分词及情感分析后,得到订单的间接影响因素参数的情感值;将订单的直接影响因素参数及订单的间接影响因素参数的情感值输入到所构建的预测模型中,通过所述预测模型中的BP神经网络及GBDT神经网络进行预估处理,分别输出第一订单预估数量值及第二订单预估数量值,通过所述预测模型的合并处理,得到订单预估数据值。这样,本发明实施例就准确预估订单数量,提高了预估准确性。
附图说明
图1为本发明实施例提供的订单数量的预估方法流程图;
图2为本发明实施例提供的订单数量的预估方法实施的架构示意图;
图3为本发明实施例获取订单的直接影响因素参数及订单的间接影响因素参数的构架框图;
图4为本发明实施例提供的对订单的间接影响因素参数进行分词及情感分析过程的框架示意图;
图5为本发明实施例提供的基于迭代算法的BP神经网络对订单的直接影响因素参数及订单的间接影响因素参数的情感值进行处理的框架示意图;
图6为本发明实施例提供的通过所述预测模型的合并处理,得到订单预估数据值的过程流程图;
图7为本发明实施例提供的订单数量的预估系统结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其他步骤或单元。
下面以具体实施例对本发明的技术方案进行详细说明。下面几个具体实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
从背景技术可以看出,第二种方法相比于第一种方法,从对订单数量的主观定性预测到采用神经网络模型预测,提高了预估的准确性。但是,当采用第二种方法时,如果采用基于时间序列的预测模型,主要关注时间与订单涉及的信息之间的关系,而忽略了其他影响,当该预测模型遇到非线性关系的实际问题时,预估的准确性就会下降。当该预测模型采用回归分析等方法时,对预测结果的影响因素及变化规律较难确定,其中有的设置的预测模型单纯地认为订单数量是未来是过去和现在的延续,有的设置的预测模型中会加入过多的主观因素,这些影响模型的预测订单数量的效果。如果单独采用BP神经网络预测模型,则该预测模型在收敛过程中存在速度慢,很有可能陷入局部极小值及稳定性差等缺点,而采用其他的神经网络构建的预测模型也会有稳定性不强、泛化能力差及误差大等缺点。因此,方法二提供的无论采用一个线性预测模型、或神经网络构建预测模型,还是将线性预测模型和诸如BP神经网络的神经网络结合构建预测模型,预估的订单数量都存在与实际订单数量之间的误差比较大的问题,预估准确性低的缺点。
为了解决上述问题,本发明实施例采用BP神经网络及GBDT神经网络结合构建预测模型,获取订单的直接影响因素参数及订单的间接影响因素参数,对订单的间接影响因素参数进行分词及情感分析后,得到订单的间接影响因素参数的情感值;将订单的直接影响因素参数及订单的间接影响因素参数的情感值输入到所构建的预测模型中,通过所述预测模型中的BP神经网络及GBDT神经网络进行预估处理,分别输出第一订单预估数量值及第二订单预估数量值,通过所述预测模型的合并处理,得到订单预估数据值。
这样,由于输入预测模型的订单的间接影响因素参数的情感值是基于订单所包括货品或服务的评价信息(也就是订单的间接影响因素参数)确定的,而订单所包括货品或服务的评价信息是影响订单数量的重要因素,且订单的直接影响因素参数反映了影响订单数量的最主要因素,所以基于订单的直接影响因素参数及订单的间接影响因素参数的情感值进行订单数量预估,能够提高预估订单数量的准确度。更进一步地,预测模型由BP神经网络以及GBDT神经网络进行组合,避免了采用单一神经网络的不足。因此,本发明实施例可以准确预估订单数量,提高预估准确性。
图1为本发明实施例提供的订单数量的预估方法流程图,其具体步骤包括:
步骤101、获取订单的直接影响因素参数及订单的间接影响因素参数;
步骤102、对订单的间接影响因素参数进行分词及情感分析,得到订单的间接影响因素参数的情感值;
步骤103、将订单的直接影响因素参数及订单的间接影响因素参数的情感值输入到预测模型中,所述预测模型由BP神经网络及GBDT神经网络结合构建;
步骤104、通过所述预测模型中的BP神经网络及GBDT神经网络进行预估处理,分别输出第一订单预估数量值及第二订单预估数量值,通过所述预测模型的合并处理,得到订单预估数据值。
在本发明实施例中,用户终端接入交易平台,浏览或购买交易平台提供的货品或服务,随着计算机网络的大数据时代到来,用户终端浏览量及订单数量会不断增加。交易平台获取的这些海量数据是非常有价值的信息,使得订单数量的准确预估成为可能。订单数量的准确预估在交易平台上的商家备货、仓库资源调配、快递及大促时的业绩预测等场景都有很大的价值。在这种情况下,通过图1所述的方法就可以准确预估订单数量,提高预估准确性及效率,给交易平台及交易平台的商家带来更准确的风向标和更大的价值。
在图1的步骤101中,所述获取订单的直接影响因素参数及订单的间接影响因素参数包括:
获取订单的用户行为相关因素、订单的商家行为相关因素及订单的交易行为相关因素;
获取订单包括的货品或服务的评价信息。
也就是说,订单的直接影响因素参数包括了订单的用户行为相关因素、订单的商家行为相关因素及订单的交易行为相关因素;订单的间接影响因素为订单包括的货品或服务的评价信息。
更进一步地,订单的用户行为相关因素包括货品或服务的浏览量、货品或服务的加购量、以及货品或服务的收藏量中的一种或多种组合;订单的商家行为相关因素包括货品或服务的单价信息、以及货品或服务的折扣力度信息中的一种或多种组合;订单的交易行为相关因素包括货品或服务的销售量,或/和,货品或服务的销售额信息。
在图1的步骤102中,所述对订单的间接影响因素参数进行分词及情感分析包括:
采用设置的分词数据库,对订单的间接影响因素参数进行分词,得到订单的情感词典;
基于订单的情感词典进行计算,得到订单的情感词典中的各个情感词的情感值;
计算订单的情感词典中的各个情感词的情感值的平均值,得到订单的间接影响因素参数的情感值。
在这里,分词数据库可以是计算机编程语言python中的Jieba包。
在图1的步骤104中,通过所述预测模型中的BP神经网络输出第一订单预估数量值包括:通过所述预测模型中的采用迭代算法(Adaboots)的BP神经网络输出第一订单预估数量值。
在图1的步骤104中,所述通过所述预测模型的合并处理,得到订单预估数据值包括:
采用沙普利(shapley)算法,为第一订单预估数量值及第二订单预估数据值分别确定对应的权重后,根据所对应的权重进行合并,得到订单预估数据值。
以下举例对本发明实施例进行详细说明。
图2为本发明实施例提供的订单数量的预估方法实施的架构示意图,如图所示,包括:
第一步骤,通过交易平台中已有的海量数据进行特征选择,获取订单的直接影响因素参数及订单的间接影响因素参数;
第二步骤,对订单的间接影响因素参数进行分词、构造情感词典及进行情感值计算,得到订单的间接影响因素参数的情感值;
第三步骤,将订单的直接影响因素参数及订单的间接影响因素参数的情感值输入到预测模型中的基于迭代算法的BP神经网络,采用弱分类器进行弱预测后,将得到的弱分类器结果采用强分类器进行强预测后,得到第一订单预估数据值;
第四步骤,将订单的直接影响因素参数及订单的间接影响因素参数的情感值输入到预测模型中的GBDT神经网络进行处理,得到第二订单预估数据值;
第五步骤,采用shapley算法,为第一订单预估数量值及第二订单预估数据值分别确定对应的权重后,根据所对应的权重进行合并,得到订单预估数据值作为预测模型的输出。
在图2所述的第一步骤,要进行特征选择,如图3所示,图3为本发明实施例获取订单的直接影响因素参数及订单的间接影响因素参数的构架框图。在调研和分析了影响订单数量的因素后,将影响订单数量的因素分为订单的直接影响因素参数,包括订单的用户行为相关因素、订单的商家行为相关因素及订单的交易行为相关因素。影响订单数量的因素还包括订单的间接影响因素参数,也就是订单包括的货品或服务的评价信息。在这里,可以通过统计产品与服务解决方案(SPSS,Statistical Product and Service Solutions)软件对交易平台中的所有因素参数进行订单的相关性分析,通过显著性检测且相关性系数大于设定指标,比如设定指标为0.85的因素参数,作为最终选择的影响订单数量的因素参数。
在图2所述的步骤二中,要进行分词及情感分析,如图4所示,图4为本发明实施例提供的对订单的间接影响因素参数进行分词及情感分析过程的框架示意图。所述对订单的间接影响因素参数进行分词及情感分析过程具体包括:
采用计算机编程语言python中的Jieba包,对订单所包括货品或服务的评价信息进行分词,得到订单的情感词典;
基于订单的情感词典进行计算,得到订单的情感词典中的各个情感词的情感值;
计算订单的情感词典中的各个情感词的情感值的平均值,得到订单的间接影响因素参数的情感值。
在图2所述的步骤三中,基于迭代算法的BP神经网络对订单的直接影响因素参数及订单的间接影响因素参数的情感值进行处理的框架示意图如图5所示,具体包括:
将订单的直接影响因素参数及订单的间接影响因素参数的情感值输入到预测模型中的基于迭代算法的BP神经网络;在这里,将图2所述的步骤一中选取的七个参数及步骤二中计算得到的情感值经过归一化处理构成样本集,进行输入,也就是输入基于迭代算法的BP神经网络的神经元个数为七;
该BP神经网络采用弱分类器进行弱预测后,该BP神经网络将得到的弱分类器结果采用强分类器进行强预测后,得到第一订单预估数据值。在这里,基于迭代算法的BP神经网络在进行强预测时,就是对若分类器基于不同的权重进行弱分类器的多次迭代过程,最终得到强预测结果。在这里,最终得到强预测结果为得到第一订单预估数据值,输出神经元个数为一。
在这里例子中,考虑到BP神经网络在处理参数时,BP神经网络随机初始化权值和阈值往往会降低收敛速度,容易陷入局部极值。而基于迭代算法的BP神经网络是改进的BP神经网络,通过适应性地调整其中的弱分类器的误差,从而提高弱分类器的预测精度,而迭代算法的缺点在于对异常值敏感,异常值在迭代中可能会获取较高的权重,从而影响其中的强分类器的预测准确度。所以,本发明实施例以BP神经网络作为基于迭代算法的BP神经网络的弱分类器,且在BP神经网络引入了迭代算法,采用增加权重确定的步骤选取每次迭代数据,代替随机选择迭代数据,将多个弱分类器联合起来得到强分类器,从而避免单个BP神经网络处理数据时带来的缺点。
在图2中的步骤四中采用了GBDT神经网络,该GBDT神经网络基于GBDT算法,GBDT算法是非常优秀的单个回归模型,它是通过多轮迭代,每轮迭代产生一个弱分类器,使得损失函数沿着梯度方向下降,每轮弱分类器在上一轮弱分类器的残差基础上进行再处理。将每轮处理得到的弱分类器加权求和得到最终的总分类器,输出得到第二订单预估数据值。GBDT神经网络的优点是有很准确的模型精度且较为稳定,将它与基于迭代算法的BP神经网络相结合,也是为了更好的改善预测模型的精度。
在图2中的步骤五中,将GBDT神经网络及基于迭代算法的BP神经网络相结合构成预测模型,是采用shapley算法实现的。shapley算法是确定各单项神经网络输出的结果在预测模型中的权重大小,根据各自误差大小确定所分配的权重。shapley算法反映1了每个结合的神经网络对该预测模型的贡献大小,突出反映了各个神经网络在总的预测模型中的重要性。如图6所示,图6为本发明实施例提供的通过所述预测模型的合并处理,得到订单预估数据值的过程流程图。具体地说:
采用shapley算法,为第一订单预估数量值及第二订单预估数据值分别确定对应的权重后,根据所对应的权重进行合并,得到订单预估数据值作为预测模型的输出。
举一个具体例子进行详细说明。
采用某交易平台中某个售卖货品的店铺的一整年的相关数据进行处理。该相关数据包括:货品的浏览量、货品的加购量、货品的单价、折扣力度、货品的销售量、货品的销售额及货品的评论信息的情感值。采用不同的方法预估该店铺的订单数量,并评价所预估的订单数量的准确性。
将预估的订单数量与实际的订单数量进行比较,并采用评价指标评价所预估的订单数量的准确性,采用的评价指标包括:均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)。
所采用的方法包括:第一种方法:采用基于迭代算法的BP神经网络进行预估;第二种方法:采用GBDT神经网络进行预估;第三种方法:基于迭代算法的BP神经网络和GBDT神经网络组合构成了预测模型,预测模型的输入只包括订单的直接影响因素参数,不包括订单的间接影响因素参数的情感值;第四种方法:基于迭代算法的BP神经网络和GBDT神经网络组合构成了预测模型,预测模型的输入包括订单的直接影响因素参数及订单的间接影响因素参数的情感值。
各个方法得到的订单数量预估的评价指标对比如表一所示:
表一
可以看出,方法四得出的评价指标更好,也就是其预估的订单数量最准确,准确性高,效果最好。
图7为本发明实施例提供的订单数量的预估系统结构示意图,包括:获取单元、情感值分析单元及预估模型处理单元,其中,
获取单元,用于获取订单的直接影响因素参数及订单的间接影响因素参数,将订单的直接影响因素参数发送给预估模型处理单元;
情感分析单元,用于对订单的间接影响因素参数进行分词及情感分析,得到订单的间接影响因素参数的情感值,发送给预估模型处理单元;
预估模型处理单元,用于接收订单的直接影响因素参数及订单的间接影响因素参数的情感值,输入到预测模型中,所述预测模型由BP神经网络及GBDT神经网络结合构建;通过所述预测模型中的BP神经网络及GBDT神经网络进行预估处理,分别输出第一订单预估数量值及第二订单预估数量值,通过所述预测模型的合并处理,得到订单预估数据值。
在该系统中,订单的直接影响因素参数包括了订单的用户行为相关因素、订单的商家行为相关因素及订单的交易行为相关因素;订单的间接影响因素为订单包括的货品或服务的评价信息。
在该系统中,订单的用户行为相关因素包括了货品或服务的浏览量、货品或服务的加购量、以及货品或服务的收藏量中的一种或多种组合;订单的商家行为相关因素包括了货品或服务的单价信息、以及货品或服务的折扣力度信息;订单的交易行为相关因素包括了货品或服务的销售量、以及货品或服务的销售额信息。
在该系统中,情感分析单元,还用于采用设置的分词数据库,对订单的间接影响因素参数进行分词,得到订单的情感词典;基于订单的情感词典进行计算,得到订单的情感词典中的各个情感词的情感值;计算订单的情感词典中的各个情感词的情感值的平均值,得到订单的间接影响因素参数的情感值。
在该系统中,预估模型处理单元,还用于通过所述预测模型中的采用迭代算法的BP神经网络输出第一订单预估数量值。
在该系统中,预估模型处理单元,还用于采用沙普利shapley算法,为第一订单预估数量值及第二订单预估数据值分别确定对应的权重后,根据所对应的权重进行合并,得到订单预估数据值。
本申请实施例还提供一种计算机可读介质,所述计算机可读存储介质存储指令,所述指令在由处理器执行时可执行如上所述的订单数量的预估方法中的执行步骤。实际应用中,所述的计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的,也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或多个程序被执行时,可以实现上述各实施例描述的所述的应用业务的执行方法。根据本申请公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件,或者上述的任意合适的组合,但不用于限制本申请保护的范围。在本申请公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
本发明实施例还提供一种电子设备,其中可以集成本申请实施例实现方法的装置。
具体来讲:
该电子设备可以包括一个或一个以上处理核心的处理器、一个或一个以上计算机可读存储介质的存储器以及存储在存储器上并可在处理器上运行的计算机程序。在执行所述存储器的程序时,可以实现上述的订单数量的预估方法。
具体的,实际应用中,该电子设备还可以包括电源、输入单元、以及输出单元等部件。本领域技术人员可以理解,本发明实施例中的电子设备的结构并不构成对该电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器内的软件程序和/或模块,以及调用存储在存储器内的数据,执行服务器的各种功能和处理数据,从而对该电子设备进行整体监控。
存储器可用于存储软件程序以及模块,即上述计算机可读存储介质。处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
该电子设备还包括给各个部件供电的电源,可以通过电源管理系统与处理器逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元,该输入单元可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
该电子设备还可以包括输出单元,该输出单元可以用于显示由用户输入的信息或提供给用户的信息以及各种图像用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。
本申请附图中的流程图和框图,示出了按照本申请公开的各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或者代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应该注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同附图中所标准的顺序发生。例如,两个连接地表示的方框实际上可以基本并行地执行,它们有时也可以按照相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或者流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本申请中。特别地,在不脱离本申请精神和教导的情况下,本申请的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,所有这些组合和/或结合均落入本申请公开的范围。
本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思路,并不用于限制本申请。对于本领域的技术人员来说,可以依据本发明的思路、精神和原则,在具体实施方式及应用范围上进行改变,其所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种订单数量的预估方法,其特征在于,包括:
获取订单的直接影响因素参数及订单的间接影响因素参数;
对订单的间接影响因素参数进行分词及情感分析,得到订单的间接影响因素参数的情感值;
将订单的直接影响因素参数及订单的间接影响因素参数的情感值输入到预测模型中,所述预测模型由多层前馈BP神经网络及梯度提升决策树GBDT神经网络结合构建;
通过所述预测模型中的BP神经网络及GBDT神经网络进行预估处理,分别输出第一订单预估数量值及第二订单预估数量值,通过所述预测模型的合并处理,得到订单预估数据值。
2.如权利要求1所述的方法,其特征在于,所述获取订单的直接影响因素参数及订单的间接影响因素参数包括:
获取订单的用户行为相关因素、订单的商家行为相关因素及订单的交易行为相关因素;其中,所述订单的用户行为相关因素包括货品或服务的浏览量、货品或服务的加购量、以及货品或服务的收藏量中的一种或多种组合;所述订单的商家行为相关因素包括货品或服务的单价信息、以及货品或服务的折扣力度信息中的一种或多种组合;所述订单的交易行为相关因素包括货品或服务的销售量,或/和,货品或服务的销售额信息;
获取订单包括的货品或服务的评价信息。
3.如权利要求1所述的方法,其特征在于,所述对订单的间接影响因素参数进行分词及情感分析包括:
采用设置的分词数据库,对订单的间接影响因素参数进行分词,得到订单的情感词典;
基于订单的情感词典进行计算,得到订单的情感词典中的各个情感词的情感值;
计算订单的情感词典中的各个情感词的情感值的平均值,得到订单的间接影响因素参数的情感值。
4.如权利要求1所述的方法,其特征在于,所述通过所述预测模型中的BP神经网络输出第一订单预估数量值包括:通过所述预测模型中的采用迭代算法Adaboots的BP神经网络输出第一订单预估数量值。
5.如权利要求1所述的方法,其特征在于,所述通过所述预测模型的合并处理,得到订单预估数据值包括:
采用沙普利shapley算法,为第一订单预估数量值及第二订单预估数据值分别确定对应的权重后,根据所对应的权重进行合并,得到订单预估数据值。
6.一种订单数量的预估系统,其特征在于,包括:获取单元、情感值分析单元及预估模型处理单元,其中,
获取单元,用于获取订单的直接影响因素参数及订单的间接影响因素参数,将订单的直接影响因素参数发送给预估模型处理单元;
情感分析单元,用于对订单的间接影响因素参数进行分词及情感分析,得到订单的间接影响因素参数的情感值,发送给预估模型处理单元;
预估模型处理单元,用于接收订单的直接影响因素参数及订单的间接影响因素参数的情感值,输入到预测模型中,所述预测模型由BP神经网络及GBDT神经网络结合构建;通过所述预测模型中的BP神经网络及GBDT神经网络进行预估处理,分别输出第一订单预估数量值及第二订单预估数量值,通过所述预测模型的合并处理,得到订单预估数据值。
7.如权利要求6所述的系统,其特征在于,所述订单的直接影响因素参数包括订单的用户行为相关因素、订单的商家行为相关因素及订单的交易行为相关因素;订单的间接影响因素为订单包括的货品或服务的评价信息;
所述订单的用户行为相关因素包括货品或服务的浏览量、货品或服务的加购量、以及货品或服务的收藏量中的一种或多种组合;所述订单的商家行为相关因素包括货品或服务的单价信息、以及货品或服务的折扣力度信息中的一种或多种组合;所述订单的交易行为相关因素包括货品或服务的销售量,或/和,货品或服务的销售额信息。
8.如权利要求6所述的系统,其特征在于,所述情感分析单元,还用于采用设置的分词数据库,对订单的间接影响因素参数进行分词,得到订单的情感词典;基于订单的情感词典进行计算,得到订单的情感词典中的各个情感词的情感值;计算订单的情感词典中的各个情感词的情感值的平均值,得到订单的间接影响因素参数的情感值;
所述预估模型处理单元,还用于通过所述预测模型中的采用迭代算法的BP神经网络输出第一订单预估数量值;
所述预估模型处理单元,还用于采用沙普利shapley算法,为第一订单预估数量值及第二订单预估数据值分别确定对应的权重后,根据所对应的权重进行合并,得到订单预估数据值。
9.一种订单数量的预估装置,其特征在于,包括:
存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1~5任一所述的订单数量的预估方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1~5任一所述的订单数量的预估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110771812.6A CN113393279A (zh) | 2021-07-08 | 2021-07-08 | 一种订单数量的预估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110771812.6A CN113393279A (zh) | 2021-07-08 | 2021-07-08 | 一种订单数量的预估方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113393279A true CN113393279A (zh) | 2021-09-14 |
Family
ID=77625490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110771812.6A Pending CN113393279A (zh) | 2021-07-08 | 2021-07-08 | 一种订单数量的预估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113393279A (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0660090A (ja) * | 1992-08-11 | 1994-03-04 | Nec Corp | 商品発注数量決定方式 |
CN106951514A (zh) * | 2017-03-17 | 2017-07-14 | 合肥工业大学 | 一种考虑品牌情感的汽车销量预测方法 |
US20180053107A1 (en) * | 2016-08-19 | 2018-02-22 | Sap Se | Aspect-based sentiment analysis |
CN108230049A (zh) * | 2018-02-09 | 2018-06-29 | 新智数字科技有限公司 | 订单的预测方法及系统 |
CN108320171A (zh) * | 2017-01-17 | 2018-07-24 | 北京京东尚科信息技术有限公司 | 热销商品预测方法、系统及装置 |
CN108563647A (zh) * | 2017-11-29 | 2018-09-21 | 重庆邮电大学 | 一种基于评论情感分析的汽车销量预测方法 |
CN109509030A (zh) * | 2018-11-15 | 2019-03-22 | 北京旷视科技有限公司 | 销量预测方法及其模型的训练方法、装置和电子系统 |
CN109871858A (zh) * | 2017-12-05 | 2019-06-11 | 北京京东尚科信息技术有限公司 | 预测模型建立、对象推荐方法及系统、设备及存储介质 |
CN110009432A (zh) * | 2019-04-15 | 2019-07-12 | 武汉理工大学 | 一种个人消费行为预测方法 |
CN110955695A (zh) * | 2019-09-16 | 2020-04-03 | 北京三快在线科技有限公司 | 一种数据处理方法及装置 |
KR20200039852A (ko) * | 2018-09-28 | 2020-04-17 | 주식회사 알스피릿 | 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법 |
CN111027895A (zh) * | 2019-05-16 | 2020-04-17 | 珠海随变科技有限公司 | 商品的备料预测、行为数据收集方法、装置、设备和介质 |
CN111242679A (zh) * | 2020-01-08 | 2020-06-05 | 北京工业大学 | 一种基于产品评论观点挖掘的销量预测方法 |
CN111292106A (zh) * | 2018-12-06 | 2020-06-16 | 北京嘀嘀无限科技发展有限公司 | 一种业务需求影响因素确定方法以及装置 |
CN112487199A (zh) * | 2020-11-24 | 2021-03-12 | 杭州电子科技大学 | 一种基于用户购买行为的用户特征预测方法 |
CN112861541A (zh) * | 2020-12-15 | 2021-05-28 | 哈尔滨工程大学 | 一种基于多特征融合的商品评论情感分析方法 |
-
2021
- 2021-07-08 CN CN202110771812.6A patent/CN113393279A/zh active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0660090A (ja) * | 1992-08-11 | 1994-03-04 | Nec Corp | 商品発注数量決定方式 |
US20180053107A1 (en) * | 2016-08-19 | 2018-02-22 | Sap Se | Aspect-based sentiment analysis |
CN108320171A (zh) * | 2017-01-17 | 2018-07-24 | 北京京东尚科信息技术有限公司 | 热销商品预测方法、系统及装置 |
CN106951514A (zh) * | 2017-03-17 | 2017-07-14 | 合肥工业大学 | 一种考虑品牌情感的汽车销量预测方法 |
CN108563647A (zh) * | 2017-11-29 | 2018-09-21 | 重庆邮电大学 | 一种基于评论情感分析的汽车销量预测方法 |
CN109871858A (zh) * | 2017-12-05 | 2019-06-11 | 北京京东尚科信息技术有限公司 | 预测模型建立、对象推荐方法及系统、设备及存储介质 |
CN108230049A (zh) * | 2018-02-09 | 2018-06-29 | 新智数字科技有限公司 | 订单的预测方法及系统 |
KR20200039852A (ko) * | 2018-09-28 | 2020-04-17 | 주식회사 알스피릿 | 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법 |
CN109509030A (zh) * | 2018-11-15 | 2019-03-22 | 北京旷视科技有限公司 | 销量预测方法及其模型的训练方法、装置和电子系统 |
CN111292106A (zh) * | 2018-12-06 | 2020-06-16 | 北京嘀嘀无限科技发展有限公司 | 一种业务需求影响因素确定方法以及装置 |
CN110009432A (zh) * | 2019-04-15 | 2019-07-12 | 武汉理工大学 | 一种个人消费行为预测方法 |
CN111027895A (zh) * | 2019-05-16 | 2020-04-17 | 珠海随变科技有限公司 | 商品的备料预测、行为数据收集方法、装置、设备和介质 |
CN110955695A (zh) * | 2019-09-16 | 2020-04-03 | 北京三快在线科技有限公司 | 一种数据处理方法及装置 |
CN111242679A (zh) * | 2020-01-08 | 2020-06-05 | 北京工业大学 | 一种基于产品评论观点挖掘的销量预测方法 |
CN112487199A (zh) * | 2020-11-24 | 2021-03-12 | 杭州电子科技大学 | 一种基于用户购买行为的用户特征预测方法 |
CN112861541A (zh) * | 2020-12-15 | 2021-05-28 | 哈尔滨工程大学 | 一种基于多特征融合的商品评论情感分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Doumpos et al. | Corporate failure prediction in the European energy sector: A multicriteria approach and the effect of country characteristics | |
CN106095942B (zh) | 强变量提取方法及装置 | |
CN107220217A (zh) | 基于逻辑回归的特征系数训练方法和装置 | |
CN110348977A (zh) | 基于多层模型结构的金融风险分析方法、装置及电子设备 | |
CN111738331A (zh) | 用户分类方法及装置、计算机可读存储介质、电子设备 | |
CN106408325A (zh) | 基于用户支付信息的用户消费行为预测分析方法及系统 | |
Mathews | Innovation portfolio architecture—Part 2: Attribute selection and valuation | |
CN111260142B (zh) | 商品指标数据预测方法、装置、存储介质及电子设备 | |
Lin et al. | Omnichannel facility location and fulfillment optimization | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN114493208A (zh) | 工程项目全寿命周期的评价方法、装置、电子设备及介质 | |
JP5084968B1 (ja) | 市場リスク予測装置、市場リスク予測方法及び市場リスク予測プログラム | |
CN110544118A (zh) | 销量预测方法、装置、介质和计算设备 | |
CN113421014A (zh) | 一种目标企业确定方法、装置、设备和存储介质 | |
US20210357699A1 (en) | Data quality assessment for data analytics | |
CN117132315A (zh) | 活跃用户预测方法、装置、设备及存储介质 | |
CN113393279A (zh) | 一种订单数量的预估方法及系统 | |
CN115062687A (zh) | 企业信用监控方法、装置、设备及存储介质 | |
CN112328899A (zh) | 信息处理方法、信息处理装置、存储介质与电子设备 | |
CN112950392A (zh) | 信息展示方法、后验信息确定方法及装置及相关设备 | |
CN115619427B (zh) | 目标对象质量评估方法及装置、存储介质、电子设备 | |
Borissova et al. | Selection of ERP via cost-benefit analysis under uncertainty conditions | |
Tantawy et al. | Applying Big Data Analytics to Retail for Improved Supply Chain Visibility | |
JP2014006863A (ja) | 市場リスク予測装置、ヘッジ数量算出方法及びヘッジ数量算出プログラム | |
CN115221421A (zh) | 数据处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |