CN108876458A - 一种基于网络爬虫的商品动态预测方法及系统 - Google Patents

一种基于网络爬虫的商品动态预测方法及系统 Download PDF

Info

Publication number
CN108876458A
CN108876458A CN201810628771.3A CN201810628771A CN108876458A CN 108876458 A CN108876458 A CN 108876458A CN 201810628771 A CN201810628771 A CN 201810628771A CN 108876458 A CN108876458 A CN 108876458A
Authority
CN
China
Prior art keywords
data
model
prediction
web crawlers
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810628771.3A
Other languages
English (en)
Inventor
周鑫
施险峰
褚金
褚金一
莫婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei State Grid Huazhong Science And Technology Development Co Ltd
Original Assignee
Hubei State Grid Huazhong Science And Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei State Grid Huazhong Science And Technology Development Co Ltd filed Critical Hubei State Grid Huazhong Science And Technology Development Co Ltd
Priority to CN201810628771.3A priority Critical patent/CN108876458A/zh
Publication of CN108876458A publication Critical patent/CN108876458A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于网络爬虫的商品动态预测方法及系统,通过“数据爬取→清洗→处理→查询→建模→可视化呈现”完整的网络数据分析的方法,用户可以根据特定业务场景自定义分析操作流程,实现工作效率的最大化,利用各种针对性的反爬技术爬取多个网站的数据,支持后端word数据自动获取等,并提供多种统计学方法进行数据清洗、归一化、平滑处理等方法,然后结合实际的业务场景进行建模与分析,最终以多种可视化图表展现,提升了数据质量,辅助用户进行决策。

Description

一种基于网络爬虫的商品动态预测方法及系统
技术领域
本发明涉及网络信息处理技术领域,具体的说是一种基于网络爬虫的商品动态预测方法及系统。
背景技术
在从网络上海量商品信息数据源中获取信息的系统中,绝大部分是为了提升查询与检索效率,例如在同时运行多个针对不同站点的爬虫以同时爬取大量信息时,由于各个数据源各自的特点,往往会形成各自的更新模式,通过对各爬虫间需要的带宽进行动态地进行预测,作为动态带宽分配的依据。即市面上的网络爬虫系统均是针对提升爬取效率或检索效率的技术研究,缺少基于数据的统计处理、呈现以及对数据深层价值的挖掘。以上爬取技术缺乏业务场景的依托,对实际工作上的提升效果较小,不利于推广。事实上,随着网络爬虫技术的普及,越来越多的网站基于数据资产的保护会制定各种反爬策略,致使爬取失败甚至ip被封,同时网站数据格式不一,存储方式不限于文字、表格等形式,会有pdf、word等文件的形式存储,而且对于某些网站数据更新时间较为频繁,数据量级高达千万级,对整个数据检索影响极大。
基于此,针对上述现状中存在的局限性,本发明提出了一种实现工作效率的最大化的基于网络爬虫的商品动态预测方法及系统。
发明内容
为了解决上述现有技术中存在的问题,本发明提供一种实现工作效率的最大化的基于网络爬虫的商品动态预测方法及系统。
本发明解决其技术问题所采用的技术方案是:
一种基于网络爬虫的商品动态预测方法,包括以下步骤:
S1、对目标网站的关键字段或文件进行爬取;
S2、对爬取的数据进行处理,得到结构化的数据后存储;
S3、对数据进行时间序列分析,得到特定字段与时间段关系的预测模型;
S4、通过预测模型,根据不同的数据查询,得到需要的预测结果。
进一步地,所述步骤S1还包括需要对所有待爬取的目标网站所需的关键字段确认和整合,统一展示信息表。
进一步地,所述步骤S1还包括需要对目标网站的文件下载后进行后台自动打开解析,获取相应的数据。
进一步地,所述步骤S2中对爬取的数据进行处理的步骤具体包括:
对爬取数据的关键字段缺失记录进行剔除;
对爬取数据的计量单位进行统一;
对仅更新时间变化的数据记录进行去重。
进一步地,所述步骤S3具体为:
S301、将选定品类的数据按照月份划分,然后进行时间序列建模,通过统计学方法进行拟合测试,搭建预测模型;
S302、采用部分历史数据,计算以月为单位的预测模型预测到的数据与实际历史数据的误差,选取误差最小的模型作为最终预测模型;
S303、将时间代入到预测模型中计算,得到预测的数据。
更进一步地,所述统计学方法为线性自回归方法和一阶指数平滑方法,使用ARMA模型进行计算。
进一步地,所述步骤S4中还包括根据关键字段设定多种筛选条件组合,同时保留用户历史查询条件。
一种基于网络爬虫的商品动态预测系统,包括:
数据采集模块,用于通过爬虫程序实时或定时爬取各目标网站的发布信息;
数据处理模块,用于对数据采集模块中爬取的数据进行清洗,统一存储格式;
模型配置模块,用于对数据处理模块处理后的数据进行时间序列分析,得到网站发布信息量与时间段关系的预测模型;以及
前端,用于给用户提供对应场景的服务界面并通过服务界面展示预测结果与查询结果。
进一步地,所述模型配置模块中得到预测模型的具体方法为:
将选定品类的数据按照月份划分,然后进行时间序列建模,通过统计学方法进行拟合测试,搭建预测模型;
采用部分历史数据,计算以月为单位的预测模型预测到的数据与实际历史数据的误差,选取误差最小的模型作为最终预测模型;
将时间代入到预测模型中计算,得到预测的数据。
更进一步地,所述统计学方法为线性自回归方法和一阶指数平滑方法,使用ARMA模型进行计算。
与现有技术相比,本发明的有益效果是:本发明提供一套从“数据爬取→清洗→处理→查询→建模→可视化呈现”完整的网络数据分析的方法,用户可以根据特定业务场景自定义分析操作流程,实现工作效率的最大化,利用各种针对性的反爬技术爬取多个网站的数据,支持后端word数据自动获取等,并提供多种统计学方法进行数据清洗、归一化、平滑处理等方法,然后结合实际的业务场景进行建模与分析,最终以多种可视化图表展现,提升了数据质量,辅助用户进行决策。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1为本发明的流程图;
图2为本发明第一个实施例中全国P.O 42.5袋装水泥均价P-QG示意图;
图3为图2按照趋势项TC分解得到的示意图;
图4为图2按照季节项SF分解得到的示意图;
图5为图2按照不可控影响因素IR分解得到的示意图;
图6为本发明第一个实施例中模型可靠性验证的示意图;
图7为本发明第二个实施例中广东P.O 42.5袋装水泥均价P-QG示意图;
图8为图7按照趋势项TC分解得到的示意图;
图9为图7按照季节项SF分解得到的示意图;
图10为图7按照不可控影响因素IR分解得到的示意图;
图11为本发明第二个实施例中模型可靠性验证的示意图;
图12为本发明第三个实施例中原始序列折线图;
图13为本发明第三个实施例中差分序列折线图;
图14为本发明第三个实施例中模型可靠性验证的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明所述的一种基于网络爬虫的商品动态预测方法,包括以下步骤:
S1、对目标网站的关键字段或文件进行爬取;
S2、对爬取的数据进行处理,得到结构化的数据后存储;
S3、对数据进行时间序列分析,得到特定字段与时间段关系的预测模型;
S4、通过预测模型,根据不同的数据查询,得到需要的预测结果。
具体实施时,所述步骤S1还包括需要对所有待爬取的目标网站所需的关键字段确认和整合,统一展示信息表。
具体实施时,所述步骤S1还包括需要对目标网站的文件下载后进行后台自动打开解析,获取相应的数据。
具体实施时,所述步骤S2中对爬取的数据进行处理的步骤具体包括:
对爬取数据的关键字段缺失记录进行剔除;
对爬取数据的计量单位进行统一;
对仅更新时间变化的数据记录进行去重。
在上述技术方案中,能够避免过多的冗余数据影响数据检索效率。
具体实施时,所述步骤S3具体为:
S301、将选定品类的数据按照月份划分,然后进行时间序列建模,通过统计学方法进行拟合测试,搭建预测模型;
S302、采用部分历史数据,计算以月为单位的预测模型预测到的数据与实际历史数据的误差,选取误差最小的模型作为最终预测模型;
S303、将时间代入到预测模型中计算,得到预测的数据。
具体实施时,所述统计学方法为线性自回归方法和一阶指数平滑方法,使用ARMA模型进行计算。
具体实施时,所述步骤S4中还包括根据关键字段设定多种筛选条件组合,同时保留用户历史查询条件。
一种基于网络爬虫的商品动态预测系统,包括:
数据采集模块,用于通过爬虫程序实时或定时爬取各目标网站的发布信息;
数据处理模块,用于对数据采集模块中爬取的数据进行清洗,统一存储格式;
模型配置模块,用于对数据处理模块处理后的数据进行时间序列分析,得到网站发布信息量与时间段关系的预测模型;以及
前端,用于给用户提供对应场景的服务界面并通过服务界面展示预测结果与查询结果。
具体实施时,所述模型配置模块中得到预测模型的具体方法为:
将选定品类的数据按照月份划分,然后进行时间序列建模,通过统计学方法进行拟合测试,搭建预测模型;
采用部分历史数据,计算以月为单位的预测模型预测到的数据与实际历史数据的误差,选取误差最小的模型作为最终预测模型;
将时间代入到预测模型中计算,得到预测的数据。
具体实施时,所述统计学方法为线性自回归方法和一阶指数平滑方法,使用ARMA模型进行计算。
本发明建模原理利用了季节调整概念,具体为:
经济指标的月度或季度时间序列包含4种变动要素:长期趋势要素T、循环要素C、季节变动要素S和不规则要素I。
长期趋势要素(T):代表经济时间序列长期的趋势特性。
循环要素(C):是以数年为周期的一种周期性变动。
季节要素(S):是每年重复出现的循环变动,以12个月或4个季度为周期的周期性影响,由温度、降雨、每年中的假期和政策等因素引起。季节要素和循环要素的区别在于季节变动是固定间距(如季或月)中的自我循环,而循环要素是从一个周期变动到另一个周期,间距比较长且不固定的一种周期性波动。
不规则要素(I):又称随机因子、残余变动或噪声,其变动无规则可循,这类因素是由偶然发生的事件引起的,如罢工、意外事故、地震、水灾、恶劣气候、战争、法令更改和预测误差等。
所谓的“季节调整”,就是从时间序列中估计和剔除季节影响的过程,目的是更好地揭示季度或月度序列的特征或基本趋势。
AR模型:AR模型也称为自回归模型。它的预测方式是通过过去的观测值和现在的干扰值的线性组合预测,自回归模型的数学公式为:
yt=φ1yt-12yt-2+…+φpyt-pt
式中:p为自回归模型的阶数φi(i=1,2,…,p)为模型的待定系数,εt为误差,yt为一个平稳时间序列。
MA模型:MA模型也称为滑动平均模型。它的预测方式是通过过去的干扰值和现在的干扰值的线性组合预测,滑动平均模型的数学公式为:
yt=εt1εt-12εt-2-…-θqεt-q
式中:q为模型的阶数;θj(j=1,2,…,q)为模型的待定系数;εt为误差;yt为平稳时间序列。
ARMA模型:自回归模型和滑动平均模型的组合,便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA,数学公式为:
yt=φ1yt-12yt-2+…+φpyt-pt1εt-12εt-2-…-θqεt-q
作为本发明的第一个实施例:
按月预测P.O 42.5袋装水泥全国平均价格,以2013年6月-2017年12月全国各地区P.O 42.5袋装水泥均价作为历史数据(其中2013m06-2017m12为训练样本,2018m012018m03为测试样本),通过Eviews软件进行ARMA模型构建与求解,实现月度价格预测,参见表1-1。
表1-1全国P.O 42.5袋装水泥均价(元/吨)
年份 2013年 2014年 2015年 2016年 2017年 2018年
1月 364.60 344.68 271.54 349.32 452.29
2月 357.94 344.71 264.34 346.29 441.67
3月 356.62 341.83 263.35 348.45 431.52
4月 357.54 339.80 270.15 354.47
5月 356.91 332.70 274.64 358.30
6月 376.43 354.30 320.55 274.50 354.83
7月 372.71 346.81 300.68 270.63 349.79
8月 369.97 344.27 291.90 280.64 349.94
9月 360.21 344.60 286.55 295.58 362.28
10月 358.58 347.59 286.69 322.33 372.73
11月 367.35 346.33 286.27 342.87 395.28
12月 369.51 346.72 279.72 348.08 443.17
步骤一、按时间序列分解
通过季节调整将P_QG分解为趋势项TC、季节项SF和不规则要素IR,得到P_QG=P_QG_TC+P_QG_SF+P_QG_IR。其中TC为价格趋势变化、SF为季节周期性波动,IR为不可控影响因素,如图2至图5所示。
步骤二、模型求解
(1)对于TC,采用ARMA模型,通过建模求解得到:
TC表达式:TC=1.976*TC(-1)-0.975*TC(-2)+0.968*εt-1,如表1-2所示。
表1-2
(2)对于SF,得到每年的季节固定波动,如表1-3所示。
表1-3
月份 SF
1月 12.23
2月 6.56
3月 2.09
4月 3.78
5月 3.07
6月 -3.59
7月 -14.85
8月 -16.61
9月 -11.93
10月 -2.10
11月 7.04
12月 14.26
(3)对于IR,不可控因素无法纳入模型进行量化计算。
步骤三、模型检验与预测
通过上述过程可得最终价格预测表达式为:
Pt表达式:Pt=1.976*TC(-1)-0.975*TC(-2)+0.968*εt-1+SF;
(1)模型可靠性验证
计算得出通过模型预测的平均相对误差为0.44%,模型可靠性较好,如图6所示,Actual为实际值,Fitted为拟合值,Residual为残余值,表1-4表示模型误差。
表1-4模型误差
(2)价格预测
预测未来3个月P.O 42.5全国各地袋装水泥平均价格,通过
Pt表达式:Pt=1.976*TC(-1)-0.975*TC(-2)+0.968*εt-1+SF,
进行预测得到:
P2018-1=1.976*416.40-0.975*401.21+0.968*(-1.037)+12.23=442.86(元/吨),
比实际价格452.29低9.42元/吨,相对偏差率为2.08%,
P2018-2=1.976*427.36-0.975*416.40+0.968*(-3.27)+6.56=441.86(元/吨),
比实际价格441.67高0.19元/吨,相对偏差率为0.04%。
P2018-3=1.976*431.91-0.975*427.36+0.968*(-3.39)+2.09=435.60(元/吨),
比实际价格431.52高4.08元/吨,相对偏差率为0.95%。
作为本发明第二个实施例:
按月预测P.O 42.5袋装水泥广东平均价格,同样以2013年6月-2017年12月广东各地区P.O 42.5袋装水泥均价作为历史数据(其中2013m06-2017m12为训练样本,2018m012018m03为测试样本),通过Eviews软件进行ARMA模型构建与求解,实现月度价格预测,如表2-1所示。
表2-1广东P.O 42.5袋装水泥均价(元/吨)
步骤一、时间序列分解
跟实施例一一样,得到如图6至图9所示的曲线。
步骤二、模型求解
(1)对于TC,采用ARMA模型,通过建模求解得到:
TC表达式:TC=1.937*TC(-1)-0.937*TC(-2)+0.955*εt-1,如表2-2所示,表2-2模型结果
(2)对于SF,得到每年的季节固定波动,如表2-3所示:
表2-3广东P.O 42.5袋装水泥均价季节固定波动(元/吨)
(3)对于IR,不可控因素无法纳入模型进行量化计算。
步骤三、模型检验与预测
通过上述过程可得最终价格预测表达式为:
Pt表达式:Pt=1.937*TC(-1)-0.937*TC(-2)+0.955*εt-1+SF;
(1)模型可靠性验证
计算得出通过模型预测的平均相对误差为0.99%,模型可靠性较好,如图11和表2-4所示。
表2-4模型误差
(2)价格预测
预测未来3个月广东地区P.O 42.5袋装水泥平均价格,通过
Pt=1.937*TC(-1)-0.937*TC(-2)+0.955*εt-1+SF,进行预测得到:
P2018-1=1.937*401.34-0.937*385.52+0.955*3.80+9.99=429.72(元/吨),
比实际价格455.40低25.68元/吨,相对偏差率为5.64%,
P2018-1=1.937*419.82-0.937*401.34+0.955*(-0.02)+6.52=443.29(元/吨),
比实际价格457.78低14.49元/吨,相对偏差率为3.17%。
P2018-3=1.937*435.78-0.937*419.82+0.955*20.62+7.25=477.92(元/吨),
比实际价格457.65高20.26元/吨,相对偏差率为4.43%。
作为本发明第三个实施例:
按月预测袋装水泥价格,以2016年6月-2018年1月全国各地区P.C 32.5R袋装水泥均价作为历史数据,通过Eviews软件进行ARMA模型构建与求解,实现月度价格预测。
1、平稳性检验
如图11和图12所示,对原始序列P进行平稳性检验,序列不平稳,因此进行一阶差分得到序列DP,检验表明是平稳的。
2、模型设定
通过分别计算序列DP的自相关系数与偏相关系数,初步确定ARMA(p,q)的阶数,见表3-1。
表3-1ARMA(3,3)模型形式比较
可见,MA(3)模型预测的精度最高,因此选择MA(3)模型进行价格预测。
3、模型检验与预测
(1)模型求解
通过Eviews求得表达式为:
DP表达式:DP=2.8251-0.8905*εt-3
从而得到:
P表达式:Pt=Pt-1+2.8251-0.8905*εt-3
(2)计算模型误差
计算得出通过模型预测的平均相对误差为3.10%,模型预测效果较好,如图14和表3-2所示。
表3-2模型误差
(3)价格预测
MA(3)模型最多能预测未来3个月PC.32.5R袋装水泥价格,通过
Pt=Pt-1+2.8251-0.8905*εt-3
进行预测得到:
2018年2月份:P2018-2=P2018-1+2.8251-0.8905*ε2017-11
=361.75+2.8251-0.8905*(-2.22)=366.55(元/吨),
2018年3月份:P2018-3=P2018-2+2.8251-0.8905*ε2017-12
=366.55+2.8251-0.8905*18.83=352.61(元/吨),
2018年4月份:P2018-4=P2018-3+2.8251-0.8905*ε2018-1
=352.61+2.8251-0.8905*6.16=349.95(元/吨)。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (10)

1.一种基于网络爬虫的商品动态预测方法,其特征在于,包括以下步骤:
S1、对目标网站的关键字段或文件进行爬取;
S2、对爬取的数据进行处理,得到结构化的数据后存储;
S3、对数据进行时间序列分析,得到特定字段与时间段关系的预测模型;
S4、通过预测模型,根据不同的数据查询,得到需要的预测结果。
2.根据权利要求1所述的一种基于网络爬虫的商品动态预测方法,其特征在于:所述步骤S1还包括需要对所有待爬取的目标网站所需的关键字段确认和整合,统一展示信息表。
3.根据权利要求1所述的一种基于网络爬虫的商品动态预测方法,其特征在于:所述步骤S1还包括需要对目标网站的文件下载后进行后台自动打开解析,获取相应的数据。
4.根据权利要求1所述的一种基于网络爬虫的商品动态预测方法,其特征在于,所述步骤S2中对爬取的数据进行处理的步骤具体包括:
对爬取数据的关键字段缺失记录进行剔除;
对爬取数据的计量单位进行统一;
对仅更新时间变化的数据记录进行去重。
5.根据权利要求1所述的一种基于网络爬虫的商品动态预测方法,其特征在于,所述步骤S3具体为:
S301、将选定品类的数据按照月份划分,然后进行时间序列建模,通过统计学方法进行拟合测试,搭建预测模型;
S302、采用部分历史数据,计算以月为单位的预测模型预测到的数据与实际历史数据的误差,选取误差最小的模型作为最终预测模型;
S303、将时间代入到预测模型中计算,得到预测的数据。
6.根据权利要求5所述的一种基于网络爬虫的商品动态预测方法,其特征在于:所述统计学方法为线性自回归方法和一阶指数平滑方法,使用ARMA模型进行计算。
7.根据权利要求1所述的一种基于网络爬虫的商品动态预测方法,其特征在于:所述步骤S4中还包括根据关键字段设定多种筛选条件组合,同时保留用户历史查询条件。
8.一种基于网络爬虫的商品动态预测系统,其特征在于,包括:
数据采集模块,用于通过爬虫程序实时或定时爬取各目标网站的发布信息;
数据处理模块,用于对数据采集模块中爬取的数据进行清洗,统一存储格式;
模型配置模块,用于对数据处理模块处理后的数据进行时间序列分析,得到网站发布信息量与时间段关系的预测模型;以及
前端,用于给用户提供对应场景的服务界面并通过服务界面展示预测结果与查询结果。
9.根据权利要求8所述的一种基于网络爬虫的商品动态预测系统,其特征在于,所述模型配置模块中得到预测模型的具体方法为:
将选定品类的数据按照月份划分,然后进行时间序列建模,通过统计学方法进行拟合测试,搭建预测模型;
采用部分历史数据,计算以月为单位的预测模型预测到的数据与实际历史数据的误差,选取误差最小的模型作为最终预测模型;
将时间代入到预测模型中计算,得到预测的数据。
10.根据权利要求9所述的一种基于网络爬虫的商品动态预测系统,其特征在于,所述统计学方法为线性自回归方法和一阶指数平滑方法,使用ARMA模型进行计算。
CN201810628771.3A 2018-06-19 2018-06-19 一种基于网络爬虫的商品动态预测方法及系统 Pending CN108876458A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810628771.3A CN108876458A (zh) 2018-06-19 2018-06-19 一种基于网络爬虫的商品动态预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810628771.3A CN108876458A (zh) 2018-06-19 2018-06-19 一种基于网络爬虫的商品动态预测方法及系统

Publications (1)

Publication Number Publication Date
CN108876458A true CN108876458A (zh) 2018-11-23

Family

ID=64339715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810628771.3A Pending CN108876458A (zh) 2018-06-19 2018-06-19 一种基于网络爬虫的商品动态预测方法及系统

Country Status (1)

Country Link
CN (1) CN108876458A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619440A (zh) * 2019-09-23 2019-12-27 东莞市大易产业链服务有限公司 价格预测模型的处理方法、装置、计算机和存储介质
CN110929127A (zh) * 2019-12-05 2020-03-27 广州市原象信息科技有限公司 一种淘宝直播投放效果分析的方法及计算机设备
CN110968272A (zh) * 2019-12-16 2020-04-07 华中科技大学 基于时间序列预测的海量小文件存储性能优化方法及系统
CN111382890A (zh) * 2018-12-27 2020-07-07 珠海格力电器股份有限公司 一种家电安装量预测方法、系统及存储介质
WO2022126977A1 (zh) * 2020-12-16 2022-06-23 平安科技(深圳)有限公司 业务数据的预测方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914743A (zh) * 2014-04-21 2014-07-09 中国科学技术大学先进技术研究院 一种基于自回归模型的在线连载内容流行度预测方法
CN105956699A (zh) * 2016-04-29 2016-09-21 连云港天马网络发展有限公司 基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法
CN106202383A (zh) * 2016-07-08 2016-12-07 武汉烽火普天信息技术有限公司 一种应用于网络爬虫的网络带宽占比动态预测方法与系统
CN107767659A (zh) * 2017-10-13 2018-03-06 东南大学 基于arima模型的共享单车吸引量和发生量预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914743A (zh) * 2014-04-21 2014-07-09 中国科学技术大学先进技术研究院 一种基于自回归模型的在线连载内容流行度预测方法
CN105956699A (zh) * 2016-04-29 2016-09-21 连云港天马网络发展有限公司 基于电商销售数据的商品分类提取及在该分类提取下的销量预测方法
CN106202383A (zh) * 2016-07-08 2016-12-07 武汉烽火普天信息技术有限公司 一种应用于网络爬虫的网络带宽占比动态预测方法与系统
CN107767659A (zh) * 2017-10-13 2018-03-06 东南大学 基于arima模型的共享单车吸引量和发生量预测方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382890A (zh) * 2018-12-27 2020-07-07 珠海格力电器股份有限公司 一种家电安装量预测方法、系统及存储介质
CN111382890B (zh) * 2018-12-27 2022-04-12 珠海格力电器股份有限公司 一种家电安装量预测方法、系统及存储介质
CN110619440A (zh) * 2019-09-23 2019-12-27 东莞市大易产业链服务有限公司 价格预测模型的处理方法、装置、计算机和存储介质
CN110929127A (zh) * 2019-12-05 2020-03-27 广州市原象信息科技有限公司 一种淘宝直播投放效果分析的方法及计算机设备
CN110968272A (zh) * 2019-12-16 2020-04-07 华中科技大学 基于时间序列预测的海量小文件存储性能优化方法及系统
WO2022126977A1 (zh) * 2020-12-16 2022-06-23 平安科技(深圳)有限公司 业务数据的预测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108876458A (zh) 一种基于网络爬虫的商品动态预测方法及系统
Feizizadeh et al. Spatially explicit sensitivity and uncertainty analysis for multicriteria-based vulnerability assessment
Barua et al. Artificial neural network–based drought forecasting using a nonlinear aggregated drought index
Levner et al. Entropy-based model for the ripple effect: managing environmental risks in supply chains
Garzón et al. Machine learning‐based surrogate modeling for urban water networks: review and future research directions
US9600773B2 (en) Detecting electricity theft via meter tampering using statistical methods
US11790383B2 (en) System and method for selecting promotional products for retail
CN104090919A (zh) 推荐广告的方法及广告推荐服务器
Wang et al. Predicting ENR construction cost index using machine-learning algorithms
CN107016571A (zh) 数据预测方法及其系统
CN106529869A (zh) 一种物资库存物料动态特征分析平台及其分析方法
Tsang et al. Gaussian processes for daily demand prediction in tourism planning
Li et al. Sensitivity analysis of TOPSIS method in water quality assessment II: Sensitivity to the index input data
Bayzid et al. Prediction of maintenance cost for road construction equipment: A case study
Barcaroli et al. Use of web scraping and text mining techniques in the istat survey on information and communication technology in enterprises
Gosain et al. Validating dimension hierarchy metrics for the understandability of multidimensional models for data warehouse
Wu et al. Similarity measure models and algorithms for hierarchical cases
CN107590747A (zh) 基于综合能源大数据分析的电网资产周转率计算方法
Shabbir et al. A novel hybrid method for river discharge prediction
Guo et al. Groundwater depth forecasting using configurational entropy spectral analyses with the optimal input
US12008497B2 (en) Demand sensing and forecasting
CN117171145B (zh) 一种企业管理系统数据的分析处理方法、设备及存储介质
Mathumitha et al. Intelligent deep learning techniques for energy consumption forecasting in smart buildings: a review
CN107424026A (zh) 商家信誉评价方法和装置
Li et al. A greyness reduction framework for prediction of grey heterogeneous data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181123