CN109697522A - 一种数据预测的方法和装置 - Google Patents

一种数据预测的方法和装置 Download PDF

Info

Publication number
CN109697522A
CN109697522A CN201710982948.5A CN201710982948A CN109697522A CN 109697522 A CN109697522 A CN 109697522A CN 201710982948 A CN201710982948 A CN 201710982948A CN 109697522 A CN109697522 A CN 109697522A
Authority
CN
China
Prior art keywords
data
date
predicted
prediction
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710982948.5A
Other languages
English (en)
Other versions
CN109697522B (zh
Inventor
李晨
张宁
刘业辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201710982948.5A priority Critical patent/CN109697522B/zh
Publication of CN109697522A publication Critical patent/CN109697522A/zh
Application granted granted Critical
Publication of CN109697522B publication Critical patent/CN109697522B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据预测的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取样本集;其中,样本集包括第一数据和第二数据,第一数据为在待预测日期所属年份待预测日期之前的第一预设时间段的数据,第二数据为在历史年份同比待预测日期之前的第二预设时间段的数据;获取预设的参数值,根据参数值对样本集中的第一数据以及第二数据进行训练测试,确定样本集的预测模型;至少获取位于待预测日期之前且与待预测日期相邻最近日期的数据、历史年份中同比待预测日期的数据,根据预测模型,对待预测日期进行数据预测,确定待预测日期的预测数据。该实施方式依赖历史同比发展规律进行数据预测,提高了数据预测的质量和准确性。

Description

一种数据预测的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据预测的方法和装置。
背景技术
对于企业,例如电商企业,如果能够精确把握市场的变化规律,不仅可以获取巨大利益,还可以规避投资风险。而且业务数据非常重要,直接影响着企业相关服务的正常运营。因此,数据预测一直以来都是一个企业所关注的问题。
现有技术对于数据的预测,主要通过采集待预测日期之前一定周期的历史数据,对预测模型进行训练测试,根据所得预测模型对待预测日期进行数据预测。之后,依靠人工对预测模型进行检查,若发现预测准确性变差则需重新训练。例如,预测某一时刻的销售量,往往会使用上一周期(如昨日、上周或上个月)同一时刻的销售量作为历史数据。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
(1)企业业务运营中,很多周期数据还受到了节假日、工作日等的影响,但现有技术的预测方法,仅简单将上一周期的数据作训练处理,导致待预测日期的数据预测准确性较差,异常监控效果不理想的情况。
(2)现有技术的预测监控仍停留在人工阶段,例如预测模型的监控维护、异常数据的分析,没有一套完整的自动化体系,因而对于企业,所投入的人力成本较大。
发明内容
有鉴于此,本发明实施例提供一种数据预测的方法和装置,至少能够解决现有技术中预测准确性低、人力成本消耗大的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种数据预测的方法,包括:获取样本集;其中,样本集包括第一数据和第二数据,第一数据为在待预测日期所属年份待预测日期之前的第一预设时间段的数据,第二数据为在历史年份同比待预测日期之前的第二预设时间段的数据;获取预设的参数值,根据参数值对样本集中的第一数据以及第二数据进行训练测试,确定样本集的预测模型;至少获取位于待预测日期之前且与待预测日期相邻最近日期的数据、历史年份中同比待预测日期的数据,根据预测模型,对待预测日期进行数据预测,确定待预测日期的预测数据。
可选地,获取预设的参数值,根据参数值对样本集中的第一数据以及第二数据进行训练测试,确定样本集的预测模型包括:将样本集分为训练集以及测试集;获取预设的参数值,根据参数值,对训练集进行训练,获取待测预测模型;根据测试集,对待测预测模型进行测试,计算测试到的数据与测试集的数据之间的测试误差值;当测试误差值小于或者等于预设误差值时,确定待测预测模型为样本集的预测模型。
可选地,确定待测预测模型为样本集的预测模型还包括:根据测试误差值,确定预测模型的预测标准差;在确定待预测日期的预测数据之后,还包括:根据预测标准差以及待预测日期的预测数据,确定待预测日期的置信区间;其中,置信区间为[预测数据-预设置信度×预测标准差,预测数据+预设置信度×预测标准差];获取待预测日期的实际数据,当判断到待预测日期的实际数据置于待预测日期的置信区间内时,添加待预测日期的实际数据至样本集,以更新样本集。
可选地,在获取待预测日期的实际数据之后,还包括:当判断到待预测日期的实际数据超出待预测日期的置信区间时,确定待预测日期的实际数据为异常数据;统计预定周期内异常数据的数量,当所统计到异常数据的数量超出预定阈值时,调整参数值,根据调整后的参数值对预测模型进行重新训练。
可选地,第一预设时间段与第二预设时间段的结束日期相同,且当第一预设时间段的时间跨度为N时,第二预设时间段的时间跨度为N或者N-1;其中,N≥2。
为实现上述目的,根据本发明实施例的一个方面,提供了一种数据预测的装置,包括:获取模块,用于获取样本集;其中,样本集包括第一数据和第二数据,第一数据为在待预测日期所属年份待预测日期之前的第一预设时间段的数据,第二数据为在历史年份同比所述待预测日期之前的第二预设时间段的数据;训练模块,用于获取预设的参数值,根据参数值对所述样本集中的第一数据以及第二数据进行训练测试,确定样本集的预测模型;预测模块,用于至少获取位于待预测日期之前且与待预测日期相邻最近日期的数据、历史年份中同比待预测日期的数据,根据预测模型,对待预测日期进行数据预测,确定待预测日期的预测数据。
可选地,训练模块,还用于将样本集分为训练集以及测试集;获取预设的所述参数值,根据参数值,对训练集进行训练,获取待测预测模型;根据测试集,对待测预测模型进行测试,计算测试到的数据与测试集的数据之间的测试误差值;当测试误差值小于或者等于预设误差值时,确定待测预测模型为样本集的预测模型。
可选地,训练模块,还用于根据测试误差值,确定预测模型的预测标准差;确定模块,用于根据预测标准差以及待预测日期的预测数据,确定待预测日期的置信区间;其中,置信区间为[预测数据-预设置信度×预测标准差,预测数据+预设置信度×预测标准差];获取待预测日期的实际数据,当判断到待预测日期的实际数据置于待预测日期的置信区间内时,添加待预测日期的实际数据至样本集,以更新样本集。
可选地,确定模块还用于当判断到待预测日期的实际数据超出待预测日期的置信区间时,确定待预测日期的实际数据为异常数据;统计预定周期内异常数据的数量,当所统计到异常数据的数量超出预定阈值时,调整参数值,根据调整后的参数值对预测模型进行重新训练。
可选地,第一预设时间段与第二预设时间段的结束日期相同,且当第一预设时间段的时间跨度为N时,第二预设时间段的时间跨度为N或者N-1;其中,N≥2。
为实现上述目的,根据本发明实施例的再一方面,提供了一种数据预测的电子设备。
本发明实施例的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一所述的数据预测的方法。
为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现上述任一所述的数据预测的方法。
上述发明中的一个实施例具有如下优点或有益效果:提供了一种数据预测的新思路,通过加入历史同比数据,在对待预测日进行数据预测时,可以同时结合历史同比数据的发展规律进行预测,提高了预测模型的预测周期,同时提高了数据预测的质量和准确性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的一种数据预测的方法的主要流程的示意图;
图2是图1所示方法中步骤S102的具体过程的流程的示意图;
图3是根据本发明实施例的一种可选的数据预测的方法的主要流程的示意图;
图4是根据本发明实施例的另一种可选的数据预测的方法的主要流程的示意图;
图5是根据本发明实施例的一种具体的数据预测的方法的主要流程的示意图;
图6是根据本发明实施例的一种数据预测的装置的主要模块的示意图;
图7是本发明实施例可以应用于其中的示例性系统架构图;
图8是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,本发明实施例可适应于多特征的时序预测,例如销售量、客流量、人口数量、产量、股票等的预测,本发明实施例以销售量为例进行说明。本发明实施例所提供的日期,可以是日、月、季度或者年,本发明实施例以日为例进行说明。
另外,本发明实施例所提供的同比,是指本期销售量与历史同期销售量的对比,具体地某年、某季、某月的销售量与历史年份同期销售量的对比,例如,2017年9月份销售量与2016年9月份销售量的对比,或者2017年9月份销售量与2014年9月份销售量、2015年9月份销售量以及2016年9月份销售量的对比。
参见图1,示出的是本发明实施例提供的一种数据预测的方法的主要流程图,包括如下步骤:
S101:获取样本集;其中,样本集包括第一数据和第二数据,第一数据为在待预测日期所属年份待预测日期之前的第一预设时间段的数据,第二数据为在历史年份同比待预测日期之前的第二预设时间段的数据。
S102:获取预设的参数值,根据参数值对样本集中的第一数据以及第二数据进行训练测试,确定样本集的预测模型。
S103:至少获取位于待预测日期之前且与待预测日期相邻最近日期的数据、历史年份中同比待预测日期的数据,根据预测模型,对待预测日期进行数据预测,确定待预测日期的预测数据。
上述实施方式中,对于步骤S101,有些日期的销售量除了受到该日之前销售量影响之外,可能还有日期的特殊影响,例如节假日、双休日等。另外,若历史年份中每年同期该日的销售量都会呈现增长趋势(例如,11月11日促销日),那么这样的周期性信息也应当是一个考虑因素,可以作为一个新特征考虑。另外,在对预测模型进行训练时,特征越多,所训练的预测模型拟合效果也越好。
即,对待预测日期销售量的预测,在考虑与待预测日期相邻最近的销售量的同时,也至少要考虑历史年份中同比待预测日期的销售量。例如,2017年11月11是促销日,近十年每年11月11日都是促销日,但在这一日之前一日或者乃至几日的销售量趋于平缓的,而在这一日销售量都是猛增的,因而若仅依据前一日或者前几日的销售量,对于促销日当日销售量的预测会与实际销售量存有较大差值。若考虑历史年份同期日期销售量,找出历史周期发展规律,可以在预测时结合该周期发展规律,以便提高预测准确性。
因而,对于样本集的选择,在考虑当年销售量的同时,也需要考虑历史同期销售量。该历史同期销售量,可以是过去一年也可以是几年的销售量,依据具体实际情况进行选择。具体参见表1,示出的是今年2017年9月1日~2017年9月10日的销售量(以万为单位),其中9月10日为待预测日期,其销售量待预测:
表1今年销售量
参见表2,示出的是历史同期的销售量(以万为单位),具体为同比日期2016年9月1日~2016年9月10日的销售量,其中,由于2017年9月10日为待预测日期,相应的2016年9月10日即为周期数据:
表2历史同期的销售量
所确定的样本集既包括今年待预测日期之前1~9日的销售量以及历史同期1~9日的销售量,具体地,参见表3,将各销售量按照今年当日销售量、历史同期销售量、历史下一日销售量以及今年下一日销售量进行分类:
表3样本集
此时,对于今年,选用的是1~9日的销售量,而对于历史同期,则选用的1~9日的销售量,即历史同期数据量与今年数据量相同(即同为N,N为日),且两者的结束日期相应。该对比可以分为四类:今年当日销售量——今年下一日销售量、今年下一日销售量——历史下一日销售量、历史下一日销售量——历史同期销售量、历史同期销售量——今年当日销售量。
另外,样本集的选择,除包括今年待预测日期之前的1~9日的销售量之外,还可以仅包括历史同期2~9日的销售量。具体地,参见表4,将各销售量按照今年当日销售量、历史下一日销售量以及今年下一日销售量进行分类:
表4样本集
此时,对于今年,选用的是1~9日的销售量,而对于历史同期销售量,仅选用的是2~9日的销售量,即历史同期数据量比今年数据量少一日(即N-1,N为日且N≥2),且两者的结束日期相应。该对比可以分为两类:今年当日销售量——今年下一日销售量、今年下一日销售量——历史下一日销售量。
进一步的,在获取样本集之前,还可以对所有销售量进行预处理,例如,对数函数平滑销售量,对于销售量数量较多的情况,可以提高拟合结果的准确性。该预处理方式也可以是标准化处理,或者仅剔除部分异常值值,本发明在此对该预处理方式不做限制。
对于步骤S102,对预测模型的训练方式可以预先设定,例如,可以是基于LSTM(Long Short-Term Memory,长短期记忆网络)方法进行训练。所选用的参数,可以是LSTM中的学习率、隐层数以及动量因子等,其中,学习率可以选择动态降低,当样本集中数据较少时隐层数不宜过多。这些参数可以预先设定,例如可以先按照其预设初始值对样本集进行训练,也可以是依据经验调整这些参数值,依据调整后的参数值对样本集进行训练,具体地,对样本集中的各销售量进行训练。
以表3为例,依据所预设的参数值对表3中的销售量进行训练、测试,得到可用于确定待预测日期销售量的预测模型,所得到的预测模型可以有具体表示,例如:待预测日期销售量=a×当日销售量+b×历史同期销售量+c×历史同期下一日销售量,其中a、b、c为训练得到的系数。
同样,以表4为例,依据所预设的参数值对表4中的销售量进行训练、测试,得到可用于确定待预测日期销售量的预测模型,所得到的预测模型同样可以有具体表示,例如:待预测日期销售量=d×当日销售量+e×历史同期下一日销售量,其中,d、e分别为训练得到的系数。
对于步骤S103,对于表3,对待预测日期销售量的预测,可以输入当日(例如,待预测日期前一日9月9日)销售量、历史同期(例如,2016年9月9日)销售量、历史同期待预测日期(例如,2016年9月10日)的销售量,至与表3相应的预测模型中进行数据预测,具体参见表5:
表5对待预测日期销售量的预测
同样,对于表4,对于待预测日期销售量的预测,可以获取当日销售量,历史同期下一日的销售量,输入至于与表4相应的预测模型进行数据预测,具体参见表6:
表6对待预测日期销售量的预测
由上可知,依据不同的样本集,测试得到的销售量之间仍存有差异,具体依据实际情况进行选择。
上述实施例所提供的方法,为待预测日期的数据预测提供了一种新思路,通过将历史同期数据作为一个新的特征,添加至样本集以确定预测模型,提高对历史周期性发展趋势的依赖性,具有极高实用性。因而对于待预测日期的数据预测,在结合上一周期数据的发展趋势的同时,还可以结合历史同期数据的周期发展趋势进行预测,提高了待预测日期数据的准确性以及可靠性。
参见图2,示出了图1所示方法中步骤S102的具体过程的流程的示意图,包括如下步骤:
S201:将样本集分为训练集以及测试集;其中,样本集包括第一数据以及第二数据。
S202:获取预设的参数值,根据参数值,对训练集进行训练,获取待测预测模型。
S203:根据测试集,对待测预测模型进行测试,计算测试到的数据与测试集的数据之间的测试误差值。
S204:当测试误差值小于或者等于预设误差值时,确定待测预测模型为样本集的预测模型。
上述实施方式中,对于步骤S201,可以按照预定比例将样本集分为训练集以及测试集,例如,80%样本集作为训练集、剩余20%样本集作为测试集。以表4为例,所获取的训练集以及测试集分别参见表7所示:
表7训练集以及测试集
训练集:
测试集:
对于步骤S202~S204,对于预测模型中的参数值,可以依据其初始值,根据LSTM方法对训练集进行训练,以构造待测预测模型。之后,输入测试集至该待测预测模型中进行测试评估。计算测试得到的预测销售量与原测试集的实际销售量之间的误差值,具体地,可以是:
误差值=(预测销售量—实际销售量)/预测销售量;
例如,依据测试集中当年9月7日的销售量,预测得到9月8日的销售量为10.6,则确定其误差值为0.9%。
依据测试集对待测预测模型进行测试,可以得到多个误差值,以此确定该模型的测试误差值(例如,平均误差值)。只有当测试误差值小于或者等于预定误差值时,才确定该待测预测模型为可用的预测模型;否则,则需按照一定步长调整参数值,对训练集进行重新训练,以重新确定预测模型。例如,测试误差值为23%,而预定误差值为20%,此时需要重新调整参数值,对训练集进行重新训练。
进一步的,若此次调整参数后,迭代结束也没有达到测试误差之不超过预定误差值的要求时则停止。之后重新调整参数值,对训练集进行重新训练,直至测试误差值达到要求,且不能过拟合时停止。
上述实施方式中,将历史同期数据作为一个新的特征添加至样本集中,在对训练集进行训练获取待测预测模型时,能够获取历史发展规律。便于在对待预测日期进行数据预测时,可以结合该历史发展规律进行预测,提高了预测数据的准确性。
参见图3,示出了根据本发明实施例的一种可选的数据预测的方法流程示意图,包括如下步骤:
S301:获取样本集;其中,样本集包括第一数据和第二数据,第一数据为在待预测日期所属年份待预测日期之前的第一预设时间段的数据,第二数据为在历史年份同比待预测日期之前的第二预设时间段的数据。
S302:获取预设的参数值,根据参数值对样本集中的第一数据以及第二数据进行训练测试,确定样本集的预测模型以及预测模型的预测标准差。
S303:至少获取位于待预测日期之前且与待预测日期相邻最近日期的数据、历史年份中同比待预测日期的数据,根据预测模型,对待预测日期进行数据预测,确定待预测日期的预测数据。
S304:根据预测标准差以及待预测日期的预测数据,确定待预测日期的置信区间;其中,置信区间为[预测数据-预设置信度×预测标准差,预测数据+预设置信度×预测标准差]。
S305:获取待预测日期的实际数据,当判断到待预测日期的实际数据置于待预测日期的置信区间内时,添加待预测日期的实际数据至样本集,以更新样本集。
上述实施方式中,对于步骤S301、S303可分别参见图1所示步骤S101、S103的描述,在此不再赘述。另外,对于步骤S302,确定预测模型的具体过程,可参见图1所示步骤S102以及图2所示步骤的描述,在此不再赘述。
上述实施方式中,对于步骤S302,对于所获取的预测模型,其预测不可能完全准确,因而可以设置相应的预测标准差。具体的,在依据测试集对预测模型进行测试,获取测试误差值之后,可以构建误差集,以确定预测模型的预测标准差,例如,该预测标准差为误差集的方差。
对于步骤S304,对于待预测日期的预测销售量以及实际销售量之间,可能存有一定的偏差,因而,可以构建一个属于该待预测日期的置信区间,用以对待预测日期的销售量进行监控。具体地,置信区间可表示为:
[预测销售量-预设置信度×标准差,预测销售量+预设置信度×标准差]。
对于所预设的置信度,与样本集的数据数量有关,当数量足够多时,误差值分布近似正态分布,置信水平取95%,置信度取值为1.96。例如,预测到预测日期2017年9月10日的预测销售量为12,预测标准差计算为0.2,则相应的置信区间为[11.608,12.392]。
对于步骤S305,对于所获取的待预测日期的实际销售量,例如,11.8,当该实际销售量位于该置信区间内时,则证明该预测模型可用,预测值合理,并将该日的实际销售量添加至样本集中,用以更新样本集,依据预测模型的参数值,对预测模型进行更新。根据重新确定的预测模型,对该日之后日期的销售量进行预测,实现训练的迭代更新,形成了完整的闭环。
上述实施例提供的方法,提供了一种对预测模型的监控方式,确定预测模型的预测标准差,结合预测模型对待预测日期的预测数据,构建待预测日期的置信区间,用以提高监控能力。另外,对于处于置信区间内的数据,可以添加至样本集中,用以实现预测模型的动态迭代,形成完整的闭环,同时降低企业对人力资源的成本投入。
参见图4,示出了根据本发明实施例的另一种可选的数据预测的方法流程示意图,包括如下步骤:
S401:获取样本集;其中,样本集包括第一数据和第二数据,第一数据为在待预测日期所属年份待预测日期之前的第一预设时间段的数据,第二数据为在历史年份同比待预测日期之前的第二预设时间段的数据。
S402:获取预设的参数值,根据参数值对样本集中的第一数据以及第二数据进行训练测试,确定样本集的预测模型以及预测模型的预测标准差。
S403:至少获取位于待预测日期之前且与待预测日期相邻最近日期的数据、历史年份中同比待预测日期的数据,根据预测模型,对待预测日期进行数据预测,确定待预测日期的预测数据。
S404:根据预测标准差以及待预测日期的预测数据,确定待预测日期的置信区间;其中,置信区间为[预测数据-预设置信度×预测标准差,预测数据+预设置信度×预测标准差]。
S405:获取待预测日期的实际数据,当判断到待预测日期的实际数据超出待预测日期的置信区间时,确定待预测日期的实际数据为异常数据。
S406:统计预定周期内异常数据的数量,当所统计到异常数据的数量超出预定阈值时,调整参数值,根据调整后的参数值对预测模型进行重新训练。
上述实施方式中,步骤S401、S403可分别参见图1所示步骤S101、S103的描述,步骤S402可参见图1所示步骤S102、图2以及图3所示步骤S302的描述,步骤S404可参见图3所示步骤S304的描述,在此不再赘述。
上述实施方式中,对于步骤S405,由于预测模型存有一定的预测偏差,因而对于待预测日期的销售量的监控,可能存在实际销售量超出相应置信区间的情况(例如,促销日当天实际销售量大于预测置信区间),此时可以首先确定该实际销售量为异常值。但对于该异常值,较难区分到是有价值的异常值,还是因为预测模型预测偏差所造成的,因而可以对该异常值产生的原因进行判断。
对于步骤S406,对于异常值,不可能每日都去研究异常值以及预测模型的准确性。对于这一情况,可以通过周期性统计异常值的占比进行分析,当异常值的数量在可解释的一定范围之内(例如,预定阈值为5个),说明这些异常值是有意义的,即基于某种原因的才出现的,并通过这些异常值去找到对应的日期内是否有过什么有益(实际销售量过高)或有害(实际销售量过低)的行为。
进一步的,有益的行为可以为企业之后的发展提出更合理的建设性意见。例如,促销活动日下单量猛增,超出预测水准,即表明这类促销活动是有意义的,即有效。
更进一步的,对于有害行为则应尽早规避和及时制定针对性的对策,例如,调整企业销售策略等。另外,还可以调整参数值重新训练样本集以预测模型,此时的样本集中可以包括所获取的待预测日期的实际销售量。
上述实施例所提供的方法,提供了另一种对预测模型的监控方式,通过捕获异常数据,并对异常数据是否有价值进行判断,进而提高异常监控效果。通过分析异常数据产生的原因,以此调整预测模型,在最大程度上减少预测模型带来的误差干扰,或者调整企业策略,为企业的发展提供了建议。
参见图5,示出的是本发明实施例的一个具体的数据预测的方法的流程示意图,包括如下步骤:
S501:获取样本集;其中,样本集包括第一数据和第二数据。
S502:提取80%样本集作为训练集。
S502’:提取剩余20%样本集作为测试集。
S503:获取预设的初始参数值,根据初始参数值,对训练集进行训练。
S504:构造训练后的待测预测模型。
S505:输入测试集对待测预测模型进行测试,计算测试结果与测试集数据之间的误差值。
S506:判断测试的误差值是否大于预定误差值。
S507:当确定所测试的误差值小于或者等于预定误差值时,确定该待测预测模型为可用的预测模型,同时根据测试的误差值计算预测模型的预测标准差。
S507’:当确定测试的误差值大于预定误差值时,对参数值从初始值开始按照一定步长进行调整,根据调整后的参数值,对训练集进行重新训练。
S508:至少获取当日数据以及历史同比第二日的历史数据,根据预测模型,确定第二日的预测数据。
S509:根据第二日的预测数据以及预测模型的预测标准差,确定第二日的置信区间,其中,置信区间为[预测数据-预设置信度×预测标准差,预测数据+预设置信度×预测标准差]。
S510:获取第二日的实际数据。
S511:判断第二日的实际数据是否处于第二日的置信区间内。
S512:当判断到第二日的实际数据处于第二日的置信区间内时,将第二日的实际数据添加至样本集,以更新样本集。
S512’:当判断到第二日的实际数据超出第二日的置信区间时,确定第二日的实际数据为异常数据。
S513:根据预定周期,统计异常数据的数量。
S514:判断异常数据的数量是否超出预定阈值。
S515:当判断到异常数据的数量小于或者等于预定阈值时,对异常数据所产生的原因进行行为分析。
S515’:当判断到异常数据的数量超出预定阈值时,调整参数值,对样本集进行修正。
上述实施例方式中,所选取的样本集包括第二日所属年份中位于第二日之前的第一预定时间段的第一历史数据,历史年份中同比第二日之前的第二预定时间段的第二历史数据,且第一预定时间段与第二预定时间段的结束日期相同,第二预定时间段比第一预定时间段少一日或者相同。具体参见图1所示步骤S101的描述,在此不再赘述。
对于预测模型的训练,可以依据第一数据以及第二数据,结合参数值,对预测模型进行训练测试。只有当测试的误差值小于或是等于预定误差值时,才会确定所训练的预测模型为可用的预测模型;否则,按照一定步长调整参数值,对预测模型进行重新训练、测试。
所得到的预测模型,既包括第二日所属年份的数据发展规律,同时还包括了历史年份中同比数据的历史发展规律。因而根据预测模型对第二日数据的预测,在输入第二日所属年份当日数据的同时,至少还需要输入历史年份中同比第二日的数据,以结合历史发展规律,对第二日的数据进行预测,提高预测准确性。
由于预测模型预测具有一定的偏差,实际数据与预测数据可能不完全相符,因而可以对其设置相应的置信区间,对第二日实际数据进行监控。
对于超出置信区间的异常数据,可能是出现某种原因所导致的,因而可以通过异常数据去找到相应日期(例如,上述第二日)是否有什么有益或者有害的行为,以进行行为分析,为企业发展提供建议。
上述实施例所提供的方法,提供了一种具体的对第二日数据进行预测的方法,通过加入历史同比数据,训练预测模型找出历史发展规律;构造置信区间,提高预测模型的监控能力;对于异常数据,究其产生原因可用于行为分析。上述实施例所提供的方法,在提高预测模型的预测准确性、保证预测数据质量的同时,还降低了人力的投入成本,为企业节约了资源。
本发明实施例所提供的方法,提供了一种数据预测的新思路,通过加入历史同比数据,依据历史同比数据的发展规律,提高了预测模型的预测周期,同时提高了数据预测的质量和准确性;依据预测模型的预测标准差,构造待预测日期的置信区间,进一步提高了异常监控的监控效果。另外,对于异常数据,可以判断其是否有效,用于企业分析,为企业及时调整策略提供了建议。
参见图6,示出了本发明实施例提供的一种数据预测的装置600的主要模块示意图;
获取模块601,用于获取样本集;其中,所述样本集包括第一数据和第二数据,所述第一数据为在待预测日期所属年份所述待预测日期之前的第一预设时间段的数据,所述第二数据为在历史年份同比所述待预测日期之前的第二预设时间段的数据;
训练模块602,用于获取预设的参数值,根据所述参数值对所述样本集中的所述第一数据以及所述第二数据进行训练测试,确定所述样本集的预测模型;
预测模块603,用于至少获取位于所述待预测日期之前且与所述待预测日期相邻最近日期的数据、历史年份中同比所述待预测日期的数据,根据所述预测模型,对所述待预测日期进行数据预测,确定所述待预测日期的预测数据。
本发明实施例所提供的装置中的训练模块602,还用于:将所述样本集分为训练集以及测试集;获取预设的所述参数值,根据所述参数值,对所述训练集进行训练,获取待测预测模型;根据所述测试集,对所述待测预测模型进行测试,计算测试到的数据与所述测试集的数据之间的测试误差值;当所述测试误差值小于或者等于预设误差值时,确定所述待测预测模型为所述样本集的预测模型。
本发明实施例所提供的装置中的训练模块602,还用于根据所述测试误差值,确定所述预测模型的预测标准差;确定模块604,用于:根据所述预测标准差以及所述待预测日期的预测数据,确定所述待预测日期的置信区间;其中,所述置信区间为[预测数据-预设置信度×预测标准差,预测数据+预设置信度×预测标准差];获取所述待预测日期的实际数据,当判断到所述待预测日期的实际数据置于所述待预测日期的置信区间内时,添加所述待预测日期的实际数据至所述样本集,以更新所述样本集。
本发明实施例所提供的装置中的确定模块604,还用于:当判断到所述待预测日期的实际数据超出所述待预测日期的置信区间时,确定所述待预测日期的实际数据为异常数据;统计预定周期内异常数据的数量,当所统计到异常数据的数量超出预定阈值时,调整所述参数值,根据调整后的参数值对所述预测模型进行重新训练。
本发明实施例所提供的装置中,所述第一预设时间段与所述第二预设时间段的结束日期相同,且当所述第一预设时间段的时间跨度为N时,所述第二预设时间段的时间跨度为N或者N-1;其中,N≥2。
另外,在本发明实施例中所述的数据预测装置的具体实施内容,在上面所述数据预测方法中已经详细说明了,故在此重复内容不再说明。
本发明实施例所提供的装置,提供了一种数据预测的新思路,通过加入历史同比数据,依据历史同比数据的发展规律,提高了预测模型的预测周期,同时提高了数据预测的质量和准确性;依据预测模型的预测标准差,构造待预测日期的置信区间,进一步提高了异常监控的监控效果。另外,对于异常数据,可以判断其是否有效,用于企业分析,为企业及时调整策略提供了建议。
参见图7示出了可以应用本发明实施例的数据预测方法或数据预测装置的示例性系统架构700。
如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备701、702、703可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,例如对用户利用终端设备701、702、703所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的预测行为方法一般由服务器705执行,相应地,预测行为装置一般设置于服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
参见图8,其示出了适于用来实现本发明实施例的终端设备的计算机系统800的结构示意图。图8示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、训练模块、预测模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“样本信息获取模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
获取样本集;其中,所述样本集包括第一数据和第二数据,所述第一数据为在待预测日期所属年份所述待预测日期之前的第一预设时间段的数据,所述第二数据为在历史年份同比所述待预测日期之前的第二预设时间段的数据;
获取预设的参数值,根据所述参数值对所述样本集中的所述第一数据以及所述第二数据进行训练测试,确定所述样本集的预测模型;
至少获取位于所述待预测日期之前且与所述待预测日期相邻最近日期的数据、历史年份中同比所述待预测日期的数据,根据所述预测模型,对所述待预测日期进行数据预测,确定所述待预测日期的预测数据。
根据本发明实施例的技术方案,提供了一种数据预测的新思路,通过加入历史同比数据,依据历史同比数据的发展规律,提高了预测模型的预测周期,同时提高了数据预测的质量和准确性;依据预测模型的预测标准差,构造待预测日期的置信区间,进一步提高了异常监控的监控效果。另外,对于异常数据,可以判断其是否有效,用于企业分析,为企业及时调整策略提供了建议。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (12)

1.一种数据预测的方法,其特征在于,包括:
获取样本集;其中,所述样本集包括第一数据和第二数据,所述第一数据为在待预测日期所属年份所述待预测日期之前的第一预设时间段的数据,所述第二数据为在历史年份同比所述待预测日期之前的第二预设时间段的数据;
获取预设的参数值,根据所述参数值对所述样本集中的所述第一数据以及所述第二数据进行训练测试,确定所述样本集的预测模型;
至少获取位于所述待预测日期之前且与所述待预测日期相邻最近日期的数据、历史年份中同比所述待预测日期的数据,根据所述预测模型,对所述待预测日期进行数据预测,确定所述待预测日期的预测数据。
2.根据权利要求1所述的方法,其特征在于,所述获取预设的参数值,根据所述参数值对所述样本集中的所述第一数据以及所述第二数据进行训练测试,确定所述样本集的预测模型包括:
将所述样本集分为训练集以及测试集;
获取预设的所述参数值,根据所述参数值,对所述训练集进行训练,获取待测预测模型;
根据所述测试集,对所述待测预测模型进行测试,计算测试到的数据与所述测试集的数据之间的测试误差值;
当所述测试误差值小于或者等于预设误差值时,确定所述待测预测模型为所述样本集的预测模型。
3.根据权利要求2所述的方法,其特征在于,所述确定所述待测预测模型为所述样本集的预测模型还包括:
根据所述测试误差值,确定所述预测模型的预测标准差;
在所述确定所述待预测日期的预测数据之后,还包括:
根据所述预测标准差以及所述待预测日期的预测数据,确定所述待预测日期的置信区间;其中,所述置信区间为[预测数据-预设置信度×预测标准差,预测数据+预设置信度×预测标准差];
获取所述待预测日期的实际数据,当判断到所述待预测日期的实际数据置于所述待预测日期的置信区间内时,添加所述待预测日期的实际数据至所述样本集,以更新所述样本集。
4.根据权利要求3所述的方法,其特征在于,在所述获取所述待预测日期的实际数据之后,还包括:
当判断到所述待预测日期的实际数据超出所述待预测日期的置信区间时,确定所述待预测日期的实际数据为异常数据;
统计预定周期内异常数据的数量,当所统计到异常数据的数量超出预定阈值时,调整所述参数值,根据调整后的参数值对所述预测模型进行重新训练。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述第一预设时间段与所述第二预设时间段的结束日期相同,且当所述第一预设时间段的时间跨度为N时,所述第二预设时间段的时间跨度为N或者N-1;其中,N≥2。
6.一种数据预测的装置,其特征在于,包括:
获取模块,用于获取样本集;其中,所述样本集包括第一数据和第二数据,所述第一数据为在待预测日期所属年份所述待预测日期之前的第一预设时间段的数据,所述第二数据为在历史年份同比所述待预测日期之前的第二预设时间段的数据;
训练模块,用于获取预设的参数值,根据所述参数值对所述样本集中的所述第一数据以及所述第二数据进行训练测试,确定所述样本集的预测模型;
预测模块,用于至少获取位于所述待预测日期之前且与所述待预测日期相邻最近日期的数据、历史年份中同比所述待预测日期的数据,根据所述预测模型,对所述待预测日期进行数据预测,确定所述待预测日期的预测数据。
7.根据权利要求6所述的装置,其特征在于,所述训练模块,还用于:
将所述样本集分为训练集以及测试集;
获取预设的所述参数值,根据所述参数值,对所述训练集进行训练,获取待测预测模型;
根据所述测试集,对所述待测预测模型进行测试,计算测试到的数据与所述测试集的数据之间的测试误差值;
当所述测试误差值小于或者等于预设误差值时,确定所述待测预测模型为所述样本集的预测模型。
8.根据权利要求7所述的装置,其特征在于,所述训练模块,还用于根据所述测试误差值,确定所述预测模型的预测标准差;
确定模块,用于:
根据所述预测标准差以及所述待预测日期的预测数据,确定所述待预测日期的置信区间;其中,所述置信区间为[预测数据-预设置信度×预测标准差,预测数据+预设置信度×预测标准差];
获取所述待预测日期的实际数据,当判断到所述待预测日期的实际数据置于所述待预测日期的置信区间内时,添加所述待预测日期的实际数据至所述样本集,以更新所述样本集。
9.根据权利要求8所述的装置,其特征在于,所述确定模块,还用于:
当判断到所述待预测日期的实际数据超出所述待预测日期的置信区间时,确定所述待预测日期的实际数据为异常数据;
统计预定周期内异常数据的数量,当所统计到异常数据的数量超出预定阈值时,调整所述参数值,根据调整后的参数值对所述预测模型进行重新训练。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述第一预设时间段与所述第二预设时间段的结束日期相同,且当所述第一预设时间段的时间跨度为N时,所述第二预设时间段的时间跨度为N或者N-1;其中,N≥2。
11.一种数据预测的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201710982948.5A 2017-10-20 2017-10-20 一种数据预测的方法和装置 Active CN109697522B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710982948.5A CN109697522B (zh) 2017-10-20 2017-10-20 一种数据预测的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710982948.5A CN109697522B (zh) 2017-10-20 2017-10-20 一种数据预测的方法和装置

Publications (2)

Publication Number Publication Date
CN109697522A true CN109697522A (zh) 2019-04-30
CN109697522B CN109697522B (zh) 2021-07-09

Family

ID=66225131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710982948.5A Active CN109697522B (zh) 2017-10-20 2017-10-20 一种数据预测的方法和装置

Country Status (1)

Country Link
CN (1) CN109697522B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047005A (zh) * 2019-03-28 2019-07-23 莆田学院 一种期货信息处理方法及系统
CN110175711A (zh) * 2019-05-17 2019-08-27 北京市天元网络技术股份有限公司 一种基于联合lstm基站小区流量预测方法以及装置
CN110276492A (zh) * 2019-06-24 2019-09-24 深圳前海微众银行股份有限公司 一种节点数据预测方法及装置
CN110287086A (zh) * 2019-07-03 2019-09-27 中国工商银行股份有限公司 一种周期性时间的交易量预测方法及装置
CN110378741A (zh) * 2019-07-24 2019-10-25 珠海格力智能装备有限公司 尿素溶液的生产方法及装置,车用尿素机
CN110443374A (zh) * 2019-08-14 2019-11-12 腾讯科技(深圳)有限公司 一种资源信息处理方法、装置及设备
CN110610382A (zh) * 2019-09-10 2019-12-24 浙江大搜车软件技术有限公司 车辆销售量预测方法、装置、计算机设备和存储介质
CN111091407A (zh) * 2019-10-28 2020-05-01 海南太美航空股份有限公司 一种航线客座率预测方法及系统
CN111340281A (zh) * 2020-02-20 2020-06-26 支付宝(杭州)信息技术有限公司 预测模型训练方法及装置
CN111917809A (zh) * 2019-05-09 2020-11-10 腾讯科技(深圳)有限公司 多媒体数据推送方法及其装置
CN112446520A (zh) * 2019-08-30 2021-03-05 京东数字科技控股有限公司 一种预测产品排期时间的方法和装置
CN112819231A (zh) * 2021-02-05 2021-05-18 北京明略昭辉科技有限公司 用于预测家庭户数的方法、装置及设备
CN115470936A (zh) * 2022-09-23 2022-12-13 广州爱浦路网络技术有限公司 一种基于nwdaf的机器学习模型更新方法及装置
CN116582702A (zh) * 2023-07-11 2023-08-11 成都工业职业技术学院 一种基于大数据的网络视频播放量预测方法、系统及介质
CN117057488A (zh) * 2023-10-12 2023-11-14 江南大学附属医院 基于人工智能模型的放射医疗设备工作量预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268726A (zh) * 2014-10-29 2015-01-07 杭州凯达电力建设有限公司 一种用电方案生成方法及系统
CN105096159A (zh) * 2015-06-30 2015-11-25 北京中电普华信息技术有限公司 一种区域售电量预测方法及装置
CN105303262A (zh) * 2015-11-12 2016-02-03 河海大学 一种基于核主成分分析和随机森林的短期负荷预测方法
CN106295995A (zh) * 2016-08-10 2017-01-04 曼威网络科技(上海)有限公司 一种用于确定生产计划的数据分析方法与设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268726A (zh) * 2014-10-29 2015-01-07 杭州凯达电力建设有限公司 一种用电方案生成方法及系统
CN105096159A (zh) * 2015-06-30 2015-11-25 北京中电普华信息技术有限公司 一种区域售电量预测方法及装置
CN105303262A (zh) * 2015-11-12 2016-02-03 河海大学 一种基于核主成分分析和随机森林的短期负荷预测方法
CN106295995A (zh) * 2016-08-10 2017-01-04 曼威网络科技(上海)有限公司 一种用于确定生产计划的数据分析方法与设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘文斌 主编: "区间估计与置信区间", 《概率论与数理统计 经管类》 *
程宇也: "基于人工神经网络的短期电力负荷预测研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047005A (zh) * 2019-03-28 2019-07-23 莆田学院 一种期货信息处理方法及系统
CN111917809A (zh) * 2019-05-09 2020-11-10 腾讯科技(深圳)有限公司 多媒体数据推送方法及其装置
CN111917809B (zh) * 2019-05-09 2021-11-26 腾讯科技(深圳)有限公司 多媒体数据推送方法及其装置
CN110175711A (zh) * 2019-05-17 2019-08-27 北京市天元网络技术股份有限公司 一种基于联合lstm基站小区流量预测方法以及装置
CN110276492A (zh) * 2019-06-24 2019-09-24 深圳前海微众银行股份有限公司 一种节点数据预测方法及装置
CN110287086A (zh) * 2019-07-03 2019-09-27 中国工商银行股份有限公司 一种周期性时间的交易量预测方法及装置
CN110378741A (zh) * 2019-07-24 2019-10-25 珠海格力智能装备有限公司 尿素溶液的生产方法及装置,车用尿素机
CN110443374A (zh) * 2019-08-14 2019-11-12 腾讯科技(深圳)有限公司 一种资源信息处理方法、装置及设备
CN112446520A (zh) * 2019-08-30 2021-03-05 京东数字科技控股有限公司 一种预测产品排期时间的方法和装置
CN110610382A (zh) * 2019-09-10 2019-12-24 浙江大搜车软件技术有限公司 车辆销售量预测方法、装置、计算机设备和存储介质
CN111091407A (zh) * 2019-10-28 2020-05-01 海南太美航空股份有限公司 一种航线客座率预测方法及系统
CN111340281A (zh) * 2020-02-20 2020-06-26 支付宝(杭州)信息技术有限公司 预测模型训练方法及装置
CN111340281B (zh) * 2020-02-20 2022-06-03 支付宝(杭州)信息技术有限公司 预测模型训练方法及装置
CN112819231A (zh) * 2021-02-05 2021-05-18 北京明略昭辉科技有限公司 用于预测家庭户数的方法、装置及设备
CN115470936A (zh) * 2022-09-23 2022-12-13 广州爱浦路网络技术有限公司 一种基于nwdaf的机器学习模型更新方法及装置
CN116582702A (zh) * 2023-07-11 2023-08-11 成都工业职业技术学院 一种基于大数据的网络视频播放量预测方法、系统及介质
CN116582702B (zh) * 2023-07-11 2023-09-15 成都工业职业技术学院 一种基于大数据的网络视频播放量预测方法、系统及介质
CN117057488A (zh) * 2023-10-12 2023-11-14 江南大学附属医院 基于人工智能模型的放射医疗设备工作量预测方法及系统
CN117057488B (zh) * 2023-10-12 2023-12-26 江南大学附属医院 基于人工智能模型的放射医疗设备工作量预测方法及系统

Also Published As

Publication number Publication date
CN109697522B (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
CN109697522A (zh) 一种数据预测的方法和装置
CN106549772B (zh) 资源预测方法、系统和容量管理装置
CN110400024B (zh) 订单预测的方法、装置、设备和计算机可读存储介质
CN110443657B (zh) 客户流量数据处理方法、装置、电子设备及可读介质
CN109634833A (zh) 一种软件缺陷预测方法和装置
CN109426593A (zh) 自动评估系统性能的方法和装置
CN110390408A (zh) 交易对象预测方法和装置
CN109408205A (zh) 基于hadoop集群的任务调度方法和装置
Chen et al. A study of earthquake inter-occurrence times distribution models in Taiwan
CN110163457A (zh) 一种业务指标的异常定位方法和装置
CN114138625A (zh) 服务器健康状态的评估方法、系统、电子设备和存储介质
CN108388563A (zh) 信息输出方法和装置
CN109002925A (zh) 业务量预测方法和装置
CN109961299A (zh) 数据分析的方法和装置
CN109976999A (zh) 测试用例覆盖率的度量方法和度量装置
CN110389873A (zh) 一种判定服务器资源使用情况的方法和装置
CN110019367A (zh) 一种统计数据特征的方法和装置
CN109961199A (zh) 一种分析数据波动的方法和装置
CN108629355A (zh) 用于生成工作量信息的方法和装置
CN110263791A (zh) 一种识别功能区的方法和装置
CN110032750A (zh) 一种模型构建、数据生命周期预测方法、装置及设备
US20220058590A1 (en) Equipment maintenance in geo-distributed equipment
CN105432038A (zh) 应用排名计算装置和使用信息收集装置
CN109902847A (zh) 预测分库订单量的方法和装置
CN112799712A (zh) 维护工作量的确定方法、装置、设备、介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant