CN112131467A - 一种数据预测方法、系统、介质及设备 - Google Patents

一种数据预测方法、系统、介质及设备 Download PDF

Info

Publication number
CN112131467A
CN112131467A CN202010970473.XA CN202010970473A CN112131467A CN 112131467 A CN112131467 A CN 112131467A CN 202010970473 A CN202010970473 A CN 202010970473A CN 112131467 A CN112131467 A CN 112131467A
Authority
CN
China
Prior art keywords
data
prediction
predicted
value
date
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010970473.XA
Other languages
English (en)
Inventor
郭嘉炯
张林敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhidemai Technology Co ltd
Original Assignee
Beijing Zhidemai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhidemai Technology Co ltd filed Critical Beijing Zhidemai Technology Co ltd
Priority to CN202010970473.XA priority Critical patent/CN112131467A/zh
Publication of CN112131467A publication Critical patent/CN112131467A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种数据预测方法、系统、介质及设备,该方法包括:获取所述预测日期之前多个不同历史日期在所述预测时刻前后预设时长内的历史数据;根据各个历史数据及对应的预设权重值,预测所述预测日期在所述预测时刻的数据。该方法通过采集多个历史数据,结合相应的权重来对未来某个日期的数据进行预测,从而提高了预测未来趋势的准确性,减少了历史异常数据对预测的影响,使预测的结果趋于平滑。本发明过程简单,计算量相对较小,在条件允许的情况下,可以进行实时计算,较少了对存储器容量的要求。

Description

一种数据预测方法、系统、介质及设备
技术领域
本发明属于数据挖掘领域,具体涉及一种数据预测方法、系统、介质及设备。
背景技术
近年来,随着互联网的飞速发展,人们在互联网上参与各种社会活动的情况越来越普遍,其制造出的数据信息量也越来越大,可用于挖掘某种趋势的数据也越来越多。作为互联网运营者,为了提高网络服务的质量,需要在一定程序上预测未来用户行为。
现有的技术直接使用了历史上的某天的数据进行预测,该数据可能由于某天某物的干扰比较严重导致该天数据严重的缺失精度,进而影响到数据趋势走势的判断。例如某天突发异常情况导致的当天数据出现了极大的变化,在使用该天数据进行预测时就可能会产生不可靠并且偏离未来趋势的判断。
发明内容
针对上述技术问题,本发明提供一种数据预测方法、系统、介质及设备。
本发明解决上述技术问题的技术方案如下:
一种数据预测方法,用于预测某个预测日期在某个预测时刻的数据,包括:
获取所述预测日期之前多个不同历史日期在所述预测时刻前后预设时长内的历史数据;
根据各个历史数据及对应的预设权重值,预测所述预测日期在所述预测时刻的数据。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述根据各个历史数据及对应的预设权重值,预测所述预测日期在所述时刻的数据,具体包括:
将属于同一时刻的所述历史数据作为一组,根据各组历史数据及对应的预设权重值,分别计算初步基线值;
计算各个所述初步基线值的平均值,作为所述预测日期在所述预测时刻的数据的预测值。
进一步,所述初步基线值的计算公式为:
Figure BDA0002683542310000021
其中,S为历史数据,c为对应的预设权重值。
进一步,在分别计算初步基线值之后,计算各个所述初步基线值的平均值之前,还包括:
去除显著大于或显著小于所述预测时刻的初步基线值的初步基线值。
为实现上述发明目的,本发明还提供一种数据预测系统,用于预测某个预测日期在某个预测时刻的数据,包括:
数据获取模块,用于获取所述预测日期之前多个不同历史日期在所述预测时刻前后预设时长内的历史数据;
数据预测模块,用于根据各个历史数据及对应的预设权重值,预测所述预测日期在所述预测时刻的数据。
进一步,所述数据预测模块,具体包括:
基线值计算单元,用于将属于同一时刻的所述历史数据作为一组,根据各组历史数据及对应的预设权重值,分别计算初步基线值;
预测值计算单元,用于计算各个所述初步基线值的平均值,作为所述预测日期在所述预测时刻的数据的预测值。
进一步,所述初步基线值的计算公式为:
Figure BDA0002683542310000031
其中,S为历史数据,c为对应的预设权重值。
进一步,所述数据预测模块还包括:
数据去噪单元,用于在所述基线值计算单元分别计算初步基线值之后,所述预测值计算单元计算各个所述初步基线值的平均值之前,去除显著大于或显著小于所述预测时刻的初步基线值的初步基线值。
本发明还提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使所述计算机执行上述方法。
本发明还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上的并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法。
本发明的有益效果是:通过采集多个历史数据,结合相应的权重来对未来某个日期的数据进行预测,从而提高了预测未来趋势的准确性,减少了历史异常数据对预测的影响,使预测的结果趋于平滑。本发明过程简单,计算量相对较小,在条件允许的情况下,可以进行实时计算,较少了对存储器容量的要求。
附图说明
图1为本发明实施例提供的一种数据预测方法的流程图;
图2为本发明实施例提供的一种数据预测方法步骤S40的具体流程图
图3为本发明实施例提供的一种数据预测系统的结构框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明实施例提供的一种数据预测方法的流程图,该方法用于预测某个预测日期在某个预测时刻的数据,如图1所示,该方法包括:
S20、获取所述预测日期之前多个不同历史日期在所述预测时刻前后预设时长内的历史数据;
具体的,每天的数据以一个单位进行细化来保存的,例如,若以分钟为单位,则一天有1440个数据。
以预测未来7天内某一天某个时刻的数据为例,根据该天的日期,可取出4份历史数据,分别是该日期时间点的7天前该时刻的数据,14天前该时刻的数据,21天前该时刻的数据,28天前该时刻的数据。
S40、根据各个历史数据及对应的预设权重值,预测所述预测日期在所述预测时刻的数据。
在该实施例中,对于不同日期的历史数据,可预设不同的权重值,例如对7天前、14天前、21天前、28天前这4天的数据分别取权重40%、30%、20%、10%,这样,在进行数据预测时即可反映出多个历史数据的大小及其权重,提高预测的准确性,对数据的偏差进行纠正。
并且,为了避免单个数据的突变影响预测的准确性,还需要考虑预测数据周围的数据的预测值。可选地,在该实施例中,如图2所示,步骤S40具体包括:
S420、将属于同一时刻的所述历史数据作为一组,根据各组历史数据及对应的预设权重值,分别计算初步基线值;
在该实施例中,在预测t时刻的数据时,还需要预测t时刻之前和之后一段时间范围内的数据,作为一组初步基线值。具体的时间范围可以根据不同业务的具体情况进行调整。
其中,所述初步基线值的计算公式为:
Figure BDA0002683542310000041
其中,S为历史数据,c为对应的预设权重值。
具体的,设7天前、14天前、21天前和28天的历史数据分别为St-7、St-14、St-21、St-28,则:
St=0.4*St-7+0.3*St-14+0.2*St-21+0.1*St-28
S440、计算各个所述初步基线值的平均值,作为所述预测日期在所述预测时刻的数据的预测值。
以时间范围为前后15分钟为例,则可以计算得到前后各15个初步基线值,将这30个初步基线值进行平均,则可以得到预测时刻的预测值。
为了进一步去除异常值,避免异常值对于预测值计算的影响,可选地,在该实施例中,如图2所示,在步骤S420之后,步骤S440之前,还包括:
S430、去除显著大于或显著小于所述预测时刻的初步基线值的初步基线值。
这里的显著大于或显著小于可通过倍数来确定,例如,大于三倍的预测时刻的初步基线值为显著大于,小于三分之一的预测时刻的初步基线值为显著小于。去掉显著大或者显著小的初步基线值之后,可以避免异常值对于预测值计算的影响。
本发明还提供一种数据预测系统,用于预测某个预测日期在某个预测时刻的数据,该系统中各个模块的功能原理已在前述内容中进行了具体说明,以下不再赘述,如图3所示,该系统包括:
数据获取模块,用于获取所述预测日期之前多个不同历史日期在所述预测时刻前后预设时长内的历史数据;
数据预测模块,用于根据各个历史数据及对应的预设权重值,预测所述预测日期在所述预测时刻的数据。
可选地,在该实施例中,所述数据预测模块,具体包括:
基线值计算单元,用于将属于同一时刻的所述历史数据作为一组,根据各组历史数据及对应的预设权重值,分别计算初步基线值;
预测值计算单元,用于计算各个所述初步基线值的平均值,作为所述预测日期在所述预测时刻的数据的预测值。
可选地,在该实施例中,所述初步基线值的计算公式为:
Figure BDA0002683542310000061
其中,S为历史数据,c为对应的预设权重值。
可选地,在该实施例中,所述数据预测模块还包括:
数据去噪单元,用于在所述基线值计算单元分别计算初步基线值之后,所述预测值计算单元计算各个所述初步基线值的平均值之前,去除显著大于或显著小于所述预测时刻的初步基线值的初步基线值。
本发明实施例还提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使所述计算机执行上述方法实施例中的方法步骤;或者存储上述系统实施例的各个软件模块对应的指令。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上的并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法实施例中的方法步骤。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述系统实施例中的模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种数据预测方法,用于预测某个预测日期在某个预测时刻的数据,其特征在于,包括:
获取所述预测日期之前多个不同历史日期在所述预测时刻前后预设时长内的历史数据;
根据各个历史数据及对应的预设权重值,预测所述预测日期在所述预测时刻的数据。
2.根据权利要求1所述的一种数据预测方法,其特征在于,所述根据各个历史数据及对应的预设权重值,预测所述预测日期在所述时刻的数据,具体包括:
将属于同一时刻的所述历史数据作为一组,根据各组历史数据及对应的预设权重值,分别计算初步基线值;
计算各个所述初步基线值的平均值,作为所述预测日期在所述预测时刻的数据的预测值。
3.根据权利要求2所述的一种数据预测方法,其特征在于,所述初步基线值的计算公式为:
St=∑S*c
其中,S为历史数据,c为对应的预设权重值。
4.根据权利要求1至3任一项所述的一种数据预测方法,其特征在于,在分别计算初步基线值之后,计算各个所述初步基线值的平均值之前,还包括:
去除显著大于或显著小于所述预测时刻的初步基线值的初步基线值。
5.一种数据预测系统,用于预测某个预测日期在某个预测时刻的数据,其特征在于,包括:
数据获取模块,用于获取所述预测日期之前多个不同历史日期在所述预测时刻前后预设时长内的历史数据;
数据预测模块,用于根据各个历史数据及对应的预设权重值,预测所述预测日期在所述预测时刻的数据。
6.根据权利要求5所述的一种数据预测系统,其特征在于,所述数据预测模块,具体包括:
基线值计算单元,用于将属于同一时刻的所述历史数据作为一组,根据各组历史数据及对应的预设权重值,分别计算初步基线值;
预测值计算单元,用于计算各个所述初步基线值的平均值,作为所述预测日期在所述预测时刻的数据的预测值。
7.根据权利要求6所述的一种数据预测系统,其特征在于,所述初步基线值的计算公式为:
St=∑S*c
其中,S为历史数据,c为对应的预设权重值。
8.根据权利要求5至7任一项所述的一种数据预测系统,其特征在于,所述数据预测模块还包括:
数据去噪单元,用于在所述基线值计算单元分别计算初步基线值之后,所述预测值计算单元计算各个所述初步基线值的平均值之前,去除显著大于或显著小于所述预测时刻的初步基线值的初步基线值。
9.一种计算机可读存储介质,包括指令,其特征在于,当所述指令在计算机上运行时,使所述计算机执行根据权利要求1至4任一项所述的方法。
10.一种计算机设备,包括存储器、处理器及存储在所述存储器上的并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述的方法。
CN202010970473.XA 2020-09-15 2020-09-15 一种数据预测方法、系统、介质及设备 Pending CN112131467A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010970473.XA CN112131467A (zh) 2020-09-15 2020-09-15 一种数据预测方法、系统、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010970473.XA CN112131467A (zh) 2020-09-15 2020-09-15 一种数据预测方法、系统、介质及设备

Publications (1)

Publication Number Publication Date
CN112131467A true CN112131467A (zh) 2020-12-25

Family

ID=73845730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010970473.XA Pending CN112131467A (zh) 2020-09-15 2020-09-15 一种数据预测方法、系统、介质及设备

Country Status (1)

Country Link
CN (1) CN112131467A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651560A (zh) * 2020-12-28 2021-04-13 华润电力技术研究院有限公司 一种超短期风功率预测方法、装置及设备
CN115410386A (zh) * 2022-09-05 2022-11-29 同盾科技有限公司 短时速度预测方法及装置、计算机存储介质、电子设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651560A (zh) * 2020-12-28 2021-04-13 华润电力技术研究院有限公司 一种超短期风功率预测方法、装置及设备
CN112651560B (zh) * 2020-12-28 2023-04-25 华润电力技术研究院有限公司 一种超短期风功率预测方法、装置及设备
CN115410386A (zh) * 2022-09-05 2022-11-29 同盾科技有限公司 短时速度预测方法及装置、计算机存储介质、电子设备
CN115410386B (zh) * 2022-09-05 2024-02-06 同盾科技有限公司 短时速度预测方法及装置、计算机存储介质、电子设备

Similar Documents

Publication Publication Date Title
CN110874674B (zh) 一种异常检测方法、装置及设备
CN112131467A (zh) 一种数据预测方法、系统、介质及设备
CN111199018B (zh) 异常数据检测方法、装置、存储介质及电子设备
CN113011888B (zh) 一种针对数字货币的异常交易行为检测方法、装置、设备及介质
JP5282857B1 (ja) 情報拡散規模予測装置、情報拡散規模予測方法、および情報拡散規模予測プログラム
CN108959961B (zh) 一种查询平均成绩的隐私保护方法
CN108809734B (zh) 网络告警根源分析方法、系统、存储介质及计算机设备
CN110390563A (zh) 用户价值的量化方法、装置、计算机设备和存储介质
Buysse et al. Globalisation outcomes and the real output in the subSaharan Africa LICs: a cointegration analysis
CN116384594B (zh) 基于大数据分析的作物虫害预警方法、系统、终端及介质
CN113783717A (zh) 智慧城市网络流量预测方法及系统
CN113743531A (zh) 一种设备工况预警方法及相关装置
CN113793076B (zh) 一种风险池动态监测方法、系统、设备和可读存储介质
CN110876072A (zh) 一种批量注册用户识别方法、存储介质、电子设备及系统
CN106775962B (zh) 一种规则执行方法及装置
CN110738327B (zh) 一种快充桩设备风险评估方法及系统
CN108429632B (zh) 一种业务监控方法和装置
JP2020181443A (ja) 異常検出装置、異常検出方法、およびコンピュータプログラム
CN114844696A (zh) 一种基于风险池最小化的网络入侵动态监测方法、系统、设备和可读存储介质
CN109697203A (zh) 指标异动分析方法及设备、计算机存储介质、计算机设备
CN110245844B (zh) 异常指标检测方法及装置
CN113610627A (zh) 用于风险预警的数据处理方法和装置
EP3754664A1 (en) Disease suffering probability prediction method and electronic apparatus
CN111429232A (zh) 产品推荐方法、装置和电子设备及计算机可读存储介质
CN117828900B (zh) 一种应用于板坯轧制下的杂质去除提醒方法、系统及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination