CN111507495A - 缺失的测风数据的预测方法及装置 - Google Patents
缺失的测风数据的预测方法及装置 Download PDFInfo
- Publication number
- CN111507495A CN111507495A CN201910092396.XA CN201910092396A CN111507495A CN 111507495 A CN111507495 A CN 111507495A CN 201910092396 A CN201910092396 A CN 201910092396A CN 111507495 A CN111507495 A CN 111507495A
- Authority
- CN
- China
- Prior art keywords
- data
- missing part
- prediction model
- sequence
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005259 measurement Methods 0.000 title claims abstract description 139
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 86
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000003062 neural network model Methods 0.000 claims description 74
- 238000012360 testing method Methods 0.000 claims description 67
- 238000004364 calculation method Methods 0.000 claims description 31
- 238000012545 processing Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 18
- 230000007704 transition Effects 0.000 claims description 18
- 230000001360 synchronised effect Effects 0.000 claims description 17
- 238000007689 inspection Methods 0.000 claims description 15
- 238000012935 Averaging Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 8
- 238000002790 cross-validation Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 230000001502 supplementing effect Effects 0.000 claims description 5
- 239000013589 supplement Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Wind Motors (AREA)
Abstract
提供一种缺失的测风数据的预测方法及装置。该缺失的测风数据的预测方法包括:对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练,基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据,从而提高了测风数据的缺失部分的数据的准确性。
Description
技术领域
本发明涉及风电领域。更具体地,本发明涉及一种缺失的测风数据的预测方法及装置。
背景技术
风电场测风塔的测风数据的质量直接影响风能资源评估的结果,进而影响整个风电场投产运行后的经济效益。因此,测风塔的缺测或者缺失的测风数据的插补在整个风电场的设计过程中具有重要的作用。目前已有的处理方法有同塔插补和异塔插补,对于同塔插补和异塔插补后完整率依然不满足要求的数据,现用的方法有中尺度插补或FillGaps方法。中尺度插补需要将小时间间隔的数据(例如,逐10min数据)转变成大时间间隔的数据(例如,逐小时数据),FillGaps方法虽然可以得到逐10min数据,但预测精度不高,误差较大。
发明内容
本发明的示例性实施例在于提供一种缺失的测风数据的预测方法及装置,以提高缺失的测风数据的预测精度。
根据本发明的示例性实施例,提供一种缺失的测风数据的预测方法,包括:对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练,基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
可选地,对输入的测风数据进行预处理的步骤可包括:对输入的测风数据进行异常数据筛选和清除处理。
可选地,对输入的测风数据进行预处理的步骤之后,所述方法还包括:针对预处理后的测风数据中缺失部分的数据补充缺失的时间标签。
可选地,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练的步骤之前,所述方法还包括:分别计算多套中尺度数据中的每套中尺度数据与测风数据的相关度;根据计算得到的相关度,从多套中尺度数据中选择至少一套中尺度数据用于对预设的数据预测模型进行训练。
可选地,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练的步骤可包括:将测风数据序列中的无缺失部分的数据序列分成训练数据和检验数据;将与训练数据相应的同期中尺度数据和训练数据分别作为训练的输入数据集和输出数据集,使用输入数据集和输出数据集对预设的数据预测模型中的神经网络模型进行训练;使用检验数据和与检验数据相应的同期中尺度数据对训练后的数据预测模型进行检验;当检验不通过时,根据用户的输入对预设的数据预测模型进行更新,对更新后的数据预测模型中的神经网络模型进行训练,并对训练后的数据预测模型进行检验,直至检验通过时结束训练。
可选地,神经网络模型是支持向量回归模型,其中,使用输入数据集和输出数据集对预设的数据预测模型中的神经网络模型进行训练的步骤可包括:对输入数据集和输出数据集中的数据进行归一化处理;通过交叉验证选择回归的最佳惩罚参数和最佳核函数参数;使用最佳惩罚参数和最佳核函数参数对神经网络模型进行训练。
可选地,计算测风数据的缺失部分的数据的步骤可包括:根据所述测风数据序列的缺失部分的数据序列对预处理后的测风数据进行更新;针对无缺失部分的数据生成每个时刻点离散化的变量值列表,并分别针对每个变量值生成每个时刻点的百分位值,根据百分位值确定每个变量值在每个时刻的状态;根据无缺失部分的数据中的每个变量值在每个时刻的状态确定状态转移概率矩阵;针对缺失部分的数据中的每个变量值,在每个时刻依次根据确定的预测参照状态以及状态转移概率矩阵,计算缺失部分的数据中的当前时刻的状态,其中,将与缺失部分最接近的无缺失部分的时刻的状态确定为预测参照状态;根据计算得到的当前时刻的状态预测当前时刻的数据,其中,在针对缺失部分的数据中的每个变量值,在每个时刻依次根据确定的预测参照状态以及状态转移概率矩阵,计算缺失部分的数据中的当前时刻的状态的步骤之前,所述方法还可包括:针对缺失部分的数据每隔第二时间间隔确定一个时刻,其中,第二时间间隔小于第一时间间隔。
可选地,使用检验数据和与检验数据相应的同期中尺度数据对训练后的数据预测模型进行检验的步骤可包括:基于训练后的数据预测模型,根据与检验数据相应的同期中尺度数据计算与检验数据相应的预测数据;将检验数据和预测数据进行比较,根据比较结果对训练后的数据预测模型进行检验。
可选地,数据预测模型至少包括神经网络模型和马尔科夫预测模型,其中,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练的步骤可包括:用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据,对预设的数据预测模型中的神经网络模型进行训练,其中,基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列的步骤可包括:基于训练后的数据预测模型中的神经网络模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,其中,基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据的步骤可包括:基于训练后的数据预测模型中的马尔科夫预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
可选地,计算测风数据的缺失部分的数据的步骤可包括:当计算缺失部分的同时具有第一时间间隔和第二时间间隔的时刻的数据时,将神经网络模型计算得到的所述时刻的数据和马尔科夫预测模型计算得到的相应时刻的数据进行加权平均,将加权平均得到的平均值作为所述时刻的数据;获取与加权平均得到的平均值相应的状态,并根据获取的状态对预测参照状态进行更新。
根据本发明的示例性实施例,提供一种缺失的测风数据的预测装置,包括:数据处理模块,被配置为对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,其中,测风数据包括缺失部分的数据和无缺失部分的数据,测风数据序列包括缺失部分的数据序列和无缺失部分的数据序列;模型训练模块,被配置为使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练;第一计算模块,被配置为基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列;和第二计算模块,被配置为基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
可选地,数据处理模块可被配置为:对输入的测风数据进行异常数据筛选和清除处理。
可选地,所述装置还包括:标签补充模块,被配置为针对预处理后的测风数据中缺失部分的数据补充缺失的时间标签。
可选地,所述装置还包括:相关度计算模块,被配置为分别计算多套中尺度数据中的每套中尺度数据与测风数据的相关度;和数据选择模块,被配置为根据计算得到的相关度,从多套中尺度数据中选择至少一套中尺度数据用于对预设的数据预测模型进行训练。
可选地,模型训练模块可被配置为:将测风数据序列中的无缺失部分的数据序列分成训练数据和检验数据;将与训练数据相应的同期中尺度数据和训练数据分别作为训练的输入数据集和输出数据集,使用输入数据集和输出数据集对预设的数据预测模型中的神经网络模型进行训练;使用检验数据和与检验数据相应的同期中尺度数据对训练后的数据预测模型进行检验;检验不通过时,根据用户的输入对预设的数据预测模型进行更新,对更新后的数据预测模型中的神经网络模型进行训练,并对训练后的数据预测模型进行检验,直至检验通过时结束训练。
可选地,神经网络模型是支持向量回归模型,其中,模型训练模块被配置为:对输入数据集和输出数据集中的数据进行归一化处理;通过交叉验证选择回归的最佳惩罚参数和最佳核函数参数;使用最佳惩罚参数和最佳核函数参数对神经网络模型进行训练。
可选地,第二计算模块可被配置为:根据所述测风数据序列的缺失部分的数据序列对预处理后的测风数据进行更新;针对无缺失部分的数据生成每个时刻点离散化的变量值列表,并分别针对每个变量值生成每个时刻点的百分位值,根据百分位值确定每个变量值在每个时刻的状态;根据无缺失部分的数据中的每个变量值在每个时刻的状态确定状态转移概率矩阵;针对缺失部分的数据中的每个变量值,在每个时刻依次根据确定的预测参照状态以及状态转移概率矩阵,计算缺失部分的数据中的当前时刻的状态,其中,将与缺失部分最接近的无缺失部分的时刻的状态确定为预测参照状态;根据计算得到的当前时刻的状态预测当前时刻的数据,其中,所述装置还可包括:时刻确定模块,被配置为针对缺失部分的数据每隔第二时间间隔确定一个时刻,其中,第二时间间隔小于第一时间间隔。
可选地,模型训练模块可被配置为:基于训练后的数据预测模型,根据与检验数据相应的同期中尺度数据计算与检验数据相应的预测数据;将检验数据和预测数据进行比较,根据比较结果对训练后的数据预测模型进行检验。
可选地,数据预测模型至少包括神经网络模型和马尔科夫预测模型,其中,模型训练模块被配置为使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据,对预设的数据预测模型中的神经网络模型进行训练,其中,第一计算模块被配置为基于训练后的数据预测模型中的神经网络模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,其中,第二计算模块被配置为基于训练后的数据预测模型中的马尔科夫预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
可选地,第二计算模块可被配置为:当计算缺失部分的同时具有第一时间间隔和第二时间间隔的时刻的数据时,将神经网络模型计算得到的所述时刻的数据和马尔科夫预测模型计算得到的相应时刻的数据进行加权平均,将加权平均得到的平均值作为所述时刻的数据;获取与加权平均得到的平均值相应的状态,并根据获取的状态对预测参照状态进行更新。
根据本发明的示例性实施例,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被执行时实现根据本发明的缺失的测风数据的预测方法的步骤。
根据本发明的示例性实施例,提供一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现根据本发明的缺失的测风数据的预测方法的步骤。
根据本发明示例性实施例的缺失的测风数据的预测方法及装置,通过对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练,基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据,从而提高了测风数据的缺失部分的数据的准确性。
附图说明
通过下面结合示例性地示出实施例的附图进行的描述,本发明示例性实施例的上述和其他目的和特点将会变得更加清楚,其中:
图1示出根据本发明示例性实施例的缺失的测风数据的预测方法的流程图;
图2示出根据本发明示例性实施例的支持向量回归(SVR)模型体系结构图;
图3示出根据本发明示例性实施例的缺失的测风数据的预测装置的框图;和
图4示出根据本发明示例性实施例的计算装置的示意图。
具体实施方式
现将详细参照本发明的示例性实施例,所述实施例的示例在附图中示出,其中,相同的标号始终指的是相同的部件。以下将通过参照附图来说明所述实施例,以便解释本发明。
图1示出根据本发明示例性实施例的缺失的测风数据的预测方法的流程图。
参照图1,在步骤S101,对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列。
在本发明示例性实施例中,测风数据可包括缺失部分的数据和无缺失部分的数据,测风数据序列可包括缺失部分的数据序列和无缺失部分的数据序列。例如,测风数据可以是1月-12月的数据,其中,如果3月和7月的数据缺失,则3月和7月的数据为测风数据的缺失部分的数据,其余数据(1月、2月、4月-6月、8月-12月的数据)为测风数据的无缺失部分的数据。第一时间间隔可以根据用户需要进行设置,例如,第一时间间隔可以是1小时、2小时、3小时等整数个小时,也可以是非整数个小时(诸如40分钟、50分钟、80分钟等)。根据本申请的实施例,第一时间间隔可以是具有较大尺度的时间间隔。在以下的实施例中,以1小时作为第一时间间隔的示例进行说明,但是本领域的技术人员应理解,这仅是一个示例而不是限制第一时间间隔的范围。
在本发明示例性实施例中,在对输入的测风数据进行预处理时,可对输入的测风数据进行异常数据筛选和清除处理。例如,在对测风数据Y进行预处理的过程中可执行以下操作:识别超出范围的数据,其中,诸如风速大于50m/s、风速小于0m/s、温度低于-45℃、温度高于50℃、气压低于60kPa、气压高于120kPa等的数据均属于超出正常范围的数据。这些数据都属于异常数据,可被筛选出来并可被清除。
在本发明示例性实施例中,在对输入的测风数据进行预处理之后,可针对预处理后的测风数据中缺失部分的数据补充缺失的时间标签。例如,如果5月1号的5:00至7:00的数据缺失,则可将5:00至7:00的时间标签补充为5:00、5:10、5:20、5:30、5:40、5:50、6:00、6:10、6:20、6:30、6:40、6:50、7:00,以在后续过程中计算这些时间点的数据。
在本发明示例性实施例中,在对输入的测风数据进行预处理之后,将预处理后的测风数据转换为具有第一时间间隔的测风数据序列。例如,如果第一时间间隔被确定为1小时,则将以上清洗完的测风数据转化为逐小时数据(即,时间间隔为1小时的测风数据序列),从而便于进行后续的计算。
在步骤S102,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练。
在气象专业中,将2km至2000km的天气系统称为中尺度系统,并将与中尺度系统相应的中尺度气象模型生成的数据称为中尺度数据。中尺度数据可包括风速、温度、风向、湿度等中的至少一个。在本发明示例性实施例中,与无缺失部分相应的同期中尺度数据可以是同期的一套或者多套中尺度数据。例如,可在选定的中尺度数据测量区域中的多个位置中的每个位置处分别测量得到一套中尺度数据。
在本发明示例性实施例中,在使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练之前,可分别计算多套中尺度数据中的每套中尺度数据与测风数据的相关度;根据计算得到的相关度,从多套中尺度数据中选择至少一套中尺度数据用于对预设的数据预测模型进行训练。例如,选择多套中尺度数据中的相关度超过0.45的中尺度数据用于对预设的数据预测模型进行训练,或者选择多套中尺度数据中的相关度最大的中尺度数据用于对预设的数据预测模型进行训练。
在本发明示例性实施例中,在使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练之前,例如,当第一时间间隔被设置为1小时,以上清洗完的测风数据已被转化为逐小时数据(即,时间间隔为1小时的测风数据序列)时,可将测风数据的逐小时数据作为数据集Y1;提取测风数据Y所在位置处的n个同期中尺度数据MERRA数据序列X1,X2,…,Xn(例如,风速、温度等);提取Y1中部分时刻(一般不超过总数据序列的25%)的风速数据Y2’作为数据预测模型的检验数据,剩余时刻的数据序列Y1’作为数据预测模型的训练数据;提取与数据序列Y1’对应时刻的MERRA数据集X11’,X21’,…,Xn1’;提取与数据序列Y2’对应时刻的MERRA数据集X12’,X22’,…,Xn2’,以对数据预测模型的训练进行数据准备。
在本发明示例性实施例中,在使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练时,可首先将测风数据序列中的无缺失部分的数据序列分成训练数据和检验数据,然后将与训练数据相应的同期中尺度数据和训练数据分别作为训练的输入数据集和输出数据集,使用输入数据集和输出数据集对预设的数据预测模型中的神经网络模型进行训练,之后,使用检验数据和与检验数据相应的同期中尺度数据对训练后的数据预测模型进行检验,当检验不通过时,根据用户的输入对预设的数据预测模型进行更新,对更新后的数据预测模型中的神经网络模型进行训练,并对训练后的数据预测模型进行检验,直至检验通过时结束训练。
在本发明示例性实施例中,神经网络模型可以是任意类型的神经网络模型,优选地,神经网络模型可以是支持向量回归(SVR)模型。例如,图2示出根据本发明示例性实施例的SVR的体系结构。如图2所示,SVR通过非线性映射,采用结构风险最小化原则,将处在低维空间且线性不可分的数据样本映射到高维空间,使样本数据线性可分,将其放在高维空间进行分类和预测。由于SVR算法能有效的避免局部极值问题,并且在样本信息有限的情况下,在模型的复杂性和学习能力之间寻求最佳值,因此具有很好的泛化能力。
当采用SVR时,在使用输入数据集和输出数据集对预设的数据预测模型中的神经网络模型进行训练时,可首先对输入数据集和输出数据集中的数据进行归一化处理,然后通过交叉验证选择回归的最佳惩罚参数和最佳核函数参数,最后使用最佳惩罚参数和最佳核函数参数对神经网络模型进行训练。
在对输入数据集和输出数据集中的数据进行归一化处理时,可采用的归一化映射其中,x,y∈Rn,xmin=min(x),xmax=max(x)。经过归一化处理,输数据集和输入出数据集中的数据可被归一化到[0,1]范围内。
在通过交叉验证选择回归的最佳惩罚参数和最佳核函数参数时,可首先分别选定惩罚参数c和核函数参数g的范围,然后利用K-CV方法,将分类准确率最高时的惩罚参数c和核函数参数g分别确定为最佳惩罚参数和最佳核函数参数。当得到多组符合条件的惩罚参数c和核函数参数g的情况时,选择其中惩罚参数c最小的那组惩罚参数c和核函数参数g作为最终的最佳惩罚参数和最佳核函数参数。如果此时相符的最小的惩罚参数c又有多组核函数参数g,则选择第一组惩罚参数c和核函数参数g作为最佳惩罚参数和最佳核函数参数。其中,回归的最佳参数可由例如MATLAB中的SVMcgForRegress.m来实现。
在使用检验数据和与检验数据相应的同期中尺度数据对训练后的数据预测模型进行检验时,可首先基于训练后的数据预测模型,根据与检验数据相应的同期中尺度数据计算与检验数据相应的预测数据,然后将检验数据和预测数据进行比较,根据比较结果对训练后的数据预测模型进行检验。例如,可将检验数据和预测数据的均值、相关系数、均方根误差、平均绝对误差等中的至少一个进行比较,如果比较得到的值达到预先设定的阈值,则说明此数据预测模型通过检验,如果比较得到的值无法达到预先设定的阈值,则说明此数据预测模型未通过检验,可通过增加输入参数(诸如地形参数、中尺度数据的风向参数)或更换数据预测模型来进行数据预测模型的重新搭建。例如,以测风数据中的风速为例,如果检验数据中风速的均值10.6m/s和预测数据中风速的均值10.5m/s的差值0.1m/s小于预先设定的0.15m/s,则说明数据预测模型通过检验,如果检验数据中风速的均值10.7m/s和预测数据中风速的均值10.5m/s的差值0.2m/s大于预先设定的0.15m/s,则说明数据预测模型未通过检验。当数据预测模型未通过检验时,如果数据预测模型中未包括地形参数,则将地形参数增加到数据预测模型中,以提高数据预测模型的预测效果,使得数据预测模型通过检验。
在本发明示例性实施例中,数据预测模型可包括神经网络模型。其中,神经网络模型可用于预测具有第一时间间隔的缺失部分的数据序列。当数据预测模型包括神经网络模型时,在使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练时,可使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据,对预设的数据预测模型中的神经网络模型进行训练。
在步骤S103,基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列。
在本发明示例性实施例中,数据预测模型可至少包括神经网络模型和马尔科夫预测模型。其中,神经网络模型可用于预测具有第一时间间隔的缺失部分的数据序列,马尔科夫预测模型可用于预测具有第二时间间隔的缺失部分的数据。当数据预测模型包括神经网络模型和马尔科夫预测模型时,在基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列时,可基于训练后的数据预测模型中的神经网络模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列。例如,将与缺失部分的数据相应的同期中尺度数据输入到神经网络模型中,神经网络模型计算并输出测风数据序列的缺失部分的数据序列(例如,时间间隔为1小时的测风数据序列的缺失部分的数据序列)。
例如,当测风数据中5月3号的数据缺失时,可将5月3号的中尺度数据输入到神经网络模型中,计算得到5月3号的数据序列(即0:00、1:00、2:00、3:00、4:00、5:00、6:00、7:00、8:00、9:00、10:00、11:00、12:00、13:00、14:00、15:00、16:00、17:00、18:00、19:00、20:00、21:00、22:00、23:00的数据序列)。
在步骤S103计算得到所述测风数据序列的缺失部分的数据序列之后,在步骤S104,基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和计算出的所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
在本发明示例性实施例中,在计算测风数据的缺失部分的数据时,可首先根据所述测风数据序列的缺失部分的数据序列对预处理后的测风数据进行更新,然后针对无缺失部分的数据生成每个时刻点离散化的变量值列表,并分别针对每个变量值生成每个时刻点的百分位值(其中,百分位值是指样本总体中在指定样本值以下的样本数占总样本数的百分比),根据百分位值确定每个变量值在每个时刻的状态(例如,风速的快慢、温度的高低等)。然后,根据无缺失部分的数据中的每个变量值在每个时刻的状态确定状态转移概率矩阵,最后针对缺失部分的数据中的每个变量值,在每个时刻依次根据确定的预测参照状态以及状态转移概率矩阵,计算缺失部分的数据中的当前时刻的状态;根据计算得到的当前时刻的状态预测当前时刻的数据。其中,可将与缺失部分最接近的无缺失部分的时刻的状态确定为预测参照状态。其中,在确定每个变量值在每个时刻的状态之前,可预先对每个状态进行定义。
在本发明示例性实施例中,在针对缺失部分的数据中的每个时刻,依次根据前一时刻的状态以及状态转移概率矩阵,计算缺失部分的数据中的当前时刻的状态的步骤之前,所述方法还可包括:针对缺失部分的数据每隔第二时间间隔确定一个时刻,其中,第二时间间隔小于第一时间间隔。第二时间间隔可以根据用户需要进行设置,例如,第二时间间隔可以是10分钟、15分钟、20分钟等。根据本申请的实施例,第二时间间隔可以是具有较小尺度的时间间隔。在以下的实施例中,以10分钟作为第二时间间隔的示例进行说明,但是本领域的技术人员应理解,这仅是一个示例而不是限制第二时间间隔的范围。
当数据预测模型包括神经网络模型和马尔科夫预测模型时,在基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据时,可基于训练后的数据预测模型中的马尔科夫预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。例如,将预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列输入到马尔科夫预测模型中,马尔科夫预测模型计算并输出测风数据序列的缺失部分的数据(例如,时间间隔为10分钟的测风数据序列的缺失部分的数据)。
在本发明示例性实施例中,在计算测风数据的缺失部分的数据时,当计算缺失部分的具有第一时间间隔并具有第二时间间隔的时刻的数据时,可将通过神经网络模型计算得到的时刻的数据和通过马尔科夫预测模型计算得到的相应时刻的数据进行加权平均,并将加权平均得到的平均值作为所述时刻的数据,从而提高预测结果的准确性。另外,还可获取与加权平均得到的平均值相应的状态,并根据获取的状态对预测参照状态进行更新。例如,在计算缺失部分的整点时刻的数据(例如,1:00的风速数据)时,可将通过神经网络模型计算得到的整点时刻的数据和通过马尔科夫预测模型计算得到相应时刻的数据进行加权平均,并将加权平均得到的平均值作为整点时刻的数据(例如,1:00的风速数据),然后可将预测参照状态更新为获取的与加权平均得到的平均值相应的状态。
例如,当测风数据中5月1号的12:30至14:30的风速数据缺失时,可通过马尔科夫预测模型首先获取与12:30之前的最后一个风速数据(例如,12:20的风速数据)相应的风速状态(例如,无风、软风、轻风、微风、和风、大风、烈风、狂风等),然后将获取的状态确定为预测参照状态,之后,根据预测参照状态和状态转移概率矩阵计算12:30、12:40、12:50和13:00的风速状态,并根据计算得到的12:30、12:40、12:50和13:00的风速状态分别预测12:30、12:40、12:50和13:00的风速数据。获取之前通过神经网络模型计算得到的整点时刻的数据中13:00的风速数据,将通过神经网络模型计算得到的整点时刻的数据中13:00的风速数据和通过马尔科夫预测模型计算得到的13:00的风速数据进行加权平均,并且将加权平均值确定为13:00的风速数据。在确定13:00的风速数据之后,获取与13:00的风速数据相应的风速状态,并且将预测参照状态更新为与13:00的风速数据相应的风速状态,例如,微风。
之后,根据更新后的预测参照状态和状态转移概率矩阵计算13:10、13:20、13:30、13:40、13:50和14:00的风速状态,并根据计算得到的13:10、13:20、13:30、13:40、13:50和14:00的风速状态分别预测13:10、13:20、13:30、13:40、13:50和14:00的风速数据。获取之前通过神经网络模型计算得到的整点时刻的数据中14:00的风速数据,将通过神经网络模型计算得到的整点时刻的数据中14:00的风速数据和通过马尔科夫预测模型计算得到的14:00的风速数据进行加权平均,并且将加权平均值确定为14:00的风速数据。在确定14:00的风速数据之后,获取与14:00的风速数据相应的风速状态,并且将预测参照状态更新为与14:00的风速数据相应的风速状态,例如,微风。
之后,根据再次更新后的预测参照状态和状态转移概率矩阵计算14:10、14:20和14:30的风速状态,并根据计算得到的14:10、14:20和14:30的风速状态分别预测14:10、14:20和14:30的风速数据。
根据本发明示例性实施例的缺失的测风数据的预测方法,通过对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练,基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据,从而提高了测风数据的缺失部分的数据的准确性。
以上已经结合图1和图2对根据本发明示例性实施例的缺失的测风数据的预测方法进行了描述。在下文中,将参照图3对根据本发明示例性实施例的缺失的测风数据的预测装置及其模块进行描述。
图3示出根据本发明示例性实施例的缺失的测风数据的预测装置。
参照图3,缺失的测风数据的预测装置包括数据处理模块31、模型训练模块32、第一计算模块33和第二计算模块34。
数据处理模块31,被配置为对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列。
在本发明示例性实施例中,测风数据可包括缺失部分的数据和无缺失部分的数据,测风数据序列可包括缺失部分的数据序列和无缺失部分的数据序列。第一时间间隔可以根据用户需要进行设置,例如,第一时间间隔可以是1小时、2小时、3小时等整数个小时,也可以是非整数个小时(诸如40分钟、50分钟、80分钟等)。根据本申请的实施例,第一时间间隔可以是具有较大尺度的时间间隔。在以下的实施例中,以1小时作为第一时间间隔的示例进行说明,但是本领域的技术人员应理解,这仅是一个示例而不是限制第一时间间隔的范围。
在本发明示例性实施例中,数据处理模块31可被配置为对输入的测风数据进行异常数据筛选和清除处理。
在本发明示例性实施例中,所述装置还可包括:标签补充模块,被配置为针对预处理后的测风数据中缺失部分的数据补充缺失的时间标签。
在本发明示例性实施例中,在对输入的测风数据进行预处理之后,通过数据处理模块31将预处理后的测风数据转换为具有第一时间间隔的测风数据序列。例如,如果第一时间间隔被确定为1小时,则通过数据处理模块31将以上清洗完的测风数据转化为逐小时数据(即,时间间隔为1小时的测风数据序列),从而便于进行后续的计算。
模型训练模块32,被配置为使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练。
在本发明示例性实施例中,与无缺失部分相应的同期中尺度数据可以是同期的一套或者多套中尺度数据。例如,可在选定的中尺度数据测量区域中的多个位置中的每个位置处分别测量得到一套中尺度数据。
在本发明示例性实施例中,所述装置还可包括:相关度计算模块,被配置为分别计算多套中尺度数据中的每套中尺度数据与测风数据的相关度;和数据选择模块,被配置为根据计算得到的相关度,从多套中尺度数据中选择至少一套中尺度数据用于对预设的数据预测模型进行训练。这样,可在使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练之前,确定用于对预设的数据预测模型进行训练的中尺度数据。
在本发明示例性实施例中,模型训练模块32可被配置为:将测风数据序列中的无缺失部分的数据序列分成训练数据和检验数据;将与训练数据相应的同期中尺度数据和训练数据分别作为训练的输入数据集和输出数据集,使用输入数据集和输出数据集对预设的数据预测模型中的神经网络模型进行训练;使用检验数据和与检验数据相应的同期中尺度数据对训练后的数据预测模型进行检验;当检验不通过时,根据用户的输入对预设的数据预测模型进行更新,对更新后的数据预测模型中的神经网络模型进行训练,并对训练后的数据预测模型进行检验,直至检验通过时结束训练。
在本发明示例性实施例中,神经网络模型可以是任意类型的神经网络模型,优选地,神经网络模型可以是SVR。当采用SVR时,模型训练模块32可被配置为:输入数据集和输出数据集中的数据进行归一化处理;通过交叉验证选择回归的最佳惩罚参数和最佳核函数参数;使用最佳惩罚参数和最佳核函数参数对神经网络模型进行训练。
在本发明示例性实施例中,模型训练模块32可被配置为:基于训练后的数据预测模型,根据与检验数据相应的同期中尺度数据计算与检验数据相应的预测数据;将检验数据和预测数据进行比较,根据比较结果对训练后的数据预测模型进行检验。
在本发明示例性实施例中,数据预测模型可包括神经网络模型。其中,神经网络模型可用于预测具有第一时间间隔的缺失部分的数据序列。当数据预测模型包括神经网络模型时,模型训练模块32可被配置为使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据,对预设的数据预测模型中的神经网络模型进行训练。
第一计算模块33,被配置为基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列。
在本发明示例性实施例中,数据预测模型可至少包括神经网络模型和马尔科夫预测模型。其中,神经网络模型可用于预测具有第一时间间隔的缺失部分的数据序列,马尔科夫预测模型可用于预测具有第二时间间隔的缺失部分的数据。当数据预测模型包括神经网络模型和马尔科夫预测模型时,第一计算模块33可被配置为基于训练后的数据预测模型中的神经网络模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列。
第二计算模块34,被配置为基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和计算出的所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
在本发明示例性实施例中,第二计算模块34可被配置为:根据所述测风数据序列的缺失部分的数据序列对预处理后的测风数据进行更新;针对无缺失部分的数据生成每个时刻点离散化的变量值列表,并分别针对每个变量值生成每个时刻点的百分位值,根据百分位值确定每个变量值在每个时刻的状态;根据无缺失部分的数据中的每个变量值在每个时刻的状态确定状态转移概率矩阵;针对缺失部分的数据中的每个变量值,在每个时刻依次根据确定的预测参照状态以及状态转移概率矩阵,计算缺失部分的数据中的当前时刻的状态;根据计算得到的当前时刻的状态预测当前时刻的数据。其中,可将与缺失部分最接近的无缺失部分的时刻的状态确定为预测参照状态。其中,所述装置还可包括:状态定义模块,被配置为在确定每个变量值在每个时刻的状态之前,预先对每个状态进行定义。
在本发明示例性实施例中,所述装置还可包括:时刻确定模块,被配置为针对缺失部分的数据每隔第二时间间隔确定一个时刻,其中,第二时间间隔小于第一时间间隔,第二时间间隔可以根据用户需要进行设置。根据本申请的实施例,第二时间间隔可以是具有较小尺度的时间间隔。在以下的实施例中,以10分钟作为第二时间间隔的示例进行说明,但是本领域的技术人员应理解,这仅是一个示例而不是限制第二时间间隔的范围。
当数据预测模型包括神经网络模型和马尔科夫预测模型时,第二计算模块34可被配置为基于训练后的数据预测模型中的马尔科夫预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
第二计算模块34可被配置为:当计算缺失部分的同时具有第一时间间隔和第二时间间隔的时刻的数据时,将神经网络模型计算得到的所述时刻的数据和马尔科夫预测模型计算得到的相应时刻的数据进行加权平均,将加权平均得到的平均值作为所述时刻的数据;获取与加权平均得到的平均值相应的状态,并根据获取的状态对预测参照状态进行更新。例如,在计算缺失部分的1:00的风速数据时,可将通过神经网络模型计算得到的1:00的风速数据和通过马尔科夫预测模型计算得到1:00的风速数据进行加权平均,并将加权平均得到的平均值作为1:00的风速数据,然后可获取与1:00的风速数据相应的1:00的风速状态,将预测参照状态更新为获取的与1:00的风速状态。
根据本发明示例性实施例的缺失的测风数据的预测装置,通过数据处理模块31对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,通过模型训练模块32使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练,通过第一计算模块33基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,通过第二计算模块34基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据,从而提高了测风数据的缺失部分的数据的准确性。
此外,根据本发明的示例性实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,程序被执行时实现根据本发明的缺失的测风数据的预测方法的步骤。
作为示例,程序被执行时可实现以下步骤:对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练,基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
以上已经结合图3对根据本发明示例性实施例的缺失的测风数据的预测装置进行了描述。接下来,结合图4对根据本发明的示例性实施例的计算装置进行描述。
图4示出根据本发明示例性实施例的计算装置的示意图。
参照图4,根据本发明示例性实施例的计算装置4,包括存储器41、处理器42及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现根据本发明的缺失的测风数据的预测方法的步骤。
作为示例,处理器可被配置为执行包括以下缺失的测风数据的预测方法的步骤的程序:对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练,基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
以上已参照图1至图3描述了根据本发明示例性实施例的缺失的测风数据的预测方法及装置。然而,应该理解的是:图3中所示的缺失的测风数据的预测装置及其模块可分别被配置为执行特定功能的软件、硬件、固件或上述项的任意组合,图4中所示的计算装置并不限于包括以上示出的组件,而是可根据需要增加或删除一些组件,并且以上组件也可被组合。
根据本发明示例性实施例的缺失的测风数据的预测方法及装置,通过对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练,基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据,从而提高了测风数据的缺失部分的数据的准确性。
尽管已经参照其示例性实施例具体显示和描述了本发明,但是本领域的技术人员应该理解,在不脱离权利要求所限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种改变。
Claims (22)
1.一种缺失的测风数据的预测方法,包括:
对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,其中,测风数据包括缺失部分的数据和无缺失部分的数据,测风数据序列包括缺失部分的数据序列和无缺失部分的数据序列;
使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练;
基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列;
基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
2.根据权利要求1所述的预测方法,其中,对输入的测风数据进行预处理的步骤包括:
对输入的测风数据进行异常数据筛选和清除处理。
3.根据权利要求1所述的预测方法,其中,对输入的测风数据进行预处理的步骤之后,所述方法还包括:
针对预处理后的测风数据中缺失部分的数据补充缺失的时间标签。
4.根据权利要求1所述的预测方法,其中,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练的步骤之前,所述方法还包括:
分别计算多套中尺度数据中的每套中尺度数据与测风数据的相关度;
根据计算得到的相关度,从多套中尺度数据中选择至少一套中尺度数据用于对预设的数据预测模型进行训练。
5.根据权利要求1所述的预测方法,其中,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练的步骤包括:
将测风数据序列中的无缺失部分的数据序列分成训练数据和检验数据;
将与训练数据相应的同期中尺度数据和训练数据分别作为训练的输入数据集和输出数据集,使用输入数据集和输出数据集对预设的数据预测模型中的神经网络模型进行训练;
使用检验数据和与检验数据相应的同期中尺度数据对训练后的数据预测模型进行检验;
当检验不通过时,根据用户的输入对预设的数据预测模型进行更新,对更新后的数据预测模型中的神经网络模型进行训练,并对训练后的数据预测模型进行检验,直至检验通过时结束训练。
6.根据权利要求5所述的预测方法,其中,神经网络模型是支持向量回归模型,
其中,使用输入数据集和输出数据集对预设的数据预测模型中的神经网络模型进行训练的步骤包括:
对输入数据集和输出数据集中的数据进行归一化处理;
通过交叉验证选择回归的最佳惩罚参数和最佳核函数参数;
使用最佳惩罚参数和最佳核函数参数对神经网络模型进行训练。
7.根据权利要求5所述的预测方法,其中,计算测风数据的缺失部分的数据的步骤包括:
根据所述测风数据序列的缺失部分的数据序列对预处理后的测风数据进行更新;
针对无缺失部分的数据生成每个时刻点离散化的变量值列表,并分别针对每个变量值生成每个时刻点的百分位值,根据百分位值确定每个变量值在每个时刻的状态;
根据无缺失部分的数据中的每个变量值在每个时刻的状态确定状态转移概率矩阵;
针对缺失部分的数据中的每个变量值,在每个时刻依次根据确定的预测参照状态以及状态转移概率矩阵,计算缺失部分的数据中的当前时刻的状态,其中,将与缺失部分最接近的无缺失部分的时刻的状态确定为预测参照状态;
根据计算得到的当前时刻的状态预测当前时刻的数据,
其中,在针对缺失部分的数据中的每个变量值,在每个时刻依次根据确定的预测参照状态以及状态转移概率矩阵,计算缺失部分的数据中的当前时刻的状态的步骤之前,所述方法还包括:
针对缺失部分的数据每隔第二时间间隔确定一个时刻,其中,第二时间间隔小于第一时间间隔。
8.根据权利要求5所述的预测方法,其中,使用检验数据和与检验数据相应的同期中尺度数据对训练后的数据预测模型进行检验的步骤包括:
基于训练后的数据预测模型,根据与检验数据相应的同期中尺度数据计算与检验数据相应的预测数据;
将检验数据和预测数据进行比较,根据比较结果对训练后的数据预测模型进行检验。
9.根据权利要求1-8所述的预测方法,其中,数据预测模型至少包括神经网络模型和马尔科夫预测模型,
其中,使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练的步骤包括:
使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据,对预设的数据预测模型中的神经网络模型进行训练,
其中,基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列的步骤包括:
基于训练后的数据预测模型中的神经网络模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,
其中,基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据的步骤包括:
基于训练后的数据预测模型中的马尔科夫预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
10.根据权利要求9所述的预测方法,其中,计算测风数据的缺失部分的数据的步骤包括:
当计算缺失部分的同时具有第一时间间隔和第二时间间隔的时刻的数据时,将神经网络模型计算得到的所述时刻的数据和马尔科夫预测模型计算得到的相应时刻的数据进行加权平均,将加权平均得到的平均值作为所述时刻的数据;
获取与加权平均得到的平均值相应的状态,并根据获取的状态对预测参照状态进行更新。
11.一种缺失的测风数据的预测装置,包括:
数据处理模块,被配置为对输入的测风数据进行预处理,并将预处理后的测风数据转换为具有第一时间间隔的测风数据序列,其中,测风数据包括缺失部分的数据和无缺失部分的数据,测风数据序列包括缺失部分的数据序列和无缺失部分的数据序列;
模型训练模块,被配置为使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据对预设的数据预测模型进行训练;
第一计算模块,被配置为基于训练后的数据预测模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列;和
第二计算模块,被配置为基于训练后的数据预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
12.根据权利要求11所述的预测装置,其中,数据处理模块被配置为:
对输入的测风数据进行异常数据筛选和清除处理。
13.根据权利要求11所述的预测装置,其中,所述装置还包括:
标签补充模块,被配置为针对预处理后的测风数据中缺失部分的数据补充缺失的时间标签。
14.根据权利要求11所述的预测装置,其中,所述装置还包括:
相关度计算模块,被配置为分别计算多套中尺度数据中的每套中尺度数据与测风数据的相关度;和
数据选择模块,被配置为根据计算得到的相关度,从多套中尺度数据中选择至少一套中尺度数据用于对预设的数据预测模型进行训练。
15.根据权利要求11所述的预测装置,其中,模型训练模块被配置为:
将测风数据序列中的无缺失部分的数据序列分成训练数据和检验数据;
将与训练数据相应的同期中尺度数据和训练数据分别作为训练的输入数据集和输出数据集,使用输入数据集和输出数据集对预设的数据预测模型中的神经网络模型进行训练;
使用检验数据和与检验数据相应的同期中尺度数据对训练后的数据预测模型进行检验;
当检验不通过时,根据用户的输入对预设的数据预测模型进行更新,对更新后的数据预测模型中的神经网络模型进行训练,并对训练后的数据预测模型进行检验,直至检验通过时结束训练。
16.根据权利要求15所述的预测装置,其中,神经网络模型是支持向量回归模型,
其中,模型训练模块被配置为:
对输入数据集和输出数据集中的数据进行归一化处理;
通过交叉验证选择回归的最佳惩罚参数和最佳核函数参数;
使用最佳惩罚参数和最佳核函数参数对神经网络模型进行训练。
17.根据权利要求15所述的预测装置,其中,第二计算模块被配置为:
根据所述测风数据序列的缺失部分的数据序列对预处理后的测风数据进行更新;
针对无缺失部分的数据生成每个时刻点离散化的变量值列表,并分别针对每个变量值生成每个时刻点的百分位值,根据百分位值确定每个变量值在每个时刻的状态;
根据无缺失部分的数据中的每个变量值在每个时刻的状态确定状态转移概率矩阵;
针对缺失部分的数据中的每个变量值,在每个时刻依次根据确定的预测参照状态以及状态转移概率矩阵,计算缺失部分的数据中的当前时刻的状态,其中,将与缺失部分最接近的无缺失部分的时刻的状态确定为预测参照状态;
根据计算得到的当前时刻的状态预测当前时刻的数据,
其中,所述装置还包括:
时刻确定模块,被配置为针对缺失部分的数据每隔第二时间间隔确定一个时刻,其中,第二时间间隔小于第一时间间隔。
18.根据权利要求15所述的预测装置,其中,模型训练模块被配置为:
基于训练后的数据预测模型,根据与检验数据相应的同期中尺度数据计算与检验数据相应的预测数据;
将检验数据和预测数据进行比较,根据比较结果对训练后的数据预测模型进行检验。
19.根据权利要求11-18所述的预测装置,其中,数据预测模型至少包括神经网络模型和马尔科夫预测模型,
其中,模型训练模块被配置为使用测风数据序列中的无缺失部分的数据序列和与无缺失部分相应的同期中尺度数据,对预设的数据预测模型中的神经网络模型进行训练,
其中,第一计算模块被配置为基于训练后的数据预测模型中的神经网络模型,根据与缺失部分的数据相应的同期中尺度数据计算得到所述测风数据序列的缺失部分的数据序列,
其中,第二计算模块被配置为基于训练后的数据预测模型中的马尔科夫预测模型,根据预处理后的测风数据中的无缺失部分的数据和所述测风数据序列的缺失部分的数据序列,计算测风数据的缺失部分的数据。
20.根据权利要求19所述的预测装置,其中,第二计算模块被配置为:
当计算缺失部分的同时具有第一时间间隔和第二时间间隔的时刻的数据时,将神经网络模型计算得到的所述时刻的数据和马尔科夫预测模型计算得到的相应时刻的数据进行加权平均,将加权平均得到的平均值作为所述时刻的数据;
获取与加权平均得到的平均值相应的状态,并根据获取的状态对预测参照状态进行更新。
21.一种计算机可读存储介质,其上存储有计算机程序,其中,所述程序被执行时实现权利要求1至10任一项所述的方法的步骤。
22.一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910092396.XA CN111507495A (zh) | 2019-01-30 | 2019-01-30 | 缺失的测风数据的预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910092396.XA CN111507495A (zh) | 2019-01-30 | 2019-01-30 | 缺失的测风数据的预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111507495A true CN111507495A (zh) | 2020-08-07 |
Family
ID=71875551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910092396.XA Pending CN111507495A (zh) | 2019-01-30 | 2019-01-30 | 缺失的测风数据的预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111507495A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627546A (zh) * | 2021-08-16 | 2021-11-09 | 阳光新能源开发有限公司 | 一种反射率数据的确定方法、电量确定方法及相关装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184072A (zh) * | 2015-08-31 | 2015-12-23 | 中国华能集团清洁能源技术研究院有限公司 | 数据插补的方法和装置 |
CN108564484A (zh) * | 2018-04-11 | 2018-09-21 | 中国电建集团成都勘测设计研究院有限公司 | 风电场测风代表年滑动选取方法 |
CN109242115A (zh) * | 2018-09-17 | 2019-01-18 | 东北大学 | 一种基于gan的风机轮毂测风缺失数据的插补方法 |
CN109272157A (zh) * | 2018-09-12 | 2019-01-25 | 中交信息技术国家工程实验室有限公司 | 一种基于门控神经网络的高速公路交通流参数预测方法及系统 |
-
2019
- 2019-01-30 CN CN201910092396.XA patent/CN111507495A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184072A (zh) * | 2015-08-31 | 2015-12-23 | 中国华能集团清洁能源技术研究院有限公司 | 数据插补的方法和装置 |
CN108564484A (zh) * | 2018-04-11 | 2018-09-21 | 中国电建集团成都勘测设计研究院有限公司 | 风电场测风代表年滑动选取方法 |
CN109272157A (zh) * | 2018-09-12 | 2019-01-25 | 中交信息技术国家工程实验室有限公司 | 一种基于门控神经网络的高速公路交通流参数预测方法及系统 |
CN109242115A (zh) * | 2018-09-17 | 2019-01-18 | 东北大学 | 一种基于gan的风机轮毂测风缺失数据的插补方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627546A (zh) * | 2021-08-16 | 2021-11-09 | 阳光新能源开发有限公司 | 一种反射率数据的确定方法、电量确定方法及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113496104B (zh) | 基于深度学习的降水预报订正方法及系统 | |
Hu et al. | A hybrid approach based on the Gaussian process with t-observation model for short-term wind speed forecasts | |
CN114254561A (zh) | 一种内涝预测方法、系统及存储介质 | |
CN111861023B (zh) | 基于统计学的混合风电功率预测方法、装置 | |
CN111105068B (zh) | 基于序回归学习的数值模式订正的方法 | |
KR20210017342A (ko) | 과거 데이터에 기초한 시계열 예측 방법 및 장치 | |
CN107730097B (zh) | 一种母线负荷预测方法、装置及计算设备 | |
CN113822418A (zh) | 一种风电场功率预测方法、系统、设备和存储介质 | |
CN112180471B (zh) | 天气预报方法、装置、设备及存储介质 | |
CN110543987A (zh) | 一种智能气候预测系统 | |
CN114165392A (zh) | 一种风电机组功率异常诊断方法、装置及存储介质 | |
CN116595394A (zh) | 风速修正模型的训练方法及风速预测方法、设备和介质 | |
CN115908051A (zh) | 一种电力系统储能容量确定方法 | |
CN114881286A (zh) | 一种基于深度学习的短时降水预测方法 | |
CN113033910A (zh) | 一种光伏发电功率的预测方法、存储介质及终端设备 | |
CN113449920A (zh) | 一种风电功率预测方法、系统及计算机可读介质 | |
CN113053536A (zh) | 一种基于隐马尔科夫模型的传染病预测方法、系统和介质 | |
CN112802011A (zh) | 一种基于vgg-bls的风机叶片缺陷检测方法 | |
CN110826810B (zh) | 一种空间推理与机器学习相结合的区域降雨预测方法 | |
CN117220283A (zh) | 一种光伏发电功率预测方法、装置和设备 | |
CN111507495A (zh) | 缺失的测风数据的预测方法及装置 | |
CN115905997A (zh) | 基于预测偏差优化的风电机组气象灾害预警方法及系统 | |
CN116029440A (zh) | 光伏电站超短期功率预测方法和装置 | |
CN115907189A (zh) | 基于混合模型的大风预报订正方法 | |
CN115310648A (zh) | 一种基于多气象变量模型识别的中长期风电功率组合预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |