CN114911788A - 一种数据插补方法、装置及存储介质 - Google Patents

一种数据插补方法、装置及存储介质 Download PDF

Info

Publication number
CN114911788A
CN114911788A CN202210829727.5A CN202210829727A CN114911788A CN 114911788 A CN114911788 A CN 114911788A CN 202210829727 A CN202210829727 A CN 202210829727A CN 114911788 A CN114911788 A CN 114911788A
Authority
CN
China
Prior art keywords
data
data sequence
sequence
time
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210829727.5A
Other languages
English (en)
Other versions
CN114911788B (zh
Inventor
张子良
马宝林
易侃
文仁强
张皓
杜梦蛟
王浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges Corp
Original Assignee
China Three Gorges Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges Corp filed Critical China Three Gorges Corp
Priority to CN202210829727.5A priority Critical patent/CN114911788B/zh
Publication of CN114911788A publication Critical patent/CN114911788A/zh
Application granted granted Critical
Publication of CN114911788B publication Critical patent/CN114911788B/zh
Priority to EP22207321.5A priority patent/EP4307172A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Fuzzy Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Complex Calculations (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Recording Measured Values (AREA)

Abstract

本发明公开了一种数据插补方法、装置及存储介质,包括:获取待处理风数据序列,待处理风数据序列包括与第一时间段对应的第一数据序列、第二时间段对应的空白数据序列及第三时间段对应的第二数据序列;对第一数据序列和第二数据序列分别从第一时间变化方向和第二时间变化方向进行循环取值,并分别基于各次取值的各数据之间的关系预测第二时间段中目标时间点对应的第一数据和第二数据,得到第一数据序列和第二数据序列,最后基于目标时间点对第一数据序列与第二数据序列中的对应数据进行融合处理,从而确定空白数据序列中的数据。本方案从两个时间方向对空白数据进行预测,提升了数据插补的精度,提高了风资源评估的准确性。

Description

一种数据插补方法、装置及存储介质
技术领域
本发明涉及数据处理领域,具体涉及一种数据插补方法、装置及存储介质。
背景技术
数据分析时常会出现数据缺失的问题,通常可以通过数据插补技术对缺失部分的数据进行插补。以海上风电领域的数据插补为例,风资源测量是海上风电场前期规划阶段的重要环节,准确的风资源测量能够有效降低风电场的投资建设成本,风资源测量中要求风速和风向等数据需满足有效性、完整性、合理性等指标。现有常用的风资源测量方法是建立固定式测风塔,通过测风塔上的测风装置来测量风速风向。相比于陆上,海上固定式测风塔建设成本高昂,达到千万量级。随着海上风电向深远海发展,测风塔的成本会进一步增加。
漂浮式激光雷达测风技术因其成本低、可回收利用、布放灵活等优点被认为是一种应用潜力巨大的新型海上风资源测量技术,可显著降低海上风电场前期测风成本。然而激光雷达测风受海上环境及设备的影响,例如大雾天气、台风、极潮天气、设备故障、缺电等,极易造成测风数据不完整、数据错误、数据不合理等问题,在经过数据治理后会出现不同时间长度的数据缺失现象,导致数据的完整性无法满足指标要求,最终影响风资源评估的准确性,进而影响到风电场的规划和建设。目前常用的数据插补方法根据插补源的不同可以分为同塔自补、异塔插补、再分析数据插补等,基于不同插补源,可采用线性、非线性或神经网络的方法对数据进行插补。由于激光雷达测风数据经常会出现各个高度层数据均缺失的现象,该情况下无法使用同塔自补方法。同时在海上,漂浮式激光雷达通常为唯一的测风装置,因此无法使用异塔插补方法,且分析数据插补的准确度取决于再分析数据的精度,不确定性较大。
发明内容
有鉴于此,本发明实施例提供了一种数据插补方法、装置、电子设备及存储介质,以提升数据插补的精度。
根据第一方面,本发明实施例提供了一种数据插补方法,包括:
获取待处理风数据序列,所述待处理风数据序列包括与第一时间段对应的第一数据序列、第二时间段对应的空白数据序列以及第三时间段对应的第二数据序列;
基于第一步长在所述第一数据序列中沿第一时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第一数据,将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列;
基于第二步长在所述第二数据序列中沿第二时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第二数据,将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列;
基于所述目标时间点对所述第一数据序列与所述第二数据序列中的对应数据进行融合处理,确定所述空白数据序列中的各个数据。
本实施例提供的数据插补方法,通过对第一数据序列和第二数据序列分别从第一时间变化方向和第二时间变化方向进行循环取值,并分别基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第一数据和第二数据,得到第一数据序列和第二数据序列,最后基于目标时间点对第一数据序列与第二数据序列中的对应数据进行融合处理,从而确定空白数据序列中的各个数据。采用双向预测的方法对空白数据进行插补,无需其他参考数据,提升数据插补的精度,提高了风资源评估的准确性。
结合第一方面,在一种实施方式中,所述基于第一步长在所述第一数据序列中沿第一时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第一数据,将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列,包括:
基于第一步长在所述第一数据序列中沿第一时间变化方向取值,以获取第一数据序列中的第一目标数据序列;
将所述第一目标数据序列输入预设第一时间序列模型,基于所述第一目标数据序列中各数据之间的关系进行预测,以确定所述第二时间段中目标时间点对应的第一数据;
将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列。
结合第一方面,在一种实施方式中,所述将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列,包括:
将所述第二时间段中目标时间点对应的第一数据加入所述第一数据序列中,得到更新的第一数据序列;
基于第一步长在所述更新的第一数据序列中沿第一时间变化方向循环取值,以获取更新后的第一数据序列中的第一目标数据序列;
将所述更新后的第一数据序列中的第一目标数据序列输入预设第一时间序列模型,基于所述第一目标数据序列中各数据之间的关系进行预测,以更新所述第一数据序列。
结合第一方面,在一种实施方式中,所述基于第二步长在所述第二数据序列中沿第二时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第二数据,将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列,包括:
基于第二步长在所述第二数据序列中沿第二时间变化方向取值,以获取第二数据序列中的第二目标数据序列;
将所述第二目标数据序列输入预设第二时间序列模型,基于所述第二目标数据序列中各数据之间的关系进行预测,以确定所述第二时间段中目标时间点对应的第二数据;
将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列。
结合第一方面,在一种实施方式中,所述将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列,包括:
将所述第二时间段中目标时间点对应的第二数据加入所述第二数据序列中,得到更新的第二数据序列;
基于第二步长在所述更新的第二数据序列中沿第二时间变化方向循环取值,以获取更新后的第二数据序列中的第二目标数据序列;
将所述更新后的第二数据序列中的第二目标数据序列输入预设第二时间序列模型,基于所述第二目标数据序列中各数据之间的关系进行预测,以更新第二数据序列。
结合第一方面,在一种实施方式中,所述基于所述目标时间点对所述第一数据序列与所述第二数据序列中的对应数据进行融合处理,确定所述空白数据序列中的各个数据,包括:
基于所述目标时间点分别获取所述更新的第一数据序列和所述更新的第二数据序列中的第一对应数据和第二对应数据;
对所述第一对应数据和第二对应数据进行融合处理,以确定空白数据序列中的各个数据。
根据第二方面,本发明实施例提供了一种数据插补装置,包括:
数据获取模块,用于获取待处理风数据序列,所述待处理风数据序列包括与第一时间段对应的第一数据序列、第二时间段对应的空白数据序列以及第三时间段对应的第二数据序列;
第一更新模块,用于基于第一步长在所述第一数据序列中沿第一时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第一数据,将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列;
第二更新模块,用于基于第二步长在所述第二数据序列中沿第二时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第二数据,将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列;
空白数据确定模块,用于基于所述目标时间点对所述第一数据序列与所述第二数据序列中的对应数据进行融合处理,确定所述空白数据序列中的各个数据。
结合第一方面,在一种实施方式中,第一更新模块包括:
第一取值子单元,用于基于第一步长在所述第一数据序列中沿第一时间变化方向取值,以获取第一数据序列中的第一目标数据序列;
第一数据确定子单元,用于将所述第一目标数据序列输入预设第一时间序列模型,基于所述第一目标数据序列中各数据之间的关系进行预测,以确定所述第二时间段中目标时间点对应的第一数据;
第一数据序列确定子单元,用于将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列。
根据第三方面,本发明实施例提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中所述的数据插补方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的数据插补方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的数据插补方法的流程图;
图2是根据本发明实施例的数据插补方法的示意图;
图3是根据本发明实施例的数据插补方法的过程示意图;
图4是根据本发明实施例LSTM神经网络模型的结构示意图;
图5是根据本发明实施例的风速插补结果图;
图6是根据本发明实施例的风向插补结果图;
图7是根据本发明实施例的数据插补装置的结构框图;
图8是本发明实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对数据进行分析时,常会因为人为或自然原因导致数据的缺漏,这种时候需要对缺失的数据进行处理,用合理的数据代替缺失数据。以海上激光雷达采集的风资源数据为例,激光雷达测风设备容易受大雾、台风、极潮天气以及设备故障、缺电等影响,从而出现获得的风数据不完整、缺失或不合理等问题,继而导致风数据缺失,影响风资源评估的准确性。
根据本发明实施例,提供了一种数据插补方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种数据插补方法,可用于如手机、电脑、平板电脑等移动终端,图1是根据本发明实施例的数据插补方法的流程图,如图1所示,该流程包括如下步骤:
S11,获取待处理风数据序列,待处理风数据序列包括与第一时间段对应的第一数据序列、第二时间段对应的空白数据序列以及第三时间段对应的第二数据序列。
训练两个用于数据插补的神经网络模型,分别从两个方向的时间段的风数据对空白时间段的风数据进行插补,风数据可以是通过海上漂浮式激光雷达获取的风速数据和风向数据,风数据序列为在某一段时间内的根据预设时间间隔组成的。由于风速和风向具有随机性、波动性等特点,LSTM(Long Short-Term Memory,长短期记忆)作为一种专门用来解决时间序列数据分析的神经网络,具有高级的非线性映射能力,利用参数共享能够使模型延伸到各种形式并具备一定的泛化能力,因此,可以采用前向LSTM的神经网络模型和后向LSTM的神经网络模型。
获取雷达等设备采集的风数据后,对一段时间内的风数据按预设比例进行划分,将数据划分为训练集和测试集。训练集用于对数据插补模型进行训练,测试集用于检测数据插补模型的拟合度。由于时间序列必须是连续的,所以可以将前面一段时间的数据设定为训练集,后面一段时间的数据设定为测试集,待处理风数据序列为测试集。在数据划分前对所有数据进行归一化处理,从而降低数据插补模型的误差,加快模型的收敛速度,可以采用最大最小值归一化方法,具体不作限定。
在划分出待处理风数据序列后,对待处理风数据序列进行划分,待处理风数据序列中包括三个时间段,其中第一时间段和第三时间段分别有对应的第一数据序列和第二数据序列,在第一时间段和第三时间段之间的第二时间段的数据存在缺失。为了对第二时间段的空白数据序列进行插补,基于第二时间段的总时长,设定第一时间段的时间步长和第三时间段的时间步长,分别为第一步长和第二步长。时间步长指需要使用多长时间的风数据来插补空白数据序列中的一个风数据,时间步长的大小影响能够插补多长时间的数据,因此在设定时间步长时需要考虑需要插补的时长,即第二时间段的时长,根据经验,可设定时间步长为第二时间段时长的1.5倍以上,具体设定不做限定。
S12,基于第一步长在第一数据序列中沿第一时间变化方向循环取值,并基于各次取值的各数据之间的关系预测第二时间段中目标时间点对应的第一数据,将第一数据加入第一数据序列中,以更新第一数据序列得到第一数据序列。
第一时间变化方向可以是正向的时间变化,基于预设的第一步长在第一数据序列中沿第一时间变化方向循环取值,由于数据序列中的时间间隔是一致的,在时间间隔和第一步长确定的情况下,在第一数据序列中取的数据的数量是固定的,目标时间点即第二时间段中空白数据所在的时间点。具体地,根据所取数据中各个数据之间的关系对第二时间段中的第一个空白数据进行预测,并在得到该数据后,将该数据加入第一数据序列,更新第一数据序列,在下一次取值时,基于第一步长在更新的第一数据序列中进行取值,并根据获取的数据对第二时间段中的第二个空白数据进行预测,直至根据第一数据序列按正向的时间顺序预测第二时间段中的所有空白数据。对数据预测的方法可以通过将获取的数据基于预先训练好的数据插补模型,数据插补模型经过对数据之间的分析,输出预测的下一个数值。
S13,基于第二步长在第二数据序列中沿第二时间变化方向循环取值,并基于各次取值的各数据之间的关系预测第二时间段中目标时间点对应的第二数据,将第二数据加入第二数据序列中,以更新第二数据序列得到第二数据序列。
第二时间变化方向与第一时间变化方向相反,若第一时间变化方向为正向的时间变化,第二时间变化方向即反向的时间变化。基于预设的第二步长在第二数据序列中沿第二时间变化方向循环取值,由于数据序列中的时间间隔是一致的,在时间间隔和第二步长确定的情况下,在第二数据序列中取的数据的数量是固定的,目标时间点即第二时间段中空白数据所在的时间点。具体地,根据所取数据中各个数据之间的关系对第二时间段中的最后一个空白数据进行预测,并在得到该数据后,将该数据加入第二数据序列,更新第二数据序列,在下一次取值时,基于第二步长在更新的第二数据序列中进行取值,并根据获取的数据对第二时间段中的倒数第二个空白数据进行预测,直至根据第二数据序列按从后往前的顺序依次预测得到第二时间段中的所有空白数据。对数据预测的方法可以通过将获取的数据基于预先训练好的数据插补模型,数据插补模型经过对数据之间的分析,输出预测的下一个数值。
S14,基于目标时间点对第一数据序列与第二数据序列中的对应数据进行融合处理,确定空白数据序列中的各个数据。
由于第一数据序列和第二数据序列分别按不同的时间方向,分别从正向获取第一时间段之后的第二时间段中的空白数据序列以及从反向获取第三时间段之前的第二时间段中的空白数据序列,分别将两个方向预测得到的数据加入第一数据序列和第二数据序列。其中,预测得到的数据的时间点是重合的,即空白数据序列所在时刻的数据存在两个,空白数据序列所在的时间点为目标时间点,对同一目标时间点中分别通过第一数据序列和第二数据序列预测得到的数据进行融合处理,例如计算两个数据的平均值,从而确定目标时间点的每个数据,即空白数据序列中的各个数据。
本实施例提供的数据插补方法,通过对第一数据序列和第二数据序列分别从第一时间变化方向和第二时间变化方向进行循环取值,并分别基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第一数据和第二数据,得到第一数据序列和第二数据序列,最后基于目标时间点对第一数据序列与第二数据序列中的对应数据进行融合处理,从而确定空白数据序列中的各个数据。采用双向预测的方法对空白数据进行插补,无需其他参考数据,提升数据插补的精度,提高了风资源评估的准确性。
在本实施例中提供了更新第一数据序列的方法,对应于图1中的S12,该方法包括如下步骤:
S121,基于第一步长在第一数据序列中沿第一时间变化方向取值,以获取第一数据序列中的第一目标数据序列。
第一步长指需要使用多长时间的风数据来插补空白数据序列中的一个风数据,第一步长的大小与需要插补的空白时间段的总时长有关,即第二时间段的时长。另外,由于数据序列中数据间隔是固定的,因此,在确定第一步长和数据间隔的情况下,用于预测数据的数据序列中的数据数量是固定的。第一时间方向可以是前向的时间方向,即按正常时间顺序获取空白时间序列中的第一个数据之前的固定数量的数据,这些数据即第一目标数据序列。
S122,将第一目标数据序列输入预设第一时间序列模型,基于第一目标数据序列中各数据之间的关系进行预测,以确定第二时间段中目标时间点对应的第一数据。
预设第一时间序列模型可以为经过预先训练的数据插补模型,可以采用LSTM神经网络模型。将第一目标数据序列输入预先训练好的第一时间序列模型,第一时间序列模型经过对数据的处理,预测第二时间段中的第一个时间点对应的数据,由于第一时间段和第二时间段是连续的时间段,因此第二时间段中的第一个时间点即第一目标数据序列中最后一个数据对应时间点的下一时间点,这里目标时间点即第二时间段中的第一个时间点。
S123,将第二时间段中目标时间点对应的第一数据加入第一数据序列中,得到更新的第一数据序列。
将S122中获取的第二时间段中的数据加入第一数据序列,更新第一数据序列。
S124,基于第一步长在更新的第一数据序列中沿第一时间变化方向循环取值,以获取更新后的第一数据序列中的第一目标数据序列。
根据第一步长在更新后的第一数据序列中取值,为了获取第二时间段中的下一时刻对应的数据,根据第一步长,第一目标数据序列的取值从第二时间段中第一个空白数据对应的时间点的前一时间点开始,由此更新第一目标数据序列。
循环取值即根据第一目标数据序列预测第二时间段中目标时间点对应的数据后,将获取的数据加入第一数据序列并根据第一步长更新第一目标数据序列,保证更新的第一目标序列中的最后一个数据对应的时间点为第二时间段中的目标时间点的上一时间点。
S125,将更新后的第一数据序列中的第一目标数据序列输入预设第一时间序列模型,基于第一目标数据序列中各数据之间的关系进行预测,以更新第一数据序列。
通过将更新后的第一数据序列输入预设第一时间序列模型,预测第二时间段中目标时间点对应的数据,再将获取的数据加入第一数据序列,直至预测第二时间段中目标时刻的所有数据,将这些数据加入第一数据序列,更新第一数据序列。
在本实施例中提供了更新第二数据序列的方法,对应于图1中的S13,该方法包括如下步骤:
S131,基于第二步长在第二数据序列中沿第二时间变化方向取值,以获取第二数据序列中的第二目标数据序列。
第二步长指需要使用多长时间的风数据来插补空白数据序列中的一个风数据,第二步长的大小与需要插补的空白时间段的总时长有关,即第二时间段的时长。另外,由于数据序列中数据间隔是固定的,因此,在确定第二步长和数据间隔的情况下,用于预测数据的数据序列中的数据数量是固定的。第二时间方向可以是后向的时间方向,即根据第二时间段之后的第三时间段的数据对第二时间段中的数据进行预测,用于预测的第三时间段内的数据即第二目标数据序列。
S132,将第二目标数据序列输入预设第二时间序列模型,基于第二目标数据序列中各数据之间的关系进行预测,以确定第二时间段中目标时间点对应的第二数据。
预设第二时间序列模型可以为经过预先训练的数据插补模型,可以采用LSTM神经网络模型。将第二目标数据序列输入预先训练好的第二时间序列模型,第二时间序列模型经过对数据的处理,预测第二时间段中的最后一个时间点对应的数据,由于第二时间段和第三时间段是连续的时间段,因此第二时间段中的最后一个时间点即第二目标数据序列中第一个数据对应时间点的前一时间点,这里目标时间点即第二时间段中的最后一个时间点。
S133,将第二时间段中目标时间点对应的第二数据加入第二数据序列中,得到更新的第二数据序列。
将S132中获取的第二时间段中的数据加入第二数据序列,更新第二数据序列。
S134,基于第二步长在更新的第二数据序列中沿第二时间变化方向循环取值,以获取更新后的第二数据序列中的第二目标数据序列。
根据第二步长在更新后的第二数据序列中取值,为了获取第二时间段中的下一时刻对应的数据,根据第二步长,第二目标数据序列的取值从第二时间段中最后一个空白数据对应的时间点的前一时间点开始,由此更新第二目标数据序列。
循环取值即根据第二目标数据序列预测第二时间段中目标时间点对应的数据后,将获取的数据加入第二数据序列并根据第二步长更新第二目标数据序列,保证更新的第二目标序列中的第一个数据对应的时间点为第二时间段中的目标时间点的下一时间点。
S135,将更新后的第二数据序列中的第二目标数据序列输入预设第二时间序列模型,基于第二目标数据序列中各数据之间的关系进行预测,以更新第二数据序列。
通过将更新后的第二数据序列输入预设第二时间序列模型,预测第二时间段中目标时间点对应的数据,再将获取的数据加入第二数据序列,直至预测第二时间段中目标时刻的所有数据,将这些数据加入第二数据序列,更新第二数据序列。
在本实施例中提供了确定空白数据序列数据的方法,对应于图1中的S14,该方法包括如下步骤:
S141,基于目标时间点分别获取更新的第一数据序列和更新的第二数据序列中的第一对应数据和第二对应数据。
目标时间点为第二时间段内的空白数据序列对应的时间点,根据第一数据序列和第二数据序列分别获取的第二时间段内同一时间点对应的数据,分别为第一对应数据和第二对应数据。
S142,对第一对应数据和第二对应数据进行融合处理,以确定空白数据序列中的各个数据。
为了确保预测的空白数据的准确性,可以对同一时间点对应的两个数据进行融合处理,例如计算平均值,从而确定该时间点对应的数据,由此确认空白数据序列中的各个数据。
请参照图2,图2是根据本发明实施例的数据插补方法的示意图。在对空白数据序列进行预测之前,首先进行数据收集和治理,需要收集海上漂浮式激光雷达待插补的数据集,对于海上风电,一般需收集风力机轮毂高度的测风数据。数据收集完成后,对数据的合理性进行检验,剔除不合理的数据,随后根据需要第二时间段的时长设定时间步长。在确定了时间步长后,对获取的数据进行预处理,包括对数据按一定比例进行划分,将数据分为训练集和数据集。训练集用于训练模型,测试集用来检验模型的拟合度。
在准备好数据后,建立前向模型和后向模型,即第一时间序列模型和第二时间序列模型。两个模型分别是前向LSTM神经网络模型和后向LSTM神经网络模型,前向LSTM神经网络模型根据第一时间段的数据对第二时间段的数据进行预测,后向LSTM神经网络模型根据第三时间段的数据对第二时间段的数据进行预测。构建模型后对模型进行初始化,从而降低模型的最终误差结果。
两个LSTM神经网络模型的参数和网络结构一样,结构如图4所示。包含LSTM网络层和Dropout(随机失活)层,通过叠加四层LSTM网络提取测风数据中的时间序列信息,预测下一时刻的测风数据,Dropout层通过随机删除部分网络分支,降低模型的复杂度,避免模型过拟合。采用Mini-Batch(批大小)随机梯度下降方法进行训练。Mini-Batch随机梯度下降是随机梯度下降和批量梯度下降的,在大数据集上具有较快的收敛速度。
之后对空白的风速数据进行插补,分别从前向和后向进行插补,插补区域即第二时间段的空白数据序列。具体如图3所示,第一数据序列为x1-x36,第二数据序列为x43-x78,第一步长和第二步长都为36,即根据36个数据对下一个数据进行预测。在前向插补过程中,首先根据x1-x36预测得到空白数据序列中的第一个数据y37’,将y37’加入第一数据序列,根据第一步长进行取值,更新后的第一数据序列为x2-x36、y37’,根据更新后的第一数据序列进行预测,得到y38’,依次向后循环取值并进行预测,直至得到空白数据序列对应的数据y37’-y42’。
在后向插补过程中,首先根据x43-x78预测得到空白数据序列中的最后一个数据y42’’,将y42’’加入第二数据序列,根据第二步长进行取值,更新后的第二数据序列为y42’’、x43-x77,根据更新后的第二数据序列进行预测,得到y41’’,依次向前循环取值并进行预测,直至得到空白数据序列对应的数据y37’’-y42’’。
对得到的结果y37’-y42’和y37’’-y42’’进行融合处理,例如计算同一时刻两个数据的平均值,得到最终的测风数据插补结果,即空白数据序列对应的数据y37-y42
本方法通过前向和后向两个时间序列模型,分别从前向和后向对同一时间段内的数据进行插补,降低了模型的插补误差。如图5和图6所示,分别为插补时长为1小时情况下风速和风向的插补结果。风速误差为0.18m/s至0.20m/s,风向误差为7°至9°,在合理范围内,模型精度满足测风数据质量要求,结果证明采用本方案的双向LSTM神经网络进行数据插补的结果精度高于仅用前向LSTM神经网络或仅用后向LSTM神经网络。需要注意的是,模型的插补误差随着插补时长的增大会有变大的趋势。本方案满足了风资源评估中测风数据完整性要求,数据插补精度高,可提高风资源评估的准确性。且无需其他参考测风装置的数据,适用于海上风电开发环境。
在本实施例中还提供了一种数据插补装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种数据插补装置,如图7所示,包括:
数据获取模块,用于获取待处理风数据序列,所述待处理风数据序列包括与第一时间段对应的第一数据序列、第二时间段对应的空白数据序列以及第三时间段对应的第二数据序列;
第一更新模块,用于基于第一步长在所述第一数据序列中沿第一时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第一数据,将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列;
第二更新模块,用于基于第二步长在所述第二数据序列中沿第二时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第二数据,将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列;
空白数据确定模块,用于基于所述目标时间点对所述第一数据序列与所述第二数据序列中的对应数据进行融合处理,确定所述空白数据序列中的各个数据。
在一种实施方式中,第一更新模块包括:
第一取值子单元,用于基于第一步长在所述第一数据序列中沿第一时间变化方向取值,以获取第一数据序列中的第一目标数据序列;
第一数据确定子单元,用于将所述第一目标数据序列输入预设第一时间序列模型,基于所述第一目标数据序列中各数据之间的关系进行预测,以确定所述第二时间段中目标时间点对应的第一数据;
第一数据序列确定子单元,用于将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列。
在一种实施方式中,第一数据序列确定子单元还用于:
将所述第二时间段中目标时间点对应的第一数据加入所述第一数据序列中,得到更新的第一数据序列;
基于第一步长在所述更新的第一数据序列中沿第一时间变化方向循环取值,以获取更新后的第一数据序列中的第一目标数据序列;
将所述更新后的第一数据序列中的第一目标数据序列输入预设第一时间序列模型,基于所述第一目标数据序列中各数据之间的关系进行预测,以更新所述第一数据序列。
在一种实施方式中,第二更新模块包括:
第二取值子单元,基于第二步长在所述第二数据序列中沿第二时间变化方向取值,以获取第二数据序列中的第二目标数据序列;
第二数据确定子单元,将所述第二目标数据序列输入预设第二时间序列模型,基于所述第二目标数据序列中各数据之间的关系进行预测,以确定所述第二时间段中目标时间点对应的第二数据;
第二数据序列确定子单元,将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列。
在一种实施方式中,第二数据序列确定子单元还用于:
将所述第二时间段中目标时间点对应的第二数据加入所述第二数据序列中,得到更新的第二数据序列;
基于第二步长在所述更新的第二数据序列中沿第二时间变化方向循环取值,以获取更新后的第二数据序列中的第二目标数据序列;
将所述更新后的第二数据序列中的第二目标数据序列输入预设第二时间序列模型,基于所述第二目标数据序列中各数据之间的关系进行预测,以更新第二数据序列。
在一种实施方式中,空白数据确定模块还用于:
基于所述目标时间点分别获取所述更新的第一数据序列和所述更新的第二数据序列中的第一对应数据和第二对应数据;
对所述第一对应数据和第二对应数据进行融合处理,以确定空白数据序列中的各个数据。
本实施例中的数据插补装置是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
上述各个模块的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本发明实施例还提供一种电子设备,具有上述图7所示的数据插补装置。
请参阅图8,图8是本发明可选实施例提供的一种电子设备的结构示意图,如图8所示,该电子设备可以包括:至少一个处理器601,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口603,存储器604,至少一个通信总线602。其中,通信总线602用于实现这些组件之间的连接通信。其中,通信接口603可以包括显示屏(Display)、键盘(Keyboard),可选通信接口603还可以包括标准的有线接口、无线接口。存储器604可以是高速RAM存储器(Random Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器604可选的还可以是至少一个位于远离前述处理器601的存储装置。其中处理器601可以结合图7所描述的装置,存储器604中存储应用程序,且处理器601调用存储器604中存储的程序代码,以用于执行上述任一方法步骤。
其中,通信总线602可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线602可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器604可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器604还可以包括上述种类的存储器的组合。
其中,处理器601可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器601还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic, 缩写:GAL)或其任意组合。
可选地,存储器604还用于存储程序指令。处理器601可以调用程序指令,实现如本申请实施例中所示的数据插补方法。
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的数据插补方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种数据插补方法,其特征在于,包括:
获取待处理风数据序列,所述待处理风数据序列包括与第一时间段对应的第一数据序列、第二时间段对应的空白数据序列以及第三时间段对应的第二数据序列;
基于第一步长在所述第一数据序列中沿第一时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第一数据,将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列;
基于第二步长在所述第二数据序列中沿第二时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第二数据,将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列;
基于所述目标时间点对所述第一数据序列与所述第二数据序列中的对应数据进行融合处理,确定所述空白数据序列中的各个数据。
2.根据权利要求1所述的方法,其特征在于,所述基于第一步长在所述第一数据序列中沿第一时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第一数据,将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列,包括:
基于第一步长在所述第一数据序列中沿第一时间变化方向取值,以获取第一数据序列中的第一目标数据序列;
将所述第一目标数据序列输入预设第一时间序列模型,基于所述第一目标数据序列中各数据之间的关系进行预测,以确定所述第二时间段中目标时间点对应的第一数据;
将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列。
3.根据权利要求2所述的方法,其特征在于,所述将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列,包括:
将所述第二时间段中目标时间点对应的第一数据加入所述第一数据序列中,得到更新的第一数据序列;
基于第一步长在所述更新的第一数据序列中沿第一时间变化方向循环取值,以获取更新后的第一数据序列中的第一目标数据序列;
将所述更新后的第一数据序列中的第一目标数据序列输入预设第一时间序列模型,基于所述第一目标数据序列中各数据之间的关系进行预测,以更新所述第一数据序列。
4.根据权利要求1所述的方法,其特征在于,所述基于第二步长在所述第二数据序列中沿第二时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第二数据,将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列,包括:
基于第二步长在所述第二数据序列中沿第二时间变化方向取值,以获取第二数据序列中的第二目标数据序列;
将所述第二目标数据序列输入预设第二时间序列模型,基于所述第二目标数据序列中各数据之间的关系进行预测,以确定所述第二时间段中目标时间点对应的第二数据;
将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列。
5.根据权利要求4所述的方法,其特征在于,所述将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列,包括:
将所述第二时间段中目标时间点对应的第二数据加入所述第二数据序列中,得到更新的第二数据序列;
基于第二步长在所述更新的第二数据序列中沿第二时间变化方向循环取值,以获取更新后的第二数据序列中的第二目标数据序列;
将所述更新后的第二数据序列中的第二目标数据序列输入预设第二时间序列模型,基于所述第二目标数据序列中各数据之间的关系进行预测,以更新第二数据序列。
6.根据权利要求1所述的方法,其特征在于,所述基于所述目标时间点对所述第一数据序列与所述第二数据序列中的对应数据进行融合处理,确定所述空白数据序列中的各个数据,包括:
基于所述目标时间点分别获取所述更新的第一数据序列和所述更新的第二数据序列中的第一对应数据和第二对应数据;
对所述第一对应数据和第二对应数据进行融合处理,以确定空白数据序列中的各个数据。
7.一种数据插补装置,其特征在于,包括:
数据获取模块,用于获取待处理风数据序列,所述待处理风数据序列包括与第一时间段对应的第一数据序列、第二时间段对应的空白数据序列以及第三时间段对应的第二数据序列;
第一更新模块,用于基于第一步长在所述第一数据序列中沿第一时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第一数据,将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列;
第二更新模块,用于基于第二步长在所述第二数据序列中沿第二时间变化方向循环取值,并基于各次取值的各数据之间的关系预测所述第二时间段中目标时间点对应的第二数据,将所述第二数据加入所述第二数据序列中,以更新所述第二数据序列得到第二数据序列;
空白数据确定模块,用于基于所述目标时间点对所述第一数据序列与所述第二数据序列中的对应数据进行融合处理,确定所述空白数据序列中的各个数据。
8.根据权利要求7所述的装置,其特征在于,第一更新模块包括:
第一取值子单元,用于基于第一步长在所述第一数据序列中沿第一时间变化方向取值,以获取第一数据序列中的第一目标数据序列;
第一数据确定子单元,用于将所述第一目标数据序列输入预设第一时间序列模型,基于所述第一目标数据序列中各数据之间的关系进行预测,以确定所述第二时间段中目标时间点对应的第一数据;
第一数据序列确定子单元,用于将所述第一数据加入所述第一数据序列中,以更新所述第一数据序列得到第一数据序列。
9.一种电子设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-6中任一项所述的数据插补方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-6中任一项所述的数据插补方法。
CN202210829727.5A 2022-07-15 2022-07-15 一种数据插补方法、装置及存储介质 Active CN114911788B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210829727.5A CN114911788B (zh) 2022-07-15 2022-07-15 一种数据插补方法、装置及存储介质
EP22207321.5A EP4307172A1 (en) 2022-07-15 2022-11-14 Data interpolation method and apparatus and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210829727.5A CN114911788B (zh) 2022-07-15 2022-07-15 一种数据插补方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN114911788A true CN114911788A (zh) 2022-08-16
CN114911788B CN114911788B (zh) 2022-09-27

Family

ID=82772263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210829727.5A Active CN114911788B (zh) 2022-07-15 2022-07-15 一种数据插补方法、装置及存储介质

Country Status (2)

Country Link
EP (1) EP4307172A1 (zh)
CN (1) CN114911788B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115877345A (zh) * 2023-02-28 2023-03-31 航天宏图信息技术股份有限公司 一种风廓线雷达缺测数据的补齐方法和装置
CN117807380A (zh) * 2024-01-02 2024-04-02 中国科学院西北生态环境资源研究院 一种时间序列数据补全方法、装置、存储介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070294247A1 (en) * 2006-06-20 2007-12-20 International Business Machines Corporation Identifying optimal multi-scale patterns in time-series streams
CN111597080A (zh) * 2020-05-22 2020-08-28 广东省生态环境技术研究所 基于地统计和神经网络的地下水位缺失数据的修复方法
CN113569972A (zh) * 2021-08-03 2021-10-29 中国科学院地理科学与资源研究所 气象数据插补方法、装置、电子设备及存储介质
CN114548280A (zh) * 2022-02-23 2022-05-27 上海华兴数字科技有限公司 故障诊断模型的训练、故障诊断方法及电子设备
CN114692950A (zh) * 2022-03-03 2022-07-01 内蒙古工业大学 风电功率预测方法
CN114723093A (zh) * 2021-01-04 2022-07-08 中国移动通信有限公司研究院 数据处理方法、装置及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070294247A1 (en) * 2006-06-20 2007-12-20 International Business Machines Corporation Identifying optimal multi-scale patterns in time-series streams
CN111597080A (zh) * 2020-05-22 2020-08-28 广东省生态环境技术研究所 基于地统计和神经网络的地下水位缺失数据的修复方法
CN114723093A (zh) * 2021-01-04 2022-07-08 中国移动通信有限公司研究院 数据处理方法、装置及电子设备
CN113569972A (zh) * 2021-08-03 2021-10-29 中国科学院地理科学与资源研究所 气象数据插补方法、装置、电子设备及存储介质
CN114548280A (zh) * 2022-02-23 2022-05-27 上海华兴数字科技有限公司 故障诊断模型的训练、故障诊断方法及电子设备
CN114692950A (zh) * 2022-03-03 2022-07-01 内蒙古工业大学 风电功率预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NAN JIANG等: "BiLSTM-A: A missing value imputation method for PM2.5 prediction", 《2020 2ND INTERNATIONAL CONFERENCE ON APPLIED MACHINE LEARNING (ICAML)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115877345A (zh) * 2023-02-28 2023-03-31 航天宏图信息技术股份有限公司 一种风廓线雷达缺测数据的补齐方法和装置
CN117807380A (zh) * 2024-01-02 2024-04-02 中国科学院西北生态环境资源研究院 一种时间序列数据补全方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
EP4307172A1 (en) 2024-01-17
CN114911788B (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN114911788B (zh) 一种数据插补方法、装置及存储介质
CN109978228B (zh) 一种pm2.5浓度预测方法、装置及介质
CN112735094B (zh) 基于机器学习的地质灾害预测方法、装置和电子设备
CN110686633B (zh) 一种滑坡位移预测方法、装置及电子设备
CN112598248B (zh) 负荷预测方法、装置、计算机设备和存储介质
CN113657668A (zh) 基于lstm网络的电力负荷预测方法及系统
CN113409167A (zh) 一种水质异常分析方法及装置
CN111177135B (zh) 一种基于界标的数据填补方法及装置
CN113902187A (zh) 分时电价预测方法、装置及终端设备
CN116739172B (zh) 一种基于爬坡识别的海上风电功率超短期预测方法及装置
CN110866682B (zh) 基于历史数据的地下电缆预警方法和装置
CN116186493B (zh) 基于数值模式校正的气象预报方法、装置、设备和介质
CN117149565A (zh) 云平台关键性能指标的状态检测方法、装置、设备及介质
CN111783883A (zh) 一种异常数据的检测方法及装置
CN111340975A (zh) 异常数据特征提取方法、装置、设备及存储介质
CN116562120A (zh) 一种基于rve的涡轮发动机系统健康状况评估方法及装置
CN115952916A (zh) 基于人工智能的风电功率预测误差修正方法、装置及设备
CN115830807A (zh) 一种矿山安全预警方法、系统、设备及介质
CN115239105A (zh) 一种在役风电场的风资源的评估方法以及装置
CN114169646A (zh) 水华预测方法、装置、电子设备及计算机可读存储介质
CN113553754A (zh) 存储器、火灾风险预测模型构建方法、系统和装置
CN113011657A (zh) 进行台风水位预测的方法、装置、电子设备及存储介质
CN116541726B (zh) 用于植被覆盖度估算的样本量确定方法、装置及设备
CN117391125B (zh) 一种基于神经网络的数据处理方法及系统
CN117807416A (zh) 一种卫星遥测数据剔野方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant