CN114118633A - 一种基于先行关系的指标自优化预测方法及装置 - Google Patents

一种基于先行关系的指标自优化预测方法及装置 Download PDF

Info

Publication number
CN114118633A
CN114118633A CN202210090890.4A CN202210090890A CN114118633A CN 114118633 A CN114118633 A CN 114118633A CN 202210090890 A CN202210090890 A CN 202210090890A CN 114118633 A CN114118633 A CN 114118633A
Authority
CN
China
Prior art keywords
index
time
indexes
leading
lag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210090890.4A
Other languages
English (en)
Other versions
CN114118633B (zh
Inventor
张崇辉
陈思博
姚鑫童
王永恒
苏为华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Gongshang University
Zhejiang Lab
Original Assignee
Zhejiang Gongshang University
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Gongshang University, Zhejiang Lab filed Critical Zhejiang Gongshang University
Priority to CN202210090890.4A priority Critical patent/CN114118633B/zh
Publication of CN114118633A publication Critical patent/CN114118633A/zh
Application granted granted Critical
Publication of CN114118633B publication Critical patent/CN114118633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于先行关系的指标自优化预测方法及装置,包括:制定协同调整规则,计算时滞协同相关度形成时滞相关分析表,以及对时间序列指标进行筛选形成先行分析表;若指标时间长度远小于指标个数,则对指标集进行重抽样处理,并进行逐步回归;构造指标重要性测度公式,自优化先行指标集,形成关键先行指标集;利用关键先行指标集进行再逐步回归,开展参数估计与预测。本发明的基于先行关系的指标自优化预测算法,解决了高维数据分析过程中指标维度远高于指标数量而导致的预测失效问题。

Description

一种基于先行关系的指标自优化预测方法及装置
技术领域
本发明涉及有规律的波动性数据处理技术领域,尤其是涉及一种基于先行关系的指标自优化预测方法及装置。
背景技术
大型风力发电场通常占地面积较大,故风机组的检修维护工作需要耗费大量人力物力。为提升风力发电厂日常维护效率,需结合风机运行反馈指标构造统计预测方法,进行全面分析,找出高故障风险风机组予以重点检修。即为优化风力发电机场日常维护工作,需要根据风机组系统各组件运行状况,构造高维预测分析方法,对风机组故障可能性展开预测。
对于新装机风力风机组而言,其具有观测时期短、运行反馈数据指标多的特点,已有统计预测方法可能无法给出精确且稳健的预测结果。为此,我们提供了一种基于先行关系的指标自优化预测方法,来解决高维数据分析过程中,指标维度远高于指标数量而导致的预测失效问题。
发明内容
为解决现有技术的不足,通过严谨的内部关键变量判别逻辑,实现构建步骤具有较高自动化水平,对于高维数据分析过程中,指标维度远高于指标数量的时间序列指标,给出预测精度较高的分析结果的目的,本发明采用如下的技术方案:
一种基于先行关系的指标自优化预测方法,包括如下步骤:
S1,针对新装机风力风机组运行反馈指标,制定协同调整规则,计算时滞协同相关度形成时滞相关分析表,对影响新装机风力风机组当期故障发生率的时间序列指标,进行筛选,形成先行分析表;
S2,若先行指标观测数量小于等于先行指标数量,则对先行分析表中的指标集进行重抽样处理,并进行逐步回归,否则直接将指标集中的指标作为自变量,以目标指标为因变量,进行标准倒退逐步回归,得到回归结果;
S3,根据回归结果,构造指标重要性测度公式,自优化先行指标集,形成关键先行指标集;
S4,利用关键先行指标集进行再逐步回归,开展参数估计与预测。
进一步地,所述S1中时滞相关分析表的形成,包括如下步骤:
S111,分别检查目标指标以及所有先行指标的时序波动规律,判断是否存在协同变化规律,若存在,则对先行指标值进行预处理,若不存在,则不做处理;
S112,对潜在先行指标
Figure 464291DEST_PATH_IMAGE001
进行时滞移动处理,得到时滞指标
Figure 443748DEST_PATH_IMAGE002
i表示第i个先行 指标,t表示t期,即先行指标时期位置,k表示时滞k期;即对于第i个先行指标,使用其时滞k 期的指标数值
Figure 754644DEST_PATH_IMAGE002
替代其t期数值
Figure 195858DEST_PATH_IMAGE001
,得到时滞先行指标;
S113,分别计算当期故障发生率y和潜在先行指标
Figure 541389DEST_PATH_IMAGE002
的一阶差分,得到差分序列 Δy
Figure 160589DEST_PATH_IMAGE003
S114,利用差分序列Δy
Figure 975092DEST_PATH_IMAGE003
,计算得到1和0的协同信息序列H,通过比较Δy
Figure 970730DEST_PATH_IMAGE003
绝对值,将较大值乘以协同乘数α后,与Δy
Figure 170767DEST_PATH_IMAGE003
差的绝对值进行比较,小于差 的绝对值时,输出1,大于等于时,输出0,其中α>0,其取值越大,协同接受域则越宽;公式如 下:
Figure 210137DEST_PATH_IMAGE004
Figure 761204DEST_PATH_IMAGE005
S115,将序列H中满足条件H=1的元素个数,比上序列H中元素个数,计算时滞协同相关度r
Figure 29374DEST_PATH_IMAGE006
,其中#{H}表示序列H中元素个数,#{H|H=1}表示序列H中满足条件H=1 的元素个数;
S116,汇总时滞协同相关度r,形成时滞相关分析表。
进一步地,所述S1中先行分析表的形成,包括如下步骤:
S121,利用时滞相关分析表,根据时滞协同相关度选择最优时序调整阶数;即根据r值选择最优时序调整阶数l best ,并记其对应的r值为r best
S122,设置相关度接受阈值,将优时序调整阶数对应的时滞协同相关度中,大于等于相关度接受阈值的,汇总形成先行分析表。即筛选出r best s的指标,s表示相关度接受阈值。本实例设置s=0.6,即筛选出r best ≥0.6的指标。
进一步地,所述S111中,若检测到第i个先行指标x i 在时点s存在协同变化规律,则 对先行指标值
Figure 834650DEST_PATH_IMAGE007
进行移动平均处理,对
Figure 61232DEST_PATH_IMAGE007
前后时点取平均值,作为调整后的指标值
Figure 834016DEST_PATH_IMAGE008
按照如下公式对先行指标值
Figure 889565DEST_PATH_IMAGE007
进行移动平均处理:
Figure 329774DEST_PATH_IMAGE009
以调整后的指标值
Figure 461678DEST_PATH_IMAGE008
,对原先行指标值进行替代。
进一步地,所述S2包括如下步骤:
S21,设先行指标观测数量为t,先行指标数量为n
S22,若tn,则对先行分析表中的指标集D 0进行重抽样处理,得到新指标集D 1,将 新指标集D 1中的指标
Figure 738070DEST_PATH_IMAGE010
作为自变量,对目标指标y按照S23-S24进行逐步回归,其中sx表 示D 1中的指标,i表示第i个先行指标,t表示t期,即先行指标时期位置,k表示时滞k期;因为 t≤n的情况下,先行指数的协方差矩阵满秩,导致部分系数无唯一解,先行回归函数反馈 error;另一方面,为确保结果稳健性和无偏性,进行多次重抽样处理,重抽样N次,一次重抽 样为一个循环节;若t>n,则直接将指标集D 0中的指标作为自变量,以y为因变量进行标准倒 退逐步回归;即按照标准倒退逐步回归操作对y进行分析,该逐步回归是同行逐步回归的一 种发展,可以解决传统逐步回归无法解决的t≤n情形下的分析失败问题;
S23,将
Figure 613622DEST_PATH_IMAGE010
回归结果标记的显著性中,水平最低的指标
Figure 908337DEST_PATH_IMAGE011
D 1中删除,形成 先行指标集D 2W表示最差的相关指标,即worst;
S24,对D 2进行重抽样与逐步回归,直至满足:tβ*nP i,W τ,则停止删除指标, 输出最终先行指标集
Figure 997428DEST_PATH_IMAGE012
,其中P i,W 表示D 2中水平最低的指标
Figure 479225DEST_PATH_IMAGE011
对应的显著性水平,τ表示 算法输出显著性阈值,β为时期充足度系数阈值。
进一步地,所述S3包括如下步骤:
S31,重复S2的内容N次,将回归结果中指标回归显著性值P和算法拟合性能测度值R 2汇成总表M
S32,根据汇成总表M,计算各指标重要性测度,令
Figure 909200DEST_PATH_IMAGE013
为指标iR 2值,
Figure 58422DEST_PATH_IMAGE014
为指标iP值,构造重要性测度公式:
Figure 797708DEST_PATH_IMAGE015
,其中
Figure 281648DEST_PATH_IMAGE016
为第j次重 复中指标iR 2值,
Figure 233423DEST_PATH_IMAGE017
为其对应的P值;
S33,设定指标重要性测度接受阈值为thrshd,当
Figure 502730DEST_PATH_IMAGE018
时,则指标i为关键 先行指标。从而形成影响新装机风力风机组当期故障发生率的关键先行指标集。
进一步地,所述S33包括如下步骤:
S331,设置thrshd的初值为thrshd 0,按照thrshd 0筛选指标,对于指标i,若其重要 性测度满足
Figure 898071DEST_PATH_IMAGE019
则将其作为关键先行指标,否则作为非关键先行指标;
S332,判断关键先行指标个数是否小于最少先行指标个数m,若是,则按照线性调整系数λ放宽thrshd约束,再进行判断,否则输出筛选完成的关键变量名称,放宽thrshd约束公式为:thrshd=thrshd 0-λ;最少先行指标个数由用户指定;
S333,根据关键变量名称,在先行分析表中挑选出相应数据字段,形成关键先行指标集。据此可得影响新装机风力风机组当期故障发生率的各指标重要性测度。
进一步地,所述S4包括如下步骤:
S41,将关键先行指标集中的先行指标作为自变量,对目标指标y进行逐步回归;
S42,删除显著性水平最低的指标,直至关键先行指标集中,水平最低的指标对应的显著性水平小于算法输出显著性阈值(P i,W τ),则停止删除指标,输出逐步回归参数估计结果;
S43,依据逐步回归参数估计结果,对新装机风力风机组目标指标展开预测。
进一步地,所述目标指标为当期故障发生率。
一种基于先行关系的指标自优化预测装置,其特征在于,包括一个或多个处理器,用于实现所述的一种基于先行关系的指标自优化预测方法。
本发明的优势和有益效果在于:
本发明一种基于先行关系的指标自优化预测方法及装置,不仅能对先行指标进行自动筛选,而且能利用筛选后的先行指标进行回归预测,从而解决了高维数据分析过程中,维度数量高于观测数量而导致最终无法准确预测的问题。
附图说明
图1为本发明的一种基于先行关系的指标自优化预测方法的流程图。
图2为本发明中的指标重要性测度示意图。
图3为本发明中的预测结果示意图。
图4为本发明的一种基于先行关系的指标自优化预测装置的结构图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
如图1所示,本实例提供的一种基于先行关系的指标自优化预测方法,包括以下步骤:
S1,针对新装机风力风机组运行反馈指标,制定协同调整规则,计算时滞协同相关度形成时滞相关分析表,对影响新装机风力风机组当期故障发生率的时间序列指标,进行筛选,形成先行分析表,时滞相关分析表的形成,包括如下步骤:
S111,分别检查目标指标(当期故障发生率)以及所有先行指标的时序波动规律,判断是否存在协同变化规律,若存在,则对先行指标值进行预处理,若不存在,则不做处理;
若检测到第i个先行指标x i 在时点s存在协同变化规律,则对先行指标值
Figure 620039DEST_PATH_IMAGE007
进行移 动平均处理,对
Figure 375505DEST_PATH_IMAGE007
前后时点取平均值,作为调整后的指标值
Figure 968161DEST_PATH_IMAGE008
按照如下公式对先行指标值
Figure 298517DEST_PATH_IMAGE007
进行移动平均处理:
Figure 507781DEST_PATH_IMAGE009
以调整后的指标值
Figure 66939DEST_PATH_IMAGE008
,对原先行指标值进行替代。
S112,对潜在先行指标
Figure 795991DEST_PATH_IMAGE001
进行时滞移动处理,得到时滞指标
Figure 47981DEST_PATH_IMAGE002
i表示第i个先行 指标,t表示t期,即先行指标时期位置,k表示时滞k期;
即对于第i个先行指标,使用其时滞k期的指标数值
Figure 728230DEST_PATH_IMAGE002
替代其t期数值
Figure 91078DEST_PATH_IMAGE001
,得到时 滞先行指标。
S113,分别计算当期故障发生率y和潜在先行指标
Figure 189484DEST_PATH_IMAGE002
的一阶差分,得到差分序列 Δy
Figure 97529DEST_PATH_IMAGE003
S114,利用差分序列Δy
Figure 281385DEST_PATH_IMAGE003
,计算得到1和0的协同信息序列H,通过比较Δy
Figure 447924DEST_PATH_IMAGE003
绝对值,将较大值乘以协同乘数α后,与Δy
Figure 378666DEST_PATH_IMAGE003
差的绝对值进行比较,小于差 的绝对值时,输出1,大于等于时,输出0,其中α>0,其取值越大,协同接受域则越宽;公式如 下:
Figure 238037DEST_PATH_IMAGE004
Figure 128764DEST_PATH_IMAGE005
S115,将序列H中满足条件H=1的元素个数,比上序列H中元素个数,计算时滞协同相关度r
Figure 98994DEST_PATH_IMAGE006
,其中#{H}表示序列H中元素个数,#{H|H=1}表示序列H中满足条件H=1 的元素个数。
S116,汇总时滞协同相关度r,形成时滞相关分析表,如表1所示:
表1:时滞相关度分析表
指标 lag0 lag1 lag2 lag3 lag4
风速响应过载时间 0.4286 0.4286 0.5000 0.6667 0.6000
发电机轴承日间最高温度 0.7143 0.7143 0.8333 0.8333 0.8000
偏航系统响应日均一致性(方向) 0.5714 0.4286 0.3333 0.5000 0.6000
偏航系统响应日均一致性(时间) 0.1429 0.1429 0.1667 0.1667 0.2000
偏航系统齿轮组轴承日均震颤幅度 0.5714 0.5714 0.6667 0.6667 0.8000
偏航系统齿轮间隙(当日) 0.4286 0.4286 0.3333 0.3333 0.4000
偏航系统齿轮组轴承日间最高温度 0.7143 0.7143 0.8333 0.8333 0.8000
偏航系统信号反馈日均一致性 0.5714 0.4286 0.5000 0.5000 0.6000
发电机轴承日均温度 0.7143 0.7143 0.8333 0.8333 0.8000
日PM 3.5 0.7143 0.7143 0.8333 0.8333 0.8000
轮毂螺栓组应力反馈情况 0.5714 0.4286 0.5000 0.5000 0.4000
叶片日均转速 0.4286 0.2857 0.3333 0.3333 0.4000
叶片铆接点日均震颤幅度 0.7143 0.7143 0.8333 0.8333 0.8000
轮毂日均旋转速度 0.2857 0.2857 0.1667 0.3333 0.4000
风机组日均粉尘清理总量 0.7143 0.7143 0.8333 0.8333 0.8000
发电机组日均过载时间 0.7143 0.7143 0.8333 0.8333 0.8000
轮毂应力日均过载时间 0.7143 0.7143 0.8333 0.8333 0.8000
发电机核心组件日温度方差 0.1429 0.2857 0.3333 0.3333 0.4000
…… …… …… …… …… ……
时滞相关分析表的第一列是影响新装机风力风机组当期故障发生率的指标名称, 第二列至第六列分别表示对应的时滞指标
Figure 640834DEST_PATH_IMAGE003
k=0,1,2,3,4时的相关度。
先行分析表的形成,包括如下步骤:
S121,利用时滞相关分析表,根据时滞协同相关度选择最优时序调整阶数;即根据r值选择最优时序调整阶数l best ,并记其对应的r值为r best
S122,设置相关度接受阈值,将优时序调整阶数对应的时滞协同相关度中,大于等于相关度接受阈值的,汇总形成先行分析表;即筛选出r best s的指标,s表示相关度接受阈值。本实例设置s=0.6,即筛选出r best ≥0.6的指标。
S2,若先行指标观测数量(即先行指标时间长度)小于等于先行指标数量,则对先行分析表中的指标集进行重抽样处理,并进行逐步回归,否则直接将指标集中的指标作为自变量,以目标指标(当期故障发生率)为因变量,进行标准倒退逐步回归,得到回归结果;
包括如下步骤:
S21,设先行指标观测数量为t,先行指标数量为n
S22,若tn,则对先行分析表中的指标集D 0进行重抽样处理,得到新指标集D 1,将 新指标集D 1中的指标
Figure 654795DEST_PATH_IMAGE010
作为自变量,对目标指标(当期故障发生率)y按照S23-S24进行 逐步回归,其中sx表示D 1中的指标,i表示第i个先行指标,t表示t期,即先行指标时期位置,k表示时滞k期;因为t≤n的情况下,先行指数的协方差矩阵满秩,导致部分系数无唯一解, 先行回归函数反馈error;另一方面,为确保结果稳健性和无偏性,进行多次重抽样处理,重 抽样N次,一次重抽样为一个循环节;
t>n,则直接将指标集D 0中的指标作为自变量,以y为因变量进行标准倒退逐步回归;即按照标准倒退逐步回归操作对y进行分析,该逐步回归是同行逐步回归的一种发展,可以解决传统逐步回归无法解决的t≤n情形下的分析失败问题;
S23,将
Figure 282086DEST_PATH_IMAGE010
回归结果标记的显著性中,水平最低的指标
Figure 790427DEST_PATH_IMAGE011
(对应的显著性水 平为P i,W )从D 1中删除,形成先行指标集D 2W表示最差的相关指标,即worst;
S24,对D 2进行重抽样与逐步回归,直至满足:tβ*nP i,W τ,则停止删除指标, 输出最终先行指标集
Figure 186774DEST_PATH_IMAGE012
,其中P i,W 表示D 2中水平最低的指标
Figure 873101DEST_PATH_IMAGE011
对应的显著性水平,τ表示 算法输出显著性阈值,β为时期充足度系数阈值。
本实例指标t=18,n=59,则需进行重抽样处理后再进行逐步回归;本实例设置β=1.2,τ=0.1,即当t≥1.2*nP i,W ≤0.1时,停止删除变量。
S3,根据回归结果,构造指标重要性测度公式,自优化先行指标集,形成关键先行指标集,包括如下步骤:
S31,重复S2所述内容N次,将回归结果中指标回归显著性值P和算法拟合性能测度值R 2汇成总表M;所述P i,W P
M 算法结果汇总表
Figure 253267DEST_PATH_IMAGE020
本实例设置N=3,即在进行3次重抽样和逐步回归后,汇总3个逐步回归算法的输出结果;
S32,根据汇成总表M,计算各指标重要性测度,令
Figure 34141DEST_PATH_IMAGE021
为指标iR 2值,
Figure 65420DEST_PATH_IMAGE022
为指标iP值,构造重要性测度公式:
Figure 171916DEST_PATH_IMAGE023
,其中
Figure 773799DEST_PATH_IMAGE024
为第j次重 复中指标iR 2值,
Figure 374676DEST_PATH_IMAGE025
为其对应的P值;
S33,设定指标重要性测度接受阈值为thrshd,当
Figure 11193DEST_PATH_IMAGE026
时,则指标i为关键 先行指标;从而形成影响新装机风力风机组当期故障发生率的关键先行指标集,包括如下 步骤:
S331,设置thrshd的初值为thrshd 0,按照thrshd 0筛选指标,对于指标i,若其重要 性测度满足
Figure 537858DEST_PATH_IMAGE027
则将其作为关键先行指标,否则作为非关键先行指标;
S332,判断关键先行指标个数是否小于最少先行指标个数m,若是,则按照线性调整系数λ放宽thrshd约束,再进行判断,否则输出筛选完成的关键变量名称;最少先行指标个数由用户指定;
放宽thrshd约束公式为:thrshd=thrshd 0-λ
S333,根据关键变量名称,在先行分析表中挑选出相应数据字段,形成关键先行指标集。
本实例设置thrshd=0.6,λ=0.1,m=3。据此可得影响新装机风力风机组当期故障发生率的各指标重要性测度,如图2所示。
S4,利用关键先行指标集进行再逐步回归,开展参数估计与预测,包括如下步骤:
S41,将关键先行指标集中的先行指标作为自变量,对目标指标(当期故障发生率)y进行逐步回归;
S42,删除显著性水平最低的指标,直至关键先行指标集中,水平最低的指标对应的显著性水平小于算法输出显著性阈值(P i,W τ),则停止删除指标,输出逐步回归参数估计结果;
S43,依据逐步回归参数估计结果,对新装机风力风机组目标指标(当期故障发生率)展开预测。
本实例预测结果如图3所示,可以看出,本发明的一种基于先行关系的指标自优化预测算法,解决了高维数据分析过程中,维度数量高于观测数量而导致最终无法准确预测的问题,且预测精度较高。
与前述一种基于先行关系的指标自优化预测方法的实施例相对应,本发明还提供了一种基于先行关系的指标自优化预测装置的实施例。
参见图4,本发明实施例提供的一种基于先行关系的指标自优化预测装置,包括一个或多个处理器,用于实现上述实施例中的一种基于先行关系的指标自优化预测方法。
本发明一种基于先行关系的指标自优化预测装置的实施例可以应用在任意具备数据处理能力的设备上,该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图4所示,为本发明一种基于先行关系的指标自优化预测装置所在任意具备数据处理能力的设备的一种硬件结构图,除了图4所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能,还可以包括其他硬件,对此不再赘述。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明实施例还提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现上述实施例中的一种基于先行关系的指标自优化预测方法。
所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元,例如硬盘或内存。所述计算机可读存储介质也可以是任意具备数据处理能力的设备的外部存储设备,例如所述设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、SD卡、闪存卡(Flash Card)等。进一步的,所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据,还可以用于暂时地存储已经输出或者将要输出的数据。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (10)

1.一种基于先行关系的指标自优化预测方法,其特征在于包括如下步骤:
S1,针对新装机风力风机组运行反馈指标,制定协同调整规则,计算时滞协同相关度形成时滞相关分析表,对影响新装机风力风机组当期故障发生率的时间序列指标,进行筛选,形成先行分析表;
S2,若先行指标观测数量小于等于先行指标数量,则对先行分析表中的指标集进行重抽样处理,并进行逐步回归,否则直接将指标集中的指标作为自变量,以目标指标为因变量,进行标准倒退逐步回归,得到回归结果;
S3,根据回归结果,构造指标重要性测度公式,自优化先行指标集,形成关键先行指标集;
S4,利用关键先行指标集进行再逐步回归,开展参数估计与预测。
2.根据权利要求1所述的一种基于先行关系的指标自优化预测方法,其特征在于所述S1中时滞相关分析表的形成,包括如下步骤:
S111,分别检查目标指标以及所有先行指标的时序波动规律,判断是否存在协同变化规律,若存在,则对先行指标值进行预处理,若不存在,则不做处理;
S112,对潜在先行指标
Figure 130211DEST_PATH_IMAGE001
进行时滞移动处理,得到时滞指标
Figure 784046DEST_PATH_IMAGE002
i表示第i个先行指 标,t表示t期,即先行指标时期位置,k表示时滞k期;
S113,分别计算当期故障发生率y和潜在先行指标
Figure 760224DEST_PATH_IMAGE002
的一阶差分,得到差分序列Δy
Figure 942943DEST_PATH_IMAGE003
S114,利用差分序列Δy
Figure 784997DEST_PATH_IMAGE003
,计算得到1和0的协同信息序列H,通过比较Δy
Figure 226212DEST_PATH_IMAGE003
绝对值,将较大值乘以协同乘数α后,与Δy
Figure 571742DEST_PATH_IMAGE003
差的绝对值进行比较,小于差的 绝对值时,输出1,大于等于时,输出0,其中α>0;
S115,将序列H中满足条件H=1的元素个数,比上序列H中元素个数,计算时滞协同相关度r
S116,汇总时滞协同相关度r,形成时滞相关分析表。
3.根据权利要求1所述的一种基于先行关系的指标自优化预测方法,其特征在于所述S1中先行分析表的形成,包括如下步骤:
S121,利用时滞相关分析表,根据时滞协同相关度选择最优时序调整阶数;
S122,设置相关度接受阈值,将优时序调整阶数对应的时滞协同相关度中,大于等于相关度接受阈值的,汇总形成先行分析表。
4.根据权利要求2所述的一种基于先行关系的指标自优化预测方法,其特征在于所述 S111中,若检测到第i个先行指标x i 在时点s存在协同变化规律,则对先行指标值
Figure 190943DEST_PATH_IMAGE004
进行移 动平均处理,对
Figure 5446DEST_PATH_IMAGE004
前后时点取平均值,作为调整后的指标值
Figure 735505DEST_PATH_IMAGE005
5.根据权利要求1所述的一种基于先行关系的指标自优化预测方法,其特征在于所述S2包括如下步骤:
S21,设先行指标观测数量为t,先行指标数量为n
S22,若tn,则对先行分析表中的指标集D 0进行重抽样处理,得到新指标集D 1,将新指 标集D 1中的指标
Figure 669963DEST_PATH_IMAGE006
作为自变量,对目标指标y按照S23-S24进行逐步回归,其中sx表示D 1 中的指标,i表示第i个先行指标,t表示t期,即先行指标时期位置,k表示时滞k期;若t>n,则 直接将指标集D 0中的指标作为自变量,以y为因变量进行标准倒退逐步回归;
S23,将
Figure 460064DEST_PATH_IMAGE006
回归结果标记的显著性中,水平最低的指标
Figure 525978DEST_PATH_IMAGE007
D 1中删除,形成先行指 标集D 2
S24,对D 2进行重抽样与逐步回归,直至满足:tβ*nP i,W τ,则停止删除指标,输出最 终先行指标集
Figure 794148DEST_PATH_IMAGE008
,其中P i,W 表示D 2中水平最低的指标
Figure 848692DEST_PATH_IMAGE007
对应的显著性水平,τ表示算法输 出显著性阈值,β为时期充足度系数阈值。
6.据权利要求1所述的一种基于先行关系的指标自优化预测方法,其特征在于所述S3包括如下步骤:
S31,重复S2的内容N次,将回归结果中指标回归显著性值P和算法拟合性能测度值R 2汇成总表M
S32,根据汇成总表M,计算各指标重要性测度,令
Figure 560427DEST_PATH_IMAGE009
为指标iR 2值,
Figure 67632DEST_PATH_IMAGE010
为指标iP值,构造重要性测度公式:
Figure 405072DEST_PATH_IMAGE011
,其中
Figure 579702DEST_PATH_IMAGE012
为第j次重 复中指标iR 2值,
Figure 695294DEST_PATH_IMAGE013
为其对应的P值;
S33,设定指标重要性测度接受阈值为thrshd,当
Figure 220953DEST_PATH_IMAGE014
时,则指标i为关键先行 指标。
7.据权利要求6所述的一种基于先行关系的指标自优化预测方法,其特征在于所述S33包括如下步骤:
S331,设置thrshd的初值为thrshd 0,按照thrshd 0筛选指标,对于指标i,若其重要性测 度满足
Figure 830926DEST_PATH_IMAGE015
则将其作为关键先行指标,否则作为非关键先行指标;
S332,判断关键先行指标个数是否小于最少先行指标个数m,若是,则按照线性调整系数λ放宽thrshd约束,再进行判断,否则输出筛选完成的关键变量名称,放宽thrshd约束公式为:thrshd=thrshd 0-λ
S333,根据关键变量名称,在先行分析表中挑选出相应数据字段,形成关键先行指标集。
8.根据权利要求1所述的一种基于先行关系的指标自优化预测方法,其特征在于所述S4包括如下步骤:
S41,将关键先行指标集中的先行指标作为自变量,对目标指标y进行逐步回归;
S42,删除显著性水平最低的指标,直至关键先行指标集中,水平最低的指标对应的显著性水平小于算法输出显著性阈值,则停止删除指标,输出逐步回归参数估计结果;
S43,依据逐步回归参数估计结果,对新装机风力风机组目标指标展开预测。
9.根据权利要求1、2、5、8之一所述的一种基于先行关系的指标自优化预测方法,其特征在于所述目标指标为当期故障发生率。
10.一种基于先行关系的指标自优化预测装置,其特征在于,包括一个或多个处理器,用于实现权利要求1-9中任一项所述的一种基于先行关系的指标自优化预测方法。
CN202210090890.4A 2022-01-26 2022-01-26 一种基于先行关系的指标自优化预测方法及装置 Active CN114118633B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210090890.4A CN114118633B (zh) 2022-01-26 2022-01-26 一种基于先行关系的指标自优化预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210090890.4A CN114118633B (zh) 2022-01-26 2022-01-26 一种基于先行关系的指标自优化预测方法及装置

Publications (2)

Publication Number Publication Date
CN114118633A true CN114118633A (zh) 2022-03-01
CN114118633B CN114118633B (zh) 2022-06-10

Family

ID=80361970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210090890.4A Active CN114118633B (zh) 2022-01-26 2022-01-26 一种基于先行关系的指标自优化预测方法及装置

Country Status (1)

Country Link
CN (1) CN114118633B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114756605A (zh) * 2022-06-14 2022-07-15 之江实验室 一种基于时间序列数据的混频预测方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488595A (zh) * 2015-12-10 2016-04-13 四川省电力公司供电服务中心 用于月度用电预测模型的先行性指数构建方法
CN105634787A (zh) * 2014-11-26 2016-06-01 华为技术有限公司 网络关键指标的评估方法、预测方法及装置和系统
US20190005400A1 (en) * 2016-09-20 2019-01-03 Southwest Petroleum University A fuzzy evaluation and prediction method for running status of mechanical equipment with occurrence probability of failure modes
CN109884892A (zh) * 2019-02-28 2019-06-14 杭州电子科技大学 基于交叉相关时滞灰色关联分析的流程工业系统预测模型
CN110503462A (zh) * 2019-07-18 2019-11-26 上海交通大学 基于灰色关联度分析的电网投资测算方法、系统及介质
CN111508240A (zh) * 2020-06-29 2020-08-07 之江实验室 一种基于混合特征挖掘的交通流量预测方法
CN111582586A (zh) * 2020-05-11 2020-08-25 长沙理工大学 用于减少抖动的多车队驾驶危险预测系统与方法
JP2021099767A (ja) * 2019-12-21 2021-07-01 弘容 杉原 看護業務量予測型 看護管理システム
CN113362913A (zh) * 2021-05-27 2021-09-07 南通大学 一种基于随机森林回归的汽油辛烷值损失预测及优化方法
CN113538940A (zh) * 2021-07-08 2021-10-22 西湾智慧(广东)信息科技有限公司 适用于车路协同环境下的实时最优车道选择方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105634787A (zh) * 2014-11-26 2016-06-01 华为技术有限公司 网络关键指标的评估方法、预测方法及装置和系统
CN105488595A (zh) * 2015-12-10 2016-04-13 四川省电力公司供电服务中心 用于月度用电预测模型的先行性指数构建方法
US20190005400A1 (en) * 2016-09-20 2019-01-03 Southwest Petroleum University A fuzzy evaluation and prediction method for running status of mechanical equipment with occurrence probability of failure modes
CN109884892A (zh) * 2019-02-28 2019-06-14 杭州电子科技大学 基于交叉相关时滞灰色关联分析的流程工业系统预测模型
CN110503462A (zh) * 2019-07-18 2019-11-26 上海交通大学 基于灰色关联度分析的电网投资测算方法、系统及介质
JP2021099767A (ja) * 2019-12-21 2021-07-01 弘容 杉原 看護業務量予測型 看護管理システム
CN111582586A (zh) * 2020-05-11 2020-08-25 长沙理工大学 用于减少抖动的多车队驾驶危险预测系统与方法
CN111508240A (zh) * 2020-06-29 2020-08-07 之江实验室 一种基于混合特征挖掘的交通流量预测方法
CN113362913A (zh) * 2021-05-27 2021-09-07 南通大学 一种基于随机森林回归的汽油辛烷值损失预测及优化方法
CN113538940A (zh) * 2021-07-08 2021-10-22 西湾智慧(广东)信息科技有限公司 适用于车路协同环境下的实时最优车道选择方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
THU ZAR HSAN等: "Combining Support Vector Machine and Polynomial Regressing to Predict Tropical Cyclone Track", 《2021 IEEE 3RD GLOBAL CONFERENCE ON LIFE SCIENCES AND TECHNOLOGIES (LIFETECH)》 *
赵志伟: "中小企业成长性评价理论方法及其应用研究", 《中国博士学位论文全文数据库》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114756605A (zh) * 2022-06-14 2022-07-15 之江实验室 一种基于时间序列数据的混频预测方法及系统
CN114756605B (zh) * 2022-06-14 2022-09-16 之江实验室 一种基于时间序列数据的混频预测方法及系统

Also Published As

Publication number Publication date
CN114118633B (zh) 2022-06-10

Similar Documents

Publication Publication Date Title
Yan et al. Multiple sensor data fusion for degradation modeling and prognostics under multiple operational conditions
Staszewska‐Bystrova Bootstrap prediction bands for forecast paths from vector autoregressive models
CN112904266B (zh) 一种电能表寿命预测方法及装置
CN109840671B (zh) 运行改进效果计算设备、运行改进效果计算方法和记录介质
JP2009294969A (ja) 需要予測方法および需要予測装置
CN112734128A (zh) 一种基于优化rbf的7日电力负荷峰值预测方法
CN114118633B (zh) 一种基于先行关系的指标自优化预测方法及装置
Inoue et al. Bivariate change-point modeling for software reliability assessment with uncertainty of testing-environment factor
CN115689055A (zh) 一种短期太阳辐照度预测方法及装置
CN108694472B (zh) 预测误差极值分析方法、装置、计算机设备和存储介质
Lunacek et al. Understanding biases in pre-construction estimates
KR20220061713A (ko) 스마트 미터의 결측치 대체 방법 및 이를 이용하는 스마트 미터 제어 시스템
CN111783883A (zh) 一种异常数据的检测方法及装置
Bagnai et al. Generalized Balance of Payments Constrained Growth and South—South Trade in Sub-Saharan Africa
CN116090216A (zh) 一种基于典型相关分析的发电功率预测方法和系统
CN111754027B (zh) 一种基于概率语言术语集的pm2.5排放权分配方法
CN109376957B (zh) 一种火电厂负荷的预测方法
CN113408076A (zh) 基于支持向量机模型的小样本机械剩余寿命预测方法
Grivas An Automatic Portmanteau Test For Nonlinear Dependence
CN117113886B (zh) 一种压力预测方法及装置
CN117150973B (zh) 一种轴流泵沟槽参数的确定方法及装置
Yu et al. Research on Network Traffic Monitoring Based on Time Series Prediction with Information Theoretic Entropy Value Judgment and Improved Moving Average Method
CN116519534A (zh) 基于运行参数相关性的吸收塔浆液密度测量方法及系统
CN117522220A (zh) 一种基于仪表日志的仪表管理方法及系统
CN117193184A (zh) Vae与深度神经网络混合的智能制造工厂过程质量监控方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant