CN113723634A - 故障变量确定方法、系统和可读存储介质 - Google Patents

故障变量确定方法、系统和可读存储介质 Download PDF

Info

Publication number
CN113723634A
CN113723634A CN202111007333.3A CN202111007333A CN113723634A CN 113723634 A CN113723634 A CN 113723634A CN 202111007333 A CN202111007333 A CN 202111007333A CN 113723634 A CN113723634 A CN 113723634A
Authority
CN
China
Prior art keywords
target
data
variable
fault
variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111007333.3A
Other languages
English (en)
Other versions
CN113723634B (zh
Inventor
姜孝谟
马明骏
成骁彬
唐伟健
陈庆
赵海心
林琳
惠怀宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Shanghai Electric Wind Power Group Co Ltd
Original Assignee
Dalian University of Technology
Shanghai Electric Wind Power Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology, Shanghai Electric Wind Power Group Co Ltd filed Critical Dalian University of Technology
Priority to CN202111007333.3A priority Critical patent/CN113723634B/zh
Publication of CN113723634A publication Critical patent/CN113723634A/zh
Application granted granted Critical
Publication of CN113723634B publication Critical patent/CN113723634B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Fuzzy Systems (AREA)
  • Water Supply & Treatment (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本申请提供一种故障变量确定方法、系统和可读存储介质。故障变量确定方法包括获取目标变量的数据,其中,目标变量的数据包括故障数据和正常数据,故障数据表示风机发生目标故障时目标变量的数据,正常数据表示风机正常运行时目标变量的数据;根据目标变量的数据,对至少部分目标变量进行相关性分析,确定部分目标变量为第一目标变量,其中,第一目标变量包括相关系数的绝对值大于第一相关阈值的两个目标变量中的其中一个;以及根据第一目标变量的数据,将受目标故障的影响程度不低于影响阈值的第一目标变量作为目标故障的故障变量。确定的故障变量较为准确。

Description

故障变量确定方法、系统和可读存储介质
技术领域
本发明涉及风电领域,尤其涉及一种故障变量确定方法、系统和可读存储介质。
背景技术
风电机组为无人值守的大型复杂机械系统,通常建造在偏远地带,其运行状态监测及故障诊断依赖于机组监测数据。在对风电机组进行运行状态监测和故障诊断时,一般是从监测数据中筛选出表征机组运行状态的故障变量。通过对故障变量的数据进行分析,对风电机组进行状态监测或故障诊断。但一些技术中,筛选出的故障变量不准确,导致对风电机组的状态监测或故障诊断不准确。
发明内容
本申请提供一种故障变量确定方法、系统和可读存储介质,确定的故障变量较为准确。
本申请提供一种故障变量确定方法,所述故障变量确定方法包括:
获取目标变量的数据,其中,所述目标变量的数据包括故障数据和正常数据,所述故障数据表示风机发生目标故障时所述目标变量的数据,所述正常数据表示所述风机正常运行时所述目标变量的数据;
根据所述目标变量的数据,对至少部分所述目标变量进行相关性分析,确定部分所述目标变量为第一目标变量,其中,所述第一目标变量包括相关系数的绝对值大于第一相关阈值的两个所述目标变量中的其中一个;以及
根据所述第一目标变量的数据,将受所述目标故障的影响程度不低于影响阈值的所述第一目标变量作为所述目标故障的故障变量。
本申请提供一种故障变量确定系统,包括一个或多个处理器,用于实现如上任一项所述的故障变量确定方法
本申请提供一种可读存储介质,其上存储有程序,该程序被处理器执行时,实现如上任一项所述的故障变量确定方法。
在本申请的一些实施例中,故障变量确定方法基于目标变量的数据,对目标变量的数据进行相关性等分析,确定其中部分目标变量为第一目标变量,再将受目标故障的影响程度不低于影响阈值的第一目标变量作为目标故障的故障变量。通过相关性分析等技术手段,减少了数据量,从而可以使确定的故障变量较为准确。
附图说明
图1是本申请的一个实施例提供的故障变量确定方法的流程图;
图2是图1中的步骤S13的子流程图;
图3给出了本申请的一个实施例提供的不同筛选阶段的变量个数;
图4是本申请一个实施例提供的故障变量确定系统的模块框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施例并不代表与本说明书一个或多个实施例相一致的所有实施例。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
图1是本申请的一个实施例提供的故障变量确定方法的流程图。故障变量确定方法包括步骤S11至步骤S13。
步骤S11,获取目标变量的数据,其中,目标变量的数据包括故障数据和正常数据,故障数据表示风机发生目标故障时目标变量的数据,正常数据表示风机正常运行时目标变量的数据。
在一些实施例中,目标变量可以是在风机的监控数据中,根据人工经验粗略筛选出的可能与目标故障相关的变量。与目标故障相关的变量指可以反映风机是否发生目标故障的变量。在风机发生目标故障时,受目标故障的影响,这些变量的数据也会发生较大变化,从而使得通过分析这些变量的数据,可以判断风机是否发生目标故障。
在一些实施例中,目标变量包括对风机监测点采集的数据进行统计的统计特征变量。统计特征变量包括但不限于平均值、最大值、最小值。可以针对不同风机监测点采集的数据分别进行统计,从而得到每个风机监测点对应的统计特征变量。另外,对风机监测点的数据进行统计时,可以对风机监测点在多个监测周期内采集的数据分别进行统计,得到一个统计特征变量的多个数据。比如,假设风机监测点A用于采集风机所在环境的风速,以10分钟为一个监测周期,风机监测点A在每个监测周期内,每隔1秒采集一次风机所在环境的风速。通过对风机监测点A在不同监测周期内采集的风速数据分别进行统计,则可以得到每个监测周期内的风速平均值、风速最大值、风速最小值等数据。又比如,假设风机监测点B用于采集风机的发电机功率,通过对风机监测点B在不同监测周期内采集的发电机功率分别进行统计,可以得到每个监测周期内的功率平均值、功率最大值、功率最小值等数据。以风机监测点A、B在其中两个监测周期为例,假设统计特征变量包括平均值和最大值,表格1示例性的给出了风机监测点A、B、监测周期、统计特征变量和统计特征变量数据之间的对应关系。
表格1
Figure BDA0003237662600000041
在一些实施例中,获取到的目标变量的数据中,故障数据和正常数据为预设比例,比如故障数据占所有数据的40%,正常数据占所有数据的60%。故障数据和正常数据的量级不易相差太大,以避免两者数据量不均衡,造成后续的数据分析结果不准确。故障数据和正常数据有分别对应的标签,比如故障数据的标签为1,正常数据的标签为0,如此,以便于区分故障数据和正常数据。
在一些实施例中,在获取到目标变量的数据后,还可以针对目标变量的数据,进行无效变量剔除、数据清洗、季节性因素消除以及数据标准化等处理。
无效变量剔除指:剔除不包括目标故障信息的变量,比如剔除单一值变量、字符类型变量、累计型变量等,以避免后续的数据分析。
数据清洗主要可以包括:
若目标变量的数据中包括风速变量的数据,则对风速进行修正,消除环境温度和气压对风速的影响;
若目标变量的数据中存在缺失值,则:对于缺失值占比大于阈值(比如大于20%)的目标变量,删除相应的目标变量;对于缺失值占比不低于阈值(比如不低于20%)的目标变量,采用目标变量数据中的中位数对缺失值进行填充。
若存在外界环境干扰和强制弃风限电现象导致的异常数据,采用四分位法+Dbin方法对这些异常数据进行删除。
季节性因素消除是指:若目标变量的数据中包括温度变量的数据,则对温度变量的数据进行修正。温度数据的修正公式可以表达为表达式(1)
Figure BDA0003237662600000051
其中,T表示温度变量的数据,比如风机的绕组温度、轴承温度等;
Te表示风机所在环境的温度;
Figure BDA0003237662600000052
表示风机所在环境的平均温度;
T′表示修正后的温度变量的数据。
数据标准化是指:通过去均值和方差归一化等方法,对目标变量的数据进行线性变换,以消除不同目标变量数据之间的量纲影响。
完成上述相关操作后,可以继续执行图1中的步骤S12。
步骤S12,根据目标变量的数据,对至少部分目标变量进行相关性分析,确定部分目标变量为第一目标变量,其中,第一目标变量包括相关系数的绝对值大于第一相关阈值的两个目标变量中的其中一个。
通过对至少部分目标变量进行相关性分析,在相关性较大的两个目标变量(即相关系数的绝对值大于第一相关阈值的两个目标变量)中,选择其中一个作为第一目标变量,剔除另外一个目标变量,如此,可以避免在后续的数据分析中,该两个目标变量对应的特征重复使用,忽略其他的重要特征。同时,降低后续的数据分析量。
以下对步骤S12中的相关性分析进行说明。
在一些实施例中,在目标变量包括统计特征变量的实施例中,对于任一风机监测点,可以根据对该风机监测点在多个监测周期内采集的数据分别进行统计后得到的统计特征变量的数据,对该风机监测点对应的统计特征变量进行相关性分析。比如可以对上述风机监测点A的风速平均值、风速最大值、风速最小值,以及风机监测点B的功率平均值、功率最大值、功率最小值分别进行相关性分析。通过分别对每个风机监测点对应的统计特征变量进行相关性分析,数据量较小,降低相关性分析难度。
以对风机监测点A的风速平均值、风速最大值、风速最小值进行相关性分析为例,可以先对风速平均值和风速最大值进行相关性分析,若该两者的相关系数的绝对值未大于第一相关阈值,则可以再对风速平均值和风速最小值进行相关性分析,若该两者的相关系数的绝对值同样未大于第一相关阈值,则继续对风速最大值和风速最小值进行相关性分析。但在对上述的风速平均值和风速最大值进行相关性分析时,若该两者的相关系数的绝对值大于第一相关阈值,则需要在风速平均值和风速最大值中剔除一个,比如将风速平均值剔除,然后将风速最大值和风速最小值继续进行相关性分析。可以理解的是,因为剔除的风速平均值与风速最大值具有较大的相关性,风速最大值和风速最小值之间的相关性可以反映风速平均值与风速最小值之间的相关性,比如,风速最大值和风速最小值之间的相关系数的绝对值未大于第一相关阈值,可以得知,风速平均值和风速最小值之间的相关系数的绝对值同样未大于第一相关阈值。因此,在将风速平均值剔除后,可以无需再计算风速平均值与其他统计特征变量之间的相关系数。
在一些实施例中,对于任一风机监测点,对于该风机监测点对应的任两个统计特征变量,可以基于该两个统计特征变量的数据,计算该两个统计特征变量之间的皮尔逊相关系数;然后基于皮尔逊相关系数,对该两个统计特征变量进行相关性分析。此处假设:
统计特征变量Y1=(y11,y12,…,y1n),其中,y11,y12,…,y1n表示不同监测周期内的统计特征变量Y1的数据,比如y11表示第一监测周期的统计特征变量Y1的数据,y1n表示第N监测周期的统计特征变量Y1的数据。y11,y12,…,yin包括风机发生目标故障时统计特征变量Y1的数据和风机未发生目标故障时统计特征变量Y1的数据;
统计特征变量Y2=(y21,y22,…,y2n),其中,(y21,y22,…,y2n)表示与统计特征变量Y1在对应监测周期内的数据,比如y21表示第一监测周期的统计特征变量Y2的数据,y2n表示第N监测周期内的统计特征变量Y2的数据。(y21,y22,…,y2n)包括风机发生目标故障时统计特征变量Y2的数据和风机未发生目标故障时统计特征变量Y2的数据。
统计特征变量Y1和Y2之间的皮尔逊相关系数的公式可以表达为表达式(2):
Figure BDA0003237662600000071
其中,
Figure BDA0003237662600000072
表示统计特征变量Y1和Y2之间的皮尔逊相关系数;
Figure BDA0003237662600000073
表示统计特征变量Y1和Y2之间的协方差,
Figure BDA0003237662600000074
表示统计特征变量Y1的平均值;
Figure BDA0003237662600000075
表示统计特征变量Y2的平均值;
Figure BDA0003237662600000076
表示统计特征变量Y1的标准差;
Figure BDA0003237662600000077
表示统计特征变量Y2的标准差。
在一些实施例中,基于步骤S12确定第一目标变量后,可以继续执行图1中的步骤S13。
步骤S13,根据第一目标变量的数据,将受目标故障的影响程度不低于影响阈值的第一目标变量作为目标故障的故障变量。
可以理解的是,在步骤S12中经过相关性分析后的第一目标变量中,可能部分第一目标变量受目标故障的影响程度并不高,或者实际并不受目标故障的影响。这些受目标故障影响程度不高,或者实际并不受目标故障影响的第一目标变量,在风机发生目标故障和未发生目标故障时,数据变化并不明显,对目标故障的监测诊断意义不大,但却可能导致监测数据量增加,影响监测结果。因此有必要在步骤S13中进一步筛选,以筛选出受目标故障的影响程度不低于影响阈值的第一目标变量,并将这部分第一目标变量作为目标故障的故障变量。筛选出的故障变量受目标故障的影响较大,在风机发生目标故障和未发生目标故障时,数据变化明显,使得可以基于故障变量的数据变化,对风机是否发生目标故障进行有效监控。
结合参考图2。图2是图1中的步骤S13的子流程图,包括步骤S21至步骤S22。
步骤S21,对于任一第一目标变量,若根据该第一目标变量的数据,确定该第一目标变量受目标故障影响的显著程度大于第一影响阈值,将该第一目标变量确定为第二目标变量。
在一些实施例中,对于任一第一目标变量,可以对该第一目标变量的故障数据和正常数据进行方差分析,若确定该第一目标变量受目标故障影响的显著程度大于第一影响阈值,将该第一目标变量确定为第二目标变量。
为便于理解,此处以其中一个统计特征变量Z为例进行说明。假设统计特征变量Z是风机所在环境的平均风速,统计特征变量Z包括故障数据集Z1和正常数据集Z0
故障数据集Z1表示风机发生目标故障时,统计特征变量Z在多个监测周期内的数据,即风机发生目标故障时,多个监测周期内风机所在环境的平均风速;
正常数据集Z0表示风机未发生目标故障时,统计特征变量Z在多个监测周期内的数据,即风机未发生目标故障时,多个监测周期内风机所在环境的平均风速。
故障数据集Z1和正常数据集Z0可以表达为:
Z1=(z11,z12,…,z1k1),k1表示故障数据集Z1的数据个数;
Z0=(z01,z02,…,z0k0),k0表示正常数据集Z0的数据个数。
统计特征变量Z受目标故障影响的显著程度的计算公式可以表达为表达式(3):
Figure BDA0003237662600000081
其中,
F表示统计特征变量Z受目标故障影响的显著程度,即目标故障对统计特征变量Z的影响程度;
SSw表示组内差异。组内差异SSw的计算公式可参见后续相关描述;
k-1表示组内差异SSw的自由度,k为故障数据集Z1和正常数据集Z0的数据个数之和;
SSb表示组间差异。组间差异SSb的计算公式可参见后续相关描述。另外,由于此处只有故障数据集Z1和正常数据集Z0两个组,因此组间差异SSb的自由度为1。
组内差异SSw的计算公式可以表达为表达式(4):
Figure BDA0003237662600000091
其中,
Figure BDA0003237662600000092
表示故障数据集Z1的均值,计算公式可参见后续相关描述;
Figure BDA0003237662600000093
表示正常数据Z0的均值,计算公式可参见后续相关描述。
组间差异SSb的计算公式可以表达为表达式(5):
Figure BDA0003237662600000094
其中,
Figure BDA0003237662600000095
Figure BDA0003237662600000096
的相关描述请参见表达式(4),此处不赘述;
Figure BDA0003237662600000097
表示统计特征变量Z的数据均值。
Figure BDA0003237662600000098
的计算公式可以表达为表达式(6):
Figure BDA0003237662600000099
Figure BDA00032376626000000910
的计算公式可以表达为表达式(7):
Figure BDA00032376626000000911
Figure BDA00032376626000000912
的计算公式可以表达为表达式(8):
Figure BDA00032376626000000913
根据方差分析的原理可知,上述F值越大,表示统计特征变量Z受目标故障的影响程度越大。依照上述方法,可分别计算出其他第一目标变量分别对应的F值,然后将所有第一目标变量受目标故障影响的显著程度(即F值)按照从大到小的顺序进行排序。然后基于显著性水平α的取值、组内差异SSw的自由度和组间差异SSb的自由度,通过查询F分布临界值表,可以确定第一影响阈值。比如假设显著性水平α=0.05,组内差异SSw的自由度(即上述k-1)为正无穷大,又由于组间差异SSb的自由度为1,通过查询F分布临界值表,可以得到第一影响阈值为3.84。若第一目标变量的F值大于3.84,表示第一目标变量受目标故障影响的显著程度较大,可以将相应的第一目标变量确定为第二目标变量;若第一目标变量的F值小于或等于3.84,表示第一目标变量受目标故障影响的显著程度较小,对应的第一目标变量可以剔除,不确定为第二目标变量。
需要说明的是,除了上述方差分析方法,也可以基于相关性分析等方法,确定第一目标变量受目标故障的影响程度。相对于其他的方法,方差分析方法得到的结果相对较为准确。
在步骤S21中,是计算目标故障分别对单个第一目标变量的影响程度,然后确定出受目标故障影响的显著程度大于第一影响阈值的第二目标变量。但在确定出的第二目标变量中,目标故障通常并不是单独影响某一个第二目标变量,而是对多个第二目标变量进行耦合影响。基于此,还需要考虑目标故障对多个第二目标变量的耦合影响下,每个第二目标变量分别受目标故障影响的显著程度。因此,在执行完步骤S21后,可以继续执行图2中的步骤S22。
步骤S22,根据多个第二目标变量的数据,确定该多个第二目标变量中各第二目标变量受目标故障耦合影响的显著程度。
在一些实施例中,可以对多个第二目标变量的数据和该些数据对应的标签值进行线性回归分析,确定各第二目标变量的线性回归系数,其中,线性回归系数表示对应的第二目标变量受目标故障影响的显著程度。
在一些实施例中,考虑到上述步骤S12中,只对部分的目标变量进行了相关性分析,因此在第二目标变量中,可能还存在一些相关性较高的第二目标变量,导致在对第二目标变量进行线性回归时,出现共线性的问题,对数据分析产生影响。基于此,在对第二目标变量的数据以及该些数据对应的标签的值进行线性回归分析前,故障监测方法还包括:对第二目标变量进行相关性分析,若在该至少部分第二目标变量中,存在两个第二目标变量的相关系数的绝对值大于第二相关阈值,删除其中一个第二目标变量。其中,对第二目标变量进行相关性分析,类似上述步骤S12,此处不再赘述。
在一些实施例中,在对第二目标变量进行相关性分析后,基于未被删除的多个第二目标变量的数据以及该些数据对应的标签的值进行线性回归分析,确定各第二目标变量的线性回归系数。线性回归的方程可以表达为表达式(9):
y=XW (9)
其中,
Figure BDA0003237662600000111
表示风机出现目标故障时,多个监测周期内或多个时间点的所有第二目标变量的数据,以及风机未出现目标故障时,多个监测周期内或多个时间点的所有第二目标变量的数据,m表示第二目标变量个数,n表示每个第二目标变量的数据个数,即监测周期或时间点的个数。比如:x11;x21…;xm1可以表示第一个监测周期内每个第二目标变量分别对应的数据,比如x11表示第一个监测周期内第二目标变量A的数据,x21表示第一个监测周期内第二目标变量B的数据。x1n;x2n…;xmn可以表示第N个监测周期内每个第二目标变量分别对应的数据。
Figure BDA0003237662600000112
表示每个监测周期或时间点的第二目标变量的数据对应的标签值。比如在第一个监测周期内,风机出现目标故障,x11;x21…;xm1对应的数据为风机出现目标故障时的数据,则y1的取值为故障标签“1”。在第N个监测周期内,风机未出现目标故障,x1n;x2n…;xmn对应的数据为风机未出现目标故障时的数据,则y1的取值为故障标签“0”。
Figure BDA0003237662600000113
表示需要计算的每个第二目标变量的线性回归系数。可以基于最小二乘法估算得到的线性回归系数W的估计值
Figure BDA0003237662600000114
线性回归系数的估计值
Figure BDA0003237662600000115
的计算公式可以表达为表达式(10):
Figure BDA0003237662600000116
在估算得到每个第二目标变量的线性回归系数的后,可以对估算得到的每个第二目标变量的线性回归系数进行t假设校验,以验证每个第二目标变量是否与标签值y线性相关。此处以对第i个第二目标变量的线性回归系数
Figure BDA0003237662600000117
进行t假设校验为例进行说明。i的取值为1,2,……m。对第i个第二目标变量的线性回归系数
Figure BDA0003237662600000121
进行t假设校验的公式可以表达为表达式(11):
Figure BDA0003237662600000122
其中,t表示第i个第二目标变量与标签值y的线性显著程度;
Figure BDA0003237662600000123
表示第i个第二目标变量的数据平均值,以上述第m个第二目标变量为例,
Figure BDA0003237662600000124
为xm1;xm2…;xmn的平均值;
n-2表示第二目标变量数据的自由度;
Figure BDA0003237662600000125
表示第二目标变量的数据标准差,可以基于表达式(12)得到:
Figure BDA0003237662600000126
其中,
Figure BDA0003237662600000127
表示标签值y的平均值。
基于上述方法,计算得到每个第二目标变量与标签值y的线性显著程度后,筛选出与标签值y的线性显著程度大于线性显著阈值的第二目标变量。线性显著阈值可以通过查询t分布表来确定。比如假设显著性水平α=0.05,自由度(即上述n-2)为正无穷大,通过查询t分布表,可以得到线性显著阈值为1.96。因此,需要筛选出与标签值y的线性显著程度大于1.96的第二目标变量,剔除与标签值y的线性显著程度小于或等于1.96的第二目标变量。通过对第二目标变量与标签值y进行线性显著程度校验,可以剔除与标签值y线性相关性不大或不线性相关的第二目标变量,提高数据分析的准确性。
在筛选出与标签值的线性显著程度大于线性显著阈值的第二目标变量后,可以对该些第二目标变量的线性回归系数按照大小进行排序,线性回归系数越大的第二目标变量,表示受目标故障耦合影响的显著程度越高,即受目标故障耦合影响越大。
在根据多个第二目标变量的数据,确定该多个第二目标变量中各第二目标变量受目标故障耦合影响的显著程度后,可以继续执行图2中的步骤S23。
步骤S23,根据各第二目标变量受目标故障耦合影响的显著程度,将至少部分第二目标变量确定为目标故障的故障变量。
在一些实施例中,在与标签值的线性显著程度大于线性显著阈值的第二目标变量中,可以将线性回归系数大于第二影响阈值的第二目标变量确定为目标故障的故障变量。如此确定得到的故障变量,在风机发生目标故障以及未发生目标故障时,数据变化较明显,进而可以基于故障变量的数据,对风机是否发生目标故障进行监控。
在本申请的一些实施例中,故障变量确定方法基于目标变量的数据,对目标变量的数据进行相关性等分析,确定其中部分目标变量为第一目标变量,再将受目标故障的影响程度不低于影响阈值的第一目标变量作为目标故障的故障变量。通过相关性分析等技术手段,减少了数据量,从而可以较为准确的判断各第一目标变量受目标故障的影响程度,进而使得确定的故障变量较为准确。具体来说,一些技术是根据相关性分析、方差分析、随机森林等方法,根据与风机的目标故障相关的目标变量的数据,直接判断各个目标变量受目标故障的影响程度,然后筛选目标故障的故障变量。这些方法只适合从少量的数据中筛选故障变量。风机的监控数据量较大,通过这些方法从大量数据中筛选出的故障变量通常不够准确,导致对风机的状态监测及故障诊断不准确。本申请通过先对目标变量的数据进行相关性分析,可以大大减少数据量,从而在后续的故障变量筛选中,可以提高筛选准确性,得到故障变量更准确,从而可以提高对风机状态监测或故障诊断的准确性。
图3给出了本申请的一个实施例提供的不同筛选阶段的变量个数。
从图3可以看出,在第一次相关性分析后,变量个数从80个降低到29个。大大减少了数据量。可以提高方差分析的准确性。
图4是本申请一个实施例提供的故障变量确定系统400的模块框图。
故障变量确定系统400包括一个或多个处理器401,用于实现如上描述的故障变量确定方法。在一些实施例中,故障变量确定系统400可以包括可读存储介质409,可读存储介质409可以存储有可被处理器401调用的程序,可以包括非易失性存储介质。
在一些实施例中,故障变量确定系统400可以包括内存408和接口407。
在一些实施例中,故障变量确定系统400还可以根据实际应用包括其他硬件。
本申请实施例的可读存储介质409,其上存储有程序,该程序被处理器401执行时,用于实现如上描述的故障变量确定方法。
本申请可采用在一个或多个其中包含有程序代码的可读存储介质409(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。可读存储介质409包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。可读存储介质409的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

Claims (10)

1.一种故障变量确定方法,其特征在于,所述故障变量确定方法包括:
获取目标变量的数据,其中,所述目标变量的数据包括故障数据和正常数据,所述故障数据表示风机发生目标故障时所述目标变量的数据,所述正常数据表示所述风机正常运行时所述目标变量的数据;
根据所述目标变量的数据,对至少部分所述目标变量进行相关性分析,确定部分所述目标变量为第一目标变量,其中,所述第一目标变量包括相关系数的绝对值大于第一相关阈值的两个所述目标变量中的其中一个;以及
根据所述第一目标变量的数据,将受所述目标故障的影响程度不低于影响阈值的所述第一目标变量作为所述目标故障的故障变量。
2.如权利要求1所述的故障变量确定方法,其特征在于,所述目标变量包括对风机监测点采集的数据进行统计的统计特征变量;
所述对至少部分所述目标变量进行相关性分析,包括:
对于任一所述风机监测点,根据对该风机监测点在多个监测周期内采集的数据分别进行统计后得到的所述统计特征变量的数据,对该风机监测点对应的所述统计特征变量进行相关性分析。
3.如权利要求2所述的故障变量确定方法,其特征在于,所述对于任一所述风机监测点,根据对该风机监测点在多个监测周期内采集的数据分别进行统计后得到的所述统计特征变量的数据,对该风机监测点对应的所述统计特征变量进行相关性分析,包括:
对于该风机监测点对应的任两个所述统计特征变量,基于该两个统计特征变量的数据,计算该两个统计特征变量之间的皮尔逊相关系数;
基于所述皮尔逊相关系数,对该两个统计特征变量进行相关性分析。
4.如权利要求1所述的故障变量确定方法,其特征在于,所述将受所述目标故障的影响程度不低于影响阈值的所述第一目标变量作为所述目标故障的故障变量,包括:
对于任一所述第一目标变量,若根据该第一目标变量的数据,确定该第一目标变量受所述目标故障影响的显著程度大于第一影响阈值,将该第一目标变量确定为第二目标变量;
根据多个所述第二目标变量的数据,确定该多个所述第二目标变量中各所述第二目标变量受所述目标故障影响的显著程度;
根据各所述第二目标变量受所述目标故障影响的显著程度,将至少部分所述第二目标变量确定为所述目标故障的故障变量。
5.如权利要求4所述的故障变量确定方法,其特征在于,所述对于任一所述第一目标变量,若根据该第一目标变量的数据,确定该第一目标变量受所述目标故障影响的显著程度大于第一影响阈值,将该第一目标变量确定为第二目标变量,包括:
对该第一目标变量的故障数据和正常数据进行方差分析,若确定该第一目标变量受所述目标故障影响的显著程度大于所述第一影响阈值,将该第一目标变量确定为第二目标变量。
6.如权利要求4所述的故障变量确定方法,其特征在于,所述第二目标变量的故障数据和正常数据分别对应不同的标签值,所述根据多个所述第二目标变量的数据,确定该多个所述第二目标变量中各所述第二目标变量受所述目标故障影响的显著程度,包括:
对多个所述第二目标变量的数据和该些数据对应的所述标签值进行线性回归分析,确定各所述第二目标变量的线性回归系数,其中,所述线性回归系数表示对应的所述第二目标变量受所述目标故障耦合影响的显著程度;
所述根据各所述第二目标变量受所述目标故障影响的显著程度,将至少部分所述第二目标变量确定为所述目标故障的故障变量,包括:
在与所述标签值的线性显著程度大于线性显著阈值的第二目标变量中,将所述线性回归系数大于第二影响阈值的所述第二目标变量确定为所述目标故障的故障变量。
7.如权利要求6所述的故障变量确定方法,其特征在于,在对所述第二目标变量的数据以及该些数据对应的所述标签的值进行线性回归分析前,所述故障监测方法还包括:
对所述第二目标变量进行相关性分析,若在该至少部分所述第二目标变量中,存在两个所述第二目标变量的相关系数的绝对值大于第二相关阈值,删除其中一个所述第二目标变量;
所述对该多个所述第二目标变量的数据以及该些数据对应的所述标签的值进行线性回归分析,确定各所述第二目标变量的线性回归系数,包括:
基于未被删除的多个所述第二目标变量的数据以及该些数据对应的所述标签的值进行线性回归分析,确定各所述第二目标变量的线性回归系数。
8.如权利要求1所述的故障变量确定方法,其特征在于,在获取到目标变量的数据后,所述故障变量确定方法还包括:
基于去均值和方差归一化方法,对获取到的数据进行线性变换;和/或
对获取到的数据进行数据清洗。
9.一种故障变量确定系统,其特征在于,包括一个或多个处理器,用于实现如权利要求1-8中任一项所述的故障变量确定方法。
10.一种可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时,实现如权利要求1-8中任一项所述的故障变量确定方法。
CN202111007333.3A 2021-08-30 2021-08-30 故障变量确定方法、系统和可读存储介质 Active CN113723634B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111007333.3A CN113723634B (zh) 2021-08-30 2021-08-30 故障变量确定方法、系统和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111007333.3A CN113723634B (zh) 2021-08-30 2021-08-30 故障变量确定方法、系统和可读存储介质

Publications (2)

Publication Number Publication Date
CN113723634A true CN113723634A (zh) 2021-11-30
CN113723634B CN113723634B (zh) 2024-07-05

Family

ID=78679360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111007333.3A Active CN113723634B (zh) 2021-08-30 2021-08-30 故障变量确定方法、系统和可读存储介质

Country Status (1)

Country Link
CN (1) CN113723634B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229600A (zh) * 2017-05-31 2017-10-03 北京邮电大学 一种基于大数据的并行方差分析方法及装置
CN107725283A (zh) * 2017-09-19 2018-02-23 江苏方天电力技术有限公司 一种基于深度信念网络模型的风机故障检测方法
CN108072524A (zh) * 2016-11-10 2018-05-25 中国电力科学研究院 一种风电机组齿轮箱轴承故障预警方法
CN109919432A (zh) * 2019-01-28 2019-06-21 国网湖北省电力有限公司宜昌供电公司 一种基于大数据的变电站设备故障影响因素分析方法
CN110890130A (zh) * 2019-12-03 2020-03-17 大连理工大学 基于多类型关系的生物网络模块标志物识别方法
CN111222781A (zh) * 2019-12-31 2020-06-02 国网北京市电力公司 故障诊断方法和装置、存储介质
CN112179655A (zh) * 2020-08-17 2021-01-05 中国农业大学 一种基于阈值分级的汽轮发电机故障预警方法
CN112950403A (zh) * 2021-01-29 2021-06-11 上海电气风电集团股份有限公司 风机多工况数据异常处理的方法、装置及计算机可读存储介质
CN112949733A (zh) * 2021-03-12 2021-06-11 暨南大学 故障因子数据的获取方法、装置、电子装置及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108072524A (zh) * 2016-11-10 2018-05-25 中国电力科学研究院 一种风电机组齿轮箱轴承故障预警方法
CN107229600A (zh) * 2017-05-31 2017-10-03 北京邮电大学 一种基于大数据的并行方差分析方法及装置
CN107725283A (zh) * 2017-09-19 2018-02-23 江苏方天电力技术有限公司 一种基于深度信念网络模型的风机故障检测方法
CN109919432A (zh) * 2019-01-28 2019-06-21 国网湖北省电力有限公司宜昌供电公司 一种基于大数据的变电站设备故障影响因素分析方法
CN110890130A (zh) * 2019-12-03 2020-03-17 大连理工大学 基于多类型关系的生物网络模块标志物识别方法
CN111222781A (zh) * 2019-12-31 2020-06-02 国网北京市电力公司 故障诊断方法和装置、存储介质
CN112179655A (zh) * 2020-08-17 2021-01-05 中国农业大学 一种基于阈值分级的汽轮发电机故障预警方法
CN112950403A (zh) * 2021-01-29 2021-06-11 上海电气风电集团股份有限公司 风机多工况数据异常处理的方法、装置及计算机可读存储介质
CN112949733A (zh) * 2021-03-12 2021-06-11 暨南大学 故障因子数据的获取方法、装置、电子装置及存储介质

Also Published As

Publication number Publication date
CN113723634B (zh) 2024-07-05

Similar Documents

Publication Publication Date Title
US20120016886A1 (en) Determining a seasonal effect in temporal data
JP5827426B1 (ja) 予兆診断システム及び予兆診断方法
CN110717472B (zh) 基于改进的小波阈值去噪的故障诊断方法及系统
CN110333078B (zh) 一种滚动轴承退化状态阶段确定方法
CN110858072B (zh) 设备运行状态的确定方法及装置
CN110909306A (zh) 业务异常检测方法、装置、电子设备和存储设备
US20080288213A1 (en) Machine condition monitoring using discontinuity detection
WO2020166236A1 (ja) 作業効率評価方法、作業効率評価装置、及びプログラム
JP5771317B1 (ja) 異常診断装置及び異常診断方法
CN118375603A (zh) 一种真空泵的故障监测方法及系统
CN111914424B (zh) 一种基于短期测风资料的设计风速取值方法及系统
CN113723634A (zh) 故障变量确定方法、系统和可读存储介质
Mohamad et al. Gear fault diagnostics using extended phase space topology
CN111695829B (zh) 一种指标波动周期计算方法、装置、存储介质及电子设备
JP7494562B2 (ja) 要因分析装置及び要因分析方法
KR102212022B1 (ko) 양수 수차의 건전성 자동 판정 방법 및 이를 위한 시스템
JP7437163B2 (ja) 診断装置、診断方法およびプログラム
JP7153585B2 (ja) 異常原因推定方法、および、異常原因推定装置
CN113419706A (zh) 一种快速的任意分布随机数产生方法、系统及其检验方法、系统
CN111967364A (zh) 复合故障诊断方法、装置、电子设备和存储介质
CN113884301B (zh) 阈值确定方法、系统和可读存储介质
JP2020067750A (ja) 学習方法、装置及びプログラム、並びに設備の異常診断方法
CN118499705B (zh) 供水管网泄露事件分级预警方法、装置、设备及介质
CN118094107B (zh) 异常数据检测方法及异常数据诊断器、射线测厚仪
CN116702521B (zh) 一种自动驾驶场景一致性对比方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant