CN115293383A - 融合博弈论的变压器风险致因分析方法 - Google Patents

融合博弈论的变压器风险致因分析方法 Download PDF

Info

Publication number
CN115293383A
CN115293383A CN202211225269.0A CN202211225269A CN115293383A CN 115293383 A CN115293383 A CN 115293383A CN 202211225269 A CN202211225269 A CN 202211225269A CN 115293383 A CN115293383 A CN 115293383A
Authority
CN
China
Prior art keywords
data
transformer
risk
sensor
cause analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211225269.0A
Other languages
English (en)
Inventor
汪敏
杨春宇
张安安
李茜
杨威
张亮
邓江湖
李自平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN202211225269.0A priority Critical patent/CN115293383A/zh
Publication of CN115293383A publication Critical patent/CN115293383A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种融合博弈论的变压器风险致因分析方法。包括以下步骤:S1:收集变压器传感器数据,进行kNN缺失值填补;S2:将S1中收集的数据进行3‑sigma异常值剔除;S3:利用随机森林模型对数据进行拟合;S4:利用博弈论Shapleyvalue理论,对随机森林模型进行建模;S5:将新时刻的数据x采集上来,经过步骤S1与S2;S6:输入S3的随机森林模型和S4的数学模型,得到变压器风险状态评估和每个传感器特征的贡献;S7:对步骤S6的特征贡献进行归一化处理得到致因分析,本专利从新颖的角度出发,根据博弈论理论设计了一种特征归因方法,可以分析变压器风险的原因,指导平台工作人员进行变压器维护。

Description

融合博弈论的变压器风险致因分析方法
技术领域
本发明涉及一种变压器风险评估致因分析技术,特别涉及一种结合博弈论与机器学习的反向致因分析方法,具体是利用机器学习模型来得到对变压器的风险状态评估,并且通过博弈论Shapleyvalue理论对机器学习模型再次建模,从而对机器学习模型得到的变压器风险状态评估进行有效的致因分析,属于变压器风险评估技术领域。
背景技术
随着海洋资源的开发和利用,以及海上平台的发展,如何对海上平台上时刻运行的变压器等电气设备进行有效的监测成为了国内外研究关注的重点,变压器不仅关系到海上平台作业的安全运行、同时关系到附近平台群电网的平稳运行。
由于海上平台距岸距离较远,因此无法进行常规巡检,有必要针对关键变配电设备进行全方位在线监控,实时掌握电气设备的运行状态,并采用科学合理的检修策略,从而保障海上油气平台供电可靠性,近年来,针对电气设备故障问题,各作业区也采用安装变压器在线监测系统等方式来进行辅助维护。
从国内外发展现状来看,电气设备的在线监测系统的研究较为成熟,并且国内外大多学者都对电气监测系统中的大量数据进行了数理分析及数据挖掘,目前用于数据挖掘的主要手段包括时间序列预测、风险状态评估等,其中风险状态评估以机器学习或深度学习技术为基础,通过机器学习模型或深度神经网络模型来对采集的传感器数据进行非线性拟合,并结合实际人工标注的变压器风险评估标签,可以在大多数场景下实现较高的准确率。这些监测评估方法在取得一定效果的同时,也存在一些问题:1)数据采集后的处理没有标准可循,随着各种监测设备及信息化系统的逐步完善与应用,设备运行状态的相关信息呈现出多源、异构的数据特征,容易造成不同工区系统数据融合度较差的问题;2)这些方法虽然采用了一些大数据人工智能技术来预测、评估变压器的健康状态,但并没有指出设备风险状态的原因,使得类似的变压器状态评估结果只是空中楼阁,缺乏完备的原因分析支撑。
例如,变压器的风险评估模型提示变压器具有一级风险,急需现场人员维修调试,然而在海上油气作业平台上,排查维修的成本是高昂的,这就要求数据挖掘技术不仅需要给出设备的风险状况评估,还需给出支撑这一评估的致因分析,现场人员通过致因分析结合实际数据,进一步人工监督设备运行,在确定设备的风险状况后排查维修,可以提高电气设备的安全稳定性以及排查维修的成本。
发明内容
为了解决上述提出的问题,本发明提出了一种融合博弈论贡献分析的变压器风险致因分析方法,博弈论中的贡献分配问题是一个经典问题,通过分析团队协作中每个成员的参与与否,来公平的衡量成员对团队的贡献,此理论具有完备的数学理论支撑,本专利将此理论融合机器学习模型,将数据的传感器特征视为团队成员,将模型输出视为团队,此时就可以为机器学习模型进行算法建模,从而依靠博弈论完备的数学理论来对传感器特征的贡献做出公平的评估。
一种融合博弈论的变压器风险致因分析方法,其特征在于,所述具体步骤如下:
S1:定时收集变压器历史传感器数据,在不同传感器采集到的n条数据,按照时间进行对齐,并且进行缺失值填补,本专利采用“kNN缺失值填补方法”,基于欧氏距离的最短距离点被认为是最近邻点,在处理缺失值的时候,找到距离这条数据最近的k个数据点所对应得缺失传感器特征的平均值来进行填补,同时,采集对应变压器风险水平人工标注数据n条,在此步骤中,存储缺失值填补之前的n条数据值;
S2:将S1中收集并填补了缺失值的数据进行异常值检测,本专利采用3-sigma异常值检测技术,计算确定上下三个扰动范围的正常区间,超过这个区间的误差不属于随机误差而是粗大误差,含有该误差的数据予以剔除,经过步骤S1和异常值剔除后,可以有效的减少海上平台恶劣环境造成的传感器短暂失去数据传输的影响,在此步骤中,计算并存储剔除异常值之前的数据平均值μ和标准差σ;
S3:以步骤S2中各个传感器采集的n条数据为训练数据,以步骤S1中采集的n条变压器风险水平人工标注数据为标签,利用机器学习模型对数据进行拟合训练,为保证模型尽可能地拟合步骤S2中清洗后的数据,本专利采用较为复杂的机器学习模型——随机森林。随机森林模型是一个包含多个决策树的分类器并且其输出的类别是由个别树输出类别的众数而定,在新的输入数据进入时,每一棵决策树会分别进行判断和分类,所有决策树的分类结果中哪一个分类比较多,那么就会采纳为随机森林模型的最终分类结果。随机森林模型采用众多决策树分别训练,可以有效避免复杂机器学习模型导致的过拟合问题,并且可以非常有效的拟合变压器特殊的电气背景数据。随机森林模型的拟合训练过程包含四个步骤:1)随机抽样数据;2)随机选取数据特征;3)重复执行随机选取特征的步骤;4)建立大量的决策树分类器,形成随机森林;
S4:利用博弈论Shapleyvalue思想,对步骤S3中拟合训练好的随机森林模型进行数学建模,博弈论的Shapleyvalue思想是以团队和成员为背景,通过分析不同成员的不同排列组合方式下,团队最终的产出结果如何变化,来确定每一名成员对所属团队的贡献值。本专利中我们将步骤S1、S2中采集、处理得到的传感器数据中每一个传感器维度特征作为成员,将人工标注的变压器风险水平数据作为团队产出,构建融合博弈论与机器学习的数学模型;
S5:将新时刻不同传感器的数据x采集上来,经过步骤S1的时间对齐和缺失值填补,步骤S1中将使用之前存储的n条未填补数据,并带入步骤S2中进行异常值剔除,步骤S2中将之前n条数据的平均值μ与标准差σ进行迭代更新,并使用新的平均值μ与标准差σ进行异常值剔除;
S6:将步骤S5中得到的新数据x输入随机森林模型,即可得到预测的变压器风险状态评估,在此步骤,通过博弈论Shapley value分析来对随机森林模型的输出,即变压器风险状态评估,进行计算、分析和解释,在新数据x上,对于某个传感器特征j,其对于模型预测的贡献记为
Figure DEST_PATH_IMAGE001
:
Figure 323971DEST_PATH_IMAGE002
其中,S是当前传感器特征子集,N是传感器特征的所有子集,
Figure DEST_PATH_IMAGE003
是排除j在外的所有子集,
Figure 303428DEST_PATH_IMAGE004
是对子集S加上传感器特征j后的模型输出值,
Figure DEST_PATH_IMAGE005
是仅在子集S上的模型输出值,
Figure 738958DEST_PATH_IMAGE006
意为考虑子集S时,有无传感器特征j对模型输出的影响,此步骤得到每一个数据每一个传感器特征的贡献,此向量的维度是(1,d),其中d是传感器特征个数;
S7:将步骤S6中得到的贡献向量进行归一化处理,经过归一化处理后,可以将每一个传感器特征的贡献值限制到(0,1)之间,更适合作为致因分析来表征风险原因所在,此时通过判断每一个传感器特征贡献值的大小来判断是变压器的哪一个因素造成了变压器的风险状态;
S8:定义变压器风险评估致因分析流水线:循环经过步骤S5得到变压器的风险状态预测、循环经过步骤S6、S7得到对此风险状态预测结果的致因分析,定义此流水线可以在线监控变压器的风险状态,并且实时给出风险状态的原因分析,可以指导工程人员排查检修。
在步骤S1中,进行数据缺失值填补,采用kNN最近邻缺失值填补方法,对缺失的数据进行补充,由于后续步骤5中会将新数据逐条读取分析,在对新数据进行缺失值填补时,应当采用前n条数据从未填补过的原数据值进行计算,以避免误差叠加的风险,因此在这一步骤中,存储所采集的n条数据填补之前的值;
在步骤S3中,采用随机森林模型进行拟合训练,设置n_tree(基分类器个数)为200,lr_rate(学习率)为0.01,在随机森林模型的训练步骤1)和2)中,随机抽取部分训练数据,以及随机抽取部分传感器维度特征来进行单颗决策树的训练,可以增强随机森林模型的抗拟合能力,并且增加随机森林模型的容错能力;
在步骤S5中,采集到的新数据经过步骤S2时,如果只是采用前n条数据存储的平均值μ与标准差σ,在数据量增大的情况下会产生数据走向的偏差,使得数据库不停向数据的簇中心聚集,使数据丧失多样性,因此在此步骤需要动态更新平均值μ与标准差σ后再进行异常值的剔除。
与现有技术相比,本发明的有益效果
(1)本发明能够有效地对海上平台的变压器设备进行风险评估,与以往其他发明专利不同的是,本专利可以给出对机器学习模型评估的解释信息来辅助现场人员排查危险;
(2)本发明通过在随机森林模型上建立基于博弈论的Shapleyvalue模型,对各个传感器维度的特征进行贡献分析,具有相当完备的数学理论基础;
(3)本发明建立的数据模型,依托于机器学习中的随机森林模型,具有时间复杂度低的特点,因此适合于海上平台电气监测中的实时反应要求;
(4)本发明所采用的随机森林模型,具有缺失值不敏感的特点,非常适合于传感器大量分布于环境恶劣的海上平台的环境。
附图说明
图1为本发明流程图(输入输出示意图);
图2为传统的风险评估系统流程图(输入输出示意图);
图3为变压器致因分析举例示意图;
图4为数据表清洗示意图。
具体实施方式
下面结合附图及实施案例,对本发明进行进一步的详细说明,以使本发明的目的、技术方案及优点更加清楚明白。结合实例,本发明的具体步骤如下:
S1:进行充分的数据采集和缺失值填补。我们以如下表为源数据表:
Figure 727642DEST_PATH_IMAGE007
按照图4中流程所示,我们将源数据表按照5分钟的间隔读入,按照时间进行相应的对齐,进行缺失值填补,学术界一般采用三种不同的方式来对带有缺失值的数据进行填补,分别为“0填充”、“平均值填充”以及“最近邻填充”,其中“0填充”即在缺失值处填补0,“平均值填补”即在数据表读入的数据中计算缺失特征的均值进行填补。
本专利中采用“kNN最近邻”方法来进行缺失值的填充,基于欧氏距离的最短距离点被认为是最近邻点,在处理缺失值的时候,找到距离这条数据最近的k个数据点对应所缺失的特征的平均值来进行填补,首先,计算缺失值所在数据与其他完整数据点的加权欧式距离:
Figure 486823DEST_PATH_IMAGE008
其中,d为本次采集的传感器数量(数据的传感器维度特征),i为数据的第i个传感器特征的索引,x为带有缺失值的数据,y为完整数据。对缺失值所在数据与其他完整数据全部计算完成加权欧式距离后,找到距离数据x最近的k个数据点,取它们对应缺失特征的平均值作为填补值,在本专利中k取5;
S2:3-sigma异常值检测,3-sigma原则又称为拉依达准则,它是先假设一组检测数据只含有随机误差,对其使用如下标准差公式进行计算处理得到标准差:
Figure DEST_PATH_IMAGE009
式中,x为现场采集的数据,μ为平均值,σ为标准差,n为采集总数,确定(u-3σ,u+3σ)这个区间,超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据予以剔除;
S3:机器学习算法拟合,我们采用随机森林模型进行数据拟合,随机森林就是通过集成学习的Bagging思想将多棵树集成的一种算法,它的基本单元就是决策树,不同决策树之间没有关联,当新的输入样本进入时,就让随机森林中的每一棵决策树分别进行判断和评估,每个决策树会得到一个自己的评估结果,决策树的评估结果中哪一个预估风险状态最多,随机森林模型就会把这个结果作为最终的变压器风险状态评估结果。
在模型的训练过程中,会采取随机抽样数据、随机选取特征的训练技巧,将总量为n的变压器数据,有放回的抽取n次,每次抽取1个,最终形成了n个训练数据,这选择好了的n个样本用来训练一个决策树,作为决策树根节点处的样本,每条数据都有d个传感器维度特征,在决策树的每个节点需要分裂时,随机从这d个特征中选取出m个特征,满足条件m小于d,然后从这m个特征中选择1个信息增益率最大的传感器特征作为该节点的分裂特征,首先信息熵的计算公式如下:
Figure 168341DEST_PATH_IMAGE010
其中D为n条训练数据组成的数据集合,K为变压器的风险评估等级个数,
Figure DEST_PATH_IMAGE011
为属于第k类变压器风险状态的数据个数,条件熵的计算公式如下:
Figure 278117DEST_PATH_IMAGE012
其中A为某一个参与计算的传感器特征,将传感器特征A的取值由小到大排列,取每两个值的中间点作为分裂点,将D划分为L个子集合,
Figure DEST_PATH_IMAGE013
是在集合
Figure 788601DEST_PATH_IMAGE014
中属于第k类风险状态的变压器数据个数,传感器特征A的固有熵公式为:
Figure DEST_PATH_IMAGE015
信息增益率的公式为:
Figure 441168DEST_PATH_IMAGE016
在单棵决策树每一个节点的构建过程中,选择信息增益率大的分裂点构建节点,每个节点都要按照这一规则来分裂,一直到不能够再分裂为止,重复进行数据抽样、传感器特征抽样和决策树构建,来建立一定数量的决策树,这样就构成了随机森林,本专利中取决策树数量200棵;
S4:博弈论理论建模,博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略,博弈论中的Shapley value理论可以从较为公平合理的角度评估每个成员对最终结果的贡献,在本专利中,将步骤S1、S2中采集到每一条数据的每个传感器特征视为Shapley value思想中的每一个成员,将人工标注的变压器风险水平视作团队产出,综合计算考虑所有传感器特征集合的各个子集,可以较为公平的评估各个特征对模型预测的贡献;
S5:将新时刻不同传感器的数据x采集,经过步骤S1进行缺失值填补,此时为避免误差积累,采用n条未填补的变压器数据再次进行最近邻缺失值填补,随即进行步骤S2的异常值剔除,这里更新平均值μ与标准差σ,并且使用更新后的平均值μ与标准差σ进行异常值剔除;
S6:将步骤S5得到的新数据输入随机森林模型,得到对此条数据中变压器的风险状态评估,随即进行Shapleyvalue计算,在新数据x上,对于某个传感器特征j,其对于模型预测的贡献记为
Figure DEST_PATH_IMAGE017
:
Figure 214958DEST_PATH_IMAGE018
其中,S是当前传感器特征子集,N是传感器特征的所有子集,
Figure DEST_PATH_IMAGE019
是排除j在外的所有子集,
Figure 625080DEST_PATH_IMAGE020
是对子集S加上传感器特征j后的模型输出值,
Figure DEST_PATH_IMAGE021
是仅在子集S上的模型输出值,
Figure 486726DEST_PATH_IMAGE022
意为考虑子集S时,有无传感器特征j对模型输出的影响,通过对新数据的每一个传感器特征计算贡献
Figure DEST_PATH_IMAGE023
,得到每一个传感器特征对随机森林模型输出,及变压器风险评估的贡献,即得到了一个维度为(1,d)的特征贡献向量;
S7:归一化后处理,在步骤S4中得到的维度为(1,d)的特征贡献向量d,可以表征这条数据的d个特征各自的贡献,本专利中对这一向量进行归因处理,即归一化处理:
Figure 118433DEST_PATH_IMAGE024
输出的处理后的向量记为
Figure DEST_PATH_IMAGE025
,此时的向量具有最大值为1,即
Figure 79436DEST_PATH_IMAGE026
的特点,因此作为贡献值适合用于致因分析,在得到这个特征向量后,可以通过分析每一个特征对变压器风险水平的贡献高低,来得到导致变压器产生风险的原因,平台维护人员可以通过致因分析得到的结果,加以人工经验判断,进行准确的风险排查。
本专利为融合博弈论的变压器风险致因分析方法,通过融合博弈论的中Shapleyvalue思想,克服了以往传统电气检测系统风险评估方法无法解释评估结果的不足,可得到对变压器状态风险评估的致因分析,如图3所示,可以通过每一个传感器特征的贡献大小来确定变压器的风险状态原因,本专利与以往的变压器风险评估方法不同,如图1和图2所示,增加了对变压器风险评估的反向致因分析,对海上油气平台变压器的风险状态维护有指导性帮助,具有广泛的应用价值。

Claims (5)

1.融合博弈论的变压器风险致因分析方法,其特征在于,包括以下步骤:
S1:定时收集变压器历史传感器数据,在不同传感器采集到的n条数据,按照时间进行对齐,并且进行缺失值填补,采用“kNN缺失值填补方法”;
S2:将S1中收集并填补了缺失值的数据进行异常值计算检测,采用3-sigma异常值检测技术,计算确定上下三个扰动范围的正常区间,超过这个区间的误差不属于随机误差而是粗大误差,含有该误差的数据予以剔除;
S3:以步骤S2中各个传感器采集的n条数据为训练数据,以步骤S1中采集的n条变压器风险水平人工标注数据为标签,利用机器学习模型对数据进行拟合训练,采用较为复杂的集成树模型——随机森林;
S4:利用博弈论Shapley value思想,对步骤S3中拟合训练好的随机森林模型进行数学建模;
S5:将新时刻不同传感器的数据x采集上来,经过步骤S1的数据清洗与缺失值填补,此步骤中将使用之前存储的n条未填补数据,并带入步骤S2中进行异常值剔除;
S6:将步骤S5中得到的新数据x输入随机森林模型,即可得到预测的变压器风险状态评估,再通过博弈论Shapley value分析来对随机森林模型的输出,即变压器的风险评估等级,进行计算、分析和解释,得到每一个数据每一个传感器维度特征的贡献;
S7:将步骤S6中得到的贡献向量进行归一化处理,经过归一化处理后,可以将每一个传感器特征贡献值限制到(0,1)之间,更适合作为致因分析来表征风险原因所在;
S8:定义变压器风险评估致因分析流水线:循环经过步骤S5得到变压器的风险状态预测、循环经过步骤S6、S7得到对此风险状态预测结果的致因分析,定义此流水线可以在线监控变压器的风险状态,并且实时给出风险状态的原因分析,可以指导工程人员排查检修。
2.根据权利要求1所述的融合博弈论的变压器风险致因分析方法,其特征在于:步骤S1中,根据缺失值所在数据,计算与其他数据点的加权欧式距离:
Figure 755097DEST_PATH_IMAGE002
其中,d为本次采集的传感器数量(数据的传感器维度特征),i为数据的第i个传感器特征的索引,x为带有缺失值的数据,y为完整数据,对缺失值所在数据与其他完整数据全部计算完成加权欧式距离后,找到距离数据x最近的k个数据点,取它们对应缺失特征的平均值作为填补值,k取5,在此步骤中,存储缺失值填补之前的n条数据值。
3.根据权利要求1所述的融合博弈论的变压器风险致因分析方法,其特征在于:步骤S4中利用博弈论理论对随机森林模型进行数学建模,在机器学习思想中,每一条数据的每个特征可以视为Shapley value思想中的每一个成员,基于这一思想,计算得到每一条数据中每个传感器特征的贡献。
4.根据权利要求1所述的融合博弈论的变压器风险致因分析方法,其特征在于:步骤S5中进行Shapleyvalue计算,在采集到的新数据x上,对于某个传感器特征j,其对于模型预测的贡献记为
Figure 889276DEST_PATH_IMAGE004
:
Figure 798326DEST_PATH_IMAGE006
其中,S是当前传感器特征子集,N是传感器特征的所有子集,
Figure 320443DEST_PATH_IMAGE008
是排除j在外的所有子集,
Figure 252627DEST_PATH_IMAGE010
是对子集S加上传感器特征j后的模型输出值,
Figure 721654DEST_PATH_IMAGE012
是仅在子集S上的模型输出值,
Figure 422894DEST_PATH_IMAGE014
意为考虑子集S时,有无传感器特征j对随机森林模型输出的影响。
5.根据权利要求1所述的融合博弈论的变压器风险致因分析方法,其特征在于:在步骤S8中定义的变压器风险评估致因分析流水线,循环经过步骤S5得到变压器的风险状态预测、循环经过步骤S6、S7得到对此风险状态预测结果的致因分析,定义此流水线可以在线监控变压器的风险状态,并且实时给出风险状态的原因分析,指导工程人员排查检修。
CN202211225269.0A 2022-10-09 2022-10-09 融合博弈论的变压器风险致因分析方法 Pending CN115293383A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211225269.0A CN115293383A (zh) 2022-10-09 2022-10-09 融合博弈论的变压器风险致因分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211225269.0A CN115293383A (zh) 2022-10-09 2022-10-09 融合博弈论的变压器风险致因分析方法

Publications (1)

Publication Number Publication Date
CN115293383A true CN115293383A (zh) 2022-11-04

Family

ID=83833308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211225269.0A Pending CN115293383A (zh) 2022-10-09 2022-10-09 融合博弈论的变压器风险致因分析方法

Country Status (1)

Country Link
CN (1) CN115293383A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115570228A (zh) * 2022-11-22 2023-01-06 苏芯物联技术(南京)有限公司 一种焊接管道供气智能反馈控制方法与系统
CN115796401A (zh) * 2023-02-07 2023-03-14 西南石油大学 融合博弈论的井下复杂事故致因分析方法
CN116861369A (zh) * 2023-09-04 2023-10-10 山东捷瑞数字科技股份有限公司 工业互联网异构数据融合的空压机健康评估方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109164343A (zh) * 2018-08-30 2019-01-08 西华大学 基于特征信息量化与加权knn的变压器故障诊断方法
CN110110784A (zh) * 2019-04-30 2019-08-09 贵州电网有限责任公司 一种基于变压器相关运行数据的变压器故障辨识方法
CN110533300A (zh) * 2019-08-08 2019-12-03 三峡大学 基于博弈集对云的变压器智能决策系统
CN114118588A (zh) * 2021-11-30 2022-03-01 广东电网有限责任公司广州供电局 聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法
CN115000968A (zh) * 2022-06-30 2022-09-02 国网上海市电力公司 基于博弈和风电出力相关性的海上风电接入系统规划方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109164343A (zh) * 2018-08-30 2019-01-08 西华大学 基于特征信息量化与加权knn的变压器故障诊断方法
CN110110784A (zh) * 2019-04-30 2019-08-09 贵州电网有限责任公司 一种基于变压器相关运行数据的变压器故障辨识方法
CN110533300A (zh) * 2019-08-08 2019-12-03 三峡大学 基于博弈集对云的变压器智能决策系统
CN114118588A (zh) * 2021-11-30 2022-03-01 广东电网有限责任公司广州供电局 聚类欠采样下基于博弈特征提取的迎峰度夏停电预测方法
CN115000968A (zh) * 2022-06-30 2022-09-02 国网上海市电力公司 基于博弈和风电出力相关性的海上风电接入系统规划方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李茜 等: "面向提供系统灵活性的风电场内机组优化运行", 《中国电力》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115570228A (zh) * 2022-11-22 2023-01-06 苏芯物联技术(南京)有限公司 一种焊接管道供气智能反馈控制方法与系统
CN115796401A (zh) * 2023-02-07 2023-03-14 西南石油大学 融合博弈论的井下复杂事故致因分析方法
CN116861369A (zh) * 2023-09-04 2023-10-10 山东捷瑞数字科技股份有限公司 工业互联网异构数据融合的空压机健康评估方法及系统

Similar Documents

Publication Publication Date Title
CN115293383A (zh) 融合博弈论的变压器风险致因分析方法
CN111340063B (zh) 一种磨煤机数据异常检测方法
CN111444940A (zh) 风机关键部位故障诊断方法
CN105677791B (zh) 用于分析风力发电机组的运行数据的方法和系统
CN111768082A (zh) 一种基于大数据分析的电力设备状态评估方法
CN109324604A (zh) 一种基于多源信号的智能列车综合故障分析方法
CN109271374A (zh) 一种基于机器学习的数据库健康度打分方法和打分系统
CN109472241A (zh) 基于支持向量回归的燃机轴承剩余使用寿命预测方法
CN107341349A (zh) 风机健康评估的方法、系统、存储器及控制器
CN110837866A (zh) 基于XGBoost的电力二次设备缺陷程度评估方法
CN114723285B (zh) 一种电网设备安全性评估预测方法
CN112383052A (zh) 基于电力物联网的电网故障修复方法和装置
CN110737874A (zh) 一种基于空间关系的流域水质监测异常值检测方法
CN114580706A (zh) 基于gru-lstm神经网络的电力金融业务风控方法及系统
CN116681187B (zh) 一种基于企业经营数据的企业碳配额预测方法
CN109782124B (zh) 一种基于梯度下降算法的主配用一体化故障定位方法及系统
CN112116160B (zh) 一种基于优化神经网络改进元胞自动机的重要输电通道灾害监测方法
CN103793859A (zh) 一种风电场运行监控及事件综合评价方法
CN111738420A (zh) 一种基于多尺度抽样的机电设备状态数据补全与预测方法
CN108445861A (zh) 一种基于卷积神经网络算法的转辙机故障检测方法及系统
CN114201374A (zh) 基于混合机器学习的运维时序数据异常检测方法及系统
CN112364928A (zh) 一种变电站故障数据诊断中的随机森林分类方法
CN110968703B (zh) 基于lstm端到端抽取算法的异常计量点知识库构建方法及系统
CN107862459A (zh) 一种基于大数据的计量设备状态评估方法及系统
CN115034671A (zh) 基于关联规则与聚类的二次系统信息故障分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20221104