CN114329966A

CN114329966A - 一种天然气管道远维控制系统健康度评价方法及系统

Info

Publication number: CN114329966A
Application number: CN202111630978.2A
Authority: CN
Inventors: 张世斌; 贾立东; 宋飞; 史威; 艾月乔; 张小俊; 张舒; 王宁; 黑卫春; 杨永利; 余冬; 张赫; 宫连峰; 杨全博; 高博颢
Original assignee: China Oil and Gas Pipeline Network Corp; National Pipe Network Group North Pipeline Co Ltd
Current assignee: China Oil and Gas Pipeline Network Corp; National Pipe Network Group North Pipeline Co Ltd
Priority date: 2021-12-28
Filing date: 2021-12-28
Publication date: 2022-04-12

Abstract

本发明提供了一种天然气管道远维控制系统健康度评价方法及系统，其中，所述方法包括：获得系统运行历史数据，并行训练健康度评价子模型，使用得到的各个判别器作为分类器分别对各硬件对应的测试集进行分类，根据分类结果与测试集对健康评价子模型进行性能验证和优化，获得最终健康度评价子模型；获得各硬件健康评价结果，进行等级离散处理获得离散结果，进行整体模型训练得到系统整体健康度评价模型，进行系统健康度评价。解决了现有技术中存在对远维系统的健康度评价过程中各个健康度等级的样本数据分布存在较严重的不平衡现象，并且无法保证生成的样本与原样本分布的一致性，健康度评价的准确性和可靠性较低的技术问题。

Description

一种天然气管道远维控制系统健康度评价方法及系统

技术领域

本发明涉及人工智能领域，具体涉及一种天然气管道远维控制系统健康度评价方法及系统。

背景技术

天然气管道远维控制系统实现了对油气管道SCADA系统的全设备一体化运维、油气管道调控业务的全流程运维、自动化与通讯安全的联合运维，解决了运维人员技术水平较弱、多运维业务无法有效整合等困难，有效提高自动化设备运行的可靠性，保障管网安全稳定运行。长输油气管道的自动化控制水平直接关系着其生产运行的安全和效率，为了保证远维系统平稳高效运行，运维人员需要实时掌握系统健康程度，因此对远维系统的健康度评价变得尤为关键。各个行业内系统的健康度评价都大多采用基于专家经验的方法，典型的方法有层次分析法、组合评价法等。

天然气管道远维系统的健康度等级可以分为完好、正常、注意、异常、严重五个类别。在实际运行中，系统大部分时间稳定健康运行，系统健康度长时间处于完好、正常状态，各个健康度等级的样本数据分布存在较严重的不平衡现象。因此对天然气管道远维系统的健康度评价可以转化为机器学习中的不平衡数据多分类问题。在传统的机器学习中，目前解决不平衡数据分类问题主要有两类方法。第一类方法是算法层面的方法，通过改进或提出新的方法来解决不平衡数据分类问题，主要包括代价敏感学习和集成方法两类。代价敏感学习通过给样本分配不同的误分类代价，增大少数类的误分类代价使分类器更关注少数类。集成方法通过集成多个分类器，对多个分类器的结果按照某种投票规则得出最终的分类结果。上述方法依赖于若干个样本的特征信息生成样本，但没有机制能保证生成的样本与原样本分布尽可能一致。而深度学习中近几年受到广泛研究的生成对抗网络(Generative adversarial network，GAN)为解决上述问题提供了新的思路并开始被人们用来处理不平衡数据分类问题。但在处理不平衡数据的多分类问题时，基于GAN的方法还存在这些问题：一是生成对抗网络虽然可以捕捉真实数据的分布，但生成器生成的数据可能对分类器分类起不到作用，而且生成的数据随机性大也会导致分类器的结果有很大随机性。二是在处理多分类问题时往往把多分类问题转化为二分类问题，这样会面临不平衡率增高、分类边界不明确、单一分类器信息丢失等问题，同时使用多个分类器分类还会降低分类效率。

但现有技术至少存在如下技术问题：

存在对远维系统的健康度评价过程中各个健康度等级的样本数据分布存在较严重的不平衡现象，并且无法保证生成的样本与原样本分布的一致性，健康度评价的准确性和可靠性较低的技术问题。

发明内容

本申请通过提供了一种天然气管道远维控制系统健康度评价方法及系统，解决了现有技术中存在对远维系统的健康度评价过程中各个健康度等级的样本数据分布存在较严重的不平衡现象，并且无法保证生成的样本与原样本分布的一致性，健康度评价的准确性和可靠性较低的技术问题。达到了通过对不同硬件的健康度单独训练子模型，根据系统的层级关系，对各硬件子模块单独训练后，汇总各自模块健康度等级进行系统的整体健康度评价，解决了不平衡数据分类问题，保证生成的样本与原样本分布的一致性，提高健康度评价的准确性和可靠性的技术效果。

鉴于上述问题，本申请提供了一种天然气管道远维控制系统健康度评价方法及系统。

第一方面，本申请提供了一种天然气管道远维控制系统健康度评价方法，其中，所述方法包括：获得系统运行历史数据，所述系统运行历史数据包括多个硬件运行历史数据；分别对每个硬件运行历史数据进行数据划分，其中，所述数据划分包括从所述硬件运行历史数据中选取训练集，确定测试集；分别利用各硬件在数据划分中得到的所述训练集并行训练健康度评价子模型，其中，所述健康度评价子模型与硬件一一对应；使用各健康度评价子模型训练得到的判别器作为分类器分别对各硬件对应的所述测试集进行分类，根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化，通过多次迭代确定最终健康度评价子模型；获得各所述最终健康度评价子模型的输出结果，所述输出结果包括各硬件健康评价结果；对所述各硬件健康评价结果进行等级离散处理，获得离散结果，并基于所述离散结果进行整体模型训练，得到系统整体健康度评价模型，利用所述系统整体健康度评价模型进行系统健康度评价。

另一方面，本申请提供了一种天然气管道远维控制系统健康度评价系统，其中，所述系统包括：第一获得单元，所述第一获得单元用于获得系统运行历史数据，所述系统运行历史数据包括多个硬件运行历史数据；第一执行单元，所述第一执行单元用于分别对每个硬件运行历史数据进行数据划分，其中，所述数据划分包括从所述硬件运行历史数据中选取训练集，确定测试集；第二执行单元，所述第二执行单元用于分别利用各硬件在数据划分中得到的所述训练集并行训练健康度评价子模型，其中，所述健康度评价子模型与硬件一一对应；第三执行单元，所述第三执行单元用于使用各健康度评价子模型训练得到的判别器作为分类器分别对各硬件对应的所述测试集进行分类，根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化，通过多次迭代确定最终健康度评价子模型；第二获得单元，所述第二获得单元用于获得各所述最终健康度评价子模型的输出结果，所述输出结果包括各硬件健康评价结果；第四执行单元，所述第四执行单元用于对所述各硬件健康评价结果进行等级离散处理，获得离散结果，并基于所述离散结果进行整体模型训练，得到系统整体健康度评价模型，利用所述系统整体健康度评价模型进行系统健康度评价。

第三方面，本申请提供了一种天然气管道远维控制系统健康度评价系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现第一方面任一项所述方法的步骤。

本申请中提供的一个或多个技术方案，至少具有如下技术效果或优点：

由于采用了获得系统多个硬件运行历史数据，分别对每个硬件运行历史数据进行数据划分，从所述硬件运行历史数据中选取训练集，确定测试集；分别利用各硬件在数据划分中得到的所述训练集并行训练健康度评价子模型，使用各健康度评价子模型训练得到的判别器作为分类器分别对各硬件对应的所述测试集进行分类，根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化，经过多次迭代确定最终健康度评价子模型；通过各所述最终健康度评价子模型获得各硬件健康评价结果；对所述各硬件健康评价结果进行等级离散处理，获得离散结果，并基于所述离散结果进行整体模型训练，得到系统整体健康度评价模型，利用所述系统整体健康度评价模型进行系统健康度评价的技术方案，本申请通过提供了一种天然气管道远维控制系统健康度评价方法及系统，达到了通过对不同硬件的健康度单独训练子模型，根据系统的层级关系，对各硬件子模块单独训练后，汇总各自模块健康度等级进行系统的整体健康度评价，解决了不平衡数据分类问题，保证生成的样本与原样本分布的一致性，提高健康度评价的准确性和可靠性的技术效果。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

图1为本申请实施例一种天然气管道远维控制系统健康度评价方法的流程示意图；

图2为本申请实施例一种天然气管道远维控制系统健康度评价系统的结构示意图；

图3为本申请实施例示例性电子设备的结构示意图。

附图标记说明：第一获得单元11，第一执行单元12，第二执行单元13，第三执行单元14，第二获得单元15，第四执行单元16，电子设备300，存储器301，处理器302，通信接口303，总线架构304。

具体实施方式

天然气管道远维系统的各个健康度等级的样本数据分布存在较严重的不平衡现象，因此对天然气管道远维系统的健康度评价可以转化为机器学习中的不平衡数据多分类问题。传统的基于过采样的不平衡数据处理方法依赖于若干个样本的特征信息生成样本，但没有机制能保证生成的样本与原样本分布尽可能一致。所以生成对抗网络被用来处理不平衡数据分类问题，通过生成器和判别器的对抗学习数据分布，利用生成器生成与原数据分布尽可能一致的平衡数据集。但生成对抗网络用于不平衡数据分类存在诸多问题。解决了现有技术中存在对远维系统的健康度评价过程中各个健康度等级的样本数据分布存在较严重的不平衡现象，并且无法保证生成的样本与原样本分布的一致性，健康度评价的准确性和可靠性较低的技术问题。

针对上述技术问题，本申请提供的技术方案总体思路如下：

本申请提供了一种天然气管道远维控制系统健康度评价方法，其中，所述方法包括：获得系统多个硬件运行历史数据，分别对每个硬件运行历史数据进行数据划分，从所述硬件运行历史数据中选取训练集，确定测试集；分别利用各硬件在数据划分中得到的所述训练集并行训练健康度评价子模型，使用各健康度评价子模型训练得到的判别器作为分类器分别对各硬件对应的所述测试集进行分类，根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化，经过多次迭代确定最终健康度评价子模型；通过各所述最终健康度评价子模型获得各硬件健康评价结果；对所述各硬件健康评价结果进行等级离散处理，获得离散结果，并基于所述离散结果进行整体模型训练，得到系统整体健康度评价模型，利用所述系统整体健康度评价模型进行系统健康度评价。

在介绍了本申请基本原理后，下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。

实施例一

如图1所示，本申请实施例提供了一种天然气管道远维控制系统健康度评价方法，其中，所述方法包括：

S100：获得系统运行历史数据，所述系统运行历史数据包括多个硬件运行历史数据；

具体而言，所述系统运行历史数据为天然气管道远维控制系统的运行历史数据，包括多个硬件运行历史数据。硬件设备主要包括服务器、路由器、交换机、工作站、PLC设备等，多种设备既相互配合保证远维控制系统的安全平稳运行，又单独负责实现各自的功能。天然气管道远维控制系统运行历史数据为天然气管道远维控制系统服务器资源占用情况，其特征属性包括系统运行时间、CPU单核使用率、内存使用率、电源状态、风扇状态、风扇转速、硬盘使用率、硬盘容量。并且，将服务器资源占用特征中的电源状态和风扇状态进行离散化为0和1之后，便于后续数据处理。

S200：分别对每个硬件运行历史数据进行数据划分，其中，所述数据划分包括从所述硬件运行历史数据中选取训练集，确定测试集；

进一步的，所述分别对每个硬件运行历史数据进行数据划分，其中，所述数据划分包括从所述硬件运行历史数据中选取训练集，确定测试集，步骤S200还包括：

S210：从所述硬件运行历史数据中基于健康度等级随机抽取80％数据作为所述训练集，剩余硬件运行历史数据作为所述测试集。

S300：分别利用各硬件在数据划分中得到的所述训练集并行训练健康度评价子模型，其中，所述健康度评价子模型与硬件一一对应；

具体而言，对每一个硬件运行历史数据进行数据划分，依据健康度等级等比例随机抽取，将所述硬件运行历史数据中划分为训练集和测试集，划分比例优选为8：2。进一步使用各硬件的训练集，使用ACWGAN-GP算法分别训练各硬件的健康度评价子模型。Wasserstein距离和辅助分类生成对抗网络算法(ACWGAN-GP)的详细步骤见表1的算法1。训练过程如下：随机选取全部天然气管道远维控制系统实际运行数据中的80％历史数据作为训练集S，其余20％作为测试集T，对天然气管道远维控制系统的健康度等级分为完好、正常、注意、异常、严重5个等级，离散化为0、1、2、3、4；循环交替训练生成器G和判别器D，生成器每训练1次，判别器训练n_critic次，使用相应的损失函数分别对生成器G和判别器D进行迭代更新，训练得到分类模型即所述健康度评价子模型(ACWGAN-GP模型)。考虑到不同硬件的评价指标不同，对不同硬件的健康度单独训练ACWGAN-GP子模型，根据系统的层级关系，对各硬件子模块进行单独训练后，能够为系统的整体健康度评价奠定基础。

表1 Wasserstein距离和辅助分类生成对抗网络算法(ACWGAN-GP)的详细步骤

S400：使用各健康度评价子模型训练得到的判别器作为分类器分别对各硬件对应的所述测试集进行分类，根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化，通过多次迭代确定最终健康度评价子模型；

具体而言，使用各健康度评价子模型(包括但不限于服务器健康度、路由器健康度、交换机健康度、工作站健康度和PLC健康度5个子模块的健康度评价模型)训练得到的判别器D作为分类器直接对各硬件对应的测试集T分类得到分类结果。根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化。通过多次迭代确定最终健康度评价子模型，运维人员可以根据这些子模型掌握单个硬件系统的运行情况，并依此对系统进行维护。

S500：获得各所述最终健康度评价子模型的输出结果，所述输出结果包括各硬件健康评价结果；

S600：对所述各硬件健康评价结果进行等级离散处理，获得离散结果，并基于所述离散结果进行整体模型训练，得到系统整体健康度评价模型，利用所述系统整体健康度评价模型进行系统健康度评价。

具体而言，获得各个最终健康度评价子模型的输出结果，所述输出结果包括各硬件健康评价结果用健康度等级表示，将子模块的健康度等级作为系统整体健康度评价模型的输入特征，使用ACWGAN-GP算法训练各子模块健康度的离散化等级数据，得到系统整体健康度评价模型。并行训练子模块模型，串行训练子模块与整体模块，构建系统整体健康度评价模型，使用所述系统整体健康度评价模型能够进行准确、可靠的系统健康度评价。

进一步的，如图2所示，本申请实施例还包括：

S610：步骤1：从服从正态分布的随机噪音中获得随机噪声数据，为所述随机噪声数据指定健康度等级，根据随机噪声数据和指定健康度等级，通过生成器得到生成数据；

S620：步骤2：从所述训练集中按照预设健康度等级分别抽样得到真实数据，将所述真实数据和生成数据送入所述判别器，得到真实数据概率和数据判别类别；

S630：步骤3：基于所述数据判别为真实的概率、所述数据判别类型通过损失函数更新判别器参数；

S640：步骤4：判断判别次数是否大于预设次数，当大于所述预设次数时，保持所述判别器参数不变，生成器通过所述噪声数据和所述指定健康度等级生成新数据；

S650：步骤5：基于所述噪声数据、所述指定健康度等级、所述生成新数据，根据损失函数更新生成器参数；

S660：步骤6：循环交替执行上述步骤1-5进行判别器参数、生成器参数训练更新，直到满足停止训练要求为止，得到所述最终健康度评价子模型，并基于最终判别器参数确定所述判别器。

具体而言，从服从于正态分布的随机噪声p_z(z)中获得随机噪声数据，为这些随机数据指定类别标签c_g得到生成数据

指定类别标签即为所述健康度等级，保证生成数据类别平衡。从服从于分布p_r(x)的真实数据中，根据类别标签c_r抽取数据，保证各类别数据类别平衡。从所述训练集中按照预设健康度等级分别抽样得到真实数据，X＝(x₁,x₂,...,x_n)和生成器G生成数据

送入判别器D，分别得到数据判别为真实数据的概率D(X)、数据判别为判别为生成的概率

和数据的判别类别c。

基于所述数据判别为真实数据的概率、所述数据判别类型通过损失函数更新判别器D参数，判断判别次数是否大于预设次数n_critic次，若大于，则，判别器D参数保持不变，生成器G通过噪声数据z和指定健康度等级c_g得到生成数据

基于所述噪声数据、所述指定健康度等级、所述生成新数据，根据损失函数

更新生成器G参数。若判别次数不满足大于预设次数n_critic次的要求，即判别次数不满足n_critic次则重复步骤1-步骤3继续从噪声分布中获得随机数据，为这些随机数据指定健康度等级，根据随机数据和指定健康度等级，通过生成器得到生成数据，从完好、正常、注意、异常、严重5个等级的原始数据中分别抽样得到真实数据，真实数据和生成数据送入判别器，得到数据为真实数据的概率和判别的类别，根据损失函数更新判别器参数，直到满足预设次数n_critic次为止。则继续执行步骤4-步骤5保持判别器参数保持不变，生成器使用噪声数据和指定健康度等级得到生成数据，根据损失函数更新生成器参数。这个过程为一次训练过程，即生成器训练一次，判别器判别n_critic次。

循环执行步骤1至步骤5进行判别器参数、生成器参数训练更新，循环交替进行判别器参数、生成器参数训练更新，经过多次迭代直到满足损失函数停止训练的要求为止，根据不同用户对精度的不同要求设置不同的停止训练要求。得到所述最终健康度评价子模型，并基于最终判别器参数确定所述判别器，利用得到的判别器进行分类。

进一步的，所述基于所述数据判别为真实的概率、所述数据判别类型通过损失函数更新判别器参数，步骤S630还包括：

S631：根据损失函数

其中，

基于所述损失函数，通过计算获得判别器参数的梯度，基于梯度对判别器参数进行更新其中，D(X)为数据判别为真实的概率，

为判别为生成的概率，c为数据判别类型，p_r(x)为真实数据分布，

为生成数据，

是判别器对抗训练损失，

是判别器类别损失，

服从分布

随机数a～U(0,1)，λ为梯度惩罚系数，p_z(z)为服从噪音分布的随机噪声数据，E为期望，c_r为真实数据类别，c_g为生成数据类别，logP(c＝c_r|x)和

分别表示辅助分类器预测数据类别为c_r和c_g的概率。

具体而言，对判别器参数更新的方法具体为通过损失函数计算获得判别器参数的梯度，基于梯度对判别器参数进行更新。在训练过程中，需要保证生成器生成与真实数据分布尽可能一致的数据，同时需要判别器尽可能识别数据来源。原始GAN使用的J-S散度不适合衡量生成数据和真实数据分布的距离，因此我们使用Wasserstein距离替代J-S散度衡量数据分布之间的距离。使用Wasserstein距离需要满足Lipschitz连续的条件，因此我们还引入梯度惩罚，避免判别器产生梯度爆炸或梯度消失。Wasserstein距离公式为：

公式中，Π(P_r,P_g)是真实数据分布和生成数据分布组合起来的所有可能的联合分布的集合。对于每个可能的分布γ，都可以从γ中采样得到一个真实样本x和生成样本y，并计算出两个样本的距离||x-y||，进而计算在该联合分布γ下，样本对距离的期望值E_(x,y)～γ[||x-y||]。在所有的联合分布Π(P_r,P_g)中，能取到期望的下限值的分布的距离，即最小距离，就是Wasserstein距离。

根据Kantorovich-Rubinstein对偶原理，在函数f满足Lipschitz连续的条件下，可以得到Wasserstein距离的等价形式：

为满足Lipschitz连续，引入梯度惩罚

其中，

服从分布

随机数a～U(0,1)，λ为梯度惩罚系数。因此，可以得到对抗训练损失函数为：

式中D(X)为判别为真实的概率，

为判别为生成的概率，p_r(x)为真实数据分布，

为生成数据，

服从分布

随机数a～U(0,1)，λ为梯度惩罚系数，p_z(z)为噪音分布，E为期望，生成器G生成数据为G(z,c)，

判别器D输出D(x)和

通过引入Wasserstein距离和梯度惩罚，缓解了ACGAN易产生模式崩溃的问题。

判别器的另外一个损失函数为辅助分类器损失。判别器通过对数据所属类别的预测，实现对多类数据同时训练，实现使用辅助分类器直接进行分类。辅助分类器的训练损失为：

其中，c为判别器得到的类别，c_r为真实数据类别，c_g为生成数据类别，logP(c＝c_r|x)和logP(c＝c_g|G(z,c_g))分别表示辅助分类器预测数据类别为c_r和c_g的概率，训练损失

越大，表示辅助分类器可以更准确的预测数据类别，通过最大化训练损失

实现对分类器的训练。

进一步的，所述基于所述噪声数据、所述指定健康度等级、所述生成新数据，根据损失函数更新生成器参数，步骤S650还包括：

S651：生成器通过噪声数据z和指定健康度等级c_g得到生成新数据

根据损失函数

更新生成器参数，其中：

是生成器类别损失，

是生成器对抗训练损失。

具体而言，生成对抗网络可以通过生成器和判别器的不断对抗学习获得数据的分布，利用生成器生成与原数据分布尽可能一致的平衡数据集。生成器通过噪声数据z和指定健康度等级c_g得到生成新数据

根据损失函数

更新生成器参数，

是生成器类别损失，

是生成器对抗训练损失。

进一步的，所述循环交替进行判别器参数、生成器参数训练更新，步骤S660还包括：

S661：所述生成器每训练一次，所述判别器训练n_critic次，所述预设次数为n_critic次。

具体而言，循环交替训练生成器G和判别器D，生成器每训练1次，判别器训练n_critic次，所述预设次数为n_critic次，判断判别次数是否大于预设次数，当大于所述预设次数时，保持所述判别器参数不变，生成器继续生成数据。使用相应的损失函数分别对生成器G和判别器D进行迭代更新。分别得到生成器损失和判别器损失之后，最小化判别器损失可以尽可能分辨数据来源和数据类别，最小化生成器损失可以生成与真实分布尽可能一致的数据。

进一步的，本申请实施例步骤S660还包括：

S662：使用ACWGAN-GP算法并行训练所述各健康度评价子模型，串行训练所述健康度评价子模型与所述系统整体健康度评价模型，其中，预设健康度等级包括：完好、正常、注意、异常、严重，对应的离散化结果分别为0、1、2、3、4。

具体而言，对不同硬件的健康度单独训练ACWGAN-GP子模型；根据系统的层级关系，对各硬件子模块进行单独训练后，汇总各自模块健康度等级进行系统的整体健康度评价。举例如：并行计算各个硬件子模型健康度，通过ACWGAN-GP算法并行训练分别得到服务器健康度、路由器健康度、交换机健康度、工作站健康度和PLC健康度5个子模块的健康度评价模型，将5个子模块的健康度等级作为系统整体健康度评价模型的输入特征，使用ACWGAN-GP算法训练各子模块健康度的离散化等级数据，得到系统整体健康度评价模型。其中健康度等级预设了5个等级包括：完好、正常、注意、异常、严重，且将预设健康度等级进行离散化，对应的离散化结果分别为0、1、2、3、4。从而完成串行训练所述健康度评价子模型与所述系统整体健康度评价模型的过程，构建系统整体健康度评价模型。

综上所述，本申请实施例所提供的一种天然气管道远维控制系统健康度评价方法及系统具有如下技术效果：

1、由于采用了获得系统多个硬件运行历史数据，分别对每个硬件运行历史数据进行数据划分，从其中选取训练集确定测试集；分别利用各硬件在数据划分中得到的所述训练集并行训练健康度评价子模型，使用各健康度评价子模型训练得到的判别器作为分类器分别对各硬件对应的所述测试集进行分类，根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化，经过多次迭代确定最终健康度评价子模型；通过各所述最终健康度评价子模型获得各硬件健康评价结果；对所述各硬件健康评价结果进行等级离散处理，获得离散结果，并基于所述离散结果进行整体模型训练，得到系统整体健康度评价模型，利用所述系统整体健康度评价模型进行系统健康度评价的技术方案，本申请实施例通过提供了一种天然气管道远维控制系统健康度评价方法及系统，达到了通过对不同硬件的健康度单独训练子模型，根据系统的层级关系，对各硬件子模块单独训练后，汇总各自模块健康度等级进行系统的整体健康度评价，解决了不平衡数据分类问题，保证生成的样本与原样本分布的一致性，提高健康度评价的准确性和可靠性的技术效果。

2、由于采用了在模型的训练过程中，生成器不断生成平衡数据，使用生成数据和真实数据对判别器进行训练的方法，Wasserstein距离和辅助分类生成对抗网络算法(ACWGAN-GP)直接使用判别器对数据进行多分类，尽可能避免转化为二分类问题时会面临不平衡率增高、分类边界不明确、单一分类器信息丢失等问题，并且引入Wasserstein距离和梯度惩罚，缓解了ACGAN易产生模式崩溃的问题的技术效果。

实施例二

将本申请提出的ACWGAN-GP算法的实验结果与其余九种算法的结果进行对比，实验结果如表1所示。观察表1中可以发现，ACWGAN-GP在τ_macroacc指标上表现更好，在13个公开数据集中的9个数据集上取得最好性能，每个公开数据集中的最佳结果使用粗体突出显示。ACWGAN-GP在13组数据上的平均准确率也取得了最好性能，且比其余方法中的最好方法提高了5.52％。

接着使用Wilcoxon符号秩检验和Friedman检验来对不同方法进行比较。Wilcoxon符号秩检验结果如表2所示，其中R+的值代表ACWGAN-GP方法的秩和，R-的值代表其余九种方法的秩和。从表2中可以看出，除CWGAN-GP外，其余所有方法在τ_macroacc上的所有原假设被拒绝，表明ACWGAN-GP与除CWGAN-GP的其余方法有显著差异，且R+大于R-，说明ACWGAN-GP性能更优越。Friedman检验结果如表1所示，ACWGAN-GP在Friedman检验中的平均排名最高，为2.00。试验结果表明，所提ACWGAN-GP方法在不平衡数据集上表现优于其他对比方法。

在天然气管道远维控制系统实际运行数据上采用五折交叉验证得到的平均分类结果如表3所示。观察表3可以发现，ACWGAN-GP在τ_macroacc指标分类上取得最佳性能，且比其余方法中的最好方法提高了2.43％。

表1 10种算法的分类结果对比

表2 ACWGAN-GP算法与其他算法差异性的Wilcoxon符号秩检验结果(α＝0.05)

表3远维控制系统实际运行数据上10种算法的分类结果对比

实施例三

基于与前述实施例中一种天然气管道远维控制系统健康度评价方法相同的发明构思，如图2所示，本申请实施例提供了一种天然气管道远维控制系统健康度评价系统，其中，所述系统包括：

第一获得单元11，所述第一获得单元11用于获得系统运行历史数据，所述系统运行历史数据包括多个硬件运行历史数据；

第一执行单元12，所述第一执行单元12用于分别对每个硬件运行历史数据进行数据划分，其中，所述数据划分包括从所述硬件运行历史数据中选取训练集，确定测试集；

第二执行单元13，所述第二执行单元13用于分别利用各硬件在数据划分中得到的所述训练集并行训练健康度评价子模型，其中，所述健康度评价子模型与硬件一一对应；

第三执行单元14，所述第三执行单元14用于使用各健康度评价子模型训练得到的判别器作为分类器分别对各硬件对应的所述测试集进行分类，根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化，通过多次迭代确定最终健康度评价子模型；

第二获得单元15，所述第二获得单元15用于获得各所述最终健康度评价子模型的输出结果，所述输出结果包括各硬件健康评价结果；

第四执行单元16，所述第四执行单元16用于对所述各硬件健康评价结果进行等级离散处理，获得离散结果，并基于所述离散结果进行整体模型训练，得到系统整体健康度评价模型，利用所述系统整体健康度评价模型进行系统健康度评价。

进一步的，所述系统包括：

第三获得单元，所述第三获得单元用于步骤1：从服从正态分布的随机噪音中获得随机噪声数据，为所述随机噪声数据指定健康度等级，根据随机噪声数据和指定健康度等级，通过生成器得到生成数据；

第五执行单元，所述第五执行单元用于步骤2：从所述训练集中按照预设健康度等级分别抽样得到真实数据，将所述真实数据和生成数据送入所述判别器，得到真实数据概率和数据判别类别；

第六执行单元，所述第六执行单元用于步骤3：基于所述数据判别为真实的概率、所述数据判别类型通过损失函数更新判别器参数；

第一生成单元，所述第一生成单元用于步骤4：判断判别次数是否大于预设次数，当大于所述预设次数时，保持所述判别器参数不变，生成器通过所述噪声数据和所述指定健康度等级生成新数据；

第七执行单元，所述第七执行单元用于步骤5：基于所述噪声数据、所述指定健康度等级、所述生成新数据，根据损失函数更新生成器参数；

第八执行单元，所述第八执行单元用于步骤6：循环交替执行上述步骤1-5进行判别器参数、生成器参数训练更新，直到满足停止训练要求为止，得到所述最终健康度评价子模型，并基于最终判别器参数确定所述判别器。

进一步的，所述系统包括：

第一计算单元，所述第一计算单元用于根据损失函数

其中

为生成数据，

是判别器对抗训练损失，

是判别器类别损失，

服从分布

分别表示辅助分类器预测数据类别为c_r和c_g的概率。

进一步的，所述系统包括：

第九执行单元，所述第九执行单元用于从所述硬件运行历史数据中基于健康度等级随机抽取80％数据作为所述训练集，剩余硬件运行历史数据作为所述测试集。

进一步的，所述系统包括：

第十执行单元，所述第十执行单元用于使用ACWGAN-GP算法并行训练所述各健康度评价子模型，串行训练所述健康度评价子模型与所述系统整体健康度评价模型，其中，预设健康度等级包括：完好、正常、注意、异常、严重，对应的离散化结果分别为0、1、2、3、4。

示例性电子设备

下面参考图3来描述本申请实施例的电子设备。

基于与前述实施例中一种天然气管道远维控制系统健康度评价方法相同的发明构思，本申请实施例还提供了一种天然气管道远维控制系统健康度评价系统，包括：处理器，所述处理器与存储器耦合，所述存储器用于存储程序，当所述程序被所述处理器执行时，使得系统以执行第一方面任一项所述的方法。

该电子设备300包括：处理器302、通信接口303、存储器301。可选的，电子设备300还可以包括总线架构304。其中，通信接口303、处理器302以及存储器301可以通过总线架构304相互连接；总线架构304可以是外设部件互连标(peripheral componentinterconnect，简称PCI)总线或扩展工业标准结构(extended industry Standardarchitecture，简称EISA)总线等。所述总线架构304可以分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

处理器302可以是一个CPU，微处理器，ASIC，或一个或多个用于控制本申请方案程序执行的集成电路。

通信接口303，使用任何收发器一类的系统，用于与其他设备或通信网络通信，如以太网，无线接入网(radio access network，RAN),无线局域网(wireless local areanetworks，WLAN)，有线接入网等。

存储器301可以是ROM或可存储静态信息和指令的其他类型的静态存储设备，RAM或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable Programmable read-only memory，EEPROM)、只读光盘(compactdisc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线架构304与处理器相连接。存储器也可以和处理器集成在一起。

其中，存储器301用于存储执行本申请方案的计算机执行指令，并由处理器302来控制执行。处理器302用于执行存储器301中存储的计算机执行指令，从而实现本申请上述实施例提供的一种天然气管道远维控制系统健康度评价方法。

可选的，本申请实施例中的计算机执行指令也可以称之为应用程序代码，本申请实施例对此不作具体限定。

本申请实施例提供了一种天然气管道远维控制系统健康度评价方法，其中，所述方法包括：获得系统多个硬件运行历史数据，分别对每个硬件运行历史数据进行数据划分，从所述硬件运行历史数据中选取训练集，确定测试集；分别利用各硬件在数据划分中得到的所述训练集并行训练健康度评价子模型，使用各健康度评价子模型训练得到的判别器作为分类器分别对各硬件对应的所述测试集进行分类，根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化，经过多次迭代确定最终健康度评价子模型；通过各所述最终健康度评价子模型获得各硬件健康评价结果；对所述各硬件健康评价结果进行等级离散处理，获得离散结果，并基于所述离散结果进行整体模型训练，得到系统整体健康度评价模型，利用所述系统整体健康度评价模型进行系统健康度评价。

本领域普通技术人员可以理解：本申请中涉及的第一、第二等各种数字编号仅为描述方便进行的区分，并不用来限制本申请实施例的范围，也不表示先后顺序。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“至少一个”是指一个或者多个。至少两个是指两个或者多个。“至少一个”、“任意一个”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a,b,或c中的至少一项(个、种)，可以表示：a,b,c,a-b,a-c,b-c,或a-b-c，其中a,b,c可以是单个，也可以是多个。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程系统。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

本申请实施例中所描述的各种说明性的逻辑单元和电路可以通过通用处理器，数字信号处理器，专用集成电路(ASIC)，现场可编程门阵列(FPGA)或其它可编程逻辑系统，离散门或晶体管逻辑，离散硬件部件，或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器，可选地，该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算系统的组合来实现，例如数字信号处理器和微处理器，多个微处理器，一个或多个微处理器联合一个数字信号处理器核，或任何其它类似的配置来实现。

本申请实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件单元、或者这两者的结合。软件单元可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地，存储媒介可以与处理器连接，以使得处理器可以从存储媒介中读取信息，并可以向存储媒介存写信息。可选地，存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中，ASIC可以设置于终端中。可选地，处理器和存储媒介也可以设置于终端中的不同的部件中。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管结合具体特征及其实施例对本申请进行了描述，显而易见的，在不脱离本申请的精神和范围的情况下，可对其进行各种修改和组合。相应地，本说明书和附图仅仅是本申请所界定的本申请的示例性说明，且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样，倘若这些修改和变型属于本申请及其等同技术的范围之内，则本申请意图包括这些改动和变型在内。

Claims

1.一种天然气管道远维控制系统健康度评价方法，其特征在于，所述方法包括：

获得系统运行历史数据，所述系统运行历史数据包括多个硬件运行历史数据；

分别对每个硬件运行历史数据进行数据划分，其中，所述数据划分包括从所述硬件运行历史数据中选取训练集，确定测试集；

分别利用各硬件在数据划分中得到的所述训练集并行训练健康度评价子模型，其中，所述健康度评价子模型与硬件一一对应；

使用各健康度评价子模型训练得到的判别器作为分类器分别对各硬件对应的所述测试集进行分类，根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化，通过多次迭代确定最终健康度评价子模型；

获得各所述最终健康度评价子模型的输出结果，所述输出结果包括各硬件健康评价结果；

对所述各硬件健康评价结果进行等级离散处理，获得离散结果，并基于所述离散结果进行整体模型训练，得到系统整体健康度评价模型，利用所述系统整体健康度评价模型进行系统健康度评价。

2.如权利要求1所述的方法，其特征在于，所述方法包括：

步骤1：从服从正态分布的随机噪音中获得随机噪声数据，为所述随机噪声数据指定健康度等级，根据随机噪声数据和指定健康度等级，通过生成器得到生成数据；

步骤2：从所述训练集中按照预设健康度等级分别抽样得到真实数据，将所述真实数据和生成数据送入所述判别器，得到数据判别为真实的概率和数据判别类别；

步骤3：基于所述数据判别为真实的概率、所述数据判别类型通过损失函数更新判别器参数；

步骤4：判断判别次数是否大于预设次数，当大于所述预设次数时，保持所述判别器参数不变，生成器通过所述噪声数据和所述指定健康度等级生成新数据；

步骤5：基于所述噪声数据、所述指定健康度等级、所述生成新数据，根据损失函数更新生成器参数；

步骤6：循环交替执行上述步骤1-5进行判别器参数、生成器参数训练更新，直到满足停止训练要求为止，得到所述最终健康度评价子模型，并基于最终判别器参数确定所述判别器。

3.如权利要求2所述的方法，其特征在于，所述基于所述数据判别为真实的概率、所述数据判别类型通过损失函数更新判别器参数，包括：

根据损失函数

其中，

为生成数据，

是判别器对抗训练损失，

是判别器类别损失，

服从分布

分别表示辅助分类器预测数据类别为c_r和c_g的概率。

4.如权利要求2所述的方法，其特征在于，所述基于所述噪声数据、所述指定健康度等级、所述生成新数据，根据损失函数更新生成器参数，包括：

生成器通过噪声数据z和指定健康度等级c_g得到生成新数据

根据损失函数

更新生成器参数，其中：

是生成器类别损失，

是生成器对抗训练损失。

5.如权利要求2所述的方法，其特征在于，所述循环交替进行判别器参数、生成器参数训练更新，包括：

所述生成器每训练一次，所述判别器训练n_critic次，所述预设次数为n_critic次。

6.如权利要求1所述的方法，其特征在于，所述分别对每个硬件运行历史数据进行数据划分，其中，所述数据划分包括从所述硬件运行历史数据中选取训练集，确定测试集，包括：

从所述硬件运行历史数据中基于健康度等级随机抽取80％数据作为所述训练集，剩余硬件运行历史数据作为所述测试集。

7.如权利要求2所述的方法，其特征在于，所述方法还包括：

使用ACWGAN-GP算法并行训练所述各健康度评价子模型，串行训练所述健康度评价子模型与所述系统整体健康度评价模型，其中，预设健康度等级包括：完好、正常、注意、异常、严重，对应的离散化结果分别为0、1、2、3、4。

8.一种天然气管道远维控制系统健康度评价系统，其特征在于，所述系统包括：

第一获得单元，所述第一获得单元用于获得系统运行历史数据，所述系统运行历史数据包括多个硬件运行历史数据；

第一执行单元，所述第一执行单元用于分别对每个硬件运行历史数据进行数据划分，其中，所述数据划分包括从所述硬件运行历史数据中选取训练集，确定测试集；

第二执行单元，所述第二执行单元用于分别利用各硬件在数据划分中得到的所述训练集并行训练健康度评价子模型，其中，所述健康度评价子模型与硬件一一对应；

第三执行单元，所述第三执行单元用于使用各健康度评价子模型训练得到的判别器作为分类器分别对各硬件对应的所述测试集进行分类，根据分类结果与所述测试集对所述健康评价子模型进行性能验证和优化，通过多次迭代确定最终健康度评价子模型；

第二获得单元，所述第二获得单元用于获得各所述最终健康度评价子模型的输出结果，所述输出结果包括各硬件健康评价结果；

第四执行单元，所述第四执行单元用于对所述各硬件健康评价结果进行等级离散处理，获得离散结果，并基于所述离散结果进行整体模型训练，得到系统整体健康度评价模型，利用所述系统整体健康度评价模型进行系统健康度评价。

9.一种天然气管道远维控制系统健康度评价系统，包括：处理器，所述处理器与存储器耦合，所述存储器用于存储程序，当所述程序被所述处理器执行时，其特征在于，使系统以执行如权利要求1～7任一项所述的方法。