CN114444569B - 一种电源控制系统健康状态评估算法 - Google Patents
一种电源控制系统健康状态评估算法 Download PDFInfo
- Publication number
- CN114444569B CN114444569B CN202111584381.9A CN202111584381A CN114444569B CN 114444569 B CN114444569 B CN 114444569B CN 202111584381 A CN202111584381 A CN 202111584381A CN 114444569 B CN114444569 B CN 114444569B
- Authority
- CN
- China
- Prior art keywords
- sample data
- data set
- health
- control system
- support vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000036541 health Effects 0.000 title claims abstract description 143
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 25
- 238000011156 evaluation Methods 0.000 title abstract description 34
- 239000013598 vector Substances 0.000 claims abstract description 82
- 238000012706 support-vector machine Methods 0.000 claims abstract description 42
- 238000013145 classification model Methods 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 claims description 4
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 4
- 238000012854 evaluation process Methods 0.000 abstract description 14
- 230000003862 health status Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/245—Classification techniques relating to the decision surface
- G06F18/2451—Classification techniques relating to the decision surface linear, e.g. hyperplane
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公布了一种电源控制系统健康状态评估算法,该电源控制系统健康状态评估算法包括:获取电源控制系统的正样本数据集和负样本数据集;应用正样本数据集和负样本数据集对支持向量机进行分类训练;基于分类模型和第一支持向量,建立健康等级云模型;获取电源控制系统的待评估样本数据集,并将待评估样本数据集输入分类模型中,得到第二距离数据集;将第二距离数据集输入健康等级云模型中,得到待评估样本的健康隶属度向量集;计算电源控制系统的健康状态向量。本发明首先通过支持向量机将电源控制系统性能的健康评估问题转化为一个分类问题,降低了评估过程中主观因素的影响。
Description
技术领域
本发明属于电源控制系统技术领域,更具体地,涉及一种基于支持向量机和云模型的电源控制系统健康状态评估算法。
背景技术
现有评估方法采用的方式都是独立地分析每个参量后再做融合,由于电源系统非常复杂,各个部件、各个参数之间的重要性和依赖关系难以确定,因此在融合过程中这些参量之间的关系容易受到人为因素的影响,这增加了评估过程中的主观性。
通过分析支持向量机(SVM)分类算法的几何意义与系统健康评估定义之间的关系,我们可以将系统性能的健康评估问题转化为一个分类问题,从整体上评价电源系统或电源系统某一个子部件的健康状态,降低了评估过程中主观因素的影响。对系统性能进行综合评估时,不仅需要考虑性能状态的模糊性,还需要考虑系统性能评估值向评语映射的不确定性。随机性和模糊性,是最基本的不确定性。目前,模糊集理论只能处理模糊性的问题,而不能处理模糊性和随机性关联的问题。90年代初期,李德毅院士研究了模糊性和随机性及两者之间的关联性,在传统模糊数学和概率统计的基础上提出了定性定量互换的云模型,实现了定量与定性概念之间的不确定性转换,解决了模糊集理论所面临的问题。
因此,期待发明一种电源控制系统健康状态评估算法,能够有效解决现有技术中在电源系统评估过程中由于引入人为因素而导致的系统健康评估误差问题。
发明内容
本发明的目的是提出一种电源控制系统健康状态评估算法,能够有效解决现有技术中在电源系统评估过程中由于引入人为因素而导致的系统健康评估误差问题。
为了实现上述目的,本发明提供一种基于支持向量机和云模型的电源控制系统健康状态评估算法,包括:
获取电源控制系统的正样本数据集和负样本数据集;
应用所述正样本数据集和所述负样本数据集对所述支持向量机进行分类训练,得到分类模型和第一支持向量;
基于所述分类模型和所述第一支持向量,建立健康等级云模型;
获取所述电源控制系统的待评估样本数据集,并将所述待评估样本数据集输入所述分类模型中,得到所述待评估样本数据集中每个待评估样本数据到正样本分类平面的第二距离d2,从而得到第二距离数据集;
将所述第二距离数据集输入所述健康等级云模型中,得到所述待评估样本的健康隶属度向量集;
基于所述待评估样本的健康隶属度向量集,计算所述电源控制系统的健康状态向量。
可选地,所述获取电源控制系统的正样本数据集和负样本数据集包括:
获取所述电源控制系统的历史样本数据集,并根据所述历史样本数据集构造所述正样本数据集和负样本数据集。
可选地,所述获取所述电源控制系统的历史样本数据集包括:
根据年份确定历史样本数据所在的文件夹,并遍历所述文件夹中所有数据文件;
设置目标数据文件,并针对每个所述数据文件执行以下步骤:
读取所述数据文件的第一列,得到所述数据文件中包含样本数据的时间轴,将所述数据文件中的时间轴拼接到所述目标数据文件中的时间轴上;
根据所述数据文件的第二列至最后一列,获得样本数据的参数名称及其对应的参数值,并根据对应的时间轴将所述参数名称及其对应的参数值记录在所述目标数据文件中,从而获取所述历史样本数据集。
可选地,所述根据所述数据文件的第二列至最后一列,获得样本数据的参数名称及对应的参数值包括:
根据所述数据文件的第二列至最后一列的第一行,获得多个参数名称字符串信息,去掉每个所述参数名称字符串信息的前缀和后缀,获得样本数据的参数名称;
根据所述数据文件的第二列至最后一列的第二行至最后一行,获取初始参数值,通过平滑算法去掉所述初始参数值中的异常数据,获得样本数据的参数值。
可选地,所述根据所述历史样本数据集构造所述正样本数据集和负样本数据集包括:
设定所述正样本数据集中正样本的个数为N1以及所述负样本数据集中负样本的个数为N2;
在所述历史样本数据集中采集N1个数据样本,获得所述正样本数据集;
读取所述历史样本数据集,对于所述历史样本数据集中每个样本数据的第i个参数,其中1≤i≤K,K表示参数个数,重复执行以下步骤:
计算所述第i个参数的直方图;
判断所述第i个参数是否完成N2/K次采样,如果没有则在所述直方图中通过拒绝/接受法进行一次采样,得到采样值v;
随机选取所述历史样本数据集中的一个样本数据,并将所述样本数据的第i个参数对应的参数值替换为v,得到一个负样本数据,将所述负样本数据加入所述负样本数据集中。
可选地,所述应用所述正样本数据集和所述负样本数据集对所述支持向量机进行分类训练,得到分类模型和第一支持向量包括:
将所述正样本数据集和所述负样本数据集分别加上标签+1和-1;
设定所述支持向量机的核函数;
将加上标签的所述正样本数据集和所述负样本数据集输入所述支持向量机中,并调用所述支持向量机的训练函数进行分类训练,从而得到所述分类模型和所述第一支持向量。
可选地,所述基于所述分类模型和所述第一支持向量,建立健康等级云模型包括:
基于所述分类模型和所述第一支持向量,计算所述正样本数据集中每个样本数据到正样本分类平面的第一距离d1,从而获得第一距离数据集;
基于所述第一距离数据集,建立多个健康等级,每个所述健康等级对应一个第一距离数据集的数值区间;
基于多个所述健康等级和每个所述健康等级对应的所述数值区间,建立健康等级云模型。
可选地,所述基于所述分类模型和所述第一支持向量,计算所述正样本数据集中每个样本数据到正样本分类平面的第一距离d1,从而获得第一距离数据集包括:
基于所述分类模型,计算所述正样本数据集中每个所述样本数据到最优分类平面的第三距离d3;
根据所述第一支持向量得到所述正样本数据集的所述正样本分类平面;
计算所述正样本数据集中每个样本数据到所述正样本分类平面的第一距离d1=1-d3,进而获得所述第一距离数据集。
可选地,所述基于多个所述健康等级和每个所述健康等级对应的所述数值区间,建立健康等级云模型包括:
基于多个所述健康等级和每个所述健康等级对应的所述数值区间,分别给出所述健康等级云模型的三个数字特征的特征值,所述三个数字特征分别为期望Ex、熵En和超熵He;
生成以En为期望值、He为方差的正态随机数En’,其中,En’=Normrnd(En,He),Normrnd为正态随机数函数;
生成以Ex为期望值、En’为方差的正态随机数Xi,其中,Xi=Normrnd(Ex,En’),Xi表示所述正样本数据集中每个样本数据到正样本分类平面的距离;计算Xi的确定度y,其中,
基于Xi和y,生成云滴,所述云滴表示为(Xi,y);
基于所述云滴,建立所述健康等级云模型。
可选地,所述基于所述待评估样品的健康隶属度向量集,计算出所述电源控制系统的健康状态向量并输出所述健康状态向量包括:
基于所述待评估样本的健康隶属度向量集,通过加权平均法或投票法计算出所述电源控制系统的健康状态向量;
将所述电源控制系统的健康状态向量进行归一化。
本发明的有益效果在于:
本发明的电源控制系统健康状态评估算法首先通过支持向量机将电源控制系统性能的健康评估问题转化为一个分类问题,从整体上评价电源系统或电源系统某一个子部件的健康状态,降低了评估过程中主观因素的影响,然后,通过结合云模型我们可以实现从评估值到评估语域的不确定性映射,解决了电源控制系统性能评估过程中存在的模糊性和随机性的问题,极大提高了评估的准确性,进而有效解决了现有技术中在电源系统评估过程中由于引入人为因素而导致的系统健康评估误差问题。
本发明的其它特征和优点将在随后具体实施方式部分予以详细说明。
附图说明
通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了根据本发明的一个实施例的一种基于支持向量机和云模型的电源控制系统健康状态评估算法的流程图。
具体实施方式
下面将更详细地描述本发明的优选实施方式。虽然以下描述了本发明的优选实施方式,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
根据本发明的一种基于支持向量机和云模型的电源控制系统健康状态评估算法,包括:
获取电源控制系统的正样本数据集和负样本数据集;
应用正样本数据集和负样本数据集对支持向量机进行分类训练,得到分类模型和第一支持向量;
基于分类模型和第一支持向量,建立健康等级云模型;
获取电源控制系统的待评估样本数据集,并将待评估样本数据集输入分类模型中,得到待评估样本数据集中每个待评估样本数据到正样本分类平面的第二距离d2,从而得到第二距离数据集;
将第二距离数据集输入健康等级云模型中,得到待评估样本的健康隶属度向量集;
基于待评估样本的健康隶属度向量集,计算电源控制系统的健康状态向量。
具体地,本发明的电源控制系统健康状态评估算法首先通过支持向量机将电源控制系统性能的健康评估问题转化为一个分类问题,从整体上评价电源系统或电源系统某一个子部件的健康状态,降低了评估过程中主观因素的影响,然后,通过结合云模型我们可以实现从评估值到评估语域的不确定性映射,解决了电源控制系统性能评估过程中存在的模糊性和随机性的问题,极大提高了评估的准确性,有效解决了现有技术中在电源系统评估过程中由于引入人为因素而导致的系统健康评估误差问题。
进一步地,正样本数据集为电源控制系统正常工作时获得的正常样本数据集,正常样本数据集包括时间、参数名称及对应的正常参数值,负常样本数据集为电源控制系统异常工作时的异常样本数据集,负常样本数据集包括时间、参数名称及对应的异常样本参数值。
在一个示例中,获取电源控制系统的正样本数据集和负样本数据集包括:
获取电源控制系统的历史样本数据集,并根据历史样本数据集构造正样本数据集和负样本数据集。
在一个示例中,获取电源控制系统的历史样本数据集包括:
根据年份确定历史样本数据所在的文件夹,并遍历所述文件夹中所有数据文件;
设置目标数据文件,并针对每个数据文件执行以下步骤:
读取数据文件的第一列,得到数据文件中包含样本数据的时间轴,将数据文件中的时间轴拼接到目标数据文件中的时间轴上;
根据数据文件的第二列至最后一列,获得样本数据的参数名称及其对应的参数值,并根据对应的时间轴将参数名称及其对应的参数值记录在目标数据文件中,从而获取历史样本数据集。
在一个示例中,根据所述数据文件的第二列至最后一列,获得样本数据的参数名称及对应的参数值包括:
根据数据文件的第二列至最后一列的第一行,获得多个参数名称字符串信息,去掉每个参数名称字符串信息的前缀和后缀,获得样本数据的参数名称;
根据数据文件的第二列至最后一列的第二行至最后一行,获取初始参数值,通过平滑算法去掉初始参数值中的异常数据,获得样本数据的参数值。
在一个示例中,根据历史样本数据集构造正样本数据集和负样本数据集包括:
设定正样本数据集中正样本的个数为N1以及负样本数据集中负样本的个数为N2;
在历史样本数据集中采集N1个数据样本,获得正样本数据集;
读取历史样本数据集,对于历史样本数据集中每个样本数据的第i个参数,其中1≤i≤K,K表示参数个数,重复执行以下步骤:
计算第i个参数的直方图;
判断第i个参数是否完成N2/K次采样,如果没有则在直方图中通过拒绝/接受法进行一次采样,得到采样值v;
随机选取历史样本数据集中的一个样本数据,并将样本数据的第i个参数对应的参数值替换为v,得到一个负样本数据,将负样本数据加入负样本数据集中。
在一个示例中,应用正样本数据集和所述负样本数据集对支持向量机进行分类训练,得到分类模型和第一支持向量包括:
将正样本数据集和负样本数据集分别加上标签+1和-1;
设定支持向量机的核函数;
将加上标签的正样本数据集和负样本数据集输入支持向量机中,并调用支持向量机的训练函数进行分类训练,从而得到分类模型和第一支持向量。
在一个示例中,基于分类模型和第一支持向量,建立健康等级云模型包括:
基于分类模型和第一支持向量,计算正样本数据集中每个样本数据到正样本分类平面的第一距离d1,从而获得第一距离数据集;
基于第一距离数据集,建立多个健康等级,每个健康等级对应一个第一距离数据集的数值区间;
基于多个健康等级和每个健康等级对应的数值区间,建立健康等级云模型。
具体地,基于所述第一距离数据集,建立多个健康等级包括:
基于所述第一距离数据集,建立五个健康等级,所述五个健康等级为健康、亚健康、一般、严重和危险;
健康、亚健康、一般、严重和危险分别对应的第一距离数据的数值区间为[-∞,0]、[0,0.7]、[0.7,1.3]、[1.3,2]和[2,+∞]。
但是,由于级别概念具有模糊性,对于一个定值,它所属于的级别就有了模糊性,这里,我们使用云模型的隶属度来表示。对于超熵为0的云模型,距离d’=0.5时,此样本点属于健康的隶属度为0.2494,属于亚健康的隶属度为1,属于一般的隶属度均为0.8007,属于退化的隶属度为0.0286,属于危险的隶属度为0.0000。所以d’=0.5的隶属度向量为(0.2494,1.0000,0.8007,0.0286,0.0000),归一化之后为(0.1200,0.4811,0.3852,0.0137,0.0000)。这里,隶属度体现了概念的模糊性。当超熵不为0时,由于隶属度也有一定的随机性,因此隶属度向量是有一个波动的,它的值并不是严格为(0.2494,1.0000,0.8007,0.0286,0.0000)。当d’=0.5时,其属于亚健康的隶属度是1,但是,其属于其它几个等级的隶属度会有相应的波动,这种波动体现了隶属度的随机性,波动的大小由期望、熵和超熵共同决定。因此,可以利用云模型的3个数字特征值,把模糊性(定性概念的亦此亦彼性)和随机性(隶属度的随机性)完全集成到一起,将距离d’转化为隶属度向量,这个隶属度向量能体现出系统的健康状况。
在一个示例中,基于分类模型和第一支持向量,计算正样本数据集中每个样本数据到正样本分类平面的第一距离d1,从而获得第一距离数据集包括:
基于分类模型,计算正样本数据集中每个样本数据到最优分类平面的第三距离d3;
根据第一支持向量得到正样本数据集的正样本分类平面;
计算正样本数据集中每个样本数据到正样本分类平面的第一距离d1=1-d3,进而获得第一距离数据集。
在一个示例中,基于多个健康等级和每个健康等级对应的数值区间,建立健康等级云模型包括:
基于多个健康等级和每个健康等级对应的数值区间,分别给出健康等级云模型的三个数字特征的特征值,三个数字特征分别为期望Ex、熵En和超熵He;
生成以En为期望值、He为方差的正态随机数En’,其中,En’=Normrnd(En,He),Normrnd为正态随机数函数;
生成以Ex为期望值、En’为方差的正态随机数Xi,其中,Xi=Normrnd(Ex,En’),Xi表示正样本数据集中每个样本数据到正样本分类平面的距离;
计算Xi的确定度y,其中,
基于Xi和y,生成云滴,云滴表示为(Xi,y);
基于云滴,建立健康等级云模型。
在一个示例中,基于待评估样品的健康隶属度向量集,计算出电源控制系统的健康状态向量并输出健康状态向量包括:
基于待评估样本的健康隶属度向量集,通过加权平均法或投票法计算出电源控制系统的健康状态向量;
将电源控制系统的健康状态向量进行归一化。
具体地,对于一段时间内每一个待估计健康等级的样本,都可得到相应的隶属度向量。通过一系列的隶属度向量,有很多种确定系统健康等级的方法。
方法一:每个样本通过隶属度最大原则映射到系统的某一等级,通过投票来决定系统的健康等级。
方法二:求出所有样本隶属度向量的均值,把该均值隶属度向量最大分量对应的等级作为系统的健康等级。
方法三:考虑到每个样本的重要性程度(由隶属度向量中最大值确定),把这个重要性作为权值,得到加权计算的隶属度均值向量,取该均值向量的最大分量对应的等级作为系统的健康等级。
通过对正常样本和负样本进行测试,该方法能够很好的区分健康和故障两个等级。对于亚健康和退化两种情况,由于目前很难人为确定相应等级的样本,也就很难对这两个等级进行测试。
实施例一
如图1所示,一种基于支持向量机和云模型的电源控制系统健康状态评估算法,包括:
步骤1:获取电源控制系统的正样本数据集和负样本数据集;
其中,获取电源控制系统的正样本数据集和负样本数据集包括:
获取电源控制系统的历史样本数据集,并根据历史样本数据集构造正样本数据集和负样本数据集。
其中,获取电源控制系统的历史样本数据集包括:
根据年份确定历史样本数据所在的文件夹,并遍历所述文件夹中所有数据文件;
设置目标数据文件,并针对每个数据文件执行以下步骤:
读取数据文件的第一列,得到数据文件中包含样本数据的时间轴,将数据文件中的时间轴拼接到目标数据文件中的时间轴上;
根据数据文件的第二列至最后一列,获得样本数据的参数名称及其对应的参数值,并根据对应的时间轴将参数名称及其对应的参数值记录在目标数据文件中,从而获取历史样本数据集。
其中,根据数据文件的第二列至最后一列,获得样本数据的参数名称及对应的参数值包括:
根据数据文件的第二列至最后一列的第一行,获得多个参数名称字符串信息,去掉每个参数名称字符串信息的前缀和后缀,获得样本数据的参数名称;
根据数据文件的第二列至最后一列的第二行至最后一行,获取初始参数值,通过平滑算法去掉初始参数值中的异常数据,获得样本数据的参数值。
其中,根据历史样本数据集构造正样本数据集和负样本数据集包括:
设定正样本数据集中正样本的个数为N1以及负样本数据集中负样本的个数为N2;
在历史样本数据集中采集N1个数据样本,获得正样本数据集;
读取历史样本数据集,对于历史样本数据集中每个样本数据的第i个参数,其中1≤i≤K,K表示参数个数,重复执行以下步骤:
计算第i个参数的直方图;
判断第i个参数是否完成N2/K次采样,如果没有则在直方图中通过拒绝/接受法进行一次采样,得到采样值v;
随机选取历史样本数据集中的一个样本数据,并将样本数据的第i个参数对应的参数值替换为v,得到一个负样本数据,将负样本数据加入负样本数据集中。
步骤2:应用正样本数据集和负样本数据集对支持向量机进行分类训练,得到分类模型和第一支持向量;
其中,应用正样本数据集和所述负样本数据集对支持向量机进行分类训练,得到分类模型和第一支持向量包括:
将正样本数据集和负样本数据集分别加上标签+1和-1;
设定支持向量机的核函数;
将加上标签的正样本数据集和负样本数据集输入支持向量机中,并调用支持向量机的训练函数进行分类训练,从而得到分类模型和第一支持向量。
步骤3:基于分类模型和第一支持向量,建立健康等级云模型;
其中,基于分类模型和第一支持向量,建立健康等级云模型包括:
基于分类模型和第一支持向量,计算正样本数据集中每个样本数据到正样本分类平面的第一距离d1,从而获得第一距离数据集;
基于第一距离数据集,建立多个健康等级,每个健康等级对应一个第一距离数据集的数值区间;
基于多个健康等级和每个健康等级对应的数值区间,建立健康等级云模型。
其中,基于分类模型和第一支持向量,计算正样本数据集中每个样本数据到正样本分类平面的第一距离d1,从而获得第一距离数据集包括:
基于分类模型,计算正样本数据集中每个样本数据到最优分类平面的第三距离d3;
根据第一支持向量得到正样本数据集的正样本分类平面;
计算正样本数据集中每个样本数据到正样本分类平面的第一距离d1=1-d3,进而获得第一距离数据集。
具体地,最优分类平面为SVM中的超平面,正样本分类平面为正样本数据集中距离超平面最近的样本且平行于超平面的平面,即在SVM中,实心点和空心点代表两类样本,H为正确分开两类样本的分类线,H1、H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类空隙或分类间隔。所谓最优分类线就是要求分类线不但能将两类正确分开,而且使分类间隔最大。要求两类训练样本正确分开就是保证经验风险最小,要求分类间隔最大也就是使推广性的界中的置信范围最小,从而使真实风险最小。
其中,基于多个健康等级和每个健康等级对应的数值区间,建立健康等级云模型包括:
基于多个健康等级和每个健康等级对应的数值区间,分别给出健康等级云模型的三个数字特征的特征值,三个数字特征分别为期望Ex、熵En和超熵He;
生成以En为期望值、He为方差的正态随机数En’,其中,En’=Normrnd(En,He),Normrnd为正态随机数函数;
生成以Ex为期望值、En’为方差的正态随机数Xi,其中,Xi=Normrnd(Ex,En’),Xi表示正样本数据集中每个样本数据到正样本分类平面的距离;
计算Xi的确定度y,其中,
基于Xi和y,生成云滴,云滴表示为(Xi,y);
基于云滴,建立健康等级云模型。
步骤4:获取电源控制系统的待评估样本数据集,并将待评估样本数据集输入分类模型中,得到待评估样本数据集中每个待评估样本数据到正样本分类平面的第二距离d2,从而得到第二距离数据集;
步骤5:将第二距离数据集输入健康等级云模型中,得到待评估样本的健康隶属度向量集;
步骤6:基于待评估样本的健康隶属度向量集,计算电源控制系统的健康状态向量。
其中,基于待评估样品的健康隶属度向量集,计算出电源控制系统的健康状态向量并输出健康状态向量包括:
基于待评估样本的健康隶属度向量集,通过加权平均法或投票法计算出电源控制系统的健康状态向量;
将电源控制系统的健康状态向量进行归一化。
综上所述,本发明的电源控制系统健康状态评估算法首先通过支持向量机将电源控制系统性能的健康评估问题转化为一个分类问题,从整体上评价电源系统或电源系统某一个子部件的健康状态,降低了评估过程中主观因素的影响,然后,通过结合云模型我们可以实现从评估值到评估语域的不确定性映射,解决了电源控制系统性能评估过程中存在的模糊性和随机性的问题,极大提高了评估的准确性,有效解决了现有技术中在电源系统评估过程中由于引入人为因素而导致的系统健康评估误差问题。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。
Claims (8)
1.一种基于支持向量机和云模型的电源控制系统健康状态评估算法,其特征在于,包括:
获取电源控制系统的正样本数据集和负样本数据集;
应用所述正样本数据集和所述负样本数据集对所述支持向量机进行分类训练,得到分类模型和第一支持向量;
基于所述分类模型和所述第一支持向量,建立健康等级云模型;
获取所述电源控制系统的待评估样本数据集,并将所述待评估样本数据集输入所述分类模型中,得到所述待评估样本数据集中每个待评估样本数据到正样本分类平面的第二距离d2,从而得到第二距离数据集;
将所述第二距离数据集输入所述健康等级云模型中,得到所述待评估样本的健康隶属度向量集;
基于所述待评估样本的健康隶属度向量集,计算所述电源控制系统的健康状态向量;
其中,所述获取电源控制系统的正样本数据集和负样本数据集包括:
获取所述电源控制系统的历史样本数据集,并根据所述历史样本数据集构造所述正样本数据集和负样本数据集;
所述根据所述历史样本数据集构造所述正样本数据集和负样本数据集包括:
设定所述正样本数据集中正样本的个数为N1以及所述负样本数据集中负样本的个数为N2;
在所述历史样本数据集中采集N1个数据样本,获得所述正样本数据集;
读取所述历史样本数据集,对于所述历史样本数据集中每个样本数据的第i个参数,其中1≤i≤K,K表示参数个数,重复执行以下步骤:
计算所述第i个参数的直方图;
判断所述第i个参数是否完成N2/K次采样,如果没有则在所述直方图中通过拒绝/接受法进行一次采样,得到采样值v;
随机选取所述历史样本数据集中的一个样本数据,并将所述样本数据的第i个参数对应的参数值替换为v,得到一个负样本数据,将所述负样本数据加入所述负样本数据集中。
2.根据权利要求1所述的基于支持向量机和云模型的电源控制系统健康状态评估算法,其特征在于,
所述获取所述电源控制系统的历史样本数据集包括:
根据年份确定历史样本数据所在的文件夹,并遍历所述文件夹中所有数据文件;
设置目标数据文件,并针对每个所述数据文件执行以下步骤:
读取所述数据文件的第一列,得到所述数据文件中包含样本数据的时间轴,将所述数据文件中的时间轴拼接到所述目标数据文件中的时间轴上;
根据所述数据文件的第二列至最后一列,获得样本数据的参数名称及其对应的参数值,并根据对应的时间轴将所述参数名称及其对应的参数值记录在所述目标数据文件中,从而获取所述历史样本数据集。
3.根据权利要求2所述的基于支持向量机和云模型的电源控制系统健康状态评估算法,其特征在于,
所述根据所述数据文件的第二列至最后一列,获得样本数据的参数名称及对应的参数值包括:
根据所述数据文件的第二列至最后一列的第一行,获得多个参数名称字符串信息,去掉每个所述参数名称字符串信息的前缀和后缀,获得样本数据的参数名称;
根据所述数据文件的第二列至最后一列的第二行至最后一行,获取初始参数值,通过平滑算法去掉所述初始参数值中的异常数据,获得样本数据的参数值。
4.根据权利要求1所述的基于支持向量机和云模型的电源控制系统健康状态评估算法,其特征在于,
所述应用所述正样本数据集和所述负样本数据集对所述支持向量机进行分类训练,得到分类模型和第一支持向量包括:
将所述正样本数据集和所述负样本数据集分别加上标签+1和-1;
设定所述支持向量机的核函数;
将加上标签的所述正样本数据集和所述负样本数据集输入所述支持向量机中,并调用所述支持向量机的训练函数进行分类训练,从而得到所述分类模型和所述第一支持向量。
5.根据权利要求1所述的基于支持向量机和云模型的电源控制系统健康状态评估算法,其特征在于,
所述基于所述分类模型和所述第一支持向量,建立健康等级云模型包括:
基于所述分类模型和所述第一支持向量,计算所述正样本数据集中每个样本数据到正样本分类平面的第一距离d1,从而获得第一距离数据集;
基于所述第一距离数据集,建立多个健康等级,每个所述健康等级对应一个第一距离数据集的数值区间;
基于多个所述健康等级和每个所述健康等级对应的所述数值区间,建立所述健康等级云模型。
6.根据权利要求5所述的基于支持向量机和云模型的电源控制系统健康状态评估算法,其特征在于,
所述基于所述分类模型和所述第一支持向量,计算所述正样本数据集中每个样本数据到正样本分类平面的第一距离d1,从而获得第一距离数据集包括:
基于所述分类模型,计算所述正样本数据集中每个所述样本数据到最优分类平面的第三距离d3;
根据所述第一支持向量得到所述正样本数据集的所述正样本分类平面;
计算所述正样本数据集中每个样本数据到所述正样本分类平面的第一距离d1=1-d3,进而获得所述第一距离数据集。
7.根据权利要求5所述的基于支持向量机和云模型的电源控制系统健康状态评估算法,其特征在于,
所述基于多个所述健康等级和每个所述健康等级对应的所述数值区间,建立健康等级云模型包括:
基于多个所述健康等级和每个所述健康等级对应的所述数值区间,分别给出所述健康等级云模型的三个数字特征的特征值,所述三个数字特征分别为期望Ex、熵En和超熵He;
生成以En为期望值、He为方差的正态随机数En’,其中,En’=Normrnd(En,He),Normrnd为正态随机数函数;
生成以Ex为期望值、En’为方差的正态随机数Xi,其中,Xi=Normrnd(Ex,En’),Xi表示所述正样本数据集中每个样本数据到正样本分类平面的距离;
计算Xi的确定度y,其中,
基于Xi和y,生成云滴,所述云滴表示为(Xi,y);
基于所述云滴,建立所述健康等级云模型。
8.根据权利要求1所述的基于支持向量机和云模型的电源控制系统健康状态评估算法,其特征在于,
所述基于所述待评估样品的健康隶属度向量集,计算出所述电源控制系统的健康状态向量并输出所述健康状态向量包括:
基于所述待评估样本的健康隶属度向量集,通过加权平均法或投票法计算出所述电源控制系统的健康状态向量;
将所述电源控制系统的健康状态向量进行归一化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111584381.9A CN114444569B (zh) | 2021-12-22 | 2021-12-22 | 一种电源控制系统健康状态评估算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111584381.9A CN114444569B (zh) | 2021-12-22 | 2021-12-22 | 一种电源控制系统健康状态评估算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114444569A CN114444569A (zh) | 2022-05-06 |
CN114444569B true CN114444569B (zh) | 2024-05-10 |
Family
ID=81364591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111584381.9A Active CN114444569B (zh) | 2021-12-22 | 2021-12-22 | 一种电源控制系统健康状态评估算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114444569B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156885A (zh) * | 2010-02-12 | 2011-08-17 | 中国科学院自动化研究所 | 基于级联式码本生成的图像分类方法 |
CN109871304A (zh) * | 2018-12-29 | 2019-06-11 | 北京航天测控技术有限公司 | 一种卫星电源状态评估方法 |
CN111835707A (zh) * | 2020-05-27 | 2020-10-27 | 江苏大学 | 一种基于改进后的支持向量机的恶意程序识别方法 |
WO2021185177A1 (zh) * | 2020-03-16 | 2021-09-23 | 福建省特种设备检验研究院 | 基于多数据采集的石化常压储油罐健康状态评估方法 |
-
2021
- 2021-12-22 CN CN202111584381.9A patent/CN114444569B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156885A (zh) * | 2010-02-12 | 2011-08-17 | 中国科学院自动化研究所 | 基于级联式码本生成的图像分类方法 |
CN109871304A (zh) * | 2018-12-29 | 2019-06-11 | 北京航天测控技术有限公司 | 一种卫星电源状态评估方法 |
WO2021185177A1 (zh) * | 2020-03-16 | 2021-09-23 | 福建省特种设备检验研究院 | 基于多数据采集的石化常压储油罐健康状态评估方法 |
CN111835707A (zh) * | 2020-05-27 | 2020-10-27 | 江苏大学 | 一种基于改进后的支持向量机的恶意程序识别方法 |
Non-Patent Citations (4)
Title |
---|
基于SVM和云模型的健康状态评估技术研究;朱林涛等;《电子工业专用设备》(第283期);第37-41页 * |
基于多尺度特征近似计算的行人检测方法;崔剑;侯晓荣;;电脑与电信(04);全文 * |
基于曲率分级的形状编码及识别方法;贾棋;于美玉;樊鑫;高新凯;郭禾;;计算机学报;20170918(11);全文 * |
基于风速-负荷联合状态的发输电系统可靠性评估研究;杨苏;袁越;陆丹;吴涵;;可再生能源(07);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114444569A (zh) | 2022-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112699913B (zh) | 一种台区户变关系异常诊断方法及装置 | |
US8868985B2 (en) | Supervised fault learning using rule-generated samples for machine condition monitoring | |
US8078913B2 (en) | Automated identification of performance crisis | |
CN109891508B (zh) | 单细胞类型检测方法、装置、设备和存储介质 | |
CN112148955A (zh) | 一种物联网时序数据异常检测方法及系统 | |
CN113792825A (zh) | 一种用电信息采集设备故障分类模型训练方法及装置 | |
CN101907681A (zh) | 基于gsd_svdd的模拟电路动态在线故障诊断方法 | |
CN112668164A (zh) | 诱导有序加权证据推理的变压器故障诊断方法及系统 | |
CN108647707B (zh) | 概率神经网络创建方法、故障诊断方法及装置、存储介质 | |
US11798266B2 (en) | Multi-dimensional task facial beauty prediction method and system, and storage medium | |
CN114239855B (zh) | 分析异常诊断信息的方法、装置、介质和计算设备 | |
CN116383727A (zh) | 一种电厂系统测量粗大误差识别方法、系统、设备及介质 | |
CN109902731B (zh) | 一种基于支持向量机的性能故障的检测方法及装置 | |
CN113884807B (zh) | 基于随机森林和多层架构聚类的配电网故障预测方法 | |
CN111125186A (zh) | 一种基于调查问卷的数据处理方法及系统 | |
CN114444569B (zh) | 一种电源控制系统健康状态评估算法 | |
CN113822336A (zh) | 一种云硬盘故障预测方法、装置、系统及可读存储介质 | |
CN112882898A (zh) | 基于大数据日志分析的异常检测方法、系统、设备及介质 | |
KR20220049573A (ko) | 거리 기반 학습 신뢰 모델 | |
CN114912549B (zh) | 风险交易识别模型的训练方法、风险交易识别方法和装置 | |
US20220222580A1 (en) | Deterioration detection method, non-transitory computer-readable storage medium, and information processing device | |
CN116383747A (zh) | 基于多时间尺度深度卷积生成对抗网络的异常检测方法 | |
US20220222568A1 (en) | System and Method for Ascertaining Data Labeling Accuracy in Supervised Learning Systems | |
US20220222486A1 (en) | Data Source Evaluation Platform for Improved Generation of Supervised Learning Models | |
CN112699908B (zh) | 标注图片的方法、电子终端、计算机可读存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |