CN110632191B - 一种基于决策树算法的变压器色谱峰定性方法和系统 - Google Patents
一种基于决策树算法的变压器色谱峰定性方法和系统 Download PDFInfo
- Publication number
- CN110632191B CN110632191B CN201910851009.6A CN201910851009A CN110632191B CN 110632191 B CN110632191 B CN 110632191B CN 201910851009 A CN201910851009 A CN 201910851009A CN 110632191 B CN110632191 B CN 110632191B
- Authority
- CN
- China
- Prior art keywords
- decision tree
- characteristic attribute
- sample set
- peak
- training sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8675—Evaluation, i.e. decoding of the signal into analytical information
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Treatment Of Liquids With Adsorbents In General (AREA)
Abstract
本发明公开了一种基于决策树算法的变压器色谱峰定性方法和系统,方法包括以下步骤:S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;S30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。本发明构建简单,抗漂移性能好,能够有效剔除假峰,能够实现有效色谱峰的正确分类,分类快且容错性好。
Description
技术领域
本发明涉及变压器色谱峰定性领域,尤其涉及一种基于决策树算法的变压器色谱峰定性方法和系统。
背景技术
电力变压器色谱技术是目前检测油中溶解气体最有效的方法之一,在线色谱技术是实现电力变压器在线实时监测的关键技术,电力变压器在线色谱技术与实验室离线色谱技术的本质区别是:没有人工的干扰,需要自动地采集色谱数据,进行色谱峰辨识、辨别对应色谱峰的成分和扣除基线,最后算出每个色谱成分的浓度含量;由于现场环境很恶劣,温度、湿度等变化较大,容易出现峰辨识缺陷、基线漂移等问题,要求色谱仪抗各种因素的干扰性要强。
正是由于在线色谱的特点,就对色谱算法提出了很高的要求,要求算法容错性大,在没有人工的辅助下自动、准确地完成这些工作。目前变压器在线色谱一般采用的定性技术是根据保留时间设定每个成分的变动区间来进行成分定性,有辨识范围较小,对峰漂移容错性不好,抗假峰能力差的缺点。
电力变压器在线色谱由于安装在现场,所以环境非常恶劣,有各种电磁噪声干扰、温度湿度的变化等,这些环境因素不可避免地使每次采集的色谱成分的峰位不一样,产生峰位的漂移,在温差大的环境漂移会很大。
针对上述这些问题,现有技术中有的把模糊技术引入了电力变压器色谱定性,也有的基于BP神经网络进行峰辨识和峰定性。但是其环境适应性较差,无法根据不同现场环境、不同浓度、不同设备的现场实际状况产生阈值,准确度有限。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种能够自适应阈值,抗漂移性能好,能够有效剔除假峰,能够实现有效色谱峰的正确分类,容错性好的基于决策树算法的变压器色谱峰定性方法和系统。
为了实现上述目的,本发明采用的技术方案为:
一种基于决策树算法的变压器色谱峰定性方法,包括以下步骤:
S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;
S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;
S30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。
上述方案中,利用决策树算法来进行变压器色谱峰定性,算法构建简单便利,抗漂移性能好,能够有效剔除假峰,能够实现变压器色谱峰中有效色谱峰的正确分类,定性正确度高,容错性好,尤其是可以自适应阈值,即能够根据不同现场环境、不同浓度、不同设备的现场实际状况产生阈值。
进一步地,所述步骤S30之后还包括:
S40:决策树模型重构建:用于若测试结果不符合预设标准,则添加训练样本进入所述训练样本集,并重复步骤S10之后的步骤直至步骤S30判断出测试结果符合预设标准。
进一步地,所述训练样本集的特征属性阈值自适应包括以下步骤:
S211:利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合;
S212:从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值。
进一步地,所述步骤S212中包括:
计算每个特征属性的所述候选划分点集合中的每个候选划分点对训练样本集进行划分所获得的信息增益;
选取信息增益最大的候选划分点作为该特征属性的阈值。
进一步地,所述决策树结点特征属性的选取包括:
S221:计算每个特征属性阈值的增益率;
S222:选取增益率最大的所述特征属性作为决策树结点。
进一步地,所述依据特征属性阈值和结点特征属性递归形成决策树包括:
重复执行步骤S211、S212、S221以及S222,确定决策树的根结点和每个分支的结点,直至数据分类结束,形成最终的决策树。
进一步地,所述特征属性集至少包括峰高、峰宽、峰面积以及峰位置。
进一步地,所述步骤S20还包括在所述决策树形成后对所述决策树进行修剪。
一种基于决策树算法的变压器色谱峰定性系统,包括:
数据准备与选取模块,用于从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;
决策树模型构建模块,用于利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;
结果测试模块,用于利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。
进一步地,所述决策树模型构建模块包括:
二分处理单元,用于利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合;
阈值自适应单元,用于从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值;
结点确认单元,用于计算每个特征属性阈值的增益率,选取增益率最大的所述特征属性作为决策树结点。
采用上述技术方案后,本发明的有益效果是:通过决策树的构建,建立了优良的分类标准,算法构建简单方便,能够根据不同现场环境、不同浓度、不同设备的现场实际状况自适应产生阈值,抗漂移性能好,容错性好,能够有效剔除假峰,有利于准确率高的分类变压器色谱峰中的有效峰。
附图说明
为了更清楚地说明本发明实施例或现有技术的技术方案,附图如下:
图1为本发明实施例1提供的一种基于决策树算法的变压器色谱峰定性方法流程图;
图2为本发明实施例1提供的优选的基于决策树算法的变压器色谱峰定性方法流程图;
图3为本发明实施例2提供的优选的一种基于决策树算法的变压器色谱峰定性系统框图;
图4为本发明实施例2提供的一具体实施方式下系统生成的决策树结构示意图。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
实施例1
如图1所示,本实施例提供一种基于决策树算法的变压器色谱峰定性方法,包括以下步骤:
S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;
数据准备与选取具体利用的算法现有技术有很多,主要是为了获得相对有效性较高的色谱峰数据,以便获得精炼样本,此处不予赘述,经过数据准备及数据选取之后,将得到训练样本集D,测试样本集Q以及特征属性集U,充分利用特征属性集U,选择最优的特征属性进行组合,建立相应分类规则,就能准确分类出有效峰;例如选取特征属性集U中包含峰高、峰宽以及峰位置三个特征属性;
S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;
训练样本集的特征属性阈值自适应过程中,特征属性可能都是连续值,因此,必须先利用连续属性离散化技术,将数值离散化,然后再像现有技术离散属性值一样考察每个划分点,选取最优的划分点作为阈值进行训练样本集的划分,其中最优的划分点的判定可以以信息增益作为评判标准,也可以以基尼指数或者增益率作为评判标准;
决策树结点特征属性的选取过程中,同样可以以信息增益、增益率以及基尼指数三者中的任一一种作为选取标准,获得每个结点所应当使用的特征属性以及相应的阈值,就可以逐步的向下分支形成决策树;
S30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。
上述方案中,利用决策树算法来进行变压器色谱峰定性,算法构建便利,能够根据不同现场环境、不同浓度、不同设备的现场实际状况自适应特征属性阈值,结点特征属性的选取标准统一,环境适应性强,错误率低,增减训练样本集D和测试样本集Q的样本数量以及增减特征属性集的特征属性数量能够便利分类准确率的调整,进而调整出更符合实际需求的分类规则,整体抗漂移性能好,能够有效剔除假峰,能够实现变压器色谱峰中有效色谱峰的正确分类,容错性好。
进一步地,如图2所示,所述步骤S30之后还包括:
S40:决策树模型重构建:用于若测试结果不符合预设标准,则添加训练样本进入所述训练样本集,并重复步骤S10之后的步骤直至步骤S30判断出测试结果符合预设标准。及时添加新的训练样本进入所述训练样本集,有利于智能的调整出符合实际分类标准的决策树,新的训练样本从现场变压器油色谱在线监测装置中提取获得。
所述训练样本集的特征属性阈值自适应包括以下步骤:
S211:利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合;
S212:从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值。
具体地,例如提取的特征属性集U包括峰高、峰宽、峰面积和峰位置,定义h,w,s和p分别为训练样本集D中特征属性峰高、峰宽、峰面积和峰位置的连续属性。h,w,s和p在训练样本集D上出现了V个可能的取值,将这些取值从小到大进行排序,分别记为:
峰高:{h1,h2,h3…,hV};
峰宽:{w1,w2,w3,…,wV};
峰面积:{s1,s2,s3…,sV};
峰位置:{p1,p2,p3,…,pV}。
各个V值根据数据真实情况各不相同,即峰高、峰宽、峰面积和峰位置的样本数量可不同。
以峰高h为例,基于划分点t可将训练样本集分为Dt +和Dt -,其中Dt -包含峰高不大于t值的样本,Dt +包含峰高大于t值的样本。显然,对相邻的属性取值hi与hi+1来说,t在区间[hi,hi+1)中任意取值所产生的划分结果相同。因此,对连续属性峰高h,可以考察包含(V-1)个元素的候选分点集合:
即把区间[hi,hi+1)的中位点(hi+hi+1)/2作为候选划分点。之后我们就可以像离散属性值一样来考察这些划分点,选取最优划分点进行训练样本集D的划分,最优划分点的判定可以以信息增益作为评判标准,也可以以基尼指数或者增益率作为评判标准。
所述步骤S212中包括:
计算每个特征属性的所述候选划分点集合中的每个候选划分点对训练样本集进行划分所获得的信息增益;
选取信息增益最大的候选划分点作为该特征属性的阈值。
上述步骤以信息增益作为最优划分点的评判标准,首先计算信息熵:
若当前训练样本集D中有效峰所占的比例为Pk(k=1,2),则训练样本集D的信息熵定义如下:
Ent(D)的值越小,则训练样本集D的纯度越高。
然后计算信息增益,以峰高h为例,结合式(1)后峰高h的信息增益具体定义如下:
其中,代表第t个候选划分点的取值,包含了训练样本集D中所有在峰高h上取值为ht范围内的样本,t用于区分候选划分点,例如数据1到10,“3”是其中一个t点(任何一个1到10都可以是一个t点),λ用于区分+和-,例如前文所述“3”为一个t点,则λ用于区分3+还是3-,若为3+,数据被分为两组,第一组[1,3],第二组(3,10], 表示分结点的权重,即训练样本集D中样本数越多对分支结点的影响越大。
比较每个候选划分点的信息增益,选择利用式(3)计算出的最大信息增益所对应的候选划分点作为特征属性峰高h的阈值。
所述决策树结点特征属性的选取包括:
S221:计算每个特征属性阈值的增益率;
S222:选取增益率最大的所述特征属性作为决策树结点。
具体地,还是以特征属性峰高h为例,增益率定义如下:
其中,,称为特征属性峰高h的“固有值”(intrinsicvalue)。一般来说峰高h的可能取值越多(即V越大),则IV(h)的值通常会越大;
利用式(4)计算出峰高h的增益率Gain_ratio(D,h),峰宽w的增益率Gain_ratio(D,w),峰面积s的增益率Gain_ratio(D,s),峰位置p的增益率Gain_ratio(D,p),比较Gain_ratio(D,h)、Gain_ratio(D,w)、Gain_ratio(D,s)以及Gain_ratio(D,p)的大小,选择最大增益率对应的特征属性作为决策树的结点特征属性,该特征属性的最佳划分点,也就是阈值,参考步骤S212的结果;
进一步地,所述依据特征属性阈值和结点特征属性递归形成决策树包括:
重复执行步骤S211、S212、S221以及S222,确定决策树的根结点和每个分支的结点,直至数据分类结束,形成最终的决策树。
形成完整的决策树只需要重复继续步骤S211、S212、S221以及S222,选取出后面每个分支的结点直至分类结束,或者直至所有True决策点样本总数和为变压器峰辨识中得到的气体组分峰的种数时,分类结束,需要注意的是,已经作为结点的特征属性不能作为后面分支的结点。
优选,所述特征属性集至少包括峰高、峰宽、峰面积以及峰位置。
进一步地,所述步骤S20还包括在所述决策树形成后对所述决策树进行修剪。
实施例2
如图3所示,本实施例提供一种基于决策树算法的变压器色谱峰定性系统,作为实施例1所述方法的物理支持,系统包括:
数据准备与选取模块100,用于从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;
决策树模型构建模块200,用于利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;优选还包括在形成决策树后对其进行修剪,修剪即为现有技术的剪枝过程,包括预剪枝和后剪枝;
结果测试模块300,用于利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。
进一步地,所述决策树模型构建模块200包括:
二分处理单元210,用于利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合;
阈值自适应单元220,用于从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值;
结点确认单元230,用于计算每个特征属性阈值的增益率,选取增益率最大的所述特征属性作为决策树结点。
上述模块和单元的具体运行参考实施例1所述,具体地,例如一具体实施例中:
数据准备与选取模块100提取训练编号为20190605152550的一组数据,从该组中筛选出的训练样本集包含19个训练样本,测试样本集包含6个测试样本,特征属性集包括峰高h、峰宽w、峰面积s以及峰位置p,对特征属性“峰高h”而言,在决策树学习开始时,根结点即包含19个训练样本,二分处理单元210根据实施例1式(1)计算获得该特征属性的候选划分点集合包含15个候选值:Th={0,0.002342,0.008358,0.019199,0.033967,0.918968,1.968109,4.132203,6.571499,10.6794,15.141897,18.746905,22.110970,22.893356,31.650967}。阈值自适应单元220由实施例1式(2)得Ent(D)=0.949452,由式(3)可计算出特征属性“峰高h”的信息增益较高的候选划分点为0.918968,对应信息增益为0.485。最后结点确认单元230由式(4)得该候选划分点的增益率为Gain_ratio(D,h)=0.486。
同理,得到其余特征属性峰宽w、峰面积s以及峰位置p的最佳候选划分点(特征属性阈值)和增益率为:
92.509,Gain_ratio(D,w)=0.588;
80.318,Gain_ratio(D,s)=0.484;
4022.5,Gain_ratio(D,p)=0.511。
0.588>0.511>0.486>0.484,因此“峰宽w”的增益率最大,于是,结点确认单元230确认“峰宽w”被选为根结点的特征属性,第一次结点特征属性的选取结束,接着结点划分过程递归进行,获取其他分支的结点选取,直到分类结束,决策树生成结束,需要注意的是,特征属性“峰宽w”被选过之后就不再使用,用剩下来的三个重新计算增益率来比较,再获得后一个分支的结点,即分支准确划分所应选用的特征属性。
优选对上述递归生成的决策树进行修剪处理,直至修剪掉任何一个都会使分类精度降低,最终生成的决策树如图4所示。
综上,本实施例的系统具备分类速度快,能够自适应特征属性的阈值,抗漂移性能好,容错性好,能够有效剔除假峰,有效峰定性更准确,分类准确率更高的优良特性。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (4)
1.一种基于决策树算法的变压器色谱峰定性方法,其特征在于,包括以下步骤:
S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集,所述特征属性集至少包括峰高、峰宽、峰面积以及峰位置;
S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;
所述训练样本集的特征属性阈值自适应包括以下步骤:
S211:利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合;定义h,w,s和p分别为训练样本集D中特征属性峰高、峰宽、峰面积和峰位置的连续属性;h,w,s和p在训练样本集D上出现了V个可能的取值,将这些取值从小到大进行排序,分别记为:峰高:{h1,h2,h3…,hV};峰宽:{w1,w2,w3,…,wV};峰面积:{s1,s2,s3…,sV};峰位置:{p1,p2,p3,…,pV};对连续属性峰高h,考察包含(V-1)个元素的候选分点集合,该集合为;
S212:从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值,最优划分点的判定以信息增益作为评判标准;
S30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性;
所述步骤S30之后还包括:
S40:决策树模型重构建:用于若测试结果不符合预设标准,则添加训练样本进入所述训练样本集,并重复步骤S10之后的步骤直至步骤S30判断出测试结果符合预设标准,及时添加新的训练样本进入所述训练样本集,有利于调整出符合实际分类标准的决策树,新的训练样本从现场变压器油色谱在线监测装置中提取获得;
所述步骤S212中包括:
计算每个特征属性的所述候选划分点集合中的每个候选划分点对训练样本集进行划分所获得的信息增益;
选取信息增益最大的候选划分点作为该特征属性的阈值;
所述决策树结点特征属性的选取包括:
S221:计算每个特征属性阈值的增益率;
S222:选取增益率最大的所述特征属性作为决策树结点;
所述依据特征属性阈值和结点特征属性递归形成决策树包括:
重复执行步骤S211、S212、S221以及S222,确定决策树的根结点和每个分支的结点,直至数据分类结束,形成最终的决策树;
形成完整的决策树只需要重复继续步骤S211、S212、S221以及S222,选取出后面每个分支的结点直至分类结束,或者直至所有True决策点样本总数和为变压器峰辨识中得到的气体组分峰的种数时,分类结束。
2.根据权利要求1所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述步骤S20还包括在所述决策树形成后对所述决策树进行修剪。
3.一种基于决策树算法的变压器色谱峰定性系统,采用如权利要求1所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,包括:
数据准备与选取模块,用于从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集,所述特征属性集至少包括峰高、峰宽、峰面积以及峰位置;
决策树模型构建模块,用于利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;
所述决策树模型构建模块包括:
二分处理单元,用于利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合;定义h,w,s和p分别为训练样本集D中特征属性峰高、峰宽、峰面积和峰位置的连续属性;h,w,s和p在训练样本集D上出现了V个可能的取值,将这些取值从小到大进行排序,分别记为:峰高:{h1,h2,h3…,hV};峰宽:{w1,w2,w3,…,wV};峰面积:{s1,s2,s3…,sV};峰位置:{p1,p2,p3,…,pV};对连续属性峰高h,考察包含(V-1)个元素的候选分点集合,该集合为;
阈值自适应单元,用于从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值;最优划分点的判定以信息增益作为评判标准;
结果测试模块,用于利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。
4.根据权利要求3所述的一种基于决策树算法的变压器色谱峰定性系统,其特征在于,所述决策树模型构建模块还包括:
结点确认单元,用于计算每个特征属性阈值的增益率,选取增益率最大的所述特征属性作为决策树结点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910851009.6A CN110632191B (zh) | 2019-09-10 | 2019-09-10 | 一种基于决策树算法的变压器色谱峰定性方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910851009.6A CN110632191B (zh) | 2019-09-10 | 2019-09-10 | 一种基于决策树算法的变压器色谱峰定性方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110632191A CN110632191A (zh) | 2019-12-31 |
CN110632191B true CN110632191B (zh) | 2023-04-18 |
Family
ID=68970859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910851009.6A Active CN110632191B (zh) | 2019-09-10 | 2019-09-10 | 一种基于决策树算法的变压器色谱峰定性方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110632191B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112633370B (zh) * | 2020-12-22 | 2022-01-14 | 中国医学科学院北京协和医院 | 一种针对丝状真菌形态的检测方法、装置、设备及介质 |
CN113379301A (zh) * | 2021-06-29 | 2021-09-10 | 未鲲(上海)科技服务有限公司 | 通过决策树模型对用户进行分类的方法、装置和设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MXPA06012232A (es) * | 2004-04-20 | 2007-06-15 | Univ Texas | Uso del patron proteogenomico del plasma para diagnostico, clasificacion, prediccion de respuesta a la terapia y comportamiento clinico, estratificacion de la terapia y monitoreo de enfermedad, en malignidades hematologicas. |
CN104535865A (zh) * | 2014-12-30 | 2015-04-22 | 西安工程大学 | 基于多参数的电力变压器运行故障综合诊断方法 |
CN106096748A (zh) * | 2016-04-28 | 2016-11-09 | 武汉宝钢华中贸易有限公司 | 基于聚类分析和决策树算法的装车工时预测模型 |
CN107193992A (zh) * | 2017-06-06 | 2017-09-22 | 云南电网有限责任公司信息中心 | 一种基于决策树算法的220kV主变压器状态评估预测方法 |
CN108663582A (zh) * | 2017-11-30 | 2018-10-16 | 全球能源互联网研究院有限公司 | 一种变压器的故障诊断方法及系统 |
-
2019
- 2019-09-10 CN CN201910851009.6A patent/CN110632191B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110632191A (zh) | 2019-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106055918B (zh) | 一种电力系统负荷数据的辨识及修正方法 | |
CN110632191B (zh) | 一种基于决策树算法的变压器色谱峰定性方法和系统 | |
CN105717556B (zh) | 一种基于大数据的自分型雷达估测降水方法 | |
CN108667684B (zh) | 一种基于局部向量点积密度的数据流异常检测方法 | |
CN110472671B (zh) | 基于多阶段的油浸式变压器故障数据预处理方法 | |
CN113011481B (zh) | 一种基于决策树算法的电能表功能异常评估方法及系统 | |
CN111275307A (zh) | 一种水质自动在线站高频连续观测数据质量控制方法 | |
CN111426905B (zh) | 一种配电网同母线变关系异常诊断方法、装置及系统 | |
CN104182642A (zh) | 一种基于稀疏表示的故障检测方法 | |
CN109270345A (zh) | 一种电网谐波信号的检测方法 | |
CN111275570A (zh) | 一种基于迭代式统计与假设检验的风电机组功率异常值检测方法 | |
CN111089856A (zh) | 一种拉曼光谱弱信号提取的后处理方法 | |
CN109828187B (zh) | 一种定位变电设备局部放电故障的时间差提取分析方法 | |
CN117454100A (zh) | 一种面向工程结构的缺失数据重构方法 | |
CN114666236B (zh) | 一种全自动信号检测识别报警方法 | |
CN110990383A (zh) | 一种基于工业大数据集的相似度计算方法 | |
CN115081485B (zh) | 一种基于ai的漏磁内检测数据自动分析方法 | |
CN111507374A (zh) | 一种基于随机矩阵理论的电网海量数据异常检测方法 | |
CN115659136A (zh) | 基于神经网络的无线干扰信号波形识别方法 | |
CN114114400A (zh) | 微地震事件有效信号拾取方法 | |
CN111428820A (zh) | 基于特征选择的矿井突水水源判别方法 | |
CN112381426A (zh) | 基于分阶段时间趋势特征的森林退化遥感监测方法及系统 | |
CN114493243B (zh) | 一种基于岭模型树算法的山洪灾害易发性评估方法 | |
CN114881074B (zh) | 一种基于聚类-深度学习的工程结构变形预测方法 | |
CN111596357B (zh) | 一种分析海底采集节点工作状态的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |