CN111562541B - 一种应用cart算法实现电能表检测数据管理的软件平台 - Google Patents

一种应用cart算法实现电能表检测数据管理的软件平台 Download PDF

Info

Publication number
CN111562541B
CN111562541B CN202010481313.9A CN202010481313A CN111562541B CN 111562541 B CN111562541 B CN 111562541B CN 202010481313 A CN202010481313 A CN 202010481313A CN 111562541 B CN111562541 B CN 111562541B
Authority
CN
China
Prior art keywords
data
electric energy
energy meter
model
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010481313.9A
Other languages
English (en)
Other versions
CN111562541A (zh
Inventor
李建炜
曹献炜
王娜
林福平
王再望
党政军
杨杰
屈子旭
李全堂
刘贵平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningxia LGG Instrument Co Ltd
Original Assignee
Ningxia LGG Instrument Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningxia LGG Instrument Co Ltd filed Critical Ningxia LGG Instrument Co Ltd
Priority to CN202010481313.9A priority Critical patent/CN111562541B/zh
Publication of CN111562541A publication Critical patent/CN111562541A/zh
Application granted granted Critical
Publication of CN111562541B publication Critical patent/CN111562541B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R35/00Testing or calibrating of apparatus covered by the other groups of this subclass
    • G01R35/04Testing or calibrating of apparatus covered by the other groups of this subclass of instruments for measuring time integral of power or current
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种应用CART算法实现电能表检测数据管理的软件平台,涉及电能计量检测技术领域,通过采用云大数据管理平台,充分挖掘海量数据中的信息,以实现大数据的分析、挖掘和处理,通过采用云计算技术,能够在几秒钟的时间内处理上亿种数据类型,通过CART算法和改进型的CART算法,提高了不同数据的分类能力和计算精度,通过CART算法还能够实现大数据的分布式层次模型的构建,简化了数据识别能力。本发明通过采用数据融合算法将信息表现形式多样化、信息数量巨大化、信息关系复杂化的电能表各种数据及时性、准确、可靠地反映出来,通过BP神经网络算法模型,利用输出后的误差来估计输出层的直接前导层的误差,提高学习算法精度。

Description

一种应用CART算法实现电能表检测数据管理的软件平台
技术领域
本发明涉及电能计量检测技术领域,且更具体地涉及一种应用CART算法实现电能表检测数据管理的软件平台。
背景技术
随着智能电表厂商、电表种类越来越多,在进行电能表检定时,电能表检定装置往往是分布式布局的方式,分散式的本地测试不利于对测试数据进行整合分析和系统管理。因此如何整合分布式的测试资源和方案,提高测试效率,降低成本,是当前智能电表嵌入式软件测试所面临的重点、难点问题。由于电能表检定数据多样,如何从这些海量的数据中提取有用的信息来创造价值,就成为了一个关键问题。常规技术的电能表检测大数据管理往往采用人工管理的方法,随着计算机技术的发展,在采用计算机系统管理时,常规的存储式管理、关键词检索方式就显得无能无力。在智能电能表检定中,尤其是自动化流水线检定系统中,在实现智能电能表的自动传输、自动接拆线、自动检定、自动封印、贴标和智能分拣入库等功能的各个环节都会产生大量的数据信息,这就需要一种数据管理平台。
发明内容
针对现有技术的不足,本发明公开了一种应用CART算法实现电能表检测数据管理的软件平台,能够实现电能表检定过程中各个环节的数据管理,大大提高了数据管理能力。
为了解决上述技术问题,本发明采用以下技术方案:
一种应用CART算法实现电能表检测数据管理的软件平台,所述软件平台为基于SQL Server的数据库管理平台,其中所述软件平台包括:
数据层,其内至少设置有数据库,所述数据库设置有多通信数据接口,所述多通信数据接口至少包括GPRS通信接口、CDMA通信接口、光纤传输通信接口、RS485通信接口、RS232通信接口、红外通信接口或载波通信接口,用于接收外界设备层传输的各种电能表数据信息;其中所述数据库内的电能表数据类型至少包括电能表故障数据、检定数据、参数数据、性能数据、设备数据或环境数据,其中所述电能表故障数据至少包括电能表本体故障数据、电能表通信故障数据或电能表检测故障数据,所述检定数据信息至少包括电流、电压、功率、谐波或纹波或相序,所述参数数据至少包括电压参数、电流参数、电源频率、耗电计量参数或电能表精度等级,所述设备数据至少包括电能表型号、规格、工作标准或者精度,所述环境数据至少包括工作所处的温度、湿度、磁场、海拔或谐波干扰;
基础构建层,其内至少设置有结构模型、框架模型、动态模型、过程模型和功能模型,所述结构模型通过其内设置的构件或连接件之间的关系进行构建软件平台;所述框架模型是构建整个平台的框架结构;所述动态模型是补充所述软件平台的不足的元素,以在结构、布局或形态上进行调整;所述过程模型是以脚本的形式说明软件平台的构建过程和步骤;所述功能模型是构建所述软件平台实现的各种功能说明;
数据管理层,其内设置有数据处理模型,所述数据处理模型连接有CART算法模型和故障诊断模型,所述CART算法模型用于实现电能表数据的分类和处理,以使用户能够从较多的数据库内的数据中快速找到目标数据,通过分层结构的形式将电能表数据信息进行分类;所述故障诊断模型为BP神经网络算法模型,用以弥补所述CART算法模型的计算过程中存在的不足,以对所述CART算法模型分类后的数据进行自我校验,以提高数据处理的精度;其中所述CART算法模型包括分类树算法模型与回归树算法模型;所述分类树算法模型包括根节点节点、叶子节点和边,通过决策树分类器实现电能表各种数据的分类;所述回归树算法模型用于处理输出为连续型的数据;
数据应用层,其内至少设置有应用界面或者终端、客户端或便携式智能设备,所述终端为PDA、智能手机或笔记本;其中:
所述数据层的输出端与所述基础构件层的输入端连接,所述基础构件层的输出端与所述数据管理层的输入端连接,所述数据管理层的输出端与所述数据应用层的输入端连接。
进一步地,所述CART算法模型为改进型算法模型,所述CART算法模型设置有I/O数据接口,通过所述I/O数据接口实现与所述BP神经网络算法模型数据的交互与融合。
本发明还采用以下技术方案:
一种电能表检测数据管理方法,其中包括以下步骤:
(1)通过数据层获取电能表的各种数据信息,并对所述电能表的各种数据信息进行信息融合;
(2)通过基础构件层构建软件平台,并对数据库中的各种电能表数据信息进行存储;
(3)通过CART算法模型和BP神经网络算法模型实现电能表大数据的处理和分类;所述CART算法模型的输出端与所述BP神经网络算法模型的输入端连接;
(4)通过数据应用层对所述CART算法模型和BP神经网络算法模型处理后的数据进行应用,实现电能表各种数据信息的快速分类和处理。
进一步地,所述数据融合的模型为:
Figure RE-GDA0002570076970000021
Figure RE-GDA0002570076970000022
为归一化公式,
Figure RE-GDA0002570076970000023
为在t时刻下时各种不同电能表检定设备si输出的权重系数, m为不同的电能表检定设备。
进一步地,所述权重系数si的范围介于0-5.5之间。
进一步地,所述CART算法模型中所述分类树算法模型的构建方法为:
(1)数据获取:从数据层中取不同种类的电能表数据信息;
(2)数据训练:首先选定数据样本D,假设在数据样本中选择K个类别,则样本点属于第k类的概率设定为pk,则概率分布的基尼指数定义为:
Figure RE-GDA0002570076970000031
则对于数据样本D,则有:
Figure RE-GDA0002570076970000032
则Ck是数据样本D中第k类的数据样本,则在特征为A的情况下,数据样本D的基尼指数为:
Figure RE-GDA0002570076970000033
其中D1和D2是在数据集合D中被特征A分割的部分,然后选择基尼指数最小的特征及其对应的切分点作为最优特征与最优切分点,
(3)确定根节点:根据公式(5)计算出的基尼指数选择决策树的根节点,基尼指数较大的属性选作为根节点;
(4)确定叶节点:根据计算出的基尼指数选择决策树的叶节点,基尼指数较小的属性选作为叶节点;然后不断地重复应用公式(5)进行计算,停止计算的条件是结点中的样本个数小于预定阈值,或样本集的基尼指数小于预定阈值,则不再计算分类属性;
(5)建立数据模型:根据上述方法确定的根节点和叶节点,建立数据模型;
(6)构建决策树:根据数据模型,构建决策树;构建出的决策树是呈树形的结构,最后输出的是用户目标值;
(7)根据构建的决策树运行智能电能表大数据,输出运行结果。
进一步地,所述分类树算法模型的构建方法还包括决策树的剪枝步骤,以降低决策树的复杂度,决策树的剪枝通过最小化决策树整体的损失函数来实现,损失函数为:
Ca(T)=C(T)+α|T| (6)
其中T为任意子树,C(T)是对训练数据的预测误差,|T|为子树的叶结点个数,其中α≥0,Ca(T)为参数是α时的子树T的整体损失,其中α值越大,Ca(T)越小,α值越小,Ca(T)越大。
进一步地,所述回归树算法模型的构建方法为:
假设分别设定X为电能表输入变量,Y为输出变量,其中Y为连续输出变量,假设电能表给定的训练数据集为:
D={(x1,y1),(x2,y2),...,(xN,yN)}; (7)
其中选择第j个变量xj和其取值s作为切分变量和切分点,定义数据区域:
R1(j,s)={x|xj≤s}; (8)
R2(j,s)={x|xj>s}; (9)
然后寻找最优切分变量xj和其最优切分点s,通过以下公式求解:
Figure RE-GDA0002570076970000034
Figure RE-GDA0002570076970000041
其中:cm是区域Rm上的回归决策树输出,也是区域Rm上所有输入实例xi对应的输出yi的均值,则有:
cm=ave(yi|xi∈Rm); (11)
然后将每个区域R1和R2重复上述过程,将输入空间划分为M个区域,则有: R1,R2,...,Rm;则在每个区域上的输出为cm,其中m=1,2,...,M,则最小二乘回归树可表示为:
Figure RE-GDA0002570076970000042
进一步地,所述BP神经网络算法模型的构建方法为:
(1)对BP神经网络算法模型中的各个网络节点进行初始化处理,初始化数据至少包括阈值或输入权值;
(2)输入电能表各种数据样本的输入向量和期望输出值;
(3)计算出输入层、蕴含层和输出层中的参数值;
其中用以下公式调整输出层权系数:
Figure RE-GDA0002570076970000043
采用以下公式调整隐含层权系数:
Figure RE-GDA0002570076970000044
(4)求出输出层输出与期望输出的误差;计算公式为:
Figure RE-GDA0002570076970000045
(5)判断误差是否满足要求?当满足要求时,计算隐含层误差,当不满足要求时,返回步骤(3);
(6)计算隐含层误差,
(7)重新调整输出层和隐含层节点的阈值和输入权重,直到计算结束;
在公式(13)-(15)中,用字母Δωki表示BP神经网络算法模型的输出层权系数,用字母
Figure RE-GDA0002570076970000046
表示BP神经网络算法模型的的信息期望输出值,用字母
Figure RE-GDA0002570076970000047
表示为BP神经网络算法模型进行计算的输出,用字母η表示为常数。
进一步地,η的值介于0.25-3.2之间。
积极有益效果:
本发明采用云大数据管理平台,充分挖掘海量数据中的信息,以实现大数据的分析、挖掘和处理,以发现隐藏在宏观数据中的微观意义,通过采用云计算技术,能够在几秒钟的时间内处理上亿种数据类型,实现大数据的管理,提高大数据的计算能力;
本发明应用了CART算法,并进一步应用了改进型的CART算法,通过构建决策树实现大数据的分类,并利用回归树算法模型实现决策树的更进一步的分类和计算,并且生成可以理解的规则,计算量不大,误差较小,提高了不同数据数据的分类能力和计算精度,通过CART算法还能够实现大数据的分布式层次模型的构建,简化了数据识别能力;
本发明通过采用数据融合算法将信息表现形式多样化、信息数量巨大化、信息关系复杂化的电能表各种数据及时性、准确、可靠地反映出来,实现了数据识别能力;
本发明又通过,利用输出后的误差来估计输出层的直接前导层的误差,再用这个误差估计更前一层的误差,如此一层一层的反传下去,就获得了所有其他各层的误差估计,以提高学习算法精度。
附图说明
图1为本发明一种应用CART算法实现电能表检测数据管理的软件平台的架构示意图;
图2为本发明一种应用CART算法实现电能表检测数据管理的软件平台中的构建平台示意图;
图3为本发明一种应用CART算法实现电能表检测数据管理的软件平台中的基础构建层架构示意图;
图4为本发明一种应用CART算法实现电能表检测数据管理的软件平台中数据管理方法示意图;
图5为本发明一种应用CART算法实现电能表检测数据管理的软件平台中的数据管理模型示意图;
图6为本发明一种应用CART算法实现电能表检测数据管理的软件平台中决策树构建流程示意图;
图7为本发明一种应用CART算法实现电能表检测数据管理的软件平台中BP神经网络算法模型示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1平台
如图1-图3所示,一种应用CART算法实现电能表检测数据管理的软件平台,所述软件平台为基于SQL Server的数据库管理平台,其中所述软件平台包括:
数据层,其内至少设置有数据库,所述数据库设置有多通信数据接口,所述多通信数据接口至少包括GPRS通信接口、CDMA通信接口、光纤传输通信接口、RS485通信接口、RS232通信接口、红外通信接口或载波通信接口,用于接收外界设备层传输的各种电能表数据信息;其中所述数据库内的电能表数据类型至少包括电能表故障数据、检定数据、参数数据、性能数据、设备数据或环境数据,其中所述电能表故障数据至少包括电能表本体故障数据、电能表通信故障数据或电能表检测故障数据,所述检定数据信息至少包括电流、电压、功率、谐波或纹波或相序,所述参数数据至少包括电压参数、电流参数、电源频率、耗电计量参数或电能表精度等级,所述设备数据至少包括电能表型号、规格、工作标准或者精度,所述环境数据至少包括工作所处的温度、湿度、磁场、海拔或谐波干扰;
基础构建层,其内至少设置有结构模型、框架模型、动态模型、过程模型和功能模型,所述结构模型通过其内设置的构件或连接件之间的关系进行构建软件平台;所述框架模型是构建整个平台的框架结构;所述动态模型是补充所述软件平台的不足的元素,以在结构、布局或形态上进行调整;所述过程模型是以脚本的形式说明软件平台的构建过程和步骤;所述功能模型是构建所述软件平台实现的各种功能说明;
数据管理层,其内设置有数据处理模型,所述数据处理模型连接有CART算法模型和故障诊断模型,所述CART算法模型用于实现电能表数据的分类和处理,以使用户能够从较多的数据库内的数据中快速找到目标数据,通过分层结构的形式将电能表数据信息进行分类;所述故障诊断模型为BP神经网络算法模型,用以弥补所述CART算法模型的计算过程中存在的不足,以对所述CART算法模型分类后的数据进行自我校验,以提高数据处理的精度;其中所述CART算法模型包括分类树算法模型与回归树算法模型;所述分类树算法模型包括根节点节点、叶子节点和边,通过决策树分类器实现电能表各种数据的分类;所述回归树算法模型用于处理输出为连续型的数据;
数据应用层,其内至少设置有应用界面或者终端、客户端或便携式智能设备,所述终端为PDA、智能手机或笔记本;其中:
所述数据层的输出端与所述基础构件层的输入端连接,所述基础构件层的输出端与所述数据管理层的输入端连接,所述数据管理层的输出端与所述数据应用层的输入端连接。
在本发明中,所述CART算法模型为改进型算法模型,所述CART算法模型设置有I/O数据接口,通过所述I/O数据接口实现与所述BP神经网络算法模型数据的交互与融合。
实施例2方法
如图4所示,一种电能表检测数据管理方法,其中包括以下步骤:
(1)通过数据层获取电能表的各种数据信息,并对所述电能表的各种数据信息进行信息融合;
(2)通过基础构件层构建软件平台,并对数据库中的各种电能表数据信息进行存储;
(3)通过CART算法模型和BP神经网络算法模型实现电能表大数据的处理和分类;所述CART算法模型的输出端与所述BP神经网络算法模型的输入端连接;
(4)通过数据应用层对所述CART算法模型和BP神经网络算法模型处理后的数据进行应用,实现电能表各种数据信息的快速分类和处理。
针对步骤(S1),所述数据融合的模型为:
Figure RE-GDA0002570076970000061
Figure RE-GDA0002570076970000062
为归一化公式,
Figure RE-GDA0002570076970000063
为在t时刻下时各种不同电能表检定设备si输出的权重系数, m为不同的电能表检定设备。
在本发明中,所述权重系数si的范围介于0-5.5之间。
在本发明中,所述CART算法模型中所述分类树算法模型的构建方法为:
(1)数据获取:从数据层中取不同种类的电能表数据信息;
(2)数据训练:首先选定数据样本D,假设在数据样本中选择K个类别,则样本点属于第k类的概率设定为pk,则概率分布的基尼指数定义为:
Figure RE-GDA0002570076970000071
则对于数据样本D,则有:
Figure RE-GDA0002570076970000072
则Ck是数据样本D中第k类的数据样本,则在特征为A的情况下,数据样本D的基尼指数为:
Figure RE-GDA0002570076970000073
其中D1和D2是在数据集合D中被特征A分割的部分,然后选择基尼指数最小的特征及其对应的切分点作为最优特征与最优切分点,
(3)确定根节点:根据公式(5)计算出的基尼指数选择决策树的根节点,基尼指数较大的属性选作为根节点;
(4)确定叶节点:根据计算出的基尼指数选择决策树的叶节点,基尼指数较小的属性选作为叶节点;然后不断地重复应用公式(5)进行计算,停止计算的条件是结点中的样本个数小于预定阈值,或样本集的基尼指数小于预定阈值,则不再计算分类属性;
(5)建立数据模型:根据上述方法确定的根节点和叶节点,建立数据模型;
(6)构建决策树:根据数据模型,构建决策树;构建出的决策树是呈树形的结构,最后输出的是用户目标值;
(7)根据构建的决策树运行智能电能表大数据,输出运行结果。
在本发明中,所述分类树算法模型的构建方法还包括决策树的剪枝步骤,以降低决
策树的复杂度,决策树的剪枝通过最小化决策树整体的损失函数来实现,损失函数为:
Ca(T)=C(T)+α|T| (6)
其中T为任意子树,C(T)是对训练数据的预测误差,|T|为子树的叶结点个数,其中α≥0,Ca(T)为参数是α时的子树T的整体损失,其中α值越大,Ca(T)越小,α值越小,Ca(T)越大。
在本发明中,所述回归树算法模型的构建方法为:
假设分别设定X为电能表输入变量,Y为输出变量,其中Y为连续输出变量,假设电能表给定的训练数据集为:
D={(x1,y1),(x2,y2),...,(xN,yN)}; (7)
其中选择第j个变量xj和其取值s作为切分变量和切分点,定义数据区域:
R1(j,s)={x|xj≤s}; (8)
R2(j,s)={x|xj>s}; (9)
然后寻找最优切分变量xj和其最优切分点s,通过以下公式求解:
Figure RE-GDA0002570076970000081
其中:cm是区域Rm上的回归决策树输出,也是区域Rm上所有输入实例xi对应的输出yi的均值,则有:
cm=ave(yi|xi∈Rm); (11)
然后将每个区域R1和R2重复上述过程,将输入空间划分为M个区域,则有: R1,R2,...,Rm;则在每个区域上的输出为cm,其中m=1,2,...,M,则最小二乘回归树可表示为:
Figure RE-GDA0002570076970000082
在本发明中,所述BP神经网络算法模型的构建方法为:
(1)对BP神经网络算法模型中的各个网络节点进行初始化处理,初始化数据至少包括阈值或输入权值;
(2)输入电能表各种数据样本的输入向量和期望输出值;
(3)计算出输入层、蕴含层和输出层中的参数值;
其中用以下公式调整输出层权系数:
Figure RE-GDA0002570076970000083
采用以下公式调整隐含层权系数:
Figure RE-GDA0002570076970000084
(4)求出输出层输出与期望输出的误差;计算公式为:
Figure RE-GDA0002570076970000085
(5)判断误差是否满足要求?当满足要求时,计算隐含层误差,当不满足要求时,返回步骤(3);
(6)计算隐含层误差,
(7)重新调整输出层和隐含层节点的阈值和输入权重,直到计算结束;
在公式(13)-(15)中,用字母Δωki表示BP神经网络算法模型的输出层权系数,用字母
Figure RE-GDA0002570076970000086
表示BP神经网络算法模型的的信息期望输出值,用字母
Figure RE-GDA0002570076970000087
表示为BP神经网络算法模型进行计算的输出,用字母η表示为常数。
在本发明中,η的值介于0.25-3.2之间,在具体实施例中,η的值取2.8能够实现最佳的技术效果。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些具体实施方式仅是举例说明,本领域的技术人员在不脱离本发明的原理和实质的情况下,可以对上述方法和系统的细节进行各种省略、替换和改变。例如,合并上述方法步骤,从而按照实质相同的方法执行实质相同的功能以实现实质相同的结果则属于本发明的范围。因此,本发明的范围仅由所附权利要求书限定。

Claims (10)

1.一种应用CART算法实现电能表检测数据管理的软件平台,所述软件平台为基于SQLServer的数据库管理平台,其特征在于:所述软件平台包括:
数据层,其内至少设置有数据库,所述数据库设置有多通信数据接口,所述多通信数据接口至少包括GPRS通信接口、CDMA通信接口、光纤传输通信接口、RS485通信接口、RS232通信接口、红外通信接口或载波通信接口,用于接收外界设备层传输的各种电能表数据信息;其中所述数据库内的电能表数据类型至少包括电能表故障数据、检定数据、参数数据、性能数据、设备数据或环境数据,其中所述电能表故障数据至少包括电能表本体故障数据、电能表通信故障数据或电能表检测故障数据,所述检定数据信息至少包括电流、电压、功率、谐波或纹波或相序,所述参数数据至少包括电压参数、电流参数、电源频率、耗电计量参数或电能表精度等级,所述设备数据至少包括电能表型号、规格、工作标准或者精度,所述环境数据至少包括工作所处的温度、湿度、磁场、海拔或谐波干扰;
基础构建层,其内至少设置有结构模型、框架模型、动态模型、过程模型和功能模型,所述结构模型通过其内设置的构件或连接件之间的关系进行构建软件平台;所述框架模型是构建整个平台的框架结构;所述动态模型是补充所述软件平台的不足的元素,以在结构、布局或形态上进行调整;所述过程模型是以脚本的形式说明软件平台的构建过程和步骤;所述功能模型是构建所述软件平台实现的各种功能说明;
数据管理层,其内设置有数据处理模型,所述数据处理模型连接有CART算法模型和故障诊断模型,所述CART算法模型用于实现电能表数据的分类和处理,以使用户能够从较多的数据库内的数据中快速找到目标数据,通过分层结构的形式将电能表数据信息进行分类;所述故障诊断模型为BP神经网络算法模型,用以弥补所述CART算法模型的计算过程中存在的不足,以对所述CART算法模型分类后的数据进行自我校验,以提高数据处理的精度;其中所述CART算法模型包括分类树算法模型与回归树算法模型;所述分类树算法模型包括根节点、叶子节点和边,通过决策树分类器实现电能表各种数据的分类;所述回归树算法模型用于处理输出为连续型的数据;
数据应用层,其内至少设置有应用界面或者终端、客户端或便携式智能设备,所述终端为PDA、智能手机或笔记本;其中:
所述数据层的输出端与所述基础构建层的输入端连接,所述基础构件层的输出端与所述数据管理层的输入端连接,所述数据管理层的输出端与所述数据应用层的输入端连接。
2.根据权利要求1所述的一种应用CART算法实现电能表检测数据管理的软件平台,其特征在于:所述CART算法模型为改进型算法模型,所述CART算法模型设置有I/O数据接口,通过所述I/O数据接口实现与所述BP神经网络算法模型数据的交互与融合。
3.一种电能表检测数据管理方法,其特征在于:包括以下步骤:
通过数据层获取电能表的各种数据信息,并对所述电能表的各种数据信息进行信息融合;
通过基础构件层构建软件平台,并对数据库中的各种电能表数据信息进行存储;
通过CART算法模型和BP神经网络算法模型实现电能表大数据的处理和分类;所述CART算法模型的输出端与所述BP神经网络算法模型的输入端连接;
通过数据应用层对所述CART算法模型和BP神经网络算法模型处理后的数据进行应用,实现电能表各种数据信息的快速分类和处理。
4.根据权利要求3所述的一种电能表检测数据管理方法,其特征在于:所述数据融合的模型为:
Figure 727657DEST_PATH_IMAGE001
(1)
其中
Figure DEST_PATH_IMAGE002
(2)
Figure 647072DEST_PATH_IMAGE003
为归一化公式,
Figure DEST_PATH_IMAGE004
为在
Figure DEST_PATH_IMAGE005
时刻下时各种不同电能表检定设备输出的权重系数
Figure DEST_PATH_IMAGE006
Figure 468922DEST_PATH_IMAGE007
为不同的电能表检定设备。
5.根据权利要求4所述的一种电能表检测数据管理方法,其特征在于:所述权重系数
Figure DEST_PATH_IMAGE008
的范围介于0-5.5之间。
6.根据权利要求3所述的一种电能表检测数据管理方法,其特征在于:所述CART算法模型中所述分类树算法模型的构建方法为:
(1)数据获取:从数据层中取不同种类的电能表数据信息;
(2)数据训练:首先选定数据样本
Figure DEST_PATH_IMAGE009
,假设在数据样本中选择
Figure DEST_PATH_IMAGE010
个类别,则样本点属于第
Figure DEST_PATH_IMAGE011
类的概率设定为
Figure DEST_PATH_IMAGE012
,则概率分布的基尼指数定义为:
Figure DEST_PATH_IMAGE013
(3)
则对于数据样本
Figure 245117DEST_PATH_IMAGE009
,则有:
Figure DEST_PATH_IMAGE014
(4)
Figure DEST_PATH_IMAGE015
是数据样本
Figure 415067DEST_PATH_IMAGE009
中第
Figure 810276DEST_PATH_IMAGE011
类的数据样本,则在特征为
Figure DEST_PATH_IMAGE016
的情况下,数据样本
Figure 421386DEST_PATH_IMAGE009
的基尼指数为:
Figure DEST_PATH_IMAGE017
; (5)
其中
Figure DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE019
是在数据集合
Figure 648710DEST_PATH_IMAGE009
中被特征
Figure 978060DEST_PATH_IMAGE016
分割的部分,然后选择基尼指数最小的特征及其对应的切分点作为最优特征与最优切分点,
(3)确定根节点:根据公式(5)计算出的基尼指数选择决策树的根节点,基尼指数较大的属性选作为根节点;
(4)确定叶节点:根据计算出的基尼指数选择决策树的叶节点,基尼指数较小的属性选作为叶节点;然后不断地重复应用公式(5)进行计算,停止计算的条件是结点中的样本个数小于预定阈值,或样本集的基尼指数小于预定阈值,则不再计算分类属性;
(5)建立数据模型:根据上述方法确定的根节点和叶节点,建立数据模型;
(6)构建决策树:根据数据模型,构建决策树;构建出的决策树是呈树形的结构,最后输出的是用户目标值;
(7)根据构建的决策树运行智能电能表大数据,输出运行结果。
7.根据权利要求6所述的一种电能表检测数据管理方法,其特征在于:所述分类树算法模型的构建方法还包括决策树的剪枝步骤,以降低决策树的复杂度,决策树的剪枝通过最小化决策树整体的损失函数来实现,损失函数为:
Figure DEST_PATH_IMAGE020
(6)
其中
Figure DEST_PATH_IMAGE021
为任意子树,
Figure DEST_PATH_IMAGE022
是对训练数据的预测误差,
Figure DEST_PATH_IMAGE023
为子树的叶结点个数,其中
Figure DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE025
为参数是
Figure DEST_PATH_IMAGE026
时的子树
Figure 285283DEST_PATH_IMAGE021
的整体损失,其中
Figure 954161DEST_PATH_IMAGE026
值越大,
Figure 278351DEST_PATH_IMAGE025
越小,
Figure 829418DEST_PATH_IMAGE026
值越小,
Figure 832009DEST_PATH_IMAGE025
越大。
8.根据权利要求3所述的一种电能表检测数据管理方法,其特征在于:回归树算法模型的构建方法为:
假设分别设定
Figure DEST_PATH_IMAGE027
为电能表输入变量,
Figure DEST_PATH_IMAGE028
为输出变量,其中
Figure 417711DEST_PATH_IMAGE028
为连续输出变量,假设电能表给定的训练数据集为:
Figure DEST_PATH_IMAGE029
; (7)
其中选择第
Figure DEST_PATH_IMAGE030
个变量
Figure DEST_PATH_IMAGE031
和其取值
Figure DEST_PATH_IMAGE032
作为切分变量和切分点,定义数据区域:
Figure DEST_PATH_IMAGE033
; (8)
Figure DEST_PATH_IMAGE034
; (9)
然后寻找最优切分变量
Figure 893561DEST_PATH_IMAGE031
和其最优切分点
Figure 135186DEST_PATH_IMAGE032
,通过以下公式求解:
Figure 741136DEST_PATH_IMAGE035
; (10)
其中:
Figure DEST_PATH_IMAGE036
是区域
Figure DEST_PATH_IMAGE037
上的回归决策树输出,也是区域
Figure 243661DEST_PATH_IMAGE037
上所有输入实例
Figure DEST_PATH_IMAGE038
对应的输出
Figure DEST_PATH_IMAGE039
的均值,则有:
Figure DEST_PATH_IMAGE040
; (11)
然后将每个区域
Figure 906724DEST_PATH_IMAGE041
Figure DEST_PATH_IMAGE042
重复上述过程,将输入空间划分为
Figure 494700DEST_PATH_IMAGE043
个区域,则有:
Figure DEST_PATH_IMAGE044
;则在每个区域上的输出为
Figure 901410DEST_PATH_IMAGE036
,其中
Figure DEST_PATH_IMAGE045
,则最小二乘回归树可表示为:
Figure DEST_PATH_IMAGE046
(12)。
9.根据权利要求3所述的一种电能表检测数据管理方法,其特征在于:所述BP神经网络算法模型的构建方法为:
(1)对BP神经网络算法模型中的各个网络节点进行初始化处理,初始化数据至少包括阈值或输入权值;
(2)输入电能表各种数据样本的输入向量和期望输出值;
(3)计算出输入层、蕴含层和输出层中的参数值;
其中用以下公式调整输出层权系数:
Figure DEST_PATH_IMAGE047
(13)
采用以下公式调整隐含层权系数:
Figure DEST_PATH_IMAGE048
(14)
(4)求出输出层输出与期望输出的误差;计算公式为:
Figure DEST_PATH_IMAGE049
(15)
(5)判断误差是否满足要求,当满足要求时,计算隐含层误差,当不满足要求时,返回步骤(3);
(6)计算隐含层误差,
(7)重新调整输出层和隐含层节点的阈值和输入权重,直到计算结束;
在公式(13)-(15)中,用字母
Figure DEST_PATH_IMAGE050
表示BP神经网络算法模型的输出层权系数,用字母
Figure DEST_PATH_IMAGE051
表示BP神经网络算法模型的信息期望输出值,用字母
Figure DEST_PATH_IMAGE052
表示为BP神经网络算法模型进行计算的输出,用字母
Figure DEST_PATH_IMAGE053
表示为常数。
10.根据权利要求9所述的一种电能表检测数据管理方法,其特征在于:
Figure 713902DEST_PATH_IMAGE053
的值介于0.25-3.2之间。
CN202010481313.9A 2020-05-31 2020-05-31 一种应用cart算法实现电能表检测数据管理的软件平台 Active CN111562541B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010481313.9A CN111562541B (zh) 2020-05-31 2020-05-31 一种应用cart算法实现电能表检测数据管理的软件平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010481313.9A CN111562541B (zh) 2020-05-31 2020-05-31 一种应用cart算法实现电能表检测数据管理的软件平台

Publications (2)

Publication Number Publication Date
CN111562541A CN111562541A (zh) 2020-08-21
CN111562541B true CN111562541B (zh) 2022-05-24

Family

ID=72071247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010481313.9A Active CN111562541B (zh) 2020-05-31 2020-05-31 一种应用cart算法实现电能表检测数据管理的软件平台

Country Status (1)

Country Link
CN (1) CN111562541B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507790B (zh) * 2020-11-03 2023-09-29 北方工业大学 基于差异演化的互补分类回归树的故障诊断方法及系统
CN113205274A (zh) * 2021-05-21 2021-08-03 华设设计集团股份有限公司 一种施工质量定量化排名方法
CN115454959B (zh) * 2022-11-08 2023-01-24 中国民用航空飞行学院 航空飞行计划制定时气象数据核实方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030033628A (ko) * 2001-10-24 2003-05-01 한국전자통신연구원 판별 및 회귀 트리를 이용한 끊어읽기 강도 자동 레이블링방법
CN106161138A (zh) * 2016-06-17 2016-11-23 贵州电网有限责任公司贵阳供电局 一种智能自动计量方法及装置
CN108304536A (zh) * 2018-01-29 2018-07-20 中国科学院地理科学与资源研究所 一种耦合地缘环境要素的地缘环境模拟与预测平台
CN109961186A (zh) * 2019-03-22 2019-07-02 大唐环境产业集团股份有限公司 基于决策树和bp神经网络的脱硫系统运行参数预测方法
CN110750641A (zh) * 2019-09-24 2020-02-04 武汉大学 一种基于序列连接模型和二叉树模型的分类纠错方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030033628A (ko) * 2001-10-24 2003-05-01 한국전자통신연구원 판별 및 회귀 트리를 이용한 끊어읽기 강도 자동 레이블링방법
CN106161138A (zh) * 2016-06-17 2016-11-23 贵州电网有限责任公司贵阳供电局 一种智能自动计量方法及装置
CN108304536A (zh) * 2018-01-29 2018-07-20 中国科学院地理科学与资源研究所 一种耦合地缘环境要素的地缘环境模拟与预测平台
CN109961186A (zh) * 2019-03-22 2019-07-02 大唐环境产业集团股份有限公司 基于决策树和bp神经网络的脱硫系统运行参数预测方法
CN110750641A (zh) * 2019-09-24 2020-02-04 武汉大学 一种基于序列连接模型和二叉树模型的分类纠错方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于CART 算法的电能表故障概率决策树分析";李梦宇 等;《电力大数据》;20171031;第20卷(第10期);第7-10页 *

Also Published As

Publication number Publication date
CN111562541A (zh) 2020-08-21

Similar Documents

Publication Publication Date Title
CN111562541B (zh) 一种应用cart算法实现电能表检测数据管理的软件平台
Dezert et al. The SPOTIS rank reversal free method for multi-criteria decision-making support
US8756181B2 (en) System and method employing a self-organizing map load feature database to identify electric load types of different electric loads
Zhang et al. Community detection in networks with node features
US20130138669A1 (en) System and method employing a hierarchical load feature database to identify electric load types of different electric loads
CN109740694A (zh) 一种基于非监督学习的智能电网非技术性损失检测方法
CN111079780A (zh) 空间图卷积网络的训练方法、电子设备及存储介质
CN112132188B (zh) 一种基于网络属性的电商用户分类方法
CN108108455A (zh) 目的地的推送方法、装置、存储介质及电子设备
CN116596095B (zh) 基于机器学习的碳排放量预测模型的训练方法及装置
CN110866366A (zh) 一种基于XGBoost算法的含PHEV光伏微网孤岛检测法
CN109034490A (zh) 一种电力负荷预测方法、装置、设备及存储介质
CN116842459A (zh) 一种基于小样本学习的电能计量故障诊断方法及诊断终端
Zhang et al. Load Prediction Based on Hybrid Model of VMD‐mRMR‐BPNN‐LSSVM
Gao et al. Adapting the TopLeaders algorithm for dynamic social networks
Du et al. Image recommendation algorithm combined with deep neural network designed for social networks
CN110222098A (zh) 基于流数据聚类算法的电力大数据流异常检测
CN114117134A (zh) 一种异常特征检测方法、装置、设备和计算机可读介质
CN113033898A (zh) 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统
CN115130663B (zh) 基于图神经网络和注意力机制的异质网络属性补全方法
Bai RETRACTED ARTICLE: Data cleansing method of talent management data in wireless sensor network based on data mining technology
CN114723147A (zh) 基于改进的小波变换与神经网络的新能源功率预测方法
Guo et al. Multisource target data fusion tracking method for heterogeneous network based on data mining
Müller et al. An Integrated Graph Neural Network for Supervised Non-obvious Relationship Detection in Knowledge Graphs.
Wang et al. Research on line loss prediction model based on clustering and multi prediction model fusion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant