CN110413682A - 一种数据的分类展示方法及系统 - Google Patents

一种数据的分类展示方法及系统 Download PDF

Info

Publication number
CN110413682A
CN110413682A CN201910734531.6A CN201910734531A CN110413682A CN 110413682 A CN110413682 A CN 110413682A CN 201910734531 A CN201910734531 A CN 201910734531A CN 110413682 A CN110413682 A CN 110413682A
Authority
CN
China
Prior art keywords
data
device data
classification
binary tree
exhibiting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910734531.6A
Other languages
English (en)
Inventor
赵莹
王国平
蒋亚坤
赵川
巢玉坚
刘军
张磊
杨勰
刘赛
晁凯
张敏杰
吴垠
徐雪菲
宋凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan Power Grid Co Ltd
Nari Information and Communication Technology Co
Original Assignee
Yunnan Power Grid Co Ltd
Nari Information and Communication Technology Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan Power Grid Co Ltd, Nari Information and Communication Technology Co filed Critical Yunnan Power Grid Co Ltd
Priority to CN201910734531.6A priority Critical patent/CN110413682A/zh
Publication of CN110413682A publication Critical patent/CN110413682A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Abstract

本发明公开了一种数据的分类展示方法,包括采集设备数据,构建训练样本;用训练样本训练基于二叉树分类方法的数据模型;通过训练好的数据模型对待监测设备数据进行分类;根据分类结果,对待监测设备数据进行分类统计;根据统计结果,生成多维展示数据。同时公开了相应的系统。本发明构建基于二叉树分类方法的数据模型,通过数据模型对设备数据进行分类,根据分类统计生产多维展示数据,不仅过程简单,同时可实现数据的多维区分展示。

Description

一种数据的分类展示方法及系统
技术领域
本发明涉及一种数据的分类展示方法及系统,属于数据处理技术领域。
背景技术
伴随着人工智能的火热发展,以人工智能为基础的智能监测技术水平的不断提高和完善,使人们对人工智能在设备的主动监测领域有了期待,通过人工智能技术来对设备的运行情况进行实时主动的监测、及时预警和分类,比通过专家更具与便捷性、稳定性和实时性,通过人工智能对设备进行主动的监测,为决策者做出更好的决策提供帮助。设备的监测主要是对设备数据进行分类和展示,现有方法一般采用大数据分析,过程较为复杂,同时无法实现数据的多维区分展示。
发明内容
本发明提供了一种数据的分类展示方法及系统,解决了背景技术中披露的问题。
为了解决上述技术问题,本发明所采用的技术方案是:
一种数据的分类展示方法,包括,
采集设备数据,构建训练样本;
用训练样本训练基于二叉树分类方法的数据模型;
通过训练好的数据模型对待监测设备数据进行分类;
根据分类结果,对待监测设备数据进行分类统计;
根据统计结果,生成多维展示数据图表。
数据模型为根据二叉树分类方法构建的神经网络模型。
设备数据为若干特征的集合,二叉树分类方法的过程为,
为每条设备数据构建对应的二叉树;
计算二叉树中到达各叶子节点的路径长度H;
将同一二叉树的H相加,获得该二叉树的路径长度;
计算所有二叉树的平均路径长度E;
将H除以E,得到异常分数;
根据异常分数判断设备数据与H对应的叶子节点是否属于同一类。
为设备数据构建对应的二叉树的过程为,
1)随机从集合中选择一个特征作为节点,并在该集合特征值区间内随机选择一个值A赋予该特征;
2)将特征值小于等于A的特征划分到节点左边,将特征值大于A的特征划分到节点右边;
3)左边的集合重复步骤1和2的过程,右边的集合重复步骤1和2的过程,直到不可能在分或者树的高度达到阈值。
根据异常分数判断的过程为,
响应于异常分数位于区间B1内,设备数据与叶子节点不属于同一类;
响应于异常分数位于区间B2内,设备数据与叶子节点属于同一类;
响应于异常分数位于区间B3内,设备数据与叶子节点之间无法判断是否属于同一类。
根据统计结果,通过图表生成工具,生成多维展示数据图表。
采集的设备数据会先根据预设的规则进行格式化,然后构建训练样本。
数据的分类展示系统,包括,
训练样本构建模块:采集设备数据,构建训练样本;
模型模块:用训练样本训练基于二叉树分类方法的数据模型;
分类模块:通过训练好的数据模型对待监测设备数据进行分类;
统计模块:根据分类结果,对待监测设备数据进行分类统计;
多维展示模块:根据统计结果,生成多维展示数据图表。
一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行数据的分类展示方法。
一种计算设备,包括一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行数据的分类展示方法的指令。
本发明所达到的有益效果:本发明构建基于二叉树分类方法的数据模型,通过数据模型对设备数据进行分类,根据分类统计生产多维展示数据,不仅过程简单,同时可实现数据的多维区分展示。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,一种数据的分类展示方法,包括以下步骤:
步骤1,采集设备数据,构建训练样本。
采集的设备数据为设备底层数据,这些数据一般为历史数据,采集后,对采集数据进行检查过滤,过滤掉空数据、无穷大数据等,然后根据预设规则对设备数据进行格式化,便于后续分类等处理,最后从格式化的数据中抽样,形成训练样本。
步骤2,用训练样本训练基于二叉树分类方法的数据模型。
数据模型为根据二叉树分类方法构建的神经网络模型,通过训练样本训练构建的数据模型。
步骤3,通过训练好的数据模型对待监测设备数据进行分类。
设备数据为若干特征的集合,二叉树分类方法的过程如下:
31)为每条设备数据构建对应的二叉树。
为设备数据构建对应的二叉树的过程为:
1)随机从集合中选择一个特征作为节点,并在该集合特征值区间内随机选择一个值A赋予该特征;
2)将特征值小于等于A的特征划分到节点左边,将特征值大于A的特征划分到节点右边;
3)左边的集合重复步骤1和2的过程,右边的集合重复步骤1和2的过程,直到不可能在分或者树的高度达到阈值。
响应于异常分数位于区间B1内,设备数据与叶子节点不属于同一类;响应于异常分数位于区间B2内,设备数据与叶子节点属于同一类;响应于异常分数位于区间B3内,设备数据与叶子节点之间无法判断是否属于同一类。
以区间(0,1]为例,异常分数约接近1,不属于同一类的概率越高,一般在[0.7,1]区间内均可认为不属于同一类;异常分数约接近0,属于同一类的概率越高,一般在(0,0.3]区间内均可认为属于同一类;异常分数在[0.4,0.6]区间内,无法判断是否属于同一类。
32)计算二叉树中到达各叶子节点的路径长度H。
在二叉树上沿对应的条件分支往下走,直到达到叶子节点,并记录这过程中经过的路径长度,即从根节点,穿过中间的节点,最后到达叶子节点,所走过的边的数量。
33)将同一二叉树的H相加,获得该二叉树的路径长度。
34)计算所有二叉树的平均路径长度E;即所有二叉树的路径长度之和除以二叉树的数量。
35)将H除以E,得到异常分数。
36)根据异常分数判断设备数据与H对应的叶子节点是否属于同一类。
步骤4,根据分类结果,对待监测设备数据进行分类统计。
步骤5,根据统计结果,通过图表生成工具,生成多维展示数据图表。
上述方法构建基于二叉树分类方法的数据模型,通过数据模型对设备数据进行分类,根据分类统计生产多维展示数据,不仅过程简单,同时可实现数据的多维区分展示。
数据的分类展示系统,包括:
训练样本构建模块:采集设备数据,构建训练样本;
模型模块:用训练样本训练基于二叉树分类方法的数据模型;
分类模块:通过训练好的数据模型对待监测设备数据进行分类;
统计模块:根据分类结果,对待监测设备数据进行分类统计;
多维展示模块:根据统计结果,生成多维展示数据图表。
一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备数据的分类展示方法及系统。
一种计算设备,包括一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行数据的分类展示方法及系统的指令。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。

Claims (10)

1.一种数据的分类展示方法,其特征在于:包括,
采集设备数据,构建训练样本;
用训练样本训练基于二叉树分类方法的数据模型;
通过训练好的数据模型对待监测设备数据进行分类;
根据分类结果,对待监测设备数据进行分类统计;
根据统计结果,生成多维展示数据图表。
2.根据权利要求1所述的一种数据的分类展示方法,其特征在于:数据模型为根据二叉树分类方法构建的神经网络模型。
3.根据权利要求1或2所述的一种数据的分类展示方法,其特征在于:设备数据为若干特征的集合,二叉树分类方法的过程为,
为每条设备数据构建对应的二叉树;
计算二叉树中到达各叶子节点的路径长度H;
将同一二叉树的H相加,获得该二叉树的路径长度;
计算所有二叉树的平均路径长度E;
将H除以E,得到异常分数;
根据异常分数判断设备数据与H对应的叶子节点是否属于同一类。
4.根据权利要求3所述的一种数据的分类展示方法,其特征在于:为设备数据构建对应的二叉树的过程为,
1)随机从集合中选择一个特征作为节点,并在该集合特征值区间内随机选择一个值A赋予该特征;
2)将特征值小于等于A的特征划分到节点左边,将特征值大于A的特征划分到节点右边;
3)左边的集合重复步骤1和2的过程,右边的集合重复步骤1和2的过程,直到不可能在分或者树的高度达到阈值。
5.根据权利要求3所述的一种数据的分类展示方法,其特征在于:根据异常分数判断的过程为,
响应于异常分数位于区间B1内,设备数据与叶子节点不属于同一类;
响应于异常分数位于区间B2内,设备数据与叶子节点属于同一类;
响应于异常分数位于区间B3内,设备数据与叶子节点之间无法判断是否属于同一类。
6.根据权利要求1所述的一种数据的分类展示方法,其特征在于:根据统计结果,通过图表生成工具,生成数据多维展示图表。
7.根据权利要求1所述的一种数据的分类展示方法,其特征在于:采集的设备数据会先根据预设的规则进行格式化,然后构建训练样本。
8.数据的分类展示系统,其特征在于:包括,
训练样本构建模块:采集设备数据,构建训练样本;
模型模块:用训练样本训练基于二叉树分类方法的数据模型;
分类模块:通过训练好的数据模型对待监测设备数据进行分类;
统计模块:根据分类结果,对待监测设备数据进行分类统计;
多维展示模块:根据统计结果,生成多维展示数据图表。
9.一种存储一个或多个程序的计算机可读存储介质,其特征在于:所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至7所述的方法中的任一方法。
10.一种计算设备,其特征在于:包括,
一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1至7所述的方法中的任一方法的指令。
CN201910734531.6A 2019-08-09 2019-08-09 一种数据的分类展示方法及系统 Pending CN110413682A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910734531.6A CN110413682A (zh) 2019-08-09 2019-08-09 一种数据的分类展示方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910734531.6A CN110413682A (zh) 2019-08-09 2019-08-09 一种数据的分类展示方法及系统

Publications (1)

Publication Number Publication Date
CN110413682A true CN110413682A (zh) 2019-11-05

Family

ID=68366945

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910734531.6A Pending CN110413682A (zh) 2019-08-09 2019-08-09 一种数据的分类展示方法及系统

Country Status (1)

Country Link
CN (1) CN110413682A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340075A (zh) * 2020-02-14 2020-06-26 北京邮电大学 一种ics的网络数据检测方法及装置
CN111783904A (zh) * 2020-09-04 2020-10-16 平安国际智慧城市科技股份有限公司 基于环境数据的数据异常分析方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930392A (en) * 1996-07-12 1999-07-27 Lucent Technologies Inc. Classification technique using random decision forests
CN104020754A (zh) * 2014-05-16 2014-09-03 国家电网公司 一种变电站一次主设备状态监测信息接入调控系统的方法
CN105447525A (zh) * 2015-12-15 2016-03-30 中国科学院软件研究所 一种数据预测分类方法及装置
CN108038216A (zh) * 2017-12-22 2018-05-15 联想(北京)有限公司 信息处理方法、装置及服务器集群
CN109408548A (zh) * 2018-09-19 2019-03-01 中国电力科学研究院有限公司 一种城市电力大数据应用系统及方法
CN109948669A (zh) * 2019-03-04 2019-06-28 腾讯科技(深圳)有限公司 一种异常数据检测方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930392A (en) * 1996-07-12 1999-07-27 Lucent Technologies Inc. Classification technique using random decision forests
CN104020754A (zh) * 2014-05-16 2014-09-03 国家电网公司 一种变电站一次主设备状态监测信息接入调控系统的方法
CN105447525A (zh) * 2015-12-15 2016-03-30 中国科学院软件研究所 一种数据预测分类方法及装置
CN108038216A (zh) * 2017-12-22 2018-05-15 联想(北京)有限公司 信息处理方法、装置及服务器集群
CN109408548A (zh) * 2018-09-19 2019-03-01 中国电力科学研究院有限公司 一种城市电力大数据应用系统及方法
CN109948669A (zh) * 2019-03-04 2019-06-28 腾讯科技(深圳)有限公司 一种异常数据检测方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340075A (zh) * 2020-02-14 2020-06-26 北京邮电大学 一种ics的网络数据检测方法及装置
CN111340075B (zh) * 2020-02-14 2021-05-14 北京邮电大学 一种ics的网络数据检测方法及装置
CN111783904A (zh) * 2020-09-04 2020-10-16 平安国际智慧城市科技股份有限公司 基于环境数据的数据异常分析方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN109271374B (zh) 一种基于机器学习的数据库健康度打分方法和打分系统
CN107766929B (zh) 模型分析方法及装置
CN109948647A (zh) 一种基于深度残差网络的心电图分类方法及系统
Gandhi et al. Classification rule construction using particle swarm optimization algorithm for breast cancer data sets
CN109816509A (zh) 评分卡模型的生成方法、终端设备及介质
CN110008853A (zh) 行人检测网络及模型训练方法、检测方法、介质、设备
US20210201201A1 (en) Method and apparatus for determining storage load of application
CN110413682A (zh) 一种数据的分类展示方法及系统
CN103262103A (zh) 用于情景分析的处理器
CN110262942A (zh) 一种日志分析方法及装置
CN110956277A (zh) 一种交互式的迭代建模系统及方法
CN111986027A (zh) 基于人工智能的异常交易处理方法、装置
CN110569883A (zh) 基于Kohonen网络聚类和ReliefF特征选择的空气质量指数预测方法
CN115730947A (zh) 银行客户流失预测方法及装置
CN111796917A (zh) 算子运算调度方法和装置
CN108875842A (zh) 一种金融时间序列预测方法、服务器及装置
CN113095511A (zh) 一种在自动化主站实现操作到位的判断方法及装置
CN117170980A (zh) 一种服务器硬件异常预警方法、装置、设备及存储介质
CN112215254A (zh) 一种基于改进案例推理的变电站故障诊断方法以及诊断装置
CN108363738B (zh) 一种工业设备数据分析算法的推荐方法
CN115293827A (zh) 一种助力企业精细化运营的模型可解释性分析新方法
Horvat et al. Comparative Analysis of YOLOv5 and YOLOv6 Models Performance for Object Classification on Open Infrastructure: Insights and Recommendations
CN113807462A (zh) 一种基于ai的网络设备故障原因定位方法及其系统
Shyamala et al. Defect prediction in medical software using hybrid genetic optimized support vector machines
CN109978038A (zh) 一种集群异常判定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191105