CN118013407A - 一种变电站状态检测方法、装置、设备及可读存储介质 - Google Patents
一种变电站状态检测方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN118013407A CN118013407A CN202410109455.0A CN202410109455A CN118013407A CN 118013407 A CN118013407 A CN 118013407A CN 202410109455 A CN202410109455 A CN 202410109455A CN 118013407 A CN118013407 A CN 118013407A
- Authority
- CN
- China
- Prior art keywords
- detection data
- data
- substation
- state
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24568—Data stream processing; Continuous queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B31/00—Predictive alarm systems characterised by extrapolation or other computation using updated historic data
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02B—BOARDS, SUBSTATIONS OR SWITCHING ARRANGEMENTS FOR THE SUPPLY OR DISTRIBUTION OF ELECTRIC POWER
- H02B1/00—Frameworks, boards, panels, desks, casings; Details of substations or switching arrangements
- H02B1/24—Circuit arrangements for boards or switchyards
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J13/00—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
- H02J13/00001—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by the display of information or by user interaction, e.g. supervisory control and data acquisition systems [SCADA] or graphical user interfaces [GUI]
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J13/00—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
- H02J13/00002—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by monitoring
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J13/00—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
- H02J13/00032—Systems characterised by the controlled or operated power network elements or equipment, the power network elements or equipment not otherwise provided for
- H02J13/00034—Systems characterised by the controlled or operated power network elements or equipment, the power network elements or equipment not otherwise provided for the elements or equipment being or involving an electric power substation
Landscapes
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Power Engineering (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Emergency Management (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本申请实施例公开了一种变电站状态检测方法、装置、设备及可读存储介质,该方法包括:获取待检测变电站的历史检测数据;根据目标算法处理所述历史检测数据,生成对应的决策树模型,其中,所述目标算法为在Flink并行模式下执行的c4.5算法;根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类;根据所述状态分类的结果,对所述待检测变电站的状态进行评估和预警。本申请能够提高变电站设备的状态检测和故障预测的准确性和效率。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种变电站状态检测方法、装置、设备及可读存储介质。
背景技术
变电站是电力系统中重要的节点,承担着电能传输、转换和分配的功能,为了及时发现和处理设备故障,减少事故的发生,需要对变电站的设备进行状态检测。
然而,现有的针对变电站设备状态的检测方式大多是人工巡检,该检测方式存在诸多不足之处。例如人工巡检变电站状态需要消耗大量的人力资源和时间,检测效率低下且容易出现人为错误。其次,人工巡检无法实时监测设备状态,对于历史数据的统计和分析也存在漏统计和响应慢的问题。此外,人工巡检依赖于人类专家的经验和认知,规则生成可能不够完善,人工巡检在处理大量变电站数据时存在困难,数据存储和检索效率低下。
因此,为了能够有效地解决以上问题,需要提供一种准确、高效的变电站状态检测方法。
发明内容
本申请实施例提供一种变电站状态检测方法、装置、系统、设备及可读存储介质,本申请能够提高变电站设备的状态检测和故障预测的准确性和效率,保障变电站的安全稳定运行,降低设备故障和事故的风险,提升电网运行效率和可靠性。
本申请实施例第一方面提供一种变电站状态检测方法,所述方法包括:
获取待检测变电站的历史检测数据;
根据目标算法处理所述历史检测数据,生成对应的决策树模型,其中,所述目标算法为在Flink并行模式下执行的c4.5算法;
根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类;
根据所述状态分类的结果,对所述待检测变电站的状态进行评估和预警。
可选地,所述获取待检测变电站的历史检测数据,包括:
通过传感器设备获取所述待检测变电站在历史时段的初始检测数据,所述初始检测数据包括所述待检测变电站的电流、电压、温度数据的历史记录;
对所述初始检测数据进行预处理,所述预处理包括去除所述初始检测数据中的异常值,以及填充所述初始检测数据中的缺失值;
对预处理后的所述初始检测数据进行时序分析和统计分析,提取所述初始检测数据的时序特征和统计特征;
对所述初始检测数据的时序特征和统计特征进行特征工程和特征选择,选取时序特征和统计特征,得到所述历史检测数据。
可选地,所述根据目标算法处理所述历史检测数据,生成对应的决策树模型,包括:
对所述历史检测数据进行预处理和特征提取,得到对应的训练数据集;
根据所述训练数据集中特征的信息增益量和信息增益率,计算所述训练数据集中每个特征的重要度;
根据所述每个特征的重要度,选择目标特征类型;
根据所述目标特征的类型,将所述训练数据集划分为多个子训练数据集,并根据所述多个子训练数据集递归地构建决策树,直到满足停止条件,得到构建好的决策树;
使用剪枝技术对决策树进行优化,生成训练好的所述决策树模型。
可选地,所述特征的信息增益率通过以下公式计算:
其中,R′(A)表示特征A的信息增益率,G′(A)表示所述特征A的信息增益量;S′(A)表示特征A的分裂信息度量;I′(A)表示特征A的信息量;U′(A)表示特征A的数据集的信息量。
可选地,所述根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类,包括:
以所述决策树模型的根节点为起始,根据所述当前检测数据和所述历史检测数据的值,确定所述当前检测数据和所述历史检测数据落入的目标根节点和目标子节点,根据所述目标子节点的类型确定所述待检测变电站的状态分类子节点。
可选地,所述根据所述当前检测数据和所述历史检测数据的值,确定所述当前检测数据和所述历史检测数据落入的目标根节点和目标子节点,包括:
获取所述每个根节点的第一节点值范围,以及每个所述根节点包含的每个子节点的第二节点值范围;
确定所述当前检测数据和所述历史检测数据的值落入的第一节点值范围对应的目标根节点;
判断所述当前检测数据和所述历史检测数据的值是否落入所述目标根节点包含的各第二节点值范围;
确定所述当前检测数据和所述历史检测数据落入的所述第二节点值范围对应的子节点为目标子节点。
可选地,所述方法还包括:
基于目标框架对所述历史检测数据和当前检测数据进行管理,其中,所述目标框架包括Hadoop单元、Flume单元、Flink单元、HBase单元和ZooKeeper和Kafka单元。
相应地,本申请实施例第二方面提供一种变电站状态检测装置,所述装置包括:
数据获取模块,用于获取待检测变电站的历史检测数据;
模型生成模块,用于根据目标算法处理所述历史检测数据,生成对应的决策树模型,其中,所述目标算法为在Flink并行模式下执行的c4.5算法;
状态检测模块,用于根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类;
状态评估模块,用于根据所述状态分类的结果,对所述待检测变电站的状态进行评估和预警。
本申请实施例第三方面提供的一种电子设备,所述电子设备包括:
处理器;以及存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据第一方面所述的变电站状态检测方法。
本申请实施例第四方面还提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据第一方面所述的变电站状态检测方法。
由此可知,本申请实施例借助Flink框架的实时流处理能力,可以对变电站数据进行实时处理和分析,使得对变电站设备的状态、异常和故障进行及时检测和响应,并使得变电站监测系统具有高度的可扩展性和容错性,可以轻松地扩展计算和存储能力,适应变电站数据量的增长,并能够自动处理节点故障和数据丢失等问题。并且,本申请实施例通过在系统中集成实时报警和通知机制,可以及时预警和报警变电站设备的异常和故障,有助于提高变电站设备的安全性和可靠性,避免潜在的损失和事故发生。
综上所述,本申请的方法通过自适应学习的目标算法和决策树模型,对变电站的当前检测数据和历史检测数据相结合后进行高效处理,得到变电站状态检测结果,从而能够提升变电站状态检测的准确性和效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的变电站状态检测方法的应用场景示意图;
图2是本申请实施例提供的变电站状态检测方法的流程示意图;
图3是本申请实施例提供的变电站状态检测装置的结构示意图;
图4是本申请实施例提供的电子设备的一种逻辑结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种变电站状态检测方法、装置、设备及可读存储介质,其中,设备可以为电子设备,可读存储介质可以为计算机可读存储介质。变电站状态检测装置可以集成在电子设备中,该电子设备可以是服务器,也可以是终端等设备。
其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
例如,如图1所示,服务器可以获取待检测变电站的历史检测数据;根据目标算法处理所述历史检测数据,生成对应的决策树模型,其中,所述目标算法为在Flink并行模式下执行的c4.5算法;根据所述决策树模型对所述待检测变电站的当检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类;根据所述状态分类的结果,对所述待检测变电站的状态进行评估和预警。
需要说明的是,以上在服务器中执行的步骤,也可以在终端中执行,本实施例对此不做限制。
本申请实施例中的“多个”指两个或两个以上。本申请实施例中的“第一”和“第二”等用于区分描述,而不能理解为暗示相对重要性。
以下分别进行详细说明。需要说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
请参阅图2,在本实施例中,提供了一种变电站状态检测方法,如图2所示,该方法包括:
步骤101、获取待检测变电站的历史检测数据。
其中,检测数据可以包括变电站设备的电压、电流,变电站所处环境的温度、湿度等。
可选地,步骤101可以包括:
通过传感器设备获取所述待检测变电站在历史时段的初始检测数据,所述初始检测数据包括所述待检测变电站的电流、电压、温度数据的历史记录;
对所述初始检测数据进行预处理,所述预处理包括去除所述初始检测数据中的异常值,以及填充所述初始检测数据中的缺失值;
对预处理后的所述初始检测数据进行时序分析和统计分析,提取所述初始检测数据的时序特征和统计特征;
对所述初始检测数据的时序特征和统计特征进行特征工程和特征选择,选取时序特征和统计特征,得到所述历史检测数据。
在一些实施例中,可以通过传感器设备,可以获取待检测变电站在历史时段的初始检测数据,其中包括电流、电压、温度等数据的历史记录。
为了确保数据的准确性和完整性,可以对初始检测数据进行预处理。这个预处理过程包括去除异常值和填充缺失值。异常值可能是由于设备故障或其他异常情况导致的数据异常,可以需要将其排除在数据集之外。同时,由于设备故障或数据采集问题,部分数据可能缺失,可以需要通过合适的方法填充这些缺失值,以保证后续分析的可靠性。
预处理后,可以对初始检测数据进行时序分析和统计分析。时序分析可以揭示数据的时间相关性和趋势变化,例如周期性、趋势性等。统计分析则可以提供数据的基本统计特征,如平均值、方差、最大值、最小值等。
进一步地,可以进行特征工程和特征选择,从时序特征和统计特征中选取具有代表性和区分度的特征。特征工程涉及数据的转换和提取,以便更好地表达数据的含义和特征。特征选择则是根据特征的重要性和对目标的贡献程度,选择最具有区分度的特征。
在一些实施例中,可以通过传感器设备获取待检测变电站的历史检测数据,例如可以包括电流、电压、温度等历史记录中的数据。接着,可以对这些数据进行预处理,例如可以包括去除异常值和填充缺失值等预处理措施。然后,可以对与处理后的历史检测数据进行时序分析和统计分析,提取出初始检测数据的时序特征和统计特征。
在一些实施例中,统计特征可以得到数据的基本统计信息,如平均值、方差、最大值、最小值等,例如,可以计算立式检测数据的电压平均值和温度方差作为统计特征。
在一些实施例中,可以通过特征工程对原始特征进行变换和组合,以得到更有代表性和区分度的特征,例如可以包括将时序特征和统计特征进行组合,计算新的特征,以更好地反映数据的特性。
在一些实施例中,在得到以上的一系列特征后,可以对以上特征进行选择,以减少维度并选择最具代表性和区分度的特征。例如可以使用各种特征选择方法,例如基于信息增益、方差、互信息等进行排序,选择排名靠前的特征。待选取好特征后,可以将其用于训练自适应学习算法和构建决策树模型。在模型训练完成后,需要进行验证,确保模型对新数据的泛化能力和鲁棒性。
综上,通过以上方式,可以得到了经过处理和选择的历史检测数据,可以用于后续的变电站状态检测和分析。这些数据包含了变电站在历史时段的重要特征,为进一步的状态分类和评估提供了基础。
步骤102、根据目标算法处理所述历史检测数据,生成对应的决策树模型。
其中,目标算法可以为在Flink并行模式下对C4.5算法进行优化后的算法。
可选地,步骤102可以包括:
对所述历史检测数据进行预处理和特征提取,得到对应的训练数据集;
根据所述训练数据集中特征的信息增益量和信息增益率,计算所述训练数据集中每个特征的重要度;
根据所述每个特征的重要度,选择目标特征类型;
根据所述目标特征类型,将所述训练数据集划分为多个子训练数据集,并根据所述多个子训练数据集递归地构建决策树,直到满足停止条件,得到构建好的决策树;
使用剪枝技术对决策树进行优化,生成训练好的所述决策树模型。
其中,特征的信息增益率通过以下公式计算:
其中,R′(A)表示特征A的信息增益率,G′(A)表示所述特征A的信息增益量;S′(A)表示特征A的分裂信息度量;I′(A)表示特征A的信息量;U′(A)表示特征A的数据集的信息量。
在一些实施例中,信息增益率表示特征A对于划分数据集的贡献度,即通过特征A能够降低数据集的不确定性程度。信息增益量表示使用特征A进行划分后,数据集不确定性的减少程度。分裂信息度量表示使用特征A进行划分后,各个子集的加权熵。特征A的信息量表示使用特征A进行划分后的加权熵,是对各个子集熵的加权求和。特征A的数据集的信息量表示使用特征A进行划分后,各个子集的加权熵。
C4.5算法是一种决策树算法,是在ID3算法上的一种改进算法,而本申请的目标算法又是在Flink并行模式下执行的C4.5算法。
为了便于理解步骤102的内容,现进行举例说明,假设可以有一份历史检测数据集,即训练数据集,包括变电站的电流、电压和温度数据,并希望基于Flink并行模式下对C4.5算法进行优化,生成决策树模型来预测变电站的状态。
在一些实施例中,可以对历史检测数据进行预处理和特征提取。例如,去除异常值、填充缺失值,并提取电流、电压和温度的统计特征,如均值、方差等。这样可以得到了对应的训练数据集。
在一些实施例中,可以根据训练数据集中特征的信息增益量和信息增益率,计算每个特征的重要度。例如,计算电流、电压和温度的信息增益量和信息增益率,得到它们的重要度排序。
具体实现中,信息增益量可以通过以下公式进行计算:
G′(A)=I(d1,d2,…,dn)-IE(A)
其中,A为训练数据集,d为训练数据集中的特征,共有n个特征,I(d1,d2,…,dn)为数据集的信息熵,IE(A)对集合A进行子集划分后的加权信息熵。
在一些实施例中,可以将信息增益量和信息增益率作为特征的重要度指标,可以根据具体需求,例如选取其中一个或综合考虑两者,例如可以对信息增益量和信息增益率各自赋予不同的权重后,计算出每个特征对应的重要度对应的数值,并根据计算出的多个数值由大到小以此排序以获取重要度排序。
在一些实施例中,可以根据计算得到的特征重要度,选择具有最高重要度的特征作为训练数据集的划分依据。假设电流的重要度最高,可以选择电流作为划分依据。
在一些实施例中,可以根据选择的目标特征,将训练数据集划分为多个子训练数据集,例如高电流和低电流两个子数据集。然后,对每个子数据集递归地构建决策树。在构建过程中,可以选择另一个重要特征作为划分依据,如电压或温度。
在一些实施例中,可以在递归构建决策树的过程中,应用剪枝技术对决策树进行优化。剪枝技术可以去除一些不必要的分支和子节点,以提高决策树的泛化能力和减少过拟合的风险。最终,可以生成了训练好的决策树模型。
综上,通过以上方式,可以对历史检测数据进行预处理和特征提取,计算特征的重要度,选择目标特征类型作为划分依据,划分子训练数据集并递归构建决策树,并使用剪枝技术优化决策树,最终生成了训练好的决策树模型,用于预测变电站的状态。
在一些实施例中,还可以在C4.5算法的基础上添加自适应学习算法,该算法使得C4.5决策树模型能够根据新数据动态调整其参数,以更好地适应环境变化和设备老化等因素。
在一些实施例中,自适应学习过程可以包括实时监测数据更新、在线更新模型参数和模型评估与校准等过程。在一些实施例中,实时监测数据更新可以是设立一个实时监测数据流,以获取待检测变电站的最新检测数据,可以通过连接到实时数据源,如传感器网络或设备监控系统来实现。
在一些实施例中,在线更新模型参数可以是引入自适应学习算法,使得模型能够根据实时数据动态调整其参数。以下是具体的步骤:a.获取实时数据:周期性地或实时地获取最新的监测数据,包括电流、电压、温度等。b.模型参数调整:利用获取到的实时数据,对决策树模型的相关参数进行在线更新。这可以采用梯度下降、遗传算法等优化算法,通过不断迭代优化模型的参数,以适应新数据的特征。c.动态特征选择:考虑实时数据中特征的重要性变化,动态调整特征的权重或选择不同的特征,可以通过监测特征的信息增益率等指标,并根据变化情况进行调整,以保持模型的灵活性,目的是在决策树的构建过程中灵活地应对数据集的变化,以提高模型的适应性和性能。
在一些实施例中,模型评估与校准可以是定期对模型进行评估,检查其性能和准确性。相应的,如模型性能下降或者发现新的特征模式,可以通过模型的校准过程进行调整,以提高模型的预测能力。
综上所述,通过引入自适应学习算法,模型不仅能够在训练时适应历史数据,还能够在运行时根据新数据进行动态调整,使得模型更具有实时性和适应性,能够更好地应对变电站设备状态的实时变化,从而提高系统的可靠性和准确性。
需要说明的是,本申请可以通过不同的决策树算法或者与其他算法结合,以构建更为复杂和准确的混合模型。在一些实施例中,可以引入随机森林算法,通过集成多个决策树,每个树基于不同的随机子集进行训练。通过投票机制,综合多个树的预测结果,可以提高模型的泛化能力和鲁棒性。
在一些实施例中,可以利用梯度提升算法,通过逐步构建弱分类器并调整其权重,形成强分类器。
在一些实施例中,可以将决策树模型与深度学习模型结合,形成深度集成模型。可以使用神经网络作为一个强大的特征提取器,然后将其输出与决策树模型进行集成,以获取更丰富的特征表达和更高的准确性。
综上,通过尝试不同的决策树算法和与其他算法的结合,我们可以构建更为复杂、鲁棒的混合模型,从而提高对变电站状态变化的识别和预测能力。这样的混合模型在应对不同特征、数据分布和环境变化方面可能表现更为优越。
步骤103、根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类。
可选地,步骤103可以包括:
以所述决策树模型的根节点为起始,根据所述当前检测数据和所述历史检测数据的值,确定所述当前检测数据和所述历史检测数据落入的目标根节点和目标子节点,根据所述目标子节点的类型确定所述待检测变电站的状态分类子节点。
可选地,步骤“根据所述当前检测数据和所述历史检测数据的值,确定所述当前检测数据和所述历史检测数据落入的目标根节点和目标子节点”,包括:
获取所述每个根节点的第一节点值范围,以及每个所述根节点包含的每个子节点的第二节点值范围;
确定所述当前检测数据和所述历史检测数据的值落入的第一节点值范围对应的目标根节点;
判断所述当前检测数据和所述历史检测数据的值是否落入所述目标根节点包含的各第二节点值范围;
确定所述当前检测数据和所述历史检测数据落入的所述第二节点值范围对应的子节点为目标子节点。
为了便于理解步骤103的内容,现进行举例说明,假设可以有一个训练好的决策树模型,用于预测变电站的状态,现在可以有一组待检测的变电站的当前检测数据和历史检测数据,可以要根据决策树模型对其进行状态分类。
在一些实施例中,可以从决策树模型的根节点开始,根据当前检测数据和历史检测数据的值,确定它们所属的目标根节点和目标子节点。通过对比节点的划分条件,可以确定待检测数据落入目标根节点的哪个目标子节点。
可以理解,对于每个目标根节点和目标子节点,可以获取其第一节点值范围和第二节点值范围。这些值范围是决策树模型中的划分条件,用于将数据进一步分配到下一级节点。
在一些实施例中,可以根据当前检测数据和历史检测数据的值,可以逐级判断它们是否落入节点的值范围。如果数据值落入第一节点值范围,则继续判断是否落入第二节点值范围,第二节点值范围对应目标根节点的其他子节点。这样一直迭代下去,直到数据落入目标根节点的子节点。
最终,根据数据落入的子节点,可以确定待检测变电站的状态分类。每个子节点对应一种状态,例如“正常”或“异常”,取决于该子节点的分类标签。
下面结合数据进行举例,假设有一个变电站的数据集,其中包括以下属性:温度、湿度和电流。可以使用这个数据集来构建决策树模型,并进行推理过程。
首先,可以根据历史检测数据训练决策树模型。假设可以的决策树模型如下:
IF温度<=30AND湿度<=60THEN状态=正常;
IF温度>30AND湿度<=70THEN状态=异常;
IF温度>30AND湿度>70AND电流<=20THEN状态=正常;
IF温度>30AND湿度>70AND电流>20THEN状态=异常。
现在,可以有一组待检测数据,具体如下:温度=28、湿度=55、电流=15,可以将使用决策树模型进行推理过程:
从目标根节点开始,根据温度属性进行判断,发现温度为28,小于等于30,所以可以进入第一个子节点。在第一个子节点中,根据湿度属性进行判断,发现湿度为55,小于等于60,所以可以进入第一个子节点的子节点。进入第一个子节点的子节点后,可以到达了子节点,子节点的分类结果为"正常"。根据推理结果,可以得出待检测变电站的状态为"正常"。
通过以上的推理过程,可以利用决策树模型对待检测数据进行了分类,最终得出变电站的状态为"正常"。这个过程是根据决策树模型的判断条件逐层进行的,根据每个节点的划分属性和划分条件进行数据的判断和分类,直到到达子节点并得出最终的分类结果。
步骤104、根据所述状态分类的结果,对所述待检测变电站的状态进行评估和预警。
在一些实施中,可以将待检测变电站的当前检测数据和历史检测数据根据决策树模型进行了状态分类,得到了如下的分类结果:
待检测变电站A:状态分类为“正常”;
待检测变电站B:状态分类为“异常”;
待检测变电站C:状态分类为“正常”。
进一步地,可以根据这些状态分类结果,可以进行评估和预警,具体如下:待检测变电站A:状态分类为“正常。根据状态分类为“正常”,可以评估变电站A的状态良好,没有发现异常情况。可以继续进行常规运行,不需要采取进一步的预警措施。
相应地,待检测变电站B:状态分类为“异常”。可以根据状态分类为“异常”,可以需要对变电站B进行更详细的分析和预警。根据决策树模型的判定条件和分类结果,可以了解到变电站B的某些特征或指标超出了正常范围,可能存在故障或异常情况。此时,可以需要及时采取预警措施,例如派遣维修人员进行现场检查和修复,以避免潜在的设备故障或事故发生。
相应地,待检测变电站C:状态分类为“正常”,可以根据状态分类为“正常”,可以评估变电站C的状态良好,没有发现异常情况。可以继续进行常规运行,不需要采取进一步的预警措施。
通过对不同变电站的状态分类结果进行评估和预警,可以及时发现异常情况并采取相应的措施,以确保变电站的安全运行和设备的正常工作。这有助于提高运维效率和减少潜在风险。
可选地,本申请的方法还可以包括:
基于目标框架对所述历史检测数据和当前检测数据进行管理,其中,所述目标框架包括Hadoop单元、Flume单元、Flink单元、HBase单元和ZooKe eper和Kafka单元。
下面做出具体说明,Hadoop框架使用计算机集群的概念,把任务分配给各个集群节点并行处理,并将结果统一返回,从而解决单台计算效率低的问题。该框架具有高度可扩展性和容错能力,并使用简单的计算模型。Hadoop框架具有四个核心组件:Hadoop common(其他模块的实用程序库)、分布式文件系统(HDFS)、作业调度和集群资源管理(Yarn)、分布式并行计算(MapReduce)。
Flink是一个开源的流处理框架,是目前最流行的流处理引擎之一,支持多种数据源,而且提供了内置的机器学习库,提供了一组功能强大、灵活和易于使用的组件和API,如FlinkML、FlinkML Pipeline等,方便开发者进行机器学习任务。开发人员可以构建高效、可扩展和可靠的流处理应用程序。在一些实施例中,Flink框架可以包括以下组件:
DataStream API:用于构建和操作以流为中心的应用程序。DataStream API支持流数据的转换、过滤、聚合和连接等操作。
DataSet API:用于构建和操作离线批处理任务。DataSet API支持数据集的转换、过滤、聚合和连接等操作。
Stateful Stream Processing:支持在处理流数据时维护和更新状态信息。这些状态可以是简单的计数器、累加器或复杂的数据结构。
Table API和SQL:用于以类似于关系型数据库的方式处理流和批数据。Table API和SQL支持流和批数据之间的无缝切换。
Flink Runtime:Flink的核心运行时,包括任务调度、故障恢复和资源管理等功能。
Connectors:Flink提供了与各种数据源和数据存储的连接器,包括Kafka、Hadoop、Elasticsearch等。
Libraries:Flink还提供了许多库,用于实现常见的数据处理模式,如图形处理、机器学习、复杂事件处理等。
Flume是一个分布式、可靠、高可扩展性的日志收集、聚合、传输系统。Flume支持多种数据源和数据目的地,包括日志文件、消息队列、数据库、HDFS等,用户可以根据自己的需求选择合适的数据源和目的地,提供了多个可配置的容错机制,确保了数据的可靠传输。在一些实施例中,Flume系统可以包括以下组件:
Source:一个Source是Flume的输入端,用于接收来自各种数据源的数据流。它可以是网络接口、日志文件、消息队列等等。
Channel:Channel是连接Source和Sink的缓冲区,用于存储数据流。Flume提供了多个Channel实现,包括内存Channel、文件Channel和Kafka Channel等。
Sink:一个Sink是Flume的输出端,用于将数据流发送到目标。它可以是HDFS、关系型数据库、Elasticsearch等等。
Agent:一个Flume Agent是由一个或多个Source、Channel和Sink组成的数据流处理单元。它负责收集、过滤、转换并将数据流传输到目标。
Interceptor:拦截器是Flume的一个可选组件,用于对数据流进行实时处理。它可以用于过滤、修改和分割数据,以便更好地适应目标。
HBase系统是一种分布式存储系统,主要有以下几个组件:
HMaster:HBase的主节点,负责管理RegionServer的分配、负载均衡、故障恢复等。
RegionServer:HBase的工作节点,负责存储和管理数据的读写操作。每个RegionServer管理多个Region,每个Region负责存储一部分数据。
ZooKeeper:HBase使用ZooKeeper来协调分布式系统的各个节点。ZooKeeper负责维护HBase的元数据信息、监控RegionServer的状态等。
Hadoop HDFS:HBase使用HDFS作为底层存储,将数据存储在HDFS的数据块中。
HBase客户端:HBase客户端负责与HBase进行交互,通过API访问HBase中存储的数据。
HBase Shell:HBase提供了一个命令行工具HBase Shell,用于管理HBase集群和操作数据。
HBase Thrift Server:HBase允许通过Thrift接口访问HBase数据,HBase ThriftServer提供了支持。
HBase REST Server:HBase也可以通过RESTful接口访问,HBase REST Server提供了支持。
HBase的二级索引功能,基于唯一键key的合理设置,能够用于大数据量的查询检索,百亿级别的数据量能够毫秒级查询。
Kafka是一个分布式的消息队列系统,是一个高可靠、可扩展、分布式的流式处理平台,可以被用来作为工业数据采集的中间件。将采集到的数据发送给一组Kafka节点,其中包括producer和broker等组件。producer负责将数据发送给Kafka的brokers,brokers则负责将数据在Kafka集群中分配和存储,consumer则从brokers中读取数据进行消费和处理。具体而言,Ka fka可以将工业数据从不同数据源(如传感器、设备、物联网设备、人工监测等)实时传输和存储。组件如下:
Broker:Kafka集群中的每个服务器被称为一个Broker。一个Broker可以处理多个Topic的消息。
Topic:一个Topic是一个消息流的分类,生产者将消息发送到一个特定的Topic,消费者订阅这个Topic并接收其中的消息。
Partition:一个Topic可以被分成多个Partition,每个Partition是一个有序的、不可变的消息序列。每个Partition都存储在多个Broker上,以提供冗余性和可扩展性。
Producer:一个生产者是将消息发布到一个或多个Topic的应用程序。
Consumer:一个消费者是从一个或多个Topic订阅消息的应用程序。
Consumer Group:一个消费者组是一组消费者,它们共同订阅一个Topic,并通过协调来确保每个消息只被组中的一个消费者处理。
ZooKeeper是一个开源的分布式协调服务框架,主要用于解决分布式系统中的一些数据管理问题。ZooKeeper提供了一套API,使得开发人员可以非常方便地实现分布式应用程序中的一些功能,例如统一命名服务、配置管理、负载均衡、分布式锁、集群管理等。使用ZAB算法和协议来确保所有节点上的数据是一致的,而且节点之间的同步非常快速,能够实现数据的实时同步,有如下组件:
Data Model:Zookeeper的数据模型是一个层次化的命名空间,类似于一个文件系统。每个节点都可以存储一个小数据对象,并且可以有一个无限数量的子节点。
Znode:Znode是Zookeeper中的基本单元,它是一个命名空间中的一个节点。每个Znode可以存储一个小数据对象,并且可以有一个无限数量的子节点。
Watches:Watches是Zookeeper的一种特殊机制,用于在Zookeeper中的节点发生变化时通知客户端。
ACL:Zookeeper提供了访问控制列表(ACL),允许管理员对节点进行细粒度的控制,以限制对节点的访问。
Quorum:Zookeeper使用Quorum机制来保证数据的一致性和可用性。在多个Zookeeper服务器之间形成一个Quorum,达成共识来确保数据一致性。
由此可知,本申请实施例的方法通过利用Hadoop框架和分布式存储系统(HDFS和HBase),在变电站设备状态检测中,可以使用Hadoop框架的Map Reduce任务对历史数据进行处理和分析,提取关键特征,甚至进行模型训练。还利用HDFS作为分布式文件系统,用于存储大规模的变电站设备状态数据,HDFS将数据划分为多个块,并在集群中的多个节点上存储这些块,提供了高可靠性和容错性,以确保数据的安全性和可靠性。在变电站设备状态检测中,HBase可以存储实时监测到的设备状态数据,支持快速的查询操作。从而能够高效地存储、处理和分析变电站产生的大量数据,有助于实时监测和预测变电站设备的状态和性能。本申请实施例还借助Flink框架的实时流处理能力,Flink框架可以用于实时监测变电站设备状态数据,以便快速检测设备的异常或变化,通过构建Flink流式处理任务,可以连续地接收、处理和分析实时产生的数据,从而及时发现潜在的问题,还可以对变电站数据进行实时处理和分析,使得对变电站设备的状态、异常和故障进行及时检测和响应成为可能。使用Flume和Kafka等技术,使用Flume和Kafka,可以搭建一个稳健、高效的实时数据流处理管道,确保从变电站设备中采集到的数据能够可靠地传输到后续的处理系统中,为实时监测和分析提供支持,能够从多种数据源(传感器、设备、监测系统等)可靠地采集和传输变电站数据,确保了数据的完整性和可靠性,为后续的数据处理和分析提供可靠的数据基础。
此外,本申请实施例还通过整合ZooKeeper作为协调和监控的中心,可以实现分布式系统的节点管理、状态监测和故障恢复,提高了系统的稳定性和可靠性,确保变电站监测系统的持续运行和数据的一致性。本申请实施例采用分布式系统架构,如Hadoop和Flink,使得变电站监测系统具有高度的可扩展性和容错性,可以轻松地扩展计算和存储能力,适应变电站数据量的增长,并能够自动处理节点故障和数据丢失等问题。并且,本申请实施例通过在系统中集成实时报警和通知机制,可以及时预警和报警变电站设备的异常和故障,有助于提高变电站设备的安全性和可靠性,避免潜在的损失和事故发生。
综上所述,本申请的方法为变电站健康监测提供了高效、实时、可靠和可扩展的解决方案,能够提高变电站设备的状态检测和故障预测能力,保障变电站的安全稳定运行,降低设备故障和事故的风险,提升电网运行效率和可靠性。
通过以上几个方面的数据处理操作,本申请能够有效地实现提升数据的可读性和展示效果,并降低数据的理解难度的技术效果。
根据上述实施例所描述的方法,以下将作进一步详细说明。
如图3所示,为本申请实施例提供的变电站状态检测装置的结构示意图,该装置可以包括:
数据获取模块201,用于获取待检测变电站的历史检测数据;
模型生成模块202,用于根据目标算法处理所述历史检测数据,生成对应的决策树模型,其中,所述目标算法为在Flink并行模式下执行的c4.5算法;
状态检测模块203,用于根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类;
状态评估模块204,用于根据所述状态分类的结果,对所述待检测变电站的状态进行评估和预警。
在本申请中,数据获取模块201可以获取待检测变电站的历史检测数据;模型生成模块202可以根据目标算法处理所述历史检测数据,生成对应的决策树模型,其中,所述目标算法为在Flink并行模式下执行的c4.5算法;状态检测模块203可以根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类;状态评估模块204可以根据所述状态分类的结果,对所述待检测变电站的状态进行评估和预警。
由此可知,本申请实施例的方法通过利用Hadoop框架和分布式存储系统(HDFS和HBase),能够高效地存储、处理和分析变电站产生的大量数据,有助于实时监测和预测变电站设备的状态和性能。本申请实施例还借助Flink框架的实时流处理能力,可以对变电站数据进行实时处理和分析,使得对变电站设备的状态、异常和故障进行及时检测和响应成为可能。使用Flume和Kafka等技术,能够从多种数据源(传感器、设备、监测系统等)可靠地采集和传输变电站数据,确保了数据的完整性和可靠性,为后续的数据处理和分析提供可靠的数据基础。
此外,本申请实施例还通过整合ZooKeeper作为协调和监控的中心,可以实现分布式系统的节点管理、状态监测和故障恢复,提高了系统的稳定性和可靠性,确保变电站监测系统的持续运行和数据的一致性。本申请实施例采用分布式系统架构,如Hadoop和Flink,使得变电站监测系统具有高度的可扩展性和容错性,可以轻松地扩展计算和存储能力,适应变电站数据量的增长,并能够自动处理节点故障和数据丢失等问题。并且,本申请实施例通过在系统中集成实时报警和通知机制,可以及时预警和报警变电站设备的异常和故障,有助于提高变电站设备的安全性和可靠性,避免潜在的损失和事故发生。利用本申请实施例的方法提供的数据处理和分析模块,可以生成可视化的报告和仪表盘,直观展示变电站设备的状态和趋势,从而有助于管理人员和维护人员快速了解变电站的运行情况,并采取相应的措施。
综上所述,本申请的方法为变电站健康监测提供了高效、实时、可靠和可扩展的解决方案,能够提高变电站设备的状态检测和故障预测能力,保障变电站的安全稳定运行,降低设备故障和事故的风险,提升电网运行效率和可靠性。
相应于上面的方法实施例,本发明实施例还提供了一种计算机设备,下文描述的一种计算机设备与上文描述的一种变电站状态检测方法可相互对应参照。
该计算机设备包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现上述方法实施例的变电站状态检测方法的步骤:
获取待检测变电站的历史检测数据;
根据目标算法处理所述历史检测数据,生成对应的决策树模型,其中,所述目标算法为在Flink并行模式下执行的c4.5算法;
根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类;
根据所述状态分类的结果,对所述待检测变电站的状态进行评估和预警。
如图4所示,电子设备400包括计算单元401,其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序,来执行各种适当的动作和处理。在RAM 403中,还可存储电子设备400操作所需的各种程序和数据。计算单元401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
电子设备400中的多个部件连接至I/O接口405,包括:输入单元406、输出单元407、存储单元408以及通信单元409。输入单元406可以是能向电子设备400输入信息的任何类型的设备,输入单元406可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元407可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元408可以包括但不限于磁盘、光盘。通信单元409允许电子设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理。例如,在一些实施例中,前述变电站状态检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元408。在一些实施例中,计算机程序的部分或者全部可以经由ROM402和/或通信单元409而被载入和/或安装到电子设备400上。在一些实施例中,计算单元401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行前述变电站状态检测方法。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
如本申请使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
Claims (10)
1.一种变电站状态检测方法,其特征在于,所述方法包括:
获取待检测变电站的历史检测数据;
根据目标算法处理所述历史检测数据,生成对应的决策树模型,其中,所述目标算法为在Flink并行模式下执行的c4.5算法;
根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类;
根据所述状态分类的结果,对所述待检测变电站的状态进行评估和预警。
2.根据权利要求1所述的变电站状态检测方法,其特征在于,所述获取待检测变电站的历史检测数据,包括:
通过传感器设备获取所述待检测变电站在历史时段的初始检测数据,所述初始检测数据包括所述待检测变电站的电流、电压、温度数据的历史记录;
对所述初始检测数据进行预处理,所述预处理包括去除所述初始检测数据中的异常值,以及填充所述初始检测数据中的缺失值;
对预处理后的所述初始检测数据进行时序分析和统计分析,提取所述初始检测数据的时序特征和统计特征;
对所述初始检测数据的时序特征和统计特征进行特征工程和特征选择,选取时序特征和统计特征,得到所述历史检测数据。
3.根据权利要求1所述的变电站状态检测方法,其特征在于,所述根据目标算法处理所述历史检测数据,生成对应的决策树模型,包括:
对所述历史检测数据进行预处理和特征提取,得到对应的训练数据集;
根据所述训练数据集中特征的信息增益量和信息增益率,计算所述训练数据集中每个特征的重要度;
根据所述每个特征的重要度,选择目标特征类型;
根据所述目标特征类型,将所述训练数据集划分为多个子训练数据集,并根据所述多个子训练数据集递归地构建决策树,直到满足停止条件,得到构建好的决策树;
使用剪枝技术对决策树进行优化,生成训练好的所述决策树模型。
4.根据权利要求3所述的变电站状态检测方法,其特征在于,所述特征的信息增益率通过以下公式计算:
其中,R′(A)表示特征A的信息增益率,G′(A)表示所述特征A的信息增益量;S′(A)表示特征A的分裂信息度量;I′(A)表示特征A的信息量;U′(A)表示特征A的数据集的信息量。
5.根据权利要求1所述的变电站状态检测方法,其特征在于,所述根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类,包括:
以所述决策树模型的根节点为起始,根据所述当前检测数据和所述历史检测数据的值,确定所述当前检测数据和所述历史检测数据落入的目标根节点和目标子节点;
根据所述目标子节点的类型确定所述待检测变电站的状态分类。
6.根据权利要求5所述的变电站状态检测方法,其特征在于,所述根据所述当前检测数据和所述历史检测数据的值,确定所述当前检测数据和所述历史检测数据落入的目标根节点和目标子节点,包括:
获取所述每个根节点的第一节点值范围,以及每个所述根节点包含的每个子节点的第二节点值范围;
确定所述当前检测数据和所述历史检测数据的值落入的第一节点值范围对应的目标根节点;
判断所述当前检测数据和所述历史检测数据的值是否落入所述目标根节点包含的各第二节点值范围;
确定所述当前检测数据和所述历史检测数据落入的所述第二节点值范围对应的子节点为目标子节点。
7.根据权利要求1所述的变电站状态检测方法,其特征在于,所述方法还包括:
基于目标框架对所述历史检测数据和当前检测数据进行管理,其中,所述目标框架包括Hadoop单元、Flume单元、Flink单元、HBase单元和ZooKeepe r和Kafka单元。
8.一种变电站状态检测装置,其特征在于,所述装置包括:
数据获取模块,用于获取待检测变电站的历史检测数据;
模型生成模块,用于根据目标算法处理所述历史检测数据,生成对应的决策树模型,其中,所述目标算法为在Flink并行模式下执行的c4.5算法;
状态检测模块,用于根据所述决策树模型对所述待检测变电站的当前检测数据和所述历史检测数据进行处理,得到所述待检测变电站的状态分类;
状态评估模块,用于根据所述状态分类的结果,对所述待检测变电站的状态进行评估和预警。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-7中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410109455.0A CN118013407A (zh) | 2024-01-25 | 2024-01-25 | 一种变电站状态检测方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410109455.0A CN118013407A (zh) | 2024-01-25 | 2024-01-25 | 一种变电站状态检测方法、装置、设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118013407A true CN118013407A (zh) | 2024-05-10 |
Family
ID=90949278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410109455.0A Pending CN118013407A (zh) | 2024-01-25 | 2024-01-25 | 一种变电站状态检测方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118013407A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118427732A (zh) * | 2024-07-05 | 2024-08-02 | 浙江正泰智维能源服务有限公司 | 一种电站逆变器状态判断方法、装置、电子设备及介质 |
CN118889692A (zh) * | 2024-09-26 | 2024-11-01 | 浙江追求电机股份有限公司 | 一种配电柜智能监测预警系统 |
CN119473445A (zh) * | 2025-01-14 | 2025-02-18 | 宇动源(北京)信息技术有限公司 | Flink流处理任务的生成方法及电子设备、存储介质、计算机程序产品 |
-
2024
- 2024-01-25 CN CN202410109455.0A patent/CN118013407A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118427732A (zh) * | 2024-07-05 | 2024-08-02 | 浙江正泰智维能源服务有限公司 | 一种电站逆变器状态判断方法、装置、电子设备及介质 |
CN118889692A (zh) * | 2024-09-26 | 2024-11-01 | 浙江追求电机股份有限公司 | 一种配电柜智能监测预警系统 |
CN119473445A (zh) * | 2025-01-14 | 2025-02-18 | 宇动源(北京)信息技术有限公司 | Flink流处理任务的生成方法及电子设备、存储介质、计算机程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN118013407A (zh) | 一种变电站状态检测方法、装置、设备及可读存储介质 | |
US10409650B2 (en) | Efficient access scheduling for super scaled stream processing systems | |
CN105677836A (zh) | 一种同时支持离线数据和实时在线数据的大数据处理解决系统 | |
CN112860695B (zh) | 监控数据查询方法、装置、设备、存储介质及程序产品 | |
US20170242889A1 (en) | Cache Based Efficient Access Scheduling for Super Scaled Stream Processing Systems | |
CN106547882A (zh) | 一种智能电网中营销大数据的实时处理方法及系统 | |
CN104156810A (zh) | 一种基于云计算的电力调度生产管理系统及其实现方法 | |
CN105469204A (zh) | 深度融合大数据分析技术的重装制造企业综合评价系统 | |
CN112148578A (zh) | 基于机器学习的it故障缺陷预测方法 | |
CN113176948A (zh) | 边缘网关、边缘计算系统及其配置方法 | |
CN110928740A (zh) | 云计算中心运维数据集中可视化方法及其系统 | |
CN115344207A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
Ma et al. | Design and implementation of smart city big data processing platform based on distributed architecture | |
CN117634801A (zh) | 矿井复杂环境下无人巡检车的任务调度和分析方法 | |
CN118647092A (zh) | 一种配电通信网络综合管理方法及系统 | |
CN116629802A (zh) | 一种用于铁路港口站的大数据平台系统 | |
Li et al. | A distributed parallel alarm management strategy for alarm reduction in chemical plants | |
CN111291029B (zh) | 数据清洗方法及装置 | |
CN111414355A (zh) | 一种海上风电场数据监测存储系统及方法、装置 | |
CN115883392B (zh) | 算力网络的数据感知方法、装置、电子设备及存储介质 | |
CN110837970A (zh) | 一种区域卫生平台质控方法和系统 | |
CN114756301B (zh) | 日志处理方法、装置和系统 | |
KR101878291B1 (ko) | 에너지 빅데이터 관리 시스템 및 그 방법 | |
CN116975109A (zh) | 一种数据质量的检测方法和装置 | |
CN116739395A (zh) | 一种企业外迁预测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |