CN113435703A - 一种基于scada数据建模风电机组故障分析系统 - Google Patents
一种基于scada数据建模风电机组故障分析系统 Download PDFInfo
- Publication number
- CN113435703A CN113435703A CN202110602643.3A CN202110602643A CN113435703A CN 113435703 A CN113435703 A CN 113435703A CN 202110602643 A CN202110602643 A CN 202110602643A CN 113435703 A CN113435703 A CN 113435703A
- Authority
- CN
- China
- Prior art keywords
- data
- module
- wind turbine
- fault
- scada
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 18
- 238000002372 labelling Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000007781 pre-processing Methods 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 238000004590 computer program Methods 0.000 claims abstract description 14
- 238000011160 research Methods 0.000 claims abstract description 13
- 238000012800 visualization Methods 0.000 claims abstract description 12
- 238000005065 mining Methods 0.000 claims abstract description 11
- 238000010276 construction Methods 0.000 claims abstract description 6
- 238000001514 detection method Methods 0.000 claims abstract description 5
- 238000012423 maintenance Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000012544 monitoring process Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000012952 Resampling Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 2
- 238000010248 power generation Methods 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 claims 1
- 238000012417 linear regression Methods 0.000 claims 1
- 238000012706 support-vector machine Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02B—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
- Y02B10/00—Integration of renewable energy sources in buildings
- Y02B10/30—Wind power
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Operations Research (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明涉及风电场风电机组故障分析技术领域,具体为一种基于SCADA数据建模风电机组故障分析系统,包括网关设备、数据处理单元以及模型构建单元;数据处理单元和模型构建单元均基于SCADA系统平台进行集成与开发,且数据处理单元获取研究对象的数据信息并生成用于模型构建单元提取的故障数据库;网关设备包括存储器、中央处理器以及计算机程序;数据处理单元包括标准化预处理模块以及故障数据自动标注模块;模型构建单元包括信息提取模块、故障预警模块以及可视化模块,并依次连接。通过本发明,实现关联信息的自动挖掘与综合利用、SCADA数据内在的复杂时空相关性的自主学习与建模以及故障自动检测与报警。
Description
技术领域
本发明涉及风电厂风电机组故障分析技术领域,具体为一种基于SCADA数据建模风电机组故障分析系统。
背景技术
及时全面准确的监测和评估并网风电机组的运行状态,有效避免故障及连锁故障的发生,对于优化风电场的维修策略和实现大规模风力发电机组安全高效的并网具有重要的现实意义。
因此,如何提高风力发电机组可利用率,降低运行维护成本,特别是随着我国风电机组安装数量的迅猛增加以及风电机组的发展,对风电机组运行状态综合分析、故障诊断以及可靠性研究等方而有望成为我国风电产业新的增长点。
发明内容
本发明目的为解决上述所提到的问题,提出了一种基于SCADA数据建模风电机组故障分析系统。
本发明提供的技术方案是:
一种基于SCADA数据建模风电机组故障分析系统,包括:网关设备、数据处理单元以及模型构建单元;
所述数据处理单元和所述模型构建单元均基于SCADA系统平台进行集成与开发,且所述数据处理单元获取研究对象的数据信息并生成用于所述模型构建单元提取的故障数据库;
所述网关设备包括存储器、中央处理器以及存储在所述存储器上并可以在所述中央处理器上运行的计算机程序;
所述数据处理单元包括标准化预处理模块以及与所述标准化预处理模块连接的故障数据自动标注模块;
所述模型构建单元包括信息提取模块、故障预警模块以及可视化模块,所述信息提取模块连接所述故障预警模块,所述故障预警模块连接所述可视化模块;
所述信息提取模块调取经过所述数据处理单元生成的所述故障数据库,进行关联信息的挖掘以及预警测试,并将预测评估反馈给所述研究对象。
进一步的,所述标准化预处理模块基于SCADA系统,提取风电机组样本数据,研究所述风电机组运行数据与所述风电机组主要部件运行特性之间的关联关系,对所述风电机组样本数据进行标准化处理,建立标准化预处理工具包,实现数据的自动化预处理。
进一步的,所述故障数据自动标注模块,基于SCADA系统提取所述风电机组样本数据,研究所述风电机组运行故障数据自动标注方法,并建立对应的故障数据库。
进一步的,所述信息提取模块,基于SCADA系统提取的所述风电机组样本数据,建立关联参数挖掘模型,获取关键监测变量数据库。
进一步的,所述故障预警模块,基于机器学习和深度学习技术,建立典型故障监测预警模型库,开发相应的模型训练模块和模型评估模块。
进一步的,所述可视化模块,开发并运用于所述风电机组的运维和管理。
进一步的,所述样本数据的标准化处理包括数据重采样、异常点检测、缺失值填充以及归一化。
进一步的,运行特性包括发电量、机组运行时间、温度、震动、风速以及风向并以图表形式展现。
进一步的,所述故障数据自动标注模块,基于风电场历史运行数据、事件记录或故障维修记录,包括:子标签库设置模块、子标签选择模块、标签构建模块、运算值计算模块、哈希模块、标注模块以及编辑模块,且各模块依次电连接。
本发明的一个方面带来的有益效果是:
1.通过大数据挖掘、分析技术,具体分析与机组发电量、健康相关的数据,指明机组性能优化的方向,提高运维效率和能力;
2.建立多参数关联分析模型,有效挖掘与不同典型部件运行状态关联的变量集合,实现关联信息的自动挖掘与综合利用;
3.提出多变量时空融合建模方法,实现SCADA数据内在的复杂时空相关性的自主学习与建模;
4.构建基于机器学习的故障预警模型,建立SCADA数据与典型故障的映射关系,实现故障的自动检测与报警。
附图说明
图1为本发明一种基于SCADA数据建模风电机组故障分析系统框架示意图;
图2为本发明一种基于SCADA数据建模风电机组故障分析系统实施例提供的数据自动标注方法的流程示意图;
图3为本发明一种基于SCADA数据建模风电机组故障分析系统实施例提供的数据自动标注装置的示意性框图;
图4为本发明一种基于SCADA数据建模风电机组故障分析系统实施例提供的计算机设备的示意性框图。
其中,100、标准化预处理模块,110、数据处理单元,120、故障数据自动标注模块,130、模型构建单元,140、信息提取模块,150、故障预警模块,160、可视化模块,170、中央处理器,180、存储器,190、计算机程序,200、子标签库设置模块,210、子标签选择模块,220、标签构建模块,230、运算值计算模块,240、哈希模块,250、标注模块,260、编辑模块,500、计算机设备,501、系统总线,502、处理器,503、非易失性存储介质,504、内存储器,5031、操作系统,5032、计算机程序,505、网络接口。
具体实施方式
为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案做进一步的详细描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的实施例,都属于本发明的保护范围。
实施例
本实施例是根据本发明技术方案做进一步详细的开展,具体过程及要点如下:
如图1所示,一种基于SCADA数据建模风电机组故障分析系统,包括:网关设备、数据处理单元110以及模型构建单元130,其中数据处理单元110和模型构建单元130均基于SCADA系统平台进行集成与开发,且数据处理单元110获取研究对象的数据信息并生成用于模型构建单元130提取的故障数据库。
网关设备包括存储器180、中央处理器170以及存储在存储器180上并可以在中央处理器170上运行的计算机程序190。
所述数据处理单元110包括标准化预处理模块100以及与标准化预处理模块100连接的故障数据自动标注模块120;
模型构建单元130包括信息提取模块140、故障预警模块150以及可视化模块160,信息提取模块140连接故障预警模块150,故障预警模块150连接可视化模块160,信息提取模块140调取经过数据处理单元110生成的故障数据库,进行关联信息的挖掘以及预警测试,并将预测评估反馈给研究对象。
标准化预处理模块100基于SCADA系统,提取风电机组样本数据,研究所述风电机组运行数据与所述风电机组主要部件运行特性之间的关联关系,对所述风电机组样本数据进行标准化处理,建立标准化预处理工具包,实现数据的自动化预处理。
故障数据自动标注模块120,基于SCADA系统提取所述风电机组样本数据,研究所述风电机组运行故障数据自动标注方法,并建立对应的故障数据库。
对于所述风电机组运行故障数据自动标注并建立对应的故障数据库,本实施例采用如下方案:
如图2所示,为本发明实施例提供的数据自动标注方法的流程示意图,该数据自动标注方法应用于云服务器中,该方法通过安装于云服务器中的应用软件进行执行。具体步骤如下:
S110、预先设置若干个子标签组成子标签库。其中,每一个子标签用于定义至少一项标签属性。
在本实施例中,为了更清楚的理解技术方案,对具体实现场景所涉及的终端进行详细介绍。
一是智能终端,例如智能手机,个人电脑或者平板电脑等,其用于接收云服务器提供的系统数据,并且将用户的多种控制指令发送至云服务器,以执行对应的操作。
二是云服务器,用于接收智能终端上传的控制指令,并据此在数据系统或者平台中执行与控制指令对应的操作。在一些实施例中,为了识别智能终端的用户角色,是否具有与控制指令相匹配的权限。云服务器可以在初始化时进行用户身份数据的认证和识别。例如,通过用户账号密码,或者设备的IMEI码确定用户角色。
在本实施例中,“子标签”是用于对标签进行描述和定义的基础元素或者单元。通过一个或者多个子标签,共同组成了对标签的完整定义,可以确定一个标签的多个不同的标签属性。“标签属性”是关于标签某一方面的特性,例如该标签的对象。
S120、从所述子标签库中选出一个或者多个子标签。
在本实施例中,预先设置的子标签都存储在子标签库这一数据集合中,以便于随时调用。具体可以采用任何合适的方式,从子标签库中选出一个或者多个子标签,用以作为构成标签的基础元素。
S130、通过一种或者多种运算关系,将所述选出的子标签构建为多个不同的标签。
在本实施例中,“运算关系”是指两个子标签之间的关系。当然,根据实际情况的需要,可以包括除了“和”以外的,其他合适的运算关系,例如“非”等,
在一些实施例中,所述子标签的数据类型包括:数值、字符串和布尔值;所述运算关系包括关系操作符、逻辑运算符以及数学操作符。
具体的,在构建多个标签时,首先可以根据所述选出的子标签的数据类型,确定可用的运算关系。
具体而言,根据不同的数据类型,可以选择使用的运算关系包括:关系操作符(如eq(==),ne(!=),lt()<,le(<=),gt(>),ge(>=)等),逻辑运算符(如and(&&),or(||),not(!)等),数学操作符(如加(+),减(-),乘(*),除(/),取模(%),幂指数(^)等)以及归类为其他的操作符。
最后,通过所述可用的运算关系,组合所述选出的子标签以生成对应的标签。本领域技术人员可以理解,即使选出了相同的子标签,对于每一种可用的运算关系都可以生成一个新的标签。
以下结合构建特定标签的例子,详细描述由子标签构建标签的详细过程:
假设,已经设置好的子标签库中包含X1至Xn的n个不同的子标签。在构建标签的过程中,可以将子标签视作计算因子,从相应的子标签库中选取所需要的子标签X1和X3。然后,设置这些子标签之间的运算关系为“和”,即可构建生成一个标签1。亦即,标签1等于子标签X1和子标签X3之间的交集。
通过这样的方式,理论上可以构建多种不同的,具有精确定义的标签。这些标签可以很好的满足实际使用的需求,能够在不同的维度上进行标记和定义。
S140、根据所述子标签以及所述子标签之间的运算关系,计算每个所述标签的运算值。
在本实施例中,运算值是用以区分不同标签的标记,从而建立起标签与实际待标注数据之间的关联。当然,一个标签可以与多个运算值对应,但一个运算值只能对应一个标签,以避免数据标注时出现混乱。
在一些实施例中,标签的运算值可以采用与构建标签相类似的方式。亦即,每个标签对应的运算值都通过多个子标签的运算因子按照选定的运算关系计算获得。
由此,在计算标签的运算值时,首先为每个所述子标签预设对应的标签值。然后,使用所述子标签之间的运算关系,对所述子标签对应的标签值进行计算以获得所述标签的运算值。
具体的标签值可以由技术人员根据实际情况的需要而进行设置,是经验性数值。
S150、通过预设的哈希函数,计算待标注数据对应的哈希值。
在本实施例中,哈希函数是将一个大范围的数据映射到一个较小的数据范围的函数。其具体可以根据实际情况的需要,选择使用合适的哈希函数,以获得待标注数据的哈希值。
在一些实施例中,待标注数据的数据类型可以选自数值、字符串和布尔值中的一种或多种。亦即,待标注数据可能是由多种不同的数据类型的数据所组成的。
由此,为了满足哈希函数的使用要求,可以先将所述待标注数据中的字符串或布尔值,通过预设的编码表,将所述字符串和所述布尔值转换为数值。然后,在通过预设的哈希函数,计算所述字符串或布尔值转换后的数值对应的哈希值。
S160、使用所述运算值与所述哈希值相同的标签标注所述待标注数据。
在本实施例中,每个待标注数据都具有一个哈希值,每个标签也具有运算值。因此,根据哈希值和运算值,采用比较匹配的方式实现对待标注数据的自动标注。亦即,在所有的标签中找到那些运算值与待标注数据的哈希值相等的标签,并自动为所述待标注数据进行标注。
例如,针对人员的能力评估可以构建有一级至四级这样四个等级的专家标签,每个级别均具有对应的运算值。在对人员这一数据进行自动标注时,便可以通过哈希函数计算得到该人员此时的哈希值,然后确定该哈希值具体与哪个级别的专家标签的运算值相同,最终为该人员标注为对应等级的专家标签。
在一些实施例中,步骤160之后还可以包括:
S170、根据用户的编辑指令,编辑所述子标签和/或所述子标签之间的运算关系。
随着系统平台的使用时间的不断增长,实际使用的场景或者数据等可能会出现相应的变化,此时需要对原有的标签体系作相应的调整和维护。
在本实施例中,由于标签都是依赖基础的子标签和运算关系生成的。因此,技术人员可以通过对运算关系以及标签的编辑操作来实现对标签的编辑。具体的,可以通过增加、删除或者修改所述子标签定义的标签属性和修改所述子标签之间的运算关系的方式,对子标签库中的子标签及其运算关系进行编辑和调整。这样的标签编辑方式具有很强的适应性,便于进行调整和维护。
本发明实施例提供的数据自动标注方法,通过子标签和运算关系来构建多种不同的,具有精确定义的标签。这些标签可以很好的满足实际使用的需求,能够在不同的维度上进行标记和定义,提供客观的评价体系。
而且,技术人员可以通过对运算关系以及子标签的编辑操作来实现对标签的适应性调整,具有很强的适应性并且便于调整和维护。
本发明实施例还提供一种数据自动标注装置,该数据自动标注装置用于执行前述数据自动标注方法的任一实施例。具体地,如图3所示,图3是本发明实施例提供的数据自动标注装置的示意性框图。该故障数据自动标注模块120可以配置于云服务器中。
如图3所示,故障数据自动标注模块120包括:子标签库设置模块200,子标签选择模块210,标签构建模块220,运算值计算模块230,哈希模块240以及标注模块250。
子标签库设置模块200,用于预先设置若干个子标签组成子标签库,每一个子标签用于定义至少一项标签属性。
子标签选择模块210,用于从所述子标签库中选出一个或者多个子标签。子标签可以由用户或者技术人员根据实际情况的需要,在子标签库中搜索获得。当然,也可以采用随机搜索选取等的方式,只需要能够选出合适的子标签即可。
标签构建模块220,用于通过一种或者多种运算关系,将所述选出的子标签构建为多个不同的标签。
在一实施例中,所述子标签的数据类型包括:数值、字符串和布尔值;所述运算关系包括关系操作符、逻辑运算符以及数学操作符。
相对应地,标签构建模块220具体用于:根据所述选出的子标签的数据类型,确定可用的运算关系;通过所述可用的运算关系,组合所述选出的子标签以生成对应的标签;每一种可用的运算关系与一个标签对应。
多个不同的可用运算关系可以相应的生成多个标签,从而极大的丰富了标签体系的内容和层次。
运算值计算模块230,用于根据所述子标签以及所述子标签之间的运算关系,计算每个所述标签的运算值。
在一实施例中,运算值计算模块230具体用于:为每个所述子标签预设对应的标签值;并且使用所述子标签之间的运算关系,对所述子标签对应的标签值进行计算以获得所述标签的运算值。
该预设的标签值是一个经验性数值,可以根据实际情况的需要,由技术人员进行设置或者调整。
哈希模块240,用于通过预设的哈希函数,计算待标注数据对应的哈希值。具体的,所述待标注数据的数据类型可以选自数值、字符串和布尔值中的一种或多种。亦即,待标注数据的数据类型可能是单一的,也可能是混合的。
由此,所述哈希单元在面对具有混合的待标注数据时,具体用于将所述待标注数据中的数值,通过预设的哈希函数,计算对应的哈希值;并且将所述待标注数据中的字符串或布尔值,通过预设的编码表,将所述字符串和所述布尔值转换为数值;通过预设的哈希函数,计算所述字符串或布尔值转换后的数值对应的哈希值。
标注模块250,用于使用所述运算值与所述哈希值相同的标签标注所述待标注数据。在已知待标注数据的哈希值后,可以搜索所有标签中,运算值与该哈希值相同的标签,并将搜索到的标签对该数据进行标注。亦即,使用哈希值和运算值作为自动标注的索引。
在本实施例中,通过子标签和运算关系来快速构建多种不同的,具有精确定义的标签。这些标签可以很好的满足实际使用的需求,能够在不同的维度上进行标记和定义,提供客观的评价体系。
在一实施例中,如图3所示,还可以包括:编辑模块260。该编辑模块260用于根据用户的编辑指令,编辑所述子标签和/或所述子标签之间的运算关系。
通过编辑模块260,技术人员可以通过对运算关系以及子标签的编辑操作来实现对标签的适应性调整,具有很强的适应性并且便于调整和维护。
上述数据自动标注装置可以实现为计算机程序的形式,该计算机程序可以在如图4所示的计算机设备上运行。
该计算机设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
如图4所示,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行数据自动标注方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行数据自动标注方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图4中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本发明实施例公开的数据自动标注方法。
本领域技术人员可以理解,图4中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图4所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元,该处理器502还可以是其他通用处理器、数字信号处理器、专用集成电路、现成可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本发明实施例公开的数据自动标注方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、磁碟或者光盘等各种可以存储程序代码的介质。
信息提取模块140,基于SCADA系统提取的风电机组样本数据,建立关联参数挖掘模型,获取关键监测变量数据库。
故障预警模块150,基于机器学习和深度学习技术,建立典型故障监测预警模型库,开发相应的模型训练模块和模型评估模块。
可视化模块160,开发并运用于所述风电机组的运维和管理。
样本数据的标准化处理包括数据重采样、异常点检测、缺失值填充以及归一化,运行特性包括发电量、机组运行时间、温度、震动、风速以及风向并以图表形式展现,研究风电机组运行故障数据自动标注方法,基于风电场历史运行数据、事件记录或故障维修记录。
具体的步骤要点如下:
首先,进行数据标准化与预处理技术,本实施例按照机组类型比如东汽双馈型和金风直驱型,对SCADA数据进行标准化处理,包括数据重采样、异常点检测、缺失值填充、归一化等,建立标准化预处理工具包,实现数据的自动化预处理。
其次,进行故障数据自动标注技术,基于风电场历史SCADA运行数据和事件记录或故障维修记录,研究故障数据自动标注方法,分别建立东汽双馈机组和金风直驱机组的故障数据库。
其次,进行SCADA数据分析,通过机组运行数据分析机组的各项运行特性,包括发电量、机组各种运行状态时数、温度、震动、风速、风向等,以图表形式展示。
其次,进行SCADA数据关联信息挖掘,基于海量的风电场历史SCADA数据,建立基于统计相关分析的关联参数挖掘模型,分别获取东汽双馈机组大部件,比如叶片、齿轮箱等和金风直驱机组比如,叶片、发电机以及变流器等的关键监测变量数据库。
再次,进行基于机器学习的大部件典型故障预警,研究高维动态SCADA数据的多变量时空关系建模方法,以机器学习/深度学习为关键技术,建立基于多状态参数融合的大部件典型故障监测预警模型库,开发相应的模型训练和模型评估模块。
最后,进行故障预警诊断可视化:开发可视化工具包,便于风电场运维人员使用,根据故障预警结果科学指导风电机组运维和管理工作。
Claims (10)
1.一种基于SCADA数据建模风电机组故障分析系统,其特征在于,包括:网关设备、数据处理单元以及模型构建单元;
所述数据处理单元和所述模型构建单元均基于SCADA系统平台进行集成与开发,且所述数据处理单元获取研究对象的数据信息并生成用于所述模型构建单元提取的故障数据库;
所述网关设备包括存储器、中央处理器以及存储在所述存储器上并可以在所述中央处理器上运行的计算机程序;
所述数据处理单元包括标准化预处理模块以及与所述标准化预处理模块连接的故障数据自动标注模块;
所述模型构建单元包括信息提取模块、故障预警模块以及可视化模块,所述信息提取模块连接所述故障预警模块,所述故障预警模块连接所述可视化模块;
所述信息提取模块调取经过所述数据处理单元生成的所述故障数据库,进行关联信息的挖掘以及预警测试,并将预测评估反馈给所述研究对象。
2.根据权利要求1所述的一种基于SCADA数据建模风电机组故障分析系统,其特征在于:所述标准化预处理模块基于SCADA系统,提取风电机组样本数据,研究所述风电机组运行数据与所述风电机组主要部件运行特性之间的关联关系,对所述风电机组样本数据进行标准化处理,建立标准化预处理工具包,实现数据的自动化预处理。
3.根据权利要求1所述的一种基于SCADA数据建模风电机组故障分析系统,其特征在于:所述故障数据自动标注模块,基于SCADA系统提取所述风电机组样本数据,研究所述风电机组运行故障数据自动标注方法,并建立对应的故障数据库。
4.根据权利要求1所述的一种基于SCADA数据建模风电机组故障分析系统,其特征在于:所述信息提取模块,基于SCADA系统提取的所述风电机组样本数据,建立关联参数挖掘模型,获取关键监测变量数据库。
5.根据权利要求1所述的一种基于SCADA数据建模风电机组故障分析系统,其特征在于:所述故障预警模块,基于机器学习和深度学习技术,建立典型故障监测预警模型库,开发相应的模型训练模块和模型评估模块。
6.根据权利要求5所述的一种基于SCADA数据建模风电机组故障分析系统,其特征在于:所述机器学习技术包括多元线性回归、神经网络以及支持向量机。
7.根据权利要求1所述的一种基于SCADA数据建模风电机组故障分析系统,其特征在于:所述可视化模块,开发并运用于所述风电机组的运维和管理。
8.根据权利要求2所述的一种基于SCADA数据建模风电机组故障分析系统,其特征在于:所述样本数据的标准化处理包括数据重采样、异常点检测、缺失值填充以及归一化。
9.根据权利要求2所述的一种基于SCADA数据建模风电机组故障分析系统,其特征在于:运行特性包括发电量、机组运行时间、温度、震动、风速以及风向并以图表形式展现。
10.根据权利要求3所述的一种基于SCADA数据建模风电机组故障分析系统,其特征在于:所述故障数据自动标注模块,基于风电场历史运行数据、事件记录或故障维修记录,包括:子标签库设置模块、子标签选择模块、标签构建模块、运算值计算模块、哈希模块、标注模块以及编辑模块,且各模块依次电连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110602643.3A CN113435703A (zh) | 2021-05-31 | 2021-05-31 | 一种基于scada数据建模风电机组故障分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110602643.3A CN113435703A (zh) | 2021-05-31 | 2021-05-31 | 一种基于scada数据建模风电机组故障分析系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113435703A true CN113435703A (zh) | 2021-09-24 |
Family
ID=77804069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110602643.3A Withdrawn CN113435703A (zh) | 2021-05-31 | 2021-05-31 | 一种基于scada数据建模风电机组故障分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435703A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114135440A (zh) * | 2021-12-02 | 2022-03-04 | 国能思达科技有限公司 | 一种风电机组作业工艺模块化的系统 |
CN114330569A (zh) * | 2021-12-30 | 2022-04-12 | 山东浪潮科学研究院有限公司 | 一种检测风机组部件故障的方法、设备及存储介质 |
CN117273709A (zh) * | 2023-11-20 | 2023-12-22 | 中况检测技术(南京)有限公司 | 设备运维及故障监测在线评估系统和方法 |
-
2021
- 2021-05-31 CN CN202110602643.3A patent/CN113435703A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114135440A (zh) * | 2021-12-02 | 2022-03-04 | 国能思达科技有限公司 | 一种风电机组作业工艺模块化的系统 |
CN114330569A (zh) * | 2021-12-30 | 2022-04-12 | 山东浪潮科学研究院有限公司 | 一种检测风机组部件故障的方法、设备及存储介质 |
CN117273709A (zh) * | 2023-11-20 | 2023-12-22 | 中况检测技术(南京)有限公司 | 设备运维及故障监测在线评估系统和方法 |
CN117273709B (zh) * | 2023-11-20 | 2024-01-26 | 中况检测技术(南京)有限公司 | 设备运维及故障监测在线评估系统和方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113435703A (zh) | 一种基于scada数据建模风电机组故障分析系统 | |
KR102073912B1 (ko) | 고부하 가스 터빈들에 대한 진단 규칙들을 위한 방법 및 시스템 | |
CN115048591B (zh) | 一种基于人工智能的配电网全息数据可视化智能展示分析系统 | |
CN112462736B (zh) | 一种基于数据分析的风电机组故障诊断方法 | |
CN106446016A (zh) | 一种基于并行关联规则挖掘的配电网运行可靠性预测方法 | |
CN110297207A (zh) | 智能电表的故障诊断方法、系统及电子装置 | |
CN115438726A (zh) | 一种基于数字孪生技术的设备寿命与故障类型预测方法及系统 | |
CN117114449A (zh) | 一种电力大数据可视化分析系统及方法 | |
CN117056688A (zh) | 一种基于数据分析的新材料生产数据管理系统及方法 | |
US11907865B2 (en) | Determination of security-constrained optimal power flow | |
CN111306051B (zh) | 一种输油泵机组探针式状态监测预警方法、装置及系统 | |
CN112686773A (zh) | 一种基于融合业务拓扑的电力计量全链路关键业务异常定位模型构建方法 | |
CN110415136A (zh) | 一种电力调度自动化系统服务能力评估系统与方法 | |
CN111539642B (zh) | 一种基于面向对象的电厂数据采集处理系统及其方法 | |
CN109494882B (zh) | 一种变电站开关设备状态的诊断方法及系统 | |
CN112765232A (zh) | 核电厂重大设备的数据管理方法及系统 | |
CN117742858B (zh) | 基于数字孪生的供热数据可视化方法及计算机设备 | |
CN116069598A (zh) | 一种智能3d可视化it监控管理方法及系统 | |
CN117950381B (zh) | 一种数字化生产制造管理系统 | |
CN117152355B (zh) | 一种基于工厂数据的可视化监管系统 | |
CN117907754B (zh) | 基于故障分析的配电网维护方法及系统 | |
Godwin et al. | Rapid labelling of SCADA data to extract transparent rules using RIPPER | |
CN118171423A (zh) | 基于数据融合的电网图构建方法、装置、终端设备及介质 | |
Kranjčič | The potential of OPC technology for monitoring and maintenance of hydropower plants | |
CN117670288A (zh) | 基于智能巡检管理平台的电力设备运行检修方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210924 |