CN117591539A - 一种基于电力大数据的多数据整合运用一体化系统及方法 - Google Patents
一种基于电力大数据的多数据整合运用一体化系统及方法 Download PDFInfo
- Publication number
- CN117591539A CN117591539A CN202311674232.0A CN202311674232A CN117591539A CN 117591539 A CN117591539 A CN 117591539A CN 202311674232 A CN202311674232 A CN 202311674232A CN 117591539 A CN117591539 A CN 117591539A
- Authority
- CN
- China
- Prior art keywords
- data
- power
- power data
- category
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000010354 integration Effects 0.000 title claims abstract description 13
- 238000007726 management method Methods 0.000 claims abstract description 100
- 230000000750 progressive effect Effects 0.000 claims abstract description 31
- 238000009960 carding Methods 0.000 claims abstract description 27
- 230000008569 process Effects 0.000 claims abstract description 16
- 238000013523 data management Methods 0.000 claims abstract description 10
- 238000012216 screening Methods 0.000 claims abstract description 7
- 238000010276 construction Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 230000009471 action Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及电力数据管理技术领域,具体为一种基于电力大数据的多数据整合运用一体化系统及方法,包括每间隔单位周期采集在电厂运营过程中产生的所有电力数据,获取按照预设的电力数据管理规则将各电力数据所分属对应的管理数据类别,并将作对应类别标记后的各电力数据存储进电力数据库;构建电力数据拓扑节点,梳理电力数据库的电力数据拓扑网;分别计算各管理数据类别的电力数据在电力数据库中的特征检索指数;筛选出特征类别,对各特征类别的关联检索类别进行识别判断,并获取在建立各特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围;引入语言模型,为用户提供智能化的检索提示。
Description
技术领域
本发明涉及电力数据管理技术领域,具体为一种基于电力大数据的多数据整合运用一体化系统及方法。
背景技术
电力运营数据管理是电力行业中非常重要的一环,通过对电力系统中各种数据进行收集、存储、分析和应用,可以帮助电力企业实现在运营过程中的优化以及决策的科学化;而在电力运营过程中产生的电力数据往往种类多、数据复杂,例如说在实现对电厂运营过程中往往会存在大量有价值的方案、成果、设备运维经验等,相应能提取得到的电力数据包括设备检修过程记录数据、设备运行风险参考数据、设备安全检查指标数据、电厂隐患数据等;而上述情况也意味着,用户在电力数据库中进行数据检索时,面对种类多且复杂的电力数据,容易出现检索局限和检索盲目的现象,若能实现对电力数据库中存储的电力数据进行有序的和多维度的分类管理和展示,才能方便用户从不同的维度获取相应的知识提升知识的存储及检索效率。
发明内容
本发明的目的在于提供一种基于电力大数据的多数据整合运用一体化系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于电力大数据的多数据整合运用一体化方法,方法包括:
步骤S1:每间隔单位周期采集在电厂运营过程中产生的所有电力数据,获取按照预设的电力数据管理规则将各电力数据所分属对应的管理数据类别,并将作对应类别标记后的各电力数据存储进电力数据库;
步骤S2:对存储进电力数据库的所有电力数据梳理特征信息分布,根据在不同电力数据对应的特征信息之间存在的包含分布情况,构建电力数据拓扑节点,梳理电力数据库的电力数据拓扑网;
步骤S3:在电力数据拓扑网中,对在所有电力数据拓扑节点中所呈现的类别标记变化情况进行分析,分别计算各管理数据类别的电力数据在电力数据库中的特征检索指数;
步骤S4:根据各管理数据类别的电力数据在电力数据库中对应的特征检索指数,筛选出特征类别,根据涉及各特征类别的数据拓扑节点的分布情况,对各特征类别的关联检索类别进行识别判断,并获取在建立各特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围;
步骤S5:引入语言模型,对访问电力数据库的用户采集输入的检索信息,实时对从用户输入的检索信息中提取得到的特征信息进行监测,为用户提供智能化的检索提示。
进一步的,步骤S2包括:
步骤S2-1:分别对电力数据库内各电力数据提取特征信息,得到对应各电力数据的特征信息集;遍历电力数据库内各电力数据的特征信息集;
步骤S2-2:若在电力数据库内存有某电力数据A和某电力数据B,且某电力数据A的特征信息集为P(A),某电力数据B的特征信息集为P(B),当在P(A)与P(B)之间满足P(A)=P(B)+U,且card(U)/card[P(A)]<β时,判断P(A)对P(B)存在递进包含关系;其中,U表示由在P(A)中除P(B)包含的特征信息以外的特征信息所构成的区别特征信息集合,card(U)表示在区别特征信息集合U中包含的特征信息总数,card[P(A)]表示在集合P(A)中包含的特征信息总数,β表示占比阈值;
步骤S2-3:基于P(A)对P(B)存在的递进包含关系,在某电力数据A和某电力数据B之间构建电力数据拓扑节点D=B→A,其中,B为电力数据拓扑节点D的第一数据端点,A为电力数据拓扑节点D的第二数据端点;分别在电力数据库内每两个电力数据之间进行递进包含关系判断,提取出在电力数据库内的所有电力数据拓扑节点;
步骤S2-4:对各电力数据拓扑节点的第一数据端点、第二数据端点进行遍历;在所有电力数据拓扑节点中,逐一将第一数据端点和第二数据端点相同的两个不同电力数据拓扑节点进行合并连接,构建得到电力数据库的电力数据拓扑网。
进一步的,步骤S3包括:
步骤S3-1:遍历电力数据拓扑网中各电力数据所对应的类别标记,提取在电力数据拓扑网中相应的第一数据端点和第二数据端点所对应的类别标记不同的电力数据拓扑节点,设为特征节点;分别将第一数据端点所对应的类别标记相同的特征节点进行汇集,得到若干特征节点集合;其中,在一个特征节点集合中,各特征节点的第一数据端点所属的管理数据类别相同;在各特征节点中,第一数据端点和第二数据端点所对应的类别标记不同,也就是说在各特征节点中呈现出,在不同管理数据类别的电力数据之间的特征信息所满足的递进包含关系;
步骤S3-2:设在所有特征节点的第一数据端点均所属于某管理数据类别的特征节点集合中,累计特征节点的总数为K,累计在K个特征节点的第二数据端点中出现的类别标记的种类数为N,累计从电力数据拓扑网中提取得到的特征节点的总数为M,累计在电力数据库中管理数据类别的总数为Q;计算属于某管理数据类别的电力数据在电力数据库中的特征检索指数β=K/M+N/Q;其中,K/M的比值越大,说明在某管理数据类别和其他管理数据类别之间基于电力数据出现递进包含关系的频率越高,N/Q越大,说明与某管理数据类别之间基于电力数据出现递进包含关系的其他管理数据类别的涵盖范围越广,特征检索指数β越大,说明在电力数据库中,某管理数据类别的电力数据与其他管理数据类别的电力数据之间存在特征关联的可能性越大,反应在实际检索过程中,则意味着用户在检索某管理数据类别的电力数据时,往往还需要检索其他管理数据类别的电力数据。
进一步的,步骤S4包括:
步骤S4-1:获取各管理数据类别的电力数据在电力数据库中的特征检索指数,将相应特征检索指数大于指数阈值的管理数据类别设为特征类别;若在某特征类别f的特征节点集合中,第二数据端点所属类别为管理数据类别h的特征节点总数为S,满足S/G≥α,判断管理数据类别h为某特征类别f的一个关联检索类别;
步骤S4-2:对S个第二数据端点所属类别为管理数据类别h的特征节点的区别特征信息集合进行汇集,得到集合W,分别对集合W内各特征信息计算重复指数δ=c/E,其中,c表示在集合W中,包含各特征信息的区别特征信息集合的总个数,E表示在集合W中所汇集的区别特征信息集合的总个数;将汇集重复指数δ大于重复指数阈值的所有特征信息得到的集合,设为在建立某特征类别f与管理数据类别h之间的递进检索关联关系时所依据的特征信息范围;
步骤S4-3:分别获取各特征类别的关联检索类别,获取在建立各特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围。
进一步的,步骤S5包括:
步骤S5-1:将从用户输入的检索信息中提取得到的特征信息集设为目标信息集,实时将目标信息集与电力数据拓扑网中各电力数据的特征信息集进行匹配;
步骤S5-2:当目标信息集与电力数据拓扑网中某电力数据的特征信息集之间呈现的匹配相似度大于相似度阈值时,获取某电力数据所对应的类别标记,若某电力数据所属类别为某特征类别,提取某特征类别的关联检索类别;
步骤S5-3:从在建立某特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围中,随机选取若干特征信息生成检索式,向用户进行推送。
为更好的实现上述方法,还提出了一种多数据整合运用一体化系统,系统包括电力数据库存储管理模块、电力数据拓扑网梳理模块、电力数据特征检索管理模块、电力数据检索信息管理模块、检索提示管理模块;
电力数据库存储管理模块,用于每间隔单位周期采集在电厂运营过程中产生的所有电力数据,获取按照预设的电力数据管理规则将各电力数据所分属对应的管理数据类别,并将作对应类别标记后的各电力数据存储进电力数据库;
电力数据拓扑网梳理模块,用于对存储进电力数据库的所有电力数据梳理特征信息分布,根据在不同电力数据对应的特征信息之间存在的包含分布情况,构建电力数据拓扑节点,梳理电力数据库的电力数据拓扑网;
电力数据特征检索管理模块,用于在电力数据拓扑网中,对在所有电力数据拓扑节点中所呈现的类别标记变化情况进行分析,分别计算各管理数据类别的电力数据在电力数据库中的特征检索指数;
电力数据检索信息管理模块,用于根据各管理数据类别的电力数据在电力数据库中对应的特征检索指数,筛选出特征类别,根据涉及各特征类别的数据拓扑节点的分布情况,对各特征类别的关联检索类别进行识别判断,并获取在建立各特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围;
检索提示管理模块,用于引入语言模型,对访问电力数据库的用户采集输入的检索信息,实时对从用户输入的检索信息中提取得到的特征信息进行监测,为用户提供智能化的检索提示。
进一步的,电力数据拓扑网梳理模块包括电力数据拓扑节点构建单元、电力数据拓扑网梳理单元;
电力数据拓扑节点构建单元,用于对存储进电力数据库的所有电力数据梳理特征信息分布,根据在不同电力数据对应的特征信息之间存在的包含分布情况,构建电力数据拓扑节点;
电力数据拓扑网梳理单元,用于接受电力数据拓扑节点构建单元中的数据,对电力数据库进行电力数据拓扑网的梳理和构建。
进一步的,电力数据特征检索管理模块包括电力数据拓扑节点信息管理单元、特征检索指数计算单元;
电力数据拓扑节点信息管理单元,用于在电力数据拓扑网中,对在所有电力数据拓扑节点中所呈现的类别标记变化情况进行分析;
特征检索指数计算单元,用于分别计算各管理数据类别的电力数据在电力数据库中的特征检索指数。
与现有技术相比,本发明所达到的有益效果是:本发明结合在电厂运营过程中产生的电力数据的多样化、复杂化、综合化的特征,为在电力数据库中存储的电力数据梳理电力数据拓扑网,从搭建得到的电力数据拓扑网中分析分属于不同管理数据类别的电力数据之间的关联递进关系,识别捕捉出从电力数据本身的特征信息出发,能与多数不同管理数据类别的电力数据之间存在特征信息分布关联的管理数据类别,并为其进行关联检索类别的识别判断,同时从不同管理数据类别的电力数据在呈现出关联递进关系的过程中,提取在建立不同管理数据类别之间的递进检索关联关系时所依据的特征信息范围,为用户提供在对电力数据库进行电力数据检索时的检索式智能化推荐,辅助用户在电力数据库内进行电力数据检索时,能符合在电力数据之间存在的数据关联体系,进行科学化地检索,得到更全面详尽的电力数据。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种基于电力大数据的多数据整合运用一体化方法的流程示意图;
图2是本发明一种基于电力大数据的多数据整合运用一体化系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图2,本发明提供技术方案:一种基于电力大数据的多数据整合运用一体化方法,方法包括:
步骤S1:每间隔单位周期采集在电厂运营过程中产生的所有电力数据,获取按照预设的电力数据管理规则将各电力数据所分属对应的管理数据类别,并将作对应类别标记后的各电力数据存储进电力数据库;
步骤S2:对存储进电力数据库的所有电力数据梳理特征信息分布,根据在不同电力数据对应的特征信息之间存在的包含分布情况,构建电力数据拓扑节点,梳理电力数据库的电力数据拓扑网;
其中,步骤S2包括:
步骤S2-1:分别对电力数据库内各电力数据提取特征信息,得到对应各电力数据的特征信息集;遍历电力数据库内各电力数据的特征信息集;
步骤S2-2:若在电力数据库内存有某电力数据A和某电力数据B,且某电力数据A的特征信息集为P(A),某电力数据B的特征信息集为P(B),当在P(A)与P(B)之间满足P(A)=P(B)+U,且card(U)/card[P(A)]<β时,判断P(A)对P(B)存在递进包含关系;其中,U表示由在P(A)中除P(B)包含的特征信息以外的特征信息所构成的区别特征信息集合,card(U)表示在区别特征信息集合U中包含的特征信息总数,card[P(A)]表示在集合P(A)中包含的特征信息总数,β表示占比阈值;
步骤S2-3:基于P(A)对P(B)存在的递进包含关系,在某电力数据A和某电力数据B之间构建电力数据拓扑节点D=B→A,其中,B为电力数据拓扑节点D的第一数据端点,A为电力数据拓扑节点D的第二数据端点;分别在电力数据库内每两个电力数据之间进行递进包含关系判断,提取出在电力数据库内的所有电力数据拓扑节点;
步骤S2-4:对各电力数据拓扑节点的第一数据端点、第二数据端点进行遍历;在所有电力数据拓扑节点中,逐一将第一数据端点和第二数据端点相同的两个不同电力数据拓扑节点进行合并连接,构建得到电力数据库的电力数据拓扑网;
例如说,某电力数据拓扑节点D1=a→b,某电力数据拓扑节点D2=b→c,则因为b在某电力数据拓扑节点D1中为第二数据端点,在某电力数据拓扑节点D2中为第一数据端点,因此可在某电力数据拓扑节点D1和某电力数据拓扑节点D2之间进行合并连接,得到D1→D2=a→b→c;
步骤S3:在电力数据拓扑网中,对在所有电力数据拓扑节点中所呈现的类别标记变化情况进行分析,分别计算各管理数据类别的电力数据在电力数据库中的特征检索指数;
其中,步骤S3包括:
步骤S3-1:遍历电力数据拓扑网中各电力数据所对应的类别标记,提取在电力数据拓扑网中相应的第一数据端点和第二数据端点所对应的类别标记不同的电力数据拓扑节点,设为特征节点;分别将第一数据端点所对应的类别标记相同的特征节点进行汇集,得到若干特征节点集合;其中,在一个特征节点集合中,各特征节点的第一数据端点所属的管理数据类别相同;
步骤S3-2:设在所有特征节点的第一数据端点均所属于某管理数据类别的特征节点集合中,累计特征节点的总数为K,累计在K个特征节点的第二数据端点中出现的类别标记的种类数为N,累计从电力数据拓扑网中提取得到的特征节点的总数为M,累计在电力数据库中管理数据类别的总数为Q;计算属于某管理数据类别的电力数据在电力数据库中的特征检索指数β=K/M+N/Q;
步骤S4:根据各管理数据类别的电力数据在电力数据库中对应的特征检索指数,筛选出特征类别,根据涉及各特征类别的数据拓扑节点的分布情况,对各特征类别的关联检索类别进行识别判断,并获取在建立各特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围;
其中,步骤S4包括:
步骤S4-1:获取各管理数据类别的电力数据在电力数据库中的特征检索指数,将相应特征检索指数大于指数阈值的管理数据类别设为特征类别;若在某特征类别f的特征节点集合中,第二数据端点所属类别为管理数据类别h的特征节点总数为S,满足S/G≥α,判断管理数据类别h为某特征类别f的一个关联检索类别;
步骤S4-2:对S个第二数据端点所属类别为管理数据类别h的特征节点的区别特征信息集合进行汇集,得到集合W,分别对集合W内各特征信息计算重复指数δ=c/E,其中,c表示在集合W中,包含各特征信息的区别特征信息集合的总个数,E表示在集合W中所汇集的区别特征信息集合的总个数;将汇集重复指数δ大于重复指数阈值的所有特征信息得到的集合,设为在建立某特征类别f与管理数据类别h之间的递进检索关联关系时所依据的特征信息范围;
步骤S4-3:分别获取各特征类别的关联检索类别,获取在建立各特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围
步骤S5:引入语言模型,对访问电力数据库的用户采集输入的检索信息,实时对从用户输入的检索信息中提取得到的特征信息进行监测,为用户提供智能化的检索提示;
其中,步骤S5包括:
步骤S5-1:将从用户输入的检索信息中提取得到的特征信息集设为目标信息集,实时将目标信息集与电力数据拓扑网中各电力数据的特征信息集进行匹配;
步骤S5-2:当目标信息集与电力数据拓扑网中某电力数据的特征信息集之间呈现的匹配相似度大于相似度阈值时,获取某电力数据所对应的类别标记,若某电力数据所属类别为某特征类别,提取某特征类别的关联检索类别;
步骤S5-3:从在建立某特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围中,随机选取若干特征信息生成检索式,向用户进行推送。
为更好的实现上述方法,还提出了一种多数据整合运用一体化系统,系统包括电力数据库存储管理模块、电力数据拓扑网梳理模块、电力数据特征检索管理模块、电力数据检索信息管理模块、检索提示管理模块;
电力数据库存储管理模块,用于每间隔单位周期采集在电厂运营过程中产生的所有电力数据,获取按照预设的电力数据管理规则将各电力数据所分属对应的管理数据类别,并将作对应类别标记后的各电力数据存储进电力数据库;
电力数据拓扑网梳理模块,用于对存储进电力数据库的所有电力数据梳理特征信息分布,根据在不同电力数据对应的特征信息之间存在的包含分布情况,构建电力数据拓扑节点,梳理电力数据库的电力数据拓扑网;
其中,电力数据拓扑网梳理模块包括电力数据拓扑节点构建单元、电力数据拓扑网梳理单元;
电力数据拓扑节点构建单元,用于对存储进电力数据库的所有电力数据梳理特征信息分布,根据在不同电力数据对应的特征信息之间存在的包含分布情况,构建电力数据拓扑节点;
电力数据拓扑网梳理单元,用于接受电力数据拓扑节点构建单元中的数据,对电力数据库进行电力数据拓扑网的梳理和构建;
电力数据特征检索管理模块,用于在电力数据拓扑网中,对在所有电力数据拓扑节点中所呈现的类别标记变化情况进行分析,分别计算各管理数据类别的电力数据在电力数据库中的特征检索指数;
其中,电力数据特征检索管理模块包括电力数据拓扑节点信息管理单元、特征检索指数计算单元;
电力数据拓扑节点信息管理单元,用于在电力数据拓扑网中,对在所有电力数据拓扑节点中所呈现的类别标记变化情况进行分析;
特征检索指数计算单元,用于分别计算各管理数据类别的电力数据在电力数据库中的特征检索指数;
电力数据检索信息管理模块,用于根据各管理数据类别的电力数据在电力数据库中对应的特征检索指数,筛选出特征类别,根据涉及各特征类别的数据拓扑节点的分布情况,对各特征类别的关联检索类别进行识别判断,并获取在建立各特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围;
检索提示管理模块,用于引入语言模型,对访问电力数据库的用户采集输入的检索信息,实时对从用户输入的检索信息中提取得到的特征信息进行监测,为用户提供智能化的检索提示。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于电力大数据的多数据整合运用一体化方法,其特征在于,所述方法包括:
步骤S1:每间隔单位周期采集在电厂运营过程中产生的所有电力数据,获取按照预设的电力数据管理规则将各电力数据所分属对应的管理数据类别,并将作对应类别标记后的各电力数据存储进电力数据库;
步骤S2:对存储进电力数据库的所有电力数据梳理特征信息分布,根据在不同电力数据对应的特征信息之间存在的包含分布情况,构建电力数据拓扑节点,梳理电力数据库的电力数据拓扑网;
步骤S3:在电力数据拓扑网中,对在所有电力数据拓扑节点中所呈现的类别标记变化情况进行分析,分别计算各管理数据类别的电力数据在电力数据库中的特征检索指数;
步骤S4:根据各管理数据类别的电力数据在电力数据库中对应的特征检索指数,筛选出特征类别,根据涉及各特征类别的数据拓扑节点的分布情况,对各特征类别的关联检索类别进行识别判断,并获取在建立各特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围;
步骤S5:引入语言模型,对访问电力数据库的用户采集输入的检索信息,实时对从用户输入的检索信息中提取得到的特征信息进行监测,为用户提供智能化的检索提示。
2.根据权利要求1所述的一种基于电力大数据的多数据整合运用一体化方法,其特征在于,所述步骤S2包括:
步骤S2-1:分别对电力数据库内各电力数据提取特征信息,得到对应各电力数据的特征信息集;遍历电力数据库内各电力数据的特征信息集;
步骤S2-2:若在电力数据库内存有某电力数据A和某电力数据B,且某电力数据A的特征信息集为P(A),某电力数据B的特征信息集为P(B),当在P(A)与P(B)之间满足P(A)=P(B)+U,且card(U)/card[P(A)]<β时,判断P(A)对P(B)存在递进包含关系;其中,U表示由在P(A)中除P(B)包含的特征信息以外的特征信息所构成的区别特征信息集合,card(U)表示在区别特征信息集合U中包含的特征信息总数,card[P(A)]表示在集合P(A)中包含的特征信息总数,β表示占比阈值;
步骤S2-3:基于P(A)对P(B)存在的递进包含关系,在某电力数据A和某电力数据B之间构建电力数据拓扑节点D=B→A,其中,B为电力数据拓扑节点D的第一数据端点,A为电力数据拓扑节点D的第二数据端点;分别在电力数据库内每两个电力数据之间进行递进包含关系判断,提取出在电力数据库内的所有电力数据拓扑节点;
步骤S2-4:对各电力数据拓扑节点的第一数据端点、第二数据端点进行遍历;在所有电力数据拓扑节点中,逐一将第一数据端点和第二数据端点相同的两个不同电力数据拓扑节点进行合并连接,构建得到电力数据库的电力数据拓扑网。
3.根据权利要求2所述的一种基于电力大数据的多数据整合运用一体化方法,其特征在于,所述步骤S3包括:
步骤S3-1:遍历电力数据拓扑网中各电力数据所对应的类别标记,提取在电力数据拓扑网中相应的第一数据端点和第二数据端点所对应的类别标记不同的电力数据拓扑节点,设为特征节点;分别将第一数据端点所对应的类别标记相同的特征节点进行汇集,得到若干特征节点集合;其中,在一个特征节点集合中,各特征节点的第一数据端点所属的管理数据类别相同;
步骤S3-2:设在所有特征节点的第一数据端点均所属于某管理数据类别的特征节点集合中,累计特征节点的总数为K,累计在K个特征节点的第二数据端点中出现的类别标记的种类数为N,累计从电力数据拓扑网中提取得到的特征节点的总数为M,累计在电力数据库中管理数据类别的总数为Q;计算属于所述某管理数据类别的电力数据在电力数据库中的特征检索指数β=K/M+N/Q。
4.根据权利要求3所述的一种基于电力大数据的多数据整合运用一体化方法,其特征在于,所述步骤S4包括:
步骤S4-1:获取各管理数据类别的电力数据在电力数据库中的特征检索指数,将相应特征检索指数大于指数阈值的管理数据类别设为特征类别;若在某特征类别f的特征节点集合中,第二数据端点所属类别为管理数据类别h的特征节点总数为S,满足S/G≥α,判断所述管理数据类别h为某特征类别f的一个关联检索类别;
步骤S4-2:对S个第二数据端点所属类别为管理数据类别h的特征节点的区别特征信息集合进行汇集,得到集合W,分别对集合W内各特征信息计算重复指数δ=c/E,其中,c表示在集合W中,包含所述各特征信息的区别特征信息集合的总个数,E表示在集合W中所汇集的区别特征信息集合的总个数;将汇集重复指数δ大于重复指数阈值的所有特征信息得到的集合,设为在建立某特征类别f与管理数据类别h之间的递进检索关联关系时所依据的特征信息范围;
步骤S4-3:分别获取各特征类别的关联检索类别,获取在建立各特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围。
5.根据权利要求4所述的一种基于电力大数据的多数据整合运用一体化方法,其特征在于,所述步骤S5包括:
步骤S5-1:将从用户输入的检索信息中提取得到的特征信息集设为目标信息集,实时将所述目标信息集与电力数据拓扑网中各电力数据的特征信息集进行匹配;
步骤S5-2:当所述目标信息集与电力数据拓扑网中某电力数据的特征信息集之间呈现的匹配相似度大于相似度阈值时,获取所述某电力数据所对应的类别标记,若所述某电力数据所属类别为某特征类别,提取所述某特征类别的关联检索类别;
步骤S5-3:从在建立某特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围中,随机选取若干特征信息生成检索式,向用户进行推送。
6.用于执行权利要求1-5中任意一项所述的一种基于电力大数据的多数据整合运用一体化方法的多数据整合运用一体化系统,其特征在于,所述系统包括电力数据库存储管理模块、电力数据拓扑网梳理模块、电力数据特征检索管理模块、电力数据检索信息管理模块、检索提示管理模块;
所述电力数据库存储管理模块,用于每间隔单位周期采集在电厂运营过程中产生的所有电力数据,获取按照预设的电力数据管理规则将各电力数据所分属对应的管理数据类别,并将作对应类别标记后的各电力数据存储进电力数据库;
所述电力数据拓扑网梳理模块,用于对存储进电力数据库的所有电力数据梳理特征信息分布,根据在不同电力数据对应的特征信息之间存在的包含分布情况,构建电力数据拓扑节点,梳理电力数据库的电力数据拓扑网;
所述电力数据特征检索管理模块,用于在电力数据拓扑网中,对在所有电力数据拓扑节点中所呈现的类别标记变化情况进行分析,分别计算各管理数据类别的电力数据在电力数据库中的特征检索指数;
所述电力数据检索信息管理模块,用于根据各管理数据类别的电力数据在电力数据库中对应的特征检索指数,筛选出特征类别,根据涉及各特征类别的数据拓扑节点的分布情况,对各特征类别的关联检索类别进行识别判断,并获取在建立各特征类别与相应各关联检索类别之间的递进检索关联关系时所依据的特征信息范围;
所述检索提示管理模块,用于引入语言模型,对访问电力数据库的用户采集输入的检索信息,实时对从用户输入的检索信息中提取得到的特征信息进行监测,为用户提供智能化的检索提示。
7.根据权利要求6所述的多数据整合运用一体化系统,其特征在于,所述电力数据拓扑网梳理模块包括电力数据拓扑节点构建单元、电力数据拓扑网梳理单元;
所述电力数据拓扑节点构建单元,用于对存储进电力数据库的所有电力数据梳理特征信息分布,根据在不同电力数据对应的特征信息之间存在的包含分布情况,构建电力数据拓扑节点;
所述电力数据拓扑网梳理单元,用于接受所述电力数据拓扑节点构建单元中的数据,对电力数据库进行电力数据拓扑网的梳理和构建。
8.根据权利要求6所述的多数据整合运用一体化系统,其特征在于,所述电力数据特征检索管理模块包括电力数据拓扑节点信息管理单元、特征检索指数计算单元;
所述电力数据拓扑节点信息管理单元,用于在电力数据拓扑网中,对在所有电力数据拓扑节点中所呈现的类别标记变化情况进行分析;
所述特征检索指数计算单元,用于分别计算各管理数据类别的电力数据在电力数据库中的特征检索指数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311674232.0A CN117591539B (zh) | 2023-12-07 | 2023-12-07 | 一种基于电力大数据的多数据整合运用一体化系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311674232.0A CN117591539B (zh) | 2023-12-07 | 2023-12-07 | 一种基于电力大数据的多数据整合运用一体化系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117591539A true CN117591539A (zh) | 2024-02-23 |
CN117591539B CN117591539B (zh) | 2024-05-14 |
Family
ID=89911415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311674232.0A Active CN117591539B (zh) | 2023-12-07 | 2023-12-07 | 一种基于电力大数据的多数据整合运用一体化系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117591539B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7701877B1 (en) * | 2006-09-28 | 2010-04-20 | Emc Corporation | Methods and apparatus for representing and querying storage area network (SAN) topology |
CN111177405A (zh) * | 2019-12-18 | 2020-05-19 | 深圳壹账通智能科技有限公司 | 数据搜索匹配方法、装置、计算机设备和存储介质 |
CN111970345A (zh) * | 2020-08-05 | 2020-11-20 | 韶关市志通达信息科技有限公司 | 一种基于物联网的大数据信息处理方法及系统 |
CN112084385A (zh) * | 2020-09-03 | 2020-12-15 | 江西农业大学 | 一种基于数字孪生的零件-工艺-设备关联关系拓扑视图生成方法 |
EP3952211A1 (en) * | 2020-08-06 | 2022-02-09 | Nokia Solutions and Networks Oy | Network topology |
WO2022100233A1 (zh) * | 2020-11-12 | 2022-05-19 | 全球能源互联网研究院有限公司 | 一种基于图数据库的电网检索方法及系统 |
CN115375084A (zh) * | 2022-07-08 | 2022-11-22 | 国网江苏省电力有限公司徐州供电分公司 | 一种基于电力数据的图数据库构建方法及系统 |
CN116956130A (zh) * | 2023-07-25 | 2023-10-27 | 北京安联通科技有限公司 | 一种基于关联特征梳理模型的智能化数据处理方法及系统 |
CN117112630A (zh) * | 2023-09-15 | 2023-11-24 | 国网江苏省电力有限公司信息通信分公司 | 电网数据的拓扑结构生成方法、装置、设备及存储介质 |
-
2023
- 2023-12-07 CN CN202311674232.0A patent/CN117591539B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7701877B1 (en) * | 2006-09-28 | 2010-04-20 | Emc Corporation | Methods and apparatus for representing and querying storage area network (SAN) topology |
CN111177405A (zh) * | 2019-12-18 | 2020-05-19 | 深圳壹账通智能科技有限公司 | 数据搜索匹配方法、装置、计算机设备和存储介质 |
CN111970345A (zh) * | 2020-08-05 | 2020-11-20 | 韶关市志通达信息科技有限公司 | 一种基于物联网的大数据信息处理方法及系统 |
EP3952211A1 (en) * | 2020-08-06 | 2022-02-09 | Nokia Solutions and Networks Oy | Network topology |
CN112084385A (zh) * | 2020-09-03 | 2020-12-15 | 江西农业大学 | 一种基于数字孪生的零件-工艺-设备关联关系拓扑视图生成方法 |
WO2022100233A1 (zh) * | 2020-11-12 | 2022-05-19 | 全球能源互联网研究院有限公司 | 一种基于图数据库的电网检索方法及系统 |
CN115375084A (zh) * | 2022-07-08 | 2022-11-22 | 国网江苏省电力有限公司徐州供电分公司 | 一种基于电力数据的图数据库构建方法及系统 |
CN116956130A (zh) * | 2023-07-25 | 2023-10-27 | 北京安联通科技有限公司 | 一种基于关联特征梳理模型的智能化数据处理方法及系统 |
CN117112630A (zh) * | 2023-09-15 | 2023-11-24 | 国网江苏省电力有限公司信息通信分公司 | 电网数据的拓扑结构生成方法、装置、设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
吴琪,谢秋华等: "某巨型电站计算机监控系统报警事件梳理与优化", 水电站机电技术, vol. 46, no. 1, 15 January 2023 (2023-01-15) * |
周竞涛;杨海成;王明微;赵寒;张树生;莫蓉;: "面向对等网络知识集成网络的检索方法", 计算机集成制造系统, no. 03, 15 March 2011 (2011-03-15) * |
杜红军;李巍;张文杰;于海;: "基于云计算技术的电力大数据分布式检索系统", 电网与清洁能源, no. 09, 25 September 2018 (2018-09-25) * |
赵玉聪;钟志农;景宁;吴烨;: "多维实体关联信息综合处理平台", 计算机应用, no. 1, 10 June 2016 (2016-06-10) * |
Also Published As
Publication number | Publication date |
---|---|
CN117591539B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108417033B (zh) | 基于多维因素的高速路交通事故分析预测方法 | |
CN106447346A (zh) | 一种智能电力客服系统的构建方法及系统 | |
CN111090643B (zh) | 一种基于数据分析系统下的海量用电数据挖掘方法 | |
CN112580831B (zh) | 一种基于知识图谱的电力通信网智能辅助运维方法及系统 | |
CN111552813A (zh) | 一种基于电网全业务数据的电力知识图谱构建方法 | |
CN112487033A (zh) | 一种面向数据流及构建网络拓扑的业务可视化方法及系统 | |
CN115794803B (zh) | 一种基于大数据ai技术的工程审计问题监测方法与系统 | |
CN115271369A (zh) | 一种基于知识图谱的装备信息管理方法、系统及存储介质 | |
CN115438199A (zh) | 一种基于智慧城市场景数据中台技术的知识平台系统 | |
CN112100402A (zh) | 一种电网知识图谱构建方法及装置 | |
CN110287237B (zh) | 一种基于社会网络结构分析社团数据挖掘方法 | |
CN114117065A (zh) | 基于电力生产统计业务的知识图谱构建方法及系统 | |
CN117591539B (zh) | 一种基于电力大数据的多数据整合运用一体化系统及方法 | |
CN103365960A (zh) | 电力多级调度管理结构化数据的离线搜索方法 | |
CN111292201A (zh) | 一种基于Apriori和RETE的电力通信网现场运维信息推送的方法 | |
CN115017251B (zh) | 一种用于智慧城市的标准映射地图建立方法及系统 | |
CN115983582A (zh) | 一种数据分析方法和能耗管理系统 | |
CN113538011B (zh) | 一种电力系统中非在册联系信息与在册用户的关联方法 | |
CN110298585B (zh) | 一种变电站设备监控信息分层分级自动审核方法 | |
CN109976271B (zh) | 一种利用信息表征方法计算信息结构有序度的方法 | |
JPH08106408A (ja) | 運用情報アクセスログ収集管理システム及び運用情報アクセスログ収集管理方法 | |
CN112101798A (zh) | 一种基于大数据技术的电力设备寿命管理方法 | |
CN112329432A (zh) | 一种基于改进Apriori的配电网电压越限问题关联分析方法 | |
CN111428756A (zh) | 基于时间序列信息熵的规划数据融合实时态方法及装置 | |
CN111724028A (zh) | 一种基于大数据技术的机器设备运行分析与挖掘系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |