CN115080669B - 全防误信息点表生成方法、装置、设备及存储介质 - Google Patents
全防误信息点表生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115080669B CN115080669B CN202210532869.5A CN202210532869A CN115080669B CN 115080669 B CN115080669 B CN 115080669B CN 202210532869 A CN202210532869 A CN 202210532869A CN 115080669 B CN115080669 B CN 115080669B
- Authority
- CN
- China
- Prior art keywords
- data
- equipment
- point table
- analyzed
- full
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理领域,公开了一种全防误信息点表生成方法、装置、设备及存储介质,该方法包括:获取变电站中各设备的多维异构数据,并进行内容转换,生成设备多维数据集合;识别并标注多维数据集合中各数据的有效数据,得到待分析数据集并进行实体抽取,得到对应的设备三元组,并基于设备三元组从待分析数据集中提取设备数据,基于设备数据建立多种数据子模型;根据预设的知识库和各类数据子模型进行点表建模,生成全防误信息点表。本方法通过多维异构数据分析以及预设的知识库,从变电站数据中自动标注、提取有价值的数据,用于抽取设备三元组,自动生成全防误信息点表,无需要人工录入数据,保证防误数据的准确性。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种全防误信息点表生成方法、装置、设备及存储介质。
背景技术
电力系统的运行可靠性是电力生产运行功能实现的基础和最重要的技术指标之一,由变电站内的误操作及系统的异常运行可能导致重大事故的发生,造成人员、电网、设备的损失。二次防误点表作为二次防误的基础数据,其数据的正确性直接影响变电站二次防误操作闭锁的可靠性。但是,目前点表的制作方式为调试员对照现场照片,在Excel中手工逐字录入,由于二次点表的数据量大、专业性强,导致制作点表的工作量大、错误率高,进而增加了全防误工程实施难度,影响了防误功能的准确性。
发明内容
本发明的主要目的在于解决现有的全防误信息点表通过人工录入导致制作点表的错误率高的技术问题。
本发明第一方面提供了一种全防误信息点表生成方法,包括:获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对所述多维异构数据进行数据内容转换,建立设备多维数据集合;
利用预设的数据标注模型,识别所述设备多维数据集合中各数据的有效数据,并进行标注,得到待分析数据集;
对所述待分析数据集进行设备实体抽取,得到对应的设备三元组,并基于所述设备三元组从所述待分析数据集中提取设备数据,基于所述设备数据的分类建立各类数据子模型;
根据预设的知识库和各类所述数据子模型进行点表建模,得到点表建模数据,并基于所述点表建模数据生成全防误信息点表。
可选的,在本发明第一方面的第一种实现方式中,所述获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对所述多维异构数据进行数据内容转换,建立设备多维数据集合包括:
获取所述变电站内的变电站文档以及获取所述变电站自动化系统的设备信息;
基于所述变电站文档结构和级别信息对所述变电站文档进行节点划分,建立所述变电站文档的节点表,所述节点表包括所述变电站文档的多个层级、多个节点;
从所述变电站文档中读取各所述节点对应的文档内容,将所述文档内容作为多维异构数据进行数据内容转换,得到二维数据表;
根据数据源、数据格式、数据关系将各所述二维数据表进行关联,建立设备多维数据集合。
可选的,在本发明第一方面的第二种实现方式中,所述获取所述变电站自动化系统的设备信息包括:
获取所述变电站自动化系统的四遥信息以及变电站能力模型SCD文件;
将所述四遥信息中的遥信信息、遥控信息和软压板信息作为设备信息存储于表格数据表的行;
将变电站能力模型SCD文件按模型节点编号,存储于文本数据表的行。
可选的,在本发明第一方面的第三种实现方式中,所述文档内容包含文本内容、表格内容和图片内容中的一种或多种,所述二维数据表为关系数据库中文本数据表、表格数据表和图片数据表中的一种或多种;
所述从所述变电站文档读取中各所述节点对应的文档内容,将所述文档内容作为多维异构数据进行数据内容转换,得到二维数据表包括:
读取所述变电站文档中各所述节点对应的文档内容;
若所述文档内容中包含文本内容,则将所述文本内容所在节点的节点编号作为关系数据库的主键,将所述文本内容作为字符串数据,得到对应的文本数据表的行,得到对应的文本数据表;
若所述文档内容中包含表格内容,则获取所述表格内容中的列头和行头,并将所述表格内容所在节点的节点编号和序号作为所述关系数据库的主键,将所述列头和所述行头作为所述表格数据表的行,得到对应的表格数据表;
若文档内容中包含图片内容,则根据对所述图片内容进行光学字符识别,得到所述图片内容中的字符串,并将所述图片内容所在节点的节点编号作为关系数据库的主键,将所述字符串作为图片数据表的行信息,得到对应的图片数据表。可选的,在本发明第一方面的第四种实现方式中,所述利用预设的数据标注模型,识别所述设备多维数据集合中各数据的有效数据,并进行标注,得到待分析数据集包括:
获取所述数据标注模型,并将所述数据标注模型格式化为SQL查询条件;
遍历所述设备多维数据集合中的数据,依次判断所述设备多维数据集合中的数据是否满足所述SQL查询条件;
将所述满足查询条件的数据识别为有效数据并进行标注,并将所有标注的数据进行汇总,得到待分析数据集。
可选的,在本发明第一方面的第五种实现方式中,所述对所述待分析数据集进行设备实体抽取,得到对应的设备三元组,并基于所述设备三元组从所述待分析数据集中提取设备数据,基于所述设备数据的分类建立各类数据子模型包括:
对所述待分析数据集中的待分析数据进行规范化处理;
根据预设的知识库和拓扑算法,对规范化处理后的待分析数据进行智能分析,得到所述待分析数据集对应的设备三元组,其中,所述设备三元组包含设备属性;
基于所述设备三元组中的设备属性,对待分析数据集进行设备分类,并基于设备分类的结果从所述待分析数据集中提取设备数据,基于所述设备数据和对应的分类结果建立各类数据子模型。
可选的,在本发明第一方面的第六种实现方式中,所述根据预设的知识库和拓扑算法,对规范化处理后的待分析数据进行智能分析,得到所述待分析数据集对应的设备三元组包括:
对规范化处理后的待分析数据进行智能分析,从所述待分析数据中抽取出设备实体;
根据所述知识库和所述拓扑算法,计算所述待分析数据中的设备属性和设备关系;
根据所述设备实体、所述设备属性和所述设备关系生成对应的设备三元组。可选的,在本发明第一方面的第七种实现方式中,所述基于所述设备三元组中的设备属性,对待分析数据集进行设备分类,并基于设备分类的结果从所述待分析数据集中提取设备数据,基于所述设备数据和对应的分类结果建立各类数据子模型包括:
根据所述设备三元组中的设备实体的实体名称和所述设备关系中的实体关系,对所述待分析数据集进行聚类,去除所述待分析数据集中的冗余数据;
将所述设备属性中的设备类别作为特征向量,基于所述特征向量对去除冗余数据后的待分析数据集中的待分析数据进行设备分类,得到设备分类结果;
基于设备分类的结果从所述待分析数据集中提取设备数据,并基于所述设备数据和对应的分类结果建立各设备类别对应的数据子模型。
可选的,在本发明第一方面的第八种实现方式中,所述全防误信息点表包括装置表,所述数据子模型包括装置子模型;
所述根据预设的知识库和各类所述数据子模型进行点表建模,得到点表建模数据,并基于所述点表建模数据生成全防误信息点表包括:
读取各类所述数据子模型的二次设备数据,以及所述设备三元组中的设备关系的关联装置ID,并对所述关联装置ID进行分组计算,得到待建模的装置ID集合;
将所述装置ID集合与所述装置子模型的装置ID进行匹配,并根据匹配结果提取装置子模型信息,得到待建模装置对象集合;
根据所述待建模装置对象集合以及知识库中的建模规则,构建装置表。可选的,在本发明第一方面的第九种实现方式中,所述全防误信息点表还包括压板空开信号表;
所述根据预设的知识库和各类所述数据子模型进行点表建模,得到点表建模数据,并基于所述点表建模数据生成全防误信息点表还包括:
根据所述二次设备数据生成对应的二次设备数据对象集合;
根据所述二次设备数据对象集合中的二次设备关联装置名称,以及知识库中的过滤规则,过滤所述待分析数据集中的脏数据;
根据过滤脏数据后的二次设备数据对象集合,以及知识库中的建模规则,构建压板空开信号表。
可选的,在本发明第一方面的第十种实现方式中,在所述根据预设的建模算法和所述数据子模型进行点表建模,生成全防误信息点表之后,还包括:
将所述全防误信息点表发送至预设的ui页面进行展示;
获取用户针对展示在所述ui页面上的全防误信息点表的功能选项;
基于所述功能选项对所述全防误信息点表中的数据进行对应的数据操作。
可选的,在本发明第一方面的第十一种实现方式中,在所述基于所述功能选项对所述全防误信息点表中的数据进行对应的数据操作之后,还包括:
获取所述用户输入的点表格式;
将所述全防误信息点表转换为所述点表格式并存储在本地缓存空间。
本发明第二方面提供了一种全防误信息点表生成装置,包括:
获取模块,用于获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对所述多维异构数据进行数据内容转换,建立设备多维数据集合;
标注模块,用于利用预设的数据标注模型,识别所述设备多维数据集合中各数据的有效数据,并进行标注,得到待分析数据集;
实体抽取模块,用于对所述待分析数据集进行设备实体抽取,得到对应的设备三元组,并基于所述设备三元组从所述待分析数据集中提取设备数据,基于所述设备数据的分类建立各类数据子模型;
点表建模模块,用于根据预设的知识库和各类所述数据子模型进行点表建模,得到点表建模数据,并基于所述点表建模数据生成全防误信息点表。
可选的,在本发明第二方面的第一种实现方式中,所述获取模块具体包括:
文档获取单元,用于获取所述变电站内的变电站文档以及获取所述变电站自动化系统的设备信息;
节点划分单元,用于基于所述变电站文档结构和级别信息对所述变电站文档进行节点划分,建立所述变电站文档的节点表,所述节点表包括所述变电站文档的多个层级、多个节点;
数据读取单元,用于从所述变电站文档读取中各所述节点对应的文档内容,将所述文档内容作为多维异构数据进行数据内容转换,得到二维数据表;
关联单元,用于根据数据源、数据格式、数据关系将各所述二维数据表进行关联,建立设备多维数据集合。
可选的,在本发明第二方面的第二种实现方式中,所述文档获取单元具体用于:
获取所述变电站自动化系统的四遥信息以及变电站能力模型SCD文件;
将所述四遥信息中的遥信信息、遥控信息和软压板信息作为设备信息存储于表格数据表的行;
将变电站能力模型SCD文件按模型节点编号,存储于文本数据表的行。
可选的,在本发明第二方面的第三种实现方式中,所述文档内容包含文本内容、表格内容和图片内容中的一种或多种,所述二维数据表为关系数据库中文本数据表、表格数据表和图片数据表中的一种或多种;所述数据读取单元具体用于:
读取所述变电站文档中各所述节点对应的文档内容;
若所述文档内容中包含文本内容,则将所述文本内容所在节点的节点编号作为关系数据库的主键,将所述文本内容作为字符串数据,得到对应的文本数据表的行,得到对应的文本数据表;
若所述文档内容中包含表格内容,则获取所述表格内容中的列头和行头,并将所述表格内容所在节点的节点编号和序号作为所述关系数据库的主键,将所述列头和所述行头作为所述表格数据表的行,得到对应的表格数据表;
若文档内容中包含图片内容,则根据对所述图片内容进行光学字符识别,得到所述图片内容中的字符串,并将所述图片内容所在节点的节点编号作为关系数据库的主键,将所述字符串作为图片数据表的行信息,得到对应的图片数据表。
可选的,在本发明第二方面的第四种实现方式中,所述标注模块具体用于:
获取所述数据标注模型,并将所述数据标注模型格式化为SQL查询条件;
遍历所述设备多维数据集合中的数据,依次判断所述设备多维数据集合中的数据是否满足所述SQL查询条件;
将所述满足查询条件的数据识别为有效数据并进行标注,并将所有标注的数据进行汇总,得到待分析数据集。
可选的,在本发明第二方面的第五种实现方式中,所述实体抽取模块具体包括:
规范化单元,用于对所述待分析数据集中的待分析数据进行规范化处理;
分析单元,用于根据预设的知识库和拓扑算法,对规范化处理后的待分析数据进行智能分析,得到所述待分析数据集对应的设备三元组,其中,所述设备三元组包含设备属性;
抽取单元,用于基于所述设备三元组中的设备属性,对待分析数据集进行设备分类,并基于设备分类的结果从所述待分析数据集中提取设备数据,基于所述设备数据和对应的分类结果建立各类数据子模型。
可选的,在本发明第二方面的第六种实现方式中,所述分析单元具体用于:
对规范化处理后的待分析数据进行智能分析,从所述待分析数据中抽取出设备实体;
根据所述知识库和所述拓扑算法,计算所述待分析数据中的设备属性和设备关系;
根据所述设备实体、所述设备属性和所述设备关系生成对应的设备三元组。
可选的,在本发明第二方面的第七种实现方式中,所述抽取单元具体用于:
根据所述设备三元组中的设备实体的实体名称和所述设备关系中的实体关系,对所述待分析数据集进行聚类,去除所述待分析数据集中的冗余数据;
将所述设备属性中的设备类别作为特征向量,基于所述特征向量对去除冗余数据后的待分析数据集中的待分析数据进行设备分类,得到设备分类结果;
基于设备分类的结果从所述待分析数据集中提取设备数据,并基于所述设备数据和对应的分类结果建立各设备类别对应的数据子模型。
可选的,在本发明第二方面的第八种实现方式中,所述全防误信息点表包括装置表,所述数据子模型包括装置子模型;所述点表建模模块具体用于:
读取各类所述数据子模型的二次设备数据,以及所述设备三元组中的设备关系的关联装置ID,并对所述关联装置ID进行分组计算,得到待建模的装置ID集合;
将所述装置ID集合与所述装置子模型的装置ID进行匹配,并根据匹配结果提取装置子模型信息,得到待建模装置对象集合;
根据所述待建模装置对象集合以及知识库中的建模规则,构建装置表。
可选的,在本发明第二方面的第九种实现方式中,述全防误信息点表还包括压板空开信号表;所述点表建模模块具体还用于:
根据所述二次设备数据生成对应的二次设备数据对象集合;
根据所述二次设备数据对象集合中的二次设备关联装置名称,以及知识库中的过滤规则,过滤所述待分析数据集中的脏数据;
根据过滤脏数据后的二次设备数据对象集合,以及知识库中的建模规则,构建压板空开信号表。
可选的,在本发明第二方面的第十种实现方式中,所述全防误信息点表生成装置还包括数据操作模块,所述数据操作模块具体用于:
将所述全防误信息点表发送至预设的ui页面进行展示;
获取用户针对展示在所述ui页面上的全防误信息点表的功能选项;
基于所述功能选项对所述全防误信息点表中的数据进行对应的数据操作。
可选的,在本发明第二方面的第十一种实现方式中,所述全防误信息点表生成装置还包括本地缓存模块,所述本地缓存模块具体用于:
获取所述用户输入的点表格式;
将所述全防误信息点表转换为所述点表格式并存储在本地缓存空间。
本发明第三方面提供了一种全防误信息点表生成设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述全防误信息点表生成设备执行上述的全防误信息点表生成方法的各个步骤。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的全防误信息点表生成方法的各个步骤。
本发明的技术方案中,通过获取变电站中各设备的多维异构数据,并进行内容转换,生成设备多维数据集合;识别并标注多维数据集合中各数据的有效数据,得到待分析数据集并进行实体抽取,得到对应的设备三元组,并基于设备三元组从待分析数据集中提取设备数据,基于设备数据建立多种数据子模型;根据预设的知识库和各类数据子模型进行点表建模,生成全防误信息点表。本方法通过多维异构数据分析以及预设的知识库,从变电站数据中自动标注、提取有价值的数据,用于抽取设备三元组,自动生成全防误信息点表,无需要人工录入数据,保证防误功能的准确性。
附图说明
图1为本发明实施例中全防误信息点表生成方法的第一个实施例示意图;
图2为本发明实施例中全防误信息点表生成方法的第二个实施例示意图;
图3为本发明实施例中全防误信息点表生成方法的第三个实施例示意图;
图4为本发明实施例中全防误信息点表生成装置的一个实施例示意图;
图5为本发明实施例中全防误信息点表生成装置的另一个实施例示意图;
图6为本发明实施例中全防误信息点表生成设备的一个实施例示意图。
具体实施方式
本发明的主要目的在于解决现有的全防误信息点表通过人工录入导致制作点表的错误率高的技术问题。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中全防误信息点表生成方法的第一个实施例包括:
101、获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对多维异构数据进行数据内容转换,建立设备多维数据集合;
可以理解的是,本发明的执行主体可以为全防误信息点表生成装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在本实施例中,主要从变电站文档中获取各种设备的多维异构数据,其中,变电站文档从可以包括但不限于来自变电站运行规程、压板状态检查表、监控或调度转发表、SCD模型文件等多个数据源中的一种或多种,从多个不同的维度获取数据,并且上述变电站文档包括多种不同结构的文件格式,例如EXCEL、WORD或XML格式,通过将上述多维异构数据进行统一的格式转换,并汇总后即可得到二维数据表,并按变电站文档的级别、标题、源数据格式等一定的关联关系存储于关系型数据库,根据存储在关系数据库中的数据得到多维数据集合。
102、利用预设的数据标注模型,识别设备多维数据集合中各数据的有效数据,并进行标注,得到待分析数据集;
在本实施例中,预设的数据标注模型,在服务器导入多维数据集合后,自动读取数据标注模型并格式化为SQL查询条件,遍历多维数据集合中的多维数据是否满足SQL查询条件,对满足SQL查询条件的数据进行自动标注,并根据标注结果从关系数据库中提取数据集作为待分析数据集,包括但不局限于从压板检查表中提取压板数据集,从变电站运行规程中提取装置数据集和空开数据集、把手数据集,从调度转发表或遥信表中提取异常信号数据集,从SCD模型文件中提取软压板数据集等。
103、对待分析数据集进行设备实体抽取,得到对应的设备三元组,并基于设备三元组从待分析数据集中提取设备数据,基于设备数据的分类建立各类数据子模型;
在本实施例中,对待分析数据集中的字符串进行智能分析,得到文本中的设备实体,通过知识库和拓扑算法,计算设备属性和设备关系,将设备实体、设备属性和设备关系作为设备三元组,构建对应设备的数据子模型,其中设备实体主要包括设备名称、编号等信息,设备属性包括设备类型、电压等级、双重化属性等,设备关系包括间隔与保护装置之前的关系、保护装置与设备之间的关系、一次设备与二次设备之间的关系等。
在本实施例中,通过实体抽取得到的设备三元组中包括设备属性,设备属性中包含不同的设备类别,基于不同的设备类别,可以从待分析数据集中提取对应设备类别的待分析数据,并根据不同设备类别的待分析数据构建对应的数据子模型,即可得到不同设备类别的数据子模型。
104、根据预设的知识库和各类数据子模型进行点表建模,得到点表建模数据,并基于点表建模数据生成全防误信息点表。
在本实施例中,使用知识库,按照二次防误业务对基础数据、防误逻辑的要求,构建一套自动建模算法存储在知识库中,然后,根据知识库的建模算法对各类数据子模型进行建模处理,自动完成全防误信息点表建模,得到全防误信息点表建模数据。
在本实施例中,将全防误信息点表建模数据输出到预设的UI界面,在UI界面上展示全防误信息点表,并支持增、删、改、查等数据操作,可将全防误信息点表以EXCEL格式导出到本地,供后续的数据校核、业务系统使用等。
在本实施例中,通过获取变电站中各设备的多维异构数据,并进行内容转换,生成设备多维数据集合;识别并标注多维数据集合中各数据的有效数据,得到待分析数据集并进行实体抽取,得到对应的设备三元组,并基于设备三元组从待分析数据集中提取设备数据,基于设备数据建立多种数据子模型;根据预设的知识库和各类数据子模型进行点表建模,生成全防误信息点表。本方法通过多维异构数据分析以及预设的知识库,从变电站数据中自动标注、提取有价值的数据,用于抽取设备三元组,自动生成全防误信息点表,无需要人工录入数据,保证防误功能的准确性。
请参阅图2,本发明实施例中全防误信息点表生成方法的第二个实施例包括:
201、获取变电站内的变电站文档以及获取变电站自动化系统的设备信息;
在本实施例中,导入的变电站文档,包括但不局限于变电站运行规程、压板检查表、遥信表、SCD文档,文档格式包括但不局限于EXCEL、WORD、XML、CSV格式,文档内容包括但不局限于文本、表格、图片,其中导入变电站文档时,根据变电站文档中的级别信息,建立文件层级的节点表,然后根据节点表,读取各个节点下的内容,其中,所述级别信息为变电站文档中的标题等级,以变电站文档为变电站运行规程为例,变电站运行规程的文件格式为WORD格式,其中包括:“第一章变电站运行规程”“第二章主要电气设备参数及运行维护内容”等,在每一章中,包含第一节、第二节等,每一节中包含第一条、第二条等,通过章、节、条构建变电站文档的层级关系。
在本实施例中,所述获取所述变电站自动化系统的设备信息主要通过获取所述变电站自动化系统的四遥信息以及变电站能力模型SCD文件;将所述四遥信息中的遥信信息、遥控信息和软压板信息作为设备信息存储于表格数据表的行;将变电站能力模型SCD文件按模型节点编号,存储于文本数据表的行。
202、基于变电站文档结构和级别信息对变电站文档进行节点划分,建立变电站文档的节点表,节点表包括变电站文档的多个层级、多个节点;
203、从变电站文档中读取各节点对应的文档内容,将文档内容作为多维异构数据进行数据内容转换,得到二维数据表;
204、根据数据源、数据格式、数据关系将各二维数据表进行关联,建立设备多维数据集合;
在本实施例中,所述文档内容包含文本内容、表格内容和图片内容中的一种或多种,所述二维数据表为关系数据库中文本数据表、表格数据表和图片数据表中的一种或多种,具体的,从所述变电站文档中读取各所述节点对应的文档内容,将所述文档内容作为多维异构数据进行数据内容转换,得到二维数据表主要通过读取所述变电站文档中各所述节点对应的文档内容;若所述文档内容中包含文本内容,则将所述文本内容所在节点的节点编号作为关系数据库的主键,将所述文本内容作为字符串数据,得到对应的文本数据表的行,得到对应的文本数据表;若所述文档内容中包含表格内容,则获取所述表格内容中的列头和行头,并将所述表格内容所在节点的节点编号和序号作为所述关系数据库的主键,将所述列头和所述行头作为所述表格数据表的行,得到对应的表格数据表;若文档内容中包含图片内容,则根据对所述图片内容进行光学字符识别,得到所述图片内容中的字符串,并将所述图片内容所在节点的节点编号作为关系数据库的主键,将所述字符串作为图片数据表的行信息,得到对应的图片数据表。
205、获取数据标注模型,并将数据标注模型格式化为SQL查询条件;
206、遍历设备多维数据集合中的数据,依次判断设备多维数据集合中的数据是否满足SQL查询条件;
207、将满足查询条件的数据识别为有效数据并进行标注,并将所有标注的数据进行汇总,得到待分析数据集;
在本实施例中,根据业务需要设计一套数据标注模型,程序读取模型并格式化为SQL查询条件,在数据库中对满足查询条件的数据进行自动标注;然后,根据标注结果从数据库中提取待分析数据集。包括但不局限于从压板检查表中提取压板数据集,从变电站运行规程中提取装置数据集和空开数据集、把手数据集,从调度转发表或遥信表中提取异常信号数据集,从SCD模型文件中提取软压板数据集等。
208、对待分析数据集进行设备实体抽取,得到对应的设备三元组,并基于设备三元组从待分析数据集中提取设备数据,基于设备数据的分类建立各类数据子模型;
209、根据预设的知识库和各类数据子模型进行点表建模,得到点表建模数据,并基于点表建模数据生成全防误信息点表。
本实施例在上一实施例的基础上,详细描述了获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对所述多维异构数据进行数据内容转换,建立设备多维数据集合的过程,通过获取所述变电站内的变电站文档以及获取所述变电站自动化系统的设备信息;基于所述变电站文档结构和级别信息对所述变电站文档进行节点划分,建立所述变电站文档的节点表,所述节点表包括所述变电站文档的多个层级、多个节点;从所述变电站文档中读取各所述节点对应的文档内容,将所述文档内容作为多维异构数据进行数据内容转换,得到二维数据表;根据数据源、数据格式、数据关系将各所述二维数据表进行关联,建立设备多维数据集合。本方法通过多维异构数据分析以及预设的知识库,从变电站数据中自动标注、提取有价值的数据,用于抽取设备三元组,自动生成全防误信息点表,无需要人工录入数据,保证防误功能的准确性。
请参阅图3,本发明实施例中全防误信息点表生成方法的第三个实施例包括:
301、获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对多维异构数据进行数据内容转换,建立设备多维数据集合;
302、利用预设的数据标注模型,识别设备多维数据集合中各数据的有效数据,并进行标注,得到待分析数据集;
303、对待分析数据集中的待分析数据进行规范化处理;
304、对规范化处理后的待分析数据进行智能分析,从待分析数据中抽取出设备实体;
305、根据知识库和拓扑算法,计算待分析数据中的设备属性和设备关系;
306、根据设备实体、设备属性和设备关系生成对应的设备三元组;
307、根据设备三元组中的设备实体的实体名称和设备关系中的实体关系,对待分析数据集进行聚类,去除待分析数据集中的冗余数据;
308、将设备属性中的设备类别作为特征向量,基于特征向量对去除冗余数据后的待分析数据集中的待分析数据进行设备分类,得到设备分类结果;
309、基于设备分类的结果从待分析数据集中提取设备数据,并基于设备数据和对应的分类结果建立各设备类别对应的数据子模型;
在本实施例中,从压板数据集中抽取出压板实体信息,包括编号、名称、初始状态的值,然后对压板数据进行分析,抽取出压板的关系属性,形成压板数据子模型;从装置数据集中抽取出保护装置实体信息,包括间隔、屏柜、保护装置的值,然后对装置数据进行分析,抽取出装置的关系属性,形成装置子模型,装置数据包括:编号、压板空开信号名称、功能类型、二次设备属性、关联一次设备、装置名称、行位置子模型;从空开数据集中抽取空气开关的实体信息,包括编号、设备名称、功能类型、初始状态的值,然后对空开数据进行分析,抽取出空开的关系属性,包括关联一次设备、所属保护装置等,形成空开数据子模型;从把手数据集中抽取选择开关的实体信息,包括编号、设备名称、功能类型、初始状态的值,然后对把手数据进行分析,抽取出把手的关系属性,包括关联一次设备、所属保护装置等,形成把手数据子模型;从异常信号数据集中抽取信号的实体信息,包括名称、功能类型等值,然后对信号数据进行分析,抽取出信号的关系属性,包括所属保护装置等,形成异常信号子模型。
310、根据预设的知识库和各类数据子模型进行点表建模,得到点表建模数据,并基于点表建模数据生成全防误信息点表;
在本实施例中,全防误信息点表包括装置表和压板空开信号表,其中,装置表通过读取各类所述数据子模型的二次设备数据,以及所述设备三元组中的设备关系的关联装置ID,并对所述关联装置ID进行分组计算,得到待建模的装置ID集合;将所述装置ID集合与所述装置子模型的装置ID进行匹配,并根据匹配结果提取装置子模型信息,得到待建模装置对象集合;根据所述待建模装置对象集合以及知识库中的建模规则,构建装置表,其中,所述装置表包含厂站、保护小室、间隔、屏名称、装置名称、装置类型、电压等级、双重化属性等字段值。压板空开信号表通过根据所述二次设备数据生成对应的二次设备数据对象集合;根据所述二次设备数据对象集合中的二次设备关联装置名称,以及知识库中的过滤规则,过滤所述待分析数据集中的脏数据;根据过滤脏数据后的二次设备数据对象集合,以及知识库中的建模规则,构建压板空开信号表,其中,所述压板空开信号表包含编号、压板空开信号名称、功能类型、二次设备属性、关联一次设备、装置名称、行位置、列位置、常投标志等字段值。
具体的,在生成压板空开信号表的过程中,在形成二次设备数据表的过程中,包括去除脏数据:对于全防误业务不需要的数据以及无保护装置关联关系的数据,程序判断为脏数据进行清除。
311、将全防误信息点表发送至预设的ui页面进行展示;
312、获取用户针对展示在ui页面上的全防误信息点表的功能选项;
313、基于功能选项对全防误信息点表中的数据进行对应的数据操作;
314、获取用户输入的点表格式;
315、将全防误信息点表转换为点表格式并存储在本地缓存空间。
在本实施例中,服务器支持增、删、改、查等数据操作,通过在界面上人工进行对应的功能选项选择,根据不同的功能选项对全防误信息点表数据进行对应的数据操作,并通过人工确认并进一步完善数据后,将全防误信息点表以EXCEL格式导出到本地,供后续的数据校核、业务系统使用等。
本实施例在前实施例的基础上,详细描述了对所述待分析数据集进行设备实体抽取,得到对应的设备三元组,并基于所述设备三元组从所述待分析数据集中提取设备数据,基于所述设备数据的分类建立各类数据子模型的过程,通过对所述待分析数据集中的待分析数据进行规范化处理;根据预设的知识库和拓扑算法,对规范化处理后的待分析数据进行智能分析,得到所述待分析数据集对应的设备三元组,其中,所述设备三元组包含设备属性;基于所述设备三元组中的设备属性,对待分析数据集进行设备分类,并基于设备分类的结果从所述待分析数据集中提取设备数据,基于所述设备数据和对应的分类结果建立各类数据子模型。本方法通过多维异构数据分析以及预设的知识库,从变电站数据中自动标注、提取有价值的数据,用于抽取设备三元组,自动生成全防误信息点表,无需要人工录入数据,保证防误功能的准确性。
上面对本发明实施例中全防误信息点表生成方法进行了描述,下面对本发明实施例中全防误信息点表生成装置进行描述,请参阅图4,本发明实施例中全防误信息点表生成装置一个实施例包括:
获取模块401,用于获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对所述多维异构数据进行数据内容转换,建立设备多维数据集合;
标注模块402,用于利用预设的数据标注模型,识别所述设备多维数据集合中各数据的有效数据,并进行标注,得到待分析数据集;
实体抽取模块403,用于对所述待分析数据集进行设备实体抽取,得到对应的设备三元组,并基于所述设备三元组从所述待分析数据集中提取设备数据,基于所述设备数据的分类建立各类数据子模型;
点表建模模块404,用于根据预设的知识库和各类所述数据子模型进行点表建模,得到点表建模数据,并基于所述点表建模数据生成全防误信息点表。
本发明实施例中,所述全防误信息点表生成装置运行上述全防误信息点表生成方法,所述全防误信息点表生成装置通过获取变电站中各设备的多维异构数据,并进行内容转换,生成设备多维数据集合;识别并标注多维数据集合中各数据的有效数据,得到待分析数据集并进行实体抽取,得到对应的设备三元组,并基于设备三元组从待分析数据集中提取设备数据,基于设备数据建立多种数据子模型;根据预设的知识库和各类数据子模型进行点表建模,生成全防误信息点表。本方法通过多维异构数据分析以及预设的知识库,从变电站数据中自动标注、提取有价值的数据,用于抽取设备三元组,自动生成全防误信息点表,无需要人工录入数据,保证防误功能的准确性。
请参阅图5,本发明实施例中全防误信息点表生成装置的第二个实施例包括:
获取模块401,用于获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对所述多维异构数据进行数据内容转换,建立设备多维数据集合;
标注模块402,用于利用预设的数据标注模型,识别所述设备多维数据集合中各数据的有效数据,并进行标注,得到待分析数据集;
实体抽取模块403,用于对所述待分析数据集进行设备实体抽取,得到对应的设备三元组,并基于所述设备三元组从所述待分析数据集中提取设备数据,基于所述设备数据的分类建立各类数据子模型;
点表建模模块404,用于根据预设的知识库和各类所述数据子模型进行点表建模,得到点表建模数据,并基于所述点表建模数据生成全防误信息点表。
可选的,在本发明第二方面的第一种实现方式中,所述获取模块401具体包括:
文档获取单元4011,用于获取所述变电站内的变电站文档以及获取所述变电站自动化系统的设备信息;
节点划分单元4012,用于基于所述变电站文档结构和级别信息对所述变电站文档进行节点划分,建立所述变电站文档的节点表,所述节点表包括所述变电站文档的多个层级、多个节点;
数据读取单元4013,用于从所述变电站文档读取中各所述节点对应的文档内容,将所述文档内容作为多维异构数据进行数据内容转换,得到二维数据表;
关联单元4014,用于根据数据源、数据格式、数据关系将各所述二维数据表进行关联,建立设备多维数据集合。
可选的,所述文档获取单元4011具体用于:
获取所述变电站自动化系统的四遥信息以及变电站能力模型SCD文件;
将所述四遥信息中的遥信信息、遥控信息和软压板信息作为设备信息存储于表格数据表的行;
将变电站能力模型SCD文件按模型节点编号,存储于文本数据表的行。
可选的,所述文档内容包含文本内容、表格内容和图片内容中的一种或多种,所述二维数据表为关系数据库中文本数据表、表格数据表和图片数据表中的一种或多种;所述数据读取单元4013具体用于:
读取所述变电站文档中各所述节点对应的文档内容;
若所述文档内容中包含文本内容,则将所述文本内容所在节点的节点编号作为关系数据库的主键,将所述文本内容作为字符串数据,得到对应的文本数据表的行,得到对应的文本数据表;
若所述文档内容中包含表格内容,则获取所述表格内容中的列头和行头,并将所述表格内容所在节点的节点编号和序号作为所述关系数据库的主键,将所述列头和所述行头作为所述表格数据表的行,得到对应的表格数据表;
若文档内容中包含图片内容,则根据对所述图片内容进行光学字符识别,得到所述图片内容中的字符串,并将所述图片内容所在节点的节点编号作为关系数据库的主键,将所述字符串作为图片数据表的行信息,得到对应的图片数据表。
可选的,所述标注模块402具体用于:
获取所述数据标注模型,并将所述数据标注模型格式化为SQL查询条件;
遍历所述设备多维数据集合中的数据,依次判断所述设备多维数据集合中的数据是否满足所述SQL查询条件;
将所述满足查询条件的数据识别为有效数据并进行标注,并将所有标注的数据进行汇总,得到待分析数据集。
可选的,所述实体抽取模块403具体包括:
规范化单元4031,用于对所述待分析数据集中的待分析数据进行规范化处理;
分析单元4032,用于根据预设的知识库和拓扑算法,对规范化处理后的待分析数据进行智能分析,得到所述待分析数据集对应的设备三元组,其中,所述设备三元组包含设备属性;
抽取单元4033,用于基于所述设备三元组中的设备属性,对待分析数据集进行设备分类,并基于设备分类的结果从所述待分析数据集中提取设备数据,基于所述设备数据和对应的分类结果建立各类数据子模型。
可选的,所述分析单元4032具体用于:
对规范化处理后的待分析数据进行智能分析,从所述待分析数据中抽取出设备实体;
根据所述知识库和所述拓扑算法,计算所述待分析数据中的设备属性和设备关系;
根据所述设备实体、所述设备属性和所述设备关系生成对应的设备三元组。
可选的,所述抽取单元4033具体用于:
根据所述设备三元组中的设备实体的实体名称和所述设备关系中的实体关系,对所述待分析数据集进行聚类,去除所述待分析数据集中的冗余数据;
将所述设备属性中的设备类别作为特征向量,基于所述特征向量对去除冗余数据后的待分析数据集中的待分析数据进行设备分类,得到设备分类结果;
基于设备分类的结果从所述待分析数据集中提取设备数据,并基于所述设备数据和对应的分类结果建立各设备类别对应的数据子模型。
可选的,所述全防误信息点表包括装置表,所述数据子模型包括装置子模型;所述点表建模模块404具体用于:
读取各类所述数据子模型的二次设备数据,以及所述设备三元组中的设备关系的关联装置ID,并对所述关联装置ID进行分组计算,得到待建模的装置ID集合;
将所述装置ID集合与所述装置子模型的装置ID进行匹配,并根据匹配结果提取装置子模型信息,得到待建模装置对象集合;
根据所述待建模装置对象集合以及知识库中的建模规则,构建装置表。
可选的,述全防误信息点表还包括压板空开信号表;所述点表建模模块404具体还用于:
根据所述二次设备数据生成对应的二次设备数据对象集合;
根据所述二次设备数据对象集合中的二次设备关联装置名称,以及知识库中的过滤规则,过滤所述待分析数据集中的脏数据;
根据过滤脏数据后的二次设备数据对象集合,以及知识库中的建模规则,构建压板空开信号表。
可选的,在本发明第二方面的第九种实现方式中,所述全防误信息点表生成装置还包括数据操作模块405,所述数据操作模块405具体用于:
将所述全防误信息点表发送至预设的ui页面进行展示;
获取用户针对展示在所述ui页面上的全防误信息点表的功能选项;
基于所述功能选项对所述全防误信息点表中的数据进行对应的数据操作。
可选的,在本发明第二方面的第十种实现方式中,所述全防误信息点表生成装置还包括本地缓存模块406,所述本地缓存模块406具体用于:
获取所述用户输入的点表格式;
将所述全防误信息点表转换为所述点表格式并存储在本地缓存空间。
本实施例在上一实施例的基础上,详细描述了各个模块的具体功能,通过全防误信息点表生成装置上的各个模块进行多维异构数据分析以及预设的知识库,从变电站数据中自动标注、提取有价值的数据,用于抽取设备三元组,自动生成全防误信息点表,无需要人工录入数据,保证防误功能的准确性。
上面图4和图5从模块化功能实体的角度对本发明实施例中的中全防误信息点表生成装置进行详细描述,下面从硬件处理的角度对本发明实施例中全防误信息点表生成设备进行详细描述。
图6是本发明实施例提供的一种全防误信息点表生成设备的结构示意图,该全防误信息点表生成设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)610(例如,一个或一个以上处理器)和存储器620,一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对全防误信息点表生成设备600中的一系列指令操作。更进一步地,处理器610可以设置为与存储介质630通信,在全防误信息点表生成设备600上执行存储介质630中的一系列指令操作,以实现上述全防误信息点表生成方法的步骤。
全防误信息点表生成设备600还可以包括一个或一个以上电源640,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口660,和/或,一个或一个以上操作系统631,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的全防误信息点表生成设备结构并不构成对本申请提供的全防误信息点表生成设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述全防误信息点表生成方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统或装置、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (14)
1.一种全防误信息点表生成方法,其特征在于,所述全防误信息点表生成方法包括:
获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对所述多维异构数据进行数据内容转换,建立设备多维数据集合;
利用预设的数据标注模型,识别所述设备多维数据集合中各数据的有效数据,并进行标注,得到待分析数据集;
对所述待分析数据集中的待分析数据进行规范化处理;
根据预设的知识库和拓扑算法,对规范化处理后的待分析数据进行智能分析,得到所述待分析数据集对应的设备三元组,其中,所述设备三元组包含设备属性;
基于所述设备三元组中的设备属性,对待分析数据集进行设备分类,并基于设备分类的结果从所述待分析数据集中提取设备数据,基于所述设备数据和对应的分类结果建立各类数据子模型;
根据预设的知识库和各类所述数据子模型进行点表建模,得到点表建模数据,并基于所述点表建模数据生成全防误信息点表。
2.根据权利要求1所述的全防误信息点表生成方法,其特征在于,所述获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对所述多维异构数据进行数据内容转换,建立设备多维数据集合包括:
获取所述变电站内的变电站文档以及获取所述变电站自动化系统的设备信息;
基于所述变电站文档结构和级别信息对所述变电站文档进行节点划分,建立所述变电站文档的节点表,所述节点表包括所述变电站文档的多个层级、多个节点;
从所述变电站文档中读取各所述节点对应的文档内容,将所述文档内容作为多维异构数据进行数据内容转换,得到二维数据表;
根据数据源、数据格式、数据关系将各所述二维数据表进行关联,建立设备多维数据集合。
3.根据权利要求2所述的全防误信息点表生成方法,其特征在于,所述获取所述变电站自动化系统的设备信息包括:
获取所述变电站自动化系统的四遥信息以及变电站能力模型SCD文件;
将所述四遥信息中的遥信信息、遥控信息和软压板信息作为设备信息存储于表格数据表的行;
将变电站能力模型SCD文件按模型节点编号,存储于文本数据表的行。
4.根据权利要求2所述的全防误信息点表生成方法,其特征在于,所述文档内容包含文本内容、表格内容和图片内容中的一种或多种,所述二维数据表为关系数据库中文本数据表、表格数据表和图片数据表中的一种或多种;
所述从所述变电站文档中读取各所述节点对应的文档内容,将所述文档内容作为多维异构数据进行数据内容转换,得到二维数据表包括:
读取所述变电站文档中各所述节点对应的文档内容;
若所述文档内容中包含文本内容,则将所述文本内容所在节点的节点编号作为关系数据库的主键,将所述文本内容作为字符串数据,得到对应的文本数据表的行,得到对应的文本数据表;
若所述文档内容中包含表格内容,则获取所述表格内容中的列头和行头,并将所述表格内容所在节点的节点编号和序号作为所述关系数据库的主键,将所述列头和所述行头作为所述表格数据表的行,得到对应的表格数据表;
若文档内容中包含图片内容,则根据对所述图片内容进行光学字符识别,得到所述图片内容中的字符串,并将所述图片内容所在节点的节点编号作为关系数据库的主键,将所述字符串作为图片数据表的行信息,得到对应的图片数据表。
5.根据权利要求1所述的全防误信息点表生成方法,其特征在于,所述利用预设的数据标注模型,识别所述设备多维数据集合中各数据的有效数据,并进行标注,得到待分析数据集包括:
获取所述数据标注模型,并将所述数据标注模型格式化为SQL查询条件;
遍历所述设备多维数据集合中的数据,依次判断所述设备多维数据集合中的数据是否满足所述SQL查询条件;
将满足所述SQL查询条件的数据识别为有效数据并进行标注,并将所有标注的数据进行汇总,得到待分析数据集。
6.根据权利要求1所述的全防误信息点表生成方法,其特征在于,所述根据预设的知识库和拓扑算法,对规范化处理后的待分析数据进行智能分析,得到所述待分析数据集对应的设备三元组包括:
对规范化处理后的待分析数据进行智能分析,从所述待分析数据中抽取出设备实体;
根据所述知识库和所述拓扑算法,计算所述待分析数据中的设备属性和设备关系;
根据所述设备实体、所述设备属性和所述设备关系生成对应的设备三元组。
7.根据权利要求6所述的全防误信息点表生成方法,其特征在于,所述基于所述设备三元组中的设备属性,对待分析数据集进行设备分类,并基于设备分类的结果从所述待分析数据集中提取设备数据,基于所述设备数据和对应的分类结果建立各类数据子模型包括:
根据所述设备三元组中的设备实体的实体名称和所述设备关系中的实体关系,对所述待分析数据集进行聚类,去除所述待分析数据集中的冗余数据;
将所述设备属性中的设备类别作为特征向量,基于所述特征向量对去除冗余数据后的待分析数据集中的待分析数据进行设备分类,得到设备分类结果;
基于设备分类的结果从所述待分析数据集中提取设备数据,并基于所述设备数据和对应的分类结果建立各设备类别对应的数据子模型。
8.根据权利要求1所述的全防误信息点表生成方法,其特征在于,所述全防误信息点表包括装置表,所述数据子模型包括装置子模型;
所述根据预设的知识库和各类所述数据子模型进行点表建模,得到点表建模数据,并基于所述点表建模数据生成全防误信息点表包括:
读取各类所述数据子模型的二次设备数据,以及所述设备三元组中的设备关系的关联装置ID,并对所述关联装置ID进行分组计算,得到待建模的装置ID集合;
将所述装置ID集合与所述装置子模型的装置ID进行匹配,并根据匹配结果提取装置子模型信息,得到待建模装置对象集合;
根据所述待建模装置对象集合以及知识库中的建模规则,构建装置表。
9.根据权利要求8所述的全防误信息点表生成方法,其特征在于,所述全防误信息点表还包括压板空开信号表;
所述根据预设的知识库和各类所述数据子模型进行点表建模,得到点表建模数据,并基于所述点表建模数据生成全防误信息点表还包括:
根据所述二次设备数据生成对应的二次设备数据对象集合;
根据所述二次设备数据对象集合中的二次设备关联装置名称,以及知识库中的过滤规则,过滤所述待分析数据集中的脏数据;
根据过滤脏数据后的二次设备数据对象集合,以及知识库中的建模规则,构建压板空开信号表。
10.根据权利要求1-9中任一项所述的全防误信息点表生成方法,其特征在于,在所述根据预设的建模算法和所述数据子模型进行点表建模,生成全防误信息点表之后,还包括:
将所述全防误信息点表发送至预设的ui页面进行展示;
获取用户针对展示在所述ui页面上的全防误信息点表的功能选项;
基于所述功能选项对所述全防误信息点表中的数据进行对应的数据操作。
11.根据权利要求10所述的全防误信息点表生成方法,其特征在于,在所述基于所述功能选项对所述全防误信息点表中的数据进行对应的数据操作之后,还包括:
获取所述用户输入的点表格式;
将所述全防误信息点表转换为所述点表格式并存储在本地缓存空间。
12.一种全防误信息点表生成装置,其特征在于,所述全防误信息点表生成装置包括:
获取模块,用于获取变电站中各数据源的设备多维异构数据,针对不同的数据源分别对所述多维异构数据进行数据内容转换,建立设备多维数据集合;
标注模块,用于利用预设的数据标注模型,识别所述设备多维数据集合中各数据的有效数据,并进行标注,得到待分析数据集;
实体抽取模块,用于对所述待分析数据集中的待分析数据进行规范化处理;根据预设的知识库和拓扑算法,对规范化处理后的待分析数据进行智能分析,得到所述待分析数据集对应的设备三元组,其中,所述设备三元组包含设备属性;基于所述设备三元组中的设备属性,对待分析数据集进行设备分类,并基于设备分类的结果从所述待分析数据集中提取设备数据,基于所述设备数据和对应的分类结果建立各类数据子模型;
点表建模模块,用于根据预设的知识库和各类所述数据子模型进行点表建模,得到点表建模数据,并基于所述点表建模数据生成全防误信息点表。
13.一种全防误信息点表生成设备,其特征在于,所述全防误信息点表生成设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述全防误信息点表生成设备执行如权利要求1-11中任一项所述的全防误信息点表生成方法的各个步骤。
14.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-11中任一项所述的全防误信息点表生成方法的各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210532869.5A CN115080669B (zh) | 2022-05-11 | 2022-05-11 | 全防误信息点表生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210532869.5A CN115080669B (zh) | 2022-05-11 | 2022-05-11 | 全防误信息点表生成方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115080669A CN115080669A (zh) | 2022-09-20 |
CN115080669B true CN115080669B (zh) | 2023-05-05 |
Family
ID=83246502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210532869.5A Active CN115080669B (zh) | 2022-05-11 | 2022-05-11 | 全防误信息点表生成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115080669B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105468605A (zh) * | 2014-08-25 | 2016-04-06 | 济南中林信息科技有限公司 | 一种实体信息图谱生成方法及装置 |
CN106447346A (zh) * | 2016-08-29 | 2017-02-22 | 北京中电普华信息技术有限公司 | 一种智能电力客服系统的构建方法及系统 |
CN112860908A (zh) * | 2021-01-27 | 2021-05-28 | 云南电网有限责任公司电力科学研究院 | 基于多源异构电力设备数据的知识图谱自动化构建方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912567A (zh) * | 2016-03-25 | 2016-08-31 | 北京用尚科技股份有限公司 | 一种电力设备监控信息点表自动生成方法 |
CN105955159A (zh) * | 2016-05-05 | 2016-09-21 | 国电南瑞科技股份有限公司 | 一种基于防误规则源端维护的调控操作防误校验方法 |
CN107798435B (zh) * | 2017-11-09 | 2021-08-31 | 贵州电网有限责任公司 | 一种基于文本信息抽取的电力物资需求预测方法 |
CN113991843A (zh) * | 2021-10-21 | 2022-01-28 | 广东电网有限责任公司 | 一种电网调度操作的防误方法、系统、设备和介质 |
CN114298339A (zh) * | 2021-12-20 | 2022-04-08 | 国网湖南省电力有限公司 | 一种变电站设备告警智能决策方法及系统 |
CN114282010A (zh) * | 2021-12-30 | 2022-04-05 | 国网电力科学研究院有限公司 | 基于知识图谱的电网运行故障识别方法、系统及存储介质 |
-
2022
- 2022-05-11 CN CN202210532869.5A patent/CN115080669B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105468605A (zh) * | 2014-08-25 | 2016-04-06 | 济南中林信息科技有限公司 | 一种实体信息图谱生成方法及装置 |
CN106447346A (zh) * | 2016-08-29 | 2017-02-22 | 北京中电普华信息技术有限公司 | 一种智能电力客服系统的构建方法及系统 |
CN112860908A (zh) * | 2021-01-27 | 2021-05-28 | 云南电网有限责任公司电力科学研究院 | 基于多源异构电力设备数据的知识图谱自动化构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115080669A (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105843878B (zh) | 一种it系统事件标准化实现方法 | |
CN108712294A (zh) | 一种基于Syslog知识库实现网络设备监控告警的方法 | |
CN101945009A (zh) | 基于案例和模式匹配的电力通信网故障定位方法及装置 | |
CN104573024B (zh) | 一种复杂网络体系下异构安全日志信息的自适应提取方法及系统 | |
CN108446396B (zh) | 一种基于改进型cim模型的电力数据处理方法 | |
CN104182911A (zh) | 一种实现配电网系统cim模型一致性的校验方法 | |
EP4155974A1 (en) | Knowledge graph construction method and apparatus, check method and storage medium | |
CN115858796A (zh) | 一种故障知识图谱构建方法及装置 | |
CN112672370B (zh) | 网元指标数据的自动检测方法及系统、设备和存储介质 | |
CN116467468B (zh) | 基于知识图谱技术的电力管理系统异常信息处置方法 | |
CN112905642B (zh) | 基于csv映射文件将iec61850报告数据存入关系数据库的方法 | |
CN115080669B (zh) | 全防误信息点表生成方法、装置、设备及存储介质 | |
CN113608903A (zh) | 一种基于xml语言的故障管理方法 | |
CN111340253B (zh) | 一种主网检修申请单的解析方法及系统 | |
CN103390035A (zh) | 一种基于正则表达式的智能告警信号类型匹配方法 | |
CN103383649A (zh) | 一种复杂虚拟仪器系统设计模型 | |
CN105512270A (zh) | 一种确定相关对象的方法和装置 | |
CN114662279A (zh) | 基于二次设备大数据平台的继电保护信息建模方法及系统 | |
CN109785099B (zh) | 一种自动对业务数据信息进行处理的方法及系统 | |
CN111444254B (zh) | 一种skl系统文件格式转换方法和系统 | |
CN113779178A (zh) | 基于知识图谱的数据存储方法和装置 | |
CN111143622A (zh) | 基于大数据平台的故障数据集构建方法 | |
CN111198879A (zh) | 基于智慧社区的业务数据存储方法及系统 | |
CN111723549B (zh) | 省间和省内电力市场的模型嵌套与信息交互方法、系统及设备 | |
JP2015156103A (ja) | M2mにおける電文変換システム及び電文変換方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |