CN111223004A - 一种面向业务应用的继电保护知识建模方法及平台 - Google Patents
一种面向业务应用的继电保护知识建模方法及平台 Download PDFInfo
- Publication number
- CN111223004A CN111223004A CN201911111178.2A CN201911111178A CN111223004A CN 111223004 A CN111223004 A CN 111223004A CN 201911111178 A CN201911111178 A CN 201911111178A CN 111223004 A CN111223004 A CN 111223004A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- module
- deconstruction
- relay protection
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 239000000463 material Substances 0.000 claims abstract description 30
- 230000008676 import Effects 0.000 claims abstract description 28
- 238000004806 packaging method and process Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 20
- 239000002131 composite material Substances 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 15
- 230000004927 fusion Effects 0.000 claims description 14
- 230000003993 interaction Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000005538 encapsulation Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 5
- 238000003058 natural language processing Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
- G06F16/212—Schema design and management with details for data modelling support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Water Supply & Treatment (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种面向业务应用的继电保护知识建模方法及平台,该平台包括知识标记模块、知识解构模块、属性匹配模块、知识封装模块、图数据库、应用程序管理器、数据导入/出接口、应用程序调用接口,主要根据提供的继电保护知识素材,通过知识标记、知识解构、属性匹配、知识结构封装实现知识建模。本发明可以利用业务应用需求采用知识图谱和图数据库对建模知识进行信息管理。同时,平台各应用模块具备统一接口供外部调用,数据库信息可灵活导出。
Description
技术领域
本发明涉及电力系统继电保护领域,具体是一种面向业务应用的继电保护知识建模方法及平台。
背景技术
电力系统继电保护领域涉及大量的专业技术知识,涵盖电力系统分析、微机原理、数字/模拟电路、可靠性统计分析、信息通信等多个基础领域。随着人工智能应用的快速发展,在电力系统继电保护各类业务场景中知识信息化将成为智能应用的基础。除此之外,电力系统继电保护培训、研究和开发工作也正在使用信息化的专业知识提升质效。
目前,知识图谱是一种比较通用的语义知识的形式化描述框架,它用节点表示语义符号,用边表示符号之间的语义关系,在实现上,就是在数据库系统上利用图谱这种抽象载体表示知识这种认知内容。知识图谱技术广泛应用于人工智能应用,其生命周期一般包括知识体系构建、知识获取、知识融合、知识存储、知识推理和知识应用。针对电力系统继电保护的知识图谱技术应用,有必要考虑专业应用需求,简化复杂技术知识内容解构难度,增加在知识应用类型、设备全寿命周期和系统运行部位等方面多维度的应用特征,便于工作任务直接使用。
发明内容
本发明所要解决的技术问题是通过提供一种面向业务应用的继电保护知识建模方法及平台,根据业务应用需求采用知识图谱和图数据库对建模知识进行信息管理;同时,平台各应用模块具备统一接口供外部调用,数据库信息可灵活导出。
本发明采用的技术方案如下:
一种面向业务应用的继电保护知识建模平台,其特征在于:包括知识标记模块、知识解构模块、属性匹配模块、知识封装模块、图数据库、应用程序管理器、数据导入/出接口、应用程序调用接口;
所述知识标记模块,用于完成获取继电保护知识素材,并通过多元层次融合实现知识结构辨识并标记相应信息;
所述知识解构模块,用于根据标记后的知识内容,通过面向业务应用的复合维度解构,完成符合知识图谱的概念、关系和属性信息提取及体系构建;
所述属性匹配模块,用于根据标记后的解构信息,根据构建的体系,将属性与概念和关系信息进行匹配,形成完整的知识单元结构;
所述知识封装模块,按照构建的体系,将匹配好的知识单元分层分类封装为综合知识模型;
所述图数据库模块,完成知识模型及实例化信息管理,并根据数据导入/出接口需求保存导入数据、生成指定格式的导出数据;
所述应用程序管理器,用于与各应用模块进行信息交互,统一协调计算分析资源,与应用程序调用接口配合完成外部应用调用任务;
所述数据导入/出接口,用于与图数据库模块进行信息交互,完成数据导入校验和生成指定格式数据的导出;
所述应用程序调用接口,用于与应用程序管理器进行信息交互,按照双方约定好的服务规则,向外部需求方提供指定的应用服务。
一种面向业务应用的继电保护知识建模方法,其特征在于应用上述建模平台进行分析构建,所述方法包括如下步骤:
步骤一、所述数据导入/出接口获取继电保护知识素材并进行文件格式与内容的初步校验,通过校验后保存至图数据库模块;
步骤二、所述知识标记模块调取保存至图数据库模块的继电保护知识素材,完成多元层次融合知识结构辨识并标记相应信息保存至图数据库模块;
步骤三、所述知识解构模块调取保存至图数据库模块的带标记的继电保护知识素材,通过面向业务应用的复合维度解构,完成符合知识图谱的概念、关系和属性信息提取及体系构建,并将相应数据保存至图数据库模块;
步骤四、所述属性匹配模块调取保存至图数据库模块保存的解构后的继电保护知识概念、属性和关系,并参照构建的知识体系完成属性与概念和关系的匹配及关系和概念的匹配;
步骤五、所述知识封装模块调取保存至图数据库模块的知识解构和属性匹配数据,自动完成继电保护知识建模封装,形成包含节点、属性及其关系的综合知识体。
进一步的,还包括步骤六、所述图数据库模块保存的综合知识体可进行可视化展示和交互管理。
进一步的,还包括步骤七、所述数据导入/出接口可根据外部需求将保存于图数据库模块的知识标记、解构、封装信息按照规定格式进行导出。
进一步的,还包括步骤八、所述应用程序调用接口利用应用程序管理器完成外部应用对平台可提供服务的直接调用和数据交互。
进一步的,所述步骤二中中生成知识标记包括如下步骤:
步骤S301、由所述知识标记模块调取保存至图数据库模块的继电保护知识素材;
步骤S302、由所述知识标记模块人工选择辨识模式选择,典型模式为串行和并行两种;
步骤S303、若选择串行模式,则需设置辨识因素状态序列,典型的辨识因素包括:素材获取来源(如超链接、本地导入、手动输入等)、文件属性(主要依据后缀名判断)、内容形式(书籍、论文、标准等);
步骤S304、若选择并行模式,则需选择辨识结果判定机制,典型机制为多结果一票否决和多数票有效,其中多结果一票否决又可进一步选择任意项否决和指定项否决,多数票有效又可进一步选择正向即肯定类判定和反向即否定类判定;
步骤S305、所述知识标记模块根据选择的辨识模式及其设置完成内容结构辨识,并生成辨识结果,典型的结构类型包括:结构化数据、非结构化数据和半结构化数据;
步骤S306、所述知识标记模块提示人工进行结果判定,若接受辨识结果,则进入步骤S308,若不接受辨识结果,则进入步骤S307;
步骤S307、若人工判定不接受自动辨识结果,则进一步选择是否结束标记,选择“是”,则直接进入步骤S308,选择“否”,则转至步骤S302重新开始标记流程;
步骤S308、知识标记模块判定生成标记结束,将相关结果信息保存至图数据库模块。
进一步的,所述步骤三中已标记知识的信息内容解构包括如下步骤:
步骤S401、所述知识解构模块调取保存至图数据库模块的带标记继电保护知识内容;
步骤S402、所述知识解构模块按照标记信息完成知识结构化分类;
步骤S403、对于非结构化知识内容,所述知识解构模块首先进行预处理操作,主要利用自然语言处理工具完成文本分词、句法分析、命名实体识别等任务;
步骤S404、对于完成预处理操作的非结构化知识内容,所述知识解构模块完成领域概念抽取,也称为知识图谱节点提取;
步骤S405、所述知识解构模块完成非结构化知识内容的知识体系构建,也称为知识体图谱结构;
步骤S406、根据节点提取情况和构建的知识体系,所述知识解构模块完成属性及关系提取;
步骤S407、对于结构化知识内容,所述知识解构模块首先完成数据库表单识别;
步骤S408、所述知识解构模块根据数据库表单识别信息,完成节点、关系、属性提取及知识体图谱结构的构建;
步骤S409、对于半结构化知识内容,所述知识解构模块首先根据内容格式模板(如XML、HTML、已发布的知识词典)完成文档结构解析;
步骤S410、所述知识解构模块102首先根据文档结构解析结果,将内容转换为结构化文档形式;
步骤S411、所述知识解构模块102利用结构化文档处理步骤,完成节点、关系、属性提取及知识体图谱结构的构建,方法类似非结构体化知识内容的处理;
步骤S412、所述知识解构模块针对提取好的信息和构建的图谱结构,完成面向业务应用的多维度继电保护知识分类融合,主要包括和继电保护业务相关的知识应用类型、继电保护系统运行部位和设备全寿命周期等维度,完成节点、关系和属性的维度分析,包括单一维度模式、复合维度模式和异构维度驱动模式;
步骤S413、所述知识解构模块确认知识内容信息解构完成后,将相应数据保存至图数据库模块。
本发明的有益效果如下:
本发明可实现对电力系统继电保护知识的结构化辨识、处理和构建整体信息模型,经过多元层次融合知识结构辨识和面向业务应用的复合维度解构,使得综合知识体不仅能够体现继电保护专业领域技术要素,同时,也使得对应的概念、属性和关系附带业务应用特征,可在多类型生产场景实际应用中发挥直接辅助决策或现场指导作用。本发明可广泛应用于电力系统继电保护领域知识模型构建,有效辅助继电保护知识库的建立,为人工智能业务应用提供标准有效的专业知识体。同时,本发明也可应用于电力系统继电保护培训、研究、开发中对于知识的信息化应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明面向业务应用的继电保护知识建模平台的结构示意图;
图2为本发明面向业务应用的继电保护知识建模方法的流程示意图;
图3为本发明继电保护知识多元层次化融合的结构辨识的流程示意图;
图4为本发明面向业务应用的继电保护知识复合维度解构流程示意图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述。
本发明提供的一种面向业务应用的继电保护知识建模平台的实施例,如图1所示。
所述继电保护知识平台包括:知识标记模块101、知识解构模块102、属性匹配模块103、知识封装模块104、图数据库105、应用程序管理器106、数据导入/出接口107、应用程序调用接口108;
所述知识标记模块101,用于完成获取继电保护知识素材,并通过多元层次融合实现知识结构辨识并标记相应信息,继电保护知识素材来源为网页超链接、本地导入文件及指定搜索引擎(如Google、百度、知网等)产生的搜索结果列表,多元层次融合可从素材来源、文件属性和内容格式形式等角度按照串行状态序列或并行同步判定获取知识结构类型(结构化、非结构化、半结构化);
所述知识解构模块102,用于根据标记后的知识内容,通过面向业务应用的复合维度解构,完成符合知识图谱的概念、关系和属性信息提取及体系构建,面向业务应用的复合维度解构主要是指给初步解构的节点、属性和关系赋予不同维度的业务特征,包括知识应用类型、继电保护系统运行部位和设备全寿命周期等维度,以及确定单一维度模式、复合维度模式和异构维度驱动模式下的特征关联;
所述属性匹配模块103,用于根据标记后的解构信息,根据构建的体系,将属性与概念和关系信息进行匹配,形成完整的知识单元结构;
所述知识封装模块(104),按照构建的体系,将匹配好的知识单元分层分类封装为综合知识模型,知识模型从实现上看就是一段具备节点、属性及其关联的符合XML格式的结构化文档;
所述图数据库模块(105),完成知识模型及实例化信息管理,并根据数据导入/出接口(107)需求保存导入数据、生成指定格式的导出数据,图数据库基于知识图谱技术,使用多关系图来表征数据对象的基本属性,利用关系图来存储数据对象,具备完整的ACID支持、高可用性、便于扩展节点和关系、通过遍历工具高速检索数据;
所述应用程序管理器(106),用于与各应用模块进行信息交互,统一协调计算分析资源,与应用程序调用接口(108)配合完成外部应用调用任务;
所述数据导入/出接口(107),用于与图数据库模块(105)进行信息交互,完成数据导入校验和生成指定格式数据的导出,其中本地数据导入一般为各类关系型数据库文件、平台规定的XML格式文件、HTML文件及其超链接、各类文档文件、各类图形和图片文件,数据导出主要以XML格式和.csv格式文件为主,写入的内容可根据需求进行选择,包括带标记的继电保护知识素材、继电保护知识解构信息及封装好的知识结构体;
所述应用程序调用接口(108),用于与应用程序管理器(106)进行信息交互,按照双方约定好的服务规则,向外部需求方提供指定的应用服务。
本发明提供的一种面向业务应用的继电保护知识建模方法的流程实施例,如图2所示,其应用上述测试分析系统进行测试,包括如下步骤:
步骤S201、平台通过所述数据导入/出接口107获取继电保护知识素材并进行文件格式与内容的初步校验,通过校验后保存至图数据库模块105,导入方式主要有三种:本地文件导入、网页超链接和搜索引擎的指定结果,本地文件导入时,接口会根据文件后缀名判断该文件格式是否满足知识建模素材要求,网页超链接和搜索引擎的指定结果导入时,接口会根据所关联的网页内容进行HTML规则校验,确认其是否满足知识建模素材要求;
步骤S202、所述知识标记模块101调取保存至图数据库模块105的继电保护知识素材,完成多元层次融合知识结构辨识并标记相应信息保存至图数据库模块105,知识标记可完成知识素材的结构化分类(结构化数据、非结构化数据和半结构化数据),多元层次融合辨识则可根据素材来源方式、文件属性和内容格式形式等角度按照串行状态序列或并行同步完成结构化判定;
步骤S203、所述知识解构模块102调取保存至图数据库模块105的带标记的继电保护知识素材,通过面向业务应用的复合维度解构,完成符合知识图谱的概念、关系和属性信息提取及体系构建,并将相应数据保存至图数据库模块105,业务应用的复合维度主要指知识素材的内容同时包含知识应用类型、继电保护系统运行部位和设备全寿命周期等维度的不同特征,解构则是指将知识节点、属性和关系按照不同维度进行解析,并确定单一维度模式、复合维度模式和异构维度驱动模式下的特征关联;
步骤S204、所述属性匹配模块103调取保存至图数据库模块104的解构后的继电保护知识概念(节点)、属性和关系,并参照构建的知识体系完成属性与概念和关系的匹配及关系和概念的匹配,使得概念具备属性和附属关系描述,关系具备属性及对应概念描述;
步骤S205、所述知识封装模块104调取保存至图数据库模块105的知识解构和属性匹配数据,自动完成继电保护知识建模封装,形成包含节点、属性及其关系的综合知识体。
另外,步骤S205之后,还可执行步骤S206,所述图数据库模块105保存的综合知识体进行可视化展示和交互管理,相应的展示和管理应用则需要另行开发,不属于在此方案描述内容。
此外,也可执行步骤S207,所述数据导入/出接口107可根据外部需求将保存于图数据库模块105的知识标记、解构、封装信息按照规定格式进行导出,主要以XML格式和.csv格式文件为主,写入的内容可根据需求进行选择,包括带标记的继电保护知识素材、继电保护知识解构信息及封装好的知识结构体。
此外,也可执行步骤S208,所述应用程序调用接口108利用应用程序管理器106完成外部应用对平台可提供服务的直接调用和数据交互。
一般的领域知识建模仍然使用单一的知识结构辨识模式和知识体构建方法,通常为基于预定规则或各类机器模式。本发明在此基础上,实现了面向继电保护专业领域的业务应用的复合维度知识建模,使得相应的知识体的概念、属性和关系具备多维度业务特点,同时,为进一步提升知识建模质效,采用了一种串并行兼容的知识素材结构化综合辨识方式,简化了知识解构难度。在本发明所述的知识建模过程中,知识标记(S202)和知识解构(S203)的实现尤为关键。
本发明提供的一种面向业务应用的继电保护知识建模方法的生成知识标记(即上述步骤S202)流程实施例,如图3所示,其应用上述知识建模平台完成,包括如下步骤:
步骤S301、由所述知识标记模块101调取保存至图数据库模块105的继电保护知识素材,素材导入时已经过数据导入/出接口107的校验,格式和内容符合建模基本条件;
步骤S302、由所述知识标记模块101人工完成辨识模式选择,典型模式为串行和并行两种,串行辨识指按照设定的判定条件(状态序列)依次完成辨识,上一判定条件的结果既作为下一判定状态的触发条件,也是其内容之一,并行辨识指按照设定的判定条件独立完成各状态的辨识,所获得结果按照一定的规则形成最终辨识结果;
步骤S303、若选择串行模式,则需设置辨识因素状态序列,典型的辨识因素包括:素材获取来源(如超链接、本地导入、手动输入等)、文件属性(主要依据后缀名判断)、内容形式(书籍、论文、标准等),状态序列可以是这些因素的任意顺序组合;
步骤S304、若选择并行模式,则需选择辨识结果判定机制,典型机制为多结果一票否决和多数票有效,其中多结果一票否决又可进一步选择任意项否决和指定项否决,一票否决即一个判定结果与其他结果不一致时,例如,当进行“是否为结构化数据”判定时,三种辨识结果中有一种(任意或指定)判定为“否”,则辨识结果为“不是结构化数据”,多数票有效又可进一步选择正向即肯定类判定和反向即否定类判定,正向即肯定即当超过一定比例(可设置)的辨识结果均肯定为某种类型时,则为某种类型,反向即否定即当超过一定比例(可设置)的辨识结果均否定为某种类型时,则不为某种类型;
步骤S305、所述知识标记模块根据选择的辨识模式及其设置完成内容结构辨识,并生成辨识结果,典型的结构类型包括:结构化数据、非结构化数据和半结构化数据;
步骤S306、所述知识标记模块提示人工进行结果判定,若接受辨识结果,则进入步骤S308,若不接受辨识结果,则进入步骤S307;
步骤S307、若人工判定不接受自动辨识结果,则进一步选择是否结束标记,选择“否”,则直接进入步骤S308,选择“是”,则转至步骤S302重新开始标记流程;
步骤S308、知识标记模块判定生成标记结束,将相关结果信息保存至图数据库模块。
本发明提供的一种面向业务应用的继电保护知识建模方法的知识解构(即上述步骤S203)流程实施例,如图4所示,其应用上述知识建模平台完成,包括如下步骤:
步骤S401、所述知识解构模块102调取保存至图数据库模块105的带标记继电保护知识内容,标记信息主要为经过辨识后的结构化类型(结构化、非结构化、半结构化);
步骤S402、所述知识解构模块102按照标记信息完成知识结构化分类,不同的结构化分类将调用知识解构模块102中不同的处理机制和程序;
步骤S403、对于非结构化知识内容,所述知识解构模块102首先进行预处理操作,主要利用自然语言处理工具完成文本分词、句法分析、命名实体识别等任务,一种典型的自然语言处理工具可采取二元形式逻辑、关键词类型和上下单词关系的组合方法完成此类预处理操作;
步骤S404、对于完成预处理操作的非结构化知识内容,所述知识解构模块102完成领域概念抽取,也称为知识图谱节点提取,领域概念通常指属于指定范畴的实体,通过文本形式识别时,一般有命名性指称、名词性指称和代词性指称,识别方法可利用规则或机器学习;
步骤S405、所述知识解构模块102完成非结构化知识内容的知识体系构建,也称为知识体图谱结构,具体可为一种分类体系,即将表示知识体的要素组织成层级结构的分类样式,可利用“自顶向下”或“自底向上”的方法实现;
步骤S406、根据节点提取情况和构建的知识体系,所述知识解构模块102完成属性及关系提取,其中属性提取指概念和关系的附属特征的自动识别,而关系提取指自动识别概念之间的语义联系,具体又可分为二元关系和多元关系提取,可采用的方式有基于模板和基于机器学习两种;
步骤S407、对于结构化知识内容,所述知识解构模块102首先完成数据库表单识别;
步骤S408、所述知识解构模块102根据数据库表单识别信息,完成节点、关系、属性提取及知识体图谱结构的构建,方法类似非结构体化知识内容的处理;
步骤S409、对于半结构化知识内容,所述知识解构模块102首先根据内容格式模板(如XML、HTML、已发布的知识词典)完成文档结构解析;
步骤S410、所述知识解构模块102首先根据文档结构解析结果,将内容转换为结构化文档形式;
步骤S411、所述知识解构模块102利用结构化文档处理步骤,完成节点、关系、属性提取及知识体图谱结构的构建,方法类似非结构体化知识内容的处理;
步骤S412、所述知识解构模块102针对提取好的信息和构建的图谱结构,完成面向业务应用的多维度继电保护知识分类融合,主要包括和继电保护业务相关的知识应用类型、继电保护系统运行部位和设备全寿命周期等维度,完成节点、关系和属性的维度分析,包括单一维度模式、复合维度模式和异构维度驱动模式;
步骤S413、所述知识解构模块102确认知识内容信息解构完成后,将相应数据保存至图数据库模块105。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (7)
1.一种面向业务应用的继电保护知识建模平台,其特征在于:包括知识标记模块(101)、知识解构模块(102)、属性匹配模块(103)、知识封装模块(104)、图数据库(105)、应用程序管理器(106)、数据导入/出接口(107)、应用程序调用接口(108);
所述知识标记模块(101),用于完成获取继电保护知识素材,并通过多元层次融合实现知识结构辨识并标记相应信息;
所述知识解构模块(102),用于根据标记后的知识内容,通过面向业务应用的复合维度解构,完成符合知识图谱的概念、关系和属性信息提取及体系构建;
所述属性匹配模块(103),用于根据标记后的解构信息,根据构建的体系,将属性与概念和关系信息进行匹配,形成完整的知识单元结构;
所述知识封装模块(104),按照构建的体系,将匹配好的知识单元分层分类封装为综合知识模型;
所述图数据库模块(105),完成知识模型及实例化信息管理,并根据数据导入/出接口(107)需求保存导入数据、生成指定格式的导出数据;
所述应用程序管理器(106),用于与各应用模块进行信息交互,统一协调计算分析资源,与应用程序调用接口(108)配合完成外部应用调用任务;
所述数据导入/出接口(107),用于与图数据库模块(105)进行信息交互,完成数据导入校验和生成指定格式数据的导出;
所述应用程序调用接口(108),用于与应用程序管理器(106)进行信息交互,按照双方约定好的服务规则,向外部需求方提供指定的应用服务。
2.一种面向业务应用的继电保护知识建模方法,其特征在于应用权利要求1所述的系统进行分析构建,所述方法包括如下步骤:
步骤一、所述数据导入/出接口(107)获取继电保护知识素材并进行文件格式与内容的初步校验,通过校验后保存至图数据库模块(105);
步骤二、所述知识标记模块(101)调取保存至图数据库模块(105)的继电保护知识素材,完成多元层次融合知识结构辨识并标记相应信息保存至图数据库模块(105);
步骤三、所述知识解构模块(102)调取保存至图数据库模块(105)的带标记的继电保护知识素材,通过面向业务应用的复合维度解构,完成符合知识图谱的概念、关系和属性信息提取及体系构建,并将相应数据保存至图数据库模块(105);
步骤四、所述属性匹配模块(103)调取保存至图数据库模块(105)保存的解构后的继电保护知识概念(节点)、属性和关系,并参照构建的知识体系完成属性与概念和关系的匹配及关系和概念的匹配;
步骤五、所述知识封装模块(104)调取保存至图数据库模块(105)的知识解构和属性匹配数据,自动完成继电保护知识建模封装,形成包含节点、属性及其关系的综合知识体。
3.如权利要求2所述的面向业务应用的继电保护知识建模方法,其特征在于:还包括步骤六、所述图数据库模块(105)保存的综合知识体进行可视化展示和交互管理。
4.如权利要求2所述的面向业务应用的继电保护知识建模方法,其特征在于:还包括步骤七、所述数据导入/出接口(107)根据外部需求将保存于图数据库模块(105)的知识标记、解构、封装信息按照规定格式进行导出。
5.如权利要求2所述的面向业务应用的继电保护知识建模方法,其特征在于:还包括步骤八、所述应用程序调用接口(108)利用应用程序管理器(106)完成外部应用对平台可提供服务的直接调用和数据交互。
6.如权利要求2所述的面向业务应用的继电保护知识建模方法,其特征在于:所述步骤二中生成知识标记具体包括如下步骤:
步骤S301、由所述知识标记模块(101)调取保存至图数据库模块(105)的继电保护知识素材;
步骤S302、由所述知识标记模块(101)人工选择辨识模式选择,典型模式为串行和并行两种;
步骤S303、若选择串行模式,则需设置辨识因素状态序列,典型的辨识因素包括:素材获取来源、文件属性、内容形式;
步骤S304、若选择并行模式,则需选择辨识结果判定机制,典型机制为多结果一票否决和多数票有效,其中多结果一票否决又可进一步选择任意项否决和指定项否决,多数票有效又可进一步选择正向即肯定类判定和反向即否定类判定;
步骤S305、所述知识标记模块(101)根据选择的辨识模式及其设置完成内容结构辨识,并生成辨识结果,典型的结构类型包括:结构化数据、非结构化数据和半结构化数据;
步骤S306、所述知识标记模块(101)提示人工进行结果判定,若接受辨识结果,则进入步骤S308,若不接受辨识结果,则进入步骤S307;
步骤S307、若人工判定不接受自动辨识结果,则进一步选择是否结束标记,选择“否”,则直接进入步骤S308,选择“是”,则转至步骤S302重新开始标记流程;
步骤S308、知识标记模块(101)判定生成标记结束,将相关结果信息保存至图数据库模块(105)。
7.如权利要求2所述的面向业务应用的继电保护知识建模方法,其特征在于:所述步骤三中已标记知识的信息内容解构包括如下步骤:
步骤S401、所述知识解构模块(102)调取保存至图数据库模块(105)的带标记继电保护知识内容;
步骤S402、所述知识解构模块(102)按照标记信息完成知识结构化分类;
步骤S403、对于非结构化知识内容,所述知识解构模块(102)首先进行预处理操作,主要利用自然语言处理工具完成文本分词、句法分析、命名实体识别等任务;
步骤S404、对于完成预处理操作的非结构化知识内容,所述知识解构模块(102)完成领域概念抽取,也称为知识图谱节点提取;
步骤S405、所述知识解构模块(102)完成非结构化知识内容的知识体系构建,也称为知识体图谱结构;
步骤S406、根据节点提取情况和构建的知识体系,所述知识解构模块(102)完成属性及关系提取;
步骤S407、对于结构化知识内容,所述知识解构模块(102)首先完成数据库表单识别;
步骤S408、所述知识解构模块(102)根据数据库表单识别信息,完成节点、关系、属性提取及知识体图谱结构的构建;
步骤S409、对于半结构化知识内容,所述知识解构模块(102)首先根据内容格式模板完成文档结构解析;
步骤S410、所述知识解构模块102首先根据文档结构解析结果,将内容转换为结构化文档形式;
步骤S411、所述知识解构模块102利用结构化文档处理步骤,完成节点、关系、属性提取及知识体图谱结构的构建,方法类似非结构体化知识内容的处理;
步骤S412、所述知识解构模块(102)针对提取好的信息和构建的图谱结构,完成面向业务应用的多维度继电保护知识分类融合,主要包括和继电保护业务相关的知识应用类型、继电保护系统运行部位和设备全寿命周期等维度,完成节点、关系和属性的维度分析,包括单一维度模式、复合维度模式和异构维度驱动模式;
步骤S413、所述知识解构模块(102)确认知识内容信息解构完成后,将相应数据保存至图数据库模块(105)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911111178.2A CN111223004A (zh) | 2019-11-14 | 2019-11-14 | 一种面向业务应用的继电保护知识建模方法及平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911111178.2A CN111223004A (zh) | 2019-11-14 | 2019-11-14 | 一种面向业务应用的继电保护知识建模方法及平台 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111223004A true CN111223004A (zh) | 2020-06-02 |
Family
ID=70827694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911111178.2A Pending CN111223004A (zh) | 2019-11-14 | 2019-11-14 | 一种面向业务应用的继电保护知识建模方法及平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111223004A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744846A (zh) * | 2013-08-13 | 2014-04-23 | 北京航空航天大学 | 一种多维度动态局部知识地图及其构建方法 |
WO2018040067A1 (zh) * | 2016-09-02 | 2018-03-08 | 浙江核新同花顺网络信息股份有限公司 | 用户指导系统及方法 |
CN108460136A (zh) * | 2018-03-08 | 2018-08-28 | 国网福建省电力有限公司 | 电力运维信息知识图谱构建方法 |
CN108520139A (zh) * | 2018-03-30 | 2018-09-11 | 北京理工大学 | 一种多维度工装设计知识组件构建方法 |
CN108595449A (zh) * | 2017-11-23 | 2018-09-28 | 北京科东电力控制系统有限责任公司 | 调度自动化系统知识图谱的构建与应用方法 |
CN109284394A (zh) * | 2018-09-12 | 2019-01-29 | 青岛大学 | 一种从多源数据集成视角构建企业知识图谱的方法 |
CN109299285A (zh) * | 2018-09-11 | 2019-02-01 | 中国医学科学院医学信息研究所 | 一种药物基因组学知识图谱构建方法及系统 |
CN110197280A (zh) * | 2019-05-20 | 2019-09-03 | 中国银行股份有限公司 | 一种知识图谱构建方法、装置及系统 |
CN110390023A (zh) * | 2019-07-02 | 2019-10-29 | 安徽继远软件有限公司 | 一种基于改进bert模型的知识图谱构建方法 |
-
2019
- 2019-11-14 CN CN201911111178.2A patent/CN111223004A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744846A (zh) * | 2013-08-13 | 2014-04-23 | 北京航空航天大学 | 一种多维度动态局部知识地图及其构建方法 |
WO2018040067A1 (zh) * | 2016-09-02 | 2018-03-08 | 浙江核新同花顺网络信息股份有限公司 | 用户指导系统及方法 |
CN108595449A (zh) * | 2017-11-23 | 2018-09-28 | 北京科东电力控制系统有限责任公司 | 调度自动化系统知识图谱的构建与应用方法 |
CN108460136A (zh) * | 2018-03-08 | 2018-08-28 | 国网福建省电力有限公司 | 电力运维信息知识图谱构建方法 |
CN108520139A (zh) * | 2018-03-30 | 2018-09-11 | 北京理工大学 | 一种多维度工装设计知识组件构建方法 |
CN109299285A (zh) * | 2018-09-11 | 2019-02-01 | 中国医学科学院医学信息研究所 | 一种药物基因组学知识图谱构建方法及系统 |
CN109284394A (zh) * | 2018-09-12 | 2019-01-29 | 青岛大学 | 一种从多源数据集成视角构建企业知识图谱的方法 |
CN110197280A (zh) * | 2019-05-20 | 2019-09-03 | 中国银行股份有限公司 | 一种知识图谱构建方法、装置及系统 |
CN110390023A (zh) * | 2019-07-02 | 2019-10-29 | 安徽继远软件有限公司 | 一种基于改进bert模型的知识图谱构建方法 |
Non-Patent Citations (2)
Title |
---|
李新鹏;徐建航;郭子明;李军良;宁文元;王震学;: "调度自动化系统知识图谱的构建与应用" * |
王颖 等: "科技大数据知识图谱构建模型与方法研究" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI746690B (zh) | 自然語言問句答案的產生方法、裝置及伺服器 | |
CN104361127B (zh) | 基于领域本体和模板逻辑的多语种问答接口快速构成方法 | |
CN109446341A (zh) | 知识图谱的构建方法及装置 | |
CN109493166A (zh) | 一种针对电子商务导购场景任务型对话系统的构建方法 | |
CN109063221A (zh) | 基于混合策略的查询意图识别方法和装置 | |
US20050203869A1 (en) | Hierarchical database apparatus, components selection method in hierarchical database, and components selection program | |
CN113987212A (zh) | 一种数控加工领域工艺数据的知识图谱构建方法 | |
CN109325040B (zh) | 一种faq问答库泛化方法、装置及设备 | |
CN104679867B (zh) | 基于图的地址知识处理方法及装置 | |
CN101689190A (zh) | 用于智能文本注释的方法、系统和计算机程序 | |
CN107203468A (zh) | 一种基于ast的软件版本演化对比分析方法 | |
CN113609838B (zh) | 文档信息抽取及图谱化方法和系统 | |
CN110399448A (zh) | 中文地名地址搜索匹配方法、终端、计算机可读存储介质 | |
CN114218472A (zh) | 基于知识图谱的智能搜索系统 | |
CN113821622A (zh) | 基于人工智能的答案检索方法、装置、电子设备及介质 | |
CN115470232A (zh) | 模型训练和数据查询方法、装置、电子设备和存储介质 | |
CN111428093A (zh) | 基于实体对齐的可视化图谱融合方法及系统 | |
CN105912723A (zh) | 一种自定义字段的存储方法 | |
John et al. | Elicitation of requirements from user documentation | |
CN112883202A (zh) | 一种基于知识图谱的多组件建模方法和系统 | |
CN117033816A (zh) | 停车推荐方法、装置、电子设备及存储介质 | |
CN116523041A (zh) | 装备领域知识图谱构建方法、检索方法、系统及电子设备 | |
CN111223004A (zh) | 一种面向业务应用的继电保护知识建模方法及平台 | |
CN115905574A (zh) | 一种面向船舶电力系统设计任务的知识图谱构建方法及装置 | |
CN115346095A (zh) | 视觉问答方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |