CN112883202A - 一种基于知识图谱的多组件建模方法和系统 - Google Patents

一种基于知识图谱的多组件建模方法和系统 Download PDF

Info

Publication number
CN112883202A
CN112883202A CN202110323133.2A CN202110323133A CN112883202A CN 112883202 A CN112883202 A CN 112883202A CN 202110323133 A CN202110323133 A CN 202110323133A CN 112883202 A CN112883202 A CN 112883202A
Authority
CN
China
Prior art keywords
service
business
knowledge
component
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110323133.2A
Other languages
English (en)
Inventor
黄韬
魏亮
檀朝红
陈俊霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Future Networks Innovation Institute
Original Assignee
Jiangsu Future Networks Innovation Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Future Networks Innovation Institute filed Critical Jiangsu Future Networks Innovation Institute
Priority to CN202110323133.2A priority Critical patent/CN112883202A/zh
Publication of CN112883202A publication Critical patent/CN112883202A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于知识图谱的多组件建模方法,包括:业务逻辑识别过程;业务组件标注过程;业务组件匹配过程;业务模型调优过程;还提供了一种基于知识图谱的多组件建模系统,包括:业务知识处理模块;业务组件信息管理模块;业务组件匹配模块;业务模型管理模块。本发明可充分利用已有的行业内、企业内的业务说明文件,通过知识图谱学习过程,降低业务知识的形成对人的依赖,间接提升了业务模型的构建效率;通过知识图谱与业务组件的匹配,间接实现了业务模型的构建,将业务知识直接转换为用户的生成力;业务模型通过人工干预或实验验证的方法,可持续提升业务模型的准确性;提升了发现未知业务模型的概率。

Description

一种基于知识图谱的多组件建模方法和系统
技术领域
本发明涉及工业APP建模技术领域,尤其是涉及一种基于知识图谱的多组件建模方法和系统。
背景技术
工业APP是一种承载工业技术知识、经验与规律的形式化工业应用程序,是工业技术软件化的主要成果。为了解决特定问题、满足特定需要而将工业领域的各种流程、方法、数据、信息、规律、经验、知识等工业技术要素,通过数据建模与分析、结构化整理、系统性抽象提炼,并基于统一的标准,将这些工业技术要素封装固化后所形成的一种可高效重用和广泛传播的工业应用程序。本质上是一种与原宿主解耦的工业技术经验、规律与知识的沉淀、转化和应用的载体。业务组件是一个企业中基本的、唯一的、不会重复的构造块,代表了一系列的业务活动,是构建专业化企业的功能模块。
一个产品的生命周期中需要产出市场需求文档,然后根据市场需求文档画出产品原型图并输出产品需求文档。仅仅明确需求就去构造产品原型会不清晰,中间需要做很多的过渡工作,这些工作不像明确需求与建立原型那样被广泛提及,它们并没有一套明确的方法论。需求到原型存在“断层”,而需求到原型之间的过渡体尚没有明确的概念,如何在需求与原型之间搭建起一座桥梁,从而顺畅输出产品原型是工业APP所面临的一个困难。工业APP模型的形成,先从需求出发,分析APP的实体与实体关系的方法进行建模,形成一个全局感知,人脑只能形成一个提纲挈领的模型。建模过程是逐步深化的过程,在工业APP设计时需要落实各个细节,从顶层设计开始,逐步分析系统的实体与实体关系,最后再在这个基础上去组织构建工业APP原型。随着工业APP构建过程的逐步深化,如何快速且准确地分析系统的实体与实体关系,成为工业APP构建的一个难题。
知识图谱是一种规模非常大的语义网络系统,它主要目的就是为了描述真实世界里实体或概念之间的关联关系。通过大量的数据收集,整理成机器能处理的知识库,实现可视化的展示。知识图谱可以用来分析工业APP实体或概念之间关系,通过知识建模、关系抽取、图存储、关系推理、实体融合、决策分析等功能。充分利用大数据等手段,做好与已有知识管理系统、设计平台、生产平台、保障平台的集成接入,面向不同产业、领域、地区、企业、产品、项目、制造阶段和个人等开发个性化工业APP,实现知识的互联互通。
知识图谱也有其问题:
1)知识图谱比较依赖大量的结构化数据,需要一个庞大的数据网;
2)依赖实体识别的准确性:实体识别的准确性是最后能否解决用户问题的基础;
3)构建知识库遍历的逻辑:如何构建清晰的遍历逻辑,能快速搜索到需要的信息;
4)实体的歧义性问题:相同实体可能在不同的场景下,其含义可能会不一样。将知识图谱用于工业APP构建,提升工业APP建模的准确性和效率,需规避知识图谱的问题。
在知识生成过程中,知识由<实体1,关系,实体2>或<实体,属性,属性值>来表示。在工业APP建模中,实体1对应操作对象,实体2对应被操作对象,关系对应业务组件模型(即业务功能),属性对应于实体的特征描述。
发明内容
本发明所要解决的技术问题是如何基于知识图谱构建业务逻辑模型,本发明提供了一种基于知识图谱的多组件建模方法和系统。
为实现上述目的,本发明提供的具体技术方案如下:
一种基于知识图谱的多组件建模方法,其特征在于,包括:
业务逻辑识别过程:收集与业务相关的原始描述数据,通过预处理过程、业务信息抽取过程、业务知识融合过程,形成初级的业务知识图谱;
业务组件标注过程:对业务组件进行标注和管理,使每个业务组件拥有至少一个标签;
业务组件匹配过程:通过将初级的业务知识图谱中的实体、关系、属性、属性值等信息与业务组件的标签相对比,建立业务知识图谱中描述的业务知识与业务组件的关联,形成初级的业务模型;
业务模型调优过程:指通过人工干预或实验验证,对所述的初级的业务知识图谱进行质量评估和调整,将合格的模型纳入业务模型库中统一管理维护,对于不能通过质量评估的模型,需要对相关业务组件进行重新标注或者对初级的业务知识图谱进行修正,以确保业务模型的质量。
所述与业务相关的原始描述数据,是指所有与业务相关的资料,包括但不限于行业内的标准规范、操作说明、工作手册、音频资料、视频资料、图像资料、网页数据等,和企业内部的标准规范、操作说明、工作手册、音频资料、视频资料、图像资料、网页数据等;
所述业务知识对应知识图谱中的<实体1,关系,实体2>、<实体,属性,属性值>两种描述形式;所述实体包括但不限于业务功能的使用者、业务功能的处理对象;所述实体1、实体2是为了表述方便,代表两个实体;所述关系是指本行业或本企业的业务处理操作;所述属性和属性值是指实体的描述类别和具体描述信息;
所述标签包括但不限于前置条件、组件的输入、组件的输出、功能描述、操作对象、被操作对象等信息;进一步地,所述业务组件与所述的标签是一对多的对应关系。
所述预处理过程,是指对所述的原始描述数据进行预处理操作,形成可用于后续分析的文本数据的过程;所述的预处理操作,是指异构的、与业务相关的资料转换为知识图谱构建所需的文本数据的处理操作,预处理操作包括但不限于文字识别、语音转文字、文件格式转换、文本内容抽取等操作;
所述业务信息抽取过程,是指对文本数据进行结构化处理,完成实体识别、关系提取、属性抽取,生成可用的结构化信息数据,形成业务知识;
所述业务知识融合过程,是指整合多条业务知识中,通过指代消解、实体消歧、实体链接等过程,将描述同一个实体的不同描述整合在一起,形成对实体的完整描述;
所述结构化处理:是指将所述的文本数据进行分析,对业务实体抽取形成节点,对业务关系抽取形成边,抽取业务属性和属性值来丰富对业务实体的描述。
所述业务组件标注过程,包括人工标注和自动标注两种方法,所述的人工标注指人根据业务组件的特征维护对应组件的标签,所述的自动标注是指软件自动根据业务组件的文档描述或根据所述的业务模型调优过程的反馈结果来维护对应组件的标签,所述的业务组件标注过程支持对标签的添加、删除、修改和查询操作。
所述业务模型调优过程中的人工干预,是指依据人的经验和知识,对实体、关系、属性、属性值、标签、业务模型进行评估,给出模型的可信度,并反馈和维护知识图谱、业务组件标签的过程;所述业务模型调优过程中的实验验证,是指依据实验反馈的量化的可信度,对实体、关系、属性、属性值、标签、业务模型进行评估,并反馈和维护知识图谱、业务组件标签的过程。
一种基于知识图谱的多组件建模系统,其特征在于,所述的系统包括:
业务知识处理模块,用于收集业务相关的描述文件,并根据需要对业务相关的描述文件进行处理,转换为文本类描述文件,基于文本类描述文件中包含的业务知识,处理形成业务知识图谱;
业务组件信息管理模块,用于管理业务组件索引与业务组件标签信息,可从业务组件的描述信息中提取标注信息,维护业务组件与业务组件索引之间的对应关系,管理业务组件索引与业务组件标签信息之间的对应关系;
业务组件匹配模块,用于业务知识与业务组件之间的匹配处理,通过将业务知识的实体、属性、关系与每个业务组件的标签相对比,或者根据业务知识的实体、属性、关系提取出某个或某类标签,将已有的知识图谱,映射为初级的多组件模型;
业务模型管理模块,用于验证初级的业务模型是否达到可信度,采纳可信的多组件模型,对不可信的多组件模型实施干预。
所述业务知识处理模块,包括业务描述文件收集模块、预处理模块、结构化信息提取模块、知识生成与管理模块、业务知识库;其中,所述的业务描述文件收集模块,负责管理与业务相关的描述文件,文件类型包括但不限于视频、音频、图像、文本等;所述的预处理模块,负责将各种不同类型的与业务相关的描述文件转换为统一的文本文件,转换过程包括但不限于文字识别、语音转文字、文本编码转换等;所述的结构化信息提取模块,负责从统一的文本文件中,面向业务抽取实体、关系、属性、属性值,形成简单的由<实体1,关系,实体2>三元组和<实体,属性,属性值>三元组表示的业务知识;所述的知识生成与管理模块,负责将不同的知识进行融合处理,包括但不限于指代关联、实体去歧等操作,形成知识图谱。
所述的业务组件信息管理模块,包括业务组件索引库、业务组件标签库和业务组件标注与管理模块;所述的业务组件索引库,用于存储、增加、修改、删除和查询业务组件的索引信息;所述的业务组件标签库,用于存储、增加、修改、删除和查询业务组件的标签信息;所述的业务组件标注与管理模块,根据人工输入或业务组件的描述文件输入信息,管理业务组件的索引与业务组件的标签之间的对应关系。
所述的业务组件匹配模块,包括关联映射模块、冲突消解模块;所述的关联映射模块,用于接收初级的业务知识图谱、业务组件标签等信息,搜索建立业务知识图谱与业务组件的对应关系,输出初级的业务模型;所述的冲突消解模块,用于解决关联映射模块在处理过程中出现的冲突问题,冲突问题包括但不限于同一标签对应多个业务组件、同一业务组件存在矛盾的业务标签。
所述的业务模型管理模块,包括质量评估模块、模型存储模块、修正信息生成模块;所述的模型存储模块,用于存储可信的业务模型,并能输出业务模型给外部使用;所述的修正信息生成模块,用于记录不可信的业务模型产生的原因,并将修正信息反馈至业务知识处理模块和业务组件信息管理模块;所述的质量评估模块,接收初级的业务模型,可对该业务模型进行人工干预和实验验证两种质量评估,通过对模型的人工干预或基于模型的实验,给出质量评估结果,对于模型具备可信的质量评估结果,则将该模型交由模型存储模块管理,对于模型不具备可信的质量评估结果,则由修正信息生成模块生成修改信息,并反馈至对应模块进行修正。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
(1)本发明可充分利用已有的行业内、企业内的业务说明文件,通过知识图谱学习过程,降低业务知识的形成对人的依赖,间接提升了业务模型的构建效率;
(2)本发明通过知识图谱与业务组件的匹配,间接实现了业务模型的构建,将业务知识直接转换为用户的生成力;
(3)本发明中业务模型可通过人工干预或实验验证的方法,持续提升业务模型的准确性;
(4)本发明可通过业务知识的不断学习过程,提升发现未知业务模型的概率。
附图说明
图1为实施例中基于知识图谱的多组件建模方法的流程示意图;
图2为实施例中所述的业务组件标注过程的流程示意图;
图3为实施例中所述的业务逻辑识别过程的流程示意图;
图4为实施例中所述的业务组件匹配过程的流程示意图;
图5为实施例中所述的业务模型调优过程的流程示意图;
图6为实施例中一种基于知识图谱的多组件建模系统的模块示意图;
图7为实施例中所述的业务知识处理模块的组成示意图;
图8为实施例中所述的业务组件信息管理模块的组成示意图;
图9为实施例中所述的业务组件匹配模块的组成示意图;
图10为实施例中所述的业务模型管理模块的组成示意图;
图11为实施例中网络管理业务的简化知识图谱示意图。
图中:101、业务组件标注过程;102、业务逻辑识别过程;103、业务组件匹配过程;104、业务模型调优过程;201、获取业务组件的描述信息的过程;202、提取业务组件描述信息的关键词并自动生成标签的过程;203、人工维护标签的过程;301、收集业务相关的描述文件过程;302、预处理业务相关的描述文件过程;303、抽取文本中的实体、关系、属性、属性值并形成不同的业务知识过程;304、对不同的业务知识进行指代消除、实体去歧并形成初级的业务知识图谱过程;401、读取初级的业务知识图谱过程;402、搜索标签查找对应的业务组件过程;403、构成业务模型过程;501、通过人工干预或实验验证来评估业务模型的质量过程;502、根据评估质量确定是否采纳该模型过程;601、第一信息交互接口;602、第二信息交互接口;603、第三信息交互接口;604、第四信息交互接口;605、第五信息交互接口;606、第六信息交互接口;607、第七信息交互接口;608、第八信息交互接口;609、第九信息交互接口;701、第十信息交互接口;702、第十一信息交互接口;703、第十二信息交互接口;704、第十三信息交互接口;705、第十四信息交互接口;801、第十五信息交互接口;802、第十六信息交互接口;803、第十七信息交互接口;901、第十八信息交互接口;902、第十九信息交互接口;903、第二十信息交互接口;904、第二十一信息交互接口;1001、第二十二信息交互接口;1002、第二十三信息交互接口;1003、第二十四信息交互接口;1004、第二十五信息交互接口;1005、第二十六信息交互接口;1006、第二十七信息交互接口;
具体实施方式
下面结合附图和实施例对本发明进行详细的描述,但并不以此作为对本申请保护范围的限定。
工业APP本质上是一种与原宿主解耦的工业技术经验、规律与知识的沉淀、转化和应用的载体。业务组件是一个企业中基本的、唯一的、不会重复的构造块,代表了一系列的业务活动,是构建专业化企业的功能模块。业务建模过程是逐步深化的过程,在工业APP设计时需要落实各个细节,从顶层设计开始,逐步分析系统的实体与实体关系,最后再在这个基础上去组织构建工业APP原型。本发明提供了一种基于知识图谱的多组件建模方法,收集大量的业务相关的描述文件,分析获取业务中实体与实体的关系,形式丰富的业务知识,通过建立和优化业务知识与业务组件之间的对应关系,解决快速构建工业APP的难题。
根据知识图谱理论,知识由<实体1,关系,实体2>或<实体,属性,属性值>来表示。在工业APP建模过程中,实体1对应操作对象,实体2对应被操作对象,关系对应业务组件模型(即业务功能),属性对应于实体的特征描述。所述的业务知识对应知识图谱中的<实体1,关系,实体2>、<实体,属性,属性值>两种描述形式;所述的实体包括但不限于业务功能的使用者、业务功能的处理对象;所述的实体1、实体2是为了表述方便,代表两个实体;所述的关系是指本行业或本企业的业务处理操作;所述的属性和属性值是指实体的描述类别和具体描述信息。
如图1所示,在一个实施例中,基于知识图谱的多组件建模方法包括以下过程:
业务组件标注过程101:实现对已知的业务组件进行标注和信息管理,通过对业务组件进行标注和管理,使每个业务组件拥有至少一个标签;所述的标签包括但不限于前置条件、组件的输入、组件的输出、功能描述、操作对象、被操作对象等信息;进一步地,所述的业务组件与所述的标签是一对多的对应关系。以网络管理为例,已知业务组件包括用户登录、路由器界面、IP管理、MAC管理、路由管理、转发管理、防火墙管理等,其中用户登录组件的标签包括“用户”、“登录”,IP管理组件的标签包括“IP”、“设置”、“LAN口”、“WAN口”等。
业务逻辑识别过程102:处理业务相关的描述文件,形成业务知识,多个知识融合形成初级的业务知识图谱;具体通过收集与业务相关的原始描述数据,然后执行预处理过程、业务信息抽取过程、业务知识融合过程,形成初级的业务知识图谱;所述的与业务相关的原始描述数据,是指所有与业务相关的资料,包括但不限于行业内的标准规范、操作说明、工作手册、音频资料、视频资料、图像资料、网页数据等,和企业内部的标准规范、操作说明、工作手册、音频资料、视频资料、图像资料、网页数据等。以网络管理为例,对网络管理手册进行学习,形成一系列的知识,例如<用户,登录,路由器>、<路由器,配置,IP>、<IP,设置,WAN口IP>、<IP,设置,LAN口IP>等,最后形成以用户、IP、MAC、防火墙等实体为节点的简单知识图谱,如图11所示。
业务组件匹配过程103:建立业务组件与业务知识之间的关联关系,根据初级的业务知识图谱,形成初级的多组件模型;具体通过将初级的业务知识图谱中的实体、关系、属性、属性值等信息与业务组件的标签相对比,建立业务知识图谱中描述的业务知识与业务组件的关联。
业务模型调优过程104:对多组件模型进行质量评估,根据评估结果判断:采纳模型或者进行干预;具体通过人工干预或实验验证,对所述的初级的业务知识图谱进行质量评估和调整,将合格的模型纳入业务模型库中统一管理维护,对于不能通过质量评估的模型,需要对相关业务组件进行重新标注或者对初级的业务知识图谱进行修正,以确保业务模型的质量。
如图2所示,在一个实施例中,所述业务组件标注过程101业务组件标注过程具体包括以下子过程:
获取业务组件的描述信息的过程201:主要通过查询或外部输入,来获取业务组件的描述信息;
提取业务组件描述信息的关键词,自动生成标签的过程202:具体是指软件自动根据业务组件的文档描述或根据所述的业务模型调优过程的反馈结果来维护对应组件的标签的过程;
人工维护标签的过程203:是指人根据业务组件的特征维护对应组件的标签。
如图3所示,在一个实施例中,所述业务逻辑识别过程102业务逻辑识别过程具体包括以下子过程:
收集业务相关的描述文件过程301:所述的描述文件包括但不限于行业和企业内的标准规范、操作说明、工作手册、音频资料、视频资料、图像资料、网页数据等;
预处理业务相关的描述文件过程302:形成文本形式的业务描述,具体是指将异构的、与业务相关的资料转换为知识图谱构建所需的文本数据的处理操作,预处理操作包括但不限于文字识别、语音转文字、文件格式转换、文本内容抽取等操作;
抽取文本中的实体、关系、属性、属性值,形成不同的业务知识过程303:具体指对文本数据进行结构化处理,完成实体识别、关系提取、属性抽取,生成可用的结构化信息数据,形成业务知识;利用纯文本数据进行知识生成,需要用到许多自然语言处理的技术,包括但不仅限于分词、词性标注、分布式语义表达、篇章潜在主题分析、同义词构建、语义解析、依存句法、语义角色标注、语义相似度计算等。
对不同的业务知识进行指代消除、实体去歧,形成初级的业务知识图谱过程304:通过业务知识融合将描述同一个实体的不同描述整合在一起,形成对实体的完整描述;
如图4所示,在一个实施例中,所述业务组件匹配过程103业务组件匹配过程具体包括以下子过程:
读取初级的业务知识图谱过程401;
搜索标签查找对应的业务组件过程402:根据初级的业务知识图谱,通过搜索标签查找对应的业务组件;
构成业务模型过程403:得到的1个或多个业务组件,连接构成业务模型。
如图5所示,在一个实施例中,所述业务模型调优过程104业务模型调优过程具体包括以下子过程:
通过人工干预或实验验证来评估业务模型的质量过程501,该过程中既可以依据人的经验和知识,对实体、关系、属性、属性值、标签、业务模型进行评估,给出模型的可信度;也可以依据实验反馈的量化的可信度,对实体、关系、属性、属性值、标签、业务模型进行评估。
根据评估质量,确定是否采纳该模型过程502;采纳则保存;不采纳则需向所述业务逻辑识别过程102和所述业务组件标注过程101提供反馈信息,由二者对原有数据进行修正。
如图6所示,本发明还提供一种基于知识图谱的多组件建模系统,该系统包括业务知识处理模块、业务组件信息管理模块、业务组件匹配模块、业务模型管理模块。其中:
业务知识处理模块,用于收集业务相关的描述文件,并根据需要对业务相关的描述文件进行处理,转换为文本类描述文件,基于文本类描述文件中包含的业务知识,处理形成业务知识图谱;业务知识处理模块可以从第一信息交互接口601接收与业务相关的描述信息,所述的描述信息包括但不限于行业内的标准规范、操作说明、工作手册、音频资料、视频资料、图像资料、网页数据等,和企业内部的标准规范、操作说明、工作手册、音频资料、视频资料、图像资料、网页数据等;业务知识处理模块可以从第二信息交互接口602和第三信息交互接口603分别接收人工输入的知识信息和业务模型管理模块产生的修正知识信息;业务知识处理模块通过第四信息交互接口604输出生成的业务知识。
业务组件信息管理模块,用于管理业务组件索引与业务组件标注信息,可从业务组件的描述信息中提取标注信息,维护业务组件与业务组件索引之间的对应关系,管理业务组件索引与业务组件标签信息之间的对应关系;业务组件信息管理模块可以从第五信息交互接口605接收业务组件的描述信息;业务组件信息管理模块还可以通过第六信息交互接口606接收人工输入的业务组件的标签信息,通过第七信息交互接口607接收业务模型管理模块产生的修正标签的信息;业务组件信息管理模块通过第八信息交互接口608输出业务组件的标签信息。
业务组件匹配模块,用于业务知识与业务组件之间的匹配处理,通过第四信息交互接口604接收业务知识信息,通过第八信息交互接口608接收业务组件标签信息,通过将业务知识的实体、属性、关系与业务组件的标签相对比,或者根据业务知识的实体、属性、关系提取出某个或某类标签,将已有的知识图谱,映射为初级的多组件模型;业务组件匹配模块通过第九信息交互接口609输出初级的多组件模型。
业务模型管理模块,从第九信息交互接口609接收初级的多组件模型,验证该模型是否达到预设的可信度;如果该模型达到可信的质量,那么采纳该多组件模型;否则,通过第三信息交互接口603和第七信息交互接口607,分别对业务知识和组件标签实施干预。
如图7所示,在一个实施例中,业务知识处理模块包括业务描述文件收集模块、预处理模块、结构化信息提取模块、知识生成与管理模块、业务知识库;其中:
业务描述文件收集模块,负责管理与业务相关的描述文件,文件类型包括但不限于视频、音频、图像、文本等,通过第十信息交互接口701输出无统一格式的音频、视频、图像、文本等类型的文件。
预处理模块,从第十信息交互接口701接收与业务相关的描述文件,并将各种不同类型的与业务相关的描述文件转换为统一的文本文件,转换过程包括但不限于文字识别、语音转文字、文本编码转换等,最后预处理模块通过第十一信息交互接口702输出统一编码的文本数据。
结构化信息提取模块,从第十一信息交互接口702接收统一编码的文本数据,从统一编码的文本数据中,面向业务抽取实体、关系、属性、属性值,形成简单的由<实体1,关系,实体2>三元组和<实体,属性,属性值>三元组表示的业务知识,并通过第十二信息交互接口703输出有效的<实体1,关系,实体2>三元组或<实体,属性,属性值>三元组。
知识生成与管理模块,从第十二信息交互接口703接收信息,将信息中的知识与已有的知识进行融合处理,包括但不限于指代关联、实体去歧等操作,形成知识图谱,将该知识图谱通过第十三信息交互接口704存储在业务知识库,通过第十四信息交互接口705对外发布。
如图8所示,在一个实施例中,业务组件信息管理模块包括业务组件索引库、业务组件标签库和业务组件标注与管理模块。其中:
业务组件索引库,用于存储、增加、修改、删除和查询业务组件的索引信息,通过第十五信息交互接口801接收业务组件标注与管理模块对业务组件索引的管理指令;
业务组件标签库,用于存储、增加、修改、删除和查询业务组件的标签信息,通过第十六信息交互接口802接收业务组件标注与管理模块对业务组件标签的管理指令;
业务组件标注与管理模块,根据人工输入或业务组件的描述文件输入信息,管理业务组件的索引与业务组件的标签之间的对应关系,可通过第十五信息交互接口801访问业务组件索引库,通过第十六信息交互接口802访问业务组件标签库,通过第十七信息交互接口803输出业务组件标签信息。
如图9所示,在一个实施例中,业务组件匹配模块包括关联映射模块、冲突消解模块。其中:
关联映射模块,首先,通过第十八信息交互接口901接收初级的业务知识信息,通过第十九信息交互接口902接收业务组件标签信息;然后,搜索建立业务知识图谱与业务组件的对应关系,针对建立对应关系中出现的冲突问题,通过第二十信息交互接口903调用冲突消解模块,进行冲突消解;最后,通过第二十一信息交互接口904输出初级的业务模型;
冲突消解模块,通过第二十信息交互接口903与关联映射模块交互信息,解决关联映射模块在处理过程中出现的冲突问题,冲突问题包括但不限于同一标签对应多个业务组件、同一业务组件存在矛盾的业务标签。
如图10所示,在一个实施例中,业务模型管理模块包括质量评估模块、模型存储模块、修正信息生成模块。其中:
质量评估模块,首先,通过第二十二信息交互接口1001接收初级的业务模型,然后对该业务模型进行人工干预和实验验证两种质量评估,通过对模型的人工干预或基于模型的实验,给出质量评估结果,对于模型具备可信的质量评估结果,则通过第二十三信息交互接口1002将该模型交由模型存储模块管理,对于模型不具备可信的质量评估结果,则通过第二十四信息交互接口1003将不可信的业务模型产生原因交由修正信息生成模块处理;
模型存储模块,通过第二十三信息交互接口1002接收可信的业务模型并存储,同时还可通过第二十七信息交互接口1006对外发布业务模型;
修正信息生成模块,通过第二十四信息交互接口1003接收不可信的业务模型产生原因,并记录;对于不可信的业务模型产生的原因,生成相应的修正信息,通过第二十五信息交互接口1004向业务知识处理模块反馈业务知识修正信息,通过第二十六信息交互接口1005向业务组件信息管理模块反馈标签修正信息。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (10)

1.一种基于知识图谱的多组件建模方法,其特征在于,包括:
业务逻辑识别过程:收集与业务相关的原始描述数据,通过预处理过程、业务信息抽取过程、业务知识融合过程,形成初级的业务知识图谱;
业务组件标注过程:对业务组件进行标注和管理,使每个业务组件拥有至少一个标签;
业务组件匹配过程:通过将初级的业务知识图谱中的实体、关系、属性、属性值等信息与业务组件的标签相对比,建立业务知识图谱中描述的业务知识与业务组件的关联,形成初级的业务模型;
业务模型调优过程:指通过人工干预或实验验证,对所述的初级的业务知识图谱进行质量评估和调整,将合格的模型纳入业务模型库中统一管理维护,对于不能通过质量评估的模型,需要对相关业务组件进行重新标注或者对初级的业务知识图谱进行修正,以确保业务模型的质量。
2.根据权利要求1所述的基于知识图谱的多组件建模方法,其特征在于:
所述与业务相关的原始描述数据,是指所有与业务相关的资料,包括但不限于行业内的标准规范、操作说明、工作手册、音频资料、视频资料、图像资料、网页数据等,和企业内部的标准规范、操作说明、工作手册、音频资料、视频资料、图像资料、网页数据等;
所述业务知识对应知识图谱中的<实体1,关系,实体2>、<实体,属性,属性值>两种描述形式;所述实体包括但不限于业务功能的使用者、业务功能的处理对象;所述实体1、实体2是为了表述方便,代表两个实体;所述关系是指本行业或本企业的业务处理操作;所述属性和属性值是指实体的描述类别和具体描述信息;
所述标签包括但不限于前置条件、组件的输入、组件的输出、功能描述、操作对象、被操作对象等信息;进一步地,所述业务组件与所述的标签是一对多的对应关系。
3.根据权利要求1所述的基于知识图谱的多组件建模方法,其特征在于,所述预处理过程,是指对所述的原始描述数据进行预处理操作,形成可用于后续分析的文本数据的过程;所述的预处理操作,是指异构的、与业务相关的资料转换为知识图谱构建所需的文本数据的处理操作,预处理操作包括但不限于文字识别、语音转文字、文件格式转换、文本内容抽取等操作;
所述业务信息抽取过程,是指对文本数据进行结构化处理,完成实体识别、关系提取、属性抽取,生成可用的结构化信息数据,形成业务知识;
所述业务知识融合过程,是指整合多条业务知识中,通过指代消解、实体消歧、实体链接等过程,将描述同一个实体的不同描述整合在一起,形成对实体的完整描述;
所述结构化处理:是指将所述的文本数据进行分析,对业务实体抽取形成节点,对业务关系抽取形成边,抽取业务属性和属性值来丰富对业务实体的描述。
4.根据权利要求1所述的基于知识图谱的多组件建模方法,其特征在于,所述业务组件标注过程,包括人工标注和自动标注两种方法,所述的人工标注指人根据业务组件的特征维护对应组件的标签,所述的自动标注是指软件自动根据业务组件的文档描述或根据所述的业务模型调优过程的反馈结果来维护对应组件的标签,所述的业务组件标注过程支持对标签的添加、删除、修改和查询操作。
5.根据权利要求1所述的基于知识图谱的多组件建模方法,其特征在于,所述业务模型调优过程中的人工干预,是指依据人的经验和知识,对实体、关系、属性、属性值、标签、业务模型进行评估,给出模型的可信度,并反馈和维护知识图谱、业务组件标签的过程;所述业务模型调优过程中的实验验证,是指依据实验反馈的量化的可信度,对实体、关系、属性、属性值、标签、业务模型进行评估,并反馈和维护知识图谱、业务组件标签的过程。
6.一种基于知识图谱的多组件建模系统,其特征在于,包括:
业务知识处理模块,用于收集业务相关的描述文件,并根据需要对业务相关的描述文件进行处理,转换为文本类描述文件,基于文本类描述文件中包含的业务知识,处理形成业务知识图谱;
业务组件信息管理模块,用于管理业务组件索引与业务组件标签信息,可从业务组件的描述信息中提取标注信息,维护业务组件与业务组件索引之间的对应关系,管理业务组件索引与业务组件标签信息之间的对应关系;
业务组件匹配模块,用于业务知识与业务组件之间的匹配处理,通过将业务知识的实体、属性、关系与每个业务组件的标签相对比,或者根据业务知识的实体、属性、关系提取出某个或某类标签,将已有的知识图谱,映射为初级的多组件模型;
业务模型管理模块,用于验证初级的业务模型是否达到可信度,采纳可信的多组件模型,对不可信的多组件模型实施干预。
7.根据权利要求6所述的基于知识图谱的多组件建模系统,其特征在于,所述业务知识处理模块,包括业务描述文件收集模块、预处理模块、结构化信息提取模块、知识生成与管理模块、业务知识库;其中,所述的业务描述文件收集模块,负责管理与业务相关的描述文件,文件类型包括但不限于视频、音频、图像、文本等;所述的预处理模块,负责将各种不同类型的与业务相关的描述文件转换为统一的文本文件,转换过程包括但不限于文字识别、语音转文字、文本编码转换等;所述的结构化信息提取模块,负责从统一的文本文件中,面向业务抽取实体、关系、属性、属性值,形成简单的由<实体1,关系,实体2>三元组和<实体,属性,属性值>三元组表示的业务知识;所述的知识生成与管理模块,负责将不同的知识进行融合处理,包括但不限于指代关联、实体去歧等操作,形成知识图谱。
8.根据权利要求6所述的基于知识图谱的多组件建模系统,其特征在于,所述的业务组件信息管理模块,包括业务组件索引库、业务组件标签库和业务组件标注与管理模块;所述的业务组件索引库,用于存储、增加、修改、删除和查询业务组件的索引信息;所述的业务组件标签库,用于存储、增加、修改、删除和查询业务组件的标签信息;所述的业务组件标注与管理模块,根据人工输入或业务组件的描述文件输入信息,管理业务组件的索引与业务组件的标签之间的对应关系。
9.根据权利要求6所述的基于知识图谱的多组件建模系统,其特征在于,所述的业务组件匹配模块,包括关联映射模块、冲突消解模块;所述的关联映射模块,用于接收初级的业务知识图谱、业务组件标签等信息,搜索建立业务知识图谱与业务组件的对应关系,输出初级的业务模型;所述的冲突消解模块,用于解决关联映射模块在处理过程中出现的冲突问题,冲突问题包括但不限于同一标签对应多个业务组件、同一业务组件存在矛盾的业务标签。
10.根据权利要求6所述的基于知识图谱的多组件建模系统,其特征在于,所述的业务模型管理模块,包括质量评估模块、模型存储模块、修正信息生成模块;所述的模型存储模块,用于存储可信的业务模型,并能输出业务模型给外部使用;
所述的修正信息生成模块,用于记录不可信的业务模型产生的原因,并将修正信息反馈至业务知识处理模块和业务组件信息管理模块;所述的质量评估模块,接收初级的业务模型,可对该业务模型进行人工干预和实验验证两种质量评估,通过对模型的人工干预或基于模型的实验,给出质量评估结果,对于模型具备可信的质量评估结果,则将该模型交由模型存储模块管理,对于模型不具备可信的质量评估结果,则由修正信息生成模块生成修改信息,并反馈至对应模块进行修正。
CN202110323133.2A 2021-03-26 2021-03-26 一种基于知识图谱的多组件建模方法和系统 Pending CN112883202A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110323133.2A CN112883202A (zh) 2021-03-26 2021-03-26 一种基于知识图谱的多组件建模方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110323133.2A CN112883202A (zh) 2021-03-26 2021-03-26 一种基于知识图谱的多组件建模方法和系统

Publications (1)

Publication Number Publication Date
CN112883202A true CN112883202A (zh) 2021-06-01

Family

ID=76042387

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110323133.2A Pending CN112883202A (zh) 2021-03-26 2021-03-26 一种基于知识图谱的多组件建模方法和系统

Country Status (1)

Country Link
CN (1) CN112883202A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115169164A (zh) * 2022-09-09 2022-10-11 昆仑智汇数据科技(北京)有限公司 一种工业模型的信息处理方法、装置及设备
CN115935608A (zh) * 2022-11-10 2023-04-07 北京能科瑞元数字技术有限公司 一种基于模型的设备预装配选配方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064318A (zh) * 2018-08-24 2018-12-21 苏宁消费金融有限公司 一种基于知识图谱的互联网金融风险监测系统
CN110569369A (zh) * 2019-09-16 2019-12-13 神州数码融信软件有限公司 银行金融系统知识图谱的生成方法及装置、应用方法及装置
CN110825882A (zh) * 2019-10-09 2020-02-21 西安交通大学 一种基于知识图谱的信息系统管理方法
CN111444351A (zh) * 2020-03-24 2020-07-24 清华苏州环境创新研究院 一种行业工艺领域知识图谱构建方法及装置
CN111475604A (zh) * 2019-09-18 2020-07-31 北京国双科技有限公司 数据处理方法及装置
CN111861825A (zh) * 2020-07-31 2020-10-30 嘉兴运达智能设备有限公司 一种轨道交通行业职业培训体系模型构建方法及系统
CN111897968A (zh) * 2020-07-20 2020-11-06 国网浙江省电力有限公司嘉兴供电公司 一种工业信息安全知识图谱构建方法和系统
CN112000814A (zh) * 2020-10-27 2020-11-27 南京易安联网络技术有限公司 一种基于知识图谱的网络实体行为评估方法
CN112035676A (zh) * 2020-09-02 2020-12-04 中国银行股份有限公司 用户操作行为知识图谱构建方法及装置
CN112199515A (zh) * 2020-11-17 2021-01-08 西安交通大学 一种多形态知识图谱驱动的知识服务创新方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064318A (zh) * 2018-08-24 2018-12-21 苏宁消费金融有限公司 一种基于知识图谱的互联网金融风险监测系统
CN110569369A (zh) * 2019-09-16 2019-12-13 神州数码融信软件有限公司 银行金融系统知识图谱的生成方法及装置、应用方法及装置
CN111475604A (zh) * 2019-09-18 2020-07-31 北京国双科技有限公司 数据处理方法及装置
CN110825882A (zh) * 2019-10-09 2020-02-21 西安交通大学 一种基于知识图谱的信息系统管理方法
CN111444351A (zh) * 2020-03-24 2020-07-24 清华苏州环境创新研究院 一种行业工艺领域知识图谱构建方法及装置
CN111897968A (zh) * 2020-07-20 2020-11-06 国网浙江省电力有限公司嘉兴供电公司 一种工业信息安全知识图谱构建方法和系统
CN111861825A (zh) * 2020-07-31 2020-10-30 嘉兴运达智能设备有限公司 一种轨道交通行业职业培训体系模型构建方法及系统
CN112035676A (zh) * 2020-09-02 2020-12-04 中国银行股份有限公司 用户操作行为知识图谱构建方法及装置
CN112000814A (zh) * 2020-10-27 2020-11-27 南京易安联网络技术有限公司 一种基于知识图谱的网络实体行为评估方法
CN112199515A (zh) * 2020-11-17 2021-01-08 西安交通大学 一种多形态知识图谱驱动的知识服务创新方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙枫;: "知识图谱在金融机构网络安全中的应用", 金融科技时代 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115169164A (zh) * 2022-09-09 2022-10-11 昆仑智汇数据科技(北京)有限公司 一种工业模型的信息处理方法、装置及设备
CN115935608A (zh) * 2022-11-10 2023-04-07 北京能科瑞元数字技术有限公司 一种基于模型的设备预装配选配方法

Similar Documents

Publication Publication Date Title
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
WO2021196520A1 (zh) 一种面向税务领域知识图谱的构建方法及系统
CN109739994B (zh) 一种基于参考文档的api知识图谱构建方法
CN111708773A (zh) 一种多源科创资源数据融合方法
Van der Aa et al. Detecting inconsistencies between process models and textual descriptions
CN111967761B (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
CN111859969B (zh) 数据分析方法及装置、电子设备、存储介质
CN110888943A (zh) 基于微模板的法院裁判文书辅助生成的方法和系统
CN113254507B (zh) 一种数据资产目录智能构建盘点方法
CN114218472A (zh) 基于知识图谱的智能搜索系统
CN113094512B (zh) 一种工业生产制造中故障分析系统及方法
CN112883202A (zh) 一种基于知识图谱的多组件建模方法和系统
CN114881043B (zh) 基于深度学习模型的法律文书语义相似度评估方法及系统
CN113360582A (zh) 基于bert模型融合多元实体信息的关系分类方法及系统
CN117473054A (zh) 基于知识图谱的通用智能问答方法及装置
CN111831624A (zh) 数据表创建方法、装置、计算机设备及存储介质
KR101499571B1 (ko) 일반문서의 자동계층 분류를 통한 의미적 문서로의 변환 방법, 이를 수행하기 위한 기록 매체 및 장치
Modoni et al. The knowledge reuse in an industrial scenario: A case study
CN115827885A (zh) 一种运维知识图谱的构建方法、装置及电子设备
CN106407271B (zh) 一种智能客服系统及其智能客服知识库的更新方法
WO2019043380A1 (en) SEMANTIC ANALYSIS
Rogushina et al. Use of ontologies for metadata records analysis in big data
CN112286916A (zh) 一种数据处理方法、装置、设备及存储介质
CN111913997A (zh) 一种基于人工智能的用户画像系统的实现方法
CN117724683B (zh) 一种基于大语言模型的业务逻辑编码框架生成方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination