CN114647744A - 一种体系结构建模方法及装置 - Google Patents
一种体系结构建模方法及装置 Download PDFInfo
- Publication number
- CN114647744A CN114647744A CN202210559784.6A CN202210559784A CN114647744A CN 114647744 A CN114647744 A CN 114647744A CN 202210559784 A CN202210559784 A CN 202210559784A CN 114647744 A CN114647744 A CN 114647744A
- Authority
- CN
- China
- Prior art keywords
- architecture
- data
- system structure
- knowledge
- relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000000605 extraction Methods 0.000 claims abstract description 58
- 238000002372 labelling Methods 0.000 claims abstract description 36
- 238000013499 data model Methods 0.000 claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000006243 chemical reaction Methods 0.000 claims abstract description 25
- 238000000547 structure data Methods 0.000 claims abstract description 22
- 238000005065 mining Methods 0.000 claims abstract description 9
- 238000010276 construction Methods 0.000 claims description 28
- 238000013507 mapping Methods 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims 1
- 230000007123 defense Effects 0.000 description 28
- 230000000694 effects Effects 0.000 description 23
- 239000011159 matrix material Substances 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 239000012634 fragment Substances 0.000 description 5
- 230000008520 organization Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种体系结构建模方法及装置,该方法包括:构建体系结构知识本体;构建识别模型,并将获得的关于体系结构知识本体的文本数据进行序列标注,形成训练数据;基于体系结构知识本体构建用于抽取体系结构关系数据的实体关系抽取规则库;基于识别出的命名实体数据以及抽取到的体系结构关系数据构建体系结构知识图谱;基于体系结构知识图谱及体系结构知识本体构建用于挖掘各体系结构知识图谱中的隐含体系结构数据的知识推理规则库;至少基于不同体系结构模型及其对应的体系结构数据构建数据‑模型转换规则,体系结构数据包括由知识推理规则库输出的隐含体系结构数据;基于待处理的体系结构数据及数据‑模型转换规则自动生成体系结构模型。
Description
技术领域
本发明实施例涉及系统工程技术领域,特别涉及一种体系结构建模方法及装置。
背景技术
体系是诸多组成要素集成的一个紧密结合的整体,强调内部组分系统之间的互联互通互操作,以及各组成要素之间的信息、物质、能量的交换。大多数体系具有复杂的体系结构,体系结构建模技术能够从不同的视点构建体系结构模型对体系结构进行描述。随着体系复杂程度越来越高,涉及多领域、多学科的专业知识,这使人工采集体系结构数据的方法暴露出效率低、资源浪费严重等问题。此外,目前体系结构模型主要采用手动构建的方法。由于体系结构模型有着严格的构建标准,非专业建模人员难以构建标准的、可重用的体系结构模型。但专业的建模人员需要一定的周期来培养,现在专业的建模人员比较紧缺。
因此,亟需一种体系结构智能建模方法满足当前以及未来的体系结构建模需求,能够提高建模效率,确保模型规范。
发明内容
本发明实施例提供了一种体系结构建模方法,包括:
构建体系结构知识本体;
构建用于识别体系结构命名实体的识别模型,并将获得的关于所述体系结构知识本体的文本数据进行序列标注,形成所述识别模型的训练数据;
基于所述体系结构知识本体构建实体关系抽取规则库,所述规则库能够用于抽取体系结构关系数据;
基于所述识别模型识别待测数据得到的命名实体数据以及自所述关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱;
基于所述体系结构知识图谱及体系结构知识本体构建知识推理规则库,所述推理规则库用于挖掘各体系结构知识图谱中的隐含体系结构数据;
至少基于不同体系结构模型及其对应的体系结构数据构建数据-模型转换规则,所述体系结构数据包括由所述知识推理规则库输出的隐含体系结构数据;
基于待处理的体系结构数据及数据-模型转换规则自动生成体系结构模型。
作为一可选实施例,所述将获得的关于所述体系结构知识本体的文本数据进行序列标注,形成所述识别模型的训练数据,包括:
获得对应所述体系结构知识本体所属领域的描述文本;
对所述描述文本进行预处理;
将预处理后的所述描述文本基于BIO标注法及确定的标注标签进行标注,以形成所述训练数据,所述标注标签基于所述体系结构知识本体确定。
作为一可选实施例,所述体系结构知识本体包括多个,多个所述体系结构知识本体分别对应不同的领域;
所述基于所述体系结构知识本体构建实体关系抽取规则库,包括:
基于各个所述体系结构知识本体的各个体系结构关系类型的文本数据确定对应每个所述关系类型的关系词,所述关系词包含关系语义信息;
基于各关系词及由各所述体系结构知识本体确定的头尾实体确定实体关系抽取规则;
基于所述关系抽取规则构建所述关系抽取规则库。
作为一可选实施例,所述基于所述识别模型识别待测数据得到的命名实体数据以及自所述关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱,包括:
获得所述识别模型对输入的对应所述体系结构知识本体所述领域的描述文本进行计算输出的命名实体数据;
获得自所述关系抽取规则库中抽取的对应所述体系结构知识本体的体系结构关系数据;
基于所述命名实体数据及体系结构关系数据构建所述体系结构知识图谱。
作为一可选实施例,所述体系结构知识本体包括多个,且对应不同体系领域;
所述基于所述体系结构知识图谱及体系结构知识本体构建知识推理规则库,包括:
根据各所述体系结构知识本体中的实体类型与体系结构关系数据类型确定对应每种关系类型的候选推理规则;
基于多个所述候选推理规则处理所述体系结构知识图谱,并基于处理结果自多个所述候选推理规则中确定推理规则;
基于所述推理规则构建所述知识推理规则库。
作为一可选实施例,所述至少基于不同体系结构模型及其对应的体系结构数据构建数据-模型转换规则,包括:
根据所述体系结构知识本体以及不同体系结构模型被构建时所需的体系结构数据类型,形成不同体系结构知识本体的特征与体系结构模型中的特征之间的映射关系;
基于所述映射关系构建所述数据-模型转换规则。
本发明另一实施例提供一种体系结构建模装置,包括:
第一构建模块,用于构建体系结构知识本体;
第二构建模块,用于构建用于识别体系结构命名实体的识别模型,并将获得的关于所述体系结构知识本体的文本数据进行序列标注,形成所述识别模型的训练数据;
第三构建模块,用于根据所述体系结构知识本体构建实体关系抽取规则库,所述规则库能够用于抽取体系结构关系数据;
第四构建模块,用于根据所述识别模型识别待测数据得到的命名实体数据以及自所述关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱;
第五构建模块,用于根据所述体系结构知识图谱及体系结构知识本体构建知识推理规则库,所述推理规则库用于挖掘各体系结构知识图谱中的隐含体系结构数据;
第六构建模块,用于至少基于不同体系结构模型及其对应的体系结构数据构建数据-模型转换规则,所述体系结构数据包括由所述知识推理规则库输出的隐含体系结构数据;
生成模块,用于根据待处理的体系结构数据及数据-模型转换规则自动生成体系结构模型。
作为一可选实施例,所述将获得的关于所述体系结构知识本体的文本数据进行序列标注,形成所述识别模型的训练数据,包括:
获得对应所述体系结构知识本体所属领域的描述文本;
对所述描述文本进行预处理;
将预处理后的所述描述文本基于BIO标注法及确定的标注标签进行标注,以形成所述训练数据,所述标注标签基于所述体系结构知识本体确定。
作为一可选实施例,所述体系结构知识本体包括多个,多个所述体系结构知识本体分别对应不同的领域;
所述根据所述体系结构知识本体构建实体关系抽取规则库,包括:
基于各个所述体系结构知识本体的各个体系结构关系类型的文本数据确定对应每个所述关系类型的关系词,所述关系词包含关系语义信息;
基于各关系词及由各所述体系结构知识本体确定的头尾实体确定实体关系抽取规则;
基于所述关系抽取规则构建所述关系抽取规则库。
作为一可选实施例,所述根据所述识别模型识别待测数据得到的命名实体数据以及自所述关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱,包括:
获得所述识别模型对输入的对应所述体系结构知识本体所属领域的描述文本进行计算输出的命名实体数据;
获得自所述关系抽取规则库中抽取的对应所述体系结构知识本体的体系结构关系数据;
基于所述命名实体数据及体系结构关系数据构建所述体系结构知识图谱。
基于上述实施例的公开可以获知,本发明实施例具备的有益效果包括:
1.通过构建数据-模型转换规则库,使得用户可以基于需求而通过设备自动生成对应地体系结构模型,或设备自主根据计算需求等而自动生成对应地体系结构模型,显著提升了体系结构模型的生成速度及效率,应用范围广泛;
2.可以通过基于体系结构元模型和用户需求等来构建体系结构领域知识本体,对体系结构数据的采集、组织和存储起到规范指导作用;
3.利用知识抽取技术,从体系结构知识本体的描述文本中采集体系结构数据,并辅助构建知识推理规则库,以有效挖掘隐含体系结构数据,以减少知识图谱的数据缺失;
4.构建体系结构数据-体系结构模型间的转换规则库,支持体系结构模型的自动构建,从而提高体系结构模型的构建效率,推动体系结构建模技术的智能化发展。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中的建模方法的流程图;
图2为本发明实施例中的体系结构知识本体的结构图;
图3为本发明实施例中的知识图谱示意图;
图4为本发明实施例中的系统接口描述模型(SV-1)的结构示意图;
图5为本发明实施例中的建模装置的结构框图。
具体实施方式
下面,结合附图对本发明的具体实施例进行详细的描述,但不作为本发明的限定。
应理解的是,可以对此处公开的实施例做出各种修改。因此,下述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本公开的范围和精神内的其他修改。
包含在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且与上面给出的对本公开的大致描述以及下面给出的对实施例的详细描述一起用于解释本公开的原理。
通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本发明的这些和其它特性将会变得显而易见。
还应当理解,尽管已经参照一些具体实例对本发明进行了描述,但本领域技术人员能够确定地实现本发明的很多其它等效形式,它们具有如权利要求所述的特征并因此都位于借此所限定的保护范围内。
当结合附图时,鉴于以下详细说明,本公开的上述和其他方面、特征和优势将变得更为显而易见。
此后参照附图描述本公开的具体实施例;然而,应当理解,所公开的实施例仅仅是本公开的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本公开模糊不清。因此,本文所公开的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本公开。
本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本公开的相同或不同实施例中的一个或多个。
下面,结合附图详细的说明本发明实施例。
如背景技术所述,体系结构建模技术能够从多视角对体系结构进行全方位的描述,目前体系结构模型的构建主要依靠人工完成。然而,随着体系复杂程度越来越高,人工构建体系结构模型的方法暴露出采集数据难度大,模型构建效率低等问题。亟需一种体系结构智能建模方法满足当前以及未来的体系结构建模需求,能够提高建模效率,确保模型规范。
针对上述相关技术存在的问题, 如图1所示,本发明实施例提供一种建模方法,包括:
构建体系结构知识本体;
构建用于识别体系结构命名实体的识别模型,并将获得的关于体系结构知识本体的文本数据进行序列标注,形成识别模型的训练数据;
基于体系结构知识本体构建实体关系抽取规则库,规则库能够用于抽取体系结构关系数据;
基于识别模型识别待测数据得到的命名实体数据以及自关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱;
基于体系结构知识图谱及体系结构知识本体构建知识推理规则库,推理规则库用于挖掘各体系结构知识图谱中的隐含体系结构数据;
至少基于不同体系结构模型及其对应的体系结构数据构建数据-模型转换规则,体系结构数据包括由知识推理规则库输出的隐含体系结构数据;
基于待处理的体系结构数据及数据-模型转换规则自动生成体系结构模型。
基于上述内容可知本实施例的建模方法,以体系结构知识本体的描述文本为初始数据,利用知识图谱构建采集体系结构数据的抽取规则库,并基于知识推理规则实现隐含数据的挖掘,最终基于获得的体系结构数据等构建数据-模型转换规则库,使通过构建数据-模型转换规则库,使得用户可以基于需求而通过设备自动生成对应地体系结构模型,或设备自主根据计算需求等而自动生成对应地体系结构模型,显著提升了体系结构模型的生成速度及效率,应用范围广泛。
进一步地,例如以构建首都地面防空反导体系结构模型为例,在构建体系结构知识本体时,可以构建空天防御体系结构知识本体,当然还可以构建其他体系领域的知识本体,具体不唯一。在构建空天防御体系结构知识本体时包括:
选取DoDAF元模型作为空天防御体系结构知识本体的构建基础,参照DoDAF元模型中的概念数据,定义空天防御体系结构知识本体中的实体类型、关系类型以及属性类型。实体类型包括:“活动”“能力”“位置”“组织”“执行者”“系统”共6种。关系类型包括:“活动-包含-活动”“活动-发生于-位置”“能力-包含-能力”“能力-支持-活动”“执行者-包含-执行者”“执行者-执行-活动”“执行者-具有-能力”“执行者-部署于-位置”“组织-属于-执行者”“系统-属于-执行者”共10种,由于“组织”“系统”是“执行者”的子类型,“组织”“系统”继承“执行者”具有的关系类型,扩展出关系类型“组织-执行-活动”等共10种。每一类实体类型具有“编号”属性类型,例如“能力”具有“能力编号”属性,作为“能力”的唯一标识。
在上述步骤定义的实体类型、关系类型、属性类型的基础上,考虑空天防御体系的具体特征,对实体类型、关系类型、属性类型进行细化和补充。在空天防御体系中,“防空反导系统”具有“战略级反导系统”和“非战略级反导系统”两种子类型;“防空反导系统”实体类型具有“最远射程(Km)”和“拦截高度(Km)”两种属性;“系统”实体类型具有“研制或服役状态”属性。构建完成的空天防御体系结构知识本体可结合图2所示。通过基于体系结构元模型和用户需求等来构建体系结构领域知识本体,对体系结构数据的采集、组织和存储起到规范指导作用。
进一步地,将获得的关于体系结构知识本体的文本数据进行序列标注,形成识别模型的训练数据,包括:
获得对应体系结构知识本体所属领域的描述文本;
对描述文本进行预处理;
将预处理后的描述文本基于BIO标注法及确定的标注标签进行标注,以形成训练数据,标注标签基于体系结构知识本体确定。
例如,仍以上述实施例为例,在为支持后续步骤中识别模型的训练,需要采集、预处理空天防御体系领域相关的体系结构描述文本数据,并对预处理数据进行序列标注,以获得训练数据。
具体地,空天防御体系领域及其体系结构知识本体相关的体系结构描述文本数据可以依靠爬虫程序、人工相结合的采集方式,主要从相关网页、文献中采集获得。此时的文本数据若以段落的形式存在,不具有标准的格式,便需要进行数据预处理。首先以句号、分号、回车符为切分依据将段落形式的文本数据切分为句子形式,由于在BiLSTM-CRF(例如后文所述的建立的识别模型为BiLSTM-CRF命名实体识别模型)命名实体抽取模型中采用的是字符向量而不是词向量,所以此处的数据预处理不涉及中文分词操作。获得句子形式的文本数据后,去除文本数据中的停用词、标点、空格。经过上述预处理操作,得到具有标准格式的文本数据。
得到预处理文本数据后,采用BIO标注方法对文本数据进行序列标注。BIO标注是将句子中的每个元素标注为“B-X”、“I-X”或者“O”。其中,“B-X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I-X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型。根据空天防御体系结构知识本体明确标注标签类型,包括B-SYS、I-SYS、B-ACT、I-ACT等共22种标签类型。文本数据序列标注采用人工标注的方法,可以保证序列标注的准确率,从而使BiLSTM-CRF命名实体识别模型达到最好的训练效果。
进一步地,在建立识别模型时,本实施例中采用BiLSTM-CRF深度学习模型执行体系结构命名实体识别任务,该模型在不同领域的命名实体识别任务中均表现良好。在BiLSTM-CRF模型构建过程中将隐藏层维度hidden_dim设置为300,字符嵌入向量的维度设置为300,并且将标注标签添加到字典中。BiLSTM-CRF模型构建完成后,将步骤二中得到的训练数据输入模型进行训练,字符嵌入向量一般选择随机初始化,并且在训练过程中所有的字符嵌入向量都会被学习调整,CRF层也可以在训练数据时自动学习得到一些约束以有效减少非法的预测序列。BiLSTM-CRF模型训练过程中,将epoch设置为12,并且利用F值作为命名实体识别准确率的评价指标,其计算公式为:
基于前述实施例得到的训练数据训练模型的过程中可能会出现过拟合现象,及时保存具有最大F值的BiLSTM-CRF模型,该模型具有最好的命名实体识别效果。
BiLSTM-CRF模型训练完成后,该模型便可执行体系结构命名实体识别任务。例如将首都地面防空反导体系结构描述文本数据输入BiLSTM-CRF模型中,文本数据中的每个字符被表征为字符向量形式。经过模型处理便可输出每个字符对应每个标签的分值,设备需将最大分值对应的标签作为对该字符的预测标签,便可基于此识别出体系结构命名实体。
进一步地,本实施例中的体系结构知识本体包括多个,多个体系结构知识本体分别对应不同的体系领域;
基于体系结构知识本体构建实体关系抽取规则库,包括:
基于各个体系结构知识本体的各个体系结构关系类型的文本数据确定对应每个关系类型的关系词,关系词包含关系语义信息;
基于各关系词及由各体系结构知识本体确定的各头尾实体确定实体关系抽取规则;
基于关系抽取规则构建关系抽取规则库。
例如,继续上一实施例,根据空天防御体系结构知识本体,结合每一种关系类型常用的自然语言表述形式,确定每一种关系类型对应的关系词,关系词是指包含关系语义的字词或者句式。然后结合关系词以及头尾实体的实体类型明确关系抽取规则,构建体系结构关系抽取规则库。具体的体系结构关系抽取规则如下表所示:
关系抽取规则库构建完成后,可以将例如首都地面防空反导体系结构描述文本数据与体系结构关系抽取规则进行匹配,输出相匹配的关系类型以及头尾实体,得到首都地面防空反导体系结构关系数据。另外,实体属性数据的采集可以作为一种特殊的关系抽取类型。
进一步地,在基于识别模型识别待测数据得到的命名实体数据以及自关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱,包括:
获得识别模型对输入的体系结构知识本体所属领域的描述文本进行计算输出的命名实体数据;
获得自关系抽取规则库中抽取的对应体系结构知识本体的体系结构关系数据;
基于命名实体数据及体系结构关系数据构建体系结构知识图谱。
例如可以是根据前述步骤获得的体系结构命名实体数据和体系结构关系数据构建首都地面防空反导体系结构知识图谱。
具体地,根据前述步骤获得的体系结构数据,可以选择利用Neo4j图数据库构建首都地面防空反导体系结构知识图谱。知识图谱构建可以采用人工添加节点、关系、属性数据的构建方式,在知识图谱中添加“系统”节点“A-235战略反导系统”的函数语句如下:
其中,“系统”为新建节点的类型,“A-235战略反导系统”为新建节点的名称,“intercept height: 500-750Km”为新建节点的“拦截高度”属性。在知识图谱中添加关系“A-235战略反导系统 - 执行 - 摧毁弹道目标”的函数语句如下:
其中,match语句的目的是匹配“A-235战略反导系统”和“摧毁弹道目标”两个节点,create语句创建节点“A-235战略反导系统”到节点“摧毁弹道目标”之间的“执行”关系。该具体构建的首都地面防空反导体系结构知识图谱如图3所示。
进一步地,当在体系结构知识本体包括多个,多个体系结构知识本体分别对应不同体系领域的情况下,本实施例中的基于体系结构知识图谱及体系结构知识本体构建知识推理规则库,包括:
根据各体系结构知识本体中的实体类型与体系结构关系数据确定对应每种关系类型的候选推理规则;
基于多个候选推理规则处理体系结构知识图谱,并基于处理结果自多个候选推理规则中确定推理规则;
基于推理规则构建知识推理规则库。
例如,由于知识抽取存在误差,会使得上述步骤获得的首都地面防空反导体系结构知识图谱可能存在数据缺失。根据空天防御体系结构知识本体,可以从本体层面分析考虑所有关系类型之间的推理关系,梳理符合逻辑的推理路径,并将符合逻辑的推理路径构建为知识推理规则。知识推理规则如下所示:
规则1:若[活动A]包含[活动B],且[活动A]发生于[位置X],则[活动B]发生于[位置X];
规则2:若[执行者A]包含[执行者B],且[执行者A]部署于[位置X],则[执行者B]部署于[位置X];
规则3:若[执行者A]执行[活动B],且[活动B]发生于[位置X],则[执行者A]部署于[位置X];
规则4:若[执行者A]具有[能力B],且[能力B]支持[活动C],则[执行者A]执行[活动C]。
根据体系结构知识推理规则可以构建相应的规则库,各个推理规则可用于挖掘首都地面防空反导体系结构知识图谱中未知或隐含的体系结构数据,得到更加完整的首都地面防空反导体系结构数据。
另外,为了扩充推理规则,可以设置多个对应不同体系领域的不同的体系结构知识本体。
进一步地,至少基于不同体系结构模型及其对应的体系结构数据构建数据-模型转换规则,包括:
根据体系结构知识本体以及不同体系结构模型被构建时所需的体系结构数据类型,形成不同体系结构知识本体的特征与体系结构模型中的特征之间的映射关系;
基于映射关系构建数据-模型转换规则。
例如,可以根据体系结构模型的呈现形式,将多种体系结构模型分类为表格型、结构型、行为型、映射型、本体型、图片型、时间进度型等类型。具有相同呈现形式的体系结构模型在模型生成时制定的数据-模型转换规则是相似的。接着明确构建每一种体系结构模型需要的体系结构数据类型,在模型生成过程中重点关注构建该模型所需要的数据类型。再根据所述体系结构知识本体,以及每一种模型构建需要的数据类型,形成知识本体中的概念数据与体系结构模型中的模型要素之间的映射关系,构建数据-模型转换规则。最后根据体系结构数据,以及所述数据-模型转换规则,自动生成体系结构模型。
具体地,实施时,可以根据DoDAF体系结构模型构建标准,以及每一种体系结构模型构建所需的数据类型,构建数据-模型转换规则库,自动生成体系结构模型。本实施例构建首都地面防空反导体系的系统接口描述模型(SV-1)和作战活动-系统跟踪矩阵(SV-5b)。
系统接口描述模型(SV-1),描述系统及其相互关系,一般采用结构型呈现形式。本实施例采用SysML建模语言中的块定义图作为SV-1模型的呈现形式。根据步骤一构建的空天防御体系结构知识本体,明确构建SV-1模型需要的数据类型,具体需要的体系结构数据类型包括实体类型“系统”,关系类型“[系统]包含[系统]”,属性类型“系统编号”“研制或服役状态”“拦截射程”“拦截高度”。针对SV-1模型生成构建的数据-模型转换规则如下:
规则一:实体类型“系统”的每一个“系统”实例在SV-1模型中对应生成同名Block模块。
规则二:顶层“系统”实例生成顶层Block模块,顶层“系统”实例包含的“系统”实例生成下层Block模块。关系类型“[系统]包含[系统]”的每一个实例数据生成对应Block模块之间的关联线,并且关联线类型为“包含”。
规则三:实体类型“系统”的每一个实例数据具有的属性“系统编号”“研制或服役状态”“拦截射程”“拦截高度”生成对应Block模块的Property。
生成的首都地面防空反导体系SV-1模型如图4所示。
而作战活动-系统跟踪矩阵(SV-5b),描述系统与作战活动之间的支持关系,一般采用映射型呈现形式。本实施例采用映射矩阵作为SV-5b模型的呈现形式。根据步骤一构建的空天防御体系结构知识本体,明确构建SV-5b模型需要的数据类型,具体需要的体系结构数据类型包括实体类型“系统”“活动”,关系类型“[系统]支持[活动]”。针对SV-5b模型生成构建的数据-模型转换规则如下:
规则一:关系类型“[系统]支持[活动]”的所有实例数据中涉及的“系统”实例对应生成映射矩阵的首行。
规则二:关系类型“[系统]支持[活动]”的所有实例数据中涉及的“活动”实例对应生成映射矩阵的首列。
规则三:关系类型“[系统]支持[活动]”的每一个实例数据对应生成映射矩阵对应单元格内的“√”符号。
具体如下所示。
如图5所示,本发明另一实施例同时提供一种建模装置,包括:
第一构建模块,用于构建体系结构知识本体;
第二构建模块,用于构建用于识别体系结构命名实体的识别模型,并将获得的关于所述体系结构知识本体的文本数据进行序列标注,形成所述识别模型的训练数据;
第三构建模块,用于根据所述体系结构知识本体构建实体关系抽取规则库,所述规则库能够用于抽取体系结构关系数据;
第四构建模块,用于根据所述识别模型识别待测数据得到的命名实体数据以及自所述关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱;
第五构建模块,用于根据所述体系结构知识图谱及体系结构知识本体构建知识推理规则库,所述推理规则库用于挖掘各体系结构知识图谱中的隐含体系结构数据;
第六构建模块,用于至少基于不同体系结构模型及其对应的体系结构数据构建数据-模型转换规则,所述体系结构数据包括由所述知识推理规则库输出的隐含体系结构数据;
生成模块,用于根据待处理的体系结构数据及数据-模型转换规则自动生成体系结构模型。
作为一可选实施例,所述将获得的关于所述体系结构知识本体的文本数据进行序列标注,形成所述识别模型的训练数据,包括:
获得对应所述体系结构知识本体所属领域的描述文本;
对所述描述文本进行预处理;
将预处理后的所述描述文本基于BIO标注法及确定的标注标签进行标注,以形成所述训练数据,所述标注标签基于所述体系结构知识本体确定。
作为一可选实施例,所述体系结构知识本体包括多个,多个所述体系结构知识本体分别对应不同的领域;
所述基于所述体系结构知识本体构建实体关系抽取规则库,包括:
基于各个所述体系结构知识本体的各个体系结构关系类型的文本数据确定对应每个所述关系类型的关系词,所述关系词包含关系语义信息;
基于各关系词及各所述体系结构知识本体的头尾实体确定实体关系抽取规则;
基于所述关系抽取规则构建所述关系抽取规则库。
作为一可选实施例,所述基于所述识别模型识别待测数据得到的命名实体数据以及自所述规则库中抽取的体系结构关系数据构建体系结构知识图谱,包括:
获得所述识别模型对输入的对应所述体系结构知识本体所属领域的描述文本进行计算输出的命名实体数据;
获得自所述关系抽取规则库中抽取的对应所述体系结构知识本体的体系结构关系数据;
基于所述命名实体数据及体系结构关系数据构建所述体系结构知识图谱。
作为一可选实施例,所述体系结构知识本体包括多个,多个所述体系结构知识本体分别对应不同的领域;
所述基于所述体系结构知识图谱及体系结构知识本体构建知识推理规则库,包括:
根据各所述体系结构知识本体中的实体类型与体系结构关系数据确定对应每种关系类型的候选推理规则;
基于多个所述候选推理规则处理所述体系结构知识图谱,并基于处理结果自多个所述候选推理规则中确定推理规则;
基于所述推理规则构建所述知识推理规则库。
作为一可选实施例,所述至少基于不同体系结构模型及其对应的体系结构数据构建数据-模型转换规则,包括:
根据所述体系结构知识本体以及不同体系结构模型被构建时所需的体系结构数据类型,形成不同体系结构知识本体的特征与体系结构模型中的特征之间的映射关系;
基于所述映射关系构建所述数据-模型转换规则。
本发明另一实施例还提供一种电子设备,包括:
一个或多个处理器;
存储器,配置为存储一个或多个程序;
当该一个或多个程序被该一个或多个处理器执行时,使得该一个或多个处理器实现上述建模方法。
本发明一实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的建模方法。应理解,本实施例中的各个方案具有上述方法实施例中对应的技术效果,此处不再赘述。
本发明另一实施例还提供了一种计算机程序产品,所述计算机程序产品被有形地存储在计算机可读介质上并且包括计算机可读指令,所述计算机可执行指令在被执行时使至少一个处理器执行诸如上文所述实施例中的建模方法。应理解,本实施例中的各个方案具有上述方法实施例中对应的技术效果,此处不再赘述。
需要说明的是,本申请的计算机存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读介质例如可以但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储介质(RAM)、只读存储介质(ROM)、可擦式可编程只读存储介质(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储介质(CD-ROM)、光存储介质件、磁存储介质件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输配置为由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、天线、光缆、RF等等,或者上述的任意合适的组合。
应当理解,虽然本申请是按照各个实施例描述的,但并非每个实施例仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。
Claims (10)
1.一种体系结构建模方法,其特征在于,包括:
构建体系结构知识本体;
构建用于识别体系结构命名实体的识别模型,并将获得的关于所述体系结构知识本体的文本数据进行序列标注,形成所述识别模型的训练数据;
基于所述体系结构知识本体构建实体关系抽取规则库,所述规则库能够用于抽取体系结构关系数据;
基于所述识别模型识别待测数据得到的命名实体数据以及自所述关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱;
基于所述体系结构知识图谱及体系结构知识本体构建知识推理规则库,所述推理规则库用于挖掘各体系结构知识图谱中的隐含体系结构数据;
至少基于不同体系结构模型及其对应的体系结构数据构建数据-模型转换规则,所述体系结构数据包括由所述知识推理规则库输出的隐含体系结构数据;
基于待处理的体系结构数据及数据-模型转换规则自动生成体系结构模型。
2.根据权利要求1所述的体系结构建模方法,其特征在于,所述将获得的关于所述体系结构知识本体的文本数据进行序列标注,形成所述识别模型的训练数据,包括:
获得对应所述体系结构知识本体所属领域的描述文本;
对所述描述文本进行预处理;
将预处理后的所述描述文本基于BIO标注法及确定的标注标签进行标注,以形成所述训练数据,所述标注标签基于所述体系结构知识本体确定。
3.根据权利要求1所述的体系结构建模方法,其特征在于,所述体系结构知识本体包括多个,多个所述体系结构知识本体分别对应不同的领域;
所述基于所述体系结构知识本体构建实体关系抽取规则库,包括:
基于各个所述体系结构知识本体的各个体系结构关系类型的文本数据确定对应每个所述关系类型的关系词,所述关系词包含关系语义信息;
基于各关系词及由各所述体系结构知识本体确定的头尾实体确定实体关系抽取规则;
基于所述关系抽取规则构建所述关系抽取规则库。
4.根据权利要求1所述的体系结构建模方法,其特征在于,所述基于所述识别模型识别待测数据得到的命名实体数据以及自所述关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱,包括:
获得所述识别模型对输入的对应所述体系结构知识本体所属领域的描述文本进行计算输出的命名实体数据;
获得自所述关系抽取规则库中抽取的对应所述体系结构知识本体的体系结构关系数据;
基于所述命名实体数据及体系结构关系数据构建所述体系结构知识图谱。
5.根据权利要求1所述的体系结构建模方法,其特征在于,所述体系结构知识本体包括多个,多个所述体系结构知识本体分别对应不同的领域;
所述基于所述体系结构知识图谱及体系结构知识本体构建知识推理规则库,包括:
根据各所述体系结构知识本体中的实体类型与体系结构关系数据类型确定对应每种关系类型的候选推理规则;
基于多个所述候选推理规则处理所述体系结构知识图谱,并基于处理结果自多个所述候选推理规则中确定推理规则;
基于所述推理规则构建所述知识推理规则库。
6.根据权利要求1所述的体系结构建模方法,其特征在于,所述至少基于不同体系结构模型及其对应的体系结构数据构建数据-模型转换规则,包括:
根据所述体系结构知识本体以及不同体系结构模型被构建时所需的体系结构数据类型,形成不同体系结构知识本体的特征与体系结构模型中的特征之间的映射关系;
基于所述映射关系构建所述数据-模型转换规则。
7.一种体系结构建模装置,其特征在于,包括:
第一构建模块,用于构建体系结构知识本体;
第二构建模块,用于构建用于识别体系结构命名实体的识别模型,并将获得的关于所述体系结构知识本体的文本数据进行序列标注,形成所述识别模型的训练数据;
第三构建模块,用于根据所述体系结构知识本体构建实体关系抽取规则库,所述规则库能够用于抽取体系结构关系数据;
第四构建模块,用于根据所述识别模型识别待测数据得到的命名实体数据以及自所述关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱;
第五构建模块,用于根据所述体系结构知识图谱及体系结构知识本体构建知识推理规则库,所述推理规则库用于挖掘各体系结构知识图谱中的隐含体系结构数据;
第六构建模块,用于至少基于不同体系结构模型及其对应的体系结构数据构建数据-模型转换规则,所述体系结构数据包括由所述知识推理规则库输出的隐含体系结构数据;
生成模块,用于根据待处理的体系结构数据及数据-模型转换规则自动生成体系结构模型。
8.根据权利要求7所述的体系结构建模装置,其特征在于,所述将获得的关于所述体系结构知识本体的文本数据进行序列标注,形成所述识别模型的训练数据,包括:
获得对应所述体系结构知识本体所属领域的描述文本;
对所述描述文本进行预处理;
将预处理后的所述描述文本基于BIO标注法及确定的标注标签进行标注,以形成所述训练数据,所述标注标签基于所述体系结构知识本体确定。
9.根据权利要求7所述的体系结构建模装置,其特征在于,所述体系结构知识本体包括多个,多个所述体系结构知识本体分别对应不同的领域;
所述根据所述体系结构知识本体构建实体关系抽取规则库,包括:
基于各个所述体系结构知识本体的各个体系结构关系类型的文本数据确定对应每个所述关系类型的关系词,所述关系词包含关系语义信息;
基于各关系词及由各所述体系结构知识本体确定的头尾实体确定实体关系抽取规则;
基于所述关系抽取规则构建所述关系抽取规则库。
10.根据权利要求7所述的体系结构建模装置,其特征在于,所述根据所述识别模型识别待测数据得到的命名实体数据以及自所述关系抽取规则库中抽取的体系结构关系数据构建体系结构知识图谱,包括:
获得所述识别模型对输入的对应所述体系结构知识本体所属领域的描述文本进行计算输出的命名实体数据;
获得自所述关系抽取规则库中抽取的对应所述体系结构知识本体的体系结构关系数据;
基于所述命名实体数据及体系结构关系数据构建所述体系结构知识图谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210559784.6A CN114647744B (zh) | 2022-05-23 | 2022-05-23 | 一种体系结构建模方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210559784.6A CN114647744B (zh) | 2022-05-23 | 2022-05-23 | 一种体系结构建模方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114647744A true CN114647744A (zh) | 2022-06-21 |
CN114647744B CN114647744B (zh) | 2022-08-12 |
Family
ID=81996565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210559784.6A Active CN114647744B (zh) | 2022-05-23 | 2022-05-23 | 一种体系结构建模方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114647744B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170124497A1 (en) * | 2015-10-28 | 2017-05-04 | Fractal Industries, Inc. | System for automated capture and analysis of business information for reliable business venture outcome prediction |
CN107193995A (zh) * | 2017-06-08 | 2017-09-22 | 网帅科技(北京)有限公司 | 一种位置分类规则库管理系统及其编码方法 |
CN113407725A (zh) * | 2020-03-17 | 2021-09-17 | 复旦大学 | 基于知识图谱构建规章的本体模型的方法 |
CN113672599A (zh) * | 2020-09-30 | 2021-11-19 | 华斌 | 通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法 |
-
2022
- 2022-05-23 CN CN202210559784.6A patent/CN114647744B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170124497A1 (en) * | 2015-10-28 | 2017-05-04 | Fractal Industries, Inc. | System for automated capture and analysis of business information for reliable business venture outcome prediction |
CN107193995A (zh) * | 2017-06-08 | 2017-09-22 | 网帅科技(北京)有限公司 | 一种位置分类规则库管理系统及其编码方法 |
CN113407725A (zh) * | 2020-03-17 | 2021-09-17 | 复旦大学 | 基于知识图谱构建规章的本体模型的方法 |
CN113672599A (zh) * | 2020-09-30 | 2021-11-19 | 华斌 | 通过创建领域知识图谱实现政务信息化项目建设管理的可视化辅助决策方法 |
Non-Patent Citations (1)
Title |
---|
葛冰峰等: "可执行体系结构建模与分析", 《系统工程理论与实践》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114647744B (zh) | 2022-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111353310B (zh) | 基于人工智能的命名实体识别方法、装置及电子设备 | |
CN111078836B (zh) | 基于外部知识增强的机器阅读理解方法、系统、装置 | |
CN110633409B (zh) | 一种融合规则与深度学习的汽车新闻事件抽取方法 | |
CN112214610B (zh) | 一种基于跨度和知识增强的实体关系联合抽取方法 | |
Tran et al. | Neural metric learning for fast end-to-end relation extraction | |
CN111738001B (zh) | 同义词识别模型的训练方法、同义词确定方法及设备 | |
CN112711953A (zh) | 一种基于注意力机制和gcn的文本多标签分类方法和系统 | |
CN112149421A (zh) | 一种基于bert嵌入的软件编程领域实体识别方法 | |
CN111046671A (zh) | 基于图网络融入词典的中文命名实体识别方法 | |
US11170169B2 (en) | System and method for language-independent contextual embedding | |
Lin et al. | Deep structured scene parsing by learning with image descriptions | |
CN111813931A (zh) | 事件检测模型的构建方法、装置、电子设备及存储介质 | |
CN105260488A (zh) | 一种用于语义理解的文本序列迭代方法 | |
CN112528658A (zh) | 层次化分类方法、装置、电子设备和存储介质 | |
Dai et al. | Relation classification via LSTMs based on sequence and tree structure | |
Bao et al. | Text generation from tables | |
CN117952104A (zh) | 一种基于大模型与知识图谱融合的小样本三元组抽取方法 | |
CN113779202B (zh) | 命名实体识别方法、装置、计算机设备和存储介质 | |
CN113220854B (zh) | 机器阅读理解的智能对话方法及装置 | |
CN116386148B (zh) | 基于知识图谱引导的小样本动作识别方法及系统 | |
CN114647744B (zh) | 一种体系结构建模方法及装置 | |
CN116702784A (zh) | 实体链接方法、装置、计算机设备和存储介质 | |
Du et al. | Knowledge extract and ontology construction method of assembly process text | |
CN110489740A (zh) | 语义解析方法及相关产品 | |
CN115658845A (zh) | 一种适用于开源软件供应链的智能问答方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |