CN109947950B - 基于中间层核心本体的领域知识图谱的构建方法和装置 - Google Patents

基于中间层核心本体的领域知识图谱的构建方法和装置 Download PDF

Info

Publication number
CN109947950B
CN109947950B CN201910193557.4A CN201910193557A CN109947950B CN 109947950 B CN109947950 B CN 109947950B CN 201910193557 A CN201910193557 A CN 201910193557A CN 109947950 B CN109947950 B CN 109947950B
Authority
CN
China
Prior art keywords
domain
ontology
module
knowledge graph
constructing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910193557.4A
Other languages
English (en)
Other versions
CN109947950A (zh
Inventor
龙海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha Aoben Intelligence Technology Co ltd
Original Assignee
Changsha Aoben Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changsha Aoben Intelligence Technology Co ltd filed Critical Changsha Aoben Intelligence Technology Co ltd
Priority to CN201910193557.4A priority Critical patent/CN109947950B/zh
Publication of CN109947950A publication Critical patent/CN109947950A/zh
Application granted granted Critical
Publication of CN109947950B publication Critical patent/CN109947950B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Machine Translation (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了基于中间层核心本体的领域知识图谱的构建方法和装置,属于知识图谱技术领域,构建方法包括以下步骤:步骤S1:构建基于通用形式化本体顶层本体的领域核心本体,即中间层核心本体;步骤S2:按照通用形式化本体自底向上构建领域本体模块,形成模块化的领域本体;步骤S3:对中间层核心本体和模块化的领域本体进行链接处理;步骤S4:以模块集成的方式形成一个具有统一语义规范和通用形式化本体顶层框架的领域知识图谱;步骤S5:对领域知识图谱进行维护和升级,融合了自顶向下和自底向上两种方式,提供一个基于顶层本体框架的具有统一语义规范的知识图谱建模方法。

Description

基于中间层核心本体的领域知识图谱的构建方法和装置
技术领域
本发明涉及知识图谱技术领域,更具体地说,它涉及一种基于中间层核心本体的领域知识图谱的构建方法和装置。
背景技术
知识图谱是一种以语义网络形式表示的知识库,用图的形式描述客观世界的概念,实体,事件及其相互之间的关系。其中,概念是指人们在认识世界过程中形成的对客观事物的概念化表示,如人,动物,组织机构等;实体是客观世界中的具体事物;事件是客观世界中可观察或可感受到的某些过程或活动;关系描述概念,实体,事件之间客观存在的关联。这里的图指的是数据结构中的图,也就是由节点(node)和边(edge)组成的。知识图谱以结构化的形式描述客观世界中的概念实体及其关系,将互联网信息表达成人类认知世界的形式,提供了一种更好地组织,管理和理解互联网海量信息的能力。知识图谱与大数据和深度学习一起,成为互联网和人工智能发展的核心驱动力之一。
知识图谱技术是指知识图谱建立和应用的技术,它融合了认知计算,知识表示与推理,信息检索与抽取,自然语言处理与语义Web,数据挖掘与机器学习等方向的交叉研究。知识图谱已经在人工和商业智能等领域有了一系列的应用,包括语义搜索,聊天机器人,临床决策支持等。通过知识图谱,可以实现Web从网页链接向概念链接转变,支持用户按主题而不是字符串检索,从而真正实现语义检索,基于知识图谱的搜索引擎,能够以图形方式向用户反馈结构化的知识,用户不必再次自行浏览大量网页链接即可准确地获取和定位目标知识作为答案。
现有的知识图谱构建方法有自顶向下和自底向上两种。其中自顶向下构建又分为两种方式,一种是指对构建通用型知识图谱而言,借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库里。而对于构建行业知识图谱或某些垂直领域知识图谱而言,由于其行业术语、行业数据都相对比较清晰规范,可以先确定知识图谱的数据模型,然后根据数据模型约定的框架,再补充数据,完成知识图谱的构建。数据模型的构建,一般会先找到一个基础的参照模型,这个参照模型,可以参考比如行业的具体数据表示标准和规范,整合该标准规范中对各种行业数据的说明要求,逐渐形成一个基础的数据模型,及逐步形成某种行业相关的领域本体,再根据实际收集的数据情况逐步完善数据模型。也可从公开的各种知识图谱或数据库中当中抽取有关数据,结合有关的行业知识进行完善和整合。对于自顶向下的构建方式,随着数据量的不断积累,可能会发现原来的数据模型并不完善,有很多数据可能没有包含在数据模型的体系中,这时候就需要修订数据模型,根据数据的特点,完善数据模型。这个过程往往需要领域专家参与,费时费力,相当繁琐。而且对于不同领域之间,以及同个领域不同数据库或知识库之间的数据集之间进行映射时,横向之间的兼容性较差,从而使得有关知识之间的共享和可复用性受到较大限制。
而自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的信息,加入到知识库中。一般包括三个阶段:信息抽取:从各种类型的数据源当中提取出实体,属性以及实体间的相互关系,在此基础上形成本体化的知识表达;知识融合:在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应多个不同的实体等;知识加工:对于经过融合的新知识,需要经过质量评估之后,才能将合格的部分加入到知识库当中,以确保知识库的质量。这种方式通常是以一种自动化或半自动化的方式来实现的,但是由于缺乏统一的指导方法和标准,难以对领域知识进行广泛的覆盖和深度理解,所提供知识的准确性有时难以保证。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种基于中间层核心本体的领域知识图谱的构建方法和装置。
为实现上述目的,本发明提供了如下技术方案:
基于中间层核心本体的领域知识图谱的构建方法,包括以下步骤:
步骤S1:构建基于通用形式化本体顶层本体的领域核心本体,即中间层核心本体;
步骤S2:按照通用形式化本体自底向上构建领域本体模块,形成模块化的领域本体;
步骤S3:对所述中间层核心本体和所述模块化的领域本体进行链接处理,在已经建好的所述中间层核心本体与所述模块化的领域本体之间通过链接建立映射和对应关系;
步骤S4:返回步骤S2,通过不断构建更新所述领域本体模块或复用现有所述领域核心本体的方式,通过链接、映射与合并,将新的知识图谱补入到中间层核心本体知识图谱当中,并以模块集成的方式形成一个具有统一语义规范和所述通用形式化本体顶层框架的领域知识图谱;
步骤S5:对所述领域知识图谱进行维护和升级。
通过上述技术方案,融合了自顶向下和自底向上来构建本体的两种优势特征,能快速对领域建模,基于一个统一的语义框架,知识内容可以在不同领域本体或平台系统之间复用和互操作,知识图谱也具有良好的可扩展性和与兼容性。顶层本体具有普通性和抽象性,它可以作为构建领域本体的基础,并且为不同系统提供一个共同的知识库顶层框架。利用GFO顶层本体中已有的概念集,规范的关系定义和功能定义,以及合理的逻辑结构,通过GFO顶层本体来构建某个行业相关的领域顶层本体,作为中间层本体,可以大大减少知识图谱构建过程中的复杂性和由于数据来源多样化及数据缺失所带来不确定性。同时通过遵循统一的标准规范,能在不同本体库或知识系统之间建立映射(本体对齐)以实现知识的复用共享和互操作性,也可在现有的中医药领域知识库与其他领域知识库之间进行了整合。
进一步优选为:在步骤S2中,所述领域本体模块的构建方法包括以下步骤:
步骤S21:获取领域本体的覆盖范围;
步骤S22:根据所述覆盖范围获取与所述领域本体概念相对应的相关术语;
步骤S23:获取与所述相关术语相对应的概念化定义;
步骤S24:对所述概念化定义进行公理化表达;
步骤S25:通过所述领域本体的公理化表达进行建模,形成模块化的领域本体;
步骤S26:对所述模块化的领域本体进行评估和更新。
进一步优选为:在步骤S1中,所述领域核心本体构建之后,还包括对所述领域核心本体进行正确性审核。
进一步优选为:在步骤S2中,所述模块化的领域本体构建之后,还包括对所述模块化的领域本体进行正确性审核。
进一步优选为:在步骤S4中,所述领域知识图谱构建之后,还包括对所述领域知识图谱进行正确性审核。
进一步优选为:所述领域核心本体为中医药领域核心本体;所述领域本体所述中医药领域本体;所述领域知识图谱为中医药领域知识图谱。
进一步优选为:在步骤S1中,所述领域核心本体构建方法包括以下步骤:
步骤S11:获取现有TCMLS-SN顶层框架中的基本概念体系和语义关系;
步骤S12:对现有TCMLS-SN顶层框架中的基本概念体系和语义关系进行预处理,并整合到所述通用形式化本体顶层本体的规范与标准中;
步骤S13:通过实体合并与重构,将所述TCMLS-SN顶层框架中的顶层节点集合与所述通用形式化本体顶层本体中的顶层抽象节点建立映射关系,形成基于所述通用形式化本体顶层本体的所述领域核心本体。
基于中间层核心本体的领域知识图谱的构建装置,包括:
领域核心本体构建模块,用于构建基于通用形式化本体顶层本体的领域核心本体,即中间层核心本体;
领域本体模块构建模块,用于按照通用形式化本体自底向上构建领域本体模块,形成模块化的领域本体;
链接处理模块,用于对所述中间层核心本体和所述模块化的领域本体进行链接处理,在已经建好的所述中间层核心本体与所述模块化的领域本体之间通过链接建立映射和对应关系;
领域知识图谱获取模块,用于返回所述领域本体模块构建模块,通过不断构建更新所述领域本体模块或复用现有所述领域核心本体的方式,通过链接、映射与合并,将新的知识图谱补入到中间层核心本体知识图谱当中,并以模块集成的方式形成一个具有统一语义规范和所述通用形式化本体顶层框架的领域知识图谱;
维护和升级模块,用于对所述领域知识图谱进行维护和升级。
进一步优选为:所述领域核心本体构建模块包括:
TCMLS-SN顶层框架获取模块,用于获取现有TCMLS-SN顶层框架中的基本概念体系和语义关系;
预处理模块,用于对现有TCMLS-SN顶层框架中的基本概念体系和语义关系进行预处理,并整合到所述通用形式化本体顶层本体的规范与标准中;
实体合并与重构模块,用于通过实体合并与重构,将所述TCMLS-SN顶层框架中的顶层节点集合与所述通用形式化本体顶层本体中的顶层抽象节点建立映射关系,形成基于所述通用形式化本体顶层本体的所述领域核心本体。
进一步优选为:所述领域本体模块构建模块包括:
领域本体覆盖范围获取模块,用于获取领域本体的覆盖范围;
相关术语获取模块,用于根据所述覆盖范围获取与所述领域本体概念相对应的相关术语;
概念化定义模块,用于获取与所述相关术语相对应的概念化定义;
公理化表达模块,用于对所述概念化定义进行公理化表达;
建模模块,用于通过所述领域本体的公理化表达进行建模,形成模块化的领域本体;
评估和更新模块,用于对所述模块化的领域本体进行评估和更新。
综上所述,本发明具有以下有益效果:融合了自顶向下和自底向上来构建本体的两种优势特征,能快速对领域建模,基于一个统一的语义框架,知识内容可以在不同领域本体或平台系统之间复用和互操作,知识图谱也具有良好的可扩展性和与兼容性。顶层本体具有普通性和抽象性,它可以作为构建领域本体的基础,并且为不同系统提供一个共同的知识库顶层框架。利用GFO顶层本体中已有的概念集,规范的关系定义和功能定义,以及合理的逻辑结构,通过GFO顶层本体来构建某个行业相关的领域顶层本体,作为中间层本体,可以大大减少知识图谱构建过程中的复杂性和由于数据来源多样化及数据缺失所带来不确定性。同时通过遵循统一的标准规范,能在不同本体库或知识系统之间建立映射(本体对齐)以实现知识的复用共享和互操作性,也可在现有的中医药领域知识库与其他领域知识库之间进行了整合。
对于基于自顶向下和自底向上的两种构建方式进行了融合,提供一个基于顶层本体框架的具有统一语义规范的中医知识图谱建模方法;并且这种知识图谱建模方法可以快速复制到任何其他领域或行业相关的知识图谱构建任务当中去。
基于统一的语义规范和形式化表达,不同的领域知识图谱模块之间的数据信息,可以很便捷地实现数据共享和互操作。
本体模块与模块之间既可以实现无缝对接,也可以作为某个独立的子学科领域本体单独应用。
能提供方便的业务支持场景,例如语义检索和知识推理。由于具有统一的语义规范和顶层框架,进行跨系统和平台的知识库查询时,能提供知识价值的复用和互操作性。
在GFO顶层本体框架下,本技术方案中提出的GFO核心本体可兼容GFO-BIO的概念体系。为实现中医药学与西医学知识体系之间的相互参照理解,以及知识整合提供了一个现实的桥梁和平台。
附图说明
图1是实施例的流程示意图,主要用于体现基于中间层核心本体的领域知识图谱的构建过程;
图2是实施例的流程示意图,主要用于体现领域核心本体的构建过程;
图3是实施例的流程示意图,主要用于体现领域本体模块的构建过程;
图4是实施例的系统架构示意图,主要用于体现基于中间层核心本体的领域知识图谱的构建装置;
图5是实施例领域核心本体构建模块的系统架构示意图;
图6是实施例领域本体模块构建模块的系统架构示意图;
图7是实施例GFO中医药核心本体的基本结构,主要用于体现领域核心本体设定为中医药核心本体时,GFO中医药核心本体的基本结构;
图8是实施例的映射关系示意图,主要用于体现领域核心本体设定为中医药核心本体时,GFO中医药核心本体与TCMLS-SN之间的映射关系;
图9是实施例的映射和对应关系图,主要用于体现领域本体模块与领域核心本体之间通过链接建立的映射和对应关系。
具体实施方式
下面结合附图和实施例,对本发明进行详细描述。
实施例:基于中间层核心本体的领域知识图谱的构建方法和装置,参照图4,基于中间层核心本体的领域知识图谱的构建装置包括领域核心本体构建模块110、领域本体模块构建模块120、链接处理模块130、领域知识图谱获取模块140和维护和升级模块150。其中领域核心本体构建模块110用于构建基于通用形式化本体(General Formal Ontology)顶层本体的领域核心本体,即中间层核心本体。领域本体模块构建模块120用于按照通用形式化本体自底向上构建领域本体模块,形成模块化的领域本体。链接处理模块130用于对中间层核心本体和模块化的领域本体进行链接处理,在已经建好的中间层核心本体与模块化的领域本体之间通过链接建立映射和对应关系。领域知识图谱获取模块140用于返回领域本体模块构建模块120,通过不断构建更新领域本体模块或复用现有领域核心本体的方式,通过链接、映射与合并,将新的知识图谱补入到中间层核心本体知识图谱当中,并以模块集成的方式形成一个具有统一语义规范和通用形式化本体顶层框架的领域知识图谱。维护和升级模块150用于对领域知识图谱进行维护和升级。
参照图5,领域核心本体构建模块110包括TCMLS-SN顶层框架获取模块1101、预处理模块1102和实体合并与重构模块1103。其中TCMLS-SN顶层框架获取模块1101用于获取现有TCMLS-SN顶层框架中的基本概念体系和语义关系;预处理模块1102用于对现有TCMLS-SN顶层框架中的基本概念体系和语义关系进行预处理,并整合到通用形式化本体顶层本体的规范与标准中;实体合并与重构模块1103用于通过实体合并与重构,将TCMLS-SN顶层框架中的顶层节点集合与通用形式化本体顶层本体中的顶层抽象节点建立映射关系,形成基于通用形式化本体顶层本体的领域核心本体。构建领域核心本体过程中,参考或复用现有TCMLS-SN顶层框架,将TCMLS-SN顶层框架的基本概念体系和语义关系整合到通用形式化本体(GFO)顶层本体的规范与标准中,并通过实体合并与重构的方式,将TCMLS-SN的顶层节点集合与通用形式化本体(GFO)当中的顶层抽象节点建立映射关系,并借助本体开发工具Protégé,从而构建一个基于通用形式化本体(GFO)顶层本体的领域核心本体。领域核心本体设定为中医药核心本体时,GFO中医药核心本体的基本结构参考图7,GFO中医药核心本体与TCMLS-SN之间的映射关系参考图8。
参照图6,领域本体模块构建模块120包括领域本体覆盖范围获取模块1201、相关术语获取模块1202、概念化定义模块1203、公理化表达模块1204、建模模块1205和评估和更新模块1206。领域本体覆盖范围获取模块1201用于获取领域本体的覆盖范围;相关术语获取模块1202用于根据覆盖范围获取与领域本体概念相对应的相关术语;概念化定义模块1203用于获取与相关术语相对应的概念化定义;公理化表达模块1204用于对概念化定义进行公理化表达;建模模块1205用于通过领域本体的公理化表达进行建模,形成模块化的领域本体;将构建好的模块化领域本体投入使用,并通过评估和更新模块1206对模块化的领域本体进行评估和更新。
参照图1、2、3,基于中间层核心本体的领域知识图谱的构建方法包括:
步骤S1:构建基于通用形式化本体顶层本体的领域核心本体,即中间层核心本体。
领域核心本体构建方法包括以下步骤:
步骤S11:获取现有TCMLS-SN顶层框架中的基本概念体系和语义关系;
步骤S12:对现有TCMLS-SN顶层框架中的基本概念体系和语义关系进行预处理,并整合到通用形式化本体顶层本体的规范与标准中;
步骤S13:通过实体合并与重构,将TCMLS-SN顶层框架中的顶层节点集合与通用形式化本体顶层本体中的顶层抽象节点建立映射关系,形成基于通用形式化本体顶层本体的领域核心本体。
领域核心本体构建之后,还包括对领域核心本体进行正确性审核,正确性审核由领域专家协同完成。
步骤S2:按照通用形式化本体自底向上构建领域本体模块,形成模块化的领域本体。
领域本体模块的构建方法包括以下步骤:
步骤S21:获取领域本体的覆盖范围;
步骤S22:根据覆盖范围获取与领域本体概念相对应的相关术语;
步骤S23:获取与相关术语相对应的概念化定义;
步骤S24:对概念化定义进行公理化表达;
步骤S25:通过领域本体的公理化表达进行建模,形成模块化的领域本体;
步骤S26:对模块化的领域本体进行评估和更新。
模块化的领域本体构建之后,还包括对模块化的领域本体进行正确性审核,正确性审核由领域专家协同完成。优选的,领域核心本体为中医药领域核心本体,但并不仅仅局限在此领域;领域本体中医药领域本体,但并不仅仅局限在此领域;领域知识图谱为中医药领域知识图谱,但并不仅仅局限在此领域。
现以构建中医银屑病领域知识图谱为例对领域本体模块的构建方法加以说明:
步骤S21,获取领域本体的覆盖范围:参考国家颁布的中医银屑病临床实践指南和中医银屑病临床路径等相关行业标准,并征询业内专家建议和意见。
步骤S22,根据覆盖范围获取与领域本体概念相对应的相关术语:广泛收集与银屑病领域知识有关的术语集(terms),包括事实性知识:如银屑病的常见症状;经验知识:如在疾病,症状,辩证类型,病因和诊断之间的因果关联关系的显式表达;以及关于发病过程的病理学知识等。
步骤S23,获取与相关术语相对应的概念化定义:在步骤(S2)的基础上对收集的术语给出标准定义,即对其进行概念化表示。例如银屑病:也称为白疕,干藓,蛇虱,松皮癣,银钱疯等。是一种常见的慢性复发性炎症性皮肤病,典型皮损为鳞屑性红斑。
步骤S24,对概念化定义进行公理化表达:对给出的有关概念提出公理化的形式表达,也即是由某种形式化语言描述的取值永远为真的命题陈述。这种形式化语言可以是描述逻辑语言(description logic,DL),也可以是manchester OWL语言等。
步骤S25,通过领域本体的公理化表达进行建模,形成模块化的领域本体:通过领域本体的公理化表达进行建模,形成模块化的领域本体:进行本体化建模,即构建相应的类(class)层次结构,类与类之间的相互关系,类的实例化,以及对象属性,数据属性和它们的约束性说明等内容。例如规定银屑病诊断当中的血热证必须包括全部主症状皮损鲜红;新出皮疹不断增多或迅速扩大。和次症状其中至少一项以上如:心烦易怒;小便黄;舌质红;脉滑等。
步骤S26,对模块化的领域本体进行评估和更新:将构建好的本体投入实际使用当中,基于中医银屑病本体知识库构建了一个辅助诊断专家系统,并根据使用当中反馈信息对本体进行评估和必要的更新升级。
步骤S3:对中间层核心本体和模块化的领域本体进行链接处理,在已经建好的中间层核心本体与模块化的领域本体之间通过链接建立映射和对应关系。
构建好的中医领域中间层核心本体与模块化的领域本体通过链接公理和映射方式,在已经建好的中间层核心本体与模块化的领域本体之间通过链接建立映射和对应关系。使得模块化的领域本体的上层节点分别与中医领域中间层核心本体的Basic-Level之间的各实体之间建立映射链接。其映射和链接过程参考图9。
步骤S4:返回步骤S2,通过不断构建更新领域本体模块或复用现有领域核心本体的方式,通过链接、映射与合并,将新的知识图谱补入到中间层核心本体知识图谱当中,并以模块集成的方式形成一个具有统一语义规范和通用形式化本体顶层框架的领域知识图谱。
领域知识图谱构建之后,还包括对领域知识图谱进行正确性审核,正确性审核由领域专家协同完成。
步骤S5:对领域知识图谱进行维护和升级。
根据使用情况和具体需求对领域知识图谱进行维护和升级。
领域核心本体由第三方开发平台或专家小组协同构建而成。构建好的领域核心本体将经过专家协同审核,审核通过后,再进入模块化的领域本体的构建,模块化的领域本体的构建过程中,需对每个模块领域本体单独构建,并整合形成一个完整的模块化的领域本体,从而构建出完整的领域知识图谱。每个模块领域本体构建都需要专家审核,只有专家审核通过后才能启动下个模块领域本体的构建。模块集成的完整领域知识图谱将经过专家审核,审核通过后,再进入知识图谱维护和升级。
结合了自顶向下和自底向上两种知识图谱构建方式的各自特点,特别是针对在中医药领域当中存在大量的异构领域本体的情况下,如何更好地利用现有资源,更好地解中医药知识可共享与复用的问题,以及解决本体对齐的问题。本发明融合了自顶向下和自底向上来构建本体的两种优势特征,能快速建模,具有良好的可扩展性和与兼容性。
顶层本体具有普通性和抽象性,它可以作为构建领域本体的基础,并且为不同系统提供一个共同的知识库顶层框架。利用GFO顶层本体中已有的概念集,规范的关系定义和功能定义,以及合理的逻辑结构,通过GFO顶层本体来构建某个行业相关的领域顶层本体,作为中间层本体,可以大大减少知识图谱构建过程中的复杂性和由于数据来源多样化及数据缺失所带来不确定性。同时通过遵循统一的标准规范,能在不同本体库或知识系统之间建立映射(本体对齐)以实现知识的复用共享和互操作性,也可在现有的中医药领域知识库与其他领域知识库之间进行了整合。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和修饰,这些改进和修饰也应视为本发明的保护范围。

Claims (7)

1.基于中间层核心本体的领域知识图谱的构建方法,其特征在于:包括以下步骤:
步骤S1:构建基于通用形式化本体顶层本体的领域核心本体,即中间层核心本体,所述领域核心本体为中医药领域核心本体;
步骤S2:按照通用形式化本体自底向上构建领域本体模块,形成模块化的领域本体,所述领域本体为中医药领域本体;
步骤S3:对所述中间层核心本体和所述模块化的领域本体进行链接处理,在已经建好的所述中间层核心本体与所述模块化的领域本体之间通过链接建立映射和对应关系;
步骤S4:返回步骤S2,通过不断构建更新所述领域本体模块或复用现有所述领域核心本体的方式,通过链接、映射与合并,将新的知识图谱补入到中间层核心本体知识图谱当中,并以模块集成的方式形成一个具有统一语义规范和通用形式化本体顶层框架的领域知识图谱,所述领域知识图谱为中医药领域知识图谱;
领域知识图谱构建之后,还包括对领域知识图谱进行正确性审核,正确性审核由领域专家协同完成;
步骤S5:对所述领域知识图谱进行维护和升级;
在步骤S2中,所述领域本体模块的构建方法包括以下步骤:
步骤S21,获取领域本体的覆盖范围:参考国家颁布的中医银屑病临床实践指南和中医银屑病临床路径行业标准,并征询业内专家建议和意见;
步骤S22,根据覆盖范围获取与领域本体概念相对应的相关术语:收集与银屑病领域知识有关的术语集(terms),即事实性知识:银屑病的常见症状;经验知识:在疾病,症状,辩证类型,病因和诊断之间的因果关联关系的显式表达;以及关于发病过程的病理学知识;
步骤S23,获取与相关术语相对应的概念化定义:对收集的术语给出标准定义,即对其进行概念化表示;
步骤S24,对概念化定义进行公理化表达:对给出的有关概念提出公理化的形式表达,即是由某种形式化语言描述的取值永远为真的命题陈述;
步骤S25,通过领域本体的公理化表达进行建模,形成模块化的领域本体:进行本体化建模,即构建相应的类(class)层次结构,类与类之间的相互关系,类的实例化,以及对象属性,数据属性和它们的约束性说明;即为规定银屑病诊断当中的血热症必须包括全部主症状和次症状中至少一项;
步骤S26,对模块化的领域本体进行评估和更新:将构建好的本体投入实际使用当中,基于中医银屑病本体知识库构建了一个辅助诊断专家系统,并根据使用当中反馈信息对本体进行评估和更新升级;
构建好的中医领域中间层核心本体与模块化的领域本体通过链接公理和映射方式,在已经建好的中间层核心本体与模块化的领域本体之间通过链接建立映射和对应关系;使得模块化的领域本体的上层节点分别与中医领域中间层核心本体的Basic-Level之间的各实体之间建立映射链接。
2.根据权利要求1所述的基于中间层核心本体的领域知识图谱的构建方法,其特征在于:在步骤S1中,所述领域核心本体构建之后,还包括对所述领域核心本体进行正确性审核。
3.根据权利要求1所述的基于中间层核心本体的领域知识图谱的构建方法,其特征在于:在步骤S2中,所述模块化的领域本体构建之后,还包括对所述模块化的领域本体进行正确性审核。
4.根据权利要求1所述的基于中间层核心本体的领域知识图谱的构建方法,其特征在于:在步骤S1中,所述领域核心本体构建方法包括以下步骤:
步骤S11:获取TCMLS-SN顶层框架中的基本概念体系和语义关系;
步骤S12:对TCMLS-SN顶层框架中的基本概念体系和语义关系进行预处理,并整合到所述通用形式化本体顶层本体的规范与标准中;
步骤S13:通过实体合并与重构,将所述TCMLS-SN顶层框架中的顶层节点集合与所述通用形式化本体顶层本体中的顶层抽象节点建立映射关系,形成基于所述通用形式化本体顶层本体的所述领域核心本体。
5.基于权利要求1-4任一权利要求所述的基于中间层核心本体的领域知识图谱的构建装置,其特征在于:包括:
领域核心本体构建模块,用于构建基于通用形式化本体顶层本体的领域核心本体,即中间层核心本体;
领域本体模块构建模块,用于按照通用形式化本体自底向上构建领域本体模块,形成模块化的领域本体;
链接处理模块,用于对所述中间层核心本体和所述模块化的领域本体进行链接处理,在已经建好的所述中间层核心本体与所述模块化的领域本体之间通过链接建立映射和对应关系;
领域知识图谱获取模块,用于返回所述领域本体模块构建模块,通过不断构建更新所述领域本体模块或复用现有所述领域核心本体的方式,通过链接、映射与合并,将新的知识图谱补入到中间层核心本体知识图谱当中,并以模块集成的方式形成一个具有统一语义规范和所述通用形式化本体顶层框架的领域知识图谱;
维护和升级模块,用于对所述领域知识图谱进行维护和升级。
6.根据权利要求5所述的基于中间层核心本体的领域知识图谱的构建装置,其特征在于:所述领域核心本体构建模块包括:
TCMLS-SN顶层框架获取模块,用于获取TCMLS-SN顶层框架中的基本概念体系和语义关系;
预处理模块,用于对TCMLS-SN顶层框架中的基本概念体系和语义关系进行预处理,并整合到所述通用形式化本体顶层本体的规范与标准中;
实体合并与重构模块,用于通过实体合并与重构,将所述TCMLS-SN顶层框架中的顶层节点集合与所述通用形式化本体顶层本体中的顶层抽象节点建立映射关系,形成基于所述通用形式化本体顶层本体的所述领域核心本体。
7.根据权利要求5所述的基于中间层核心本体的领域知识图谱的构建装置,其特征在于:所述领域本体模块构建模块包括:
领域本体覆盖范围获取模块,用于获取领域本体的覆盖范围;
相关术语获取模块,用于根据所述覆盖范围获取与所述领域本体概念相对应的相关术语;
概念化定义模块,用于获取与所述相关术语相对应的概念化定义;
公理化表达模块,用于对所述概念化定义进行公理化表达;
建模模块,用于通过所述领域本体的公理化表达进行建模,形成模块化的领域本体;
评估和更新模块,用于对所述模块化的领域本体进行评估和更新。
CN201910193557.4A 2019-03-14 2019-03-14 基于中间层核心本体的领域知识图谱的构建方法和装置 Active CN109947950B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910193557.4A CN109947950B (zh) 2019-03-14 2019-03-14 基于中间层核心本体的领域知识图谱的构建方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910193557.4A CN109947950B (zh) 2019-03-14 2019-03-14 基于中间层核心本体的领域知识图谱的构建方法和装置

Publications (2)

Publication Number Publication Date
CN109947950A CN109947950A (zh) 2019-06-28
CN109947950B true CN109947950B (zh) 2023-01-06

Family

ID=67009825

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910193557.4A Active CN109947950B (zh) 2019-03-14 2019-03-14 基于中间层核心本体的领域知识图谱的构建方法和装置

Country Status (1)

Country Link
CN (1) CN109947950B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110825721B (zh) * 2019-11-06 2023-05-02 武汉大学 大数据环境下高血压知识库构建与系统集成方法
CN111177399B (zh) * 2019-12-04 2023-06-16 华瑞新智科技(北京)有限公司 一种知识图谱构建方法和装置
CN111177322A (zh) * 2019-12-30 2020-05-19 成都数之联科技有限公司 一种领域知识图谱的本体模型构建方法
CN111723216A (zh) * 2020-06-20 2020-09-29 廊坊市珍珪谷教育科技有限公司 一种面向教育出版领域的本体构建方法
CN112632287B (zh) * 2020-12-03 2024-01-30 清华大学 电力知识图谱构建方法和装置
CN114201619B (zh) * 2022-02-18 2022-06-21 中国电子技术标准化研究院 多层结构标准知识图谱构建、标准检索方法及装置
CN116910250A (zh) * 2023-06-28 2023-10-20 北京百度网讯科技有限公司 知识处理方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006130162A2 (en) * 2005-06-01 2006-12-07 Wisper Technologies, Llc Information system using healthcare ontology
CN106909662A (zh) * 2017-02-27 2017-06-30 腾讯科技(上海)有限公司 知识图谱构建方法及装置
CN108021718A (zh) * 2017-12-29 2018-05-11 中国电子科技集团公司信息科学研究院 物联网能力知识图谱及其构建方法
CN109271530A (zh) * 2018-10-17 2019-01-25 长沙瀚云信息科技有限公司 一种疾病知识图谱构建方法和平台系统、设备、存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006130162A2 (en) * 2005-06-01 2006-12-07 Wisper Technologies, Llc Information system using healthcare ontology
CN106909662A (zh) * 2017-02-27 2017-06-30 腾讯科技(上海)有限公司 知识图谱构建方法及装置
CN108021718A (zh) * 2017-12-29 2018-05-11 中国电子科技集团公司信息科学研究院 物联网能力知识图谱及其构建方法
CN109271530A (zh) * 2018-10-17 2019-01-25 长沙瀚云信息科技有限公司 一种疾病知识图谱构建方法和平台系统、设备、存储介质

Also Published As

Publication number Publication date
CN109947950A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN109947950B (zh) 基于中间层核心本体的领域知识图谱的构建方法和装置
Petnga et al. An ontological framework for knowledge modeling and decision support in cyber-physical systems
Hsieh et al. Enabling the development of base domain ontology through extraction of knowledge from engineering domain handbooks
CN111930956B (zh) 一种采用知识图谱的多创新方法推荐与流驱动的集成系统
Colombo et al. Towards the design of intelligent CAD systems: An ontological approach
de Graaf et al. An exploratory study on ontology engineering for software architecture documentation
CN105808853B (zh) 一种面向工程应用的本体构建管理与本体数据自动获取方法
Kalfoglou Exploring ontologies
Ding et al. Robotic task oriented knowledge graph for human-robot collaboration in disassembly
Reimer et al. Eule: a knowledge-based system to support business processes
Kennel A unified framework for multi-level modeling
Costin A new methodology for interoperability of heterogeneous bridge information models
CN105095060A (zh) 利用规则集网络生成测试用例的装置和方法
Izquierdo et al. Community-driven language development
Sureephong et al. An ontology-based knowledge management system for industry clusters
Liu et al. Modeling ontology evolution with SetPi
Sobol et al. Improving OPM conceptual models by incorporating design structure matrix
Sosa-Sánchez et al. Service discovery using a semantic algorithm in a SOA modernization process from legacy Web applications
Valaski et al. Ontology to Classify Learning Material in Software Engineering Knowledge Domain.
Kolp et al. Enhanced ER to relational mapping and interrelational normalization
Mantz Coupled transformations of graph structures applied to model migration
Stewart Hornsby et al. Linking geosensor network data and ontologies to support transportation modeling
Blouin et al. An ontological foundation for multi-paradigm modelling for cyber-physical systems
CN108363563A (zh) 基于数据图谱、信息图谱和知识图谱架构的uml模型一致性检测方法
Szárnyas Query, analysis, and benchmarking techniques for evolving property graphs of software systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant