CN114297336A - 图表联动的知识图谱查询系统和方法 - Google Patents

图表联动的知识图谱查询系统和方法 Download PDF

Info

Publication number
CN114297336A
CN114297336A CN202111119620.3A CN202111119620A CN114297336A CN 114297336 A CN114297336 A CN 114297336A CN 202111119620 A CN202111119620 A CN 202111119620A CN 114297336 A CN114297336 A CN 114297336A
Authority
CN
China
Prior art keywords
view
graph
knowledge
model
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111119620.3A
Other languages
English (en)
Inventor
王亚沙
赵俊峰
尹思菁
徐涌鑫
杨恺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202111119620.3A priority Critical patent/CN114297336A/zh
Publication of CN114297336A publication Critical patent/CN114297336A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于图数据库与文档型数据库的图表联动的知识图谱查询系统和方法,属于知识图谱检索技术领域,所述系统包括领域知识模型交互式多维可视化展现模块和交互式知识推理与探查模块;交互式多维可视化展现模块用于查询实体之间结构关系,包括力导布局视图、层次布局视图和矩阵布局视图,还包括GIS地理视图、层次递进视图、图结构视图、表结构视图、微观尺度视图和宏观尺度视图;交互式知识推理与探查模块用于精确定位数据信息,提供的数据查询方式包括全局过滤、局部过滤和本体导航。本发明提供的系统和方法在面对拥有海量数据的知识图谱时,能更好地展现和查询海量数据,从而能高效精准地找到用户所需的信息。

Description

图表联动的知识图谱查询系统和方法
技术领域
本发明属于知识图谱检索技术领域,具体涉及一种基于图数据库与文档型数据库的图表联动的知识图谱查询系统和方法。
背景技术
随着知识图谱的发展,知识图谱的数据规模越来越大。腾讯的TopBase已经有一亿多的实体,22亿的三元组;谷歌的知识图谱已经有了十亿的实体规模,百度的知识图谱实体已经达到了五十亿的规模。传统的关系数据库对子图的检索随着数据的规模的增加急剧下降,而图数据库则对属性地检索表现的性能不佳。面对GB甚至是PB级规模的数据,知识图谱对数据检索提出了更高的要求,传统的仅依赖于图数据库或者关系数据库的查询方式已经无法满足查询的需求。
发明内容
为解决现有技术存在的缺陷,本发明的目的在于提供一种基于图数据库与文档型数据库的图表联动的知识图谱查询系统和方法,能够在面对GB级别甚至时PB级别的数据时,知识图谱仍然能高性能地直观检索出所需数据。
为达到以上目的,本发明采用的一种技术方案是:
一种基于图数据库与文档型数据库的图表联动的知识图谱查询系统,包括领域知识模型交互式多维可视化展现模块和领域知识模型交互式知识推理与探查模块;
所述领域知识模型交互式多维可视化展现模块用于查询实体之间结构关系,提供多种查看领域知识模型的方式,包括力导布局视图、层次布局视图和矩阵布局视图;
所述领域知识模型交互式多维可视化展现模块还提供多种查看领域知识模型的视角,包括GIS地理视图、层次递进视图、图结构视图、表结构视图、微观尺度视图和宏观尺度视图;
所述领域知识模型交互式知识推理与探查模块用于精确定位数据信息,提供的数据探查方法包括全局过滤、局部过滤和本体导航。
进一步,如上所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,所述力导布局视图用于展示普通的物理结构关系,所述层次布局视图用于展现实体之间清晰的层次关系,所述矩阵布局视图用于展现大规模的实体之间的关系。
进一步,如上所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,所述GIS地理视图用于展现带有经纬度数据的实体,所述GIS地理视图中包含树状视图,用于展示领域知识模型的概念模型、属性模型、标签模型和关系模型。
进一步,如上所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,所述层次递进视图面向业务逻辑,用于对实体关系追根溯源。
进一步,如上所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,所述图结构视图用于展现实体之间的关系;所述表结构视图用于展示实体和关系的详细属性信息。
进一步,如上所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,所述微观尺度视图用于用户查看所有的节点;所述宏观尺度视图用于用户查看聚簇的部分节点,聚簇方式包括同类型节点聚簇、相关节点聚簇和多选节点聚簇。
进一步,如上所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,所述全局过滤方法用于检索全局符合要求的数据,以本体模型作为基础对整个知识图谱的数据进行精确的条件检索,具体包括以下步骤:
S11、全局选择概念;
S12、选择在知识图谱本体模型中与所述概念相关的关系;
S13、对所述概念与所述关系设置属性的筛选条件;
S14、在文档型数据库里对所述概念和所述关系进行筛选,筛选出符合筛选条件的实体和边;
S15、在图数据库中,通过类型和图结构筛选出符合要求的三元组,结合步骤S14查询出的符合要求的实体和边,筛选出符合要求的数据。
进一步,如上所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,所述局部过滤滤方法以实体作为起点对实体相关联的数据进行精确的条件索引,具体包括以下步骤:
S21、在工作区选择实体;
S22、选择局部过滤,然后选择在知识图谱本体模型中与所述实体所属概念相关的关系;
S23、对所述概念与所述关系设置属性的筛选条件;
S24、在文档型数据库里对所述概念和所述关系进行筛选,筛选出符合筛选条件的实体和边;
S25、在图数据库中,通过类型和图结构筛选出符合要求的三元组,结合步骤S24查询出的符合要求的实体和边,筛选出符合要求的数据。
进一步,如上所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,所述本体导航方法以实体节点为起点粗粒度地对数据进行检索筛选,具体包括以下步骤:
S31、选择实体;
S32、从所述实体相关的关系中选择需要展开的关系。
采用本发明提供的基于图数据库与文档型数据库的图表联动的知识图谱查询系统和方法,具有以下显著的技术效果:
本发明所述系统和方法,通过采用领域知识模型交互式多维可视化展现技术和领域知识模型交互式知识推理与探查技术,在面对拥有海量数据的知识图谱时,能更好地展现和查询海量数据,从而能高效精准地找到用户所需的信息,理清数据关系,从而辅助用户决策,减少用户查询和处理数据的时间,尽可能地提升海量数据知识图谱的可用性。
附图说明
图1是本发明所述的领域知识模型交互式多维可视化展现模块中的力导视图;
图2是本发明所述的领域知识模型交互式多维可视化展现模块中的层次视图;
图3是本发明所述的领域知识模型交互式多维可视化展现模块中的矩阵视图;
图4是本发明所述的领域知识模型交互式多维可视化展现模块中的GIS视图;
图5是本发明所述的领域知识模型交互式多维可视化展现模块中的层次递进视图;
图6是本发明所述的领域知识模型交互式多维可视化展现模块中的图结构视图;
图7是本发明所述的领域知识模型交互式多维可视化展现模块中的表结构视图;
图8是本发明所述的领域知识模型交互式多维可视化展现模块中的微观尺度视图;
图9是本发明所述的领域知识模型交互式多维可视化展现模块中的宏观尺度视图;
图10是本发明所述的领域知识模型交互式知识推理与探查模块中的全局过滤视图;
图11是本发明所述的领域知识模型交互式知识推理与探查模块中的局部过滤视图;
图12是本发明所述的领域知识模型交互式知识推理与探查模块中的本体导航视图;
图13是本发明所述的领域知识模型交互式知识推理与探查模块中的全局过滤方法流程图;
图14是本发明所述的领域知识模型交互式知识推理与探查模块中的局部过滤方法流程图;
图15本发明所述的领域知识模型交互式知识推理与探查模块中的本体导航方法流程图。
具体实施方式
本发明提供的基于图数据库与文档型数据库的知识图谱图表联动的查询系统和方法可以用于分布式知识图谱系统进行大规模高效数据查询,以下从多种查询方法的应用实例,结合说明书附图进一步说明本发明的实施方式。
本发明提供的系统包括领域知识模型交互式多维可视化展现模块,以及领域知识模型交互式知识推理与探查模块。下面分别对这两个模块的结构和功能进行详细描述。
1、领域知识模型交互式多维可视化展现模块
基于可视化展现的不同需求,领域知识模型提供了多维可视化模型展示方式。该模块提供了关系视图,主要用于查询实体之间结构关系。关系视图包括力导布局、层次布局和矩阵布局等多种布局方式来展示不同的结构关系。
参阅图1所示,力导布局展示物理布局方式,用户可以通过调整物理参数来调整物理布局距离,主要用于展示普通的结构关系。
参阅图2所示,层次布局用来展现实体之间清晰的层次关系,用户可以通过设置参数调整层次布局的展示方式。
参阅图3所示,矩阵布局则用来展现大规模的实体之间的关系。
同时,领域知识模型交互式多维可视化展现模块提供了GIS地理视图。如图4所示,GIS地理视图能展现带有经纬度数据的实体,GIS地理视图的左侧栏为树状视图,用于展示领域知识模型的概念模型、属性模型、标签模型和关系模型等。
面对海量数据时,数据特征与关联只通过图是无法充分地展现的。如图5所示,领域知识模型提供了面向业务逻辑的模型层次递进可视化功能,该功能可以辅助用户逐步精确地探查业务信息以及辅助用户决策,帮助用户在纷繁复杂的数据中理清业务逻辑,对实体关系追根溯源。
针对不同的需求,领域知识模型提供了多种不同的探查数据的角度。在面对探查数据之间的关系时,领域知识模型通过图结构来清晰地展现实体之间的关系,如图6所示。在面对探查详细的数据特征时,领域知识模型则提供表结构对数据详细的呈现,如图7所示。领域知识模型提供了图表结合的模型可视化方式,通过节点之间的结构图来展示节点之间的关系,通过表来展示节点和关系的详细属性信息。
在面对海量的数据时,领域知识模型的用户有时并不需要同时观察所有的同类型数据。如图8和图9所示,领域知识模型提供微观尺度和宏观尺度上的结构视图,用户可以查看所有的节点构成的微观视图,也可以查看聚簇一部分节点得到的宏观视图。领域知识模型提供了对同类型节点、相关节点和多选节点等多种聚簇方式,让用户可以查看多种不同角度的视图。
多种视图和多种布局为用户提供了查看领域知识模型的不同方式和不同视角,用户能对领域知识模型有更丰富的认识。多尺度多视图的知识展示技术通过对不同类型数据的提取与前端框架的相关特点进行结合,对数据进行了多个纬度的展示。
2、领域知识模型交互式知识推理与探查模块
过去的知识图谱往往没有对数据的精确筛查,这样在面对海量数据的时候,往往不能很好的辅助用户进行探查与决策。针对这一问题,本发明所述的领域知识模型交互式知识推理与探查模块提供了全局过滤、局部过滤和本体导航多种方法来精确定位数据信息。通过将概念模型存储在云端,用户下载部分模型来探查数据,系统通过将关系、实体和模型分类存储达成效率和性能的平衡。交互式知识推理与探查模块结合了文档型数据库和图数据库能在不同粒度下对数据进行筛选加载,在提供了较好的交互性的同时减少了冗余信息节约了机器性能。
图10示出了本发明所述的全局过滤视图,全局过滤方法以本体模型作为基础对整个知识图谱的数据进行精确的条件检索,用户可以用于检索全局符合要求的数据。领域知识模型通过使用Janusgraph对模型的关系设定细粒度的检索条件,云端系统在对检索条件进行解析之后,对相关的数据在文档型数据库中进行复杂的条件查询。这样既能对领域知识模型的数据进行复杂的查询,同时也能提高检索速度。
参阅图13所示,使用全局过滤方法进行知识图谱查询的流程为:
S11、全局选择概念;
S12、选择在知识图谱本体模型中与概念相关的关系;
S13、对概念与关系设置属性的筛选条件;
S14、在文档型数据库里对概念和关系进行筛选,筛选出符合筛选条件的实体和边;
S15、在图数据库中,通过类型和图结构筛选出符合要求的三元组(实体—边—实体),结合步骤S14查询出的符合要求的实体和边,筛选出符合要求的数据。
在领域知识模型中,除开无上下文的全局过滤外,还提供了有起始实体的局部过滤功能。图11示出了本发明所述的局部过滤视图,局部过滤以实体作为起点对实体相关联的数据进行精确的条件索引,用户可以使用局部过滤来“顺藤摸瓜”地挖掘实体数据相关隐藏事实和知识。局部过滤是通过设定起始实体,在Janusgraph中查询起始实体的关系类型以及具体的属性,设定条件渐进式地探查实体,在文档型数据库中查到复合条件的结果返回给用户。
参阅图14所示,使用局部过滤方法进行知识图谱查询的流程为:
S21、在工作区选择实体;
S22、选择局部过滤,然后选择在知识图谱本体模型中与实体所属概念相关的关系;
S23、对概念与关系设置属性的筛选条件;
S24、在文档型数据库里对概念和关系进行筛选,筛选出符合筛选条件的实体和边;
S25、在图数据库中,通过类型和图结构筛选出符合要求的三元组(实体—边—实体),结合步骤S24查询出的符合要求的实体和边,筛选出符合要求的数据。
领域知识模型面对快捷的粗粒度的数据探查也提供了本体导航功能。图12示出了本发明所述的本体导航视图,本体导航功能以实体节点为起点粗粒度地对数据进行检索筛选,用户可以通过本体导航快速加载实体相关的关系和节点数据。
参阅图15所示,使用本体导航方法进行知识图谱查询的流程为:
S31、首先选择实体;
S32、选择本体导航,从实体的相关关系中选择要展开的关系。
本发明提供的基于图数据库与文档型数据库的图表联动的知识图谱查询系统和方法,通过采用领域知识模型交互式多维可视化展现技术和领域知识模型交互式知识推理与探查技术,在面对拥有海量数据的知识图谱时,能更好地展现和查询海量数据,从而能高效精准地找到用户所需的信息,理清数据关系,从而辅助用户决策,减少用户查询和处理数据的时间,尽可能地提升海量数据知识图谱的可用性。
上述实施例只是对本发明的举例说明,本发明也可以以其它的特定方式或其它的特定形式实施,而不偏离本发明的要旨或本质特征。因此,描述的实施方式从任何方面来看均应视为说明性而非限定性的。本发明的范围应由附加的权利要求说明,任何与权利要求的意图和范围等效的变化也应包含在本发明的范围内。

Claims (9)

1.一种基于图数据库与文档型数据库的图表联动的知识图谱查询系统,其特征在于,所述系统包括领域知识模型交互式多维可视化展现模块和领域知识模型交互式知识推理与探查模块;
所述领域知识模型交互式多维可视化展现模块用于查询实体之间结构关系,提供多种查看领域知识模型的方式,包括力导布局视图、层次布局视图和矩阵布局视图;
所述领域知识模型交互式多维可视化展现模块还提供多种查看领域知识模型的视角,包括GIS地理视图、层次递进视图、图结构视图、表结构视图、微观尺度视图和宏观尺度视图;
所述领域知识模型交互式知识推理与探查模块用于精确定位数据信息,提供的数据探查方法包括全局过滤、局部过滤和本体导航。
2.根据权利要求1所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,其特征在于,所述力导布局视图用于展示普通的物理结构关系,所述层次布局视图用于展现实体之间清晰的层次关系,所述矩阵布局视图用于展现大规模的实体之间的关系。
3.根据权利要求2所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,其特征在于,所述GIS地理视图用于展现带有经纬度数据的实体,所述GIS地理视图中包含树状视图,用于展示领域知识模型的概念模型、属性模型、标签模型和关系模型。
4.根据权利要求3所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,其特征在于,所述层次递进视图面向业务逻辑,用于对实体关系追根溯源。
5.根据权利要求4所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,其特征在于,所述图结构视图用于展现实体之间的关系;所述表结构视图用于展示实体和关系的详细属性信息。
6.根据权利要求1-5任一项所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,其特征在于,所述微观尺度视图用于用户查看所有的节点;所述宏观尺度视图用于用户查看聚簇的部分节点,聚簇方式包括同类型节点聚簇、相关节点聚簇和多选节点聚簇。
7.根据权利要求1所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,其特征在于,所述全局过滤方法用于检索全局符合要求的数据,以本体模型作为基础对整个知识图谱的数据进行精确的条件检索,具体包括以下步骤:
S11、全局选择概念;
S12、选择在知识图谱本体模型中与所述概念相关的关系;
S13、对所述概念与所述关系设置属性的筛选条件;
S14、在文档型数据库里对所述概念和所述关系进行筛选,筛选出符合筛选条件的实体和边;
S15、在图数据库中,通过类型和图结构筛选出符合要求的三元组,结合步骤S14查询出的符合要求的实体和边,筛选出符合要求的数据。
8.根据权利要求7所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,其特征在于,所述局部过滤滤方法以实体作为起点对实体相关联的数据进行精确的条件索引,具体包括以下步骤:
S21、在工作区选择实体;
S22、选择局部过滤,然后选择在知识图谱本体模型中与所述实体所属概念相关的关系;
S23、对所述概念与所述关系设置属性的筛选条件;
S24、在文档型数据库里对所述概念和所述关系进行筛选,筛选出符合筛选条件的实体和边;
S25、在图数据库中,通过类型和图结构筛选出符合要求的三元组,结合步骤S24查询出的符合要求的实体和边,筛选出符合要求的数据。
9.根据权利要求8所述的基于图数据库与文档型数据库的图表联动的知识图谱查询系统,其特征在于,所述本体导航方法以实体节点为起点粗粒度地对数据进行检索筛选,具体包括以下步骤:
S31、选择实体;
S32、从所述实体相关的关系中选择需要展开的关系。
CN202111119620.3A 2021-09-24 2021-09-24 图表联动的知识图谱查询系统和方法 Pending CN114297336A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111119620.3A CN114297336A (zh) 2021-09-24 2021-09-24 图表联动的知识图谱查询系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111119620.3A CN114297336A (zh) 2021-09-24 2021-09-24 图表联动的知识图谱查询系统和方法

Publications (1)

Publication Number Publication Date
CN114297336A true CN114297336A (zh) 2022-04-08

Family

ID=80963926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111119620.3A Pending CN114297336A (zh) 2021-09-24 2021-09-24 图表联动的知识图谱查询系统和方法

Country Status (1)

Country Link
CN (1) CN114297336A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114896426A (zh) * 2022-07-14 2022-08-12 中国人民解放军国防科技大学 一种电子目标认知图谱的构建方法
CN115329221A (zh) * 2022-10-09 2022-11-11 北京邮电大学 一种针对多源地理实体的查询方法及查询系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114896426A (zh) * 2022-07-14 2022-08-12 中国人民解放军国防科技大学 一种电子目标认知图谱的构建方法
CN114896426B (zh) * 2022-07-14 2023-10-13 中国人民解放军国防科技大学 一种电子目标认知图谱的构建方法
CN115329221A (zh) * 2022-10-09 2022-11-11 北京邮电大学 一种针对多源地理实体的查询方法及查询系统

Similar Documents

Publication Publication Date Title
CN109284338B (zh) 一种基于混合索引的卫星遥感大数据优化查询方法
CN110019396B (zh) 一种基于分布式多维分析的数据分析系统及方法
CN106933833B (zh) 一种基于空间索引技术的位置信息快速查询方法
CN114297336A (zh) 图表联动的知识图谱查询系统和方法
CN106897374B (zh) 一种基于轨迹大数据最近邻查询的个性化推荐方法
CN104239513A (zh) 一种面向领域数据的语义检索方法
CN102867066B (zh) 数据汇总装置和数据汇总方法
CN109783628B (zh) 结合时间窗口和关联规则挖掘的关键词搜索ksaarm方法
CN113535788B (zh) 一种面向海洋环境数据的检索方法、系统、设备及介质
CN106611053A (zh) 一种数据清理、索引方法
CN104794221A (zh) 一种基于业务对象的多维数据分析系统
Talaş et al. Elastic stack in action for smart cities: Making sense of big data
CN105550375A (zh) 一种异构数据的整合方法及系统
Battle et al. A structured review of data management technology for interactive visualization and analysis
CN102819600A (zh) 面向电力生产管理系统关系数据库的关键词搜索方法
CN103226608A (zh) 一种基于目录级可伸缩的Bloom Filter位图表的并行文件搜索方法
Nguyen et al. DBSTexC: Density-based spatio-textual clustering on twitter
Kricke et al. Graph data transformations in Gradoop
CN104902018A (zh) 基于服务簇的服务组合与替换方法
CN106682168B (zh) 一种跨域城市数据可视查询系统的构建方法
Cuzzocrea Scalable olap-based big data analytics over cloud infrastructures: Models, issues, algorithms
KR101955376B1 (ko) 비공유 아키텍처 기반의 분산 스트림 처리 엔진에서 관계형 질의를 처리하는 방법, 이를 수행하기 위한 기록 매체 및 장치
CN110389944B (zh) 一种基于模型的元数据管理系统及方法
Kang et al. Geoddupe: A novel interface for interactive entity resolution in geospatial data
CN114077652A (zh) 一种基于多维数据立方体的数据处理方法及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination