CN111339316A - 一种知识图谱可视化编辑与持久化实现方法及系统架构 - Google Patents
一种知识图谱可视化编辑与持久化实现方法及系统架构 Download PDFInfo
- Publication number
- CN111339316A CN111339316A CN202010122562.9A CN202010122562A CN111339316A CN 111339316 A CN111339316 A CN 111339316A CN 202010122562 A CN202010122562 A CN 202010122562A CN 111339316 A CN111339316 A CN 111339316A
- Authority
- CN
- China
- Prior art keywords
- map
- layout
- visual
- graph
- editing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000007 visual effect Effects 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000002688 persistence Effects 0.000 title claims abstract description 28
- 238000012800 visualization Methods 0.000 claims abstract description 29
- 230000003993 interaction Effects 0.000 claims abstract description 8
- 230000002452 interceptive effect Effects 0.000 claims abstract description 7
- 238000009877 rendering Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000008602 contraction Effects 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 230000002085 persistent effect Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 3
- 230000003068 static effect Effects 0.000 claims description 3
- 230000001960 triggered effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 230000005484 gravity Effects 0.000 claims description 2
- 238000005096 rolling process Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000004891 communication Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000010187 selection method Methods 0.000 description 3
- 238000007711 solidification Methods 0.000 description 2
- 230000008023 solidification Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种知识图谱可视化编辑与持久化实现方法及系统架构,所述方法提供允许基于特定的可视化知识图谱布局文件实现对知识图谱编辑结果的持久化,支持SPARQL查询、可视化交互编辑,并能够将编辑结果持久化为通用的知识图谱文件或者本发明定义的可视化图谱布局文件。所述的系统架构主要包括前台可视化图谱交互模块、后台图数据库管理模块两个部分。本发明利用可视化技术,将知识图谱中用结构化方式描述的实体间语义关系直观地表现出来;同时定义了可视化知识图谱的布局文件,方便用户将可视化成果便捷地保存、恢复。本发明能为知识图谱相关工作中实现高效交流、直观展示提供支撑。
Description
技术领域
本发明属于知识图谱可视化交互编辑技术,具体涉及一种知识图谱可视化编辑与持久化实现方法及系统架构。
背景技术
知识图谱是语义网技术的一种延伸,通过在实体间定义语义关系,将不同实体进行了有意义的关联。近年来,随着知识图谱技术的不断发展,其构建工作已经逐步在各行各业展开,形成了兼具深度和广度的知识体系。随着知识图谱构建规模的不断扩大,知识间的联系日益复杂,单纯的文字表达形式所带来的直观性问题逐渐显现出来:知识网中的隐藏信息无法被有效挖掘。可以说,单薄的表达形式正限制着知识图谱的价值与潜力。
知识图谱采用结构化的方式描述所要存储的知识,在计算机中以图数据库的形式进行存储管理,为计算机查找、利用知识提供了极大的便利。然而这种结构化的描述方式对于普通用户来说不够友好:(1)知识图谱的设计过程较为抽象,阻碍了知识图谱的进一步推广。(2)对于非从业人员而言,编辑知识的门槛较高(3)以三元组形式描述的知识对一般用户不够直观,往往会带来困惑。(4)不利于研究者挖掘知识间的隐含知识。为了能够提高知识图谱技术的易用性,实现一种支持可视化交互的呈现形式十分必要。
除了上述问题外,现有知识图谱可视化方案都是即时渲染的,可视化结果难以复用。因此,如果能为可视化的知识图谱提供持久化存储方案,允许复用可视化结果,可以大大提高知识图谱的设计、开发效率,降低知识图谱使用者间的交流、合作难度。
发明内容
发明目的:为解决当前知识图谱应用过程中的不足之处,本发明的第一个目的是提供一种基于布局文件的知识图谱可视化编辑与持久化的实现方法。同时,基于该方法,本发明的第二个目的是提供一种基于布局文件的知识图谱可视化编辑与持久化的系统架构。
技术方案:一种基于布局文件的知识图谱可视化编辑与持久化的实现方法,包括如下步骤:
(1)构建Web后台服务进程,引入图数据库组件管理知识图谱,并预留前台数据接口;
(2)获取用户向浏览器提供知识图谱的布局数据,以形成节点和有向关系边的对象数组渲染可视化图谱;
(3)对可视化的知识图谱进行编辑,包括切换布局、编辑节点、编辑有向关系边、编辑图例、手动新增节点、手动新增有向关系边、自动拓展节点和删除元素;
(4)根据缩放比例选择不同图谱层次中的节点、关系边渲染到可视化区域中,并对概念层和实例层知识图谱收缩或分解;
(5)用户通过将可视化图谱输出为JSON格式的图谱布局文件或TTL格式的图谱关系文件,实现可视化图谱的文件持久化功能;
(6)将三元陈述内容的编辑结果固化到TDB数据库。
进一步的,步骤(1)构建Web后台服务进程,并引入图数据库组件管理知识图谱,并预留前台数据所需的各种接口;前台引入图表渲染组件提供可视化服务,并提供实现可视化知识图谱的各种交互式编辑功能的接口。
步骤(2)中用于知识图谱可视化的布局文件,包括:
用于描述节点的数据结构,包括节点的id、name、x坐标、y坐标和颜色;
用于描述有向关系边的数据结构,包括有向关系边的起点id、终点id、起点name、终点name、关系名称及颜色;
程序使用JSON格式保存上述的图谱布局文件;
对于布局数据的获取包括如下三种方式:
(a)向服务器传递SPARQL查询语句,服务器完成查询后,将结果集处理为布局数据返回;
(b)用户上传布局文件,浏览器读取其中JSON格式的数据;
(c)用户上传TTL文件,服务器将TTL中描述的三元组持久化到TDB数据库后执行默认查询,将结果集处理为布局数据返回。
更进一步的,步骤(2)中结果集处理通过将结果集中的每一条记录分成多组subject、predicate和object三元组分别处理实现,具体过程如下:
对于subject和object,首先区分所处理的RDF资源类型:对于字面量,在其字面内容前连接“#”加以区分;对于资源量,通过模型中的命名空间键值对缩减资源量的URI长度,将处理完的subject或object资源实例化出节点对象,并为字面量资源生成uuid来填充实例中的id属性,其余属性取默认值;
对于predicate,取同一条陈述中的subject和object的节点对象的id分别作为startId和endId,将predicate本身的uri作为有向边实例的name填充,其余属性取默认值,在实例化得到的节点对象的基础上按布局文件的记录形式进行组织,得到布局数据;
所述subject、predicate和object依据SPARQL语句的where条件进行区分。
进一步的,步骤(3)对可视化的知识图谱编辑过程中,通过图谱配置项option,得到具体的待编辑对象,然后根据用户输入,修改待编辑对象的相关属性后重新置入option中,将图谱重新渲染实现编辑,具体如下:
(1)切换布局状态:通过更改图谱的布局属性进行切换布局状态,动态布局的情况下改变节点位置,静态布局的情况下为整体拖动图谱;
(2)编辑节点:单击节点,将节点信息加载到节点编辑区域中,解锁后更改属性值,点击应用后重新渲染得到新的可视化图谱;
(3)编辑有向关系边:单击有向关系边,将关系边信息加载到关系编辑区域,解锁后可更改属性值,点击应用后重新渲染得到新的可视化图谱;
(4)编辑图例:单击自动图例,将图例信息加载到图例编辑区域,解锁后更改属性值,点击应用后重新渲染得到新的可视化图谱;
(5)手动新增节点:填写新增节点的id和name属性,其余信息按默认设置补足后渲染到可视化图谱;
(6)手动新增有向关系边:填写起始节点、终末节点的id和表示具体语义关系的name,其余信息按默认设置补足后渲染到可视化图谱;
(7)自动拓展节点:右键单击节点,选择横向或纵向的拓展方式,自动查询图数据库中以该节点为主语的陈述,并根据拓展方式在查询语句中自动添加相关查询条件,查询结果将被添加到可视化在图谱中,所述横向拓展指查询与主语属于同一层次的节点,所述纵向拓展指查询与主语不在同一层次的节点。
(8)删除元素:双击要删除的元素,获取被双击的数据对象,将其从元素数组中删除;对于节点包括遍历有向关系边的数组以删除该节点的入边、出边。
步骤(4)包括在程序中预先指定好属于概念层的命名空间作为判断节点层次的依据,然后通过某个标记属性区分节点和关系边所属的层次;具体如下:
若节点属于实例层将标记属性置为0,否则置为1;
若关系边与实例层节点有关将标记属性置为0,否则置为1;
用户通过滚轮缩放整张图谱,当缩放比例达到阈值时触发图谱的收缩或分解,缩小图谱时,删除标记属性为0的节点并缓存到其上位节点中,实现收缩实例层;扩大图谱时,查询每个节点中的缓存将其中的数据渲染到可视化图谱中,实现分解展示实例层。
步骤(5)中浏览器读取布局数据并以JSON文件形式写入本地硬盘,通过读取当前可视化图谱的option中的data和links对象形成布局数据,并借助浏览器提供的FileReader对象写入到本地硬盘,包括如下两个方面:
(A)输出为图谱布局文件时,浏览器读取布局数据,以JSON文件形式写入本地硬盘;
(B)输出为图谱关系文件时,浏览器将所用的布局数据传回到服务器;服务器从中恢复出对应的TTL格式的图谱文件,并附带指定图模型中的命名空间一并输出后由浏览器为用户下载到本地硬盘。
实施上述方法实现的一种基于布局文件的知识图谱可视化编辑与持久化的系统架构,所述系统架构包括前台可视化图谱交互模块和后台图数据库管理模块,所述的前台可视化图谱交互模块,用于展示、编辑可视化图谱并转化图谱布局文件;所述的后台图数据库管理模块,用于存储、管理结构化的知识图谱数据并转化图谱关系文件。
进一步的,所述前台可视化图谱交互模块包括如下功能单元:
可视化图谱展示功能:以节点和有向关系边的形式展现知识图谱语义关系,结合起点和终点表达图谱文件中的一个三元组;在渲染可视化图谱时,程序将自动配置图例,区分不同命名空间下的节点;当鼠标移至元素上时,自动显示详情,并高亮邻接元素;当同时提供概念层图谱数据和实例层图谱数据时,通过滚轮缩放在概念层图谱、实例层图谱和综合图谱之间切换;在显示综合图谱时,将用有向关系边明确概念层节点和实例层节点之间的上下位关系;
可视化图谱编辑功能:包括引力布局、坐标布局两种切换布局方式,手动添加或删除节点、自动查询拓展节点、有向关系边,编辑节点、有向关系边、图例和拖动节点以更改节点位置,所有涉及到修改三元组陈述的编辑结果被保存到图数据库;
图谱布局持久化功能:浏览器将可视化图谱整体持久化到布局文件并保存到本地,通过布局文件恢复出所保存的可视化图谱。
进一步的,所述后台图数据库管理模块包括功能单元:
SPARQL查询功能:服务器执行前台请求的SPARQL查询,并将查询得到的每条结果依据任意多条where条件提取为多组subject、predicate、object三元组;服务器将三元组处理成布局数据,供可视化图谱展示功能解析成相应的可视化图谱;
图谱文件写入功能:服务器将上传的TTL图谱关系文件写入到图数据库的指定模型图中进行持久化管理;
图谱数据转换功能:浏览器将布局文件上传到后台服务器,结合模型中的命名空间键值对转换为TTL格式的知识图谱文件。
有益效果:与现有技术相比,本发明利用可视化技术,将知识图谱中用结构化方式描述的实体间语义关系直观地表现出来;同时定义了可视化知识图谱的布局文件,方便用户将可视化成果便捷地保存、恢复。本发明能为知识图谱相关工作中实现高效交流、直观展示提供支撑。
附图说明
图1为本发明所述方法的实施流程图;
图2为依据本发明所述方法实现的主界面视图;
图3为依据本发明所述方法实现的显示子功能区附图;
图4为依据本发明所述方法实现的查询子功能区附图;
图5为依据本发明所述方法实现的绘制子功能区附图;
图6为依据本发明所述方法实现的图例子功能区附图;
图7为依据本发明所述方法实现的新增节点功能附图;
图8为依据本发明所述方法实现的新增关系功能附图。
具体实施方式
为了详细的说明本发明所公开的技术方案,下面结合说明书附图及具体实施例做进一步的阐述。
本发明公开的是一种知识图谱可视化编辑与持久化实现方法及系统架构,是一种可视化的交互式知识图谱设计、编辑方式和相关的可视化知识图谱的存储方案,便利了知识图谱相关工作中的设计、交流、展示。本发明所提供的方法以及架构可以具体应用在水利资源对象的构建过程中,帮助完善水利对象知识网络的构建。
本发明所述一种基于布局文件的知识图谱可视化编辑与持久化的实现方法,其整体实施流程架构如图1所示。包括如下步骤:
步骤一:搭建Web后台服务程序,并引入图数据库组件(比如ApacheJena)管理知识图谱。在此基础上二次开发,提供满足前台数据需求的各种接口。前台引入图表渲染组件(比如eCharts)提供可视化服务,并在此基础上进行二次开发,提供实现可视化知识图谱的各种交互式编辑功能的接口。
步骤二:为了实现对知识图谱的可视化需求,用户需向浏览器提供知识图谱的布局数据以形成节点和有向关系边的对象数组渲染可视化图谱,布局数据的获取有三种途径:
(1)向服务器传递SPARQL查询语句。服务器完成查询后,将结果集处理为布局数据返回。
(2)用户上传布局文件,浏览器读取其中JSON格式的数据。
(3)用户上传TTL文件,服务器将TTL中描述的三元组持久化到TDB数据库后执行默认查询,将结果集处理为布局数据返回。
当前步骤中所述的查询功能是通过图数据库组件执行SPARQL语句查询方法实现的,该方法返回查询结果集。
当前步骤中所述的结果集处理,是通过将结果集中的每一条记录分成多组subject、predicate和object三元组分别处理实现的。对于subject和object而言,首先区分所处理的RDF资源类型:对于字面量,在其字面内容前连接“#”加以区分;对于资源量,通过模型中的命名空间键值对缩减资源量的URI(Uniform Resource Identifier)长度。将处理完的subject或object资源实例化出节点对象,并为字面量资源生成uuid(UniversallyUnique Identifier)来填充实例中的id属性,其余属性取默认值。对于predicate而言,取同一条陈述中的subject和object的节点对象的id分别作为startId和endId,将predicate本身的uri作为有向边实例的name填充,其余属性取默认值。所述subject、predicate和object的区分是依据SPARQL语句的where条件进行的。
步骤三:为了实现对可视化的知识图谱进行编辑的相关操作,包括:
(1)切换布局状态,更改图谱的布局属性实现。动态布局的情况下可以拖动以改变节点位置,静态布局的情况下可以整体拖动图谱。
(2)编辑节点。单击节点,将节点信息加载到节点编辑区域中,解锁后可更改属性值,点击应用后重新渲染得到新的可视化图谱。
(3)编辑有向关系边。单击有向关系边,将关系边信息加载到关系编辑区域,解锁后可更改属性值,点击应用后重新渲染得到新的可视化图谱。
(4)编辑图例。单击自动图例,将图例信息加载到图例编辑区域,解锁后可更改属性值,点击应用后重新渲染得到新的可视化图谱。
(5)手动新增节点。填写新增节点的id(唯一值)和name属性,其余信息按默认设置补足后渲染到可视化图谱。
(6)手动新增有向关系边。填写起始节点、终末节点的id和表示具体语义关系的name,其余信息按默认设置补足后渲染到可视化图谱。
(7)自动拓展节点。右键单击节点,选择拓展方式(横向/纵向),自动查询图数据库中以该节点为主语的陈述,并根据拓展方式在查询语句中自动添加相关查询条件,查询结果将被添加到可视化在图谱中。这里的横向拓展指查询与主语属于同一层次的节点,纵向拓展指查询与主语不在同一层次的节点。
(8)删除元素。双击要删除的元素,获取被双击的数据对象,将其从元素数组中删除。对于节点而言,除了删除该节点对象本身之外,还需要遍历有向关系边的数组以删除该节点的入边、出边。
当前步骤中所述的各类编辑功能,都是通过图谱配置项option,得到具体的待编辑对象。程序根据用户输入,修改待编辑对象的相关属性后重新置入option中,将图谱重新渲染实现编辑。
步骤四:采用“选择法”实现概念层、实例层知识图谱收缩/分解。知识图谱中的节点间往往存在语义上的“上下位”关系,可以将上位节点和下位节点分别存储在不同的图谱层次中,通过“选择法”决定哪些节点和关系被展示。所谓“选择法”,即根据缩放比例选择不同图谱层次中的节点、关系边渲染到可视化区域中。实现中,在移除某一层次的图谱时,将涉及到的元素收缩进其上位节点;需要分解展示时从其上位节点的数据结构中重新取出加以渲染。首先,在程序中预先指定好属于概念层的命名空间作为判断节点层次的依据。其次,通过某个标记属性区分节点和关系边所属的层次。具体地,若节点属于实例层将标记属性置为0否则置为1;若关系边与实例层节点有关将标记属性置为0否则置为1。用户通过滚轮缩放整张图谱,当缩放比例达到阈值时触发图谱的收缩/分解:缩小图谱时,删除标记属性为0的节点并缓存到其上位节点中,实现收缩实例层的目的;扩大图谱时,查询每个节点中的缓存将其中的数据渲染到可视化图谱中,实现分解展示实例层的目的。
步骤五:实现可视化图谱的文件持久化功能。用户可以将可视化图谱输出为JSON格式的图谱布局文件或TTL格式的图谱关系文件。
(1)输出为图谱布局文件时,浏览器读取布局数据,以JSON文件形式写入本地硬盘。
(2)输出为图谱关系文件时,浏览器将所用的布局数据传回到服务器。服务器按一定规则从中恢复出对应的TTL格式的图谱文件,并附带指定图模型中的命名空间一并输出后由浏览器为用户下载到本地硬盘。
当前步骤中所述的浏览器读取布局数据并以JSON文件形式写入本地硬盘,是通过读取当前可视化图谱的option中的data和links对象形成布局数据,并借助浏览器提供的FileReader对象写入到本地硬盘实现的。
当前步骤中所述的将图谱布局文件转化为图谱关系文件,是通过向服务器提交布局数据,并结合指定模型中的命名空间键值对实现的。具体地,将上传的图谱布局数据分别实例化为节点对象(包括id和name属性)和关系边对象(包括源点id、目标id和关系id)。然后依据节点的id值将所有节点对象组织为键值对形式。转化时依据关系边对象的集合进行,同时缩减uri为前缀表达形式。对于以uuid值作为id的资源,需要通过键值取出节点对象参与到这一过程中。处理完所有关系边的对象即可得到对应的TTL文件。
步骤六:实现将涉及到三元陈述内容的编辑结果固化到TDB数据库的功能。当编辑涉及到对象节点id、有向关系边id或者数据节点的字面量值时,相关修改要被固化到TDB数据库。对于有向关系边,需要从可视化图谱中提取出原有陈述,并保存新的陈述,固化时一并提交给图数据库。对于节点,需要找到所有邻接边,修改所有相关陈述,固化时将新旧陈述和新旧节点id一并提交图数据库。
通过上述方法所实现的一种基于布局文件的知识图谱可视化编辑与持久化的系统架构,如图2-图8所示。
图2所展示的为依据本发明所述方法实现的系统中一种B/S架构的整体界面。该界面以可视化图谱展示区域为主体,配合左侧复杂操作区域与顶部功能条实现方法中所述的各种功能。
图3所展示的为左侧操作区中的“显示”子功能区域,包括“还原到空白图”、“切换布局状态”、“输出布局文件”、“上传布局文件”、“上传图谱文件”、“保存图谱文件”六项功能,主要为可视化图谱的持久化和复用功能提供用户接口。
图4所展示的为左侧操作区中的“查询”子功能区域,允许用户通过SPARQL语句搜索图数据库并可视化图谱。
图5所展示的为左侧操作区中的“绘制”子功能区域,根据用户鼠标点选的对象加载相关信息,并允许用户编辑对象信息后即时应用到右侧图谱可视化区域中。
图6所展示的为左侧操作区中的“图例”子功能区域,允许用户点选图例并编辑,编辑结果可即时应用到右侧可视化区域中。
图7与图8为顶部功能条中增加节点和增加关系功能各自的操作界面,允许用户即时的向可视化图谱显示区域添加节点对象或关系边对象。
更加进一步的表述所述方法实现的系统架构功能及
实施例1
实施例1叙述了可视化呈现SPARQL查询结果过程。
用户访问前端页面,浏览器自动请求默认的SPARQL查询,待服务器执行完成、返回结果后于右侧显示可视化结果。
用户可在左侧操作区域中的“查询”子功能下自定义SPARQL查询语句,点击提交后待服务器执行完成、返回结果,于右侧显示可视化结果。对于渲染出来的可视化图谱,用户通过滚轮进行缩放,缩放比例会实时显示在右上角。当缩放比例处于设定的触发范围中时会进行实例层、概念层图谱的收缩/分解。
实施例2
实施例2叙述了用户上传TTL文件后获取其可视化结果和从可视化结果获取TTL文件的过程。
用户在左侧操作区域中的“显示”子功能下点击“上传图谱文件”,填写指定的TDB数据库模型名称。服务器按指示将数据持久化到TDB数据库并自动执行SPARQL查询,返回结果于右侧可视化区域显示。
在用户已经获取到可视化知识图谱的情况下,用户点击左侧操作区域中“显示”子功能下的“保存图谱文件”,浏览器会将当前的布局数据提交给服务器,服务器会依据节点的id、name数据及有向边的source、target和model数据,结合指定模型中的“命名空间”数据构造出TTL文件后返回给用户。
实施例3
实施例3叙述了布局文件和可视化知识图谱间的互转换过程。
在用户已经获取到可视化知识图谱的情况下,用户点击左侧操作区域中“显示”子功能下的“输出布局文件”,浏览器会为用户下载当前显示区域中图谱的布局文件到本地。
用户可以通过点击左侧操作区域中“显示”子功能下的“上传布局文件”,将本地存储的布局文件数据交给浏览器完成图谱可视化,可视化结果将在右侧显示区域自动呈现。
实施例4
实施例4叙述了编辑可视化图谱中内容的交互过程。
用户单击选中节点或有向关系边,相关的布局数据显示在左侧“绘制”子功能下的编辑区域中,解锁后可以进行编辑,点击“应用”修改会即时反映在右侧可视化区域中。
用户单击选中左侧操作区域“图例”子功能中的图例,图例信息会被加载到编辑区域中,解锁后可以进行编辑,点击“应用”修改会即时反映在右侧可视化区域中。
用户可以单击页面右上角“增加节点”或“增加关系”按钮,填写相关信息并确认。新的节点或者关系边会显示在右侧显示区域。操作中要求,新增节点的id在图谱中是唯一的,新增有向关系边的起点id、终点id必须是已存在的。
Claims (10)
1.一种基于布局文件的知识图谱可视化编辑与持久化的实现方法,其特征在于,包括如下步骤:
(1)构建Web后台服务进程,引入图数据库组件管理知识图谱,并预留前台数据接口;
(2)获取用户向浏览器提供的知识图谱布局数据,以形成用于渲染可视化图谱的节点和有向关系边的对象数组;
(3)对可视化的知识图谱进行编辑,包括切换布局、编辑节点、编辑有向关系边、编辑图例、手动新增节点、手动新增有向关系边、自动拓展节点和删除元素;
(4)根据缩放比例选择不同图谱层次中的节点、关系边渲染到可视化区域中,实现知识图谱跨层次的收缩或分解;
(5)用户通过将可视化图谱输出为JSON格式的图谱布局文件或TTL格式的图谱关系文件,实现可视化图谱的文件持久化功能;
(6)将三元组陈述内容的编辑结果固化到TDB数据库。
2.根据权利要求1所述的基于布局文件的知识图谱可视化编辑与持久化的实现方法,其特征在于,步骤(1)构建Web后台服务进程,并引入图数据库组件管理知识图谱,并预留前台数据所需的各种接口;前台引入图表渲染组件提供可视化服务,并提供实现可视化知识图谱的各种交互式编辑功能的接口。
3.根据权利要求1所述的基于布局文件的知识图谱可视化编辑与持久化的实现方法,其特征在于,步骤(2)中用于知识图谱可视化的布局文件,包括:
用于描述节点的数据结构,包括节点的id、name、x坐标、y坐标和颜色;
用于描述有向关系边的数据结构,包括有向关系边的起点id、终点id、起点name、终点name、关系名称及颜色;
程序使用JSON格式保存上述的图谱布局数据形成布局文件;
对于布局数据的获取包括如下三种方式:
(a)向服务器传递SPARQL查询语句,服务器完成查询后,将结果集处理为布局数据返回;
(b)用户上传布局文件,浏览器读取其中JSON格式的数据;
(c)用户上传TTL文件,服务器将TTL中描述的三元组持久化到TDB数据库后执行默认查询,将结果集处理为布局数据返回。
4.根据权利要求1所述的基于布局文件的知识图谱可视化编辑与持久化的实现方法,其特征在于,步骤(2)中结果集处理通过将结果集中的每一条记录分成多组subject、predicate和object三元组分别处理实现,具体过程如下:
对于subject和object,首先区分所处理的RDF资源类型:对于字面量,在其字面内容前连接“#”加以区分;对于资源量,通过模型中的命名空间键值对缩减资源量的URI长度,将处理完的subject或object资源实例化出节点对象,并为字面量资源生成uuid来填充实例中的id属性,其余属性取默认值;
对于predicate,取同一条陈述中的subject和object的节点对象的id分别作为startId和endId,将predicate本身的uri作为有向边实例的name填充,其余属性取默认值,在实例化得到的节点对象的基础上按布局文件的记录形式进行组织,得到布局数据;
所述subject、predicate和object依据SPARQL语句的where条件进行区分。
5.根据权利要求1所述的基于布局文件的知识图谱可视化编辑与持久化的实现方法,其特征在于,步骤(3)对可视化的知识图谱编辑过程中,通过图谱配置项option,得到具体的待编辑对象,然后根据用户输入,修改待编辑对象的相关属性后重新置入option中,将图谱重新渲染实现编辑,具体如下:
(1)切换布局状态:通过更改图谱的布局属性进行切换布局状态,动态布局的情况下改变节点位置,静态布局的情况下为整体拖动图谱;
(2)编辑节点:将节点信息加载到节点编辑区域中,更改属性值后重新渲染得到新的可视化图谱;
(3)编辑有向关系边:将关系边信息加载到关系编辑区域,更改属性值后重新渲染得到新的可视化图谱;
(4)编辑图例:将图例信息加载到图例编辑区域,更改属性值后重新渲染得到新的可视化图谱;
(5)手动新增节点:填写新增节点的id和name属性,其余信息按默认设置补足后渲染到可视化图谱;
(6)手动新增有向关系边:填写起始节点、终末节点的id和表示具体语义关系的name,其余信息按默认设置补足后渲染到可视化图谱;
(7)自动拓展节点:对节点选择横向或纵向的拓展方式,自动查询图数据库中以该节点为主语的陈述,并根据拓展方式在查询语句中自动添加相关查询条件生成SPARQL语句;查询结果将被添加到可视化在图谱中,所述横向拓展指查询与主语属于同一层次的节点,所述纵向拓展指查询与主语不在同一层次的节点;
(8)删除元素:获取被删除的数据对象,将其从元素数组中删除;对于节点包括遍历有向关系边的数组以删除该节点的入边、出边。
6.根据权利要求1所述的基于布局文件的知识图谱可视化编辑与持久化的实现方法,其特征在于,步骤(4)包括在程序中预先指定好属于概念层的命名空间作为判断节点层次的依据,然后通过某个标记属性区分节点和关系边所属的层次;具体如下:
若节点属于实例层将标记属性置为0,否则置为1;
若关系边与实例层节点有关将标记属性置为0,否则置为1;
用户通过滚轮缩放整张图谱,当缩放比例达到阈值时触发图谱的收缩或分解,缩小图谱时,删除标记属性为0的节点并缓存到其上位节点中,实现收缩实例层;扩大图谱时,查询每个节点中的缓存将其中的数据渲染到可视化图谱中,实现分解展示实例层。
7.根据权利要求1所述的基于布局文件的知识图谱可视化编辑与持久化的实现方法,其特征在于,步骤(5)中浏览器读取布局数据并以JSON文件形式写入本地硬盘,通过读取当前可视化图谱的option中的data和links对象形成布局数据,并借助浏览器提供的FileReader对象写入到本地硬盘,包括如下两个方面:
(A)输出为图谱布局文件时,浏览器读取布局数据,以JSON文件形式写入本地硬盘;
(B)输出为图谱关系文件时,浏览器将所用的布局数据传回到服务器;服务器从中恢复出对应的TTL格式的图谱文件,并附带指定图模型中的命名空间一并输出后由浏览器为用户下载到本地硬盘。
8.实施如权利要求1所述的方法的一种基于布局文件的知识图谱可视化编辑与持久化的系统架构,其特征在于,所述系统架构包括前台可视化图谱交互模块和后台图数据库管理模块,所述的前台可视化图谱交互模块,用于展示、编辑可视化图谱并转化图谱布局文件;所述的后台图数据库管理模块,用于存储、管理结构化的知识图谱数据并转化图谱关系文件。
9.根据权利要求8所述的基于布局文件的知识图谱可视化编辑与持久化的系统架构,其特征在于,所述前台可视化图谱交互模块包括如下功能单元:
可视化图谱展示功能:以节点和有向关系边的形式展现知识图谱语义关系,结合起点和终点表达图谱文件中的一个三元组;在渲染可视化图谱时,程序将自动配置图例,区分不同命名空间下的节点;当鼠标移至元素上时,自动显示详情,并高亮邻接元素;当同时提供概念层图谱数据和实例层图谱数据时,通过滚轮缩放在概念层图谱、实例层图谱和综合图谱之间切换;在显示综合图谱时,将用有向关系边明确概念层节点和实例层节点之间的上下位关系;
可视化图谱编辑功能:包括引力布局、坐标布局两种布局方式的切换,手动添加或删除节点、自动查询拓展节点、有向关系边,编辑节点、有向关系边、图例和拖动节点以更改节点位置,所有涉及到修改三元组陈述的编辑结果被保存到图数据库;
图谱布局持久化功能:浏览器将可视化图谱整体持久化到布局文件并保存到本地,通过布局文件恢复出所保存的可视化图谱。
10.根据权利要求8所述的基于布局文件的知识图谱可视化编辑与持久化的系统架构,其特征在于,所述后台图数据库管理模块包括功能单元:
SPARQL查询功能:服务器执行前台请求的SPARQL查询,并将查询得到的每条结果依据任意多条where条件提取为多组subject、predicate、object三元组;服务器将三元组处理成布局数据,供可视化图谱展示功能解析成相应的可视化图谱;
图谱文件写入功能:服务器将上传的TTL图谱关系文件写入到图数据库的指定模型图中进行持久化管理;
图谱数据转换功能:浏览器将布局文件上传到后台服务器,结合模型中的命名空间键值对转换为TTL格式的知识图谱文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010122562.9A CN111339316A (zh) | 2020-02-27 | 2020-02-27 | 一种知识图谱可视化编辑与持久化实现方法及系统架构 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010122562.9A CN111339316A (zh) | 2020-02-27 | 2020-02-27 | 一种知识图谱可视化编辑与持久化实现方法及系统架构 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111339316A true CN111339316A (zh) | 2020-06-26 |
Family
ID=71183845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010122562.9A Pending CN111339316A (zh) | 2020-02-27 | 2020-02-27 | 一种知识图谱可视化编辑与持久化实现方法及系统架构 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111339316A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111767412A (zh) * | 2020-09-02 | 2020-10-13 | 成都数联铭品科技有限公司 | 用于知识图谱构建的数据映射方法及系统、电子设备 |
CN112287114A (zh) * | 2020-09-28 | 2021-01-29 | 珠海大横琴科技发展有限公司 | 一种知识图谱服务处理方法和装置 |
CN112380357A (zh) * | 2020-12-09 | 2021-02-19 | 武汉烽火众智数字技术有限责任公司 | 一种知识图谱可视化可交互导航实现的方法 |
CN112507036A (zh) * | 2020-11-30 | 2021-03-16 | 武汉烽火众智数字技术有限责任公司 | 一种知识图谱可视化分析方法 |
CN113010758A (zh) * | 2021-03-04 | 2021-06-22 | 北京顶象技术有限公司 | 关联网络知识图谱可视化组件和方法 |
CN113157942A (zh) * | 2021-04-09 | 2021-07-23 | 杭州电子科技大学 | 适用于使用与展示的知识图谱可视化的构建方法 |
CN113220903A (zh) * | 2021-05-19 | 2021-08-06 | 云南电网有限责任公司电力科学研究院 | 一种基于知识图谱的电力事故可视化分析系统及方法 |
CN113313474A (zh) * | 2021-06-21 | 2021-08-27 | 罗华龙 | 一种人力资源管理系统及方法 |
CN113312472A (zh) * | 2021-05-20 | 2021-08-27 | 北京黑岩方碑网络科技有限公司 | 一种智能化的协同知识图谱记录和展示系统 |
CN113536663A (zh) * | 2021-06-17 | 2021-10-22 | 山东大学 | 基于环约束和应力模型的图可视化方法及系统 |
CN114297443A (zh) * | 2021-12-29 | 2022-04-08 | 卫宁健康科技集团股份有限公司 | 图数据查询语句的处理方法、装置、设备及存储介质 |
CN114417018A (zh) * | 2022-03-28 | 2022-04-29 | 金现代信息产业股份有限公司 | 一种知识图谱的全流程可视化配置系统及方法 |
CN115080671A (zh) * | 2022-07-26 | 2022-09-20 | 北京金堤科技有限公司 | 自定义关系图谱的创建方法、装置、存储介质及电子设备 |
CN115238089A (zh) * | 2022-07-07 | 2022-10-25 | 无锡芯领域微电子有限公司 | 一种对零散文本数据的可视化知识图谱处理方法 |
CN115826956A (zh) * | 2023-02-14 | 2023-03-21 | 长威信息科技发展股份有限公司 | 知识图谱业务规则的可视化编排分析方法及可视化构建器 |
WO2023077732A1 (zh) * | 2021-11-03 | 2023-05-11 | 北京邮电大学 | 面向数据可视化大屏的知识可视化开发方法及系统 |
CN116303516A (zh) * | 2023-04-21 | 2023-06-23 | 中信证券股份有限公司 | 一种更新知识图谱的方法、装置及相关设备 |
CN117112807A (zh) * | 2023-10-23 | 2023-11-24 | 浙江大学 | 基于力学模型的知识图谱关联信息焦点可视化方法及系统 |
CN117391192A (zh) * | 2023-12-08 | 2024-01-12 | 杭州悦数科技有限公司 | 基于图数据库的利用llm从pdf构建知识图谱的方法及装置 |
CN118626684A (zh) * | 2024-07-18 | 2024-09-10 | 杭州定川信息技术有限公司 | 一种可视化构建水利对象关联关系知识图谱的方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460083A (zh) * | 2018-01-16 | 2018-08-28 | 浙江大学 | 一种知识图谱可视化查询工具 |
CN109033260A (zh) * | 2018-07-06 | 2018-12-18 | 天津大学 | 基于rdf的知识图谱交互式可视化查询方法 |
-
2020
- 2020-02-27 CN CN202010122562.9A patent/CN111339316A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460083A (zh) * | 2018-01-16 | 2018-08-28 | 浙江大学 | 一种知识图谱可视化查询工具 |
CN109033260A (zh) * | 2018-07-06 | 2018-12-18 | 天津大学 | 基于rdf的知识图谱交互式可视化查询方法 |
Non-Patent Citations (1)
Title |
---|
林明: "基于知识图谱的交互关系浏览与分析:可视化模型与系统实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111767412B (zh) * | 2020-09-02 | 2020-12-08 | 成都数联铭品科技有限公司 | 用于知识图谱构建的数据映射方法及系统、电子设备 |
CN111767412A (zh) * | 2020-09-02 | 2020-10-13 | 成都数联铭品科技有限公司 | 用于知识图谱构建的数据映射方法及系统、电子设备 |
CN112287114A (zh) * | 2020-09-28 | 2021-01-29 | 珠海大横琴科技发展有限公司 | 一种知识图谱服务处理方法和装置 |
CN112507036A (zh) * | 2020-11-30 | 2021-03-16 | 武汉烽火众智数字技术有限责任公司 | 一种知识图谱可视化分析方法 |
CN112380357A (zh) * | 2020-12-09 | 2021-02-19 | 武汉烽火众智数字技术有限责任公司 | 一种知识图谱可视化可交互导航实现的方法 |
CN113010758A (zh) * | 2021-03-04 | 2021-06-22 | 北京顶象技术有限公司 | 关联网络知识图谱可视化组件和方法 |
CN113157942B (zh) * | 2021-04-09 | 2022-06-24 | 杭州电子科技大学 | 适用于使用与展示的知识图谱可视化的构建方法 |
CN113157942A (zh) * | 2021-04-09 | 2021-07-23 | 杭州电子科技大学 | 适用于使用与展示的知识图谱可视化的构建方法 |
CN113220903A (zh) * | 2021-05-19 | 2021-08-06 | 云南电网有限责任公司电力科学研究院 | 一种基于知识图谱的电力事故可视化分析系统及方法 |
CN113220903B (zh) * | 2021-05-19 | 2023-01-20 | 云南电网有限责任公司电力科学研究院 | 一种基于知识图谱的电力事故可视化分析系统及方法 |
CN113312472A (zh) * | 2021-05-20 | 2021-08-27 | 北京黑岩方碑网络科技有限公司 | 一种智能化的协同知识图谱记录和展示系统 |
CN113536663B (zh) * | 2021-06-17 | 2023-08-25 | 山东大学 | 基于环约束和应力模型的图可视化方法及系统 |
CN113536663A (zh) * | 2021-06-17 | 2021-10-22 | 山东大学 | 基于环约束和应力模型的图可视化方法及系统 |
CN113313474A (zh) * | 2021-06-21 | 2021-08-27 | 罗华龙 | 一种人力资源管理系统及方法 |
WO2023077732A1 (zh) * | 2021-11-03 | 2023-05-11 | 北京邮电大学 | 面向数据可视化大屏的知识可视化开发方法及系统 |
CN114297443B (zh) * | 2021-12-29 | 2023-11-24 | 卫宁健康科技集团股份有限公司 | 图数据查询语句的处理方法、装置、设备及存储介质 |
CN114297443A (zh) * | 2021-12-29 | 2022-04-08 | 卫宁健康科技集团股份有限公司 | 图数据查询语句的处理方法、装置、设备及存储介质 |
CN114417018A (zh) * | 2022-03-28 | 2022-04-29 | 金现代信息产业股份有限公司 | 一种知识图谱的全流程可视化配置系统及方法 |
CN115238089A (zh) * | 2022-07-07 | 2022-10-25 | 无锡芯领域微电子有限公司 | 一种对零散文本数据的可视化知识图谱处理方法 |
CN115080671A (zh) * | 2022-07-26 | 2022-09-20 | 北京金堤科技有限公司 | 自定义关系图谱的创建方法、装置、存储介质及电子设备 |
CN115826956A (zh) * | 2023-02-14 | 2023-03-21 | 长威信息科技发展股份有限公司 | 知识图谱业务规则的可视化编排分析方法及可视化构建器 |
CN115826956B (zh) * | 2023-02-14 | 2023-06-16 | 长威信息科技发展股份有限公司 | 知识图谱业务规则的可视化编排分析方法及可视化构建器 |
CN116303516A (zh) * | 2023-04-21 | 2023-06-23 | 中信证券股份有限公司 | 一种更新知识图谱的方法、装置及相关设备 |
CN117112807A (zh) * | 2023-10-23 | 2023-11-24 | 浙江大学 | 基于力学模型的知识图谱关联信息焦点可视化方法及系统 |
CN117112807B (zh) * | 2023-10-23 | 2024-01-30 | 浙江大学 | 基于力学模型的知识图谱关联信息焦点可视化方法及系统 |
CN117391192A (zh) * | 2023-12-08 | 2024-01-12 | 杭州悦数科技有限公司 | 基于图数据库的利用llm从pdf构建知识图谱的方法及装置 |
CN117391192B (zh) * | 2023-12-08 | 2024-03-15 | 杭州悦数科技有限公司 | 基于图数据库的利用llm从pdf构建知识图谱的方法及装置 |
CN118626684A (zh) * | 2024-07-18 | 2024-09-10 | 杭州定川信息技术有限公司 | 一种可视化构建水利对象关联关系知识图谱的方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111339316A (zh) | 一种知识图谱可视化编辑与持久化实现方法及系统架构 | |
CN107844297B (zh) | 一种数据可视化实现系统及方法 | |
DE60003725T2 (de) | Geographische karten auf einem persönlichen digitalen assistenten (pda) und server | |
US10146843B2 (en) | System, method and computer program for creating and manipulating data structures using an interactive graphical interface | |
CA2780330C (en) | System, method and computer program for creating and manipulating data structures using an interactive graphical interface | |
JP3309066B2 (ja) | ステートメントを構成するコンピュータ・システム、方法及びプログラム | |
Blaser et al. | Visualization in an early stage of the problem-solving process in GIS | |
US20010045949A1 (en) | Single gesture map navigation graphical user interface for a personal digital assistant | |
US20100079460A1 (en) | method and system for generating and displaying an interactive dynamic selective view of multiply connected objects | |
DE102014208515A1 (de) | Interaktive georäumliche Karte | |
CN103413002A (zh) | 一种拓扑图编辑后方法及拓扑图编辑器 | |
US20020188669A1 (en) | Integrated method for disseminating large spatial data sets in a distributed form via the internet | |
US20150346942A1 (en) | Drag & Drop for Defining Hierarchy | |
CN116245052A (zh) | 一种图纸迁移方法、装置、设备和存储介质 | |
CN117436054B (zh) | 一种岩土工程大数据共享平台 | |
US11768591B2 (en) | Dynamic graphical containers | |
JP3448874B2 (ja) | 文書処理装置および文書処理方法 | |
Egenhofer et al. | Interacting with GIS | |
JPWO2007052680A1 (ja) | 文書処理装置及び文書処理方法 | |
CN116756261A (zh) | 一种基于关系型数据库管理工具的gis数据处理方法 | |
US20070055928A1 (en) | User workflow lists to organize multimedia files | |
JP2010191889A (ja) | 地図データ編集装置及び地図データ編集装置用サーバ | |
JP3002528B2 (ja) | 図面管理方法および装置 | |
JP2001134424A (ja) | システムパラメタ作成方法、システムパラメタ作成装置、システムパラメタ作成プログラムを記録したコンピュータ読み取り可能な記録媒体及びシステムパラメタ作成データを格納したコンピュータ読み取り可能な記録媒体 | |
JP2008310800A (ja) | データベースおよび情報端末の表示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200626 |
|
RJ01 | Rejection of invention patent application after publication |