CN110795476B - 一种本体库的数据写入方法及装置 - Google Patents

一种本体库的数据写入方法及装置 Download PDF

Info

Publication number
CN110795476B
CN110795476B CN201910985063.XA CN201910985063A CN110795476B CN 110795476 B CN110795476 B CN 110795476B CN 201910985063 A CN201910985063 A CN 201910985063A CN 110795476 B CN110795476 B CN 110795476B
Authority
CN
China
Prior art keywords
ontology
data
node
nodes
instance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910985063.XA
Other languages
English (en)
Other versions
CN110795476A (zh
Inventor
黄伟
刘译璟
廖锐
于帮付
苏萌
刘钰
龚鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Percent Technology Group Co ltd
Original Assignee
Beijing Percent Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Percent Technology Group Co ltd filed Critical Beijing Percent Technology Group Co ltd
Priority to CN201910985063.XA priority Critical patent/CN110795476B/zh
Publication of CN110795476A publication Critical patent/CN110795476A/zh
Application granted granted Critical
Publication of CN110795476B publication Critical patent/CN110795476B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种本体库的数据写入方法及装置,其中,该方法包括:基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中,得到一个或多个本体实例的本体数据;其中,在分布式数据库中,来自不同外部数据源的相同本体实例的本体数据基于本体实例标识关联;基于本体实例标识将分布式数据库中存储的同一本体实例的本体数据进行聚合,并写入到本体库中。

Description

一种本体库的数据写入方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种本体库的数据写入方法及装 置。
背景技术
目前,随着互联网的发展,大量的信息涌入人们的视线,如何将这些海量 数据存储起来,以方便人们找到所需的信息,是一个需要解决的问题。
在相关技术中,解决上述问题的一个方案是将数据存储到关系数据库,关 系数据库能够很好地存储结构化数据并存储实体之间的关系,同时支持结构化 查询。但是对于关系较为复杂的情况,采用关系数据库进行存储,在设计数据 表时的难度比较大,而且容易造成数据冗余。
本体是一个源于哲学的概念,知识工程学者借用了这个概念,在开发知识 系统时用于领域知识的获取。本体是用于描述一个领域的术语集合,其组织结 构是层次结构化的,可以作为一个知识库的骨架和基础。本体是第三代互联网 --语义网(Semantic Web)的基础,也是语义搜索的基础。目前,这一概念已 被引进数据库设计和开发,以本体的方式进行数据存储可以沿用之前的自下而 上的方式,也可以采用自上而下的方式,即首先确定和设计领域中的概念和实 体的构成关系,概念和实体所具体的属性,建立起一个系统的本体,然后根据 各个实体的属性,构建各个本体实例,例如,在设计时,可以设计一个“人” 的本体,并设计“人”的属性信息,例如,可以包含:姓名、住址和电话,而 具体的人,例如,张三,则是一个本体实例,该本体实例的各个属性信息的值 具体为:姓名:张三、住址:北京市海淀区XX路X号、电话:138XXXXXXXX。
使用本体进行数据存储时,如何将现有数据源中的数据转换到本体库中, 目前尚未提出有效的解决方案。
发明内容
本申请实施例提供一种本体库的数据写入方法。
本申请实施例还提供一种本体库的数据写入装置。
本申请实施例采用下述技术方案:
本申请实施例一方面提供了一种本体库的数据写入方法,包括:基于本体 配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式 数据库中,得到一个或多个本体实例的本体数据;其中,在所述分布式数据库 中,来自不同外部数据源的相同本体实例的本体数据基于本体实例标识关联; 基于本体实例标识将所述分布式数据库中存储的同一本体实例的本体数据进 行聚合,并写入到本体库中。
可选地,所述本体配置信息包括:所述至少一个外部数据源的标识信息、 所述外部数据源中的预设数据字段与定义本体的属性字段的映射关系、以及聚 合同一本体实例的本体数据的数据融合规则。
可选地,将至少一个外部数据源中的本体相关数据导入到列式存储的分布 式数据库中,包括:根据所述至少一个外部数据源的标识信息,从所述至少一 个外部数据源中依次获取各个数据实体的预设数据字段的数据,并根据所述映 射关系,将所述数据实体的预设数据字段的数据转换为本体实例的属性字段的 数据后导入到所述分布式数据库。
可选地,在基于本体配置信息,将至少一个外部数据源中的本体相关数据 导入到列式存储的分布式数据库中之前,所述方法还包括:基于预设的取数逻 辑,从所述至少一个所述外部数据源中获取所述预设数据字段;将所述预设数 据字段与定义本体的属性字段进行匹配,得到所述外部数据源中的预设数据字 段与定义本体的属性字段的映射关系。
可选地,基于本体实例标识将同一本体实例的本体数据进行聚合,并写入 到本体库,包括:基于本体实例标识,将同一本体实例的不同属性字段的本体 数据进行聚合,并写入到所述本体库中,其中,对于来自不同外部数据源的同 一本体实例的本体数据:根据预先设置的优先级,确定所述不同外部数据源中 的优先级最高的外部数据源,将来自所述优先级最高的外部数据源的本体数据 作为所述同一本体实例的本体数据写入到所述本体库中;或者,将来自所述不 同数据源的本体数据中相同属性字段的本体数据进行组合,将组合得到的本体 数据作为所述同一本体实例的本体数据写入到所述本体库中。
可选地,所述本体库包括:全文检索引擎和图数据库,其中,所述全文检 索引擎存储的本体实例包括:实体类本体实例、事件类本体实例以及文档类本 体实例,所述图数据库存储的本体实例包括:关系类本体实例。
可选地,在基于本体实例标识将同一本体实例的本体数据进行聚合,并写 入到本体库中之后,所述方法还包括:接收到查询指令,从所述本体库中获取 与所述查询指令对应的查询结果;以图形的形式在画布中显示所述查询结果, 其中,所述图形中包括:节点、或者,节点和节点之间的连接关系,所述节点 用于表示所述查询结果中的实体类本体实例、事件类本体实例或文档类本体实 例,节点之间的连接关系用于表示所述查询结果中的关系类本体实体。
可选地,以图形的形式在画布中显示所述查询结果包括:根据待显示的所 述节点大小,计算出各个所述节点之间的间距;根据待显示的所述节点的数量, 计算出节点排列的行数和列数;根据所述行数、列数和所述间距计算得到第一 个所述节点距离画布中心点的坐标差;根据所述中心点的坐标,得到第一个所 述节点的实际坐标;根据所述行数、列数和所述间距计算得到第二个所述节点 距离画布中心点的坐标差,并根据所述中心点的坐标,得到第二个所述节点的 实际坐标,如此循环,得到各个所述节点的实际坐标;按照各个所述节点的实 际坐标,显示所述查询结果。
可选地,以图形的形式在画布中显示所述查询结果包括:将待显示的各个 所述节点划分为多个子图;根据预设的子图的显示图标的形状,确定各个所述 子图的显示图标的中心点及大小;按照各个所述子图的中心点,将各个所述子 图的显示图标按照网格形式进行排列;在排列后的各个所述子图的显示图标之 间存在重叠的情况下,对各个所述子图的显示图标的排列方式进行调整,直到 各个所述子图的显示图标之间不存在重叠,按照当前的排列方式显示各个所述 子图的显示图标;对于任一所述子图中的各个所述节点,获取各个所述节点中 与该节点具有一度关系的节点的对应关系,根据所述对应关系,确定该子图的 布局层数以及各层布局的节点,再根据节点大小、间距以及层数,确定布局在 各层的节点的纵坐标,并按照同层节点从该子图的显示图标的中间均匀向两边 分布的原则,确定各层的节点的横坐标,根据该子图的各个所述节点的纵坐标 和横坐标显示该子图的各个所述节点。
可选地,在以图形的形式在画布中显示所述查询结果之后,所述方法还包 括:接收到输入的扩展指令,其中,所述扩展指令指示对当前选中的节点进行 扩展;从所述本体库中查询并显示与所述当前选中的节点具有一度关系的节 点;响应输入的对显示的所述具有一度关系的节点进行选择的操作,将选择的 节点显示在画布上,并显示所述选择的节点与所述当前选中的节点之间的连接 关系。
可选地,在以图形的形式在画布中显示所述查询结果之后,所述方法还包 括:接收到输入的流分析指令,其中,所述流分析指令指示对当前选中的节点 进行流分析;查询与所述当前选中的节点存在数据传输关系的关系节点;以动 画的方式显示所述当前选中的节点与所述关系节点之间的数据传输。
可选地,以图形的形式在画布中显示所述查询结果包括:按照所述查询结 果中各个本体实例涉及的时间属性,将所述查询结果中的各个本体实例的节点 显示在时间轴上的对应区域;或者,对于所述查询结果中两个实体类本体实例 涉及的多个事件类本体实例,对所述多个事件类本体实例的节点进行合并显 示。
可选地,在以图形的形式在画布中显示所述查询结果之后,所述方法还包 括:接收到词云分析指令,其中,所述词云分析指令指示展现文档类本体中的 热点词汇;在所述查询结果中包含文档类本体实例的情况下,从所述文档类本 体实例的文档中查询并显示热点词汇。
可选地,在以图形的形式在画布中显示所述查询结果之后,所述方法还包 括:按照所述查询结果中各个本体实例的类型以及属性信息,分类显示所述查 询结果;或者检测到从一个所述节点到另一个所述节点的拖动操作,建立所述 一个节点与所述另一个节点之间的关系类本体实例,并根据接收到的输入信 息,确定建立的所述关系类本体实例的属性信息;或者接收到对编辑指令,其 中,所述编辑指令指示对当前显示的节点对应的本体实例的属性进行编辑;根 据接收到的输入信息,修改所述当前显示的节点对应的本体实例的属性信息; 或者,接收到图形搜索指令,其中,所述图形搜索指令指示搜索画布上指定区域内的节点;根据获取并显示位于所述指定区域内的节点。
本申请实施例另一方面提供了一种本体库的数据写入装置,包括:导入模 块,用于基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到 列式存储的分布式数据库中,得到一个或多个本体实例的本体数据;其中,在 所述分布式数据库中,来自不同外部数据源的相同本体实例的本体数据基于本 体实例标识关联;写入模块,用于基于本体实例标识将同一本体实例的本体数 据进行聚合,并写入到本体库中。
可选地,所述本体配置信息包括:所述至少一个外部数据源的标识信息、 所述外部数据源中的预设数据字段与定义本体的属性字段的映射关系、以及聚 合同一本体实例的本体数据的数据融合规则;所述导入模块,包括:取数单元, 用于根据所述至少一个外部数据源的标识信息,从所述至少一个外部数据源中 依次获取各个数据实体的预设数据字段的数据;转换单元,用于根据所述映射 关系,将所述数据实体的预设数据字段的数据转换为本体实例的属性字段的数 据,得到一个或多个本体实例的本体数据;导入单元,用于将所述一个或多个 本体实例的本体数据导入到所述分布式数据库。
可选地,还包括:映射模块,用于基于预设的取数逻辑,从所述至少一个 所述外部数据源中获取所述预设数据字段,将所述预设数据字段与定义本体的 属性字段进行匹配,得到所述外部数据源中的预设数据字段与定义本体的属性 字段的映射关系。
可选地,所述写入模块通过以下方式将本体数据写入到本体库:基于本体 实例标识,将同一本体实例的不同属性字段的本体数据进行聚合,并写入到所 述本体库中,其中,对于来自不同外部数据源的同一本体实例的本体数据:根 据预先设置的优先级,确定所述不同外部数据源中的优先级最高的外部数据 源,将来自所述优先级最高的外部数据源的本体数据作为所述同一本体实例的 本体数据写入到所述本体库中;或者,将来自所述不同数据源的本体数据中相 同属性字段的本体数据进行组合,将组合得到的本体数据作为所述同一本体实 例的本体数据写入到所述本体库中。
可选地,所述本体库包括:全文检索引擎和图数据库,其中,所述全文检 索引擎存储的本体实例包括:实体类本体实例、事件类本体实例以及文档类本 体实例,所述图数据库存储的本体实例包括:关系类本体实例;所述装置还包 括:查询模块,用于接收到查询指令,从所述本体库中获取与所述查询指令对 应的查询结果;显示模块,用于以图形的形式在画布中显示所述查询结果,其 中,所述图形中包括:节点、或者,节点和节点之间的连接关系,所述节点用 于表示所述查询结果中的实体类本体实例、事件类本体实例或文档类本体实 例,节点之间的连接关系用于表示所述查询结果中的关系类本体实体。
可选地,所述显示模块通过以下方式显示所述查询结果:根据待显示的所 述节点大小,计算出各个所述节点之间的间距;根据待显示的所述节点的数量, 计算出节点排列的行数和列数;根据所述行数、列数和所述间距计算得到第一 个所述节点距离画布中心点的坐标差;根据所述中心点的坐标,得到第一个所 述节点的实际坐标;根据所述行数、列数和所述间距计算得到第二个所述节点 距离画布中心点的坐标差,并根据所述中心点的坐标,得到第二个所述节点的 实际坐标,如此循环,得到各个所述节点的实际坐标;按照各个所述节点的实 际坐标,显示所述查询结果。
可选地,所述显示模块通过以下方式显示所述查询结果:将待显示的各个 所述节点划分为多个子图;根据预设的子图的显示图标的形状,确定各个所述 子图的显示图标的中心点及大小;按照各个所述子图的中心点,将各个所述子 图的显示图标按照网格形式进行排列;在排列后的各个所述子图的显示图标之 间存在重叠的情况下,对各个所述子图的显示图标的排列方式进行调整,直到 各个所述子图的显示图标之间不存在重叠,按照当前的排列方式显示各个所述 子图的显示图标;对于任一所述子图中的各个所述节点,获取各个所述节点中 与该节点具有一度关系的节点的对应关系,根据所述对应关系,确定该子图的 布局层数以及各层布局的节点,再根据节点大小、间距以及层数,确定布局在 各层的节点的纵坐标,并按照同层节点从该子图的显示图标的中间均匀向两边 分布的原则,确定各层的节点的横坐标,根据该子图的各个所述节点的纵坐标 和横坐标显示该子图的各个所述节点。
可选地,还包括:扩展模块,用于在所述显示模块显示所述查询结果之后, 接收到输入的扩展指令,其中,所述扩展指令指示对当前选中的节点进行扩展; 从所述本体库中查询并显示与所述当前选中的节点具有一度关系的节点;响应 输入的对显示的所述具有一度关系的节点进行选择的操作,将选择的节点显示 在画布上,并显示所述选择的节点与所述当前选中的节点之间的连接关系。
可选地,还包括:流分析模块,用于在所述显示模块显示所述查询结果之 后,接收到输入的流分析指令,其中,所述流分析指令指示对当前选中的节点 进行流分析;查询与所述当前选中的节点存在数据传输关系的关系节点;以动 画的方式显示所述当前选中的节点与所述关系节点之间的数据传输。
可选地,所述显示模块还用于通过以下方式显示所述查询结果:按照所述 查询结果中各个本体实例涉及的时间属性,将所述查询结果中的各个本体实例 的节点显示在时间轴上的对应区域;或者,对于所述查询结果中两个实体类本 体实例涉及的多个事件类本体实例,对所述多个事件类本体实例的节点进行合 并显示。
可选地,还包括:词云分析模块,用于在所述显示模块显示所述查询结果 之后,接收到词云分析指令,其中,所述词云分析指令指示展现文档类本体中 的热点词汇;在所述查询结果中包含文档类本体实例的情况下,从所述文档类 本体实例的文档中查询并显示热点词汇。
可选地,还包括:分类模块,用于在所述显示模块显示所述查询结果之后, 按照所述查询结果中各个本体实例的类型以及属性信息,分类显示所述查询结 果;或者编辑模块,用于在所述显示模块显示所述查询结果之后,检测到从一 个所述节点到另一个所述节点的拖动操作,建立所述一个节点与所述另一个节 点之间的关系类本体实例,并根据接收到的输入信息,确定建立的所述关系类 本体实例的属性信息;或者接收到对编辑指令,其中,所述编辑指令指示对当 前显示的节点对应的本体实例的属性进行编辑;根据接收到的输入信息,修改 所述当前显示的节点对应的本体实例的属性信息;或者,地图模块,用于接收 到图形搜索指令,其中,所述图形搜索指令指示搜索画布上指定区域内的节点; 根据获取并显示位于所述指定区域内的节点。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:基于 本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分 布式数据库中,得到一个或多个本体实例的本体数据,并且,在分布式数据库 中将来自不同外部数据源的相同本体实例的本体数据基于本体实例标识关联 存储,再基于本体实例标识将同一个本体实例的本体数据进行聚合,并写入到 本体库中。通过本申请提供的技术方案,可以根据用户的配置,将数据源中的 数据转换为本体数据先转换到分布式数据库中,然后再聚合写入本体库,实现 数据从现有数据源到本体库的转换。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部 分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不 当限定。在附图中:
图1为实施例1提供的一种本体库的数据写入方法的流程图;
图2为实施例1中一种节点布局的示意图;
图3为实施例1中另一种节点布局的示意图;
图4为实施例1中又一种节点布局的示意图;
图5为实施例1中一种节点扩展的示意图;
图6为实施例1中一种流分析的流程示意图;
图7为实施例1中一种按照时间轴进行显示的示意图;
图8为实施例1中一种对查询结果进行分类显示的示意图;
图9a为实施例1中两个本体实例中存在多个事件的示意图;
图9b为实施例1中将多个事件进行合并显示的示意图;
图10为实施例1中将画布数据保存到工作区的一种示例流程图;
图11为实施例1中将画布数据下载的一种示例流程图;
图12为实施例1中的进行词云分析的一种示例流程图;
图13为实施例1中的通过拖动建立关系的示意图;
图14为实施例1中对本体实例进行编辑的示意图;
图15为实施例1中通过地图选择节点的示意图;
图16是本申请提供的一种本体库的数据写入装置的结构示意图;
图17为本申请实施例中的一个本体库的构建及应用系统的示例图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实 施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的 实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施 例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
实施例1
本实施例提供了一种本体库的数据获取方法。
图1为本实施例提供的一种本体库的数据获取方法的流程图,如图1所示, 该方法主要包括以下步骤S102至步骤S104。
步骤S102中,基于本体配置信息,将至少一个外部数据源中的本体相关 数据导入到列式存储的分布式数据库中,得到一个或多个本体实例的本体数 据;其中,在所述分布式数据库中,来自不同外部数据源的相同本体实例的本 体数据基于本体实例标识关联。
在本实施例的一个可选实施方式中,本体配置信息包括但不限于:至少一 个外部数据源的标识信息、外部数据源中的预设数据字段与定义本体的属性字 段的映射关系、以及聚合同一本体实例的本体数据的数据融合规则。其中,外 部数据源中的预设数据字段可以是与本体相关数据对应的数据字段,在实际应 用中,对于某些数据源,并不需要将其所有的数据均导入到本体库中,因此, 可以通过配置预设数据字段来确定需要获取的数据,以避免获取的数据过于杂 乱。
在上述可选实施方式中,外部数据源的标识信息可以是外部数据源的地址 和/或名称,只要是通过该标识信息可以访问到外部数据源即可,具体本实施例 不作限定。
在本实施例的一个可选实施方式中,可以通过提供配置界面,由用户手动 配置上述本体配置信息。
在本实施例的一个具体应用中,在配置本体配置信息时,可以采用自顶而 下的方式建立知识图谱的结构(schema),为知识图谱中的每个节点建立本体, 对应的建立该本体的字段属性和属性类型等。在具体应用中,知识图谱中的每 个节点对应的本体的类型包括:实体类本体、文档类本体和事件类本体,另外, 还可以建立各个节点本体之间的关系类本体,在实际应用中,关系类本体的字 段属性值可以直接设置为固定值,关系类本体用于存储连接两端的本体的索 引。
在实际应用中,可以接入大量异构的数据源,因此,在配置时,可以配置 数据源的标识信息,可以根据数据源的标识信息在线测试数据源的连接性。在 本实施例中,数据源的类型包括但不限于:关系型数据库、全文检索数据库、 列式存储数据库和消息队列等。
在实际应用中,不同的外部的数据源可能具有不同的结构,也可能具有不 同的字段,因此,为了得到外部数据源中的数据字段与定义本体的属性字段之 间的映射关系前,需要先获取数据源中的数据字段。因此,在本实施例的一个 可选实施方式中,在步骤S102之前,还可以包括以下步骤1-步骤2:
步骤1,基于预设的取数逻辑,从所述至少一个所述外部数据源中获取所 述预设数据字段。
在实际应用中,取数逻辑可以采用结构化查询语言(Structured QueryLanguage,SQL)查询语句,也可以采用JS对象简谱(JavaScript Object Notation, JSON)格式,以支持多种结构的数据源。
在实际应用中,在解析取数逻辑时,需要验证SQL查询语句或JSON格式 的正确性,为了减少验证所消耗的时间,在本实施例的一个可选实施方式中, 在执行取数逻辑获取外部数据源中的数据字段时,可以采用异步调用的形式验 证SQL查询语句或JSON格式的正确性,并解析出相应的字段名。
步骤2,将所述预设数据字段与定义本体的属性字段进行匹配,得到所述 外部数据源中的预设数据字段与定义本体的属性字段的映射关系。
在具体应用中,可以根据本体的属性字段的字段名与数据源中的字段的字 段名进行自动映射,映射的规则是字段名相同的本体的属性字段与数据源中的 字段相对应,如果存在字段名不同的字段,则可以提示用户,由用户手动选择 映射关系,响应用户的选择,将用户选择的两个字段名设置为一对映射关系, 从而可以保证映射关系的准确性。
在本实施例的一个可选实施方式中,在将至少一个外部数据源中的本体相 关数据导入到列式存储的分布式数据库中时,可以根据外部数据源的标识信 息,从外部数据源中取数,然后再依据映射关系,转换获取到的数据,因此, 在该可选实施方式中,将至少一个外部数据源中的本体相关数据导入到列式存 储的分布式数据库中可以包括:根据所述至少一个外部数据源的标识信息,从 所述至少一个外部数据源中依次获取各个数据实体的预设数据字段的数据,并 根据所述映射关系,将所述数据实体的预设数据字段的数据转换为本体实例的 属性字段的数据后导入到所述分布式数据库。在实际应用中,可以采用同步队 列的方式进行数据转换,例如,在从外部数据源中读取到一个数据实体的预设 数据字段的数据后,根据外部数据源中的预设数据字段与定义本体的属性字段 的映射关系,将读取到的数据转换为本体数据推送到同步队列中存储,然后采 用导入器将该本体数据写入到分布式数据库中,并继续从外部数据源中读取下 一个数据实体的预设数据字段的数据,再根据映射关系进行转换存入到同步队 列,再写入到分布式数据库中,如此循环,直到读取完外部数据源中的数据记 录。
在上述可选实施方式中,将从外部数据源中获取到的数据转换为本体数据 的过程,是对配置的本体进行实例化的过程,通过该过程可以得到具体的本体 实例,例如,配置的“人”的本体,在数据源中读取到“张三”的数据,则得 到一个本体实例:张三,并根据数据源中存储的与“张三”对应的字段,得到 本体实例“张三”的各个属性字段的值。
在上述可选实施方式中,在将获取的数据转换为本体数据时,可以为每个 本体实例分配一个唯一标识,即本体实例标识,在将本体数据存储到分布式数 据库中时,将同一本体实例的本体数据基于本体实例标识关联。
在具体应用中,分布式数据库中可以包括多个数据节点,可以将本体数据 存储到任一数据节点中,由于分布式数据库具有分布式的特性,插入和读取数 据的速度会比较快,因此,在本实施例中,将本体数据先存入到分布式数据库 中,可以避免写入的数据太多而导致拥堵的情况。
在实际应用中,可选地,分布式数据库可以采用一个分布式的、面向列的 开源数据库HBase,HBase不同于一般的关系数据库,它是一个适合于非结构 化数据存储的数据库,因此,比较适合存储本体数据。
在实际应用中,不同的数据源中数据可能会对应到同一本体实例,在本实 施例的一个可选实施方式中,为了避免数据遗漏的情况,对于来自不同数据源 的同一本体实例的本体数据,并不丢弃整条数据,而是将来自不同数据源同一 本体实例的本体数据关联存储在分布式数据库中。例如,在HBase中,假如数 据A和数据B都映射到了本体C,则可以将数据A和数据B存储在同一个表 的同一个rowkey(行键)的对应的同一个列簇下不同的列,列名可以通过数据 源索引来确定。
在实际应用中,在将本体数据存储到分布式数据库时,可以为每一条数据 建立一个数据表,如果是实体类本体,它的数据表的名称可以采用统一前缀+ 对应的本体实例索引(例如,本体实例标识)+对应的本体实例类型,采用这 种方式,方便来自不同数据源的同一本体实例的进行数据融合;如果是其他的 本体类则采用统一前缀+数据源标识+对应的本体实例索引(例如,本体实例标 识)+对应的本体实例类型,这种规则来建立表名,这类本体数据不需要融合, 这样就可以隔离映射到同一本体的不同数据源。
步骤S104,基于本体实例标识将所述分布式数据库中存储的同一本体实例 的本体数据进行聚合,并写入到本体库中。
在具体应用中,可选地,可以设置同步事件,在检测到同步事件时,将同 一本体实例的不同属性字段的本体数据进行聚合,并写入到所述本体库中。
在实际应用中,同步事件可以根据具体需求进行设置,例如,可以是预设 周期,也可以是分布式数据库中的数据量达到预定值,具体本实施例中不作限 定。
在步骤S104中,可以根据上述可选实施方式中的本体配置信息中聚合同 一本体实例的本体数据的数据融合规则,对来自不同外部数据源的同一本体实 例的本体数据进行融合,例如,在本实施例的一个可选实施方式中,如果融合 规则为优先级规则,则可以预先设置各个数据源的优先级,在步骤S104中, 根据预先设置的优先级,确定所述不同外部数据源中的优先级最高的外部数据 源,将来自所述优先级最高的外部数据源的本体数据作为所述同一本体实例的 本体数据写入到所述本体库中,例如,数据A和数据B都映射到了本体C,数 据A来自于数据源a,数据B来自数据源b,而数据源a的优先级高于数据源 b,则将数据A作为本体C的本体数据写入到本体库中。
或者,在本实施例的一个可选实施方式中,如果融合规则为组合规则,则 将来自所述不同数据源的本体数据中相同属性字段的本体数据进行组合,将组 合得到的本体数据作为所述同一本体实例的本体数据写入到所述本体库中。例 如,数据A和数据B都映射到了本体C,则将数据A与数据B进行组合,将 组合得到的数据E作为本体C的本体数据写入到本体库中。在该可选实施方式 中,可选地,在将来自不同数据源的本体数据进行组合时,可以将来自不同数 据源的本体数据的相同属性信息的值进行组合,例如,数据A中包括的数据是: 姓名:张三、电话:138xxxxxxxx,而数据B中包括的数据是:姓名:张三、 电话:135xxxxxxxx,则组合后得到的数据E为:姓名:张三、电话: 138xxxxxxxx+135xxxxxxxx。通过该可选实施方式中,可以使得本体库中存储 的数据信息更加完整。
在本实施例的一个可选实施方式中,本体库可以包括全文检索引擎和图数 据库,所述全文检索引擎存储的本体实例包括:实体类本体实例、事件类本体 实例以及文档类本体实例,所述图数据库存储的本体实例包括:关系类本体实 例。
在将本体数据同步到本体库之后,可以对本体库中存储的本体数据进行查 询,为用户提供查询结果。
在本实施例的一个可选实施方式中,为了方便用户扩展本体间的关系,可 以查询图数据库,以图形的方式向用户展示查询结果。因此,在该可选实施方 式中,在基于本体实例标识将同一本体实例的本体数据进行聚合,并写入到本 体库中之后,还可以包括:接收到查询指令,从所述本体库中获取与所述查询 指令对应的查询结果;以图形的形式在画布中显示所述查询结果。其中,所述 图形中包括:节点、或者,节点和节点之间的连接关系,所述节点用于表示所 述查询结果中的实体类本体实例、事件类本体实例或文档类本体实例,节点之 间的连接关系用于表示所述查询结果中的关系类本体实体。在该可选实施方式中,以图形的方式显示查询结果,使得用户可以很直观的获取到查询结果。
在上述可选实施方式中,在显示所述查询结果时,可以采用自动布局的方 式,如图2所示,对各个节点进行布局展示。
或者,在本实施例的一个可选实施方式中,可以采用网络布局的方式显示 查询结果。在该可选实施方式中,可以按照以下步骤显示查询结果:
步骤1,根据待显示的所述节点大小,计算出各个所述节点之间的间距;
步骤2,根据待显示的所述节点的数量,计算出节点排列的行数和列数;
步骤3,根据所述行数、列数和所述间距计算得到第一个所述节点距离画 布中心点的坐标差;
步骤4,根据所述中心点的坐标(在实际应用中,中心点的坐标默认可以 为(0.5,0.5),当然也可以为其它值,具体可以根据画布的布局确定),得到 第一个所述节点的实际坐标;
步骤5,根据所述行数、列数和所述间距计算得到第二个所述节点距离画 布中心点的坐标差,并根据所述中心点的坐标,得到第二个所述节点的实际坐 标,如此循环,得到各个所述节点的实际坐标;
步骤6,按照各个所述节点的实际坐标,显示所述查询结果,最后得到显 示效果如图3所示。
采用上述算法进行布局,其时间复杂度为O(n),空间复杂度Ω(n),其中, n为查询结果中包含的节点的数量。
或者,在本实施例的另一个可选实施方式中,也可以采用层次布局的方式 显示查询结果。在该可选实施方式中,可以通过以下步骤显示查询结果:
步骤1,将待显示的各个所述节点划分为多个子图;在该可选实施方式中, 先遍历全图,划分出各个子图,然后在每个子图之间进行力学布局,再在各个 子图本身进行层次布局。
步骤2,根据预设的子图的显示图标的形状,确定各个所述子图的显示图 标的中心点及大小;例如,子图的显示图标可以为长方形,根据子图的层次布 局结果可以确定子图的显示图标的长宽。
步骤3,按照各个所述子图的中心点及大小,将各个所述子图的显示图标 按照网格形式进行排列;
步骤4,在排列后的各个所述子图的显示图标之间存在重叠的情况下,对 各个所述子图的显示图标的排列方式进行调整,直到各个所述子图的显示图标 之间不存在重叠,按照当前的排列方式显示各个所述子图的显示图标;
具体地,在步骤3和步骤4,以各个子图的中心点对所有子图进行网格布 局,即按照以子图为基本单位按照上述的网格布局方式对所有子图进行布局, 然后每个子图之间定义斥力,当任意2个子图之间距离小于2个子图斜边之和 时,斥力较大,需要重新布局,否则,斥力较小,不需要重新布局,直到各个 子图之间不存在重叠时迭代收敛。
步骤5,对于任一所述子图中的各个所述节点,获取各个所述节点与该节 点具有一度关系的节点的对应关系,根据所述对应关系,确定该子图的布局层 数以及各层布局的节点,再根据节点大小、间距以及层数,确定布局在各层的 节点的纵坐标,并按照同层节点从该子图的显示图标的中间均匀向两边分布的 原则,确定各层的节点的横坐标,根据该子图的各个所述节点的纵坐标和横坐 标显示该子图的各个所述节点。如果有孤立节点(即查询结果中不存在与其存 在关系的节点,则直接将该节点作为其子图的子节点。图4为采用该方式进行 布局的显示效果示意例。
在本实施例的一个可选实施方式中,用户还可以在显示查询结果的画布上 对其中的节点进行扩展,因此,在该可选实施方式中,在显示查询结果之后, 该方法还可以包括:接收到输入的扩展指令,其中,所述扩展指令指示对当前 选中的节点进行扩展;从所述本体库中查询并显示与所述当前选中的节点具有 一度关系的节点;响应输入的对显示的所述具有一度关系的节点进行选择的操 作,将选择的节点显示在画布上,并显示所述选择的节点与所述当前选中的节 点之间的连接关系。例如,在图5中,用户可以选中“人A”这个本体实例, 输入对这个本体实例进行扩展的指令(例如,选中“人A”,点击右键,在弹 出的功能选项中选择扩展),扩展出与“人A”具有“拥有”关系的本体实例 “电话A”,再通过扩展本体实例“电话A”扩展出与“电话A”具有“打电 话”关系的事件本体实例“打电话事件”以及与该事件本体实例对应的“电话 B”,再扩展出与“电话B”具有“属于”关系的本体实例“人B”,从而可以 “人A”向“人B”打电话的信息。通过该可选实施方式中,用户可以通过查 询结果获取到与查询结果中的节点相应的扩展信息。
为了使查询结果的显示更加直观,在本实施例的一个可选实施方式中,提 供了流分析功能。在该可选实施方式中,在显示所述查询结果之后,还可以包 括:接收到输入的流分析指令,其中,所述流分析指令指示对当前选中的节点 进行流分析;查询与所述当前选中的节点存在数据传输关系的关系节点;以动 画的方式显示所述当前选中的节点与所述关系节点之间的数据传输。例如,假 设当前画布中显示的查询节点中,本体实例A与本体实例B存在转账关系, 即A转账给B,则采用该可选实施方式提供的技术方案,画布中动画展示节点 A到节点B的交易数据流动。
在上述可选实施方式中,在接收到流分析指令时,如图6所示,可以先判 断当前是否存在自定义流分析,如果否,则可以提示用户建立流分析,并根据 用户的输入建立自定义流分析(即定义哪些关系可以展示动画的数据流动), 然后获取用户选中的流分析,再分析当前画布中显示的节点是否存在跟流分析 匹配的数据,例如,如果自定义流分析为转账关系,如果有,则判断当前显示 的节点之间是否存在有转账关系,如果有,则执行流分析,否则,显示不存在 数据,结束流分析流程。通过该可选实施方式,可以以一种很直接的方式向用 户展现两个本体实例之间的数据交互。
在本实施例的一个可选实施方式中,为了便于用户查看,在显示查询结果 时,按照所述查询结果中各个本体实例涉及的时间属性,将所述查询结果中的 各个本体实例的节点显示在时间轴上的对应区域。例如,对于事件型本体,一 般都具有一个发生时间的属性信息,根据该属性信息的值,可以确定各个事件 类本体实例的发生时间,而事件类本体一般会涉及一个或多个实体类本体,在 该可选实施方式中,可以将该事件类本体实例、该事件类本体实例对应的一个 或多个实体类本体实例的节点显示在时间轴上与该事件类本体实例的发生时 间相对应的位置,显示效果如图7所示。通过该可选实施方式,可以统计画布 上的节点中具有发生时间的数据,针对时间进行聚合,从而可以方便快速的选 择时间段,高亮选择时间段内的节点,比如可以在地图上,利用时间轴实现运 动轨迹的查看,可以在时间轴上看到以不同粒度的时间展示的数据,可以以一 定的速度在时间轴上选中对象,相应的地图上的点也会高亮,从而实现动态的 显示节点随着时间的运动的轨迹。
在本实施例的一个可选实施方式中,在显示查询结果后,还可以按照查询 结果中各个本体实例的类型以及属性信息,分类显示查询结果,例如,在图8 中显示的查询结果中,涉及有两个实体类型的本体和一个事件类型的本体,其 中,两个实体类型的本体为“人”和“电话”,其中,“人”具有两个具体的实 例,而“电话”也具有两个具体的实例,事件类型的本体为“打电话事件”, 实体类本体的实体属性涉及“人”的“性别”,其中,性别为男的本体实例有 一个,性别为女的本体实例也有一个,而事件类本体的事件属性涉及“打电话事件”的“时间”,其值为2019-05-23 12:23:23。采用这种方式,用户可以很直 接地得到查询结果,方便用户查看。
在实际应用中,在查询结果中,两个实体类本体实例之间可能存在有大量 的事件类本体实例,如果将这些实例都显示出来,可以会使展现画布看起来比 较杂乱,因此,在本实施例的一个可选实施方式中,在显示查询结果时,对于 所述查询结果中两个实体类本体实例涉及的多个事件类本体实例,对所述多个 事件类本体实例的节点进行合并显示。例如,在图9a中,电话A和电话B之 间一共有6个打电话事件,如果将这个6个打电话事件都显示出来,画面看起 来比较混乱,因此,可以将这个6个打电话事件合并起来显示,合并结果如图 9b所示。当然,在具体应用中,为了方便用户查看,还可以将合并的显示结果 进行拆分,即将图9b所示的显示画面拆分为图9a所示的显示画面,以使用户 可以方便的查看其中的某个打电话事件。
在本实施例的一个可选实施方式中,为了方便用户以后查看或者发送给其 他用户查看,还可以将当前显示的部分或全部数据保存到工作区,或者是下载 到本地,例如,可以保存为csv文件。
图10为将画布数据保存到工作区的一种示例流程图,在图10中,根据用 户输入的指令打开工作区,系统判断画布上是否有数据,如果否,则根据用户 输入的指令,打开指定的内容,如果是,则提示是否保存画布数据,并根据用 户输入的指令,判断是否保存,如果否,则打开用户指定的内容,如果是,则 保存画布数据,然后打开用户指定的内容。
图11为本实施例中将画布数据下载的一种示例流程图,在图11中,先接 收到用户输入的下载指令,然后判断画布中是否有数据,如果没有,则提示没 有数据,结束;否则,判断当前是否有被选中的数据,如果否,则提示没有选 中,结束流程;否则,判断选中的是否包括文档类型的本体实例,如果是,则 提示文档类型不支持下载,结束,否则,开始下载画布上的数据。
在本实施例的一个可选实施方式中,为了使用户可以快速查看到文档类本 体实例中的关键信息,在显示查询结果之后,该方法还可以包括:接收到词云 分析指令,其中,所述词云分析指令指示展现文档类本体中的热点词汇;在所 述查询结果中包含文档类本体实例的情况下,从所述文档类本体实例的文档中 查询并显示热点词汇。在具体应用中,可以通过自然语言处理(Natural Language Processing,NLP)实现词云分析,找到热点词汇。
图12为本实施例中的进行词云分析的一种示例流程图,如图12所示,在 接收到词云分析指令后,判断画布上是否有数据,如果没有,则提示没有数据, 如果有,则判断当前是否选中了数据,如果没选中,则提示没有选中,如果选 中,则判断选中的本体实例是否为文档类,如果是,则开始分析,否则,提示 非文档类本体实例,不支持词云分析。
在本实施例的一个可选实施方式中,在显示查询结果之后,还可以影响用 户选中某个节点的操作,显示选中的节点对应的本体实例的各个属性值。
在本实施例的一个可选实施方式中,用户可以建立画布中显示的节点之间 的关系,因此,在该可选实施方式中,该方法还可以包括:检测到从一个节点 到另一个节点的拖动操作,建立一个节点与另一个节点之间的关系类本体实 例,并根据接收到的输入信息,确定建立的关系类本体实例的属性信息。例如, 在图13中,显示了一个“人”和一个“电话”,用户通过拖动操作,可以在“人” 和“电话”之间建立“拥有”关系(即建立一个“拥有”的关系类本体)。
在本实施例的一个可选实施方式中,用户还可以对显示的节点的属性信息 进行编辑,在该可选实施方式中,该方法还可以包括:接收到对编辑指令,其 中,所述编辑指令指示对当前显示的节点对应的本体实例的属性进行编辑;根 据接收到的输入信息,修改所述当前显示的节点对应的本体实例的属性信息。 例如,在图14中,用户可以在节点的属性显示界面,添加属性“电话”以及 “电话”的属性值“183xxxxxxxx”,然后通过“添加”按钮,将该属性及属性 值添加到对应的节点上。
在本实施例的一个可选实施方式中,用户可以通过地图的方式选择节点, 因此,在该可选实施方式中,该方法还包括:接收到图形搜索指令,其中,所 述图形搜索指令指示搜索画布上指定区域内的节点;根据获取并显示位于所述 指定区域内的节点。在具体应用中,可以通过openlayers库的聚合功能,计算 当前画布各个中心点范围内的点个数。用户可以通过输入一系列的点的经纬度 来表示选择地图区域,响应用户的输入,借用elasticsearch的polygon搜索功 能,计算出满足相应条件的点,并将其返回给前端进行聚合操作显示。
可选地,如图15所示,在显示查询结果之后,还可以对查询结果进行分 类显示,例如,在图15中,提供事件时间和本体类型两种方式对显示的节点 进行筛选。
需要说明的是,实施例1所提供方法的各步骤的执行主体均可以是同一设 备,或者,该方法也由不同设备作为执行主体。
实施例2
基于与实施例1同一种构思,本申请还提供了一种本体库的数据写入装置, 该装置可以用于实现实施例1中所提供的本体库的数据写入方法。
图16是本申请提供的一种本体库的数据写入装置的结构示意图,如图16 所示,该装置主要包括:导入模块1610和写入模块1620。下面主要对本实施 例提供的本体库的数据写入装置的功能模块的功能进行描述,其它相关事宜, 可以参见实施例1的描述,在此不再赘述。
在本实施例中,导入模块1610,用于基于本体配置信息,将至少一个外部 数据源中的本体相关数据导入到列式存储的分布式数据库中,得到一个或多个 本体实例的本体数据;其中,在所述分布式数据库中,来自不同外部数据源的 相同本体实例的本体数据基于本体实例标识关联;写入模块1620,用于基于本 体实例标识将同一本体实例的本体数据进行聚合,并写入到本体库中。
在本实施例的一个可选实施方式中,所述本体配置信息包括:所述至少一 个外部数据源的标识信息、所述外部数据源中的预设数据字段与定义本体的属 性字段的映射关系、以及聚合同一本体实例的本体数据的数据融合规则;导入 模块1610可以包括:取数单元,用于根据所述至少一个外部数据源的标识信 息,从所述至少一个外部数据源中依次获取各个数据实体的预设数据字段的数 据;转换单元,用于根据所述映射关系,将所述数据实体的预设数据字段的数 据转换为本体实例的属性字段的数据,得到一个或多个本体实例的本体数据; 导入单元,用于将所述一个或多个本体实例的本体数据导入到所述分布式数据 库。
在本实施例的一个可选实施方式中,该装置还可以包括:映射模块,用于 基于预设的取数逻辑,从所述至少一个所述外部数据源中获取所述预设数据字 段,将所述预设数据字段与定义本体的属性字段进行匹配,得到所述外部数据 源中的预设数据字段与定义本体的属性字段的映射关系。
在本实施例的一个可选实施方式中,写入模块1620可以通过以下方式将 本体数据写入到本体库:基于本体实例标识,将同一本体实例的不同属性字段 的本体数据进行聚合,并写入到所述本体库中,其中,对于来自不同外部数据 源的同一本体实例的本体数据:根据预先设置的优先级,确定所述不同外部数 据源中的优先级最高的外部数据源,将来自所述优先级最高的外部数据源的本 体数据作为所述同一本体实例的本体数据写入到所述本体库中;或者,将来自 所述不同数据源的本体数据中相同属性字段的本体数据进行组合,将组合得到 的本体数据作为所述同一本体实例的本体数据写入到所述本体库中。
在本实施例的一个可选实施方式中,所述本体库可以包括:全文检索引擎 和图数据库,其中,所述全文检索引擎存储的本体实例包括:实体类本体实例、 事件类本体实例以及文档类本体实例,所述图数据库存储的本体实例包括:关 系类本体实例;如图16所示,该装置还可以包括:查询模块1630,用于接收 到查询指令,从所述本体库中获取与所述查询指令对应的查询结果;显示模块 1640,用于以图形的形式在画布中显示所述查询结果,其中,所述图形中包括: 节点、或者,节点和节点之间的连接关系,所述节点用于表示所述查询结果中 的实体类本体实例、事件类本体实例或文档类本体实例,节点之间的连接关系用于表示所述查询结果中的关系类本体实体。
在本实施例的一个可选实施方式中,所述显示模块1640可以通过以下方 式显示所述查询结果:根据待显示的所述节点大小,计算出各个所述节点之间 的间距;根据待显示的所述节点的数量,计算出节点排列的行数和列数;根据 所述行数、列数和所述间距计算得到第一个所述节点距离画布中心点的坐标 差;根据所述中心点的坐标,得到第一个所述节点的实际坐标;根据所述行数、 列数和所述间距计算得到第二个所述节点距离画布中心点的坐标差,并根据所 述中心点的坐标,得到第二个所述节点的实际坐标,如此循环,得到各个所述 节点的实际坐标;按照各个所述节点的实际坐标,显示所述查询结果。
在本实施例的一个可选实施方式中,所述显示模块1640通过以下方式显 示所述查询结果:将待显示的各个所述节点划分为多个子图;根据预设的子图 的显示图标的形状,确定各个所述子图的显示图标的中心点及大小;按照各个 所述子图的中心点,将各个所述子图的显示图标按照网格形式进行排列;在排 列后的各个所述子图的显示图标之间存在重叠的情况下,对各个所述子图的显 示图标的排列方式进行调整,直到各个所述子图的显示图标之间不存在重叠, 按照当前的排列方式显示各个所述子图的显示图标;对于任一所述子图中的各 个所述节点,获取各个所述节点中与该节点具有一度关系的节点的对应关系, 根据所述对应关系,确定该子图的布局层数以及各层布局的节点,再根据节点 大小、间距以及层数,确定布局在各层的节点的纵坐标,并按照同层节点从该 子图的显示图标的中间均匀向两边分布的原则,确定各层的节点的横坐标,根 据该子图的各个所述节点的纵坐标和横坐标显示该子图的各个所述节点。
在本实施例的一个可选实施方式中,该装置还可以包括:扩展模块,用于 在所述显示模块1640显示所述查询结果之后,接收到输入的扩展指令,其中, 所述扩展指令指示对当前选中的节点进行扩展;从所述本体库中查询并显示与 所述当前选中的节点具有一度关系的节点;响应输入的对显示的所述具有一度 关系的节点进行选择的操作,将选择的节点显示在画布上,并显示所述选择的 节点与所述当前选中的节点之间的连接关系。
在本实施例的一个可选实施方式中,该装置还可以包括:流分析模块,用 于在所述显示模块1640显示所述查询结果之后,接收到输入的流分析指令, 其中,所述流分析指令指示对当前选中的节点进行流分析;查询与所述当前选 中的节点存在数据传输关系的关系节点;以动画的方式显示所述当前选中的节 点与所述关系节点之间的数据传输。
在本实施例的一个可选实施方式中,所述显示模块1640还可以用于通过 以下方式显示所述查询结果:按照所述查询结果中各个本体实例涉及的时间属 性,将所述查询结果中的各个本体实例的节点显示在时间轴上的对应区域;或 者,对于所述查询结果中两个实体类本体实例涉及的多个事件类本体实例,对 所述多个事件类本体实例的节点进行合并显示。
在本实施例的一个可选实施方式中,该装置还可以包括:词云分析模块, 用于在所述显示模块1640显示所述查询结果之后,接收到词云分析指令,其 中,所述词云分析指令指示展现文档类本体中的热点词汇;在所述查询结果中 包含文档类本体实例的情况下,从所述文档类本体实例的文档中查询并显示热 点词汇。
在本实施例的一个可选实施方式中,该装置还可以包括:分类模块,用于 在所述显示模块1640显示所述查询结果之后,按照所述查询结果中各个本体 实例的类型以及属性信息,分类显示所述查询结果;或者编辑模块,用于在所 述显示模块1640显示所述查询结果之后,检测到从一个所述节点到另一个所 述节点的拖动操作,建立所述一个节点与所述另一个节点之间的关系类本体实 例,并根据接收到的输入信息,确定建立的所述关系类本体实例的属性信息; 或者接收到对编辑指令,其中,所述编辑指令指示对当前显示的节点对应的本 体实例的属性进行编辑;根据接收到的输入信息,修改所述当前显示的节点对应的本体实例的属性信息;或者,地图模块,用于接收到图形搜索指令,其中, 所述图形搜索指令指示搜索画布上指定区域内的节点;根据获取并显示位于所 述指定区域内的节点。
在实际应用中,本实施例提供的技术方案可以应用到一个本体库的构建及 应用系统来实现,将上述本体库的数据写入装置的各个功能模块通过多个装置 来实现。
图17为本实施例的一个本体库的构建及应用系统的示例图,如图17所示, 该系统提供了一个本体配置端1710,本体配置端1710可以提供可视化的配置 界面,用户通过本体配置端1710可以配置本体模型、外部数据源和定义本体 的属性字段和外部数据源的数据字段的映射关系。
在实际应用中,本体配置端1710可以采用关系数据库存储数据。该数据 库存储了本体表、属性表、数据源表、字段映射表和调度表。用户通过本体配 置端1710可以建立实体类、事件类、文档类和关系类这几类本体。本体配置 端1710可以自顶而下的建立知识图谱的schema。用户通过本体配置端1710 可以为图谱中的每个点建立本体,对应的建立相关的字段属性和属性类型,在 建立了实体类、文档类和事件类本体后,还可以建立各个本体之间的关系类本 体,在具体应用中,可以将关系类本体的字段属性设置为固定的值,它仅仅存 储连接两端的本体的索引。
在本体配置端1710可以接入大量异构的数据库,简单的填写地址和库名 后,支持在线测试数据库联通性,在本实施例中,外部数据源可以包括各类关 系型数据库、全文检索数据库、列式存储和消息队列,同时在一个系统支持多 种异构的数据库可以方便用户和满足各类现实的需求。
在数据源地址配置好后,可以配置针对具体外部数据库的取数逻辑,也可 称为数据视图的配置,在实际应用中,取数逻辑的配置可以使用支持sql语法 和json格式,可以使用两种配置方式去数据库中获取数据。在实际应用中,通 过解析配置,并验证sql和json的正确性,可以从外部数据库中获取到所需的 数据。在实际应用中,查询sql耗时较久,对用户体验不好,因此可以采用异 步调用的形式去验证sql和解析出外部数据源的相应的数据字段名。
在配置完好数据视图和本体的属性信息后,可以进行字段映射的配置,在 具体应用时,可以将外部的数据字段和本体的属性字段进行一一的对应,建立 字段的映射关系,该映射关系可以用于数据的转换。在实现时,可以将映射双 方集合的字段进行自动映射,配对的规则是名字相同,如果有不同的,则可以 提示用户进行手动调整。
在实际应用中,当一个本体实例被多个不同的数据来源映射,这时数据就 需要融合,因此,在本体配置时,还需要配置细粒度的融合规则配置,具体可 以包括上述的优先级和组合两种规则。
适配器1720根据本体配置端1710的配置去外部数据源中取数据,然后通 过转换器进行转换,由导出器将数据导入分布式数据仓库1730(hbase),再将 hbase 1730中的数据同步到本体库,本体库由全文检索引擎1740和图数据库 1750组成。Hbase是hadoop生态中的列式存储,具有分布式的特性,插入和 读取数据快的特点。
适配器1720将读取到的外部数据根据配置转换,其中涉及到字段数据类 型的转换,因此可能出现数据脏乱,在本实施例中,进行细粒度的兼容性处理, 遇到脏数据并不丢弃整条数据,而是采用同步队列,将转换好的数据存储推送 到同步队列,然后导入器将数据写入到hbase,在具体应用中,可以通过设置 表名建立规则,例如,可配置的统一前缀,拼接本体索引的和本体类型的方式, 对表名进行命名,从而可以方便的隔离不同数据来源和方便数据融合。
例如,数据A和数据B都映射到了本体C,导入器会将它们存储在同一个 表的同一个rowkey(行键)的对应的同一个列簇下不同的列,列名采用数据源 索引来决定,这样每次同步hbase的数据到本体库时,根据数据融合规则,将 A和B两份数据融合后生成数据D然后将其写到本体库。
本体库中存储的数据是以本体配置端1710中定义的格式存储的,因此可 以方便地进行数据分析,它由全文检索引擎1740和图数据库1750两类存储组 成。
全文检索引擎1740和图数据库1750用于支持上层分析应用,在具体应用 中,用户可以通过可视化分析端1760查询本体库,并对查询结果进行扩展等。 例如,本实施例中本体库的数据写入装置的查询模块1630和显示模块1640可 以设置在可视化分析端1760,另外,在显示模块1640显示查询结果之后,上 述基于画布显示的结果执行的各项功能,均可以在可视化分析端1760中实现。
另外,在可视化分析端1760还可以提供其它的多种功能,例如:
框选功能:支持方便的选中节点和反选中节点;
锁定功能:将画布某个点锁定,不受其他节点布局影响而改变位置;
截屏功能:支持截屏当前画布分析界面;
快速搜索功能:支持显示搜索前10条数据,快速添加到画布中进行分析;
to location功能:将选择的节点带入地图模块进行分析;
to profile功能:将选择的节点导入profile模块进行分析;
to share功能:将数据分享给不同的用户或者群组。
在本实施例提供的上述系统中,为了方便的构建知识图谱,设计了简便的 可视化配置本体模型、外部数据源和进行本体字段和外部数据源字段的关系映 射方式。利用中间件把各类海量异构数据进行高效快速的本体化并存储在分布 式存储系统中,实时对接入数据进行本体化,并进行快速的图谱化,利用算法 将图谱上的点以不同的布局展示接入的数据。基于分布式存储系统对多源异构 数据进行本体化后根据设定的融合规则进行数据融合处理,利用定时任务将本 体化数据同步到相应的内容检索引擎库和图数据库。基于ElasticSearch来做本 体化数据的全文检索,并利用sigma技术可视化呈现以点边为基本元素的图谱 对象关系,画布上的数据点可以根据算法进行布局和扩展合并。以及将数据实体呈现在不同的地图上,并对地图比例缩放聚合分析出数据实体在不同位置出 现个数,针对经纬度数据利用算法将地图内选择的区域内的相关本体化数据搜 索出来,并在画布展现。支持将可疑数据点进行拖拽方式建立相关关系,有利 于分析数据沉淀进本体库,方便用于下次分析进行扩展。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计 算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结 合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包 含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产 品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入 式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算 机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一 个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设 备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中 的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个 流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使 得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处 理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个 流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输 出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。 内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任 何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序 的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其 他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读 存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁 磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算 设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒 体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排 他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括 那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、 方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括 一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设 备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程 序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和 硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算 机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、 光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技 术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所 作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (19)

1.一种本体库的数据写入方法,其特征在于,包括:
基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中,得到一个或多个本体实例的本体数据;其中,在所述分布式数据库中,来自不同外部数据源的相同本体实例的本体数据基于本体实例标识关联;
基于本体实例标识将所述分布式数据库中存储的同一本体实例的本体数据进行聚合,并写入到本体库中;
所述本体库包括:全文检索引擎和图数据库,其中,所述全文检索引擎存储的本体实例包括:实体类本体实例、事件类本体实例以及文档类本体实例,所述图数据库存储的本体实例包括:关系类本体实例;
在基于本体实例标识将同一本体实例的本体数据进行聚合,并写入到本体库中之后,所述方法还包括:
接收到查询指令,从所述本体库中获取与所述查询指令对应的查询结果;
以图形的形式在画布中显示所述查询结果,其中,所述图形中包括:节点、或者,节点和节点之间的连接关系,所述节点用于表示所述查询结果中的实体类本体实例、事件类本体实例或文档类本体实例,节点之间的连接关系用于表示所述查询结果中的关系类本体实体;
在以图形的形式在画布中显示所述查询结果之后,所述方法还包括:
接收到输入的扩展指令,其中,所述扩展指令指示对当前选中的节点进行扩展;
从所述本体库中查询并显示与所述当前选中的节点具有一度关系的节点;
响应输入的对显示的所述具有一度关系的节点进行选择的操作,将选择的节点显示在画布上,并显示所述选择的节点与所述当前选中的节点之间的连接关系;
或者
接收到输入的流分析指令,其中,所述流分析指令指示对当前选中的节点进行流分析;
查询与所述当前选中的节点存在数据传输关系的关系节点;
以动画的方式显示所述当前选中的节点与所述关系节点之间的数据传输。
2.根据权利要求1所述的方法,其特征在于,所述本体配置信息包括:所述至少一个外部数据源的标识信息、所述外部数据源中的预设数据字段与定义本体的属性字段的映射关系、以及聚合同一本体实例的本体数据的数据融合规则。
3.根据权利要求2所述的方法,其特征在于,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中,包括:
根据所述至少一个外部数据源的标识信息,从所述至少一个外部数据源中依次获取各个数据实体的预设数据字段的数据,并根据所述映射关系,将所述数据实体的预设数据字段的数据转换为本体实例的属性字段的数据后导入到所述分布式数据库。
4.根据权利要求2所述的方法,其特征在于,在基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中之前,所述方法还包括:
基于预设的取数逻辑,从所述至少一个所述外部数据源中获取所述预设数据字段;
将所述预设数据字段与定义本体的属性字段进行匹配,得到所述外部数据源中的预设数据字段与定义本体的属性字段的映射关系。
5.根据权利要求1所述的方法,其特征在于,基于本体实例标识将同一本体实例的本体数据进行聚合,并写入到本体库,包括:
基于本体实例标识,将同一本体实例的不同属性字段的本体数据进行聚合,并写入到所述本体库中,其中,对于来自不同外部数据源的同一本体实例的本体数据:
根据预先设置的优先级,确定所述不同外部数据源中的优先级最高的外部数据源,将来自所述优先级最高的外部数据源的本体数据作为所述同一本体实例的本体数据写入到所述本体库中;或者,将来自所述不同外部数据源的本体数据中相同属性字段的本体数据进行组合,将组合得到的本体数据作为所述同一本体实例的本体数据写入到所述本体库中。
6.根据权利要求1所述的方法,其特征在于,以图形的形式在画布中显示所述查询结果包括:
根据待显示的所述节点大小,计算出各个所述节点之间的间距;
根据待显示的所述节点的数量,计算出节点排列的行数和列数;
根据所述行数、列数和所述间距计算得到第一个所述节点距离画布中心点的坐标差;
根据所述中心点的坐标,得到第一个所述节点的实际坐标;
根据所述行数、列数和所述间距计算得到第二个所述节点距离画布中心点的坐标差,并根据所述中心点的坐标,得到第二个所述节点的实际坐标,如此循环,得到各个所述节点的实际坐标;
按照各个所述节点的实际坐标,显示所述查询结果。
7.根据权利要求1所述的方法,其特征在于,以图形的形式在画布中显示所述查询结果包括:
将待显示的各个所述节点划分为多个子图;
根据预设的子图的显示图标的形状,确定各个所述子图的显示图标的中心点及大小;
按照各个所述子图的中心点,将各个所述子图的显示图标按照网格形式进行排列;
在排列后的各个所述子图的显示图标之间存在重叠的情况下,对各个所述子图的显示图标的排列方式进行调整,直到各个所述子图的显示图标之间不存在重叠,按照当前的排列方式显示各个所述子图的显示图标;
对于任一所述子图中的各个所述节点,获取各个所述节点中与该节点具有一度关系的节点的对应关系,根据所述对应关系,确定该子图的布局层数以及各层布局的节点,再根据节点大小、间距以及层数,确定布局在各层的节点的纵坐标,并按照同层节点从该子图的显示图标的中间均匀向两边分布的原则,确定各层的节点的横坐标,根据该子图的各个所述节点的纵坐标和横坐标显示该子图的各个所述节点。
8.根据权利要求1所述的方法,其特征在于,以图形的形式在画布中显示所述查询结果包括:
按照所述查询结果中各个本体实例涉及的时间属性,将所述查询结果中的各个本体实例的节点显示在时间轴上的对应区域;或者,
对于所述查询结果中两个实体类本体实例涉及的多个事件类本体实例,对所述多个事件类本体实例的节点进行合并显示。
9.根据权利要求1所述的方法,其特征在于,在以图形的形式在画布中显示所述查询结果之后,所述方法还包括:
接收到词云分析指令,其中,所述词云分析指令指示展现文档类本体中的热点词汇;
在所述查询结果中包含文档类本体实例的情况下,从所述文档类本体实例的文档中查询并显示热点词汇。
10.根据权利要求1所述的方法,其特征在于,在以图形的形式在画布中显示所述查询结果之后,所述方法还包括:
按照所述查询结果中各个本体实例的类型以及属性信息,分类显示所述查询结果;或者
检测到从一个所述节点到另一个所述节点的拖动操作,建立所述一个节点与所述另一个节点之间的关系类本体实例,并根据接收到的输入信息,确定建立的所述关系类本体实例的属性信息;或者
接收到对编辑指令,其中,所述编辑指令指示对当前显示的节点对应的本体实例的属性进行编辑;根据接收到的输入信息,修改所述当前显示的节点对应的本体实例的属性信息;或者,
接收到图形搜索指令,其中,所述图形搜索指令指示搜索画布上指定区域内的节点;根据获取并显示位于所述指定区域内的节点。
11.一种本体库的数据写入装置,其特征在于,包括:
导入模块,用于基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中,得到一个或多个本体实例的本体数据;其中,在所述分布式数据库中,来自不同外部数据源的相同本体实例的本体数据基于本体实例标识关联;
写入模块,用于基于本体实例标识将同一本体实例的本体数据进行聚合,并写入到本体库中;
所述本体库包括:全文检索引擎和图数据库,其中,所述全文检索引擎存储的本体实例包括:实体类本体实例、事件类本体实例以及文档类本体实例,所述图数据库存储的本体实例包括:关系类本体实例;
所述装置还包括:
查询模块,用于接收到查询指令,从所述本体库中获取与所述查询指令对应的查询结果;
显示模块,用于以图形的形式在画布中显示所述查询结果,其中,所述图形中包括:节点、或者,节点和节点之间的连接关系,所述节点用于表示所述查询结果中的实体类本体实例、事件类本体实例或文档类本体实例,节点之间的连接关系用于表示所述查询结果中的关系类本体实体;
还包括:
扩展模块,用于在所述显示模块显示所述查询结果之后,接收到输入的扩展指令,其中,所述扩展指令指示对当前选中的节点进行扩展;从所述本体库中查询并显示与所述当前选中的节点具有一度关系的节点;响应输入的对显示的所述具有一度关系的节点进行选择的操作,将选择的节点显示在画布上,并显示所述选择的节点与所述当前选中的节点之间的连接关系;
或者
流分析模块,用于在所述显示模块显示所述查询结果之后,接收到输入的流分析指令,其中,所述流分析指令指示对当前选中的节点进行流分析;查询与所述当前选中的节点存在数据传输关系的关系节点;以动画的方式显示所述当前选中的节点与所述关系节点之间的数据传输。
12.根据权利要求11所述的装置,其特征在于,
所述本体配置信息包括:所述至少一个外部数据源的标识信息、所述外部数据源中的预设数据字段与定义本体的属性字段的映射关系、以及聚合同一本体实例的本体数据的数据融合规则;
所述导入模块,包括:
取数单元,用于根据所述至少一个外部数据源的标识信息,从所述至少一个外部数据源中依次获取各个数据实体的预设数据字段的数据;
转换单元,用于根据所述映射关系,将所述数据实体的预设数据字段的数据转换为本体实例的属性字段的数据,得到一个或多个本体实例的本体数据;
导入单元,用于将所述一个或多个本体实例的本体数据导入到所述分布式数据库。
13.根据权利要求12所述的装置,其特征在于,还包括:
映射模块,用于基于预设的取数逻辑,从所述至少一个所述外部数据源中获取所述预设数据字段,将所述预设数据字段与定义本体的属性字段进行匹配,得到所述外部数据源中的预设数据字段与定义本体的属性字段的映射关系。
14.根据权利要求11所述的装置,其特征在于,所述写入模块通过以下方式将本体数据写入到本体库:
基于本体实例标识,将同一本体实例的不同属性字段的本体数据进行聚合,并写入到所述本体库中,其中,对于来自不同外部数据源的同一本体实例的本体数据:
根据预先设置的优先级,确定所述不同外部数据源中的优先级最高的外部数据源,将来自所述优先级最高的外部数据源的本体数据作为所述同一本体实例的本体数据写入到所述本体库中;或者,将来自所述不同外部数据源的本体数据中相同属性字段的本体数据进行组合,将组合得到的本体数据作为所述同一本体实例的本体数据写入到所述本体库中。
15.根据权利要求11所述的装置,其特征在于,所述显示模块通过以下方式显示所述查询结果:
根据待显示的所述节点大小,计算出各个所述节点之间的间距;
根据待显示的所述节点的数量,计算出节点排列的行数和列数;
根据所述行数、列数和所述间距计算得到第一个所述节点距离画布中心点的坐标差;
根据所述中心点的坐标,得到第一个所述节点的实际坐标;
根据所述行数、列数和所述间距计算得到第二个所述节点距离画布中心点的坐标差,并根据所述中心点的坐标,得到第二个所述节点的实际坐标,如此循环,得到各个所述节点的实际坐标;
按照各个所述节点的实际坐标,显示所述查询结果。
16.根据权利要求11所述的装置,其特征在于,所述显示模块通过以下方式显示所述查询结果:
将待显示的各个所述节点划分为多个子图;
根据预设的子图的显示图标的形状,确定各个所述子图的显示图标的中心点及大小;
按照各个所述子图的中心点,将各个所述子图的显示图标按照网格形式进行排列;
在排列后的各个所述子图的显示图标之间存在重叠的情况下,对各个所述子图的显示图标的排列方式进行调整,直到各个所述子图的显示图标之间不存在重叠,按照当前的排列方式显示各个所述子图的显示图标;
对于任一所述子图中的各个所述节点,获取各个所述节点中与该节点具有一度关系的节点的对应关系,根据所述对应关系,确定该子图的布局层数以及各层布局的节点,再根据节点大小、间距以及层数,确定布局在各层的节点的纵坐标,并按照同层节点从该子图的显示图标的中间均匀向两边分布的原则,确定各层的节点的横坐标,根据该子图的各个所述节点的纵坐标和横坐标显示该子图的各个所述节点。
17.根据权利要求11所述的装置,其特征在于,所述显示模块还用于通过以下方式显示所述查询结果:
按照所述查询结果中各个本体实例涉及的时间属性,将所述查询结果中的各个本体实例的节点显示在时间轴上的对应区域;或者,
对于所述查询结果中两个实体类本体实例涉及的多个事件类本体实例,对所述多个事件类本体实例的节点进行合并显示。
18.根据权利要求11所述的装置,其特征在于,还包括:
词云分析模块,用于在所述显示模块显示所述查询结果之后,接收到词云分析指令,其中,所述词云分析指令指示展现文档类本体中的热点词汇;在所述查询结果中包含文档类本体实例的情况下,从所述文档类本体实例的文档中查询并显示热点词汇。
19.根据权利要求11所述的装置,其特征在于,还包括:
分类模块,用于在所述显示模块显示所述查询结果之后,按照所述查询结果中各个本体实例的类型以及属性信息,分类显示所述查询结果;或者
编辑模块,用于在所述显示模块显示所述查询结果之后,检测到从一个所述节点到另一个所述节点的拖动操作,建立所述一个节点与所述另一个节点之间的关系类本体实例,并根据接收到的输入信息,确定建立的所述关系类本体实例的属性信息;或者接收到对编辑指令,其中,所述编辑指令指示对当前显示的节点对应的本体实例的属性进行编辑;根据接收到的输入信息,修改所述当前显示的节点对应的本体实例的属性信息;或者,
地图模块,用于接收到图形搜索指令,其中,所述图形搜索指令指示搜索画布上指定区域内的节点;根据获取并显示位于所述指定区域内的节点。
CN201910985063.XA 2019-10-16 2019-10-16 一种本体库的数据写入方法及装置 Active CN110795476B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910985063.XA CN110795476B (zh) 2019-10-16 2019-10-16 一种本体库的数据写入方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910985063.XA CN110795476B (zh) 2019-10-16 2019-10-16 一种本体库的数据写入方法及装置

Publications (2)

Publication Number Publication Date
CN110795476A CN110795476A (zh) 2020-02-14
CN110795476B true CN110795476B (zh) 2022-03-08

Family

ID=69439234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910985063.XA Active CN110795476B (zh) 2019-10-16 2019-10-16 一种本体库的数据写入方法及装置

Country Status (1)

Country Link
CN (1) CN110795476B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625524B (zh) * 2020-05-18 2023-07-21 北京锐安科技有限公司 数据处理方法、装置、设备及存储介质
CN112347056B (zh) * 2021-01-08 2021-07-02 北京东方通软件有限公司 一种基于时间轴的文件自动生成方法
CN113111108A (zh) * 2021-04-06 2021-07-13 创意信息技术股份有限公司 文件数据源入库解析接入方法
CN112765137B (zh) * 2021-04-07 2021-06-22 暗链科技(深圳)有限公司 基于区块分布式区块链的区块同步方法及电子设备
CN113312890B (zh) * 2021-06-16 2024-04-12 第四范式(北京)技术有限公司 多表拼接方法、装置、电子设备及存储介质
CN116701717B (zh) * 2023-08-04 2023-10-27 杭州悦数科技有限公司 图数据库数据导入方法和系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1274018A2 (en) * 2001-07-06 2003-01-08 Unicorn Solutions, Inc. Instance browser for ontology
CN102385635A (zh) * 2011-12-14 2012-03-21 湖南科技大学 一种基于本体模式的异构数据集成方法
CN104572970A (zh) * 2014-12-31 2015-04-29 浙江大学 一种基于本体库内容的sparql查询语句生成系统
CN106446162A (zh) * 2016-09-26 2017-02-22 浙江大学 一种面向领域的本体知识库文本检索方法
CN106777372A (zh) * 2017-01-26 2017-05-31 语义(上海)信息科技有限公司 一种基于语义网本体的蜂流器数据导流和数据转化方法
CN107038207A (zh) * 2017-02-20 2017-08-11 阿里巴巴集团控股有限公司 一种数据查询方法、数据处理方法及装置
CN107330007A (zh) * 2017-06-12 2017-11-07 南京邮电大学 一种基于多数据源的本体学习方法
CN109635119A (zh) * 2018-10-25 2019-04-16 同济大学 一种基于本体融合的工业大数据集成系统
CN109857870A (zh) * 2019-01-03 2019-06-07 成都数联铭品科技有限公司 用于知识图谱的可视化本体构建系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2365447A1 (en) * 2010-03-11 2011-09-14 British Telecommunications Data integration system

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1274018A2 (en) * 2001-07-06 2003-01-08 Unicorn Solutions, Inc. Instance browser for ontology
CN102385635A (zh) * 2011-12-14 2012-03-21 湖南科技大学 一种基于本体模式的异构数据集成方法
CN104572970A (zh) * 2014-12-31 2015-04-29 浙江大学 一种基于本体库内容的sparql查询语句生成系统
CN106446162A (zh) * 2016-09-26 2017-02-22 浙江大学 一种面向领域的本体知识库文本检索方法
CN106777372A (zh) * 2017-01-26 2017-05-31 语义(上海)信息科技有限公司 一种基于语义网本体的蜂流器数据导流和数据转化方法
CN107038207A (zh) * 2017-02-20 2017-08-11 阿里巴巴集团控股有限公司 一种数据查询方法、数据处理方法及装置
CN107330007A (zh) * 2017-06-12 2017-11-07 南京邮电大学 一种基于多数据源的本体学习方法
CN109635119A (zh) * 2018-10-25 2019-04-16 同济大学 一种基于本体融合的工业大数据集成系统
CN109857870A (zh) * 2019-01-03 2019-06-07 成都数联铭品科技有限公司 用于知识图谱的可视化本体构建系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于Neo4j的海量石油领域本体数据存储研究;宫法明等;《计算机科学》;20180615;第549-554页 *
基于领域本体的海洋环境数据仓库多维建模技术;鲍玉斌等;《海洋通报》;20090815(第04期);第132-140页 *
本体应用可视化研究;董慧等;《情报理论与实践》;20091230(第12期);第116-120页 *

Also Published As

Publication number Publication date
CN110795476A (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN110795476B (zh) 一种本体库的数据写入方法及装置
US11238033B1 (en) Interactive location queries for raw machine data
Von Landesberger et al. Visual analysis of large graphs: state‐of‐the‐art and future research challenges
CN106897361B (zh) 基于树状结构的标签页分组管理系统及方法
CN107545046A (zh) 一种多源异构数据的融合方法及装置
US20180018402A1 (en) Dynamic hierarchy generation based on graph data
Ye et al. Development of a highly flexible mobile GIS-based system for collecting arable land quality data
US9760260B2 (en) System for retrieving, visualizing and editing semantic annotations
CN101488151A (zh) 一种聚合Web站点内容的系统和方法
Troncy et al. 3cixty: Building comprehensive knowledge bases for city exploration
WO2017143996A1 (zh) 数据展示的方法与装置
US11100141B2 (en) Monitoring organization-wide state and classification of data stored in disparate data sources of an organization
CN103530379A (zh) 树形结构数据显示方法与装置
CN109359141A (zh) 一种可视化报表数据展示方法及装置
US10067950B1 (en) Systems and methods for efficiently organizing map styling information
Amirkhanyan et al. Real-time clustering of massive geodata for online maps to improve visual analysis
CN117033527B (zh) 一种知识图谱的构建方法、装置、存储介质及电子设备
CN109325015A (zh) 一种领域模型的特征字段的提取方法及装置
WO2017050164A1 (zh) 一种对象呈现方法与设备
CN102129468B (zh) 一种可定制集群状态展现的方法
CN114880308A (zh) 一种基于大数据的元数据处理方法、装置、介质
Matuszka The design and implementation of semantic web-based architecture for augmented reality browser
KR20230142799A (ko) 다수의 부모 노드들을 갖는 자식 노드들의 도표화
Lu et al. Data visualization of web service with parallel coordinates and nodetrix
CN108763665B (zh) 电网仿真分析数据存储方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: No.27, 1st floor, building 14, Haidian Road, zhongjiancai District, Beijing 100096

Applicant after: Beijing PERCENT Technology Group Co.,Ltd.

Address before: 100096 101 / F, building 14, 27 Jiancai Middle Road, Haidian District, Beijing

Applicant before: BEIJING BAIFENDIAN INFORMATION SCIENCE & TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant