CN114547157A - 一种知识图谱分析系统及方法 - Google Patents
一种知识图谱分析系统及方法 Download PDFInfo
- Publication number
- CN114547157A CN114547157A CN202210168248.3A CN202210168248A CN114547157A CN 114547157 A CN114547157 A CN 114547157A CN 202210168248 A CN202210168248 A CN 202210168248A CN 114547157 A CN114547157 A CN 114547157A
- Authority
- CN
- China
- Prior art keywords
- analysis
- data
- graph
- entity
- business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种知识图谱分析系统及方法,包括根据业务场景及业务数据分析出业务场景中的实体和关系;根据实体和关系建立实体模型和关系模型,及将实体模型和关系模型存储在Neo4j中;分析实体模型和关系模型,得到分析结果,将分析结果以图形的形式展现,生成业务场景的图形分析数据;即时保存分析结果和图形分析数据,生成知识图谱分析图,及将知识图谱分析图存储在MySQL中。本申请采用MySQL和Neo4j混合存储技术,解决了传统数据库中无法灵活改变实体和关系的属性、数据查询效率低的问题,通过二维图展示业务关系,可以发现正常逻辑业务中的异常信息,还可以应用图计算算法发现业务实体的深层次关联关系。
Description
技术领域
本申请涉及知识图谱关系技术领域,尤其涉及一种知识图谱分析系统及方法。
背景技术
传统的系统通常是由客户进行信息的整理录入,系统研发时候通过需求的分析调研,理清业务信息,交由系统开发人员开发出需求系统功能。通常使用传统数据库存储客户业务信息,其传统数据库预先定义了数据表模式,固定实体和关系的属性,查询关系时通过连接如JOIN操作。
但目前传统的数据库预先定义了数据表模式,无法灵活改变实体和关系的属性。查询关系时需要大量连接操作,在数据量很大时效率尤其低下,甚至无法返回结果。例如查询重点人的关系网络时,就需要在不同的实体表(人,车,户籍,案件等表)间进行大量的连接操作。如果系统中的业务表有修改,则需要开发人员修改表修改数据,这样的传统方式无法灵活的定义数据模式,管理数据间的关系,无法高效查询或遍历关系数据,没有深层次的关联关系挖掘能力。
发明内容
本申请提供一种知识图谱分析系统及方法,以解决传统数据库中无法灵活改变实体和关系的属性、数据查询效率低的问题。
第一方面,本申请提供一种知识图谱分析系统,包括:业务建模模块、数据接入模块、图谱分析模块以及图谱管理模块:
业务建模模块被配置为:根据业务场景及业务数据分析出业务场景中的实体和关系;
数据接入模块被配置为:根据实体和关系建立实体模型和关系模型,以及将实体模型和关系模型存储在Neo4j中;
图谱分析模块被配置为:分析实体模型和关系模型,得到分析结果,以及将分析结果以图形的形式展现,生成业务场景的图形分析数据;
图谱管理模块被配置为:即时保存分析结果和图形分析数据,生成知识图谱分析图,以及将知识图谱分析图存储在MySQL中。
进一步地,知识图谱分析系统还包括数据检索模块,数据检索模块被配置为:
基于图数据库Neo4j检索引擎,根据实体的属性值进行关键词匹配搜索,以查找目标实体;
根据关系的预设条件进行条件搜索,以查找目标关系。
进一步地,业务建模模块进一步被配置为:根据预设的模型关系字典构建实体属性及可视化实体关系,预设的模型关系字典用于存储实体及关系的属性信息。
进一步地,数据接入模块进一步被配置为:通过可视化方式对接各种数据源,以及对数据源及业务数据进行校验及管理,根据实体和数据源建立基本知识库。
进一步地,图谱分析模块进一步被配置为:根据实体和关系挖掘关联关系,生成关联关系结果;其中,挖掘关联关系包括关系查询、路径挖掘、全图搜索、图计算、基于时间属性和空间属性的轨迹描绘、多维度关联分析、实体定位。
第二方面,本申请还提供一种知识图谱分析方法,包括:
根据业务场景及业务数据分析出业务场景中的实体和关系;
根据实体和关系建立实体模型和关系模型,以及将实体模型和关系模型存储在Neo4j中;
分析实体模型和关系模型,得到分析结果,以及将分析结果以图形的形式展现,生成业务场景的图形分析数据;
即时保存分析结果和图形分析数据,生成知识图谱分析图,以及将知识图谱分析图存储在MySQL中。
进一步地,在根据业务场景及业务数据分析出业务场景中的实体和关系之前,还包括:对业务数据进行清洗与结构化,并将清洗与结构化之后的业务数据存储至Neo4j中。
进一步地,在对业务数据进行清洗与结构化之后,还包括:对清洗与结构化之后的业务数据的属性进行整理,以及将整理后的业务数据分类存储至Neo4j中。
进一步地,该方法还包括:可视化展现知识图谱分析图,可视化展现知识图谱分析图包括:可视化展现实体及关系,以及可视化展现分析结果和图形分析数据。
进一步地,该方法还包括:将任一实体与其关联的其他实体和事件进行碰撞比对。
由以上技术方案可知,本申请提供一种知识图谱分析系统及方法,包括业务建模模块根据业务场景及业务数据分析出业务场景中的实体和关系;数据接入模块根据实体和关系建立实体模型和关系模型,以及将实体模型和关系模型存储在Neo4j中;图谱分析模块分析实体模型和关系模型,得到分析结果,以及将分析结果以图形的形式展现,生成业务场景的图形分析数据;图谱管理模块即时保存分析结果和图形分析数据,生成知识图谱分析图,以及将知识图谱分析图存储在MySQL中。本申请采用MySQL和Neo4j混合存储技术,解决了传统数据库中无法灵活改变实体和关系的属性、数据查询效率低的问题,通过简单二维图来展示业务关系,可以发现正常逻辑业务中的异常信息,还可以应用图计算算法,发现业务实体的深层次关联关系。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种知识图谱分析系统结构示意图;
图2为本申请实施例提供的一种知识图谱分析系统的另一种结构示意图;
图3为本申请实施例提供的一种知识图谱分析方法流程示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。以下结合附图,详细说明本申请各实施例提供的技术方案。
传统数据库预先定义了数据表模式,无法灵活改变实体和关系的属性,查询关系时需要大量连接操作。在数据量很大时效率尤其低下,甚至无法返回结果。例如查询风险地址的关系网络时,就需要在不同的实体表间进行大量的连接操作。基于此,本申请提供一种知识图谱分析系统及方法。
参见图1,第一方面,本申请提供一种知识图谱分析系统,包括:业务建模模块、数据接入模块、图谱分析模块以及图谱管理模块,其中,各个模块分别被配置为执行下述步骤:
业务建模模块根据业务场景及业务数据分析出业务场景中的实体和关系;数据接入模块根据实体和关系建立实体模型和关系模型,以及将实体模型和关系模型存储在Neo4j中;图谱分析模块分析实体模型和关系模型,得到分析结果,以及将分析结果以图形的形式展现,生成业务场景的图形分析数据;图谱管理模块即时保存分析结果和图形分析数据,生成知识图谱分析图,以及将知识图谱分析图存储在MySQL中。
本申请实施例中,Neo4j是一个开源的NoSQL原生图形数据库,NoSQL泛指非关系型的数据库,NoSQL数据库具有非常高的读写性能,尤其在大数据量下,这得益于它的无关系性,数据库的结构简单。
原生(Native)图数据库指的是以图的方式存储、处理、查询和展现数据。在Neo4j中,数据对象/实体被保存为节点,它们之间的关系则以链接地址的形式也保存在物理存储中。因此,在遍历关系时,原生的Neo4j图数据库中只要找到起始节点、读取节点的邻接边就可以访问该节点的邻居;而无需像关系数据库那样需要执行昂贵的连接JOIN操作,系统开销大大减少,使用Neo4j图数据库使得执行效率极大提升。
原生的Neo4j图数据库能有效地存储、处理和查询连接,传统数据库通过昂贵的JOIN操作在查询计算关系,而Neo4j图形数据库将连接与模型中的数据一起存储。访问原生图形数据库中的节点和关系是一种高效、恒定时间的操作,允许快速遍历每核每秒数百万个连接。可以说,在在关系型数据库中,关系是“计算”出来的;而在Neo4j图数据库中,关系是“读”出来的。
无论数据集的总大小如何,图形数据库都擅长管理高度连接的数据和复杂的查询。只有一个模式和一组起点,图形数据库探索围绕这些初始起点的相邻数据,从数百万个节点和关系中收集和聚合信息,并使搜索范围之外的任何数据保持不变。
在知识图谱中,每一条数据每抽象成为一个个节点,数据之间的关联则用一条线标识。通过把数据二维化,最大限度的将数据从高度抽象的性质转化为本来的面目,帮助用户在错综复杂的数据中找寻规律,理清思路,去发现数据背后隐藏的价值和风险。
业务建模模块根据业务场景及业务数据分析出业务场景中的实体和关系,即业务建模模块根据业务场景及业务数据提取业务中的实体关系信息,系统将实体和关系的定义存入结构化的数据库MySQL中,即字典类型的信息存储到MySQL中。对业务数据进行清洗与结构化可以过滤掉垃圾数据,提高数据的质量。在进行数据清洗、结构化后,将数据存储至Neo4j,主要是把业务明细数据按照实体和关系的定义后写入到Neo4j中,即业务记录明细写入到Neo4j中。知识图谱使用Neo4j作为图形数据库进行存储,具有良好的稳定性。本申请实施例采用混合存储技术(MySQL数据库在平台上主要存储实体和关系的定义也就是字典类型的数据,Neo4j是图数据库,可以存储实体和关系的具体信息),实现最高性能的的存储方案。
下面结合具体实施例对知识图谱分析系统中的模块进行详细介绍。
知识图谱系统(以下简称系统)为各种业务场景提供整套的以知识图谱方式分析业务解决方案,主要包括业务建模模块、数据接入模块、图谱分析模块以及图谱管理模块,系统开发使用的相关组件可以包括MySQL、Java、AntDesign、React、Spring、Neo4j及Neo4jGraph Data Science等。
业务建模模块:根据业务场景及业务数据分析出业务场景中的实体和关系。对业务场景分析,提取出业务场景中的实体和关系,这里的实体和关系可以视为字典类型的信息,并将这些字典类型的信息存储到数据库MySQL中。在一些实施例中,业务建模模块可以根据预设的模型关系字典构建实体属性及可视化实体关系,预设的模型关系字典用于存储实体及关系的属性信息。即业务建模模块支持可视化实体关系构建、支持多种实体关系的构建与挖掘、支持实体属性的构建。系统中可以预置模型关系字典,用来帮助分析业务,提高业务建模的效率质量。
在一些实施例中,根据业务场景及业务数据分析出业务场景中的实体和关系之前,还包括对业务数据进行清洗与结构化,并将清洗与结构化之后的业务数据存储至Neo4j中。知识图谱以海量的业务数据为基础,通过简单二维图来展示业务关系,可以发现正常逻辑业务中的异常信息,还可以应用图计算算法,发现业务实体的深层次关联关系。对业务数据进行清洗与结构化之后,可以对清洗与结构化之后的业务数据的属性进行整理,以及将整理后的业务数据分类存储至Neo4j中。
数据接入模块:根据实体和关系建立实体模型和关系模型,以及将实体模型和关系模型存储在Neo4j中。例如,建立实体模型和关系模型的方式可以为,把实体和关系的属性通过系统页面录入,后台会储存到Neo4j数据库中。在一些实施例中,数据接入模块可以通过可视化方式对接各种数据源,以及对数据源及业务数据进行校验及管理,根据实体和数据源建立基本知识库。具体地,数据接入模块支持通过可视化的方式对接各类数据源(例如,可以通过页面操作,把数据文件上传到服务后台,服务后台把数据写入neo4j库中)、支持数据校验、处理,并存储到不同介质中;支持实时数据源接入、支持数据源可视化管理、支持数据融合、支持任务调度。数据接入模块利用可视化数据展示方式,最大限度的还原出数据在真实世界的状态,方便直观的锁定目标实体,分析实体关系。
图谱分析模块:分析实体模型和关系模型,得到分析结果,以及将分析结果以图形的形式展现,生成业务场景的图形分析数据。图谱分析模块基于实体模型和关系模型进行高效关系查询、路径挖掘、全图搜索、图计算算法分析等挖掘发现数据,一些实施例中,图谱分析模块根据实体和关系挖掘关联关系,生成关联关系结果;其中,挖掘关联关系包括关系查询、路径挖掘、全图搜索、图计算、基于时间属性和空间属性的轨迹描绘、多维度关联分析、实体定位。系统将数据以图形直观的方式展现,包含图谱、地图及流引擎,帮助终端用户理解复杂关联,完成高复杂度的分析操作。例如支持根据时间和空间属性描绘目标实体的运动轨迹,并可根据该目标运动轨迹寻找相同轨迹,找出犯罪团体。再如分析业务中账户等实体信息,发现其行为轨迹及习惯特征(例:活跃时间段、习惯所在地、习惯消费金额等),并对其进行多维度(例:设备、IP、账号、交易对象等)的关联分析,深挖个性特征,标记定位各类实体,进而进行营销推荐、风险防控等。
图谱管理模块:即时保存分析结果和图形分析数据,生成知识图谱分析图,以及将知识图谱分析图存储在MySQL中。随时保存过程中的逻辑思维分析过程和分析结果,可随时的将现有的图形分析数据和分析结果保存起来供下次继续进行分析操作。在一些实施例中,图谱管理模块随时保存分析结果和图形分析数据,生成知识图谱分析图,可以将分析结果、图形分析数据、知识图谱分析图视为业务明细数据,系统把业务明细数据按照实体和关系的定义后写入到Neo4j中。在实际应用过程中,针对于多部门协同工作的业务需求,系统平台也支持将已保存的知识图谱分析图共享给权限内的其他账号进行进一步分析。
一种实现方式中,该系统还包括数据检索模块,数据检索模块基于数据库检索引擎,根据实体的属性值进行关键词匹配搜索,以查找目标实体,以及根据关系的预设条件进行条件搜索,以查找目标关系。数据检索模块基于图数据库检索引擎,支持对实体的属性值列进行关键词匹配搜索以及关系属性的条件搜索,例如搜索转账关系,转账金额大于阈值的实体及关系,能更准确迅速的定位到目标实体及关系。
在一些实施例中,系统可以通过实体的属性,例如:交易哈希、块高度、手续费、交易金额、出块时间等,初步的筛选出一些实体点,添加到知识图谱分析图中。也可以从关系着手,通过关系的属性筛选,如结合实体本身附带的标签服务(标签服务可以是预先设定的)的同步标记,某些地址已经被发现是风险地址的,或是在数据入库清洗的过程中会发现一些例如大额风险的交易,此时就会一同展示在系统页面上,可以帮助用户更快的辨别、筛选非正常情况。
当发现问题实体后,继续通过预置的关系条件在知识图谱分析图中进一步的扩展信息,通过关联实体内的关联关系,对该实体的每一种关系属性进行筛选,例如:关联实体的标签,交易时间等。当大量节点和关系计入图谱时,就可以通过布局调整内容展示的格式,现有的布局可以包括:表格布局、环形布局、同轴布局、广度优先搜索breadthfirst等。以环形布局为例,信息流在网中是沿着固定方向流动的,两个节点仅有一条道路,故简化了路径选择的控制,且环路上各节点都是自举控制,故控制软件简单。但是环路是封闭的,不便于扩充。当我们发现了问题实体,可以通过共同关联实体,选择需要发现的实体的类型,及最大的关系长度来细化实体,发现问题实体。同时也可以通过全局搜索获取他们之间的最短路径。
图2为本申请实施例提供的一种知识图谱分析系统的另一种结构示意图,在一种实现方式中,本申请实施例的知识图谱分析系统在构建时可以分为三层,分别为,表现层、业务逻辑层及数据存储层。表现层即系统界面的页面展示层,为用户提供界面展示,与系统交互使用;业务逻辑层负责整个平台的业务逻辑处理,介于表现层和数据存储层之间,业务逻辑层可以包括业务建模模块、数据接入模块、图谱分析模块、图谱管理模块、数据访问层及图计算层;数据储存层提供数据储存功能,主要是图数据和字典数据的储存。其中,数据访问层是封装访问图数据库的接口,用于基本的图库的增删改查;图计算层是封装的图计算的功能接口,用于提供各种图算法的接口。
在一些实施例中,知识图谱分析系统还可以应用在多业务场景中,例如,可以通过Restful API与上游业务系统打通、下游与机器学习系统打通为业务系统提供智能推荐、用户增长、智能风控等解决方案。Restful API也称为RESTful API,是遵循REST架构规范的应用编程接口(API或Web API),支持与RESTful Web服务进行交互。REST是表述性状态传递的英文缩写,由计算机科学家Roy Fielding创建,就是服务之间通过网络的方式通信。
例如,通过Restful API与上游业务系统打通、下游与机器学习系统打通后,可以实时进行大数据分析,为上游系统提供更精准的决策。例如:反洗钱分析,可以发现可疑账户间的明确的路径、交易规律以及趋势等;再做深层次的交易分析,得到交易关系、资金流向、交易反洗钱业务的操作规范和操作流程。再如反欺诈分析,可以识别和根除隐藏在企业数据背后的欺诈犯罪模式,用算法梳理现存档案,找到蛛丝马迹,进而识别异常模式、锁定诈骗行为。
在一些实施例中,知识图谱分析系统还可以可视化展现知识图谱分析图,包括可视化展现实体及关系,以及可视化展现分析结果和图形分析数据。可视化包括实体关系可视化以及数据结果可视化等,直接展示知识图谱分析图计算的结果、实体与实体之间的关联关系等。例如,Neo4j图数据库能高效查询或遍历关系数据,Neo4j图数据库无需预定义数据模式就能灵活管理数据间的关系,基于Neo4j图数据库,利用可视化技术,可以将数据关系和内在规律清晰的展现给用户。
在一些实施例中,知识图谱分析系统还包括将任一实体与其关联的其他实体和事件进行碰撞比对。在关系挖掘的世界里,实体是具有扩展挖掘属性的单一个体,通过每个实体可以将其相关联的任一实体和事件做挖掘和碰撞比对,这是在利用大数据做关联推演的核心解决方案,这一过程在页面设计中充分尊重了人脑的认知模型,将复杂多维的关系展现在二维的图析页面上,既满足了对关系挖掘的需要,又简化了人的识别和记忆曲线。该系统基于用户心理模型的交互方式,充分发挥计算机的特性,模拟人脑思维方式进行数据挖掘与推演,延伸人脑的能力,在人机交互的设计与展现上充分尊重用户的心理认知模型,使得更易于人机交互。
本申请实施例中的知识图谱分析系统将实体和关系的定义存入结构化的数据库MySQL中,把业务明细数据按照实体和关系的定义后写入到Neo4j中,可以灵活改变实体和关系的属性,灵活的定义数据模式、管理数据间的关系。Neo4j图数据库是专门管理关系数据的系统,利用邻接矩阵技术可以高效查询实体数据,且查询关系时不需要连接操作,在数据量很大时仍然做到毫秒级响应。同时,基于关键词匹配搜索,可以发现更多的实体关系,达到挖掘深层次的关联关系效果。可以从一个实体出发,可以查询出与其他实体之间的关联,如利用图遍历算法快速查询以地址为中心的关系网络,避免传统数据库中的大量操作。
在一些实施例中,关于系统的界面,可以根据用户需求及实际需要进行预设风格的设计。例如,为了提升用户的体验和易用性,可以在页面中加入很多细节设计,如直观的实体与事件角色图标设计、可视化的数据信息展现形式、所见即所得的信息交互方式等,以符合用户习惯的文件预览体验及协同分享体验。再如,在系统设计上,从整体的产品界面到细节的设计元素都可以保持一致的界面设计风格,其一致性可以主要体现在核心推演的元素设计上,包括实体、事件、关系三者的视觉风格以及交互过程中展示的细微动画效果等。
参见图3,本申请还提供一种知识图谱分析方法,包括:
S1:根据业务场景及业务数据分析出业务场景中的实体和关系;
S2:根据实体和关系建立实体模型和关系模型,以及将实体模型和关系模型存储在Neo4j中;
S3:分析实体模型和关系模型,得到分析结果,以及将分析结果以图形的形式展现,生成业务场景的图形分析数据;
S4:即时保存分析结果和图形分析数据,生成知识图谱分析图,以及将知识图谱分析图存储在MySQL中。
由以上技术方案可知,本申请提供一种知识图谱分析系统及方法,包括业务建模模块根据业务场景及业务数据分析出业务场景中的实体和关系;数据接入模块根据实体和关系建立实体模型和关系模型,以及将实体模型和关系模型存储在Neo4j中;图谱分析模块分析实体模型和关系模型,得到分析结果,以及将分析结果以图形的形式展现,生成业务场景的图形分析数据;图谱管理模块即时保存分析结果和图形分析数据,生成知识图谱分析图,以及将知识图谱分析图存储在MySQL中。本申请采用MySQL和Neo4j混合存储技术,解决了传统数据库中无法灵活改变实体和关系的属性、数据查询效率低的问题,通过简单二维图来展示业务关系,可以发现正常逻辑业务中的异常信息,还可以应用图计算算法,发现业务实体的深层次关联关系。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (10)
1.一种知识图谱分析系统,其特征在于,包括:业务建模模块、数据接入模块、图谱分析模块以及图谱管理模块:
所述业务建模模块被配置为:
根据业务场景及业务数据分析出所述业务场景中的实体和关系;
所述数据接入模块被配置为:
根据所述实体和所述关系建立实体模型和关系模型,以及将所述实体模型和所述关系模型存储在Neo4j中;
所述图谱分析模块被配置为:
分析所述实体模型和所述关系模型,得到分析结果,以及将所述分析结果以图形的形式展现,生成所述业务场景的图形分析数据;
所述图谱管理模块被配置为:
即时保存所述分析结果和所述图形分析数据,生成知识图谱分析图,以及将所述知识图谱分析图存储在MySQL中。
2.根据权利要求1所述的知识图谱分析系统,其特征在于,还包括数据检索模块,所述数据检索模块被配置为:
基于图数据库Neo4j检索引擎,根据所述实体的属性值进行关键词匹配搜索,以查找目标实体;
根据所述关系的预设条件进行条件搜索,以查找目标关系。
3.根据权利要求1所述的知识图谱分析系统,其特征在于,所述业务建模模块进一步被配置为:
根据预设的模型关系字典构建实体属性及可视化实体关系,所述预设的模型关系字典用于存储所述实体及所述关系的属性信息。
4.根据权利要求1所述的知识图谱分析系统,其特征在于,所述数据接入模块进一步被配置为:
通过可视化方式对接各种数据源,以及对所述数据源及所述业务数据进行校验及管理,根据所述实体和所述数据源建立基本知识库。
5.根据权利要求1所述的知识图谱分析系统,其特征在于,所述图谱分析模块进一步被配置为:
根据所述实体和所述关系挖掘关联关系,生成关联关系结果;其中,挖掘关联关系包括关系查询、路径挖掘、全图搜索、图计算、基于时间属性和空间属性的轨迹描绘、多维度关联分析、实体定位。
6.一种知识图谱分析方法,其特征在于,包括:
根据业务场景及业务数据分析出所述业务场景中的实体和关系;
根据所述实体和所述关系建立实体模型和关系模型,以及将所述实体模型和所述关系模型存储在Neo4j中;
分析所述实体模型和所述关系模型,得到分析结果,以及将所述分析结果以图形的形式展现,生成所述业务场景的图形分析数据;
即时保存所述分析结果和所述图形分析数据,生成知识图谱分析图,以及将所述知识图谱分析图存储在MySQL中。
7.根据权利要求6所述的知识图谱分析方法,其特征在于,在根据业务场景及业务数据分析出所述业务场景中的实体和关系之前,还包括:
对所述业务数据进行清洗与结构化,并将清洗与结构化之后的业务数据存储至所述Neo4j中。
8.根据权利要求7所述的知识图谱分析方法,其特征在于,在对所述业务数据进行清洗与结构化之后,还包括:
对清洗与结构化之后的业务数据的属性进行整理,以及将整理后的所述业务数据分类存储至所述Neo4j中。
9.根据权利要求6所述的知识图谱分析方法,其特征在于,还包括:可视化展现所述知识图谱分析图,可视化展现所述知识图谱分析图包括:
可视化展现所述实体及所述关系,以及可视化展现所述分析结果和所述图形分析数据。
10.根据权利要求6所述的知识图谱分析方法,其特征在于,还包括:将任一所述实体与其关联的其他实体和事件进行碰撞比对。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210168248.3A CN114547157A (zh) | 2022-02-23 | 2022-02-23 | 一种知识图谱分析系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210168248.3A CN114547157A (zh) | 2022-02-23 | 2022-02-23 | 一种知识图谱分析系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114547157A true CN114547157A (zh) | 2022-05-27 |
Family
ID=81676667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210168248.3A Pending CN114547157A (zh) | 2022-02-23 | 2022-02-23 | 一种知识图谱分析系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114547157A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117648387A (zh) * | 2024-01-29 | 2024-03-05 | 杭银消费金融股份有限公司 | 一种基于数据实体的逻辑数据截面的构建方法 |
-
2022
- 2022-02-23 CN CN202210168248.3A patent/CN114547157A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117648387A (zh) * | 2024-01-29 | 2024-03-05 | 杭银消费金融股份有限公司 | 一种基于数据实体的逻辑数据截面的构建方法 |
CN117648387B (zh) * | 2024-01-29 | 2024-05-07 | 杭银消费金融股份有限公司 | 一种基于数据实体的逻辑数据截面的构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10878358B2 (en) | Techniques for semantic business policy composition | |
US10853382B2 (en) | Interactive punchcard visualizations | |
US10853383B2 (en) | Interactive parallel coordinates visualizations | |
US10725981B1 (en) | Analyzing big data | |
US11132359B2 (en) | Systems and methods for grouping and enriching data items accessed from one or more databases for presentation in a user interface | |
Ballard et al. | Data modeling techniques for data warehousing | |
US9361320B1 (en) | Modeling big data | |
US11037342B1 (en) | Visualization modules for use within a framework for displaying interactive visualizations of event data | |
US7634478B2 (en) | Metadata driven intelligent data navigation | |
CN102253936B (zh) | 记录用户访问商品信息的方法及搜索方法和服务器 | |
US10853380B1 (en) | Framework for displaying interactive visualizations of event data | |
Blazewicz et al. | Handbook on data management in information systems | |
JP5535062B2 (ja) | ウェブログの時系列分析のためのデータ格納および照会方法及びその方法を実行するシステム | |
US11100141B2 (en) | Monitoring organization-wide state and classification of data stored in disparate data sources of an organization | |
Bano et al. | Discovering data models from event logs | |
Andriamampianina et al. | Graph data temporal evolutions: From conceptual modelling to implementation | |
CN114547157A (zh) | 一种知识图谱分析系统及方法 | |
Saroop et al. | Comparison of data warehouse design approaches from user requirement to conceptual model: A survey | |
CN114860819A (zh) | 商业智能系统的构建方法、装置、设备和存储介质 | |
Cao | E-Commerce Big Data Mining and Analytics | |
CN113486630B (zh) | 一种供应链数据向量化和可视化处理方法及装置 | |
Nunes et al. | Exploration of Semi-Structured Data Sources. | |
Mittal | Big Data Analysis for Data VisualizationA Review | |
Singh et al. | Big-Data-Based Techniques for Predictive Intelligence | |
FLORES et al. | Open-Data Mining in Tourism: Implications for Marketing Strategy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |