CN109446279A - 基于neo4j大数据血缘关系管理方法、系统、设备及存储介质 - Google Patents
基于neo4j大数据血缘关系管理方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN109446279A CN109446279A CN201811196013.5A CN201811196013A CN109446279A CN 109446279 A CN109446279 A CN 109446279A CN 201811196013 A CN201811196013 A CN 201811196013A CN 109446279 A CN109446279 A CN 109446279A
- Authority
- CN
- China
- Prior art keywords
- data
- genetic connection
- neo4j
- node
- syntax tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明涉及基于neo4j大数据血缘关系管理方法、系统、设备及存储介质。方法包括以下步骤:解析SQL语句,生成相应的抽象语法树,对于每个抽象语法树,深度遍历该抽象语法树的每个节点,在每个节点采集相应的节点数据;将采集的节点数据关系存储于neo4j图形数据库,将采集的必要信息存储于HBase;将异构数据源的信息引入血缘关系系统,形成血缘关系。便于图形化展现各数据源、Hive表间的依赖关系和血缘关系。提升了大数据平台元数据管理能力的层次,加强了对平台内部数据流转的把控,理清数据的来龙去脉,打通了各异构数据源的隔阂,血缘关系作为一座桥梁,连接了各数据源。
Description
技术领域
本发明涉及数据库技术领域,尤其涉及基于neo4j大数据血缘关系管理方法、系统、设备及存储介质。
背景技术
大数据时代,数据蕴藏着无限的价值。移动互联网的蓬勃发展,让各互联网公司积累了PB级别的用户数据和业务数据。在强大的需求驱动下,大数据技术也稳步成熟发展,通过HDFS,HBase,MongoDB,Kafka等存储组件,记录下了海量且持续增加的数据。
数据的产生、加工融合、流转流通,到最终消亡,数据之间自然会形成一种关系。借鉴人类社会中类似的一种关系来表达数据之间的这种关系,称之为数据的血缘关系。
随着大数据的崛起,数据挖掘对于企业来说显得越来越重要。目前基于数据挖掘的开源解决方案有2种,WhereHows系统和Atlas系统。WhereHows系统,其所依赖组件非常多,而且github上的项目,文档滞后非常严重,编译会遇到非常多的问题,对于一个开源项目,这是致命伤,对使用者非常不友好。而且其依赖Azkaban,不支持字段级别的血缘。
而Atlas也是一个庞大的系统,需要依赖titan,solr等。研究人员尝试修改其元数据存储组件为HBase,但Atlas却只支持非常低级别的Hbase。对于ElasticSearch也是同样的问题,Atlas也只支持非常低级别ElasticSearch。若大数据团队为Atlas系统维护两个低级别的HBase和ElasticSearch,则成本太大。
发明内容
为了解决上述技术问题,本发明的目的在于提供基于neo4j大数据血缘关系管理方法、系统、设备及存储介质。
根据本发明的一个方面,提供了基于neo4j大数据血缘关系管理方法,包括以下步骤:
解析SQL语句,生成相应的抽象语法树,对于每个抽象语法树,深度遍历该抽象语法树的每个节点,在每个节点采集相应的节点数据;
将采集的节点数据关系存储于neo4j图形数据库,将采集的必要信息存储于HBase;
将异构数据源的信息引入血缘关系系统,形成血缘关系。
作为优选,采用Antlr语法分析工具,进行语法、词法和语义分析,生成相应的抽象语法树。
作为优选,基于neo4j大数据血缘关系管理方法还包括:
针对neo4j建立索引,优化查询语句。
作为优选,所述相应的节点数据包括源数据表、目标数据表、源数据表字段和目标数据表字段。
作为优选,所述的必要信息包括Hive SQL语句及运行Hive SQL的时间。
作为优选,将异构数据源的信息引入血缘关系系统,形成血缘关系,包括:
打通内部的ETL系统和接入分发系统,获取定位唯一数据源的数据信息并引入血缘关系系统。
根据本发明的另一个方面,提供了基于neo4j大数据血缘关系管理系统,包括:
语法树生成单元,配置用于解析SQL语句,生成相应的抽象语法树,对于每个抽象语法树,深度遍历该抽象语法树的每个节点,在每个节点采集相应的节点数据;
数据存储单元,配置用于将采集的节点数据关系存储于neo4j图形数据库,将采集的必要信息存储于HBase;
血缘关系形成单元,配置用于将异构数据源的信息引入血缘关系系统,形成血缘关系。
作为优选,采用Antlr语法分析工具,进行语法、词法和语义分析,生成相应的抽象语法树。
作为优选,基于neo4j大数据血缘关系管理系统,还包括:
索引单元,配置用于针对neo4j建立索引,优化查询语句。
作为优选,所述相应的节点数据包括源数据表、目标数据表、源数据表字段和目标数据表字段。
作为优选,所述的必要信息包括Hive SQL语句及运行Hive SQL的时间。
作为优选,将异构数据源的信息引入血缘关系系统,形成血缘关系,包括:
数据获取子单元,配置用于打通内部的ETL系统和接入分发系统,获取定位唯一数据源的数据信息并引入血缘关系系统。
根据本发明的另一个方面,提供了一种设备,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上任一项所述的方法。
根据本发明的另一个方面,提供了一种存储有计算机程序的计算机可读存储介质,该程序被处理器执行时实现如上任一项所述的方法。
与现有技术相比,本发明具有以下有益效果:
1、本发明示例的基于neo4j大数据血缘关系管理方法,可以通过图形化展现各数据源、Hive表间的依赖关系和血缘关系,大大提升数据仓库等同事的工作效率。提升了大数据平台元数据管理能力的层次,加强了对平台内部数据流转的把控,理清数据的来龙去脉。提供生成该血缘关系的Hive Sql等来源信息,打通了各异构数据源的隔阂,血缘关系作为一座桥梁,连接了各数据源。此外,基于解析Hive Sql这项技术,可以在各层面计数hive表的使用次数,据此对数据表进行冷热分离。
2、本发明示例的基于neo4j大数据血缘关系管理系统,包括语法树生成单元,配置用于解析SQL语句,生成相应的抽象语法树,对于每个抽象语法树,深度遍历该抽象语法树的每个节点,在每个节点采集相应的节点数据;数据存储单元,配置用于将采集的节点数据关系存储于neo4j图形数据库,将采集的必要信息存储于HBase;血缘关系形成单元,配置用于将异构数据源的信息引入血缘关系系统。通过上述单元相互协作,可以图形化展现各数据源、Hive表间的依赖关系和血缘关系。且该系统支持表级别和字段级别的血缘关系,系统更加轻量级。提升了大数据平台元数据管理能力的层次,加强了对平台内部数据流转的把控,理清数据的来龙去脉。提供生成该血缘关系的Hive Sql等来源信息,打通了各异构数据源的隔阂,血缘关系作为一座桥梁,连接了各数据源。
3、本发明示例的基于neo4j大数据血缘关系管理设备,通过存储有计算机程序的计算机可读介质,所述程序被运行用于形成血缘关系,图形化展现各数据源、Hive表间的依赖关系和血缘关系。提升了大数据平台元数据管理能力的层次,加强了对平台内部数据流转的把控,理清数据的来龙去脉。
支持表级别和字段级别的血缘关系,图形数据库使用Neo4j,同时采用HBase当辅助存储。同时打通大数据团队的ETL系统和接入分发系统Databus。
附图说明
图1为本发明流程图;
图2为本发明的架构图。
具体实施方式
为了更好的了解本发明的技术方案,下面结合具体实施例、说明书附图对本发明作进一步说明。
实施例一:
本实施例的基于neo4j大数据血缘关系管理方法,包括:
S1、解析SQL语句,生成相应的抽象语法树,对于每个抽象语法树,深度遍历该抽象语法树的每个节点,在每个节点采集相应的节点数据;
其中,采用Antlr语法分析工具,进行语法、词法和语义分析,生成相应的抽象语法树。
其中,所述相应的节点数据包括源数据表、目标数据表、源数据表字段和目标数据表字段。
具体的,LineageMgr服务通过Antlr解析器,解析存储于HDFS的已经成功执行的Hive Sql,得到Hive Sql的抽象语法树,通过深度遍历语法树的每个节点,分析各子树的相对结构,以及采集重要节点的数据,所采集的数据包括源数据表、目标数据表、源数据表字段和目标数据表字段。
LineageMgr主要的工作量,是要对生成的抽象语法树(AST)深度遍历,判断特定TOKEN子树下的内容,是否是血缘关系所需要的。同时,需要考虑很多Hive Sql的复杂语法,比如子查询,子查询带别名,JOIN关键词,UNION关键词,Where条件中带函数等等。
S2、将采集的节点数据关系存储于neo4j图形数据库,将采集的必要信息存储于HBase;
其中,所述的必要信息包括Hive SQL语句及运行Hive SQL的时间。
具体的,在深度遍历AST之后,将采集到的Hive Sql中包含的源数据表、目标数据表、源数据表字段和目标数据表字段存储入neo4j图形数据库,同时将详细的元数据存储于HBase。这样存储分离,neo4j发挥了自己的图形存储的能力,而HBase互补了neo4j节点和边不能存储过长信息的问题。再利用neo4j的图形数据库特性,用点来表示Hive的数据库表;用边来表示两个表的血缘关系,由源表指向目标表。再产生了多个血缘关系之后,多个边组成图,由此血缘图便产生了。
根据neo4j的查询语言Cypher,可以把neo4j的数据,图形化地展现出来。同时,也可以限定读取的语句,只筛选特定的表(neo4j的点)和血缘关系(neo4j的边)。
S3、将异构数据源的信息引入血缘关系系统,形成血缘关系;
其中,打通内部的ETL系统和接入分发系统,获取定位唯一数据源的数据信息并引入血缘关系系统。
具体的,ETL为大数据团队内部的ETL系统,内部的接入分发系统为Databus,打通团队内部的ETL系统和接入分发系统Databus,将各异构数据源的信息,即定位唯一数据源的数据信息(比如kafka数据,根据集群名称,topic名称,来定位一个数据源;Elasticsearch数据,根据Elasticsearch所在的集群,以及索引名,来定位一个数据源),组合成neo4j的数据结构,固化存储于neo4j,形成血缘关系。如图2所示,异构数据源包括ETL中的MySQL、Oracle、Hive、Kafka、Elasticsearch和接入分发系统Databus中的Kafka数据库。
基于neo4j大数据血缘关系管理方法,还包括:
针对neo4j建立索引,优化查询语句。
针对neo4j的特定属性建立索引,优化查询的Cypher语句。通过Dubbo框架暴露该血缘关系服务的功能。针对存入neo4j中的label为table,即表格节点的name属性,建立索引。这样方便了读取的效率,同时,也提升了写入时,采用merge语句的效率,保证了产品服务的可用性。
当产品需要展现血缘关系时,会作为客户端,访问Dubbo服务,通过RESTful API接口,HTTP协议来访问后台服务。后台服务,则需要编写高性能的Cypher语句去读取特定表格的上下游血缘关系。同时,组合成合适的数据结构返回给客户端展现,通过go.js框架来展现图形。
本实施例提供了基于neo4j大数据血缘关系管理系统,包括:
语法树生成单元,配置用于解析SQL语句,生成相应的抽象语法树,对于每个抽象语法树,深度遍历该抽象语法树的每个节点,在每个节点采集相应的节点数据;
数据存储单元,配置用于将采集的节点数据关系存储于neo4j图形数据库,将采集的必要信息存储于HBase;
血缘关系形成单元,配置用于将异构数据源的信息引入血缘关系系统,形成血缘关系。
较佳的,采用Antlr语法分析工具,进行语法、词法和语义分析,生成相应的抽象语法树。
较佳的,基于neo4j大数据血缘关系管理系统,还包括:
索引单元,配置用于针对neo4j建立索引,优化查询语句。
较佳的,所述节点数据包括源数据表、目标数据表、源数据表字段和目标数据表字段。
较佳的,所述的必要信息包括Hive SQL语句及运行Hive SQL的时间。
较佳的,将异构数据源的信息引入血缘关系系统,形成血缘关系,包括:
数据获取子单元,配置用于打通内部的ETL系统和接入分发系统,获取定位唯一数据源的数据信息并引入血缘关系系统。
本实施例提供了一种设备,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上所述的方法。
本实施例提供了一种存储有计算机程序的计算机可读存储介质,该程序被处理器执行时实现如上所述的方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能。
Claims (14)
1.基于neo4j大数据血缘关系管理方法,其特征是,包括:
解析SQL语句,生成相应的抽象语法树,对于每个抽象语法树,深度遍历该抽象语法树的每个节点,在每个节点采集相应的节点数据;
将采集的节点数据关系存储于neo4j图形数据库,将采集的必要信息存储于HBase;
将异构数据源的信息引入血缘关系系统,形成血缘关系。
2.根据权利要求1所述的基于neo4j大数据血缘关系管理方法,其特征是,采用Antlr语法分析工具,进行语法、词法和语义分析,生成相应的抽象语法树。
3.根据权利要求1所述的基于neo4j大数据血缘关系管理方法,其特征是,还包括:
针对neo4j建立索引,优化查询语句。
4.根据权利要求1所述的基于neo4j大数据血缘关系管理方法,其特征是,所述相应的节点数据包括源数据表、目标数据表、源数据表字段和目标数据表字段。
5.根据权利要求1所述的基于neo4j大数据血缘关系管理方法,其特征是,所述的必要信息包括Hive SQL语句及运行Hive SQL的时间。
6.根据权利要求1所述的基于neo4j大数据血缘关系管理方法,其特征是,所述将异构数据源的信息引入血缘关系系统,形成血缘关系,包括:
打通内部的ETL系统和接入分发系统,获取定位唯一数据源的数据信息并引入血缘关系系统。
7.基于neo4j大数据血缘关系管理系统,其特征是,包括:
语法树生成单元,配置用于解析SQL语句,生成相应的抽象语法树,对于每个抽象语法树,深度遍历该抽象语法树的每个节点,在每个节点采集相应的节点数据;
数据存储单元,配置用于将采集的节点数据关系存储于neo4j图形数据库,将采集的必要信息存储于HBase;
血缘关系形成单元,配置用于将异构数据源的信息引入血缘关系系统,形成血缘关系。
8.根据权利要求7所述的基于neo4j大数据血缘关系管理系统,其特征是,采用Antlr语法分析工具,进行语法、词法和语义分析,生成相应的抽象语法树。
9.根据权利要求7所述的基于neo4j大数据血缘关系管理系统,其特征是,还包括:
索引单元,配置用于针对neo4j建立索引,优化查询语句。
10.根据权利要求7所述的基于neo4j大数据血缘关系管理系统,其特征是,所述节点数据包括源数据表、目标数据表、源数据表字段和目标数据表字段。
11.根据权利要求7所述的基于neo4j大数据血缘关系管理系统,其特征是,所述的必要信息包括Hive SQL语句及运行Hive SQL的时间。
12.根据权利要求7所述的基于neo4j大数据血缘关系管理系统,其特征是,将异构数据源的信息引入血缘关系系统,形成血缘关系,包括:
数据获取子单元,配置用于打通内部的ETL系统和接入分发系统,获取定位唯一数据源的数据信息并引入血缘关系系统。
13.一种设备,其特征是,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1-6中任一项所述的方法。
14.一种存储有计算机程序的计算机可读存储介质,其特征是,该程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811196013.5A CN109446279A (zh) | 2018-10-15 | 2018-10-15 | 基于neo4j大数据血缘关系管理方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811196013.5A CN109446279A (zh) | 2018-10-15 | 2018-10-15 | 基于neo4j大数据血缘关系管理方法、系统、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109446279A true CN109446279A (zh) | 2019-03-08 |
Family
ID=65545156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811196013.5A Pending CN109446279A (zh) | 2018-10-15 | 2018-10-15 | 基于neo4j大数据血缘关系管理方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109446279A (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008231A (zh) * | 2019-03-19 | 2019-07-12 | 福建省天奕网络科技有限公司 | MySQL数据回溯方法、存储介质 |
CN110196888A (zh) * | 2019-05-27 | 2019-09-03 | 深圳前海微众银行股份有限公司 | 基于Hadoop的数据更新方法、装置、系统及介质 |
CN110232056A (zh) * | 2019-05-21 | 2019-09-13 | 苏宁云计算有限公司 | 一种结构化查询语言的血缘解析方法及其工具 |
CN110245270A (zh) * | 2019-05-09 | 2019-09-17 | 重庆天蓬网络有限公司 | 基于图模型的数据血缘关系存储方法、系统、介质和设备 |
CN110399423A (zh) * | 2019-07-24 | 2019-11-01 | 北京明略软件系统有限公司 | 元数据血缘关系的处理方法及装置、存储介质和电子装置 |
CN110727677A (zh) * | 2019-09-19 | 2020-01-24 | 上海数禾信息科技有限公司 | 数据仓库内表格的血缘关系追溯的方法和装置 |
CN110866029A (zh) * | 2019-10-11 | 2020-03-06 | 支付宝(杭州)信息技术有限公司 | sql语句构建方法、装置、服务器及可读存储介质 |
CN111125269A (zh) * | 2019-12-31 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 一种数据管理方法、血缘关系显示方法和相关装置 |
CN111143403A (zh) * | 2019-12-10 | 2020-05-12 | 跬云(上海)信息科技有限公司 | Sql转换方法及装置、存储介质 |
CN111198901A (zh) * | 2020-01-06 | 2020-05-26 | 北京邮电大学 | 基于多数据源的统一数据服务开放方法及系统 |
CN111538743A (zh) * | 2020-04-22 | 2020-08-14 | 电子科技大学 | 基于sql的数据血缘关系分析方法以及系统 |
CN111538744A (zh) * | 2020-07-08 | 2020-08-14 | 浙江大华技术股份有限公司 | 数据血缘的处理方法及装置 |
CN111723253A (zh) * | 2020-05-25 | 2020-09-29 | 贵州华泰智远大数据服务有限公司 | 一种基于图数据库的数据血缘查询方法及查询系统 |
CN111782738A (zh) * | 2020-08-14 | 2020-10-16 | 北京斗米优聘科技发展有限公司 | 构建数据仓库表级别血缘关系的方法及装置 |
CN112328667A (zh) * | 2020-07-17 | 2021-02-05 | 四川长宁天然气开发有限责任公司 | 一种基于数据血缘的页岩气田地面工程数字化移交方法 |
CN112559493A (zh) * | 2020-12-23 | 2021-03-26 | 北京北明数科信息技术有限公司 | 数据血缘关系解析方法、计算机装置和存储介质 |
CN112634004A (zh) * | 2020-12-30 | 2021-04-09 | 中国农业银行股份有限公司 | 征信数据的血缘图谱分析方法与系统 |
CN112860713A (zh) * | 2021-04-23 | 2021-05-28 | 脉策(上海)智能科技有限公司 | 用于获取图层数据的方法、电子设备和存储介质 |
CN112925777A (zh) * | 2021-02-25 | 2021-06-08 | 吉林亿联银行股份有限公司 | 一种用于探测hive数据库数据血缘的方法及系统 |
CN113326401A (zh) * | 2021-06-16 | 2021-08-31 | 上海哔哩哔哩科技有限公司 | 字段血缘生成方法及系统 |
CN113468165A (zh) * | 2020-03-31 | 2021-10-01 | 中国移动通信集团贵州有限公司 | 数据的血缘关系建立方法、装置及电子设备、存储介质 |
WO2021218021A1 (zh) * | 2020-04-28 | 2021-11-04 | 平安科技(深圳)有限公司 | 数据血缘分析方法、装置、设备及计算机可读存储介质 |
WO2022156087A1 (zh) * | 2021-01-22 | 2022-07-28 | 平安科技(深圳)有限公司 | 数据血缘关系建立方法、装置、计算机设备及存储介质 |
CN117786023A (zh) * | 2024-02-28 | 2024-03-29 | 北方健康医疗大数据科技有限公司 | 医疗数据血缘分析方法、系统、终端及存储介质 |
CN110196888B (zh) * | 2019-05-27 | 2024-05-10 | 深圳前海微众银行股份有限公司 | 基于Hadoop的数据更新方法、装置、系统及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130097114A1 (en) * | 2011-10-18 | 2013-04-18 | International Business Machines Corporation | Query metadata engine |
US20130124545A1 (en) * | 2011-11-15 | 2013-05-16 | Business Objects Software Limited | System and method implementing a text analysis repository |
CN105701181A (zh) * | 2016-01-06 | 2016-06-22 | 中电科华云信息技术有限公司 | 一种动态异构元数据获取方法及系统 |
US20170061007A1 (en) * | 2015-08-28 | 2017-03-02 | Futurewei Technologies, Inc. | System and Method for Providing Data as a Service (DaaS) in Real-time |
CN107644073A (zh) * | 2017-09-18 | 2018-01-30 | 广东中标数据科技股份有限公司 | 一种基于深度优先遍历的字段血缘分析方法、系统及装置 |
-
2018
- 2018-10-15 CN CN201811196013.5A patent/CN109446279A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130097114A1 (en) * | 2011-10-18 | 2013-04-18 | International Business Machines Corporation | Query metadata engine |
US20130124545A1 (en) * | 2011-11-15 | 2013-05-16 | Business Objects Software Limited | System and method implementing a text analysis repository |
US20170061007A1 (en) * | 2015-08-28 | 2017-03-02 | Futurewei Technologies, Inc. | System and Method for Providing Data as a Service (DaaS) in Real-time |
CN105701181A (zh) * | 2016-01-06 | 2016-06-22 | 中电科华云信息技术有限公司 | 一种动态异构元数据获取方法及系统 |
CN107644073A (zh) * | 2017-09-18 | 2018-01-30 | 广东中标数据科技股份有限公司 | 一种基于深度优先遍历的字段血缘分析方法、系统及装置 |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008231A (zh) * | 2019-03-19 | 2019-07-12 | 福建省天奕网络科技有限公司 | MySQL数据回溯方法、存储介质 |
CN110245270A (zh) * | 2019-05-09 | 2019-09-17 | 重庆天蓬网络有限公司 | 基于图模型的数据血缘关系存储方法、系统、介质和设备 |
CN110232056A (zh) * | 2019-05-21 | 2019-09-13 | 苏宁云计算有限公司 | 一种结构化查询语言的血缘解析方法及其工具 |
WO2020238597A1 (zh) * | 2019-05-27 | 2020-12-03 | 深圳前海微众银行股份有限公司 | 基于Hadoop的数据更新方法、装置、系统及介质 |
CN110196888A (zh) * | 2019-05-27 | 2019-09-03 | 深圳前海微众银行股份有限公司 | 基于Hadoop的数据更新方法、装置、系统及介质 |
CN110196888B (zh) * | 2019-05-27 | 2024-05-10 | 深圳前海微众银行股份有限公司 | 基于Hadoop的数据更新方法、装置、系统及介质 |
CN110399423A (zh) * | 2019-07-24 | 2019-11-01 | 北京明略软件系统有限公司 | 元数据血缘关系的处理方法及装置、存储介质和电子装置 |
CN110727677A (zh) * | 2019-09-19 | 2020-01-24 | 上海数禾信息科技有限公司 | 数据仓库内表格的血缘关系追溯的方法和装置 |
CN110727677B (zh) * | 2019-09-19 | 2022-12-30 | 上海数禾信息科技有限公司 | 数据仓库内表格的血缘关系追溯的方法和装置 |
CN110866029A (zh) * | 2019-10-11 | 2020-03-06 | 支付宝(杭州)信息技术有限公司 | sql语句构建方法、装置、服务器及可读存储介质 |
CN111143403A (zh) * | 2019-12-10 | 2020-05-12 | 跬云(上海)信息科技有限公司 | Sql转换方法及装置、存储介质 |
CN111125269A (zh) * | 2019-12-31 | 2020-05-08 | 腾讯科技(深圳)有限公司 | 一种数据管理方法、血缘关系显示方法和相关装置 |
CN111125269B (zh) * | 2019-12-31 | 2023-05-02 | 腾讯科技(深圳)有限公司 | 一种数据管理方法、血缘关系显示方法和相关装置 |
CN111198901A (zh) * | 2020-01-06 | 2020-05-26 | 北京邮电大学 | 基于多数据源的统一数据服务开放方法及系统 |
CN111198901B (zh) * | 2020-01-06 | 2023-03-10 | 北京邮电大学 | 基于多数据源的统一数据服务开放方法及系统 |
CN113468165A (zh) * | 2020-03-31 | 2021-10-01 | 中国移动通信集团贵州有限公司 | 数据的血缘关系建立方法、装置及电子设备、存储介质 |
CN111538743B (zh) * | 2020-04-22 | 2023-08-18 | 电子科技大学 | 基于sql的数据血缘关系分析方法以及系统 |
CN111538743A (zh) * | 2020-04-22 | 2020-08-14 | 电子科技大学 | 基于sql的数据血缘关系分析方法以及系统 |
WO2021218021A1 (zh) * | 2020-04-28 | 2021-11-04 | 平安科技(深圳)有限公司 | 数据血缘分析方法、装置、设备及计算机可读存储介质 |
CN111723253A (zh) * | 2020-05-25 | 2020-09-29 | 贵州华泰智远大数据服务有限公司 | 一种基于图数据库的数据血缘查询方法及查询系统 |
CN111538744A (zh) * | 2020-07-08 | 2020-08-14 | 浙江大华技术股份有限公司 | 数据血缘的处理方法及装置 |
CN112328667A (zh) * | 2020-07-17 | 2021-02-05 | 四川长宁天然气开发有限责任公司 | 一种基于数据血缘的页岩气田地面工程数字化移交方法 |
CN112328667B (zh) * | 2020-07-17 | 2023-09-08 | 四川长宁天然气开发有限责任公司 | 一种基于数据血缘的页岩气田地面工程数字化移交方法 |
CN111782738A (zh) * | 2020-08-14 | 2020-10-16 | 北京斗米优聘科技发展有限公司 | 构建数据仓库表级别血缘关系的方法及装置 |
CN112559493A (zh) * | 2020-12-23 | 2021-03-26 | 北京北明数科信息技术有限公司 | 数据血缘关系解析方法、计算机装置和存储介质 |
CN112634004B (zh) * | 2020-12-30 | 2023-10-13 | 中国农业银行股份有限公司 | 征信数据的血缘图谱分析方法与系统 |
CN112634004A (zh) * | 2020-12-30 | 2021-04-09 | 中国农业银行股份有限公司 | 征信数据的血缘图谱分析方法与系统 |
WO2022156087A1 (zh) * | 2021-01-22 | 2022-07-28 | 平安科技(深圳)有限公司 | 数据血缘关系建立方法、装置、计算机设备及存储介质 |
CN112925777A (zh) * | 2021-02-25 | 2021-06-08 | 吉林亿联银行股份有限公司 | 一种用于探测hive数据库数据血缘的方法及系统 |
CN112860713A (zh) * | 2021-04-23 | 2021-05-28 | 脉策(上海)智能科技有限公司 | 用于获取图层数据的方法、电子设备和存储介质 |
CN113326401A (zh) * | 2021-06-16 | 2021-08-31 | 上海哔哩哔哩科技有限公司 | 字段血缘生成方法及系统 |
CN113326401B (zh) * | 2021-06-16 | 2023-01-20 | 上海哔哩哔哩科技有限公司 | 字段血缘生成方法及系统 |
CN117786023A (zh) * | 2024-02-28 | 2024-03-29 | 北方健康医疗大数据科技有限公司 | 医疗数据血缘分析方法、系统、终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109446279A (zh) | 基于neo4j大数据血缘关系管理方法、系统、设备及存储介质 | |
Lawrence | Integration and virtualization of relational SQL and NoSQL systems including MySQL and MongoDB | |
CN107291807B (zh) | 一种基于图遍历的sparql查询优化方法 | |
CN104123288B (zh) | 一种数据查询方法及装置 | |
Curé et al. | Data integration over NoSQL stores using access path based mappings | |
US20160253385A1 (en) | Global query hint specification | |
US9965641B2 (en) | Policy-based data-centric access control in a sorted, distributed key-value data store | |
CN105279286A (zh) | 一种交互式大数据分析查询处理方法 | |
Hai et al. | Query rewriting for heterogeneous data lakes | |
CN114461603A (zh) | 多源异构数据融合方法及装置 | |
Khan et al. | Predictive performance comparison analysis of relational & NoSQL graph databases | |
Mostajabi et al. | A Systematic Review of Data Models for the Big Data Problem | |
Both et al. | A service-oriented search framework for full text, geospatial and semantic search | |
Gao et al. | GLog: A high level graph analysis system using MapReduce | |
Xie et al. | An evolvable and transparent data as a service framework for multisource data integration and fusion | |
US10592506B1 (en) | Query hint specification | |
Alsubaiee et al. | Asterix: scalable warehouse-style web data integration | |
Haque et al. | Distributed RDF triple store using hbase and hive | |
Khelil et al. | Combining graph exploration and fragmentation for scalable RDF query processing | |
Zhang et al. | Unified SQL query middleware for heterogeneous databases | |
Dede et al. | Scalable and distributed processing of scientific XML data | |
Wu et al. | Scalable SAPRQL querying processing on large RDF data in cloud computing environment | |
Kalogeros et al. | Document-based RDF storage method for parallel evaluation of basic graph pattern queries | |
Rahm et al. | Dynamic fusion of web data | |
Xu et al. | A unified computation engine for big data analytics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190308 |
|
RJ01 | Rejection of invention patent application after publication |