CN111538743A - 基于sql的数据血缘关系分析方法以及系统 - Google Patents

基于sql的数据血缘关系分析方法以及系统 Download PDF

Info

Publication number
CN111538743A
CN111538743A CN202010319878.7A CN202010319878A CN111538743A CN 111538743 A CN111538743 A CN 111538743A CN 202010319878 A CN202010319878 A CN 202010319878A CN 111538743 A CN111538743 A CN 111538743A
Authority
CN
China
Prior art keywords
data
sql
blood relationship
analysis
abstract syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010319878.7A
Other languages
English (en)
Other versions
CN111538743B (zh
Inventor
吴晓华
庞红
樊友平
李瑞恒
罗瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010319878.7A priority Critical patent/CN111538743B/zh
Publication of CN111538743A publication Critical patent/CN111538743A/zh
Application granted granted Critical
Publication of CN111538743B publication Critical patent/CN111538743B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于SQL的数据血缘关系分析方法以及系统,所述方法首先从含有SQL代码的脚本文件中提取得到规则化的SQL语句,完成对SQL语句的清洗;再对规则化的SQL语句进行词法分析,生成抽象语法树,并遍历抽象语法树对SQL语句进行句法解析;然后根据抽象语法树对SQL语句进行血缘关系分析,得到血缘关系分析结果;最后根据血缘关系分析结果绘制SQL语句的数据血缘关系图,并进行可视化显示。本发明用图形化的方式展现了数据库各个表之间的血缘关系,可以梳理出表间、字段间的依赖关系,方便后续业务的查询和开发管理。

Description

基于SQL的数据血缘关系分析方法以及系统
技术领域
本发明属于计算机技术领域,具体涉及一种基于SQL的数据血缘关系分析方法以及系统的设计。
背景技术
随着大数据技术的发展与应用,在大数据治理领域出现了数据血缘分析的需求,通过对数据库进行操作的结构化查询语句的分析与处理,可以梳理出数据库之间表、字段的映射关系,形成数据地图,以便在海量、巨大的数据中追踪数据的流向,查看大数据系统中上游数据的来源与下游数据的去向,方便大数据开发人员以及业务分析人员掌握数据的消费与来源,从而更好地管理大数据系统,挖掘出数据血缘关系的价值。但是,现有的数据库血缘关系分析方法通常基于数据库存储血缘关系,不利于大数据各个部门之间的安装、配置以及维护,这导致数据血缘分析效率不高。
发明内容
本发明的目的是为了解决现有的数据库血缘关系分析方法分析效率不高的问题,提出了一种基于SQL的数据血缘关系分析方法以及系统。
本发明的技术方案为:基于SQL的数据血缘关系分析方法,包括以下步骤:
S1、从含有SQL代码的脚本文件中提取得到规则化的SQL语句,完成对SQL语句的清洗。
S2、对规则化的SQL语句进行词法分析,生成抽象语法树,并遍历抽象语法树对SQL语句进行句法解析。
S3、根据抽象语法树对SQL语句进行血缘关系分析,得到血缘关系分析结果。
S4、根据血缘关系分析结果绘制SQL语句的数据血缘关系图,并进行可视化显示。
进一步地,步骤S1包括以下分步骤:
S11、获取含有SQL代码的脚本文件,并寻找SQL代码的标志位。
S12、利用标志位过滤脚本文件中的无关内容,保留得到规则化的SQL代码语句。
进一步地,步骤S2包括以下分步骤:
S21、对规则化的SQL语句进行词法分析,根据语法规则对规则化的SQL语句进行关键词划分,并对每个关键词进行标签标识。
S22、将每个标识后的SQL语句作为一个节点,生成为一棵抽象语法树。
S23、遍历抽象语法树,为每个标签对应的SQL语句赋予句法意义,实现对SQL语句的句法解析。
进一步地,步骤S3包括以下分步骤:
S31、处理抽象语法树中标识出的节点数据,将源数据表和源数据字段作为节点数据的输入集合,将目标数据表和目标数据字段作为节点数据的输出集合。
S32、对节点数据的来源和去向分别进行映射,得到血缘关系分析结果。
进一步地,步骤S4包括以下分步骤:
S41、根据输入集合和输出集合中的节点数据,绘制数据血缘关系图中数据表和字段节点。
S42、根据血缘关系分析结果,关联数据血缘关系图中的节点并绘制箭头指向连线,完成SQL语句的数据血缘关系图的绘制。
S43、将绘制好的数据血缘关系图发送至用户终端进行可视化显示。
本发明还提供了一种基于SQL的数据血缘关系分析系统,包括依次连接的数据清洗模块、数据解析模块、血缘分析模块以及可视化模块;数据清洗模块用于从含有SQL代码的脚本文件中提取得到规则化的SQL语句,完成对SQL语句的清洗;数据解析模块用于对规则化的SQL语句进行词法分析,生成抽象语法树,并遍历抽象语法树对SQL语句进行句法解析;血缘分析模块用于根据抽象语法树对SQL语句进行血缘关系分析,得到血缘关系分析结果;可视化模块用于根据血缘关系分析结果绘制SQL语句的数据血缘关系图,并进行可视化显示。
进一步地,数据清洗模块包括相互连接的标记单元和过滤单元;标记单元用于获取含有SQL代码的脚本文件,并寻找SQL代码的标志位;过滤单元用于利用标志位过滤脚本文件中的无关内容,保留得到规则化的SQL代码语句。
进一步地,数据解析模块包括相互连接的词法解析单元和句法解析单元;词法解析单元用于对规则化的SQL语句进行词法分析,根据语法规则对规则化的SQL语句进行关键词划分,并对每个关键词进行标签标识,并将每个标识后的SQL语句作为一个节点,生成为一棵抽象语法树;句法解析单元用于遍历抽象语法树,为每个标签对应的SQL语句赋予句法意义,实现对SQL语句的句法解析。
进一步地,血缘分析模块包括依次连接的节点识别单元和血缘关联单元;节点识别单元用于处理抽象语法树中标识出的节点数据,将源数据表和源数据字段作为节点数据的输入集合,将目标数据表和目标数据字段作为节点数据的输出集合;血缘关联单元用于对节点数据的来源和去向分别进行映射,得到血缘关系分析结果。
进一步地,可视化模块包括相互连接的前端绘制单元和后端发送单元;前端绘制单元用于绘制数据血缘关系图中数据表和字段节点,并根据血缘关系分析结果,关联数据血缘关系图中的节点并绘制箭头指向连线;后端发送单元用于将绘制好的数据血缘关系图发送至用户终端进行可视化显示。
本发明的有益效果是:
(1)本发明可以避免使用数据库的方式分析SQL语句的血缘关系,同时能够以可视化的方式显示数据之间的依赖关系,方便后续业务的查询和开发管理。
(2)本发明通过数据血缘分析过程加强了对数据流动的监控,以可视化的方式理清了数据的源头与去向。
附图说明
图1所示为本发明实施例一提供的基于SQL的数据血缘关系分析方法流程图。
图2所示为本发明实施例一提供的用户终端可视化效果示意图。
图3所示为本发明实施例二提供的基于SQL的数据血缘关系分析系统框图。
具体实施方式
现在将参考附图来详细描述本发明的示例性实施方式。应当理解,附图中示出和描述的实施方式仅仅是示例性的,意在阐释本发明的原理和精神,而并非限制本发明的范围。
实施例一:
本发明实施例提供了一种基于SQL的数据血缘关系分析方法,如图1所示,包括以下步骤S1~S4:
S1、从含有SQL代码的脚本文件中提取得到规则化的SQL语句,完成对SQL语句的清洗。
步骤S1包括以下分步骤S11~S12:
S11、获取含有SQL代码的脚本文件,并寻找SQL代码的标志位。
本发明实施例中,脚本文件为perl等脚本。
S12、利用标志位过滤脚本文件中的无关内容,保留得到规则化的SQL代码语句。
根据本发明实施例,SQL语句清洗示例如下:
CREATE TABLE
${icl_db_name}.C_PT_CUSTODY_BAL_ACCUM_TMP_ACCT${TX_DATE}
(Party_Id VARCHAR(120),Acct_Bal DECIMAL(18,2))
CLUSTERED BY
(Party_Id)
INTO 3BUCKETS
STORED AS ORC.
其中,需要过滤到带有明显特征的${}变量参数的符号标志。例如,这里icl_db_name是数据库的名称,其后是数据库的表名以及日期。施行SQL语句清洗过滤后,可以获得如下结果:
CREATE TABLE icl_db_name.C_PT_CUSTODY_BAL_ACCUM_TMP_ACCTTX_DATE(Party_Id VARCHAR(120),Acct_Bal DECIMAL(18,2))BY(Party_Id)INTO 3BUCKETSSTORED AS ORC.
S2、对规则化的SQL语句进行词法分析,生成抽象语法树,并遍历抽象语法树对SQL语句进行句法解析。
步骤S2包括以下分步骤S21~S23:
S21、对规则化的SQL语句进行词法分析,根据语法规则对规则化的SQL语句进行关键词划分,并对每个关键词进行标签标识。
S22、将每个标识后的SQL语句作为一个节点,生成为一棵抽象语法树。
S23、遍历抽象语法树,为每个标签对应的SQL语句赋予句法意义,实现对SQL语句的句法解析。
根据本发明实施例,SQL语句解析示例如下:
<DDL'CREATE'at 0x7FDCCC579828>,
<Whitespace”at 0x7FDCCC579888>,
<Keyword'TABLE'at 0x7FDCCC5799A8>,
<Whitespace”at 0x7FDCCC579948>,
<Identifier'icl_db...'at 0x7FDCCC642E58>,
<Whitespace”at 0x7FDCCC579AC8>,
<Parenthesis'(Party...'at 0x7FDCCC642C78>,
<Whitespace”at 0x7FDCCC56B228>,
<Keyword'BY'at 0x7FDCCC56B288>,
<Whitespace”at 0x7FDCCC56B2E8>,
<Parenthesis'(Party...'at 0x7FDCCC642CF0>,
<Whitespace”at 0x7FDCCC56B468>,
<Keyword'INTO'at 0x7FDCCC56B4C8>,
<Whitespace”at 0x7FDCCC56B528>,
<Identifier'3BUCK...'at 0x7FDCCC572318>,
<Whitespace”at 0x7FDCCC56B6A8>,
<Identifier'STORED...'at 0x7FDCCC572228>
其中词法分析为一条SQL语句划分出不同的关键词,比如'CREATE'、'TABLE'、'BY'、'INTO'等。这些关键词被赋予了不同的标识,这些标识标明了关键词在SQL语句中的词法意义,比如DDL、Keyword、Parenthesis、Identifier等。
S3、根据抽象语法树对SQL语句进行血缘关系分析,得到血缘关系分析结果。
步骤S3包括以下分步骤S31~S32:
S31、处理抽象语法树中标识出的节点数据,将源数据表和源数据字段作为节点数据的输入集合,将目标数据表和目标数据字段作为节点数据的输出集合。
S32、对节点数据的来源和去向分别进行映射,得到血缘关系分析结果。
本发明实施例中,识别节点数据来源标签的关键词包括'FROM','JOIN','INNERJOIN','LEFT JOIN','RIGHT JOIN','LEFT OUTER JOIN','RIGHT OUTER JOIN','FULLOUTER JOIN','CROSS JOIN'等,目标标签的关键词包括'INTO','OVERWRITE','TABLE',通过关键词分别识别出数据来源和目标的集合。对不同的SQL操作包括CREATE、INSERT、SELECT等进行血缘关系分析,并将节点数据的来源和去向的映射作为血缘分析结果输出。
S4、根据血缘关系分析结果绘制SQL语句的数据血缘关系图,并进行可视化显示。
步骤S4包括以下分步骤S41~S43:
S41、根据输入集合和输出集合中的节点数据,绘制数据血缘关系图中数据表和字段节点。
S42、根据血缘关系分析结果,关联数据血缘关系图中的节点并绘制箭头指向连线,完成SQL语句的数据血缘关系图的绘制。
S43、将绘制好的数据血缘关系图发送至用户终端进行可视化显示。
本发明实施例中,血缘关系处理功能以flask框架作为后端服务,当用户终端需要可视化血缘关系时,后端服务将相应的血缘关系节点和关联结果返回给用户终端,通过pinker.js框架来绘制数据血缘关系图,在用户终端展现的效果如图2所示。
实施例二:
本发明实施例提供了一种基于SQL的数据血缘关系分析系统,如图3所示,包括依次连接的数据清洗模块、数据解析模块、血缘分析模块以及可视化模块。
其中,数据清洗模块用于从含有SQL代码的脚本文件中提取得到规则化的SQL语句,完成对SQL语句的清洗;数据解析模块用于对规则化的SQL语句进行词法分析,生成抽象语法树,并遍历抽象语法树对SQL语句进行句法解析;血缘分析模块用于根据抽象语法树对SQL语句进行血缘关系分析,得到血缘关系分析结果;可视化模块用于根据血缘关系分析结果绘制SQL语句的数据血缘关系图,并进行可视化显示。
如图3所示,数据清洗模块包括相互连接的标记单元和过滤单元。
其中,标记单元用于获取含有SQL代码的脚本文件,并寻找SQL代码的标志位;过滤单元用于利用标志位过滤脚本文件中的无关内容,保留得到规则化的SQL代码语句。
如图3所示,数据解析模块包括相互连接的词法解析单元和句法解析单元。
其中,词法解析单元用于对规则化的SQL语句进行词法分析,根据语法规则对规则化的SQL语句进行关键词划分,并对每个关键词进行标签标识,并将每个标识后的SQL语句作为一个节点,生成为一棵抽象语法树;句法解析单元用于遍历抽象语法树,为每个标签对应的SQL语句赋予句法意义,实现对SQL语句的句法解析。
如图3所示,血缘分析模块包括依次连接的节点识别单元和血缘关联单元。
其中,节点识别单元用于处理抽象语法树中标识出的节点数据,将源数据表和源数据字段作为节点数据的输入集合,将目标数据表和目标数据字段作为节点数据的输出集合;血缘关联单元用于对节点数据的来源和去向分别进行映射,得到血缘关系分析结果。
如图3所示,可视化模块包括相互连接的前端绘制单元和后端发送单元。
其中,前端绘制单元用于绘制数据血缘关系图中数据表和字段节点,并根据血缘关系分析结果,关联数据血缘关系图中的节点并绘制箭头指向连线;后端发送单元用于将绘制好的数据血缘关系图发送至用户终端进行可视化显示。
本发明实施例中,数据血缘关系分析系统基于flask、sqlparse、sqllineage以及pinker.js等开发,实现了基于SQL语句的数据血缘关系分析系统,完成了血缘分析结果的可视化展示。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (10)

1.基于SQL的数据血缘关系分析方法,其特征在于,包括以下步骤:
S1、从含有SQL代码的脚本文件中提取得到规则化的SQL语句,完成对SQL语句的清洗;
S2、对规则化的SQL语句进行词法分析,生成抽象语法树,并遍历抽象语法树对SQL语句进行句法解析;
S3、根据抽象语法树对SQL语句进行血缘关系分析,得到血缘关系分析结果;
S4、根据血缘关系分析结果绘制SQL语句的数据血缘关系图,并进行可视化显示。
2.根据权利要求1所述的数据血缘关系分析方法,其特征在于,所述步骤S1包括以下分步骤:
S11、获取含有SQL代码的脚本文件,并寻找SQL代码的标志位;
S12、利用标志位过滤脚本文件中的无关内容,保留得到规则化的SQL代码语句。
3.根据权利要求1所述的数据血缘关系分析方法,其特征在于,所述步骤S2包括以下分步骤:
S21、对规则化的SQL语句进行词法分析,根据语法规则对规则化的SQL语句进行关键词划分,并对每个关键词进行标签标识;
S22、将每个标识后的SQL语句作为一个节点,生成为一棵抽象语法树;
S23、遍历抽象语法树,为每个标签对应的SQL语句赋予句法意义,实现对SQL语句的句法解析。
4.根据权利要求3所述的数据血缘关系分析方法,其特征在于,所述步骤S3包括以下分步骤:
S31、处理抽象语法树中标识出的节点数据,将源数据表和源数据字段作为节点数据的输入集合,将目标数据表和目标数据字段作为节点数据的输出集合;
S32、对节点数据的来源和去向分别进行映射,得到血缘关系分析结果。
5.根据权利要求4所述的数据血缘关系分析方法,其特征在于,所述步骤S4包括以下分步骤:
S41、根据输入集合和输出集合中的节点数据,绘制数据血缘关系图中数据表和字段节点;
S42、根据血缘关系分析结果,关联数据血缘关系图中的节点并绘制箭头指向连线,完成SQL语句的数据血缘关系图的绘制;
S43、将绘制好的数据血缘关系图发送至用户终端进行可视化显示。
6.基于SQL的数据血缘关系分析系统,其特征在于,包括依次连接的数据清洗模块、数据解析模块、血缘分析模块以及可视化模块;
所述数据清洗模块用于从含有SQL代码的脚本文件中提取得到规则化的SQL语句,完成对SQL语句的清洗;
所述数据解析模块用于对规则化的SQL语句进行词法分析,生成抽象语法树,并遍历抽象语法树对SQL语句进行句法解析;
所述血缘分析模块用于根据抽象语法树对SQL语句进行血缘关系分析,得到血缘关系分析结果;
所述可视化模块用于根据血缘关系分析结果绘制SQL语句的数据血缘关系图,并进行可视化显示。
7.根据权利要求6所述的数据血缘关系分析系统,其特征在于,所述数据清洗模块包括相互连接的标记单元和过滤单元;
所述标记单元用于获取含有SQL代码的脚本文件,并寻找SQL代码的标志位;
所述过滤单元用于利用标志位过滤脚本文件中的无关内容,保留得到规则化的SQL代码语句。
8.根据权利要求6所述的数据血缘关系分析系统,其特征在于,所述数据解析模块包括相互连接的词法解析单元和句法解析单元;
所述词法解析单元用于对规则化的SQL语句进行词法分析,根据语法规则对规则化的SQL语句进行关键词划分,并对每个关键词进行标签标识,并将每个标识后的SQL语句作为一个节点,生成为一棵抽象语法树;
所述句法解析单元用于遍历抽象语法树,为每个标签对应的SQL语句赋予句法意义,实现对SQL语句的句法解析。
9.根据权利要求8所述的数据血缘关系分析系统,其特征在于,所述血缘分析模块包括依次连接的节点识别单元和血缘关联单元;
所述节点识别单元用于处理抽象语法树中标识出的节点数据,将源数据表和源数据字段作为节点数据的输入集合,将目标数据表和目标数据字段作为节点数据的输出集合;
所述血缘关联单元用于对节点数据的来源和去向分别进行映射,得到血缘关系分析结果。
10.根据权利要求9所述的数据血缘关系分析系统,其特征在于,所述可视化模块包括相互连接的前端绘制单元和后端发送单元;
所述前端绘制单元用于绘制数据血缘关系图中数据表和字段节点,并根据血缘关系分析结果,关联数据血缘关系图中的节点并绘制箭头指向连线;
所述后端发送单元用于将绘制好的数据血缘关系图发送至用户终端进行可视化显示。
CN202010319878.7A 2020-04-22 2020-04-22 基于sql的数据血缘关系分析方法以及系统 Active CN111538743B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010319878.7A CN111538743B (zh) 2020-04-22 2020-04-22 基于sql的数据血缘关系分析方法以及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010319878.7A CN111538743B (zh) 2020-04-22 2020-04-22 基于sql的数据血缘关系分析方法以及系统

Publications (2)

Publication Number Publication Date
CN111538743A true CN111538743A (zh) 2020-08-14
CN111538743B CN111538743B (zh) 2023-08-18

Family

ID=71979108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010319878.7A Active CN111538743B (zh) 2020-04-22 2020-04-22 基于sql的数据血缘关系分析方法以及系统

Country Status (1)

Country Link
CN (1) CN111538743B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256721A (zh) * 2020-10-21 2021-01-22 平安科技(深圳)有限公司 Sql语句解析方法、系统、计算机设备和存储介质
CN112363713A (zh) * 2020-11-30 2021-02-12 杭州玳数科技有限公司 一种绑定式的sql血缘解析数据流可视化交互方法
CN112434046A (zh) * 2020-12-16 2021-03-02 杭州天均科技有限公司 一种数据血缘分析方法、装置、设备及存储介质
CN112464050A (zh) * 2020-12-11 2021-03-09 中国人寿保险股份有限公司 一种基于python的数据血缘整理方法、装置及电子设备
CN112749186A (zh) * 2021-01-22 2021-05-04 广州虎牙科技有限公司 数据处理方法、装置、电子设备和计算机可读存储介质
CN112765209A (zh) * 2021-02-07 2021-05-07 浪潮云信息技术股份公司 一种数据库间的sql语句语法迁移方法及系统
CN112818015A (zh) * 2021-01-21 2021-05-18 广州汇通国信科技有限公司 基于数据血缘分析的数据追踪方法、系统及存储介质
CN112860585A (zh) * 2021-03-31 2021-05-28 中国工商银行股份有限公司 一种测试脚本断言生成方法及装置
CN112925777A (zh) * 2021-02-25 2021-06-08 吉林亿联银行股份有限公司 一种用于探测hive数据库数据血缘的方法及系统
CN113177057A (zh) * 2021-04-28 2021-07-27 深圳依时货拉拉科技有限公司 一种sql语句语法可视化分析方法、系统及计算机可读存储介质
CN113326401A (zh) * 2021-06-16 2021-08-31 上海哔哩哔哩科技有限公司 字段血缘生成方法及系统
CN113672628A (zh) * 2021-10-22 2021-11-19 中航金网(北京)电子商务有限公司 数据血缘分析方法、终端设备及介质
CN113742368A (zh) * 2021-09-16 2021-12-03 北京航空航天大学 一种数据血缘关系分析方法
WO2022188331A1 (zh) * 2021-03-11 2022-09-15 北京锐安科技有限公司 数据血缘关系展示方法、装置、电子设备及存储介质
CN115291889A (zh) * 2022-09-27 2022-11-04 华控清交信息科技(北京)有限公司 一种数据血缘关系建立方法、装置及电子设备
CN112464050B (zh) * 2020-12-11 2024-05-28 中国人寿保险股份有限公司 一种基于python的数据血缘整理方法、装置及电子设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636478A (zh) * 2015-02-13 2015-05-20 广州神马移动信息科技有限公司 信息查询方法和设备
CN105912595A (zh) * 2016-04-01 2016-08-31 华南理工大学 一种关系数据库的数据起源收集方法
KR101737578B1 (ko) * 2015-11-27 2017-05-18 한국비앤에스시스템 주식회사 자동 생성된 sql 구문에 대한 자동 튜닝 방법 및 장치
CN107644073A (zh) * 2017-09-18 2018-01-30 广东中标数据科技股份有限公司 一种基于深度优先遍历的字段血缘分析方法、系统及装置
CN107797916A (zh) * 2016-11-14 2018-03-13 平安科技(深圳)有限公司 Ddl语句审核方法和装置
CN109325078A (zh) * 2018-09-18 2019-02-12 拉扎斯网络科技(上海)有限公司 基于结构数据的数据血缘确定方法及装置
CN109446279A (zh) * 2018-10-15 2019-03-08 顺丰科技有限公司 基于neo4j大数据血缘关系管理方法、系统、设备及存储介质
CN110232056A (zh) * 2019-05-21 2019-09-13 苏宁云计算有限公司 一种结构化查询语言的血缘解析方法及其工具
CN110245270A (zh) * 2019-05-09 2019-09-17 重庆天蓬网络有限公司 基于图模型的数据血缘关系存储方法、系统、介质和设备
CN110555032A (zh) * 2019-09-09 2019-12-10 北京搜狐新媒体信息技术有限公司 一种基于元数据的数据血缘关系分析方法及系统
CN110908997A (zh) * 2019-10-09 2020-03-24 支付宝(杭州)信息技术有限公司 数据血缘构建方法、装置、服务器及可读存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636478A (zh) * 2015-02-13 2015-05-20 广州神马移动信息科技有限公司 信息查询方法和设备
KR101737578B1 (ko) * 2015-11-27 2017-05-18 한국비앤에스시스템 주식회사 자동 생성된 sql 구문에 대한 자동 튜닝 방법 및 장치
CN105912595A (zh) * 2016-04-01 2016-08-31 华南理工大学 一种关系数据库的数据起源收集方法
CN107797916A (zh) * 2016-11-14 2018-03-13 平安科技(深圳)有限公司 Ddl语句审核方法和装置
CN107644073A (zh) * 2017-09-18 2018-01-30 广东中标数据科技股份有限公司 一种基于深度优先遍历的字段血缘分析方法、系统及装置
CN109325078A (zh) * 2018-09-18 2019-02-12 拉扎斯网络科技(上海)有限公司 基于结构数据的数据血缘确定方法及装置
CN109446279A (zh) * 2018-10-15 2019-03-08 顺丰科技有限公司 基于neo4j大数据血缘关系管理方法、系统、设备及存储介质
CN110245270A (zh) * 2019-05-09 2019-09-17 重庆天蓬网络有限公司 基于图模型的数据血缘关系存储方法、系统、介质和设备
CN110232056A (zh) * 2019-05-21 2019-09-13 苏宁云计算有限公司 一种结构化查询语言的血缘解析方法及其工具
CN110555032A (zh) * 2019-09-09 2019-12-10 北京搜狐新媒体信息技术有限公司 一种基于元数据的数据血缘关系分析方法及系统
CN110908997A (zh) * 2019-10-09 2020-03-24 支付宝(杭州)信息技术有限公司 数据血缘构建方法、装置、服务器及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡晓东;: "分布式顺序表类SQL技术的实现和优化", 现代电子技术, no. 15 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021179722A1 (zh) * 2020-10-21 2021-09-16 平安科技(深圳)有限公司 Sql语句解析方法、系统、计算机设备和存储介质
CN112256721A (zh) * 2020-10-21 2021-01-22 平安科技(深圳)有限公司 Sql语句解析方法、系统、计算机设备和存储介质
CN112256721B (zh) * 2020-10-21 2021-08-17 平安科技(深圳)有限公司 Sql语句解析方法、系统、计算机设备和存储介质
CN112363713A (zh) * 2020-11-30 2021-02-12 杭州玳数科技有限公司 一种绑定式的sql血缘解析数据流可视化交互方法
CN112464050A (zh) * 2020-12-11 2021-03-09 中国人寿保险股份有限公司 一种基于python的数据血缘整理方法、装置及电子设备
CN112464050B (zh) * 2020-12-11 2024-05-28 中国人寿保险股份有限公司 一种基于python的数据血缘整理方法、装置及电子设备
CN112434046A (zh) * 2020-12-16 2021-03-02 杭州天均科技有限公司 一种数据血缘分析方法、装置、设备及存储介质
CN112434046B (zh) * 2020-12-16 2021-09-17 杭州天均科技有限公司 一种数据血缘分析方法、装置、设备及存储介质
CN112818015A (zh) * 2021-01-21 2021-05-18 广州汇通国信科技有限公司 基于数据血缘分析的数据追踪方法、系统及存储介质
CN112749186A (zh) * 2021-01-22 2021-05-04 广州虎牙科技有限公司 数据处理方法、装置、电子设备和计算机可读存储介质
CN112749186B (zh) * 2021-01-22 2024-02-09 广州虎牙科技有限公司 数据处理方法、装置、电子设备和计算机可读存储介质
CN112765209A (zh) * 2021-02-07 2021-05-07 浪潮云信息技术股份公司 一种数据库间的sql语句语法迁移方法及系统
CN112925777A (zh) * 2021-02-25 2021-06-08 吉林亿联银行股份有限公司 一种用于探测hive数据库数据血缘的方法及系统
WO2022188331A1 (zh) * 2021-03-11 2022-09-15 北京锐安科技有限公司 数据血缘关系展示方法、装置、电子设备及存储介质
CN112860585B (zh) * 2021-03-31 2024-01-26 中国工商银行股份有限公司 一种测试脚本断言生成方法及装置
CN112860585A (zh) * 2021-03-31 2021-05-28 中国工商银行股份有限公司 一种测试脚本断言生成方法及装置
CN113177057A (zh) * 2021-04-28 2021-07-27 深圳依时货拉拉科技有限公司 一种sql语句语法可视化分析方法、系统及计算机可读存储介质
CN113326401A (zh) * 2021-06-16 2021-08-31 上海哔哩哔哩科技有限公司 字段血缘生成方法及系统
CN113326401B (zh) * 2021-06-16 2023-01-20 上海哔哩哔哩科技有限公司 字段血缘生成方法及系统
CN113742368A (zh) * 2021-09-16 2021-12-03 北京航空航天大学 一种数据血缘关系分析方法
CN113672628A (zh) * 2021-10-22 2021-11-19 中航金网(北京)电子商务有限公司 数据血缘分析方法、终端设备及介质
CN115291889A (zh) * 2022-09-27 2022-11-04 华控清交信息科技(北京)有限公司 一种数据血缘关系建立方法、装置及电子设备

Also Published As

Publication number Publication date
CN111538743B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
CN111538743B (zh) 基于sql的数据血缘关系分析方法以及系统
US10545998B2 (en) Syntactic tagging in a domain-specific context
CA2484009C (en) Managing expressions in a database system
US7487174B2 (en) Method for storing text annotations with associated type information in a structured data store
CN103425740B (zh) 一种面向物联网的基于语义聚类的物资信息检索方法
CN110674229A (zh) 一种基于ast的关系型数据库sql表关系分析及展现方法
CN111078729B (zh) 医疗数据溯源方法、装置、系统、存储介质以及电子设备
CN114328471B (zh) 一种基于数据虚拟化引擎的数据模型及其构建方法
US8635242B2 (en) Processing queries on hierarchical markup data using shared hierarchical markup trees
CN104346331A (zh) Xml数据库的检索方法及系统
CN114201616A (zh) 一种基于多源数据库的知识图谱构建方法及系统
CN107368500B (zh) 数据抽取方法及系统
KR20130064160A (ko) Rdf 데이터에 대한 sparql 질의 결과의 개체 관계 변형 시스템 및 그 방법
CN117076742A (zh) 数据血缘追踪方法、装置及电子设备
CN110717025B (zh) 一种问答方法、装置、电子设备及存储介质
CN111625655A (zh) 基于知识图谱的归并以及分类方法、装置以及存储介质
CN116467433A (zh) 面向多源数据的知识图谱可视化方法、装置、设备及介质
CN113792067B (zh) 一种基于递归算法的sql自动生成系统与方法
CN115456413A (zh) 人员与岗位的匹配方法、装置、设备及存储介质
CN113312517A (zh) 基金知识图谱获取方法、装置和电子设备
CN112286916A (zh) 一种数据处理方法、装置、设备及存储介质
CN109657010A (zh) 文档处理方法、装置和存储介质
CN116126873B (zh) 基于非标数据表的数据汇总方法、装置及存储介质
CN118113882A (zh) 知识图谱处理方法、装置、设备及存储介质
CN116304207A (zh) 一种基于图数据库的数据关联方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant