CN105912595B - 一种关系数据库的数据起源收集方法 - Google Patents

一种关系数据库的数据起源收集方法 Download PDF

Info

Publication number
CN105912595B
CN105912595B CN201610206169.1A CN201610206169A CN105912595B CN 105912595 B CN105912595 B CN 105912595B CN 201610206169 A CN201610206169 A CN 201610206169A CN 105912595 B CN105912595 B CN 105912595B
Authority
CN
China
Prior art keywords
data
operator
projection
origin
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610206169.1A
Other languages
English (en)
Other versions
CN105912595A (zh
Inventor
汤德佑
周忠
林悦邦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201610206169.1A priority Critical patent/CN105912595B/zh
Publication of CN105912595A publication Critical patent/CN105912595A/zh
Application granted granted Critical
Publication of CN105912595B publication Critical patent/CN105912595B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公布了一种关系数据库数据起源收集方法,包括:根据SQL数据流起源语义定义数据起源模型;解析SQL语句,生成抽象语法树;遍历抽象语法树,提取出来源表、目标表、逻辑操作算子;根据数据起源模型对所述来源表、目标表、逻辑操作算子进行结构化描述,生成起源信息元数据。本发明可以将SQL脚本中的数据处理逻辑通过数据转换图和属性映射图进行描述,从而为关系数据库系统提供数据起源分析功能和字段影响分析功能,不仅可以实现数据脚本的解析,并且可以根据解析信息实现数据追溯及分析数据之间的影响关系。

Description

一种关系数据库的数据起源收集方法
技术领域
本发明涉及数据管理技术领域,尤其涉及一种关系数据库的数据起源收集方法。
背景技术
随着信息化社会的发展,数据的存储能力和规模都在持续增长,越来越多的信息被数据化。在面对海量数据时,识别数据来源和评价数据质量变得十分困难,数据的来源及鉴别方法对数据管理提出了一个巨大的挑战,因此对于数据起源问题的研究应运而生。
数据起源是指数据的来源及其生命周期中的处理历史。传统的关系型数据库管理系统主要提供高效的查询、插入、删除以及更新等方法,没有解决数据起源问题,因而无法得到查询结果的来源。用户在分析数据库中的查询结果时,有时需要对关键数据或有疑问数据进行跟踪,查询产生它的原始来源表以及作用在该来源表的数据处理过程,而现有的数据库系统无法提供这一功能。
关系数据库中的数据起源分析是建立在数据库元数据的基础之上,在数据来源方面,数据起源需要记录目标数据表的来源表集合。在数据处理方面,数据起源需要记录来源表到目标数据表的转换过程,同时还需要记录目标数据表与来源数据表的字段映射关系。
数据起源问题普遍存在于数据管理和数据集成领域中,借助于数据起源技术,可以追踪数据的来源和演化过程,评价数据的质量和可靠性。
发明内容
本发明要解决的技术问题在于,提供一种关系数据库的数据起源收集方法,不仅可以实现数据脚本的解析,并且可以根据解析信息实现数据追溯及分析数据之间的相互影响关系。
为解决上述技术问题,本发明提供如下技术方案:一种关系数据库的数据起源收集方法,包括以下步骤:
S1.根据SQL数据流起源语义定义数据起源模型;
S2.解析接收到的SQL语句,生成抽象语法树;
S3.遍历所述抽象语法树,提取出来源表、目标表、逻辑操作算子;
S4.根据所述数据起源模型对所述来源表、目标表、逻辑操作算子进行结构化描述,生成起源信息元数据。
进一步地,所述SQL数据流起源语义,包括:用于描述目标表的来源与经历的转换过程的表级数据起源语义、用于描述目标字段的来源字段与经历的字段投影过程的字段级数据起源语义;
所述表级数据起源语义,包括:目标表的来源表集合、来源表到目标表的转换关系;
所述字段级数据起源语义,包括:目标字段的来源字段集合、来源字段到目标字段的属性映射关系。
进一步地,所述步骤S2具体为:
接收SQL语句;
对所述SQL语句进行词法分析,生成单词序列;
对所述单词序列进行语法分析,生成抽象语法树。
进一步地,所述步骤S3具体为:
根据所述抽象语法树的根节点描述信息,获得所述SQL语句的句型;
根据所述SQL语句的句型,递归遍历所述抽象语法树根节点的各个子节点,在每个子节点处采集相应的节点数据;
将所述节点数据与数据库元数据进行关联,获得节点元数据,包括所述SQL语句中包含的来源表、目标表以及至少一个逻辑操作算子。
进一步地,所述逻辑操作算子包括:选择操作算子、投影操作算子、连接操作算子、分组操作算子、排序操作算子、交并差集合操作算子、重命名操作算子。
进一步地,所述步骤S4中的数据起源模型包括:用于描述表级数据转换过程的数据转换图与用于描述字段映射过程的属性映射图;
所述数据转换图描述包括两个类:表节点类和关系代数操作类;其中,所述关系代数操作类包含七个子类:选择操作子类、投影操作子类、连接操作子类、分组操作子类、排序操作子类、交并差集合操作子类、重命名操作子类;
所述属性映射图描述包括两个类:字段节点类与投影节点类。
进一步地,所述数据转换图具体的使用方式为:
(1)使用所述数据转换图中的表节点类对所述来源表和目标表进行结构化描述,分别生成来源表节点对象和目标表节点对象;
(2)使用所述数据转换图中的关系代数操作子类对所述逻辑操作算子进行结构化描述,对每一个逻辑操作算子生成一个关系代数操作对象;
(3)分析所述关系代数操作对象,对其中的投影操作对象、交并差集合操作对象和重命名操作对象细化为至少一个字段节点对象和投影节点对象。
进一步地,所述使用方式(2)包括:
将所述投影操作算子使用数据转换图中的投影操作子类进行结构化描述,生成投影操作对象;
当所述逻辑操作算子中存在所述连接操作算子时,使用所述数据转换图中的连接操作子类进行结构化描述,生成连接操作对象;
当所述逻辑操作算子中存在所述选择操作算子时,使用所述数据转换图中的选择操作子类进行结构化描述,生成选择操作对象;
当所述逻辑操作算子中存在所述分组操作算子时,使用所述数据转换图中的分组操作子类进行结构化描述,生成分组操作对象;
当所述逻辑操作算子中存在所述排序操作算子时,使用所述数据转换图中的排序操作子类进行结构化描述,生成排序操作对象。
进一步地,所述连接操作对象根据连接操作对象属性标记连接操作类型,所述连接操作类型包括:笛卡尔连接、内连接、左外连接、右外连接、全外连接,分别对应地描述所述连接操作算子为笛卡尔连接操作、内连接操作、左外连接操作、右外连接操作、全外连接操作。
进一步地,所述使用方式(3)包括:
将所述投影列表中的每一个投影字段分别生成一个字段节点对象和投影节点对象,投影字段表达式作为投影节点对象中的表达式;当所述投影操作对象的投影操作列表中存在嵌套子查询时,投影表达式所对应字段节点对象的输入为所嵌套的下一层查询子句所对应的所有字段节点对象的输出。
采用上述技术方案后,本发明至少具有如下有益效果:本发明的一种关系数据库的数据起源收集方法,根据SQL数据流起源语义定义数据起源模型,可以将SQL脚本中的数据处理逻辑通过数据转换图和属性映射图进行描述,从而为关系数据库系统提供数据起源分析功能和字段影响分析功能,不仅可以实现数据脚本的解析,并且可以根据解析信息实现数据追溯及分析数据之间的影响关系,借此可以帮助IT相关人员及时、准确地掌握数据模型的内容及数据关系。
附图说明
图1为本发明所述一种关系数据库的数据起源收集方法的流程图。
图2为图1所述方法中关系数据库数据起源模型各类之间的关联示意图。
图3为图1所述方法中解析SQL语句生成抽象语法树的流程图。
图4为图1所述方法中遍历与提取逻辑操作算子的流程图。
图5为图1所述方法中结构化描述的流程图。
图6为图1所述方法中CREATE_SELECT句型SQL语句生成结构化对象的示意图。
图7为图1所述方法中SELECT_INTO句型SQL语句生成结构化对象的示意图。
图8为图1所述方法中INSERT_SELECT句型SQL语句生成结构化对象的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本申请作进一步详细说明。
图1为根据本发明关系数据库的数据起源收集方法实施例流程图,如图1所示,本实施例包括:
步骤101:根据关系数据库数据起源语义定义数据起源模型。
步骤102:解析接收到的SQL语句,生成抽象语法树。
步骤103:遍历所述抽象语法树,提取出来源表、目标表、逻辑操作算子。
步骤104:根据所述数据起源模型对所述来源表、目标表、逻辑操作算子进行结构化描述,生成起源信息元数据。
在步骤101中,关系数据库数据起源语义用于描述执行SQL命令生成的目标数据的来源以及所经历的转换过程;具体到数据库中就分为两个层次:粗粒度的表级数据起源以及细粒度的字段级数据起源。
表级数据起源用于描述目标表的来源以及经历的转换过程;字段级数据起源用于描述目标字段的来源字段以及字段投影过程。
所述表级数据起源包括两部分:目标表的来源表集合、来源表到目标表的转换关系;所述字段级数据起源包括两部分:目标字段的来源字段集合、来源字段到目标字段的属性映射关系。
为了具体对关系数据库中数据起源进行结构化描述,本发明定义了数据起源模型,该模型包括:用于描述表级数据转换过程的数据转换图模型与用于描述字段映射过程的属性映射图模型。
所述数据起源图模型描述包括两个类:表节点类RelationNode和关系代数操作类RelationOperator;其中,所述关系代数操作类进一步包含七个子类:连接操作子类JoinOperator、交并差集合操作子类SetOperator、选择操作子类SelectOperator、投影操作子类ProjectOperator、分组操作子类GroupByOperator、排序操作子类OrderByOperator以及重命名操作子类RenameOperator。
所述属性映射图模型描述包括两个类:字段节点类ColumnNode与投影节点类MappingNode。
图2展示了关系数据库数据起源模型中各类之间的关系。
表节点类用来描述参与数据转换过程的来源表和目标表,表节点类的属性有表模式名、表名、表的字段个数、各字段名。
关系代数操作类用来描述数据转换过程中的关系代数操作,具体分为七个子类,分别表示关系代数中的连接操作、交并差集合操作、选择操作、投影操作、分组操作、排序操作以及重命名操作;类中的属性有参与关系操作的输入表节点、输出表节点以及其它用来描述关系操作的信息。
连接操作子类JoinOperator中描述关系操作的信息为:表示连接类型的枚举字段。该枚举字段包括:INNER_JOIN(内连接)、CROSS_JOIN(笛卡尔连接)、FULL_OUTER_JOIN(全外连接)、LEFT_OUTER_JOIN(左外连接)、
交并差集合操作子类SetOperator中描述关系操作的信息为:表示集合操作类型的枚举字段。该枚举字段包括:UNION(去重并集合操作)、UNION_ALL(不去重并集合操作)、MINUS(差集合操作)、INTERSECT(交集合操作)。
选择操作子类SelectOperator中描述关系操作的信息为:表示过滤条件的表达式;在本实施例中使用文本字符串的形式存放SQL过滤条件的表达式,即SQL语句中“WHERE”子句对应的部分。例如,针对如下的SQL语句:
SELECT name,age FROM Student WHERE age>13AND score>80;
生成SelectOperator对象中的过滤条件字段内容为“age>13AND score>80”。
投影操作子类ProjectOperator中描述关系操作的信息为:表示目标字段的投影节点对象列表,每个投影节点对象属于投影节点类,包含投影表达式,目标字段以及来源字段,即SQL语句中“SELECT”子句对应的部分。
分组操作子类GroupByOperator中描述关系操作的信息为:表示分组字段的字段名列表,即SQL语句中“Group By”子句对应的部分。
排序操作子类OrderByOperator中描述关系操作的信息为:表示排序字段的字段名列表,即SQL语句中“Order By”子句对应的部分。
每条SQL语句中包含有一至多个关系代数操作,在数据转换图模型中,每个关系代数操作对应于一个关系代数操作对象,通过对关系代数操作对象进行实例化得到。
本领域的技术人员应了解,“类”和“对象”是两个专业术语。在数据转换图模型中定义的是“类”,而在生成元数据时,则是根据这些类实例化成对象。
在步骤102中,需要对接收到的SQL语句进行解析。图3展示了解析SQL语句生成抽象语法树的过程,包括:
步骤1021:接收SQL语句。
步骤1022:对所述SQL语句进行词法分析,生成单词序列。
步骤1023:对所述单词序列进行语法分析,生成抽象语法树。
在解析SQL语句时,首先需要定义相关的SQL词法和语法规则,并使用flex和yacc识别词法和语法规则,生成相应的词法扫描器和语法分析器,从而对SQL语句进行解析,生成抽象语法树。
在步骤103中,遍历所述抽象语法树,提取出来源表、目标表、逻辑操作算子。图4展示了遍历与提取逻辑操作算子过程,包括以下步骤:
步骤1031:根据所述抽象语法树的根节点描述信息,获得所述SQL语句的句型。
步骤1032:根据所述SQL语句的句型,递归遍历所述抽象语法树根节点的各个子节点,在每个子节点处采集相应的节点数据。
步骤1033:将所述节点数据与数据库元数据进行关联,获得节点元数据,包括所述SQL语句中包含的来源表、目标表以及一至多个逻辑操作算子。
在步骤1031中,根据抽象语法树根节点描述信息识别所对应的SQL语句的句型,本发明分析涉及数据起源语义的SQL句型包括如下:
句型1:CREATE_SELECT句型,包括如下语法:
CREATE TABLE…AS SELECT…FROM…WHERE…;
CREATE VIEW…AS SELECT…FROM…WHERE…;
句型2:SELECT_INTO句型,包括如下语法:
SELECT…INTO…FROM…WHERE…;
句型3:INSERT_SELECT句型,包括如下语法:
INSERT INTO…SELECT…FROM…WHERE…;
以及其它句型,如ALTER命令、重命名操作、存储过程等。
在步骤1032中,节点数据包括:当前节点关键字、表名、字段名、过滤条件、函数、表达式信息。
在步骤1033中,逻辑操作算子包括:选择操作算子、投影操作算子、连接操作算子、分组操作算子、排序操作算子、交并差集合操作算子、重命名操作算子。
逻辑操作算子表示SQL中的关系代数操作,获得这些信息后就可以使用已建立的数据起源模型中的类对这些来源表、目标表以及逻辑操作算子进行结构化描述。
在CREATE_SELECT句型的SQL语句中,数据处理的目标表是CREATE子句所创建的数据库表或者视图,数据转换处理的逻辑在SELECT语句中,包含相应的逻辑操作算子。
在SELECT_INTO和INSERT_SELECT句型的SQL语句中,数据处理的目标是INTO子句所插入的数据库表,数据转换处理的逻辑在SELECT语句中,包含相
以下面的SQL语句为例说明步骤103中的具体过程:
CREATE TABLE tc(c1,c2,c3)AS
SELECT a1,a2+b1,a3*b2FROM ta,tb WHERE ta.a1>10and ta.a1=tb.b2;
该语句为CREATE_SELECT类型,生成的抽象语法树根节点表示了目标表信息,目标表表名为tc,各字段分别为c1、c2、c3;之后是抽象语法树的各个子节点,其中SELECT子句对应的子节点包含投影操作算子,各投影字段分别为a1、a2+b1、a3*b2;FROM子句对应的子节点包含连接操作算子,为ta表与tb表的笛卡尔积连接;WHERE子句对应的子节点包含选择操作算子,过滤条件表达式为“ta.a1>10and ta.a1=tb.b2”。
在步骤104中,根据所述数据起源模型对所述来源表、目标表、逻辑操作算子进行结构化描述,生成起源信息元数据。图5展示了具体的结构化描述过程,包括以下步骤:
步骤1041:使用所述数据转换图中的表节点类对所述来源表和目标表进行结构化描述,分别生成来源表节点对象和目标表节点对象。
步骤1042:使用所述数据转换图中的关系代数操作子类对逻辑操作算子进行结构化描述,对每一个逻辑操作算子生成一个关系代数操作对象。
步骤1043:分析所述关系代数操作对象,对其中的投影操作对象、交并差集合操作对象和重命名操作对象细化为一至多个字段节点对象和投影节点对象。
在步骤1042中,使用数据转换图中的关系代数操作子类对逻辑操作算子进行结构化描述,每一个逻辑操作算子生成一个对应的关系代数操作对象包括:
当所述逻辑操作算子中存在连接操作算子时,使用数据转换图中的连接操作子类进行结构化描述,生成连接操作对象。
当所述逻辑操作算子中存在选择操作算子时,使用数据转换图中的选择操作子类进行结构化描述,生成选择操作对象。
当所述逻辑操作算子中存在分组操作算子时,使用数据转换图中的分组操作子类进行结构化描述,生成分组操作对象。
当所述逻辑操作算子中存在排序操作算子时,使用数据转换图中的排序操作子类进行结构化描述,生成排序操作对象。
对于SQL语句中的关系操作,其执行顺序会因数据库底层不同的优化策略而不同,因此按照连接、选择、分组、投影、集合和排序操作算子这样的顺序排列关系操作。
图6到图8分别展示了CREATE_SELECT句型、SELECT_INTO句型和INSERT_SELECT句型中逻辑操作算子生成的关系操作对象的关联结构。
在步骤1043中,分析所述关系代数操作对象,对其中的投影操作对象、交并差集合操作对象和重命名操作对象细化为一至多个字段节点对象和投影节点对象包括:
将所述投影列表中的每一个投影字段分别生成一个字段节点对象和投影节点对象,投影字段表达式作为投影节点对象中的表达式。
当所述投影操作对象的投影操作列表中存在嵌套子查询时,投影表达式所对应字段节点对象的输入为所嵌套的下一层查询子句所对应的所有字段节点对象的输出。
由上述可见,本发明的关系数据库的数据起源收集方法,根据SQL数据流起源语义定义数据起源模型,可以将SQL脚本中的数据处理逻辑通过数据转换图和属性映射图进行描述,从而为关系数据库系统提供数据起源分析功能和字段影响分析功能,不仅可以实现数据脚本的解析,并且可以提供根据解析信息实现数据追溯及分析数据之间影响关系,借此可以帮助IT相关人员及时、准确地掌握数据模型的内容及数据关系。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解的是,在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种等效的变化、修改、替换和变型,本发明的范围由所附权利要求及其等同范围限定。

Claims (6)

1.一种关系数据库的数据起源收集方法,其特征在于,包括以下步骤:
S1.根据SQL数据流起源语义定义数据起源模型;
S2.解析接收到的SQL语句,生成抽象语法树;
S3.遍历所述抽象语法树,提取出来源表、目标表、逻辑操作算子;
S4.根据所述数据起源模型对所述来源表、目标表、逻辑操作算子进行结构化描述,生成起源信息元数据;
所述SQL数据流起源语义,包括:用于描述目标表的来源与经历的转换过程的表级数据起源语义、用于描述目标字段的来源字段与经历的字段投影过程的字段级数据起源语义;
所述表级数据起源语义,包括:目标表的来源表集合、来源表到目标表的转换关系;
所述字段级数据起源语义,包括:目标字段的来源字段集合、来源字段到目标字段的属性映射关系;
所述步骤S2具体为:
接收SQL语句;
对所述SQL语句进行词法分析,生成单词序列;
对所述单词序列进行语法分析,生成抽象语法树;
所述步骤S3具体为:
根据所述抽象语法树的根节点描述信息,获得所述SQL语句的句型;
根据所述SQL语句的句型,递归遍历所述抽象语法树根节点的各个子节点,在每个子节点处采集相应的节点数据;
将所述节点数据与数据库元数据进行关联,获得节点元数据,包括所述SQL语句中包含的来源表、目标表以及至少一个逻辑操作算子;
所述步骤S4中的数据起源模型包括:用于描述表级数据转换过程的数据转换图与用于描述字段映射过程的属性映射图;
所述数据转换图描述包括两个类:表节点类和关系代数操作类;其中,所述关系代数操作类包含七个子类:选择操作子类、投影操作子类、连接操作子类、分组操作子类、排序操作子类、交并差集合操作子类、重命名操作子类;
所述属性映射图描述包括两个类:字段节点类与投影节点类。
2.根据权利要求1所述的一种关系数据库的数据起源收集方法,其特征在于,所述逻辑操作算子包括:选择操作算子、投影操作算子、连接操作算子、分组操作算子、排序操作算子、交并差集合操作算子、重命名操作算子。
3.根据权利要求1所述的一种关系数据库的数据起源收集方法,其特征在于,所述数据转换图具体的使用方式为:
(1)使用所述数据转换图中的表节点类对所述来源表和目标表进行结构化描述,分别生成来源表节点对象和目标表节点对象;
(2)使用所述数据转换图中的关系代数操作子类对所述逻辑操作算子进行结构化描述,对每一个逻辑操作算子生成一个关系代数操作对象;
(3)分析所述关系代数操作对象,对其中的投影操作对象、交并差集合操作对象和重命名操作对象细化为至少一个字段节点对象和投影节点对象。
4.根据权利要求3所述的一种关系数据库的数据起源收集方法,其特征在于,所述使用方式(2)包括:
将所述投影操作算子使用数据转换图中的投影操作子类进行结构化描述,生成投影操作对象;
当所述逻辑操作算子中存在所述连接操作算子时,使用所述数据转换图中的连接操作子类进行结构化描述,生成连接操作对象;
当所述逻辑操作算子中存在所述选择操作算子时,使用所述数据转换图中的选择操作子类进行结构化描述,生成选择操作对象;
当所述逻辑操作算子中存在所述分组操作算子时,使用所述数据转换图中的分组操作子类进行结构化描述,生成分组操作对象;
当所述逻辑操作算子中存在所述排序操作算子时,使用所述数据转换图中的排序操作子类进行结构化描述,生成排序操作对象。
5.根据权利要求4所述的一种关系数据库的数据起源收集方法,其特征在于,所述连接操作对象根据连接操作对象属性标记连接操作类型,所述连接操作类型包括:笛卡尔连接、内连接、左外连接、右外连接、全外连接,分别对应地描述所述连接操作算子为笛卡尔连接操作、内连接操作、左外连接操作、右外连接操作、全外连接操作。
6.根据权利要求3所述的一种关系数据库的数据起源收集方法,其特征在于,所述使用方式(3)包括:
将所述投影列表中的每一个投影字段分别生成一个字段节点对象和投影节点对象,投影字段表达式作为投影节点对象中的表达式;
当所述投影操作对象的投影操作列表中存在嵌套子查询时,投影表达式所对应字段节点对象的输入为所嵌套的下一层查询子句所对应的所有字段节点对象的输出。
CN201610206169.1A 2016-04-01 2016-04-01 一种关系数据库的数据起源收集方法 Active CN105912595B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610206169.1A CN105912595B (zh) 2016-04-01 2016-04-01 一种关系数据库的数据起源收集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610206169.1A CN105912595B (zh) 2016-04-01 2016-04-01 一种关系数据库的数据起源收集方法

Publications (2)

Publication Number Publication Date
CN105912595A CN105912595A (zh) 2016-08-31
CN105912595B true CN105912595B (zh) 2019-03-05

Family

ID=56745475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610206169.1A Active CN105912595B (zh) 2016-04-01 2016-04-01 一种关系数据库的数据起源收集方法

Country Status (1)

Country Link
CN (1) CN105912595B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108241622B (zh) * 2016-12-23 2022-07-05 北京国双科技有限公司 一种查询脚本的生成方法及装置
CN106802931B (zh) * 2016-12-28 2020-06-09 深圳市华傲数据技术有限公司 基于影响分析进行数据表查找的方法及装置
CN107203640B (zh) * 2017-06-14 2019-12-31 成都四方伟业软件股份有限公司 通过数据库运行记录建立物理模型的方法及系统
CN107729349B (zh) * 2017-08-25 2022-06-07 昆仑智汇数据科技(北京)有限公司 一种基于元数据的特征数据集自动生成方法及装置
CN107644073A (zh) * 2017-09-18 2018-01-30 广东中标数据科技股份有限公司 一种基于深度优先遍历的字段血缘分析方法、系统及装置
CN110019116B (zh) * 2017-09-26 2023-07-07 南京中兴新软件有限责任公司 数据追溯方法、装置、数据处理设备及计算机存储介质
CN107862023B (zh) * 2017-10-31 2021-12-24 四川巧夺天工信息安全智能设备有限公司 一种解析edb数据库源文件中数据的方法
CN110147396B (zh) * 2017-11-08 2021-08-31 中移(苏州)软件技术有限公司 一种映射关系生成方法及装置
CN109901984A (zh) * 2017-12-08 2019-06-18 北京京东尚科信息技术有限公司 生成大数据测试用例的方法和装置
CN110457378A (zh) * 2018-05-08 2019-11-15 华为技术有限公司 一种数据处理的方法和设备
CN110019315A (zh) * 2018-06-19 2019-07-16 杭州数澜科技有限公司 一种用于数据血缘解析的方法和装置
CN109325078A (zh) * 2018-09-18 2019-02-12 拉扎斯网络科技(上海)有限公司 基于结构数据的数据血缘确定方法及装置
CN109857818B (zh) * 2019-02-03 2021-09-14 北京字节跳动网络技术有限公司 确定生产关系的方法、装置、存储介质及电子设备
CN110232056B (zh) * 2019-05-21 2022-02-25 苏宁云计算有限公司 一种结构化查询语言的血缘解析方法及其工具
CN110134671B (zh) * 2019-05-21 2020-09-01 北京物资学院 一种面向溯源应用的区块链数据库数据管理系统及方法
CN110516081A (zh) * 2019-09-02 2019-11-29 北京明略软件系统有限公司 数据表映射关系的显示方法及装置
CN110795455B (zh) * 2019-09-06 2023-11-21 中国平安财产保险股份有限公司 依赖关系解析方法、电子装置、计算机设备及可读存储介质
CN111538743B (zh) * 2020-04-22 2023-08-18 电子科技大学 基于sql的数据血缘关系分析方法以及系统
CN113760891A (zh) * 2020-12-02 2021-12-07 北京沃东天骏信息技术有限公司 一种数据表的生成方法、装置、设备和存储介质
CN112527815A (zh) * 2020-12-02 2021-03-19 平安医疗健康管理股份有限公司 数据库的脚本迁移方法、装置、计算机设备和存储介质
CN112541004A (zh) * 2020-12-25 2021-03-23 华南理工大学 数据库的自动处理方法及装置
CN114003231B (zh) * 2021-09-28 2022-07-26 厦门国际银行股份有限公司 一种sql语法解析树优化方法及系统
CN117331933B (zh) * 2023-09-11 2024-02-23 安徽省大数据中心 基于多源异构统一纳管的安全运营方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117302B (zh) * 2009-12-31 2013-01-23 南京理工大学 传感器数据流复杂查询结果的数据起源跟踪方法
CN103823885A (zh) * 2014-03-07 2014-05-28 河海大学 基于数据起源依赖关系分析模型的数据依赖分析方法
CN104239581A (zh) * 2014-10-13 2014-12-24 河海大学 一种面向数据库系统的复制数据起源追踪方法

Also Published As

Publication number Publication date
CN105912595A (zh) 2016-08-31

Similar Documents

Publication Publication Date Title
CN105912595B (zh) 一种关系数据库的数据起源收集方法
CN107122443B (zh) 一种基于Spark SQL的分布式全文检索系统及方法
CN110134671B (zh) 一种面向溯源应用的区块链数据库数据管理系统及方法
Fahrner et al. A survey of database design transformations based on the entity-relationship model
CN104965735B (zh) 用于生成升级sql脚本的装置
CN107644073A (zh) 一种基于深度优先遍历的字段血缘分析方法、系统及装置
Pardillo et al. Using ontologies for the design of data warehouses
Unbehauen et al. Knowledge extraction from structured sources
CN105095319A (zh) 基于时间序列化的文档的标识、关联、搜索及展现的系统
Rivero et al. Generating SPARQL executable mappings to integrate ontologies
CN101493820A (zh) 一种药监行业知识库的平台及其构建方法
CN103176963A (zh) 基于crf++汉语句义结构模型自动标注方法
CN109799990A (zh) 源代码注释自动生成方法及系统
Brunel et al. Supporting hierarchical data in SAP HANA
CN107818181A (zh) 基于Plcient交互式引擎的索引方法及其系统
Tissot et al. Exploring logical and hierarchical information to map relational databases into ontologies
Berkani et al. Generic methodology for semantic data warehouse design: From schema definition to etl
Meurice et al. Establishing referential integrity in legacy information systems-reality bites!
Taniar et al. Integrations of Data Warehousing, Data Mining and Database Technologies: Innovative Approaches
CN113221528B (zh) 基于openEHR模型的临床数据质量评估规则的自动生成与执行方法
CN110297829A (zh) 一种面向特定行业结构化业务数据的全文检索方法及系统
Taktak et al. Toward propagating the evolution of data warehouse on data marts
Vargas-Vera et al. State of the art on ontology alignment
CN107766545A (zh) 一种科技数据的管理方法及装置
Brdjanin et al. On suitability of standard UML notation for relational database schema representation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant