CN108038248B - Etl依赖自动识别方法与系统 - Google Patents

Etl依赖自动识别方法与系统 Download PDF

Info

Publication number
CN108038248B
CN108038248B CN201711464696.3A CN201711464696A CN108038248B CN 108038248 B CN108038248 B CN 108038248B CN 201711464696 A CN201711464696 A CN 201711464696A CN 108038248 B CN108038248 B CN 108038248B
Authority
CN
China
Prior art keywords
etl
data object
module
task number
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711464696.3A
Other languages
English (en)
Other versions
CN108038248A (zh
Inventor
陆俭彪
郑浩华
巩祥平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Computer Technology Shanghai Co Ltd
Original Assignee
Ctrip Computer Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Computer Technology Shanghai Co Ltd filed Critical Ctrip Computer Technology Shanghai Co Ltd
Priority to CN201711464696.3A priority Critical patent/CN108038248B/zh
Publication of CN108038248A publication Critical patent/CN108038248A/zh
Application granted granted Critical
Publication of CN108038248B publication Critical patent/CN108038248B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Character Discrimination (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种ETL依赖自动识别方法与系统。其中ETL依赖自动识别方法与系统包括:S1、获取所有ETL任务中的标记语言,并将标记语言保存至标记语言库,其中标记语言包括数据对象ID和标记任务号;S2、根据ETL任务获取数据对象,数据对象包括当前数据对象ID;S3、判断数据对象是否为当前创建的临时表;若否,则转至步骤S4;S4、判断标记语言库是否包括当前数据对象ID;若是,则转至步骤S5;S5、根据标记任务号生成依赖任务号。本发明在程序编写完成之后,可以自动识别ETL任务中的依赖任务号并对数据对象的依赖任务号进行自动配置,减少了作业平台开发中的人为参与,进而提高了任务配置的效率以及准确性。

Description

ETL依赖自动识别方法与系统
技术领域
本发明涉及计算机技术领域,特别涉及一种ETL(extract-transform-load,抽取、转换、加载)依赖自动识别方法与系统。
背景技术
当前在作业平台上开发任务时,配置任务依赖的步骤通常包括:人为地识别出所有的输入表,再人为地辨别每个输入表是否需要依赖,并在需要依赖的情况下辨别是否需要改变输入表的当前依赖。如此,大量的人为操作增加了ETL任务开发的复杂度,同时大量的人为操作也容易发生依赖错误(诸如缺失依赖或者多余依赖)的情况,进而导致最终产出的结果发生错误。
发明内容
本发明要解决的技术问题是为了克服现有技术中人为配置任务依赖的缺陷,提供一种ETL依赖自动识别方法与系统。
本发明是通过下述技术方案来解决上述技术问题:
一种ETL依赖自动识别方法,其特点在于,包括:
S1、获取所有ETL任务中的标记语言,并将所述标记语言保存至标记语言库,其中所述标记语言包括数据对象ID和标记任务号;
S2、根据ETL任务获取数据对象,所述数据对象包括当前数据对象ID;
S3、判断所述数据对象是否为当前创建的临时表;
若否,则转至步骤S4;
S4、判断所述标记语言库是否包括所述当前数据对象ID;
若是,则转至步骤S5;
S5、根据所述标记任务号生成依赖任务号。
优选地,步骤S1具体包括:
S11、询问ETL任务;
S12、判断所述ETL任务是否包括标记语言;
若是,则转至步骤S13;
S13、判断所述标记语言是否包括数据对象ID和标记任务号;
若是,则转至步骤S14;
S14、将所述标记语言保存至标记语言库;和/或
步骤S2具体包括:
S21、解析ETL任务获取语法树;
S22、解析所述语法树获取数据对象。
优选地,所述数据对象还包括当前任务号,所述ETL依赖自动识别方法还包括:
S6、判断所述标记任务号是否与所述当前任务号相同;
若否,则转至步骤S7;
S7、将所述当前任务号保存至错误依赖表。
优选地,步骤S7具体包括:
S71、根据所述标记任务号和所述当前任务号判断发生的是多余依赖还是缺失依赖;
若是多余依赖,则转至步骤S72;若是缺失依赖,则转至步骤S73;
S72、将所述当前任务号保存至多余依赖表;
S73、将所述当前任务号保存至缺失依赖表。
优选地,所述ETL依赖自动识别方法还包括:
S8、发送错误通知。
一种ETL依赖自动识别系统,其特点在于,包括:
第一获取模块,用于获取所有ETL任务中的标记语言,并将所述标记语言保存至标记语言库,其中所述标记语言包括数据对象ID和标记任务号;
第二获取模块,用于根据ETL任务获取数据对象,所述数据对象包括当前数据对象ID;
第一判断模块,用于判断所述数据对象是否为当前创建的临时表,并在判断为否时调用第二判断模块;
所述第二判断模块,用于判断所述标记语言库是否包括所述当前数据对象ID,并在判断为是时调用生成模块;
所述生成模块,用于根据所述标记任务号生成依赖任务号。
优选地,所述第一获取模块包括:
询问模块,用于询问ETL任务;
第三判断模块,用于判断所述ETL任务是否包括标记语言,并在判断为是时调用第四判断模块;
所述第四判断模块,用于判断所述标记语言是否包括数据对象ID和标记任务号,并在判断为是时调用第一保存模块;
所述第一保存模块,用于将所述标记语言保存至标记语言库;和/或
所述第二获取模块包括:
第一解析模块,用于解析ETL任务获取语法树;
第二解析模块,用于解析所述语法树获取数据对象。
优选地,所述数据对象还包括当前任务号,所述ETL依赖自动识别系统还包括:
第五判断模块,用于判断所述标记任务号是否与所述当前任务号相同,并在判断为否时调用第二保存模块;
所述第二保存模块,用于将所述当前任务号保存至错误依赖表。
优选地,所述第二保存模块包括:
第六判断模块,用于根据所述标记任务号和所述当前任务号判断发生的是多余依赖还是缺失依赖,并在判断发生多余依赖时调用第三保存模块,发生缺失依赖时调用第四保存模块;
所述第三保存模块,用于将所述当前任务号保存至多余依赖表;
所述第四保存模块,用于将所述当前任务号保存至缺失依赖表。
优选地,所述ETL依赖自动识别系统还包括:
通知模块,用于发送错误通知。
本发明的积极进步效果在于:本发明ETL依赖自动识别方法与系统首先获取ETL任务中事先标记的标记语言,再判断ETL任务中的数据对象是否被标记,并在是的情况下根据标记语言生成真正的依赖任务号。减少了作业平台开发中的人为参与,提高了任务配置的效率以及准确率。
附图说明
图1为本发明实施例1的ETL依赖自动识别方法的流程图。
图2为本发明实施例2的ETL依赖自动识别方法的流程图。
图3为本发明实施例3的ETL依赖自动识别方法的流程图。
图4为本发明实施例4的ETL依赖自动识别系统的结构示意图。
图5为本发明实施例5的ETL依赖自动识别系统的结构示意图。
图6为本发明实施例6的ETL依赖自动识别系统的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供了一种ETL依赖自动识别方法,图1示出了本实施例的流程图。如图1所示,本实施例的ETL依赖自动识别方法包括以下步骤:
S101、获取所有ETL任务中的标记语言,并将标记语言保存至标记语言库,其中标记语言包括数据对象ID和标记任务号;
S102、根据ETL任务获取数据对象,数据对象包括当前数据对象ID;
S103、判断数据对象是否为当前创建的临时表;
若否,则转至步骤S104;
S104、判断标记语言库是否包括当前数据对象ID;
若是,则转至步骤S105;
S105、根据标记任务号生成依赖任务号。
具体地,编程人员在编写程序时,通常会在语句、程序段等之后添加标记语言,以对所编写的程序代码进行解释和说明,ETL任务中也包括标记语言,该标记语言包括数据对象ID和标记任务号,用以解释和说明数据对象的真正的任务号。本实施例首先获取所有ETL任务中的标记语言并保存至标记语言库,即获取数据对象ID与标记任务号之间的对应关系并保存,以供后续步骤调用。其次,获取ETL任务的数据对象,该数据对象包括当前数据对象ID,并排除当前创建的临时表,以提高本实施例ETL依赖自动识别方法的准确性。最后,再判断标记语言库中是否包括当前数据对象ID,即判断针对当前数据对象ID是否设有标记任务号,也即判断针对当前数据对象ID是否对其真正的任务号进行解释和说明,若是,则根据标记语言库中当前数据对象ID对应的标记任务号生成依赖任务号,以为当前数据对象配置其真正的任务号;若否,则按照常规方式配置依赖任务号,例如通过人为手动的方式为当前数据对象配置其真正的任务号,又或者某些维表(诸如国家维表)并不需要设置依赖任务号。
本实施例的ETL依赖自动识别方法首先获取ETL任务中预设的对数据对象真正的任务号进行解释和说明的标记语言,再判断ETL任务中的数据对象是否被标记语言所标记,并在是的情况下根据该标记语言生成该数据对象真正的依赖任务号。因此,本实施例的ETL依赖自动识别方法在程序编写完成之后,可以自动识别ETL任务中的依赖任务号并对数据对象的依赖任务号进行自动配置,减少了作业平台开发中的人为参与,进而提高了任务配置的效率以及准确性。
实施例2
本实施例提供的ETL依赖自动识别方法是对实施例1的进一步改进,图2示出了本实施例的流程图。如图2所示,本实施例的ETL依赖自动识别方法较之实施例1,其改进在于:
步骤S101具体包括:
S1011、询问ETL任务;
S1012、判断ETL任务是否包括标记语言;
若是,则转至步骤S1013;
S1013、判断标记语言是否包括数据对象ID和标记任务号;
若是,则转至步骤S1014;
S1014、将标记语言保存至标记语言库。
本实施例进一步细化了获取所有ETL任务中标记语言并保存至标记语言库的步骤S101。在程序编写过程中,标记语言不仅仅只用来解释和说明数据对象及其真正的任务号,因此获取ETL任务中的数据对象ID以及其对应的标记任务号的过程则包括两个判断步骤:其一,判断ETL任务中是否包括标记语言;其二,判断标记语言的内容是否用来解释和说明数据对象及其真正的任务号,即标记语言是否包括数据对象ID和标记任务号,其中,在两个判断皆为是时才能获得ETL任务中包括数据对象ID和标记任务号的标记语言。
此外,本实施例的ETL依赖自动识别方法较之实施例1,其改进还在于:
步骤S102具体包括:
S1021、解析ETL任务获取语法树;
S1022、解析所述语法树获取数据对象。
本实施例进一步细化了根据ETL任务获取数据对象的步骤S102,即通过解析ETL任务以识别数据对象,数据对象的类型包括表和视图。
本实施例的ETL依赖自动识别方法是对实施例1的进一步改进,具体细化了实施例1中的步骤S101和步骤S102,提供了一种更加优选的实施方式。
实施例3
本实施例提供的ETL依赖自动识别方法是对实施例1的进一步改进,图3示出了本实施例的流程图。如图3所示,较之实施例1,本实施例步骤S102中的数据对象还包括当前任务号,本实施例的ETL依赖自动识别方法的还包括:
S106、判断标记任务号是否与当前任务号相同;
若否,则转至步骤S107;
S107、将当前任务号保存至错误依赖表;
S108、发送错误通知。
其中,步骤S107具体包括:
S1071、根据标记任务号和当前任务号判断发生的是多余依赖还是缺失依赖;
若是多余依赖,则转至步骤S1072;若是缺失依赖,则转至步骤S1073;
S1072、将当前任务号保存至多余依赖表;
S1073、将当前任务号保存至缺失依赖表。
具体地,与实施例1提供的ETL依赖自动识别方法相比,本实施例在步骤S105根据标记任务号生成依赖任务号之后,还判断生成的依赖任务号所依据的标记任务号是否与数据对象的当前任务号相同。若相同,则表明事先针对该数据对象配置的当前任务号为该数据对象真正的任务号,未发生错误依赖;若不相同,则表明事先针对该数据对象配置的当前任务号并非该数据对象真正的任务号,发生了错误依赖,在此情况下,进一步根据该数据对象的对应的标记任务号以及当前任务号判断发生的是多余依赖的情形还是缺失依赖的情形,并分别将多余依赖以及缺失依赖对应的当前任务号保存至多余依赖表以及缺失依赖表。最后,发送错误通知以告知相关人员之前存在的错误依赖的情形,例如但不限于通过邮件方式发送错误通知。
本实施例的ETL依赖自动识别方法是对实施例1的进一步改进,改进在于本实施例还包括识别ETL任务中发生的错误依赖(多余依赖以及缺失依赖)的情形,并且本实施例还包括发送错误通知的步骤,提高了本实施例ETL依赖自动识别方法与相关人员的交互性。
实施例4
本实施例提供了一种ETL依赖自动识别系统,图4示出了本实施例的结构示意图。如图4所示,本实施例的ETL依赖自动识别系统1包括:
第一获取模块11,用于获取所有ETL任务中的标记语言,并将标记语言保存至标记语言库,其中标记语言包括数据对象ID和标记任务号;
第二获取模块12,用于根据ETL任务获取数据对象,数据对象包括当前数据对象ID;
第一判断模块13,用于判断数据对象是否为当前创建的临时表,并在判断为否时调用第二判断模块14;
第二判断模块14,用于判断标记语言库是否包括当前数据对象ID,并在判断为是时调用生成模块15;
生成模块15,用于根据标记任务号生成依赖任务号。
具体地,编程人员在编写程序时,通常会在语句、程序段等之后添加标记语言,以对所编写的程序代码进行解释和说明,ETL任务中也包括标记语言,该标记语言包括数据对象ID和标记任务号,用以解释和说明数据对象的真正的任务号。本实施例首先通过第一获取模块11获取所有ETL任务中的标记语言并保存至标记语言库,即获取数据对象ID与标记任务号之间的对应关系并保存,以供后续步骤调用。其次,通过第二获取模块12获取ETL任务的数据对象,该数据对象包括当前数据对象ID,并通过第一判断模块13排除当前创建的临时表,以提高本实施例ETL依赖自动识别系统1的准确性。最后,再通过第二判断模块14判断标记语言库中是否包括当前数据对象ID,即判断针对当前数据对象ID是否设有标记任务号,也即判断针对当前数据对象ID是否对其真正的任务号进行解释和说明,若是,则生成模块15根据标记语言库中当前数据对象ID对应的标记任务号生成依赖任务号,以为当前数据对象配置其真正的任务号;若否,则按照常规方式配置依赖任务号,例如通过人为手动的方式为当前数据对象配置其真正的任务号,又或者某些维表(诸如国家维表)并不需要设置依赖任务号。
本实施例的ETL依赖自动识别系统首先获取ETL任务中预设的对数据对象真正的任务号进行解释和说明的标记语言,再判断ETL任务中的数据对象是否被标记语言所标记,并在是的情况下根据该标记语言生成该数据对象真正的依赖任务号。因此,本实施例的ETL依赖自动识别系统在程序编写完成之后,可以自动识别ETL任务中的依赖任务号并对数据对象的依赖任务号进行自动配置,减少了作业平台开发中的人为参与,进而提高了任务配置的效率以及准确性。
实施例5
本实施例提供的ETL依赖自动识别系统是对实施例4的进一步改进,图5示出了本实施例的结构示意图。如图5所示,本实施例的ETL依赖自动识别系统1较之实施例4,其改进在于:
第一获取模块11具体包括:
询问模块111,用于询问ETL任务;
第三判断模块112,用于判断ETL任务是否包括标记语言,并在判断为是时调用第四判断模块113;
第四判断模块113,用于判断标记语言是否包括数据对象ID和标记任务号,并在判断为是时调用第一保存模块114;
第一保存模块114,用于将标记语言保存至标记语言库。
本实施例进一步细化了第一获取模块11的组成结构。在程序编写过程中,标记语言不仅仅只用来解释和说明数据对象及其真正的任务号,因此获取ETL任务中的数据对象ID以及其对应的标记任务号的过程则包括两个判断步骤:其一,判断ETL任务中是否包括标记语言;其二,判断标记语言的内容是否用来解释和说明数据对象及其真正的任务号,即标记语言是否包括数据对象ID和标记任务号,其中,在两个判断皆为是时才能获得ETL任务中包括数据对象ID和标记任务号的标记语言。
此外,本实施例的ETL依赖自动识别系统1较之实施例4,其改进还在于:
第二获取模块12具体包括:
第一解析模块121,用于解析ETL任务获取语法树;
第二解析模块122,用于解析所述语法树获取数据对象。
本实施例进一步细化了第二获取模块12的组成结构,即通过第一解析模块121和第二解析模块122解析ETL任务以识别数据对象,数据对象的类型包括表和视图。
本实施例的ETL依赖自动识别系统是对实施例4的进一步改进,具体细化了实施例4中的第一获取模块11和第二获取模块12的组成结构,提供了一种更加优选的实施方式。
实施例6
本实施例提供的ETL依赖自动识别系统是对实施例4的进一步改进,图6示出了本实施例的结构示意图。其中,本实施例第二获取模块12所获取的数据对象还包括当前任务号,如图6所示,较之实施例4,本实施例的ETL依赖自动识别系统1还包括:
第五判断模块16,用于判断标记任务号是否与当前任务号相同,并在判断为否时调用第二保存模块17;
第二保存模块17,用于将当前任务号保存至错误依赖表;
通知模块18,用于发送错误通知。
其中,第二保存模块17具体包括:
第六判断模块171,用于根据标记任务号和当前任务号判断发生的是多余依赖还是缺失依赖,并在判断发生多余依赖时调用第三保存模块172,发生缺失依赖时调用第四保存模块173;
第三保存模块172,用于将当前任务号保存至多余依赖表;
第四保存模块173,用于将当前任务号保存至缺失依赖表。
具体地,与实施例4提供的ETL依赖自动识别系统相比,本实施例在生成模块15根据标记任务号生成依赖任务号之后,还通过第五判断模块16判断生成的依赖任务号所依据的标记任务号是否与数据对象的当前任务号相同。若相同,则表明事先针对该数据对象配置的当前任务号为该数据对象真正的任务号,未发生错误依赖;若不相同,则表明事先针对该数据对象配置的当前任务号并非该数据对象真正的任务号,发生了错误依赖,在此情况下,进一步第六判断模块17根据该数据对象的对应的标记任务号以及当前任务号判断发生的是多余依赖的情形还是缺失依赖的情形,并分别通过第三保存模块172和第四保存模块173将多余依赖以及缺失依赖对应的当前任务号保存至多余依赖表以及缺失依赖表。最后,通知模块18发送错误通知以告知相关人员之前存在的错误依赖的情形,例如但不限于通过邮件方式发送错误通知。
本实施例的ETL依赖自动识别系统是对实施例4的进一步改进,改进在于本实施例还包括识别ETL任务中发生的错误依赖(多余依赖以及缺失依赖)的情形,并且本实施例还包括发送错误通知的通知模块,提高了本实施例ETL依赖自动识别系统与相关人员的交互性。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (10)

1.一种ETL依赖自动识别方法,其特征在于,包括:
S1、获取所有ETL任务中的标记语言,并将所述标记语言保存至标记语言库,其中所述标记语言包括数据对象ID和标记任务号;
S2、根据ETL任务获取数据对象,所述数据对象的类型包括表和视图,所述数据对象包括当前数据对象ID;
S3、判断所述数据对象是否为当前创建的临时表;
若否,则转至步骤S4;
S4、判断所述标记语言库是否包括所述当前数据对象ID;
若是,则转至步骤S5;
S5、根据所述标记任务号生成依赖任务号。
2.如权利要求1所述的ETL依赖自动识别方法,其特征在于,步骤S1具体包括:
S11、询问ETL任务;
S12、判断所述ETL任务是否包括标记语言;
若是,则转至步骤S13;
S13、判断所述标记语言是否包括数据对象ID和标记任务号;
若是,则转至步骤S14;
S14、将所述标记语言保存至标记语言库;和/或
步骤S2具体包括:
S21、解析ETL任务获取语法树;
S22、解析所述语法树获取数据对象。
3.如权利要求1所述的ETL依赖自动识别方法,其特征在于,所述数据对象还包括当前任务号,所述ETL依赖自动识别方法还包括:
S6、判断所述标记任务号是否与所述当前任务号相同;
若否,则转至步骤S7;
S7、将所述当前任务号保存至错误依赖表。
4.如权利要求3所述的ETL依赖自动识别方法,其特征在于,步骤S7具体包括:
S71、根据所述标记任务号和所述当前任务号判断发生的是多余依赖还是缺失依赖;
若是多余依赖,则转至步骤S72;若是缺失依赖,则转至步骤S73;
S72、将所述当前任务号保存至多余依赖表;
S73、将所述当前任务号保存至缺失依赖表。
5.如权利要求3所述的ETL依赖自动识别方法,其特征在于,所述ETL依赖自动识别方法还包括:
S8、发送错误通知。
6.一种ETL依赖自动识别系统,其特征在于,包括:
第一获取模块,用于获取所有ETL任务中的标记语言,并将所述标记语言保存至标记语言库,其中所述标记语言包括数据对象ID和标记任务号;
第二获取模块,用于根据ETL任务获取数据对象,所述数据对象的类型包括表和视图,所述数据对象包括当前数据对象ID;
第一判断模块,用于判断所述数据对象是否为当前创建的临时表,并在判断为否时调用第二判断模块;
所述第二判断模块,用于判断所述标记语言库是否包括所述当前数据对象ID,并在判断为是时调用生成模块;
所述生成模块,用于根据所述标记任务号生成依赖任务号。
7.如权利要求6所述的ETL依赖自动识别系统,其特征在于,所述第一获取模块包括:
询问模块,用于询问ETL任务;
第三判断模块,用于判断所述ETL任务是否包括标记语言,并在判断为是时调用第四判断模块;
所述第四判断模块,用于判断所述标记语言是否包括数据对象ID和标记任务号,并在判断为是时调用第一保存模块;
所述第一保存模块,用于将所述标记语言保存至标记语言库;和/或
所述第二获取模块包括:
第一解析模块,用于解析ETL任务获取语法树;
第二解析模块,用于解析所述语法树获取数据对象。
8.如权利要求6所述的ETL依赖自动识别系统,其特征在于,所述数据对象还包括当前任务号,所述ETL依赖自动识别系统还包括:
第五判断模块,用于判断所述标记任务号是否与所述当前任务号相同,并在判断为否时调用第二保存模块;
所述第二保存模块,用于将所述当前任务号保存至错误依赖表。
9.如权利要求8所述的ETL依赖自动识别系统,其特征在于,所述第二保存模块包括:
第六判断模块,用于根据所述标记任务号和所述当前任务号判断发生的是多余依赖还是缺失依赖,并在判断发生多余依赖时调用第三保存模块,发生缺失依赖时调用第四保存模块;
所述第三保存模块,用于将所述当前任务号保存至多余依赖表;
所述第四保存模块,用于将所述当前任务号保存至缺失依赖表。
10.如权利要求8所述的ETL依赖自动识别系统,其特征在于,所述ETL依赖自动识别系统还包括:
通知模块,用于发送错误通知。
CN201711464696.3A 2017-12-28 2017-12-28 Etl依赖自动识别方法与系统 Active CN108038248B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711464696.3A CN108038248B (zh) 2017-12-28 2017-12-28 Etl依赖自动识别方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711464696.3A CN108038248B (zh) 2017-12-28 2017-12-28 Etl依赖自动识别方法与系统

Publications (2)

Publication Number Publication Date
CN108038248A CN108038248A (zh) 2018-05-15
CN108038248B true CN108038248B (zh) 2021-11-26

Family

ID=62097839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711464696.3A Active CN108038248B (zh) 2017-12-28 2017-12-28 Etl依赖自动识别方法与系统

Country Status (1)

Country Link
CN (1) CN108038248B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112199423A (zh) * 2020-09-01 2021-01-08 河钢数字技术股份有限公司 一种etl数据质量判定与反馈方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053972A (zh) * 2009-10-27 2011-05-11 阿里巴巴集团控股有限公司 Etl模块间父任务关系的获取方法和装置
CN102231104A (zh) * 2010-07-29 2011-11-02 艾默生网络能源有限公司 一种基于描述的界面生成装置及生成方法
CN103019691A (zh) * 2012-11-20 2013-04-03 北京思特奇信息技术股份有限公司 一种etl作业关系图的转化方法及其实现系统
CN103729385A (zh) * 2012-10-16 2014-04-16 阿里巴巴集团控股有限公司 一种报表自动更新的方法和装置
CN103902653A (zh) * 2014-02-28 2014-07-02 珠海多玩信息技术有限公司 一种构建数据仓库表血缘关系图的方法和装置
CN105589874A (zh) * 2014-10-22 2016-05-18 阿里巴巴集团控股有限公司 Etl任务依赖关系的检测方法、装置及etl工具

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9064047B2 (en) * 2009-09-24 2015-06-23 International Business Machines Corporation Parallel processing of ETL jobs involving extensible markup language documents

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053972A (zh) * 2009-10-27 2011-05-11 阿里巴巴集团控股有限公司 Etl模块间父任务关系的获取方法和装置
CN102231104A (zh) * 2010-07-29 2011-11-02 艾默生网络能源有限公司 一种基于描述的界面生成装置及生成方法
CN103729385A (zh) * 2012-10-16 2014-04-16 阿里巴巴集团控股有限公司 一种报表自动更新的方法和装置
CN103019691A (zh) * 2012-11-20 2013-04-03 北京思特奇信息技术股份有限公司 一种etl作业关系图的转化方法及其实现系统
CN103902653A (zh) * 2014-02-28 2014-07-02 珠海多玩信息技术有限公司 一种构建数据仓库表血缘关系图的方法和装置
CN105589874A (zh) * 2014-10-22 2016-05-18 阿里巴巴集团控股有限公司 Etl任务依赖关系的检测方法、装置及etl工具

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A web-based ETL tool for data integration process;Nithin Vijayendra;《IEEE》;20130816;全文 *
基于MapReduce的分布式ETL过程的研究与优化;张矫艳;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170715;I138-567 *

Also Published As

Publication number Publication date
CN108038248A (zh) 2018-05-15

Similar Documents

Publication Publication Date Title
US11176317B2 (en) Automated file merging through content classification
US7917815B2 (en) Multi-layer context parsing and incident model construction for software support
CN110333863B (zh) 一种生成、显示小程序页面的方法及装置
US20120173226A1 (en) Table merging with row data reduction
CN108388640B (zh) 一种数据转换方法、装置以及数据处理系统
CN101174237B (zh) 一种自动化测试方法、系统及一种测试设备
CN105243167A (zh) 一种数据处理方法及装置
CN104461531A (zh) 一种报表系统自定义函数的实现方法
CN111190807A (zh) 一种埋点测试方法及设备
CN111026670A (zh) 测试用例的生成方法、测试用例的生成装置及存储介质
US20050234845A1 (en) End-to-end business integration testing tool
US9084131B2 (en) Data cut-over method and apparatus
CN108038248B (zh) Etl依赖自动识别方法与系统
CN107122203B (zh) 一种配置文件的设置方法及装置
US20130086133A1 (en) Method and apparatus for file revision tracking
US7844601B2 (en) Quality of service feedback for technology-neutral data reporting
CN110716804A (zh) 无用资源的自动删除方法、装置、存储介质及电子设备
CN110162299A (zh) web程序及其快速开发框架、开发方法与相关设备
CN117762865A (zh) 大数据平台的数据入湖方法及系统
US20050010595A1 (en) System and method for automating an identification mechanism and type information configuration process for a real-time data feed to a database
CN102136013A (zh) 制造步骤信息生成系统和制造步骤信息生成方法
CN104536897A (zh) 基于关键字的自动测试方法及系统
US20200042296A1 (en) Code lineage tool
JP2008269515A (ja) パラメータによる画面レイアウト動的生成方法
CN101256532A (zh) 一种嵌入式系统中变量实时查看的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant