CN106021624A - 一种etl模型生成方法及装置 - Google Patents

一种etl模型生成方法及装置 Download PDF

Info

Publication number
CN106021624A
CN106021624A CN201610581334.1A CN201610581334A CN106021624A CN 106021624 A CN106021624 A CN 106021624A CN 201610581334 A CN201610581334 A CN 201610581334A CN 106021624 A CN106021624 A CN 106021624A
Authority
CN
China
Prior art keywords
etl
data model
model
data
workflow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610581334.1A
Other languages
English (en)
Other versions
CN106021624B (zh
Inventor
常青
陈宏晓
游黎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN201610581334.1A priority Critical patent/CN106021624B/zh
Publication of CN106021624A publication Critical patent/CN106021624A/zh
Application granted granted Critical
Publication of CN106021624B publication Critical patent/CN106021624B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种ETL模型生成方法及装置,应用于ETL开发平台,ETL开发平台包括至少一种扩展,每种扩展包括至少一个第一数据模型,第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型。该方法通过接收携带ETL分析需求的ETL模型生成请求;确定ETL需求分析包括的各个工程,分别属于每个工程的各个工作流组,以及分别属于每个工作流组的各个工作流;针对每个工程,利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型(数据模型包括工程中的各个工作流组中每个工作流对应的第二数据模型);根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型的方式,实现了生成ETL模型的目的。

Description

一种ETL模型生成方法及装置
技术领域
本发明涉及数据处理技术领域,特别是涉及一种ETL模型生成方法及装置。
背景技术
信息是现代企业的重要资源,是企业运用科学管理、决策分析的基础。目前,大多数企业花费大量的资金和时间来构建联机事务处理系统和办公自动化系统,用来记录事务处理的各种相关数据。据统计,记录的事务处理的数据每2~3年时间就会成倍增长,这些数据蕴含着巨大的商业价值,而企业所关注的通常只占在总数据的2%~4%左右。可见,企业并没有最大化地利用已存储的数据资源,以致于浪费了很多的时间和资金,也失去制定关键商业决策的最佳契机。于是,企业如何把数据转换为需要的信息、知识,已经成了提高核心竞争力的主要方向。
目前,企业一般通过使用ETL达到将数据转换为需要的信息、知识的目的,以提高企业核心竞争力。其中,ETL为Extract-Transform-Load的缩写,中文名称为数据抽取、转换和加载。ETL是数据仓库的核心和灵魂,负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。
随着ETL在企业应用中地位的提升,ETL模型生成技术也越来越受到人们关注。ETL模型生成技术对于ETL在企业应用中起着举足轻重的基础作用,是不可或缺的一环。
发明内容
有鉴于此,本发明实施例提供一种ETL模型生成方法及装置,以实现生成ETL模型的目的。
为了实现上述目的,本发明实施例提供的技术方案如下:
一种ETL模型生成方法,应用于ETL开发平台,所述ETL开发平台包括至少一种扩展,每种所述扩展对应ETL作业中的唯一种业务处理方式;每种所述扩展包括至少一个第一数据模型,所述第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型;所述组件指示所述特定数据处理流程中的单个处理动作;
该方法包括:
接收ETL模型生成请求,所述ETL模型生成请求中携带ETL需求分析;
确定所述ETL需求分析包括的各个工程,分别属于每个所述工程的各个工作流组,以及分别属于每个所述工作流组的各个工作流;
针对每个所述工程,利用所述工程所属的扩展中的第一数据模型,生成与所述工程对应的数据模型,所述数据模型包括:所述工程中的各个工作流组中每个工作流对应的第二数据模型;
根据各个所述数据模型,生成与所述ETL模型生成请求对应的ETL目标数据模型。
优选的,所述利用所述工程所属的扩展中的第一数据模型,生成与所述工程对应的数据模型,包括:
针对所述工程中的各个工作流组中的每个工作流,利用所述工程所属的扩展中的第一数据模型,生成与所述工作流对应的第二数据模型;
其中,所述利用所述工程所属的扩展中的第一数据模型,生成与所述工作流对应的第二数据模型包括,响应接收到的用户输入的与所述工作流对应的建模操作,根据所述建模操作中包括的各个第一数据模型以及各个所述第一数据模型的数据处理流程,生成与所述工作流对应的第二数据模型。
优选的,所述根据各个所述数据模型,生成与所述ETL模型生成请求对应的ETL目标数据模型,包括:
将所有所述数据模型的集合,作为与所述ETL模型生成请求对应的ETL目标数据模型;
其中,所述集合中的每个数据模型分别对应一个唯一的第一标识信息,所述第一标识信息指示与其对应的数据模型所对应工程;所述数据模型中的每个第二数据模型分别对应一个唯一的第二标识信息,所述第二标识信息指示与其对应的第二数据模型所对应的工作流,以及所述工作流所属的工作流组,以及所述工作流组所属的工程。
优选的,还包括:
利用所述第一标识信息和第二标识信息,关联显示所述ETL目标数据模型中的各个数据模型;
针对每个所述数据模型,关联显示属于所述数据模型的每个工作流组;
针对每个所述工作流组,关联显示属于所述工作流组的每个工作流对应的第二数据模型。
优选的,还包括:
接收ETL文件生成请求,所述ETL文件生成请求中包括ETL文件格式需求;
根据所述ETL目标数据模型,生成满足所述ETL文件格式需求的ETL文件。
优选的,当所述ETL文件格式需求为生成的ETL文件的格式适用于任何数据平台时,
根据所述ETL目标数据模型,生成的ETL文件为可被任何所述数据平台识别的ETL中间结果文件;其中,所述ETL中间结果文件所应用的数据平台,可接收携带第一目标格式要求的转换请求,将所述中间结果文件转换成满足所述第一目标格式要求的ETL文件。
优选的,当所述ETL文件格式需求为生成的ETL文件的格式适用于目标数据平台时,
根据所述ETL目标数据模型,生成的ETL文件为满足所述目标数据平台的第二目标格式要求的ETL文件。
优选的,还包括:
将所述ETL文件发送至共享服务器,以实现所述ETL文件的共享。
优选的,还包括:
响应接收到的ETL测试请求,将所述ETL文件发送至远程服务器;
接收所述远程服务器反馈的所述ETL文件的测试结果。
一种ETL模型生成装置,应用于ETL开发平台,所述ETL开发平台包括至少一种扩展,每种所述扩展对应ETL作业中的唯一种业务处理方式;每种所述扩展包括至少一个第一数据模型,所述第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型;所述组件指示所述特定数据处理流程中的单个处理动作;
该装置包括:
请求接收单元,用于接收ETL模型生成请求,所述ETL模型生成请求中携带ETL需求分析;
信息确定单元,用于确定所述ETL需求分析包括的各个工程,分别属于每个所述工程的各个工作流组,以及分别属于每个所述工作流组的各个工作流;
数据模型生成单元,用于针对每个所述工程,利用所述工程所属的扩展中的第一数据模型,生成与所述工程对应的数据模型,所述数据模型包括:所述工程中的各个工作流组中每个工作流对应的第二数据模型;
ETL目标数据模型生成单元,用于根据各个所述数据模型,生成与所述ETL模型生成请求对应的ETL目标数据模型。
本申请提供一种ETL模型生成方法及装置,应用于ETL开发平台,ETL开发平台包括至少一种扩展,每种扩展包括至少一个第一数据模型,第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型。该方法通过接收携带ETL分析需求的ETL模型生成请求;确定ETL需求分析包括的各个工程,分别属于每个工程的各个工作流组,以及分别属于每个工作流组的各个工作流;针对每个工程,利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型(其中,数据模型包括工程中的各个工作流组中每个工作流对应的第二数据模型);进而根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型的方式,实现了生成ETL模型的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种ETL模型生成方法流程图;
图2为本申请实施例提供的另一种ETL模型生成方法流程图;
图3为本申请实施例提供的一种ETL模型生成装置的结构示意图;
图4为本申请实施例提供的另一种ETL模型生成装置的结构示意图;
图5为本申请实施例提供的又一种ETL模型生成装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例:
图1为本申请实施例提供的一种ETL模型生成方法流程图。
在本申请实施例中,优选的,如图1所示的一种ETL模型生成方法应用于ETL开发平台,ETL开发平台包括至少一种扩展,每种扩展对应ETL作业中的唯一种业务处理方式;每种扩展包括至少一个第一数据模型,第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型;组件指示特定数据处理流程中的单个处理动作。
可选的,ETL开发平台包括至少一种扩展,每种扩展对应ETL作业中的唯一种业务处理方式。其中,扩展包括:操作数据层(ODS)、基础数据层(BDS)、共性加工数据层(GDS)、数据集市层(DMS)等。
ODS:Operation Data操作数据层,该层尽量保持业务数据原貌,保留源系统的原始和历史数据,该层保存时间相对较短的历史数据,能够方便且快速地支持需要按源系统数据结构进行数据加工的分析型应用。
BDS:Basic Data Store基础数据层,该层基于事实与维度建模方法,按客户、产品、合约、存款、贷款等业务主题对数据进行拼接与整合,形成企业级的统一数据视图;同时,保留详细的历史数据,用于支持各类整合型的分析型应用。
GDS:General Data Section共性加工数据层,该层由基础数据区数据进行预关联、预汇总和预加工形成标准统一、口径一致、可复用的公共数据,该层兼顾了业务需求和数据处理性能,有多种数据粒度和数据保留周期。
DMS:Data Market Section数据集市层,满足特定的部门或者用户需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。
以上仅仅为本申请实施例的优选方式,发明人可根据自己的需求任意设置扩展的具体内容,如调度等,在此不做限定。
可选的,每种扩展均包括至少一个第一数据模型,该第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型。其中,第一数据模型指示的特定数据处理流程,属于该第一数据模型所属的扩展对应的业务处理方式。
可选的,组件指示特定数据处理流程中的单个处理动作。例如,当第一数据模型指示的特定数据处理流程为:先执行数据插入,在执行数据更新,进而执行数据导出时,第一数据模型由三个组件构成,分别为数据插入组件、数据更新组件以及数据导出组件。其中,数据插入组件指示特定数据处理流程中的数据插入动作、数据更新组件指示特定数据处理流程中的数据更新动作、数据导出组件指示特定数据处理流程中的数据导出动作。
以上仅仅是本申请实施例的优选方式,发明人可根据自己的需求任意设置组件以及第一数据模型对应的特定数据处理流程的具体内容,在此不做限定。
如图1所示,该方法包括:
S101、接收ETL模型生成请求,ETL模型生成请求中携带ETL需求分析;
在本申请实施例中,优选的,ETL模型生成请求是由用户向ETL开发平台发送的,并且用户发送的ETL模型生成请求中携带了ETL需求分析。
可选的,ETL需求分析是用户根据自己对于待生成的ETL模型的功能需求而生成的。
可选的,本申请实施例提供的一种ETL模型生成方法,根据ETL需求分析可生成满足该ETL需求分析指示的ETL模型的功能需求的ETL模型。
S102、确定ETL需求分析包括的各个工程,分别属于每个工程的各个工作流组,以及分别属于每个工作流组的各个工作流;
可选的,ETL需求分析中包括至少一个工程,且每个工程中包括至少一个工作流组,每个工作流组中包括至少一个工作流。当接收到ETL模型生成请求后,可确定该ETL模型生成请求中携带的ETL需求分析中包括的工程,以及每个工程包括的工作流组,以及每个工作流组包括的工作流。
可选的,ETL需求分析中的每个工程携带一个唯一的工程标识,每个工作流组携带一个唯一的工作流组标识(该工作流组标识指示与其对应的工作流组所属的工程),每个工作流携带一个唯一的工作流标识(该工作流标识指示与其对应的工作流所属的工作流组)。进而,当接收到ETL模型生成请求后,可根据工程标识、工作流组标识以及工作流标识,确定ETL需求分析中的各个工程,每个工程包括的工作流组,以及每个工作流组包括的工作流。
以上仅仅是本申请实施例的优选方式,发明人可根据自己的需求任意设置确定ETL需求分析包括的各个工程,分别属于每个工程的各个工作流组,以及分别属于每个工作流组的各个工作流的方式,在此不做限定。
S103、针对每个工程,利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型,数据模型包括:工程中的各个工作流组中每个工作流对应的第二数据模型;
可选的,针对ETL需求分析中的每个工程执行以下过程:利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型,数据模型包括:工程中的各个工作流组中每个工作流对应的第二数据模型。
可选的,ETL需求分析中的每个工程还携带一个扩展标识。扩展标识指示的扩展,即为携带该扩展标识的工程所属的扩展。
S104、根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型。
为了使得本申请实施例提供的一种ETL模型生成方法更加清楚、完整,在此对本申请实施例提供的一种ETL模型生成方法中的“利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型”的方法进行详细介绍。
在本申请实施例中,优选的,利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型的方法,具体包括:针对工程中的各个工作流组中的每个工作流,利用工程所属的扩展中的第一数据模型,生成与工作流对应的第二数据模型。
可选的,利用工程所属的扩展中的第一数据模型,生成与工作流对应的第二数据模型包括,响应接收到的用户输入的与工作流对应的建模操作,根据建模操作中包括的各个第一数据模型以及各个第一数据模型的数据处理流程,生成与工作流对应的第二数据模型。
在本申请实施例中,优选的,可接收用户输入的与工作流对应的建模操作。其中,接收建模操作的过程包括:接收用户将第一数据模型拖入建模操作区域的动作,确定用户拖入建模操作区域中的各个第一数据模型;以及接收用户在建模操作区域对其拖入的各个第一数据模型赋予的数据处理流程(即各个第一数据模型的数据处理顺序)。
可选的,根据用户针对工作流,拖入建模操作区域中的各个第一数据模型以及为建模操作区域中的各个第一数据模型赋予的数据处理流程,可生成与该工作流对应的第二数据模型。
通过上述对本申请实施例提供的ETL模型生成方法中的“利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型”方法的进一步介绍,使得本申请实施例提供的ETL模型生成方法更加清晰、完整,便于本领域技术人员理解。
为了使得本申请实施例提供的一种ETL模型生成方法更加清楚、完整,在此对本申请实施例提供的一种ETL模型生成方法中的“根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型”的方法进行详细介绍。
在本申请实施例中,优选的,根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型,包括:将所有数据模型的集合,作为与ETL模型生成请求对应的ETL目标数据模型。
可选的,集合中的每个数据模型分别对应一个唯一的第一标识信息,第一标识信息指示与其对应的数据模型所对应工程;数据模型中的每个第二数据模型分别对应一个唯一的第二标识信息,第二标识信息指示与其对应的第二数据模型所对应的工作流,以及工作流所属的工作流组,以及工作流组所属的工程。
通过上述对本申请实施例提供的ETL模型生成方法中的“根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型”方法的进一步介绍,使得本申请实施例提供的ETL模型生成方法更加清晰、完整,便于本领域技术人员理解。
为了便于用户对本申请实施例提供的一种ETL模型生成方法所生成的ETL目标数据模型的了解,本申请实施例在上述实施例的基础上,在根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型之后,进一步包括:
利用第一标识信息和第二标识信息,关联显示ETL目标数据模型中的各个数据模型;针对每个数据模型,关联显示属于数据模型的每个工作流组;针对每个工作流组,关联显示属于工作流组的每个工作流对应的第二数据模型。
可选的,本申请实施例提供的一种ETL模型生成方法,在生成ETL目标数据模型之后,还可显示该ETL目标数据模型。
可选的,显示生成的ETL目标数据模型的方式为:关联显示ETL目标数据模型中的各个数据模型(其中,关联显示各个数据模型的方式为:将各个数据模型同时在第一层级显示);针对显示的每个数据模型对其划分第二层级,在每个数据模型划分的第二层级中,关联显示属于该数据模型的每个工作流组(其中,关联显示属于数据模型的每个工作流组的方式为:在针对给数据模型划分的第二层级中,同时显示属于该数据模型的各个工作流组);针对显示的每个工作流组对其划分第三层级,在每个工作流组划分的第三层级中,关联显示属于该工作流组的每个工作流对应的第二数据模型(其中,关联显示属于工作流组的每个工作流对应的第二数据模型的方式为:在针对给工作流组划分的第三层级中,同时显示属于该工作流组的每个工作流对应的第二数据模型)。
可选的,可响应接收到的用户输入的显示规则,显示第一层级、第二层级和/或第三层级。
在上述实施例提供的一种ETL模型生成方法的基础上,在根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型之后,通过对生成的ETL目标数据模型的显示,使得本申请实施例提供的一种ETL模型生成方法更加人性化,便于用户理解。
图2为本申请实施例提供的另一种ETL模型生成方法流程图。
如图2所示,该方法包括:
S201、接收ETL模型生成请求,ETL模型生成请求中携带ETL需求分析;
S202、确定ETL需求分析包括的各个工程,分别属于每个工程的各个工作流组,以及分别属于每个工作流组的各个工作流;
S203、针对每个工程,利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型,数据模型包括:工程中的各个工作流组中每个工作流对应的第二数据模型;
S204、根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型;
本申请实施例中的步骤S201-S204的执行过程与上述实施例中的步骤S101-S104的执行过程相同,有关步骤S201-S204的具体执行过程,请参见上述实施例中对S101-S104的描述,在此不做赘述。
S205、接收ETL文件生成请求,ETL文件生成请求中包括ETL文件格式需求;
在本申请实施例中,优选的,在生成ETL目标数据模型后,还可接收ETL文件生成请求。具体的,在接收到的ETL文件生成请求中包括ETL文件格式需求。
S206、根据ETL目标数据模型,生成满足ETL文件格式需求的ETL文件。
在本申请实施例中,优选的,在接收到ETL文件生成请求后,可根据生成的ETL目标数据模型生成ETL文件。其中,生成的ETL文件满足ETL文件生成请求中携带的ETL文件格式需求。
在本申请实施例中,优选的,当ETL文件格式需求为生成的ETL文件的格式适用于任何数据平台时,根据ETL目标数据模型,生成的ETL文件为可被任何数据平台识别的ETL中间结果文件。
可选的,ETL中间结果文件所应用的数据平台,可接收携带第一目标格式要求的转换请求,将中间结果文件转换成满足第一目标格式要求的ETL文件。
可选的,生成的ETL中间结果文件的格式为XML格式。其中,XML格式的ETL中间结果文件可适用于任何数据平台。
以上仅仅是本申请实施例的优选方式,发明人可根据自己的需求任意设置生成的ETL中间结果文件的具体格式,在此不做限定。
可选的,当ETL中间结果文件放置于不同的数据平台时(即ETL中间结果文件在不同的数据平台使用时),放置有ETL中间结果文件的数据平台可接收用户输入的转换请求(该转换请求中携带第一目标格式要求),进而将放置于该数据平台的ETL中间结果文件转换成满足第一目标格式要求的ETL文件。
在本申请实施例中,优选的,当ETL文件格式需求为生成的ETL文件的格式适用于目标数据平台时,根据ETL目标数据模型,生成的ETL文件为满足目标数据平台的第二目标格式要求的ETL文件。
可选的,当ETL文件格式需求为生成的ETL文件的格式适用于目标数据平台时,可首先确定与目标数据平台对应的第二目标格式要求,进而根据ETL目标数据模型,生成满足第二目标格式要求的ETL文件。
在上述实施例提供的一种ETL模型生成方法的基础上,在根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型之后,通过根据ETL目标数据模型生成ETL文件的方式,可便于同一ETL文件被不同数据平台使用,便于ETL模型的移植应用,使得本申请实施例提供的一种ETL模型生成方法更加人性化,便于用户使用。
进一步的,本申请实施例提供的一种ETL模型生成方法中,在生成ETL文件之后,还包括:将ETL文件发送至共享服务器,以实现ETL文件的共享。
在本申请实施例中,优选的,将ETL文件发送至共享服务器后,可实现ETL文件的共享。例如,当其他用户登录共享服务器后,若看到满足其需求的ETL文件,则可直接从该共享服务器中下载该ETL文件(实现ETL文件的获取),并将获取到的ETL文件应用在其需要应用的数据平台上。
在本申请实施例中,为了便于从共享服务器获取到的ETL文件可被多种数据平台识别应用。优选的,将放置在共享服务器的ETL文件设置为ETL中间结果文件。
本申请实施例通过在上述实施例提供的一种ETL模型生成方法的基础上,进一步增加将生成的ETL文件进行共享的过程,使得本申请实施例提供的ETL模型生成方法的内容更加丰富、更加人性化、便于应用。
进一步的,本申请实施例提供的一种ETL模型生成方法中,在生成ETL文件之后,还包括:响应接收到的ETL测试请求,将ETL文件发送至远程服务器;接收远程服务器反馈的ETL文件的测试结果。
在本申请实施例中,优选的,在生成ETL文件后,ETL开发平台可接收用户输入的ETL测试请求,并响应接收到的ETL测试请求,将生成的ETL文件发送至远程服务器,以便远程服务器对接收到的ETL文件进行测试,并反馈测试结果,进而便于ETL开发平台接收由远程服务器反馈的ETL文件的测试结果。
本申请实施例通过在上述实施例提供的一种ETL模型生成方法的基础上,进一步增加通过远程服务器对生成的ETL文件进行测试的方案,使得本申请实施例提供的ETL模型生成方法所生成的ETL文件更加准确。
本申请提供一种ETL模型生成方法,应用于ETL开发平台,ETL开发平台包括至少一种扩展,每种扩展包括至少一个第一数据模型,第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型。该方法通过接收携带ETL分析需求的ETL模型生成请求;确定ETL需求分析包括的各个工程,分别属于每个工程的各个工作流组,以及分别属于每个工作流组的各个工作流;针对每个工程,利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型(其中,数据模型包括工程中的各个工作流组中每个工作流对应的第二数据模型);进而根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型的方式,实现了生成ETL模型的目的。
图3为本申请实施例提供的一种ETL模型生成装置的结构示意图。
如图3所示的一种ETL模型生成装置应用于ETL开发平台,ETL开发平台包括至少一种扩展,每种扩展对应ETL作业中的唯一种业务处理方式;每种扩展包括至少一个第一数据模型,第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型;组件指示特定数据处理流程中的单个处理动作。
如图3所示,该装置包括:
请求接收单元31,用于接收ETL模型生成请求,ETL模型生成请求中携带ETL需求分析;
信息确定单元32,用于确定ETL需求分析包括的各个工程,分别属于每个工程的各个工作流组,以及分别属于每个工作流组的各个工作流;
数据模型生成单元33,用于针对每个工程,利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型,数据模型包括:工程中的各个工作流组中每个工作流对应的第二数据模型;
ETL目标数据模型生成单元34,用于根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型。
在本申请实施例中,优选的,数据模型生成单元33针对工程中的各个工作流组中的每个工作流,利用工程所属的扩展中的第一数据模型,生成与工作流对应的第二数据模型;其中,利用工程所属的扩展中的第一数据模型,生成与工作流对应的第二数据模型包括,响应接收到的用户输入的与工作流对应的建模操作,根据建模操作中包括的各个第一数据模型以及各个第一数据模型的数据处理流程,生成与工作流对应的第二数据模型。
在本申请实施例中,优选的,ETL目标数据模型生成单元34将所有数据模型的集合,作为与ETL模型生成请求对应的ETL目标数据模型;其中,集合中的每个数据模型分别对应一个唯一的第一标识信息,第一标识信息指示与其对应的数据模型所对应工程;数据模型中的每个第二数据模型分别对应一个唯一的第二标识信息,第二标识信息指示与其对应的第二数据模型所对应的工作流,以及工作流所属的工作流组,以及工作流组所属的工程。
进一步的,在本申请实施例提供的一种ETL模型生成装置中,还包括:显示单元,该显示单元,用于利用第一标识信息和第二标识信息,关联显示ETL目标数据模型中的各个数据模型;针对每个数据模型,关联显示属于数据模型的每个工作流组;针对每个工作流组,关联显示属于工作流组的每个工作流对应的第二数据模型。
图4为本申请实施例提供的另一种ETL模型生成装置的结构示意图。
如图4所示的ETL模型生成装置,在上述如图3所示的ETL模型生成装置的基础上,进一步包括:ETL文件生成单元41。
其中,ETL文件生成单元41,用于接收ETL文件生成请求,ETL文件生成请求中包括ETL文件格式需求;根据ETL目标数据模型,生成满足ETL文件格式需求的ETL文件。
在本申请实施例中,优选的,当ETL文件格式需求为生成的ETL文件的格式适用于任何数据平台时,根据ETL目标数据模型,生成的ETL文件为可被任何数据平台识别的ETL中间结果文件;其中,ETL中间结果文件所应用的数据平台,可接收携带第一目标格式要求的转换请求,将中间结果文件转换成满足第一目标格式要求的ETL文件。
在本申请实施例中,优选的,当ETL文件格式需求为生成的ETL文件的格式适用于目标数据平台时,根据ETL目标数据模型,生成的ETL文件为满足目标数据平台的第二目标格式要求的ETL文件。
进一步的,在本申请实施例提供的一种ETL模型生成装置中,还包括:共享单元,该共享单元,用于将ETL文件发送至共享服务器,以实现ETL文件的共享。
图5为本申请实施例提供的又一种ETL模型生成装置的结构示意图。
如图5所示的ETL模型生成装置,在上述如图4所示的ETL模型生成装置的基础上,进一步包括:测试单元51。
其中,测试单元51,用于响应接收到的ETL测试请求,将ETL文件发送至远程服务器;接收远程服务器反馈的ETL文件的测试结果。
本申请提供一种ETL模型生成装置,应用于ETL开发平台,ETL开发平台包括至少一种扩展,每种扩展包括至少一个第一数据模型,第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型。该方法通过接收携带ETL分析需求的ETL模型生成请求;确定ETL需求分析包括的各个工程,分别属于每个工程的各个工作流组,以及分别属于每个工作流组的各个工作流;针对每个工程,利用工程所属的扩展中的第一数据模型,生成与工程对应的数据模型(其中,数据模型包括工程中的各个工作流组中每个工作流对应的第二数据模型);进而根据各个数据模型,生成与ETL模型生成请求对应的ETL目标数据模型的方式,实现了生成ETL模型的目的。
本发明中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
以上仅是本发明的优选实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种ETL模型生成方法,其特征在于,应用于ETL开发平台,所述ETL开发平台包括至少一种扩展,每种所述扩展对应ETL作业中的唯一种业务处理方式;每种所述扩展包括至少一个第一数据模型,所述第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型;所述组件指示所述特定数据处理流程中的单个处理动作;
该方法包括:
接收ETL模型生成请求,所述ETL模型生成请求中携带ETL需求分析;
确定所述ETL需求分析包括的各个工程,分别属于每个所述工程的各个工作流组,以及分别属于每个所述工作流组的各个工作流;
针对每个所述工程,利用所述工程所属的扩展中的第一数据模型,生成与所述工程对应的数据模型,所述数据模型包括:所述工程中的各个工作流组中每个工作流对应的第二数据模型;
根据各个所述数据模型,生成与所述ETL模型生成请求对应的ETL目标数据模型。
2.根据权利要求1所述的方法,其特征在于,所述利用所述工程所属的扩展中的第一数据模型,生成与所述工程对应的数据模型,包括:
针对所述工程中的各个工作流组中的每个工作流,利用所述工程所属的扩展中的第一数据模型,生成与所述工作流对应的第二数据模型;
其中,所述利用所述工程所属的扩展中的第一数据模型,生成与所述工作流对应的第二数据模型包括,响应接收到的用户输入的与所述工作流对应的建模操作,根据所述建模操作中包括的各个第一数据模型以及各个所述第一数据模型的数据处理流程,生成与所述工作流对应的第二数据模型。
3.根据权利要求2所述的方法,其特征在于,所述根据各个所述数据模型,生成与所述ETL模型生成请求对应的ETL目标数据模型,包括:
将所有所述数据模型的集合,作为与所述ETL模型生成请求对应的ETL目标数据模型;
其中,所述集合中的每个数据模型分别对应一个唯一的第一标识信息,所述第一标识信息指示与其对应的数据模型所对应工程;所述数据模型中的每个第二数据模型分别对应一个唯一的第二标识信息,所述第二标识信息指示与其对应的第二数据模型所对应的工作流,以及所述工作流所属的工作流组,以及所述工作流组所属的工程。
4.根据权利要求3所述的方法,其特征在于,还包括:
利用所述第一标识信息和第二标识信息,关联显示所述ETL目标数据模型中的各个数据模型;
针对每个所述数据模型,关联显示属于所述数据模型的每个工作流组;
针对每个所述工作流组,关联显示属于所述工作流组的每个工作流对应的第二数据模型。
5.根据权利要求1所述的方法,其特征在于,还包括:
接收ETL文件生成请求,所述ETL文件生成请求中包括ETL文件格式需求;
根据所述ETL目标数据模型,生成满足所述ETL文件格式需求的ETL文件。
6.根据权利要求5所述的方法,其特征在于,当所述ETL文件格式需求为生成的ETL文件的格式适用于任何数据平台时,
根据所述ETL目标数据模型,生成的ETL文件为可被任何所述数据平台识别的ETL中间结果文件;其中,所述ETL中间结果文件所应用的数据平台,可接收携带第一目标格式要求的转换请求,将所述中间结果文件转换成满足所述第一目标格式要求的ETL文件。
7.根据权利要求6所述的方法,其特征在于,当所述ETL文件格式需求为生成的ETL文件的格式适用于目标数据平台时,
根据所述ETL目标数据模型,生成的ETL文件为满足所述目标数据平台的第二目标格式要求的ETL文件。
8.根据权利要求5所述的方法,其特征在于,还包括:
将所述ETL文件发送至共享服务器,以实现所述ETL文件的共享。
9.根据权利要求5所述的方法,其特征在于,还包括:
响应接收到的ETL测试请求,将所述ETL文件发送至远程服务器;
接收所述远程服务器反馈的所述ETL文件的测试结果。
10.一种ETL模型生成装置,其特征在于,应用于ETL开发平台,所述ETL开发平台包括至少一种扩展,每种所述扩展对应ETL作业中的唯一种业务处理方式;每种所述扩展包括至少一个第一数据模型,所述第一数据模型为以组件作为最小构成单元生成的指示特定数据处理流程的模型;所述组件指示所述特定数据处理流程中的单个处理动作;
该装置包括:
请求接收单元,用于接收ETL模型生成请求,所述ETL模型生成请求中携带ETL需求分析;
信息确定单元,用于确定所述ETL需求分析包括的各个工程,分别属于每个所述工程的各个工作流组,以及分别属于每个所述工作流组的各个工作流;
数据模型生成单元,用于针对每个所述工程,利用所述工程所属的扩展中的第一数据模型,生成与所述工程对应的数据模型,所述数据模型包括:所述工程中的各个工作流组中每个工作流对应的第二数据模型;
ETL目标数据模型生成单元,用于根据各个所述数据模型,生成与所述ETL模型生成请求对应的ETL目标数据模型。
CN201610581334.1A 2016-07-21 2016-07-21 一种etl模型生成方法及装置 Active CN106021624B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610581334.1A CN106021624B (zh) 2016-07-21 2016-07-21 一种etl模型生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610581334.1A CN106021624B (zh) 2016-07-21 2016-07-21 一种etl模型生成方法及装置

Publications (2)

Publication Number Publication Date
CN106021624A true CN106021624A (zh) 2016-10-12
CN106021624B CN106021624B (zh) 2019-07-09

Family

ID=57116180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610581334.1A Active CN106021624B (zh) 2016-07-21 2016-07-21 一种etl模型生成方法及装置

Country Status (1)

Country Link
CN (1) CN106021624B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609124A (zh) * 2017-09-15 2018-01-19 山东浪潮云服务信息科技有限公司 一种数据管理方法及数据管理平台
CN112084182A (zh) * 2020-09-10 2020-12-15 重庆富民银行股份有限公司 一种用于数据集市和数据仓库的数据建模方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120095957A1 (en) * 2010-10-18 2012-04-19 Tata Consultancy Services Limited Component Based Approach to Building Data Integration Tools
CN103455540A (zh) * 2012-05-29 2013-12-18 Sap股份公司 从数据仓库模型生成内存模型的系统和方法
CN103984755A (zh) * 2014-05-28 2014-08-13 中国地质大学(北京) 基于多维度模型的油气资源数据要览系统实现方法及系统
CN104778236A (zh) * 2015-04-02 2015-07-15 上海烟草集团有限责任公司 一种基于元数据的etl实现方法及系统
CN105677346A (zh) * 2016-01-04 2016-06-15 浪潮软件集团有限公司 一种web界面的动态扩展方法和服务器
CN105787059A (zh) * 2016-02-29 2016-07-20 四川长虹电器股份有限公司 基于数据仓库的财务数据整合方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120095957A1 (en) * 2010-10-18 2012-04-19 Tata Consultancy Services Limited Component Based Approach to Building Data Integration Tools
CN103455540A (zh) * 2012-05-29 2013-12-18 Sap股份公司 从数据仓库模型生成内存模型的系统和方法
CN103984755A (zh) * 2014-05-28 2014-08-13 中国地质大学(北京) 基于多维度模型的油气资源数据要览系统实现方法及系统
CN104778236A (zh) * 2015-04-02 2015-07-15 上海烟草集团有限责任公司 一种基于元数据的etl实现方法及系统
CN105677346A (zh) * 2016-01-04 2016-06-15 浪潮软件集团有限公司 一种web界面的动态扩展方法和服务器
CN105787059A (zh) * 2016-02-29 2016-07-20 四川长虹电器股份有限公司 基于数据仓库的财务数据整合方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609124A (zh) * 2017-09-15 2018-01-19 山东浪潮云服务信息科技有限公司 一种数据管理方法及数据管理平台
CN112084182A (zh) * 2020-09-10 2020-12-15 重庆富民银行股份有限公司 一种用于数据集市和数据仓库的数据建模方法

Also Published As

Publication number Publication date
CN106021624B (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
US10275545B2 (en) Modeling and simulation
Claes et al. Merging event logs for process mining: A rule based merging method and rule suggestion algorithm
Pandey et al. Examining the role of enterprise resource planning (ERP) in improving business operations in companies
CN105046446B (zh) 一种基于工作流框架的自定义权限流程方法及系统
US20130166498A1 (en) Model Based OLAP Cube Framework
Rujirayanyong et al. A project-oriented data warehouse for construction
US20040148209A1 (en) System and method for producing an infrastructure project estimate for information technology
CN113326028B (zh) 一种基于领域驱动设计与业务全景事件风暴的微服务化分解方法
US9223847B2 (en) Using dimension substitutions in OLAP cubes
Saltz et al. Exploring the process of doing data science via an ethnographic study of a media advertising company
CN101208692A (zh) 在企业软件系统的活数据立方体间自动移动多维数据
CA2772824C (en) Role mapping and training tool
US8291380B2 (en) Methods for configuring software package
CN106021624A (zh) 一种etl模型生成方法及装置
Liu et al. A multi-agent-based mould due date setting approach in stochastic production
Badem et al. Industry 4.0 revolution and the future of accounting applications
Dumitriu Modelling and simulation software solutions as a premise for enhancing processes’ quality and business overall value
CN113743791A (zh) 一种业务工单的业务考评方法、装置、电子设备和介质
CN114860851A (zh) 数据处理方法、装置、设备及存储介质
Goel et al. End-to-end process extraction in process unaware systems
Ordóñez de Pablos Knowledge management and drivers of innovation in services industries
Strutynska et al. Developing Practical Recommendations for Increasing the Level of Digital Business Transformation Index.
Sharif et al. Evaluating the potentials of technical cooperation among developing countries
CN109670682B (zh) 一种军民融合在线体系服务平台及其数据管理方法
Kalwar et al. Automation of Post-Order Costing Analysis By Using Visual Basic For Applications In Microsoft Excel: A Case Study

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant