CN115525724A

CN115525724A - 应用于数据仓库的建模方法、系统以及电子设备

Info

Publication number: CN115525724A
Application number: CN202211215551.0A
Authority: CN
Inventors: 马永刚; 江岚
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2022-09-30
Filing date: 2022-09-30
Publication date: 2022-12-27

Abstract

本申请公开了一种应用于数据仓库的建模方法、系统以及电子设备。其中，该方法包括：接收来自于客户端的模型构建指令；输出构建提示信息至客户端，并接收客户端返回的模型构建信息，其中，模型构建信息基于构建提示信息所建立，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；对多个指标元素进行组合，生成数据仓库的指标；基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。本申请解决了相关技术中数据仓库建模的成本较高的技术问题。

Description

应用于数据仓库的建模方法、系统以及电子设备

技术领域

本申请涉及数据处理领域，具体而言，涉及一种应用于数据仓库的建模方法、系统以及电子设备。

背景技术

目前，在大数据已经成为基本生产要素的社会大背景下，无论是企业还是社会组织产生的数据都呈现井喷式增长，一方面大数据的有效分析和治理已经成为企业和社会数字化转型的重中之重，另一方面数据仓库建模的门槛和成本居高不下，使得大量数据分析治理的需求不能得到及时有效的结果。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种应用于数据仓库的建模方法、系统以及电子设备，以至少解决相关技术中数据仓库建模的成本较高的技术问题。

根据本申请实施例的一个方面，提供了一种应用于数据仓库的建模方法，包括：接收来自于客户端的模型构建指令；输出构建提示信息至客户端，并接收客户端返回的模型构建信息，其中，模型构建信息基于构建提示信息所建立，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；对多个指标元素进行组合，生成数据仓库的指标；基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

根据本申请实施例的一个方面，提供了一种应用于数据仓库的建模方法，包括：响应于在客户端的操作界面上的模型构建指令，在操作界面上显示来自于服务器的构建提示信息；响应于对构建提示信息进行的构建指令，获取构建指令对应的模型构建信息，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；发送模型构建信息至服务器，其中，多个指标元素用于通过组合生成数据仓库的指标，维度逻辑表、事实逻辑表和指标用于生成数据仓库的物理模型，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

根据本申请实施例的一个方面，提供了一种应用于数据仓库的建模系统，包括：客户端，用于生成模型构建指令，并基于构建提示信息建立模型构建信息，其中，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；服务器，与客户端连接，用于生成构建提示信息，对多个指标元素进行组合，生成数据仓库的指标，并基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

根据本申请实施例的一个方面，提供了一种计算机可读存储介质，计算机可读存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行上述实施例中任意一项的方法。

根据本申请实施例的一个方面，提供了一种电子设备，其特征在于，包括：存储器，存储有可执行程序；处理器，用于运行程序，其中，程序运行时执行上述实施例中任意一项的方法。

在本申请实施例中，首先接收来自于客户端的模型构建指令；输出构建提示信息至客户端，并接收客户端返回的模型构建信息，其中，模型构建信息基于构建提示信息所建立，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；对多个指标元素进行组合，生成数据仓库的指标；基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果，实现了降低数据仓库建模的成本。容易注意到的是，通过把数据仓库建模的过程规范化、标准化，并基于该标准化流程提供智能化的建模引擎，实现了可视化、自动化建模，可以有效降低数据仓库建模的门槛，从而花较少的精力建立高质量的数据仓库模型，降低数据治理成本，进而解决了相关技术中数据仓库建模的成本较高的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种用于实现应用于数据仓库的建模方法的计算机终端(或移动设备)的硬件结构框图；

图2是根据本申请实施例的一种计算环境的结构框图；

图3是根据本申请实施例的一种服务网格的结构框图；

图4是根据本申请实施例1的应用于数据仓库的建模方法的流程图；

图5是根据本申请实施例的一种规范建模自动化指标元素示意图；

图6是根据本申请实施例的一种规范化智能建模引擎的系统架构图；

图7是根据本申请实施例的一种规范化建模的任务架构图；

图8是根据本申请实施例的一种规范化建模的流程图；

图9是根据本申请实施例的一种规范化智能建模引擎处理流程图；

图10是根据本申请实施例2的一种应用数据仓库的建模方法的流程图；

图11是根据本申请实施例3的一种应用于数据仓库的建模方法的示意图；

图12是根据本申请实施例4的一种应用于数据仓库的建模方法的示意图；

图13是根据本申请实施例的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释：

物理表：大数据引擎和数据库的真实的表。

逻辑表：根据任务需求，在任务逻辑层面定义的数据表，逻辑表屏蔽了底层不同大数据引擎的物理实现差异。

维度：数据仓库建模概念，是任务事件发生所处环境的属性信息。

事实：数据仓库建模概念，任务事件发生所处环境和过程信息。

数据定义语言(Data Definition Language，简称为DDL)：数据定义语句，本方案中主要指物理表的创建结构化查询语言(Structured Query Language，简称为SQL)。

在大数据已经成为基本生产要素的社会大背景下，无论企业和社会组织产生的数据都呈现井喷式增长，一方面大数据的有效分析和治理已经成为企业和社会数字化转型的重中之重，另一方面数据仓库建模的门槛和成本居高不下、使得大量数据分析治理的需求不能得到及时有效的解决，主要问题集中在以下几个方面：

(1)数据仓库建模的专业性要求很高，从业人员需要熟悉大量建模领域的知识和各种大数据处理引擎。

(2)对于如何建立好模型，缺乏规范化的、全流程的思考，建好的模型后期质量管控和治理的难度都非常大。

对于上述问题，本申请提供了一种应用于数据仓库的建模方法，能够有效的降低数据仓库建模的门槛，让用户可以花很少的精力就可以建立高质量的数据仓库模型，从而解决了相关技术中数据仓库建模的成本较高的技术问题。

实施例1

根据本申请实施例，提供了一种应用于数据仓库的建模方法，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1是根据本申请实施例的一种用于实现应用于数据仓库的建模方法的计算机终端(或移动设备)的硬件结构框图。如图1所示，计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b，……，102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器104可用于存储应用软件的软件程序以及模块，如本申请实施例中的应用于数据仓库的建模方法对应的程序指令/数据存储装置，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用于数据仓库的建模方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。

图1是根据本申请实施例的一种硬件结构框图，不仅可以作为上述计算机终端10(或移动设备)的示例性框图，还可以作为上述服务器的示例性框图，一种可选实施例中，图2以框图示出了使用上述图1所示的计算机终端10(或移动设备)作为计算环境201中计算节点的一种实施例。图2是根据本申请实施例的一种计算环境的结构框图，如图2所示，计算环境201包括运行在分布式网络上的多个(图中采用210-1，210-2，…,来示出)计算节点(如服务器)。每个计算节点都包含本地处理和内存资源，终端用户202可以在计算环境201中远程运行应用程序或存储数据。应用程序可以作为计算环境301中的多个服务220-1,220-2,220-3和220-4进行提供，分别代表服务“A”，“D”，“E”和“H”。

终端用户202可以通过客户端上的web浏览器或其他软件应用程序提供和访问服务，在一些实施例中，可以将终端用户202的供应和/或请求提供给入口网关230。入口网关230可以包括一个相应的代理来处理针对服务220(计算环境201中提供的一个或多个服务)的供应和/或请求。

服务220是根据计算环境201支持的各种虚拟化技术来提供或部署的。在一些实施例中，可以根据基于虚拟机(VM)的虚拟化、基于容器的虚拟化和/或类似的方式提供服务220。基于虚拟机的虚拟化可以是通过初始化虚拟机来模拟真实的计算机，在不直接接触任何实际硬件资源的情况下执行程序和应用程序。在虚拟机虚拟化机器的同时，根据基于容器的虚拟化，可以启动容器来虚拟化整个操作系统(OS)，以便多个工作负载可以在单个操作系统实例上运行。

在基于容器虚拟化的一个实施例中，服务220的若干容器可以被组装成一个POD(例如，Kubernetes POD)。举例来说，如图2所示，服务220-2可以配备一个或多个POD 240-1,240-2，…，240-N(统称为POD 240)。每个POD 240可以包括代理245和一个或多个容器242-1,242-2，…，242-M(统称为容器242)。POD 240中一个或多个容器242处理与服务的一个或多个相应功能相关的请求，代理245通常控制与服务相关的网络功能，如路由、负载均衡等。其他服务220也可以为类似于POD 240的POD。

在操作过程中，执行来自终端用户202的用户请求可能需要调用计算环境201中的一个或多个服务220，执行一个服务220的一个或多个功能需要调用另一个服务220的一个或多个功能。如图2所示，服务“A”220-1从入口网关230接收终端用户202的用户请求，服务“A”220-1可以调用服务“D”220-2，服务“D”220-2可以请求服务“E”220-3执行一个或多个功能。

上述的计算环境可以是云计算环境，资源的分配由云服务提供上管理，允许功能的开发无需考虑实现、调整或扩展服务器。该计算环境允许开发人员在不构建或维护复杂基础设施的情况下执行响应事件的代码。服务可以被分割完成一组可以自动独立伸缩的功能，而不是扩展单个硬件设备来处理潜在的负载。

另一种可选实施例中，图3以框图示出了使用上述图1所示的计算机终端10(或移动设备)作为服务网格的一种实施例。图3是根据本申请实施例的一种服务网格的结构框图，如图3所示，该服务网格300主要用于方便多个微服务之间进行安全和可靠的通信，微服务是指将应用程序分解为多个较小的服务或者实例，并分布在不同的集群/机器上运行。

如图3所示，微服务可以包括应用服务实例A和应用服务实例B，应用服务实例A和应用服务实例B形成服务网格300的功能应用层。在一种实施方式中，应用服务实例A以容器/进程308的形式运行在机器/工作负载容器组314(POD)，应用服务实例B以容器/进程310的形式运行在机器/工作负载容器组316(POD)。

在上述运行环境下，本申请提供了如图4所示的应用于数据仓库的建模方法。图4是根据本申请实施例1的应用于数据仓库的建模方法的流程图。如图4所示，该方法可以包括如下步骤：

步骤S402，接收来自于客户端的模型构建指令。

上述的客户端可以是用户所使用的客户端，用户可以通过该客户端发送模型构建指令，以便系统可以根据该模型构建指令构建出用户所需要的数据仓库的物理模型。

在一种可选的实施例中，用户可以在客户端的显示界面上点击模型构建按钮，以便生成模型构建指令，并将生成的模型构建指令发送到用于进行模型构建的系统中。

步骤S404，输出构建提示信息至客户端，并接收客户端返回的模型构建信息。

其中，模型构建信息基于构建提示信息所建立，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素。

上述的构建提示信息可以是提示客户输入模型构建所需要的模型构建信息，以便根据该模型构建信息进行模型的构建。

在一种可选的实施例中，系统在接收到模型构建指令之后，可以输出构建提示信息至客户端，并将该构建提示信息显示在客户端的显示界面上，或者可以将该构建提示信息以语音播放的形式输出。用户可以根据客户端输出的构建提示信息，在客户端中输入该构建提示信息对应的模型构建信息，以便通过客户端将模型构建信息发送至系统，便于系统根据该模型构建信息构建数据仓库的物理模型。

上述的维度逻辑表可以是用户根据任务需求设定的维度对应的逻辑表，用于表示需要获取哪些维度的数据。通过该维度逻辑表可以限定最终获取到的数据的维度。

示例性的，维度逻辑表中，店铺的维度可以为名称、标识、地址等，地域的维度可以为省、市、县、区、街道等，时间的维度可以为年、月、日、时、分、秒等，用户的维度可以为标识、名称、类型、信息等，产品的维度可以为标识、名称、类别、属性等。

上述的事实逻辑表可以是用户根据任务需求设定的事件对应的逻辑表，用于表示需要获取哪些事件的数据。通过该事实逻辑表可以限定最终获取到的数据的类型。

示例性的，事实逻辑表的可以是订单的下单事件、下单金额等。

上述的多个指标元素可以是用户通过选择显示的多个指标控件得到的。其中，多个指标元素用于按照对应的逻辑对数据进行处理，以便于获取到的数据可以符合对应的指标。

在一种可选的实施例中，可以通过大数据处理引擎手动编写出上述的维度逻辑表和事实逻辑表。

步骤S406，对多个指标元素进行组合，生成数据仓库的指标。

上述数据仓库的指标可以用于从多个数据获取到最终所需要的数据，并且最终的数据按照该指标的逻辑进行排列。

在一种可选的实施例中，可以根据用户自定义的组合方式对多个指标元素进行组合，生成数据仓库的指标。也可以遍历各种组合方式对多个指标元素进行组合，生成数据仓库的指标。也可以随机对多个指标元素进行组合，生成数据仓库的指标。此处对多个指标元素的组合方式不进行限定，还可以是其他任意的组合方式。

在另一种可选的实施例中，用户可以根据任务的需求对多个指标元素进行组合，生成数据仓库的指标。

步骤S408，基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型。

其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

在一种可选的实施例中，可以根据维度逻辑表、事实逻辑表和指标，规范化的生成数据仓库的物理模型，整个建模的流程可视化，用户不需要关心具体的实现，只需要根据流程完成定义，系统就可以自动化的生成真实的数据仓库的物理模型和调度任务。

在另一种可选的实施例中，在生成数据仓库的物理模型之后，可以定时的从数据仓库中获取原始数据进行统计处理，得到统计结果；也可以根据用户的需求随时从数据仓库中获取原始数据进行统计处理，得到统计结果。

在又一种可选的实施例中，可以在生成数据仓库的物理模型之后，输出提示信息，用于提示该物理模型已经生成，用户可以使用该物理模型对输入至数据仓库的原始数据进行统计处理，得到统计结果。

在电商数据仓库对应的物理模型构建场景中，可以先接收来自于客户端的模型构建指令，输出构建提示信息至客户端，客户端可以根据构建提示信息添加需要获取的电商数据的维度逻辑表和事实逻辑表，该维度逻辑表可以是男性顾客、女性顾客、店铺等不同维度，该事实逻辑表可以是下单时的数据、评价数据等，可以展示多个指标元素，例如，一年的数据、购买商品的数据等，对多个指标元素进行组合，生成数据仓库的指标，可以根据维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，以便于通过该物理模型对电商领域的原始数据进行统计处理，得到用户需要的统计结果。

针对于数据仓库建模需求的不断增长，但是数据仓库建模门槛较高，大量数据分析治理的需求无法得到有效满足的问题，本申请提出了一种规范化智能数据仓库建模方法，通过把数据仓库建模的过程规范化、标准化，并基于该标准化流程提供智能化的建模引擎，实现了可视化、自动化建模，可以有效降低数据仓库建模的门槛，让用户可以花很少的精力就可以建立高质量的数据仓库模型，降低数据治理的成本。业界大多数的数据仓库产品有的是针对逻辑模型设计，有的是针对大数据场景下的物理模型的计算效率。本申请提出的规范化的智能数据仓库建模方法可以把逻辑模型设计和物理模型设计结合在一起的，可以按照范化的流程完成逻辑模型设计和定义后，系统可以以自动化的实现物理代码和任务的生成。

通过上述步骤，首先，接收来自于客户端的模型构建指令；输出构建提示信息至客户端，并接收客户端返回的模型构建信息，其中，模型构建信息基于构建提示信息所建立，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；对多个指标元素进行组合，生成数据仓库的指标；基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果，实现了降低数据仓库建模的成本。容易注意到的是，通过把数据仓库建模的过程规范化、标准化，并基于该标准化流程提供智能化的建模引擎，实现了可视化、自动化建模，可以有效降低数据仓库建模的门槛，从而花较少的精力建立高质量的数据仓库模型，降低数据治理成本，进而解决了相关技术中数据仓库建模的成本较高的技术问题。

本申请上述实施例中，输出构建提示信息至客户端，并接收客户端返回的模型构建信息，包括：输出第一提示信息至客户端，其中，第一提示信息用于提示客户端建立维度逻辑表和事实逻辑表；接收来自于客户端的维度逻辑表和事实逻辑表；输出第二提示信息至客户端，其中，第二提示信息用于提示客户端基于多个指标元素对应的多个组件集合建立多个指标元素，每个组件集合包含的不同组件用于表征该组件集合对应的指标元素的不同元素值；接收来自于客户端的多个指标元素，其中，多个指标元素由分别从多个组件集合中选择的多个第一组件确定。

上述的构建提示信息包括第一提示信息和第二提示信息。

在一种可选的实施例中，在接收到客户端的模型构建指令之后，可以先输出第一提示信息至客户端，以便于用户可以根据客户端显示的第一提示信息上传维度逻辑表和事实逻辑表，在接收到客户端发送的维度逻辑表和事实逻辑表之后，可以发送第二提示信息至客户端，客户端在接收到第二提示信息之后，可以显示多个组件集合，用户可以从多个组件集合中选取所需要的指标元素对应的组件集合，并从该组件集合中确定指标元素的元素值，从而确定出多个指标元素，并将该指标元素发送至客户端。

在另一种可选的实施例中，可以根据所需要的指标元素的元素值从组件集合的第一组件选取指标元素，需要说明的是，可以从多个组件集合中选取所需要的组件集合，并从所需要的组件集合中的多个第一组件确定出指标元素。

上述的组件集合和组件集合中的第一组件可以以控件的方式显示在客户端，以便用户通过控件选定。客户端在接收到第二提示信息之后，可以显示多个组件集合，在选定组件集合之后，可以显示该组件集合对应的第一组件，并从第一组件中确定出指标元素；一般会确定多个指标元素，因此，可以是从所需要的多个组件集合中的每个组件集合中各选取一个指标元素，或者是从任意的组件集合中选取多个指标元素，在此不作具体限定。

在对指标元素进行拆分后，根据不同的任务需求，用户可以选择不同的组件进行组合，快速生产指标，比如任务需要最近1天、最近1个月的统计数据，只需要选择对应的时间周期就可以了。通过这种规范化的拆分，用户可以快速自动化的开发大量的业务指标，可以极大的提高建模的效率，同时由于系统自动化，降低了出错的概率，提升建模的质量。

本申请上述实施例中，接收来自于客户端的多个指标元素，包括：接收来自于客户端的选择指令，其中，选择指令用于分别对多个组件集合包含的不同组件进行选择；输出选择指令对应的多个第一组件至客户端；接收来自于客户端的多个指标元素，其中，多个指标元素为对多个第一组件进行修改所得到的。

在一种可选的实施例中，若显示的多个第一组件没有用户所需要的，用户还可以对第一组件进行修改，得到所需要的指标元素，可选的，可以展示多个组件集合包含的不同组件，用户可以对多个组件集合包含的不同组件进行选择，生成选择指令，输出选择指令对应的多个第一组件至客户端，输出的多个第一组件可以是用户需要进行修改的组件，用户可以对多个第一组件进行修改，生成多个第一组件对应的修改后的多个指标元素，以便在多个第一组件没有用户所需要的组件的情况下，通过对多个第一组件进行修改，可以得到用户所需要的多个指标元素。

示例性的，统计周期的组件集合中包含的多个组件可以为按日统计、按月统计、按年统计，但是，用户需要按照半年进行统计，此时，可以选定按年统计的第一组件，并将该第一组件修改为按半年统计，从而得到按半年统计的指标元素。

本申请上述实施例中，多个指标元素包括:原子指标、场景限定、统计周期和统计粒度，其中，原子指标用于表征对原始数据进行统计的处理逻辑，场景限定用于表征对原始数据所属场景进行筛选的筛选逻辑，统计周期用于表征对原始数据进行统计的周期，统计粒度用于表征对原始数据进行统计的维度。

在一种可选的实施例中，原子指标用于表征对原始数据进行统计的处理逻辑，该处理逻辑可以是对原始数据进行统计的最小的计算逻辑，例如：求和、求差等。场景限定可以是对原始数据所属场景进行筛选的筛选逻辑，通过原始数据所属场景可以确定需要获取哪些场景下的数据，例如：使用手机产生的数据、使用电脑产生的数据、男性顾客的数据、女性顾客的数据等。统计周期可以是对原始数据进行统计的周期，通过统计周期可以确定需要获取哪些时段下的数据，例如：一年以内的数据、一个月的数据、一周的数据、一天的数据等。统计粒度可以是对原始数据进行统计的维度，通过统计粒度可以知道要获取哪些维度的数据，例如：按照店铺获取数据、按照商品类型获取数据、按照行业类型获取数据。

在另一种可选的实施例中，规范化建模的核心主要是针对数据中间层的数据进行处理，数据中间层的一个重要目标就是对数据进行汇总计算，生成汇总数据表，围绕这一目的，可以将指标元素拆分为：原子指标、场景限定、统计周期和统计粒度，这样就可以定义一种可视化的建模流程，用户不需要关心具体的实现，只要根据流程完成定义，系统就可以自动化的生成真实的物理模型和调度任务。

图5是根据本申请实施例的一种规范建模自动化指标元素示意图，如图5所示，其说明了为什么指标元素可以拆分为原子指标、任务限定、统计周期和统计粒度，拆分后的系统如何进行自动化的指标计算SQL生成。其中，用户建立模型的目标是统计最近7天每个店通过手机支付完成的总的成交额，经过拆分后，最小的计算逻辑就是对成交额求和，所以定义原子指标可以是：原子求和[sum(amount)]；统计结果只针对通过手机完成支付的用户，需要对所有订单数据，根据支付的渠道(channel)进行筛选，所以定义场景限定的逻辑为：channel＝'手机'；统计的时间范围为最近7天，所以选择最近7天的统计周期，即，统计周期为：最近七天。由于是对每个店进行统计，因此，需要按照店铺的粒度进行统计，即，统计粒度为：门店位置。完成定义后系统就可以自动生成指标元素的计算结构化查询语言(Structured Query Language，简称为SQL)：

select sum(amount)

from fct_order

where channel＝'手机'and ds>＝20220701and ds<＝20220707

group by store_id

上述的原子指标、场景限定、统计周期和统计粒度可以由用户进行选定，也可以按照默认选项确定。

本申请上述实施例中，基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，包括：基于维度逻辑表和事实逻辑表，从原始数据中确定指标对应的依赖数据；获取物理表中每个字段的使用热度；基于依赖数据的产出时间和每个字段的使用热度，生成物理模型。

上述的依赖数据是指维度逻辑表和事实逻辑表中的上游任务系统产出的原始数据。

在一种可选的实施例中，用户在定义了维度逻辑表和事实逻辑表之后，模型智能构建引擎可以结合模型的上游产出时间，下游使用热度，生成逻辑表的物理化方案，可以从原始数据中确定指标对应的依赖数据，可以根据依赖数据的产出时间对物理表进行拆分，将产出时间一致或者接近的物理表拆分出来，这样可以拆分出多个依赖数据产出时间不同的物理表，可以获取物理表中每个字段的使用热度，对于使用热度较高的字段，也即使用频率较高的字段进行备份，在每个物理表中都进行存储，这样可以避免后续物理表之间的关系建立，可以减少运算资源的占用。将使用热度较高的字段存储在每个物理表中，这样物理表在使用该字段的过程中，就不需要调用其他关联的物理表，使用物理表中备份的字段即可。

本申请上述实施例中，物理模型包括：物理表和调度任务，其中，基于依赖数据的产出时间和每个字段的使用热度，生成物理模型，包括：基于依赖数据的产出时间和每个字段的使用热度，生成物理模型的物理化策略，其中，物理化策略用于确定物理表的数量和物理表中包含的字段；基于物理化策略，生成物理模型的结构化查询语言和数据定义语句；基于结构化查询语言生成调度任务，其中，调度任务用于对原始数据进行统计处理，得到统计结果；基于数据定义语句创建物理表，其中，物理表用于存储统计结果。

在一种可选的实施例中，可以根据依赖数据的产出时间和每个字段的使用热度，生成物理模型的物理化策略。可选的，可以根据物化规则集合和物化规则配置生成物理化策略，其中，物化规则集合可以用于对物理表进行拆分操作和冗余操作，物化配置集合可以用于创建物理表、修改物理表和更新物理表，可以生成物理化策略；可选的，可以根据依赖数据的产出时间对物理表进行拆分操作，以便将产出时间不同的依赖数据划分到不同的物理表中，这样用户可以快速的拿到产出时间较早的数据，晚一点拿到产出时间较晚的数据，避免将数据都集中在一个较晚的时间点给用户，导致用户拿到数据的时间较晚；可以根据每个字段的使用热度挑选出使用热度较高的字段，并在每个物理表中备份该字段，在物理表需要使用该字段的时候可以快速拿到，避免调用其他包含有该字段的物理表获取到该字段，可以减少调度资源的浪费。

上述的调度任务可以是程序语言，主要用于执行对原始数据的统计处理过程。

在另一种可选的实施例中，可以根据物理化策略，生成物理模型的结构化查询语言和定义语句，可以根据结构化查询语言生成调度任务，其中，可以根据调度任务对原始数据进行统计处理，得到统计结果。可选的，模型SQL的生成，根据模型智能构建引擎生成物理模型，自动生成物理模型的DDL和计算SQL，并对SQL进行过滤条件上推等更新处理。

上述的数据定义语句可以是由用户自行设定，可以根据数据定义语句创建物理表，其中，该数据定义语句可以在底层大数据引擎上完成物理表创建和计算任务的创建，可以运行定时信息收集任务，主要负责收集数据仓库里面模型产出的时间，分析模型下游使用情况计算字段热度。定时任务还可以用于进行查询字段的统计、字段产出时间统计以及逻辑表生命周期的设置。

图6是根据本申请实施例的一种规范化智能建模引擎的系统架构图，如图6所示，用户可以通过规范化建模流程定义的模型，都是通过智能建模引擎的处理，在底层大数据引擎上生成实际的物理模型，智能建模引擎的核心主要包括：

(1)模型智能构建，用户定义了逻辑表之后，模型智能构建引擎会结合模型的上游产出时间，下游的使用热度，生成逻辑表的物理化方案，模型智能构建过程中包含有物化规则集合和物化规则配置，可以根据物化规则集合和物化规则配置生成物理化策略，其中，物化规则集合可以用于对物理表进行拆分操作和冗余操作，物化规则配置可以用于创建物理表、修改物理表和更新物理表。物化规则配置可以是对于新建模型，由于新建模型没有下游使用热度，因此，可以直接创建模型，后续过程中可以基于下游使用热度进行修改和更新。图6中的物化结果就是真实存储数据的物理表，例如，一个逻辑表中如果有N个字段，需要几个物理表去承载这N个字段，每个物理表有哪些字段，物理表就是实际存在，会在计算引擎去创建的，真实存储数据的表。SQL归一化可以是内部更新的规则。

(2)模型SQL生成，根据模型智能构建引擎生成的物理模型，自动生成物理模型的DDL和计算SQL，并对SQL进行过滤条件上推等更新处理。其中，模型SQL生成中包含有SQL归一化、SQL生成器和数据定义语言，SQL归一化中包含有分区补充和去子查询的功能，SQL生成器中包含有维度表、事实表和汇总表。

(3)任务生成，在底层大数据引擎上完成物理表创建和计算任务的创建，得到调度任务和调度依赖。

(4)定时信息收集任务，主要负责收集数据仓库里的模型产出时间，分析模型下游使用情况计算字段热度，定时任务中可以包含有查询统计、字段产出时间统计。查询统计(Os query)是为了统计字段的使用热度，为了物化拆分时的冗余字段服务。字段产出时间统计就是上游依赖产出时间，也包括每个任务自己的产出时间，由于当前任务可能是另一个任务的下游，因此其是为了物化的拆分服务的。

本申请上述实施例中，基于依赖数据的产出时间和每个字段的使用热度，生成物理模型的物理化策略，包括：基于依赖数据中不同数据的产出时间之间的时间差，生成拆分策略，其中，拆分策略用于确定物理表的数量；基于每个字段的使用热度对拆分策略进行调整，得到调整后的拆分策略；基于每个字段的使用热度生成冗余字段，其中，冗余字段用于表征不同物理表中均存在的字段；基于调整后的拆分策略和冗余字段，生成物理化策略。

在一种可选的实施例中，可以获取依赖数据中不同数据的产出时间之间的时间差，以便于根据该时间差生成拆分策略，对于时间差较大的数据，可以拆分为两个物理表进行存储，对于时间差较小的数据，可以合并在一个物理表中进行存储，可以根据生成的拆分策略确定出物理表的数量；可以根据每个字段的使用热度对于使用热度较高的字段可以进行备份，得到冗余字段，并将冗余字段存储在不同的物理表中，可以根据调整后的拆分策略和冗余字段，生成物理化策略。

物化规则是为了把用户创建的维度逻辑表和事实逻辑表转化为实际的物理表，一个逻辑表使用多个物理表比较合适，可以通过该规则计算出来，拆分是对上游产出的时间进行更新，避免上游产出时间差异较大，影响指标产出，例如，有100个指标，前99个指标对应的上游数据产出时间为10:00，另一个指标对应的上游数据产出时间为17:00，则可以拆分100个指标，前99个指标可以创建1个物理表，另一个指标可以创建另一个物理表。

冗余是对不同物理表中的字段进行备份，避免物理表之间进行关系建立，例如，可以对使用热度较高的字段进行备份，并在每个物理表中进行存储。

目前，数据仓库建模工具和产品主要分为两类：(1)传统的模型设计和管理工具，例如数据建模工具(PowerDesigner)，这一类工具主要帮助用户梳理和记录任务关系，设计模型，不关注模型的具体实施。(2)大数据数据仓库引擎，例如云数据仓库(AmazonRedshift)，这类系统主要关注的是超大规模数据场景下的计算效率。

上述(1)中的传统的模型设计和管理工具，其优点是比较轻量化，使用比较灵活，但是其缺点主要为：缺乏针对数据仓库建模的标准化设计流程，模型的设计流程和质量完全因人而异，不能避免模型的重复性、指标的二义性。只能做逻辑模型设计，模型设计完成后需要进行物理模型开发，用户需要自己写SQL建表，配置计算任务生产数据，建模的成本依然比较高。

上述(2)中的大数据数据仓库引擎，其优点是关注数据计算的性能，提供标准的SQL操作，用户可以直接使用SQL进行物理模型开发。但是其缺点主要是缺乏针对数据仓库建模的标准化设计流程，无法进行可视化建模，建模的成本依然较高；模型需要用户自己去进行SQL开发，怎样开发出好的模型，需要用户比较熟悉引擎特性；只能针对用户建立好的模型，做大规模数据计算时的优化，无法在更高的层面，从多个模型的关系角度去优化和提升大数据场景下模型的计算效率。

本申请中，可以从以下几个方面针对性的解决数据仓库建模的痛点问题：(1)通过把数据仓库建模的过程规范化、标准化，并基于该标准化流程提供了智能化的建模引擎，可以实现可视化、自动化建模，可以有效的降低数据仓库建模的门槛，让用户可以花很少的精力就可以建立高质量的数据仓库的物理模型。(2)通过规范化的流程，可以有效避免数据指标的重复性建设、降低指标的二义性，在开发前和开发中都融入数据的治理理念，降低事后治理的成本和难度。

图7是根据本申请实施例的一种规范化建模的任务架构图，数据仓库建模场景下，数据一般分为三个层:(1)数据来源层，数据仓库数据的来源，一般都来自任务系统，数据会在这一层使用提取、转化、加载(extract、transform，load，简称为ETL)工具做一些基本的清洗和加工。(2)数据中间层，主要目标是在这一层对数据进行分析，构建模型关系，通过生成一些指标对数据进行汇总计算，生成汇总表数据，供上层应用使用，可选的，可以根据数据来源层的原始数据构建维度逻辑表和事实逻辑表，可以根据事实逻辑表进行任务限定和原子指标，可以根据任务限定和原子指标生成指标，根据指标得到汇总表。(3)数据应用层，主要是面向应用的数据服务层，主要对接具体的数据应用，可以将汇总表作用于使用加工的数据结果的各类应用。

图8是根据本申请实施例的一种规范化建模的流程图，用户进行指标建模的流程，用户可以通过规范定义的数据元素，按照流程可视化进行各个元素的定义，得到可视化的数据模型，模型提交后由系统自动化构建模型SQL。首先开始建模，然后建立维度逻辑表、事实逻辑表，并定义原子指标、任务限定、指标，系统自动化生成指标计算逻辑和任务。

图9是根据本申请实施例的一种规范化智能建模引擎处理流程图，如图9所示，该步骤包括：

步骤S901，开始模型构建；

步骤S902，获取模型定义信息；

步骤S903，获取模型依赖数据产出时间；

步骤S904，获取模型下游使用信息；

步骤S905，智能物化策略选择；

步骤S906，判断上游依赖产出时间的时间差异大于预设值，执行步骤S907，执行步骤S910；

步骤S907，运行产出时间优先拆分规则；

步骤S908，计算下游使用热度；

步骤S909，根据热度调整拆分规则和增加冗余字段；

步骤S910，生成物理模型方案；

步骤S911，生成物理表计算数据定义语言和结构化查询语言；

步骤S912，结构化查询语言的更新和改写；

步骤S913，生成物理表计算任务；

步骤S914，执行物理表数据定义语言生成物理表；

步骤S915，模型构建成功。

通过该流程可以得到本申请可以对数据仓库中间层对数据仓库中间层建模的过程进行抽象，围绕指标构建提出了一种标准的建模流程和自动化构建指标的范式，依赖本申请的规范化建模流程，实现了一种可视化的数据仓库建模流程和系统，依赖本申请的规范化建模流程，实现了一种基于产出时间和下游使用热度的模型构建方法，可以完成逻辑模型到物理模型的自动化构建。

本申请可以降低开发数据仓库物理模型的门槛，使得大量有功能需求，但是不熟悉SQL开发和大数据引擎的用户，以较低的成本完成数据仓库模型开发。通过规范化的建模流程，用户完成各种数据元素的定义后，可以通过组合不同的数据元素，快速、大批量、高质量的开发指标，响应业务需求变化。通过规范化建模流程，在用户进行数据元素定义时系统可以进行检测，避免指标重复建设和二义性。同时由于系统自动化创建物理模型，定义即开发，可以保证模型开发的质量，降低开发好之后数据模型质量有问题带来的治理成本。规范化智能建模引擎在模型构建过程中考虑了模型的上下游关系，可以从全局的视角去做模型优化，解决了大数据引擎只能在单个物理模型内部进行更新的局限，使得整个数据仓库模型达到全局效果较好。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例的方法。

实施例2

根据本申请实施例，还提供了一种应用于数据仓库的建模方法，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图10是根据本申请实施例2的一种应用数据仓库的建模方法的流程图，如图10所示，该方法可以包括如下步骤：

步骤S1002，响应于在客户端的操作界面上的模型构建指令，在操作界面上显示来自于服务器的构建提示信息。

步骤S1004，响应于对构建提示信息进行的构建指令，获取构建指令对应的模型构建信息。

其中，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素。

步骤S1006，发送模型构建信息至服务器。

其中，多个指标元素用于通过组合生成数据仓库的指标，维度逻辑表、事实逻辑表和指标用于生成数据仓库的物理模型，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

本申请上述实施例中，响应于对构建提示信息进行的构建指令，获取生成指令对应的模型构建信息，包括：在操作界面上显示来自于服务器的第一提示信息，其中，第一提示信息用于提示客户端建立维度逻辑表和事实逻辑表；响应作用于操作界面上的第一构建指令，获取第一构建指令对应的维度逻辑表和事实逻辑表；在操作界面上第二提示信息，其中，第二提示信息用于提示基于多个指标元素对应的多个组件集合建立多个指标元素，每个组件集合包含的不同组件用于表征该组件集合对应的指标元素的不同元素值；响应于对多个组件集合进行的第二构建指令，获取第二构建指令对应的多个指标元素，其中，多个指标元素由分别从多个组件集合中选择的多个第一组件确定；基于维度逻辑表、事实逻辑表和多个指标元素，构建模型构建信息。

本申请上述实施例中，响应于对多个组件集合进行的第二构建指令，获取第二构建指令对应的多个指标元素，包括：响应于对多个组件集合进行的选择指令，在操作界面上显示选择指令对应的多个第一组件；响应于对多个第一组件进行修改的修改指令，确定修改指令对应的多个第二组件；基于多个第二组件构建多个指标元素。

需要说明的是，本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同，但不仅限于实施例1所提供的方案。

实施例3

根据本申请实施例，还提供了一种用于实施上述应用于数据仓库的建模方法的应用于数据仓库的建模装置，图11是根据本申请实施例3的一种应用于数据仓库的建模方法的示意图，如图11所示，该装置包括：接收模块1102、输出模块1104、组合模块1106、生成模块1108。

其中，接收模块用于接收来自于客户端的模型构建指令；输出模块用于输出构建提示信息至客户端，并接收客户端返回的模型构建信息，其中，模型构建信息基于构建提示信息所建立，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；组合模块用于对多个指标元素进行组合，生成数据仓库的指标；生成模块用于基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

此处需要说明的是，上述接收模块1102、输出模块1104、组合模块1106、生成模块1108对应于实施例1中的步骤S402至步骤S408，四个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例1所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例1提供的计算机终端中。

实施例4

根据本申请实施例，还提供了一种用于实施上述应用于数据仓库的建模方法的应用于数据仓库的建模装置，图12是根据本申请实施例4的一种应用于数据仓库的建模方法的示意图，如图12所示，该装置包括：显示模块1202、获取模块1204、发送模块1206。

其中，显示模块用于响应于在客户端的操作界面上的模型构建指令，在操作界面上显示来自于服务器的构建提示信息；获取模块用于响应于对构建提示信息进行的构建指令，获取构建指令对应的模型构建信息，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；发送模块用于发送模型构建信息至服务器，其中，多个指标元素用于通过组合生成数据仓库的指标，维度逻辑表、事实逻辑表和指标用于生成数据仓库的物理模型，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

此处需要说明的是，上述显示模块1202、获取模块1204、发送模块1206对应于实施例2中的步骤S1002至步骤S1006，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例1所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例1提供的计算机终端中。

实施例5

根据本申请实施例，还提供了一种应用于数据仓库的建模系统，该系统包括：客户端，用于生成模型构建指令，并基于构建提示信息建立模型构建信息，其中，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；服务器，与客户端连接，用于生成构建提示信息，对多个指标元素进行组合，生成数据仓库的指标，并基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

实施例6

本申请的实施例可以提供一种计算机终端，该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述计算机终端也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中，上述计算机终端可以执行应用于数据仓库的建模方法中以下步骤的程序代码：接收来自于客户端的模型构建指令；输出构建提示信息至客户端，并接收客户端返回的模型构建信息，其中，模型构建信息基于构建提示信息所建立，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；对多个指标元素进行组合，生成数据仓库的指标；基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

可选地，图13是根据本申请实施例的一种计算机终端的结构框图。如图13所示，该计算机终端A可以包括：一个或多个(图中仅示出一个)处理器、存储器。

其中，存储器可用于存储软件程序以及模块，如本申请实施例中的应用于数据仓库的建模方法和装置对应的程序指令/模块，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用于数据仓库的建模方法。存储器可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：接收来自于客户端的模型构建指令；输出构建提示信息至客户端，并接收客户端返回的模型构建信息，其中，模型构建信息基于构建提示信息所建立，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；对多个指标元素进行组合，生成数据仓库的指标；基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

可选的，上述处理器还可以执行如下步骤的程序代码：输出第一提示信息至客户端，其中，第一提示信息用于提示客户端建立维度逻辑表和事实逻辑表；接收来自于客户端的维度逻辑表和事实逻辑表；输出第二提示信息至客户端，其中，第二提示信息用于提示客户端基于多个指标元素对应的多个组件集合建立多个指标元素，每个组件集合包含的不同组件用于表征该组件集合对应的指标元素的不同元素值；接收来自于客户端的多个指标元素，其中，多个指标元素由分别从多个组件集合中选择的多个第一组件确定。

可选的，上述处理器还可以执行如下步骤的程序代码：接收来自于客户端的选择指令，其中，选择指令用于分别对多个组件集合包含的不同组件进行选择；输出选择指令对应的多个第一组件至客户端；接收来自于客户端的多个指标元素，其中，多个指标元素为对多个第一组件进行修改所得到的。

可选的，上述处理器还可以执行如下步骤的程序代码：多个指标元素包括:原子指标、场景限定、统计周期和统计粒度，其中，原子指标用于表征对原始数据进行统计的处理逻辑，场景限定用于表征对原始数据所属场景进行筛选的筛选逻辑，统计周期用于表征对原始数据进行统计的周期，统计粒度用于表征对原始数据进行统计的维度。

可选的，上述处理器还可以执行如下步骤的程序代码：基于维度逻辑表和事实逻辑表，从原始数据中确定指标对应的依赖数据；获取物理表中每个字段的使用热度；基于依赖数据的产出时间和每个字段的使用热度，生成物理模型。

可选的，上述处理器还可以执行如下步骤的程序代码：基于依赖数据的产出时间和每个字段的使用热度，生成物理模型的物理化策略，其中，物理化策略用于确定物理表的数量和物理表中包含的字段；基于物理化策略，生成物理模型的结构化查询语言和数据定义语句；基于结构化查询语言生成调度任务，其中，调度任务用于对原始数据进行统计处理，得到统计结果；基于数据定义语句创建物理表，其中，物理表用于存储统计结果。

可选的，上述处理器还可以执行如下步骤的程序代码：基于依赖数据中不同数据的产出时间之间的时间差，生成拆分策略，其中，拆分策略用于确定物理表的数量；基于每个字段的使用热度对拆分策略进行调整，得到调整后的拆分策略；基于每个字段的使用热度生成冗余字段，其中，冗余字段用于表征不同物理表中均存在的字段；基于调整后的拆分策略和冗余字段，生成物理化策略。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：响应于在客户端的操作界面上的模型构建指令，在操作界面上显示来自于服务器的构建提示信息；响应于对构建提示信息进行的构建指令，获取构建指令对应的模型构建信息，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；发送模型构建信息至服务器，其中，多个指标元素用于通过组合生成数据仓库的指标，维度逻辑表、事实逻辑表和指标用于生成数据仓库的物理模型，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

可选的，上述处理器还可以执行如下步骤的程序代码：在操作界面上显示来自于服务器的第一提示信息，其中，第一提示信息用于提示客户端建立维度逻辑表和事实逻辑表；响应作用于操作界面上的第一构建指令，获取第一构建指令对应的维度逻辑表和事实逻辑表；在操作界面上第二提示信息，其中，第二提示信息用于提示基于多个指标元素对应的多个组件集合建立多个指标元素，每个组件集合包含的不同组件用于表征该组件集合对应的指标元素的不同元素值；响应于对多个组件集合进行的第二构建指令，获取第二构建指令对应的多个指标元素，其中，多个指标元素由分别从多个组件集合中选择的多个第一组件确定；基于维度逻辑表、事实逻辑表和多个指标元素，构建模型构建信息。

可选的，上述处理器还可以执行如下步骤的程序代码：响应于对多个组件集合进行的选择指令，在操作界面上显示选择指令对应的多个第一组件；响应于对多个第一组件进行修改的修改指令，确定修改指令对应的多个第二组件；基于多个第二组件构建多个指标元素。

采用本申请实施例，提供了一种应用于数据仓库的建模方法。首先，接收来自于客户端的模型构建指令；输出构建提示信息至客户端，并接收客户端返回的模型构建信息，其中，模型构建信息基于构建提示信息所建立，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；对多个指标元素进行组合，生成数据仓库的指标；基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果，实现了降低数据仓库建模的成本。容易注意到的是，通过把数据仓库建模的过程规范化、标准化，并基于该标准化流程提供智能化的建模引擎，实现了可视化、自动化建模，可以有效降低数据仓库建模的门槛，从而花较少的精力建立高质量的数据仓库模型，降低数据治理成本，进而解决了相关技术中数据仓库建模的成本较高的技术问题。

本领域普通技术人员可以理解，图13所示的结构仅为示意，计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternet Devices，MID)、PAD等终端设备。图13其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图13中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图13所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(RandomAccess Memory，RAM)、磁盘或光盘等。

实施例7

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例一所提供的应用于数据仓库的建模方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：接收来自于客户端的模型构建指令；输出构建提示信息至客户端，并接收客户端返回的模型构建信息，其中，模型构建信息基于构建提示信息所建立，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；对多个指标元素进行组合，生成数据仓库的指标；基于维度逻辑表、事实逻辑表和指标，生成数据仓库的物理模型，其中，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：输出第一提示信息至客户端，其中，第一提示信息用于提示客户端建立维度逻辑表和事实逻辑表；接收来自于客户端的维度逻辑表和事实逻辑表；输出第二提示信息至客户端，其中，第二提示信息用于提示客户端基于多个指标元素对应的多个组件集合建立多个指标元素，每个组件集合包含的不同组件用于表征该组件集合对应的指标元素的不同元素值；接收来自于客户端的多个指标元素，其中，多个指标元素由分别从多个组件集合中选择的多个第一组件确定。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：接收来自于客户端的选择指令，其中，选择指令用于分别对多个组件集合包含的不同组件进行选择；输出选择指令对应的多个第一组件至客户端；接收来自于客户端的多个指标元素，其中，多个指标元素为对多个第一组件进行修改所得到的。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：多个指标元素包括:原子指标、场景限定、统计周期和统计粒度，其中，原子指标用于表征对原始数据进行统计的处理逻辑，场景限定用于表征对原始数据所属场景进行筛选的筛选逻辑，统计周期用于表征对原始数据进行统计的周期，统计粒度用于表征对原始数据进行统计的维度。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：基于维度逻辑表和事实逻辑表，从原始数据中确定指标对应的依赖数据；获取物理表中每个字段的使用热度；基于依赖数据的产出时间和每个字段的使用热度，生成物理模型。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：基于依赖数据的产出时间和每个字段的使用热度，生成物理模型的物理化策略，其中，物理化策略用于确定物理表的数量和物理表中包含的字段；基于物理化策略，生成物理模型的结构化查询语言和数据定义语句；基于结构化查询语言生成调度任务，其中，调度任务用于对原始数据进行统计处理，得到统计结果；基于数据定义语句创建物理表，其中，物理表用于存储统计结果。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：基于依赖数据中不同数据的产出时间之间的时间差，生成拆分策略，其中，拆分策略用于确定物理表的数量；基于每个字段的使用热度对拆分策略进行调整，得到调整后的拆分策略；基于每个字段的使用热度生成冗余字段，其中，冗余字段用于表征不同物理表中均存在的字段；基于调整后的拆分策略和冗余字段，生成物理化策略。

可选地，在本实施例中，计算机可读存储介质被设置为存储用于执行以下步骤的程序代码：响应于在客户端的操作界面上的模型构建指令，在操作界面上显示来自于服务器的构建提示信息；响应于对构建提示信息进行的构建指令，获取构建指令对应的模型构建信息，模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；发送模型构建信息至服务器，其中，多个指标元素用于通过组合生成数据仓库的指标，维度逻辑表、事实逻辑表和指标用于生成数据仓库的物理模型，物理模型用于对输入至数据仓库的原始数据进行统计处理，得到统计结果。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：在操作界面上显示来自于服务器的第一提示信息，其中，第一提示信息用于提示客户端建立维度逻辑表和事实逻辑表；响应作用于操作界面上的第一构建指令，获取第一构建指令对应的维度逻辑表和事实逻辑表；在操作界面上第二提示信息，其中，第二提示信息用于提示基于多个指标元素对应的多个组件集合建立多个指标元素，每个组件集合包含的不同组件用于表征该组件集合对应的指标元素的不同元素值；响应于对多个组件集合进行的第二构建指令，获取第二构建指令对应的多个指标元素，其中，多个指标元素由分别从多个组件集合中选择的多个第一组件确定；基于维度逻辑表、事实逻辑表和多个指标元素，构建模型构建信息。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：响应于对多个组件集合进行的选择指令，在操作界面上显示选择指令对应的多个第一组件；响应于对多个第一组件进行修改的修改指令，确定修改指令对应的多个第二组件；基于多个第二组件构建多个指标元素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种应用于数据仓库的建模方法，其特征在于，包括：

接收来自于客户端的模型构建指令；

输出构建提示信息至所述客户端，并接收所述客户端返回的模型构建信息，其中，所述模型构建信息基于所述构建提示信息所建立，所述模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；

对所述多个指标元素进行组合，生成所述数据仓库的指标；

基于所述维度逻辑表、所述事实逻辑表和所述指标，生成所述数据仓库的物理模型。

2.根据权利要求1所述的方法，其特征在于，输出构建提示信息至所述客户端，并接收所述客户端返回的模型构建信息，包括：

输出第一提示信息至所述客户端，其中，所述第一提示信息用于提示所述客户端建立所述维度逻辑表和所述事实逻辑表；

接收来自于所述客户端的所述维度逻辑表和所述事实逻辑表；

输出第二提示信息至所述客户端，其中，所述第二提示信息用于提示所述客户端基于所述多个指标元素对应的多个组件集合建立所述多个指标元素，每个组件集合包含的不同组件用于表征该组件集合对应的指标元素的不同元素值；

接收来自于所述客户端的所述多个指标元素，其中，所述多个指标元素由分别从所述多个组件集合中选择的多个第一组件确定。

3.根据权利要求2所述的方法，其特征在于，接收来自于所述客户端的所述多个指标元素，包括：

接收来自于所述客户端的选择指令，其中，所述选择指令用于分别对所述多个组件集合包含的不同组件进行选择；

输出所述选择指令对应的所述多个第一组件至所述客户端；

接收来自于所述客户端的所述多个指标元素，其中，所述多个指标元素为对所述多个第一组件进行修改所得到的。

4.根据权利要求1所述的方法，其特征在于，基于所述维度逻辑表、所述事实逻辑表和所述指标，生成所述数据仓库的物理模型，包括：

基于所述维度逻辑表和所述事实逻辑表，从原始数据中确定所述指标对应的依赖数据；

获取物理表中每个字段的使用热度；

基于所述依赖数据的产出时间和所述每个字段的使用热度，生成所述物理模型。

5.根据权利要求4所述的方法，其特征在于，所述物理模型包括：物理表和调度任务，其中，基于所述依赖数据的产出时间和所述每个字段的使用热度，生成所述物理模型，包括：

基于所述依赖数据的产出时间和所述每个字段的使用热度，生成所述物理模型的物理化策略，其中，所述物理化策略用于确定所述物理表的数量和所述物理表中包含的字段；

基于所述物理化策略，生成所述物理模型的结构化查询语言和数据定义语句；

基于所述结构化查询语言生成所述调度任务，其中，所述调度任务用于对所述原始数据进行统计处理，得到统计结果；

基于所述数据定义语句创建所述物理表，其中，所述物理表用于存储所述统计结果。

6.根据权利要求5所述的方法，其特征在于，基于所述依赖数据的产出时间和所述每个字段的使用热度，生成所述物理模型的物理化策略，包括：

基于所述依赖数据中不同数据的产出时间之间的时间差，生成拆分策略，其中，所述拆分策略用于确定所述物理表的数量；

基于所述每个字段的使用热度对所述拆分策略进行调整，得到调整后的拆分策略；

基于所述每个字段的使用热度生成冗余字段，其中，所述冗余字段用于表征不同物理表中均存在的字段；

基于所述调整后的拆分策略和所述冗余字段，生成所述物理化策略。

7.一种应用于数据仓库的建模方法，其特征在于，包括：

响应于在客户端的操作界面上的模型构建指令，在所述操作界面上显示来自于服务器的构建提示信息；

响应于对所述构建提示信息进行的构建指令，获取所述构建指令对应的模型构建信息，其中，所述模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；

发送所述模型构建信息至所述服务器，其中，所述多个指标元素用于通过组合生成所述数据仓库的指标，所述维度逻辑表、所述事实逻辑表和所述指标用于生成所述数据仓库的物理模型，所述物理模型用于对输入至所述数据仓库的原始数据进行统计处理，得到统计结果。

8.根据权利要求7所述的方法，其特征在于，响应于对所述构建提示信息进行的构建指令，获取所述生成指令对应的模型构建信息，包括：

在所述操作界面上显示来自于所述服务器的第一提示信息，其中，所述第一提示信息用于提示所述客户端建立所述维度逻辑表和所述事实逻辑表；

响应作用于所述操作界面上的第一构建指令，获取所述第一构建指令对应的所述维度逻辑表和所述事实逻辑表；

在所述操作界面上第二提示信息，其中，所述第二提示信息用于提示基于所述多个指标元素对应的多个组件集合建立所述多个指标元素，每个组件集合包含的不同组件用于表征该组件集合对应的指标元素的不同元素值；

响应于对所述多个组件集合进行的第二构建指令，获取所述第二构建指令对应的所述多个指标元素，其中，所述多个指标元素由分别从所述多个组件集合中选择的多个第一组件确定；

基于所述维度逻辑表、所述事实逻辑表和所述多个指标元素，构建所述模型构建信息。

9.根据权利要求8所述的方法，其特征在于，响应于对所述多个组件集合进行的第二构建指令，获取所述第二构建指令对应的所述多个指标元素，包括：

响应于对所述多个组件集合进行的选择指令，在所述操作界面上显示所述选择指令对应的所述多个第一组件；

响应于对所述多个第一组件进行修改的修改指令，确定所述修改指令对应的多个第二组件；

基于所述多个第二组件构建所述多个指标元素。

10.一种应用于数据仓库的建模系统，其特征在于，包括：

客户端，用于生成模型构建指令，并基于构建提示信息建立模型构建信息，其中，所述模型构建信息包括：维度逻辑表、事实逻辑表和多个指标元素；

服务器，与所述客户端连接，用于生成所述构建提示信息，对所述多个指标元素进行组合，生成所述数据仓库的指标，并基于所述维度逻辑表、所述事实逻辑表和所述指标，生成所述数据仓库的物理模型，其中，所述物理模型用于对输入至所述数据仓库的原始数据进行统计处理，得到统计结果。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至9中任意一项所述的方法。

12.一种电子设备，其特征在于，包括：

存储器，存储有可执行程序；

处理器，用于运行所述程序，其中，所述程序运行时执行权利要求1至9中任意一项所述的方法。