CN114036147A - 数据仓库构建方法、装置、设备及存储介质 - Google Patents

数据仓库构建方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114036147A
CN114036147A CN202111267195.2A CN202111267195A CN114036147A CN 114036147 A CN114036147 A CN 114036147A CN 202111267195 A CN202111267195 A CN 202111267195A CN 114036147 A CN114036147 A CN 114036147A
Authority
CN
China
Prior art keywords
dimension
types
fields corresponding
tables
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111267195.2A
Other languages
English (en)
Inventor
董泽欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCB Finetech Co Ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202111267195.2A priority Critical patent/CN114036147A/zh
Publication of CN114036147A publication Critical patent/CN114036147A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Abstract

本申请公开了一种数据仓库构建方法、装置、设备及存储介质,该方法包括获取与预设主题关联的第一业务数据;从第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,其中N、M为正整数;根据N个维度类型对应的字段形成N个维度表,并根据M个度量类型对应字段形成M个事实表;根据N个维度表和M个事实表,构建数据仓库。根据本申请实施例,可以按照不同维度和不同度量对第一业务数据进行整合分类,使得数据仓库存储分类后的维度表和事实表,便于后续用户根据这些分类选择所需的数据生成各类报表,有效降低制作报表的难度,从而节省了制作报表的时间。

Description

数据仓库构建方法、装置、设备及存储介质
技术领域
本申请属于数据库技术领域,尤其涉及一种数据仓库构建方法、装置、设备及存储介质。
背景技术
随着电子商务的发展,各类业务数据呈现爆发式增长,数据结构也开始多元化,这些业务数据中含有的信息越来越多,企业大多采用报表的形式查看和分析这些业务数据。由于业务纷繁复杂,对应的业务数据量大且杂乱无序,目前制作报表通常直接将所有业务数据作为数据来源,缺乏对业务数据的整合分类,后续制作报表需要花费大量时间整理数据,从而造成制作报表的难度较大、耗时较长。
发明内容
本申请实施例提供一种数据仓库构建方法、装置、设备及存储介质,以解决业务数据量大且杂乱无序,从而造成后续制作报表的难度较大、耗时较长的技术问题。
第一方面,本申请实施例提供一种数据仓库构建方法,方法包括:
获取与预设主题关联的第一业务数据;
从第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,其中N、M为正整数;
根据N个维度类型对应的字段形成N个维度表,并根据M个度量类型对应字段形成M个事实表;
根据N个维度表和M个事实表,构建数据仓库。
在一些实施例中,从第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,包括:
根据第一业务数据,提取N个维度类型对应的字段;
根据N个维度类型对应的字段,按照预设主题的最小粒度确定M个度量类型对应的字段。
在一些实施例中,第一业务数据还包括Q个标识类型对应的字段,其中Q为大于或等于0的整数,
根据N个维度类型对应的字段,按照预设主题的最小粒度确定M个度量类型对应的字段,包括:
根据N个维度类型对应的字段和Q个标识类型对应的字段,按照预设主题的最小粒度确定M个度量类型对应的字段。
在一些实施例中,M个度量类型包括财务度量,N个维度类型包括时间维度、项目维度、合同维度和人员维度,
根据N个维度类型对应的字段,按照预设主题的最小粒度确定N个度量型对应的字段,包括:
根据时间维度、项目维度、合同维度和人员维度对应的字段,确定财务度量对应的字段。
在一些实施例中,M个度量类型包括周期度量,N个维度类型包括时间维度、项目维度、合同维度,
根据N个维度类型对应的字段,按照预设主题的最小粒度确定N个度量型对应的字段,包括:
根据时间维度、项目维度和合同维度对应的字段,确定周期度量对应的字段。
在一些实施例中,在根据N个维度表和M个事实表,构建数据仓库之后,方法还包括:
接收对数据仓库中的第一维度表和/或第一事实表的第一输入;
响应于第一输入,根据第一维度表和/或第一事实表生成目标报表。
在一些实施例中,在根据N个维度表和M个事实表,构建数据仓库之前,方法还包括:
获取与预设主题关联的第二业务数据,第二业务数据区别于第一业务数据;
根据第二业务数据,通过全量更新或增量更新的方式更新N个维度表,及通过增量更新的方式更新M个事实表。
第二方面,本申请实施例提供了一种数据仓库构建装置,装置包括:
第一获取模块,用于获取与预设主题关联的第一业务数据;
确定模块,用于从第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,其中N、M为正整数;
形成模块,用于根据N个维度类型对应的字段形成N个维度表,并根据M个度量类型对应字段形成M个事实表;
构建模块,用于根据N个维度表和M个事实表,构建数据仓库。
第三方面,本申请实施例提供了一种电子设备,设备包括:
处理器以及存储有程序指令的存储器;
所述处理器执行所述程序指令时实现上述的方法。
第四方面,本申请实施例提供了一种存储介质,所述存储介质上存储有程序指令,所述程序指令被处理器执行时实现上述的方法。
本申请实施例的数据仓库构建方法、装置、设备及计算机存储介质,能够获取与预设主题关联的第一业务数据,再从第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,然后根据N个维度类型对应的字段形成N个维度表,并根据M个度量类型对应字段形成M个事实表,再存储N个维度表和M个事实表,以此构建数据仓库。这样,可以按照不同维度和不同度量对第一业务数据进行整合分类,使得数据仓库存储分类后的维度表和事实表,便于后续用户根据这些分类选择所需的数据生成各类报表,有效降低制作报表的难度,从而节省了制作报表的时间。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的数据仓库构建方法的流程示意图;
图2是本申请实施例提供的数据仓库构建方法中的维度类型与度量类型的一种示意图;
图3是本申请实施例提供的数据仓库构建方法中的维度表与事实表的一种关系示意图;
图4是本申请另一个实施例提供的数据仓库构建装置的结构示意图;
图5是本申请又一个实施例提供的数据仓库构建设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了解决现有技术问题,本申请实施例提供了一种数据仓库构建方法、装置、设备及计算机存储介质。下面首先对本申请实施例所提供的数据仓库构建方法进行介绍。
图1示出了本申请一个实施例提供的数据仓库构建方法的流程示意图。如图1所示,数据仓库构建方法可以执行以下步骤:
步骤101,获取与预设主题关联的第一业务数据;
步骤102,从第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,其中N、M为正整数;
步骤103,根据N个维度类型对应的字段形成N个维度表,并根据M个度量类型对应字段形成M个事实表;
步骤104,根据N个维度表和M个事实表,构建数据仓库。
上述各个步骤的具体实现方式将在下文中进行详细描述。
在本申请实施例中,数据仓库构建方法能够获取与预设主题关联的第一业务数据,再从第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,然后根据N个维度类型对应的字段形成N个维度表,并根据M个度量类型对应字段形成M个事实表,再存储N个维度表和M个事实表,以此构建数据仓库。这样,可以按照不同维度和不同度量对第一业务数据进行整合分类,使得数据仓库存储分类后的维度表和事实表,便于后续用户根据这些分类选择所需的数据生成各类报表,有效降低制作报表的难度,从而节省了制作报表的时间。
下面介绍上述各个步骤的具体实现方式。
在步骤101中,第一业务数据可以包括与预设主题相关的所有未经数据加工的原始数据和/或经过数据加工的所有业务数据,第一业务数据可以存储在一个或更多个数据库中,可以从这些数据库中获取第一业务数据。以目标项目主题为例,用户需要分析与目标项目相关的所有业务指标,此时可以获取与目标项目相关的所有数据。
在步骤102中,可以从第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段。
如图2所示,N个维度类型可以包括时间、项目、合同和人员,还可以包括地域等。其中时间维度类型对应的字段可以包括年、季度、月、周和日等字段,项目维度对应的字段可以包括项目类型、项目性质和项目进度等字段,合同维度对应的字段可以包括合同类型、合同金额和合同签订时间等字段,人员维度对应的字段可以包括身份标识字段。
如图2所示,M个度量类型可以包括财务和周期等,其中财务类型对应的字段可以包括成本、收入、支出和利润等字段,周期类型对应的字段可以包括目标项目的开始日期、里程碑日期、阶段日期和结束日期等字段。
在步骤103中,可以根据N个维度类型对应的字段形成N个维度表。例如,可以根据项目维度类型对应的字段形成项目维度表,关于项目类型的所有属性归集到项目维度表中,即项目类型、项目性质和项目进度等与项目相关的所有字段存储在项目维度表中。
还可以根据M个度量类型对应字段形成M个事实表。例如,可以根据成本、收入和利润等对应的字段形成财务表,其中财务表可以反映目标项目的财务状况。根据目标项目的开始日期、里程碑日期、阶段日期和结束日期等字段形成周期表,其中周期表可以反映目标项目的周期性变化。
在步骤104中,可以根据N个维度表和M个事实表,构建数据仓库,即数据仓库可以存储N个维度表和M个事实表,换而言之,数据仓库中存储的是经过整合分类后的第一业务数据。
在后续调用数据时,可以直接从数据仓库中根据维度和/或度量快速确定用户需要的字段,不需要在调用数据时再花费大量时间杂乱无序的业务数据中整理挑选数据。
在一些实施例中,为了业务数据的分类整合更加准确、细致,上述步骤102,可以具体执行如下步骤:
根据第一业务数据,提取N个维度类型对应的字段;
根据N个维度类型对应的字段,按照预设主题的最小粒度确定M个度量类型对应的字段。
可以理解的是,时间、项目、合同和人员维度对应的字段往往可以从第一业务数据中提取,示例地,可以通过现有的语义识别算法从第一业务数据中提取N个维度类型对应的字段。而M个度量类型对应的字段可能并未直接记载,此时可以根据N个维度类型对应的字段进行分析或计算,从而确定M个度量对应的字段。
为了后续调用数据更加灵活,M个度量类型对应的字段可以按照预设主题的最小粒度确定。例如,以目标项目主题为例,该主题下,最小粒度既可以确定为财务类和项目周期类,因此可以将成本、收入、支出、利润及其他与目标项目相关的具体明细,都尽可能穷举的归集到财务度量中,将目标项目的周期性日期都归集到周期度量中。可以理解的是,在其他主题下,也可以将成本和利润确定为最小粒度,即度量类型可以包括成本度量和利润度量。
在一些实施例中,为了业务数据的分类整合更加准确、细致,第一业务数据还包括Q个标识类型对应的字段,其中Q为大于或等于0的整数,
根据N个维度类型对应的字段,按照预设主题的最小粒度确定M个度量类型对应的字段,可以具体执行如下步骤:
根据N个维度类型对应的字段和Q个标识类型对应的字段,按照预设主题的最小粒度确定M个度量类型对应的字段。
在本实施例中,第一业务数据还可以包括Q个标识类型对应的字段,以目标项目主题为例,标识类型对应的字段可以包括目标项目是否作废,是否延迟、是否完毕以及合同是否逾期等字段。换而言之,可以将业务数据中一些意外事件作为标识类型对应的字段进行存储。
而在确定M个度量类型对应的字段时,可以考虑这些标识类型对应的字段,即可以根据N个维度类型对应的字段和Q个标识类型对应的字段,按照预设主题的最小粒度确定M个度量类型对应的字段。这样,可以使得度量类型对应的字段更加精准,以使后续数据分析的结果更准确。
在一些实施例中,M个度量类型包括财务度量,N个维度类型包括时间维度、项目维度、合同维度和人员维度,
根据N个维度类型对应的字段,按照预设主题的最小粒度确定N个度量型对应的字段,可以具体执行如下步骤:
根据时间维度、项目维度、合同维度和人员维度对应的字段,确定财务度量对应的字段。
在本实施例中,可以根据时间维度、项目维度、合同维度和人员维度对应的字段,确定财务度量对应的字段。示例地,可以考虑时间维度、项目维度和人员维度对应的字段计算人力成本、项目执行成本和其他财务明细,再根据项目维度和合同维度对应的字段计算收入,综合计算对应的利润后,可以确定财务度量对应的字段。换而言之,如图3所示,可以根据时间表、项目表、合同表和人员表确定财务表。
在一些示例中,确定财务度量对应的字段时还可以考虑标识类型对应的字段,以使形成的财务表更加精准。
在一些实施例中,M个度量类型包括周期度量,N个维度类型包括时间维度、项目维度、合同维度,
根据N个维度类型对应的字段,按照预设主题的最小粒度确定N个度量型对应的字段,可以具体执行如下步骤:
根据时间维度、项目维度和合同维度对应的字段,确定周期度量对应的字段。
在本实施例中,可以根据时间维度、项目维度和合同维度对应的字段,确定周期度量对应的字段。示例地,可以考虑时间维度、项目维度和合同维度对应的字段确定目标项目的开始日期、里程碑日期、阶段日期和结束日期等周期度量对应的字段。换而言之,如图3所示,可以根据时间表、项目表和合同表确定周期表。
在一些示例中,确定周期度量对应的字段时还可以考虑标识类型对应的字段,以使形成的周期表更加精准。
在一些实施例中,为了制作的报表能够满足用户多样化的需求,在上述步骤104之后,数据仓库构建方法还可以执行以下步骤:
接收对数据仓库中的第一维度表和/或第一事实表的第一输入;
响应于第一输入,根据第一维度表和/或第一事实表生成目标报表。
在本实施例中,构建数据仓库之后,可以将数据仓库应用于报表的制作中。示例地,可以接收对数据仓库中的第一维度表和/或第一事实表的第一输入,其中第一维度表可以是N个维度表中的至少一个维度表,例如第一维度表可以是时间维度表或项目维度表,也可以是时间维度表、项目维度表和合同维度表。第一事实表可以是M个事实表中的至少一个事实表,例如第一事实表可以是财务表或周期表,也可以是财务表和周期表。
可以理解的是,第一维度表和第一事实表基于用户自主选择确定,用户可以根据各类报表制作所需的数据源确定第一维度表和第一事实表。
在接收到第一输入后,可以响应于第一输入,根据第一维度表和/或第一事实表生成目标报表。示例地,可以基于现有的展现工具制作目标报表,用户可以利用构建好的数据仓库,借助于展现工具,灵活的选择第一维度表和/或第一事实表查看相关字段的数据,并生成目标报表。
这样,用户可以根据自己的需求制作各类报表,无需花费大量的时间整理数据,有效降低了制作报表的难度,节省了制作报表的时间。
在一些实施例中,在上述步骤104之前,数据仓库构建方法还可以执行以下步骤:
获取与预设主题关联的第二业务数据,第二业务数据区别于第一业务数据;
根据第二业务数据,通过全量更新或增量更新的方式更新N个维度表,及通过增量更新的方式更新M个事实表。
在本实施例中,已经基于第一业务数据生成N个维度表和M个事实表之后,再次获取到与预设主题关联的第二业务数据,此时为了避免重新确定维度类型对应的字段和度量类型对应的字段后再形成维度表和事实表可能浪费算力资源的问题,可以在原有的维度表和事实表的基础上进行更新。
可以理解的是,对于维度表而言,需要涵盖的信息需全面,可以进行全量更新,也可以进行增量更新。示例地,若第二业务数据相对于第一业务数据对应的业务是新增的业务所对应的数据,则可以通过增量更新的方式进行更新,若第二业务数据是第一业务数据对应的业务所发生变更而产生的数据,则可以通过全量更新的方式进行更新,以保证维度表的准确度。
对于事实表而言,第二业务数据并不会影像事实表的准确度,因此为了进一步节约算力资源,事实表可以通过增量更新的方式进行更新。
基于上述实施例提供的数据仓库构建方法,本申请还提供了一种数据仓库构建装置的实施例。
图4示出了本申请另一个实施例提供的数据仓库构建装置的结构示意图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图4,数据仓库构建装置400可以包括:
第一获取模块401,用于获取与预设主题关联的第一业务数据;
确定模块402,用于从第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,其中N、M为正整数;
形成模块403,用于根据N个维度类型对应的字段形成N个维度表,并根据M个度量类型对应字段形成M个事实表;
构建模块404,用于根据N个维度表和M个事实表,构建数据仓库。
在本申请实施例中,数据仓库构建装置能够获取与预设主题关联的第一业务数据,再从第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,然后根据N个维度类型对应的字段形成N个维度表,并根据M个度量类型对应字段形成M个事实表,再存储N个维度表和M个事实表,以此构建数据仓库。这样,可以按照不同维度和不同度量对第一业务数据进行整合分类,使得数据仓库存储分类后的维度表和事实表,便于后续用户根据这些分类选择所需的数据生成各类报表,有效降低制作报表的难度,从而节省了制作报表的时间。
在一些实施例中,确定模块402可以包括:
提取单元,用于根据第一业务数据,提取N个维度类型对应的字段;
确定单元,用于根据N个维度类型对应的字段,按照预设主题的最小粒度确定M个度量类型对应的字段。
在一些实施例中,第一业务数据还可以包括Q个标识类型对应的字段,其中Q为大于或等于0的整数,确定单元可以具体用于:
根据N个维度类型对应的字段和Q个标识类型对应的字段,按照预设主题的最小粒度确定M个度量类型对应的字段。
在一些实施例中,M个度量类型可以包括财务度量,N个维度类型可以包括时间维度、项目维度、合同维度和人员维度,确定单元可以具体用于:
根据时间维度、项目维度、合同维度和人员维度对应的字段,确定财务度量对应的字段。
在一些实施例中,M个度量类型可以包括周期度量,N个维度类型可以包括时间维度、项目维度、合同维度,确定单元可以具体用于:
根据时间维度、项目维度和合同维度对应的字段,确定周期度量对应的字段。
在一些实施例中,数据仓库构建装置400还可以包括:
接收模块,用于接收对数据仓库中的第一维度表和/或第一事实表的第一输入;
生成模块,用于响应于第一输入,根据第一维度表和/或第一事实表生成目标报表。
在一些实施例中,数据仓库构建装置400还可以包括:
第二获取模块,用于获取与预设主题关联的第二业务数据,第二业务数据区别于第一业务数据;
更新模块,用于根据第二业务数据,通过全量更新或增量更新的方式更新N个维度表,及通过增量更新的方式更新M个事实表。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,与本申请方法实施例基于同一构思,是与上述数据仓库构建方法对应的装置,上述方法实施例中所有实现方式均适用于该装置的实施例中,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图5示出了本申请又一个实施例提供的电子设备的硬件结构示意图。
设备可以包括处理器501以及存储有程序指令的存储器502。
处理器501执行程序时实现上述任意各个方法实施例中的步骤。
示例性的,程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器502中,并由处理器501执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列程序指令段,该指令段用于描述程序在设备中的执行过程。
具体地,上述处理器501可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关容灾设备的内部或外部。在特定实施例中,存储器502是非易失性固态存储器。
存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器501通过读取并执行存储器502中存储的程序指令,以实现上述实施例中的任意一种方法。
在一个示例中,电子设备还可包括通信接口503和总线510。其中,处理器501、存储器502、通信接口503通过总线510连接并完成相互间的通信。
通信接口503,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线510包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
另外,结合上述实施例中的方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有程序指令;该程序指令被处理器执行时实现上述实施例中的任意一种方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能模块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网格被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种数据仓库构建方法,其特征在于,包括:
获取与预设主题关联的第一业务数据;
从所述第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,其中N、M为正整数;
根据所述N个维度类型对应的字段形成N个维度表,并根据所述M个度量类型对应字段形成M个事实表;
根据所述N个维度表和所述M个事实表,构建数据仓库。
2.根据权利要求1所述的方法,其特征在于,所述从所述第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,包括:
根据所述第一业务数据,提取N个维度类型对应的字段;
根据所述N个维度类型对应的字段,按照所述预设主题的最小粒度确定M个度量类型对应的字段。
3.根据权利要求2所述的方法,其特征在于,所述第一业务数据还包括Q个标识类型对应的字段,其中Q为大于或等于0的整数,
所述根据所述N个维度类型对应的字段,按照所述预设主题的最小粒度确定M个度量类型对应的字段,包括:
根据所述N个维度类型对应的字段和所述Q个标识类型对应的字段,按照所述预设主题的最小粒度确定M个度量类型对应的字段。
4.根据权利要求2所述的方法,其特征在于,所述M个度量类型包括财务度量,所述N个维度类型包括时间维度、项目维度、合同维度和人员维度,
所述根据所述N个维度类型对应的字段,按照所述预设主题的最小粒度确定N个度量型对应的字段,包括:
根据所述时间维度、所述项目维度、所述合同维度和所述人员维度对应的字段,确定所述财务度量对应的字段。
5.根据权利要求1所述的方法,其特征在于,所述M个度量类型包括周期度量,所述N个维度类型包括时间维度、项目维度、合同维度,
所述根据所述N个维度类型对应的字段,按照所述预设主题的最小粒度确定N个度量型对应的字段,包括:
根据所述时间维度、所述项目维度和所述合同维度对应的字段,确定所述周期度量对应的字段。
6.根据权利要求1所述的方法,其特征在于,在所述根据所述N个维度表和所述M个事实表,构建数据仓库之后,所述方法还包括:
接收对所述数据仓库中的第一维度表和/或第一事实表的第一输入;
响应于所述第一输入,根据所述第一维度表和/或第一事实表生成目标报表。
7.根据权利要求1所述的方法,其特征在于,在所述根据所述N个维度表和所述M个事实表,构建数据仓库之前,所述方法还包括:
获取与预设主题关联的第二业务数据,所述第二业务数据区别于所述第一业务数据;
根据所述第二业务数据,通过全量更新或增量更新的方式更新所述N个维度表,及通过增量更新的方式更新所述M个事实表。
8.一种数据仓库构建装置,其特征在于,所述装置包括:
第一获取模块,用于获取与预设主题关联的第一业务数据;
确定模块,用于从所述第一业务数据中确定N个维度类型对应的字段和M个度量类型对应的字段,其中N、M为正整数;
形成模块,用于根据所述N个维度类型对应的字段形成N个维度表,并根据所述M个度量类型对应字段形成M个事实表;
构建模块,用于根据所述N个维度表和所述M个事实表,构建数据仓库。
9.一种电子设备,其特征在于,所述设备包括:处理器以及存储有程序指令的存储器;
所述处理器执行所述程序指令时实现如权利要求1-7任意一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质上存储有程序指令,所述程序指令被处理器执行时实现如权利要求1-7任意一项所述的方法。
CN202111267195.2A 2021-10-28 2021-10-28 数据仓库构建方法、装置、设备及存储介质 Pending CN114036147A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111267195.2A CN114036147A (zh) 2021-10-28 2021-10-28 数据仓库构建方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111267195.2A CN114036147A (zh) 2021-10-28 2021-10-28 数据仓库构建方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114036147A true CN114036147A (zh) 2022-02-11

Family

ID=80142288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111267195.2A Pending CN114036147A (zh) 2021-10-28 2021-10-28 数据仓库构建方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114036147A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547482A (zh) * 2022-03-03 2022-05-27 智慧足迹数据科技有限公司 业务特征生成方法、装置、电子设备及存储介质
CN114595294A (zh) * 2022-03-11 2022-06-07 北京梦诚科技有限公司 一种数据仓库建模和抽取方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547482A (zh) * 2022-03-03 2022-05-27 智慧足迹数据科技有限公司 业务特征生成方法、装置、电子设备及存储介质
CN114547482B (zh) * 2022-03-03 2023-01-20 智慧足迹数据科技有限公司 业务特征生成方法、装置、电子设备及存储介质
CN114595294A (zh) * 2022-03-11 2022-06-07 北京梦诚科技有限公司 一种数据仓库建模和抽取方法及系统

Similar Documents

Publication Publication Date Title
CN109344170B (zh) 流数据处理方法、系统、电子设备及可读存储介质
CN107688645B (zh) 一种保单数据处理方法及终端设备
CN107909178B (zh) 电子装置、失联修复率预测方法和计算机可读存储介质
CN114036147A (zh) 数据仓库构建方法、装置、设备及存储介质
CN111339073A (zh) 实时数据处理方法、装置、电子设备及可读存储介质
CN109753596B (zh) 用于大规模网络数据采集的信源管理与配置方法和系统
CN114461644A (zh) 一种数据采集方法、装置、电子设备及存储介质
CN112445866A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN109376927A (zh) 一种用户年龄预测方法、装置及设备
CN106708869B (zh) 一种群组数据处理的方法及装置
CN109597706B (zh) 一种核对差异数据的检测方法、装置及系统
CN116303680A (zh) 数据处理方法、装置、设备及计算机存储介质
CN107729407B (zh) 用户行为分析方法及服务器
CN116049140A (zh) 一种基于电商数据的数据仓库建立方法及系统
CN114626948A (zh) 区块链交易记账方法、装置、电子设备及存储介质
CN112364018B (zh) 一种生成宽表的方法、装置、设备及存储介质
CN115526158A (zh) 信息处理方法、装置、设备及存储介质
CN117762814A (zh) 测试结果记录方法、装置、设备、介质及产品
CN115994294A (zh) 数据处理方法、装置、设备及计算机存储介质
CN114817750A (zh) 信息处理方法、装置、设备、介质及产品
CN116226105A (zh) 数据治理方法、装置、电子设备及计算机存储介质
CN115375277A (zh) 报告生成方法、装置、设备及计算机可读存储介质
CN107958011B (zh) 一种基于Discuz社区的快速统计方法
CN117575766A (zh) 试算方法、装置、设备、介质及产品
CN114237602A (zh) 规则引擎构建方法、装置、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination