CN112328706A - 数仓体系下的维度建模计算方法、计算机设备和存储介质 - Google Patents
数仓体系下的维度建模计算方法、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112328706A CN112328706A CN202011209634.XA CN202011209634A CN112328706A CN 112328706 A CN112328706 A CN 112328706A CN 202011209634 A CN202011209634 A CN 202011209634A CN 112328706 A CN112328706 A CN 112328706A
- Authority
- CN
- China
- Prior art keywords
- index
- dimension
- configuring
- data
- fact
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 31
- 239000002131 composite material Substances 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000004590 computer program Methods 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 abstract description 2
- 238000004458 analytical method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012827 research and development Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000533950 Leucojum Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
- G06F16/212—Schema design and management with details for data modelling support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了数仓体系下的维度建模计算方法、计算机设备和存储介质,方法包括以下步骤:配置事实表,所述事实表包括归属于某个业务过程的业务数据;配置维度表,所述维度表描述所述事实表并生成分析所述业务数据的维度;基于所述事实表配置原子指标,所述原子指标为以一定的规则分析得到的数据,用以衡量指定的目标;配置限定条件,所述限定条件用于对复合指标进行限定;基于所述原子指标、维度表和限定条件,配置复合指标,所述复合指标为统计指标。本发明由数据开发人员配置维度表、事实表、原子指标、复合指标、限定条件等一系列大数据计算模型,从而清洗生成想要的结果数据。
Description
技术领域
本发明涉及数据仓库领域,尤其涉及数仓体系下的维度建模计算方法、计算机设备和存储介质。
背景技术
数仓平台是数据治理的一个核心模块,承担数据治理过程中的数据加工并业务化的功能,致力于:(1)构建统一的数据分类体系,用于目录化管理所有业务数据,便于数据的归类、查找、评价、使用。(2)构建统一的数据标准体系,基于国家或行业标准,用于标准化每一行数据,每一个字段的具体取值,提升数据质量和易用性。(3)构建统一的数据模型体系,通过规范定义和数据建模,自顶向下构建企业数据分层体系,沉淀企业数据公共层和主题库,便于数据的流通、共享、创造、创新,提升数据使用效率,极大的减少数据冗余、混乱、隔离、不一致以及谬误等。因此对于数仓平台,如何能够进行维度建模计算,是本领域亟待解决的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种数仓体系下的维度建模计算方法、计算机设备和存储介质。
本发明的目的是通过以下技术方案来实现的:
本发明的第一方面,提供数仓体系下的维度建模计算方法,包括以下步骤:
配置事实表,所述事实表包括归属于某个业务过程的业务数据;
配置维度表,所述维度表描述所述事实表并生成分析所述业务数据的维度;
基于所述事实表配置原子指标,所述原子指标为以一定的规则分析得到的数据,用以衡量指定的目标;
配置限定条件,所述限定条件用于对复合指标进行限定;
基于所述原子指标、维度表和限定条件,配置复合指标,所述复合指标为统计指标;
将所述事实表、维度表、原子指标、限定条件和复合指标形成汇总表输出。
进一步地,所述配置事实表包括:
配置包括业务分层、事实表名、数据源类型、数据库在内的基本信息;
配置事实属性。
进一步地,所述的配置维度表包括:
配置包括业务分层、维度名称、数据源类型、数据库在内的基本信息;
配置维度属性以及对应的关联事实表。
进一步地,所述的配置原子指标包括:
配置包括业务分层、指标名称、数据类型、单位在内的基本信息;
配置事实表选择、字段选择和公式选择。
进一步地,所述限定条件包括时间限定条件和地区限定条件。
进一步地,所述方法还包括:
获取待建立数仓的外部数据库的级别;
根据数仓中预存的对应级别的计算方式,配置所述事实表、维度表、原子指标、限定条件和复合指标。
进一步地,所述数仓中预存的对应级别的计算方式的预存方式包括:
抓取高于对应级别的其余外部数据库发布的低级别数仓建立方式,并进行预存;和/或:
预存同级别的外部数据库的数仓建立方式。
进一步地,所述方法还包括:
获取待建立数仓的外部数据库的需求;
根据所述需求配置所述事实表、维度表、原子指标、限定条件和复合指标。
本发明的第二方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。
本发明的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的方法的步骤。
本发明的有益效果是:
(1)在本发明一实例性实施例中公开的数仓体系下的维度建模计算方法,由数据开发人员配置维度表、事实表、原子指标、复合指标、限定条件等一系列大数据计算模型,从而清洗生成想要的结果数据。
(2)在本发明多个实例性实施例中公开的内容中,分别公开了维度表、事实表、原子指标的具体实现方式。
(3)在本发明一实例性实施例中,获取待建立数仓的外部数据库的级别,根据数仓中预存的对应级别的计算方式,配置所述事实表、维度表、原子指标、限定条件和复合指标,从而实现快速建立数仓。
附图说明
图1为本发明一示例性实施例公开的流程图。
具体实施方式
下面结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
维度建模是从分析决策的需求出发构建模型,它主要是为分析需求服务,因此它重点关注用户如何更快速地完成需求分析,同时具有较好的大规模复杂查询的响应性能。多维模型是由数字型度量值组成的一张事实表连接到一组包含描述属性的多张维度表,事实表与维度表通过主/外键实现关联。典型的维度模型有星形模型,以及在一些特殊场景下使用的雪花模型。在数仓规范设计中,维度建模是以维度建模理论为基础,构建总线矩阵、抽象出事实和维度,构建维度模型和事实模型,同时对报表需求进行抽象整理出相关指标体系,构建出汇总模型。下述示例性实施例部分以旅游文化数据仓库为例。
参见图1,图1示出了本发明一实例性实施例公开的数仓体系下的维度建模计算方法的流程图,由数据开发人员配置维度表、事实表、原子指标、复合指标、限定条件等一系列大数据计算模型,从而清洗生成想要的结果数据。其中,所述方法包括以下步骤:
配置事实表,所述事实表包括归属于某个业务过程的业务数据;
配置维度表,所述维度表描述所述事实表并生成分析所述业务数据的维度;
基于所述事实表配置原子指标,所述原子指标为以一定的规则分析得到的数据,用以衡量指定的目标;
配置限定条件,所述限定条件用于对复合指标进行限定;
基于所述原子指标、维度表和限定条件,配置复合指标,所述复合指标为统计指标;
将所述事实表、维度表、原子指标、限定条件和复合指标形成汇总表输出。
其中,事实表主要是归属于某个业务过程的事实逻辑表,可以丰富具体业务过程所对应事务的详细信息。创建事实逻辑表即完成公共的事务明细数据沉淀,从而便于提取业务中事务相关的明细数据。下线条件:需要原子指标和通用限定不在使用。
具体地,在一优选示例性实施例中,当需要配置事实表(或者创建一个新的事实表)时,首先需要配置包括业务分层、事实表名、数据源类型、数据库在内的基本信息;然后再配置事实属性。在一具体实施例中,所述业务分层可以包括旅游产业和文化产业,旅游产业例如又可以选择运营商和网评OTA,对于运营商可以继续细分至游客趋势和游客画像;文化产业类似,在此不进行赘述,下述示例性实施例的业务分层以“旅游产业-运营商-游客趋势”为主。事实表名为自行设置,例如“旅客性别统计”和“旅客客源地统计”;数据源类型(hive)和数据库名(spider-test)均为对应选择。“旅客性别统计”的事实属性,可以配置为“性别”和“时间戳”,并且针对每个属性均可以选择字段编码、数据类型、是否主键和是否分区;“旅客客源地统计”的事实属性包括“景点id”、“游客来源地”、“结果时间”、“游客人数”。
对于维度表,维度是用于观察和分析业务数据的视角,来源于属性,并且多数具有层级结构,如:地理维度(其中包括国家、地区、省以及城市等级别的内容)、时间维度(其中包括年度、季度、月度等级别的内容)。创建维度,即从顶层规范业务中实体(或称主数据)的存在性及唯一性。下线条件:需要限定条件中的通用限定不在使用、事实表不在使用和复合指标不在使用。
具体地,在一优选示例性实施例中,当需要配置维度表(或者创建一个新的维度表)时,首先配置包括业务分层、维度名称、数据源类型、数据库在内的基本信息;然后配置维度属性以及对应的关联事实表。在一具体实施例中,业务分层的方式与事实表的相同(“旅游产业-运营商-游客趋势”)。维度表也可以自行设定,例如“目的地地区维度”、“游客类型维度”、“客源地地区维度”和“时间维度”。对于“游客类型维度”,其数据源类型和数据库名也与事实表相同。而对于维度属性,其可以具体包括编码、类型、是否为关键维度和关键维度字段。
另外,对于对应的关联事实表,该内容可以在事实表或维度表中进行设置,当在“旅游性别统计”事实表中设置时:可以包括字段名称、字段编码、数据类型、是否主键、关联维度表、关联维度表字段;例如字段名称可以是“日期”、“目的地地区编码”、“客源地地区编码”、“游客类型编码”,对应的字段编码为“date”、“targetregion”、“sourceregion”、“regiontype”,关联的维度表可以是“时间维度”、“目的地地区维度”、“客源地地区维度”、“游客类型维度”。而当在维度表中设置时:可以包括字段名称、字段编码、数据类型、是否主键、关联事实表、关联事实表字段。
对于原子指标,原子指标是对指标统计逻辑、具体算法的一个抽象。为了从根源上解决定义、研发不一致的问题,指标定义明确设计统计逻辑(即计算逻辑),不需要ETL二次或者重复研发,从而提升了研发效率,也保证了统计结果的一致性。
原子指标是为了构建应用统计分析所需的派生指标,而定义的数据组件,因此只可以基于事实逻辑表明细数据表来创建。
复合指标无来源表,它归属于每个组合成它的原始的原子指标的来源表。原子指标与复合指标的关系:(1)原子指标的计算逻辑修改生效后,会直接更新应用于相关的复合指标。(2)原子指标被删除或者变更英文名,需要校验下游是否有复合指标使用,如果有,则无法删除或变更。(3)原子指标的数据类型更改会影响下游复合指标。下线条件:需要复合指标不在使用。
具体地,在一优选示例性实施例中,当需要配置原子指标(或者创建一个新的原子指标)时,首先配置包括业务分层、指标名称、数据类型、单位在内的基本信息;然后配置事实表选择、字段选择和公式选择。在一示例性实施例中,基本信息包括:业务分层为“旅游产业-运营商-游客趋势”,原子指标名称为“游客人数”,数据类型为“长整型”,单位为“人”(人数);而对于计算逻辑,选择的事实表为“旅客客源地统计”,选择字段为“游客人数”,选择公式为“求和(SUM)”。
对于限定条件,用于对复合指标进行限定,在一优选示例性实施例中,所述限定条件包括时间限定条件和地区限定条件。
对于地区限定条件,原子指标是计算逻辑的标准化定义,地区限定条件则是条件限制的标准化定义。为保障所有统计指标统一、标准、规范地构建,地区限定条件在业务板块内唯一,并唯一归属于一个来源逻辑表,计算逻辑也以该来源逻辑表模型的字段为基础进行定义。由于一个地区限定条件的定义可能来自于归属不同数据域的多个逻辑表,因此一个地区限定条件可能归属于多个数据域。在一示例性实施例中,地区限定条件包括:选择表(旅客客源地统计)、选择字段(游客来源地)、筛选范围。而对于筛选范围,可以通过“码表”的形式进行选择,包括“码表选择”(地区编码)、“选择码表字段”(行政编码)、“选择码表取值”(6位编码)、“是否排除”。
对于时间限定条件,原子指标是计算逻辑的标准化定义,时间限定则是条件限制的标准化定义。为保障所有统计指标统一、标准、规范地构建,时间限定在业务板块内唯一,并唯一归属于一个来源逻辑表,计算逻辑也以该来源逻辑表模型的字段为基础进行定义。由于一个时间限定的定义可能来自于归属不同数据域的多个逻辑表,因此一个时间限定可能归属于多个数据域。在一示例性实施例中,时间限定条件包括:“年度限定”、“月度限定”等等,
对于复合指标,复合指标即统计指标,为保证统计指标标准、规范、无二义性地生成,复合指标=原子指标+维度+业务限定。在新建复合指标之前,请先确认原子指标已经新建并通过审核。并且如果复合指标将用到时间限定或通用限定,先确认时间限定和通用限定已经新建并通过审核。
例如对于“月度游客人数”这一复合指标,业务分层与上述内容相同(“旅游产业-运营商-游客趋势”),数据库也相同(spider-test),数据源类选择“hive”,原子指标选择“游客人数”,时间限定选择“月度限定”,统计维度选择“时间维度”,地区限定选择某一地点。
更优地,在一示例性实施例中,所述方法还包括:
获取待建立数仓的外部数据库的级别;
根据数仓中预存的对应级别的计算方式,配置所述事实表、维度表、原子指标、限定条件和复合指标。
具体地,对于上述示例性实施例,文旅产业外部数据库的级别可以与对应数据库的单位相关,例如可以分为国家级、省级、市级、区级等。也就是说,首先获取待建立数仓的外部数据库的级别(例如为市级数据库),此时根据数仓中预存的市级数据库的计算方式,配置所述事实表、维度表、原子指标、限定条件和复合指标。而在另一示例性实施例中,级别可以根据公司内部部门的级别进行设定。
更优地,在一示例性实施例中,所述数仓中预存的对应级别的计算方式的预存方式包括:
抓取高于对应级别的其余外部数据库发布的低级别数仓建立方式,并进行预存;和/或:
预存同级别的外部数据库的数仓建立方式。
其中,第一种方式可以为在建立市级数据库的过程中,抓取省级网站或者相关规定中对市级数据库的规定;而对于第二种方式,第一市级数据库建立时,可以利用在本数仓中其余市级数据库建立时候的数仓建立方式,从而进行同方式建立。
更优地,在一示例性实施例中,所述方法还包括:
获取待建立数仓的外部数据库的需求;
根据所述需求配置所述事实表、维度表、原子指标、限定条件和复合指标。
也就是说,根据外部数据库发送的实际需求进行建立。
本发明的第二方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。
本发明的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的方法的步骤。
基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得装置执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.数仓体系下的维度建模计算方法,其特征在于:包括以下步骤:
配置事实表,所述事实表包括归属于某个业务过程的业务数据;
配置维度表,所述维度表描述所述事实表并生成分析所述业务数据的维度;
基于所述事实表配置原子指标,所述原子指标为以一定的规则分析得到的数据,用以衡量指定的目标;
配置限定条件,所述限定条件用于对复合指标进行限定;
基于所述原子指标、维度表和限定条件,配置复合指标,所述复合指标为统计指标;
将所述事实表、维度表、原子指标、限定条件和复合指标形成汇总表输出。
2.根据权利要求1所述的数仓体系下的维度建模计算方法,其特征在于:所述配置事实表包括:
配置包括业务分层、事实表名、数据源类型、数据库在内的基本信息;
配置事实属性。
3.根据权利要求1所述的数仓体系下的维度建模计算方法,其特征在于:所述的配置维度表包括:
配置包括业务分层、维度名称、数据源类型、数据库在内的基本信息;
配置维度属性以及对应的关联事实表。
4.根据权利要求1所述的数仓体系下的维度建模计算方法,其特征在于:所述的配置原子指标包括:
配置包括业务分层、指标名称、数据类型、单位在内的基本信息;
配置事实表选择、字段选择和公式选择。
5.根据权利要求1所述的数仓体系下的维度建模计算方法,其特征在于:所述限定条件包括时间限定条件和地区限定条件。
6.根据权利要求1所述的数仓体系下的维度建模计算方法,其特征在于:所述方法还包括:
获取待建立数仓的外部数据库的级别;
根据数仓中预存的对应级别的计算方式,配置所述事实表、维度表、原子指标、限定条件和复合指标。
7.根据权利要求6所述的数仓体系下的维度建模计算方法,其特征在于:所述数仓中预存的对应级别的计算方式的预存方式包括:
抓取高于对应级别的其余外部数据库发布的低级别数仓建立方式,并进行预存;和/或:
预存同级别的外部数据库的数仓建立方式。
8.根据权利要求1所述的数仓体系下的维度建模计算方法,其特征在于:所述方法还包括:
获取待建立数仓的外部数据库的需求;
根据所述需求配置所述事实表、维度表、原子指标、限定条件和复合指标。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011209634.XA CN112328706B (zh) | 2020-11-03 | 2020-11-03 | 数仓体系下的维度建模计算方法、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011209634.XA CN112328706B (zh) | 2020-11-03 | 2020-11-03 | 数仓体系下的维度建模计算方法、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112328706A true CN112328706A (zh) | 2021-02-05 |
CN112328706B CN112328706B (zh) | 2023-10-24 |
Family
ID=74322921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011209634.XA Active CN112328706B (zh) | 2020-11-03 | 2020-11-03 | 数仓体系下的维度建模计算方法、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112328706B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113064897A (zh) * | 2021-03-16 | 2021-07-02 | 北京沃东天骏信息技术有限公司 | 一种业务指标模型的生成方法、装置、设备及存储介质 |
CN113656755A (zh) * | 2021-08-20 | 2021-11-16 | 中国人寿保险股份有限公司广东省分公司 | 自定义指标计算公式的数据统计方法、装置及存储介质 |
CN113779026A (zh) * | 2021-08-18 | 2021-12-10 | 北京健康之家科技有限公司 | 业务数据表的处理方法和装置 |
CN113901004A (zh) * | 2021-10-27 | 2022-01-07 | 江苏瑞中数据股份有限公司 | 一种数据中台化的大数据复杂实时计算的方法 |
CN114706575A (zh) * | 2022-06-07 | 2022-07-05 | 杭州比智科技有限公司 | 一种迁移和复用数据模型的方法及系统 |
CN114880405A (zh) * | 2022-03-31 | 2022-08-09 | 华能信息技术有限公司 | 一种基于数据湖的数据处理方法及系统 |
CN115374329A (zh) * | 2022-10-25 | 2022-11-22 | 杭州比智科技有限公司 | 一种管理企业业务元数据和技术元数据的方法及系统 |
CN116431638A (zh) * | 2023-04-12 | 2023-07-14 | 浪潮智慧科技有限公司 | 一种针对水利行业的指标处理方法、设备及介质 |
CN117033460A (zh) * | 2023-08-07 | 2023-11-10 | 南京中新赛克科技有限责任公司 | 一种基于总线矩阵的数据模型自动构建系统及方法 |
CN117709804A (zh) * | 2024-02-05 | 2024-03-15 | 杭州研趣信息技术有限公司 | 基于分块矩阵式的指标计算方法、装置、设备及介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102306176A (zh) * | 2011-08-25 | 2012-01-04 | 浙江鸿程计算机系统有限公司 | 一种基于数据仓库内在特征的olap关键词查询方法 |
KR20150102207A (ko) * | 2014-02-28 | 2015-09-07 | (주)로직소프트 | 데이터 웨어하우스 생성 방법 및 데이터 웨어하우스 생성 프로그램을 저장한 기록 매체 |
CN105740365A (zh) * | 2016-01-27 | 2016-07-06 | 北京掌阔移动传媒科技有限公司 | 一种数据仓库快速查询方法和装置 |
US20170124176A1 (en) * | 2015-10-30 | 2017-05-04 | Vladislav Michael Beznos | Universal analytical data mart and data structure for same |
CN108647339A (zh) * | 2018-05-14 | 2018-10-12 | 五八有限公司 | 一种维度建模方法、装置、设备及存储介质 |
CN108846040A (zh) * | 2018-05-29 | 2018-11-20 | 东华大学 | 一种基于olap的处方笺多维分析方法及系统 |
CN108897784A (zh) * | 2018-06-08 | 2018-11-27 | 北京航空航天大学 | 一个基于社交媒体的突发事件多维分析系统 |
CN109241033A (zh) * | 2018-08-21 | 2019-01-18 | 北京京东尚科信息技术有限公司 | 创建实时数据仓库的方法和装置 |
CN109902872A (zh) * | 2019-02-28 | 2019-06-18 | 北京首钢股份有限公司 | 一种性能预测模型与产品研发相结合的方法和装置 |
CN109933759A (zh) * | 2017-12-19 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 一种统计类数据表的生成方法和装置 |
CN111008253A (zh) * | 2018-10-08 | 2020-04-14 | 阿里巴巴集团控股有限公司 | 数据模型生成方法和数据仓库生成方法、装置及电子设备 |
CN111459923A (zh) * | 2020-03-16 | 2020-07-28 | 上海维信荟智金融科技有限公司 | 移动bi商业智能解决方法及系统 |
-
2020
- 2020-11-03 CN CN202011209634.XA patent/CN112328706B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102306176A (zh) * | 2011-08-25 | 2012-01-04 | 浙江鸿程计算机系统有限公司 | 一种基于数据仓库内在特征的olap关键词查询方法 |
KR20150102207A (ko) * | 2014-02-28 | 2015-09-07 | (주)로직소프트 | 데이터 웨어하우스 생성 방법 및 데이터 웨어하우스 생성 프로그램을 저장한 기록 매체 |
US20170124176A1 (en) * | 2015-10-30 | 2017-05-04 | Vladislav Michael Beznos | Universal analytical data mart and data structure for same |
CN105740365A (zh) * | 2016-01-27 | 2016-07-06 | 北京掌阔移动传媒科技有限公司 | 一种数据仓库快速查询方法和装置 |
CN109933759A (zh) * | 2017-12-19 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 一种统计类数据表的生成方法和装置 |
CN108647339A (zh) * | 2018-05-14 | 2018-10-12 | 五八有限公司 | 一种维度建模方法、装置、设备及存储介质 |
CN108846040A (zh) * | 2018-05-29 | 2018-11-20 | 东华大学 | 一种基于olap的处方笺多维分析方法及系统 |
CN108897784A (zh) * | 2018-06-08 | 2018-11-27 | 北京航空航天大学 | 一个基于社交媒体的突发事件多维分析系统 |
CN109241033A (zh) * | 2018-08-21 | 2019-01-18 | 北京京东尚科信息技术有限公司 | 创建实时数据仓库的方法和装置 |
CN111008253A (zh) * | 2018-10-08 | 2020-04-14 | 阿里巴巴集团控股有限公司 | 数据模型生成方法和数据仓库生成方法、装置及电子设备 |
CN109902872A (zh) * | 2019-02-28 | 2019-06-18 | 北京首钢股份有限公司 | 一种性能预测模型与产品研发相结合的方法和装置 |
CN111459923A (zh) * | 2020-03-16 | 2020-07-28 | 上海维信荟智金融科技有限公司 | 移动bi商业智能解决方法及系统 |
Non-Patent Citations (4)
Title |
---|
AHMED OUSSOUS ET AL.: "Big Data technologies: A survey" * |
AHMED OUSSOUS ET AL.: "Big Data technologies: A survey", 《JOURNAL OF KING SAUD UNIVERSITY - COMPUTER AND INFORMATION SCIENCES》, pages 431 - 448 * |
龙跃萍: "广东中烟决策支持系统经济效益模块数据仓库维度建模的实现与应用" * |
龙跃萍: "广东中烟决策支持系统经济效益模块数据仓库维度建模的实现与应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 138 - 831 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113064897B (zh) * | 2021-03-16 | 2024-05-17 | 北京沃东天骏信息技术有限公司 | 一种业务指标模型的生成方法、装置、设备及存储介质 |
CN113064897A (zh) * | 2021-03-16 | 2021-07-02 | 北京沃东天骏信息技术有限公司 | 一种业务指标模型的生成方法、装置、设备及存储介质 |
CN113779026A (zh) * | 2021-08-18 | 2021-12-10 | 北京健康之家科技有限公司 | 业务数据表的处理方法和装置 |
CN113656755A (zh) * | 2021-08-20 | 2021-11-16 | 中国人寿保险股份有限公司广东省分公司 | 自定义指标计算公式的数据统计方法、装置及存储介质 |
CN113901004A (zh) * | 2021-10-27 | 2022-01-07 | 江苏瑞中数据股份有限公司 | 一种数据中台化的大数据复杂实时计算的方法 |
CN114880405A (zh) * | 2022-03-31 | 2022-08-09 | 华能信息技术有限公司 | 一种基于数据湖的数据处理方法及系统 |
CN114706575A (zh) * | 2022-06-07 | 2022-07-05 | 杭州比智科技有限公司 | 一种迁移和复用数据模型的方法及系统 |
CN115374329A (zh) * | 2022-10-25 | 2022-11-22 | 杭州比智科技有限公司 | 一种管理企业业务元数据和技术元数据的方法及系统 |
CN116431638B (zh) * | 2023-04-12 | 2024-03-12 | 浪潮智慧科技有限公司 | 一种针对水利行业的指标处理方法、设备及介质 |
CN116431638A (zh) * | 2023-04-12 | 2023-07-14 | 浪潮智慧科技有限公司 | 一种针对水利行业的指标处理方法、设备及介质 |
CN117033460A (zh) * | 2023-08-07 | 2023-11-10 | 南京中新赛克科技有限责任公司 | 一种基于总线矩阵的数据模型自动构建系统及方法 |
CN117033460B (zh) * | 2023-08-07 | 2024-04-30 | 南京中新赛克科技有限责任公司 | 一种基于总线矩阵的数据模型自动构建系统及方法 |
CN117709804A (zh) * | 2024-02-05 | 2024-03-15 | 杭州研趣信息技术有限公司 | 基于分块矩阵式的指标计算方法、装置、设备及介质 |
CN117709804B (zh) * | 2024-02-05 | 2024-05-07 | 杭州研趣信息技术有限公司 | 基于分块矩阵式的指标计算方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112328706B (zh) | 2023-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112328706A (zh) | 数仓体系下的维度建模计算方法、计算机设备和存储介质 | |
CN112699175A (zh) | 一种数据治理系统及其方法 | |
CN111190881A (zh) | 一种数据治理方法和系统 | |
García‐Roselló et al. | ModestR: a software tool for managing and analyzing species distribution map databases | |
US8108367B2 (en) | Constraints with hidden rows in a database | |
CN103473672A (zh) | 企业级数据中心的元数据质量稽核系统、方法及平台 | |
EP2396720A1 (en) | Creation of a data store | |
CN114357088A (zh) | 核电工业数据仓库系统 | |
Catlett et al. | Plenario: An Open Data Discovery and Exploration Platform for Urban Science. | |
WO2020259325A1 (zh) | 一种适用于机器学习的特征处理方法及装置 | |
Al-Barak et al. | Database design debts through examining schema evolution | |
Luo et al. | Urban region profiling via multi-graph representation learning | |
CN115329011A (zh) | 数据模型的构建方法、数据查询的方法、装置及存储介质 | |
Cigánek | Design and implementation of open-data data warehouse | |
US10877998B2 (en) | Highly atomized segmented and interrogatable data systems (HASIDS) | |
CN114860819A (zh) | 商业智能系统的构建方法、装置、设备和存储介质 | |
CN113901046A (zh) | 虚拟维度表构建方法及装置 | |
CN113485987A (zh) | 企业信息标签生成方法及装置 | |
Schuurman et al. | Spatial/temporal mismatch: a conflation protocol for Canada Census spatial files | |
CN111143322A (zh) | 一种数据标准治理系统及方法 | |
CN112328705B (zh) | 支持任意配置周期的任务调度方法 | |
CN115203439B (zh) | 用于合规监管的知识图谱的构建方法、相关方法和系统 | |
CN113435731B (zh) | 一种住房保障动态监管系统 | |
CN117851522A (zh) | 基于电网大数据中心的数据仓库建模方法 | |
Moffitt et al. | Querying Evolving Graphs with Portal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |