CN115510289B - 一种数据立方体配置方法、装置、电子设备及存储介质 - Google Patents

一种数据立方体配置方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115510289B
CN115510289B CN202211160434.9A CN202211160434A CN115510289B CN 115510289 B CN115510289 B CN 115510289B CN 202211160434 A CN202211160434 A CN 202211160434A CN 115510289 B CN115510289 B CN 115510289B
Authority
CN
China
Prior art keywords
template
data cube
dimension
information
target data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211160434.9A
Other languages
English (en)
Other versions
CN115510289A (zh
Inventor
黄景华
沈彬彬
叶田田
王文鉴
宋依兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongdian Jinxin Software Co Ltd
Original Assignee
Zhongdian Jinxin Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongdian Jinxin Software Co Ltd filed Critical Zhongdian Jinxin Software Co Ltd
Priority to CN202211160434.9A priority Critical patent/CN115510289B/zh
Publication of CN115510289A publication Critical patent/CN115510289A/zh
Application granted granted Critical
Publication of CN115510289B publication Critical patent/CN115510289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • G06F16/90328Query formulation using system suggestions using search space presentation or visualization, e.g. category or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请提供了一种数据立方体配置方法、装置、电子设备及存储介质,该方法包括:获取目标数据立方体对应的基础查询模板;根据基础查询模板,确定目标数据立方体对应的目标元数据的取值,由目标元数据构成元数据信息模板;获取目标数据立方体的关联标签信息及关联维度信息,分别构建关联标签信息对应的关联标签模板及关联维度信息对应的关联维度模板;将目标数据立方体的立方体标识、基础查询模板、元数据信息模板、关联标签模板以及关联维度模板显示在数据立方体可视化平台,利用数据立方体可视化平台对目标数据立方体进行管理及配置。通过采用上述数据立方体配置方法、装置、电子设备及存储介质,解决了数据立方体信息修改及配置效率低的问题。

Description

一种数据立方体配置方法、装置、电子设备及存储介质
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种数据立方体配置方法、装置、电子设备及存储介质。
背景技术
数据立方体(Data Cube)是一种用于数据分析与索引的技术架构,它是针对大数据的处理力气,可以对元数据进行任意多关键字实时索引。通过数据立方体对元数据进行分析之后,可以大大加快数据的查询和检索效率。在实际应用过程中,常常需要对数据立方体的信息进行修改,例如:对数据立方体的元数据信息进行配置。
然而,在配置数据立方体信息时,需要先手动查询该数据立方体的相关配置信息,然后再针对要修改的内容对配置信息进行调整及上传,这造成了数据立方体信息修改及配置效率低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种数据立方体配置方法、装置、电子设备及存储介质,以解决数据立方体信息修改及配置效率低的问题。
第一方面,本申请实施例提供了一种数据立方体配置方法,包括:
获取目标数据立方体对应的基础查询模板;
根据基础查询模板,确定目标数据立方体对应的目标元数据的取值,由目标元数据构成元数据信息模板;
获取目标数据立方体的关联标签信息以及关联维度信息,分别构建关联标签信息对应的关联标签模板以及关联维度信息对应的关联维度模板;
将目标数据立方体的立方体标识、基础查询模板、元数据信息模板、关联标签模板以及关联维度模板显示在数据立方体可视化平台中,利用数据立方体可视化平台对目标数据立方体进行管理及配置。
可选地,根据基础查询模板,确定目标数据立方体对应的目标元数据的取值,包括:从数据字典中查询与目标数据立方体匹配的元数据信息;确定基础查询模板中的字段名称与元数据信息是否匹配;若与元数据信息匹配,将基础查询模板中的字段名称作为目标数据立方体对应的目标元数据的取值。
可选地,在获取目标数据立方体对应的基础查询模板之后,还包括:获取针对目标数据立方体的业务逻辑表达式;在基础查询模板中加入统计项,将基础查询模板转换成基础统计模板;在基础统计模板后附加业务逻辑表达式获得特定业务的业务统计模板,并将业务统计模板保存在数据库中。
可选地,关联标签信息包括多个标签的标签信息,标签信息包括标签编号、标签名称以及标签类目路径,关联维度信息包括至少一个维度的维度信息,维度信息包括维度编号以及维度名称;分别构建关联标签信息对应的关联标签模板以及关联维度信息对应的关联维度模板,包括:将每个标签的标签编号、标签名称以及标签类目路径作为一条记录,按照标签编号从小到大的顺序将多个标签的记录排列在一起构建关联标签模板;将每个维度的维度编号以及维度名称作为一条记录,按照维度编号从小到大的顺序将至少一个维度的记录排列在一起构建关联维度模板。
可选地,方法还包括:选取同一分类下的多个数据立方体构建一个主题;确定主题的主题标识;将主题下的多个数据立方体的立方体标识归为主题标识对应的分类下,构成针对数据立方体的树状管理结构。
可选地,利用数据立方体可视化平台对目标数据立方体进行管理及配置,包括:获取针对目标数据立方体的修改信息文件,所述修改信息文件包括多条修改内容;将修改信息文件导入数据立方体可视化平台中;利用修改信息文件中的每条修改内容对目标数据立方体进行调整,并将调整后的数据在数据立方体可视化平台中进行更新显示。
可选地,业务逻辑表达式的右值为采用驼峰命名法命名的字符串。
第二方面,本申请实施例还提供了一种数据立方体配置装置,所述装置包括:
查询模板获取模块,用于获取目标数据立方体对应的基础查询模板,基础查询模板用于确定目标数据立方体对应的物理模型的所有字段的字段名称;
元数据确定模块,用于根据基础查询模板,确定目标数据立方体对应的目标元数据的取值,由目标元数据构成元数据信息模板;
关联模板构建模块,用于获取目标数据立方体的关联标签信息以及关联维度信息,分别构建关联标签信息对应的关联标签模板以及关联维度信息对应的关联维度模板;
配置管理模块,用于将目标数据立方体的立方体标识、基础查询模板、元数据信息模板、关联标签模板以及关联维度模板显示在数据立方体可视化平台中,利用数据立方体可视化平台对目标数据立方体进行管理及配置。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的数据立方体配置方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的数据立方体配置方法的步骤。
本申请实施例带来了以下有益效果:
本申请实施例提供的一种数据立方体配置方法、装置、电子设备及存储介质,能够利用目标数据立方体的基础查询模板确定目标元数据的取值形成元数据信息模板,同时根据目标数据立方体的关联信息构建关联标签模板以及关联维度模板,利用基础查询模板、元数据信息模板、关联标签模板以及关联维度模板在数据立方体可视化平台中对目标数据立方体进行管理及配置,与现有技术中的数据立方体配置方法相比,解决了数据立方体信息修改及配置效率低的问题。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的数据立方体配置方法的流程图;
图2示出了本申请实施例所提供的数据立方体配置装置的结构示意图;
图3示出了本申请实施例所提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
值得注意的是,在本申请提出之前,数据立方体(Data Cube)是一种用于数据分析与索引的技术架构,它是针对大数据的处理力气,可以对元数据进行任意多关键字实时索引。通过数据立方体对元数据进行分析之后,可以大大加快数据的查询和检索效率。在实际应用过程中,常常需要对数据立方体的信息进行修改,例如:对数据立方体的元数据信息进行配置。然而,在配置数据立方体信息时,需要先手动查询该数据立方体的相关配置信息,然后再针对要修改的内容对配置信息进行调整及上传,这造成了数据立方体信息修改及配置效率低的问题。
基于此,本申请实施例提供了一种数据立方体配置方法,以提高数据立方体信息修改及配置的效率。
请参阅图1,图1为本申请实施例所提供的一种数据立方体配置方法的流程图。如图1所示,本申请实施例提供的数据立方体配置方法,包括:
步骤S101,获取目标数据立方体对应的基础查询模板。
该步骤中,目标数据立方体可指多维数据模型,即Data Cube,多维数据模型是基于事实表和维度表建立起来的数据库模型。
示例性的,目标数据立方体可以是三维数据立方体,也可以是四维数据立方体。
基础查询模板可指数据库查询语句,基础查询模板是查询目标数据立方体的信息的基础模板,基础查询模板包括目标数据立方体的元数据字段的字段名称,例如:报告日期列的字段名称、标签列的字段名称、阈值列的字段名称以及客户号列的字段名称。
示例性的,基础查询模板可以是SQL查询语句,例如:基础查询模板为带有Select关键字的SQL查询语句。
基础查询模板会作为单独的页签显示在数据立方体可视化平台中。
需要说明的是,目标数据立方体是为了满足用户从多角度多层次进行数据查询和分析的需要,而建立起来的基于事实表和维度表的数据库模型,其基本的应用是为了实现OLAP(联机分析处理,On-Line Analytic Processing),它是一种常用于数据分析与索引的技术,它可以对原始数据建立多维度索引。通过Cube对数据进行分析,可以大大加快数据的查询效率。
在本申请实施例中,首先根据数据分析的需求,将概念模型转化为具体的数据模型,即构建目标数据立方体的逻辑模型,然后针对构建的逻辑模型在物理介质上实现出来,例如:建立多张数据表,以获得物理模型,然后利用第三客户端工具与该物理模型进行连接,获取该物理模型的查询SQL语句,即获取针对目标数据立方体的基础查询模板,其中,基础查询模板可以指定查询的目标数据立方体对应的物理模型的表名,并从该表中查询报告日期列、标签列、阈值列、客户号列等各字段的字段内容。
其中,报告日期列是报告日期字段的字段中文名称,报告日期列用于存储目标数据立方体的所有报告日期,示例性的,报告日期列字段的字段英文名称为RPT_DT。
标签列是标签字段的字段中文名称,标签列用于存储目标数据立方体的所有标签,示例性的,标签列字段的字段英文名称为LBL_NM。
阈值列是阈值字段的字段中文名称,阈值列用于存储目标数据立方体中不同标签对应的阈值,示例性的,阈值列字段的字段英文名称为TRVAL_CD。
客户号列是客户标识字段的字段中文名称,客户号列用于存储客户标识,示例性的,客户号列字段的字段英文名称为CST_ID。
步骤S102,根据基础查询模板,确定目标数据立方体对应的目标元数据的取值,由目标元数据构成元数据信息模板。
该步骤中,元数据可指描述数据立方体的数据项,元数据用于表征数据立方体的基本信息。
元数据包括但不限于:数据立方体的中文名、表名、标签列、阈值列、报告日期列、客户号列。
中文名可指数据立方体的中文名称;表名可指数据立方体的物理模型对应的数据表的表名;标签列可指存储数据立方体的标签的字段;阈值列可指存储数据立方体的阈值的字段;报告日期列可指存储数据立方体的报告日期的字段;客户号列可指存储数据立方体的客户标识的字段;是否维度编号可指数据立方体的维度是否进行编号,取值为是或者否;是否标签编号可指存储数据立方体的标签是否进行编号,取值为是或者否。
元数据信息模板可指显示元数据信息的模板,元数据信息模板用于展示目标数据立方体的元数据信息。
元数据信息模板会作为单独的页签显示在数据立方体可视化平台中。
在本申请实施例中,基础查询模板中已经确定了目标数据立方体中各个字段的字段英文名称,因此,可以利用获得的字段英文名称确定标签列、阈值列、报告日期列、客户号列这些元数据的取值。同时,目标数据立方体与该目标数据立方体的物理模型是关联的,物理模型中包括了数据立方体的中文名以及表名,可以通过物理模型确定表名以及数据立方体的中文名,如此可确定目标数据立方体的全部元数据的取值,将目标数据立方体元数据以及各元数据的取值按照预设格式进行排列,构建成元数据信息模板。技术人员可以通过元数据信息模板查看目标数据立方体的元数据信息,元数据信息包括元数据名称及元数据的取值。
可以理解的,由基础查询模板到确定元数据信息模板的过程相当于从物理模型反向映射出逻辑模型的过程,通过元数据信息模板能够直观了解到目标数据立方体的信息。
在一可选实施例中,根据基础查询模板,确定目标数据立方体对应的目标元数据的取值,包括:从数据字典中查询与目标数据立方体匹配的元数据信息;确定基础查询模板中的字段名称与元数据信息是否匹配;若与元数据信息匹配,将基础查询模板中的字段名称作为目标数据立方体对应的目标元数据的取值。
这里,数据字典可指符合行业规范的逻辑命名字典,数据字典用于验证元数据信息是否符合规范要求。
数据字典中的内容包括但不限于:表名、字段中文名称、字段英文名称、字段类型、字段长度。
具体的,将目标数据立方体的物理模型对应的表名作为索引,从数据字典中查询与该表名对应的元数据信息,并将基础查询模板中的字段名称与该表名对应的元数据信息进行逐个匹配,确定是否存在字段名称与元数据信息不匹配的情况,如果都匹配则将基础查询模板中的字段名称作为目标元数据的取值,并将目标元数据名称以及目标元数据的取值作为元数据信息模板显示在数据立方体可视化平台中。如果不匹配则在数据字典中注册该目标数据立方体的元数据信息。
在一可选实施例中,在获取目标数据立方体对应的基础查询模板之后,还包括:获取针对目标数据立方体的业务逻辑表达式;在基础查询模板中加入统计项,将基础查询模板转换成基础统计模板;在基础统计模板后附加业务逻辑表达式获得特定业务的业务统计模板,并将业务统计模板保存在数据库中。
这里,业务逻辑表达式可指SQL语句模板,业务逻辑表达式用于针对目标数据立方体的目标字段的取值设置筛选条件的模板。
示例性的,业务逻辑表达式可以是A.LBL_NM=${LBL_NM},其中,A代表目标数据立方体对应的物理模型的表名,LBL_NM代表标签列,即目标字段,${LBL_NM}是指代符号,用于抽象表示标签列中的某个具体取值,通过该指代符号来达到标签模板效果,用不同的标签名称替换该指代符号就可以得到不同的业务规则表达式。
业务逻辑表达式还可以是A.LBL_TRAVAL_CD=${TRAVAL_CD},其中,A代表目标数据立方体对应的物理模型的表名,LBL_TRAVAL_CD代表阈值列,${LBL_TRAVAL_CD}是指代符号,用于抽象标识阈值列中的某个具体取值,通过该指代符号来达到阈值模板效果,用不同的阈值替换该指代符号就可以得到不同的业务规则表达式。
另外,在基础统计模板后附加的业务逻辑表达式,不仅限于标签列以及阈值列对应的表达式,还可以是报告日期列、客户号列等其他字段对应的业务逻辑表达式,以对设定的报告日期等业务条件进行统计分析,例如:仅对2022年10月1日的数据进行统计分析。
基础统计模板可指未设置具体业务条件的统计SQL模板,基础统计模板是用于对统计项所指示的目标数据立方体对应的数据进行统计的模板。
业务统计模板可指设置了具体业务条件的统计SQL模板,业务统计模板用于利用统计项对特定业务条件指示的数据进行统计,它是加入业务逻辑表达式的基础统计模板。
统计项可指一条具体的统计语句,用于对符合特定业务条件的数据进行计算。
示例性的,统计项可以是统计总人数的SQL语句,例如:SUM函数。
具体的,假设业务分析内容是对标签列和阈值列的具体内容进行统计,则在基础查询模板中加入针对人数进行统计的SQL语句,即加入统计项得到基础统计模板,将A.LBL_NM=${LBL_NM}and A.LBL_TRAVAL=${LBL_TRAVAL}作为业务逻辑表达式附加在基础统计模板后得到业务统计模板。当标签列和阈值列的具体内容是对性别为男性的人数进行统计时,只需要将${LBL_NM}指定为“性别”,将${LBL_TRAVAL}指定为“男”即可。
在一可选实施例中,业务逻辑表达式的右值为采用驼峰命名法命名的字符串。
这里,业务逻辑表达式的右值可指业务逻辑表达式等于符号右侧的数值。
以A.LBL_NM=${LBL_NM}为例,右值值得是${LBL_NM}。
驼峰命名法可指骆驼式命名法,它是电脑程式编写时的一套命名规则。
骆驼式命名法就是当变量名或函数名是由一个或多个单词连结在一起,而构成的唯一识别字时,第一个单词以小写字母开始;从第二个单词开始以后的每个单词的首字母都采用大写字母,例如:myFirstName、myLastName。
采用上述驼峰命名法来对右值命名有利于同一规范,提高代码查找、纠错效率。
需要说明的是,获取目标数据立方体的元数据信息模板后,该元数据信息模板会以单独一个页签的形式显示在数据立方体可视化平台中,用户可以在数据立方体可视化平台中查看目标数据立方体的元数据信息,即查看目标数据立方体中各个字段的字段名称。
步骤S103,获取目标数据立方体的关联标签信息以及关联维度信息,分别构建关联标签信息对应的关联标签模板以及关联维度信息对应的关联维度模板。
该步骤中,关联标签信息可指目标数据立方体对应的多个标签的标签信息,关联标签信息用于表征目标数据立方体的标签特征。
关联维度信息可指目标数据立方体对应的多个维度的维度信息,关联维度信息用于表征目标数据立方体的维度特征。
标签信息包括但不限于:标签顺序、标签名称、标签类目路径;维度信息可指维度名称以及维度顺序。
目标数据立方体对应多个标签,可以由1个标签以及该标签对应的阈值构成一个维度,例如:性别等于男就是一个维度,也可以由多个标签以及每个标签对应的阈值构成一个维度。
在本申请实施例中,目标数据立方体的物理模型中存储了目标数据立方体的关联标签信息以及关联维度信息,从物理模型中获取关联标签信息以及关联维度信息,将关联标签信息显示在关联标签页签中得到关联标签模板,将关联维度信息显示在关联维度页签中得到关联维度模板。
在一可选实施例中,关联标签信息包括多个标签的标签信息,标签信息包括标签编号、标签名称以及标签类目路径,关联维度信息包括至少一个维度的维度信息,维度信息包括维度编号以及维度名称;分别构建关联标签信息对应的关联标签模板以及关联维度信息对应的关联维度模板,包括:将每个标签的标签编号、标签名称以及标签类目路径作为一条记录,按照标签编号从小到大的顺序将多个标签的记录排列在一起构建关联标签模板;将每个维度的维度编号以及维度名称作为一条记录,按照维度编号从小到大的顺序将至少一个维度的记录排列在一起构建关联维度模板。
这里,标签编号可指标签的序号,标签编号作为标签的唯一标识。
标签类目路径可指标签所在类目的路径,示例性的,标签类目路径可以是“对公客户/客户基本信息标签/信贷记录”。
维度编号可指维度的序号,维度编号作为维度的唯一标识。
在本申请实施例中,在关联标签模板中,每个标签的标签编号、标签名称、标签类目路径作为一行,形成一条标签记录,将多个标签记录按照标签编号从小到大的顺序进行排列可以得到一个标签记录列表,该标签记录列表就是关联标签模板。同样地,在关联维度模板中,每个维度的维度编号、维度名称作为一行,形成一条维度记录,将多个维度记录按照维度编号从小到大的顺序进行排列可以得到一个维度记录列表,该维度记录列表就是关联维度模板。
步骤S104,将目标数据立方体的立方体标识、基础查询模板、元数据信息模板、关联标签模板以及关联维度模板显示在数据立方体可视化平台中,利用数据立方体可视化平台对目标数据立方体进行管理及配置。
该步骤中,数据立方体可视化平台可指对多个数据立方体进行管理和配置的可视化平台。
数据立方体可视化平台可分为左右两部分,左侧为数据立方体列表区域,该区域内展示了多个数据立方体的立方体标识,例如:数据立方体的中文名称,可通过点击操作选取目标数据立方体,以查看目标数据立方体的信息,这些信息展示在右侧部分,右侧部分包括四个页签,分别是元数据模板页签、基础查询模板页签、关联标签模板页签、关联维度模板页签,这些页签中的模板均是通过上述步骤确定的。
另外,数据立方体可视化平台还包括业务统计模板模块,不同的业务场景需要构建不同的业务规则表达式,业务规则表达式也是SQL表达式,以对目标数据立方体进行分析,例如:有些场景下需要将性别:男作为分析维度,而另一场景下需要将年龄小于18岁作为分析维度,如果针对不同的分析维度都要重新构造一遍业务规则表达式,则会造成业务分析效率低的问题,因此,可以通过基础查询模板来构建业务统计模板,通过在不同场景下为业务统计模板设置不同的参数来达到快速构建业务规则表达式的目的,提高业务分析的效率。
具体的,当有统计业务需求时,可根据业务需求确定具体的统计分析维度,例如:对目标数据立方体中年龄在18岁以下的用户人数进行统计分析,则年龄在18岁以下就是业务规则,于是,可根据该业务规则确定对应的业务条件表达式,即年龄小于18,对业务条件表达式进行解析获得标签为年龄,阈值为小于18,将年龄和小于18这2个数据代入业务统计模板,可以得到对应的业务规则表达式,即A.LBL_NM=“年龄”and A.LBL_TRAVAL<18。利用该业务规则表达式可以对目标数据立方体中年龄小于18的客户信息进行统计,如果业务统计模板统计的是人数,则该业务规则表达式统计的是年龄小于18岁的人数。可见,该数据立方体可视化平台不但便于查询数据立方体的相关信息,还能够快速实现对数据立方体的统计分析等管理功能。
其中,业务条件表达式可以在数据立方体可视化平台中通过配置直接获得,例如:在界面中将目标数据立方体的标签列中的所有取值以及阈值列中的所有取值均列举出来,用户可手动选取年龄这一标签,以及年龄标签对应的阈值列中的取值,由系统自动构建业务条件表达式,并根据元数据信息将业务条件表达式转化为业务规则表达式。
在一可选实施例中,方法还包括:选取同一分类下的多个数据立方体构建一个主题;确定主题的主题标识;将主题下的多个数据立方体的立方体标识归为主题标识对应的分类下,构成针对数据立方体的树状管理结构。
具体的,以客户基本信息为例,客户基本信息可分为统计信息、亲属信息、身份识别信息、家庭住址信息、工作地址信息等多个不同的信息,为了便于管理可针对这些信息分别建立数据立方体,并将这些数据立方体归属于客户基本信息这一主题下,客户基本信息并不对应数据立方体,而是作为多个子信息的父节点。
在数据立方体可视化平台中,左侧界面部分会默认显示多个主题的主题名称列表,选中一个主题名称可展开同属于该主题的多个数据立方体标识,选中一个数据立方体标识则可在数据立方体可视化平台的右侧界面部分显示该数据立方体的元数据模板页签、基础查询模板页签、关联标签模板页签、关联维度模板页签。
在一可选实施例中,利用数据立方体可视化平台对目标数据立方体进行管理及配置,包括:获取针对目标数据立方体的修改信息文件,修改信息文件包括多条修改内容;将修改信息文件导入数据立方体可视化平台中;利用修改信息文件中的每条修改内容对目标数据立方体进行调整,并将调整后的数据在数据立方体可视化平台中进行更新显示。
这里,可通过线上导入文件的方式对目标数据立方体进行批量配置,批量配置后可直接将配置信息同步到数据可视化平台对应的Redis缓存中,同步过程中无需重新启动Redis缓存,并将配置信息同步至数据库中,保证Redis缓存与数据库数据的一致性。
与现有技术中数据立方体配置方法相比,本申请能够利用目标数据立方体的基础查询模板确定目标元数据的取值形成元数据信息模板,同时根据目标数据立方体的关联信息构建关联标签模板以及关联维度模板,利用基础查询模板、元数据信息模板、关联标签模板以及关联维度模板在数据立方体可视化平台中对目标数据立方体进行管理及配置,解决了数据立方体信息修改及配置效率低的问题。
基于同一发明构思,本申请实施例中还提供了与数据立方体配置方法对应的数据立方体配置装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述数据立方体配置方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图2,图2为本申请实施例所提供的一种数据立方体配置装置的结构示意图。如图2中所示,所述数据立方体配置装置200包括:
查询模板获取模块201,用于获取目标数据立方体对应的基础查询模板;
元数据确定模块202,用于根据基础查询模板,确定目标数据立方体对应的目标元数据的取值,由目标元数据构成元数据信息模板;
关联模板构建模块203,用于获取目标数据立方体的关联标签信息以及关联维度信息,分别构建关联标签信息对应的关联标签模板以及关联维度信息对应的关联维度模板;
配置管理模块204,用于将目标数据立方体的立方体标识、基础查询模板、元数据信息模板、关联标签模板以及关联维度模板显示在数据立方体可视化平台中,利用数据立方体可视化平台对目标数据立方体进行管理及配置。
请参阅图3,图3为本申请实施例所提供的一种电子设备的结构示意图。如图3中所示,所述电子设备300包括处理器310、存储器320和总线330。
所述存储器320存储有所述处理器310可执行的机器可读指令,当电子设备300运行时,所述处理器310与所述存储器320之间通过总线330通信,所述机器可读指令被所述处理器310执行时,可以执行如上述图1所示方法实施例中的数据立方体配置方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的数据立方体配置方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种数据立方体配置方法,其特征在于,包括:
获取目标数据立方体对应的基础查询模板,所述基础查询模板为用于查询目标数据立方体信息的数据库查询语句;
根据所述基础查询模板,确定目标数据立方体对应的目标元数据的取值,由目标元数据构成元数据信息模板;
获取目标数据立方体的关联标签信息以及关联维度信息,分别构建所述关联标签信息对应的关联标签模板以及关联维度信息对应的关联维度模板;
将目标数据立方体的立方体标识、基础查询模板、元数据信息模板、关联标签模板以及关联维度模板显示在数据立方体可视化平台中,利用所述数据立方体可视化平台对目标数据立方体进行管理及配置;
所述关联标签信息包括多个标签的标签信息,所述标签信息包括标签编号、标签名称以及标签类目路径,所述关联维度信息包括至少一个维度的维度信息,所述维度信息包括维度编号以及维度名称;
所述分别构建所述关联标签信息对应的关联标签模板以及关联维度信息对应的关联维度模板,包括:
将每个标签的标签编号、标签名称以及标签类目路径作为一条记录,按照标签编号从小到大的顺序将多个标签的记录排列在一起构建关联标签模板;
将每个维度的维度编号以及维度名称作为一条记录,按照维度编号从小到大的顺序将至少一个维度的记录排列在一起构建关联维度模板。
2.根据权利要求1所述的方法,其特征在于,所述根据所述基础查询模板,确定目标数据立方体对应的目标元数据的取值,包括:
从数据字典中查询与目标数据立方体匹配的元数据信息;
确定基础查询模板中的字段名称与所述元数据信息是否匹配;
若与所述元数据信息匹配,将所述基础查询模板中的字段名称作为目标数据立方体对应的目标元数据的取值。
3.根据权利要求1所述的方法,其特征在于,在获取目标数据立方体对应的基础查询模板之后,还包括:
获取针对所述目标数据立方体的业务逻辑表达式;
在所述基础查询模板中加入统计项,将所述基础查询模板转换成基础统计模板;
在所述基础统计模板后附加所述业务逻辑表达式获得特定业务的业务统计模板,并将所述业务统计模板保存在数据库中。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
选取同一分类下的多个数据立方体构建一个主题;
确定所述主题的主题标识;
将所述主题下的多个数据立方体的立方体标识归为所述主题标识对应的分类下,构成针对数据立方体的树状管理结构。
5.根据权利要求1所述的方法,其特征在于,所述利用所述数据立方体可视化平台对目标数据立方体进行管理及配置,包括:
获取针对目标数据立方体的修改信息文件,所述修改信息文件包括多条修改内容;
将所述修改信息文件导入所述数据立方体可视化平台中;
利用所述修改信息文件中的每条修改内容对所述目标数据立方体进行调整,并将调整后的数据在所述数据立方体可视化平台中进行更新显示。
6.根据权利要求3所述的方法,其特征在于,所述业务逻辑表达式的右值为采用驼峰命名法命名的字符串。
7.一种数据立方体配置装置,其特征在于,包括:
查询模板获取模块,用于获取目标数据立方体对应的基础查询模板,所述基础查询模板为用于查询目标数据立方体信息的数据库查询语句;
元数据确定模块,用于根据所述基础查询模板,确定目标数据立方体对应的目标元数据的取值,由目标元数据构成元数据信息模板;
关联模板构建模块,用于获取目标数据立方体的关联标签信息以及关联维度信息,分别构建所述关联标签信息对应的关联标签模板以及关联维度信息对应的关联维度模板;
配置管理模块,用于将目标数据立方体的立方体标识、基础查询模板、元数据信息模板、关联标签模板以及关联维度模板显示在数据立方体可视化平台中,利用所述数据立方体可视化平台对目标数据立方体进行管理及配置;
所述关联标签信息包括多个标签的标签信息,所述标签信息包括标签编号、标签名称以及标签类目路径,所述关联维度信息包括至少一个维度的维度信息,所述维度信息包括维度编号以及维度名称;
所述关联模板构建模块,还具体用于:
将每个标签的标签编号、标签名称以及标签类目路径作为一条记录,按照标签编号从小到大的顺序将多个标签的记录排列在一起构建关联标签模板;
将每个维度的维度编号以及维度名称作为一条记录,按照维度编号从小到大的顺序将至少一个维度的记录排列在一起构建关联维度模板。
8.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至6中任一项所述的数据立方体配置方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至6中任一项所述的数据立方体配置方法的步骤。
CN202211160434.9A 2022-09-22 2022-09-22 一种数据立方体配置方法、装置、电子设备及存储介质 Active CN115510289B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211160434.9A CN115510289B (zh) 2022-09-22 2022-09-22 一种数据立方体配置方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211160434.9A CN115510289B (zh) 2022-09-22 2022-09-22 一种数据立方体配置方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN115510289A CN115510289A (zh) 2022-12-23
CN115510289B true CN115510289B (zh) 2023-04-25

Family

ID=84505569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211160434.9A Active CN115510289B (zh) 2022-09-22 2022-09-22 一种数据立方体配置方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115510289B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116467393A (zh) * 2023-04-12 2023-07-21 北京博晓通科技有限公司 数据处理方法、装置、计算机设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110275920A (zh) * 2019-06-27 2019-09-24 中国石油集团东方地球物理勘探有限责任公司 数据查询方法、装置、电子设备及计算机可读存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7970790B2 (en) * 2008-05-13 2011-06-28 Microsoft Corporation Cell-based security representation for data access
US10339133B2 (en) * 2013-11-11 2019-07-02 International Business Machines Corporation Amorphous data preparation for efficient query formulation
CN104484392B (zh) * 2014-12-11 2018-02-02 北京国双科技有限公司 数据库查询语句生成方法及装置
CN110019396B (zh) * 2017-12-01 2023-02-17 中国移动通信集团广东有限公司 一种基于分布式多维分析的数据分析系统及方法
CN110674228B (zh) * 2019-09-23 2024-03-26 先进新星技术(新加坡)控股有限公司 数据仓库模型构建和数据查询方法、装置及设备
CN113961582A (zh) * 2020-07-20 2022-01-21 中移(苏州)软件技术有限公司 数据处理方法、装置、设备及存储介质
CN114077652A (zh) * 2020-08-20 2022-02-22 中国科学院软件研究所 一种基于多维数据立方体的数据处理方法及电子装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110275920A (zh) * 2019-06-27 2019-09-24 中国石油集团东方地球物理勘探有限责任公司 数据查询方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN115510289A (zh) 2022-12-23

Similar Documents

Publication Publication Date Title
US11132346B2 (en) Information processing method and apparatus
CN110019396B (zh) 一种基于分布式多维分析的数据分析系统及方法
JP5306359B2 (ja) 複数言語によるデータ記録を関連付ける方法およびシステム
US6826566B2 (en) Identifier vocabulary data access method and system
US20140317117A1 (en) Method, device and computer storage media for user preferences information collection
CN110457405B (zh) 一种基于血缘关系的数据库审计方法
De Vries et al. Robust record linkage blocking using suffix arrays and bloom filters
CN109918341B (zh) 日志处理方法及装置
CN111191125A (zh) 一种基于标签化的数据分析方法
CN110659282B (zh) 数据路由的构建方法、装置、计算机设备和存储介质
CN111192176B (zh) 一种支持教育信息化评估的在线数据采集方法及装置
CN115510289B (zh) 一种数据立方体配置方法、装置、电子设备及存储介质
CN105095436A (zh) 数据源数据自动建模方法
CN114116762A (zh) 一种离线数据模糊搜索方法、装置、设备和介质
US20030033138A1 (en) Method for partitioning a data set into frequency vectors for clustering
US9507764B2 (en) Computerised data entry form processing
CN110737432A (zh) 一种基于词根表的脚本辅助设计方法及装置
CN114547077A (zh) 基层政务表格数据智能处理系统及方法
CN112395881B (zh) 物料标签的构建方法、装置、可读存储介质及电子设备
US11645312B2 (en) Attribute extraction apparatus and attribute extraction method
CN112363996A (zh) 用于建立电网知识图谱的物理模型的方法及系统和介质
CN117093556A (zh) 日志分类方法、装置、计算机设备及计算机可读存储介质
CN107807964B (zh) 数字内容排序方法、装置和计算机可读存储介质
CN116450664A (zh) 数据处理方法、装置、设备和存储介质
CN115270790A (zh) 一种基于大数据的样本标识方法、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant