CN111552679A - 基于简单需求的快速建模方法及装置 - Google Patents

基于简单需求的快速建模方法及装置 Download PDF

Info

Publication number
CN111552679A
CN111552679A CN202010274459.6A CN202010274459A CN111552679A CN 111552679 A CN111552679 A CN 111552679A CN 202010274459 A CN202010274459 A CN 202010274459A CN 111552679 A CN111552679 A CN 111552679A
Authority
CN
China
Prior art keywords
dimension
name
index
main
requirement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010274459.6A
Other languages
English (en)
Inventor
贺稳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suning Financial Technology Nanjing Co Ltd
Original Assignee
Suning Financial Technology Nanjing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Financial Technology Nanjing Co Ltd filed Critical Suning Financial Technology Nanjing Co Ltd
Priority to CN202010274459.6A priority Critical patent/CN111552679A/zh
Publication of CN111552679A publication Critical patent/CN111552679A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Abstract

本发明公开一种基于简单需求的快速建模方法及装置,涉及数据仓库技术领域,能够根据简单需求快速建模,便于灵活迅速的得到分析结果。该方法包括:根据用户需求构建主表以及与主表关联的维度码值表和指标码值表,主表结构包括需求名称维度、多个维度名称维度和多个指标名称维度;主表的需求名称维度中录入有至少一个需求名称,维度名称维度中录入有与各需求名称对应的维度名称主键,指标名称维度中录入有与各需求名称对应的指标名称主键;维度码值表中采集有与维度名称主键对应的维度值,指标码值表中采集有与指标名称主键对应的指标值。该装置应用有上述方案所提的方法。

Description

基于简单需求的快速建模方法及装置
技术领域
本发明涉及数据仓库技术领域,尤其涉及一种基于简单需求的快速建模方法及装置。
背景技术
随着大数据的发展,一些大型公司都建立了自己的大型数据仓库,但是大型的数据仓库在应用过程中发现存在以下问题:不同的数据仓库对于企业的需求差异较大,特别是零售行业,促销活动比较多,同时针对促销活动的活动发起方需要快速的得到活动的效果,以便及时的调整活动方向,这就要求数据仓库能灵活快速的提供出相关数据,大型数据仓库由于设计周期过长等问题,并不能满足这样的决策支持。
发明内容
本发明的目的在于提供一种基于简单需求的快速建模方法及装置,能够根据简单需求快速建模,可以灵活迅速的得到分析结果。
为了实现上述目的,本发明的一方面提供一种基于简单需求的快速建模方法,包括:
根据用户需求构建主表以及与所述主表关联的维度码值表和指标码值表,所述主表结构包括需求名称维度、多个维度名称维度和多个指标名称维度;
所述主表的需求名称维度中录入有至少一个需求名称,所述维度名称维度中录入有与各所述需求名称对应的维度名称主键,所述指标名称维度中录入有与各所述需求名称对应的指标名称主键;
所述维度码值表中录入有与所述维度名称主键对应的维度值,所述指标码值表中录入有与所述指标名称主键对应的指标值。
优选地,所述主表结构还包括编码维度,所述编码维度中录入有与所述需求名称对应的编码。
示例性地,所述需求名称维度为客户群名称。
优选地,所述维度码值表的结构包括维度名称主键维度、维度名称字段维度和维度值维度;
所述维度名称主键维度录入有所述维度名称主键;
所述维度名称字段维度录入有与所述维度名称主键一一对应的维度名称字段;
所述维度值维度录入有与所述维度名称主键一一对应的维度值。
较佳地,所述维度码值表的结构还包括层次标记维度,所述层次标记维度录入有与所述维度名称主键一一对应的层次标记。
优选地,所述指标码值表的结构包括指标名称主键维度、指标名称字段维度和指标值维度;
所述指标名称主键维度录入有所述指标名称主键;
所述指标名称字段维度录入有与所述指标名称主键一一对应的指标名称字段;
所述指标值维度录入有与所述指标名称主键一一对应的指标值。
较佳地,所述指标码值表的结构还包括层次标记维度,所述层次标记维度录入有与所述指标名称主键一一对应的层次标记。
可选地,所述主表中的部分维度名称主键和/或指标名称主键允许为空。与现有技术相比,本发明提供的基于简单需求的快速建模方法具有以下有益效果:
本发明提供的基于简单需求的快速建模方法中,根据用户需求构建主表以及与主表关联的维度码值表和指标码值表,其中,主表结构包括需求名称维度、多个维度名称维度和多个指标名称维度,在主表的需求名称维度中录入至少一个需求名称,在主表的维度名称维度中录入与每个需求名称对应的维度名称主键,在主表的指标名称维度中录入与每个需求名称对应的指标名称主键,而且维度码值表中采集有与维度名称主键对应的维度值,指标码值表中采集有与指标名称主键对应的指标值,至此建模完毕。使用时,用户可通过主表抽取相关需求名称对应的维度名称主键和指标名称主键,然后分别从维度码值表中获取对应的维度值,以及从指标码值表中获取对应的指标值,最终获取到的数据经统计分析后既可得到用户所需的分析结果。
可见,本发明采用了维度建模思想,解决了一类快速取数的临时需求分析问题,比如各种促销活动分析,相似客群分析等,总体的建模思路是对传统维度建模的一种扩展,也是对大型数据仓库的一种补充,此种建模方式相比较于大型数据仓库具有灵活快速的特点。
本发明的另一方面提供一种基于简单需求的快速建模装置,应用有上述技术方案提到的基于简单需求的快速建模方法,该装置包括:
建模单元,用于根据用户需求构建主表以及与所述主表关联的维度码值表和指标码值表,所述主表结构包括需求名称维度、多个维度名称维度和多个指标名称维度;
所述主表的需求名称维度中录入有至少一个需求名称,所述维度名称维度中录入有与各所述需求名称对应的维度名称主键,所述指标名称维度中录入有与各所述需求名称对应的指标名称主键;
所述维度码值表中录入有与所述维度名称主键对应的维度值,所述指标码值表中录入有与所述指标名称主键对应的指标值。
与现有技术相比,本发明提供的基于简单需求的快速建模装置的有益效果与上述技术方案提供的基于简单需求的快速建模方法的有益效果相同,在此不做赘述。
本发明的第三方面提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述基于简单需求的快速建模方法的步骤。
与现有技术相比,本发明提供的计算机可读存储介质的有益效果与上述技术方案提供的基于简单需求的快速建模方法的有益效果相同,在此不做赘述。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为实施例一中基于简单需求的快速建模方法的流程示意图;
图2为实施例一中主表的示例图;
图3为实施例一中维度码值表的示例图;
图4为实施例一中指标码值表的示例图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本发明保护的范围。
实施例一
请参阅图1,本实施例提供一种基于简单需求的快速建模方法,包括:
根据用户需求构建主表以及与主表关联的维度码值表和指标码值表,主表结构包括需求名称维度、多个维度名称维度和多个指标名称维度;主表的需求名称维度中录入有至少一个需求名称,维度名称维度中录入有与各需求名称对应的维度名称主键,指标名称维度中录入有与各需求名称对应的指标名称主键;维度码值表中录入有与维度名称主键对应的维度值,指标码值表中录入有与指标名称主键对应的指标值。
本实施例提供的基于简单需求的快速建模方法中,根据用户需求构建主表以及与主表关联的维度码值表和指标码值表,其中,主表结构包括需求名称维度、多个维度名称维度和多个指标名称维度,在主表的需求名称维度中录入至少一个需求名称,在主表的维度名称维度中录入与每个需求名称对应的维度名称主键,在主表的指标名称维度中录入与每个需求名称对应的指标名称主键,而且维度码值表中采集有与维度名称主键对应的维度值,指标码值表中采集有与指标名称主键对应的指标值,至此建模完毕。使用时,用户可通过主表抽取相关需求名称对应的维度名称主键和指标名称主键,然后分别从维度码值表中获取对应的维度值,以及从指标码值表中获取对应的指标值,最终获取到的数据经统计分析后既可得到用户所需的分析结果。
可以理解的是,本实施例主要体现了一种在主表中使用主键替代的数据建模思想,其具体的维度值和指标值仅在维度码值表和指标码值表中体现,数据处理时只需通过关联主键,然后从维度码值表和指标码值表中对应抽取对应的维度值和指标值进行数据处理,既可灵活迅速的得到分析结果。
综上本实施例采用了维度建模思想,适用于快速取数的临时需求分析问题,比如各种促销活动分析,相似客群分析等,总体的建模思路是对传统维度建模的一种扩展,也是对大型数据仓库的一种补充,此种建模方式相比较于大型数据仓库具有灵活快速的特点。
需要说明的是,本实施例的基本架构为小型架构,是针对大型数据仓库的一种补充,模型整体属于建立在hive基础上的表结构。
为了便于区分调用,主表结构还包括编码维度,编码维度中录入有与需求名称对应的编码。
如图2所示,示例性地,主表为活动信息表,需求名称维度为客群名称,多个维度名称维度分别对应维度1、维度2和维度3,多个指标名称维度分别对应指标1、指标2、指标3和指标4,主表的需求名称维度中录入有6个需求名称。
请参阅图3,上述实施例中的维度码值表的结构包括维度名称主键维度、维度名称字段维度和维度值维度;其中,
维度名称主键维度录入有维度名称主键;维度名称字段维度录入有与维度名称主键一一对应的维度名称字段;维度值维度录入有与维度名称主键一一对应的维度值。
具体实施时,由于活动信息表中的维度名称主键包括Dim_1、Dim_2、Dim_3、Dim_4和Dim_5,那么在构建维度码值表时,维度名称主键维度也应包括Dim_1、Dim_2、Dim_3、Dim_4和Dim_5的维度名称主键,且维度名称字段维度录入有与各维度名称主键一一对应的维度名称字段,如Sex(性别)、Is_first_login(是否为首次登陆用户)、Is_inner_mem(是否是内部员工)等,维度值维度录入有与所述维度名称主键一一对应的维度值,该维度值为具体的参数数据,如F(女)、M(男)、Y(是)、N(否)等,图3为一种维度码值表示例。
较佳地,维度码值表的结构还包括层次标记维度,层次标记维度录入有与维度名称主键一一对应的层次标记,例如Dim_1对应的层次标记为1,Dim_2对应的层次标记为2,Dim_3对应的层次标记为3,Dim_4对应的层次标记为4,Dim_5对应的层次标记为5,以此类推。层次标记可以更直接的显示出所对应的维度名称主键。
请参阅图4,上述实施例中的指标码值表的结构包括指标名称主键维度、指标名称字段维度和指标值维度;
指标名称主键维度录入有指标名称主键;指标名称字段维度录入有与指标名称主键一一对应的指标名称字段;指标值维度录入有与指标名称主键一一对应的指标值。
具体实施时,由于活动信息表中的维度名称主键包括Index_1、Index_2、Index_3和Index_4,那么在构建维度码值表时,维度名称主键维度也应包括Index_1、Index_2、Index_3和Index_4的指标名称主键,且指标名称字段维度录入有与各指标名称主键一一对应的指标名称字段,如支付会员数、登录会员数、注册会员数和支付金额等,指标值维度录入有与指标名称主键一一对应的指标值,该指标值为具体的参数数据,如45、345、3453等,图3为一种指标码值表示例。
较佳地,指标码值表的结构还包括层次标记维度,层次标记维度录入有与指标名称主键一一对应的层次标记,例如Index_1对应的层次标记为1,Index_2对应的层次标记为2,Index_3对应的层次标记为3,Index_4对应的层次标记为4,以此类推。层次标记可以更直接的显示出所对应的指标名称主键。
当然,上述实施例主表中的部分维度名称主键和/或指标名称主键允许为空。
具体实施时,上述情况适用于同时对两次或多次活动的建模分析,以促销活动为例说明,包括活动1和活动2,活动1和活动2中既存在相同的维度名称字段维度和维度值维度,也存在不同的维度名称字段维度和维度值维度,在建模时可将活动1和活动2的数据集中体现在同一张主表中,需求名称维度中既包括活动1的需求名称,也包括活动2的需求名称,此外,对于相同的维度名称字段维度和维度值维度可以共用,对于不同维度名称字段维度和维度值维度可以允许其中一个活动对应的数据为空,以此来降低维度层次,提高数据的处理速度。
例如,A部门提出的需求:我想要818大促中的各大区的参加人数(活动1),B部门提出的需求:我想要在活动1中发了多少种券以及多少张券(活动2),针对此种场景,我们在主表抽象出活动1的大区维度和参加人数指标,活动2抽象出券类型维度和券张数指标,活动1对应的需求名称为818大促参加人数,活动2对应的需求名称为活动1中发放的券类型。
实施例二
本实施例提供一种基于简单需求的快速建模装置,包括:
建模单元,用于根据用户需求构建主表以及与所述主表关联的维度码值表和指标码值表,所述主表结构包括需求名称维度、多个维度名称维度和多个指标名称维度;
所述主表的需求名称维度中录入有至少一个需求名称,所述维度名称维度中录入有与各所述需求名称对应的维度名称主键,所述指标名称维度中录入有与各所述需求名称对应的指标名称主键;
所述维度码值表中录入有与所述维度名称主键对应的维度值,所述指标码值表中录入有与所述指标名称主键对应的指标值。
与现有技术相比,本实施例提供的基于简单需求的快速建模装置的有益效果与上述实施例提供的基于简单需求的快速建模方法的有益效果相同,在此不做赘述。
实施例三
本实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述基于简单需求的快速建模方法的步骤。
与现有技术相比,本实施例提供的计算机可读存储介质的有益效果与上述技术方案提供的基于简单需求的快速建模方法的有益效果相同,在此不做赘述。
本领域普通技术人员可以理解,实现上述发明方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,上述程序可以存储于计算机可读取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,上述的存储介质可以是:ROM/RAM、磁碟、光盘、存储卡等。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种基于简单需求的快速建模方法,其特征在于,包括:
根据用户需求构建主表以及与所述主表关联的维度码值表和指标码值表,所述主表结构包括需求名称维度、多个维度名称维度和多个指标名称维度;
所述主表的需求名称维度中录入有至少一个需求名称,所述维度名称维度中录入有与各所述需求名称对应的维度名称主键,所述指标名称维度中录入有与各所述需求名称对应的指标名称主键;
所述维度码值表中录入有与所述维度名称主键对应的维度值,所述指标码值表中录入有与所述指标名称主键对应的指标值。
2.根据权利要求1所述的方法,其特征在于,所述主表结构还包括编码维度,所述编码维度中录入有与所述需求名称对应的编码。
3.根据权利要求1或2所述的方法,其特征在于,所述需求名称维度为客户群名称。
4.根据权利要求1所述的方法,其特征在于,所述维度码值表的结构包括维度名称主键维度、维度名称字段维度和维度值维度;
所述维度名称主键维度录入有所述维度名称主键;
所述维度名称字段维度录入有与所述维度名称主键一一对应的维度名称字段;
所述维度值维度录入有与所述维度名称主键一一对应的维度值。
5.根据权利要求4所述的方法,其特征在于,所述维度码值表的结构还包括层次标记维度,所述层次标记维度录入有与所述维度名称主键一一对应的层次标记。
6.根据权利要求1或4所述的方法,其特征在于,所述指标码值表的结构包括指标名称主键维度、指标名称字段维度和指标值维度;
所述指标名称主键维度录入有所述指标名称主键;
所述指标名称字段维度录入有与所述指标名称主键一一对应的指标名称字段;
所述指标值维度录入有与所述指标名称主键一一对应的指标值。
7.根据权利要求6所述的方法,其特征在于,所述指标码值表的结构还包括层次标记维度,所述层次标记维度录入有与所述指标名称主键一一对应的层次标记。
8.根据权利要求1所述的方法,其特征在于,所述主表中的部分维度名称主键和/或指标名称主键允许为空。
9.一种基于简单需求的快速建模装置,其特征在于,包括:
建模单元,用于根据用户需求构建主表以及与所述主表关联的维度码值表和指标码值表,所述主表结构包括需求名称维度、多个维度名称维度和多个指标名称维度;
所述主表的需求名称维度中录入有至少一个需求名称,所述维度名称维度中录入有与各所述需求名称对应的维度名称主键,所述指标名称维度中录入有与各所述需求名称对应的指标名称主键;
所述维度码值表中录入有与所述维度名称主键对应的维度值,所述指标码值表中录入有与所述指标名称主键对应的指标值。
10.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,计算机程序被处理器运行时执行上述权利要求1至8任一项所述方法的步骤。
CN202010274459.6A 2020-04-09 2020-04-09 基于简单需求的快速建模方法及装置 Pending CN111552679A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010274459.6A CN111552679A (zh) 2020-04-09 2020-04-09 基于简单需求的快速建模方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010274459.6A CN111552679A (zh) 2020-04-09 2020-04-09 基于简单需求的快速建模方法及装置

Publications (1)

Publication Number Publication Date
CN111552679A true CN111552679A (zh) 2020-08-18

Family

ID=72005669

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010274459.6A Pending CN111552679A (zh) 2020-04-09 2020-04-09 基于简单需求的快速建模方法及装置

Country Status (1)

Country Link
CN (1) CN111552679A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112527918A (zh) * 2020-12-04 2021-03-19 广州橙行智动汽车科技有限公司 一种数据处理的方法和装置
CN114417842A (zh) * 2021-12-29 2022-04-29 天闻数媒科技(北京)有限公司 教育数据报告的动态分析文案生成方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614402A (zh) * 2018-12-11 2019-04-12 北京京东金融科技控股有限公司 多维数据查询方法和装置
CN110674228A (zh) * 2019-09-23 2020-01-10 阿里巴巴集团控股有限公司 数据仓库模型构建和数据查询方法、装置及设备
CN110837508A (zh) * 2019-11-08 2020-02-25 深圳市彬讯科技有限公司 一种口径系统建立方法、装置、设备及计算机存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614402A (zh) * 2018-12-11 2019-04-12 北京京东金融科技控股有限公司 多维数据查询方法和装置
CN110674228A (zh) * 2019-09-23 2020-01-10 阿里巴巴集团控股有限公司 数据仓库模型构建和数据查询方法、装置及设备
CN110837508A (zh) * 2019-11-08 2020-02-25 深圳市彬讯科技有限公司 一种口径系统建立方法、装置、设备及计算机存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112527918A (zh) * 2020-12-04 2021-03-19 广州橙行智动汽车科技有限公司 一种数据处理的方法和装置
CN114417842A (zh) * 2021-12-29 2022-04-29 天闻数媒科技(北京)有限公司 教育数据报告的动态分析文案生成方法及系统
CN114417842B (zh) * 2021-12-29 2022-12-09 天闻数媒科技(北京)有限公司 教育数据报告的动态分析文案生成方法及系统

Similar Documents

Publication Publication Date Title
Soleimani-Damaneh et al. Shannon’s entropy for combining the efficiency results of different DEA models: Method and application
CN112507936A (zh) 图像信息审核方法、装置、电子设备及可读存储介质
CN113297435B (zh) 一种基于基因码的物资管理方法和系统
CN111552679A (zh) 基于简单需求的快速建模方法及装置
CN113591900A (zh) 一种高需求响应潜力用户的识别方法、装置及终端设备
CN114186132A (zh) 信息推荐方法、装置、电子设备及存储介质
CN115860023A (zh) 基于二维码的卷烟设备管理方法、装置、电子设备及介质
CN107038224A (zh) 数据处理方法及数据处理装置
CN113837631A (zh) 员工评价方法、装置、电子设备及可读存储介质
CN112988848B (zh) 一种数据处理方法、装置、设备及存储介质
CN113722533A (zh) 信息推送方法、装置、电子设备及可读存储介质
CN113505273A (zh) 基于重复数据筛选的数据排序方法、装置、设备及介质
CN112184300A (zh) 一种达人匹配方法、介质、系统和设备
CN114722789A (zh) 数据报表集成方法、装置、电子设备及存储介质
CN114022188A (zh) 目标人群圈选方法、装置、设备以及存储介质
CN113642291A (zh) 上市公司报告的逻辑结构树构建方法、系统、存储介质及终端
CN113486646A (zh) 产品报告发布方法、装置、电子设备及可读存储介质
CN111309996A (zh) 一种智能化图书馆辅助管理系统
CN114581157B (zh) 基于大数据的销量预测方法、装置、电子设备及介质
CN115526373A (zh) 一种潜在离职人员的预判方法及系统
CN115510324B (zh) 一种标签体系的确定方法、装置、电子设备及存储介质
CN112486945B (zh) 基于微服务的企业服务对外应用系统的构建方法
CN114817531A (zh) 一种员工职业生涯测评方法、装置、设备及存储介质
CN115997203A (zh) 数据处理方法、装置、电子设备和计算机可读存储介质
CN114912818A (zh) 资产指标分析方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200818

RJ01 Rejection of invention patent application after publication