CN111782691A - 指标关联性确定方法、装置、电子设备及存储介质 - Google Patents
指标关联性确定方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111782691A CN111782691A CN202010404574.0A CN202010404574A CN111782691A CN 111782691 A CN111782691 A CN 111782691A CN 202010404574 A CN202010404574 A CN 202010404574A CN 111782691 A CN111782691 A CN 111782691A
- Authority
- CN
- China
- Prior art keywords
- calculation
- index
- indexes
- sub
- calculation indexes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004364 calculation method Methods 0.000 claims abstract description 407
- 238000001914 filtration Methods 0.000 claims description 21
- 230000002776 aggregation Effects 0.000 claims description 11
- 238000004220 aggregation Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000006116 polymerization reaction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开的实施例提供了一种指标关联性确定方法、装置、电子设备及存储介质。所述方法包括:获取至少两个计算指标;对所述至少两个计算指标进行解析,确定所述至少两个计算指标在至少一个维度下的子计算指标;从预置数据库中获取所述子计算指标对应的数据字段;根据所述子计算指标对应的数据字段,确定所述至少两个计算指标之间的关联性。本公开实施例可以提高识别相似指标的效率和准确率。
Description
技术领域
本公开的实施例涉及数据指标处理技术领域,尤其涉及一种指标关联性确定方法、装置、电子设备及存储介质。
背景技术
数据仓库中的数据最终是以计算指标的形式输出数据价值,工作中经常会存在,指标名称不同但计算逻辑一致的指标,其实是同一个指标,此种情况很容易造成重复计算,浪费了计算存储资源。同时还增加了指标的复杂度,容易造成误解,增加了沟通和使用成本,并且在日常中难以被发现。
在现有技术方案中,通常是采用人工管理的方式,通过指标名称判断指标相似度,这种方式效率非常低下,且相似指标识别的准确率不高。
发明内容
本公开的实施例提供一种指标关联性确定方法、装置、电子设备及存储介质,用以提高识别相似指标的效率及准确率。
根据本公开的实施例的第一方面,提供了一种指标关联性确定方法,包括:
获取至少两个计算指标;
对所述至少两个计算指标进行解析,确定所述至少两个计算指标在至少一个维度下的子计算指标;
从预置数据库中获取所述子计算指标对应的数据字段;
根据所述子计算指标对应的数据字段,确定所述至少两个计算指标之间的关联性。
可选地,所述对所述至少两个计算指标进行解析,确定所述至少两个计算指标在至少一个维度下的子计算指标,包括:
对所述至少两个计算指标进行解析,得到所述至少两个计算指标在多个维度下的初始子计算指标;
对每个计算指标对应的初始子计算指标进行去重处理,得到每个计算指标在所述至少一个维度下的子计算指标。
可选地,所述从预置数据库中获取所述子计算指标对应的数据字段,包括:
根据所述至少两个计算指标对应的子计算指标在所述预置数据库中进行检索,得到所述至少两个计算指标对应的在所述子计算指标下的数据字段。
可选地,所述子计算指标包括:计算维度指标、聚合方式指标、数据来源指标、过滤规则指标、关联关系指标中的至少一种。
可选地,在所述子计算指标同时包含所述计算维度指标、所述聚合方式指标、所述数据来源指标、所述过滤规则指标、所述关联关系指标时,所述根据所述子计算指标对应的数据字段,确定所述至少两个计算指标之间的关联性,包括:
在根据所述数据字段确定所述至少两个计算指标对应的子计算指标完全相同时,确定所述至少两个计算指标为重复计算指标;
在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述过滤规则指标和所述计算维度指标不相同时,确定所述至少两个计算指标为相似计算指标;
在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述关联关系指标相同时,确定所述至少两个计算指标为同一类型计算指标。
根据本公开的实施例的第二方面,提供了一种指标关联性确定装置,包括:
计算指标获取模块,用于获取至少两个计算指标;
子计算指标确定模块,用于对所述至少两个计算指标进行解析,确定所述至少两个计算指标在至少一个维度下的子计算指标;
数据字段获取模块,用于从预置数据库中获取所述子计算指标对应的数据字段;
指标关联性确定模块,用于根据所述子计算指标对应的数据字段,确定所述至少两个计算指标之间的关联性。
可选地,所述子计算指标确定模块包括:
初始计算指标获取单元,用于对所述至少两个计算指标进行解析,得到所述至少两个计算指标在多个维度下的初始子计算指标;
子计算指标获取单元,用于对每个计算指标对应的初始子计算指标进行去重处理,得到每个计算指标在所述至少一个维度下的子计算指标。
可选地,所述数据字段获取模块包括:
数据字段获取单元,用于根据所述至少两个计算指标对应的子计算指标在所述预置数据库中进行检索,得到所述至少两个计算指标对应的在所述子计算指标下的数据字段。
可选地,所述子计算指标包括:计算维度指标、聚合方式指标、数据来源指标、过滤规则指标、关联关系指标中的至少一种。
可选地,在所述子计算指标同时包含所述计算维度指标、所述聚合方式指标、所述数据来源指标、所述过滤规则指标、所述关联关系指标时,所述指标关联性确定模块包括:
重复指标确定单元,用于在根据所述数据字段确定所述至少两个计算指标对应的子计算指标完全相同时,确定所述至少两个计算指标为重复计算指标;
相似指标确定单元,用于在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述过滤规则指标和所述计算维度指标不相同时,确定所述至少两个计算指标为相似计算指标;
同类指标确定单元,用于在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述关联关系指标相同时,确定所述至少两个计算指标为同一类型计算指标。
根据本公开的实施例的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的指标关联性确定方法。
根据本公开的实施例的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项所述的指标关联性确定方法。
本公开的实施例提供的指标关联性确定方案,通过获取至少两个计算指标,对至少两个计算指标进行解析,确定至少两个计算指标在至少一个维度下的子计算指标,从预置数据库中获取子计算指标对应的数据字段,根据子计算指标对应的数据字段,确定至少两个计算指标之间的关联性。本公开实施例通过根据数据计算指标的计算逻辑对数据计算指标解析得到多个维度下的子计算指标,进而依据子计算指标判断数据计算指标之间的关联性,而不依赖于指标名称,因此,本公开实施例能够提高识别相似指标的效率及准确率。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种指标关联性确定方法的步骤流程图;
图2为本公开实施例提供的另一种指标关联性确定方法的步骤流程图;
图3为本公开实施例提供的一种指标关联性确定装置的结构示意图;
图4为本公开实施例提供的一种指标关联性确定装置的结构示意图。
具体实施方式
下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
实施例一
参照图1,示出了本公开实施例提供的一种指标关联性确定方法的步骤流程图,如图1所示,该指标关联性确定方法具体可以包括如下步骤:
步骤101:获取至少两个计算指标。
本公开实施例可以应用于业务人员设置的数仓中数据的关联计算指标进行检测的场景中。
数仓中的数据是以计算指标的形式输出数据价值,数仓中存储的数据是以行列的形式存在的,是没有任何含义的原始数据,为了体现数仓中数据的价值,通常会由业务人员设置计算指标,以输出数据价值,例如,对网站一天内的访问次数、访问人数等。
计算指标是指由业务人员预先设置的用于体现数仓中数据的价值的指标。
在需要对业务人员设置的计算指标关联性进行检测时,可以获取由业务人员预先设置的至少两个计算指标。
在获取至少两个计算指标之后,执行步骤102。
步骤102:对所述至少两个计算指标进行解析,确定所述至少两个计算指标在至少一个维度下的子计算指标。
子计算指标是指将计算指标进行拆解之后得到的多个维度的子指标,在本实施例中,在获取到至少两个计算指标之后,可以将计算指标的完整SQL(Structured QueryLanguage,结构化查询语言)输入指标识别系统,指标识别系统可以对计算指标的完整SQL进行解析,所有计算指标会解析成固定格式的计算逻辑,进而,可以确定至少两个计算指标在至少一个维度下的子计算指标(如计算维度指标,数据来源指标,聚合方式指标,过滤规则指标,关联关系指标等)。
在对至少两个计算指标进行解析,得到至少两个计算指标在至少一个维度下的子计算指标之后,执行步骤103。
步骤103:从预置数据库中获取所述子计算指标对应的数据字段。
在对至少两个计算指标进行解析,得到至少两个计算指标在至少一个维度下的子计算指标之后,可以根据子计算指标在预置数据库中进行检索,以获取子计算指标对应的数据字段。具体地检索过程可以为按照SQL语句的查询过程,本实施例对此过程不再加以详细描述。
在从预置数据库中获取到子计算指标对应的数据字段之后,执行步骤104。
步骤104:根据所述子计算指标对应的数据字段,确定所述至少两个计算指标之间的关联性。
在从预置数据库中获取到子计算指标对应的数据字段之后,可以根据子计算指标对应的数据字段,确定至少两个计算指标之间的关联性,具体地,可以根据数据字段判定至少两个计算指标的哪个维度的子计算指标相同,根据判定结果,确定出至少两个计算指标之间的关联性。
本公开实施例提供的指标关联性确定方法,通过获取至少两个计算指标,对至少两个计算指标进行解析,确定至少两个计算指标在至少一个维度下的子计算指标,从预置数据库中获取子计算指标对应的数据字段,根据子计算指标对应的数据字段,确定至少两个计算指标之间的关联性。本公开实施例通过根据数据计算指标的计算逻辑对数据计算指标解析得到多个维度下的子计算指标,进而依据子计算指标判断数据计算指标之间的关联性,而不依赖于指标名称,因此,本公开实施例能够提高识别相似指标的效率及准确率。
实施例二
参照图2,示出了本公开实施例提供的另一种指标关联性确定方法的步骤流程图,如图2所示,该指标关联性确定方法具体可以包括如下步骤:
步骤201:获取至少两个计算指标。
本公开实施例可以应用于业务人员设置的数仓中数据的关联计算指标进行检测的场景中。
数仓中的数据是以计算指标的形式输出数据价值,数仓中存储的数据是以行列的形式存在的,是没有任何含义的原始数据,为了体现数仓中数据的价值,通常会由业务人员设置计算指标,以输出数据价值,例如,对网站一天内的访问次数、访问人数等。
计算指标是指由业务人员预先设置的用于体现数仓中数据的价值的指标。
在需要对业务人员设置的计算指标关联性进行检测时,可以获取由业务人员预先设置的至少两个计算指标。
在获取至少两个计算指标之后,执行步骤202。
步骤202:对所述至少两个计算指标进行解析,得到所述至少两个计算指标在多个维度下的初始子计算指标。
初始子计算指标是指在对计算指标进行解析之后,得到的多个维度下的还未进行过滤的子计算指标。
在获取到至少两个计算指标之后,可以将计算指标的完整SQL(Structured QueryLanguage,结构化查询语言)输入指标识别系统,指标识别系统可以对计算指标的完整SQL进行解析,所有计算指标会解析成固定格式的计算逻辑,进而,可以确定至少两个计算指标在多个维度下的初始子计算指标。
在对至少两个计算指标进行解析得到至少两个计算指标在多个维度下的初始子计算指标之后,执行步骤203。
步骤203:对每个计算指标对应的初始子计算指标进行去重处理,得到每个计算指标在所述至少一个维度下的子计算指标。
在得到至少两个计算指标在多个维度下的初始子计算指标之后,可以对每个计算指标对应的初始子计算指标进行去重处理,即由业务人员将初始子计算指标中的相同指标去除,将相同的初始子计算指标仅保留一个。
在对每个计算指标对应的初始子计算指标进行去重处理之后,可以得到每个计算指标在至少一个维度下的子计算指标。
在本实施例中,子计算指标可以包括:计算维度指标、聚合方式指标、数据来源指标、过滤规则指标、关联关系指标等指标中的至少一种。
其中,计算维度指标是指数据字段的分组指标,例如,以性别为例,数据字段对应的性别为男则为一个维度,性别为女为另外一个维度。
聚合方式指标是指数据字段所关联的数据表的指标,例如,一个数据字段可能关联多个数据表,通过累加平均大小等聚合计算,判断两个数据字段是否相同。
数据来源指标是指数据字段的数据主表来源。
过滤规则指标是指确定最终有效表后涉及的所有where条件为所有过滤规则指标,例如,对于数据字段可以传入一个性别,如男等,将该性别作为一个过滤规则。
关联关系指标是指以主表为目标表验证辅助表是否对统计指标有最终结果影响的维度。
在对每个计算指标对应的初始子计算指标进行去重处理,得到每个计算指标在至少一个维度下的子计算指标之后,执行步骤204。
步骤204:根据所述至少两个计算指标对应的子计算指标在所述预置数据库中进行检索,得到所述至少两个计算指标对应的在所述子计算指标下的数据字段。
在对每个计算指标对应的初始子计算指标进行去重处理,得到每个计算指标在至少一个维度下的子计算指标之后,可以根据子计算指标在预置数据库中进行检索,以获取至少两个计算指标对应的在子计算指标下的数据字段。具体地检索过程可以为按照SQL语句的查询过程,本实施例对此过程不再加以详细描述。
在得到至少两个计算指标对应的在子计算指标下的数据字段之后,执行步骤205,或者执行步骤206,或者执行步骤207。
步骤205:在根据所述数据字段确定所述至少两个计算指标对应的子计算指标完全相同时,确定所述至少两个计算指标为重复计算指标。
在获取至少两个计算指标对应的在子计算指标下的数据字段之后,可以根据每个计算指标对应的数据字段判断两个计算指标对应的子计算指标是否相同。
在根据数据字段确定至少两个计算指标对应的子计算指标完全相同时,即至少两个计算指标对应的计算维度指标、聚合方式指标、数据来源指标、过滤规则指标、关联关系指标均相同,此时,可以确定至少两个计算指标为重复计算指标,也即至少两个计算指标完全相同。
步骤206:在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述过滤规则指标和所述计算维度指标不相同时,确定所述至少两个计算指标为相似计算指标。
在根据数据字段判定至少两个计算指标下的子计算指标中仅过滤规则指标和计算维度指标不相同时,此时,聚合方式指标、数据来源指标、关联关系指标均相同,可以确定至少两个计算指标为相似计算指标。
步骤207:在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述关联关系指标相同时,确定所述至少两个计算指标为同一类型计算指标。
在根据数据字段判定至少两个计算指标下对应的子计算指标中仅关联关系指标相同时,此时,至少两个计算指标对应的计算维度指标、聚合方式指标、数据来源指标、过滤规则指标均不相同,可以确定至少两个计算指标为同一类型的计算指标。
本实施例通过根据数据计算指标的计算逻辑对数据计算指标解析得到多个维度下的子计算指标,进而依据子计算指标判断数据计算指标之间的关联性,而不依赖于指标名称,能够提高识别相似指标的准确率。
本公开实施例提供的指标关联性确定方法,通过获取至少两个计算指标,对至少两个计算指标进行解析,确定至少两个计算指标在至少一个维度下的子计算指标,从预置数据库中获取子计算指标对应的数据字段,根据子计算指标对应的数据字段,确定至少两个计算指标之间的关联性。本公开实施例通过根据数据计算指标的计算逻辑对数据计算指标解析得到多个维度下的子计算指标,进而依据子计算指标判断数据计算指标之间的关联性,而不依赖于指标名称,因此,本公开实施例能够提高识别相似指标的效率及准确率。
实施例三
参照图3,示出了本公开实施例提供的一种指标关联性确定装置的结构示意图,如图3所示,该指标关联性确定装置具体可以包括如下模块:
计算指标获取模块310,用于获取至少两个计算指标;
子计算指标确定模块320,用于对所述至少两个计算指标进行解析,确定所述至少两个计算指标在至少一个维度下的子计算指标;
数据字段获取模块330,用于从预置数据库中获取所述子计算指标对应的数据字段;
指标关联性确定模块340,用于根据所述子计算指标对应的数据字段,确定所述至少两个计算指标之间的关联性。
本公开实施例提供的指标关联性确定装置,通过获取至少两个计算指标,对至少两个计算指标进行解析,确定至少两个计算指标在至少一个维度下的子计算指标,从预置数据库中获取子计算指标对应的数据字段,根据子计算指标对应的数据字段,确定至少两个计算指标之间的关联性。本公开实施例通过根据数据计算指标的计算逻辑对数据计算指标解析得到多个维度下的子计算指标,进而依据子计算指标判断数据计算指标之间的关联性,而不依赖于指标名称,因此,本公开实施例能够提高识别相似指标的效率及准确率。
实施例四
参照图4,示出了本公开实施例提供的另一种指标关联性确定装置的结构示意图,如图4所示,该指标关联性确定装置具体可以包括如下模块:
计算指标获取模块410,用于获取至少两个计算指标;
子计算指标确定模块420,用于对所述至少两个计算指标进行解析,确定所述至少两个计算指标在至少一个维度下的子计算指标;
数据字段获取模块430,用于从预置数据库中获取所述子计算指标对应的数据字段;
指标关联性确定模块440,用于根据所述子计算指标对应的数据字段,确定所述至少两个计算指标之间的关联性。
可选地,所述子计算指标确定模块420包括:
初始计算指标获取单元421,用于对所述至少两个计算指标进行解析,得到所述至少两个计算指标在多个维度下的初始子计算指标;
子计算指标获取单元422,用于对每个计算指标对应的初始子计算指标进行去重处理,得到每个计算指标在所述至少一个维度下的子计算指标。
可选地,所述数据字段获取模块430包括:
数据字段获取单元431,用于根据所述至少两个计算指标对应的子计算指标在所述预置数据库中进行检索,得到所述至少两个计算指标对应的在所述子计算指标下的数据字段。
可选地,所述子计算指标包括:计算维度指标、聚合方式指标、数据来源指标、过滤规则指标、关联关系指标中的至少一种。
可选地,在所述子计算指标同时包含所述计算维度指标、所述聚合方式指标、所述数据来源指标、所述过滤规则指标、所述关联关系指标时,所述指标关联性确定模块440包括:
重复指标确定单元441,用于在根据所述数据字段确定所述至少两个计算指标对应的子计算指标完全相同时,确定所述至少两个计算指标为重复计算指标;
相似指标确定单元442,用于在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述过滤规则指标和所述计算维度指标不相同时,确定所述至少两个计算指标为相似计算指标;
同类指标确定单元443,用于在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述关联关系指标相同时,确定所述至少两个计算指标为同一类型计算指标。
本公开实施例提供的指标关联性确定装置,通过获取至少两个计算指标,对至少两个计算指标进行解析,确定至少两个计算指标在至少一个维度下的子计算指标,从预置数据库中获取子计算指标对应的数据字段,根据子计算指标对应的数据字段,确定至少两个计算指标之间的关联性。本公开实施例通过根据数据计算指标的计算逻辑对数据计算指标解析得到多个维度下的子计算指标,进而依据子计算指标判断数据计算指标之间的关联性,而不依赖于指标名称,因此,本公开实施例能够提高识别相似指标的效率及准确率。
本公开的实施例还提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述实施例的指标关联性确定方法。
本公开的实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的指标关联性确定方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。
Claims (12)
1.一种指标关联性确定方法,其特征在于,包括:
获取至少两个计算指标;
对所述至少两个计算指标进行解析,确定所述至少两个计算指标在至少一个维度下的子计算指标;
从预置数据库中获取所述子计算指标对应的数据字段;
根据所述子计算指标对应的数据字段,确定所述至少两个计算指标之间的关联性。
2.根据权利要求1所述的方法,其特征在于,所述对所述至少两个计算指标进行解析,确定所述至少两个计算指标在至少一个维度下的子计算指标,包括:
对所述至少两个计算指标进行解析,得到所述至少两个计算指标在多个维度下的初始子计算指标;
对每个计算指标对应的初始子计算指标进行去重处理,得到每个计算指标在所述至少一个维度下的子计算指标。
3.根据权利要求2所述的方法,其特征在于,所述从预置数据库中获取所述子计算指标对应的数据字段,包括:
根据所述至少两个计算指标对应的子计算指标在所述预置数据库中进行检索,得到所述至少两个计算指标对应的在所述子计算指标下的数据字段。
4.根据权利要求1所述的方法,其特征在于,所述子计算指标包括:计算维度指标、聚合方式指标、数据来源指标、过滤规则指标、关联关系指标中的至少一种。
5.根据权利要求4所述的方法,其特征在于,在所述子计算指标同时包含所述计算维度指标、所述聚合方式指标、所述数据来源指标、所述过滤规则指标、所述关联关系指标时,所述根据所述子计算指标对应的数据字段,确定所述至少两个计算指标之间的关联性,包括:
在根据所述数据字段确定所述至少两个计算指标对应的子计算指标完全相同时,确定所述至少两个计算指标为重复计算指标;
在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述过滤规则指标和所述计算维度指标不相同时,确定所述至少两个计算指标为相似计算指标;
在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述关联关系指标相同时,确定所述至少两个计算指标为同一类型计算指标。
6.一种指标关联性确定装置,其特征在于,包括:
计算指标获取模块,用于获取至少两个计算指标;
子计算指标确定模块,用于对所述至少两个计算指标进行解析,确定所述至少两个计算指标在至少一个维度下的子计算指标;
数据字段获取模块,用于从预置数据库中获取所述子计算指标对应的数据字段;
指标关联性确定模块,用于根据所述子计算指标对应的数据字段,确定所述至少两个计算指标之间的关联性。
7.根据权利要求6所述的装置,其特征在于,所述子计算指标确定模块包括:
初始计算指标获取单元,用于对所述至少两个计算指标进行解析,得到所述至少两个计算指标在多个维度下的初始子计算指标;
子计算指标获取单元,用于对每个计算指标对应的初始子计算指标进行去重处理,得到每个计算指标在所述至少一个维度下的子计算指标。
8.根据权利要求6所述的装置,其特征在于,所述数据字段获取模块包括:
数据字段获取单元,用于根据所述至少两个计算指标对应的子计算指标在所述预置数据库中进行检索,得到所述至少两个计算指标对应的在所述子计算指标下的数据字段。
9.根据权利要求6所述的装置,其特征在于,所述子计算指标包括:计算维度指标、聚合方式指标、数据来源指标、过滤规则指标、关联关系指标中的至少一种。
10.根据权利要求9所述的装置,其特征在于,在所述子计算指标同时包含所述计算维度指标、所述聚合方式指标、所述数据来源指标、所述过滤规则指标、所述关联关系指标时,所述指标关联性确定模块包括:
重复指标确定单元,用于在根据所述数据字段确定所述至少两个计算指标对应的子计算指标完全相同时,确定所述至少两个计算指标为重复计算指标;
相似指标确定单元,用于在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述过滤规则指标和所述计算维度指标不相同时,确定所述至少两个计算指标为相似计算指标;
同类指标确定单元,用于在根据所述数据字段确定所述至少两个计算指标对应的子计算指标中仅所述关联关系指标相同时,确定所述至少两个计算指标为同一类型计算指标。
11.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至6任一项所述的指标关联性确定方法。
12.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1至6任一项所述的指标关联性确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010404574.0A CN111782691A (zh) | 2020-05-13 | 2020-05-13 | 指标关联性确定方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010404574.0A CN111782691A (zh) | 2020-05-13 | 2020-05-13 | 指标关联性确定方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111782691A true CN111782691A (zh) | 2020-10-16 |
Family
ID=72753581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010404574.0A Pending CN111782691A (zh) | 2020-05-13 | 2020-05-13 | 指标关联性确定方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111782691A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107291749A (zh) * | 2016-03-31 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 一种数据指标关联关系的确定方法及装置 |
CN107463482A (zh) * | 2017-07-27 | 2017-12-12 | 东软集团股份有限公司 | 确定指标关联性的方法及装置 |
CN109840185A (zh) * | 2019-01-11 | 2019-06-04 | 新华三大数据技术有限公司 | 一种指标关联方法及装置 |
CN111026775A (zh) * | 2019-12-12 | 2020-04-17 | 国家电网有限公司大数据中心 | 关联指标的确定方法、装置、服务器和存储介质 |
-
2020
- 2020-05-13 CN CN202010404574.0A patent/CN111782691A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107291749A (zh) * | 2016-03-31 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 一种数据指标关联关系的确定方法及装置 |
CN107463482A (zh) * | 2017-07-27 | 2017-12-12 | 东软集团股份有限公司 | 确定指标关联性的方法及装置 |
CN109840185A (zh) * | 2019-01-11 | 2019-06-04 | 新华三大数据技术有限公司 | 一种指标关联方法及装置 |
CN111026775A (zh) * | 2019-12-12 | 2020-04-17 | 国家电网有限公司大数据中心 | 关联指标的确定方法、装置、服务器和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111565171B (zh) | 异常数据的检测方法、装置、电子设备及存储介质 | |
CN108536739B (zh) | 元数据敏感信息字段识别方法、装置、设备及存储介质 | |
CN112445875B (zh) | 数据关联及检验方法、装置、电子设备及存储介质 | |
CN111242318B (zh) | 基于异构特征库的业务模型训练方法及装置 | |
CN111324781A (zh) | 一种数据分析方法、装置及设备 | |
CN111310052A (zh) | 用户画像构建方法、装置及计算机可读存储介质 | |
CN113792084A (zh) | 数据热度的分析方法、装置、设备及存储介质 | |
CN111258905A (zh) | 缺陷定位方法、装置和电子设备及计算机可读存储介质 | |
CN110019762B (zh) | 一种问题定位方法、存储介质和服务器 | |
CN111402068B (zh) | 基于大数据的保费数据分析方法、装置及存储介质 | |
CN111026574B (zh) | 诊断Elasticsearch集群问题的方法及装置 | |
CN110083731B (zh) | 图像检索方法、装置、计算机设备及存储介质 | |
CN110298581B (zh) | 确定风险指标值的方法及装置 | |
EP3828712A1 (en) | Data parsing method and device | |
CN111782691A (zh) | 指标关联性确定方法、装置、电子设备及存储介质 | |
CN113626558B (zh) | 一种基于智能推荐的字段标准化的方法和系统 | |
CN112131215B (zh) | 自底向上的数据库信息获取方法及装置 | |
CN111737488B (zh) | 基于领域实体提取和关联分析的信息溯源方法及装置 | |
CN114090643A (zh) | 招聘信息推荐方法、装置、设备及存储介质 | |
CN109840259B (zh) | 数据查询方法、装置、电子设备及可读存储介质 | |
CN111897803A (zh) | 一种面向电力行业业务系统的数据库完整性评价方法 | |
CN113344023A (zh) | 一种代码推荐方法、装置及系统 | |
CN112434195A (zh) | 数据解析方法、装置、电子设备及计算机可读存储介质 | |
US20200097595A1 (en) | Augmenting project data with searchable metadata for facilitating project queries | |
CN111611248B (zh) | 一种自动分析指标口径的方法、系统和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |