WO2023155273A1

WO2023155273A1 - 相关系数计算方法、装置、设备和存储介质

Info

Publication number: WO2023155273A1
Application number: PCT/CN2022/083628
Authority: WO
Inventors: 冼立; 宋琦; 李栋; 李扬; 韩卿
Original assignee: 上海跬智信息技术有限公司
Priority date: 2022-02-15
Filing date: 2022-03-29
Publication date: 2023-08-24
Also published as: CN114547054A

Abstract

本申请公开了一种相关系数计算方法、装置、设备和存储介质。该方法包括：接收客户端发送的元数据的第一维度的相关系数的查询请求；从预先设置的隐藏度量值数据库中获取预先计算的元数据的第一维度的隐藏度量值；根据所述隐藏度量值和相关性计算公式计算得到所述第一维度的相关系数；将所述第一维度的相关系数发送给所述客户端。本申请的上述方法，直接查询隐藏度量值，获取隐藏度量值后，根据相关性公式进行计算相关性，提高了相关性计算的效率。

Description

相关系数计算方法、装置、设备和存储介质

技术领域

本申请涉及计算机技术领域，具体而言，涉及一种相关系数计算方法、装置、设备和存储介质。

背景技术

随着数据分析越来越广泛的运用于各大行业，快速的使用数据分析算法获取分析结果成为各个数据分析师最基本要求。在计算两列数据的相关性的计算过程中，需要进行程序开发，制作相关性计算的函数CORR来进行计算，这需要程序员开发计算程序，周期比较长。

发明内容

本申请的主要目的在于提供一种相关系数计算方法、装置、设备和存储介质，以解决上述问题。

为了实现上述目的，根据本申请的一个方面，提供了一种相关系数计算方法，包括：

接收客户端发送的元数据的第一维度的相关系数的查询请求；

从预先设置的隐藏度量值数据库中获取预先计算的元数据的第一维度的隐藏度量值；

根据所述隐藏度量值和相关性计算公式计算得到所述第一维度的相关系数；

将所述第一维度的相关系数发送给所述客户端。

在一种实施方式中，所述隐藏度量值包括：

第一隐藏度量值n；

第二隐藏度量值A＝SUM(XY)；

第三隐藏度量值B＝SUM(X ²)；

第四隐藏度量值C＝SUM(Y ²)；

第五隐藏度量值D＝SUM(X)；

第六隐藏度量值E＝SUM(Y)；

其中，n为第一列元数据，或第二列元数据的数量；

X为第一列元数据；

Y为第二列元数据。

在一种实施方式中，所述相关性计算公式为：

其中，r为相关性度量值。

在一种实施方式中，分别根据所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值的标识从隐藏度量值数据库中查找确定所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值。

在一种实施方式中，建立隐藏度量值数据库，包括：

获取第一列元数据X和第二列元数据Y；

统计所述第一列元数据X的数量n得到第一隐藏度量值；

根据所述第一列元数据X和第二列元数据Y分别采用以下公式计算得到所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值；

第二隐藏度量值

第三隐藏度量值

第四隐藏度量值

第五隐藏度量值

第六隐藏度量值

在一种实施方式中，获取所述第一维度的上一级维度，得到第二维度；

从预先设置的隐藏度量值数据库中获取所述第二维度的预计算的隐藏度量值；

根据所述第二维度的隐藏度量值和度量计算公式计算得到所述第二维度的度量值；

将所述第二维度的度量值发送给所述客户端。

在一种实施方式中，将所述第一维度的相关系数发送给所述客户端之后，所述方法还包括：

将所述度量值保存在度量值数据库中；

对所述度量值数据库进行更新，加入新的度量值；

根据所述新的度量值确定所述新的度量值相关的隐藏度量值；

对所述隐藏度量值数据库进行更新，加入所述新的度量值相关的隐藏度量值。

为了实现上述目的，根据本申请的另一方面，提供了一种相关系数计算装置，包括：

接收模块，用于接收客户端发送的元数据的第一维度的相关系数的查询请求；

处理模块，用于从预先设置的隐藏度量值数据库中获取预先计算的元数据的第一维度的隐藏度量值；

发送模块，用于将所述第一维度的相关系数发送给所述客户端。

在一种实施方式中，处理模块还用于，分别根据所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值的标识从隐藏度量值数据库中查找确定所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值。

在一种实施方式中，处理模块还用于，获取第一列元数据X和第二列元数据Y；

统计所述第一列元数据X的数量n得到第一隐藏度量值；

第二隐藏度量值

第三隐藏度量值

第四隐藏度量值

第五隐藏度量值

第六隐藏度量值

在一种实施方式中，处理模块还用于，获取所述第一维度的上一级维度，得到第二维度；

将所述第二维度的度量值发送给所述客户端。

在一种实施方式中，处理模块还用于，将所述第一维度的相关系数发送给所述客户端之后，将所述度量值保存在度量值数据库中；

对所述度量值数据库进行更新，加入新的度量值；

为了实现上述目的，根据本申请的第三方面，提供了一种电子设备；包括至少一个处理器和至少一个存储器；所述存储器用于存储一个或多个程序指令；所述处理器，用于运行一个或多个程序指令，用以执行上述任一项所述的步骤。

根据本申请的第四方面，提供了一种计算机可读存储介质，计算机可读存储介质中包含一个或多个程序指令，所述一个或多个程序指令用于执行上述任意一项所述的步骤。

在本申请实施例中，由于隐藏度量值已经预先计算并存储，计算相关性时，只需要查询隐藏度量值，获取隐藏度量值后，根据相关性公式进行计算相关性，提高了相关性计算的效率。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解，使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种相关系数计算方法的流程图；

图2是根据本申请实施例的另一种相关系数计算方法的流程图；

图3是根据本申请实施例的一种相关系数计算装置的结构示意图；

图4是根据本申请实施例的一种相关系数计算设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

基于此，本申请提出了一种相关系数计算方法，参见附图1所示的一种相关系数计算方法的流程图；该方法包括：

步骤S102，接收客户端发送的元数据的第一维度的相关系数的查询请求；

其中，相关系数，也称为度量值。

示例性的，元数据为某种商品的价格和数量，用两列表示。X表示该商品的价格，Y表示该商品的销售数量；函数相关系数度量值CORR(X,Y)计算该商品的价格和销售数量之间的相关性。

其中，第一维度为县、市或者为省。

步骤S104，从预先设置的隐藏度量值数据库中获取预先计算的元数据的第一维度的隐藏度量值；

具体的，隐藏度量值包括：

第一隐藏度量值n；

第二隐藏度量值A＝SUM(XY)；

第三隐藏度量值B＝SUM(X ²)；

第四隐藏度量值C＝SUM(Y ²)；

第五隐藏度量值D＝SUM(X)；

第六隐藏度量值E＝SUM(Y)；

其中，n为第一列元数据，或第二列元数据的数量；

X为第一列元数据；

Y为第二列元数据。

步骤S106，根据所述隐藏度量值和相关性计算公式计算得到所述第一维度的相关系数；

具体的，相关性计算公式为：

其中，r为相关系数。

步骤S108，将所述第一维度的相关系数发送给所述客户端。

本发明的上述方法，由于隐藏度量值已经预先计算并存储，计算相关性时，只需要查询隐藏度量值，获取隐藏度量值后，根据相关性公式进行计算相关性，提高了相关性计算的效率。

为了方便查找上述的隐藏度量值比较方便，在一种实施方式中，分别根据所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值的标识从隐藏度量值数据库中查找确定所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值。

具体特点，可以为每个隐藏度量值设置标识，在隐藏度量值数据库中，存储大量的隐藏度量值。

参见表1：

表1

值得强调的是，维度不同，标识不同。

在一种实施方式中，建立隐藏度量值数据库时，获取第一列元数据X和第二列元数据Y；

统计所述第一列元数据X的数量n得到第一隐藏度量值；

第二隐藏度量值

第三隐藏度量值

第四隐藏度量值

第五隐藏度量值

第六隐藏度量值

为实现计算范围的扩大，可以实现更加粗粒度的维度计算，在一种实施方式中，获取所述第一维度的上一级维度，得到第二维度；

具体的，参见表1，可以根据标识来确定第二维度中的隐藏度量值。

将所述第二维度的度量值发送给所述客户端。

示例性的，第一维度为市，第二维度为省。对于X、Y两列元数据，不仅可以在市的维度计算该两列的相关性；还可以在省的维度进行该两列数据的相关性。

具体的，假设某省下面有五个市；

预先计算得到了每个市维度上的相关性系数度量值；以及隐藏度量值；

第一个市的隐藏度量值包括：

SUM(X ₁Y ₁)、

SUM(X ₁)、SUM(Y ₁)；

第二个市的隐藏度量值包括：

SUM(X ₂Y ₂)、

SUM(X ₂)、SUM(Y ₂)；

第三个市的隐藏度量值包括：

SUM(X ₃Y ₃)、

SUM(X ₃)、SUM(Y ₃)；

第四个市的隐藏度量值包括：

SUM(X ₄Y ₄)、

SUM(X ₄)、SUM(Y ₄)；

第五个市的隐藏度量值包括：

SUM(X ₅Y ₅)、

SUM(X ₅)、SUM(Y ₅)；

在一种方式中，可以根据元数据来推算出该省的各个隐藏度量值；

该省的X＝X ₁+X ₂+X ₃+X ₄+X ₅；

Y＝Y ₁+Y ₂+Y ₃+Y ₄+Y ₅；

根据X、Y来计算各个隐藏的度量值；

SUM(XY)、SUM(X ²)、SUM(Y ²)、SUM(X)、SUM(Y)。

在另一种方式中，可以根据第一个市的隐藏度量值、第二个市的隐藏度量值、第三个市的隐藏度量值、第四个市的隐藏度量值、第五个市的隐藏度量值来计算得到；

SUM(XY)、SUM(X ²)、SUM(Y ²)、SUM(X)、SUM(Y)。

具体的，

SUM(XY)＝SUM(X ₁Y ₁)+SUM(X ₂Y ₂)+SUM(X ₃Y ₃)+SUM(X ₄Y ₄)+SUM(X ₅Y ₅)；

SUM(X)＝SUM(X ₁)+SUM(X ₂)+SUM(X ₃)+SUM(X ₄)+SUM(X ₅)；

SUM(Y)＝SUM(Y ₁)+SUM(Y ₂)+SUM(Y ₃)+SUM(Y ₄)+SUM(Y ₅)。

还可以再向上一级维度计算，得到国家范围的X和Y的相关性度量值。

本申请的上述方法，通过维度的变化，更高一级维度的实现，可以节约直接从原始数据进行计算的开销。

为了实现隐藏度量值数据库的更新，在一种实施方式中，将所述第一维度的相关系数发送给所述客户端之后，将所述度量值保存在度量值数据库中；

对所述度量值数据库进行更新，加入新的度量值；

参见附图2所示的另一种相关系数计算方法的流程图；

本申请公开了描述一种基于Apache Kylin预计算实现的计算两列度量数值相关性的函数的方法，其中函数为CORR函数。可以预先进行数据预计算，计算得到隐藏度量值并保存，在海量数据下的快速获取两列字段的相关性数值。并且支持如果没有预计算的隐藏度量值的情况下，基于SPARK计算两列字段的相关性。

负责管理和维护CORR度量相关的元数据。当用户新增CORR度量后，该度量的元数据会被记录到系统的元数据库中，并且会自动展开生成一系列隐藏度量值，比如求和度量值，采用函数SUM实现，计算数量度量值，采用函数COUNT实现。

维护这些度量的元数据，并对用户提供管理的接口。根据CORR度量展开的公式。假设用户对于X，Y列新建了CORR(X,Y)的度量，那么它会被展开生成隐藏度量:COUNT(1),SUM(XY),SUM(X^2),SUM(Y^2),SUM(X),SUM(Y)。通过上述隐藏度量值来进行计算。

预计算隐藏度量值，建立隐藏度量值数据库。CORR度量在构建过程中不会被直接计算，而是会计算相关的隐藏的度量值；并且根据维度的不同，计算每个维度下的隐藏度量值，保存。预计算的结果同时也会被写入元数据，以便后续管理和查询。

不会直接查询相关性度量值，而是会取出预计算好的隐藏度量值，根据公式，对预计算的结果进行进一步的计算或聚合，得到相关性度量值，最终将结果返回给用户。

如果找不到合适的模型，则把查询下推提交到其他查询引擎，比如SPARK，进行查询。将用户的查询反馈给推荐模块，以便对预计算模型进行推荐优化。

具体的，模型包括维度、该维度对应的度量值、以及隐藏度量值；具体实现时，可以在表格中记录该维度的度量值，隐藏度量值。可以设置多个表格，每个表格表示一个维度。模型匹配的过程采用以下的步骤：

确定用户输入的相关性度量值对应的维度和度量值；

将所述维度和度量值和预先存储模型的维度和度量值进行比对；

如果相同，则确定模型匹配成功。可以采用该模型来进行计算。

根据用户的查询直接推荐出CORR度量，避免复杂的建模过程。推荐可以由用户主动触发，用户可以将常用的查询提交到该模块，或者通过查询历史中的查询自动触发。

推荐过程中会解析这些查询，识别出CORR相关性度量值，然后对比已有的模型，为预计算模型推荐出合适的维度组合或者新的度量。创建新的CORR度量的同时，也会创建出其对应的隐藏度量。

所支持度量的数据类型为：bigint，integer，int4，long8，tinyint，smallint，decimal，double，float，real和numeric。日期类型暂不支持计算。

本申请提供了在基于Apache Kylin预计算实现的条件下，支持通过CORR函数计算两列字段的相关性，极大地提升了计算效率，灵活便利，降低了程序开发成本。支持自定义列；支持在SPARK环境下计算两列数据的相关性。

需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

根据本发明实施例，还提供了一种相关系数计算装置，如图3所示，该装置包括：

接收模块31，用于接收客户端发送的元数据的第一维度的相关系数的查询请求；

处理模块32，用于从预先设置的隐藏度量值数据库中获取预先计算的元数据的第一维度的隐藏度量值；

发送模块33，用于将所述第一维度的相关系数发送给所述客户端。

在一种实施方式中，处理模块32包括查询单元，

所述查询单元，用于分别根据所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值的标识从隐藏度量值数据库中查找确定所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值。

在一种实施方式中，处理模块32还用于，获取第一列元数据X和第二列元数据Y；

统计所述第一列元数据X的数量n得到第一隐藏度量值；

第二隐藏度量值

第三隐藏度量值

第四隐藏度量值

第五隐藏度量值

第六隐藏度量值

在一种实施方式中，处理模块32还用于，获取所述第一维度的上一级维度，得到第二维度；

将所述第二维度的度量值发送给所述客户端。

在一种实施方式中，处理模块32还用于，将所述第一维度的相关系数发送给所述客户端之后，将所述度量值保存在度量值数据库中；

对所述度量值数据库进行更新，加入新的度量值；

根据本申请的第三方面，提供了一种电子设备，参见附图4所示的电子设备的结构示意图；包括至少一个处理器41和至少一个存储器42；所述存储器42用于存储一个或多个程序指令；所述处理器41，用于运行一个或多个程序指令，用以执行以下的步骤：

将所述第一维度的相关系数发送给所述客户端。

所述处理器41还用于，所述隐藏度量值包括：

第一隐藏度量值n；

第二隐藏度量值A＝SUM(XY)；

第三隐藏度量值B＝SUM(X ²)；

第四隐藏度量值C＝SUM(Y ²)；

第五隐藏度量值D＝SUM(X)；

第六隐藏度量值E＝SUM(Y)；

其中，n为第一列元数据，或第二列元数据的数量；

X为第一列元数据；

Y为第二列元数据。

所述处理器41还用于，分别根据所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值的标识从隐藏度量值数据库中查找确定所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值。

所述处理器41还用于，建立隐藏度量值数据库，包括：

获取第一列元数据X和第二列元数据Y；

统计所述第一列元数据X的数量n得到第一隐藏度量值；

第二隐藏度量值

第三隐藏度量值

第四隐藏度量值

第五隐藏度量值

第六隐藏度量值

所述处理器41还用于，获取所述第一维度的上一级维度，得到第二维度；

将所述第二维度的度量值发送给所述客户端。

所述处理器41还用于，将所述第一维度的相关系数发送给所述客户端之后，将所述度量值保存在度量值数据库中；

对所述度量值数据库进行更新，加入新的度量值；

第四方面，本申请还提出了一种计算机可读存储介质，计算机可读存储介质中包含一个或多个程序指令，所述一个或多个程序指令用于执行上述任一项所述的方法。

可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。处理器读取存储介质中的信息，结合其硬件完成上述方法的步骤。

存储介质可以是存储器，例如可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。

其中，非易失性存储器可以是只读存储器(Read-Only Memory，简称ROM)、可编程只读存储器(Programmable ROM，简称PROM)、可擦除可编程只读存储器(Erasable PROM，简称EPROM)、电可擦除可编程只读存储器(Electrically EPROM，简称EEPROM)或闪存。

易失性存储器可以是随机存取存储器(Random Access Memory，简称RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，简称SRAM)、动态随机存取存储器(Dynamic RAM，简称DRAM)、同步动态随机存取存储器(Synchronous DRAM，简称SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM，简称DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，简称ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，简称SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM，简称DRRAM)。

本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件与软件组合来实现。当应用软件时，可以将相应功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种相关系数计算方法，其特征在于，包括：

接收客户端发送的元数据的第一维度的相关系数的查询请求；

从预先设置的隐藏度量值数据库中获取预先计算的元数据的第一维度的隐藏度量值；

根据所述隐藏度量值和相关性计算公式计算得到所述第一维度的相关系数；

将所述第一维度的相关系数发送给所述客户端。
根据权利要求1所述的相关系数计算方法，其特征在于，

所述隐藏度量值包括：

第一隐藏度量值n；

第二隐藏度量值A＝SUM(XY)；

第三隐藏度量值B＝SUM(X ²)；

第四隐藏度量值C＝SUM(Y ²)；

第五隐藏度量值D＝SUM(X)；

第六隐藏度量值E＝SUM(Y)；

其中，n为第一列元数据，或第二列元数据的数量；

X为第一列元数据；

Y为第二列元数据。
根据权利要求2所述的相关系数计算方法，其特征在于，

所述相关性计算公式为：

其中，r为相关性度量值。
根据权利要求2所述的相关系数计算方法，其特征在于，

分别根据所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值的标识从隐藏度量值数据库中查找确定所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值。
根据权利要求4所述的相关系数计算方法，其特征在于，

建立隐藏度量值数据库，包括：

获取第一列元数据X和第二列元数据Y；

统计所述第一列元数据X的数量n得到第一隐藏度量值；

根据所述第一列元数据X和第二列元数据Y分别采用以下公式计算得到所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值；

第二隐藏度量值

第三隐藏度量值

第四隐藏度量值

第五隐藏度量值

第六隐藏度量值
根据权利要求1所述的相关系数计算方法，其特征在于，

获取所述第一维度的上一级维度，得到第二维度；

从预先设置的隐藏度量值数据库中获取所述第二维度的预计算的隐藏度量值；

根据所述第二维度的隐藏度量值和度量计算公式计算得到所述第二维度的度量值；

将所述第二维度的度量值发送给所述客户端。
根据权利要求1所述的相关系数计算方法，其特征在于，将所述第一维度的相关系数发送给所述客户端之后，所述方法还包括：

将所述度量值保存在度量值数据库中；

对所述度量值数据库进行更新，加入新的度量值；

根据所述新的度量值确定所述新的度量值相关的隐藏度量值；

对所述隐藏度量值数据库进行更新，加入所述新的度量值相关的隐藏度量值。
一种相关系数计算装置，其特征在于，包括：

接收模块，用于接收客户端发送的元数据的第一维度的相关系数的查询请求；

处理模块，用于从预先设置的隐藏度量值数据库中获取预先计算的元数据的第一维度的隐藏度量值；

根据所述隐藏度量值和相关性计算公式计算得到所述第一维度的相关系数；

发送模块，用于将所述第一维度的相关系数发送给所述客户端。
根据权利要求8所述的装置，其特征在于，

所述隐藏度量值包括：

第一隐藏度量值n；

第二隐藏度量值A＝SUM(XY)；

第三隐藏度量值B＝SUM(X ²)；

第四隐藏度量值C＝SUM(Y ²)；

第五隐藏度量值D＝SUM(X)；

第六隐藏度量值E＝SUM(Y)；

其中，n为第一列元数据，或第二列元数据的数量；

X为第一列元数据；

Y为第二列元数据。
根据权利要求9所述的装置，其特征在于，

所述相关性计算公式为：

其中，r为相关性度量值。
根据权利要求9所述的相关系数计算装置，其特征在于，所述处理模块还用于：

分别根据所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值的标识从隐藏度量值数据库中查找确定所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值。
根据权利要求11所述的相关系数计算装置，其特征在于，所述处理模块还用于：

建立隐藏度量值数据库，包括：

获取第一列元数据X和第二列元数据Y；

统计所述第一列元数据X的数量n得到第一隐藏度量值；

根据所述第一列元数据X和第二列元数据Y分别采用以下公式计算得到所述第二隐藏度量值、第三隐藏度量值、第四隐藏度量值、第五隐藏度量值和第六隐藏度量值；

第二隐藏度量值

第三隐藏度量值

第四隐藏度量值

第五隐藏度量值

第六隐藏度量值
根据权利要求8所述的相关系数计算装置，其特征在于，所述发送模块还用于：

获取所述第一维度的上一级维度，得到第二维度；

从预先设置的隐藏度量值数据库中获取所述第二维度的预计算的隐藏度量值；

根据所述第二维度的隐藏度量值和度量计算公式计算得到所述第二维度的度量值；

将所述第二维度的度量值发送给所述客户端。
根据权利要求8所述的相关系数计算装置，其特征在于，所述装置还包括更新模块，所述更新模块用于：

将所述度量值保存在度量值数据库中；

对所述度量值数据库进行更新，加入新的度量值；

根据所述新的度量值确定所述新的度量值相关的隐藏度量值；

对所述隐藏度量值数据库进行更新，加入所述新的度量值相关的隐藏度量值。
一种电子设备，其特征在于，包括：至少一个处理器和至少一个存储器；所述存储器用于存储一个或多个程序指令；所述处理器，用于运行一个或多个程序指令，用以执行如权利要求1-7任一项所述的方法。
一种计算机可读存储介质，其特征在于，计算机可读存储介质中包含一个或多个程序指令，所述一个或多个程序指令用于执行如权利要求1-7任一项所述的方法。