CN105989138A

CN105989138A - 数据处理方法、数据处理系统和服务器

Info

Publication number: CN105989138A
Application number: CN201510090110.6A
Authority: CN
Inventors: 程帅
Original assignee: Peking University Founder Group Co Ltd; Beijing Founder Electronics Co Ltd
Current assignee: New Founder Holdings Development Co ltd; Beijing Founder Electronics Co Ltd
Priority date: 2015-02-27
Filing date: 2015-02-27
Publication date: 2016-10-05
Anticipated expiration: 2035-02-27
Also published as: CN105989138B

Abstract

本发明提出了一种数据处理方法、一种数据处理系统和一种服务器，其中，所述方法包括：当Web服务器接收到用户输入的目标公式时，根据所述目标公式建立数学模型；将所述数学模型与非关系型数据库中的目标数据建立关联；在接收到数据处理命令时，从所述非关系型数据库中获取所述目标数据，并根据所述数学模型对所述目标数据进行计算，以得到计算结果。通过本发明的技术方案，通过数学模型对海量数据进行计算与分析，从而可以从海量数据中发现目标数据的趋势和关联关系，进而达到挖掘数据价值的目的。

Description

数据处理方法、数据处理系统和服务器

技术领域

本发明涉及计算机技术领域，具体而言，涉及一种数据处理方法、数据处理系统和一种服务器。

背景技术

目前，当今时代是大数据的时代，但是仅仅拥有海量的数据是没有意义的，唯有挖掘出数据的趋势和关联关系，大数据才具有其生命力。但是，相关技术中很难满足对数据的计算和分析。

因此，如何有效地实现对海量数据的计算和分析，从而挖掘数据的价值成为亟待解决的问题。

发明内容

本发明正是基于上述问题，提出了一种新的技术方案，通过数学模型对海量数据进行计算与分析，从而可以从海量数据中发现目标数据的趋势和关联关系，进而达到挖掘数据价值的目的。

有鉴于此，本发明的一方面提出了一种数据处理方法，包括：当Web服务器接收到用户输入的目标公式时，根据所述目标公式建立数学模型；将所述数学模型与非关系型数据库中的目标数据建立关联；在接收到数据处理命令时，从所述非关系型数据库中获取所述目标数据，并根据所述数学模型对所述目标数据进行计算，以得到计算结果。

在该技术方案中，根据用户输入的目标公式建立数学模型，以通过数学模型对目标数据进行计算，由于目标数据和数学模型存储在不同的数据库中，因此，在建立数学模型时，将该数学模型和非关系型数据库中的目标数据建立关联，这样在从非关系型数据库中获取目标数据之后就可以通过数学模型对目标数据进行计算，得出计算结果，则可以根据计算结果从海量的目标数据中发现目标数据的趋势和关联关系，从而达到挖掘数据的价值的目的。

在上述技术方案中，优选地，还包括：根据接收到的保存命令，保存所述计算结果；以及根据接收到的显示命令，对保存的所述计算结果进行显示。

在该技术方案中，在对目标数据进行计算且得出计算结果之后，可以保存计算结果，并可以对保存的计算结果进行显示，这样便于用户根据显示的计算结果发现目标数据的趋势和关联关系，从而达到挖掘数据的价值的目的。

在上述技术方案中，优选地，根据所述目标公式建立数学模型，具体包括：根据预设的自定义脚本语言将所述目标公式转换成所述数学模型；以及在将所述数学模型与非关系型数据库中的目标数据建立关联后，还包括：根据预设的校验规则和所述目标数据对所述数学模型进行校验；在所述数学模型校验通过时，将所述数学模型存储至应用服务器中；在将所述数学模型存储至所述应用服务器之后，根据所述预设的校验规则和所述目标数据对所述数学模型进行再次校验；在所述数学模型校验通过时，将所述数学模型存储至关系型数据库中。

在该技术方案中，根据预设的自定义脚本语言将用户输入的目标公式转换成数学模型，其中，自定义脚本语言包括但不限于：javascript脚本。另外，在数学模型存储至应用服务器之前，根据预设的校验规则和目标数据对数学模型进行校验，只有在校验通过时，才将数学模型存储至应用服务器中，保证了数学模型的准确性，并且在数学模型存储至关系型数据库之前，对数学模型再一次进行校验，进一步地保证了数学模型的准确性，避免了数学模型在进行第一次校验时的误校验，进而保证了计算结果的准确性。而在校验通过时，将数学模型存储至关系型数据库中，则可以实现对数学模型的统一管理。

在上述技术方案中，优选地，还包括：所述预设的校验规则包括数学运算校验规则和安全校验规则，其中，所述安全校验规则包括：跨站脚本攻击规则、漏洞校验规则和/或数据库脚本特殊字符校验规则，则在所述数学模型和所述目标数据满足所述数学运算校验规则和所述安全校验规则时，判定所述数学模型校验通过，否则，判定所述数学模型校验未通过。

在该技术方案中，预设的校验规则包括但不限于数学运算校验规则和安全校验规则，且数学模型和目标数据都满足数学运算校验规则和安全校验规则时，判断数学模型校验通过，例如，数学模型中包含有根号，而根号处理的目标数据为负数，此时，数学模型和目标数据不满足数学运算规则，则该数学模型是无效的，这种情况下数学模型校验不通过，并提示用户校验不通过，以及提示用户输入正确的目标公式，再例如，根据安全校验规则校验时，发现有黑客对数学模型进行攻击，为了保证目标数据的安全性，使数学模型校验不通过，防止目标数据遭到泄漏，并提示用户不通过，以及时发现漏洞并对其进行修补，其中，安全校验规则包括但不限于：跨站脚本攻击规则(XXS，Cross Site Scripting)、漏洞校验规则和数据库脚本特殊字符校验规则。这样，不仅保证了目标数据的安全性，还保证了数学模型的正确性和有效性。

在上述技术方案中，优选地，还包括：根据接收到的设置命令，设置公式字符库，其中，所述公式字符库中包含至少一个公式字符；根据接收到的公式显示命令，显示所述公式字符库中的公式字符；以及根据接收到的选择命令，从所述公式字符库中选择出目标公式字符，以使用所述目标公式字符组成所述目标公式。

在该技术方案中，可以设置公式字符库，且公式字符库中包括有一个或多个公式字符，该公式字符为目标公式中不常用到的公式字符(例如，log和∑等，而常用到的公式字符例如+、-、*、/)，且多个公式字符中的每个公式字符都对应有标记符，这样在确定目标公式时，如果目标公式中包括有公式字符，则可以根据用户输入的标记符来确定公式字符，从而使用户在输入目标公式时更加方便与快捷，另外，可以根据用户进行数据计算的实时需求，自定义目标公式，即实现了目标公式的可定制化，从而更好地满足用户的需求。

本发明的另一方面提出了一种数据处理系统，用于服务器，包括：建立单元，当Web服务器接收到用户输入的目标公式时，根据所述目标公式建立数学模型；关联单元，将所述数学模型与非关系型数据库中的目标数据建立关联；处理单元，在接收到数据处理命令时，从所述非关系型数据库中获取所述目标数据，并根据所述数学模型对所述目标数据进行计算，以得到计算结果。

在上述技术方案中，优选地，还包括：保存单元，根据接收到的保存命令，保存所述计算结果；以及第一显示单元，根据接收到的显示命令，对保存的所述计算结果进行显示。

在上述技术方案中，优选地，所述建立单元，包括：转换单元，根据预设的自定义脚本语言将所述目标公式转换成所述数学模型；以及所述数据处理系统还包括：校验单元，根据预设的校验规则和所述目标数据对所述数学模型进行校验；存储单元，在所述数学模型校验通过时，将所述数学模型存储至应用服务器中；所述校验单元还用于：在将所述数学模型存储至所述应用服务器之后，根据所述预设的校验规则和所述目标数据对所述数学模型进行再次校验；所述存储单元还用于：在所述数学模型校验通过时，将所述数学模型存储至关系型数据库中。

在上述技术方案中，优选地，还包括：所述预设的校验规则包括数学运算校验规则和安全校验规则，其中，所述安全校验规则包括：跨站脚本攻击规则、漏洞校验规则和/或数据库脚本特殊字符校验规则，则所述校验单元还用于：在所述数学模型和所述目标数据满足所述数学运算校验规则和所述安全校验规则时，判定所述数学模型校验通过，否则，判定所述数学模型校验未通过。

在上述技术方案中，优选地，还包括：设置单元，根据接收到的设置命令，设置公式字符库，其中，所述公式字符库中包含至少一个公式字符；第二显示单元，根据接收到的公式显示命令，显示所述公式字符库中的公式字符；以及选择单元，根据接收到的选择命令，从所述公式字符库中选择出目标公式字符，以使用所述目标公式字符组成所述目标公式。

在该技术方案中，可以通过设置公式字符库，且公式字符库中包括有一个或多个公式字符，该公式字符为目标公式中不常用到的公式字符(例如，log和∑等，而常用到的公式字符例如+、-、*、/)，且多个公式字符中的每个公式字符都对应有标记符，这样在确定目标公式时，如果目标公式中包括有公式字符，则可以根据用户输入的标记符来确定公式字符，从而使用户在输入目标公式时更加方便与快捷，另外，可以根据用户进行数据计算的实时需求，自定义目标公式，即实现了目标公式的可定制化，从而更好地满足用户的需求。

本发明的又一方面提出了一种服务器，包括如上述任一项技术方案所述的数据处理系统。

在该技术方案中，根据用户输入的目标公式建立数学模型，以通过数学模型对目标数据进行计算，但由于目标数据和数学模型存储在不同的数据库中，因此，在建立数学模型时，将该数学模型和非关系型数据库中的目标数据建立关联，这样在从非关系型数据库中获取目标数据之后就可以通过数学模型对目标数据进行计算，得出计算结果，则可以根据计算结果从海量的目标数据中发现目标数据的趋势和关联关系，从而达到挖掘数据的价值的目的。

通过本发明的技术方案，通过数学模型对海量数据进行计算与分析，从而可以从海量数据中发现目标数据的趋势和关联关系，进而达到挖掘数据价值的目的。

附图说明

图1示出了根据本发明的一个实施例的数据处理方法的流程示意图；

图2示出了根据本发明的一个实施例的数据处理系统的结构示意图；

图3示出了根据本发明的一个实施例的服务器的结构示意图；

图4示出了根据本发明的一个实施例的数据处理系统的原理示意图。

具体实施方式

为了可以更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了根据本发明的一个实施例的数据处理方法的流程示意图。

如图1所示，根据本发明的一个实施例的数据处理方法，所述方法包括：

步骤102，当Web服务器接收到用户输入的目标公式时，根据所述目标公式建立数学模型；

步骤104，将所述数学模型与非关系型数据库中的目标数据建立关联；

步骤106，在接收到数据处理命令时，从所述非关系型数据库中获取所述目标数据，并根据所述数学模型对所述目标数据进行计算，以得到计算结果。

图2示出了根据本发明的一个实施例的数据处理系统的结构示意图。

如图2所示，根据本发明的一个实施例的数据处理系统200，包括：建立单元202、关联单元204和处理单元206，所述建立单元202用于当Web服务器接收到用户输入的目标公式时，根据所述目标公式建立数学模型；关联单元204，将所述数学模型与非关系型数据库中的目标数据建立关联；处理单元206，在接收到数据处理命令时，从所述非关系型数据库中获取所述目标数据，并根据所述数学模型对所述目标数据进行计算，以得到计算结果。

在上述技术方案中，优选地，还包括：保存单元208，根据接收到的保存命令，保存所述计算结果；以及第一显示单元210，根据接收到的显示命令，对保存的所述计算结果进行显示。

在上述技术方案中，优选地，所述建立单元202，包括：转换单元2022，根据预设的自定义脚本语言将所述目标公式转换成所述数学模型；以及所述数据处理系统200还包括：校验单元212，根据预设的校验规则和所述目标数据对所述数学模型进行校验；存储单元214，在所述数学模型校验通过时，将所述数学模型存储至应用服务器中；所述校验单元212还用于：在将所述数学模型存储至所述应用服务器之后，根据所述预设的校验规则和所述目标数据对所述数学模型进行再次校验；所述存储单元214还用于：在所述数学模型校验通过时，将所述数学模型存储至关系型数据库中。

在上述技术方案中，优选地，还包括：所述预设的校验规则包括数学运算校验规则和安全校验规则，其中，所述安全校验规则包括：跨站脚本攻击规则、漏洞校验规则和/或数据库脚本特殊字符校验规则，则所述校验单元212还用于：在所述数学模型和所述目标数据满足所述数学运算校验规则和所述安全校验规则时，判定所述数学模型校验通过，否则，判定所述数学模型校验未通过。

在上述技术方案中，优选地，还包括：设置单元216，根据接收到的设置命令，设置公式字符库，其中，所述公式字符库中包含至少一个公式字符；第二显示单元218，根据接收到的公式显示命令，显示所述公式字符库中的公式字符；以及选择单元220，根据接收到的选择命令，从所述公式字符库中选择出目标公式字符，以使用所述目标公式字符组成所述目标公式。

图3示出了根据本发明的一个实施例的服务器的结构示意图。

如图3所示，根据本发明的一个实施例的服务器300，包括如上述任一项技术方案所述的数据处理系统200。

如图4所示，根据本发明的一个实施例的数据处理系统，将目标数据存储至非关系型数据库408中，Web服务器402接收到用户输入的目标公式之后，自定义脚本语言(包括javascript脚本)将公式转换成数学模型，其中，数学模型包括MathML(Mathematical Markup Language，数学标记语言)，并且将数学模型与非关系型数据库408中的目标数据建立关联，在转换成数学模型之后，对数学模型进行校验，以保证数学模型的正确性和目标数据的安全性，在校验通过后，对数学模型进行保存，然后将数学模型从Web服务器402下发到应用服务器404中，并且在关系型数据库406从应用服务器404中获取数学模型之前，对数学模型再一次进行校验，以进一步地确保数学模型的准确性和目标数据的安全，避免第一次对数学模型校验时出现的误校验，在校验通过之后，将数学模型存储至关系型数据库406中，以实现对数学模型的统一管理，当接收到用户的启动运算的指令后，服务器300从关系型数据库406中获取数学模型，并从非关系型数据库408中获取目标数据，由于在生成数学模型时，数学模型与目标数据建立关联，此时，就可以通过数学模型对目标数据进行计算和分析，从而就可以从海量的目标数据中发现目标数据的趋势和关联关系，从而达到挖掘数据的价值的目的。

同时，该数据处理系统可以用于领域研究，例如：

广义熵系数(Generalised Entropy，简记为GE)的公式(目标公式)为：

GE (α) = \frac{1}{α^{2} - α} [\frac{1}{n} {Σ_{i = 1}^{n} (\frac{y_{i}}{\overset{&OverBar;}{y}})}^{α} - 1]

其中n是样本观测数，y_i是个体收入，y是算数平均数。GE系数的取值范围为0到无穷大。0表示完全平等(所有人的收入都相同)，GE系数越大则不平等的程度越高。参数α表示对分布不同位置给予的权重，可以取任意的实数。最常见的取值为0，1和2：当α＝0，表示给予低收入部分以更大的权重；当α＝1，表示给予收入分布以相同的权重；当α＝2，表示给予高收入部分以较大的权重。特别当α取值为0和1时，利用洛必达法则，得到Theil衡量不平等的两个指标。

GE (0) = \frac{1}{n} Σ_{i = 1}^{n} \ln \frac{\overset{&OverBar;}{y}}{y_{i}}

GE (1) = \frac{1}{n} Σ_{i = 1}^{n} \frac{y_{i}}{\overset{&OverBar;}{y}} \ln \frac{y_{i}}{\overset{&OverBar;}{y}}

GE (2) = \frac{1}{\overset{&OverBar;}{y}} {[\frac{1}{n} Σ_{i = 1}^{n} {(y_{i} - \overset{&OverBar;}{y})}^{2}]}^{\frac{1}{2}}

GE系数有一个对于不平等分析非常有帮助的性质：可以对它分项分解。一个指标的不平等状况可以很容易地表达成，组内不平等和组间不平等的加总，即I＝I_within-group+I_{between-group}；同时，每个组成部分(或者收入来源)都对总体指标的不平等有一定的影响，指标总体的不平等就等于所有组成部分对不平等影响的加总。这个性质使我们可以很方便地对不同因素在总体不平等当中所起作用的大小及其变化进行深入的分析。

数据处理系统可以支持复杂的运算模型，例如：

算数平均数(arithmetic mean)是度量数据集中趋势最常用的指标，其定义式如下：

\overset{&OverBar;}{X} = \frac{X_{1} + X_{2} + . . . + X_{n}}{n} = \frac{Σ_{i = 1}^{n} X_{i}}{n}

加权算数平均数(weighted arithmetic mean)是将各个数据乘以反映其重要性的权数(weight)再求平均的方法。其定义式如下：

{\overset{&OverBar;}{X}}_{W} = \frac{w_{1} X_{1} + w_{2} X_{2} + . . . + w_{n} X_{n}}{w_{1} + w_{2} + . . . w_{n}}

几何平均数(geometric mean)是n个数乘积的n次方根。一般来说几何平均数会小于或等于算数平均数。几何平均数的定义式如下：

g = \sqrt[n]{X_{1} \times X_{2} \times . . . \times X_{n}}

中位数(median)表示经排序后的一列数据中位于中间位置(50％)的数。也就是说，在这组数据中，有一半的数据大于中位数，另外一半的数据小于中位数。中位数的位置为(n+1)/2。如果n是奇数，中位数即为排序序列居中位置的观测值；如果n是偶数，则中位数为排序序列两个居中位置的观测值的均值。中位数的优点是不受数据极端值的影响。

众数(mode)是指出现次数最多的那个数的数值，可从排序数组中观察得到。众数不受极值的影响，一组数据可能没有众数或有多个众数，并且对数值数据和类型数据均适用。

另外还支持表示变异程度的统计公式，比如：

方差(variance)是指每个数据与算数平均数之差的平方的算术平均数，简称为“离差平方和的平均”。它表示全部观测值相对于均值的平均变异程度，度量的是数据的离散程度。方差的定义式为：

s^{2} = \frac{1}{n} Σ_{i = 1}^{n} {(X_{i} - \overset{&OverBar;}{X})}^{2}

标准差(standard deviation)是指方差的平方根。其计算公式为：

s = \sqrt{s^{2}} = \sqrt{\frac{1}{n} Σ_{i = 1}^{n} {(X_{i} - \overset{&OverBar;}{X})}^{2}}

当然，该数据处理系统中的目标公式还可以是用户自定义的复杂运算公式，以及扩展的多样的公式。

以上结合附图详细说明了本发明的技术方案，通过数学模型对海量数据进行计算与分析，从而可以从海量数据中发现目标数据的趋势和关联关系，进而达到挖掘数据价值的目的。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种数据处理方法，用于服务器，其特征在于，包括：

当Web服务器接收到用户输入的目标公式时，根据所述目标公式建立数学模型；

将所述数学模型与非关系型数据库中的目标数据建立关联；

在接收到数据处理命令时，从所述非关系型数据库中获取所述目标数据，并根据所述数学模型对所述目标数据进行计算，以得到计算结果。

2.根据权利要求1所述的数据处理方法，其特征在于，还包括：

根据接收到的保存命令，保存所述计算结果；以及

根据接收到的显示命令，对保存的所述计算结果进行显示。

3.根据权利要求1所述的数据处理方法，其特征在于，

根据所述目标公式建立数学模型，具体包括：

根据预设的自定义脚本语言将所述目标公式转换成所述数学模型；以及

在将所述数学模型与非关系型数据库中的目标数据建立关联后，还包括：

根据预设的校验规则和所述目标数据对所述数学模型进行校验；

在所述数学模型校验通过时，将所述数学模型存储至应用服务器中；

在将所述数学模型存储至所述应用服务器之后，根据所述预设的校验规则和所述目标数据对所述数学模型进行再次校验；

在所述数学模型校验通过时，将所述数学模型存储至关系型数据库中。

4.根据权利要求3所述的数据处理方法，其特征在于，

所述预设的校验规则包括数学运算校验规则和安全校验规则，其中，所述安全校验规则包括：跨站脚本攻击规则、漏洞校验规则和/或数据库脚本特殊字符校验规则，

则在所述数学模型和所述目标数据满足所述数学运算校验规则和所述安全校验规则时，判定所述数学模型校验通过，否则，判定所述数学模型校验未通过。

5.根据权利要求1至4中任一项所述的数据处理方法，其特征在于，还包括：

根据接收到的设置命令，设置公式字符库，其中，所述公式字符库中包含至少一个公式字符；

根据接收到的公式显示命令，显示所述公式字符库中的公式字符；以及

根据接收到的选择命令，从所述公式字符库中选择出目标公式字符，以使用所述目标公式字符组成所述目标公式。

6.一种数据处理系统，用于服务器，其特征在于，包括：

建立单元，当Web服务器接收到用户输入的目标公式时，根据所述目标公式建立数学模型；

关联单元，将所述数学模型与非关系型数据库中的目标数据建立关联；

处理单元，在接收到数据处理命令时，从所述非关系型数据库中获取所述目标数据，并根据所述数学模型对所述目标数据进行计算，以得到计算结果。

7.根据权利要求6所述的数据处理系统，其特征在于，还包括：

保存单元，根据接收到的保存命令，保存所述计算结果；以及

第一显示单元，根据接收到的显示命令，对保存的所述计算结果进行显示。

8.根据权利要求6所述的数据处理系统，其特征在于，

所述建立单元，包括：

转换单元，根据预设的自定义脚本语言将所述目标公式转换成所述数学模型；以及

所述数据处理系统还包括：

校验单元，根据预设的校验规则和所述目标数据对所述数学模型进行校验；

存储单元，在所述数学模型校验通过时，将所述数学模型存储至应用服务器中；以及

所述校验单元还用于：

所述存储单元还用于：

9.根据权利要求8所述的数据处理系统，其特征在于，

则所述校验单元还用于：

在所述数学模型和所述目标数据满足所述数学运算校验规则和所述安全校验规则时，判定所述数学模型校验通过，否则，判定所述数学模型校验未通过。

10.根据权利要求6至9中任一项所述的数据处理系统，其特征在于，还包括：

设置单元，根据接收到的设置命令，设置公式字符库，其中，所述公式字符库中包含至少一个公式字符；

第二显示单元，根据接收到的公式显示命令，显示所述公式字符库中的公式字符；以及

选择单元，根据接收到的选择命令，从所述公式字符库中选择出目标公式字符，以使用所述目标公式字符组成所述目标公式。

11.一种服务器，其特征在于，包括：如权利要求6至10中任一项所述的数据处理系统。