CN107230005A

CN107230005A - 一种数据处理方法及设备

Info

Publication number: CN107230005A
Application number: CN201710530348.5A
Authority: CN
Inventors: 王江; 王甲樑; 张斌德
Original assignee: Guoxin Youe Data Co Ltd
Current assignee: Guoxin Youe Data Co Ltd
Priority date: 2017-06-29
Filing date: 2017-06-29
Publication date: 2017-10-03
Anticipated expiration: 2037-06-29
Also published as: CN107230005B

Abstract

本发明提供了一种数据处理方法及设备，该方法包括：根据指数计算需求采集数据；确定针对目标年份进行指数计算时所使用的指标体系，并基于采集的数据确定上述指标体系下每个指标对应的指标值；基于预设历史年份对应的指数，按照预设优化规则对指标体系中的非占比型指标对应的指标值进行优化处理，使优化后的非占比型指标的指标值在零到一之间；根据在上述指标体系下每个指标的指标值和每个指标的权重，确定上述指标体系在目标年份的指数。本发明中，可以将指标体系中的非占比型指标的指标值优化在零到一之间，使得非占比型指标也能够参与指数的计算，提高了计算出的指数的准确性，进而提高了该指数在用于评价对象时的准确性。

Description

一种数据处理方法及设备

技术领域

本发明涉及大数据技术领域，具体而言，涉及一种数据处理方法及设备。

背景技术

指数是指基于海量数据、采用科学计算方法统计得出的反映不同领域发展状况的数值。指数包括广义指数和狭义指数，狭义指数一般指的是反映不能直接相加的复杂社会经济现象在数量上综合变动情况的相对数，比如说，零售物价指数、消费价格指数、股价指数、军民融合指数、卫星导航指数等。

现有技术中，在进行指数计算时，一般都是使用占比型指标的指标值，但是，在实际应用中，对于指定的指标体系中，很多指标并不是占比型指标，相应的，这些非占比型指标的指标值也不是百分比数据，进而不能应用于指数的计算中。这样，可能会使得指标体系中的部分指标无法参与指数的计算，这样会导致计算出的指数值准确性较低，使得在应用该指数在评价待评价对象时，评价不准确。

发明内容

有鉴于此，本发明实施例的目的在于提供一种数据处理方法及设备，以解决现有技术中，指标体系中的非占比型指标无法参与指数的计算，进而使得计算出的指数值准确性较低，在用于对象的评价时，评价不准确的问题。

第一方面，本发明实施例提供了一种数据处理方法，其中，所述方法包括：

根据指数计算需求采集数据；

确定针对目标年份进行指数计算时所使用的指标体系，并基于采集的数据确定所述指标体系下每个指标对应的指标值；

基于预设历史年份对应的指数，按照预设优化规则对所述指标体系中的非占比型指标对应的指标值进行优化处理，使优化后的所述非占比型指标的指标值在零到一之间；

其中，占比型指标为表征一个参量与另一个参量之间的比值类型的指标；

根据在所述指标体系下每个指标的指标值和所述每个指标的权重，确定所述指标体系在所述目标年份的指数。

结合第一方面，本发明实施例提供了上述第一方面的第一种可能的实现方式，其中，采用如下方式确定在所述指标体系下每个指标的权重：

构建所述指标体系的权重判断矩阵；

其中，所述权重判断矩阵的行和列均分别表征所述指标体系下的指标，所述权重判断矩阵的元素表征该元素对应行所表征指标和该元素对应列所表征指标之间的重要程度比对值；

计算所述权重判断矩阵的最大特征根和对应的特征向量；

根据所述权重判断矩阵的最大特征根对所述权重判断矩阵进行一致性校验；

响应于所述权重判断矩阵通过一致性校验，将所述特征向量中的每个特征值分别确定为所述指标体系中对应指标的权重。

结合第一方面，本发明实施例提供了上述第一方面的第二种可能的实现方式，其中，所述基于预设历史年份对应的指数，按照预设优化规则对所述指标体系中的非占比型指标对应的指标值进行优化处理，具体包括：

针对所述指标体系中每个非占比型指标，分别计算在所述目标年份中该指标的指标值与在所述预设历史年份中该指标的指标值的比值；

根据该指标对应的比值和所述预设历史年份对应的指数之间的数值关系，确定该指标的指标值对应的优化方式；并

按照确定的该指标的指标值对应的优化方式对该指标值进行优化。

结合第一方面的第二种可能的实现方式，本发明实施例提供了上述第一方面的第三种可能的实现方式，其中，所述根据该指标对应的比值和所述预设历史年份对应的指数之间的数值关系，确定该指标的指标值对应的优化方式，包括：

针对所述比值为零的情况，确定该指标的指标值的范围等级为第一等级；

针对所述比值大于零且小于所述预设历史年份对应的指数的倒数的情况，确定该指标的指标值的范围等级为第二等级；

针对所述比值大于等于所述预设历史年份对应的指数的倒数的情况，确定该指标的指标值的范围等级为第三等级；

根据该指标的指标值对应的范围等级，确定该指标的指标值对应的优化方式。

结合第一方面的第二种可能的实现方式，本发明实施例提供了上述第一方面的第四种可能的实现方式，其中，所述按照确定的该指标的指标值对应的优化方式对该指标值进行优化，具体包括：

针对第一等级指标值，将该指标值初优化为百分之百，并将该指标值再优化为百分之百与所述预设历史年份对应的指数的乘积；

针对第二等级指标值，将该指标值初优化为该指标值自身值，并将该指标值再优化为该自身值与所述预设历史年份对应的指数的乘积；

针对第三等级指标值，将该指标值初优化为百分之二百，并将该指标值再优化为百分之二百与所述预设历史年份对应的指数的乘积。

结合第一方面，本发明实施例提供了上述第一方面的第五种可能的实现方式，其中，所述根据在所述该指标体系下每个指标的指标值和所述每个指标的权重，确定所述指标体系在所述目标年份的指数，包括：

根据在所述指标体系下每个指标对应的指标值和所述每个指标的权重，对每个指标的指标值进行加权求和；其中，所述非占比型指标的指标值为优化处理后得到的指标值；

将得到的和值确定为所述指标体系在所述目标年份的指数。

结合第一方面，本发明实施例提供了上述第一方面的第六种可能的实现方式，其中，针对所述目标年份为首次进行指数计算的年份的情况，采用如下方式确定该目标年份的指数：

根据指数计算需求采集数据；

确定针对该目标年份进行指数计算所使用的指标体系中的占比型指标，并基于采集的数据确定所述占比型指标对应的指标值；

根据在所述占比型指标的指标值和所述每个占比型指标的权重，确定所述指标体系在该目标年份的指数。

第二方面，本发明实施例提供了一种数据处理设备，其中，所述设备包括：

采集模块，用于根据指数计算需求采集数据；

第一确定模块，用于确定针对目标年份进行指数计算时所使用的指标体系，并基于采集的数据确定所述指标体系下每个指标对应的指标值；

优化处理模块，用于基于预设历史年份对应的指数，按照预设优化规则对所述指标体系中的非占比型指标对应的指标值进行优化处理，使优化后的所述非占比型指标的指标值在零到一之间；其中，占比型指标为表征一个参量与另一个参量之间的比值类型的指标；

第二确定模块，用于根据在所述指标体系下每个指标的指标值和所述每个指标的权重，确定所述指标体系在所述目标年份的指数。

第三方面，本发明实施例还提供了一种数据处理设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面至第一方面的第六种可能的实现方式中任一项所述的方法的步骤。

第四方面，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行上述第一方面至第一方面的第六种可能的实现方式中任一项所述的方法的步骤。

在本发明实施例提供的数据处理方法及设备中，可以将指标体系中的非占比型指标的指标值优化在零到一之间，使得非占比型指标也能够参与指数的计算，提高了计算出的指数的准确性，进而提高了该指数在用于评价对象时的准确性。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本发明一实施例所提供的数据处理方法的流程图；

图2示出了本发明一实施例所提供的数据处理方法中，对指标体系中的非占比型指标的指标值进行优化的流程图；

图3示出了本发明一实施例所提供的数据处理方法中，计算目标年份的指数的流程图；

图4示出了本发明一实施例所提供的数据处理方法中，计算指标体系中各个指标的权重的流程图；

图5示出了本发明又一实施例所提供的数据处理方法的流程图；

图6示出了本发明实施例所提供的数据处理设备之一的结构示意图；

图7示出了本发明实施例所提供的数据处理设备之二的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明一实施例提供了一种数据处理方法，该数据处理方法主要应用于指数的计算，比如，军民融合指数、股票指数的计算等。参考图1所示，该数据处理方法包括如下步骤：

S110，根据指数计算需求采集数据。

上述步骤中采集的数据指的是计算指数时所需要使用的指标的指标值。

S120，确定针对目标年份进行指数计算时所使用的指标体系，并基于采集的数据确定该指标体系下每个指标对应的指标值；

上述目标年份指的是需要进行指数计算的年份，具体的，该目标年份可以是首次进行指数计算的年份，也可以不是首次指数计算的年份，针对该目标年份的上述两种情况，则通过不同的方法来计算上述目标年份的指数，如果，上述目标年份不是首次进行指数计算的年份，则通过下述步骤S130和步骤S140来进行指数计算。

上述指标体系指的是在评价某一事物时所选取的指标的集合，具体的，上述指标体系的确定需要依据科学性、系统性、相关性和可操作性四个原则，上述科学性是任何指标体系设计中最基本的原则，无论是指标体系的设置、数据的选择、评价的方法都要以工人的科学理论及方法为依据，主要体现在理论与实际相结合及采用科学方法等方面；上述系统性是指纳入指标体系内的各项指标应在总体上组成一个系统，具有统一性和完整性；上述相关性是指各项指标均与待评价对象紧密相关，即待评价对象可由这些指标灵敏的反映，如果上述待评价对象为军民融合，则上述相关性指的是各项指标均与区域内的军民融合活动紧密相关；上述可操作性指的是选取的指标不仅能客观的反映问题，还能取得较为准确的数据，完成指数计算的任务，以真正为政府客观决策提供量化依据。

在本发明实施例中，可以依据上述原则确定出针对目标年份进行指数计算时所使用的指标体系。

表1

以军民融合领域为例，针对目标年份确定的军民融合领域一种可能的指标体系如表1所示。

当确定出目标年份进行指数计算所使用的指标体系后，并从步骤S110中采集的数据中分别找到上述指标体系中每个指标对应的指标值。

S130，基于预设历史年份对应的指数，按照预设优化规则对上述指标体系中的非占比型指标对应的指标值进行优化处理，使优化处理后的非占比型指标的指标值在零到一之间。

其中，占比型指标为表征一个参量与另一个参量之间的比值类型的指标；且零到一之间包括零和一。

如表1所示的指标体系中，既包括占比型指标，也包括非占比型指标，其中，军工企业参与军民工作人员占比、军工企业民品开发工作人员占比及民口企业参与民参军工作人员占比等均为占比型指标，而国防生招生数、地方高校委培军队干部数及接收均转干部数等均为非占比型指标。

在本发明实施例中，上述预设历史年份指的是目标年份之前的某一年份，比如说，目标年份为2015年，则预设历史年份可以是2014年。

其中，参考图2所示，上述步骤S130中，基于预设历史年份对应的指数，按照预设优化规则对上述指标体系中的非占比型指标对应的指标值进行优化处理，是通过如下步骤S210-S230实现的，具体包括：

S210，针对上述指标体系中每个非占比型指标，分别计算在上述目标年份中该指标的指标值与在预设历史年份中该指标的指标值的比值。

以预设历史年份为2014年，目标年份为2015年为例对上述步骤S210进行说明，比如，2014年的国防招生数为100人，2015年的国防招生数为0，则2015年的国防招生数与2014年的国防招生数的比值则为0；还比如，2014年的军民技术转军用技术攻关成果数为1,2015年的军民技术转均用技术攻关成果数为70，则2015年的军民技术转军用技术攻关成果数与2014年的军民技术转军用技术攻关成果数的比值则为7000.00％。将指标体系中的每个非占比型指标，均按照上述方式进行计算目标年份与预设历史年份的对应的指标值的比值。

进一步地，上例中2015年的国防招生数为0，这表征2015年的国防招生数为缺失数据，通过本发明实施例能够将缺失数据优化处理。

S220,根据该指标对应的比值和预设历史年份对应的指数之间的数值关系，确定该指标的指标值对应的优化方式。

具体的，在该步骤中，根据该指标对应的比值和预设历史年份对应的指数之间的数值关系，确定该指标的指标值对应的优化方式，具体实施时，可以将上述比值与预设历史年份对应的指数的倒数进行比较，以此确定该指标的指标值对应的优化方式，具体过程包括：针对上述比值为零的情况，确定该指标的指标值的范围为第一等级；针对上述比值大于零且小于预设历史年份对应的指数的倒数的情况，确定该指标的指标值的范围等级为第二等级；针对上述比值大于等于预设历史范围对应的指数的倒数的情况，确定该指标的指标值的范围等级为第三等级；针对该指标的指标值对应的范围等级，确定该指标的指标值对应的优化方式。

其中，对于处于不同范围等级的指标值，则采用不同的方式进行优化处理。

S230，按照确定的该指标的指标值对应的优化方式对该指标值进行优化。

具体的，在本发明实施例中，针对第一等级指标值，将该指标值初优化为百分之百，并将该指标值再优化为百分之百与预设历史年份对应的指数的乘积；针对第二等级指标值，将该指标值初优化为该指标值自身值，并将该指标值再优化为该自身值与预设历史年份对应的指数的乘积；针对第三等级指标值，将该指标值初优化为百分之二百，并将该指标值再优化为百分之二百与预设历史年份对应的指数的乘积。

其中，上述第一等级指标值指的是上述比值为零的指标值，上述第二等级指标值指的是上述比值在第二等级对应的取值范围内的指标值，上述第三等级的指标值指的是上述比值在第三等级对应的取值范围内的指标值。

比如说，上述预设历史年份的指数的倒数记为a，将非占比性指标在目标年份的指标值与预设历史年份的指标值之间的比值记为x，则当x＝0时，可以确定该非占比型指标的指标值属于第一等级，当x大于零且小于a时，可以确定该非占比型指标的指标值属于第二等级，当x大于等于a时，可以确定该非占比型指标的指标值属于第三等级。

S140，根据在上述指标体系下每个指标的指标值和每个指标的权重，确定上述指标体系在目标年份的指数。

在本发明实施例中，当上述指标体系存在多个级别的指标时，可以根据实际需要针对每一级指标实施本发明实施例，以上述表1中的指标体系为例，则上述步骤S140中的每个指标则可以为表1中的三级指标。

经过上述步骤S130进行优化后得到的非占比型指标的指标值均在零到一之间。

其中，参考图3所示，上述确定指标体系在目标年份的指数，具体是通过步骤S310和步骤S320实现的，具体包括：

S310，根据在上述指标体系下每个指标对应的指标值和每个指标的权重，对每个指标的指标值进行加权求和；

其中，在步骤S310中的非占比型指标的指标值为优化处理后得到的指标值。

S320，将得到的和值确定为上述指标体系在目标年份的指数。

具体的，在上述步骤S310中，可以通过如下公式计算上述指标体系在目标年份的指数：

其中，在上述公式中，C表示的是上述指标体系在目标年份的指数，上述m表示的是指标体系中的指标的个数，上述p_i表示的是第i个指标的指标值，如果该指标为非占比型指标，则p_i表示的是优化处理后的指标值，ω_i表示的是第i个指标的权重。

具体的，参考图4所示，上述指标体系中每个指标的权重则是通过如下步骤确定的：

S410，构建上述指标体系的权重判断矩阵；

其中，该权重判断矩阵的行和列均分别表征上述指标体系下的指标，权重判断矩阵的元素表征该元素对应行所表征指标和该元素对应列所表征指标之间的重要程度的比对值；或者表征该元素对应列所表征指标和该元素对应行所表征指标之间的重要程度的比对值。

S420，计算上述权重判断矩阵的最大特征根和对应的特征向量；

S430，根据上述权重判断矩阵的最大特征根对上述权重判断矩阵进行一致性校验；

S440，响应于上述权重判断矩阵通过一致性校验，将上述特征向量中的每个特征值分别确定为该指标体系中对应指标的权重。

在本发明实施例中，上述权重判断矩阵中的元素记为B_ij，并且，其中，B_i指的是上述权重判断矩阵的i行对应的指标的重要程度得分，B_j指的是上述权重判断矩阵的第j列对应的指标的重要程度得分，并且，当i的取值等于j的取值时，B_ij＝B_ii＝B_jj＝1。

当然，上述权重判断矩阵中的元素表示第i行对应的指标的重要程度得分与第j列对应的指标的重要程度得分的比对值，除此之外，在具体场景中，上述权重判断矩阵的元素还可以表示第j列对应的指标的重要程度得分与第i行对应的指标的重要程度得分的比对值。

在通过上述步骤S420计算权重判断矩阵的特征向量时，首先通过如下公式计算上述权重判断矩阵中每一行的所有元素的乘积

其中，在上述公式中，M_i表示的是第i行中各个元素的乘积，B_ij表示的是权重判断矩阵中第i行第j列对应的元素，n表示的是权重判断矩阵的列数，即权重判断矩阵中指标的个数。

当计算出上述权重判断矩阵中每一行的所有元素的乘积后，再计算第i行中各个元素的乘积M_i的n次方根，即

在上述公式中，表示的是权重判断矩阵中第i行中各个元素的乘积的n次方根。

上述权重判断矩阵中的每一行均可以计算出一个各个元素的乘积的n次方根，上述权重判断矩阵中所有行分别对应的n次方根值，可以记为其中，表示的是权重判断矩阵中各行对应的n次方根的向量，对上述向量中的每个值进行正规化，可以得到上述权重判断矩阵对应的特征向量。

具体，通过如下过程对上述向量中的每个值进行正规化：

其中，在上述公式中，W_i表示的是上述权重判断矩阵中第i行对应的特征值。

在上述步骤S420中，通过如下公式计算上述权重判断矩阵的最大特征根：

其中，在上述公式中，λ_max表示的是上述权重判断矩阵的最大特征值，上述(AW)_i表示的是上述权重判断矩阵中第i行中每个元素与权重判断矩阵的特征向量中每个特征值的乘积。

在上述步骤S430中，通过如下公式计算上述权重判断矩阵的一致性指标：

其中，在上述公式中，CI表示的是上述权重判断矩阵的一致性指标。

当计算出上述权重判断矩阵的一致性指标后，根据预先建立的指标个数与预设一致性指标的映射关系，查找到本发明实施例中的指标个数对应的预设一致性指标，上述预先建立的指标个数与预设的一致性指标的映射关系如表2所示。

在表2中，RI表示的是预设一致性指标。

表2

当确定出上述权重判断矩阵对应的预设一致性指标后，则计算上述计算出的权重判断矩阵的一致性指标与该权重判断矩阵对应的预设一致性指标的比值，将该比值与预设阈值进行比较，当该比值小于预设阈值时，则确定该权重判断矩阵的一致性验证通过。这时，将上述计算出来的权重判断矩阵中的特征向量中的每个特征值分别确定为该指标体系对应指标的权重。

为了详细介绍上述每个指标的权重计算过程，下面将以表1中的产业发展对应的四个占比型指标为例进行说明。

表3

根据专家经验可以得出军民融合产业产值占比的重要度得分为2，军民融合规上企业增加值占比的重要度得分为2，军民生产民口配套率的重要度得分为2，军工企业资本化率的重要度得分为1，则构造的权重判断矩阵如表3所示。

首先，计算上述表3中每一行元素的乘积：

M₁＝1*1*1*2＝2

M₂＝1*1*1*2＝2

M₃＝1*1*1*2＝2

M₄＝0.5*0.5*0.5*1＝1/8

其中，M₁为表3中第一行元素的乘积，M₂为表3中第二行元素的乘积，M₃为表3中第三行元素的乘积，M₄为表3中第四行元素的乘积。

之后，分别计算M₁、M₂、M₃和M₄的n次方根，针对上述表3，n的取值为4，则可以计算出：

其中，在上述公式中，为上述表3中第一行元素的乘积的4次方根，为上述表3中第二行元素的乘积的4次方根，为上述表3中第三行元素的乘积的4次方根，为上述表3中第四行元素的乘积4次方根。

对上述计算出来的表3中每一行对应元素的乘积的4次方根进行正规化，具体过程如下所示：

将上述确定为上述表3对应的权重判断矩阵的特征向量。

之后，则需要计算上述表3中的权重判断矩阵的最大特征根，以便根据上述权重判断矩阵的最大特征根，对上述权重判断矩阵进行一致性校验。

在计算上述表3中的权重判断矩阵的最大特征根时，首先需要计算表3中每行元素对应的(AW)_i,具体的，

(AW)₁＝1*0.286+1*0.286+1*0.286+2*0.143＝1.143

(AW)₂＝1*0.286+1*0.286+1*0.286+2*0.143＝1.143

(AW)₃＝1*0.286+1*0.286+1*0.286+2*0.143＝1.143

(AW)₄＝0.5*0.286+0.5*0.286+0.5*0.286+1*0.143＝0.571

其中，在上述公式中，(AW)₁表示的是表3中第一行元素分别与上述特征向量中每个特征值的乘积，(AW)₂表示的是表3中第二行元素分别与上述特征向量中每个特征值的乘积，(AW)₃表示的是表3中第三行元素分别与上述特征向量中每个特征值的乘积，(AW)₄表示的是表3中第四行元素分别与上述特征向量中每个特征值的乘积。

最后，根据表3中每行元素对应的(AW)_i的值，及表3中每行元素对应的特征值，通过如下公式计算上述表3的权重判断矩阵的最大特征值，

根据上述表3对应的权重判断矩阵的最大特征值，以及表3中的指标个数，通过如下方式计算表3对应的权重判断矩阵的一致性指标：

通过表2可知，当n＝4时，RI＝0.9，而CR＝CI/RI＝0/0.9＝0<0.10，因此，表3对应的权重判断矩阵具有满意的一致性，因此，可以确定出上述表3中居民融合产业产值占比、军民融合规上企业增加值占比、军品生产民口配套率及军工企业资本化率的权重分别为0.286、0.286、0.286和0.143。

上述介绍的指数计算方法针对的是目标年份不是首次进行指数计算的年份的情况，当上述目标年份为首次进行指数计算时，则采用本发明又一实施例还提供的方法进行指数的计算，参考图5所示，本发明又一实施例提供的指数计算方法，具体包括步骤S510-S530：

S510，根据指数计算需求采集数据。

在该步骤中，采集的数据为进行指数计算时需要使用的指标的指标值。

S520，确定针对该目标年份进行指数计算所使用的指标体系中的占比型指标，并基于采集的数据确定上述占比型指标对应的指标值。

S530，根据上述占比型指标的指标指和每个占比型指标的权重，确定上述指标体系在该目标年份的指数。

在步骤S530中，采用公式进行指数的计算，其中，C表示的是上述指标体系在目标年份的指数，上述m表示的是指标体系中占比型指标的个数，上述p_i表示的是第i个占比型指标的指标值，ω_i表示的是第i个指标的权重。

本发明实施例提供的数据处理方法，可以将指标体系中的非占比型指标的指标值优化在零到一之间，使得非占比型指标也能够参与指数的计算，提高了计算出的指数的准确性，进而提高了该指数在用于评价对象时的准确性。

基于与上述方法实施例相同的构思，本发明实施例还提供了一种数据处理设备之一，该设备用于执行本发明实施例提供的数据处理方法，具体的，参考图6所示，该设备包括采集模块610、第一确定模块620、优化处理模块630和第二确定模块640，具体的，

上述采集模块610，用于根据指数计算需求采集数据；

上述第一确定模块620，用于确定针对目标年份进行指数计算时所使用的指标体系，并基于采集的数据确定上述指标体系下每个指标对应的指标值；

上述优化处理模块630，用于基于预设历史年份对应的指数，按照预设优化规则对上述指标体系中的非占比型指标对应的指标值进行优化处理，使优化后的非占比型指标的指标值在零到一之间；其中，占比型指标为表征一个参量与另一个参量之间的比值类型的指标；

上述第二确定模块640，用于根据在上述指标体系下每个指标的指标值和上述每个指标的权重，确定上述指标体系在目标年份的指数。

具体的，上述优化处理模块630基于预设历史年份对应的指数，按照预设优化规则对上述指标体系中非占比型指标对应的指标值进行优化处理，是通过计算单元、第一确定单元和优化单元实现的，具体包括：

上述计算单元，用于针对上述指标体系中每个非占比型指标，分别计算在上述目标年份中该指标的指标值与在预设历史年份中该指标的指标值的比值；上述第一确定单元，用于根据该指标对应的比值和预设历史年份对应的指数之间的数值关系，确定该指标的指标值对应的优化方式；上述优化单元，用于按照确定的该指标的指标值对应的优化方式对该指标值进行优化。

具体的，上述第一确定单元根据该指标对应的比值和预设历史年份对应的指数之间的数值关系，确定该指标的指标值对应的优化方式，是通过第一确定子单元和第二确定子单元实现的，具体包括：

上述第一确定子单元，用于针对上述比值为零的情况，确定该指标的指标值的范围等级为第一等级；还用于，针对上述比值大于零且小于预设历史年份对应的指数的倒数的情况，确定该指标的指标值的范围等级为第二等级；还用于，针对上述比值大于等于预设历史年份对应的指数的倒数的情况，确定该指标的指标值的范围等级为第三等级；上述第二确定子单元，用于根据该指标的指标值对应的范围等级，确定该指标的指标值对应的优化方式。

其中，上述第二确定子单元，具体用于，

针对第一等级指标值，将该指标值初优化为百分之百，并将该指标值再优化为百分之百与预设历史年份对应的指数的乘积；针对第二等级指标值，将该指标值初优化为该指标值自身值，并将该指标值再优化为该自身值与预设历史年份对应的指数的乘积；针对第三等级指标值，将该指标值初优化为百分之二百，并将该指标值再优化为百分之二百与预设历史年份对应的指数的乘积。

在本发明实施例中，上述第二确定模块640根据在指标体系下每个指标对应的指标值和每个指标的权重，确定上述指标体系在目标年份的指数，是通过求和单元和第二确定单元实现的，具体包括：

上述求和单元，用于根据在上述指标体系下每个指标对应的指标值和上述指标的权重，对每个指标的指标值进行加权求和；其中，上述非占比型指标的指标值为优化处理后得到的指标值；上述第二确定单元，用于将得到的和值确定为上述指标体系在目标年份的指数。

其中，为了计算指标体系中各个指标的权重，本发明实施例提供的数据处理设备，还包括构建模块、计算模块、一致性验证模块和第三确定模块；

上述构建模块，用于构建上述指标体系的权重判断矩阵；其中，该权重判断矩阵的行和列分别表征上述指标体系下的指标；上述权重判断矩阵的元素表征该元素对应行所表征指标和该元素对应列所表征指标之间的重要程度比对值；上述计算模块，用于计算上述权重判断矩阵的最大特征根和对应的特征向量；上述一致性验证模块，用于根据上述权重判断矩阵的最大特征根对上述权重判断矩阵进行一致性校验；上述第三确定模块，用于响应于上述权重判断矩阵通过一致性校验，将上述特征向量中的每个特征值分别确定为上述指标体系中对应指标的权重。

针对上述目标年份为首次进行指数计算的年份的情况，上述采集模块、第一确定模块和第二确定模块，还具体用于，

上述采集模块，用于根据指数计算需求采集数据；上述第一确定模块，用于确定针对该目标年份进行指数计算所使用的指标体系中的占比型指标，并基于采集的数据确定上述占比型指标对应的指标值；上述第二确定模块，用于根据上述占比型指标的指标值和每个占比型指标的权重，确定上述指标体系在该目标年份的指数。

本发明实施例提供的数据处理设备之一，可以将指标体系中的非占比型指标的指标值优化在零到一之间，使得非占比型指标也能够参与指数的计算，提高了计算出的指数的准确性，进而提高了该指数在用于评价对象时的准确性。

上述各单元的功能可对应于图1至图5所示流程中的相应处理步骤，在此不再赘述。

对应于图1中的数据处理方法，本发明实施例还提供了一种数据处理设备之二，如图7所示，该设备包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序，其中，上述处理器2000执行上述计算机程序时实现上述数据处理方法的步骤。

具体地，上述存储器1000和处理器2000能够为通用的存储器和处理器，这里不做具体限定，当处理器2000运行存储器1000存储的计算机程序时，能够执行上述数据处理方法，从而解决传统的数据处理方法对大数据的处理能力不足，无法确保数据的安全性和可靠性的问题，进而实现对敏感数据进行精准定位和保护，从而保证数据的安全性和可靠性。

对应于图1中的数据处理方法，本发明实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述数据处理方法的步骤。

具体地，该存储介质能够为通用的存储介质，如移动磁盘、硬盘等，该存储介质上的计算机程序被运行时，能够执行上述数据处理方法，从而解决传统的数据处理方法对大数据的处理能力不足，无法确保数据的安全性和可靠性的问题，进而实现对敏感数据进行精准定位和保护，从而保证数据的安全性和可靠性。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

根据指数计算需求采集数据；

2.根据权利要求1所述的方法，其特征在于，采用如下方式确定在所述指标体系下每个指标的权重：

构建所述指标体系的权重判断矩阵；

计算所述权重判断矩阵的最大特征根和对应的特征向量；

3.根据权利要求1所述的方法，其特征在于，所述基于预设历史年份对应的指数，按照预设优化规则对所述指标体系中的非占比型指标对应的指标值进行优化处理，具体包括：

4.根据权利要求3所述的方法，其特征在于，所述根据该指标对应的比值和所述预设历史年份对应的指数之间的数值关系，确定该指标的指标值对应的优化方式，包括：

5.根据权利要求3所述的方法，其特征在于，所述按照确定的该指标的指标值对应的优化方式对该指标值进行优化，具体包括：

6.根据权利要求1所述的方法，其特征在于，所述根据在所述该指标体系下每个指标的指标值和所述每个指标的权重，确定所述指标体系在所述目标年份的指数，包括：

将得到的和值确定为所述指标体系在所述目标年份的指数。

7.根据权利要求1所述的方法，其特征在于，针对所述目标年份为首次进行指数计算的年份的情况，采用如下方式确定该目标年份的指数：

根据指数计算需求采集数据；

根据所述占比型指标的指标值和所述每个占比型指标的权重，确定所述指标体系在该目标年份的指数。

8.一种数据处理设备，其特征在于，所述设备包括：

采集模块，用于根据指数计算需求采集数据；

9.一种数据处理设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行上述权利要求1至7任一项所述的方法的步骤。