CN115658990B

CN115658990B - 一种用于目标空间分群的数据处理方法及装置

Info

Publication number: CN115658990B
Application number: CN202211184414.5A
Authority: CN
Inventors: 张海林; 黄谦; 齐智敏; 马贤明; 陈敏; 王凯; 黄嘉瑜; 杜玉龙
Original assignee: Strategic Evaluation And Consultation Center Of Pla Academy Of Military Sciences
Current assignee: Strategic Evaluation And Consultation Center Of Pla Academy Of Military Sciences
Priority date: 2022-09-27
Filing date: 2022-09-27
Publication date: 2023-04-21
Anticipated expiration: 2042-09-27
Also published as: CN115658990A

Abstract

本发明公开了一种用于目标空间分群的数据处理方法及装置，该方法包括：获取待聚类数据信息；待聚类数据信息包括N个目标实体；N为正整数；对待聚类数据信息进行数据预处理，得到标准数据信息；标准数据信息包括N个节点数据信息；对标准数据信息进行聚类处理，得到目标空间分群信息；目标空间分群信息包括若干个簇内信息；每个簇内信息包括若干个目标实体；任意两个簇内信息不包含相同的目标实体。可见，本发明有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

Description

一种用于目标空间分群的数据处理方法及装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种用于目标空间分群的数据处理方法及装置。

背景技术

当前在进行战场态势评估时，通常要对目标进行空间分群，但目前处理负责非凸形状簇的目标空间分群任务时，聚类结果容易出现偏差，数据处理效率相对较低，精度还有待提高。因此，提供一种用于目标空间分群的数据处理方法及装置，以优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度，进而提高战场态势评估精度。

发明内容

本发明所要解决的技术问题在于，提供一种用于目标空间分群的数据处理方法及装置，能够通过对待聚类数据信息的数据预处理和聚类处理得到目标空间分群信息，有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

为了解决上述技术问题，本发明实施例第一方面公开了一种用于目标空间分群的数据处理方法，所述方法包括：

获取待聚类数据信息；所述待聚类数据信息包括N个目标实体；所述N为正整数；

对所述待聚类数据信息进行数据预处理，得到标准数据信息；所述标准数据信息包括所述N个节点数据信息；

对所述标准数据信息进行聚类处理，得到目标空间分群信息；所述目标空间分群信息包括若干个簇内信息；每个所述簇内信息包括若干个所述目标实体；任意两个所述簇内信息不包含相同的所述目标实体。

作为一种可选的实施方式，在本发明实施例第一方面中，所述对所述标准数据信息进行聚类处理，得到目标空间分群信息，包括：

对所述标准数据信息进行相似度计算和矩阵构建，得到节点相似矩阵；

对所述节点相似矩阵进行分层抽样处理，得到目标偏向系数；

对所述标准数据信息、所述节点相似矩阵和所述目标偏向系数进行迭代计算处理，得到目标空间分群信息。

作为一种可选的实施方式，在本发明实施例第一方面中，所述对所述标准数据信息进行相似度计算和矩阵构建，得到节点相似矩阵，包括：

利用预设的节点相似模型计算所述标准数据信息中任意两个所述节点数据信息的相似度，得到节点相似信息；所述节点相似信息包括N²个相似度值；

根据所述标准数据信息中所述节点数据信息的位置顺序关系对所述节点相似信息进行数据编排，得到节点相似矩阵。

作为一种可选的实施方式，在本发明实施例第一方面中，所述对所述节点相似矩阵进行分层抽样处理，得到目标偏向系数，包括：

根据所述节点相似矩阵，确定出样本空间信息；

对所述样本空间信息进行抽样处理，得到抽样结果信息；所述抽样结果信息包括抽样次数、轮廓系数信息和当前样本信息；所述轮廓系数信息包括当前轮廓系数和历史轮廓系数信息；

判断所述抽样结果信息是否满足抽样终止条件，得到抽样判断结果；所述抽样终止条件用于对所述抽样次数和所述轮廓系数信息的分析判断；

当所述抽样判断结果为否时，利用所述抽样结果信息对所述样本空间信息进行更新，并触发执行所述对所述样本空间信息进行抽样处理，得到抽样结果信息；

当所述抽样判断结果为是时，根据所述抽样结果信息中的所述轮廓系数信息和所述当前样本信息，确定出目标偏向系数。

作为一种可选的实施方式，在本发明实施例第一方面中，所述对所述样本空间信息进行抽样处理，得到抽样结果信息，包括：

根据预设的抽样组距和样本分组数对所述样本空间信息进行样本均分，得到样本组信息；所述样本组信息包括12个样本组；所述样本组包括若干个样本点；

对于所述样本组信息中的任一所述样本组，利用预设的偏向系数模型计算该样本组中每个所述样本点的偏向系数，得到该样本组对应的待用系数信息；所述待用系数信息包括若干个待用系数；所述待用系数的取值范围为[-1,1]；

对该样本组对应的待用系数信息中所有待用系数进行加权均值计算，得到该样本组对应的系数平均值；

从所有所述系数平均值中选取最大值作为所述当前轮廓系数；

从所述样本组信息中选取所述当前轮廓系数对应的样本组作为所述当前样本信息；

更新所述历史轮廓系数信息和所述抽样次数。

作为一种可选的实施方式，在本发明实施例第一方面中，利用所述目标偏向系数从所述标准数据信息进行中心点划分，得到初始中心点信息；所述初始中心点信息包括若干个初始中心点；所述初始中心点用于筛选确定聚类中心点；

对于任一所述初始中心点，根据该初始中心点，对所述节点相似矩阵进行迭代计算，得到该初始中心点对应的第一吸引度矩阵和该初始中心点对应的第一归属度矩阵；

初始化所述第一归属度矩阵，得到第二归属度矩阵；

利用所述第二归属度矩阵和所述节点相似矩阵对所述第一吸引度矩阵进行计算和更新，得到第二吸引度矩阵；

利用所述第二吸引度矩阵对所述第二归属度矩阵进行计算更新，得到第三归属度矩阵和迭代次数；

判断所述迭代次数是否等于预设的迭代阈值，得到迭代判断结果；

当所述迭代判断结果为否时，利用所述第三归属度矩阵和所述第二吸引度矩阵分别对所述第二归属度矩阵和所述第一吸引度矩阵进行更新，并触发执行所述利用所述第二归属度矩阵和所述节点相似矩阵对所述第一吸引度矩阵进行计算和更新，得到第二吸引度矩阵；

当所述迭代判断结果为是时，对所述第二吸引度矩阵和所述第三归属度矩阵进行求和计算，得到中心聚类值；

判断所述中心聚类值是否大于0，得到中心判断结果；

当所述中心判断结果为是时，确定该初始中心点为一个所述聚类中心点；每一个所述聚类中心点对应于唯一一个所述簇内信息；

根据所有所述聚类中心点对所述标准数据信息进行聚类，得到目标空间分群信息。

作为一种可选的实施方式，在本发明实施例第一方面中，在所述对所述标准数据信息进行聚类处理，得到目标空间分群信息之后，所述方法还包括：

获取评价参考参数信息；

利用预设的评价模型对所述目标空间分群信息进行计算处理，得到第一评价参数信息；所述评价参数信息包括3个评价参数；

对所述目标空间分群信息进行类别数量信息提取，得到第二评价参数信息；

利用所述评价参考参数信息对所述第一评价参数信息和所述第二评价参数信息进行对比分析，得到评价结果信息；所述评价结果信息用于指示优化所述标准数据信息的聚类处理。

本发明实施例第二方面公开了一种用于目标空间分群的数据处理装置，所述装置包括：

获取模块，用于获取待聚类数据信息；所述待聚类数据信息包括N个目标实体；所述N为正整数；

第一处理模块，用于对所述待聚类数据信息进行数据预处理，得到标准数据信息；所述标准数据信息包括所述N个节点数据信息；

第二处理模块，用于对所述标准数据信息进行聚类处理，得到目标空间分群信息；所述目标空间分群信息包括若干个簇内信息；每个所述簇内信息包括若干个所述目标实体；任意两个所述簇内信息不包含相同的所述目标实体。

作为一种该可选的实施方式，在本发明实施例第二方面中，所述第一处理模块对所述待聚类数据信息进行数据预处理，得到标准数据信息的具体方式为：

作为一种该可选的实施方式，在本发明实施例第二方面中，所述第一处理模块对所述标准数据信息进行相似度计算和矩阵构建，得到节点相似矩阵的具体方式为：

作为一种该可选的实施方式，在本发明实施例第二方面中，所述第一处理模块对所述节点相似矩阵进行分层抽样处理，得到目标偏向系数的具体方式为：

根据所述节点相似矩阵，确定出样本空间信息；

作为一种该可选的实施方式，在本发明实施例第二方面中，所述第一处理模块对所述样本空间信息进行抽样处理，得到抽样结果信息的具体方式为：

更新所述历史轮廓系数信息和所述抽样次数。

作为一种该可选的实施方式，在本发明实施例第二方面中，所述第一处理模块对所述标准数据信息、所述节点相似矩阵和所述目标偏向系数进行迭代计算处理，得到目标空间分群信息的具体方式为：

利用所述目标偏向系数从所述标准数据信息进行中心点划分，得到初始中心点信息；所述初始中心点信息包括若干个初始中心点；所述初始中心点用于筛选确定聚类中心点；

初始化所述第一归属度矩阵，得到第二归属度矩阵；

判断所述中心聚类值是否大于0，得到中心判断结果；

作为一种该可选的实施方式，在本发明实施例第二方面中，在所述第二处理模块对所述标准数据信息进行聚类处理，得到目标空间分群信息之后，所述装置还包括：

所述获取模块，还用于获取评价参考参数信息；

第三处理模块，用于利用预设的评价模型对所述目标空间分群信息进行计算处理，得到第一评价参数信息；所述评价参数信息包括3个评价参数；

提取模块，用于对所述目标空间分群信息进行类别数量信息提取，得到第二评价参数信息；

对比分析模块，用于利用所述评价参考参数信息对所述第一评价参数信息和所述第二评价参数信息进行对比分析，得到评价结果信息；所述评价结果信息用于指示优化所述标准数据信息的聚类处理。

本发明第三方面公开了另一种用于目标空间分群的数据处理装置，所述装置包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明实施例第一方面公开的用于目标空间分群的数据处理方法中的部分或全部步骤。

本发明第四方面公开了一种计算机存储介质，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行本发明实施例第一方面公开的用于目标空间分群的数据处理方法中的部分或全部步骤。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，获取待聚类数据信息；待聚类数据信息包括N个目标实体；N为正整数；对待聚类数据信息进行数据预处理，得到标准数据信息；标准数据信息包括N个节点数据信息；对标准数据信息进行聚类处理，得到目标空间分群信息；目标空间分群信息包括若干个簇内信息；每个簇内信息包括若干个目标实体；任意两个簇内信息不包含相同的目标实体。可见，本发明有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种用于目标空间分群的数据处理方法的流程示意图；

图2是本发明实施例公开的另一种用于目标空间分群的数据处理方法的流程示意图；

图3是本发明实施例公开的一种用于目标空间分群的数据处理装置的结构示意图；

图4是本发明实施例公开的另一种用于目标空间分群的数据处理装置的结构示意图；

图5是本发明实施例公开的又一种用于目标空间分群的数据处理装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本发明公开了一种用于目标空间分群的数据处理方法及装置，能够通过对待聚类数据信息的数据预处理和聚类处理得到目标空间分群信息，有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。以下分别进行详细说明。

实施例一

请参阅图1，图1是本发明实施例公开的一种用于目标空间分群的数据处理方法的流程示意图。其中，图1所描述的用于目标空间分群的数据处理方法应用于数据处理系统中，如用于目标空间分群的数据处理管理的本地服务器或云端服务器等，本发明实施例不做限定。如图1所示，该用于目标空间分群的数据处理方法可以包括以下操作：

101、获取待聚类数据信息。

本发明实施例中，上述待聚类数据信息包括N个目标实体。

本发明实施例中，上述N为正整数。

102、对待聚类数据信息进行数据预处理，得到标准数据信息。

本发明实施例中，上述标准数据信息包括N个节点数据信息。

103、对标准数据信息进行聚类处理，得到目标空间分群信息。

本发明实施例中，上述目标空间分群信息包括若干个簇内信息。

本发明实施例中，上述每个簇内信息包括若干个目标实体。

本发明实施例中，上述任意两个簇内信息不包含相同的目标实体。

可选的，上述目标实体表征需要聚类的实体点，其为本领域现有技术。

可选的，上述目标实体包括若干个特征属性信息。

可选的，上述特征属性信息包括批号，和/或，速度，和/或，位置，和/或，类型，本发明实施例不做限定。

可选的，上述簇内信息中的目标实体对应的位置是相似的。

可选的，上述对待聚类数据信息进行数据预处理是对待聚类数据信息进行归一化处理，以消除待聚类数据信息中不同量纲对聚类过程的影响，进而提高聚类精度和效率。

可选的，上述节点数据信息表征节点对应的属性信息。

可选的，上述每个节点对应于唯一一个目标实体。

可见，实施本发明实施例所描述的用于目标空间分群的数据处理方法能够通过对待聚类数据信息的数据预处理和聚类处理得到目标空间分群信息，有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在一个可选的实施例中，上述步骤103中对标准数据信息进行聚类处理，得到目标空间分群信息，包括：

对标准数据信息进行相似度计算和矩阵构建，得到对称节点相似矩阵；

对对称节点相似矩阵进行分层抽样处理，得到目标偏向系数；

对标准数据信息、对称节点相似矩阵和目标偏向系数进行迭代计算处理，得到目标空间分群信息。

可选的，通过上述分层抽样处理是在没有先验知识积累的偏向系数选取时，在每次运算前，对取样区间进行等间距划分，不断缩小偏向系数的取值以得到最为合适的目标偏向系数。

可选的，上述目标偏向系数与聚类的类别数量是非线性的密切关系。进一步的，上述对目标偏向系数的筛选是根据实际情况动态调整得到的。

可见，实施本发明实施例所描述的用于目标空间分群的数据处理方法能够通过对标准数据信息进行聚类处理，得到目标空间分群信息，有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在另一个可选的实施例中，上述对标准数据信息进行相似度计算和矩阵构建，得到对称节点相似矩阵，包括：

利用预设的节点相似模型计算标准数据信息中任意两个节点数据信息的相似度，得到节点相似信息；节点相似信息包括N²个相似度值；

根据标准数据信息中节点数据信息的位置顺序关系对节点相似信息进行数据编排，得到对称节点相似矩阵。

可选的，上述节点相似模型的具体形式为：

其中，K(x_i,x_j)为节点x_i与节点x_j之间的相似度；σ为宽带参数；i、j为节点的序号数。

可选的，上述宽带参数σ与聚类效果和泛化程度相关。

可选的，上述σ为大于0的正数。

可选的，上述对称节点相似矩阵是根据各节点的位置顺序关系和各节点之间的相似度来编排构建的。

可选的，利用上述节点相似模型构建的对称节点相似矩阵可将将数据进行升维，以将数据的非线性关系转变为线性关系，避免一般聚类算法中分类不准确的问题。

可见，实施本发明实施例所描述的用于目标空间分群的数据处理方法能够对标准数据信息进行相似度计算和矩阵构建，得到对称节点相似矩阵，有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在又一个可选的实施例中，对对称节点相似矩阵进行分层抽样处理，得到目标偏向系数，包括：

根据对称节点相似矩阵，确定出样本空间信息；

对样本空间信息进行抽样处理，得到抽样结果信息；抽样结果信息包括抽样次数、轮廓系数信息和当前样本信息；轮廓系数信息包括当前轮廓系数和历史轮廓系数信息；

判断抽样结果信息是否满足抽样终止条件，得到抽样判断结果；抽样终止条件用于对抽样次数和轮廓系数信息的分析判断；

当抽样判断结果为否时，利用抽样结果信息对样本空间信息进行更新，并触发执行对样本空间信息进行抽样处理，得到抽样结果信息；

当抽样判断结果为是时，根据抽样结果信息中的轮廓系数信息和当前样本信息，确定出目标偏向系数。

可选的，上述样本空间信息中的最大值和最小值分别为对称相似矩阵中所有元素的最大值和最小值。

可选的，上述抽样终止条件包括抽样次数大于等于迭代次数阈值和最近3个轮廓系数是相一致的。

在该可选的实施例中，作为一种可选的实施方式，上述判断抽样结果信息是否满足抽样终止条件，得到抽样判断结果的具体方式为：

判断抽样次数是否大于等于迭代次数阈值，得到次数判断结果；

当上述次数判断结果为否时，确定抽样判断结果为否；

当上述次数判断结果为是时，从历史轮廓系数信息中选取最近的2个历史轮廓系数；

判断最近的2个历史轮廓系数与当前轮廓系数是否相一致，得到系数判断结果；

当上述系数判断结果为否时，确定抽样判断结果为否；

当上述系数判断结果为是时，确定抽样判断结果为是。

在该可选的实施例中，作为另一种可选的实施方式，上述利用抽样结果信息对样本空间信息进行更新的具体方式为：

将所述抽样结果信息中的当前样本信息替换为样本空间信息。

在该可选的实施例中，作为又一种可选的实施方式，上述根据抽样结果信息中的轮廓系数信息和当前样本信息，确定出目标偏向系数的具体方式为：

计算当前样本信息的平均值，得到当前偏向系数；

选取历史轮廓系数信息中选取最近的2个历史轮廓系数对应的样本信息作为目标历史样本信息；

计算上述目标历史样本信息的平均值，得到目标历史偏向系数；

对当前偏向系数和目标历史偏向系数进行平均值计算，得到目标偏向系数。

可见，实施本发明实施例所描述的用于目标空间分群的数据处理方法能够对称节点相似矩阵进行分层抽样处理，得到目标偏向系数，更有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在又一个可选的实施例中，对样本空间信息进行抽样处理，得到抽样结果信息，包括：

根据预设的抽样组距和样本分组数对样本空间信息进行样本均分，得到样本组信息；样本组信息包括12个样本组；样本组包括若干个样本点；

对于样本组信息中的任一样本组，利用预设的偏向系数模型计算该样本组中每个样本点的偏向系数，得到该样本组对应的待用系数信息；待用系数信息包括若干个待用系数；待用系数的取值范围为[-1,1]；

从所有系数平均值中选取最大值作为当前轮廓系数；

从样本组信息中选取当前轮廓系数对应的样本组作为当前样本信息；

更新历史轮廓系数信息和抽样次数。

可选的，上述偏向系数模型的具体形式为：

其中，sil(t)为待用系数，a(t)为样本点t与同簇内中样本点的平均不相似度，b(t)为样本点t到其他簇内所有样本的平均不相似度的最小值。

可选的，上述历史轮廓系数信息包括若干个历史轮廓系数。

在该可选的实施例中，作为一种可选的实施方式，上述更新历史轮廓系数信息的具体方式为：

判断历史轮廓系数信息中是否存在空缺值，得到空缺判断结果；

当空缺判断结果为是否时，将当前轮廓系数依历史轮廓系数信息中的空缺位置依序进行填充处理，得到更新后的历史轮廓系数信息；

当空缺判断结果为否时，对历史轮廓系数信息进行曲线拟合，得到历史轮廓系数曲线；

计算所有历史轮廓系数与历史轮廓系数曲线的偏离度，得到系数偏离度信息；系数偏离度信息包括若干个系数偏离度；

从系数偏离度信息中筛选出偏离度最大的系数偏离度作为目标系数偏离度；

将当前轮廓系数替换目标系数偏离度对应的历史轮廓系数，得到更新后的历史轮廓系数信息。

可选的，上述系数偏离度表征历史轮廓系数到历史轮廓系数曲线的距离。

可选的，上述待用系数表征聚类质量，待用系数越大，聚类质量越好。

可选的，上述系数平均值的数量为12。

可见，实施本发明实施例所描述的用于目标空间分群的数据处理方法能够对样本空间信息进行抽样处理，得到抽样结果信息，更有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在一个可选的实施例中，上述对标准数据信息、对称节点相似矩阵和目标偏向系数进行迭代计算处理，得到目标空间分群信息，包括：利用目标偏向系数从标准数据信息进行中心点划分，得到初始中心点信息；初始中心点信息包括若干个初始中心点；初始中心点用于筛选确定聚类中心点；

对于任一初始中心点，根据该初始中心点，对节点相似矩阵进行迭代计算，得到该初始中心点对应的第一吸引度矩阵和该初始中心点对应的第一归属度矩阵；

初始化第一归属度矩阵，得到第二归属度矩阵；

利用第二归属度矩阵和节点相似矩阵对第一吸引度矩阵进行计算和更新，得到第二吸引度矩阵；

利用第二吸引度矩阵对第二归属度矩阵进行计算更新，得到第三归属度矩阵和迭代次数；

判断迭代次数是否等于预设的迭代阈值，得到迭代判断结果；

当迭代判断结果为否时，利用第三归属度矩阵和第二吸引度矩阵分别对第二归属度矩阵和第一吸引度矩阵进行更新，并触发执行利用第二归属度矩阵和节点相似矩阵对第一吸引度矩阵进行计算和更新，得到第二吸引度矩阵；

当迭代判断结果为是时，对第二吸引度矩阵和第三归属度矩阵进行求和计算，得到中心聚类值；

判断中心聚类值是否大于0，得到中心判断结果；

当中心判断结果为是时，确定该初始中心点为一个聚类中心点；每一个聚类中心点对应于唯一一个簇内信息；

根据所有聚类中心点对标准数据信息进行聚类，得到目标空间分群信息。

可选的，上述第一归属度矩阵、第二归属度矩阵、第三归属度矩阵中包括若干个归属度值。

可选的，上述第一吸引度矩阵、第二吸引度矩阵中包括若干个吸引度值。

可选的，上述归属度值和吸引度值为现有技术。

可选的，上述利用第二归属度矩阵和节点相似矩阵对第一吸引度矩阵进行计算和更新，得到第二吸引度矩阵是将第一吸引度矩阵中小于0的吸引度值从第一吸引度矩阵中剔除，以得到第二吸引度矩阵，即此时的第二吸引度矩阵中的吸引度值均为正值。

可选的，上述利用第二吸引度矩阵对第二归属度矩阵进行计算更新是将第二归属度矩阵中归属度值小于0剔除，以得到归属度值均为正值的第三归属度矩阵。

可见，实施本发明实施例所描述的用于目标空间分群的数据处理方法能够对标准数据信息、对称节点相似矩阵和目标偏向系数进行迭代计算处理，得到目标空间分群信息，更有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

实施例二

请参阅图2，图2是本发明实施例公开的另一种用于目标空间分群的数据处理方法的流程示意图。其中，图2所描述的用于目标空间分群的数据处理方法应用于数据处理系统中，如用于目标空间分群的数据处理管理的本地服务器或云端服务器等，本发明实施例不做限定。如图2所示，该用于目标空间分群的数据处理方法可以包括以下操作：

201、获取待聚类数据信息。

202、对待聚类数据信息进行数据预处理，得到标准数据信息。

203、对标准数据信息进行聚类处理，得到目标空间分群信息。

204、获取评价参考参数信息。

205、利用预设的评价模型对目标空间分群信息进行计算处理，得到第一评价参数信息。

本发明实施例中，上述评价参数信息包括3个评价参数。

206、对目标空间分群信息进行类别数量信息提取，得到第二评价参数信息。

207、利用评价参考参数信息对第一评价参数信息和第二评价参数信息进行对比分析，得到评价结果信息。

本发明实施例中，上述评价结果信息用于指示优化标准数据信息的聚类处理。

本发明实施例中，针对步骤201-步骤203的具体技术细节和技术名词解释，可以参照实施例一中针对步骤101-步骤103的详细描述，本发明实施例不再赘述。

可选的，上述评价参数包括准确率、归一化互信息量、芮氏指标值。

可选的，上述评价模型包括第一评价模型、第二评价模型和第三评价模型。

可选的，上述第一评价模型的具体形式为：

其中，ACC为准确率，P_m为每一类簇内中聚类正确的样本数，l为簇内的子集数量，m为第m个子集。

可选的，上述第二评价模型的具体形式为：

其中，NMI(X；Y)为簇内X和簇内Y的互信息量，H(X)和H(Y)分别为簇内X与簇内Y两个簇内的信息熵，l₁为簇内X的子集数量，l₂为簇内Y的子集数量，m₁为簇内X第m₁个子集，m₂为簇内X第m₂个子集，

为簇内X第m₁个子集与簇内Y第m₂个子集相同样本的个数，

为簇内X第m₁个子集中样本的个数，

为簇内Y第m₂个子集中样本的个数，N为待聚类数据信息中目标实体的数量。

可选的，上述第三评价模型的具体形式为：

其中，RI为芮氏指标值，f₀₀为具有不同簇内标签且属于不同簇内的数据点数目量，f₁₁为具有相同簇内标签且属于同一簇内的数据点数量。

可选的，上述准确率越大，归一化互信息量越高，芮氏指标值越大表征聚类效果越好。

实施例三

请参阅图3，图3是本发明实施例公开的一种用于目标空间分群的数据处理装置的结构示意图。其中，图3所描述的装置能够应用于数据处理系统中，如用于目标空间分群的数据处理管理的本地服务器或云端服务器等，本发明实施例不做限定。如图3所示，该装置可以包括：

获取模块301，用于获取待聚类数据信息；待聚类数据信息包括N个目标实体；N为正整数；

第一处理模块302，用于对待聚类数据信息进行数据预处理，得到标准数据信息；标准数据信息包括N个节点数据信息；

第二处理模块303，用于对标准数据信息进行聚类处理，得到目标空间分群信息；目标空间分群信息包括若干个簇内信息；每个簇内信息包括若干个目标实体；任意两个簇内信息不包含相同的目标实体。

可见，实施图3所描述的用于目标空间分群的数据处理装置，能够通过对待聚类数据信息的数据预处理和聚类处理得到目标空间分群信息，有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在另一个可选的实施例中，如图4所示，第一处理模块302对待聚类数据信息进行数据预处理，得到标准数据信息的具体方式为：

可见，实施图4所描述的用于目标空间分群的数据处理装置，能够通过对标准数据信息进行聚类处理，得到目标空间分群信息，有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在又一个可选的实施例中，如图4所示，第一处理模块302对标准数据信息进行相似度计算和矩阵构建，得到对称节点相似矩阵的具体方式为：

可见，实施图4所描述的用于目标空间分群的数据处理装置，能够对标准数据信息进行相似度计算和矩阵构建，得到对称节点相似矩阵，有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在又一个可选的实施例中，如图4所示，第一处理模块302对对称节点相似矩阵进行分层抽样处理，得到目标偏向系数的具体方式为：

根据对称节点相似矩阵，确定出样本空间信息；

可见，实施图4所描述的用于目标空间分群的数据处理装置，能够对称节点相似矩阵进行分层抽样处理，得到目标偏向系数，更有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在又一个可选的实施例中，如图4所示，第一处理模块302对样本空间信息进行抽样处理，得到抽样结果信息的具体方式为：

从所有系数平均值中选取最大值作为当前轮廓系数；

更新历史轮廓系数信息和抽样次数。

可见，实施图4所描述的用于目标空间分群的数据处理装置，能够对样本空间信息进行抽样处理，得到抽样结果信息，更有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在又一个可选的实施例中，如图4所示，第一处理模块302对标准数据信息、对称节点相似矩阵和目标偏向系数进行迭代计算处理，得到目标空间分群信息的具体方式为：

利用目标偏向系数从标准数据信息进行中心点划分，得到初始中心点信息；初始中心点信息包括若干个初始中心点；初始中心点用于筛选确定聚类中心点；

初始化第一归属度矩阵，得到第二归属度矩阵；

判断中心聚类值是否大于0，得到中心判断结果；

可见，实施图4所描述的用于目标空间分群的数据处理装置，能够对标准数据信息、对称节点相似矩阵和目标偏向系数进行迭代计算处理，得到目标空间分群信息，更有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

在又一个可选的实施例中，如图4所示，在第二处理模块303对标准数据信息进行聚类处理，得到目标空间分群信息之后，装置还包括：

获取模块301，还用于获取评价参考参数信息；

第三处理模块304，用于利用预设的评价模型对目标空间分群信息进行计算处理，得到第一评价参数信息；评价参数信息包括3个评价参数；

提取模块305，用于对目标空间分群信息进行类别数量信息提取，得到第二评价参数信息；

对比分析模块306，用于利用评价参考参数信息对第一评价参数信息和第二评价参数信息进行对比分析，得到评价结果信息；评价结果信息用于指示优化标准数据信息的聚类处理。

可见，实施图4所描述的用于目标空间分群的数据处理装置，能够通过对待聚类数据信息的数据预处理和聚类处理得到目标空间分群信息，有利于优化提高目标空间分群的聚类效率，提高目标空间分群的准确性和有效性，进而提高战场态势评估精度。

实施例四

请参阅图5，图5是本发明实施例公开的又一种用于目标空间分群的数据处理装置的结构示意图。其中，图5所描述的装置能够应用于数据处理系统中，如用于目标空间分群的数据处理管理的本地服务器或云端服务器等，本发明实施例不做限定。如图5所示，该装置可以包括：

存储有可执行程序代码的存储器401；

与存储器401耦合的处理器402；

处理器402调用存储器401中存储的可执行程序代码，用于执行实施例一或实施例二所描述的用于目标空间分群的数据处理方法中的步骤。

实施例五

本发明实施例公开了一种计算机读存储介质，其存储用于电子数据交换的计算机程序，其中，该计算机程序使得计算机执行实施例一或实施例二所描述的用于目标空间分群的数据处理方法中的步骤。

实施例六

本发明实施例公开了一种计算机程序产品，该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，且该计算机程序可操作来使计算机执行实施例一或实施例二所描述的用于目标空间分群的数据处理方法中的步骤。

以上所描述的装置实施例仅是示意性的，其中作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施例的具体描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory，EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

最后应说明的是：本发明实施例公开的一种用于目标空间分群的数据处理方法及装置所揭露的仅为本发明较佳实施例而已，仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各项实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims

1.一种用于目标空间分群的数据处理方法，其特征在于，所述方法包括：

对所述标准数据信息进行聚类处理，得到目标空间分群信息；所述目标空间分群信息包括若干个簇内信息；每个所述簇内信息包括若干个所述目标实体；任意两个所述簇内信息不包含相同的所述目标实体；

其中，所述对所述标准数据信息进行聚类处理，得到目标空间分群信息，包括：

对所述标准数据信息进行相似度计算和矩阵构建，得到对称节点相似矩阵；

对所述对称节点相似矩阵进行分层抽样处理，得到目标偏向系数；

对所述标准数据信息、所述对称节点相似矩阵和所述目标偏向系数进行迭代计算处理，得到目标空间分群信息；

其中，所述对所述标准数据信息、所述对称节点相似矩阵和所述目标偏向系数进行迭代计算处理，得到目标空间分群信息，包括：

对于任一所述初始中心点，根据该初始中心点，对所述对称节点相似矩阵进行迭代计算，得到该初始中心点对应的第一吸引度矩阵和该初始中心点对应的第一归属度矩阵；

初始化所述第一归属度矩阵，得到第二归属度矩阵；

利用所述第二归属度矩阵和所述对称节点相似矩阵对所述第一吸引度矩阵进行计算和更新，得到第二吸引度矩阵；

当所述迭代判断结果为否时，利用所述第三归属度矩阵和所述第二吸引度矩阵分别对所述第二归属度矩阵和所述第一吸引度矩阵进行更新，并触发执行所述利用所述第二归属度矩阵和所述对称节点相似矩阵对所述第一吸引度矩阵进行计算和更新，得到第二吸引度矩阵；

判断所述中心聚类值是否大于0，得到中心判断结果；

2.根据权利要求1所述的用于目标空间分群的数据处理方法，其特征在于，所述对所述标准数据信息进行相似度计算和矩阵构建，得到对称节点相似矩阵，包括：

利用预设的节点相似模型计算所述标准数据信息中任意两个所述节点数据信息的相似度，得到节点相似信息；所述节点相似信息包括N2个相似度值；

根据所述标准数据信息中所述节点数据信息的位置顺序关系对所述节点相似信息进行数据编排，得到对称节点相似矩阵。

3.根据权利要求1所述的用于目标空间分群的数据处理方法，其特征在于，所述对所述对称节点相似矩阵进行分层抽样处理，得到目标偏向系数，包括：

根据所述对称节点相似矩阵，确定出样本空间信息；

4.根据权利要求3所述的用于目标空间分群的数据处理方法，其特征在于，所述对所述样本空间信息进行抽样处理，得到抽样结果信息，包括：

更新所述历史轮廓系数信息和所述抽样次数。

5.根据权利要求1所述的用于目标空间分群的数据处理方法，其特征在于，在所述对所述标准数据信息进行聚类处理，得到目标空间分群信息之后，所述方法还包括：

获取评价参考参数信息；

利用预设的评价模型对所述目标空间分群信息进行计算处理，得到第一评价参数信息；所述第一评价参数信息包括3个评价参数；

6.一种用于目标空间分群的数据处理装置，其特征在于，所述装置包括：

第二处理模块，用于对所述标准数据信息进行聚类处理，得到目标空间分群信息；所述目标空间分群信息包括若干个簇内信息；每个所述簇内信息包括若干个所述目标实体；任意两个所述簇内信息不包含相同的所述目标实体；

初始化所述第一归属度矩阵，得到第二归属度矩阵；

判断所述中心聚类值是否大于0，得到中心判断结果；

7.一种用于目标空间分群的数据处理装置，其特征在于，所述装置包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如权利要求1-5任一项所述的用于目标空间分群的数据处理方法。

8.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行如权利要求1-5任一项所述的用于目标空间分群的数据处理方法。