CN107437089A

CN107437089A - 一种多传感器目标识别属性约简方法及装置

Info

Publication number: CN107437089A
Application number: CN201610365637.XA
Authority: CN
Inventors: 陈迎春; 段晓菡; 李鸥; 赵世斌; 孙昱; 童珉; 冉晓旻; 张静; 莫有权; 董芳
Original assignee: PLA Information Engineering University
Current assignee: PLA Information Engineering University
Priority date: 2016-05-27
Filing date: 2016-05-27
Publication date: 2017-12-05

Abstract

本申请提供了一种多传感器目标识别属性约简方法及装置，对传感器数据进行预处理，获得多个目标属性数据；针对每个目标属性数据，基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与目标属性数据对应的目标聚类数量，将与目标聚类数量对应的聚类结果进行数据模糊处理；利用粗糙集算法对模糊处理结果进行属性约简，获得属性约简结果。本申请充分考虑传感器数据具有同种类目标同属性数据差异较小，异种类目标同属性数据差异较大的特性，采用Kmeans聚类方法进行聚类，并对聚类结果进行数据模糊，将连续的数据离散化，弥补了粗糙集在属性约简上的局限性，并且提升了基于模糊粗糙集进行目标识别的辨识率。

Description

一种多传感器目标识别属性约简方法及装置

技术领域

本发明涉及目标识别技术领域，尤其涉及一种多传感器目标识别属性约简方法及装置。

背景技术

粗糙集是一种研究不精确、不确定性知识的数学工具。该理论已经在数据挖掘、机器学习、过程控制、决策分析和模式识别等领域得到了广泛的应用，并取得了良好的效果。属性约简是粗糙集理论中的一个重要课题，其是在保持分类能力不变的前提下，通过对知识的化简导出问题的决策或分类规则，它的意义在于可以删除冗余信息。

多传感器应用在目标识别领域是现阶段知识发现的热门问题。传感器能够提供多样、多维度、实时的大量数据作为数据基础进行目标识别，但是随之而来的是高维度数据的处理问题。

在利用多传感器的数据之前，属性约简是一个必要的工作，删除冗余属性可以提高目标识别时的计算效率。但是传感器数据的多样、多维度的特性以及数据的非线性，使得传统的属性约简算法无法很好地运作。而粗糙集理论可以很好地处理这类不规则的数据，但是，传感器数据的数据特性以及粗糙集的自身特性限制粗糙集在传感器数据上的应用广度。

发明内容

有鉴于此，本发明提供了一种多传感器目标识别属性约简方法及装置，用以解决传感器数据的数据特性以及粗糙集的自身特性限制粗糙集在传感器数据上的应用广度的技术问题，其技术方案如下：

一种多传感器目标识别属性约简方法，所述方法包括：

对传感器采集的数据进行预处理，获得多个目标属性数据，所述预处理用于将所述传感器采集的数据处理成预设格式的可读数据；

针对所述多个目标属性数据中的每个目标属性数据，基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与所述目标属性数据对应的目标聚类数量，并将与所述目标聚类数量对应的聚类结果进行数据模糊处理，获得与所述目标属性数据对应的模糊处理结果；

利用粗糙集算法对与各个目标属性数据对应的模糊处理结果进行属性约简，获得属性约简结果。

其中，所述基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与所述目标属性数据对应的目标聚类数量，包括：

利用Kmeans聚类方法对所述目标属性数据进行多次聚类，并在每次聚类后基于聚类结果计算类簇指标，所述多次聚类依次进行，且所述多次聚类中的首次聚类的聚类数量为所述预先设定的目标识别的类别数量参数，其它次聚类的聚类数量均在前一次聚类数量的基础上递减1，所述多次聚类中最后一次聚类的聚类数量为1；

通过每次聚类的聚类数量，以及与各个聚类数量对应的类簇指标绘制类簇指标曲线，并基于所述类簇指标曲线中的拐点从多个聚类数量中确定出所述目标聚类数量。

其中，所述将与所述目标聚类数量对应的聚类结果进行数据模糊处理，具体为：

将与所述目标聚类数量对应的聚类结果中的各个类簇的值用对应类簇的中心值替代。

其中，所述基于聚类结果计算类簇指标，具体为：

计算所述聚类结果中每个类簇的平均质心距离，并基于所述每个类簇的平均质心距离以及为每个类簇设置的加权值计算所述聚类结果中所有类簇的平均质心距离的加权平均值作为所述类簇指标。

其中，所述利用粗糙集对与各个目标属性数据对应的模糊处理结果进行属性约简，获得属性约简结果，包括：

基于所述模糊处理结果利用相对正域求出相容与不相容信息系统的核，并基于所述相容与不相容信息系统的核求得属性约简集。

一种多传感器目标识别属性约简装置，所述装置包括：预处理模块、数据模糊模块和属性约简模块；

所述预处理模块，用于对传感器采集的数据进行预处理，获得多个目标属性数据，所述预处理用于将所述传感器采集的数据处理成预设格式的可读数据；

所述数据模糊模块，用于针对所述预处理模块处理得到的所述多个目标属性数据中的每个目标属性数据，基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与所述目标属性数据对应的目标聚类数量，并将与所述目标聚类数量对应的聚类结果进行数据模糊处理，获得与所述目标属性数据对应的模糊处理结果；

所述属性约简模块，用于利用粗糙集算法对所述数据模糊模块处理得到的、与各个目标属性数据对应的模糊处理结果进行属性约简，获得属性约简结果。

其中，所述数据模糊模块包括：聚类子模块、计算子模块、曲线绘制子模块和确定子模块；

所述聚类子模块，用于利用Kmeans聚类方法对所述目标属性数据进行多次聚类，其中，所述多次聚类依次进行，所述多次聚类中的首次聚类的聚类数量为所述预先设定的目标识别的类别数量参数，其它次聚类的聚类数量均在前一次聚类数量的基础上递减1，所述多次聚类中最后一次聚类的聚类数量为1；

所述计算子模块，用于在所述聚类子模块每次对所述目标属性数据进行聚类后，基于聚类结果计算类簇指标；

所述曲线绘制子模块，用于通过每次聚类的聚类数量，以及所述计算子模块计算出的、与各个聚类数量对应的类簇指标绘制类簇指标曲线；

所述确定子模块，用于基于所述曲线绘制子模块绘制出的所述类簇指标曲线中的拐点从多个聚类数量中确定出所述目标聚类数量。

其中，所述模糊处理模块，具体用于将与所述目标聚类数量对应的聚类结果中的各个类簇的值用对应类簇的中心值替代。

其中，所述基于聚类结果计算类簇指标，具体为：

其中，所述属性约简模块包括：属性核计算子模块和属性约简子模块；

所述属性核计算子模块，用于基于所述模糊处理模块的模糊处理结果利用相对正域求出相容与不相容信息系统的核；

所述属性约简子模块，用于基于所述属性核计算子模块计算得到的所述相容与不相容信息系统的核求得属性约简集。

上述技术方案具有如下有益效果：

本发明提供的多传感器目标识别属性约简方法及装置，可针对传感器的多个目标属性的数据中的每个目标属性数据，基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与目标属性数据对应的目标聚类数量，并将与目标聚类数量对应的聚类结果进行数据模糊处理，然后利用粗糙集算法对与各个目标属性数据对应的模糊处理结果进行属性约简，获得属性约简结果。本发明提供的多传感器目标识别属性约简方法及装置，充分考虑多传感器识别目标所采集到的数据通常具有同种类目标同属性数据差异较小，异种类目标同属性数据差异一般较大的特点，采用Kmeans聚类方法对数据进行聚类，并在聚类后对聚类结果进行数据模糊，将连续的数据离散化，即通过聚类和模糊处理弥补了粗糙集在属性约简上的局限性，并且，提升了基于模糊粗糙集进行目标识别的辨识率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的多传感器目标识别属性约简方法的流程示意图；

图2为本发明实施例提供的多传感器目标识别属性约简方法中，基于预先设定的目标识别的类别数量参数，使用预设聚类方法按预设规则确定与目标属性数据对应的目标聚类数量的实现过程的流程示意图；

图3为本发明实施例提供的基于预先设定的目标识别的类别数量参数，使用预设聚类方法按预设规则确定与目标属性数据对应的目标聚类数量的一具体实现过程的流程示意图；

图4为本发明实施例提供的多传感器目标识别属性约简装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种多传感器目标识别属性约简方法，请参阅图1，示出了本发明实施例提供的方法的流程示意图，该方法可以包括：

步骤S101：对传感器采集的数据进行预处理，获得多个目标属性数据。

其中，预处理用于将传感器采集的数据处理成预设格式的可读数据。

需要说明的是，传感器采集的数据可能存在单位差异、值缺失等问题，因此，为了获得统一、规范的数据，需将传感器采集的数据处理成规范格式的可读数据，以便进行后续的处理。

步骤S102：针对多个目标属性数据中的每个目标属性数据，基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与目标属性数据对应的目标聚类数量，并将与目标聚类数量对应的聚类结果进行数据模糊处理，获得与目标属性数据对应的模糊处理结果。

本实施例对各个目标属性数据都进行上述的聚类、确定目标聚类数量、对与目标聚类数量对应的聚类结果进行模糊处理这些操作。即，经过上述处理过程，对于每个目标属性数据均获得了对应的模糊处理结果。

步骤S103：利用粗糙集算法对与各个目标属性数据对应的模糊处理结果进行属性约简，获得属性约简结果。

考虑到粗糙集的离散特性使其无法很好的应用到连续的传感器数据上，本发明实施例提供的多传感器目标识别属性约简方法，充分考虑多传感器识别目标所采集到的数据通常具有同种类目标同属性数据差异一般较小，异种类目标同属性数据差异一般较大的特点，采用Kmeans聚类方法对数据进行聚类，并在聚类后对聚类结果进行数据模糊，将连续的数据离散化，即通过聚类和模糊处理弥补了粗糙集在属性约简上的局限性，并且提升了基于模糊粗糙集来有效地对目标识别的辨识率。

请参阅图2，示出上述实施例中，基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与目标属性数据对应的目标聚类数量的实现过程的流程示意图，该实现过程可以包括：

步骤S201：利用Kmeans聚类方法对目标属性数据进行多次聚类，并在每次聚类后基于聚类结果计算类簇指标。

其中，多次聚类依次进行，多次聚类中的首次聚类的聚类数量为预先设定的目标识别的类别数量参数，其它次聚类的聚类数量均在前一次聚类数量的基础上递减1，多次聚类中最后一次聚类的聚类数量为1。

在本实施例中，基于聚类结果计算类簇指标，具体为：计算聚类结果中每个类簇的平均质心距离，并基于每个类簇的平均质心距离以及为每个类簇设置的加权值计算聚类结果中所有类簇的平均质心距离的加权平均值作为类簇指标。

进一步的，可通过计算类簇指标，其中，k为类簇的数量，q_i为类簇i的权重，n_i为类簇i的数量，d()为求距离函数，d_ij为第i个类簇中第j个点的位置，core_i为类簇i的核心位置。

步骤S202：通过每次聚类的聚类数量，以及与各个聚类数量对应的类簇指标绘制类簇指标曲线。

步骤S203：基于类簇指标曲线中的拐点从多个聚类数量中确定出目标聚类数量。

示例性的，对目标属性数据进行聚类所使用的聚类数量分别为k₅、k₄、k₃、k₂和k₁，在使用Kmeans聚类方法和聚类数量k₅进行聚类时，可基于聚类结果计算得到类簇指标a₅，在使用Kmeans聚类方法和聚类数量k₄进行聚类时，可基于聚类结果计算得到类簇指标a₄，以此类推，可获得与聚类数量k₃对应的类簇指标a₃、与聚类数量k₂对应的类簇指标a₂以及与聚类数量k₁对应的类簇指标a₁。

在获得与各个聚类数量对应的类簇指标之后，以聚类数量作为横坐标、类簇指标作为纵坐标绘制曲线，然后确定曲线的拐点，将与曲线中的拐点最近的聚类数量确定为目标聚类数量，假设与曲线中的拐点最近的聚类数量为k₄，则k₄即为目标聚类数量。

请参阅图3，示出了上述基于预先设定的目标识别的类别数量参数，使用预设聚类方法按预设规则确定与目标属性数据对应的目标聚类数量的一具体实例的流程示意图，可以包括：

步骤S301：基于聚类数量K利用Kmeans聚类方法对目标属性数据进行聚类，获得K个类簇。

需要说明的是，首次利用Kmeans聚类方法对目标属性数据进行聚类的聚类数量为预先设定的目标识别的类别数量参数。

步骤S302：通过K个类簇计算与聚类数量K对应的类簇指标。

步骤S303：判断聚类数量K是否大于1，如果是，则将K-1赋值给K，然后转入步骤S301，如果否，则执行步骤S304。

步骤S304：基于聚类数量和与各个聚类数量对应的类簇指标绘制类簇指标曲线。

步骤S305：基于类簇指标曲线中的拐点确定从多个聚类数量中确定出目标聚类数量。

在确定出目标聚类数量之后，为了将目标属性数据处理成可利用粗糙集处理的数据，本发明实施例对与目标聚类数量对应的聚类结果进行数据模糊处理，将连续的数据离散化。

则，将与目标聚类数量对应的聚类结果进行数据模糊处理获得离散化数据的过程具体为：将与目标聚类数量对应的聚类结果中的各个类簇的值用对应类簇的中心值替代。经过模糊处理，一个类簇可通过一个数值标识。

在对于目标聚类数量对应的聚类结果进行数据模糊处理后，基于与各个目标属性数据对应的模糊处理结果利用相对正域求出相容与不相容信息系统的核，并基于相容与不相容信息系统的核求得属性约简集。

与上述方法相对应，本发明实施例还提供了一种多传感器目标识别属性约简装置，请参阅图4，示出了该装置的结构示意图，该装置可以包括：预处理模块401、数据模糊模块402和属性约简模块403。其中：

预处理模块401，用于对传感器采集的数据进行预处理，获得多个目标属性数据。

数据模糊模块402，用于针对预处理模块401处理得到的多个目标属性数据中的每个目标属性数据，基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与目标属性数据对应的目标聚类数量，并将与目标聚类数量对应的聚类结果进行数据模糊处理，获得与目标属性数据对应的模糊处理结果。

属性约简模块403，用于利用粗糙集算法对数据模糊模块402处理得到的、与各个目标属性数据对应的模糊处理结果进行属性约简，获得属性约简结果。

本发明实施例提供的多传感器目标识别属性约简装置，充分考虑多传感器识别目标所采集到的数据通常具有同种类目标同属性数据差异一般较小，异种类目标同属性数据差异一般较大的特点，采用Kmeans聚类方法对数据进行聚类，并在聚类后对聚类结果进行数据模糊，将连续的数据离散化，即通过聚类和模糊处理弥补了粗糙集在属性约简上的局限性，并且提升了基于模糊粗糙集来有效地对目标识别的辨识率。

上述实施例提供的多传感器目标识别属性约简装置中，数据模糊模块402进一步包括：聚类子模块、计算子模块、曲线绘制子模块和确定子模块。

聚类子模块，用于利用Kmeans聚类方法对目标属性数据进行多次聚类。

计算子模块，用于在聚类子模块每次对目标属性数据进行聚类后，基于聚类结果计算类簇指标。

进一步的，计算子模块，具体用于计算所述聚类结果中每个类簇的平均质心距离，并基于每个类簇的平均质心距离以及为每个类簇设置的加权值计算聚类结果中所有类簇的平均质心距离的加权平均值作为类簇指标。

曲线绘制子模块，用于通过每次聚类的聚类数量，以及计算子模块计算出的、与各个聚类数量对应的类簇指标绘制类簇指标曲线。

确定子模块，用于基于曲线绘制子模块绘制出的类簇指标曲线中的拐点从多个聚类数量中确定出目标聚类数量。

上述实施例提供的多传感器目标识别属性约简装置中，模糊处理模块402，具体用于将与目标聚类数量对应的聚类结果中的各个类簇的值用对应类簇的中心值替代。

上述实施例提供的多传感器目标识别属性约简装置中，属性约简模块可以包括：属性核计算子模块和属性约简子模块。其中：

属性核计算子模块，用于基于模糊处理模块的模糊处理结果利用相对正域求出相容与不相容信息系统的核。

属性约简子模块，用于基于属性核计算子模块计算得到的相容与不相容信息系统的核求得属性约简集。

本发明实施例提供的多传感器目标识别属性约简方法及装置，可针对传感器的多个目标属性的数据的每个目标属性数据，基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与目标属性数据对应的目标聚类数量，并将与目标聚类数量对应的聚类结果进行数据模糊处理，然后利用粗糙集算法对与各个目标属性数据对应的模糊处理结果进行属性约简，获得属性约简结果。本发明提供的多传感器目标识别属性约简方法及装置，充分考虑多传感器识别目标所采集到的数据通常具有同种类目标同属性数据差异一般较小，异种类目标同属性数据差异一般较大的特点，采用Kmeans聚类方法对数据进行聚类，并在聚类后对聚类结果进行数据模糊，将连续的数据离散化，即通过聚类和模糊处理弥补了粗糙集在属性约简上的局限性，并且提升了基于模糊粗糙集进行目标识别的辨识率。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法、装置和设备，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个装置，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种多传感器目标识别属性约简方法，其特征在于，所述方法包括：

针对所述多个目标属性数据中的每个目标属性数据均执行：基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与所述目标属性数据对应的目标聚类数量，并将与所述目标聚类数量对应的聚类结果进行数据模糊处理，获得与所述目标属性数据对应的模糊处理结果；

2.根据权利要求1所述的方法，其特征在于，所述基于预先设定的目标识别的类别数量参数，使用Kmeans聚类方法按预设规则确定与所述目标属性数据对应的目标聚类数量，包括：

利用Kmeans聚类方法对所述目标属性数据进行多次聚类，并在每次聚类后基于聚类结果计算类簇指标，其中，所述多次聚类依次进行，且所述多次聚类中的首次聚类的聚类数量为所述预先设定的目标识别的类别数量参数，其它次聚类的聚类数量均在前一次聚类数量的基础上递减1，所述多次聚类中最后一次聚类的聚类数量为1；

3.根据权利要求1或2所述的方法，其特征在于，所述将与所述目标聚类数量对应的聚类结果进行数据模糊处理，具体为：

4.根据权利要求1或2所述的方法，其特征在于，所述基于聚类结果计算类簇指标，具体为：

5.根据权利要求1或2所述方法，其特征在于，所述利用粗糙集对与各个目标属性数据对应的模糊处理结果进行属性约简，获得属性约简结果，包括：

6.一种多传感器目标识别属性约简装置，其特征在于，所述装置包括：预处理模块、数据模糊模块和属性约简模块；

7.根据权利要求6所述的装置，其特征在于，所述数据模糊模块包括：聚类子模块、计算子模块、曲线绘制子模块和确定子模块；

8.根据权利要求6或7所述的装置，其特征在于，所述模糊处理模块，具体用于将与所述目标聚类数量对应的聚类结果中的各个类簇的值用对应类簇的中心值替代。

9.根据权利要求6或7所述的装置，其特征在于，所述基于聚类结果计算类簇指标，具体为：

10.根据权利要求6或7所述装置，其特征在于，所述属性约简模块包括：属性核计算子模块和属性约简子模块；