CN115033762A

CN115033762A - 一种可编程控制器功能块智能聚类方法

Info

Publication number: CN115033762A
Application number: CN202210469738.7A
Authority: CN
Inventors: 邬惠峰; 肖泽芸; 孙丹枫; 陈佰平
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2022-04-30
Filing date: 2022-04-30
Publication date: 2022-09-09

Abstract

本发明公开了一种可编程控制器功能块智能聚类方法，至少包括以下步骤：步骤S1：获取可编程逻辑控制器功能块的特征信息；步骤S2：将步骤S1的功能块特征信息输入预训练的功能块信息预处理模型，得到高维度的输出向量；步骤S3：将步骤S2输出的高维度向量输入预训练的功能块特征向量降维模型，输出该高维度向量的降维向量；步骤S4：将步骤S3输出的降维向量输入预训练的功能块聚类模型，得到聚类结果。相较于传统的人工分类方法，该方法大幅缩短了功能块划分的时间，提高了使用者获取所需功能块的准确性，节约了时间和人力成本。

Description

一种可编程控制器功能块智能聚类方法

技术领域

本申请涉及可编程逻辑控制器技术，尤其涉及一种可编程逻辑控制器功能块智能聚类的方法。

背景技术

在PLC编程领域5类编程语言中，以功能块为单位的功能模块图语言，表达直观，使用广泛。用户在使用功能块的过程中经常需要在大量的功能块中进行检索。传统的搜索功能块的方式是对功能块的某些特征进行简单排序，然而随着功能块数量的逐步增加，基于功能块特征的排序已经难以描述出功能块的功能特征及其相似性，使用者通过这种途径获取特定或者相关功能块的准确性和效率无法达到预期。

故，针对现有技术的缺陷，实有必要提出一种技术方案以解决现有技术存在的技术问题。

发明内容

针对现有技术存在的缺陷，本发明实施例提供一种可编程控制器功能块智能聚类方法，以提高用户对功能块的检索效率，辅助用户快速获取需要的特定功能块或是功能相近的一类功能块。

为了解决现有技术存在的技术问题，本发明的技术方案如下：

一种可编程控制器功能块智能聚类方法，所述方法至少包括以下步骤：

步骤S1：获取可编程逻辑控制器功能块的特征信息；

步骤S2：将步骤S1的功能块特征信息输入预训练的功能块信息预处理模型，得到高维度的输出向量；

步骤S3：将步骤S2输出的高维度向量输入预训练的功能块特征向量降维模型，输出该高维度向量的降维向量；

步骤S4：将步骤S3输出的降维向量输入预训练的功能块聚类模型，得到聚类结果，以快速的检索特定或者相似功能的功能块。

作为进一步的改进方案，步骤S2中，功能块信息预处理模型为基于神经网络模型训练的输入变量的向量化模型。

作为进一步的改进方案，步骤S1中，可编程逻辑控制器功能块的特征信息至少包括功能块的代码类型、基本描述、输入输出参数、引脚配置信息。

作为进一步的改进方案，步骤S4中，对降维向量进行预定义的线性变换，然后输入聚类模型中，输出聚类结果，该结果表示原功能块依据特征进行向量化处理后的聚类结果。

作为进一步的改进方案，功能块聚类模型为基于层次聚类模型训练的功能块特征聚类模型。

作为进一步的改进方案，步骤S2进一步包括如下步骤：

获取功能块的字符串特征；

对该字符串特征进行分词处理，得到由多个功能块特征组成的字符串组；

利用向量化模型对字符串组进行向量化，字符串组转化为高维度的向量并进行拼接，以输出功能块特征的完整向量表达。

作为进一步的改进方案，向量化模型的训练步骤如下：

采集各种类型已有标签的功能块关键特征，对特征进行整合，获得功能块特征语料库；

用该语料库对神经网络模型进行训练，训练后得到的神经网络模型作为向量化模型。

作为进一步的改进方案，步骤S3中，功能块特征向量降维模型采用自编码器模型。

作为进一步的改进方案，步骤S4中，功能块聚类模型选用DBSCAN聚类算法。

10.根据权利要求9所述的可编程控制器功能块智能聚类方法，其特征在于，聚类的过程采用调整兰德系数作为评价指标，并调整兰德系数取值范围为[-1,1]，其中，

在数据集和聚类结果中被划分为同一类的对象数为a；

在数据集中划分为一类，但聚类结果中被划分为不同类的对象数为b；

在数据集中为不同类，但聚类结果中划分为同一类的对象数为c；

在数据集中不为同一类，在聚类结果中也不为同一类的对象数为d；

则有：

而对于调整兰德系数，其常数期望值的一般表达式为：

若令n_i,j表示同时在数据集类别i和输出结果类别j中的数据对象数，则通过线性代换可得到：

作为进一步的改进方案，获取功能块信息预处理网络输出的功能块信息高维向量组，该向量组包含处理功能块多个特征得到的特征向量。

将所述功能块信息向量组输入预训练的功能块特征向量降维模型，输出向量组的降维结果，该结果作为描述功能块特征的低维向量表达。

与现有技术相比，本发明实施例提供一种进行可编程逻辑控制器功能块聚类的方法，该方法通过将可编程逻辑控制器功能块特征信息输入至预训练功能块信息预处理网络，得到每个功能块的特征向量，通过功能块信息降维网络得到更低维度的功能块特征向量，最后将低维度功能块特征向量输入聚类模型得到基于特征信息的功能块聚类结果，根据此结果可以快速的检索特定或者相似功能的功能块，相比于现有技术通过排序等方式检索功能块，本发明技术方案不易受到少数功能块特征的干扰，得到的结果更加准确。

附图说明

为了更清楚地说明本申请或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他附图。

图1为本申请一实施例提供的可编程逻辑控制器功能块结构图；

图2为本申请一种可编程控制器功能块智能聚类方法的流程框图；

图3为本申请一实施例提供的功能块信息预处理网络架构图；

图4为本申请一实施例提供的功能块信息降维网络架构图；

图5为本申请一实施例提供的聚类模块架构图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，以下结合附图和实例对本发明进行详细说明：

本发明所要针对的聚类对象为可编程逻辑控制器功能块，如图1所示，其主要特征为多个字符串类型的数据。参见图2，所示为本申请一种可编程控制器功能块智能聚类方法的流程框图，该方法至少包括以下步骤：

步骤S1：获取可编程逻辑控制器功能块的特征信息；

如图2所示，本发明方法所建立的聚类模型主要由以下三部分组成：

功能块信息预处理模型的结构图如图3所示。信息预处理首先需要对功能块的字符串特征进行分词处理，得到由多个功能块特征组成的字符串组，而后对字符串组进行向量化。本发明中优选的处理方式为word2vec，由跳字模型和连续词袋模型组成，跳字模型用来通过词语预测上下文，而连续词袋模型通过输入的上下文预测中间的词，本发明利用从数据集中提取的语料库对word2vec进行训练，获得每一个词所对应的词向量，相对于传统的编码方式而言，word2vec可以用更低的维度对词语进行向量表达，可以减少运算耗时，提升整体处理效率。

功能块信息降维模型的结构如图4所示，输入数据为预处理网络得到的向量。输入数据首先进入神经元数为50，激活函数ReLU，一般表达式为：

f(x)＝max(0,x)的全连接层进行处理，而后经过数个神经元数量递减的全连接层，得到神经元数量为5的中间层的输出，再将其输出结果输入数个神经元数量递增的全连接层，得到神经元数量为50的输出层的输出，若输入向量与输出向量相同或极为相似，则可以将中间层输出结果看作或近似看作输入30维向量的5维表示，随后输入到下一数据处理网络。功能块信息降维网络可以视为由编码器和解码器两个级联网络构成，编码器网络将输入a通过函数

转换为x，再将x通过解码器函数

转化成b，通过不断训练减小a、b的均方误差，提高降维网络的准确性。

功能块聚类模型结构如图5所示。在一种优选实施方式中，将处理功能块特征获得的3个5维向量拼接，获得15维的向量，将这15维向量作为功能块的15个数值特征输入到聚类模型中，针对于本发明的输入特征，实例选用DBSCAN聚类算法作为聚类模型。DBSCAN最主要的调试参数为扫描半径(eps)与最小包含点数(minpts)。DBSCAN算法首先会从输入的所有数据点中任取一个数据点p，如果对于参数eps和minpts，所选取的数据对象点p为核心点，则找出所有从p密度可达的数据对象点，形成一个簇，如果p为边缘点，则选取另外的输入点，重复这个过程直到所有点都完成聚类。

此聚类的过程采用调整兰德系数(ARI)作为评价指标。调整兰德系数假设随机模型为广义超几何分布，即随机选择数据集的划分，簇的数量是稳定的。调整兰德系数的数值与兰德系数(RI)有关。若记：

1)在数据集和聚类结果中被划分为同一类的对象数为a；

2)在数据集中划分为一类，但聚类结果中被划分为不同类的对象数为b；

3)在数据集中为不同类，但聚类结果中划分为同一类的对象数为c；

4)在数据集中不为同一类，在聚类结果中也不为同一类的对象数为d；则有

而对于调整兰德系数，其常数期望值的一般表达式为

若令n_i,j表示同时在数据集类别i和输出结果类别j中的数据对象数，则通过线性代换可得到

调整兰德系数取值范围为[-1,1]，通常值越大表示聚类效果越好。

以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干改进和修饰，这些改进和修饰也落入本发明权利要求的保护范围内。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种可编程控制器功能块智能聚类方法，其特征在于，所述方法至少包括以下步骤：

步骤S1：获取可编程逻辑控制器功能块的特征信息；

2.根据权利要求1所述的可编程控制器功能块智能聚类方法，其特征在于，步骤S1中，可编程逻辑控制器功能块的特征信息至少包括功能块的代码类型、基本描述、输入输出参数、引脚配置信息。

3.根据权利要求1所述的可编程控制器功能块智能聚类方法，其特征在于，步骤S2中，功能块信息预处理模型为基于神经网络模型训练的输入变量向量化模型。

4.根据权利要求1所述的可编程控制器功能块智能聚类方法，其特征在于，步骤S4中，对降维向量进行预定义的线性变换，然后输入聚类模型中，输出原功能块依据特征进行向量化处理后的聚类结果。

5.根据权利要求1所述的可编程控制器功能块智能聚类方法，其特征在于，所用聚类模型为基于密度聚类算法的功能块特征聚类模型。

6.根据权利要求1所述的可编程控制器功能块智能聚类方法，其特征在于，步骤S2进一步包括如下步骤：

获取功能块的字符串特征；

7.根据权利要求1所述的可编程控制器功能块智能聚类方法，其特征在于，向量化模型的训练步骤如下：

用该语料库对神经网络模型进行训练，得到功能块特征向量化模型。

8.根据权利要求1所述的可编程控制器功能块智能聚类方法，其特征在于，步骤S3中，功能块特征向量降维模型采用自编码器神经网络模型。

9.根据权利要求1所述的可编程控制器功能块智能聚类方法，其特征在于，步骤S4中，功能块聚类模型选用DBSCAN聚类算法。

10.根据权利要求1所述的可编程控制器功能块智能聚类方法，其特征在于，聚类的过程采用调整兰德系数作为评价指标，调整兰德系数取值范围为[-1,1]，其中，

在数据集和聚类结果中被划分为同一类的对象数为a；

则有：

而对于调整兰德系数，其常数期望值的一般表达式为：