CN115033762A - 一种可编程控制器功能块智能聚类方法 - Google Patents

一种可编程控制器功能块智能聚类方法 Download PDF

Info

Publication number
CN115033762A
CN115033762A CN202210469738.7A CN202210469738A CN115033762A CN 115033762 A CN115033762 A CN 115033762A CN 202210469738 A CN202210469738 A CN 202210469738A CN 115033762 A CN115033762 A CN 115033762A
Authority
CN
China
Prior art keywords
clustering
model
vector
programmable controller
function block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210469738.7A
Other languages
English (en)
Inventor
邬惠峰
肖泽芸
孙丹枫
陈佰平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202210469738.7A priority Critical patent/CN115033762A/zh
Publication of CN115033762A publication Critical patent/CN115033762A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/05Programmable logic controllers, e.g. simulating logic interconnections of signals according to ladder diagrams or function charts
    • G05B19/056Programming the PLC
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/36Software reuse
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Programmable Controllers (AREA)

Abstract

本发明公开了一种可编程控制器功能块智能聚类方法,至少包括以下步骤:步骤S1:获取可编程逻辑控制器功能块的特征信息;步骤S2:将步骤S1的功能块特征信息输入预训练的功能块信息预处理模型,得到高维度的输出向量;步骤S3:将步骤S2输出的高维度向量输入预训练的功能块特征向量降维模型,输出该高维度向量的降维向量;步骤S4:将步骤S3输出的降维向量输入预训练的功能块聚类模型,得到聚类结果。相较于传统的人工分类方法,该方法大幅缩短了功能块划分的时间,提高了使用者获取所需功能块的准确性,节约了时间和人力成本。

Description

一种可编程控制器功能块智能聚类方法
技术领域
本申请涉及可编程逻辑控制器技术,尤其涉及一种可编程逻辑控制器功能块智能聚类的方法。
背景技术
在PLC编程领域5类编程语言中,以功能块为单位的功能模块图语言,表达直观,使用广泛。用户在使用功能块的过程中经常需要在大量的功能块中进行检索。传统的搜索功能块的方式是对功能块的某些特征进行简单排序,然而随着功能块数量的逐步增加,基于功能块特征的排序已经难以描述出功能块的功能特征及其相似性,使用者通过这种途径获取特定或者相关功能块的准确性和效率无法达到预期。
故,针对现有技术的缺陷,实有必要提出一种技术方案以解决现有技术存在的技术问题。
发明内容
针对现有技术存在的缺陷,本发明实施例提供一种可编程控制器功能块智能聚类方法,以提高用户对功能块的检索效率,辅助用户快速获取需要的特定功能块或是功能相近的一类功能块。
为了解决现有技术存在的技术问题,本发明的技术方案如下:
一种可编程控制器功能块智能聚类方法,所述方法至少包括以下步骤:
步骤S1:获取可编程逻辑控制器功能块的特征信息;
步骤S2:将步骤S1的功能块特征信息输入预训练的功能块信息预处理模型,得到高维度的输出向量;
步骤S3:将步骤S2输出的高维度向量输入预训练的功能块特征向量降维模型,输出该高维度向量的降维向量;
步骤S4:将步骤S3输出的降维向量输入预训练的功能块聚类模型,得到聚类结果,以快速的检索特定或者相似功能的功能块。
作为进一步的改进方案,步骤S2中,功能块信息预处理模型为基于神经网络模型训练的输入变量的向量化模型。
作为进一步的改进方案,步骤S1中,可编程逻辑控制器功能块的特征信息至少包括功能块的代码类型、基本描述、输入输出参数、引脚配置信息。
作为进一步的改进方案,步骤S4中,对降维向量进行预定义的线性变换,然后输入聚类模型中,输出聚类结果,该结果表示原功能块依据特征进行向量化处理后的聚类结果。
作为进一步的改进方案,功能块聚类模型为基于层次聚类模型训练的功能块特征聚类模型。
作为进一步的改进方案,步骤S2进一步包括如下步骤:
获取功能块的字符串特征;
对该字符串特征进行分词处理,得到由多个功能块特征组成的字符串组;
利用向量化模型对字符串组进行向量化,字符串组转化为高维度的向量并进行拼接,以输出功能块特征的完整向量表达。
作为进一步的改进方案,向量化模型的训练步骤如下:
采集各种类型已有标签的功能块关键特征,对特征进行整合,获得功能块特征语料库;
用该语料库对神经网络模型进行训练,训练后得到的神经网络模型作为向量化模型。
作为进一步的改进方案,步骤S3中,功能块特征向量降维模型采用自编码器模型。
作为进一步的改进方案,步骤S4中,功能块聚类模型选用DBSCAN聚类算法。
10.根据权利要求9所述的可编程控制器功能块智能聚类方法,其特征在于,聚类的过程采用调整兰德系数作为评价指标,并调整兰德系数取值范围为[-1,1],其中,
在数据集和聚类结果中被划分为同一类的对象数为a;
在数据集中划分为一类,但聚类结果中被划分为不同类的对象数为b;
在数据集中为不同类,但聚类结果中划分为同一类的对象数为c;
在数据集中不为同一类,在聚类结果中也不为同一类的对象数为d;
则有:
Figure BDA0003626030880000031
而对于调整兰德系数,其常数期望值的一般表达式为:
Figure BDA0003626030880000032
若令ni,j表示同时在数据集类别i和输出结果类别j中的数据对象数,则通过线性代换可得到:
Figure BDA0003626030880000033
作为进一步的改进方案,获取功能块信息预处理网络输出的功能块信息高维向量组,该向量组包含处理功能块多个特征得到的特征向量。
将所述功能块信息向量组输入预训练的功能块特征向量降维模型,输出向量组的降维结果,该结果作为描述功能块特征的低维向量表达。
与现有技术相比,本发明实施例提供一种进行可编程逻辑控制器功能块聚类的方法,该方法通过将可编程逻辑控制器功能块特征信息输入至预训练功能块信息预处理网络,得到每个功能块的特征向量,通过功能块信息降维网络得到更低维度的功能块特征向量,最后将低维度功能块特征向量输入聚类模型得到基于特征信息的功能块聚类结果,根据此结果可以快速的检索特定或者相似功能的功能块,相比于现有技术通过排序等方式检索功能块,本发明技术方案不易受到少数功能块特征的干扰,得到的结果更加准确。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他附图。
图1为本申请一实施例提供的可编程逻辑控制器功能块结构图;
图2为本申请一种可编程控制器功能块智能聚类方法的流程框图;
图3为本申请一实施例提供的功能块信息预处理网络架构图;
图4为本申请一实施例提供的功能块信息降维网络架构图;
图5为本申请一实施例提供的聚类模块架构图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,以下结合附图和实例对本发明进行详细说明:
本发明所要针对的聚类对象为可编程逻辑控制器功能块,如图1所示,其主要特征为多个字符串类型的数据。参见图2,所示为本申请一种可编程控制器功能块智能聚类方法的流程框图,该方法至少包括以下步骤:
步骤S1:获取可编程逻辑控制器功能块的特征信息;
步骤S2:将步骤S1的功能块特征信息输入预训练的功能块信息预处理模型,得到高维度的输出向量;
步骤S3:将步骤S2输出的高维度向量输入预训练的功能块特征向量降维模型,输出该高维度向量的降维向量;
步骤S4:将步骤S3输出的降维向量输入预训练的功能块聚类模型,得到聚类结果,以快速的检索特定或者相似功能的功能块。
如图2所示,本发明方法所建立的聚类模型主要由以下三部分组成:
功能块信息预处理模型的结构图如图3所示。信息预处理首先需要对功能块的字符串特征进行分词处理,得到由多个功能块特征组成的字符串组,而后对字符串组进行向量化。本发明中优选的处理方式为word2vec,由跳字模型和连续词袋模型组成,跳字模型用来通过词语预测上下文,而连续词袋模型通过输入的上下文预测中间的词,本发明利用从数据集中提取的语料库对word2vec进行训练,获得每一个词所对应的词向量,相对于传统的编码方式而言,word2vec可以用更低的维度对词语进行向量表达,可以减少运算耗时,提升整体处理效率。
功能块信息降维模型的结构如图4所示,输入数据为预处理网络得到的向量。输入数据首先进入神经元数为50,激活函数ReLU,一般表达式为:
f(x)=max(0,x)的全连接层进行处理,而后经过数个神经元数量递减的全连接层,得到神经元数量为5的中间层的输出,再将其输出结果输入数个神经元数量递增的全连接层,得到神经元数量为50的输出层的输出,若输入向量与输出向量相同或极为相似,则可以将中间层输出结果看作或近似看作输入30维向量的5维表示,随后输入到下一数据处理网络。功能块信息降维网络可以视为由编码器和解码器两个级联网络构成,编码器网络将输入a通过函数
Figure BDA0003626030880000061
转换为x,再将x通过解码器函数
Figure BDA0003626030880000062
转化成b,通过不断训练减小a、b的均方误差,提高降维网络的准确性。
功能块聚类模型结构如图5所示。在一种优选实施方式中,将处理功能块特征获得的3个5维向量拼接,获得15维的向量,将这15维向量作为功能块的15个数值特征输入到聚类模型中,针对于本发明的输入特征,实例选用DBSCAN聚类算法作为聚类模型。DBSCAN最主要的调试参数为扫描半径(eps)与最小包含点数(minpts)。DBSCAN算法首先会从输入的所有数据点中任取一个数据点p,如果对于参数eps和minpts,所选取的数据对象点p为核心点,则找出所有从p密度可达的数据对象点,形成一个簇,如果p为边缘点,则选取另外的输入点,重复这个过程直到所有点都完成聚类。
此聚类的过程采用调整兰德系数(ARI)作为评价指标。调整兰德系数假设随机模型为广义超几何分布,即随机选择数据集的划分,簇的数量是稳定的。调整兰德系数的数值与兰德系数(RI)有关。若记:
1)在数据集和聚类结果中被划分为同一类的对象数为a;
2)在数据集中划分为一类,但聚类结果中被划分为不同类的对象数为b;
3)在数据集中为不同类,但聚类结果中划分为同一类的对象数为c;
4)在数据集中不为同一类,在聚类结果中也不为同一类的对象数为d;则有
Figure BDA0003626030880000063
而对于调整兰德系数,其常数期望值的一般表达式为
Figure BDA0003626030880000071
若令ni,j表示同时在数据集类别i和输出结果类别j中的数据对象数,则通过线性代换可得到
Figure BDA0003626030880000072
调整兰德系数取值范围为[-1,1],通常值越大表示聚类效果越好。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种可编程控制器功能块智能聚类方法,其特征在于,所述方法至少包括以下步骤:
步骤S1:获取可编程逻辑控制器功能块的特征信息;
步骤S2:将步骤S1的功能块特征信息输入预训练的功能块信息预处理模型,得到高维度的输出向量;
步骤S3:将步骤S2输出的高维度向量输入预训练的功能块特征向量降维模型,输出该高维度向量的降维向量;
步骤S4:将步骤S3输出的降维向量输入预训练的功能块聚类模型,得到聚类结果,以快速的检索特定或者相似功能的功能块。
2.根据权利要求1所述的可编程控制器功能块智能聚类方法,其特征在于,步骤S1中,可编程逻辑控制器功能块的特征信息至少包括功能块的代码类型、基本描述、输入输出参数、引脚配置信息。
3.根据权利要求1所述的可编程控制器功能块智能聚类方法,其特征在于,步骤S2中,功能块信息预处理模型为基于神经网络模型训练的输入变量向量化模型。
4.根据权利要求1所述的可编程控制器功能块智能聚类方法,其特征在于,步骤S4中,对降维向量进行预定义的线性变换,然后输入聚类模型中,输出原功能块依据特征进行向量化处理后的聚类结果。
5.根据权利要求1所述的可编程控制器功能块智能聚类方法,其特征在于,所用聚类模型为基于密度聚类算法的功能块特征聚类模型。
6.根据权利要求1所述的可编程控制器功能块智能聚类方法,其特征在于,步骤S2进一步包括如下步骤:
获取功能块的字符串特征;
对该字符串特征进行分词处理,得到由多个功能块特征组成的字符串组;
利用向量化模型对字符串组进行向量化,字符串组转化为高维度的向量并进行拼接,以输出功能块特征的完整向量表达。
7.根据权利要求1所述的可编程控制器功能块智能聚类方法,其特征在于,向量化模型的训练步骤如下:
采集各种类型已有标签的功能块关键特征,对特征进行整合,获得功能块特征语料库;
用该语料库对神经网络模型进行训练,得到功能块特征向量化模型。
8.根据权利要求1所述的可编程控制器功能块智能聚类方法,其特征在于,步骤S3中,功能块特征向量降维模型采用自编码器神经网络模型。
9.根据权利要求1所述的可编程控制器功能块智能聚类方法,其特征在于,步骤S4中,功能块聚类模型选用DBSCAN聚类算法。
10.根据权利要求1所述的可编程控制器功能块智能聚类方法,其特征在于,聚类的过程采用调整兰德系数作为评价指标,调整兰德系数取值范围为[-1,1],其中,
在数据集和聚类结果中被划分为同一类的对象数为a;
在数据集中划分为一类,但聚类结果中被划分为不同类的对象数为b;
在数据集中为不同类,但聚类结果中划分为同一类的对象数为c;
在数据集中不为同一类,在聚类结果中也不为同一类的对象数为d;
则有:
Figure FDA0003626030870000021
而对于调整兰德系数,其常数期望值的一般表达式为:
Figure FDA0003626030870000031
若令ni,j表示同时在数据集类别i和输出结果类别j中的数据对象数,则通过线性代换可得到:
Figure FDA0003626030870000032
CN202210469738.7A 2022-04-30 2022-04-30 一种可编程控制器功能块智能聚类方法 Pending CN115033762A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210469738.7A CN115033762A (zh) 2022-04-30 2022-04-30 一种可编程控制器功能块智能聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210469738.7A CN115033762A (zh) 2022-04-30 2022-04-30 一种可编程控制器功能块智能聚类方法

Publications (1)

Publication Number Publication Date
CN115033762A true CN115033762A (zh) 2022-09-09

Family

ID=83118750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210469738.7A Pending CN115033762A (zh) 2022-04-30 2022-04-30 一种可编程控制器功能块智能聚类方法

Country Status (1)

Country Link
CN (1) CN115033762A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117033394A (zh) * 2023-10-08 2023-11-10 卓世科技(海南)有限公司 一种大语言模型驱动的向量数据库构建方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117033394A (zh) * 2023-10-08 2023-11-10 卓世科技(海南)有限公司 一种大语言模型驱动的向量数据库构建方法及系统
CN117033394B (zh) * 2023-10-08 2023-12-08 卓世科技(海南)有限公司 一种大语言模型驱动的向量数据库构建方法及系统

Similar Documents

Publication Publication Date Title
CN110442684B (zh) 一种基于文本内容的类案推荐方法
CN110059181A (zh) 面向大规模分类体系的短文本标签方法、系统、装置
CN112270345B (zh) 基于自监督字典学习的聚类算法
CN111368087B (zh) 基于多输入注意力网络的中文文本分类方法
CN113806494B (zh) 一种基于预训练语言模型的命名实体识别方法
CN112306494A (zh) 一种基于卷积和循环神经网络的代码分类及聚类方法
CN110297888A (zh) 一种基于前缀树与循环神经网络的领域分类方法
CN109933682B (zh) 一种基于语义与内容信息结合的图像哈希检索方法及系统
Wu et al. Optimized deep learning framework for water distribution data-driven modeling
CN113255366A (zh) 一种基于异构图神经网络的方面级文本情感分析方法
CN115033762A (zh) 一种可编程控制器功能块智能聚类方法
CN115292490A (zh) 一种用于政策解读语义的分析算法
CN111460097A (zh) 一种基于tpn的小样本文本分类方法
CN114880538A (zh) 基于自监督的属性图社团检测方法
CN113177113A (zh) 任务型对话模型预训练方法、装置、设备及存储介质
CN117349311A (zh) 一种基于改进RetNet的数据库自然语言查询方法
CN111460817A (zh) 一种刑事法律文书相关法条的推荐方法和系统
CN114969511A (zh) 基于分片的内容推荐方法、设备及介质
CN115455162A (zh) 层次胶囊与多视图信息融合的答案句子选择方法与装置
CN113642674A (zh) 一种基于图卷积神经网络的多轮对话分类方法
CN114898776A (zh) 一种多尺度特征联合多任务cnn决策树的语音情感识别方法
CN114064888A (zh) 一种基于bert-cnn的金融文本分类方法及系统
CN112784036A (zh) 基于无监督集成学习的抽取式文本摘要方法
CN114037051A (zh) 一种基于决策边界的深度学习模型压缩方法
CN112307288A (zh) 一种用于多渠道的用户聚类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination