CN110175645B

CN110175645B - 一种确定保护装置型号的方法及计算装置

Info

Publication number: CN110175645B
Application number: CN201910446163.5A
Authority: CN
Inventors: 巫聪云; 刘斌; 蒙亮; 李海勇; 杨彥; 田君杨; 黄超; 杜杨华; 陈志�; 韩冰; 覃丙川; 秦蓓; 何洪; 孙翔; 曾剑锋; 卢德宏; 于彬; 汤小兵; 张坎; 俞小俊
Original assignee: Nanjing Sp Nice Technology Development Co ltd; Guangxi Power Grid Co Ltd
Current assignee: Nanjing Sp Nice Technology Development Co ltd; Guangxi Power Grid Co Ltd
Priority date: 2019-05-27
Filing date: 2019-05-27
Publication date: 2022-06-03
Anticipated expiration: 2039-05-27
Also published as: CN110175645A

Abstract

本发明实施例公开了一种确定保护装置型号的方法及计算装置，用于实现保护信息模型判断保护装置型号的功能。本发明实施例方法包括：获取保护装置信息和保护装置信息模型；所述保护装置信息进行向量化，得到词向量；对所述保护装置信息模型进行向量化，得到类图像数据；根据所述类图像数据，构建卷积网络；使用所述词向量，对所述卷积网络进行训练，得到保护装置型号分类器。

Description

一种确定保护装置型号的方法及计算装置

技术领域

本发明涉及计算机领域，尤其涉及一种确定保护装置型号的方法及计算装置、可读存储介质。

背景技术

由于缺少相关行业规范，电力系统保护装置信息模型并不统一，尤其是目前已经大量投入运行的传统保护装置，不同厂家、不同型号和版本的信息点表差异较大。保信系统中，保信子站负责采集保护装置的配置信息，这些保护装置的配置信息由子站来完成，并在上级控制系统接入子站时，将本站所有配置信息上传到上级系统中，因此子站是否正确配置了装置的模型，对于上级控制系统进一步利用这些信息进行故障判断、事故分析起到至关重要的作用。

因此，在子站投运前的验收过程中，验证子站是否配置了正确的保护装置信息模型，以及子站配置的保护装置型号是否正确，是一项重要的验收工作。但考虑到不同地区、不同变电站实施要求及不同电压等级，使得保护装置的信息模型可能并不统一，所以采用简单的匹配方式来实施校验的结果不够准确。

发明内容

本发明实施例提供了一种确定保护装置型号的方法及计算装置、可读存储介质,用于实现保护信息模型判断保护装置型号的功能。

有鉴于此，本发明第一方面提供一种确定保护装置型号的方法，可以包括：

获取保护装置信息和保护装置信息模型；

对所述保护装置信息进行向量化，得到词向量；

对所述保护装置信息模型进行向量化，得到类图像数据；

根据所述类图像数据，构建卷积网络；

使用所述词向量，对所述卷积网络进行训练，得到保护装置型号分类器。

可选的，在本发明的一些实施例中，所述对所述保护装置信息进行向量化，得到词向量，包括：

对所述保护装置信息进行分词，形成逻辑文档；

对所述逻辑文档进行训练，得到词向量。

可选的，在本发明的一些实施例中，所述对所述保护装置信息模型进行向量化，得到类图像数据，包括：

对所述保护装置信息模型进行分区和分通道的方式，连接成类图像数据。

可选的，在本发明的一些实施例中，所述对所述保护装置信息模型进行分区和分通道的方式，连接成类图像数据，包括：

对所述保护装置信息模型进行分区，得到至少一个区域，其中，每个区域包含一种类型的信息；

对所述保护装置信息模型建立4个通道，所述4个通道对应不同分词向量；

根据所述至少一个区域和所述4个通道，得到类图像数据。

可选的，在本发明的一些实施例中，所述卷积网络包括输入层、输出层、卷积层、池化层、全连接层；

其中，所述输入层为4个100*100的通道；

所述卷积层采用4个5*5卷积核，步长值为5，无填充；

所述池化层采用2*2最大池化；

所述全连接层使用softmax分类器得到各个分类的概率。

本发明第二方面提供一种计算装置，可以包括：

获取模块，用于获取保护装置信息和保护装置信息模型；

处理模块，用于对所述保护装置信息进行向量化，得到词向量；对所述保护装置信息模型进行向量化，得到类图像数据；根据所述类图像数据，构建卷积网络；使用所述词向量，对所述卷积网络进行训练，得到保护装置型号分类器。

可选的，在本发明的一些实施例中，

所述处理模块，具体用于对所述保护装置信息进行分词，形成逻辑文档；对所述逻辑文档进行训练，得到词向量。

可选的，在本发明的一些实施例中，

所述处理模块，具体用于对所述保护装置信息模型进行分区和分通道的方式，连接成类图像数据。

可选的，在本发明的一些实施例中，

所述处理模块，具体用于对所述保护装置信息模型进行分区，得到至少一个区域，其中，每个区域包含一种类型的信息；对所述保护装置信息模型建立4个通道，所述4个通道对应不同分词向量；根据所述至少一个区域和所述4个通道，得到类图像数据。

其中，所述输入层为4个100*100的通道；

所述卷积层采用4个5*5卷积核，步长值为5，无填充；

所述池化层采用2*2最大池化；

所述全连接层使用softmax分类器得到各个分类的概率。

本发明第三方面提供一种计算装置，可以包括：

收发器，处理器，存储器，其中，所述收发器，所述处理器和所述存储器通过总线连接；

所述存储器，用于存储操作指令；

所述收发器，用于获取保护装置信息和保护装置信息模型；

所述处理器，用于调用所述操作指令，执行如本发明第一方面及第一方面任一可选方式中所述的确定保护装置型号的方法的步骤。

本发明第四方面提供了一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如本发明第一方面及第一方面任一可选方式中所述的确定保护装置型号的方法的步骤。

从以上技术方案可以看出，本发明实施例具有以下优点：

在本发明实施例中，获取保护装置信息和保护装置信息模型；对所述保护装置信息进行向量化，得到词向量；对所述保护装置信息模型进行向量化，得到类图像数据；根据所述类图像数据，构建卷积网络；使用所述词向量，对所述卷积网络进行训练，得到保护装置型号分类器。即达到对已有保护装置信息模型进行正确分类，并使该神经网络结构有泛化能力。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，还可以根据这些附图获得其它的附图。

图1为本发明实施例中转换算法的一个示意图；

图2为本发明实施例中卷积神经网络的一个示意图；

图3为本发明实施例中确定保护装置型号的方法的实施例示意图；

图4为本发明实施例中计算装置的一个实施例示意图；

图5为本发明实施例中计算装置的一个实施例示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，都应当属于本发明保护的范围。

在本发明实施例中，采用一种确定保护装置型号的方法，来验证保护装置信息模型的内容和保护装置型号是否匹配，以便对子站配置信息进行校验，作为子站验收是否通过的技术指标之一。

为了提高校验的准确程度，同时减少人工检查的工作量，可以考虑在收集的大量保护装置模型数据的基础上，采用卷积神经网络人工智能方法完成上面的工作。卷积神经网络(CNN或ConvNet)是目前最流行的深度学习算法之一，该算法的模型可以直接从图像、视频、文本或声音中学习执行分类任务。卷积神经网络尤其善于发现数据中的模式，直接从数据中学习，并使用模式对数据进行分类，无需手动进行特征提取。

由于卷积神经网络一般应用于计算机视觉领域做图像分类、检测之类的任务，应用于保护装置模型的识别时，需要对保护装置模型数据做相应的处理，因为图像、声音类的数据天然具有稠密性，而保护装置模型的词语属于离散数据。因此需要设计一种将保护装置模型数据转换成卷积神经网络可以处理的类似图像的低维、稠密数据。

需要说明的是,在自然语言理解领域，将离散数据转换为稠密数据的方法主要是采用“词向量”的方法，算法种类较多。这里采用效果较好的word2vec方法，其原理是将词语One-Hot模型转换为词嵌入模型，转换算法也采用神经网络的训练方法：采用只有一个隐层的全连接神经网络,用来预测给定词语与相关联词语的关联度的大小，如图1所示。

此外，对在保护装置信息中出现的专用词汇，可以采用TF-IDF来评估其重要程度。TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与文本挖掘的常用加权技术。TF-IDF是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。词语的重要程度的计算方法为：

一个词语普遍重要性的度量即词语的IDF，可以由总文件数目除以包含该词语之文件的数目，再将得到的商取对数得到：

卷积神经网络是一种前馈神经网络，通过将神经元设置为响应一部分覆盖范围的局部单元的方式，在处理大型图像时能产生比较好的效果。卷积神经网络由一个或多个卷积层、关联权重和池化层(pooling layer)和顶端的全连通层组成。如图2所示，为卷积神经网络的一个示意图。这一结构使得卷积神经网络能够利用输入数据的二维结构，可以使用反向传播算法进行训练。

因此，要想使用卷积网络的优势，需要构建适于卷积网络的图形数据，并按照数据的特征对卷积网络的结构进行适应性调整，以达到对已有保护装置信息模型进行正确分类，并使该神经网络结构有泛化能力。

下面以实施例的方式，对本发明技术方案做进一步的说明，如图3所示，为本发明实施例中确定保护装置型号的方法的实施例示意图，可以包括：

301、获取保护装置信息和保护装置信息模型。

计算装置获取保护装置信息和保护装置信息模型。

其中，保护装置信息模型的构成主要包括事件、告警信息，定值及软压板参数信息，实时的模拟量和开关量信息，这些信息都由信息点的名称来标识。因此，计算装置需要对信息名称字符串进行向量化。

302、对所述保护装置信息进行向量化，得到词向量。

所述对所述保护装置信息进行向量化，得到词向量，包括：对所述保护装置信息进行分词，形成逻辑文档；对所述逻辑文档进行训练，得到词向量。

需要说明的是，对所有的信息串，即保护装置信息使用保护装置信息模型专用词典进行分词，每条信息为一行，每类信息形成一个逻辑文档，将全部保护装置信息样本全部处理为这样的逻辑文档。根据信息平均分词数量和分词总数量的情况，示例性的，设置词频门槛值为1000，高频词汇的随机降采样的阈值为0.001,上文关联度为前后2个词，生成词向量维度为50,使用word2vec算法以逻辑文档为原始数据进行训练，并得到收敛后的词向量。

同时，将上述逻辑文档经过tf-idf算法计算出词的词频-逆文本频率，作为词语选择的权重值。

303、对所述保护装置信息模型进行向量化，得到类图像数据。

计算装置对所述保护装置信息模型进行向量化，得到类图像数据，包括：计算装置对所述保护装置信息模型进行分区和分通道的方式，连接成类图像数据。

进一步的，所述计算装置对所述保护装置信息模型进行分区和分通道的方式，连接成类图像数据，包括：计算装置对所述保护装置信息模型进行分区，得到至少一个区域，其中，每个区域包含一种类型的信息；计算装置对所述保护装置信息模型建立4个通道，所述4个通道对应不同分词向量；计算装置根据所述至少一个区域和所述4个通道，得到类图像数据。

需要说明的是，在装置信息向量化的基础上，对保护装置信息模型进行向量化，向量化的方法是将保护装置模型转换成类似图片的数据，以便采用卷积神经网络进行计算。

示例性的，为了提高模型的分类辨识度，在构建图形数据时，采用将图片进行分区和分通道的方式，将数据按照特定的方式连接成类图像数据，数据矩阵维度为：100*100*4。

将100*100的矩阵进行分区，使每个区域只包含一种类型的信息，分别为定值及软压板信息区、事件信息区、故障量信息区、告警信息区和保护模拟量及开关量信息区，分布如下表1所示：

表1

同时，建立4个通道，对应信息中不同分词向量。具体步骤如下所示：

(a)对每一类型t的信息按照给定的信息区大小s进行以下的转换和筛选处理；

(b)将类型为t，序号为i的保护装置信息进行分词处理，计算分词的TF-IDF权重值，并使用训练好的分词向量模型将其转换为一组向量：

(w[1],w[2],…,w[n])及权重值(v[1],v[2],…,v[n])；

(c)对向量进行排序，排序方式为依据该分词的TF-IDF值由大到小排列，选取前4个分词向量，舍弃多余向量，如果不足4个分词向量，用0向量填充，得到：

W^T＝(w[a],w[b],w[c],w[d])及V^T＝(v[a],v[b],v[c],v[d])；

(d)重复(b)到(c)直到计算全部类型t中的信息；

(e)如果信息条数大于信息区大小s，则舍弃组合权值最小的信息，组合权值的计算公式为：

Vc＝(0.5,0.3,0.1,0.1)V^T；

(f)重复(a)到(e)的过程，处理全部保护装置信息类型；

(g)将预处理的每条数据，依照类型，对应上述表1中的区域，将W^T按照序号由低到高对应位置从上向下的顺序，填充在分区对应位置上，w[a],w[b],w[c],w[d]分别填充a、b、c、d四个通道，如果该类型的信息少于该区域行数，使用0向量进行填充。

304、根据所述类图像数据，构建卷积网络。

计算装置根据所述类图像数据，构建卷积网络。需要说明的是，所述卷积网络包括输入层、输出层、卷积层、池化层、全连接层；其中，所述输入层为4个100*100的通道；所述卷积层采用4个5*5卷积核，步长值为5，无填充；所述池化层采用2*2最大池化；所述全连接层使用softmax分类器得到各个分类的概率。

示例性的，构建卷积网络，步骤如下所示：

(a)整个卷积网络包含一个输入层和输出层，一个卷积层和池化层，一个全连接层；

(b)输入层的尺寸为100x100x4，即4个100x100的通道；

(c)卷积层使用4个5x5卷积核，步长值为5，无填充；

(d)池化层采用2x2最大池化；

(e)全连接层使用softmax分类器得到各个分类的概率；

305、使用所述词向量，对所述卷积网络进行训练，得到保护装置型号分类器。

使用样本数据训练卷积网络，即可以得到最终分类器，实现保护信息模型判断保护装置型号的功能。

如图4所示，为本发明实施例中计算装置的一个实施例示意图，可以包括：

获取模块401，用于获取保护装置信息和保护装置信息模型；

处理模块402，用于对所述保护装置信息进行向量化，得到词向量；对所述保护装置信息模型进行向量化，得到类图像数据；根据所述类图像数据，构建卷积网络；使用所述词向量，对所述卷积网络进行训练，得到保护装置型号分类器。

可选的，在本发明的一些实施例中，

处理模块402，具体用于对所述保护装置信息进行分词，形成逻辑文档；对所述逻辑文档进行训练，得到词向量。

可选的，在本发明的一些实施例中，

处理模块402，具体用于对所述保护装置信息模型进行分区和分通道的方式，连接成类图像数据。

可选的，在本发明的一些实施例中，

处理模块402，具体用于对所述保护装置信息模型进行分区，得到至少一个区域，其中，每个区域包含一种类型的信息；对所述保护装置信息模型建立4个通道，所述4个通道对应不同分词向量；根据所述至少一个区域和所述4个通道，得到类图像数据。

其中，所述输入层为4个100*100的通道；

所述卷积层采用4个5*5卷积核，步长值为5，无填充；

所述池化层采用2*2最大池化；

所述全连接层使用softmax分类器得到各个分类的概率。

如图5所示，为本发明实施例中计算装置的一个实施例示意图，可以包括：

收发器501，处理器502，存储器503，其中，收发器501，处理器502和存储器503通过总线连接；

存储器503，用于存储操作指令；

收发器501，用于获取第一当前词典和原始保护装置信息，所述第一当前词典为空集；

处理器502，用于通过调用所述操作指令，对所述保护装置信息进行向量化，得到词向量；对所述保护装置信息模型进行向量化，得到类图像数据；根据所述类图像数据，构建卷积网络；使用所述词向量，对所述卷积网络进行训练，得到保护装置型号分类器。

可选的，在本发明的一些实施例中，

处理器502，具体用于对所述保护装置信息进行分词，形成逻辑文档；对所述逻辑文档进行训练，得到词向量。

可选的，在本发明的一些实施例中，

处理器502，具体用于对所述保护装置信息模型进行分区和分通道的方式，连接成类图像数据。

可选的，在本发明的一些实施例中，

处理器502，具体用于对所述保护装置信息模型进行分区，得到至少一个区域，其中，每个区域包含一种类型的信息；对所述保护装置信息模型建立4个通道，所述4个通道对应不同分词向量；根据所述至少一个区域和所述4个通道，得到类图像数据。

其中，所述输入层为4个100*100的通道；

所述卷积层采用4个5*5卷积核，步长值为5，无填充；

所述池化层采用2*2最大池化；

所述全连接层使用softmax分类器得到各个分类的概率。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种确定保护装置型号的方法，其特征在于，包括：

获取保护装置信息和保护装置信息模型；

对所述保护装置信息进行向量化，得到词向量；

根据所述至少一个区域和所述4个通道，得到类图像数据；

根据所述类图像数据，构建卷积网络；

使用所述词向量，对所述卷积网络进行训练，得到保护装置型号分类器；

所述对所述保护装置信息模型建立4个通道，所述4个通道对应不同分词向量具体包括：

(w[1],w[2],…,w[n])及权重值(v[1],v[2],…,v[n])；

W^T＝(w[a],w[b],w[c],w[d])及V^T＝(v[a],v[b],v[c],v[d])；

(d)重复(b)到(c)直到计算全部类型t中的信息；

Vc＝(0.5,0.3,0.1,0.1)V^T；

(f)重复(a)到(e)的过程，处理全部保护装置信息类型；

(g)将预处理的每条数据，依照类型，对应所述区域，将W^T按照序号由低到高对应位置从上向下的顺序，填充在分区对应位置上，w[a],w[b],w[c],w[d]分别填充a、b、c、d四个通道，如果该类型的信息少于该区域行数，使用0向量进行填充。

2.根据权利要求1所述的方法，其特征在于，所述对所述保护装置信息进行向量化，得到词向量，包括：

对所述保护装置信息进行分词，形成逻辑文档；

对所述逻辑文档进行训练，得到词向量。

3.根据权利要求1或2所述的方法，其特征在于，所述卷积网络包括输入层、输出层、卷积层、池化层、全连接层；

其中，所述输入层为4个100*100的通道；

所述卷积层采用4个5*5卷积核，步长值为5，无填充；

所述池化层采用2*2最大池化；

所述全连接层使用softmax分类器得到各个分类的概率。

4.一种计算装置，其特征在于，包括：

获取模块，用于获取保护装置信息和保护装置信息模型；

处理模块，用于对所述保护装置信息进行向量化，得到词向量；对所述保护装置信息模型进行分区，得到至少一个区域，其中，每个区域包含一种类型的信息，对所述保护装置信息模型建立4个通道，所述4个通道对应不同分词向量，根据所述至少一个区域和所述4个通道，得到类图像数据；根据所述类图像数据，构建卷积网络；使用所述词向量，对所述卷积网络进行训练，得到保护装置型号分类器；

(w[1],w[2],…,w[n])及权重值(v[1],v[2],…,v[n])；

W^T＝(w[a],w[b],w[c],w[d])及V^T＝(v[a],v[b],v[c],v[d])；

(d)重复(b)到(c)直到计算全部类型t中的信息；

Vc＝(0.5,0.3,0.1,0.1)V^T；

(f)重复(a)到(e)的过程，处理全部保护装置信息类型；

5.根据权利要求4所述的计算装置，其特征在于，

6.一种计算装置，其特征在于，包括：

所述存储器，用于存储操作指令；

所述收发器，用于获取保护装置信息和保护装置信息模型；

所述处理器，用于调用所述操作指令，执行如权利要求1-3中任一项所述的确定保护装置型号的方法的步骤。

7.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-3中任一项所述的确定保护装置型号的方法的步骤。