CN117807105A

CN117807105A - 一种模拟量校对方法及相关装置

Info

Publication number: CN117807105A
Application number: CN202311849557.8A
Authority: CN
Inventors: 卢颖; 刘秀甫; 王跃强; 廖峰; 陈锦荣; 区伟潮; 黄国平; 廖华兴; 林锦沛; 李伟业; 金露; 杨喻涵; 陈杰云; 何慧伦; 谭志聪; 董泽球; 姜健琳; 沈亚东; 徐杨杨; 周方杰
Original assignee: Guangdong Power Grid Co Ltd; Foshan Power Supply Bureau of Guangdong Power Grid Corp
Current assignee: Guangdong Power Grid Co Ltd; Foshan Power Supply Bureau of Guangdong Power Grid Corp
Priority date: 2023-12-29
Filing date: 2023-12-29
Publication date: 2024-04-02

Abstract

本发明涉及变电站数据处理技术领域，尤其涉及一种模拟量校对方法及相关装置，其中，方法包括：构建模拟量标准数据库；获取待校对的实时模拟量；从所述模拟量标准数据库中，获取与所述实时模拟量对应的正常态阈值区间；判断所述实时模拟量是否处于所述正常态阈值区间内，若是，则判定校对成功，否则判定校对失败，解决了现有技术采用人工校对模拟量数据导致效率低下的技术问题。

Description

一种模拟量校对方法及相关装置

技术领域

本发明涉及变电站数据处理技术领域，尤其涉及一种模拟量校对方法及相关装置。

背景技术

随着电力设备不断的自动化、智能化发展，在站端可获取到的各电力设备的模拟量数据越来越多，如变电站220KV以上间隔保护装置采集到各电流电压数据，保护整定值等。模拟量数据中包含较为丰富的信息，对模拟量数据进行分析，可以得到线路设备的运行状况，因此模拟量数据的准确性是影响线路分析准确的基础。

现有技术是通过人工对模拟量数据进行校对，从而确保模拟量数据的准确度。然而这种模拟量数据处理方法需要花费大量的人力成本和时间成本，校对的效率低。

发明内容

本发明提供了一种模拟量校对方法及相关装置，用于解决现有技术采用人工校对模拟量数据导致效率低下的技术问题。

本发明一方面提供了一种模拟量校对方法，包括：

构建模拟量标准数据库；

获取待校对的实时模拟量；

从所述模拟量标准数据库中，获取与所述实时模拟量对应的正常态阈值区间；

判断所述实时模拟量是否处于所述正常态阈值区间内，若是，则判定校对成功，否则判定校对失败。

可选地，所述构建模拟量标准数据库包括：

从整定模拟量列表中，获取整定模拟量；

从保信模拟量列表中，获取保信模拟量；

将所述整定模拟量和所述保信模拟量进行模糊匹配，得到匹配结果；

根据所述匹配结果，确定第一目标整定模拟量；

对所述第一目标整定模拟量进行数据拟合，得到所述第一目标整定模拟量的正常态阈值区间；

将所述第一目标整定模拟量和所述正常态阈值区间存入预先构建的数据库中，得到模拟量标准数据库。

可选地，所述将所述整定模拟量和所述保信模拟量进行模糊匹配，得到匹配结果包括：

分别对所述整定模拟量和所述保信模拟量，进行数据预处理，得到待匹配整定数据和待匹配保信数据；

将所述待匹配整定数据和所述待匹配保信数据，分别输出预先构建的孪生网络模型中，输出得到所述待匹配整定数据和所述待匹配保信数据的相似度；

根据所述相似度和预设的相似度阈值比较结果，确定所述匹配结果。

可选地，所述分别对所述整定模拟量和所述保信模拟量，进行数据预处理，得到待匹配整定数据和待匹配保信数据包括：

对所述整定模拟量的数据项进行分词，得到第一分词数据集，并对所述第一分词数据集进行近义词识别，得到第一近义词数据集；

对所述保信模拟量的数据项进行分词，得到第二分词数据集，并对所述第二分词数据集进行近义词识别，得到第二近义词数据集；

将所述第一分词数据集和所述第一近义词数据集作为待匹配整定数据；

将所述第二分词数据集和所述第二近义词数据集作为待匹配保信数据。

可选地，所述对所述第一目标整定模拟量进行数据拟合，得到所述第一目标整定模拟量的正常态阈值区间，包括：

对所述第一目标整定模拟量进行单位标准化，并将单位标准化后的所述第一目标整定模拟量，输入预先构建的keras神经网络模型中，输出得到所述第一目标整定模拟量的正常态阈值区间。

可选地，所述方法还包括：

采用滑动窗口算法对目标实时模拟量进行采样，得到窗口模拟量数据，所述目标实时模拟量为校对成功的实时模拟量；

根据所述窗口模拟量数据、滑窗时间和预设的异常阈值，预测异常时间点；

根据所述目标实时模拟量和所述异常时间点，生成预警信息。

可选地，所述根据所述窗口模拟量数据、滑窗时间和预设的异常阈值，预测异常时间点包括：

计算所述窗口模拟量数据的平均值；

以所述滑窗时间为自变量，所述窗口模拟量数据的平均值为因变量，进行线性回归计算，得到线性参数；

根据所述线性参数、所述异常阈值，计算所述异常阈值对应的目标滑窗时间，并根据所述目标滑窗时间确定异常时间点。

可选地，所述方法还包括：

获取目标实时模拟量对应的目标基准值区间；所述目标实时模拟量为校对成功的实时模拟量；

采用滑动窗口算法对所述目标实时模拟量进行采样，得到窗口模拟量数据，所述目标实时模拟量为校对成功的实时模拟量；

根据所述窗口模拟量数据和目标基准值区间，确定当前异常数据总数。

本发明另一方面还提供了一种模拟量校对装置，所述装置包括：

构建模块，用于构建模拟量标准数据库；

第一获取模块，用于获取待校对的实时模拟量；

第二获取模块，用于从所述模拟量标准数据库中，获取与所述实时模拟量对应的正常态阈值区间；

判断模块，用于判断所述实时模拟量是否处于所述正常态阈值区间内，若是，则判定校对成功，否则判定校对失败。

本发明另一方面还提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行如上所述的方法。

从以上技术方案可以看出，本发明具有以下优点：

本发明提供了一种模拟量校对方法，所述方法包括：构建模拟量标准数据库；获取待校对的实时模拟量；从所述模拟量标准数据库中，获取与所述实时模拟量对应的正常态阈值区间；判断所述实时模拟量是否处于所述正常态阈值区间内，若是，则判定校对成功，否则判定校对失败。

在本发明中通过构建模拟量标准数据库，为提升模拟量校对效率和准确率提供的技术支撑；并通过获取待校对的实时模拟量，从所述模拟量标准数据库中，获取与所述实时模拟量对应的正常态阈值区间，判断所述实时模拟量是否处于所述正常态阈值区间内，若是，说明实时模拟量数据正确，因此判定校对成功，否则说明实时模拟量异常，判定校对失败，解决了现有技术采用人工校对模拟量数据导致效率低下的技术问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例一提供的一种模拟量校对方法的步骤流程图；

图2为本发明实施例二提供的一种模拟量校对方法的步骤流程图；

图3为本发明提供的孪生网络模型的原理示意图；

图4为本发明提供的GRU神经元的结构示意图；

图5为本发明实施例三提供的一种模拟量校对方法的步骤流程图；

图6为本发明实施例四提供的一种模拟量校对方法的步骤流程图；

图7为本发明实施例五提供的一种模拟量校对装置的结构示意图。

具体实施方式

本发明实施例提供了一种模拟量校对方法及相关装置，用于解决现有的模拟量数据校对效率低的技术问题。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一：

请参阅图1，本发明实施例提供了一种模拟量校对方法的示意图。

本发明提供的一种模拟量校对方法，包括：

101、构建模拟量标准数据库。

需要说明的是，模拟量标准数据库中预存了用于评估模拟量是否准确的的阈值数据。

102、获取待校对的实时模拟量。

需要说明的是，本实施例方法应用于变电站220KV及以上的间隔保护场景中，其包括整定系统和保信系统，其中，整定系统用于根据电力系统状况生成定值单，定值单中包含了各类继电保护装置的整定值、名称、版本号等信息。实时模拟量指整定系统的定值单上的各项数据。保信系统用于检测电力系统中的保护装置的运行状态、采集运行数据、召唤继电保护装置运行定值等功能。

可以理解的是，整定系统和保信系统均为现有电力系统中的一部分。本发明是利用整定系统和保信系统的数据，构建了用于为判断实时模拟量是否正确提供判断基准数据的模拟量标准数据库，从而使实时模拟量可以具备统一的判断基准。

103、从模拟量标准数据库中，获取与实时模拟量对应的正常态阈值区间。

需要说明的是，正常态阈值区间是指正常情况下，模拟量的区间范围。模拟量标准数据库中存储着各模拟量对应的正常态阈值区间。

104、判断实时模拟量是否处于正常态阈值区间内，若是，则判定校对成功，否则判定校对失败。

需要说明的是，当实时模拟量处于正常态阈值区间内时，说明实时模拟量准确，因此判定校对成功，否则说明实时模拟量不准确，判定校对失败。

在本实施例中，通过构建模拟量标准数据库，为提升模拟量校对效率和准确率提供的技术支撑；并通过获取待校对的实时模拟量，从模拟量标准数据库中，获取与实时模拟量对应的正常态阈值区间，判断实时模拟量是否处于正常态阈值区间内，若是，说明实时模拟量数据正确，因此判定校对成功，否则说明实时模拟量异常，判定校对失败，解决了现有技术采用人工校对模拟量数据导致效率低下的技术问题。

实施例二：

请参阅图2，在包含实施例一的基础上，本实施例提供的一种模拟量校对方法具体包括：

201、从整定模拟量列表中获取整定模拟量。

需要说明的是，整定模拟量列表指的是整定系统定值单中需要校对的全部模拟量项组成的数据表，此模拟量项则为整定模拟量。

本实施例从整定模拟量列表中逐一读取整定模拟量。

202、从保信模拟量列表中获取保信模拟量。

需要说明的是，保信模拟量列表指的是保信系统数据中需要校对的全部模拟量项的数据表，此模拟量项为保信模拟量。

203、将整定模拟量和保信模拟量进行模糊匹配，得到匹配结果。

需要说明的是，整定模拟量和保信模拟量均含有数据项，其中数据项可包含数据集名称、参引名称以及模拟量点名称。模糊匹配是一种数据匹配技术，用于比较两个或多个记录，并计算它们属于同一实体的可能性。本实施例基于数据集名称、参引名称、模拟量点名称对整定模拟量和保信模拟量进行模糊匹配，从确定整定模拟量和保信模拟量是否属于同种数据。

可以理解的是，在进行模糊匹配时，逐一匹配数据集名称、参引名称和经过转化后的模拟量点名称，当匹配结果中除了数值编号不同，后缀不同智蛙，其余相同，则视为匹配成功。转化后的模拟量点名称是指经过以下数据预处理步骤得到的模拟量点名称。

在一个具体的示例中，步骤203具体包括：

S1、分别对整定模拟量和保信模拟量，进行数据预处理，得到待匹配整定数据和待匹配保信数据。

需要说明的是，为了增强匹配的鲁棒性，在进行模拟项名称匹配时，需要对整定模拟量和保信模拟量进行数据预处理，从而得到待匹配整定数据和待匹配保信数据。

其中，数据预处理的步骤包括：

S21、对整定模拟量的数据项进行分词，得到第一分词数据集，并对第一分词数据进行近义词识别，得到第一近义词数据集。

需要说明的是，采用NLPIR分词工具对整定模拟量的数据项进行分词，从而将数据项中存在的长句名称分成词组，即得到了第一分词数据集。例如：数据项的名称为“1号线路启动电流值”，经过分词后变成“1号线路”、“启动”、“电流值”。

NLPIR分词工具是由中国科学院，基于层叠隐马尔可夫模型CHMM开发的中文分词系统，在中文分词中有着优良的效果表现。

分词之后，本实施例采用Synonyms中文近义词工具对第一分词数据集进行近义词识别，从而扩充了第一分词数据集，得到第一近义词数据集。结合前述列举的示例说明：如在进行近义词识别后，“启动”和“起动”均为一组近义词。

需要说明的是，Synonyms中文近义词工具，基于Word2vec技术开发的用于相似度技术、语义偏移等自然语义理解任务的工具，将中文变成了词向量，在中文近义词查找上有着良好的效果表现。

S22、对保信模拟量的数据项进行分词，得到第二分词数据集，并对第二分词数据进行近义词识别，得到第二近义词数据集。

需要说明的是，步骤S22的分词原理和近义词识别原理与步骤S21相同，具体可以参考步骤S21。

S23、将第一分词数据集和第一近义词数据集作为待匹配整定数据。

需要说明的是，第一分词数据和第一近义词数据集作为等待匹配的整定数据。

S24、将第二分词数据集和第二近义词数据集作为待匹配保信数据。

S2、将待匹配整定数据和待匹配保信数据，分别输出预先构建的孪生网络模型中，输出得到待匹配整定数据和待匹配保信数据的相似度。

需要说明的是，本实施例中预先构建了孪生网络模型对待匹配整定数据和待匹配保信数据进行相似度计算，以实现模糊匹配。如图3所示，保信模拟量列表作为输入1，整定模拟量列表作为输入2。可以理解的是，此处的保信模拟量列表中的模拟量项即为经过数据预处理得到的待匹配保信数据，整定模拟量列表中的模拟量项即为经过数据预处理得到的待匹配整定数据。在本实施例中，将经过数据预处理的所有整定模拟量和保信模拟量输入孪生网络模型中。

其中，孪生网络模型的是孪生神经网络Siamese network，其包括两个子网络，两个子网络共享权重。在本实施例中，子网络选取为GUA网络，因此构成了如图3所示的两个孪生GUA网络A。

GUA网络是由门控循环单元GRU神经元构成，GRU神经元如图4所示，其实现原理如下：

(1)重置门和更新门：

z_t＝σ(W_xzx_t+W_hzh_t-1+b_z)

其中，σ为激活函数，b为偏置量，x_t为第t个神经元的输入，h_t-1为第t-1个神经元的输出，r为重置门，决定需要保留的信息，z_t为更新门，决定需要传递的信息，W为权重矩阵，其中W_xr代表神经元输入对重置的影响系数，W_hr代表神经元输出对重置的影响系数，W_xz代表神经元输入对更新的影响系数，W_hz代表神经元输出对更新的影响系数。

(2)隐藏状态更新：

其中，为当前时刻新信息与上一时刻隐藏信息的组合，h_t为当前时刻隐藏状态，也是该神经元的输出。

而相似度计算神经网络由两层全连接层和一层归一化层组成，因此，相似度S的计算公式如下：

S＝sigmoid(F₂(F₁(X₁；X₂)))

F(X)＝relu(wX+b)

其中，sigmoid为归一化函数，relu为激活函数，w为权重矩阵，b为偏置量，X为输入向量，F1(X1；X2)表示对进入归一化两个参数的激活。

S3、根据相似度和预设的相似度阈值比较结果，确定匹配结果。

需要说明的是，由步骤S2可知，将待匹配整定数据和待匹配保信数据输入孪生模型中，输出得到待匹配整定数据和待匹配保信数据的相似度，之后，比较相似度和预设的相似度阈值的大小，当相似度大于相似度阈值时，说明待匹配整定数据和待匹配保信数据中的各项数据基本相同，因此匹配成功，否则视为匹配失败。

204、根据匹配结果，确定第一目标整定模拟量；

需要说明的是，匹配结果包括匹配成功和匹配失败，当匹配成功时，则该待整定数据为第一目标整定模拟量。当匹配成功时，将匹配成功的整定模拟量存入匹配成功缓存列表中。

在另一个优选的实施例中，当匹配不一致，则判定整定模拟量为第二目标整定模拟量，并将第二目标整定模拟量和保定模拟量存入匹配失败缓存列表。

之后，遍历整定模拟量列表，直到整定模拟量列表中的所有数据已经完成上述匹配过程。

当结束遍历后，去读匹配失败缓存列表中的数据项与整定模拟量列表中未被配对的项进行匹配，若匹配失败，则输出失败日志，并输出告警提醒。

若匹配成功，则判断匹配成功的两对模拟量是否为整定模拟量和保定模拟量，若是，则将匹配成功的整定模拟量重新加入匹配成功缓存列表中，否则将整定模拟量加入匹配失败缓存列表中。

205、对第一目标整定模拟量进行数据拟合，得到第一目标整定模拟量的正常态阈值区间。

需要说明的是，将匹配成功列表中的所有第一目标整定模拟量进行数据拟合，从而拟合得到整定模拟量的正常态阈值区间。

可以理解的是，在前述步骤中，整定模拟量数据首先被粗略分为已匹配上和未匹配上的。已配对好的模拟量又可以细分为两种，一种是数据正常的，一种是数据异常的。而采用已配对好的数据，可以拟合出正常态下模拟量的区间范围。

本实施例采用keras神经网络模型进行数据拟合，具体包括以下步骤：

S5、对第一目标整定模拟量进行单位标准化，并将单位标准化后的各第一目标整定模拟量，输入预先构建的keras神经网络模型中，输出得到各第一目标整定模拟量的正常态阈值区间。

需要说明的是，在拟合之前，需要先对第一目标整定模拟量进行单位标准化。例如，第一目标整定模拟量包含了电压值，如果电压值明确以V为单位，则第一目标整定模拟量中的所有的电压值单位均需转为V。

keras神经网络模型是一种可以实现数据拟合的神经网络模拟模型。在本实施例中，利用各第一目标整定模拟量对keras神经网络模型进行训练，即可得到正常态下模拟量的区间范围。从而可以通过判断模拟量的数据是否处于正常态下模拟量的区间范围，来确定模拟量的数据是否准确。

可以理解的是，在前述步骤中，整定模拟量数据首先被粗略分为已匹配上和未匹配上的。已匹配上的说明这些点位以前存在过，未匹配上说明这些数据点是后期新增的。keras神经网络模型训练只对以前存在过的数据进行识别，若每次都有新增数据，需要通过重新训练模型的进行适应。

206、将第一目标整定模拟量和正常态阈值区间存入预先构建的数据库中，得到模拟量标准数据库。

在本实施例中，将第一目标整定模拟量和正常态阈值区间存入预先构建的数据库中，即完成了模拟量标准数据库的构建。正常态阈值区间

207、获取待校对的实时模拟量。

需要说明的是，实时模拟量为整定模拟量。

208、从模拟量标准数据库中，获取与实时模拟量对应的正常态阈值区间。

需要说明的是，将实时模拟量与模拟量标准数据库中的第一目标整定模拟量进行匹配，确定配对成功的第一目标整定模拟量，此时配对成功的第一目标整定模拟量对应的常态阈值区间，即为实时模拟量对应的正常态阈值区间。

在另一个优选的实施例中，第一目标整定模拟量是经过前述步骤的数据预处理得到，为了进一步提升匹配的准确度，本实施例匹配实时模拟量和第一目标整定模拟量之前，对实时模拟量进行如上的数据预处理和单位标准化处理。

209、判断实时模拟量是否处于正常态阈值区间内，若是，则判定校对成功，否则判定校对失败。

需要说明的是，步骤209可以参考步骤104，此处不再赘述。

在本实施例中，通过构建模拟量标准数据库，为提升模拟量校对效率和准确率提供的技术支撑；并通过获取待校对的实时模拟量，从模拟量标准数据库中，获取与实时模拟量对应的正常态阈值区间，判断实时模拟量是否处于正常态阈值区间内，若是，说明实时模拟量数据正确，因此判定校对成功，否则说明实时模拟量异常，判定校对失败，解决了现有技术采用人工校对模拟量数据导致效率低下的技术问题，提升了模拟量校对的准确度，为准确进行线路设备的运行状况分析提供了有效的数据支持。

实施例三

请参阅图5，在包含实施例二或实施例一的基础上，步骤104之后包括：

301、采用滑动窗口算法对目标实时模拟量进行采样，得到窗口模拟量数据，目标实时模拟量为校对成功的实时模拟量。

需要说明的是，滑动窗口算法(SlidingWindow)是一种常用的双指针算法，被广泛应用于字符串和数组等数据结构中的子串或子数组问题，其基本思想是维护一个窗口，通过移动窗口的两个边界来处理问题。

在本实施例中，通过采用滑窗的方法取值实时模拟量数据的观测窗口，以获取窗口内的目标模拟量数据，即窗口模拟量数据。其中窗口的大小和移动速度可以根据实际情况确定。

302、根据窗口模拟量数据、滑窗时间和预设的异常阈值，预测异常时间点。

需要说明的是，滑窗时间指的是滑动窗口代表的时间。异常阈值是作为窗口模拟量数据正常与否的判断基准，其可以根据实际的模拟量数据类型进行确定。

当窗口模拟量数据大于异常阈值时，说明当前窗口模拟量数据为异常数据。

本实施例中，目标实时模拟量在时间上是持续的状态，因此通过窗口模拟量数据、滑窗时间和预设的异常阈值进行线性回归预测，即可得到异常的时间点。

在一个具体的实施例中，步骤302具体包括以下子步骤；

S61、计算窗口模拟量数据的平均值。

S62、以滑窗时间为自变量，窗口模拟量数据的平均值为因变量，进行线性回归计算，得到线性参数。

需要说明的是，本实施例中，以滑窗时间为自变量，以窗口模拟量数据的平均值为因变量，构建线性回归函数，并根据通过窗口模拟量数据的多组数据进行计算，得到线性回归函数的斜率k和常数C。斜率k和常数C即为线性参数。

其中，构建得到的线性回归函数为：

f(x)＝kx+C；

其中，f(x)为模拟量值，x为滑窗时间，k和C由计算机计算获得。

S63、根据线性参数、异常阈值，计算异常阈值对应的目标滑窗时间，并根据目标滑窗时间确定异常时间点。

需要说明的是，将线性参数、异常阈值代入构建的线性回归函数中，得到滑窗时间，基于滑窗时间和起点时间即可确定异常阈值对应的时间点。

因此，本实施例通过对窗口模拟量数据进行线性回归计算，可以预测得到窗口模拟量发展的数值趋势，并预测得到其发展至异常状态的异常时间点。

303、根据目标实时模拟量和异常时间点，生成预警信息。

需要说明的是，本实施例通过将目标实时模拟量和异常时间点生成预警信息，实现了对可能存在的异常模拟量数据进行预警。

其中，预警信息可以通过建图以及渲染的方式，将线路中的数据情况更直观的展现在操作人员面前，以便操作人员可以更直观的了解到未来可能存在的异常数据，并及时关注。

本实施例通过采用滑动窗口算法对目标实时模拟量进行采样，得到窗口模拟量数据，根据窗口模拟量数据、滑窗时间和预设的异常阈值，预测异常时间点，从而在准确度高的目标实时模拟量的基础上，实现了对目标实时模拟量的异常风险预测，提升了风险预测的准确率，并根据目标实时模拟量和异常时间点，生成预警信息，从而为操作人员提供了更直观的异常风险预测。

实施例四

请参阅图6，在包含实施例一或实施例二的基础上，步骤104之后包括

401、获取目标模拟量的目标基准值区间；目标实时模拟量为校对成功的实时模拟量。

需要说明的是，基准值区间可以通过对历史模拟量数据进行概率分布，并进行分析得到。具体地，目标实时模拟量在时间上是持续的，因此可以通过对目标实时模拟量各个点数据在时间轴上进行积分，然后将积分后的数据除以时间，得到平均值，再通过实验，确定设置模拟量的波动比例，得到基准值区间。

因此，通过获取目标模拟量对应的历史目标模拟量数据，并根据历史目标模拟量数据计算得到对应的目标基准值区间。

402、采用滑动窗口算法对目标实时模拟量进行采样，得到窗口模拟量数据，目标实时模拟量为校对成功的实时模拟量。

需要说明的是，步骤402的原理可以参考步骤301，此处不再赘述。

403、根据窗口模拟量数据和目标基准值区间，确定当前异常数据总数。

需要说明的是，将窗口模拟量数据与目标基准值区间比较，并将大于目标基准值区间的窗口模拟量数据作为当前异常数据，输出当前异常数据的总数量。因此，本实施例实现了对当前目标实时模拟量的异常状态的确定，为进行当前实时模拟量的异常告警提供了数据支持。

本实施例通过获取目标实时模拟量对应的目标基准值区间；目标实时模拟量为校对成功的实时模拟量，采用滑动窗口算法对目标实时模拟量进行采样，得到窗口模拟量数据，目标实时模拟量为校对成功的实时模拟量，根据窗口模拟量数据和目标基准值区间，确定当前异常数据总数，实现了对当前实时模拟量数据的状态进行监测，并在异常时，计算得到异常总数，实现了对异常的目标实时模拟量数据的识别，并为异常的风险告警提供了数据支持。

实施例五

参阅图7，图7为本发明实施例提供的一种模拟量校对装置，包括：

构建模块501，用于构建模拟量标准数据库；

第一获取模块502，用于获取待校对的实时模拟量；

第二获取模块503，用于从模拟量标准数据库中，获取与实时模拟量对应的正常态阈值区间；

判断模块504，用于判断实时模拟量是否处于正常态阈值区间内，若是，则判定校对成功，否则判定校对失败。

在一个具体的实施例中，构建模块501包括：

第一获取子模块，用于从整定模拟量列表中，获取整定模拟量；

第二获取子模块，用于从保信模拟量列表中，获取保信模拟量；

第一匹配子模块，用于将整定模拟量和保信模拟量进行模糊匹配，得到匹配结果；

第一确定子模块，用于根据匹配结果，确定第一目标整定模拟量；

拟合模块，用于对第一目标整定模拟量进行数据拟合，得到第一目标整定模拟量的正常态阈值区间；

存入模块，用于将第一目标整定模拟量和正常态阈值区间存入预先构建的数据库中，得到模拟量标准数据库。

在一个具体的实施例中，第一匹配子模块包括：

数据预处理单元，用于分别对整定模拟量和保信模拟量，进行数据预处理，得到待匹配整定数据和待匹配保信数据；

相似度生成单元，用于将待匹配整定数据和待匹配保信数据，分别输出预先构建的孪生网络模型中，输出得到待匹配整定数据和待匹配保信数据的相似度；

确定单元，用于根据相似度和预设的相似度阈值比较结果，确定匹配结果。

在一个具体的实施例中，数据预处理单元包括：

第一分词与识别子单元，用于对整定模拟量的数据项进行分词，得到第一分词数据集，并对第一分词数据集进行近义词识别，得到第一近义词数据集；

第二分词与识别子单元，用于对保信模拟量的数据项进行分词，得到第二分词数据集，并对第二分词数据集进行近义词识别，得到第二近义词数据集；

第一作为子单元，用于将第一分词数据集和第一近义词数据集作为待匹配整定数据；

第二作为子单元，用于将第二分词数据集和第二近义词数据集作为待匹配保信数据。

在一个具体的实施例中，拟合模块具体用于对第一目标整定模拟量进行单位标准化，并将单位标准化后的第一目标整定模拟量，输入预先构建的keras神经网络模型中，输出得到第一目标整定模拟量的正常态阈值区间。

在一个具体的实施例中，还包括：

采样模块，用于采用滑动窗口算法对目标实时模拟量进行采样，得到窗口模拟量数据，目标实时模拟量为校对成功的实时模拟量；

预测模块，用于根据窗口模拟量数据、滑窗时间和预设的异常阈值，预测异常时间点；

预警模块，用于根据目标实时模拟量和异常时间点，生成预警信息。

在一个具体的实施例中，预测模块包括：

第一计算单元，用于计算窗口模拟量数据的平均值；

第二计算单元，用于以滑窗时间为自变量，窗口模拟量数据的平均值为因变量，进行线性回归计算，得到线性参数；

第三计算单元，用于根据线性参数、异常阈值，计算异常阈值对应的目标滑窗时间，并根据目标滑窗时间确定异常时间点。

在一个具体的实施例中，还包括：

获取单元，用于获取目标实时模拟量对应的目标基准值区间；目标实时模拟量为校对成功的实时模拟量；

采样单元，用于采用滑动窗口算法对目标实时模拟量进行采样，得到窗口模拟量数据，目标实时模拟量为校对成功的实时模拟量；

异常数据总数确定单元，用于根据窗口模拟量数据和目标基准值区间，确定当前异常数据总数。

本发明还提供了一种计算机可读存储介质，计算机可读存储介质用于存储程序代码，程序代码用于执行如上任一实施例的方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其他方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其他形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个功能单元为单独的物理存在，也可以两个或两个以上功能单元集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种模拟量校对方法，其特征在于，所述方法包括：

构建模拟量标准数据库；

获取待校对的实时模拟量；

2.根据权利要求1所述的方法，其特征在于，所述构建模拟量标准数据库包括：

从整定模拟量列表中，获取整定模拟量；

从保信模拟量列表中，获取保信模拟量；

根据所述匹配结果，确定第一目标整定模拟量；

3.根据权利要求2所述的方法，其特征在于，所述将所述整定模拟量和所述保信模拟量进行模糊匹配，得到匹配结果包括：

4.根据权利要求3所述的方法，其特征在于，所述分别对所述整定模拟量和所述保信模拟量，进行数据预处理，得到待匹配整定数据和待匹配保信数据包括：

5.根据权利要求2所述的方法，其特征在于，所述对所述第一目标整定模拟量进行数据拟合，得到所述第一目标整定模拟量的正常态阈值区间，包括：

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

7.根据权利要求6所述的方法，其特征在于，所述根据所述窗口模拟量数据、滑窗时间和预设的异常阈值，预测异常时间点包括：

计算所述窗口模拟量数据的平均值；

8.根据权利要求2所述的方法，其特征在于，所述方法还包括：

9.一种模拟量校对装置，其特征在于，所述装置包括：

构建模块，用于构建模拟量标准数据库；

第一获取模块，用于获取待校对的实时模拟量；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行如权利要求1-8任一项所述的方法。