CN112579847A

CN112579847A - 生产数据的处理方法和装置、存储介质及电子设备

Info

Publication number: CN112579847A
Application number: CN201910944126.7A
Authority: CN
Inventors: 刘明
Original assignee: Beijing Gridsum Technology Co Ltd
Current assignee: Beijing Gridsum Technology Co Ltd
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2021-03-30

Abstract

本发明公开了一种生产数据的处理方法和装置、存储介质及电子设备。其中，该方法包括：获取生产数据，其中，生产数据包括：生产环境数据和生产动态数据；利用预先构建好的决策树模型对生产数据进行分析，得到排放结果，其中，排放结果用于表征生产数据对应的排放量是否超过预设排放量。本发明解决了相关技术中通过人工分析排放点的生产数据，确定排放点的排放量是否超标，费时费力的技术问题。

Description

生产数据的处理方法和装置、存储介质及电子设备

技术领域

本发明涉及数据处理领域，具体而言，涉及一种生产数据的处理方法和装置、存储介质及电子设备。

背景技术

近年来，从国家到地方，从企业到个人，都越来越重视节能减排，低碳环保。化工企业作为传统的排放大户，如何减轻排放，一直是企业重点探索的问题。

传统的分析方法，一般会在发生排放超标时，去逐一分析各生产单元的情况，逐一进行排查，费时费力。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种生产数据的处理方法和装置、存储介质及电子设备，以至少解决相关技术中通过人工分析排放点的生产数据，确定排放点的排放量是否超标，费时费力的技术问题。

根据本发明实施例的一个方面，提供了一种生产数据的处理方法，包括：获取生产数据，其中，生产数据包括：生产环境数据和生产动态数据；利用预先构建好的决策树模型对生产数据进行分析，得到排放结果，其中，排放结果用于表征生产数据对应的排放量是否超过预设排放量。

进一步地，利用预先构建的决策树模型对生产数据进行分析，得到排放结果包括：对生产数据进行特征提取，得到生产数据对应的特征向量，其中，特征向量包括：多个特征，及每个特征的特征值；将特征向量输入至决策树模型中，并获取决策树模型输出的分类结果，其中，分类结果用于表征排放量是否满足决策目标；基于分类结果和决策目标，确定排放量；将排放量与预设排放量进行比较，得到排放结果。

进一步地，在利用预先构建的决策树模型对生产数据进行分析，得到排放结果之前，上述方法还包括：获取历史生产数据和对应的历史排放量；对历史生产数据进行特征提取，得到历史生产数据对应的特征向量；判断历史排放量是否满足决策目标，得到历史排放量对应的历史分类结果；基于特征向量和对应的历史分类结果，生成训练样本；基于训练样本构建决策树模型。

进一步地，决策树模型包括依次连接的多个节点，每个节点包含全部或部分训练样本，其中，连接至同一个父节点的所有子节点包含的训练样本是划分父节点包含的训练样本得到的；在子节点包含的训练样本对应的历史分类结果相同的情况下，确定子节点为叶子节点；除叶子节点之外的每个节点对应一个目标特征，目标特征用于对相应节点包含的训练样本进行划分。

进一步地，目标特征是相应节点包含的训练样本中最小信息熵对应的特征，其中，基于每个特征的特征值和对应的分类结果，得到每个特征的信息熵。

进一步地，同一个子节点包含的训练样本中目标特征的特征值相同。

进一步地，在基于训练样本构建决策树模型之后，上述方法还包括：利用测试函数对构建好的决策树模型进行验证，得到测试结果；判断测试结果的错误率是否超过预设错误率；如果是，则继续基于训练样本构建决策树模型，直至错误率小于预设错误率；如果否，则利用决策树模型对生产数据进行分析，得到排放结果。

根据本发明实施例的另一方面，还提供了一种生产数据的处理装置，包括：获取模块，用于获取生产数据，其中，生产数据包括：生产环境数据和生产动态数据；分析模块，用于利用预先构建的决策树模型对生产数据进行分析，得到排放结果，其中，排放结果用于表征生产数据对应的排放量是否超过预设排放量。

根据本发明实施例的另一方面，还提供了一种存储介质，其特征在于，存储介质包括存储的程序，其中，程序执行上述的生产数据的处理方法。

根据本发明实施例的另一方面，还提供了一种电子设备，电子设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线；其中，处理器、存储器通过总线完成相互间的通信；处理器用于调用存储器中的程序指令，以执行权上述的生产数据的处理方法。

在本发明实施例中，在获取到生产数据之后，可以利用决策树模型对生产数据进行分析，得到相应的排放结果，从而实现分析排放点的排放量是否超标的目的。与现有技术相比，可以直接通过预先建立好的决策树模型进行处理，无需人工逐一分析各生产单元的情况，逐一进行排查，从而达到了提高处理效率、减少处理耗时的技术效果，进一步达到降低能耗的目的，进而解决了相关技术中通过人工分析排放点的生产数据，确定排放点的排放量是否超标，费时费力的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种生产数据的处理方法的流程图；

图2是根据本发明实施例的一种可选的排放点排放的示意图；

图3是根据本发明实施例的一种可选的典型的决策树模型的示意图；

图4是根据本发明实施例的一种生产数据的处理装置的示意图；以及

图5是根据本发明实施例的一种电子设备的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例，提供了一种生产数据的处理方法，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的一种生产数据的处理方法的流程图，如图1所示，该方法包括如下步骤：

步骤S102，获取生产数据，其中，生产数据包括：生产环境数据和生产动态数据。

具体地，如图2所示，上述的生产环境数据可以包括：某些开关的闭合状态、生产单元的温度、压力、各个仪表的表量、平均值等，生产动态数据可以包括：原料投入量、辅料投入量、化工三剂投放量、产品产量、公用工程消耗量等。

步骤S104，利用预先构建好的决策树模型对生产数据进行分析，得到排放结果，其中，排放结果用于表征生产数据对应的排放量是否超过预设排放量。

具体地，上述的预设排放量可以是用于确定排放点的排放量是否超标的阈值，当某个排放点的排放量超过该阈值时，确定该排放点排放超标；否则确定该排放点排放不超标。

在一种可选的方案中，为了能够准确地分析排放点的排放量是否超标，可以综合考虑企业里各生产单元的情况，根据每个排放点的实际情况进行相关数据的收集和确认，通过大数据技术、机器学习技术可以得到各个排放点的决策树模型，图3示出了典型的决策树模型。

由于排放量与生产环境数据、生产动态数据等生产数据相关，当需要分析化工企业某个排放点的排放量是否超标时，可以获取到该排放点的生产数据，利用该排放点预先建立的决策树模型对生产数据进行处理，可以确定该排放点的排放量，进一步可以得到排放量是否超标的结果，从而给企业节能减排工作提供数据依据，并以此对生产过程的各相关环节进行调整，最终达到能耗降低的目标。

通过本发明上述实施例，在获取到生产数据之后，可以利用决策树模型对生产数据进行分析，得到相应的排放结果，从而实现分析排放点的排放量是否超标的目的。与现有技术相比，可以直接通过预先建立好的决策树模型进行处理，无需人工逐一分析各生产单元的情况，逐一进行排查，从而达到了提高处理效率、减少处理耗时的技术效果，进一步达到降低能耗的目的，进而解决了相关技术中通过人工分析排放点的生产数据，确定排放点的排放量是否超标，费时费力的技术问题。

可选地，本发明上述实施例中，利用预先构建的决策树模型对生产数据进行分析，得到排放结果包括：对生产数据进行特征提取，得到生产数据对应的特征向量，其中，特征向量包括：多个特征，及每个特征的特征值；将特征向量输入至决策树模型中，并获取决策树模型输出的分类结果，其中，分类结果用于表征排放量是否满足决策目标；基于分类结果和决策目标，确定排放量；将排放量与预设排放量进行比较，得到排放结果。

由于生产环境数据、生产动态数据等生产数据包含文字信息，无法直接用于机器学习，因此，可以对生产数据进行特征提取，将每种类型的数据映射为一个特征，特征值值由数字组成，从而得到相应的特征向量，进一步通过特征向量构建决策树模型。进一步地，在获取到生产数据之后，同样需要对生产数据进行特征提取，得到相应的特征向量，从而可以输入至决策树模型中进行处理。

另外，由于决策树模型仅能实现分类功能，无法输出连续数值，因此，可以将排放量进行量化，例如，可以通过决策目标对排放量进行分类，其中，决策目标可以是“排放量<给定值”，或者“排放量>给定值”，并通过相应的分类结果进行模型训练。同样地，在获取到决策树模型输出的分类结果之后，可以结合决策目标确定排放量与给定量的关系，进一步确定排放量是否超过预设排放量，得到最终的排放结果。

可选地，本发明上述实施例中，在利用预先构建好的决策树模型对生产数据进行分析，得到排放结果之前，该方法还包括：获取历史生产数据和对应的历史排放量；对历史生产数据进行特征提取，得到历史生产数据对应的特征向量，其中，特征向量包括：多个特征，及每个特征的特征值；将历史排放量和预设排放量进行比较，得到历史生产数据对应的分类结果；基于特征向量和对应的分类结果，生成训练样本；基于训练样本构建决策树模型。

具体地，上述的历史生产数据和对应的历史排放量可以是排放点一段时间(如一个班次)内的排放量、这个班次内的生产环境、这个班次的生产输入输出等数据。上述的每个特征对应于历史生产数据中的一个种类数据，特征值对应于具体数据，例如，生产量、某三剂添加量、生产单元的温度。

在一种可选的方案中，可以将放点一段时间(如一个班次)内的排放量、这个班次内的生产环境、这个班次的生产输入输出等数据收集完整备用。通过对历史生产数据进行特征提取，并对历史排放量进行量化，可以生成决策树模型的训练样本，调用成熟的工具包可以构建得到决策树模型。

可选地，本发明上述实施例中，决策树模型包括依次连接的多个节点，每个节点包含全部或部分训练样本，其中，连接至同一个父节点的所有子节点包含的训练样本是划分父节点包含的训练样本得到的；在子节点包含的训练样本对应的历史分类结果相同的情况下，确定子节点为叶子节点；除叶子节点之外的每个节点对应一个目标特征，目标特征用于对相应节点包含的训练样本进行划分。

具体地，决策树模型中的叶子节点对应的所有样本均属于同一个类别，叶子节点可以标记为样本个数最多的类别。

可选地，目标特征是相应节点包含的训练样本中最小信息熵对应的特征，其中，基于每个特征的特征值和对应的分类结果，得到每个特征的信息熵。

具体地，信息熵可以反映训练样本的不确定程度，信息熵越大不确定程序越高，信息熵越小不确定性程度越低。信息熵的计算公式如下：

其中，p_k代表当前节点D的训练样本中第k类样本所占的比例。

可选地，同一个子节点包含的训练样本中目标特征的特征值相同。

具体地，目标特征的每一个值都对应着从该节点产生的一个分支及被划分的一个子集。

本申请实施例中，训练样本的划分原则是：将无序的数据变得更加有序，因此可以结合决策目标和信息熵度量，得出相应的目标特征。

在一种可选的的方案中，根据“排放量<给定值”的决策目标，得到相应的训练样本划分和特征，确保满足目标的特征能够发生(例如“生产量<额定生产量”、“某三剂添加量<某给定值”或者“生产单元的温度<某给定温度”)。根据“排放量>给定值”的决策目标，得到相应的训练样本划分和特征，确保满足目标的特征不要发生。

可选地，本发明上述实施例中，在基于训练样本构建决策树模型之后，上述方法还包括：利用测试函数对构建好的决策树模型进行验证，得到测试结果；判断测试结果的错误率是否超过预设错误率；如果是，则继续基于训练样本构建决策树模型，直至错误率小于预设错误率；如果否，则利用决策树模型对生产数据进行分析，得到排放结果。

在一种可选的方案中，由于每次生成决策树数据都需要大量的计算，并且耗时，可以编写测试函数验证决策树可以正确分类给定的数据实例。如果验证存在错误率较高的情况，需要反复进行模型训练，直至测试通过，并保存相应的特征和决策树模型。

根据本发明实施例，提供了一种生产数据的处理装置。

图4是根据本发明实施例的一种生产数据的处理装置的示意图，如图4所示，该装置包括：获取模块42和分析模块44。

其中，获取模块42用于获取生产数据，其中，生产数据包括：生产环境数据和生产动态数据；分析模块44用于利用预先构建好的决策树模型对生产数据进行分析，得到排放结果，其中，排放结果用于表征生产数据对应的排放量是否超过预设排放量。

可选地，本发明上述实施例中，分析模块包括：提取单元、分析单元、确定单元和比较单元。

其中，提取单元用于对生产数据进行特征提取，得到生产数据对应的特征向量，其中，特征向量包括：多个特征，及每个特征的特征值；分析单元用于将特征向量输入至决策树模型中，并获取决策树模型输出的分类结果，其中，分类结果用于表征排放量是否满足决策目标；确定单元用于基于分类结果和决策目标，确定排放量；比较单元用于将排放量与预设排放量进行比较，得到排放结果。

可选地，本发明上述实施例中，该装置还包括：提取模块、判断模块、生成模块和构建模块。

其中，获取模块还用于获取历史生产数据和对应的历史排放量；提取模块用于对历史生产数据进行特征提取，得到历史生产数据对应的特征向量；判断模块用于判断历史排放量是否满足决策目标，得到历史排放量对应的历史分类结果；生成模块用于基于特征向量和对应的历史分类结果，生成训练样本；构建模块用于基于训练样本构建决策树模型。

可选地，本发明上述实施例中，目标特征是相应节点包含的训练样本中最小信息熵对应的特征，其中，构建模块还用于基于每个特征的特征值和对应的分类结果，得到每个特征的信息熵。

可选地，本发明上述实施例中，该还包括：验证模块和判断模块。

其中，验证模块用于利用测试函数对构建好的决策树模型进行验证，得到测试结果；判断模块用于判断测试结果的错误率是否超过预设错误率；构建模块还用于如果是，则继续基于训练样本构建决策树模型，直至错误率小于预设错误率；分析模块还用于如果否，则利用决策树模型对生产数据进行分析，得到排放结果。

所述生产数据的处理装置包括处理器和存储器，上述获取模块、分析模块、构建模块、验证模块和判断模块等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来实现分析排放点的排放量是否超标的目的。

本发明实施例提供了一种存储介质，其上存储有程序，该程序被处理器执行时实现所述生产数据的处理方法。

本发明实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行所述生产数据的处理方法。

本发明实施例提供了一种电子设备，如图5所示，设备10包括至少一个处理器101、以及与处理器101连接的至少一个存储器102、总线103；其中，处理器101、存储器102通过总线103完成相互间的通信；处理器101用于调用存储器102中的程序指令，以执行上述的生产数据的处理方法。本文中的设备可以是服务器、PC、PAD、手机等。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序：

获取生产数据，其中，生产数据包括：生产环境数据和生产动态数据；利用预先构建好的决策树模型对生产数据进行分析，得到排放结果，其中，排放结果用于表征生产数据对应的排放量是否超过预设排放量。

对生产数据进行特征提取，得到生产数据对应的特征向量，其中，特征向量包括：多个特征，及每个特征的特征值；将特征向量输入至决策树模型中，并获取决策树模型输出的分类结果，其中，分类结果用于表征排放量是否满足决策目标；基于分类结果和决策目标，确定排放量；将排放量与预设排放量进行比较，得到排放结果。

在利用预先构建的决策树模型对生产数据进行分析，得到排放结果之前，获取历史生产数据和对应的历史排放量；对历史生产数据进行特征提取，得到历史生产数据对应的特征向量；判断历史排放量是否满足决策目标，得到历史排放量对应的历史分类结果；基于特征向量和对应的历史分类结果，生成训练样本；基于训练样本构建决策树模型。

基于每个特征的特征值和对应的分类结果，得到每个特征的信息熵。

在基于训练样本构建决策树模型之后，利用测试函数对构建好的决策树模型进行验证，得到测试结果；判断测试结果的错误率是否超过预设错误率；如果是，则继续基于训练样本构建决策树模型，直至错误率小于预设错误率；如果否，则利用决策树模型对生产数据进行分析，得到排放结果。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

在一个典型的配置中，设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种生产数据的处理方法，其特征在于，包括：

获取生产数据，其中，所述生产数据包括：生产环境数据和生产动态数据；

利用预先构建的决策树模型对所述生产数据进行分析，得到排放结果，其中，所述排放结果用于表征所述生产数据对应的排放量是否超过预设排放量。

2.根据权利要求1所述的方法，其特征在于，利用预先构建的决策树模型对所述生产数据进行分析，得到排放结果包括：

对所述生产数据进行特征提取，得到所述生产数据对应的特征向量，其中，所述特征向量包括：多个特征，及每个特征的特征值；

将所述特征向量输入至所述决策树模型中，并获取所述决策树模型输出的分类结果，其中，所述分类结果用于表征所述排放量是否满足决策目标；

基于所述分类结果和所述决策目标，确定所述排放量；

将所述排放量与所述预设排放量进行比较，得到所述排放结果。

3.根据权利要求2所述的方法，其特征在于，在利用预先构建的决策树模型对所述生产数据进行分析，得到排放结果之前，所述方法还包括：

获取历史生产数据和对应的历史排放量；

对所述历史生产数据进行特征提取，得到所述历史生产数据对应的特征向量；

判断所述历史排放量是否满足所述决策目标，得到所述历史排放量对应的历史分类结果；

基于所述特征向量和对应的历史分类结果，生成训练样本；

基于所述训练样本构建所述决策树模型。

4.根据权利要求3所述的方法，其特征在于，所述决策树模型包括依次连接的多个节点，每个节点包含全部或部分训练样本，其中，

连接至同一个父节点的所有子节点包含的训练样本是划分所述父节点包含的训练样本得到的；

在子节点包含的训练样本对应的历史分类结果相同的情况下，确定所述子节点为叶子节点；

除所述叶子节点之外的每个节点对应一个目标特征，所述目标特征用于对相应节点包含的训练样本进行划分。

5.根据权利要求4所述的方法，其特征在于，所述目标特征是相应节点包含的训练样本中最小信息熵对应的特征，其中，基于每个特征的特征值和对应的分类结果，得到所述每个特征的信息熵。

6.根据权利要求4所述的方法，其特征在于，同一个子节点包含的训练样本中目标特征的特征值相同。

7.根据权利要求3所述的方法，其特征在于，在基于所述训练样本构建所述决策树模型之后，所述方法还包括：

利用测试函数对构建好的决策树模型进行验证，得到测试结果；

判断所述测试结果的错误率是否超过预设错误率；

如果是，则继续基于所述训练样本构建所述决策树模型，直至所述错误率小于所述预设错误率；

如果否，则利用所述决策树模型对所述生产数据进行分析，得到所述排放结果。

8.一种生产数据的处理装置，其特征在于，包括：

获取模块，用于获取生产数据，其中，所述生产数据包括：生产环境数据和生产动态数据；

分析模块，用于利用预先构建的决策树模型对所述生产数据进行分析，得到排放结果，其中，所述排放结果用于表征所述生产数据对应的排放量是否超过预设排放量。

9.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，所述程序执行权利要求1至7中任意一项所述的生产数据的处理方法。

10.一种电子设备，其特征在于，所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线；其中，所述处理器、所述存储器通过所述总线完成相互间的通信；所述处理器用于调用所述存储器中的程序指令，以执行权利要求1至7中任意一项所述的生产数据的处理方法。