CN118095103B

CN118095103B - 水厂数字孪生应用增强方法、装置、存储介质及电子设备

Info

Publication number: CN118095103B
Application number: CN202410480170.8A
Authority: CN
Inventors: 王博; 葸维欣; 刘鑫
Original assignee: Jiangchuan Jinsha Hydropower Development Co ltd
Current assignee: Jiangchuan Jinsha Hydropower Development Co ltd
Priority date: 2024-04-22
Filing date: 2024-04-22
Publication date: 2024-07-05
Anticipated expiration: 2044-04-22
Also published as: CN118095103A

Abstract

本申请的实施例提供了一种水厂数字孪生应用增强方法、装置、存储介质及电子设备，涉及智慧水厂数字孪生应用技术领域，所述方法包括：在构建智慧水厂的数字孪生体的过程中，基于zookeeper和多协程的并发处理框架对智慧水厂物理设备的实时数据信息进行虚拟数据映射；在更新所述数字孪生体的过程中，基于互信息熵压缩算法去除所述数字孪生体产生的低质量数据；在完成所述数字孪生体的更新后，基于所述数字孪生体构建用于在孪生世界中预测任务的分布式预测模型。本申请可以有效降低现有的数字孪生技术的成本，同时保证映射精度，可应用于智慧水厂的运营中，具备提高计算效率和推理性能的双重优势。

Description

水厂数字孪生应用增强方法、装置、存储介质及电子设备

技术领域

本申请涉及智慧水厂数字孪生应用技术领域，具体而言，涉及一种水厂数字孪生应用增强方法、一种水厂数字孪生应用增强装置、一种电子设备以及一种计算机可读存储介质。

背景技术

目前，在水利水电工程领域，数字孪生技术与智慧工厂紧密结合应用已经成为常态。然而，现有的数字孪生技术在应用过程中，仅考虑基于简单的算法策略来为设计智能预测模块，如随机森林、DNN、RNN、LSTM等，这些方法的缺陷是高度依赖高质量训练数据，泛化能力不足，并且难以进行分布式化对大规模输入数据进行处理。

现有数字孪生技术在应用过程中存在以下问题：

1）预测模型的场景迁移能力不足；

2）数字孪生部署架构的拓展能力不足，弹性能力不足，难以应对海量数据并发和日益增长的需求；

3）预测模型的动态批处理能力待提升。

发明内容

本申请的实施例提供了一种水厂数字孪生应用增强方法、一种水厂数字孪生应用增强装置、一种电子设备以及一种计算机可读存储介质，已解决现有数字孪生技术在应用过程中存在的问题。

本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。

根据本申请实施例的第一方面，提供了一种水厂数字孪生应用增强方法，包括：

在构建智慧水厂的数字孪生体的过程中，基于zookeeper和多协程的并发处理框架对智慧水厂物理设备的实时数据信息进行虚拟数据映射；

在更新所述数字孪生体的过程中，基于互信息熵压缩算法去除所述数字孪生体产生的低质量数据；

在完成所述数字孪生体的更新后，基于所述数字孪生体构建用于在孪生世界中预测任务的分布式预测模型。

在本申请的一些实施例中，基于前述方案，所述基于zookeeper和多协程的并发处理框架对智慧水厂物理设备的实时数据信息进行虚拟数据映射，包括：

将Agent与物理设备适配，采集实时数据并上报至collector进行初步处理；

初步处理后的数据由collector转发至store节点进行存储；

store节点开放数据接口至zookeeper节点，zookeeper节点用于存放数据计算任务；

supervisor从zookeeper节点获取分配的任务，并交给worker进程执行具体的数据处理任务。

在本申请的一些实施例中，基于前述方案，所述基于互信息熵压缩算法去除所述数字孪生体产生的低质量数据，包括：

获取一个周期内数字孪生体产生的数据，所述一个周期内数字孪生体产生的数据包含多个数据向量；

计算一个周期内所有数据向量的信息熵之和；

基于所述信息熵之和确认阈值；

过滤掉小于所述阈值的数据。

在本申请的一些实施例中，基于前述方案，所述基于所述数字孪生体构建用于在孪生世界中预测任务的分布式预测模型，包括：

从所述数字孪生体中获取仿真的实时数据；

对所述仿真的实时数据进行特征工程处理，包括时域特征分析、周期信号频域特征分析以及PCA降维处理；

基于Ray框架搭建分布式训练环境；

利用进行特征工程处理后的所述仿真的实时数据离线训练分布式预测模型；

训练完毕后，线上部署分布式预测模型，并设计动态batch机制。

在本申请的一些实施例中，基于前述方案，所述利用进行特征工程处理后的所述仿真的实时数据离线训练分布式预测模型，包括：

步骤a，对所述仿真的实时数据进行缺失值和异常值处理，然后对处理后的数据进行时间序列特征的提取，以及标准化处理；

步骤b，中央服务器初始化DeepAR模型的参数，并下发DeepAR模型参数到子节点；

步骤c，子节点基于本地私有数据完成DeepAR模型的训练，并把DeepAR模型发送到中央服务器完成聚合；

步骤d，中央服务器基于FedAvg算法进行聚合操作，完成全局DeepAR模型的更新；

步骤e，重复步骤a至d，直到达到指定的迭代次数或者模型精准度达到要求。

在本申请的一些实施例中，基于前述方案，在构建了分布式预测模型后，还包括：

基于各类下游任务的私有数据对所述分布式预测模型进行调整，得到对应所述各类下游任务的分布式预测模型。

在本申请的一些实施例中，基于前述方案，在构建智慧水厂的数字孪生体的过程中，还包括：

引入运动学模型、动力学模型和过程模型构建智慧水厂的数字孪生体。

根据本申请实施例的第二方面，提供了一种水厂数字孪生应用增强装置，包括：

映射单元，用于在构建智慧水厂的数字孪生体的过程中，基于zookeeper和多协程的并发处理框架对智慧水厂物理设备的实时数据信息进行虚拟数据映射；

压缩单元，用于在更新所述数字孪生体的过程中，基于互信息熵压缩算法去除所述数字孪生体产生的低质量数据；

构建单元，用于在完成所述数字孪生体的更新后，基于所述数字孪生体构建用于在孪生世界中预测任务的分布式预测模型。

根据本申请实施例的第三方面，提供了一种电子设备，包括：存储器和处理器；

所述存储器，用于存储计算机指令；

所述处理器，用于调用所述存储器中存储的计算机指令，使得所述电子设备执行如第一方面所述的方法。

根据本申请实施例的第四方面，提供了一种计算机可读存储介质，所述存储介质中存储有计算机指令，所述计算机指令在计算机上运行时，使得所述计算机执行如第一方面所述的方法。

本申请技术方案的有益效果：

1）本发明面向智慧水厂的数字孪生应用提出了一种基于信息熵过滤的数据压缩算法，以更低的算力资源消耗实现和物理实时数据的处理以及对虚拟对象的渲染。该方法可以有效降低现有的数字孪生技术的成本，同时保证映射精度。

2）本发明在AI预测模块的设计上进行了优化，相较于传统的单一数据驱动的简单框架预测，本发明分别从模型训练和模型推理两个角度进行优化设计。在模型训练阶段，本发明提出基于Ray和DeepAR的分布式训练架构以实现训练加速和资源的充分利用；其次，在推理阶段，本发明提出一种自适应的动态批处理策略来提高预测模型的推理性能。

3）与现有的技术相比，本发明从设计的基于信息熵压缩技术，增强了数字孪生应用的性能，达到了降本增效的效果。

4）与现有数字孪生中的AI预测技术相比，本发明首次引入了分布式DeepAR预测模型，加速训练，并可根据实时数据完成数据微调和更新，提升模型的泛化能力，迁移到下游的各类预测任务中。与传统的每个场景重新训练一个预测模型相比，本发明提出的分布式预训练 + 微调机制，能够大幅度降低模型的构建成本。

5）与现有的技术相比，本发明设计的数字孪生+分布式AI框架具备较高的可拓展能力和实用性，通过改变物理映射对象，可应用在各类场景，利用数字化和智能化能力提升对象的监控、预测和管理。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示出了根据本申请一个实施例的一种水厂数字孪生应用增强方法的流程示意图；

图2示出了根据本申请一个实施例的一种采用本申请增强方法得到的系统架构示意图；

图3示出了根据本申请一个实施例的一种zookeeper和多协程的并发处理框架示意图；

图4示出了根据本申请一个实施例的一种分布式预测模型训练流程示意图；

图5示出了根据本申请一个实施例的预测模型经数据微调泛化到下游各类预测任务上的效果图；

图6示出了根据本申请一个实施例的一种水厂数字孪生应用增强装置的框图；

图7示出了根据本申请一个实施例的一种电子设备的结构框图；

图8示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本申请将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本申请的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本申请的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面将结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

参见图1，示出了根据本申请一个实施例的一种水厂数字孪生应用增强方法的流程示意图。

参见图2，示出了根据本申请一个实施例的一种采用本申请增强方法得到的系统架构示意图。

如图1所示，展示了一种水厂数字孪生应用增强方法，具体包括步骤S100至步骤S300。

步骤S100，在构建智慧水厂的数字孪生体的过程中，基于zookeeper和多协程的并发处理框架对智慧水厂物理设备的实时数据信息进行虚拟数据映射。

需要说明的是，zookeeper是指分布式应用程序协调服务软件，是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。

可以理解的是，构建智慧水厂的数字孪生体的具体过程可以参考图2，包括几何模型建立、物理模型建立和逻辑行为模型建立。

构建过程包括：在物理空间中针对各个子系统的传感器进行数据收集，比如温度、压力、运动状态等，然后集成来自不同源的数据。以这些数据建立高保真虚拟模型，如物理模型，3D模型和行为模型等，在此过程中需要完成复杂的计算任务，如流体动力学模拟、结构分析或多物理场模拟等。

在处理物理设备产生的实时数据时，考虑到对数据的并发处理以提高数据处理速度，本申请实施例提出了基于zookeeper和多协程的并发处理框架进行虚拟数据映射这一技术手段来提升数字孪生映射的性能。

在一些可行的实施例中，基于前述方案，所述基于zookeeper和多协程的并发处理框架对智慧水厂物理设备的实时数据信息进行虚拟数据映射，包括：

初步处理后的数据由collector转发至store节点进行存储；

其中，Agent是指能够感知环境、进行决策和执行动作的智能实体；collector是指收集器；store是指仓库；supervisor是进程管理工具，可以很方便的用来启动、重启关闭进程；worker 进程是指处请求的工作进程。

示例性的，参见图3，示出了根据本申请一个实施例的一种zookeeper和多协程的并发处理框架示意图。

通过图3所示的分布式计算框架，可以进一步加速对物理环境数据的实时计算和处理，保障虚拟世界映射的及时性和有效性。

在一些可行的实施例中，基于前述方案，在构建智慧水厂的数字孪生体的过程中，还包括：

可以理解的是，在进行物理世界向数字世界映射的过程中，需要依靠机理模型来提高孪生体的映射准确度和高保真模拟程度，所以，本申请分别引入了运动学模型、动力学模型和过程模型来支撑数字孪生世界。

继续参考图1，步骤S200，在更新所述数字孪生体的过程中，基于互信息熵压缩算法去除所述数字孪生体产生的低质量数据。

可以理解的是，通过互信息熵压缩算法可以去除非关键感知信息，降低数字孪生渲染的功耗成本，同时保证实时孪生映射的精度。

在一些可行的实施例中，基于前述方案，所述基于互信息熵压缩算法去除所述数字孪生体产生的低质量数据，包括：

计算一个周期内所有数据向量的信息熵之和；

基于所述信息熵之和确认阈值；

过滤掉小于所述阈值的数据。

示例性的，互信息熵压缩算法的具体过程如下：

1. 计算两个向量之间的信息熵：

；

2. 计算向量与前面每个向量之间的信息熵：

；

3. 一个周期内产生的a个向量的信息熵之和：

；

4. 计算阈值，熵小于该阈值的周期数据被剔除：

；

5. 保留熵大于阈值的数据：

。

可以理解的是，通过这种方式，本申请在更新数字孪生体时，实现了数据的精简和计算负担的降低，达到了降本增效的效果。

继续参考图1，步骤S300，在完成所述数字孪生体的更新后，基于所述数字孪生体构建用于在孪生世界中预测任务的分布式预测模型。

可以理解的是，构建的分布式预测模型可以应对工业控制、智能制造等对实时性要求较高的应用场景；并且将数字孪生技术和预测模型相结合，可以构建一个更加智能化和自动化的工业级管理系统，实现高效的数据处理、精准的状态监测和预测，以及优化的运营决策。

在一些可行的实施例中，基于前述方案，所述基于所述数字孪生体构建用于在孪生世界中预测任务的分布式预测模型，包括：

从所述数字孪生体中获取仿真的实时数据；

基于Ray框架搭建分布式训练环境；

可以理解的是，本申请利用基于Ray分布式框架的训练方法和dynamic batch策略，旨在实现AI预测模型训练速度的加快，提高其在实际应用中的推理性能，这种方法使得模型能够更快地学习并更准确的预测，从而提高整个系统的响应速度和决策质量。分布式预测模型的构建过程可以参见图2。

在一些可行的实施例中，基于前述方案，所述利用进行特征工程处理后的所述仿真的实时数据离线训练分布式预测模型，包括：

其中，FedAvg算法的原理为：

客户端进行局部模型的更新：；

中央服务器的聚合操作仅需要完成一个平均操作：；

表1则是说明了DeepAR在训练时的参数设置。注意DeepAR模型的输出是下一时刻的预测值的高斯分布，因此其损失函数为：，其中z是预测时刻上的真实值，基于该损失函数，期望模型的预测输出去逼近真实值的数据分布。

表 1 DeepAR模型参数设置

示例性的，参见图4，示出了根据本申请一个实施例的一种分布式预测模型训练流程示意图。

如图4所示，在本示例中，分布式预测模型也采用Center模式，即中央节点负责下发全局模型参数以及聚合子节点上传的局部模型参数，然后整体模型的权重更新。子节点则是负责提供算力支持，基于本地的数据集训练得到局部模型，并把本地局部模型的参数上传到中央服务器上。

在一些可行的实施例中，基于前述方案，在构建了分布式预测模型后，还包括：

示例性的，参见图5，示出了根据本申请一个实施例的预测模型经数据微调泛化到下游各类预测任务上的效果图。

如图5所示，各类下游任务提供私有数据在原始的预训练DeepAR模型上进行数据微调，得到该任务上的专有预测模型。通过数据微调，该预测模型学习到了该任务上的数据分布，因此，在此任务上具备较好的预测性能。微调后，则开启一个预测模型实例（一个进程）部署在后端，开放API供用户调用，提供用户以预测能力。

考虑到高并发场景，本申请引入了一种动态batch机制，即在用户请求数量较多时，增大batch size，然后将这些请求打包到一个batch中送入预测模型中处理，集中利用计算资源；相反，当后端检测到用户请求数较少时，会相应的缩小batch size，降低用户的排队等待时延。

本申请面向智慧水厂应用而设计，利用水厂丰富的监控数据完成数字孪生模型的构建，增强对水厂物理实情的监管，在数据驱动下不断优化水厂各个环节；其次，孪生体中设计的智能预测模块能够有效泛化到下游的多种AI预测性任务上，比如设备故障预测、能耗预测、水质变化预测等。

综上，本申请在现有数字孪生工业级应用的方法基础上，进一步加入了成本控制算法（数据压缩）和智能化增强算法（分布式AI预测模型），通过感知层数据预处理、中台层孪生体构建以及智能化AI模型训练等方法，实现了对现有数字孪生应用的功能增强。

以下介绍本申请的装置实施例，可以用于执行本申请上述实施例中的一种水厂数字孪生应用增强方法。对于本申请装置实施例中未披露的细节，请参照本申请上述方法的实施例。

参照图6所示，根据本申请的一个实施例的一种水厂数字孪生应用增强装置600，包括：映射单元601、压缩单元602和构建单元603。

其中，映射单元601，用于在构建智慧水厂的数字孪生体的过程中，基于zookeeper和多协程的并发处理框架对智慧水厂物理设备的实时数据信息进行虚拟数据映射；

压缩单元602，用于在更新所述数字孪生体的过程中，基于互信息熵压缩算法去除所述数字孪生体产生的低质量数据；

构建单元603，用于在完成所述数字孪生体的更新后，基于所述数字孪生体构建用于在孪生世界中预测任务的分布式预测模型。

如图7所示，本申请实施例还提供一种电子设备700，包括存储器710、处理器720及存储在存储器710上并可在处理器上运行的计算机程序711，处理器720执行计算机程序711时实现上述一种水厂数字孪生应用增强方法。

由于本实施例所介绍的电子设备为实施本申请实施例中一种水厂数字孪生应用增强装置所采用的设备，故而基于本申请实施例中所介绍的方法，本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式，所以在此对于该电子设备如何实现本申请实施例中的方法不再详细介绍，只要本领域所属技术人员实施本申请实施例中的方法所采用的设备，都属于本申请所欲保护的范围。

在具体实施过程中，该计算机程序711被处理器执行时可以实现第一方面对应的实施例中任一实施方式。

需要说明的是，图8示出的电子设备的计算机系统800仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图8所示，计算机系统800包括中央处理单元（Central Processing Unit，CPU）801，其可以根据存储在只读存储器（Read-Only Memory，ROM）802中的程序或者从储存部分808加载到随机访问存储器（Random Access Memory，RAM）803中的程序而执行各种适当的动作和处理，例如执行上述实施例中所述的方法。在RAM 803中，还存储有系统操作所需的各种程序和数据。中央处理单元（Central Processing Unit，CPU） 801、只读存储器（Read-Only Memory，ROM）802以及随机访问存储器（Random Access Memory，RAM）803通过总线804彼此相连。输入/输出（Input /Output，I/O）接口805也连接至总线804。

以下部件连接至输入/输出（Input /Output，I/O）接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管（Cathode Ray Tube，CRT）、液晶显示器（Liquid CrystalDisplay，LCD）等以及扬声器等的输出部分807；包括硬盘等的储存部分808；以及包括诸如LAN（Local Area Network，局域网）卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入储存部分808。

特别地，根据本申请的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本申请的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元（Central Processing Unit，CPU）801执行时，执行本申请的系统中限定的各种功能。

需要说明的是，本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（Erasable Programmable Read Only Memory，EPROM）、闪存、光纤、便携式紧凑磁盘只读存储器（Compact Disc Read-Only Memory，CD-ROM）、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中所述的一种水厂数字孪生应用增强方法。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现上述实施例中所述的一种水厂数字孪生应用增强方法。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本申请实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质（可以是CD-ROM，U盘，移动硬盘等）中或网络上，包括若干指令以使得一台计算设备（可以是个人计算机、服务器、触控终端、或者网络设备等）执行根据本申请实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的实施方式后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims

1.一种水厂数字孪生应用增强方法，其特征在于，包括：

在完成所述数字孪生体的更新后，基于所述数字孪生体构建用于在孪生世界中预测任务的分布式预测模型；

所述基于互信息熵压缩算法去除所述数字孪生体产生的低质量数据，包括：

计算一个周期内所有数据向量的信息熵之和；

基于所述信息熵之和确认阈值；

过滤掉小于所述阈值的数据；

其中，互信息熵压缩算法的具体过程如下：

（1）计算两个向量之间的信息熵：

；

（2）计算向量与前面每个向量之间的信息熵：

；

（3）一个周期内产生的a个向量的信息熵之和：

；

（4）计算阈值，熵小于该阈值的周期数据被剔除：

；

（5）保留熵大于阈值的数据：

;

所述基于所述数字孪生体构建用于在孪生世界中预测任务的分布式预测模型，包括：

从所述数字孪生体中获取仿真的实时数据；

基于Ray框架搭建分布式训练环境；

训练完毕后，线上部署分布式预测模型，并设计动态batch机制；

所述利用进行特征工程处理后的所述仿真的实时数据离线训练分布式预测模型，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于zookeeper和多协程的并发处理框架对智慧水厂物理设备的实时数据信息进行虚拟数据映射，包括：

初步处理后的数据由collector转发至store节点进行存储；

3.根据权利要求1所述的方法，其特征在于，在构建了分布式预测模型后，还包括：

4.根据权利要求1所述的方法，其特征在于，在构建智慧水厂的数字孪生体的过程中，还包括：

5.一种水厂数字孪生应用增强装置，应用于如权利要求1-4任一项所述的方法，其特征在于，包括：

6.一种电子设备，其特征在于，包括：存储器和处理器；

所述存储器，用于存储计算机指令；

所述处理器，用于调用所述存储器中存储的计算机指令，使得所述电子设备执行如权利要求1-4任一项所述的方法。

7.一种计算机可读存储介质，其特征在于，所述存储介质中存储有计算机指令，所述计算机指令在计算机上运行时，使得所述计算机执行如权利要求1-4任一项所述的方法。