CN113609715B

CN113609715B - 一种数字孪生背景下的多元模型数据融合方法及系统

Info

Publication number: CN113609715B
Application number: CN202111178758.0A
Authority: CN
Inventors: 蒋勇; 王玉萍; 颜佳; 李方悦; 李宝章; 赵振; 姜海龙; 王拥军
Original assignee: Shenzhen Aoya Design Inc
Current assignee: Shenzhen Aoya Design Inc
Priority date: 2021-10-11
Filing date: 2021-10-11
Publication date: 2022-02-22
Anticipated expiration: 2041-10-11
Also published as: CN113609715A

Abstract

本公开提供了一种数字孪生背景下的多元模型数据融合方法及系统，从分布式集群中获取数字孪生数据集合并将数字孪生数据集合中的每个表的每一行转化为一个数据序列，通过计算两个数据序列之间的融合度的融合度函数计算数字孪生数据集合中的各个表之间的融合度，进而将数字孪生数据集合中的各个表进行融合，以此实现了降低在分布式系统的数据库中获取表之间的联系的时间复杂度、减少对表的检索的成本的有益成果。

Description

一种数字孪生背景下的多元模型数据融合方法及系统

技术领域

本公开属于分布式计算、大数据处理领域，具体涉及一种数字孪生背景下的多元模型数据融合方法及系统。

背景技术

数字孪生是利用大数据技术将物理世界的数据信息以虚拟仿真的方式存储在大数据集群中，使得对现实世界的数据存储和计算有了更高效率的提高。然而，数字孪生技术的数据生产和数据消费的过程中不可避免地带来了大规模的数据存储规模与存储成本，在分布式系统的数据库中获取表之间的联系其时间复杂度极大，对表的检索的成本极高，且不易于计算各个表之间的联系。

发明内容

本发明的目的在于提出一种数字孪生背景下的多元模型数据融合方法及系统，以解决现有技术中所存在的一个或多个技术问题，至少提供一种有益的选择或创造条件。

孪生数据存在大数据集群中存储规模巨大，数据库中获取表之间的联系其时间复杂度极大，对表的检索的成本极高，且不易于计算各个表之间的联系。

本公开提供了一种数字孪生背景下的多元模型数据融合方法及系统，从分布式集群中获取数字孪生数据集合并将数字孪生数据集合中的每个表的每一行转化为一个数据序列，通过计算两个数据序列之间的融合度的融合度函数计算数字孪生数据集合中的各个表之间的融合度，进而将数字孪生数据集合中的各个表进行融合。

为了实现上述目的，根据本公开的一方面，提供一种数字孪生背景下的多元模型数据融合方法，所述方法包括以下步骤：

S100，从分布式集群中获取数字孪生数据集合；

S200，将数字孪生数据集合中的每个表的每一行转化为一个数据序列；

S300，设置计算两个数据序列之间的融合度的函数为融合度函数；

S400，在融合度函数的基础上计算数字孪生数据集合中的各个表之间的融合度；

S500，根据数字孪生数据集合中的各个表之间的融合度，将数字孪生数据集合中的各个表进行融合。

进一步地，在S100中，从分布式集群中获取数字孪生数据集合的方法为：从分布式集群的存储中读取数字孪生数据集合，所述数字孪生数据集合为数据库中的多个表的集合，所述表为数据库中用来存储数据的对象，所述表中存放的字段为通过传感器采集的指定位置的最近一周的温度或湿度的数据、摄像头采集的监控流数据，或者分布式集群中服务器的CPU利用率或内存的分页缓冲池的存储大小或磁盘的平均响应时间的数据。

进一步地，在S200中，将数字孪生数据集合中的每个表的每一行转化为一个数据序列的方法为：将数字孪生数据集合中的每个表的每一行中包含的各个字段作为数组的各个元素由此构成的数组作为一个数据序列，所述数据序列中的每个字段以字符串形式存储。

进一步地，在S300中，设置计算两个数据序列之间的融合度的函数为融合度函数的方法为：

记数字孪生数据集合为集合Tset，数字孪生数据集合中的表的数量为n，数字孪生数据集合中的表的序号为变量i，i∈[1,n]，数字孪生数据集合中的序号为i的表为Ti；

记表Ti中行的数量为ni，表Ti中行的序号为变量ri，ri∈[1,ni]，表Ti中列的数量为mi，表Ti中行的序号为变量ci，ci∈[1,mi]，表Ti中序号为ri的行记为Ti(ri)，表Ti中序号为ci的列记为Ti[ci]，表Ti中位于序号为ri的行、序号为ci的列的字段记为Ti(ri)[ci]或者Ti[ci](ri)；

由此将表Ti中的序号为ri的行中包含的各个字段作为数组的各个元素由此构成的数组作为一个数据序列记为Ti_ri，Ti_ri中序号为ci的元素即为Ti_ri(ci)；

选取数字孪生数据集合中的任意序号q的表为Tq，同理，则表Tq中行的序号为变量rq，表Tq中行的数量为nq，表Tq中列的序号为变量cq，表Tq中列的数量为mq，rq∈[1,nq]，cq∈[1,mq]，表Tq中序号为rq的行记为Tq(rq)，表Tq中序号为cq的列记为Tq[cq]，由此将表Tq中的序号为rq的行中包含的各个字段作为数组的各个元素由此构成的数组作为一个数据序列记为Tq_rq，Tq_rq中序号为cq的元素即为Tq_rq(cq)，用来计算两个数据序列之间的融合度的融合度函数记为Mer()，函数equals()表示计算两个数组之间相同的元素的数量，函数exp()为计算以自然数e为底的指数函数，计算两个数据序列之间的融合度Mer(Ti_ri, Tq_rq)，函数len()为计算获取序列或数组或集合中元素的数量的函数，len(Ti_ri)表示Ti_ri中元素的数量，len(Tq_rq)表示Tq_rq中元素的数量，其中公式如下：

所得Mer(Ti_ri, Tq_rq)即为Ti_ri, Tq_rq之间的融合度，所述融合度函数Mer()的公式即为计算两个数据序列之间的融合度的融合度函数。

进一步地，在S400中，在融合度函数的基础上计算数字孪生数据集合中的各个表之间的融合度的方法为：

计算数字孪生数据集合中的表Ti与表Tq之间的融合度，记表Ti与表Tq之间的融合度为Mt(Ti,Tq)，计算Mt(Ti,Tq)的公式为：

所述Mt(Ti,Tq)的计算公式即为在融合度函数的基础上计算得到的数字孪生数据集合中的各个表之间的融合度。

进一步地，在S500中，根据数字孪生数据集合中的各个表之间的融合度，将数字孪生数据集合中的各个表进行融合的方法为：获取数字孪生数据集合，获取数字孪生数据集合中的表的数量n，数字孪生数据集合中的表的序号为变量i，开始将数字孪生数据集合中的各个表进行融合的程序：

S501，开始程序；令变量i的初始值为1；设置键值对集合Dict，键值对集合Dict中有n个键值对，以数字孪生数据集合中各表的序号作为Dict中各键值对的键；

S502，获取数字孪生数据集合中序号为i的表Ti；分别计算表Ti与数字孪生数据集合中除表Ti外的其他各个表的融合度，并计算得到表Ti与数字孪生数据集合中除表Ti外的其他各个表的融合度的算术平均值为Mt_avg；

S503，设置空数组Arr_i；从数字孪生数据集合中除表Ti外的其他各个表中，选取其中所有的与表Ti的融合度大于Mt_avg的表并将这些表的序号加入数组Arr_i中；

S504，将数组Arr_i作为Dict中键为i的键值对的值；

S505，判断是否满足约束条件i<n，若是则转到S506，若否则转到S507；

S506，令i的数值增加1；转到S502；

S507，输出键值对集合Dict；结束程序；

所述程序中输出的键值对集合Dict中的各个键值对即为表示数字孪生数据集合中的各个表的具有高于平均水平的融合度的表的集合，在集合Dict中序号为i的键值对的值为数组Arr_i，数组Arr_i中的元素为表Ti的对应的需要进行融合的表的序号，进而，在分布式集群的存储中，对数字孪生数据集合中的表Ti创建指针数组，所述指针数组由多个和表对应的指针构成，各个指针对应指向以数组Arr_i中各元素为序号的各个表，所述指针有多个，所述对数字孪生数据集合中的表创建指针的操作即为将数字孪生数据集合中的各个表进行融合，进行融合后当对表Ti进行调用时可以通过指针获取表Ti的对应的需要进行融合的表，降低了获取表Ti的对应的需要进行融合的表的时间复杂度。

本公开还提供了一种数字孪生背景下的多元模型数据融合系统，所述一种数字孪生背景下的多元模型数据融合系统包括：处理器、存储器及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述一种数字孪生背景下的多元模型数据融合方法中的步骤，所述一种数字孪生背景下的多元模型数据融合系统可以运行于桌上型计算机、笔记本、掌上电脑及云端数据中心等计算设备中，可运行的系统可包括，但不仅限于，处理器、存储器、服务器集群，所述处理器执行所述计算机程序运行在以下系统的单元中：

数据获取单元，用于从分布式集群中获取数字孪生数据集合；

数据序列单元，用于将数字孪生数据集合中的每个表的每一行转化为一个数据序列；

融合度函数单元，用于设置计算两个数据序列之间的融合度的函数为融合度函数；

表融合度计算单元，用于在融合度函数的基础上计算数字孪生数据集合中的各个表之间的融合度；

数据融合单元，用于根据数字孪生数据集合中的各个表之间的融合度将数字孪生数据集合中的各个表进行融合。

本公开的有益效果为：本公开提供了一种数字孪生背景下的多元模型数据融合方法及系统，通过计算两个数据序列之间的融合度的融合度函数计算数字孪生数据集合中的各个表之间的融合度，进而将数字孪生数据集合中的各个表进行融合，以此实现了降低在分布式系统的数据库中获取表之间的联系的时间复杂度、减少对表的检索的成本的有益成果。

附图说明

通过对结合附图所示出的实施方式进行详细说明，本公开的上述以及其他特征将更加明显，本公开附图中相同的参考标号表示相同或相似的元素，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，在附图中：

图1所示为一种数字孪生背景下的多元模型数据融合方法的流程图；

图2所示为一种数字孪生背景下的多元模型数据融合系统的系统结构图。

具体实施方式

以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述，以充分地理解本公开的目的、方案和效果。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

在本发明的描述中，若干的含义是一个或者多个，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

如图1所示为根据本发明的一种数字孪生背景下的多元模型数据融合方法的流程图，下面结合图1来阐述根据本发明的实施方式的一种数字孪生背景下的多元模型数据融合方法及系统。

本公开提出一种数字孪生背景下的多元模型数据融合方法，所述方法具体包括以下步骤：

S100，从分布式集群中获取数字孪生数据集合，所述数字孪生数据集合为数据库中的多个表的集合；

选取数字孪生数据集合中的任意序号q的表为Tq，同理，则表Tq中行的序号为变量rq，表Tq中行的数量为nq，表Tq中列的序号为变量cq，表Tq中列的数量为mq，rq∈[1,nq]，cq∈[1,mq]，表Tq中序号为rq的行记为Tq(rq)，表Tq中序号为cq的列记为Tq[cq]，由此将表Tq中的序号为rq的行中包含的各个字段作为数组的各个元素由此构成的数组作为一个数据序列记为Tq_rq，Tq_rq中序号为cq的元素即为Tq_rq(cq)，用来计算两个数据序列之间的融合度的融合度函数记为Mer()，函数equals()表示计算两个数组之间相同的元素的数量，函数exp()为计算以自然数e为底的指数函数，计算两个数据序列之间的融合度Mer(Ti_ri, Tq_rq)，其中公式如下：

S504，将数组Arr_i作为Dict中键为i的键值对的值；

S506，令i的数值增加1；转到S502；

S507，输出键值对集合Dict；结束程序；

所述程序中输出的键值对集合Dict中的各个键值对即为表示数字孪生数据集合中的各个表的具有高于平均水平的融合度的表的集合，在集合Dict中序号为i的键值对的值为数组Arr_i，数组Arr_i中的元素为表Ti的对应的需要进行融合的表的序号，进而，在分布式集群的存储中，对数字孪生数据集合中的表Ti创建指针，所述指针指向以数组Arr_i中各元素为序号的各个表，所述对数字孪生数据集合中的表创建指针的操作即为将数字孪生数据集合中的各个表进行融合，进行融合后当对表Ti进行调用时可以通过指针获取表Ti的对应的需要进行融合的表，降低了获取表Ti的对应的需要进行融合的表的时间复杂度；

其中，使用的部分代码可包括：

from utils import *

import random

class TwinData:

def __init__(self, nq, ni):

"""

#对数字孪生数据集合中的表创建指针的操作即为将数字孪生数据集合中的各个表进行融合

"""

self.rq = ni

self.pi = nq * ni - 1

self.lo = set()

self.beta = 0

def pre_mer(self):

"""

进行融合后当对表Ti进行调用时可以通过指针获取表Ti的对应的需要进行融合的表

"""

while True:

ar = random.randint(self.beta, self.pi)

if ar not in self.lo:

self.lo.add(ar)

return divmod(ar, self.rq)

def reset(self):

"""

:rtype: void

"""

self.lo = set();

由此，根据数字孪生数据集合中的各个表之间的融合度，将数字孪生数据集合中的各个表进行融合。

所述一种数字孪生背景下的多元模型数据融合系统包括：处理器、存储器及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述一种数字孪生背景下的多元模型数据融合方法实施例中的步骤，所述一种数字孪生背景下的多元模型数据融合系统可以运行于桌上型计算机、笔记本、掌上电脑及云端数据中心等计算设备中，可运行的系统可包括，但不仅限于，处理器、存储器、服务器集群。

本公开的实施例提供的一种数字孪生背景下的多元模型数据融合系统，如图2所示，该实施例的一种数字孪生背景下的多元模型数据融合系统包括：处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述一种数字孪生背景下的多元模型数据融合方法实施例中的步骤，所述处理器执行所述计算机程序运行在以下系统的单元中：

所述一种数字孪生背景下的多元模型数据融合系统可以运行于桌上型计算机、笔记本、掌上电脑及云端数据中心等计算设备中。所述一种数字孪生背景下的多元模型数据融合系统包括，但不仅限于，处理器、存储器。本领域技术人员可以理解，所述例子仅仅是一种数字孪生背景下的多元模型数据融合方法及系统的示例，并不构成对一种数字孪生背景下的多元模型数据融合方法及系统的限定，可以包括比例子更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述一种数字孪生背景下的多元模型数据融合系统还可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列 (Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立元器件门电路或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述一种数字孪生背景下的多元模型数据融合系统的控制中心，利用各种接口和线路连接整个一种数字孪生背景下的多元模型数据融合系统的各个分区域。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述一种数字孪生背景下的多元模型数据融合方法及系统的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据手机的使用所创建的数据（比如音频数据、电话本等）等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡（Smart Media Card, SMC），安全数字（Secure Digital, SD）卡，闪存卡（Flash Card）、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

本公开提供了一种数字孪生背景下的多元模型数据融合方法及系统，通过计算两个数据序列之间的融合度的融合度函数计算数字孪生数据集合中的各个表之间的融合度，进而将数字孪生数据集合中的各个表进行融合，以此实现了降低在分布式系统的数据库中获取表之间的联系的时间复杂度、减少对表的检索的成本的有益成果。

尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述，但其并非旨在局限于任何这些细节或实施例或任何特殊实施例，从而有效地涵盖本公开的预定范围。此外，上文以发明人可预见的实施例对本公开进行描述，其目的是为了提供有用的描述，而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。

Claims

1.一种数字孪生背景下的多元模型数据融合方法，其特征在于，所述方法包括以下步骤：

S100，从分布式集群中获取数字孪生数据集合；

S500，根据数字孪生数据集合中的各个表之间的融合度，将数字孪生数据集合中的各个表进行融合；

其中，在S100中，从分布式集群中获取数字孪生数据集合的方法为：从分布式集群的存储中读取数字孪生数据集合，所述数字孪生数据集合为数据库中的多个表的集合，所述表为数据库中用来存储数据的对象，所述表中存放的字段为通过传感器采集的指定位置的最近一周的温度的数据；

其中，在S200中，将数字孪生数据集合中的每个表的每一行转化为一个数据序列的方法为：将数字孪生数据集合中的每个表的每一行中包含的各个字段作为数组的各个元素由此构成的数组作为一个数据序列，所述数据序列中的每个字段以字符串形式存储；

其中，在S300中，设置计算两个数据序列之间的融合度的函数为融合度函数的方法为：

选取数字孪生数据集合中的任意序号q的表为Tq，q∈[1,n]，同理，则表Tq中行的序号为变量rq，表Tq中行的数量为nq，表Tq中列的序号为变量cq，表Tq中列的数量为mq，rq∈[1,nq]，cq∈[1,mq]，表Tq中序号为rq的行记为Tq(rq)，表Tq中序号为cq的列记为Tq[cq]，由此将表Tq中的序号为rq的行中包含的各个字段作为数组的各个元素由此构成的数组作为一个数据序列记为Tq_rq，Tq_rq中序号为cq的元素即为Tq_rq(cq)，用来计算两个数据序列之间的融合度的融合度函数记为Mer()，函数equals()表示计算两个数组之间相同的元素的数量，函数exp()为计算以自然数e为底的指数函数，函数len()为计算获取序列或数组或集合中元素的数量的函数，len(Ti_ri)表示Ti_ri中元素的数量，len(Tq_rq)表示Tq_rq中元素的数量，其中公式如下：

。

2.根据权利要求1所述的一种数字孪生背景下的多元模型数据融合方法，其特征在于，在S400中，在融合度函数的基础上计算数字孪生数据集合中的各个表之间的融合度的方法为：

计算数字孪生数据集合中的表Ti与表Tq之间的融合度，计算Mt(Ti,Tq)的公式为：

3.根据权利要求2所述的一种数字孪生背景下的多元模型数据融合方法，其特征在于，在S500中，根据数字孪生数据集合中的各个表之间的融合度，将数字孪生数据集合中的各个表进行融合的方法为：获取数字孪生数据集合，获取数字孪生数据集合中的表的数量n，数字孪生数据集合中的表的序号为变量i，开始将数字孪生数据集合中的各个表进行融合的程序：

S504，将数组Arr_i作为Dict中键为i的键值对的值；

S506，令i的数值增加1；转到S502；

S507，输出键值对集合Dict；结束程序；

所述程序中输出的键值对集合Dict中的各个键值对即为表示数字孪生数据集合中的各个表的具有高于平均水平的融合度的表的集合，在集合Dict中序号为i的键值对的值为数组Arr_i，数组Arr_i中的元素为表Ti的对应的需要进行融合的表的序号，进而，在分布式集群的存储中，对数字孪生数据集合中的表Ti创建指针数组，所述指针数组由多个和表对应的指针构成，各个指针对应指向以数组Arr_i中各元素为序号的各个表，所述指针有多个，所述对数字孪生数据集合中的表创建指针的操作即为将数字孪生数据集合中的各个表进行融合，进行融合后当对表Ti进行调用时通过指针获取表Ti的对应的需要进行融合的表，降低了获取表Ti的对应的需要进行融合的表的时间复杂度。

4.一种数字孪生背景下的多元模型数据融合系统，其特征在于，所述一种数字孪生背景下的多元模型数据融合系统包括：处理器、存储器及存储在所述存储器中并在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现权利要求1中的一种数字孪生背景下的多元模型数据融合方法中的步骤，所述一种数字孪生背景下的多元模型数据融合系统运行于桌上型计算机、笔记本、掌上电脑及云端数据中心中。