WO2024021107A1

WO2024021107A1 - 工业数据的存储方法及装置

Info

Publication number: WO2024021107A1
Application number: PCT/CN2022/109203
Authority: WO
Inventors: 王璐; 于志强; 于琪
Original assignee: 西门子股份公司; 西门子（中国）有限公司
Priority date: 2022-07-29
Filing date: 2022-07-29
Publication date: 2024-02-01

Abstract

本发明提出了一种工业数据的存储方法，所述存储方法包括：在边缘设备获取工业现场设备中的非结构化数据；比较所述非结构化数据的使用频率与一第一阈值，将使用频率低于所述第一阈值的非结构化数据发送至服务器，并将使用频率高于所述第一阈值的非结构化数据保存至所述边缘设备中；在所述服务器将使用频率低于所述第一阈值的非结构化数据存储于所述服务器的多个存储节点中。

Description

工业数据的存储方法及装置

技术领域

本发明主要涉及工业数字化领域，尤其涉及一种工业数据的存储方法及装置。

背景技术

工业领域，例如图像处理和预测性维护中越来越多的使用到非结构化数据，非结构化数据是数据结构不规则或不完整，没有预定义的数据模型，不方便用数据库二维逻辑表来表现的数据，主要包括图像、视频、音频、日志文件和二进制文件，不同于结构化数据或时序数据，非结构化数据通常由于数据量巨大无法保存于传统的数据库中，并且因为这些数据的非结构化很难发现他们之间的关系。

发明内容

为了解决上述技术问题，本发明提供一种工业数据的存储方法及装置，以高效地存储和调用工业现场中的非结构化数据。

为实现上述目的，本发明提出了一种工业数据的存储方法，所述存储方法包括：在边缘设备获取工业现场设备中的非结构化数据；比较所述非结构化数据的使用频率与一第一阈值，将使用频率低于所述第一阈值的非结构化数据发送至服务器，并将使用频率高于所述第一阈值的非结构化数据保存至所述边缘设备中；在所述服务器将使用频率低于所述第一阈值的非结构化数据存储于所述服务器的多个存储节点中。为此，通过将使用频率小于第一阈值的非结构化数据存储于服务器中，使用频率大于第一阈值的非结构化数据存储于边缘设备上，实现了非结构化数据在边缘设备和服务器的多层级存储，降低了边缘设备的数据存储量，提高了非结构化数据的存储效率。

可选地，所述存储节点包括主存储单元和归档存储单元，所述方法还包括：比较所述非结构化数据的使用间隔时间与一第二阈值，将使用间隔时间小于所述第二阈值的非结构化数据存储于所述主存储单元，并将使用间隔时间大于所述第二阈值的非结构化数据存储于所述归档存储单元。为此，将短期会用的数据存储于主存储单元中，将长期不用的数据存储于归档存储单元中，降低了主存储单元的存储负载，提高了数据的存储效率。

可选地，所述方法还包括：在边缘设备获取工业现场设备中的结构化数据，匹配所述结构化数据与历史数据，将匹配之后的第一元数据上传并存储于所述服务器中，所述第一元数据包括所述结构化数据与历史数据之间的对应关系。为此，在边缘端和服务器端存储关键结构化数据的数据属性，可以极大地降低数据量，提高工业数据的存储效率。

可选地，所述方法还包括：获取第三方软件的数据，匹配所述第三方软件的数据与时间戳和标签，将匹配之后的第二元数据上传并存储于所述服务器中，所述第二元数据包括所述第三方软件的数据与时间戳和标签之间的对应关系。为此，在边缘端和服务器端存储外部第三方软件的数据属性，丰富了数据类型，提高了边缘设备的处理能力。

可选地，所述方法还包括：获取所述存储节点中的视频数据，将所述视频数据转换为视频流，并响应于请求将所述视频流推送至视频播放器中。为此，可以实现对服务器中的视频数据的高效调用。

本发明还提出了一种工业数据的存储装置，所述存储装置包括：获取模块，在边缘设备获取工业现场设备中的非结构化数据；比较模块，比较所述非结构化数据的使用频率与一第一阈值，将使用频率低于所述第一阈值的非结构化数据发送至服务器，并将使用频率高于所述第一阈值的非结构化数据保存至所述边缘设备中；存储模块，在所述服务器将使用频率低于所述第一阈值的非结构化数据存储于所述服务器的多个存储节点中。

可选地，所述存储节点包括主存储单元和归档存储单元，所述装置还包括：比较所述非结构化数据的使用间隔时间与一第二阈值，将使用间隔时间小于所述第二阈值的非结构化数据存储于所述主存储单元，并将使用间隔时间大于所述第二阈值的非结构化数据存储于所述归档存储单元。

可选地，所述装置还包括：在边缘设备获取工业现场设备中的结构化数据，匹配所述结构化数据与历史数据，将匹配之后的第一元数据上传并存储于所述服务器中，所述第一元数据包括所述结构化数据与历史数据之间的对应关系。

可选地，所述装置还包括：获取第三方软件的数据，匹配所述第三方软件的数据与时间戳和标签，将匹配之后的第二元数据上传并存储于所述服务器中，所述第二元数据包括所述第三方软件的数据与时间戳和标签之间的对应关系。

可选地，所述装置还包括：获取所述存储节点中的视频数据，将所述视频数据转换为视频流，并响应于请求将所述视频流推送至视频播放器中。

本发明还提出了数据存储系统，所述数据存储系统包括边缘设备和服务器，所述边缘设备获取工业现场设备中的非结构化数据；比较所述非结构化数据的使用频率与一第一阈值，将使用频率低于所述第一阈值的非结构化数据发送至所述服务器，并将使用频率高于所述第一阈值的非结构化数据保存至所述边缘设备中；所述服务器将使用频率低于所述第一阈值的非结构化数据存储于所述服务器的多个存储节点中。

本发明还提出了一种电子设备，包括处理器、存储器和存储在所述存储器中的指令，其中所述指令被所述处理器执行时实现如上所述的方法。

本发明还提出了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令在被运行时执行如上所述的方法。

附图说明

以下附图仅旨在于对本发明做示意性说明和解释，并不限定本发明的范围。其中，

图1是根据本发明的一实施例的一种工业数据的存储方法的流程图；

图2是根据本发明的一实施例的一种工业数据的存储方法的实施环境的示意图；

图3是根据本发明的一实施例的一种工业数据的存储装置的示意图；

图4是根据本发明的一实施例的一种电子设备的示意图。

附图标记说明

100工业数据的存储方法

110-130步骤

21第一现场设备

22第二现场设备

23边缘设备

231第一收发器

232第一缓存

233第二缓存

234上传调度器

235第二收发器

236事件处理单元

237边缘端元数据存储单元

238第三收发器

239匹配单元

24第三方软件

25服务器

251版本控制单元

252归档单元

253发现单元

254注册单元

255负载平衡单元

256备份单元

257流媒体转换单元

258第四收发器

26视频播放器

27数据访问单元

N1,N2,N3存储节点

RN(Replication Node)备份节点

MN(Management Node)管理节点

AS(Archive Storage)归档存储单元

SS(Snapshots)版本镜像

VS(Volume Storage)主存储单元

MS(Metadata Storage)服务器端元数据存储单元

300工业数据的存储装置

310获取模块

320比较模块

330存储模块

400电子设备

410处理器

420存储器

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解，现对照附图说明本发明的具体实施方式。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其它不同于在此描述的其它方式来实施，因此本发明不受下面公开的具体实施例的限制。

如本申请和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其他的步骤或元素。

本发明提出了一种工业数据的存储方法，图1是根据本发明的一实施例的一种工业数据的存储方法100的流程图，如图1所示，存储方法100包括：

步骤110，在边缘设备获取工业现场设备中的非结构化数据。

工业现场设备在运行过程中会产生非结构化数据，非结构化数据是数据结构不规则或不完整，没有预定义的数据模型，不方便用数据库二维逻辑表来表现的数据，主要包括图像、视频、音频、日志文件和二进制文件。边缘设备位于工业现场，以获取工业现场设备中的非结构化数据。边缘设备可以获取工业现场设备的历史数据中的非结构化数据，也可以获取工业现场设备的实时数据中的非结构化数据。图2是根据本发明的一实施例的一种工业数据的存储方法的实施环境的示意图，如图2所示，第一现场设备21在运行过程中产生了非结构化数据，非结构化数据可以来自于历史数据，例如视频、图像、音频、模型、文件等，非结构化数据也可以来自于实时数据，例如来自于摄像头采集的实时图像，麦克风采集的实时音频等，边缘设备23包括第一收发器231，边缘设备23通过第一收发器231获取第一现场设备21中的非结构化数据。

在一些实施例中，方法还包括：在边缘设备获取工业现场设备中的结构化数据，匹配结构化数据与历史数据，将匹配之后的第一元数据上传并存储于服务器中，第一元数据包括结构化数据与历史数据之间的对应关系。具体地，如图2所示，第二现场设备22例如PLC(可编程逻辑控制器)，驱动器，AGV(自动引导车)，传感器，CNC(计算机数控)，电机，机器人等在运行过程中产生结构化数据，也可以称之为时序数据，边缘设备23包括第二收发器235，边缘设备23通过第二收发器235获取第二现场设备22中的结构化数据，事件处理单元236将结构化数据与历史数据进行匹配，例如将传感器感测的数据与历史数据进行匹配，匹配到某一数据与历史数据中的奇点数据，某一数据与奇点数据的对应关系即为第一元数据，也称之为数据属性，事件处理单元236将第一元数据发送至边缘端元数据存储单元237存储，随后上传至服务器25的存储节点中的服务器端元数据存储单元MS中。为此，在边缘端和服务器端存储关键结构化数据的数据属性，可以极大地降低数据量，提高工业数据的存储效率。

在一些实施例中，方法还包括：获取第三方软件的数据，匹配第三方软件的数据与时间戳和标签，将匹配之后的第二元数据上传并存储于服务器中，第二元数据包括第三方软件的数据与时间戳和标签之间的对应关系。具体地，如图2所示，第三收发器238获取第三方软件24，例如ERP(企业资源规划系统)，MES(制造执行系统)，WMS(仓储管理系统)，PLM(产品生命周期管理系统)，SCADA(监视控制与数据采集系统)等的数据，匹配单元239匹配第三方软件24的数据与时间戳和标签，匹配到的数据与时间戳和标签的对应关系即为第二元数据，也称之为数据属性，匹配单元239将第二元数据发送至边缘端元数据存储单元237存储，随后上传至服务器25的存储节点中的服务器端元数据存储单元MS中。为此，在边缘端和服务器端存储外部第三方软件的数据属性，丰富了数据类型，提高了边缘设备的处理能力。

步骤120，比较非结构化数据的使用频率与一第一阈值，将使用频率低于第一阈值的非结构化数据发送至服务器，并将使用频率高于第一阈值的非结构化数据保存至边缘设备中。

第一阈值可以由用户输入，也可以由系统预设，或者由数据模型生成，若使用频率低于第一阈值，表明该非结构化数据的使用频率偏低，对于使用频率偏低的非结构化数据，将其上传至服务器上，避免占用边缘设备的存储空间，若使用频率高于第一阈值，表明该非结构化数据的使用频率偏高，对于使用频率偏高的非结构化数据，将其保存至边缘设备中，避免数据通信导致的延迟。如图2所示，第一收发器231将非结构化数据发送至第一缓存232中，第一缓存232比较非结构化数据的使用频率与一第一阈值，将使用频率低于第一阈值的非结构化数据发送至第二缓存233，第二缓存233通过上传调度器234将使用频率低于第一阈值的非结构化数据发送至服务器25中存储节点的主存储单元VS中。

步骤130，在服务器将使用频率低于第一阈值的非结构化数据存储于服务器的多个存储节点中。

服务器可以包括管理节点和多个存储节点，管理节点用于对多个存储节点进行管理，例如发现，注册，负载平衡，备份等，存储节点用于存储上传来的非结构化数据，由此，将使用频率小于第一阈值的非结构化数据存储于服务器中，使用频率大于第一阈值的非结构化数据存储于边缘设备上，实现了非结构化数据在边缘设备和服务器的多层级存储，降低了边缘设备的数据存储量，提高了非结构化数据的存储效率。如图2所示，服务器25包括管理节点MN，存储节点N1，N2，N3，管理节点MN包括版本控制单元251，归档单元252，发现单元253，注册单元254，负载平衡单元255和备份单元256，各存储节点N1，N2，N3包括归档存储单元AS，版本镜像SS，主存储单元VS和服务器端元数据存储单元MS，版本控制单元251连接至各存储节点的版本镜像SS，用于实现存储节点的镜像恢复功能，归档单元252连接至各存储节点的归档存储单元AS，用于实现存储节点的归档存储功能(归档，压缩，加密等)，发现单元253和注册单元254用于发现和注册新的存储节点，负载平衡单元255用于获取各存储节点的空余存储容量，并根据空余存储容量来确定将非结构化数据存储的存储节点。服务器25还包括备份节点RN，备份节点RN中备份有各存储节点的数据，管理节点MN中的备份单元256用于对备份节点RN进行控制。

在一些实施例中，存储节点包括主存储单元和归档存储单元，方法还包括：比较非结构化数据的使用间隔时间与一第二阈值，将使用间隔时间小于第二阈值的非结构化数据存储于主存储单元，并将使用间隔时间大于第二阈值的非结构化数据存储于归档存储单元。具体地，如图2所示，若使用间隔时间小于第二阈值，表明该结构化数据短期会用，将使用间隔时间小于第二阈值的非结构化数据存储于主存储单元VS中，若使用间隔时间大于第二阈值，表明该结构化数据长期不用，将使用间隔时间大于第二阈值的非结构化数据存储于归档存储单元。为此，将短期会用的数据存储于主存储单元中，将长期不用的数据存储于归档存储单元中，降低了主存储单元的存储负载，提高了数据的存储效率。

在一些实施例中，方法还包括：获取存储节点中的视频数据，将视频数据转换为视频流，并响应于请求将视频流推送至视频播放器中。如图2所示，流媒体转换单元257获取存储节点中的非结构化数据，例如视频，将视频数据转换为视频流，并响应于请求通过第四收发器258将视频流推送至视频播放器26中。为此，可以实现对服务器中的视频数据的高效调用。可选地，还可以通过数据访问单元27访问边缘设备23的第一缓存232中存储的非结构化数据，或者访问服务器25中各存储节点中存储的数据。

本发明的实施例提供了一种工业数据的存储方法，通过将使用频率小于第一阈值的非结构化数据存储于服务器中，使用频率大于第一阈值的非结构化数据存储于边缘设备上，实现了非结构化数据在边缘设备和服务器的多层级存储，降低了边缘设备的数据存储量，提高了非结构化数据的存储效率。

本发明还提出了一种工业数据的存储装置，图3是根据本发明的一实施例的一种工业数据的存储装置300的示意图，如图3所示，存储装置300包括：

获取模块310，在边缘设备获取工业现场设备中的非结构化数据；

比较模块320，比较非结构化数据的使用频率与一第一阈值，将使用频率低于第一阈值的非结构化数据发送至服务器，并将使用频率高于第一阈值的非结构化数据保存至边缘设备中；

存储模块330，在服务器将使用频率低于第一阈值的非结构化数据存储于服务器的多个存储节点中。

在一些实施例中，存储节点包括主存储单元和归档存储单元，装置300还包括：比较非结构化数据的使用间隔时间与一第二阈值，将使用间隔时间小于第二阈值的非结构化数据存储于主存储单元，并将使用间隔时间大于第二阈值的非结构化数据存储于归档存储单元。

在一些实施例中，装置300还包括：在边缘设备获取工业现场设备中的结构化数据，匹配所述结构化数据与历史数据，将匹配之后的第一元数据上传并存储于所述服务器中，所述第一元数据包括所述结构化数据与历史数据之间的对应关系。

在一些实施例中，装置300还包括：获取第三方软件的数据，匹配所述第三方软件的数据与时间戳和标签，将匹配之后的第二元数据上传并存储于所述服务器中，所述第二元数据包括所述第三方软件的数据与时间戳和标签之间的对应关系。

在一些实施例中，装置300还包括：获取存储节点中的视频数据，将视频数据转换为视频流，并响应于请求将视频流推送至视频播放器中。

本发明还提出了一种数据存储系统，数据存储系统包括如图2所示的边缘设备23和服务器25，边缘设备23获取工业现场设备中的非结构化数据；比较非结构化数据的使用频率与一第一阈值，将使用频率低于第一阈值的非结构化数据发送至服务器，并将使用频率高于第一阈值的非结构化数据保存至边缘设备中；服务器25将使用频率低于第一阈值的非结构化数据存储于服务器25的多个存储节点中。

本发明还提出一种电子设备400。图4是根据本发明的一实施例的一种电子设备400的示意图。如图4所示，电子设备400包括处理器410和存储器420，存储器420存储中存储有指令，其中指令被处理器410执行时实现如上文所述的方法100。

本发明还提出一种计算机可读存储介质，其上存储有计算机指令，计算机指令在被运行时执行如上文所述的方法100。

本发明的方法和装置的一些方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。处理器可以是一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理器件(DAPD)、可编程逻辑器件(PLC)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器或者其组合。此外，本发明的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。例如，计算机可读介质可包括，但不限于，磁性存储设备(例如，硬盘、软盘、磁带……)、光盘(例如，压缩盘(CD)、数字多功能盘(DVD)……)、智能卡以及闪存设备(例如，卡、棒、键驱动器……)。

在此使用了流程图用来说明根据本申请的实施例的方法所执行的操作。应当理解的是，前面的操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各种步骤。同时，或将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

应当理解，虽然本说明书是按照各个实施例描述的，但并非每个实施例仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

以上所述仅为本发明示意性的具体实施方式，并非用以限定本发明的范围。任何本领域的技术人员，在不脱离本发明的构思和原则的前提下所作的等同变化、修改与结合，均应属于本发明保护的范围。

Claims

一种工业数据的存储方法(100)，其特征在于，所述存储方法(100)包括：

在边缘设备获取工业现场设备中的非结构化数据(110)；

比较所述非结构化数据的使用频率与一第一阈值，将使用频率低于所述第一阈值的非结构化数据发送至服务器，并将使用频率高于所述第一阈值的非结构化数据保存至所述边缘设备中(120)；

在所述服务器将使用频率低于所述第一阈值的非结构化数据存储于所述服务器的多个存储节点中(130)。
根据权利要求1所述的存储方法(100)，其特征在于，所述存储节点包括主存储单元和归档存储单元，所述方法(100)还包括：比较所述非结构化数据的使用间隔时间与一第二阈值，将使用间隔时间小于所述第二阈值的非结构化数据存储于所述主存储单元，并将使用间隔时间大于所述第二阈值的非结构化数据存储于所述归档存储单元。
根据权利要求1或2所述的存储方法(100)，其特征在于，所述方法(100)还包括：在边缘设备获取工业现场设备中的结构化数据，匹配所述结构化数据与历史数据，将匹配之后的第一元数据上传并存储于所述服务器中，所述第一元数据包括所述结构化数据与历史数据之间的对应关系。
根据权利要求3所述的存储方法(100)，其特征在于，所述方法(100)还包括：获取第三方软件的数据，匹配所述第三方软件的数据与时间戳和标签，将匹配之后的第二元数据上传并存储于所述服务器中，所述第二元数据包括所述第三方软件的数据与时间戳和标签之间的对应关系。
根据权利要求1所述的存储方法(100)，其特征在于，所述方法(100)还包括：获取所述存储节点中的视频数据，将所述视频数据转换为视频流，并响应于请求将所述视频流推送至视频播放器中。
一种工业数据的存储装置(300)，其特征在于，所述存储装置(300)包括：

获取模块(310)，在边缘设备获取工业现场设备中的非结构化数据；

比较模块(320)，比较所述非结构化数据的使用频率与一第一阈值，将使用频率低于所述第一阈值的非结构化数据发送至服务器，并将使用频率高于所述第一阈值的非结构化数据保存至所述边缘设备中；

存储模块(330)，在所述服务器将使用频率低于所述第一阈值的非结构化数据存储于所述服务器的多个存储节点中。
根据权利要求6所述的存储装置(300)，其特征在于，所述存储节点包括主存储单元和归档存储单元，所述装置(300)还包括：比较所述非结构化数据的使用间隔时间与一第二阈值，将使用间隔时间小于所述第二阈值的非结构化数据存储于所述主存储单元，并将使用间隔时间大于所述第二阈值的非结构化数据存储于所述归档存储单元。
根据权利要求6或7所述的存储装置(300)，其特征在于，所述装置(300)还包括：在边缘设备获取工业现场设备中的结构化数据，匹配所述结构化数据与历史数据，将匹配之后的第一元数据上传并存储于所述服务器中，所述第一元数据包括所述结构化数据与历史数据之间的对应关系。
根据权利要求8所述的存储装置(300)，其特征在于，所述装置(300)还包括：获取第三方软件的数据，匹配所述第三方软件的数据与时间戳和标签，将匹配之后的第二元数据上传并存储于所述服务器中，所述第二元数据包括所述第三方软件的数据与时间戳和标签之间的对应关系。
根据权利要求6所述的存储装置(300)，其特征在于，所述装置(300)还包括：获取所述存储节点中的视频数据，将所述视频数据转换为视频流，并响应于请求将所述视频流推送至视频播放器中。
数据存储系统，所述数据存储系统包括边缘设备(23)和服务器(25)，其特征在于，

所述边缘设备(23)获取工业现场设备中的非结构化数据；比较所述非结构化数据的使用频率与一第一阈值，将使用频率低于所述第一阈值的非结构化数据发送至所述服务器(25)，并将使用频率高于所述第一阈值的非结构化数据保存至所述边缘设备(23)中；

所述服务器(25)将使用频率低于所述第一阈值的非结构化数据存储于所述服务器(25)的多个存储节点中。
一种电子设备(400)，包括处理器(410)、存储器(420)和存储在所述存储器(420)中的指令，其中所述指令被所述处理器(410)执行时实现如权利要求1-5任一项所述的方法。
一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令在被运行时执行根据权利要求1-5中任一项所述的方法。