CN115310360A - 基于联邦学习的数字孪生辅助工业物联网可靠性优化方法 - Google Patents

基于联邦学习的数字孪生辅助工业物联网可靠性优化方法 Download PDF

Info

Publication number
CN115310360A
CN115310360A CN202210979275.9A CN202210979275A CN115310360A CN 115310360 A CN115310360 A CN 115310360A CN 202210979275 A CN202210979275 A CN 202210979275A CN 115310360 A CN115310360 A CN 115310360A
Authority
CN
China
Prior art keywords
internet
things
model
base station
reliability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210979275.9A
Other languages
English (en)
Inventor
李�杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202210979275.9A priority Critical patent/CN115310360A/zh
Publication of CN115310360A publication Critical patent/CN115310360A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y10/00Economic sectors
    • G16Y10/25Manufacturing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/10Numerical modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Manufacturing & Machinery (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Geometry (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,属于工业物联领域。基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,针对要研究的可靠性和能量消耗问题,搭建解决该问题的整体架构DDTFI、为DDTFI提出了具有两级信誉值的聚合机制,进一步增强传统联邦学习方案的安全性、提出了系统可靠性模型和能量消耗模型,并制定了优化问题以及开发了数字孪生辅助的基于深度强化学习的优化算法解决系统可靠性模型和能量消耗优化问题。该发明是分布式机器学习框架,它打破了传统的云计算结构,能够在工业物联网的大数据和隐私之间进行有效的权衡,联邦学习避免了直接的数据泄露以保护用户的隐私和安全。

Description

基于联邦学习的数字孪生辅助工业物联网可靠性优化方法
技术领域
本发明涉及工业物联领域,更具体地说,本发明涉及基于联邦学习的数字孪生辅助工业物联网可靠性优化方法。
背景技术
人类社会正在迅速走向工业4.0时代,工业4.0的主要目标是提高自动化进程,在无需人工干预的情况下提高工业生产,工业物联网是实现工业4.0的关键技术之一,它能够显著地提高生产效率,并节省生产时间和人力成本,然而,由于工业环境复杂且动态变化,现有模型很难实时模拟动态的工业系统,利用数字孪生技术,可以在数字孪生虚拟模型上实时观察到物理实体的状态,并能够通过分析物理实体产生的海量状态数据去提高它的性能,随着新一代信息技术的快速发展,数字孪生已经成为一个热门的研究课题,目前,数字孪生已被应用于工业、智慧城市和医疗卫生等诸多领域,数字孪生在工业领域上的应用最多,因为它可以帮助制造商优化产业结构,节省生产成本,然而,构建数字孪生模型不仅需要传输大量的数据,还需要关注数据的隐私和安全问题。
传统的基于云计算的架构需要集中式服务器来收集原始数据和执行人工智能算法,联邦学习是分布式机器学习框架,它打破了传统的云计算结构,能够在工业物联网的大数据和隐私之间进行有效的权衡,联邦学习既避免了直接的数据泄露以保护用户的隐私和安全,又打破了数据孤岛以实现不同利益方的协作训练。
发明内容
1、本发明要解决的技术问题
本发明的实施例提供基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,以解决上述背景技术中提出的问题:
工业环境复杂且动态变化,现有模型很难实时模拟动态的工业系统,而且在大数据的传送过程中能耗大,同时存在数据泄露的安全隐患。
2、技术方案
为实现上述目的,本发明提供如下技术方案:基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,包括以下五个步骤:
S1、搭建基于联邦学习的数字孪生辅助工业物联网可靠性优化方法的整体框架得到DDTFI架构系统,DDTFI架构系统引入三层异构网络,包含物理实体平面、边缘平面和数字孪生平面;
S2、物联网设备基于联邦学习协同训练一个全局模型;
物联网设备通过传感器收集大量的实时运行数据,并在物理实体平面上训练自己的机器学习模型;在边缘平面,每个基站覆盖一定的区域;物联网设备将自己的模型参数上传到其所属的基站,基站完成模型的聚合和更新,同时为其覆盖区域内的所有物联网设备建立数字孪生模型;基站将聚合后的模型参数继续向宏基站上传;宏基站完成模型的聚合和更新,并构建出整个工厂的数字孪生模型;更新后的模型参数会逐级返回给每个物联网设备,物联网设备重复下一轮训练,直到整个训练过程收敛;
S3、测试DDTFI架构系统的设备可靠性和通信可靠性设计可靠性模型,可靠性模型包括设备可靠性模型和通信可靠性模型;
S4、测试DDTFI架构系统的可靠性和能量消耗问题进行建模;
S5、对基于联邦学习的数字孪生辅助工业物联网可靠性优化方法进行评估。
优选的,所述S1中搭建基于联邦学习的数字孪生辅助工业物联网可靠性优化方法的整体框架DDTFI的具体步骤:
物理实体平面由M个工业物联网设备组成,用V={v1,v2,...,vM}表示,通过传感器收集数据并存储在本地;用Ddev_i表示设备i的数据,|Ddev_i|指数据集的大小;
边缘平面由P个基站组成,用B={B1,B2,...,BP}表示;基站和宏基站都配备了边缘服务器,这些服务器拥有充足的计算、通信和AI处理能力;设备的数字孪生模型构建在相应的基站和宏基站中,形成数字孪生平面;基站收集和处理物联网设备的实时运行状态,并以数字形式动态地呈现其当前行为;
物联网设备i在t时刻的数字孪生模型表述为
Figure BDA0003799765370000031
其中
Figure BDA0003799765370000032
Figure BDA0003799765370000033
分别指设备i在t时刻的训练状态和计算能力;
由于数字孪生数据难有精确的感知,即真实值和虚拟映射值之间总是存在差异;为校准数字孪生模型的差异,引入CPU频率偏差
Figure BDA0003799765370000034
来衡量数字孪生模型映射到计算能力上的误差;
校准了映射偏差后,物联网设备i的数字孪生模型可以表示为
Figure BDA0003799765370000035
其中
Figure BDA0003799765370000041
Figure BDA0003799765370000042
分别指设备i在t时刻的训练状态和计算能力;这个模型在接收各设备运行状态的同时,还可以根据偏差值执行自我校准。
优选的,所述在DDTFI架构系统中物联网设备基于联邦学习协同训练一个全局模型的步骤:
在联邦学习方案中,宏基站首先初始化全局模型w0;在收到后w0,物理实体平面上的本地物联网设备i使用数据Ddev_i来训练模型参数
Figure BDA0003799765370000043
物联网设备i在数据集Ddev_i上的损失函数表示为,
Figure BDA0003799765370000044
使用梯度下降算法来训练模型参数,具体如下:
Figure BDA0003799765370000045
其中β>0是学习率,
Figure BDA0003799765370000046
指的是损失函数相对于
Figure BDA0003799765370000047
的梯度;
接下来,物联网设备将本地训练的模型参数上传到边缘平面的基站,基站收集所有设备的参数,然后聚合参数以更新全局模型。
优选的,所述DDTFI架构中提出了基于信誉的两级联邦学习聚合机制:
第一级信誉值,即每个物联网设备的信誉值表示为
Figure BDA0003799765370000048
通过信誉值来识别可靠的物联网设备;
定义标准中心值ct来衡量模型参数的偏离程度:
Figure BDA0003799765370000051
其中vBS是指每个基站附近的物联网设备的数量;
物联网设备i的模型训练质量表示为
Figure BDA0003799765370000052
物联网设备i的计算能力由CPU频率fdev_i来衡量;
Figure BDA0003799765370000053
代表物联网设备i映射到数字孪生虚拟模型时在计算能力上的偏差值;综合考虑物联网设备的本地模型训练质量、数字孪生映射偏差这两个因素,将物联网设备i的信誉值模型表示为
Figure BDA0003799765370000054
其中用
Figure BDA0003799765370000055
作为乘数,这样当数字孪生偏差值增加时,可信度值就会降低;
在边缘平面,通过第一级信誉值进行全局聚合;物联网设备首先将训练好的模型参数上传到它所属的基站,然后基站检索在这次迭代中每个设备的声誉值
Figure BDA0003799765370000056
最后将本地模型参数
Figure BDA0003799765370000057
聚合成一个加权的全局模型;
Figure BDA0003799765370000058
其中vBS是指每个基站附近的物联网设备的数量;
基站将聚合后的模型参数
Figure BDA0003799765370000061
继续向宏基站上传,然后宏基站检索第二层信誉值
Figure BDA0003799765370000062
即每个基站的信誉值,并将基站传输的模型参数聚合成加权的全局模型
Figure BDA0003799765370000063
Figure BDA0003799765370000064
其中
Figure BDA0003799765370000065
它表示每个基站的信誉值;
最后,更新后的模型参数
Figure BDA0003799765370000066
被逐层返回到物理实体平面内的每个物联网设备,这些设备重复下一次迭代训练,直到整个训练过程收敛;
在宏基站中的全局损失函数是
Figure BDA0003799765370000067
联邦学习的目标是最小化全局损失函数;
Figure BDA0003799765370000068
优选的,所述S3中所述测试DDTFI架构系统的设备可靠性和通信可靠性的具体步骤:
综合考虑自然老化和人为因素造成的老化这两个方面,系统可靠性中的设备可靠性;
物联网设备i的故障率表示为
Figure BDA0003799765370000069
其中bdev_i表示人为因素造成老化的系数;右手边的第二项表示设备的自然老化,它遵循韦伯分布,自然老化随着运行时间的增加而增加;μdev_i和βdev_i分别是设备的尺度参数和形状参数,物联网设备i的可靠性与故障率有关,表示为
Figure BDA0003799765370000071
系统可靠性中的通信可靠性;
DDTFI架构中,物联网设备与基站之间以及基站与宏基站之间均采用无线通信上传参数,保证工业物联网中无线通信的可靠性至关重要,表示为
Figure BDA0003799765370000072
其中
Figure BDA0003799765370000073
为噪声比;pdev_i和gdev_i分别代表物联网设备i的传输功率和信道功率增益;N0为噪声功率;当信噪比高于目标阈值
Figure BDA0003799765370000074
时,数据继续传输,否则传输中断;
DDTFI架构中的物联网设备i的整体系统可靠性由以下公式给出
Figure BDA0003799765370000075
优选的,
所述S4中对DDTFI架构系统的可靠性和能量消耗问题进行建模,具体包括如下步骤:
物联网设备的能量消耗包括计算能量消耗和通信能量消耗;对于物联网设备i,执行一单元的数据所需的CPU周期数表示为adev_i;物联网设备i进行一次迭代训练所消耗的能量为
Figure BDA0003799765370000076
其中λ代表物联网设备i的训练能量消耗系数;
假设物联网设备和基站之间采用正交频分多址进行通信;为了向基站传输模型参数,所有物联网设备共享Q个上行子信道,用Q={1,2,...,Q}表示;设备i向基站传输模型参数所消耗的能量为
Figure BDA0003799765370000081
其中ε指物联网设备i的通信能耗的归一化系数,|wdev_i|是物联网设备i传输的模型参数大小,ldev_i,q是物联网设备i在子信道q上的时隙分配,每个子信道的带宽用一个常数Wq表示;ξdev_i,q表示物联网设备i在第q个子信道上的SINR;Ψdev_i表示物联网设备i的通信可靠性是否满足工业物联网要求,可通过以下方式给出
Figure BDA0003799765370000082
物联网设备i的总能量消耗为
Figure BDA0003799765370000083
优化问题可制定为
Figure BDA0003799765370000084
Figure BDA0003799765370000085
Figure BDA0003799765370000086
Figure BDA0003799765370000087
0≤δ≤1 (18-4)
其中,(18-1)和(18-2)分别是对各设备的计算能力和传输能力的约束;约束条件(18-3)意味着能量消耗不超过设定的阈值;约束条件(18-4)表示决定系统可靠性和能量消耗之间权衡的权重参数。。
优选的,所述S4测试DDTFI架构系统的可靠性和能量消耗问题进行建模的具体步骤:
马尔可夫决策过程(MDP)对系统的可靠性和能量消耗问题进行建模,MDP模型表示为M={S,A,R,γ},然后使用深度确定性策略梯度(DDPG)算法进行求解问题;每一个基站都是一个深度强化学习的代理,它不断地与数字孪生模型进行交互,以获得当前的系统状态st;然后,代理在状态st下执行动作yt,从而获得相应的奖励rt,并使得系统状态st转移到下一个状态st+1;代理根据获得的奖励值不断地调整策略π,目标是最大化未来的累积奖励;MDP模型的关键参数描述如下;
当前状态st可以描述为st={ft,zt,pt},其中
Figure BDA0003799765370000091
表示所有设备计算能力的集合,
Figure BDA0003799765370000092
表示模型训练状态,
Figure BDA0003799765370000093
是传输功率;总的状态空间为S={st|t∈[1,τ]};
代理根据当前状态st选择新的动作yt∈A;在时隙t动作选择表示为
Figure BDA0003799765370000094
其中yt表示系统的可靠性管理;
代理获得一个即时奖励r来评估其采取的动作;在st状态下,采取yt动作获得的即时奖励是
Figure BDA0003799765370000101
深度强化学习的目标是在执行一组动作后使所有状态的累积奖励最大化,表示为
Figure BDA0003799765370000102
其中γ是折扣因子,0<γ<1,这可以防止状态陷入无限循环;
采用DDPG来解决该连续的MDP模型;DDPG有四个网络,包括actor网络、critic网络、actor目标网络和critic目标网络;它还引入了经验回放机制来存储代理与数字孪生模型的交互数据,其中一单位的数据用(st,yt,rtt)表示;
actor网络负责策略网络参数μπ的迭代更新;根据当前状态st选择动作yt,获得相应的即时奖励rt和下一个状态st+1,然后命令数字孪生模型执行动作yt,表示为
yt=π(stπ)+xt (22)
其中xt是由Ornstein-Uhlenbeck过程产生的随机噪声;
从经验回放缓冲区中随机抽取N单位的数据,作为actor网络和critic网络的小型训练数据批;actor网络的策略梯度更新算法是:
Figure BDA0003799765370000103
critic网络负责迭代更新价值网络参数μQ,并计算状态动作对(st,yt)的当前Q(st,ytQ)值,损失函数是
Figure BDA0003799765370000104
目标网络的参数由软更新算法进行更新,表示为
μQ′=ρμQ+(1-ρ)μQ′
μπ′=ρμπ+(1-ρ)μπ′ (25)
其中ρ是目标值的更新系数。
优选的,所述S5中对基于联邦学习的数字孪生辅助工业物联网可靠性优化方法进行评估的具体步骤:
将MNIST数据集被打乱并随机分配到各个设备,使得联邦学习的训练数据是均匀分布的,然后将识别数据集中的图像作为模拟真实工业物联网应用进行评估。
3、有益效果
(1)数字孪生架构(DDTFI),它将物联网设备的物理特性映射到数字空间,特别地,DDTFI使用数字孪生技术来反映工厂的实时运行状态,从而提高智能决策水平。
(2)联邦学习方案来构建DDTFI,这种方案可以减少数据传输开销,同时保护数据隐私,具体而言,提出了基于信誉的两级聚合机制,以进一步提高联邦学习的安全性。
(3)DDTFI架构的提高系统可靠性和降低能量消耗的问题表述为一个优化问题,开发了数字孪生辅助的基于深度强化学习的优化算法,该算法可以同时解决系统可靠性最大化和能量消耗最小化的问题。
附图说明
图1为本发明整体架构图。
图2为本发明所述的联邦学习方法训练精度图。
图3为本发明所述的系统可靠性图。
图4为本发明所述的能量消耗图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
请参阅图1,本发明设计的是基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,包括以下四个步骤:
S1、针对要研究的可靠性和能量消耗问题,搭建解决该问题的整体架构DDTFI;
S2、为DDTFI提出了具有两级信誉值的聚合机制,进一步增强传统联邦学习方案的安全性;
S3、提出了系统可靠性模型和能量消耗模型,并制定了优化问题;
S4、开发了数字孪生辅助的基于深度强化学习的优化算法解决系统可靠性模型和能量消耗优化问题:
实施例2
请参阅图2,结合实施例1的基础有所不同的是,搭建基于联邦学习的数字孪生辅助工业物联网可靠性优化方法的整体框架,命名为DDTFI;DDTFI架构引入了一个三层异构网络,包含物理实体平面、边缘平面和数字孪生平面;物理实体平面由M个工业物联网设备组成,用V={v1,v2,...,vM}表示,它们通过传感器收集数据并存储在本地;用Ddev_i表示设备i的数据,|Ddev_i|指数据集的大小;边缘平面由P个基站组成,用B={B1,B2,...,BP}表示;基站和宏基站都配备了边缘服务器,这些服务器拥有充足的计算、通信和AI处理能力;设备的数字孪生模型构建在相应的基站和宏基站中,形成数字孪生平面;基站收集和处理物联网设备的实时运行状态,并以数字形式动态地呈现其当前行为。
由于数字孪生数据真实值和虚拟映射值之间总是存在差异;为了校准数字孪生模型的差异,本发明引入了CPU频率偏差来衡量数字孪生模型映射到计算能力上的误差;校准了映射偏差后,物联网设备i的数字孪生模型表示为
Figure BDA0003799765370000131
其中
Figure BDA0003799765370000132
Figure BDA0003799765370000133
分别指设备i在t时刻的训练状态和计算能力;这个模型在接收各设备运行状态的同时,还可以根据偏差值执行自我校准;
物联网设备基于联邦学习协同训练一个全局模型;如图1所示,物联网设备通过传感器收集大量的实时运行数据,并在物理实体平面上训练自己的机器学习模型;在边缘平面,每个基站覆盖一定的区域。物联网设备将自己的模型参数上传到其所属的基站,基站完成模型的聚合和更新,同时为其覆盖区域内的所有物联网设备建立数字孪生模型;基站将聚合后的模型参数继续向宏基站上传;宏基站完成模型的聚合和更新,并构建出整个工厂的数字孪生模型;更新后的模型参数会逐级返回给每个物联网设备,物联网设备重复下一轮训练,直到整个训练过程收敛。
在联邦学习方案中,宏基站首先初始化全局模型w0;在收到后w0,物理实体平面上的本地物联网设备i使用自己的数据Ddev_i来训练模型参数
Figure BDA0003799765370000141
物联网设备i在数据集Ddev_i上的损失函数表示为,
Figure BDA0003799765370000142
然后使用梯度下降算法来训练模型参数,具体如下:
Figure BDA0003799765370000143
其中β>0是学习率,
Figure BDA0003799765370000144
指的是损失函数相对于
Figure BDA0003799765370000145
的梯度;
接下来,物联网设备将本地训练的模型参数上传到边缘平面的基站,基站收集所有设备的参数,然后聚合参数以更新全局模型;然而,设备可能会被攻击从而执行不可靠的本地模型更新,这降低联邦学习全局模型的质量,并影响工业物联网的可靠性;因此,DDTFI架构中提出了基于信誉的两级联邦学习聚合机制;第一级信誉值,即每个物联网设备的信誉值表示为
Figure BDA0003799765370000146
物联网设备i的模型训练质量表示为
Figure BDA0003799765370000147
物联网设备i的计算能力由CPU频率fdev_i来衡量;
Figure BDA0003799765370000148
代表物联网设备i映射到数字孪生虚拟模型时在计算能力上的偏差值;综合考虑物联网设备的本地模型训练质量、数字孪生映射偏差这两个因素,将物联网设备i的信誉值模型表示为
Figure BDA0003799765370000151
在边缘平面,通过第一级信誉值进行全局聚合;物联网设备首先将训练好的模型参数上传到它所属的基站,然后基站检索在这次迭代中每个设备的声誉值
Figure BDA0003799765370000152
最后将本地模型参数
Figure BDA0003799765370000153
聚合成一个加权的全局模型;
Figure BDA0003799765370000154
其中vBS是指每个基站附近的物联网设备的数量;
基站将聚合后的模型参数
Figure BDA0003799765370000155
继续向宏基站上传,然后宏基站检索第二层信誉值
Figure BDA0003799765370000156
即每个基站的信誉值,并将基站传输的模型参数聚合成加权的全局模型
Figure BDA0003799765370000157
Figure BDA0003799765370000158
其中
Figure BDA0003799765370000159
表示每个基站的信誉值;
最后,更新后的模型参数
Figure BDA00037997653700001510
被逐层返回到物理实体平面内的每个物联网设备,这些设备重复下一次迭代训练,直到整个训练过程收敛;
在宏基站中的全局损失函数是
Figure BDA00037997653700001511
联邦学习的目标是最小化全局损失函数;
Figure BDA00037997653700001512
实施例3
请参阅图3,结合实施例1的基础有所不同的是,DDTFI架构的系统可靠性模型包括设备可靠性模型和通信可靠性模型;综合考虑自然老化和人为因素造成的老化这两个方面,物联网设备i的故障率表示为
Figure BDA0003799765370000161
其中bdev_i表示人为因素造成老化的系数;右手边的第二项是一个韦伯分布,表示设备的自然老化;μdev_i和βdev_i分别是设备的尺度参数和形状参数;物联网设备i的可靠性表示为
Figure BDA0003799765370000162
物联网设备与基站之间以及基站与宏基站之间均采用无线通信上传参数;然而,工业生产环境十分恶劣,如高温和工作设备产生的环境噪声等都对无线信号的接收有负面影响;因此,工业物联网中无线通信的可靠性表示为
Figure BDA0003799765370000163
其中
Figure BDA0003799765370000164
为噪声比;pdev_i和gdev_i分别代表物联网设备i的传输功率和信道功率增益;N0为噪声功率;公式(12)表明,当信噪比低于目标阈值时传输中断;
DDTFI架构中的物联网设备i的整体系统可靠性表示为
Figure BDA0003799765370000165
物联网设备的能量消耗包括计算能量消耗和通信能量消耗;对于物联网设备i,执行一单元的数据所需的CPU周期数表示为adev_ i;物联网设备i进行一次迭代训练所消耗的能量为
Figure BDA0003799765370000171
其中λ代表物联网设备i的训练能量消耗系数;
假设物联网设备和基站之间采用正交频分多址进行通信;为了向基站传输模型参数,所有物联网设备共享Q个上行子信道,用Q={1,2,...,Q}表示;设备i向基站传输模型参数所消耗的能量为
Figure BDA0003799765370000172
其中ε指物联网设备i的通信能耗的归一化系数,|wdev_i|是物联网设备i传输的模型参数大小,ldev_i,q是物联网设备i在子信道q上的时隙分配,每个子信道的带宽用一个常数Wq表示;ξdev_i,q表示物联网设备i在第q个子信道上的SINR;Ψdev_i表示物联网设备i的通信可靠性是否满足工业物联网要求,可通过以下方式给出
Figure BDA0003799765370000173
物联网设备i的总能量消耗为
Figure BDA0003799765370000174
优化问题可制定为
Figure BDA0003799765370000181
Figure BDA0003799765370000182
Figure BDA0003799765370000183
Figure BDA0003799765370000184
0≤δ≤1 (18-4)
其中,(18-1)和(18-2)分别是对各设备的计算能力和传输能力的约束;约束条件(18-3)意味着能量消耗不超过设定的阈值;约束条件(18-4)表示决定系统可靠性和能量消耗之间权衡的权重参数;
首先使用马尔可夫决策过程(MDP)对系统的可靠性和能量消耗问题进行建模,MDP模型表示为M={S,A,R,γ},然后使用深度确定性策略梯度(DDPG)算法进行求解问题(18);每一个基站都是一个深度强化学习的代理,它不断地与数字孪生模型进行交互,以获得当前的系统状态st;然后,代理在状态st下执行动作yt,从而获得相应的奖励rt,并使得系统状态st转移到下一个状态st+1;代理根据获得的奖励值不断地调整自己的策略π,目标是最大化未来的累积奖励;MDP模型的关键参数描述如下;
当前状态st可以描述为st={ft,zt,pt},其中
Figure BDA0003799765370000185
表示所有设备计算能力的集合,
Figure BDA0003799765370000186
表示模型训练状态,
Figure BDA0003799765370000187
是传输功率;总的状态空间为S={st|t∈[1,τ]}。
代理根据当前状态st选择新的动作yt∈A;在时隙t动作选择表示为
Figure BDA0003799765370000191
其中yt表示系统的可靠性管理。
代理获得一个即时奖励r来评估其采取的动作;在st状态下,采取yt动作获得的即时奖励是
Figure BDA0003799765370000192
深度强化学习的目标是在执行一组动作后使所有状态的累积奖励最大化,表示为
Figure BDA0003799765370000193
其中γ是折扣因子,0<γ<1,这可以防止状态陷入无限循环;
采用DDPG来解决该连续的MDP模型;DDPG有四个网络,包括actor网络、critic网络、actor目标网络和critic目标网络;它还引入了经验回放机制来存储代理与数字孪生模型的交互数据,其中一单位的数据用(st,yt,rtt)表示。
actor网络负责策略网络参数μπ的迭代更新;它能够根据当前状态st选择动作yt,获得相应的即时奖励rt和下一个状态st+1,然后命令数字孪生模型执行动作yt,表示为
yt=π(stπ)+xt (22)
其中xt是由Ornstein-Uhlenbeck过程产生的随机噪声;
然后,从经验回放缓冲区中随机抽取N单位的数据,作为actor网络和critic网络的小型训练数据批;actor网络的策略梯度更新算法是
Figure BDA0003799765370000201
critic网络负责迭代更新价值网络参数μQ,并计算状态动作对(st,yt)的当前Q(st,ytQ)值,损失函数是
Figure BDA0003799765370000202
目标网络的参数由软更新算法进行更新,表示为
μQ′=ρμQ+(1-ρ)μQ′
μπ′=ρμπ+(1-ρ)μπ′ (25)
其中ρ是目标值的更新系数。
实施例4
请参阅图4,结合实施例1的基础有所不同的是,在MNIST数据集上对基于联邦学习的数字孪生辅助工业物联网可靠性优化方法进行评估;在实验中,MNIST数据集被打乱并随机分配到各个设备,使得联邦学习的训练数据是均匀分布的;将识别数据集中的图像作为模拟真实工业物联网应用的方式;考虑有100个设备、4个基站和1个宏基站的场景,并用卷积神经网络(CNN)作为联邦学习的本地训练模型;实验结果如图2,图3和图4所示,可以看本发明提出的方法能够有效地提高系统可靠性并降低能量消耗
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,其特征在于,包括以下五个步骤:
S1、搭建基于联邦学习的数字孪生辅助工业物联网可靠性优化方法的整体框架得到DDTFI架构系统,DDTFI架构系统引入三层异构网络,包含物理实体平面、边缘平面和数字孪生平面;
S2、在DDTFI架构系统中物联网设备基于联邦学习协同训练一个全局模型;
物联网设备通过传感器收集大量的实时运行数据,并在物理实体平面上训练自己的机器学习模型;在边缘平面,每个基站覆盖一定的区域;物联网设备将自己的模型参数上传到其所属的基站,基站完成模型的聚合和更新,同时为其覆盖区域内的所有物联网设备建立数字孪生模型;基站将聚合后的模型参数继续向宏基站上传;宏基站完成模型的聚合和更新,并构建出整个工厂的数字孪生模型;更新后的模型参数会逐级返回给每个物联网设备,物联网设备重复下一轮训练,直到整个训练过程收敛;
S3、构建DDTFI架构系统的系统可靠性模型,系统可靠性模型包括设备可靠性模型和通信可靠性模型;
S4、对DDTFI架构系统的可靠性和能量消耗问题进行建模;
S5、对基于联邦学习的数字孪生辅助工业物联网可靠性优化方法进行评估。
2.根据权利要求1所述的基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,其特征在于:所述S1中搭建基于联邦学习的数字孪生辅助工业物联网可靠性优化方法的整体框架DDTFI,具体包括如下步骤:
物理实体平面由M个工业物联网设备组成,用V={v1,v2,...,vM}表示,通过传感器收集数据并存储在本地;用Ddev_i表示设备i的数据,|Ddev_i|指数据集的大小;
边缘平面由P个基站组成,用B={B1,B2,...,BP}表示;
基站和宏基站都配备边缘服务器,这些服务器拥有计算、通信和AI处理能力;设备的数字孪生模型构建在相应的基站和宏基站中,形成数字孪生平面;
基站收集和处理物联网设备的实时运行状态,并以数字形式动态地呈现其当前行为;
物联网设备i在t时刻的数字孪生模型表述为
Figure FDA0003799765360000021
其中
Figure FDA0003799765360000022
Figure FDA0003799765360000023
分别指设备i在t时刻的训练状态和计算能力;
由于数字孪生数据难有精确的感知,即真实值和虚拟映射值之间总是存在差异;为校准数字孪生模型的差异,引入CPU频率偏差
Figure FDA0003799765360000024
来衡量数字孪生模型映射到计算能力上的误差;校准映射偏差后,物联网设备i的数字孪生模型表示为
Figure FDA0003799765360000025
这个模型在接收各设备运行状态的同时,还可以根据偏差值执行自我校准。
3.根据权利要求2所述的基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,其特征在于:所述S2中在DDTFI架构系统中物联网设备基于联邦学习协同训练一个全局模型,具体包括如下步骤:在联邦学习方案中,宏基站首先初始化全局模型w0;在收到后w0,物理实体平面上的本地物联网设备i使用数据Ddev_i来训练模型参数
Figure FDA0003799765360000031
物联网设备i在数据集Ddev_i上的损失函数表示为,
Figure FDA0003799765360000032
使用梯度下降算法来训练模型参数,具体如下:
Figure FDA0003799765360000033
其中β>0是学习率,
Figure FDA0003799765360000034
指的是损失函数相对于
Figure FDA0003799765360000035
的梯度;
接下来,物联网设备将本地训练的模型参数上传到边缘平面的基站,基站收集所有设备的参数,然后聚合参数以更新全局模型。
4.根据权利要求3所述的基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,其特征在于:所述DDTFI架构系统中设置基于信誉的两级联邦学习聚合机制:
第一级信誉值,即每个物联网设备的信誉值表示为
Figure FDA0003799765360000036
物联网设备i的模型训练质量表示为
Figure FDA0003799765360000037
物联网设备i的计算能力由CPU频率fdev_i来衡量;
Figure FDA0003799765360000038
代表物联网设备i映射到数字孪生虚拟模型时在计算能力上的偏差值;综合考虑物联网设备的本地模型训练质量、数字孪生映射偏差这两个因素,将物联网设备i的信誉值模型表示为
Figure FDA0003799765360000041
在边缘平面,通过第一级信誉值进行全局聚合;物联网设备首先将训练好的模型参数上传到它所属的基站,然后基站检索在这次迭代中每个设备的声誉值
Figure FDA0003799765360000042
最后将本地模型参数
Figure FDA0003799765360000043
聚合成一个加权的全局模型;
Figure FDA0003799765360000044
其中vBS是指每个基站附近的物联网设备的数量;
基站将聚合后的模型参数
Figure FDA0003799765360000045
继续向宏基站上传,然后宏基站检索第二层信誉值
Figure FDA0003799765360000046
即每个基站的信誉值,并将基站传输的模型参数聚合成加权的全局模型
Figure FDA0003799765360000047
Figure FDA0003799765360000048
其中
Figure FDA0003799765360000049
它表示每个基站的信誉值;
最后,更新后的模型参数
Figure FDA00037997653600000410
被逐层返回到物理实体平面内的每个物联网设备,这些设备重复下一次迭代训练,直到整个训练过程收敛;
在宏基站中的全局损失函数是
Figure FDA00037997653600000411
联邦学习的目标是最小化全局损失函数;
Figure FDA0003799765360000051
5.根据权利要求4所述的基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,其特征在于:所述S3中构建DDTFI架构系统的系统可靠性模型,系统可靠性模型包括设备可靠性模型和通信可靠性模型,具体包括如下步骤:
系统可靠性中的设备可靠性模型:
物联网设备i的故障率表示为
Figure FDA0003799765360000052
其中bdev_i表示人为因素造成老化的系数;右手边的第二项表示设备的自然老化,它遵循韦伯分布,自然老化随着运行时间的增加而增加;μdev_i和βdev_i分别是设备的尺度参数和形状参数,物联网设备i的可靠性与故障率有关,表示为
Figure FDA0003799765360000053
系统可靠性中的通信可靠性模型:
DDTFI架构系统中,物联网设备与基站之间以及基站与宏基站之间均采用无线通信上传参数,保证工业物联网中无线通信的可靠性至关重要,表示为
Figure FDA0003799765360000054
其中
Figure FDA0003799765360000055
为噪声比;pdev_i和gdev_i分别代表物联网设备i的传输功率和信道功率增益;N0为噪声功率;当信噪比高于目标阈值
Figure FDA0003799765360000056
时,数据继续传输,否则传输中断;
DDTFI架构中的物联网设备i的整体系统可靠性由以下公式给出
Figure FDA0003799765360000061
6.根据权利要求4所述的基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,其特征在于:所述S4中对DDTFI架构系统的可靠性和能量消耗问题进行建模,具体包括如下步骤:
物联网设备的能量消耗包括计算能量消耗和通信能量消耗;对于物联网设备i,执行一单元的数据所需的CPU周期数表示为adev_i;物联网设备i进行一次迭代训练所消耗的能量为
Figure FDA0003799765360000062
其中λ代表物联网设备i的训练能量消耗系数;
假设物联网设备和基站之间采用正交频分多址进行通信;为了向基站传输模型参数,所有物联网设备共享Q个上行子信道,用Q={1,2,...,Q}表示;设备i向基站传输模型参数所消耗的能量为
Figure FDA0003799765360000063
其中ε指物联网设备i的通信能耗的归一化系数,|wdev_i|是物联网设备i传输的模型参数大小,ldev_i,q是物联网设备i在子信道q上的时隙分配,每个子信道的带宽用一个常数Wq表示;ξdev_i,q表示物联网设备i在第q个子信道上的SINR;Ψdev_i表示物联网设备i的通信可靠性是否满足工业物联网要求,可通过以下方式给出
Figure FDA0003799765360000071
物联网设备i的总能量消耗为
Figure FDA0003799765360000072
优化问题可制定为
Figure FDA0003799765360000073
Figure FDA0003799765360000074
Figure FDA0003799765360000075
Figure FDA0003799765360000076
0≤δ≤1 (18-4)
其中,(18-1)和(18-2)分别是对各设备的计算能力和传输能力的约束;约束条件(18-3)意味着能量消耗不超过设定的阈值;约束条件(18-4)表示决定系统可靠性和能量消耗之间权衡的权重参数。
7.根据权利要求6所述的基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,其特征在于:
使用马尔可夫决策过程MDP对系统的可靠性和能量消耗问题进行建模,MDP模型表示为M={S,A,R,γ},然后使用深度确定性策略梯度算法DDPG进行求解问题;每一个基站都是一个深度强化学习的代理,它不断地与数字孪生模型进行交互,以获得当前的系统状态st;然后,代理在状态st下执行动作yt,从而获得相应的奖励rt,并使得系统状态st转移到下一个状态st+1;代理根据获得的奖励值不断地调整策略π,目标是最大化未来的累积奖励;MDP模型的关键参数描述如下;
当前状态st描述为st={ft,zt,pt},其中
Figure FDA0003799765360000081
表示所有设备计算能力的集合,
Figure FDA0003799765360000082
表示模型训练状态,
Figure FDA0003799765360000083
是传输功率;总的状态空间为S={st|t∈[1,τ]};
代理根据当前状态st选择新的动作yt∈A;在时隙t动作选择可以表示为
Figure FDA0003799765360000084
其中yt表示系统的可靠性管理;
代理获得一个即时奖励r来评估其采取的动作;在st状态下,采取yt动作获得的即时奖励是
Figure FDA0003799765360000085
深度强化学习的目标是在执行一组动作后使所有状态的累积奖励最大化,这表示为
Figure FDA0003799765360000086
其中γ是折扣因子,0<γ<1,这防止状态陷入无限循环;
采用DDPG来解决该连续的MDP模型;DDPG有四个网络,包括actor网络、critic网络、actor目标网络和critic目标网络;它还引入了经验回放机制来存储代理与数字孪生模型的交互数据,其中一单位的数据用(st,yt,rtt)表示;
actor网络负责策略网络参数μπ的迭代更新;根据当前状态st选择动作yt,获得相应的即时奖励rt和下一个状态st+1,然后命令数字孪生模型执行动作yt,这可以表示为
yt=π(stπ)+xt (22)
其中xt是由Ornstein-Uhlenbeck过程产生的随机噪声;
从经验回放缓冲区中随机抽取N单位的数据,作为actor网络和critic网络的小型训练数据批;actor网络的策略梯度更新算法是:
Figure FDA0003799765360000091
critic网络负责迭代更新价值网络参数μQ,并计算状态动作对(st,yt)的当前Q(st,ytQ)值,损失函数是
Figure FDA0003799765360000092
目标网络的参数由软更新算法进行更新,可表示为
μQ′=ρμQ+(1-ρ)μQ′
μπ′=ρμπ+(1-ρ)μπ′ (25)
其中ρ是目标值的更新系数。
8.根据权利要求7所述的基于联邦学习的数字孪生辅助工业物联网可靠性优化方法,其特征在于:所述S5中对基于联邦学习的数字孪生辅助工业物联网可靠性优化方法进行评估的具体步骤:
将MNIST数据集被打乱并随机分配到各个设备,使得联邦学习的训练数据是均匀分布的,然后将识别数据集中的图像作为模拟真实工业物联网应用进行评估。
CN202210979275.9A 2022-08-16 2022-08-16 基于联邦学习的数字孪生辅助工业物联网可靠性优化方法 Pending CN115310360A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210979275.9A CN115310360A (zh) 2022-08-16 2022-08-16 基于联邦学习的数字孪生辅助工业物联网可靠性优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210979275.9A CN115310360A (zh) 2022-08-16 2022-08-16 基于联邦学习的数字孪生辅助工业物联网可靠性优化方法

Publications (1)

Publication Number Publication Date
CN115310360A true CN115310360A (zh) 2022-11-08

Family

ID=83862594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210979275.9A Pending CN115310360A (zh) 2022-08-16 2022-08-16 基于联邦学习的数字孪生辅助工业物联网可靠性优化方法

Country Status (1)

Country Link
CN (1) CN115310360A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116258420A (zh) * 2023-05-11 2023-06-13 中南大学 一种产品质量检测方法、装置、终端设备及介质
CN116502237A (zh) * 2023-06-25 2023-07-28 北京智芯微电子科技有限公司 一种数字孪生平台安全协作方法及系统
CN117094031A (zh) * 2023-10-16 2023-11-21 湘江实验室 工业数字孪生数据隐私保护方法及相关介质
CN117521856A (zh) * 2023-12-29 2024-02-06 南京邮电大学 一种基于本地特征的大模型切割联邦学习方法及系统
CN118171328A (zh) * 2024-05-16 2024-06-11 三峡金沙江川云水电开发有限公司 面向水利数字孪生应用的安全与隐私强化方法、架构和系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116258420A (zh) * 2023-05-11 2023-06-13 中南大学 一种产品质量检测方法、装置、终端设备及介质
CN116502237A (zh) * 2023-06-25 2023-07-28 北京智芯微电子科技有限公司 一种数字孪生平台安全协作方法及系统
CN116502237B (zh) * 2023-06-25 2023-11-17 北京智芯微电子科技有限公司 一种数字孪生平台安全协作方法及系统
CN117094031A (zh) * 2023-10-16 2023-11-21 湘江实验室 工业数字孪生数据隐私保护方法及相关介质
CN117094031B (zh) * 2023-10-16 2024-02-06 湘江实验室 工业数字孪生数据隐私保护方法及相关介质
CN117521856A (zh) * 2023-12-29 2024-02-06 南京邮电大学 一种基于本地特征的大模型切割联邦学习方法及系统
CN117521856B (zh) * 2023-12-29 2024-03-15 南京邮电大学 一种基于本地特征的大模型切割联邦学习方法及系统
CN118171328A (zh) * 2024-05-16 2024-06-11 三峡金沙江川云水电开发有限公司 面向水利数字孪生应用的安全与隐私强化方法、架构和系统

Similar Documents

Publication Publication Date Title
CN115310360A (zh) 基于联邦学习的数字孪生辅助工业物联网可靠性优化方法
CN110770761B (zh) 深度学习系统和方法以及使用深度学习的无线网络优化
CN111176929B (zh) 一种面向边缘联邦学习的高能效计算通信联合优化方法
CN112598150B (zh) 一种在智能电厂中基于联邦学习提升火灾检测效果的方法
CN113902021B (zh) 一种高能效的聚类联邦边缘学习策略生成方法和装置
CN111629380B (zh) 面向高并发多业务工业5g网络的动态资源分配方法
CN113568727B (zh) 一种基于深度强化学习的移动边缘计算任务分配方法
CN113268341B (zh) 电网边缘计算任务的分配方法、装置、设备和存储介质
Yao et al. Caching in dynamic IoT networks by deep reinforcement learning
CN112153650B (zh) 一种无线网络中基于终端信誉的可靠联邦学习方法及系统
CN113312177B (zh) 一种基于联邦学习的无线边缘计算系统、优化方法
CN113469325A (zh) 一种边缘聚合间隔自适应控制的分层联邦学习方法、计算机设备、存储介质
CN116416508A (zh) 一种加快全局联邦学习模型收敛的方法及联邦学习系统
CN116390161A (zh) 一种移动边缘计算中基于负载均衡的任务迁移方法
CN116187483A (zh) 模型训练方法、装置、设备、介质和程序产品
Chen et al. Joint caching and computing service placement for edge-enabled IoT based on deep reinforcement learning
CN113573342B (zh) 一种基于工业物联网的节能计算卸载方法
CN112312299A (zh) 服务卸载方法、装置及系统
CN116542319A (zh) 边缘计算环境中基于数字孪生的自适应联邦学习方法及系统
CN116795198A (zh) 数据中心的能耗优化方法、装置及存储介质
CN115499876A (zh) Msde场景下基于dqn算法的计算卸载策略
CN115629576A (zh) 非侵入式柔性负荷聚合特性辨识与优化方法、装置及设备
Qi et al. Edge-edge Collaboration Based Micro-service Deployment in Edge Computing Networks
CN111327674A (zh) 一种适用于区块链工作量证明的单边缘服务器缓存算法
Le Borgne et al. Time series prediction for energy-efficient wireless sensors: Applications to environmental monitoring and video games

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication