CN115333953A - 一种基于虚拟节点构建的工业互联网资源调配方法 - Google Patents
一种基于虚拟节点构建的工业互联网资源调配方法 Download PDFInfo
- Publication number
- CN115333953A CN115333953A CN202211250383.9A CN202211250383A CN115333953A CN 115333953 A CN115333953 A CN 115333953A CN 202211250383 A CN202211250383 A CN 202211250383A CN 115333953 A CN115333953 A CN 115333953A
- Authority
- CN
- China
- Prior art keywords
- network
- virtual
- node
- entity
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013468 resource allocation Methods 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000010276 construction Methods 0.000 title claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 26
- 230000008569 process Effects 0.000 claims abstract description 13
- 230000008901 benefit Effects 0.000 claims abstract description 11
- 230000009471 action Effects 0.000 claims description 27
- 239000013598 vector Substances 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 10
- 238000012546 transfer Methods 0.000 claims description 8
- 230000007812 deficiency Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 abstract description 12
- 230000006870 function Effects 0.000 description 20
- 238000011161 development Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
技术领域
本发明涉及工业互联网领域,具体涉及一种基于虚拟节点构建的工业互联网资源调配方法。
背景技术
工业互联网结合大数据、人工智能等技术手段,将信息技术与工业发展产业相结合,将工业系统相关智能机器实体之间进行通信互联,实现智能层面的人、机、物融合协同发展。
在工业互联网的具体应用中,资源调配是一个关键的研究课题。宏观角度上,工业互联网可以看作是工业实体连结的网络结构,各个工业实体之间存在较频繁资源运输与信息传输关系。若工业实体节点为智能化制造工厂,所涉及的资源调配目标对象则为物理实体资源;若工业实体节点为工业通信基站数据处理端,则对应的资源调配目标为通信数据资源。工业互联网网络拓扑结构对应真实世界传输通路和实际物理位置,资源在调配过程中,必然存在路径选择,通路拥堵,运输代价等问题,因此,如何优化工业互联网中资源调配决策,成为解决工业互联网资源调配问题的关键。
随着工业互联网中工业实体逐步变化和发展,网络节点数目与节点之间的连接关系复杂程度呈现逐步增长的趋势,所涉及的顶层决策任务日益复杂和多样化,当面对多目标资源调配问题时,调配时间不再是单一优化目标条件。对于目标在资源调配任务过程中所面临的通道载荷约束,所获得的效益要求,所付出的通信代价,调配时间延迟,各个实体节点吞吐量限制都成为现有工业互联网资源调配问题中所需要考虑和解决的约束问题。
如果将资源调配中的资源实体视为在固定拓扑上的目标单元,资源调配问题则可以转化为带约束的最短路径求解问题。以Floyd算法为主要代表的传统算法成为最短路径寻优与规划问题的常见解决方案,但是针对带约束的最短路径寻优与规划问题,面对复杂多变的网络结构,传统算法面临计算复杂,求解困难,效果不佳的情况。随着人工智能的不断发展,深度学习开始逐渐引入资源调配问题中。
深度Q学习算法面对一般决策问题,通过计算动作价值函数,以时间差分原则构建网络代价函数,对特征提取和决策网络进行优化,输出动作决策价值数值,以贪心策略动作决策选择策略,实现端到端决策。深度Q学习主要解决离散有限维度动作决策问题,一般情况下的资源调配问题是资源目标单位面对有限离散路径的决策问题,因此深度Q学习成为解决资源调配问题的技术手段之一。
资源调配问题的数学描述为:
其中,表示资源调配问题中第个决策个体价值,由收益奖励与损失代价两部分构成;表示为第个资源目标单位到达指定目标点所获得的收益奖励,为正数;表示第个资源目标单位到达指定目标点过程中与第个资源目标单位造成通路载荷上限约束所付出的损失代价,为负数。
由于资源调配问题所决策的目标对象为资源数据包所选择的通路,因此决策输出是一个有限且离散的决策向量。而强化学习中的Q学习算法则可以较好的适用于此类有限离散的决策输出问题。通常,Q学习中的输出结果被视作为动作价值函数,是对不同决策动作的价值进行评分,在后续过程中利用贪心算法选择最大具有动作价值函数值的动作作为决策。
一般情况下,Q学习的动作价值函数可以写为:
其中,为第个决策个体针对目前状态与决策所获得的下一步期望决策价值;为第个决策个体所获得的状态特征向量;为第个决策个体决策。从数学表达式中可以看到,针对第个目标对象资源数据包,计算所得出的动作价值函数针对的动作向量维度与其他目标对象资源数据包输出动作价值函数向量维度保持一致,这意味着对于每一个目标对象资源数据包可以选择的有限离散决策数目相同,可以选择的通路数目相同,与此对应的,网络各个节点度数相同。
换言之,以上算法适用于解决工业互联网网络拓扑结构为各个节点度数相同的正则图结构,这样可以使得每个目标对象在不同网络节点位置时具有同样动作决策数目。但是一般情况下,工业互联网网络结构所抽象的网络拓扑,每个节点度数并不相同。这给深度Q学习的目标对象资源调配问题解决带来了极大的挑战与难度,也给通用工业互联网环境资源调配算法的发展带来了一定的局限性。
发明内容
基于上述基于深度Q学习资源调配算法不能解决一般化工业互联网网络拓扑结构的现有技术缺陷,本发明提供了一种基于虚拟节点构建的工业互联网资源调配方法,使得深度Q学习算法可以对一般化网络拓扑结构下的工业互联网资源调配问题进行求解,具有较强泛化性。
一种基于虚拟节点构建的工业互联网资源调配方法,包括以下步骤:
步骤4,构建实体网络与虚拟网络之间的连接,更新实体节点与虚拟节点之间运输通路集合以及所有节点的邻接矩阵,生成完备网络;对完备网络进行连通性检测,若不满足连通性则回到步骤3重新执行,直至满足连通性检测条件,更新运输通路连接权重,完成完备网络的搭建;
进一步,所述步骤1具体为:将实体工业互联网网络环境中各工业实体节点之间的拓扑连接关系,抽象为实际工业互联网场景中进行资源调配的固定网络结构,搭建实体网络:
在满足每个虚拟节点的度数的情况下,随机生成虚拟运输通路,构建生成虚拟网络,并定义虚拟节点邻接关系集合,其中,为虚拟节点邻接矩阵,为虚拟节点运输通路连接权重,设置;直到虚拟网络中虚拟运输通路数达到,完成虚拟网络的构建。
进一步,所述步骤4具体为:根据实体网络与虚拟网络,遍历中的各实体节点,,如果, 其中为实体节点的度数,则将实体节点与虚拟节点集合中的虚拟节点相连,并保证虚拟节点度数小于,完成完备网络中运输终端运输通路集合以及运输终端邻接矩阵更新,直到以下等式成立:
进一步,所述步骤5具体为:在实体网络的各实体节点上随机生成若干资源包,抽象资源包实际转移效益函数为动作状态转移函数,构建资源包特征向量作为状态向量,联合资源包所在实体节点的结构特征,输入完备网络中,获得动作决策,生成训练数据放入训练池中;在网络训练过程中批量抽取训练数据完成完备网络优化,得到最终的资源调配决策网络。
本发明与现有技术相比所具有的有益效果:
本发明通过虚拟节点的一般化构建,实现深度Q学习算法在复杂工业互联网网络拓扑结构下,资源调配问题的普遍应用;此外,本发明所述方法提高了约束条件下工业互联网资源调配问题中个体目标平均效益值,提升资源调配个体目标从出发节点到达目标节点的平均时间,实现资源调配问题方法的较强通用性。
附图说明
图1 为本发明所述的基于虚拟节点构建的工业互联网资源调配方法的流程图。
图2为本发明实施例的价值损失函数收敛曲线。
具体实施方式
以一个具体工业互联网网络资源调配问题作为实施例,详细阐述本发明在解决该具体资源调配问题时的具体步骤,如图1所示。
具体地,实体工业互联网网络环境在宏观结构层面,各个工业实体节点之间存在明显拓扑连接关系,将其抽象为实际工业互联网场景中进行资源调配的固定网络结构,并以此搭建实体网络:
步骤2,计算将要构建的虚拟网络所需的虚拟节点数目。根据实体网络特征获取实体节点运输通路数、实体网络各个实体节点运输通路数缺少程度总和、实体网络中实体节点运输通路数最大缺度,根据四个主要约束条件,计算求出虚拟网络节点所需数目的取值范围,取满足条件的最小正整数,记为,即为将要构建的虚拟网络所需的虚拟节点数目。
具有虚拟节点运输通路数,其中,在满足每个虚拟节点的度数的情况下,随机生成虚拟运输通路,构建生成虚拟网络,并定义虚拟节点邻接关系集合,其中,为虚拟节点邻接矩阵,为虚拟节点运输通路连接权重,设置。直到虚拟网络中虚拟运输通路数达到,完成虚拟网络的构建。
步骤4,连接实体网络与虚拟网络,生成解决实体工业互联网网络资源调配问题的完备网络。遍历中的各实体节点,如果,其中为实体节点的度数,则将实体节点与虚拟节点集合中度数小于的虚拟节点相连,更新邻接矩阵和运输通路连接权重,完成完备网络的构建。
根据现有已经获取的工业互联网实体网络与所构建的虚拟网络,遍历中的各实体节点,,如果, 其中为实体节点的度数,则将实体节点与虚拟节点集合中的虚拟节点相连,并保证虚拟节点度数小于,完成完备网络中运输终端之间运输通路集合以及运输终端邻接矩阵更新,直到以下等式成立:
步骤5,生成训练数据,训练完备网络,得到资源调配决策网络。在实体网络各实体节点上随机生成若干资源包,抽象资源包实际转移效益函数为动作状态转移函数。构建资源包特征向量作为状态向量,联合资源包所在实体节点所在结构特征,输入完备网络中,获得动作决策,以此生成训练数据放入经验池中;在网络训练过程中批量抽取训练数据完成完备网络优化,得到最终的资源调配决策网络。
具体地,对复杂拓扑网络建立完毕后,针对每个资源个体目标,构建状态向量。其中,表示资源个体目标固有属性向量,表示资源个体目标所在节点位置各结构特征向量的串联,包括边特征、连接节点特征。资源个体目标状态矩阵输入特征编码网络,获得隐空间特征,根据子图连接关系,计算邻居节点重要性注意力权重,赋值隐空间特征不同权重。将权重再分配的隐空间特征输入决策Q网络,获得资源个体目标决策数目的动作价值函数。根据实际资源目标个体转运过程中的效益函数,抽象为奖惩规则,完成动作决策状态更新,获得动作奖励价值。
其中,动作价值函数可以表示为:
与此同时,将所获得的每一步的目标状态与决策结果存入固定容量的经验池中,完成训练数据的实时更新,使得每次训练从经验池中批量抽取数据为优化后的状态与动作决策。
在训练过程中,批量抽取状态动作数据,计算损失函数,完成网络更新。其具体代价损失函数为:
损失函数曲线收敛,得到最终的资源调配决策网络,并且可用于其他具有相同数据包转移奖惩规则的的工业互联网网络结构上,具有较强泛化性,以此形成一般工业互联网网络形式资源调配决策方案。
如图2所示为20个资源包在实体节点数为18的实体网络上进行资源调配仿真网络训练过程中,价值损失函数收敛曲线。可见,本发明所提出的基于虚拟节点构建的工业互联网资源调配方法具有稳定收敛性,能够快速获得有效全局收益,解决普适性工业互联网资源调配问题。
Claims (6)
1.一种基于虚拟节点构建的工业互联网资源调配方法,其特征在于,包括以下步骤:
步骤4,构建实体网络与虚拟网络之间的连接,更新实体节点与虚拟节点之间运输通路集合以及所有节点的邻接矩阵,生成完备网络;对完备网络进行连通性检测,若不满足连通性则回到步骤3重新执行,直至满足连通性检测条件,更新运输通路连接权重,完成完备网络的搭建;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211250383.9A CN115333953B (zh) | 2022-10-13 | 2022-10-13 | 一种基于虚拟节点构建的工业互联网资源调配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211250383.9A CN115333953B (zh) | 2022-10-13 | 2022-10-13 | 一种基于虚拟节点构建的工业互联网资源调配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115333953A true CN115333953A (zh) | 2022-11-11 |
CN115333953B CN115333953B (zh) | 2023-01-10 |
Family
ID=83914933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211250383.9A Active CN115333953B (zh) | 2022-10-13 | 2022-10-13 | 一种基于虚拟节点构建的工业互联网资源调配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115333953B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120294617A1 (en) * | 2010-01-27 | 2012-11-22 | Takashi Miyamura | Virtual Network Control Method and System Based on Fluctuations |
CN106879073A (zh) * | 2017-03-17 | 2017-06-20 | 北京邮电大学 | 一种面向业务实体网络的网络资源分配方法及装置 |
CN110995619A (zh) * | 2019-10-17 | 2020-04-10 | 北京邮电大学 | 一种服务质量感知的虚拟网络映射方法和装置 |
CN114500297A (zh) * | 2022-04-01 | 2022-05-13 | 中国科学技术大学 | 基于虚实融合的大规模网络测试系统 |
-
2022
- 2022-10-13 CN CN202211250383.9A patent/CN115333953B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120294617A1 (en) * | 2010-01-27 | 2012-11-22 | Takashi Miyamura | Virtual Network Control Method and System Based on Fluctuations |
CN106879073A (zh) * | 2017-03-17 | 2017-06-20 | 北京邮电大学 | 一种面向业务实体网络的网络资源分配方法及装置 |
CN110995619A (zh) * | 2019-10-17 | 2020-04-10 | 北京邮电大学 | 一种服务质量感知的虚拟网络映射方法和装置 |
CN114500297A (zh) * | 2022-04-01 | 2022-05-13 | 中国科学技术大学 | 基于虚实融合的大规模网络测试系统 |
Non-Patent Citations (2)
Title |
---|
JIANPENG LIN等: ""Virtualized Resource Scheduling in Cloud Computing Environments: An Review"", 《2020 IEEE CONFERENCE ON TELECOMMUNICATIONS, OPTICS AND COMPUTER SCIENCE (TOCS)》 * |
徐金烨: ""人工智能应用下NFV服务功能链的优化部署研究"", 《通信设计与应用》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115333953B (zh) | 2023-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110611619B (zh) | 一种基于ddpg强化学习算法的智能化路由决策方法 | |
CN112132202B (zh) | 一种基于综合信任评价的边缘计算协同盟员发现方法 | |
CN101777990A (zh) | 多目标免疫优化组播路由路径选择方法 | |
CN111988225A (zh) | 基于强化学习和迁移学习的多路径路由方法 | |
CN115022937B (zh) | 拓扑特征提取方法和考虑拓扑特征的多边缘协作调度方法 | |
CN114415735B (zh) | 面向动态环境的多无人机分布式智能任务分配方法 | |
CN114710439B (zh) | 基于深度强化学习的网络能耗与吞吐量联合优化路由方法 | |
CN111917642B (zh) | 分布式深度强化学习的sdn网络智慧路由数据传输方法 | |
CN114697229A (zh) | 一种分布式路由规划模型的构建方法及应用 | |
CN111010341B (zh) | 一种基于深度学习的覆盖网络路由决策方法 | |
CN117392483B (zh) | 基于增强学习的相册分类模型训练加速方法、系统及介质 | |
CN116963225B (zh) | 一种面向流媒体传输的无线mesh网络路由方法 | |
CN115333953B (zh) | 一种基于虚拟节点构建的工业互联网资源调配方法 | |
Zhu et al. | CollOR: Distributed collaborative offloading and routing for tasks with QoS demands in multi-robot system | |
CN114792187B (zh) | 基于意愿和信任双重约束的群智感知团队招募方法及系统 | |
LU505448B1 (en) | Industrial internet resource allocation method based on virtual node construction | |
CN114828049B (zh) | 一种基于多智能体强化学习的无线网络拓扑优化控制方法 | |
CN101741749A (zh) | 基于免疫克隆的多目标组播路由优化方法 | |
CN115499365A (zh) | 路由优化方法、装置、设备及介质 | |
CN113595756A (zh) | 一种异质化节点和链路的网络建模方法、通信设备及网络 | |
CN115456313B (zh) | 一种基于分层优化的工业互联网资源调配方法 | |
Ma | Multi-Task Offloading via Graph Neural Networks in Heterogeneous Multi-access Edge Computing | |
CN110611617B (zh) | 基于节点差异性与活跃度的dtn路由方法 | |
Zhang et al. | Adaptive Service Function Chain Orchestration Algorithm Based on Deep Reinforcement Learning | |
CN116915629A (zh) | 一种共址虚拟网元节能抗干扰部署方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |