CN108075975A - 一种物联网环境中的路由传输路径的确定方法及确定系统 - Google Patents
一种物联网环境中的路由传输路径的确定方法及确定系统 Download PDFInfo
- Publication number
- CN108075975A CN108075975A CN201711458747.1A CN201711458747A CN108075975A CN 108075975 A CN108075975 A CN 108075975A CN 201711458747 A CN201711458747 A CN 201711458747A CN 108075975 A CN108075975 A CN 108075975A
- Authority
- CN
- China
- Prior art keywords
- transmission path
- routing
- route
- state
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 191
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000009471 action Effects 0.000 claims abstract description 38
- 230000007704 transition Effects 0.000 claims abstract description 35
- 238000012216 screening Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 abstract description 70
- 230000007613 environmental effect Effects 0.000 abstract description 4
- 230000002787 reinforcement Effects 0.000 description 18
- 238000005265 energy consumption Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/02—Topology update or discovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明公开一种物联网环境中的路由传输路径的确定方法及确定系统,所述确定方法包括:根据路由节点的当前状态和当前选择的动作建立马尔可夫路由决策模型;根据所述马尔可夫路由决策模型确定各路由传输路径的值函数;根据各所述路由传输路径的值函数确定路由的优选传输路径。本发明面向路由参量信息不全面,或者完全未知的情况,利用强化学习构建包括节点状态集、转发行动集、状态转移概率、奖赏值的四元组的马尔可夫路由决策模型,利用bellman最优定理,求取最大值函数,获取优选传输路径。当最大值函数对应的策略不唯一时,定义归一化值密度与加权转移概率,以网络与环境需求为加权基准,完成最优路径选择。
Description
技术领域
本发明涉及无线通信领域,特别是涉及一种物联网环境中的路由传输路径的确定方法及确定系统。
背景技术
物联网环境下,网络具有规模大、形式多样、拓扑纷杂的特点,网络形式、能耗、节点数量、移动性等诸多因素对物联网路由提出了更高的要求,需要考虑的参量已然不仅仅是能量,而是多因素之间的均衡。而且,庞杂的网络体系不可避免地面临不确定的环境因素与网络因素,如路由参量信息不全面或者完全未知的情况。如何在不确定条件下完成路由选择,同时均衡路由性能,成为本领域技术人员亟需解决的技术问题。
发明内容
本发明的目的是提供一种物联网环境中的路由传输路径的确定方法及确定系统,能够在路由条件未知或者不全面的情况下提供满足网络需求的路由传输路径。
为实现上述目的,本发明提供了如下方案:
一种物联网环境中的路由传输路径的确定方法,所述确定方法包括:
根据路由节点的当前状态和当前选择的动作建立马尔可夫路由决策模型;
根据所述马尔可夫路由决策模型确定各路由传输路径的值函数;
根据各所述路由传输路径的值函数确定路由的优选传输路径。
可选的,所述根据各所述路由传输路径的值函数确定路由的优选传输路径之后,还包括:
根据各所述路由传输路径的值函数更新所述马尔可夫路由决策模型,获得更新后的马尔可夫路由决策模型,返回所述“根据各所述路由传输路径的值函数确定路由的优选传输路径”。
可选的,所述马尔可夫路由决策模型为:其中,S表示所有状态组成的节点状态集,A(S)表示状态集S对应的所有路由动作的集合;s和s′均为所述节点状态集S中的状态元素,其中,s′表示路由节点在第t个决策时刻的状态,s表示路由节点在第(t+1)个决策时刻的状态,t表示正整数,a表示路由动作,表示路由节点执行路由动作a后由状态s′转移到状态s的概率,表示路由节点执行路由动作a后由状态s′转移到状态s获得的即时奖赏值。
可选的,每条所述路由传输路径的值函数为:
其中,m表示路由传输路径的序号且1≤m≤M,M表示路由传输路径的总数,π表示路由传输路径,表示路由节点状态s对应的第m条路由传输路径的值函数,N表示决策时刻的总数,Em表示第m条路由传输路径的期望,γ表示折扣因子且γ∈(0,1],t表示决策时刻的序号,st表示第t个决策时刻的状态,rt表示第t个决策时刻路由节点执行路由动作a后状态s获得的瞬时奖赏值。
可选的,所述根据各所述路由传输路径的值函数确定路由的优选传输路径,具体包括:
根据各所述路由传输路径的值函数计算每条所述路由传输路径的值函数值;
筛选出值函数值最大的路由传输路径作为路由的优选传输路径。
可选的,在所述筛选出值函数值最大的路由传输路径作为路由的优选传输路径之后,还包括:
判断所述优选传输路径的条数是否大于1,获得第一判断结果;
若所述第一判断结果表示所述优选传输路径的条数等于1,则将所述优选传输路径确定为最优传输路径;
若所述第一判断结果表示所述优选传输路径的条数大于1,则根据各所述优选传输路径的值函数值确定每条所述优选传输路径的值密度;
根据各所述优选传输路径的值密度确定每条所述优选传输路径的加权转移概率;
筛选出加权转移概率最大的优选传输路径作为路由的最优传输路径。
可选的,根据公式:确定每条所述优选传输路径的值密度,其中,πi表示优选传输路径,表示第i条优选传输路径,表示路由节点状态s对应的第i条优选传输路径的值密度,I表示优选传输路径的数量,表示路由节点状态s对应的第i条优选传输路径的值函数。
可选的,根据公式:确定每条所述优选传输路径的加权转移概率,其中,表示路由节点状态s对应的第i条优选传输路径的加权转移概率,αi表示根据网络需求确定的第i条优选传输路径的概率系数。
一种物联网环境中的路由传输路径的确定系统,所述确定系统包括:
决策模型建立模块,用于根据路由节点的当前状态和当前选择的动作建立马尔可夫路由决策模型;
值函数确定模块,用于根据所述马尔可夫路由决策模型确定各路由传输路径的值函数;
优选路径确定模块,用于根据各所述路由传输路径的值函数确定路由的优选传输路径。
可选的,所述确定系统还包括:
模型更新模块,用于根据各所述路由传输路径的值函数更新所述马尔可夫路由决策模型,获得更新后的马尔可夫路由决策模型,并将更新后的马尔可夫路由决策模型发送给所述优选路径确定模块。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明首先根据路由节点的当前状态和当前选择的动作建立马尔可夫路由决策模型,然后根据马尔可夫路由决策模型确定各路由传输路径的值函数,最后根据各路由传输路径的值函数确定路由的优选传输路径,能够在网络信息缺失,路由信息不足的环境下确定路由的优选传输路径。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例1提供的确定方法的流程图;
图2为本发明实施例1提供的确定方法中步骤13的流程图;
图3为本发明实施例2提供的确定系统的结构框图;
图4为本发明实施例3提供的强化学习加权均衡未知环境路由的原理图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种物联网环境中的路由传输路径的确定方法及确定系统,能够在路由条件未知或者不全面的情况下提供满足网络需求的路由传输路径。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例1提供的确定方法的流程图。如图1所示,一种物联网环境中的路由传输路径的确定方法,所述确定方法包括:
步骤11:根据路由节点的当前状态和当前选择的动作建立马尔可夫路由决策模型。本实施例中,利用强化学习方法建立包括节点状态集、转发行动集、状态转移概率、奖赏值的四元组的马尔可夫路由决策模型。
所述马尔可夫路由决策模型为:其中,S表示所有状态组成的节点状态集,A(S)表示状态集S对应的所有路由动作的集合;s和s′均为所述节点状态集S中的状态元素,其中,s′表示路由节点在第t个决策时刻的状态,s表示路由节点在第(t+1)个决策时刻的状态,t表示正整数,a表示路由动作,表示路由节点执行路由动作a后由状态s′转移到状态s的概率,表示路由节点执行路由动作a后由状态s′转移到状态s获得的即时奖赏值。
步骤12:根据所述马尔可夫路由决策模型确定各路由传输路径的值函数。
每条所述路由传输路径的值函数为:
其中,m表示路由传输路径的序号且1≤m≤M,M表示路由传输路径的总数,π表示路由传输路径,表示路由节点状态s对应的第m条路由传输路径的值函数,N表示决策时刻的总数,Em表示第m条路由传输路径的期望,γ表示折扣因子且γ∈(0,1],t表示决策时刻的序号,st表示第t个决策时刻的状态,rt表示第t个决策时刻路由节点执行路由动作a后状态s获得的瞬时奖赏值。
步骤13:根据各所述路由传输路径的值函数确定路由的优选传输路径。
可选地,执行步骤13:所述根据各所述路由传输路径的值函数确定路由的优选传输路径之后,还包括:
步骤14:根据各所述路由传输路径的值函数更新所述马尔可夫路由决策模型,获得更新后的马尔可夫路由决策模型,返回所述“根据各所述路由传输路径的值函数确定路由的优选传输路径”。
图2为本发明实施例1提供的确定方法中步骤13的流程图。如图2所示,步骤13:所述根据各所述路由传输路径的值函数确定路由的最优传输路径,具体包括:
步骤131:根据各所述路由传输路径的值函数计算每条所述路由传输路径的值函数值;
步骤132:筛选出值函数值最大的路由传输路径作为路由的优选传输路径。
执行步骤132:所述筛选出值函数值最大的路由传输路径作为路由的优选传输路径之后,还包括:
步骤133:判断所述优选传输路径的条数是否大于1,获得第一判断结果;
若所述第一判断结果表示所述优选传输路径的条数等于1,则执行步骤134;
若所述第一判断结果表示所述优选传输路径的条数大于1,则执行步骤135;
步骤134:将所述优选传输路径确定为最优传输路径;
步骤135:根据各所述优选传输路径的值函数值确定每条所述优选传输路径的值密度。
本实施例中,根据公式:确定每条所述优选传输路径的值密度,其中,表示第i条优选传输路径,表示路由节点状态s对应的第i条优选传输路径的值密度,I表示优选传输路径的数量,表示路由节点状态s对应的第i条优选传输路径的值函数。
步骤136:根据各所述优选传输路径的值密度确定每条所述优选传输路径的加权转移概率。
本实施例中,根据公式:确定每条所述优选传输路径的加权转移概率,其中,表示路由节点状态s对应的第i条优选传输路径的加权转移概率,αi表示根据网络需求确定的第i条优选传输路径的概率系数。本实施例中,网络需求为最低能耗、最短路径、最大生命期和/或最大覆盖范围等。
步骤137:筛选出加权转移概率最大的优选传输路径作为路由的最优传输路径。
一阶马尔可夫决策过程的本质是:当前状态向下一状态转移的概率和奖赏值只取决于当前状态和选择的动作,而与历史状态和历史动作无关。因此假设环境是马尔可夫型的,在已知状态转移概率函数P和奖赏函数R的系统模型知识下,可以用动态规划技术求解最优策略,在此考虑到物联网环境的多目标特性,即只考虑单一性能指标将不能完全满足网络需求,因此在动态规划的基础上,运用多目标决策理论,对网络需求进行加权均衡,以此选择出最优路径。
本发明利用强化学习与多度量因素加权相结合迭代选择最优策略,实现在网络信息缺失,路由信息不足的环境下的最优路径选取,一方面可以实现未知环境的路由选择,另一方面还将针对网络需求与目标加权配比转移概率,针对物联网、尤其是大规模复杂物联网动态调节参数间平衡,获取允许决策集节点转移概率,找到满足要求的全局最优路径,学习结果还能用于构建路由状态转移的马尔可夫模型,为进一步优化选路提供基础数据。
实施例2:
图3为本发明实施例2提供的确定系统的结构框图。如图3所示,一种物联网环境中的路由传输路径的确定系统,所述确定系统包括:
决策模型建立模块21,用于根据路由节点的当前状态和当前选择的动作建立马尔可夫路由决策模型;
值函数确定模块22,用于根据所述马尔可夫路由决策模型确定各路由传输路径的值函数;
优选路径确定模块23,用于根据各所述路由传输路径的值函数、利用贝尔曼最优定理方程(动态规划方程)确定路由的优选传输路径;
模型更新模块24,用于根据各所述路由传输路径的值函数更新所述马尔可夫路由决策模型,获得更新后的马尔可夫路由决策模型,并将更新后的马尔可夫路由决策模型发送给所述优选路径确定模块。
本发明面向路由参量信息不全面,或者完全未知的情况,利用强化学习构建包括节点状态集、转发行动集、状态转移概率、奖赏值的四元组的马尔可夫路由决策模型,利用bellman最优定理,求取最大值函数,获取优选传输路径。当最大值函数对应的策略不唯一时,定义归一化值密度与加权转移概率,以网络与环境需求为加权基准,完成最优路径选择。
实施例3:
本实施例针对物联网不确定环境的路由选择技术,分析路由选择所需要依赖的必要条件,提出一种基于强化学习加权均衡的物联网未知环境路由选择方法,实现在路由条件未知或者不全面的情况下,确定最优传输路径。
图4为本发明实施例3提供的强化学习加权均衡未知环境路由的原理图。如图4所示,本实施例在未知环境的路由构建时,利用强化学习构建包括节点状态集、转发行动集、状态转移概率、奖赏值四元组的马尔可夫路由决策模型,利用贝尔曼最优定理方程(BellmanEquation,动态规划方程)求取最大值函数,获取路由的优选传输路径。当最大值函数对应的传输路径不唯一时,定义归一化值密度与加权转移概率,以网络与环境需求为加权基准,完成最优传输路径选择。
具体地,本实施例提供的路由传输路径的确定方法包括:
步骤31:根据路由节点的当前状态和当前选择的动作建立马尔可夫路由决策模型。
路由决策当前状态向下一状态转移的概率和奖赏值只取决于当前状态和选择的动作,而与历史状态和历史动作无关,与顺序型决策一阶马尔可夫过程吻合,因此可以假设环境是马尔可夫型的。在转移概率P和奖赏值R未知的情况下,通过强化学习过程构建Markov决策过程的四元组为:其中S为所有可能的状态组成的节点非空状态集,s和s′均为所述节点状态集S中的状态元素,A(S)表示状态集S下所有可能的路由动作集合;当系统在决策时刻t处于状态s′,执行路由决策a后,系统在下一决策时刻(t+1)处于状态s的概率是获得的即时奖赏值为
步骤32:根据所述马尔可夫路由决策模型确定各路由传输路径的值函数。
定义准则函数V,或称为目标函数,在本策略中为物联网未知环境路由的选路目标,可定义为有期望时段总报酬、期望折扣总报酬、平均报酬等,该值可以是状态值函数,也可以是状态动作对函数。在物联网未知环境下可以进一步定义为最低能耗,最短路径,最大生命期,最大覆盖范围等。
对于不收敛的强化学习问题,采用任务分解的方式,即分层强化学习,分别在子网中进行建模,如此则起到了降维降次的目的,大大提高算法的收敛速度,节约网络能耗。收敛的强化学习则不需要考虑降维,进一步考虑到的物联网路由状态有限、网络规模大等特点,本实施例采取无限折扣总报酬准则,对于策略(路由传输路径)π值函数定义为:
其中,表示t时刻状态st=s的瞬时奖赏值,γ∈(0,1]为折扣因子,以表征近邻节点与近邻选路动作产生的奖赏所占的权重大于未来动作奖赏的作用。
步骤33:根据各所述路由传输路径的值函数确定路由的优选传输路径。
值函数可以用来筛选最优策略,通过鉴别最优值函数获得,将筛选出的值函数值最大的路由传输路径作为路由的优选传输路径。利用强化学习进行路由选择的目的是获得最优选路策略π*:S→A,在S状态下采取路由行动A而获取最大奖赏。
最优值函数定义为进一步可递归为利用Bellman最优方程得优选传输路径为:其中,π表示所有传输路径,π*表示优选传输路径,表示状态s对应的优选传输路径的值函数,表示状态s′对应的优选传输路径的值函数。
步骤34:判断所述优选传输路径的条数是否大于1,获得第一判断结果;
若所述第一判断结果表示所述优选传输路径的条数等于1,则将所述优选传输路径确定为最优传输路径;
若所述第一判断结果表示所述优选传输路径的条数大于1,则根据各所述优选传输路径的值函数值确定每条所述优选传输路径的值密度;
步骤35:根据各所述优选传输路径的值密度确定每条所述优选传输路径的加权转移概率;
步骤36:筛选出加权转移概率最大的优选传输路径作为路由的最优传输路径。
优选传输路径可能不只一个,但他们的值函数相同,然而在路由选择过程中,对于单跳网络来说,每次决策,只可采取一个最优路径,因此,在此情况下,本发明将根据网络需求的度量权值获取唯一最优传输路径。定义值密度函数其中I为通过Bellman最优策略获得的优选传输路径的数量。定义最大值函数对应最优策略集的加权转移概率A(a1,a2,…,ai,…,aI)→π*。非最大值函数对应的传输路径已不在当次最优选路备选集合中,因此记加权转移概率为0,αi为s状态下采取π*策略所对应选择动作的权值,以此来表征网络需求与偏好度。
在此基础上,选择转移概率最大的路径为最优路径,即
步骤37:根据各所述路由传输路径的值函数更新所述马尔可夫路由决策模型。
本实施例中,将值函数V更新到马尔可夫四元组中,成为马尔可夫选路五元组并将马尔可夫选路五元组模型进一步存到路由邻居表,以此作为后续选路判断的依据,节约选路成本。
强化学习是人工智能中策略学习的一种,基于最大利益准则,是智能系统从环境到行为映射的学习,强化学习的目标是动态地调整参数,以达到奖励信号(强化信号)函数值最大的目的。在物联网未知环境下,由于外部环境提供的信息很少,因此,本发明采用强化学习方法,在行动-评价的环境中获得知识,改进路由方案以适应环境。同时,针对强化学习最大值函数对应的策略不唯一的情况,通过值密度加权转移概率在已有优选路由方案中选择决策倾向性较高的链路。对于强化学习的收敛问题,采用了任务分解的方式,分别在子网中进行建模,从而实现降维降次的目的,大大提高了算法的收敛速度,节约网络能耗。进一步地,还可以在强化学习路由建立的过程中引入性能势函数,以降低策略比较的计算量,当路由策略改变时,只需比较当前性能势因子即可,进一步提高选路速度,降低能耗与时延,延长网络生命期。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种物联网环境中的路由传输路径的确定方法,其特征在于,所述确定方法包括:
根据路由节点的当前状态和当前选择的动作建立马尔可夫路由决策模型;
根据所述马尔可夫路由决策模型确定各路由传输路径的值函数;
根据各所述路由传输路径的值函数确定路由的优选传输路径。
2.根据权利要求1所述的确定方法,其特征在于,所述根据各所述路由传输路径的值函数确定路由的优选传输路径之后,还包括:
根据各所述路由传输路径的值函数更新所述马尔可夫路由决策模型,获得更新后的马尔可夫路由决策模型,返回所述“根据各所述路由传输路径的值函数确定路由的优选传输路径”。
3.根据权利要求1所述的确定方法,其特征在于,所述马尔可夫路由决策模型为:
其中,S表示所有状态组成的节点状态集,A(S)表示状态集S对应的所有路由动作的集合;s和s′均为所述节点状态集S中的状态元素,其中,s′表示路由节点在第t个决策时刻的状态,s表示路由节点在第(t+1)个决策时刻的状态,t表示正整数,a表示路由动作,表示路由节点执行路由动作a后由状态s′转移到状态s的概率,表示路由节点执行路由动作a后由状态s′转移到状态s获得的即时奖赏值。
4.根据权利要求1所述的确定方法,其特征在于,每条所述路由传输路径的值函数为:
其中,m表示路由传输路径的序号且1≤m≤M,M表示路由传输路径的总数,π表示路由传输路径,表示路由节点状态s对应的第m条路由传输路径的值函数,N表示决策时刻的总数,Em表示第m条路由传输路径的期望,γ表示折扣因子且γ∈(0,1],t表示决策时刻的序号,st表示第t个决策时刻的状态,rt表示第t个决策时刻路由节点执行路由动作a后状态s获得的瞬时奖赏值。
5.根据权利要求1所述的确定方法,其特征在于,所述根据各所述路由传输路径的值函数确定路由的优选传输路径,具体包括:
根据各所述路由传输路径的值函数计算每条所述路由传输路径的值函数值;
筛选出值函数值最大的路由传输路径作为路由的优选传输路径。
6.根据权利要求5所述的确定方法,其特征在于,在所述筛选出值函数值最大的路由传输路径作为路由的优选传输路径之后,还包括:
判断所述优选传输路径的条数是否大于1,获得第一判断结果;
若所述第一判断结果表示所述优选传输路径的条数等于1,则将所述优选传输路径确定为最优传输路径;
若所述第一判断结果表示所述优选传输路径的条数大于1,则根据各所述优选传输路径的值函数值确定每条所述优选传输路径的值密度;
根据各所述优选传输路径的值密度确定每条所述优选传输路径的加权转移概率;
筛选出加权转移概率最大的优选传输路径作为路由的最优传输路径。
7.根据权利要求6所述的确定方法,其特征在于,根据公式:
确定每条所述优选传输路径的值密度,其中,πi表示优选传输路径,表示第i条优选传输路径,表示路由节点状态s对应的第i条优选传输路径的值密度,I表示优选传输路径的数量,表示路由节点状态s对应的第i条优选传输路径的值函数。
8.根据权利要求7所述的确定方法,其特征在于,根据公式:
确定每条所述优选传输路径的加权转移概率,其中,表示路由节点状态s对应的第i条优选传输路径的加权转移概率,αi表示根据网络需求确定的第i条优选传输路径的概率系数。
9.一种物联网环境中的路由传输路径的确定系统,其特征在于,所述确定系统包括:
决策模型建立模块,用于根据路由节点的当前状态和当前选择的动作建立马尔可夫路由决策模型;
值函数确定模块,用于根据所述马尔可夫路由决策模型确定各路由传输路径的值函数;
优选路径确定模块,用于根据各所述路由传输路径的值函数确定路由的优选传输路径。
10.根据权利要求9所述的确定系统,其特征在于,所述确定系统还包括:
模型更新模块,用于根据各所述路由传输路径的值函数更新所述马尔可夫路由决策模型,获得更新后的马尔可夫路由决策模型,并将更新后的马尔可夫路由决策模型发送给所述优选路径确定模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711458747.1A CN108075975B (zh) | 2017-12-28 | 2017-12-28 | 一种物联网环境中的路由传输路径的确定方法及确定系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711458747.1A CN108075975B (zh) | 2017-12-28 | 2017-12-28 | 一种物联网环境中的路由传输路径的确定方法及确定系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108075975A true CN108075975A (zh) | 2018-05-25 |
CN108075975B CN108075975B (zh) | 2020-10-16 |
Family
ID=62155718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711458747.1A Expired - Fee Related CN108075975B (zh) | 2017-12-28 | 2017-12-28 | 一种物联网环境中的路由传输路径的确定方法及确定系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108075975B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108900416A (zh) * | 2018-06-19 | 2018-11-27 | 浙江水利水电学院 | 一种基于数学模型的网络通讯最优路径获取方法 |
CN109409592A (zh) * | 2018-10-15 | 2019-03-01 | 浙江工业大学 | 动态环境下移动机器人的最优策略解决方法 |
CN109818856A (zh) * | 2019-03-07 | 2019-05-28 | 北京西米兄弟未来科技有限公司 | 一种多路径数据传输方法及装置 |
CN111107602A (zh) * | 2019-12-24 | 2020-05-05 | 杭州电子科技大学 | 一种无线体域网能耗和时延加权最小的安全路由选择方法 |
CN112039767A (zh) * | 2020-08-11 | 2020-12-04 | 山东大学 | 基于强化学习的多数据中心节能路由方法及系统 |
CN112511434A (zh) * | 2020-11-25 | 2021-03-16 | 广州技象科技有限公司 | 物联网节点接入路径规划方法、装置、设备和存储介质 |
CN112533263A (zh) * | 2020-11-25 | 2021-03-19 | 广州技象科技有限公司 | 传感器网络路径优化方法、装置、设备和存储介质 |
CN112685168A (zh) * | 2019-10-17 | 2021-04-20 | 中国移动通信集团浙江有限公司 | 资源管理方法、装置及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070174105A1 (en) * | 2006-01-20 | 2007-07-26 | Naoki Abe | System and method for marketing mix optimization for brand equity management |
CN102006237A (zh) * | 2010-12-13 | 2011-04-06 | 西安电子科技大学 | 用于容迟网络的路由决策方法 |
CN104035889A (zh) * | 2014-06-18 | 2014-09-10 | 中国人民解放军信息工程大学 | 一种多态路由派生方法及系统 |
CN105657775A (zh) * | 2016-04-17 | 2016-06-08 | 吉林大学 | 用于移动自组织网络稳定路由建立的方法 |
CN106060887A (zh) * | 2016-05-25 | 2016-10-26 | 重庆邮电大学 | 面向时空特性变化认知的机会网络路由方法 |
-
2017
- 2017-12-28 CN CN201711458747.1A patent/CN108075975B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070174105A1 (en) * | 2006-01-20 | 2007-07-26 | Naoki Abe | System and method for marketing mix optimization for brand equity management |
CN102006237A (zh) * | 2010-12-13 | 2011-04-06 | 西安电子科技大学 | 用于容迟网络的路由决策方法 |
CN104035889A (zh) * | 2014-06-18 | 2014-09-10 | 中国人民解放军信息工程大学 | 一种多态路由派生方法及系统 |
CN105657775A (zh) * | 2016-04-17 | 2016-06-08 | 吉林大学 | 用于移动自组织网络稳定路由建立的方法 |
CN106060887A (zh) * | 2016-05-25 | 2016-10-26 | 重庆邮电大学 | 面向时空特性变化认知的机会网络路由方法 |
Non-Patent Citations (3)
Title |
---|
刘峡壁: "《人工智能导论 方法与系统》", 31 August 2008 * |
张文宇: "《物联网智能技术》", 30 April 2012 * |
田苗: "强化学习算法的研究与实验", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108900416A (zh) * | 2018-06-19 | 2018-11-27 | 浙江水利水电学院 | 一种基于数学模型的网络通讯最优路径获取方法 |
CN108900416B (zh) * | 2018-06-19 | 2019-09-24 | 浙江水利水电学院 | 一种基于数学模型的网络通讯最优路径获取方法 |
CN109409592A (zh) * | 2018-10-15 | 2019-03-01 | 浙江工业大学 | 动态环境下移动机器人的最优策略解决方法 |
CN109409592B (zh) * | 2018-10-15 | 2021-08-24 | 浙江工业大学 | 动态环境下移动机器人的最优策略解决方法 |
CN109818856B (zh) * | 2019-03-07 | 2021-07-13 | 北京西米兄弟未来科技有限公司 | 一种多路径数据传输方法及装置 |
CN109818856A (zh) * | 2019-03-07 | 2019-05-28 | 北京西米兄弟未来科技有限公司 | 一种多路径数据传输方法及装置 |
CN112685168A (zh) * | 2019-10-17 | 2021-04-20 | 中国移动通信集团浙江有限公司 | 资源管理方法、装置及设备 |
CN112685168B (zh) * | 2019-10-17 | 2023-12-26 | 中国移动通信集团浙江有限公司 | 资源管理方法、装置及设备 |
CN111107602A (zh) * | 2019-12-24 | 2020-05-05 | 杭州电子科技大学 | 一种无线体域网能耗和时延加权最小的安全路由选择方法 |
CN111107602B (zh) * | 2019-12-24 | 2021-07-27 | 杭州电子科技大学 | 一种无线体域网能耗和时延加权最小的安全路由选择方法 |
CN112039767A (zh) * | 2020-08-11 | 2020-12-04 | 山东大学 | 基于强化学习的多数据中心节能路由方法及系统 |
CN112511434A (zh) * | 2020-11-25 | 2021-03-16 | 广州技象科技有限公司 | 物联网节点接入路径规划方法、装置、设备和存储介质 |
CN112533263A (zh) * | 2020-11-25 | 2021-03-19 | 广州技象科技有限公司 | 传感器网络路径优化方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108075975B (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108075975B (zh) | 一种物联网环境中的路由传输路径的确定方法及确定系统 | |
CN110809306B (zh) | 一种基于深度强化学习的终端接入选择方法 | |
Dias et al. | Adapting sampling interval of sensor networks using on-line reinforcement learning | |
CN111666149A (zh) | 基于深度强化学习的超密边缘计算网络移动性管理方法 | |
Deng et al. | A digital twin approach for self-optimization of mobile networks | |
US20220248237A1 (en) | Neural network circuit remote electrical tilt antenna infrastructure management based on probability of actions | |
CN114697229B (zh) | 一种分布式路由规划模型的构建方法及应用 | |
CN111491358B (zh) | 基于能量采集的自适应调制和功率控制系统与优化方法 | |
CN109547351A (zh) | Ad Hoc网络中基于Q学习和信任模型的路由方法 | |
CN109413710B (zh) | 基于遗传算法优化的无线传感器网络的分簇方法及装置 | |
CN111836327B (zh) | 一种水下传感器网络路由数据传输方法及水下传感器网络 | |
CN110225569B (zh) | 一种基于改进粒子群算法的WSNs分簇多跳路由协议的方法 | |
CN115065678A (zh) | 一种基于深度强化学习的多智能设备任务卸载决策方法 | |
CN114301910A (zh) | 一种物联网环境下的云边协同计算任务卸载方法 | |
Alcaraz et al. | Online reinforcement learning for adaptive interference coordination | |
CN105959912B (zh) | 基于改进离散差分算法的汇聚节点定位方法 | |
CN111160513B (zh) | 一种电力配电网的能量优化方法 | |
CN111371572B (zh) | 一种网络节点的选举方法及节点设备 | |
CN116847425A (zh) | 一种基于高维数据联合优化的多资源路由优化方法 | |
CN113938978B (zh) | 一种基于强化学习的异构无线传感器寻路方法 | |
CN109492744A (zh) | 一种离散二进制粒子群算法与模糊控制耦合的混合运行优化控制方法 | |
CN115665264A (zh) | 一种基于时延感知的电力通信网自主业务编排方法和装置 | |
CN111010704B (zh) | 基于指数平滑的水下无线传感器网络数据预测优化方法 | |
Kumar et al. | Prolonging network lifetime by electing suitable cluster head by dynamic weight adjustment for weighted clustering algorithm in MANET | |
Wang et al. | A Cross-Layer Framework for LPWAN Management based on Fuzzy Cognitive Maps with Adaptive Glowworm Swarm Optimization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201016 Termination date: 20211228 |
|
CF01 | Termination of patent right due to non-payment of annual fee |