CN114845353A - D2d网络中基于确定性估计器学习自动机的定向天线邻居发现方法 - Google Patents
D2d网络中基于确定性估计器学习自动机的定向天线邻居发现方法 Download PDFInfo
- Publication number
- CN114845353A CN114845353A CN202210246181.0A CN202210246181A CN114845353A CN 114845353 A CN114845353 A CN 114845353A CN 202210246181 A CN202210246181 A CN 202210246181A CN 114845353 A CN114845353 A CN 114845353A
- Authority
- CN
- China
- Prior art keywords
- sector
- directional antenna
- automaton
- network
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000003993 interaction Effects 0.000 claims abstract description 5
- 239000003795 chemical substances by application Substances 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 9
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 230000009471 action Effects 0.000 claims description 5
- 230000007704 transition Effects 0.000 claims description 4
- 238000005315 distribution function Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 230000006399 behavior Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 6
- 230000007246 mechanism Effects 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W40/00—Communication routing or communication path finding
- H04W40/24—Connectivity information management, e.g. connectivity discovery or connectivity update
- H04W40/246—Connectivity information discovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/70—Services for machine-to-machine communication [M2M] or machine type communication [MTC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/005—Discovery of network devices, e.g. terminals
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
一种D2D网络中基于确定性估计器学习自动机的定向天线邻居发现方法,该方法利用学习自动机机制,并引入了确定性估计器,将D2D网络中的节点都建模为一个单独的智能体,并采用Generalized Pursuit算法更新扇区概率分布,通过与环境的交互积累经验,指导下一次的邻居发现过程,有效提升邻居发现的效率。
Description
技术领域
本发明属于无线通信领域中的D2D通信技术领域,尤其是一种基于定向天线的邻居节点发现方法。
背景技术
D2D通信作为一种短距离的通信技术,既可以在基站的控制下进行通信,也可以在无基站控制下直接进行终端通信。D2D通信允许两个距离较近的用户终端直接建立通信链路进行数据传输。基于D2D通信技术广阔的应用前景,越来越多的国内外研究学者对其进行了深入的研究。D2D邻居设备发现是D2D技术的主要研究方向之一。
根据不同的天线模式,邻居发现方法可以分为全向邻居发现和定向邻居发现两类。全向天线操作简单,但存在数据传输速率低,链路覆盖距离短,抗干扰能力弱等问题。而使用定向天线能够解决以上问题,因此,定向天线被应用于邻居发现中。使用定向天线后,节点之间需要考虑波束对准问题。现有的定向天线邻居发现方法可以分为两大类,随机型与规划型。在随机型方法里,网络中的每个节点随机选择一个方向进入发送或是接收状态,规划型方法则与之不同,它根据事先设计好的扫描序列与收发序列来收送信息。更进一步,在实际应用中,节点位置不是一成不变的,往往处于运动状态下,需要不断重新发现邻居节点,所以之前邻居发现的信息可以作为历史信息保存下来,为后续邻居发现积累经验。
发明内容
为了克服现有技术的不足,为进一步提升邻居发现的效率,本发明提出了一种D2D网络中基于确定性估计器学习自动机的定向天线邻居发现方法,该方法利用学习自动机机制,并引入了确定性估计器,通过与环境的交互,积累经验,直到下一次的邻居发现过程,达到提高邻居发现效率的目的。
为了解决上述技术问题,本发明提供如下的技术方案:
一种D2D网络中基于确定性估计器学习自动机的定向天线邻居发现方法,假设在一个D2D网络场景中,存在M个节点,每个节点的发送天线均为定向天线,可以指向k个天线扇区中的一个方向,时间被划分为以时隙为单位,在每个时隙节点可以任意选择一个扇区方向进行发送或者接收数据,节点间保持时间同步,当两节点当前时刻的天线指向相对,并满足一个节点发送信息,另一节点接收信息,可以互相发现对方,所述D2D网络中基于确定性估计器学习自动机的定向天线邻居发现方法包括以下步骤:
1)模型建立,D2D网络中的每个节点都作为一个单独的智能体;
2)动作执行,智能体根据当前时刻的概率分布,选择定向天线的指向扇区,并以相等的概率选择发送或者接收模式;
3)状态更新,根据与环境交互得到的反馈,更新估计器,并根据GeneralizedPursuit算法,更新扇区的概率分布;
4)状态转移,循环至步骤2),直至邻居节点发现完成。
进一步,所述步骤1)中,确定性估计器学习自动机将智能体定义为四元组{A,B,Q,T}:
A={a1,a2,...,ak}是学习自动机的输出行为合集,表示智能体定向天线指向;
B={0,1}是输入学习自动机的合集,其中“0”代表惩罚,表示智能体没有发现新的邻居节点,“1”代表奖励,表示智能体发现了新的邻居节点;
Q=<P,E>是学习自动机的状态,其中P={p1(t),p2(t),...,pk(t)}是自动机在t时刻的状态,表示智能体在t时刻的扇区概率分布;E=D(t),是自动机在t时刻的确定性估计器向量,每一个行为的奖励估计值i∈{1,2,…,k},表示智能体在t时刻扇区的奖励估计值;
T是自动机的状态转移函数,决定自动机如何从t时刻的状态迁移到t+1时刻,表示智能体如何更新扇区概率分布函数。
优选的,所述步骤2)中,t=0时每个扇区的概率向量相等。
Ri(t+1)=Ri(t)+B (1)
Gi(t+1)=Gi(t)+1 (2)
其中,Ri(0)=Gi(0)=0,Ri(t)表示定向天线扇区累计奖励值,Gi(t)表示定向天线扇区累计选择次数;
更新扇区的概率分布,假设智能体t时刻在扇区j,j∈{1,2,...,k}执行操作,根据Generalized Pursuit算法公式更新概率分布:
max{pk(t+1)}≤ω (4)
本发明的技术构思为:本专利利用学习自动机机制,并引入了确定性估计器,将邻居发现过程建模为确定性估计器学习自动机,采用Generalized Pursuit算法更新概率分布,通过与环境的交互积累经验,指导下一次的邻居发现过程,有效提升邻居发现的效率。
本发明的有益效果主要表现在:将邻居发现过程建模为确定性估计器学习自动机,并采用Generalized Pursuit算法提升了D2D网络中邻居发现的效率。
附图说明
图1是本发明方法的系统模型示意图;
图2是节点静止时本发明方法与随机型方法所需时隙数对比图;
图3是节点运动时本发明方法与随机型方法所需时隙数对比图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图3,一种D2D网络中基于确定性估计器学习自动机的定向天线邻居发现方法,利用学习自动机机制,并引入确定性估计器,将D2D网络中的节点都建模为一个单独的智能体,采用Generalized Pursuit提升邻居发现的效率,采用以下过程实现:
本实施方式的方法中,利用学习自动机机制,将D2D网络中的每个节点都作为一个单独的智能体,确定性估计器学习自动机将智能体定义为四元组{A,B,Q,T};
A={a1,a2,...,ak}是学习自动机的输出行为合集,表示智能体定向天线指向;
B={0,1}是输入学习自动机的合集,其中“0”代表惩罚,表示智能体没有发现新的邻居节点,“1”代表奖励,表示智能体发现了新的邻居节点;
Q=<P,E>是学习自动机的状态,其中P={p1(t),p2(t),...,pk(t)}是自动机在t时刻的状态,表示智能体在t时刻的扇区概率分布;E=D(t),是自动机在t时刻的确定性估计器向量,每一个行为的奖励估计值i∈{1,2,...,k},表示智能体在t时刻扇区的奖励估计值;
T是自动机的状态转移函数,决定自动机如何从t时刻的状态迁移到t+1时刻,表示智能体如何更新扇区概率分布函数。
智能体根据当前时刻的概率分布,选择定向天线的指向扇区,并以相等的概率选择发送或者接收模式,其中,t=0时每个扇区的概率向量相等。
Ri(t+1)=Ri(t)+B (1)
Gi(t+1)=Gi(t)+1 (2)
其中,Ri(0)=Gi(0)=0,Ri(t)表示定向天线扇区累计奖励值,Gi(t)表示定向天线扇区累计选择次数;
更新扇区的概率分布,假设智能体t时刻在扇区j,j∈{1,2,...,k}执行操作,根据Generalized Pursuit算法公式更新概率分布:
max{pk(t+1)}≤ω (4)
在本实施方式中,选取了大型网络仿真软件OPNET来验证所提方法的有效性及可实施性。仿真模型配置在1000m×1000m的正方形区域内,20个节点的初始位置随机确定,模拟了静止和运动两种情况,其中运动时速度为10-20km/h。图2和图3分别显示了在这两种情况下,本发明所提出方法所需时隙数相较于随机型对比方案,都有明显减少。
本说明书的实施例所述的内容仅仅是对发明构思的实现形式的列举,仅作说明用途。本发明的保护范围不应当被视为仅限于本实施例所陈述的具体形式,本发明的保护范围也及于本领域的普通技术人员根据本发明构思所能想到的等同技术手段。
Claims (4)
1.一种D2D网络中基于确定性估计器学习自动机的定向天线邻居发现方法,假设在一个D2D网络场景中,存在M个节点,每个节点的发送天线均为定向天线,可以指向k个天线扇区中的一个方向,时间被划分为以时隙为单位,在每个时隙节点可以任意选择一个扇区方向进行发送或者接收数据,节点间保持时间同步,当两节点当前时刻的天线指向相对,并满足一个节点发送信息,另一节点接收信息,可以互相发现对方,所述D2D网络中基于确定性估计器学习自动机的定向天线邻居发现方法包括以下步骤:
1)模型建立,D2D网络中的每个节点都作为一个单独的智能体;
2)动作执行,智能体根据当前时刻的概率分布,选择定向天线的指向扇区,并以相等的概率选择发送或者接收模式;
3)状态更新,根据与环境交互得到的反馈,更新估计器,并根据Generalized Pursuit算法,更新扇区的概率分布;
4)状态转移,循环至步骤2),直至邻居节点发现完成。
2.如权利要求1所述的D2D网络中基于确定性估计器学习自动机的定向天线邻居发现方法,其特征在于:所述步骤1)中,确定性估计器学习自动机将智能体定义为四元组{A,B,Q,T}:
A={a1,a2,...,ak}是学习自动机的输出行为合集,表示智能体定向天线指向;
B={0,1}是输入学习自动机的合集,其中“0”代表惩罚,表示智能体没有发现新的邻居节点,“1”代表奖励,表示智能体发现了新的邻居节点;
Q=<P,E>是学习自动机的状态,其中P={p1(t),p2(t),...,pk(t)}是自动机在t时刻的状态,表示智能体在t时刻的扇区概率分布;E=D(t),是自动机在t时刻的确定性估计器向量,每一个行为的奖励估计值表示智能体在t时刻扇区的奖励估计值;
T是自动机的状态转移函数,决定自动机如何从t时刻的状态迁移到t+1时刻,表示智能体如何更新扇区概率分布函数。
3.如权利要求1或2所述的D2D网络中基于确定性估计器学习自动机的定向天线邻居发现方法,其特征在于:所述步骤2)中,t=0时每个扇区的概率向量相等。
Ri(t+1)=Ri(t)+B (1)
Gi(t+1)=Gi(t)+1 (2)
其中,Ri(0)=Gi(0)=0,Ri(t)表示定向天线扇区累计奖励值,Gi(t)表示定向天线扇区累计选择次数;
更新扇区的概率分布,假设智能体t时刻在扇区j,j∈{1,2,...,k}执行操作,根据Generalized Pursuit算法公式更新概率分布:
max{pk(t+1)}≤ω (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210246181.0A CN114845353A (zh) | 2022-03-14 | 2022-03-14 | D2d网络中基于确定性估计器学习自动机的定向天线邻居发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210246181.0A CN114845353A (zh) | 2022-03-14 | 2022-03-14 | D2d网络中基于确定性估计器学习自动机的定向天线邻居发现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114845353A true CN114845353A (zh) | 2022-08-02 |
Family
ID=82562321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210246181.0A Pending CN114845353A (zh) | 2022-03-14 | 2022-03-14 | D2d网络中基于确定性估计器学习自动机的定向天线邻居发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114845353A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113163388A (zh) * | 2021-03-02 | 2021-07-23 | 浙江工业大学 | D2d网络中基于确定性估计器学习自动机的定向天线邻居发现方法 |
CN114051228A (zh) * | 2021-10-18 | 2022-02-15 | 清华大学 | 用于定向天线自组织网络的智能邻居发现方法及装置 |
-
2022
- 2022-03-14 CN CN202210246181.0A patent/CN114845353A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113163388A (zh) * | 2021-03-02 | 2021-07-23 | 浙江工业大学 | D2d网络中基于确定性估计器学习自动机的定向天线邻居发现方法 |
CN114051228A (zh) * | 2021-10-18 | 2022-02-15 | 清华大学 | 用于定向天线自组织网络的智能邻居发现方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | A reinforcement learning method for joint mode selection and power adaptation in the V2V communication network in 5G | |
Yang et al. | Machine learning techniques and a case study for intelligent wireless networks | |
Koushik et al. | Intelligent spectrum management based on transfer actor-critic learning for rateless transmissions in cognitive radio networks | |
Lunden et al. | Multiagent reinforcement learning based spectrum sensing policies for cognitive radio networks | |
CN108616303B (zh) | 无人机基站通信系统的控制方法、系统、装置及存储介质 | |
Han et al. | Reinforcement learning for efficient and fair coexistence between LTE-LAA and Wi-Fi | |
Lin et al. | Anticipatory mobility management by big data analytics for ultra-low latency mobile networking | |
Slavik et al. | Applying machine learning to the design of multi-hop broadcast protocols for VANET | |
CN112954651A (zh) | 一种基于深度强化学习的低时延高可靠性v2v资源分配方法 | |
CN111050413B (zh) | 一种基于自适应调整策略的无人机csma接入方法 | |
Pajarinen et al. | Optimizing spatial and temporal reuse in wireless networks by decentralized partially observable Markov decision processes | |
Ribeiro et al. | A rendezvous algorithm for multi-agent systems in disconnected network topologies | |
Ali et al. | Reinforcement-learning-enabled massive internet of things for 6G wireless communications | |
CN105188124A (zh) | 多用户ofdma中继系统中非完美csi下的鲁棒博弈功率控制方法 | |
Agarwal et al. | Low energy adaptive clustering hierarchy (leach) protocol: Simulation and analysis using matlab | |
CN115065678A (zh) | 一种基于深度强化学习的多智能设备任务卸载决策方法 | |
CN113453210A (zh) | 一种基于协作的定向自组网邻居发现方法 | |
Chen et al. | The upper bounds of cellular vehicle-to-vehicle communication latency for platoon-based autonomous driving | |
Pozza et al. | CARD: Context-aware resource discovery for mobile Internet of Things scenarios | |
CN114885340A (zh) | 一种基于深度迁移学习的超密集无线网络功率分配方法 | |
El Khamlichi et al. | Adaptive directional neighbor discovery schemes in wireless networks | |
Wang et al. | A fast neighbor discovery algorithm based on Q-learning in wireless ad hoc networks with directional antennas | |
Panahi et al. | Optimal channel-sensing scheme for cognitive radio systems based on fuzzy q-learning | |
CN114845353A (zh) | D2d网络中基于确定性估计器学习自动机的定向天线邻居发现方法 | |
Li et al. | A Lightweight Transmission Parameter Selection Scheme Using Reinforcement Learning for LoRaWAN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |