CN108710109B - 一种车载雷达频段分配方法及系统 - Google Patents
一种车载雷达频段分配方法及系统 Download PDFInfo
- Publication number
- CN108710109B CN108710109B CN201810450532.3A CN201810450532A CN108710109B CN 108710109 B CN108710109 B CN 108710109B CN 201810450532 A CN201810450532 A CN 201810450532A CN 108710109 B CN108710109 B CN 108710109B
- Authority
- CN
- China
- Prior art keywords
- vehicle
- frequency band
- vehicle state
- function parameter
- mounted radar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000006870 function Effects 0.000 claims description 119
- 239000013598 vector Substances 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 19
- 230000009467 reduction Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 abstract description 11
- 238000004364 calculation method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 238000013468 resource allocation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/02—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
- G01S7/36—Means for anti-jamming, e.g. ECCM, i.e. electronic counter-counter measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Algebra (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明实施例提供一种车载雷达频段分配方法及系统,所提供的方法包括:根据上一次迭代中,车辆中车载雷达的第一使用频段、车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,获取车辆的更新经历;根据车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数;根据第二车辆状态和第二策略函数参数,计算获得本次迭代中车载雷达的第二使用频段,并将车载雷达的使用频段切换至第二使用频段。本发明提供的方法,结合当前环境的观测,实现在动态环境中雷达资源的分配,使每辆车通过频谱选取策略,根据自身观测局部的信息自适应地选择发射频段,实现了分布式控制,能有效避免干扰,比中心化的控制更加灵活。
Description
技术领域
本发明实施例涉及雷达频段分配技术领域,尤其涉及一种车载雷达频段分配方法及系统。
背景技术
随着雷达技术的发展,车载雷达被应用到越来越多的车辆上,然而,车载雷达间的干扰问题越来越受到关注,车载雷达由于其自身的特点,当道路中装载了车载雷达的车辆增多时,干扰源也相应的增多,传统的干扰消除方法一般为预傅里叶变换(Pre-FFT),后傅里叶变换(Post-FFT),脉冲幅度调制,以及参差脉冲重复频率(PRF)等方式对雷达的干扰进行消除,然而针对车载雷达的特点,这些方法只能在干扰接收后来尽量消除它,并不能从一开始避免干扰的产生,因此不适用于车载雷达的场景。
另一种方法叫干扰避免,即通过选取不重叠的频段,从源头上避免干扰的产生。常用的是通信中的频谱感知(Spectrum Sensing)的方法。在多部雷达之间,根据不同雷达的需求,比如测距精度等,进行频谱分配,使得既能满足各个雷达的需求,同时频谱之间不相互重叠,从而避免干扰。但是,这种中心化的控制在机动性强、变换迅速的车载雷达场景中代价较高,难以实现。
现有技术中,针对车载雷达的频谱选择和分配中,并没有一种方法能适应于变换迅速的车载雷达场景中,导致车载雷达难以消除雷达间的干扰。
发明内容
本发明实施例提供一种车载雷达频段分配方法及系统,用以解决现有技术中针对车载雷达的频谱选择和分配中,并没有一种方法能适应于变换迅速的车载雷达场景中,导致车载雷达难以消除雷达间的干扰的问题。
根据本发明的第一方面,本发明实施例提供一种车载雷达频段分配方法,包括:
根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,并获取由第一使用频段、车载雷达受到的干扰、第一车辆状态和第二车辆状态组成的更新经历;
根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数;
根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,并将所述车载雷达的使用频段切换至所述第二使用频段。
其中,所述根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,具体包括:
根据以下公式对所述车辆的第一车辆状态进行更新,获得第二车辆状态:
式中,sp为第二车辆状态s的第p个分量,为第一车辆状态s-的第p个分量,车辆状态为一个M维的向量,M为车载雷达可以选用的频段的个数,第一车辆状态是更新前车辆的状态,第二车辆状态s=[s1,s2,....,sM]是更新后车辆的状态,p的取值范围为{1,2,...,M};m为第一使用频段,I为所述车载雷达受到的干扰,β为加权参数,β的取值范围是[0,1]。
其中,所述获取所述车辆的更新经历,具体包括:根据所述第一车辆状态s-,第二车辆状态s,第一使用频段m和所述车载雷达受到的干扰I,组合为一次更新经历e。
其中,所述根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数,具体包括:根据更新经历e和上一次迭代中获得的第一策略函数参数,构建代价函数;通过后向传播算法获取所述代价函数关于第二策略函数参数的导数,根据所述第二策略函数参数的导数,进而获得本次迭代中策略函数参数。
其中,所述方法还包括:将所述策略函数参数根据更新步长进行梯度下降,获得梯度下降后的策略函数参数,将该策略函数参数作为本次迭代中的第二策略函数参数。
其中,所述根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,具体包括:
根据以下公式计算出车辆状态向量:
q=f(s;w);
式中,s为所第二车辆状态,w为第二策略函数参数,q为车辆状态向量,其中,s和q均为M维向量,M为可以选用的频段个数,f为由三层神经网络构建的策略函数;
以(1-ξ)的概率选择所述车辆状态向量q中最大分量对应的索引,以ξ的概率等概率地随机选择一个频段作为第二使用频段;
其中,ξ=1/(1+t/10000),t为迭代次数。
其中,所述计算获得第二策略函数参数的步骤还包括:获得多个车辆的更新经历,通过所述多个更新经历构建测策略函数参数训练集;通过所述策略函数参数训练集,对所述第一策略函数参数进行训练,获得第二策略函数参数。
根据本发明的第二方面,提供一种车载雷达频段分配系统,包括:
状态更新模块,用于根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,并获取由第一使用频段、车载雷达受到的干扰、第一车辆状态和第二车辆状态组成的更新经历;
策略训练模块,用于根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数;
频段选择模块,用于根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,并将所述车载雷达的使用频段切换至所述第二使用频段。
根据本发明的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述第一方面所提供的方法的步骤。
根据本发明的第四方面,提供一种车载雷达频段分配设备,其特征在于,包括:至少一个处理器;以及与所述处理器连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如上述第一方面所提供的方法的步骤。
本发明实施例提供的车载雷达频段分配方法及系统,在计算获得策略函数参数后,结合当前环境的观测,实现在动态环境中雷达资源的分配,使每辆车通过频谱选取策略,根据自身观测局部的信息自适应地选择发射频段,实现一种分布式控制,既能有效避免干扰,又比中心化的控制更加灵活。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种车载雷达频段分配方法的流程示意图;
图2为本发明实施例提供的一种车在雷达频段分配方法的仿真场景示意图;
图3本发明实施例提供的一种车在雷达频段分配方法的仿真流程示意图;
图4为本发明实施例提供的一种车载雷法频段分配系统的结构图;
图5为本发明实施例提供的车载雷达频段分配设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参考图1,图1为本发明实施例提供的一种车载雷达频段分配方法的流程示意图,所提供的方法包括:
S1,根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,并获取由第一使用频段、车载雷达受到的干扰、第一车辆状态和第二车辆状态组成的更新经历。
具体的,根据上一次迭代中获得的车辆中车载雷达的使用频段,作为第一使用频段,在第一使用频段下车载雷达收到的干扰,以及在上一次迭代中获得的第一车辆状态,计算获得本次迭代中车辆的状态,记为第二车辆状态,其中车辆状态为一个M维的向量,M为车载雷达可以选用的频段的个数。
在第一次迭代中,车辆的初始状态均为0,假设更新前的车辆的状态为s-,则更新后的车辆状态为s,同时将一次车辆状态的更新的过程储存起来,作为一次更新经历。
在获取了本次迭代中的车辆更新经历后,同时将车辆更新经历储存到预先建立好的车辆更新经历数据库中。
S2,根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数;
具体的,通过车辆的更新经历,以及上一次迭代中获得的第一策略函数参数,对策略参数函数进行训练,计算获得本次迭代中的第二策略函数参数。
其中,车辆更新经历可以为S1中获得的本次迭代中生成的车辆更新经历,也可以是从车辆更新经历数据库中提取的多个车辆更新经历。
S3,根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,并将所述车载雷达的使用频段切换至所述第二使用频段。
具体的,根据第二策略函数参数和更新后的第二车辆状态,从而计算选取车载雷达的新的使用频段,此处通过将第二策略函数参数与第二车辆状态作为输入,输出结果为车载雷达应该使用的第二发射频段,随后将车载雷达的使用频段进行切换,将车载雷达的使用频段切换为第二使用频段。
通过此方法,在计算获得策略函数参数后,结合当前环境的观测,实现在动态环境中雷达资源的分配,使每辆车通过频谱选取策略,根据自身观测局部的信息自适应地选择发射频段,实现一种分布式控制,既能有效避免干扰,又比中心化的控制更加灵活。
在上述实施例的基础上,所述根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,具体包括:
根据以下公式对所述车辆的第一车辆状态进行更新,获得第二车辆状态:
式中,sp为第二车辆状态s的第p个分量,为第一车辆状态s-的第p个分量,车辆状态为一个M维的向量,M为车载雷达可以选用的频段的个数,第一车辆状态是更新前的车辆状态,第二车辆状态s=[s1,s2,...sM]是更新后的车辆状态,p的取值范围为{1,2,...,M};m为第一使用频段,I为所述车载雷达受到的干扰,β为加权参数,β的取值范围是[0,1]。
所述获取所述车辆的更新经历,具体包括:根据所述第一车辆状态s-,第二车辆状态s,第一使用频段m和所述车载雷达受到的干扰I,组合为一次更新经历e。
其中,β为可调的加权参数,取值范围为0到1之间。
在获得了新的车辆状态后,同时记录本次状态更新经历e,即e=[s-,m,I,s],其中,s-为更新前的车辆状态,即第一车辆状态;s为更新后的车辆状态;即第二车辆状态,m为当前选择的频段,即第一使用频段,I为第一使用频段下车载雷达的干扰大小。
通过此方法,使得每一个车载雷达可以据自身观测局部的信息自适应地选择发射频段,使得雷达频段分配更具有灵活性。
在上述实施例的基础上,所述根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数,具体包括:
根据更新经历e和上一次迭代中获得的第一策略函数参数,构建代价函数;通过后向传播算法获取所述代价函数关于第二策略函数参数的导数,根据所述第二策略函数参数的导数,进而获得本次迭代中策略函数参数。
其中,所述方法还包括:将所述策略函数参数根据更新步长进行梯度下降,获得梯度下降后的策略函数参数,将该策略函数参数作为本次迭代中的第二策略函数参数。
具体的,首先构建代价函数:
式中,为车辆更新经历,[·]j表示向量的第j个分量,w-上一次迭代中获得的第一策略函数参数,γ为折扣系数,取值范围为0到1之间。为更新前的车辆状态,即第一车辆状态;sk为更新后的车辆状态;即第二车辆状态,mk为当前选择的频段,即第一使用频段,Ik为第一使用频段下车载雷达的干扰大小。在代价函数中,选用的更新经历e可以为最新的更新经历,也可以从用于储存所有更新经历的储存库B中,随机选取若干个更新经历。
最后,对策略函数参数进行梯度下降,具体公式为:
从而完成一次更新,获得本次迭代中的策略函数参数w。式中,α为更新步长,取值范围为0到1之间,w-为上一次迭代中获得的策略参数函数,即第一策略函数参数。
在上述实施例的基础上,所述根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,具体包括:
根据以下公式计算出车辆状态向量:
q=f(s;w);
式中,s为第二车辆状态,w为第二策略函数参数,q为车辆状态向量,其中,s和q均为M维向量,M为可以选用的频段个数,f为由三层神经网络构建的策略函数;
以(1-ξ)的概率选择所述车辆状态向量q中最大分量对应的索引,以ξ的概率等概率地随机选择一个频段作为第二使用频段;
其中,ξ=1/(1+t/10000),t为迭代次数。
具体的,车辆状态时一个M×1维的向量s,通过公式:
q=f(s;w);
可以获得车辆状态向量q,式中,w为第二策略函数参数,q为车辆状态向量,s为所第二车辆状态,s和q均为M维向量,M为可以选用的频段个数。
在选择频段时,以(1-ξ)的概率选择输出向量q中最大分量对应的索引,以ξ的概率等概率地随机选择一个频段。
其中ξ=1/(1+t/10000),t初始为0,每进行一次频段选择,t加1。
在上述实施例的基础上,所述计算获得第二策略函数参数的步骤还包括:获得多个车辆的更新经历,通过所述多个更新经历构建测策略函数参数训练集;通过所述策略函数参数训练集,对所述第一策略函数参数进行训练,获得第二策略函数参数。
具体的,在每一次获得车辆的更新经历e后,将更新经历e进行储存,根据多个更新经历e构建策略函数参数训练集,通过策略函数参数训练集,从而可以对策略参数函数进行更新。
在将新的一次更新经历e储存到策略函数参数训练集中的时候,若存储空间已满,则将离当前最远的一次更新经历移除,储存新一次的更新经历。
综上所述,本发明实施例提供的车载雷达频段分配方法,在计算获得策略函数参数后,结合当前环境的观测,实现在动态环境中雷达资源的分配,使每辆车通过频谱选取策略,根据自身观测局部的信息自适应地选择发射频段,实现一种分布式控制,既能有效避免干扰,又比中心化的控制更加灵活。
在本发明的另一实施例中,参考图2,图2为本发明实施例提供的一种车在雷达频段分配方法的仿真场景示意图,在本实施例中,有两条车道,两条车道上的车匀速相向而行,每辆车的车前都装有雷达用于探测。仿真中的参数设置参见下表。
具体的仿真步骤如图3所示,
建立N个神经网络{fi}i∈{1,2,...,N},分别对应每辆车的策略函数,函数参数的初始值wi用随机数产生。
在tn=nT时刻,更新所有车的位置pn=pn-1+v0T,每辆车按照频段选择模块10的原理选择频段:
对于每个车辆i,按如下方式计算其他车对它的干扰大小
接着对这些干扰进行求和得到车辆i受到的总干扰:
按照状态更新模块20的原理更新每辆车在tn+1=(n+1)T时刻的状态并输出更新经历,按照经历存储模块30的原理储存经历,并从储存空间中的ND个经历中随机选取NB个作为训练集输出。按照策略训练模块40的原理对每辆车的策略函数参数进行更新。
参考图4,图4为本发明实施例提供的一种车载雷法频段分配系统的结构图,所提供的系统包括:状态更新模块41,策略训练模块41和频段选择模块43。
其中,状态更新模块41用于根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,并获取由第一使用频段、车载雷达受到的干扰、第一车辆状态和第二车辆状态组成的更新经历。
策略训练模块42用于根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数。
频段选择模块43用于根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,并将所述车载雷达的使用频段切换至所述第二使用频段。
具体的,根据上一次迭代中获得的车辆中车载雷达的使用频段,作为第一使用频段,在第一使用频段下车载雷达收到的干扰,以及在上一次迭代中获得的第一车辆状态,计算获得本次迭代中车辆的状态,记为第二车辆状态,其中车辆状态为一个M维的向量,M为车载雷达可以选用的频段的个数。
在第一次迭代中,车辆的初始状态均为0,假设更新前的车辆的状态为s-,则更新后的车辆状态为s,同时将一次车辆状态的更新的过程储存起来,作为一次更新经历。
通过车辆的更新经历,以及上一次迭代中获得的第一策略函数参数,对策略参数函数进行训练,计算获得本次迭代中的第二策略函数参数。
根据第二策略函数参数和更新后的第二车辆状态,从而计算选取车载雷达的新的使用频段,此处通过将第二策略函数参数与第二车辆状态作为输入,输出结果为车载雷达应该使用的第二发射频段,随后将车载雷达的使用频段进行切换,将车载雷达的使用频段切换为第二使用频段。
通过此系统,在计算获得策略函数参数后,结合当前环境的观测,实现在动态环境中雷达资源的分配,使每辆车通过频谱选取策略,根据自身观测局部的信息自适应地选择发射频段,实现一种分布式控制,既能有效避免干扰,又比中心化的控制更加灵活。
图5示例了车载雷达频段分配设备的实体结构示意图,如图5所示,该结构可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和总线540,其中,处理器510,通信接口520,存储器530通过总线540完成相互间的通信。通信接口540可以用于服务器与智能电视之间的信息传输。处理器510可以调用存储器530中的逻辑指令,以执行如下方法:根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,并获取由第一使用频段、车载雷达受到的干扰、第一车辆状态和第二车辆状态组成的更新经历;根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数;根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,并将所述车载雷达的使用频段切换至所述第二使用频段。
本实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,并获取由第一使用频段、车载雷达受到的干扰、第一车辆状态和第二车辆状态组成的更新经历;根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数;根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,并将所述车载雷达的使用频段切换至所述第二使用频段。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,并获取由第一使用频段、车载雷达受到的干扰、第一车辆状态和第二车辆状态组成的更新经历;根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数;根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,并将所述车载雷达的使用频段切换至所述第二使用频段。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种车载雷达频段分配方法,其特征在于,包括:
根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,并获取由第一使用频段、车载雷达受到的干扰、第一车辆状态和第二车辆状态组成的更新经历;
根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数;
根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,并将所述车载雷达的使用频段切换至所述第二使用频段。
3.根据权利要求2所述的方法,其特征在于,所述获取由第一使用频段、车载雷达受到的干扰、第一车辆状态和第二车辆状态组成的更新经历,具体包括:
根据所述第一车辆状态s-,第二车辆状态s,第一使用频段m和所述车载雷达受到的干扰I,组合为一次更新经历e。
4.根据权利要求3所述的方法,其特征在于,所述根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数,具体包括:
根据更新经历e和上一次迭代中获得的第一策略函数参数,构建代价函数;
通过后向传播算法获取所述代价函数关于第二策略函数参数的导数,根据所述第二策略函数参数的导数,获得本次迭代中策略函数参数。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
将所述策略函数参数根据更新步长进行梯度下降,获得梯度下降后的策略函数参数,将该策略函数参数作为本次迭代中的第二策略函数参数。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,具体包括:
根据以下公式计算出车辆状态向量:
q=f(s;w);
式中,s为所第二车辆状态,w为第二策略函数参数,q为车辆状态向量,其中,s和q均为M维向量,M为可以选用的频段个数,f为由三层神经网络构建的策略函数;
以(1-ξ)的概率选择所述车辆状态向量q中最大分量对应的索引,以ξ的概率等概率地随机选择一个频段作为第二使用频段;
其中,ξ=1/(1+t/10000),t为迭代次数。
7.根据权利要求1所述的方法,其特征在于,所述计算获得第二策略函数参数的步骤还包括:
获得多个车辆的更新经历,通过所述多个更新经历构建测策略函数参数训练集;
通过所述策略函数参数训练集,对所述第一策略函数参数进行训练,获得第二策略函数参数。
8.一种车载雷达频段分配系统,其特征在于,包括:
状态更新模块,用于根据上一次迭代中,车辆中车载雷达的第一使用频段、所述车载雷达受到的干扰以及第一车辆状态,计算本次迭代的第二车辆状态,并获取由第一使用频段、车载雷达受到的干扰、第一车辆状态和第二车辆状态组成的更新经历;
策略训练模块,用于根据所述车辆的更新经历和上一次迭代中获得的第一策略函数参数,计算获得第二策略函数参数;
频段选择模块,用于根据所述第二车辆状态和所述第二策略函数参数,计算获得本次迭代中所述车载雷达的第二使用频段,并将所述车载雷达的使用频段切换至所述第二使用频段。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1到7中任一所述的方法的步骤。
10.一种车载雷达频段分配设备,其特征在于,包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810450532.3A CN108710109B (zh) | 2018-05-11 | 2018-05-11 | 一种车载雷达频段分配方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810450532.3A CN108710109B (zh) | 2018-05-11 | 2018-05-11 | 一种车载雷达频段分配方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108710109A CN108710109A (zh) | 2018-10-26 |
CN108710109B true CN108710109B (zh) | 2020-09-29 |
Family
ID=63868972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810450532.3A Active CN108710109B (zh) | 2018-05-11 | 2018-05-11 | 一种车载雷达频段分配方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108710109B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111491252B (zh) * | 2019-01-28 | 2021-11-02 | 电信科学技术研究院有限公司 | 一种汽车雷达接入资源分配方法及其装置 |
SG11202002910RA (en) * | 2019-05-15 | 2020-12-30 | Advanced New Technologies Co Ltd | Determining action selection policies of an execution device |
CN112153739B (zh) * | 2019-06-27 | 2022-03-29 | 华为技术有限公司 | 一种通信方法及装置 |
CN111045949A (zh) * | 2019-12-14 | 2020-04-21 | 中车大连电力牵引研发中心有限公司 | 一种基于gprs的程序调试方法 |
CN113194538B (zh) * | 2021-04-02 | 2022-04-29 | 深圳成谷科技有限公司 | 一种雷达信号时频资源分配方法、系统及设备 |
CN115665867B (zh) * | 2022-09-28 | 2023-09-01 | 广东省新一代通信与网络创新研究院 | 一种车联网的频谱管理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008152373A1 (en) * | 2007-06-11 | 2008-12-18 | Mitsubishi Electric Information Technology Centre Europe B.V. | Object detection |
JP2012088238A (ja) * | 2010-10-21 | 2012-05-10 | Mitsubishi Electric Corp | 車載用レーダ装置、および車載用レーダ装置用の電波干渉検知方法 |
KR101603851B1 (ko) * | 2014-11-10 | 2016-03-15 | 재단법인대구경북과학기술원 | 통신 기능을 가지는 레이더 장치 및 방법 |
US9476977B2 (en) * | 2013-08-30 | 2016-10-25 | Korea Institute Of Construction Technology | Meteorological observation system using vehicles |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007232498A (ja) * | 2006-02-28 | 2007-09-13 | Hitachi Ltd | 障害物検知システム |
JP4519797B2 (ja) * | 2006-03-30 | 2010-08-04 | 富士通テン株式会社 | 車載レーダ装置及び車載レーダ管制システム |
-
2018
- 2018-05-11 CN CN201810450532.3A patent/CN108710109B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008152373A1 (en) * | 2007-06-11 | 2008-12-18 | Mitsubishi Electric Information Technology Centre Europe B.V. | Object detection |
JP2012088238A (ja) * | 2010-10-21 | 2012-05-10 | Mitsubishi Electric Corp | 車載用レーダ装置、および車載用レーダ装置用の電波干渉検知方法 |
US9476977B2 (en) * | 2013-08-30 | 2016-10-25 | Korea Institute Of Construction Technology | Meteorological observation system using vehicles |
KR101603851B1 (ko) * | 2014-11-10 | 2016-03-15 | 재단법인대구경북과학기술원 | 통신 기능을 가지는 레이더 장치 및 방법 |
Non-Patent Citations (1)
Title |
---|
Sharing for safety: The bandwidth allocation among automotive radars;Hang Ruan等;《2016 IEEE Global Conference on Signal and Information Processing (GlobalSIP)》;20170424;1047-1051 * |
Also Published As
Publication number | Publication date |
---|---|
CN108710109A (zh) | 2018-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108710109B (zh) | 一种车载雷达频段分配方法及系统 | |
CN111444009B (zh) | 一种基于深度强化学习的资源分配方法及装置 | |
Kim et al. | A probabilistic approach for determining the control mode in CREAM | |
CN111553484A (zh) | 联邦学习的方法、装置及系统 | |
CN108351881A (zh) | 分布式最优化的系统和方法 | |
CN113011603A (zh) | 模型参数更新方法、装置、设备、存储介质及程序产品 | |
CN112818588B (zh) | 一种电力系统的最优潮流计算方法、装置及存储介质 | |
CN112819157B (zh) | 神经网络训练的方法及装置、智能行驶控制的方法及装置 | |
EP4320556A1 (en) | Privacy-aware pruning in machine learning | |
CN111695624A (zh) | 数据增强策略的更新方法、装置、设备及存储介质 | |
CN114995638A (zh) | 触觉信号生成方法、装置、可读介质及电子设备 | |
CN109697083B (zh) | 数据的定点化加速方法、装置、电子设备及存储介质 | |
CN113655986B9 (zh) | 一种基于numa亲和性的fft卷积算法并行实现方法及系统 | |
CN110852414B (zh) | 高精度低位卷积神经网络 | |
Ding et al. | A NN-based hybrid intelligent algorithm for a discrete nonlinear uncertain optimal control problem | |
CN111565065A (zh) | 一种无人机基站部署方法、装置及电子设备 | |
CN108896967B (zh) | 基于杂波协方差矩阵估计的距离扩展目标检测方法及装置 | |
CN113411140B (zh) | 信道自适应通道特性学习方法及其模拟器、卫星导航系统 | |
DE102022130788A1 (de) | Verfahren, einrichtungen und herstellungsartikel zur erzeugung von befehlslisten zur auslagerung an beschleunigerschaltungsanordnung | |
CN116974584A (zh) | 模型部署方法、装置、设备及存储介质 | |
CN112822113B (zh) | 路由地址的获取方法及装置、电子设备和可读存储介质 | |
CN111612162B (zh) | 一种强化学习方法、装置、电子设备及存储介质 | |
CN112766190B (zh) | 对抗样本生成方法、装置、存储介质及电子设备 | |
CN110782017B (zh) | 用于自适应调整学习率的方法和装置 | |
CN112398543B (zh) | 用于光通信的方法、设备、系统、装置和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |