CN115856873B - 一种岸基ais信号可信性判别模型、方法及装置 - Google Patents

一种岸基ais信号可信性判别模型、方法及装置 Download PDF

Info

Publication number
CN115856873B
CN115856873B CN202211437924.9A CN202211437924A CN115856873B CN 115856873 B CN115856873 B CN 115856873B CN 202211437924 A CN202211437924 A CN 202211437924A CN 115856873 B CN115856873 B CN 115856873B
Authority
CN
China
Prior art keywords
ais signal
network
training
data
ais
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211437924.9A
Other languages
English (en)
Other versions
CN115856873A (zh
Inventor
王晓烨
姜毅
胡青
孙晓文
怀率恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN202211437924.9A priority Critical patent/CN115856873B/zh
Publication of CN115856873A publication Critical patent/CN115856873A/zh
Application granted granted Critical
Publication of CN115856873B publication Critical patent/CN115856873B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种岸基AIS信号可信性判别模型、方法及装置,所述模型为采用线性决策边界的二分类器,所述模型以基于Q网络学习结果生成的AIS信号样本以及真实AIS信号样本作为训练数据,输出样本属于真实AIS信号样本的概率。基于Q网络学习结果生成AIS信号包括:获取相关数据;基于预训练网络初始化Q网络结构中卷积神经网络的权重;通过Q网络结构生成与真实AIS信号相似的AIS信号样本。本发明主要针对AIS信号特征特点对岸基AIS信号的可信性进行判断,以提高海事导航服务质量。

Description

一种岸基AIS信号可信性判别模型、方法及装置
技术领域
本发明涉及船舶通信技术领域,具体而言,尤其涉及一种岸基AIS信号可信性判别模型、方法及装置。
背景技术
经调研发现,目前在船舶交通管理中心获取的船位等用于船舶导航服务数据主要来源仅为AIS报告的信息,即GPS提供的数据。但GPS存在脆弱性,易受干扰和欺骗,一旦AIS岸站获取的船位等信息数据为虚假信息,AIS岸站基于虚假信息为船舶提供错误的导航服务,势必严重威胁航行安全,因此需要对AIS岸站获取的AIS信号的可信性进行判断和评估。
当前,船舶交通管理中心对接收的AIS信号可信性进行判断的方法仅依赖于雷达数据关联,即船舶报告船位等信息后,结合雷达系统显示情况,观察该位置是否存在船舶,若存在船舶,则判断此AIS提供的船位信息为真实信息,否则为虚假信息。该方法虽然在一定程度上可以判断AIS报告的船位是否可信,但存在明显缺陷:一旦AIS岸站接收到的船位信息为虚假信息,而在该虚假信息位置刚好有其他船舶被雷达系统扫描,该方法依然会将虚假信息判断成可信信息,岸站将依据虚假信息提供错误的导航服务,威胁航行安全。因此基于当前雷达关联方法缺陷,需要一种准确有效的技术方法解决上述问题。
发明内容
鉴于现有技术的不足,本发明提供一种岸基AIS信号可信性判别模型、方法及装置,以提高岸基AIS信号可信性评估水平,增强岸站系统导航服务质量,保证船舶航行安全。
本发明采用的技术手段如下:
一种岸基AIS信号可信性判别模型,所述模型为采用线性决策边界的二分类器,所述模型以基于Q网络学习结果生成的AIS信号样本以及真实AIS信号样本作为训练数据,输出样本属于真实AIS信号样本的概率;所述基于Q网络学习结果生成的AIS信号样本的获取包括:
获取AIS信号数据和与所述AIS信号数据关联的雷达传感数据;
基于预训练网络对所述AIS信号数据进行预训练,所述预训练网络包括若干堆叠的受限玻尔兹曼机,训练时前一个受限玻尔兹曼机的隐含层作为后一层受限玻尔兹曼机的可观测层,每次只训练一层网络参数,直到最后一层训练完成;
将最后一层受限玻尔兹曼机输出的连接权重和神经元偏置输入推断网络,所述推断网络为两层全连接前馈神经网络,输出基于AIS信号的变分分布获得的最优化网络参数;
将最优化网络参数作为Q网络的初始化参数,将Q网络中AIS信号特征学习建模为智能体,所述智能体的环境信息为雷达传感器数据,且所述环境信息受智能体动作影响而改变状态并反馈给智能体相应的奖励,所述智能体感知环境状态和反馈的奖励,进行AIS信号特征学习,并根据反馈的奖励调整学习策略,重复多次训练智能体,直至完成AIS信号样本生成。
进一步地,所述预训练网络训练时,
自底向上的输出为:
v(i)=σ(W(i)h(i-1)+b(i)),1≤i≤l-1
式中,v(i)为第i层神经元的输出,σ(·)为Sigmoid型激活函数,b(i)为第i层神经元的偏置,W(i)为连接权重,h(i-1)为第i层神经元的输入;
获取各层神经元的输入,按照的顺序生成的一组h(l-1)训练样本,记为:/>M为l-1层神经元数量;
将h(l-1)和h(l)再组成一个预训练神经网络,以为训练样本集充分训练第l层神经网络;
最后对逐层预训练所得参数使用反向传播算法进行精调,精调的参数更新规则为:
式中,b(i)为第i层神经元的偏置,W(i)为连接权重,α为学习率,δ(i)为第i层神经元的误差项。
进一步地,所述推断网络的结构参数包括:
h=ReLU(W(1)x+b(1))
μI=W(2)h+b(2)
式中,b(i)为第i层神经元的偏置,W(i)为第i层神经元的连接权重,i=1,2,3,μI为AIS信号的变分分布的均值,为AIS信号的变分分布的方差。
进一步地,所述推断网络的目标函数为:
其中,KL[q(z|x;φ),p(z|x;θ)]为变分分布q(z|x;φ)和真实后验分布p(z|x;θ)的KL散度,logp(x;θ)为对数边际似然,ELBO(q,x;θ,φ)为其对数边际似然的下界,φ*为使ELBO(q,x;θ,φ)最大的网络参数,θ为待学习的推断网络参数,包含向量权重和偏置。
进一步地,Q网络中的AIS信号特征学习由CNN网络结构实现,所述CNN网络根据以下损失函数训练:
[y-Qφ(s,a)]2
其中,Qφ(s,a)为Q网络值函数,采用值函数近似方法计算:
Qπ(s,a)≈Qφ(s,a)
式中,Qπ(s,a)为值函数对应值,逼近总回报的平均值,
式中,N为试验次数,为起始状态和动作的第n次试验轨迹,/>为第n次试验的总回报。G(τ)为:
式中,γ∈[0,1]为折扣率,rt+1=r(st,at,st+1)为智能体根据当前状态s做出动作a后,环境状态反馈给智能体的即时奖励。
本发明还公开了一种岸基AIS信号可信性判别方法,所述方法包括:
获取AIS信号数据和与所述AIS信号数据关联的雷达传感数据;
基于预训练网络对所述AIS信号数据进行预训练;
将预训练网络输出的连接权重和神经元偏置输入推断网络,所述推断网络为两层全连接前馈神经网络,输出基于AIS信号的变分分布获得的最优化网络参数;
将最优化网络参数作为Q网络的初始化参数,构建智能体对AIS信号特征学习,直至完成AIS信号样本生成;
将Q网络生成的AIS信号样本以及真实AIS信号样本作为训练数据训练岸基AIS信号可信性判别模型;
获取待测试的AIS信号输入训练后的岸基AIS信号可信性判别模型,基于所述岸基AIS信号可信性判别模型得到可信性判断结果。
本发明还公开了一种岸基AIS信号可信性判别装置,包括:
训练数据获取单元,用于由船舶交通管理中心获取真实的AIS信号数据和与所述真实的AIS信号数据关联的雷达传感数据;
预训练单元,用于基于预训练网络对所述AIS信号数据进行预训练;
推断单元,用于将预训练网络输出的连接权重和神经元偏置输入推断网络,所述推断网络为两层全连接前馈神经网络,输出基于AIS信号的变分分布获得的最优化网络参数;
AIS信号样本生成单元,用于将最优化网络参数作为Q网络的初始化参数,构建智能体对AIS信号特征学习,直至完成AIS信号样本生成;
训练单元,用于将Q网络生成的AIS信号样本以及真实AIS信号样本作为训练数据训练岸基AIS信号可信性判别模型;
判断单元,用于获取待判断的AIS信号输入训练后的岸基AIS信号可信性判别模型,基于所述岸基AIS信号可信性判别模型得到AIS信号可信性判断结果。
较现有技术相比,本发明具有以下优点:
本发明利用神经网络强大的拟合能力和数据特征提取能力不断训练提取AIS信号特征,并以此构建AIS样本信号,再利用分类器区分任意样本信号来源,通过分类器判别结果不断改进AIS样本信号构建参数,以使其更加贴近真实AIS信号分布,提升判别网络的区分能力,达到准确判别AIS信号可信性的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种岸基AIS信号可信性判别模型训练架构图。
图2为本发明基于Q网络学习结果生成AIS信号样本网络架构图。
图3为本发明预训练网络架构图。
图4为本发明推断网络架构图。
图5为本发明Q网络架构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明提供了一种岸基AIS信号可信性判别模型,所述模型为采用线性决策边界的二分类器,如图1所示,其以基于Q网络学习结果生成的AIS信号样本以及真实AIS信号样本作为训练数据,输出样本属于真实AIS信号样本的概率。其中基于Q网络学习结果生成的AIS信号样本的网络架构如图2所示,具体生成步骤包括:
S001、获取AIS信号数据和与所述AIS信号数据关联的雷达传感数据。
该步骤主要用于将船舶交通管理中心接收的AIS信号数据接入相关数据集,用于训练后续的神经网络模型。本申请中相关数据集中的数据包含两部分,一部分是AIS信号数据,为保证用于训练推断网络模型的AIS信号的真实可信性,该部分数据选取已利用雷达和AIS位置数据关联的AIS信号数据,这部分数据主要用于训练可信性判别模型。另一部分是AIS信号数据和与之关联的雷达传感数据,该部分数据用于训练Q网络结构。此处主要采用第二部分数据。
S002、基于预训练网络对所述AIS信号数据进行预训练,所述预训练网络包括若干堆叠的受限玻尔兹曼机,训练时前一个受限玻尔兹曼机的隐含层作为后一层受限玻尔兹曼机的可观测层,每次只训练一层网络参数,直到最后一层训练完成。
预训练网络结构采用逐层预训练方式。逐层预训练的训练过程为:从最底层开始,每次只训练一层,直到最后一层训练完成。具体思路为:以实际AIS信号作为输入训练样本,通过最大化似然函数找到最优参数,将单层Sigmoid信念网络转换成受限玻尔兹曼机,将整个预训练网络结构看成是多个受限玻尔兹曼机的堆叠,第i层受限玻尔兹曼机的隐含层作为第i+1层受限玻尔兹曼机的可观测层,每次只训练一层,最终输出推断结构中全连接前馈神经网络的初始化参数值,降低神经网络模型的学习难度。
引入预训练结构,不仅可用于改善多层前馈神经网络的过拟合现象,也可使神经网络获得合适的初始化权重。不适合的初始化权重将极大地增加模型学习难度,增长模型训练时间,因此需要选择合适的神经网络初始化权重。预训练结构在权重空间中获得的权重比随机权重更接近最优权重,而逐层预训练方式可以产生非常理想的权重初始值,逐层预训练的训练过程为:从最底层开始,每次只训练一层,直到最后一层训练完成。如图3所示为预训练网络架构。
假设已训练完成l-1层预训练神经网络,计算自底向上的输出为:
v(i)=σ(W(i)h(i-1)+b(i)),1≤i≤l-1 (1)
式中,v(i)为第i层神经元的输出,σ(·)为Sigmoid型激活函数,b(i)为第i层神经元的偏置,W(i)为连接权重,h(i-1)为第i层神经元的输入,即可得到按照的顺序生成的一组h(l-1)训练样本,记为:M为l-1层神经元数量。将h(l-1)和h(l)再组成一个预训练神经网络,以/>为训练样本集充分训练第l层神经网络。最后对逐层预训练所得参数使用传统学习方法进行精调,本小节采用的传统学习方法为反向传播算法(Back Propagation,BP),BP算法进行精调的参数更新规则为:
W(i)←W(i)-αδ(i)(h(i-1))T,1≤i≤l-1 (2)
b(i)←b(i)-αδ(i),1≤i≤l-1 (3)
式中,b(i)为第i层神经元的偏置,W(i)为连接权重,α为学习率,δ(i)为第i层神经元的误差项,即偏导数该误差项表示第i层神经元对最终损失的影响,同时反映出最终损失对第i层神经元的敏感程度。L[y,f(v;W,b)]为损失函数,本小节采用的损失函数为平方损失函数,即
式中,y为真实AIS信号,f(v;W,b)为预训练模型。将最后一层预训练神经网络的输出v(l)作为多层前馈神经网络也就是推断网络的输入层数据。
S003、将最后一层受限玻尔兹曼机输出的连接权重和神经元偏置输入推断网络,所述推断网络为两层全连接前馈神经网络,输出基于AIS信号的变分分布获得的最优化网络参数。
推断网络的两层全连接前馈神经网络,第一层采用非线性激活方式,激活函数为ReLU函数,神经元数为64个,第二层采用线性激活方式,神经元数为32个。用变分推断近似估计AIS信号的后验分布,根据变分分布与真实后验分布的KL散度等于对数边际似然与其下界的差值,将推断网络目标转换为寻找网络参数使证据下界最大,最终输出AIS信号的变分分布。
本发明中推断网络架构如图4所示,假设AIS信号的变分分布q(z|x;φ)服从高斯分布:
其中,μI是高斯分布的均值和方差,可以通过推断网络fI(x;φ)来预测计算。综合考虑AIS信号可信性判别模型整体的复杂性和非线性,推断网络采用多层前馈神经网络,该多层前馈神经网络采用2层隐含层结构,第1层神经元采用ReLU函数进行非线性激活,第2层神经元选择线性激活,最后连接输出层。
推断网络结构中,各参数如下:
h=ReLU(W(1)x+b(1)) (6)
μI=W(2)h+b(2) (7)
式中,b为第i层神经元的偏置,W为连接权重。推断网络的目标函数为:
式中,KL[q(z|x;φ),p(z|x;θ)]为变分分布和真实后验分布的KL散度,logp(x;θ)为对数边际似然,ELBO(q,x;θ,φ)为其对数边际似然的下界,φ*使ELBO(q,x;θ,φ)最大的网络参数,θ为待学习的推断网络参数,包含向量权重和偏置。
S004、将最优化网络参数作为Q网络的初始化参数,将Q网络中AIS信号特征学习建模为智能体,所述智能体的环境信息为雷达传感器数据,且所述环境信息受智能体动作影响而改变状态并反馈给智能体相应的奖励,所述智能体感知环境状态和反馈的奖励,进行AIS信号特征学习,并根据反馈的奖励调整学习策略,重复多次训练智能体,直至完成AIS信号样本生成。
Q网络中的环境模块包括雷达传感器数据,并受智能体动作影响而改变状态,反馈给智能体相应的奖励。智能体感知的境状态和反馈的奖励,进行AIS信号特征学习,并根据反馈的奖励调整学习策略以决定下一步动作。AIS信号特征学习部分采用CNN网络结构,CNN网络结构中卷积层采用单卷积层、单汇聚层和全连接层结构,其中卷积层使用6个5×5的卷积核,以ReLU函数激活,汇聚层的采样窗口为2×2,全连接层的神经元数目为84个。在训练Q网络时,为避免模型陷入局部最优,在训练时在相关数据集模块中随机抽取样本代替当前样本用于训练,以去除数据间的相关性,Q网络最终输出AIS信号生成样本集。
具体来说,本发明中Q网络架构如图5所示,基于强化学习的Q网络结构用于生成AIS信号样本,目标是尽量使判别网络无法区分样本来源。以推断网络得到的最优化网络参数为初始化Q网络参数,以雷达传感器数据外界感知环境参数,以[y-Qφ(s,a)]2为损失函数训练CNN网络结构,Qφ(s,a)为Q网络值函数。CNN网络结构中,卷积层其使用6个5×5的卷积核,以ReLU函数激活,汇聚层的采样窗口为2×2,全连接层的神经元数目为84个。Qφ(s,a)可以采用值函数近似方法计算,假设:
Qπ(s,a)≈Qφ(s,a) (10)
式中,Qπ(s,a)为值函数对应值,可通过训练CNN网络参数得到,本部分采用蒙特卡洛方法,直接让Qπ(s,a)逼近总回报的平均值。/>为:
式中,N为试验次数,为起始状态和动作的第n次试验轨迹,/>为第n次试验的总回报。G(τ)为:
式中,γ∈[0,1]为折扣率,rt+1=r(st,at,st+1)为智能体根据当前状态s做出动作a后,环境状态反馈给智能体的即时奖励。
本发明中,岸基AIS信号可信性判别模型的目标是尽量准确地判断一个样本是来自真实AIS信号数据还是由Q网络生成的AIS信号样本,本发明采用支持向量机学习和训练岸基AIS信号可信性判别模型。最优参数支持向量机的决策函数为:
式中,x(n)为当前样本,为最优权重,b*为最优偏置,λ*为拉格朗日乘数最优值,y(n)∈{+1,-1},f(x)为判别网络判断当前AIS信号是否为真实AIS信号,即当前AIS信号是否可信。具体地,用标签1表示样本来自真实AIS信号,标签0表示样本来自Q网络生成的AIS样本信号,判别网络模块的输出为样本属于真实AIS信号的概率。
本发明还公开了一种岸基AIS信号可信性判别方法,所述方法包括:
S100、获取AIS信号数据和与所述AIS信号数据关联的雷达传感数据。
该步骤主要用于将船舶交通管理中心接收的AIS信号数据接入相关数据集,用于训练后续的神经网络模型。本申请中相关数据集中的数据包含两部分,一部分是AIS信号数据,为保证用于训练推断网络模型的AIS信号的真实可信性,该部分数据选取已利用雷达和AIS位置数据关联的AIS信号数据,这部分数据主要用于训练可信性判别模型。另一部分是AIS信号数据和与之关联的雷达传感数据,该部分数据用于训练Q网络结构。
S200、基于预训练网络对所述AIS信号数据进行预训练。
预训练网络包括若干堆叠的受限玻尔兹曼机,训练时前一个受限玻尔兹曼机的隐含层作为后一层受限玻尔兹曼机的可观测层,每次只训练一层网络参数,直到最后一层训练完成。
预训练网络结构采用逐层预训练方式。逐层预训练的训练过程为:从最底层开始,每次只训练一层,直到最后一层训练完成。具体思路为:以实际AIS信号作为输入训练样本,通过最大化似然函数找到最优参数,将单层Sigmoid信念网络转换成受限玻尔兹曼机,将整个预训练网络结构看成是多个受限玻尔兹曼机的堆叠,第i层受限玻尔兹曼机的隐含层作为第i+1层受限玻尔兹曼机的可观测层,每次只训练一层,最终输出推断结构中全连接前馈神经网络的初始化参数值,降低神经网络模型的学习难度。
引入预训练结构,不仅可用于改善多层前馈神经网络的过拟合现象,也可使神经网络获得合适的初始化权重。不适合的初始化权重将极大地增加模型学习难度,增长模型训练时间,因此需要选择合适的神经网络初始化权重。预训练结构在权重空间中获得的权重比随机权重更接近最优权重,而逐层预训练方式可以产生非常理想的权重初始值,逐层预训练的训练过程为:从最底层开始,每次只训练一层,直到最后一层训练完成。如图3所示为预训练网络架构。
假设已训练完成l-1层预训练神经网络,计算自底向上的输出为:
v(i)=σ(W(i)h(i-1)+b(i)),1≤i≤l-1 (1)
式中,v(i)为第i层神经元的输出,σ(·)为Sigmoid型激活函数,b(i)为第i层神经元的偏置,W(i)为连接权重,h(i-1)为第i层神经元的输入,即可得到按照的顺序生成的一组h(l-1)训练样本,记为:M为l-1层神经元数量。将h(l-1)和h(l)再组成一个预训练神经网络,以/>为训练样本集充分训练第l层神经网络。最后对逐层预训练所得参数使用传统学习方法进行精调,本小节采用的传统学习方法为反向传播算法(Back Propagation,BP),BP算法进行精调的参数更新规则为:
W(i)←W(i)-αδ(i)(h(i-1))T,1≤i≤l-1 (2)
b(i)←b(i)-αδ(i),1≤i≤l-1 (3)
式中,b(i)为第i层神经元的偏置,W(i)为连接权重,α为学习率,δ(i)为第i层神经元的误差项,即偏导数该误差项表示第i层神经元对最终损失的影响,同时反映出最终损失对第i层神经元的敏感程度。L[y,f(v;W,b)]为损失函数,本小节采用的损失函数为平方损失函数,即
式中,y为真实AIS信号,f(v;W,b)为预训练模型。将最后一层预训练神经网络的输出v(l)作为多层前馈神经网络也就是推断网络的输入层数据。
S300、将预训练网络输出的连接权重和神经元偏置输入推断网络,所述推断网络为两层全连接前馈神经网络,输出基于AIS信号的变分分布获得的最优化网络参数。
推断网络的两层全连接前馈神经网络,第一层采用非线性激活方式,激活函数为ReLU函数,神经元数为64个,第二层采用线性激活方式,神经元数为32个。用变分推断近似估计AIS信号的后验分布,根据变分分布与真实后验分布的KL散度等于对数边际似然与其下界的差值,将推断网络目标转换为寻找网络参数使证据下界最大,最终输出AIS信号的变分分布。
本发明中推断网络架构如图4所示,假设AIS信号的变分分布q(z|x;φ)服从高斯分布:
其中,μI是高斯分布的均值和方差,可以通过推断网络fI(x;φ)来预测计算。综合考虑AIS信号可信性判别模型整体的复杂性和非线性,推断网络采用多层前馈神经网络,该多层前馈神经网络采用2层隐含层结构,第1层神经元采用ReLU函数进行非线性激活,第2层神经元选择线性激活,最后连接输出层。
推断网络结构中,各参数如下:
h=ReLU(W(1)x+b(1)) (6)
μI=W(2)h+b(2) (7)
式中,b为第i层神经元的偏置,W为连接权重。推断网络的目标函数为:
式中,KL[q(z|x;φ),p(z|x;θ)]为变分分布和真实后验分布的KL散度,logp(x;θ)为对数边际似然,ELBO(q,x;θ,φ)为其对数边际似然的下界,φ*使ELBO(q,x;θ,φ)最大的网络参数,θ为待学习的推断网络参数,包含向量权重和偏置。
S400、将最优化网络参数作为Q网络的初始化参数,构建智能体对AIS信号特征学习,直至完成AIS信号样本生成。
Q网络中的环境模块包括雷达传感器数据,并受智能体动作影响而改变状态,反馈给智能体相应的奖励。智能体感知的境状态和反馈的奖励,进行AIS信号特征学习,并根据反馈的奖励调整学习策略以决定下一步动作。AIS信号特征学习部分采用CNN网络结构,CNN网络结构中卷积层采用单卷积层、单汇聚层和全连接层结构,其中卷积层使用6个5×5的卷积核,以ReLU函数激活,汇聚层的采样窗口为2×2,全连接层的神经元数目为84个。在训练Q网络时,为避免模型陷入局部最优,在训练时在相关数据集模块中随机抽取样本代替当前样本用于训练,以去除数据间的相关性,Q网络最终输出AIS信号生成样本集。
具体来说,本发明中Q网络架构如图5所示,基于强化学习的Q网络结构用于生成AIS信号样本,目标是尽量使判别网络无法区分样本来源。以推断网络得到的最优化网络参数为初始化Q网络参数,以雷达传感器数据外界感知环境参数,以[y-Qφ(s,a)]2为损失函数训练CNN网络结构,Qφ(s,a)为Q网络值函数。CNN网络结构中,卷积层其使用6个5×5的卷积核,以ReLU函数激活,汇聚层的采样窗口为2×2,全连接层的神经元数目为84个。Qφ(s,a)可以采用值函数近似方法计算,假设:
Qπ(s,a)≈Qφ(s,a) (10)
式中,Qπ(s,a)为值函数对应值,可通过训练CNN网络参数得到,本部分采用蒙特卡洛方法,直接让Qπ(s,a)逼近总回报的平均值。/>为:
式中,N为试验次数,为起始状态和动作的第n次试验轨迹,/>为第n次试验的总回报。G(τ)为:
式中,γ∈[0,1]为折扣率,rt+1=r(st,at,st+1)为智能体根据当前状态s做出动作a后,环境状态反馈给智能体的即时奖励。
S500、将Q网络生成的AIS信号样本以及真实AIS信号样本作为训练数据训练岸基AIS信号可信性判别模型。
岸基AIS信号可信性判别模型的目标是尽量准确地判断一个样本是来自真实AIS信号数据还是由Q网络生成的AIS信号样本,本发明采用支持向量机学习和训练岸基AIS信号可信性判别模型。最优参数支持向量机的决策函数为:
式中,x(n)为当前样本,为最优权重,b*为最优偏置,λ*为拉格朗日乘数最优值,y(n)∈{+1,-1},f(x)为判别网络判断当前AIS信号是否为真实AIS信号,即当前AIS信号是否可信。具体地,用标签1表示样本来自真实AIS信号,标签0表示样本来自Q网络生成的AIS样本信号,判别网络模块的输出为样本属于真实AIS信号的概率。
S600、获取待测试的AIS信号输入训练后的岸基AIS信号可信性判别模型,基于所述岸基AIS信号可信性判别模型得到AIS信号可信性判断结果。
本发明还公开了一种岸基AIS信号可信性判别装置,包括:
训练数据获取单元,用于由船舶交通管理中心获取真实的AIS信号数据和与所述真实的AIS信号数据关联的雷达传感数据;
预训练单元,用于基于预训练网络对所述AIS信号数据进行预训练;
推断单元,用于将预训练网络输出的连接权重和神经元偏置输入推断网络,所述推断网络为两层全连接前馈神经网络,输出基于AIS信号的变分分布获得的最优化网络参数;
AIS信号样本生成单元,用于将最优化网络参数作为Q网络的初始化参数,构建智能体对AIS信号特征学习,直至完成AIS信号样本生成;
训练单元,用于将Q网络生成的AIS信号样本以及真实AIS信号样本作为训练数据训练岸基AIS信号可信性判别模型;
判断单元,用于获取待判断的AIS信号输入训练后的岸基AIS信号可信性判别模型,基于所述岸基AIS信号可信性判别模型得到AIS信号可信性判断结果。
对于本发明实施例的而言,由于其与上面实施例中的相对应,所以描述的比较简单,相关相似之处请参见上面实施例中部分的说明即可,此处不再详述。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (7)

1.一种构建岸基AIS信号可信性判别模型的方法,其特征在于,所述模型为采用线性决策边界的二分类器,所述模型以基于Q网络学习结果生成的AIS信号样本以及真实AIS信号样本作为训练数据,输出待测试的AIS信号属于真实AIS信号样本的概率;所述基于Q网络学习结果生成的AIS信号样本的获取包括:
获取AIS信号数据和与所述AIS信号数据关联的雷达传感数据;具体地,所述数据包含两部分,一部分是AIS信号数据,为保证用于训练推断网络模型的AIS信号的真实可信性,该部分数据选取已利用雷达和AIS位置数据关联的AIS信号数据,这部分数据用于训练可信性判别模型;另一部分是AIS信号数据和与之关联的雷达传感数据,该部分数据用于训练Q网络结构;
基于预训练网络对所述AIS信号数据进行预训练,所述预训练网络包括若干堆叠的受限玻尔兹曼机,训练时前一个受限玻尔兹曼机的隐含层作为后一层受限玻尔兹曼机的可观测层,每次只训练一层网络参数,直到最后一层训练完成;
将最后一层受限玻尔兹曼机输出的连接权重和神经元偏置输入推断网络,所述推断网络为两层全连接前馈神经网络,输出基于AIS信号的变分分布获得的最优化网络参数;
将最优化网络参数作为Q网络的初始化参数,将Q网络中AIS信号特征学习建模为智能体,所述智能体的环境信息为雷达传感器数据,且所述环境信息受智能体动作影响而改变状态并反馈给智能体相应的奖励,所述智能体感知环境状态和反馈的奖励,进行AIS信号特征学习,并根据反馈的奖励调整学习策略,重复多次训练智能体,直至完成AIS信号样本生成。
2.根据权利要求1所述的一种构建岸基AIS信号可信性判别模型的方法,其特征在于,所述预训练网络训练时,
自底向上的输出为:
v(i)=σ(W(i)h(i-1)+b(i)),1≤i≤l-1
式中,v(i)为第i层神经元的输出,σ(·)为Sigmoid型激活函数,b(i)为第i层神经元的偏置,W(i)为连接权重,h(i-1)为第i层神经元的输入;
获取各层神经元的输入,按照的顺序生成的一组h(l-1)训练样本,记为:/>M为l-1层神经元数量;
将h(l-1)和h(l)再组成一个预训练神经网络,以为训练样本集充分训练第l层神经网络;
最后对逐层预训练所得参数使用反向传播算法进行精调,精调的参数更新规则为:
W(i)←W(i)-αδ(i)(h(i-1))T,1≤i≤l-1,
b(i)←b(i)-αδ(i),1≤i≤l-1
式中,b(i)为第i层神经元的偏置,W(i)为连接权重,α为学习率,δ(i)为第i层神经元的误差项。
3.根据权利要求1所述的一种构建岸基AIS信号可信性判别模型的方法,其特征在于,所述推断网络的结构参数包括:
h=ReLU(W(1)x+b(1))
μI=W(2)h+b(2)
式中,b(i)为第i层神经元的偏置,W(i)为第i层神经元的连接权重,i=1,2,3,μI为AIS信号的变分分布的均值,为AIS信号的变分分布的方差。
4.根据权利要求1所述的一种构建岸基AIS信号可信性判别模型的方法,其特征在于,所述推断网络的目标函数为:
其中,KL[q(z|x;φ),p(z|x;θ)]为变分分布q(z|x;φ)和真实后验分布p(z|x;θ)的KL散度,logp(x;θ)为对数边际似然,ELBO(q,x;θ,φ)为其对数边际似然的下界,φ*为使ELBO(q,x;θ,φ)最大的网络参数,θ为待学习的推断网络参数,包含向量权重和偏置。
5.根据权利要求1所述的一种构建岸基AIS信号可信性判别模型的方法,其特征在于,Q网络中的AIS信号特征学习由CNN网络结构实现,所述CNN网络根据以下损失函数训练:
[y-Qφ(s,a)]2
其中,y为真实AIS信号;Qφ(s,a)为Q网络值函数,采用值函数近似方法计算:
Qπ(s,a)≈Qφ(s,a)
式中,Qπ(s,a)为值函数对应值,逼近总回报的平均值,
式中,N为试验次数,为起始状态和动作的第n次试验轨迹,/>为第n次试验的总回报,G(τ)为:
式中,γ∈[0,1]为折扣率,rt+1=r(st,at,st+1)为智能体根据当前状态s做出动作a后,环境状态反馈给智能体的即时奖励。
6.一种岸基AIS信号可信性判别方法,其特征在于,所述方法包括:
获取AIS信号数据和与所述AIS信号数据关联的雷达传感数据;具体地,所述数据包含两部分,一部分是AIS信号数据,为保证用于训练推断网络模型的AIS信号的真实可信性,该部分数据选取已利用雷达和AIS位置数据关联的AIS信号数据,这部分数据用于训练可信性判别模型;另一部分是AIS信号数据和与之关联的雷达传感数据,该部分数据用于训练Q网络结构;
基于预训练网络对所述AIS信号数据进行预训练;
将预训练网络输出的连接权重和神经元偏置输入推断网络,所述推断网络为两层全连接前馈神经网络,输出基于AIS信号的变分分布获得的最优化网络参数;
将最优化网络参数作为Q网络的初始化参数,构建智能体对AIS信号特征学习,直至完成AIS信号样本生成;
将Q网络生成的AIS信号样本以及真实AIS信号样本作为训练数据训练岸基AIS信号可信性判别模型;
获取待测试的AIS信号输入训练后的岸基AIS信号可信性判别模型,基于所述岸基AIS信号可信性判别模型得到可信性判断结果。
7.一种岸基AIS信号可信性判别装置,其特征在于,包括:
训练数据获取单元,用于由船舶交通管理中心获取真实的AIS信号数据和与所述真实的AIS信号数据关联的雷达传感数据;具体地,所述数据包含两部分,一部分是AIS信号数据,为保证用于训练推断网络模型的AIS信号的真实可信性,该部分数据选取已利用雷达和AIS位置数据关联的AIS信号数据,这部分数据用于训练可信性判别模型;另一部分是AIS信号数据和与之关联的雷达传感数据,该部分数据用于训练Q网络结构;
预训练单元,用于基于预训练网络对所述AIS信号数据进行预训练;
推断单元,用于将预训练网络输出的连接权重和神经元偏置输入推断网络,所述推断网络为两层全连接前馈神经网络,输出基于AIS信号的变分分布获得的最优化网络参数;
AIS信号样本生成单元,用于将最优化网络参数作为Q网络的初始化参数,构建智能体对AIS信号特征学习,直至完成AIS信号样本生成;
训练单元,用于将Q网络生成的AIS信号样本以及真实AIS信号样本作为训练数据训练岸基AIS信号可信性判别模型;
判断单元,用于获取待判断的AIS信号输入训练后的岸基AIS信号可信性判别模型,基于所述岸基AIS信号可信性判别模型得到AIS信号可信性判断结果。
CN202211437924.9A 2022-11-15 2022-11-15 一种岸基ais信号可信性判别模型、方法及装置 Active CN115856873B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211437924.9A CN115856873B (zh) 2022-11-15 2022-11-15 一种岸基ais信号可信性判别模型、方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211437924.9A CN115856873B (zh) 2022-11-15 2022-11-15 一种岸基ais信号可信性判别模型、方法及装置

Publications (2)

Publication Number Publication Date
CN115856873A CN115856873A (zh) 2023-03-28
CN115856873B true CN115856873B (zh) 2023-11-07

Family

ID=85663813

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211437924.9A Active CN115856873B (zh) 2022-11-15 2022-11-15 一种岸基ais信号可信性判别模型、方法及装置

Country Status (1)

Country Link
CN (1) CN115856873B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7817079B1 (en) * 2008-04-17 2010-10-19 The United States Of America As Represented By The Secretary Of The Navy System and method for collection of global AIS and radar track information
CN110728230A (zh) * 2019-10-10 2020-01-24 江南大学 基于卷积受限玻尔兹曼机的信号调制方式的识别方法
EP3699825A2 (en) * 2019-02-22 2020-08-26 Ubotica Technologies Ltd. Systems and methods for deploying and updating neural networks at the edge of a network
WO2021057427A1 (zh) * 2019-09-25 2021-04-01 西安交通大学 一种基于PU learning的跨区域企业偷漏税识别方法及系统
CN113920447A (zh) * 2021-10-15 2022-01-11 深圳市唯特视科技有限公司 船舶入港检测方法、装置、计算机设备及存储介质
CN114742265A (zh) * 2022-03-09 2022-07-12 大连海事大学 一种vhf信号传播路径误差预测方法及系统
CN114911837A (zh) * 2021-02-07 2022-08-16 大唐移动通信设备有限公司 预失真处理方法和装置
KR20220128141A (ko) * 2021-03-12 2022-09-20 한국해양과학기술원 실시간 레이더 이미지 기반 선박 운동정보 및 크기정보 제공시스템 및 방법
CN115114949A (zh) * 2021-03-18 2022-09-27 中国科学院声学研究所 一种基于水声信号的舰船目标智能识别方法及系统
CN115221243A (zh) * 2022-07-05 2022-10-21 江苏全创电子科技有限公司 一种ais和雷达数据整合同步的方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10073965B2 (en) * 2015-12-15 2018-09-11 Nagravision S.A. Methods and systems for validating an autonomous system that includes a dynamic-code module and a static-code module
EP3928257A1 (en) * 2019-02-19 2021-12-29 HRL Laboratories, LLC System and method for transferring electro-optical (eo) knowledge for synthetic-aperture-radar (sar)-based object detection
US20200272905A1 (en) * 2019-02-26 2020-08-27 GE Precision Healthcare LLC Artificial neural network compression via iterative hybrid reinforcement learning approach
KR20210012730A (ko) * 2019-07-26 2021-02-03 삼성전자주식회사 인공지능 모델의 학습 방법 및 전자 장치
CN110673600B (zh) * 2019-10-18 2021-05-28 武汉理工大学 面向无人船舶的自动驾驶集成系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7817079B1 (en) * 2008-04-17 2010-10-19 The United States Of America As Represented By The Secretary Of The Navy System and method for collection of global AIS and radar track information
EP3699825A2 (en) * 2019-02-22 2020-08-26 Ubotica Technologies Ltd. Systems and methods for deploying and updating neural networks at the edge of a network
WO2021057427A1 (zh) * 2019-09-25 2021-04-01 西安交通大学 一种基于PU learning的跨区域企业偷漏税识别方法及系统
CN110728230A (zh) * 2019-10-10 2020-01-24 江南大学 基于卷积受限玻尔兹曼机的信号调制方式的识别方法
CN114911837A (zh) * 2021-02-07 2022-08-16 大唐移动通信设备有限公司 预失真处理方法和装置
KR20220128141A (ko) * 2021-03-12 2022-09-20 한국해양과학기술원 실시간 레이더 이미지 기반 선박 운동정보 및 크기정보 제공시스템 및 방법
CN115114949A (zh) * 2021-03-18 2022-09-27 中国科学院声学研究所 一种基于水声信号的舰船目标智能识别方法及系统
CN113920447A (zh) * 2021-10-15 2022-01-11 深圳市唯特视科技有限公司 船舶入港检测方法、装置、计算机设备及存储介质
CN114742265A (zh) * 2022-03-09 2022-07-12 大连海事大学 一种vhf信号传播路径误差预测方法及系统
CN115221243A (zh) * 2022-07-05 2022-10-21 江苏全创电子科技有限公司 一种ais和雷达数据整合同步的方法及系统

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
Deep Cybersecurity: A Comprehensive Overview from Neural Network and Deep Learning Perspective;Iqbal H. Sarker;《SN Computer Science》;第1-16页 *
Maritime over the horizon sensor integration: High frequency surface-wave-radar and automatic identification system data integration algorithm;D Nikolic 等;《Sensors》;第1-17页 *
The research of the key technology on automatic identification system core chips;Xiaoye Wang 等;《2012 5th International Conference on BioMedical Engineering and Informatics》;第1-5页 *
基于BP神经网络的AIS与雷达信息关联算法研究;欧阳萍 等;《中国水运(下半月)》;第77-79页 *
基于DBN的数字信号调制识别方法研究;郭蕴欣 等;《现代电子技术》;第22-24、29页 *
基于交互式多模型平方根容积卡尔曼滤波的船舶轨迹跟踪;杨家轩 等;《中国舰船研究》;第12-23页 *
基于混合深度学习的多类型低速率DDoS攻击检测方法;李丽娟 等;《网络与信息安全学报》;第73-85页 *
基于神经网络的异常船舶航迹特征因子模型;牟红梅 等;《科学技术与工程》;第14610-14617页 *
基于量子计算的限制波尔兹曼机网络模型及分类算法;张培林 等;《振动与冲击》;第26-31页 *
自组织神经网络雷达目标识别的研究;许俊刚 等;《北京理工大学学报》;第67-72页 *
船载AIS和雷达数据关联及融合;俞金龙;《声学与电子工程》;第58-61页 *

Also Published As

Publication number Publication date
CN115856873A (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
US9182473B2 (en) System, method and product for locating vehicle key using neural networks
US7324979B2 (en) Genetically adaptive neural network classification systems and methods
CN111709315A (zh) 一种基于领域适配的水声目标辐射噪声识别方法
CN113242259B (zh) 网络异常流量检测方法及装置
CN109346087B (zh) 对抗网络的瓶颈特征的噪声鲁棒的说话人确认方法和装置
Thiruloga et al. TENET: Temporal CNN with attention for anomaly detection in automotive cyber-physical systems
AU2012264479A1 (en) Heterogeneous data fusion using Gaussian processes
AU2012264477A1 (en) Heterogeneous data fusion using gaussian processes
CN115482230A (zh) 基于深度卷积脉冲神经网络的肺结核辅助决策系统
CN116027198A (zh) 基于联合加权域对抗网络的锂电池健康状态估计方法
CN115856873B (zh) 一种岸基ais信号可信性判别模型、方法及装置
Musakulova et al. Synthesis of the backpropagation error algorithm for a multilayer neural network with nonlinear synaptic inputs
AU2012264478A1 (en) Heterogeneous data fusion using gaussian processes
CN117150402A (zh) 基于生成式对抗网络的电力数据异常检测方法及模型
CN111814976A (zh) 一种空调系统传感器故障误差再学习方法及系统
JPWO2022024211A5 (zh)
CN116895016A (zh) 一种sar图像船舶目标生成与分类方法
CN114595770B (zh) 一种船舶轨迹的长时序预测方法
CN109344873B (zh) 一种深度神经网络的训练样本挖掘方法及装置
Kuremoto et al. Nonlinear prediction by reinforcement learning
CN113592028A (zh) 多专家分类委员会机器测井流体识别的方法及系统
Ouabi et al. Stochastic complex-valued neural networks for radar
Ramli et al. Multilayered perceptron (MLP) network trained by recursive least squares algorithm
CN117216949B (zh) 一种基于深度学习的跨传感器爆管定位域自适应方法
CN109726761B (zh) Cnn进化方法、基于cnn的auv集群工作方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant