CN114337849B - 基于互信息量估计神经网络的物理层保密方法及系统 - Google Patents
基于互信息量估计神经网络的物理层保密方法及系统 Download PDFInfo
- Publication number
- CN114337849B CN114337849B CN202111574717.3A CN202111574717A CN114337849B CN 114337849 B CN114337849 B CN 114337849B CN 202111574717 A CN202111574717 A CN 202111574717A CN 114337849 B CN114337849 B CN 114337849B
- Authority
- CN
- China
- Prior art keywords
- mutual information
- information quantity
- training
- decoder
- encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Error Detection And Correction (AREA)
Abstract
本发明提供了一种基于互信息量估计神经网络的物理层保密方法及系统,包括:步骤S1:基于互信息量估计和端到端的深度学习对编码器和解码器分别进行训练,得到训练后的编码器和训练后的解码器;步骤S2:利用训练后的编码器和训练后的解码器进行物理层保密传输。本发明引入互信息量估计和端到端深度学习的方法,通过互信息量估计实现最小化窃听者信道互信息量的保密系统,通过端到端深度学习实现合法用户信道最大互信息量的可靠通信系统,方案兼顾保密性和可靠性,适用于长距高速光通信的传输系统。
Description
技术领域
本发明涉及光纤保密通信系统的技术领域,具体地,涉及基于互信息量估计神经网络的物理层保密方法及系统,更为具体地,涉及基于互信息量估计和端到端深度学习的物理层保密方法及系统。
背景技术
在光纤通信的物理层保密领域,传统的方法有异或逻辑加密、电逻辑加密以及混沌加密等,这些加密方法均为向发送信号中加入一些噪声,接收者持有密钥或者和发送方进行同步,可以去除加入的噪声。但是这些方法需要添加复杂的光学器件才能完成加密和同步,而且加密的噪声经过信道的损伤可能难以完全除去,以及同步可能出现误差,导致收端的误码率升高;且这些方法没有在信息论层面证明,加密方法针对窃听者是信息最小的,因此存在被攻击的风险。
专利文献CN100376926C(申请号:200510070506.0)公开了涉及通信领域中的量子保密通信的专用设备及其应用方法,具体是位相调制偏振态的六态量子编码器和解码器及其用于量子保密通信中的偏振补偿方法;六态量子编码器和解码器由两个位相一偏振控制器和一个同步触发器组成;在量子密码通信中通过位相调制偏振态的量子编码器和解码器,对信号传输过程中引起的偏振态畸变进行有效的补偿,大大地降低误码率至10-5,调制速度从几十赫兹到几G赫兹。
针对上述缺陷,本发明提出了一种基于互信息量估计和端到端深度学习的物理层保密方法和系统,使用端到端深度学习最大化合法用户的互信息量,使用互信息量估计最小化窃听者的互信息量。本发明通过改变调制格式达到增加噪声的效果,只需要调制即可实现保密,不需要复杂的物理器件;本发明可以证明实现了合法用户的互信息量最大化,且窃听用户的互信息量最小化,从而证明了系统的安全性能;本系统可以应用于任意的信道,都可以实现保密通信。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于互信息量估计神经网络的物理层保密方法及系统。
根据本发明提供的一种基于互信息量估计神经网络的物理层保密方法,包括:
步骤S1:基于互信息量估计和端到端的深度学习对编码器和解码器分别进行训练,得到训练后的编码器和训练后的解码器;
步骤S2:利用训练后的编码器和训练后的解码器进行物理层保密传输。
优选地,所述步骤S1采用:
步骤S1.1:构建编码器、解码器和互信息量估计器;
步骤S1.2:通过端到端深度学习的方式训练解码器,获取训练后的解码器;
步骤S1.3:通过发端原始比特和信道输出训练互信息量估计器,获取训练后的互信息量估计器;
步骤S1.4:通过训练后的解码器神经网络获取端到端的误码率,通过训练后的互信息量估计器神经网络获取窃听者的互信息量;通过最小化端到端误码率和最小化窃听者互信息量的方式训练编码器神经网络,获取训练后的编码器神经网络。
优选地,所述步骤S1.2采用:
步骤S1.2.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
步骤S1.2.2:将信道输出信号和伪随机数序列输入解码器得到解码比特;
步骤S1.2.3:根据解码比特和原始比特通过L1Loss损失函数计算损失值,再利用梯度反向传播和梯度下降对解码器进行训练,当训练次数达到预设次时,则训练结束。
优选地,所述步骤S1.3采用:
步骤S1.3.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
步骤S1.3.2:根据信道输出信号和原始比特输入互信息量估计器,通过损失函数计算损失值,利用梯度反向传播和梯度下降对互信息量估计器进行训练,当训练次数达到预设次时,则训练结束。
优选地,所述步骤S1.4采用:
步骤S1.4.1:将原始比特和伪随机数序列输入编码器中得到处理后的信号;
步骤S1.4.2:将处理后的信号输入端到端的广义信道,得到信道输出信号;
步骤S1.4.3:将信道输出信号和伪随机数序列输入解码器得到解码比特;
步骤S1.4.4:根据解码比特和原始比特输入训练后的解码器,通过L1Loss损失函数计算端到端损失值;
步骤S1.4.5:利用原始比特和信道输出信号输入训练后的互信息量估计器,通过损失函数计算互信息量损失值;
步骤S1.4.6:根据端到端损失和互信息量损失值利用梯度反向传播和梯度下降训练编码器,当训练次数达到预设次时,则训练结束。
优选地,所述步骤S1.2采用:发端的原始比特通过端到端的传输在收端得到解码后的比特,以L1损失函数作为计算发端的原始比特和解调后的比特之间的误码率的损失函数,具体公式如下:
优选地,所述步骤S1.3采用:在互信息量估计器训练过程中使用计算互信息量的公式作为损失函数,具体公式如下:
L=-Ep(x,z)[T(x,z)]+log(Ep(x)p(z)[eT(x,z)])
其中,T表示互信息量估计器的神经网络函数;x表示输入比特的向量;z表示信道输出的向量;Ep(x,z)[T(x,z)]表示当x和z取联合分布的情况下T(x,z)的期望值,Ep(x)p(z)[eT (x,z)]表示当x和z取边际分布的情况下eT(x,z)的期望值;
优选地,所述步骤S1.4采用:在编码器训练过程中,将两个目标合成一个损失函数,具体公式如下:
L=αBER+(1-α)I
其中,BER表示端到端的误码率;I表示窃听者的互信息量;α表示权衡系数。
根据本发明提供的一种基于互信息量估计神经网络的物理层保密系统,其特征在于,包括:
模块M1:基于互信息量估计和端到端的深度学习对编码器和解码器分别进行训练,得到训练后的编码器和训练后的解码器;
模块M2:利用训练后的编码器和训练后的解码器进行物理层保密传输。
优选地,所述模块M1采用:
模块M1.1:构建编码器、解码器和互信息量估计器;
模块M1.2:通过端到端深度学习的方式训练解码器,获取训练后的解码器;
模块M1.3:通过发端原始比特和信道输出训练互信息量估计器,获取训练后的互信息量估计器;
模块M1.4:通过训练后的解码器神经网络获取端到端的误码率,通过训练后的互信息量估计器神经网络获取窃听者的互信息量;通过最小化端到端误码率和最小化窃听者互信息量的方式训练编码器神经网络,获取训练后的编码器神经网络;
所述模块M1.2采用:
模块M1.2.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
模块M1.2.2:将信道输出信号和伪随机数序列输入解码器得到解码比特;
模块M1.2.3:根据解码比特和原始比特通过L1Loss损失函数计算损失值,再利用梯度反向传播和梯度下降对解码器进行训练,当训练次数达到预设次时,则训练结束;
所述模块M1.3采用:
模块M1.3.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
模块M1.3.2:根据信道输出信号和原始比特输入互信息量估计器,通过损失函数计算损失值,利用梯度反向传播和梯度下降对互信息量估计器进行训练,当训练次数达到预设次时,则训练结束;
所述模块M1.4采用:
模块M1.4.1:将原始比特和伪随机数序列输入编码器中得到处理后的信号;
模块M1.4.2:将处理后的信号输入端到端的广义信道,得到信道输出信号;
模块M1.4.3:将信道输出信号和伪随机数序列输入解码器得到解码比特;
模块M1.4.4:根据解码比特和原始比特输入训练后的解码器,通过L1Loss损失函数计算端到端损失值;
模块M1.4.5:利用原始比特和信道输出信号输入训练后的互信息量估计器,通过损失函数计算互信息量损失值;
模块M1.4.6:根据端到端损失和互信息量损失值利用梯度反向传播和梯度下降训练编码器,当训练次数达到预设次时,则训练结束。
与现有技术相比,本发明具有如下的有益效果:
1、本发明通过改变调制格式达到增加噪声的效果,只需要调制即可实现保密,不需要复杂的物理器件;
2、本发明可以证明实现了合法用户的互信息量最大化,且窃听用户的互信息量最小化,从而证明了系统的安全性能;
3、本发明方法通过端到端训练编码器和解码器,适用于所有的信道模型;
4、本系统可以应用于任意的信道,都可以实现保密通信。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明基于互信息量估计和端到端深度学习的物理层保密方法的流程图。
图2为本发明基于互信息量估计和端到端深度学习的物理层保密方法中解码器和互信息量估计器的训练流程图。
图3为本发明基于互信息量估计和端到端深度学习的物理层保密方法中编码器的训练流程图;
图4为本发明一个实施例的一种保密系统在光纤信道的不同入纤功率下的误码率性能展示。
图5为本发明一个实施例的一种保密系统在光纤信道下的星座图展示。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1
根据本发明提供的一种基于互信息量估计神经网络的物理层保密方法,包括:
步骤S1:基于互信息量估计和端到端的深度学习对编码器和解码器分别进行训练,得到训练后的编码器和训练后的解码器;
步骤S2:利用训练后的编码器和训练后的解码器进行物理层保密传输。
具体地,所述步骤S1采用:
步骤S1.1:构建编码器、解码器和互信息量估计器;
步骤S1.2:通过端到端深度学习的方式训练解码器,获取训练后的解码器;
步骤S1.3:通过发端原始比特和信道输出训练互信息量估计器,获取训练后的互信息量估计器;
步骤S1.4:通过训练后的解码器获取端到端的误码率,通过训练后的互信息量估计器获取窃听者的互信息量;通过最小化端到端误码率和最小化窃听者互信息量的方式训练编码器,获取训练后的编码器。
编码器输入数据包括原始比特和伪随机数序列,编码器的输出数据为处理后的信号;
解码器输入数据包括信道输出的信号和伪随机数序列,解码器的输出数据为解码后的比特;
互信息量估计器的输入数据包括原始比特和信道输出的信号,输出数据为用于计算互信息量的标量;
其中,编码器输入的原始比特,解码器输出的解码后的比特,互信息量估计器输入的原始比特三者维度一致,编码器输出的处理后的信号,解码器输入的信道输出的信号,互信息量估计器输入的信道输出的信号三者维度一致,编码器输入的伪随机数序列和解码器输出的伪随机数序列两者维度一致。
编码器和解码器使用的伪随机数序列完全相同,编码器和解码器通过持有相同的伪随机数种子并且使用相同的伪随机数生成函数的方式生成相同的伪随机数序列。
具体地,所述步骤S1.2采用:
步骤S1.2.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
步骤S1.2.2:将信道输出信号和伪随机数序列输入解码器得到解码比特;
步骤S1.2.3:根据解码比特和原始比特通过L1Loss损失函数计算损失值,再利用梯度反向传播和梯度下降对解码器进行训练,当训练次数达到预设次时,则训练结束。
具体地,所述步骤S1.3采用:
步骤S1.3.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
步骤S1.3.2:根据信道输出信号和原始比特输入互信息量估计器,通过损失函数计算损失值,利用梯度反向传播和梯度下降对互信息量估计器进行训练,当训练次数达到预设次时,则训练结束。
具体地,所述步骤S1.4采用:
步骤S1.4.1:将原始比特和伪随机数序列输入编码器中得到处理后的信号;
步骤S1.4.2:将处理后的信号输入端到端的广义信道,得到信道输出信号;
步骤S1.4.3:将信道输出信号和伪随机数序列输入解码器得到解码比特;
步骤S1.4.4:根据解码比特和原始比特输入训练后的解码器,通过L1Loss损失函数计算端到端损失值;
步骤S1.4.5:利用原始比特和信道输出信号输入训练后的互信息量估计器,通过损失函数计算互信息量损失值;
步骤S1.4.6:根据端到端损失和互信息量损失值利用梯度反向传播和梯度下降训练编码器,当训练次数达到预设次时,则训练结束。
具体地,所述步骤S1.2采用:发端的原始比特通过端到端的传输在收端得到解码后的比特,以L1损失函数作为计算发端的原始比特和解调后的比特之间的误码率的损失函数,具体公式如下:
具体地,所述步骤S1.3采用:在互信息量估计器训练过程中使用计算互信息量的公式作为损失函数,具体公式如下:
L=-Ep(x,z)[T(x,z)]+log(Ep(x)p(z)[eT(x,z)])
其中,T表示互信息量估计器的神经网络函数;x表示输入比特的向量;z表示信道输出的向量;Ep(x,z)[T(x,z)]表示当x和z取联合分布的情况下T(x,z)的期望值,Ep(x)p(z)[eT (x,z)]表示当x和z取边际分布的情况下eT(x,z)的期望值;利用反向传播算法和梯度下降训练互信息量估计器;每个互信息量估计器训练步骤中重复训练互信息量估计器30次以上。
具体地,在编码器训练过程中,通过L1损失函数计算发端原始比特和收端解调后的比特,得到端到端的误码率;通过计算互信息量的公式计算发端原始比特和信道输出的信号之间的互信息量,得到窃听者的互信息量;训练编码器需要最小化端到端的误码率,并且最小化窃听者的互信息量;利用反向传播算法和梯度下降训练编码器,每批次训练1次。
具体地,所述步骤S1.4采用:在编码器训练过程中,将两个目标合成一个损失函数,具体公式如下:
L=αBER+(1-α)I
其中,BER表示端到端的误码率;I表示窃听者的互信息量;α表示权衡系数。
根据本发明提供的一种基于互信息量估计神经网络的物理层保密系统,包括:
模块M1:基于互信息量估计和端到端的深度学习对编码器和解码器分别进行训练,得到训练后的编码器和训练后的解码器;
模块M2:利用训练后的编码器和训练后的解码器进行物理层保密传输。
具体地,所述模块M1采用:
模块M1.1:构建编码器、解码器和互信息量估计器;
模块M1.2:通过端到端深度学习的方式训练解码器,获取训练后的解码器;
模块M1.3:通过发端原始比特和信道输出训练互信息量估计器,获取训练后的互信息量估计器;
模块M1.4:通过训练后的解码器获取端到端的误码率,通过训练后的互信息量估计器获取窃听者的互信息量;通过最小化端到端误码率和最小化窃听者互信息量的方式训练编码器,获取训练后的编码器。
编码器输入数据包括原始比特和伪随机数序列,编码器的输出数据为处理后的信号;
解码器输入数据包括信道输出的信号和伪随机数序列,解码器的输出数据为解码后的比特;
互信息量估计器的输入数据包括原始比特和信道输出的信号,输出数据为用于计算互信息量的标量;
其中,编码器输入的原始比特,解码器输出的解码后的比特,互信息量估计器输入的原始比特三者维度一致,编码器输出的处理后的信号,解码器输入的信道输出的信号,互信息量估计器输入的信道输出的信号三者维度一致,编码器输入的伪随机数序列和解码器输出的伪随机数序列两者维度一致。
编码器和解码器使用的伪随机数序列完全相同,编码器和解码器通过持有相同的伪随机数种子并且使用相同的伪随机数生成函数的方式生成相同的伪随机数序列。
具体地,所述模块M1.2采用:
模块M1.2.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
模块M1.2.2:将信道输出信号和伪随机数序列输入解码器得到解码比特;
模块M1.2.3:根据解码比特和原始比特通过L1Loss损失函数计算损失值,再利用梯度反向传播和梯度下降对解码器进行训练,当训练次数达到预设次时,则训练结束。
具体地,所述模块M1.3采用:
模块M1.3.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
模块M1.3.2:根据信道输出信号和原始比特输入互信息量估计器,通过损失函数计算损失值,利用梯度反向传播和梯度下降对互信息量估计器进行训练,当训练次数达到预设次时,则训练结束。
具体地,所述模块M1.4采用:
模块M1.4.1:将原始比特和伪随机数序列输入编码器中得到处理后的信号;
模块M1.4.2:将处理后的信号输入端到端的广义信道,得到信道输出信号;
模块M1.4.3:将信道输出信号和伪随机数序列输入解码器得到解码比特;
模块M1.4.4:根据解码比特和原始比特输入训练后的解码器,通过L1Loss损失函数计算端到端损失值;
模块M1.4.5:利用原始比特和信道输出信号输入训练后的互信息量估计器,通过损失函数计算互信息量损失值;
模块M1.4.6:根据端到端损失和互信息量损失值利用梯度反向传播和梯度下降训练编码器,当训练次数达到预设次时,则训练结束。
具体地,所述模块M1.2采用:发端的原始比特通过端到端的传输在收端得到解码后的比特,以L1损失函数作为计算发端的原始比特和解调后的比特之间的误码率的损失函数,具体公式如下:
具体地,所述模块M1.3采用:在互信息量估计器训练过程中使用计算互信息量的公式作为损失函数,具体公式如下:
L=-Ep(x,z)[T(x,z)]+log(Ep(x)p(z)[eT(x,z)])
其中,T表示互信息量估计器的神经网络函数;x表示输入比特的向量;z表示信道输出的向量;Ep(x,z)[T(x,z)]表示当x和z取联合分布的情况下T(x,z)的期望值,Ep(x)p(z)[eT (x,z)]表示当x和z取边际分布的情况下eT(x,z)的期望值;利用反向传播算法和梯度下降训练互信息量估计器;每个互信息量估计器训练步骤中重复训练互信息量估计器30次以上。
具体地,在编码器训练过程中,通过L1损失函数计算发端原始比特和收端解调后的比特,得到端到端的误码率;通过计算互信息量的公式计算发端原始比特和信道输出的信号之间的互信息量,得到窃听者的互信息量;训练编码器需要最小化端到端的误码率,并且最小化窃听者的互信息量;利用反向传播算法和梯度下降训练编码器,每批次训练1次。
具体地,所述模块M1.4采用:在编码器训练过程中,将两个目标合成一个损失函数,具体公式如下:
L=αBER+(1-α)I
其中,BER表示端到端的误码率;I表示窃听者的互信息量;α表示权衡系数。
实施例2
实施例2是实施例1的优选例
本发明提供了一种基于互信息量估计和端到端深度学习的物理层保密方法,如图1所示,包括以下步骤:步骤S1:基于互信息量估计和端到端的深度学习对编码器和解码器进行训练。步骤S1包括以下步骤:
神经网络构建步骤:构建编码器、解码器和互信息量估计器。构建编码器神经网络、解码器神经网络和互信息量估计器神经网络。
神经网络为全连接的神经网络,包括输入层,隐藏层和输出层。编码器输入数据包括原始比特和伪随机数序列,编码器的输出数据为处理后的信号。解码器输入数据包括信道输出的信号和伪随机数序列,解码器的输出数据为解码后的比特。互信息量估计器的输入数据包括原始比特和信道输出的信号,输出数据为用于计算互信息量的标量。
其中,编码器输入的原始比特,解码器输出的解码后的比特,互信息量估计器输入的原始比特三者维度一致,编码器输出的处理后的信号,解码器输入的信道输出的信号,互信息量估计器输入的信道输出的信号三者维度一致,编码器输入的伪随机数序列和解码器输出的伪随机数序列两者维度一致。
本发明引入了端到端的概念,端到端是通信的发端和收端。本发明将编码器神经网络定义为发端,解码器神经网络定义为收端,发端和收端之间的模块全部定义为广义的信道。发端的编码器输入发端的原始比特,输出调制后的信号,经过广义的信道传输后,收端解码器输入信道输出的信号,输出解码后的比特。因此端到端的输入为发端原始信号,输出为解码后的比特。
在本发明中,发端的编码器和收端的解码器都输入伪随机数序列,发端编码器输入的伪随机数序列起到加密的作用,收端解码器输入的伪随机数序列起到解密的作用。发端编码器和收端解码器输入的伪随机数序列是相同的。发端编码器和收端解码器持有相同的伪随机数种子,使用相同的伪随机数生成函数,从而可以生成相同的伪随机数序列。
调制格式指一种函数关系,一组比特经过一种调制格式的编码,生成一组对应的调制后的信号;与之对应的是解调策略,一组信号通过解调策略可以解调得到所对应的一组比特。在本发明中,发端输入的每一种伪随机数序列,相当于发端通过伪随机数序列选择一种对应的调制格式。收端输入的每一种伪随机数序列,相当于收端根据伪随机数序列选择一种和发端调制格式对应的解调格式。当发端的调制格式和收端的解调策略不对应的情况下,无法进行正常的解调,即会导致端到端的输入和输出之间出现大于正常解调情况的误码率。本发明中,发端依靠频繁地更换调制格式来实现解密,合法用户的收端拥有和发端所对应的伪随机数序列和解调策略,窃听者无法得到伪随机数序列和解调策略,因此会导致窃听者解调的误码率高于合法用户。
解码器训练步骤:通过端到端深度学习的方式训练解码器。解码器训练步骤如图2所示,发端生成原始比特,编码器输入原始比特输出处理后的信号,处理后的信号经过信道得到信道输出的信号,解码器输入信道输出的信号得到解码后的比特,损失函数为L1损失函数,用于计算端到端的输入和输出之间的误码率,公式为:
互信息量估计器训练步骤:通过发端原始比特和信道输出训练互信息量估计器。互信息量估计器的训练步骤如图2所示,发端生成原始比特,编码器输入原始比特输出处理后的信号,处理后的信号经过信道得到信道输出的信号,互信息量估计器输入发端原始比特和信道输出的信号,输出用于计算互信息量的标量。通过估计互信息量的公式,可以通过此标量计算得到原始比特和信道输出的信号之间的互信息量,公式为:
其中X表示原始比特,Z表示信道输出的信号,I(X;Z)表示原始比特和信道输出的信号之间的互信息量,IM表示经过估计互信息量公式计算出来的互信息量估计值,T表示互信息量估计器的神经网络函数,F表示所有凸函数的集合,x表示输入互信息量估计器的原始比特的向量,z表示输入互信息量估计器的信道的输出信号的向量,Ep(x,z)[T(x,z)]表示当x和z取联合分布的情况下T(x,z)的期望值,Ep(x)p(z)[eT(x,z)]表示当x和z取边际分布的情况下eT(x,z)的期望值。当T取得使IM最大的神经网络的函数的时候,IM等于互信息量的下界。
训练互信息量估计器的目的,寻找到使得IM最大的神经网络,从而得到一个最接近互信息量的估计值,即互信息量的下界。因此,训练互信息量估计器的损失函数,可以用IM的相反数来表示,即:
L=-Ep(x,z)[T(x,z)]+log(Ep(x)p(z)[eT(x,z)])
根据损失函数通过梯度反向传播和梯度下降对互信息量估计器进行训练,训练的目的是让互信息量估计器对于两种不同的变量分布,互信息量估计值尽可能精确,因此需要不断训练神经网络以找到最大值,这个最大值代表着两种不同的变量分布的下界。互信息量估计器训练步骤每一批次重复训练互信息量估计器30次以上。
在本发明中,互信息量估计器计算发端的原始比特和信道输出的互信息量。考虑窃听者可以获取信道输出,窃听者无法得到编码器和解码器使用的伪随机数序列,因此计算输入的比特信号和信道输出的互信息量,就是相当于窃听者所窃取到的信息量。
编码器训练步骤:通过解码器获取端到端的误码率,通过互信息量估计器获取窃听者的互信息量,通过最小化端到端误码率和最小化窃听者互信息量的方式训练编码器。编码器的任务是最小化合法用户误码率,同时最小化窃听者的互信息量。编码器的训练步骤如图3所示,发端生成原始比特,编码器输入原始比特输出处理后的信号,处理后的信号经过信道得到信道输出的信号,解码器输入信道输出的信号得到解码后的比特,通过L1损失函数计算端到端的输入和输出之间的误码率,互信息量估计器输入发端原始比特和信道输出的信号,输出用于计算互信息量的标量,再通过互信息量估计函数计算窃听者的互信息量。训练编码器的目的在于最小化端到端误码率并且最小化窃听者的互信息量,这是一个多目标优化的问题,可以使用一个损失函数的公式可以将两个梯度转换为一个梯度,公式为:
L=αBER+(1-α)I
其中BER表示端到端训练数据通过L1损失函数计算得到的误码率数据,I表示通过互信息量估计器得到的窃听者互信息量估计值;α表示权衡系数,在0和1区间,其中α接近1的时候,训练的主要目标是降低合法用户端到端的误码率,当α接近0的时候,训练的主要目标是降低窃听者的互信息量。将这个公式作为损失函数,通过梯度反向传播和梯度下降即可训练编码器,每个批次编码器训练一次。
如果信道未知或者不可微分,即梯度反向传播不能经过信道,则可以使用直通估计器的方法,在梯度反向传播的过程中,将梯度不变的从信道输出传递至发端。
如图1所示,本发明的训练流程分为多个轮回反复训练,每个轮回分别训练解码器,互信息量估计器和编码器,其中解码器和互信息量编码器至少分别训练30次和20次,每个轮回训练编码器1次。共训练K个轮回后结束编码器的训练。
步骤S2:根据编码器和解码器进行物理层保密传输。根据训练后的编码器设计端到端最优的光纤通信算法,进行高速长距离光纤传输。
本发明可以在不同条件的信道下实现保密传输,编码器设计保密的几何整形和编码,解码器进行解密的调制和译码,满足合法接收者误码率最低,实现最大化合法用户的通信互信息量,逼近通信的信道容量,同时最小化窃听者互信息量。端到端深度学习应用在光通信当中最优调制格式的设计和解码,通过端到端训练提升互信息量,逼近信道容量。互信息量估计应用于光通信当中最小化窃听者的互信息量。通过最小化窃听者的互信息量,实现保密通信。
本发明实施例还公开了一种基于互信息量估计和端到端深度学习的物理层保密系统,包括如下模块:模块M1:基于互信息量估计和端到端的深度学习对编码器和解码器进行训练。模块M1包括如下模块:神经网络构建模块:构建编码器、解码器和互信息量估计器。解码器训练模块:通过端到端深度学习的方式训练解码器。互信息量估计器训练模块:通过发端原始比特和信道输出训练互信息量估计器。编码器训练模块:通过解码器获取端到端的误码率,通过互信息量估计器获取窃听者的互信息量,通过最小化端到端误码率和最小化窃听者互信息量的方式训练编码器。
模块M2:根据优化的端到端进行光纤传输。
本发明实施例还给出了基于互信息量估计和端到端深度学习的物理层保密方法应用于光纤传输仿真系统的结果示意图。传输系统的光纤长度为80公里,双偏振,单通道,4bits/symbol调制,传输速率为400Gbit/s,使用相干调制和解调。图4展示了在不同的入纤功率下加密信号直接检测,解密信号和与之对比的16QAM格雷码调制的性能对比。图5展示了未加密和加密的信道输出的信号的星座图,其中左图:未加密的16QAM信号;右图:加密后的信号。
在上述情景中,保密系统保证了窃听者无法从信道中成功解调,获取信息,而合法通信者与未加密的信号相比,误码率有一定程度的升高,但仍然维持爱一个较低的水平。
本发明所要解决的技术问题在于实现光纤信道下的高速长距保密通信,本发明基于端到端深度学习最大化合法用户的互信息量,基于互信息量估计最小化非法用户的互信息量;本发明引入了新的损失函数,使用参数平衡训练过程中最大化合法用户互信息量和最小化非法用户互信息量两个优化目标;本发明使用伪随机数种子作为密钥,发端和收端可以通过相同的伪随机数生成函数产生相同的伪随机数序列,不需要复杂的物理器件进行同步,也不存在同步误差导致的合法用户误码率增加;本发明使用调制的方式实现保密通信,理论上如果编码器和解码器进行充分地训练,系统可以在任意高速率长距离信道中实现保密传输,误码率可以接近端到端互信息量最大的传输;由于端到端深度学习和互信息量估计都是通过数据驱动方法实现,因此本发明的保密方法可以应用于所有信道,可以在所有的信道中实现低误码率且拥有保密性能的传输。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (8)
1.一种基于互信息量估计神经网络的物理层保密方法,其特征在于,包括:
步骤S1:基于互信息量估计和端到端的深度学习对编码器和解码器分别进行训练,得到训练后的编码器和训练后的解码器;
步骤S2:利用训练后的编码器和训练后的解码器进行物理层保密传输;
所述步骤S1采用:
步骤S1.1:构建编码器、解码器和互信息量估计器;
步骤S1.2:通过端到端深度学习的方式训练解码器,获取训练后的解码器;
步骤S1.3:通过发端原始比特和信道输出训练互信息量估计器,获取训练后的互信息量估计器;
步骤S1.4:通过训练后的解码器神经网络获取端到端的误码率,通过训练后的互信息量估计器神经网络获取窃听者的互信息量;通过最小化端到端误码率和最小化窃听者互信息量的方式训练编码器神经网络,获取训练后的编码器神经网络。
2.根据权利要求1所述的基于互信息量估计神经网络的物理层保密方法,其特征在于,所述步骤S1.2采用:
步骤S1.2.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
步骤S1.2.2:将信道输出信号和伪随机数序列输入解码器得到解码比特;
步骤S1.2.3:根据解码比特和原始比特通过L1Loss损失函数计算损失值,再利用梯度反向传播和梯度下降对解码器进行训练,当训练次数达到预设次时,则训练结束。
3.根据权利要求1所述的基于互信息量估计神经网络的物理层保密方法,其特征在于,所述步骤S1.3采用:
步骤S1.3.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
步骤S1.3.2:根据信道输出信号和原始比特输入互信息量估计器,通过损失函数计算损失值,利用梯度反向传播和梯度下降对互信息量估计器进行训练,当训练次数达到预设次时,则训练结束。
4.根据权利要求1所述的基于互信息量估计神经网络的物理层保密方法,其特征在于,所述步骤S1.4采用:
步骤S1.4.1:将原始比特和伪随机数序列输入编码器中得到处理后的信号;
步骤S1.4.2:将处理后的信号输入端到端的广义信道,得到信道输出信号;
步骤S1.4.3:将信道输出信号和伪随机数序列输入解码器得到解码比特;
步骤S1.4.4:根据解码比特和原始比特输入训练后的解码器,通过L1Loss损失函数计算端到端损失值;
步骤S1.4.5:利用原始比特和信道输出信号输入训练后的互信息量估计器,通过损失函数计算互信息量损失值;
步骤S1.4.6:根据端到端损失和互信息量损失值利用梯度反向传播和梯度下降训练编码器,当训练次数达到预设次时,则训练结束。
6.根据权利要求3所述的基于互信息量估计神经网络的物理层保密方法,其特征在于,所述步骤S1.3采用:在互信息量估计器训练过程中使用计算互信息量的公式作为损失函数,具体公式如下:
L=-Ep(x,z)[T(x,z)]+log(Ep(x)p(z)[eT(x,z)])
其中,T表示互信息量估计器的神经网络函数;x表示输入比特的向量;z表示信道输出的向量;Ep(x,z)[T(x,z)]表示当x和z取联合分布的情况下T(x,z)的期望值,Ep(x)p(z)[eT(x,z)]表示当x和z取边际分布的情况下eT(x,z)的期望值。
7.根据权利要求4所述的基于互信息量估计神经网络的物理层保密方法,其特征在于,所述步骤S1.4采用:在编码器训练过程中,将两个目标合成一个损失函数,具体公式如下:
L=αBER+(1-α)I
其中,BER表示端到端的误码率;I表示窃听者的互信息量;α表示权衡系数。
8.一种基于互信息量估计神经网络的物理层保密系统,其特征在于,包括:
模块M1:基于互信息量估计和端到端的深度学习对编码器和解码器分别进行训练,得到训练后的编码器和训练后的解码器;
模块M2:利用训练后的编码器和训练后的解码器进行物理层保密传输;
所述模块M1采用:
模块M1.1:构建编码器、解码器和互信息量估计器;
模块M1.2:通过端到端深度学习的方式训练解码器,获取训练后的解码器;
模块M1.3:通过发端原始比特和信道输出训练互信息量估计器,获取训练后的互信息量估计器;
模块M1.4:通过训练后的解码器神经网络获取端到端的误码率,通过训练后的互信息量估计器神经网络获取窃听者的互信息量;通过最小化端到端误码率和最小化窃听者互信息量的方式训练编码器神经网络,获取训练后的编码器神经网络;
所述模块M1.2采用:
模块M1.2.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
模块M1.2.2:将信道输出信号和伪随机数序列输入解码器得到解码比特;
模块M1.2.3:根据解码比特和原始比特通过L1Loss损失函数计算损失值,再利用梯度反向传播和梯度下降对解码器进行训练,当训练次数达到预设次时,则训练结束;
所述模块M1.3采用:
模块M1.3.1:将原始比特和伪随机数序列输入编码器得到处理后的信号,再将处理后的信号输入端到端的广义信道,得到信道输出信号;
模块M1.3.2:根据信道输出信号和原始比特输入互信息量估计器,通过损失函数计算损失值,利用梯度反向传播和梯度下降对互信息量估计器进行训练,当训练次数达到预设次时,则训练结束;
所述模块M1.4采用:
模块M1.4.1:将原始比特和伪随机数序列输入编码器中得到处理后的信号;
模块M1.4.2:将处理后的信号输入端到端的广义信道,得到信道输出信号;
模块M1.4.3:将信道输出信号和伪随机数序列输入解码器得到解码比特;
模块M1.4.4:根据解码比特和原始比特输入训练后的解码器,通过L1Loss损失函数计算端到端损失值;
模块M1.4.5:利用原始比特和信道输出信号输入训练后的互信息量估计器,通过损失函数计算互信息量损失值;
模块M1.4.6:根据端到端损失和互信息量损失值利用梯度反向传播和梯度下降训练编码器,当训练次数达到预设次时,则训练结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111574717.3A CN114337849B (zh) | 2021-12-21 | 2021-12-21 | 基于互信息量估计神经网络的物理层保密方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111574717.3A CN114337849B (zh) | 2021-12-21 | 2021-12-21 | 基于互信息量估计神经网络的物理层保密方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114337849A CN114337849A (zh) | 2022-04-12 |
CN114337849B true CN114337849B (zh) | 2023-03-14 |
Family
ID=81053789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111574717.3A Active CN114337849B (zh) | 2021-12-21 | 2021-12-21 | 基于互信息量估计神经网络的物理层保密方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114337849B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114978306A (zh) * | 2022-05-17 | 2022-08-30 | 上海交通大学 | 基于深度学习的光纤通信传输系统互信息量计算方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107274445A (zh) * | 2017-05-19 | 2017-10-20 | 华中科技大学 | 一种图像深度估计方法和系统 |
JP2018037904A (ja) * | 2016-08-31 | 2018-03-08 | 沖電気工業株式会社 | 量子鍵配送システム |
CN109522961A (zh) * | 2018-11-23 | 2019-03-26 | 中山大学 | 一种基于字典深度学习的半监督图像分类方法 |
CN112152953A (zh) * | 2020-09-23 | 2020-12-29 | 上海交通大学 | 一种针对神经网络均衡器训练的随机序列构造方法 |
CN112468258A (zh) * | 2019-09-06 | 2021-03-09 | 河海大学常州校区 | 一种全双工端到端自动编码器通信系统及其对抗窃听方法 |
CN113079069A (zh) * | 2021-06-04 | 2021-07-06 | 南京邮电大学 | 一种面向大规模加密网络流量的混合粒度训练及分类方法 |
CN113098804A (zh) * | 2021-03-29 | 2021-07-09 | 东南大学 | 一种基于深度学习与熵编码的信道状态信息反馈方法 |
WO2021176984A1 (ja) * | 2020-03-03 | 2021-09-10 | オムロン株式会社 | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム |
CN113434761A (zh) * | 2021-06-25 | 2021-09-24 | 平安科技(深圳)有限公司 | 推荐模型训练方法、装置、计算机设备和存储介质 |
CN113746628A (zh) * | 2021-09-30 | 2021-12-03 | 西安交通大学 | 一种基于深度学习的物理层密钥生成方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2479288B (en) * | 2006-07-26 | 2012-03-28 | Japan Science & Tech Agency | Secret communication method and secret communication device thereof |
US10223780B2 (en) * | 2015-04-15 | 2019-03-05 | Institute Of Automation Chinese Academy Of Sciences | Image steganalysis based on deep learning |
EP3337063B1 (en) * | 2016-12-13 | 2023-08-23 | Id Quantique Sa | Apparatus and method for quantum enhanced physical layer security |
US10839606B2 (en) * | 2018-12-28 | 2020-11-17 | National Tsing Hua University | Indoor scene structural estimation system and estimation method thereof based on deep learning network |
US11630989B2 (en) * | 2020-03-09 | 2023-04-18 | International Business Machines Corporation | Mutual information neural estimation with Eta-trick |
CN112231774A (zh) * | 2020-10-26 | 2021-01-15 | 中国人民解放军陆军工程大学 | 一种深度学习旁路分析的安全评估框架搭建方法 |
CN112702600B (zh) * | 2020-12-29 | 2022-04-12 | 南京大学 | 一种图像编解码神经网络分层定点化方法 |
-
2021
- 2021-12-21 CN CN202111574717.3A patent/CN114337849B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018037904A (ja) * | 2016-08-31 | 2018-03-08 | 沖電気工業株式会社 | 量子鍵配送システム |
CN107274445A (zh) * | 2017-05-19 | 2017-10-20 | 华中科技大学 | 一种图像深度估计方法和系统 |
CN109522961A (zh) * | 2018-11-23 | 2019-03-26 | 中山大学 | 一种基于字典深度学习的半监督图像分类方法 |
CN112468258A (zh) * | 2019-09-06 | 2021-03-09 | 河海大学常州校区 | 一种全双工端到端自动编码器通信系统及其对抗窃听方法 |
WO2021176984A1 (ja) * | 2020-03-03 | 2021-09-10 | オムロン株式会社 | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム |
CN112152953A (zh) * | 2020-09-23 | 2020-12-29 | 上海交通大学 | 一种针对神经网络均衡器训练的随机序列构造方法 |
CN113098804A (zh) * | 2021-03-29 | 2021-07-09 | 东南大学 | 一种基于深度学习与熵编码的信道状态信息反馈方法 |
CN113079069A (zh) * | 2021-06-04 | 2021-07-06 | 南京邮电大学 | 一种面向大规模加密网络流量的混合粒度训练及分类方法 |
CN113434761A (zh) * | 2021-06-25 | 2021-09-24 | 平安科技(深圳)有限公司 | 推荐模型训练方法、装置、计算机设备和存储介质 |
CN113746628A (zh) * | 2021-09-30 | 2021-12-03 | 西安交通大学 | 一种基于深度学习的物理层密钥生成方法及系统 |
Non-Patent Citations (3)
Title |
---|
Johannes Ackermann;Maximilian Schädler;Christian Bluemm.Convolutional Neural Network Based Blind Estimation of Generalized Mutual Information for Optical Communication.《2020 European Conference on Optical Communications (ECOC)》.2021, * |
基于卷积神经网络的红外与可见光图像融合;董安勇,杜庆治,苏斌,赵文博,于闻;《红外技术》;20200720;全文 * |
基于深度学习的MIMO系统联合优化;李国权等;《重庆邮电大学学报(自然科学版)》;20190615(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114337849A (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101086949B1 (ko) | 데이터 통신 장치 | |
US8934633B2 (en) | Encrypted communication system, transmitter and receiver using same | |
Parker et al. | Reconstructing the keystream from a chaotic encryption scheme | |
JP4906732B2 (ja) | データ送信装置、データ受信装置、及びデータ通信装置 | |
CN110677236B (zh) | 一种基于复合混沌系统与异或运算的ofdm加密方法 | |
CN101719908A (zh) | 基于混沌理论和dna剪接模型的图像加密方法 | |
CN111600661B (zh) | 基于实时更新的混沌密钥分发的三维加密ofdm光系统 | |
CN114337849B (zh) | 基于互信息量估计神经网络的物理层保密方法及系统 | |
CN113422769B (zh) | 基于光纤信道实时物理态与dna编码技术的传输方法 | |
CN114915398A (zh) | 一种基于变分自编码器的混沌加密方法、应用、计算机设备及存储介质 | |
JP4889630B2 (ja) | 暗号文伝送のための光送信装置及び方法 | |
CN111641500B (zh) | 一种用于无人机无线视频传输安全的加解密方法 | |
CN113271201A (zh) | 一种动态的aes物理层数据加密方法 | |
JP2006333138A (ja) | データ送信装置、データ受信装置、並びにデータ通信装置 | |
CN209218114U (zh) | 一种长距离混合式抗量子计算通信系统 | |
JP2013021422A (ja) | 暗号送信装置 | |
US20070189521A1 (en) | Data transmission apparatus, data receiving apparatus and data communication method | |
CN113644985A (zh) | 基于细胞自动机和dna编码的超长距传输方法及系统 | |
Rahman et al. | Secure OFDM-Based NOMA for Machine-to-Machine Communication | |
JP2006295338A (ja) | データ送信装置、データ受信装置、並びにデータ通信装置 | |
CN114785484B (zh) | 一种大数据安全传输方法及系统 | |
Wang et al. | Data Center Secure Communication via DNA Hyperchaotic Encryption | |
CN113949503B (zh) | 基于dna动态编码的wfrft安全通信方法 | |
CN113691369B (zh) | 一种基于神经网络的光纤信道安全传输系统 | |
Rahman et al. | Research Article Secure OFDM-Based NOMA for Machine-to-Machine Communication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |