CN114726394B - 一种智能通信系统的训练方法及智能通信系统 - Google Patents
一种智能通信系统的训练方法及智能通信系统 Download PDFInfo
- Publication number
- CN114726394B CN114726394B CN202210198976.9A CN202210198976A CN114726394B CN 114726394 B CN114726394 B CN 114726394B CN 202210198976 A CN202210198976 A CN 202210198976A CN 114726394 B CN114726394 B CN 114726394B
- Authority
- CN
- China
- Prior art keywords
- sample
- signal transceiver
- transmitter
- receiver
- loss function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/391—Modelling the propagation channel
Abstract
本发明公开了一种智能通信系统的训练方法及智能通信系统,智能通信系统包括第一信号收发器以及第二信号收发器,第一信号收发器包括第一发射机以及第一接收机,第二信号收发器包括第二发射机以及第二接收机。训练方法包括:控制第一发射机将已知训练样本发送至第二接收机,第二接收机对已知训练样本进行重建得到第二样本;第一接收机对第二样进行重建得到第三样本并对由第二发射机发送的已知训练样本进行重建得到第四样本;根据第三样本以及第四样本构建第一损失函数;根据第一输出张量以及第一松弛张量构建第二损失函数;根据第一损失函数以及第二损失函数对第一发射机的神经网络进行训练。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种智能通信系统的训练方法及智能通信系统。
背景技术
可端到端学习的智能通信系统,由包含有神经网络的发射机和接收机组成,如图1所示。与传统的通信系统相比,可端到端学习的智能通信系统具有更高的抗噪能力和更高的信息传输速率,其发射机、接收机以及两者工作的信道可由如下公式表示:y=h(x)+n;A为被发射的模拟信号或任意进制的数字信号,A1为接收机重建的模拟信号或数字信号;表示发射机中的神经网络,其中的θT表示发射机神经网络的参数;表示接收机中的神经网络,其中的θR表示接收机神经网络的参数;h表示通信系统工作信道的响应,n表示信道中的加性噪声。x表示发射机依据其输入A映射得到的数字化的信号,该信号会由发射机进行数模转换和变频等处理后,传送到信道中。y表示接收机从信信道中接收得到的数字化基带信号,信号接收机会依据接收到的y重建得到A1。当A和A1的损失函数非常小时,我们可以认为该通信系统是准确的。Loss(A,A1)→0;0表示0向量其维度需依据通信系统传输的信号确定。
神经网络一般采用反向传播梯度的方式进行训练,但在可端到端学习的智能通信系统中,梯度信息无法跨越不可微分的物理信道,导致可端到端学习的智能通信系统中的发射机无法获取训练梯度,从而无法被训练。为解决这一问题,在现有技术中通常采用两类训练方法进行训练。第一类训练方法,是采用可微分的信道模型来代替真实信道的方式,进行可端到端学习的智能通信系统的训练。第二类训练方法是,额外构建一条可靠的通信链路,把接收机的训练相关信息传递给发射机。但是在实际操作过程中,构建信道模型或额外构建通信链路的难度和成本都非常高,从而使得智能通信系统的训练难度较大且成本较高。
发明内容
本发明实施例提供一种智能通信系统的训练方法及智能通信系统,能有效降低智能通信系统的训练成本和训练难度。
本发明一实施例提供一种智能通信系统的训练方法,所述智能通信系统至少包括第一信号收发器以及第二信号收发器,所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机;所述第一发射机、所述第一接收机、所述第二发射机以及所述第二接收机均设置有神经网;
所述智能通信系统的训练方法包括:控制第一发射机将已知训练样本发送至第二接收机,以使所述第二接收机对已知训练样本进行重建得到第二样本;
控制所述第一接收机接收由所述第二发射机发送的第二样本以及已知训练样本,以使所述第一接收机对所述第二样本进行重建得到第三样本,并对已知训练样本进行重建得到第四样本;
根据所述第三样本以及第四样本构建第一损失函数;
根据第一发射机的神经网络的第一输出张量以及第一松弛张量构建第二损失函数;其中,所述第一输出张量为所述第一发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第一松弛张量为对所述第一输出张量进行松弛操作后所形成的张量;
根据所述第一损失函数以及所述第二损失函数生成总损失函数,并根据所述总损失函数对所述第一发射机的神经网络进行训练。
进一步的,训练方法还包括:根据已知训练样本以及所述第四样本构建第三损失函数;根据所述第三损失函数对所述第一接收机的神经网络进行训练。
进一步的,训练方法还包括:控制第一发射机将第五样本以及已知训练样本发送至第二信号收发器,以使所述第二信号收发器在通过所述第二接收机接收所述第五样本和已知训练样本后,对第二发射机的神经网络进行训练;
其中,所述第五样本为所述第二发射机将已知训练样本发送至第一接收机,并由第一接收机进行重建后得到的样本;
第二信号收发器对第二发射机的神经网络进行训练具体包括:
获取由第二接收机对所述第五样本进行重建后得到的第六样本,以及由第二接收机对已知训练样本进行重建后得到的第七样本;
根据所述第六样本以及所述第七样本构建第四损失函数;
根据第二发射机的神经网络的第二输出张量以及第二松弛张量构建第五损失函数;其中,所述第二输出张量为所述第二发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第二松弛张量为对所述第二输出张量进行松弛操作后所形成的张量;根据所述第四损失函数以及所述第五损失函数生成第二总损失函数,并根据所述第二总损失函数对所述第二发射机中的神经网络进行训练。
进一步的,所述第二信号收发器还根据已知训练样本以及所述第七样本构建第六损失函数,根据所述第六损失函数对所述第二接收机的神经网络进行训练。
本发明另一实施例提供了一种智能通信系统的训练方法,所述智能通信系统包括第一信号收发器以及第二信号收发器,所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机;所述第一发射机、所述第一接收机、所述第二发射机以及所述第二接收机均设置有神经网络;
所述智能通信系统的训练方法包括:
第一信号收发器以及第二信号收发器对发射机和接收机进行迭代训练,直至达到第一预设次数;其中,在每次迭代训练时,先由第一信号收发器和第二信号收发器对各自的发射机的神经网络进行训练,再由第一信号收发器和第二信号收发器对各自接收机的神经网络进行训练;
在每次迭代训练时,第一信号收发器对第一发射机的神经网络的训练具体包括:控制第一发射机将已知训练样本发送至第二接收机,以使所述第二接收机对已知训练样本进行重建得到第二样本;控制所述第一接收机接收由所述第二发射机发送的第二样本以及已知训练样本,以使所述第一接收机对所述第二样本进行重建得到第三样本,并对已知训练样本进行重建得到第四样本;根据所述第三样本以及第四样本构建第一损失函数;根据第一发射机的神经网络的第一输出张量以及第一松弛张量构建第二损失函数;其中,所述第一输出张量为所述第一发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第一松弛张量为对所述第一输出张量进行松弛操作后所形成的张量;根据所述第一损失函数以及所述第二损失函数生成总损失函数,并根据所述总损失函数对所述第一发射机中的神经网络进行训练;
在每次迭代训练时,第一信号收发器对第一接收机的神经网络的训练具体包括:根据已知训练样本以及所述第四样本构建第三损失函数;根据所述第三损失函数对所述第一接收机的神经网络进行训练;
在每次迭代训练时,第二信号收发器对第二发射机的神经网络的训练具体包括:接收由第一发射机发送的第五样本和已知训练样本后,并控制第二接收机对所述第五样本进行重建后所得到第六样本,控制第二接收机对已知训练样本进行重建后得到第七样本;其中,所述第五样本为所述第二发射机将已知训练样本发送至第一接收机,并由第一接收机进行重建后得到的样本;根据所述第六样本以及所述第七样本构建第四损失函数;根据第二发射机的神经网络的第二输出张量以及第二松弛张量构建第五损失函数;其中,所述第二输出张量为所述第二发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第二松弛张量为对所述第二输出张量进行松弛操作后所形成的张量;根据所述第四损失函数以及所述第五损失函数生成第二总损失函数,并根据所述第二总损失函数对所述第二发射机中的神经网络进行训练;
在每次迭代训练时,第二信号收发器对第二接收机的神经网络的训练具体包括:根据已知训练样本以及第七样本构建第六损失函数,根据所述第六损失函数对所述第二接收机的神经网络进行训练。
在本发明另一实施例中,所述智能通信系统还包括第三信号收发器;所述第三信号收发器包括:第三发射机以及第三接收机;所述第三发射机和所述第三接收机均设置有神经网络;
所述智能通信系统的训练方法还包括:
在第一信号收发器以及第二信号收发器对各自的发射机和接收机进行迭代训练完毕后,由第一信号收发器、第二信号收发器以及第三信号收发器进行三端迭代训练,直至第二预设次数;其中,在每次三端迭代训练时,先由选定发射机所对应的信号收发器和第三信号收发器对各自的发射机的神经网络进行训练,再由选定接收机所对应的信号收发器和第三信号收发器对各自接收机的神经网络进行训练;所述选定发射机为第一发射机或第二发射机,所述选定接收机为第一接收机或第二接收机,在同一次三端迭代训练时,选定发射机所对应的信号收发器与选定接收机所对应的信号收发器为不同的信号收发器,相邻两次三端迭代训练的选定发射机不同,相邻两次三端迭代训练的选定接收机不同。
进一步的,在每次三端迭代训练时,选定发射机所对应的信号收发器对发射机的神经网络的训练具体包括:
当所述选定发射机所对应的信号收发器为第一信号收发器时,第一信号收发器控制第一发射机将第二已知训练样本发送至第三信号收发器,以使所述第三信号收发器对第二已知训练样本进行重建得到第八样本,并将第八样本以及第二已知训练样本传输至第二信号收发器;其中,所述第二信号收发器在接收所述第八样本以及第二已知训练样本后,对所述第八样本进行重建生成第九样本,对第二已知训练样本进行重建生成第十样本,继而将所述第九样本和所述第十样本传输至第一信号收发器;
第一信号收发器对所述第九样本进行重建得到第十一样本,对第十样本进行重建得到第十二样本;第一信号收发器根据所述第十一样本以及第十二样本构建第七损失函数;第一信号收发器根据第三输出张量以及第三松弛张量构建第八损失函数;其中,所述第三输出张量为所述第一发射机的神经网络以第二已知训练样本为输入所生成的输出张量;所述第三松弛张量为对所述第三输出张量进行松弛操作后所形成的张量;第一信号收发器根据所述第七损失函数以及所述第八损失函数生成第三总损失函数,并根据所述第三总损失函数对所述第一发射机中的神经网络进行训练;
当所述选定发射机所对应的信号收发器为第二信号收发器时,第二信号收发器控制第二发射机将第二已知训练样本发送至第三信号收发器,以使所述第三信号收发器对第二已知训练样本进行重建得到第十三样本,并将第十三样本以及第二已知训练样本传输至第一信号收发器;其中,所述第一信号收发器在接收所述第十三样本以及第二已知训练样本后,对所述第十三样本进行重建生成第十四样本,对第二已知训练样本进行重建生成第十五样本,继而将所述第十四样本和所述第十五样本传输至第二信号收发器;
第二信号收发器对所述第十四样本进行重建得到第十六样本,对第十五样本进行重建得到第十七样本;第二信号收发器根据所述第十六样本以及第十七样本构建第九损失函数;第二信号收发器根据第四输出张量以及第四松弛张量构建第十损失函数;其中,所述第四输出张量为所述第二发射机的神经网络以第二已知训练样本为输入所生成的输出张量;所述第四松弛张量为对所述第四输出张量进行松弛操作后所形成的张量;第二信号收发器根据所述第九损失函数以及所述第十损失函数生成第四总损失函数,并根据所述第四总损失函数对所述第二发射机中的神经网络进行训练。
进一步的,在每次三端迭代训练时,选定接收机所对应的信号收发器对接收机的神经网络的训练具体包括:
当选定接收机所对应的信号收发器为第一信号收发器时,第一信号收发器根据第二已知训练样本以及所述第十五样本构建第十一损失函数;第一信号收发器根据所述第十一损失函数对所述第一接收机的神经网络进行训练;
当选定接收机所对应的信号收发器为第二信号收发器时,第二信号收发器根据第二已知训练样本以及所述第十样本构建第十二损失函数;第二信号收发器根据所述第十二损失函数对所述第二接收机的神经网络进行训练。
进一步的,在每次三端迭代训练时,第三信号收发器对第三发射机的神经网络的训练具体包括:
当所述选定接收机所对应的信号收发器为第一信号收发器时,控制第三发射机将第二已知训练样本发送至第一信号收发器,以使所述第一信号收发器对所述第二已知训练样本进行重建得到第十八样本,并将第十八样本传输至第二信号收发器;其中,所述第二信号收发器在接收所述第十八样本后,对所述第十八样本进行重建获得第十九样本,继而将所述第十九样本以及第二已知训练样本传输至第三信号收发器;
控制第三接收机对所述第十九样本进行重建得到第二十样本,对第二已知训练样本进行重建得到第二十一样本;根据所述第二十样本以及第二十一样本构建第十三损失函数;获取第三发射机的神经网络的第五输出张量,根据所述第五输出张量以及第五松弛张量构建第十四损失函数;其中,所述第五输出张量为所述第三发射机的神经网络根据第二已知训练样本所生成的输出张量;所述第五松弛张量为对所述第五输出张量进行松弛操作后所形成的张量;根据所述第十三损失函数以及所述第十四损失函数生成第五总损失函数,并根据所述第五总损失函数对所述第三发射机中的神经网络进行训练;
当所述选定接收机所对应的信号收发器为第二信号收发器时,控制第三发射机将第二已知训练样本发送至第二信号收发器,以使所述第二信号收发器对所述第二已知训练样本进行重建得到第二十二样本,并将第二十二样本传输至所述第一信号收发器;其中,所述第一信号收发器在接收所述第二十二样本后,对所述第二十二样本进行重建获得第二十三样本,继而将所述第二十二样本以及第二已知训练样本传输至第三接收机;
控制第三接收机对所述第二十三样本进行重建得到第二十四样本,对已知训练样本进行重建得到第二十五样本;
根据所述第二十四样本以及第二十五样本构建第十五损失函数;获取第三发射机的神经网络的第六输出张量,根据所述第六输出张量以及第六松弛张量构建第十六损失函数;其中,所述第六输出张量为所述第三发射机的神经网络根据第二已知训练样本所生成的输出张量;所述第六松弛张量为对所述第六输出张量进行松弛操作后所形成的张量;根据所述第十五损失函数以及所述第十六损失函数生成第六总损失函数,并根据所述第六总损失函数对所述第三发射机中的神经网络进行训练。
进一步的,在每次三端迭代训练时,第三信号收发器对第三接收机的神经网络的训练具体包括:
当选定发射机所对应的信号收发器为第一信号收发器时,根据第二已知训练样本以及所述第二十五样本构建第十七损失函数;根据所述第十七损失函数对所述第三接收机的神经网络进行训练;
当选定发射机所对应的信号收发器为第二信号收发器时,根据第二已知训练样本以及所述第二十一样本构建第十八损失函数;根据所述第十八损失函数对所述第三接收机的神经网络进行训练。
在上述方法项实施例的基础上,本发明另一实施例提供了一种智能通信系统;所述智能通信系统包括:第一信号收发器以及第二信号收发器;所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机;所述第一发射机、所述第一接收机、所述第二发射机以及所述第二接收机均设置有神经网络;其中,所述第一信号收发器以及所述第二信号收发器均根据上述智能通信系统的训练方法进行训练。
在上述方法项实施例的基础上,本发明另一实施例提供了一种智能通信系统;所述智能通信系统包括:第一信号收发器、第二信号收发器以及第三信号收发器;所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机,所述第三信号收发器包括第三发射机以及第三接收机;所述第一发射机、所述第一接收机、所述第二发射机、所述第二接收机、所述第三发射机、所述第三接收机均设置有神经网络;其中,所述第一信号收发器、第二信号收发器以及第三信号收发器均根据上述智能通信系统的训练方法进行训练。
通过实施本发明实施例具有如下有益效果:
本发明将两个传统可端到端学习的智能通信系统合并为一个可点到点学习的智能通信系统,在训练发射机时(以第一发射机为例),首先由第一发射机将已知训练样本发送至第二接收机,由第二接收机对已知训练样本进行重建得到第二样本,然后由第二发射机将第二样本和一个已知训练样本发送至第一接收机,并由第一接收机对第二样本进行重建得到第三样本,对已知训练样本进行重建得到第四样本。此时,第三样本包含了第一发射机至第二接收机之间的信道的响应与噪声以及第二发射机至第一接收机之间的信道的响应与噪声。第四样本包含了第二发射机至第一接收机之间的信道的响应与噪声。这样第一发射机在无需额外建立信道模型或通信链路的情况下,即可直接在本地获取由第一接收机所生成的第三样本和第四样本,继而获取到充足的信息,进而估算第一发射机的训练梯度,完成对第一发射机的神经网络的训练。在整个训练过程中基于第二发射机的信号转发进行来获取训练相关的信息,对第一发射机进行训练,免除了现有技术中额外的信道模型或通信链路的构建,从而降低了智能通信系统的训练成本和难度。
附图说明
图1是传统智能通信系统的结构示意图。
图2是本发明一实施例提供的智能通信系统的训练方法的流程示意图。
图3是本发明一实施例提供的智能通信系统的结构示意图。
图4是本发明又一实施例提供的智能通信系统的结构示意图。
图5是本发明又一实施例提供的智能通信系统的结构示意图。
图6是本发明又一实施例提供的智能通信系统的结构示意图。
图7是本发明又一实施例提供的智能通信系统的结构示意图。
图8是本发明又一实施例提供的智能通信系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首选需要说明的是,在本发明中已知训练样本(或第二已知训练样本)对各信号收发器的发射机和接收机来说是已知的。在优选的实施例中本发明所提及的信道包括两个部分组成,第一部分是传统的通信信道,第二部分是发射机中神经网络输出之后和与接收机中神经网络之前的、不可微分的硬件模块。在本发明中,发射机中的神经网络可以替代传统通信系统的信源编码模块、信道编码模块、交织模块以及调制模块中的一个或多个模块。接收机中的神经网络可以替代传统通信系统的信源解码模块、信道解码模块、解交织模块以及解调模块中的一个或多个模块。
如图2,图3所示,本发明一实施例提供了一种智能通信系统的训练方法,所述智能通信系统至少包括:第一信号收发器以及第二信号收发器,所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机;所述第一发射机、所述第一接收机、所述第二发射机以及所述第二接收机均设置有神经网;
所述智能通信系统的训练方法包括:
步骤S101:控制第一发射机将已知训练样本发送至第二接收机,以使所述第二接收机对已知训练样本进行重建得到第二样本。
步骤S102:控制所述第一接收机接收由所述第二发射机发送的第二样本以及已知训练样本,以使所述第一接收机对所述第二样本进行重建得到第三样本,并对已知训练样本进行重建得到第四样本。
步骤S103:根据所述第三样本以及第四样本构建第一损失函数。
步骤S104:根据第一发射机的神经网络的第一输出张量以及第一松弛张量构建第二损失函数;其中,所述第一输出张量为所述第一发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第一松弛张量为对所述第一输出张量进行松弛操作后所形成的张量。
步骤S105:根据所述第一损失函数以及所述第二损失函数生成总损失函数,并根据所述总损失函数对所述第一发射机的神经网络进行训练。
对于步骤S101,具体的,如图3所示,本发明将两个传统可端到端学习的智能通信系统合并为一个可点到点学习的智能通信系统,该智能通信系统的一个通信节点为第一信号收发器,另一通信节点为第二信号收发器;每个信号收发器都具有两个通信端(发射机端和接收机端)由此组成一个可点到点学习的智能通信系统;训练时,第一发射机将已知训练样本M发送至第二接收机,第二接收机接收由第一发射机发送的已知训练样本并进行重建后得到第二样本M2。定义为第一发射机的神经中的神经网络,为第一接收机的神经中的神经网络,为第二发射机的神经中的神经网络,为第二接收机的神经中的神经网络,h1为第一发射机所发射的信号至第二接收机时所穿过的信道的响应,n1为第一发射机所发射的信号至第二接收机时所穿过的信道的噪声,h2为第二发射机所发射的信号至第一接收机时所穿过的信道的响应,n2为第二发射机所发射的信号至第一接收机时所穿过的信道的噪声;
对于步骤S102:参照图3,第二发射机在本地获取由第二接收机重建后的第二样本M2,然后将第二样本M2以及已知训练样本M发送至第一接收机,第一接收机对第二样本M2进行重建得到第三样本M3,对由第二发射机发射的已知训练样本进行重建得到第四样本M4;则: 对比M3和M4的计算公式,且考虑到在短时间内,h2和n2的分布特征、功率不会发生突变可知:当Loss(M4,M3)→0时,有Loss(M,M2)→0。因此可以利用第三样本M3与第四样本M4所构建的损失函数Loss(M4,M3),来替代已知训练样本M与第二样本M2所构建的损失函数Loss(M,M2);而第三样本M3和第四样本M4均可以由第一发射机在本地从第一接收机获取,即可以在第一信号收发器本地获取到充足的信息以估算第一发射机的训练梯度,无需构建额外的通信链路以及信道模型。
对于步骤S103,根据第三样本M3和第四样本M4构建第一损失函数Loss(M4,M3);上述第一损失函数可视实际情况采用如下任意一项所示的方式进行构建:交叉、均方误差和峰值信噪比等。
对于步骤S104,设以已知训练样本M为输入时,第一发射机的神经网络的输出为x1,利用x1与x1+c1计算第二损失函数Loss(x1,x1+c1)。x1+c1为x1的松弛张量,即上述第一松弛张量为x1+c1;c1是与x1大小相同的服从高斯分布的随机张量。需要说明的是,在本发明中将一个张量进行松弛操作的方法可以为,将一个张量加上与其大小相同的且服从高斯分布的随机张量,当然也可以采用其他的松弛方法,只需要能够获得对应的松弛张量即可。优选的,高斯分布的均值与方差可根据运算器的位数与性能进行调整,其典型值可设定为0和10-8。同样上述第二损失函数可视实际情况采用如下任意一项所示的方式进行构建:均方误差函数以及峰值信噪比等。
对于步骤S105,将上述第一损失函数Loss(M4,M3)与第二损失函数Loss(x1,x1+c1)进行组合即可得到总损失函数。需要说明的是,第一损失函数与第二损失函数的组合形式包括以下任意一种组合形式:相乘、相加、积分以及取倒数相乘。示意性的,总损失函数可以为:L=Loss(M4,M3)*Loss(x1,x1+c1);
根据上述方法即可在不构建额外的模拟信道以及通信链路的情况下完成第一发射机的训练。
在一个优选的实施例中,上述智能通信系统的训练方法,还包括:根据已知训练样本以及所述第四样本构建第三损失函数;根据所述第三损失函数对所述第一接收机的神经网络进行训练。通过这一实施例可以完成对第一接收机的神经网络的训练。具体的,在训练第一接收机时,先由第二发射机及发射一个已知训练样本M至第一接收机,第一接收机接收由第二发射机发射的已知训练样本并进行重建,即得到上述第四样本M4;然后根据已知训练样本M以及第四样本M4构建第三损失函数,根据所构建的第三损失函数对第一接收机进行训练。同理,第三损失函数可视实际情况采用如下任意一项所示的方式进行构建:交叉熵以及均方误差函等。
如图4所示,在一个优选的实施例中,上述训练方法,还包括:控制第一发射机将第五样本以及已知训练样本发送至第二信号收发器,以使所述第二信号收发器在通过所述第二接收机接收所述第五样本和已知训练样本后,对第二发射机的神经网络进行训练;其中,所述第五样本为所述第二发射机将已知训练样本发送至第一接收机,并由第一接收机进行重建后得到的样本;第二信号收发器对第二发射机的神经网络进行训练具体包括:获取由第二接收机对所述第五样本进行重建后得到的第六样本,以及由第二接收机对已知训练样本进行重建后得到的第七样本;根据所述第六样本以及所述第七样本构建第四损失函数;根据第二发射机的神经网络的第二输出张量以及第二松弛张量构建第五损失函数;其中,所述第二输出张量为所述第二发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第二松弛张量为对所述第二输出张量进行松弛操作后所形成的张量;根据所述第四损失函数以及所述第五损失函数生成第二总损失函数,并根据所述第二总损失函数对所述第二发射机中的神经网络进行训练。
通过这一实施例可完成对第二发射机的神经网络的训练,第二发射机的神经网络的训练与第一发射机神经网络的训练相似,具体的,参见图4:第二发射机将已知训练样本发送至第一接收机,第一接收机接收由第二发射机所发送的已知训练样本并进行重建得到第五样本M5;第一发射机在本地从第一接收机处获取第五样本M5,然后将第五样本M5以及一个已知训练样本M传输至第二信号收发器的第二接收机;第二接收机对第五样本M5进行重建得到第六样本M6,对由第一发射机发送的已知训练样本进行重建得到第七样本M7;紧接着根据第六样本M6和第七样本M7构建第四损失函数Loss(M6,M7)(第四损失函数的构建方式可采用以下任意一项方式进行构建:交叉、均方误差和峰值信噪比等),紧接着根据第二发射机的神经网络的第二输出张量x2以及第二松弛张量x2+c2构建第五损失函数Loss(x2,x2+c2)(同样上述第五损失函数可视实际情况采用如下任意一项所示的方式进行构建:均方误差函数以及峰值信噪比等。);其中,所述第二输出张量x2为所述第二发射机的神经网络以已知训练样本M为输入所生成的输出张量;第二松弛张量x2+c2为对所述第二输出张量进行松弛操作后所形成的张量;c2为与所述第二输出张量大小相同且服从高斯分布的随机张量;最后,根据所述第四损失函数Loss(M6,M7)以及第五损失函数Loss(x2,x2+c2)生成第二总损失函数,并根据所述第二总损失函数对所述第二发射机中的神经网络进行训练。同理,第四损失函数与第五损失函数的组合形式包括以下任意一种组合形式:相乘、相加、积分以及取倒数相乘。示意性的,第二总损失函数可以为:L2=Loss(M6,M7)*Loss(x2,x2+c2)。
在一个优选的实施例中,所述第二信号收发器还根据已知训练样本以及所述第七样本构建第六损失函数,根据所述第六损失函数对所述第二接收机的神经网络进行训练。通过这一实施例可以完成对第二接收机的训练,具体的,在训练第二接收机时,先由第一发射机发射一个已知训练样本M至第二接收机,第二接收机接收由第一发射机发射的已知训练样本并进行重建,即得到上述第七样本M7;然后根据已知训练样本M以及第四样本M7构建第六损失函数,根据所构建的第六损失函数对第二接收机进行训练。同理,第六损失函数可视实际情况采用如下任意一项所示的方式进行构建:交叉熵以及均方误差函等。
采用上述所示的方法即可完成对智能通信系统中第一接收机,第二接收机,第一发射机以及第二发射机的训练。为更好的说明本发明智能通信系统的整体训练过程,以下列举另一实施例进行整体训练的说明;
本发明另一实施例提供了一种智能通信系统的训练方法,所述智能通信系统包括第一信号收发器以及第二信号收发器,所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机;所述第一发射机、所述第一接收机、所述第二发射机以及所述第二接收机均设置有神经网络;
所述智能通信系统的训练方法包括:
第一信号收发器以及第二信号收发器对发射机和接收机进行迭代训练,直至达到第一预设次数;其中,在每次迭代训练时,先由第一信号收发器和第二信号收发器对各自的发射机的神经网络进行训练,再由第一信号收发器和第二信号收发器对各自接收机的神经网络进行训练;
在每次迭代训练时,第一信号收发器对第一发射机的神经网络的训练具体包括:控制第一发射机将已知训练样本发送至第二接收机,以使所述第二接收机对已知训练样本进行重建得到第二样本;控制所述第一接收机接收由所述第二发射机发送的第二样本以及已知训练样本,以使所述第一接收机对所述第二样本进行重建得到第三样本,并对已知训练样本进行重建得到第四样本;根据所述第三样本以及第四样本构建第一损失函数;根据第一发射机的神经网络的第一输出张量以及第一输出张量构建第二损失函数;其中,所述第一输出张量为所述第一发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第一松弛张量为对所述第一输出张量进行松弛操作后所形成的张量;根据所述第一损失函数以及所述第二损失函数生成总损失函数,并根据所述总损失函数对所述第一发射机中的神经网络进行训练;
在每次迭代训练时,第一信号收发器对第一接收机的神经网络的训练具体包括:根据已知训练样本以及所述第四样本构建第三损失函数;根据所述第三损失函数对所述第一接收机的神经网络进行训练;
在每次迭代训练时,第二信号收发器对第二发射机的神经网络的训练具体包括:接收由第一发射机发送的第五样本和已知训练样本,并控制第二接收机对所述第五样本进行重建后所得到第六样本,控制第二接收机对已知训练样本进行重建后得到第七样本;其中,所述第五样本为所述第二发射机将已知训练样本发送至第一接收机,并由第一接收机进行重建后得到的样本;根据所述第六样本以及所述第七样本构建第四损失函数;根据第二发射机的神经网络的第二输出张量以及第二松弛张量构建第五损失函数;其中,所述第二输出张量为所述第二发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第二松弛张量为对所述第二输出张量进行松弛操作后所形成的张量;根据所述第四损失函数以及所述第五损失函数生成第二总损失函数,并根据所述第二总损失函数对所述第二发射机中的神经网络进行训练;
在每次迭代训练时,第二信号收发器对第二接收机的神经网络的训练具体包括:根据已知训练样本以及第七样本构建第六损失函数,根据所述第六损失函数对所述第二接收机的神经网络进行训练。
在这一实施例中,对第一信号收发器和第二信号收发器中发射机和接收机进行交替迭代训练,在每次迭代训练时,先由第一信号收发器和第二信号收发器对各自的发射机进行训练,再由第一信号收发器和第二信号收发器对各自的接收机进行训练,即需要保证在每次迭代训练时,先对智能通信系统中发射机的训练,再对智能通信系统中接收机进行训练,至少训练至第一预设次数后(优选的第一预设次数可以为5000),完成训练。在一个优选的实施例中,在训练完成后,可以将训练过程中通信系统通信质量最佳时,各发射机和接收机的神经网络,作为训练的最终结果。示意性的通信质量的评价指标可以根据实际情况进行制定,对于数字信号可以以误码率为通信质量好坏的评价指标,将智能通信系统误码率最低时,各发射机和各接收机所对应的神经网络作为训练的最终结果。对于模拟信号可以以均方误差为通信质量好坏的评价指标,将智能通信系统均方误差最小时,各发射机和各接收机所对应的神经网络作为训练的最终结果。此外,需要说明的是在每次迭代训练时,都会对上一次训练时的已知训练样本进行更新。
为更好的说明本发明所示的智能通信系统训练方法的应用,以下列举采用本发明所示的训练方法进行训练后的两类通信系统的具体应用:
一、是数字通信系统:对于数字通信系统来说,最常用的是对于信号的分类任务。在数字通信系统中已知训练样本M由一个或多个大于等于0的正整数组成,这些正整数的最大值一般不超过256。但在系统工作信道的信噪比较高时(也即信道较好时),如30dB以上时,也可超过256。已知训练样本M可以是单独的数字的形式,也可以是其他编码的形式(如将0编码为[1,0,…,0,0]、1编码为[0,1,…,0,0]的one-hot形式)。
在这一实施例中,若已知训练样本M为单个数字符号,直接对信号中的数字进行分类,大致通信过程中如下:利用发射机中的神经网络将数字信号M编码为数字符号。将编码得到的数字符号插入含有同步定位符的待发射的连续的模拟信号之中,在接收机端,利用连续的模拟信号中的同步定位符,定位、提取出信号中的数字符号。用接收机中的神经网络识别提取出的数字符号。该数字通信系统中的发射机和接收机的神经网络采用上述所示的智能通信系统的训练方法训练后得到。
若已知训练样本M为多个数字符号组成的符号串,先做信号重建还原出源信号,再对源信号中的数字符号进行分类判断,大致通信过程中如下:利用发射机中的神经网络将M编码为待发射的离散的数字信号。将编码得到的离散的数字信号转换为发射信号并进行发射。在接收机端,利用发射信号中的同步定位符,定位、提取出信号中的数字信号波形。用接收机中的神经网络重建数字信号波形。提取数字信号波形中的多个数字符号(也可以采用传统的阈值法进行提取)。该数字通信系统中的发射机和接收机的神经网络采用上述所示的智能通信系统的训练方法训练后得到。
二、是模拟通信系统:对于数字通信系统来说,最常用的是对信号的拟合任务,在该系统中已知训练样本M为离散的样值信号,由多个样值组成。
在这一实施例中,若视为对信号的拟合任务,该方式不对M进行量化处理。一般习惯将M中的样值归一化到[0,1]之间。其大致通信过程如下:利用发射机中的神经网络将M编码为待发射的信号波形并发射。用接收机中的神经网络重建信号波形。训练的损失是对发射信号和重建信号的每一个样值点计算误差,所以接收机的神经网络损失函数和发射机神经网络的损失函数采用均方误差函数计算。
若视为多类别分类任务,依据对通信系统精度的设计要求,将M中的样值量化至若干区间内。区间的数量(量化间隔),依据通信系统的设计精度选择。(如1000、10000或更高)。其大致通信过程如下:利用发射机中的神经网络将M编码为待发射的信号波形并发射。用接收机中的神经网络重建信号波形。训练的损失是对发射信号和重建信号的每一个样值点进行分类。所以接收机的神经网络损失函数和发射机神经网络的损失函数采用交叉熵函数计算。
上述内容说明了对于存在两个通信节点第一信号收发器和第二信号收发器的智能通信系统的训练过程,以下以三个信号收发器为例,说明存在三个或三个以上的通信节点时(信号收发器),智能通信系统的训练过程。
在一个优选的实施例中,所述智能通信系统还包括第三信号收发器;所述第三信号收发器包括:第三发射机以及第三接收机;所述第三发射机和所述第三接收机均设置有神经网络;
所述智能通信系统的训练方法还包括:
在第一信号收发器以及第二信号收发器对各自的发射机和接收机进行迭代训练完毕后,由第一信号收发器、第二信号收发器以及第三信号收发器进行三端迭代训练,直至第二预设次数;其中,在每次三端迭代训练时,先由选定发射机所对应的信号收发器和第三信号收发器对各自的发射机的神经网络进行训练,再由选定接收机所对应的信号收发器和第三信号收发器对各自接收机的神经网络进行训练;所述选定发射机为第一发射机或第二发射机,所述选定接收机为第一接收机或第二接收机,在同一次三端迭代训练时,选定发射机所对应的信号收发器与选定接收机所对应的信号收发器为不同的信号收发器,相邻两次三端迭代训练的选定发射机不同,相邻两次三端迭代训练的选定接收机不同。
当存在三个以上的信号收发器时,先按前述训练方法将其中两个信号收发器训练好,然后再加入第三个信号收发器进行三端迭代训练,在每次三端迭代训练时,可以按以下方式进行理解:将之前已经训练好的第一信号收发器和第二信号收发器作为一个虚拟信号收发器,每次训练时从第一信号收发器和和第二信号收发器中选出一个发射机和接收机,作为虚拟信号收发器的发射机和接收机,然后将虚拟信号收发器和第三信号收发器进行训练。需要说明的是,在每次三端迭代训练时,当选定了第一信号收发器的发射机作为虚拟信号收发器的发射机时,则需同时选定第二信号收发器的接收机作为虚拟信号收发器的接收机时。另外,相邻两次三端迭代训练所选定的接收机不同,相邻两次三端迭代训练所选定的发射机也不同,即如果前一次训练时选定第一信号收发器的第一发射机为虚拟信号收发器的发射机,选定第二信号收发器的第二接收机为虚拟信号收发器的接收机时,那么在下一次训练时,则需要选定第二信号收发器的第二发射机为虚拟信号收发器的发射机,选定第一信号收发器的第一接收机为虚拟信号收发器的接收机,优选的上述第二预设次数可以为5000次。同样对于4个信号收发器、5个信号收发器等三个以上的信号收发器的训练也是如此,先将其中两个信号收发器训练完后,将两个信号收发器作为一个虚拟信号收发器与第三个信号收发器进行训练,当三个信号收发器训练完成后,将三个信号收发器作为一个虚拟信号收发器,然后与第四个信号收发器进行训练,以此类推,每次训练时,从组成虚拟信号收发器的各个信号收发器中,选出一个发射机和一个接收机,作为成虚拟信号收发器的接收机和发射机然后进行训练。需要说明的是,在每次三端迭代训练时对前一次训练所采用的第二已知训练样本进行更新。
以下对存在三个信号收发器的智能通信系统的训练过程进行进一步说明:
参见图5和图6所示,本发明还能将两个以上的传统可端到端学习的智能通信系统合并为一个可点到点学习的智能通信系统,以下以三个为例:
在每次三端迭代训练时,选定发射机所对应的信号收发器对发射机的神经网络的训练具体包括:
当所述选定发射机所对应的信号收发器为第一信号收发器时,第一信号收发器控制第一发射机将第二已知训练样本发送至第三信号收发器,以使所述第三信号收发器对第二已知训练样本进行重建得到第八样本,并将第八样本以及第二已知训练样本传输至第二信号收发器;其中,所述第二信号收发器在接收所述第八样本以及第二已知训练样本后,对所述第八样本进行重建生成第九样本,对第二已知训练样本进行重建生成第十样本,继而将所述第九样本和所述第十样本传输至第一信号收发器;
第一信号收发器对所述第九样本进行重建得到第十一样本,对第十样本进行重建得到第十二样本;第一信号收发器根据所述第十一样本以及第十二样本构建第七损失函数;第一信号收发器根据第三输出张量以及第三松弛张量构建第八损失函数;其中,所述第三输出张量为所述第一发射机的神经网络以第二已知训练样本为输入所生成的输出张量;所述第三松弛张量为对所述第三输出张量进行松弛操作后所形成的张量;第一信号收发器根据所述第七损失函数以及所述第八损失函数生成第三总损失函数,并根据所述第三总损失函数对所述第一发射机中的神经网络进行训练;
当所述选定发射机所对应的信号收发器为第二信号收发器时,第二信号收发器控制第二发射机将第二已知训练样本发送至第三信号收发器,以使所述第三信号收发器对第二已知训练样本进行重建得到第十三样本,并将第十三样本以及第二已知训练样本传输至第一信号收发器;其中,所述第一信号收发器在接收所述第十三样本以及第二已知训练样本后,对所述第十三样本进行重建生成第十四样本,对第二已知训练样本进行重建生成第十五样本,继而将所述第十四样本和所述第十五样本传输至第二信号收发器;
第二信号收发器对所述第十四样本进行重建得到第十六样本,对第十五样本进行重建得到第十七样本;第二信号收发器根据所述第十六样本以及第十七样本构建第九损失函数;第二信号收发器根据第四输出张量以及第四松弛张构建第十损失函数;其中,所述第四输出张量为所述第二发射机的神经网络以第二已知训练样本为输入所生成的输出张量;所述第四松弛张量为对所述第四输出张量进行松弛操作后所形成的张量;第二信号收发器根据所述第九损失函数以及所述第十损失函数生成第四总损失函数,并根据所述第四总损失函数对所述第二发射机中的神经网络进行训练。
如图5所示(图5中的h3为第一发射机将信号发送至第三接收机时信道的响应,h3为第三发射机将信号发送至第一接收机时信道的响应),当选定发射机为第一发射机时,此时选定接收机为第二接收机,第一信号收发器对第一发射机的神经网络进行训练,具体如下:
第一发射机将第二已知训练样本M’发送至第三接收机,第三接收机接收由第一发射机发送的第二已知训练样本M’并进行重建得到第八样本M8。紧接着第三发射机将第八样本M8以及第二已知训练样本M’传输至第二接收机;第二接收机对接收的第八样本进行重建得到第九样本M9,对接收的由第三发射机发送的第二已知训练样本M’进行重建生成第十样本M10;然后由第二发射机将第九样本M9和第十样本M10发送至第一接收机;第一接收机对第九样本进行重建得到第十一样本M11,对第十样本M10进行重建得到第十二样本M12;最后由第一发射机在本地从第一接收机处获取第十一样本M11和第十二样本M12,然后根据第十一样本M11和第十二样本M12构建第七损失函数(第七损失函数的构建方式与上述第一损失函数可视具体情况而定,在此不再赘述)。后续再根据第七损失函数以及上述第八损失函数生成第三总损失函数,然后基于第三总损失函数对第一发射机中的神经网络进行训练(后续过程与前述训练过程类似,在此不再展开说明)。
如图6所示(图6中的h5为第二发射机将信号发送至第三接收机时信道的响应,h6为第三发射机将信号发送至第一接收机时信道的响应),当选定发射机为第二发射机时,此时选定接收机为第一接收机,第二信号收发器对第二发射机的神经网络进行训练,具体如下:
第二发射机将第二已知训练样本M’发送至第三接收机,第三接收机接收由第二发射机发送的第二已知训练样本M’并进行重建得到第十三样本M13。紧接着第三发射机将第十三样本M13以及第二已知训练样本M’传输至第一接收机;第一接收机对接收的第十三样本M13进行重建得到第十四样本M14,对接收的由第三发射机发送的第二已知训练样本M’进行重建生成第十五样本M15;然后由第一发射机将第十四样本M14,和第十五样本M15发送至第二接收机;第二接收机第十四样本M14进行重建得到第十六样本M16,对第十五样本M15进行重建得到第十七样本M17;最后由第二发射机在本地从第二接收机处获取第十六样本M16和第十七样本M17,然后根据第十六样本M16和第十七样本M17构建第九损失函数(第九损失函数的构建方式与上述第一损失函数可视具体情况而定,在此不再赘述)。后续再根据第九损失函数以及上述第十损失函数生成第四总损失函数,然后基于第四总损失函数对第二发射机中的神经网络进行训练(后续过程与前述训练过程类似,在此不再展开说明)。
在一个优选的实施例中,在每次三端迭代训练时,选定接收机所对应的信号收发器对接收机的神经网络的训练具体包括:
当选定接收机所对应的信号收发器为第一信号收发器时,第一信号收发器根据第二已知训练样本以及所述第十五样本构建第十一损失函数;第一信号收发器根据所述第十一损失函数对所述第一接收机的神经网络进行训练;
当选定接收机所对应的信号收发器为第二信号收发器时,第二信号收发器根据第二已知训练样本以及所述第十样本构建第十二损失函数;第二信号收发器根据所述第十二损失函数对所述第二接收机的神经网络进行训练。
这一实施例实现了对选定接收机的训练,具体的,当选定接收机所对应的信号收发器为第一信号收发器时,先由第三发射机将第二已知训练样本M’发送至第一接收机,第一接收机接收由第三发射机发送的第二已知训练样本M’并进行重建得到上述第十五样本M15,然后根据第二已知训练样本M’和第十五样本M15构建第十一损失函数,最后根据第十一损失函数对所述第一接收机的神经网络进行训练。选定接收机所对应的信号收发器为第二信号收发器时,先由第三发射机将第二已知训练样本M’发送至第二接收机,第二接收机接收第三发射机发送的第二已知训练样本M’并进行重建得到上述第十样本M10,然后根据第二已知训练样本M’和第十样本M10构建第十二损失函数,最后根据第十二损失函数对所述第二接收机的神经网络进行训练。
如图7和图8所示,在一个优选的实施例中,在每次三端迭代训练时,第三信号收发器对第三发射机的神经网络的训练具体包括:
当所述选定接收机所对应的信号收发器为第一信号收发器时,控制第三发射机将第二已知训练样本发送至第一信号收发器,以使所述第一信号收发器对所述第二已知训练样本进行重建得到第十八样本,并将第十八样本传输至第二信号收发器;其中,所述第二信号收发器在接收所述第十八样本后,对所述第十八样本进行重建获得第十九样本,继而将所述第十九样本以及第二已知训练样本传输至第三信号收发器;
控制第三接收机对所述第十九样本进行重建得到第二十样本,对第二已知训练样本进行重建得到第二十一样本;根据所述第二十样本以及第二十一样本构建第十三损失函数;获取第三发射机的神经网络的第五输出张量,根据所述第五输出张量以及第五松弛张量构建第十四损失函数;其中,所述第五输出张量为所述第三发射机的神经网络根据第二已知训练样本所生成的输出张量;所述第五松弛张量为对所述第五输出张量进行松弛操作后所形成的张量;根据所述第十三损失函数以及所述第十四损失函数生成第五总损失函数,并根据所述第五总损失函数对所述第三发射机中的神经网络进行训练;
当所述选定接收机所对应的信号收发器为第二信号收发器时,控制第三发射机将第二已知训练样本发送至第二信号收发器,以使所述第二信号收发器对所述第二已知训练样本进行重建得到第二十二样本,并将第二十二样本传输至所述第一信号收发器;其中,所述第一信号收发器在接收所述第二十二样本后,对所述第二十二样本进行重建获得第二十三样本,继而将所述第二十二样本以及第二已知训练样本传输至第三接收机;
控制第三接收机对所述第二十三样本进行重建得到第二十四样本,对已知训练样本进行重建得到第二十五样本;
根据所述第二十四样本以及第二十五样本构建第十五损失函数;获取第三发射机的神经网络的第六输出张量,根据所述第六输出张量以及第六松弛张量构建第十六损失函数;其中,所述第六输出张量为所述第三发射机的神经网络根据第二已知训练样本所生成的输出张量;所述第六松弛张量为对所述第六输出张量进行松弛操作后所形成的张量;根据所述第十五损失函数以及所述第十六损失函数生成第六总损失函数,并根据所述第六总损失函数对所述第三发射机中的神经网络进行训练。
这一实施例是对第三信号收发器的第三发射机的神经网络的训练,具体的,
参见图7,当所述选定接收机所对应的信号收发器为第一信号收发器时,此时选定发射机为第二发射机。第三发射机先将第二已知训练样本M’发送至第一接收机,第一接收机接收由第三发射机发送的第二已知训练样本M’并进行重建得到第十八样本M18。紧接着第一发射机将第十八样本M18发送至第二接收机;第二接收机接收到第十八样本M18后,对第十八样本M18进行重建得到第十九样本M19。紧接着第二发射机将第十九样本M19和第二已知训练样本M’发送至第三接收机。第三接收机对第十九样本M19进行重建得到第二十样本M20,然后接收由第二发射机发送的第二已知训练样本并进行重建得到第二十一样本M21。最后由第三发射机在本地从第三接收机处获取第二十样本M20和第二十一样本M21,然后根据第二十样本M20和第二十一样本M21构建第十三损失函数(第十三损失函数的构建方式与上述第一损失函数可视具体情况而定,在此不再赘述)。后续再根据第十三损失函数以及上述第十四损失函数生成第五总损失函数,然后基于第五总损失函数对第三发射机中的神经网络进行训练(后续过程与前述训练过程类似,在此不再展开说明)。
参见图8,当所述选定接收机所对应的信号收发器为第二信号收发器时,此时选定发射机为第一发射机。第三发射机先将第二已知训练样本M’发送至第二接收机,第二接收机接收由第三发射机发送的第二已知训练样本M’并进行重建得到第二十二样本M22。紧接着第二发射机将第二十二样本M22发送至第一接收机;第一接收机接收到第二十二样本M22后,对第二十二样本M22进行重建得到第二十三样本M23。紧接着第一发射机将第二十三样本M23和第二已知训练样本M’发送至第三接收机。第三接收机对第二十三样本M23进行重建得到第二十样本M24,然后对接收到的由第一发射机发送的第二已知训练样本进行重建得到第二十五样本M25。最后由第三发射机在本地从第三接收机处获取第二十样本M24和第二十五样本M25,然后根据第二十样本M24和第二十五样本M25构建第十五损失函数(第十五损失函数的构建方式与上述第一损失函数可视具体情况而定,在此不再赘述)。后续再根据第十五损失函数以及上述第十六损失函数生成第六总损失函数,然后基于第六总损失函数对第三发射机中的神经网络进行训练(后续过程与前述训练过程类似,在此不再展开说明)。
在一个优选的实施例中,在每次三端迭代训练时,第三信号收发器对第三接收机的神经网络的训练具体包括:
当选定发射机所对应的信号收发器为第一信号收发器时,根据第二已知训练样本以及所述第二十五样本构建第十七损失函数;根据所述第十七损失函数对所述第三接收机的神经网络进行训练;
当选定发射机所对应的信号收发器为第二信号收发器时,根据第二已知训练样本以及所述第二十一样本构建第十八损失函数;根据所述第十八损失函数对所述第三接收机的神经网络进行训练。
这一实施例是对第三信号收发器中的第三接收机进行训练,具体的,当选定发射机所对应的信号收发器为第一信号收发器时,先由第一发射机将第二已知训练样本M’发送至第三接收机,第三接收机对接收的由第一发射机发送的第二已知训练样本M’进行重构得到上述第二十五样本M25,然后根据第二已知训练样本M’以及所述第二十五样本M25构建第十七损失函数;根据所述第十七损失函数对第三接收机的神经网络进行训练;
当选定发射机所对应的信号收发器为第二信号收发器时,先由第二发射机将第二已知训练样本M’发送至第三接收机,第三接收机对接收的由第二发射机发送的第二已知训练样本M’进行重构得到上述第二十一样本M21,然后根据第二已知训练样本M’以及所述第二十一样本M21构建第十八损失函数;根据所述第十八损失函数对第三接收机的神经网络进行训练。
在上述方法项实施例的基础上,本发明对应提供了系统项实施例;
本发明一实施例提供了一种智能通信系统,所述智能通信系统:第一信号收发器以及第二信号收发器;所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机;所述第一发射机、所述第一接收机、所述第二发射机以及所述第二接收机均设置有神经网络;其中,所述第一信号收发器以及所述第二信号收发器根据上述只有两个信号收发器时的智能通信系统的训练方法进行训练。
本发明另一实施例提供了另一种智能通信系统,所述智能通信系统:第一信号收发器、第二信号收发器以及第三信号收发器;所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机,所述第三信号收发器包括第三发射机以及第三接收机;所述第一发射机、所述第一接收机、所述第二发射机、所述第二接收机、所述第三发射机、所述第三接收机均设置有神经网络;其中,所述第一信号收发器、第二信号收发器以及第三信号收发器根据上述存在三个信号收发器时的智能通信系统的训练方法进行训练。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (12)
1.一种智能通信系统的训练方法,其特征在于,所述智能通信系统至少包括第一信号收发器以及第二信号收发器,所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机;所述第一发射机、所述第一接收机、所述第二发射机以及所述第二接收机均设置有神经网络;
所述智能通信系统的训练方法包括:
控制第一发射机将已知训练样本发送至第二接收机,以使所述第二接收机对已知训练样本进行重建得到第二样本;
控制所述第一接收机接收由所述第二发射机发送的第二样本以及已知训练样本,以使所述第一接收机对所述第二样本进行重建得到第三样本,并对已知训练样本进行重建得到第四样本;
根据所述第三样本以及第四样本构建第一损失函数;
根据第一发射机的神经网络的第一输出张量以及第一松弛张量构建第二损失函数;其中,所述第一输出张量为所述第一发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第一松弛张量为对所述第一输出张量进行松弛操作后所形成的张量;
根据所述第一损失函数以及所述第二损失函数生成总损失函数,并根据所述总损失函数对所述第一发射机的神经网络进行训练。
2.如权利要求1所述的智能通信系统的训练方法,其特征在于,还包括:
根据已知训练样本以及所述第四样本构建第三损失函数;
根据所述第三损失函数对所述第一接收机的神经网络进行训练。
3.如权利要求1所述的智能通信系统的训练方法,其特征在于,还包括:
控制第一发射机将第五样本以及已知训练样本发送至第二信号收发器,以使所述第二信号收发器在通过所述第二接收机接收所述第五样本和已知训练样本后,对第二发射机的神经网络进行训练;
其中,所述第五样本为所述第二发射机将已知训练样本发送至第一接收机,并由第一接收机进行重建后得到的样本;
第二信号收发器对第二发射机的神经网络进行训练具体包括:
获取由第二接收机对所述第五样本进行重建后得到的第六样本,以及由第二接收机对已知训练样本进行重建后得到的第七样本;
根据所述第六样本以及所述第七样本构建第四损失函数;
根据第二发射机的神经网络的第二输出张量以及第二松弛张量构建第五损失函数;其中,所述第二输出张量为所述第二发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第二松弛张量为对所述第二输出张量进行松弛操作后所形成的张量;
根据所述第四损失函数以及所述第五损失函数生成第二总损失函数,并根据所述第二总损失函数对所述第二发射机中的神经网络进行训练。
4.如权利要求3所述的智能通信系统的训练方法,其特征在于,所述第二信号收发器还根据已知训练样本以及所述第七样本构建第六损失函数,根据所述第六损失函数对所述第二接收机的神经网络进行训练。
5.一种智能通信系统的训练方法,其特征在于,所述智能通信系统包括第一信号收发器以及第二信号收发器,所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机;所述第一发射机、所述第一接收机、所述第二发射机以及所述第二接收机均设置有神经网络;
所述智能通信系统的训练方法包括:
第一信号收发器以及第二信号收发器对发射机和接收机进行迭代训练,直至达到第一预设次数;其中,在每次迭代训练时,先由第一信号收发器和第二信号收发器对各自的发射机的神经网络进行训练,再由第一信号收发器和第二信号收发器对各自接收机的神经网络进行训练;
在每次迭代训练时,第一信号收发器对第一发射机的神经网络的训练具体包括:控制第一发射机将已知训练样本发送至第二接收机,以使所述第二接收机对已知训练样本进行重建得到第二样本;控制所述第一接收机接收由所述第二发射机发送的第二样本以及已知训练样本,以使所述第一接收机对所述第二样本进行重建得到第三样本,并对已知训练样本进行重建得到第四样本;根据所述第三样本以及第四样本构建第一损失函数;根据第一发射机的神经网络的第一输出张量以及第一松弛张量构建第二损失函数;其中,所述第一输出张量为所述第一发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第一松弛张量为对所述第一输出张量进行松弛操作后所形成的张量;根据所述第一损失函数以及所述第二损失函数生成总损失函数,并根据所述总损失函数对所述第一发射机中的神经网络进行训练;
在每次迭代训练时,第一信号收发器对第一接收机的神经网络的训练具体包括:根据已知训练样本以及所述第四样本构建第三损失函数;根据所述第三损失函数对所述第一接收机的神经网络进行训练;
在每次迭代训练时,第二信号收发器对第二发射机的神经网络的训练具体包括:接收由第一发射机发送的第五样本和已知训练样本,并控制第二接收机对所述第五样本进行重建后所得到第六样本,控制第二接收机对已知训练样本进行重建后得到第七样本;其中,所述第五样本为所述第二发射机将已知训练样本发送至第一接收机,并由第一接收机进行重建后得到的样本;根据所述第六样本以及所述第七样本构建第四损失函数;根据第二发射机的神经网络的第二输出张量以及第二松弛张量构建第五损失函数;其中,所述第二输出张量为所述第二发射机的神经网络以已知训练样本为输入所生成的输出张量;所述第二松弛张量为对所述第二输出张量进行松弛操作后所形成的张量;根据所述第四损失函数以及所述第五损失函数生成第二总损失函数,并根据所述第二总损失函数对所述第二发射机中的神经网络进行训练;
在每次迭代训练时,第二信号收发器对第二接收机的神经网络的训练具体包括:根据已知训练样本以及第七样本构建第六损失函数,根据所述第六损失函数对所述第二接收机的神经网络进行训练。
6.如权利要求5所述的智能通信系统的训练方法,其特征在于,所述智能通信系统还包括第三信号收发器;所述第三信号收发器包括:第三发射机以及第三接收机;所述第三发射机和所述第三接收机均设置有神经网络;
所述智能通信系统的训练方法还包括:
在第一信号收发器以及第二信号收发器对各自的发射机和接收机进行迭代训练完毕后,由第一信号收发器、第二信号收发器以及第三信号收发器进行三端迭代训练,直至第二预设次数;其中,在每次三端迭代训练时,先由选定发射机所对应的信号收发器和第三信号收发器对各自的发射机的神经网络进行训练,再由选定接收机所对应的信号收发器和第三信号收发器对各自接收机的神经网络进行训练;所述选定发射机为第一发射机或第二发射机,所述选定接收机为第一接收机或第二接收机,在同一次三端迭代训练时,选定发射机所对应的信号收发器与选定接收机所对应的信号收发器为不同的信号收发器,相邻两次三端迭代训练的选定发射机不同,相邻两次三端迭代训练的选定接收机不同。
7.如权利要求6所述的智能通信系统的训练方法,其特征在于,在每次三端迭代训练时,选定发射机所对应的信号收发器对发射机的神经网络的训练具体包括:
当所述选定发射机所对应的信号收发器为第一信号收发器时,第一信号收发器控制第一发射机将第二已知训练样本发送至第三信号收发器,以使所述第三信号收发器对第二已知训练样本进行重建得到第八样本,并将第八样本以及第二已知训练样本传输至第二信号收发器;其中,所述第二信号收发器在接收所述第八样本以及第二已知训练样本后,对所述第八样本进行重建生成第九样本,对第二已知训练样本进行重建生成第十样本,继而将所述第九样本和所述第十样本传输至第一信号收发器;
第一信号收发器对所述第九样本进行重建得到第十一样本,对第十样本进行重建得到第十二样本;第一信号收发器根据所述第十一样本以及第十二样本构建第七损失函数;第一信号收发器根据第三输出张量以及第三松弛张量构建第八损失函数;其中,所述第三输出张量为所述第一发射机的神经网络以第二已知训练样本为输入所生成的输出张量;所述第三松弛张量为对所述第三输出张量进行松弛操作后所形成的张量;第一信号收发器根据所述第七损失函数以及所述第八损失函数生成第三总损失函数,并根据所述第三总损失函数对所述第一发射机中的神经网络进行训练;
当所述选定发射机所对应的信号收发器为第二信号收发器时,第二信号收发器控制第二发射机将第二已知训练样本发送至第三信号收发器,以使所述第三信号收发器对第二已知训练样本进行重建得到第十三样本,并将第十三样本以及第二已知训练样本传输至第一信号收发器;其中,所述第一信号收发器在接收所述第十三样本以及第二已知训练样本后,对所述第十三样本进行重建生成第十四样本,对第二已知训练样本进行重建生成第十五样本,继而将所述第十四样本和所述第十五样本传输至第二信号收发器;
第二信号收发器对所述第十四样本进行重建得到第十六样本,对第十五样本进行重建得到第十七样本;第二信号收发器根据所述第十六样本以及第十七样本构建第九损失函数;第二信号收发器根据第四输出张量以及第四松弛张量构建第十损失函数;其中,所述第四输出张量为所述第二发射机的神经网络以第二已知训练样本为输入所生成的输出张量;所述第四松弛张量为对所述第四输出张量进行松弛操作后所形成的张量;
第二信号收发器根据所述第九损失函数以及所述第十损失函数生成第四总损失函数,并根据所述第四总损失函数对所述第二发射机中的神经网络进行训练。
8.如权利要求7所述的智能通信系统的训练方法,其特征在于,在每次三端迭代训练时,选定接收机所对应的信号收发器对接收机的神经网络的训练具体包括:
当选定接收机所对应的信号收发器为第一信号收发器时,第一信号收发器根据第二已知训练样本以及所述第十五样本构建第十一损失函数;第一信号收发器根据所述第十一损失函数对所述第一接收机的神经网络进行训练;
当选定接收机所对应的信号收发器为第二信号收发器时,第二信号收发器根据第二已知训练样本以及所述第十样本构建第十二损失函数;第二信号收发器根据所述第十二损失函数对所述第二接收机的神经网络进行训练。
9.如权利要求8所述的智能通信系统的训练方法,其特征在于,在每次三端迭代训练时,第三信号收发器对第三发射机的神经网络的训练具体包括:
当所述选定接收机所对应的信号收发器为第一信号收发器时,控制第三发射机将第二已知训练样本发送至第一信号收发器,以使所述第一信号收发器对所述第二已知训练样本进行重建得到第十八样本,并将第十八样本传输至第二信号收发器;其中,所述第二信号收发器在接收所述第十八样本后,对所述第十八样本进行重建获得第十九样本,继而将所述第十九样本以及第二已知训练样本传输至第三信号收发器;
控制第三接收机对所述第十九样本进行重建得到第二十样本,对第二已知训练样本进行重建得到第二十一样本;根据所述第二十样本以及第二十一样本构建第十三损失函数;获取第三发射机的神经网络的第五输出张量,根据所述第五输出张量以及第五松弛张量构建第十四损失函数;其中,所述第五输出张量为所述第三发射机的神经网络根据第二已知训练样本所生成的输出张量;所述第五松弛张量为对所述第五输出张量进行松弛操作后所形成的张量;根据所述第十三损失函数以及所述第十四损失函数生成第五总损失函数,并根据所述第五总损失函数对所述第三发射机中的神经网络进行训练;
当所述选定接收机所对应的信号收发器为第二信号收发器时,控制第三发射机将第二已知训练样本发送至第二信号收发器,以使所述第二信号收发器对所述第二已知训练样本进行重建得到第二十二样本,并将第二十二样本传输至所述第一信号收发器;其中,所述第一信号收发器在接收所述第二十二样本后,对所述第二十二样本进行重建获得第二十三样本,继而将所述第二十二样本以及第二已知训练样本传输至第三接收机;
控制第三接收机对所述第二十三样本进行重建得到第二十四样本,对已知训练样本进行重建得到第二十五样本;
根据所述第二十四样本以及第二十五样本构建第十五损失函数;获取第三发射机的神经网络的第六输出张量,根据所述第六输出张量以及第六松弛张量构建第十六损失函数;其中,所述第六输出张量为所述第三发射机的神经网络根据第二已知训练样本所生成的输出张量;所述第六松弛张量为对所述第六输出张量进行松弛操作后所形成的张量;根据所述第十五损失函数以及所述第十六损失函数生成第六总损失函数,并根据所述第六总损失函数对所述第三发射机中的神经网络进行训练。
10.如权利要求9所述的智能通信系统的训练方法,其特征在于,在每次三端迭代训练时,第三信号收发器对第三接收机的神经网络的训练具体包括:
当选定发射机所对应的信号收发器为第一信号收发器时,根据第二已知训练样本以及所述第二十五样本构建第十七损失函数;根据所述第十七损失函数对所述第三接收机的神经网络进行训练;
当选定发射机所对应的信号收发器为第二信号收发器时,根据第二已知训练样本以及所述第二十一样本构建第十八损失函数;根据所述第十八损失函数对所述第三接收机的神经网络进行训练。
11.一种智能通信系统,其特征在于,包括:第一信号收发器以及第二信号收发器;所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机;所述第一发射机、所述第一接收机、所述第二发射机以及所述第二接收机均设置有神经网络;其中,所述第一信号收发器以及所述第二信号收发器均根据权利要求5所述的智能通信系统的训练方法进行训练。
12.一种智能通信系统,其特征在于,包括第一信号收发器、第二信号收发器以及第三信号收发器;所述第一信号收发器包括第一发射机以及第一接收机,所述第二信号收发器包括第二发射机以及第二接收机,所述第三信号收发器包括第三发射机以及第三接收机;所述第一发射机、所述第一接收机、所述第二发射机、所述第二接收机、所述第三发射机、所述第三接收机均设置有神经网络;其中,所述第一信号收发器、第二信号收发器以及第三信号收发器均根据权要求6所述的智能通信系统的训练方法进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210198976.9A CN114726394B (zh) | 2022-03-01 | 2022-03-01 | 一种智能通信系统的训练方法及智能通信系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210198976.9A CN114726394B (zh) | 2022-03-01 | 2022-03-01 | 一种智能通信系统的训练方法及智能通信系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114726394A CN114726394A (zh) | 2022-07-08 |
CN114726394B true CN114726394B (zh) | 2022-09-02 |
Family
ID=82235143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210198976.9A Active CN114726394B (zh) | 2022-03-01 | 2022-03-01 | 一种智能通信系统的训练方法及智能通信系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114726394B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019080988A1 (en) * | 2017-10-23 | 2019-05-02 | Nokia Technologies Oy | END-TO-END LEARNING IN COMMUNICATION SYSTEMS |
CN109902798A (zh) * | 2018-05-31 | 2019-06-18 | 华为技术有限公司 | 深度神经网络的训练方法和装置 |
CN110460402A (zh) * | 2019-07-15 | 2019-11-15 | 哈尔滨工程大学 | 一种基于深度学习的端到端通信系统建立方法 |
CN110753937A (zh) * | 2017-06-19 | 2020-02-04 | 诺基亚技术有限公司 | 数据传输网络配置 |
CN113850880A (zh) * | 2020-06-26 | 2021-12-28 | 通用电气精准医疗有限责任公司 | 使用深度学习网络学习损失函数 |
WO2022002347A1 (en) * | 2020-06-29 | 2022-01-06 | Nokia Technologies Oy | Training in communication systems |
-
2022
- 2022-03-01 CN CN202210198976.9A patent/CN114726394B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110753937A (zh) * | 2017-06-19 | 2020-02-04 | 诺基亚技术有限公司 | 数据传输网络配置 |
WO2019080988A1 (en) * | 2017-10-23 | 2019-05-02 | Nokia Technologies Oy | END-TO-END LEARNING IN COMMUNICATION SYSTEMS |
CN109902798A (zh) * | 2018-05-31 | 2019-06-18 | 华为技术有限公司 | 深度神经网络的训练方法和装置 |
CN110460402A (zh) * | 2019-07-15 | 2019-11-15 | 哈尔滨工程大学 | 一种基于深度学习的端到端通信系统建立方法 |
CN113850880A (zh) * | 2020-06-26 | 2021-12-28 | 通用电气精准医疗有限责任公司 | 使用深度学习网络学习损失函数 |
WO2022002347A1 (en) * | 2020-06-29 | 2022-01-06 | Nokia Technologies Oy | Training in communication systems |
Also Published As
Publication number | Publication date |
---|---|
CN114726394A (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110460402B (zh) | 一种基于深度学习的端到端通信系统建立方法 | |
CN110474716B (zh) | 基于降噪自编码器的scma编解码器模型的建立方法 | |
CN100553166C (zh) | 基于粒子滤波的信道估计方法 | |
CN109728824B (zh) | 一种基于深度学习的ldpc码迭代译码方法 | |
DE69834320T2 (de) | Verfahren und Vorrichtung zur Folgeschätzung | |
CN113972939B (zh) | 基于双时间尺度和深度学习的天线系统预编码方法和装置 | |
CN113381828B (zh) | 基于条件生成对抗网络的稀疏码多址接入随机信道建模方法 | |
CN111901024A (zh) | 基于抗拟合深度学习的mimo信道状态信息反馈方法 | |
CN114726394B (zh) | 一种智能通信系统的训练方法及智能通信系统 | |
CN107437976B (zh) | 一种数据处理方法及设备 | |
CN110278570B (zh) | 一种基于人工智能的无线通信系统 | |
CN113114603B (zh) | 一种mimo-ofdm系统的信息恢复方法及装置 | |
CN104135347B (zh) | 认知网络中基于联合格成型技术的脏纸编码和译码方法 | |
CN116405158A (zh) | 一种非高斯噪声下基于深度学习的端到端通信系统 | |
CN110609739B (zh) | 一种基于多目标进化算法的列车周期信息调度方法及系统 | |
CN110166386B (zh) | 一种基于递归混沌码的水声通信均衡译码方法 | |
CN110474798A (zh) | 一种利用回声状态网络预测无线通信未来信号的方法 | |
CN114745234B (zh) | 一种深度学习mimo系统信号检测方法及系统 | |
CN100578999C (zh) | 一种多用户信号的复用方法 | |
Hu et al. | Achieving ultra high freshness in real-time monitoring and decision making with incremental decoding | |
CN114499755A (zh) | 基于互信息量估计的几何与概率联合星座整形方法及系统 | |
Liu et al. | New converses for the relay channel via reverse hypercontractivity | |
CN114710235B (zh) | 一种通信质量增强系统及通信系统 | |
CN113489545A (zh) | 基于k均值聚类的光空间脉冲位置调制分步分类检测方法 | |
CN116527206B (zh) | 改进knn方法的数字信号处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |