CN114666188A - 信息生成方法及相关装置 - Google Patents
信息生成方法及相关装置 Download PDFInfo
- Publication number
- CN114666188A CN114666188A CN202011556035.5A CN202011556035A CN114666188A CN 114666188 A CN114666188 A CN 114666188A CN 202011556035 A CN202011556035 A CN 202011556035A CN 114666188 A CN114666188 A CN 114666188A
- Authority
- CN
- China
- Prior art keywords
- information
- generator
- type
- message
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 187
- 238000012549 training Methods 0.000 claims abstract description 542
- 238000013528 artificial neural network Methods 0.000 claims abstract description 467
- 230000006854 communication Effects 0.000 claims abstract description 191
- 238000004891 communication Methods 0.000 claims abstract description 189
- 230000004044 response Effects 0.000 claims description 74
- 230000015654 memory Effects 0.000 claims description 57
- 238000005259 measurement Methods 0.000 claims description 25
- 230000006399 behavior Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 20
- 230000007613 environmental effect Effects 0.000 claims description 17
- 230000008093 supporting effect Effects 0.000 claims description 15
- 230000008447 perception Effects 0.000 claims description 12
- 238000001514 detection method Methods 0.000 abstract description 16
- 230000006870 function Effects 0.000 description 169
- 230000008569 process Effects 0.000 description 36
- 238000013461 design Methods 0.000 description 35
- 238000010586 diagram Methods 0.000 description 32
- 238000009826 distribution Methods 0.000 description 30
- 210000002569 neuron Anatomy 0.000 description 30
- 238000004422 calculation algorithm Methods 0.000 description 28
- 238000001228 spectrum Methods 0.000 description 22
- 230000005540 biological transmission Effects 0.000 description 19
- 238000013507 mapping Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 230000011664 signaling Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 230000001133 acceleration Effects 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000004088 simulation Methods 0.000 description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 101150096078 outD gene Proteins 0.000 description 4
- 206010063385 Intellectualisation Diseases 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000004931 aggregating effect Effects 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L25/00—Baseband systems
- H04L25/02—Details ; arrangements for supplying electrical power along data transmission lines
- H04L25/0202—Channel estimation
- H04L25/024—Channel estimation channel estimation algorithms
- H04L25/0254—Channel estimation channel estimation algorithms using neural network algorithms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Power Engineering (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请实施例公开了一种信息生成方法及相关装置,该方法包括:第二设备接收第一消息和第三消息,并向第一设备发送第二消息;第一消息指示第一生成器的全部或部分,第三消息指示第三生成器的全部或部分,第一生成器所支持的输入包括第一类型的第一信息,第三生成器所支持的输入包括第一类型的第四信息,第一生成器和第三生成器用于第二生成器所对应的神经网络的训练;第二消息指示第二生成器的全部或部分,第二生成器所支持的输入包括第一信息和第四信息。采用本申请实施例,可以利用真实场景中采集的信息训练生成模型,实现通信辅助探测、探测辅助通信,使通信网络向着更智能化、更自适应的方向发展。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种信息生成方法及相关装置。
背景技术
无线通信技术中,无线信号在空间中的传输受到了无线传输环境的影响,因此在接收端需要做信道响应的测量(或估计),并以此来恢复出发送的无线信号。目前,通信设备在何时何地得到了怎样的信道估计,未被充分利用,即使两次面对同样的场景(指同一地点同一环境),通信设备在第二次通信时也没有根据前一次得到的信息进行改进。
由于未来无线通信场景越来越丰富,如自动驾驶、无人机、无线电感知、增强现实等等,都会利用无线通信技术。所以随着可以收集的无线信息越来越多,如何利用这些信息,从而实现通信辅助探测、探测辅助通信,使通信网络向着更智能化、更自适应的方向发展,成为了亟待解决的问题。
发明内容
本申请实施例提供一种信息生成方法及相关装置,可以充分利用真实场景中采集的信息训练生成模型,以使这个生成模型可以用一部分信息生成(或推理、或预测)出另一部分信息,从而实现通信辅助探测、探测辅助通信,使通信网络向着更智能化、更自适应的方向发展。
下面从不同的方面介绍本申请,应理解的是,下面的不同方面的实施方式和有益效果可以互相参考。
第一方面,本申请提供一种信息生成方法,该方法包括:第一设备向第二设备发送第一消息,并接收来自第二设备的第二消息。其中,第一消息指示第一生成器的全部或部分。该第一生成器所支持的输入包括第一类型的第一信息。该第一生成器用于第二生成器所对应的神经网络的训练。第二消息指示第二生成器的全部或部分以及第二生成器所支持的输入。该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,该第四信息与该第一信息不同且第一生成器和第二生成器不同。
可见,本方案通过充分利用通信设备采集的信息,把这些信息用来训练生成模型,以使这个生成模型可以用一部分信息生成(或推理、预测)出另一部分信息,从而实现通信辅助探测、探测辅助通信,使通信网络向着更智能化、更自适应的方向发展。
结合第一方面,在一种可能的设计中,第一设备在接收到第二消息之后,该方法还包括:第一设备基于该第二生成器所支持的输入将第一类型的第四信息输入该第二生成器生成第二类型的第五信息。
可见,本方案通过利用第二设备训练得到的全场景生成模块(即第二生成器),可以生成第一设备未训练过的场景下的信息。
结合第一方面,在一种可能的设计中,第一设备发送第一消息之前,该方法还包括:第一设备获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、和该第一信息对应的第三信息组成一个第一训练样本;第一设备利用多个第一训练样本训练第一神经网络,得到第一生成器,该第一生成器为训练完成的第一神经网络。其中,第一信息和第三信息均为真实环境下采集的不同种类的信息。
可选的,训练过程中,第一训练样本中的第一信息和从隐空间中随机选择的数据作为第一神经网络的输入;第一神经网络的输出和第一训练样本中的第三信息作为第一损失函数的输入;利用第一损失函数的输出计算第一神经网络的梯度,利用梯度下降算法训练第一神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。
可选的,每个第一训练样本中还包括一个从隐空间中随机选择的信息。隐空间是指随机噪声。
结合第一方面,在一种可能的设计中,第一设备发送第一消息之前,该方法还包括:第一设备获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、和该第一信息对应的第三信息组成一个第一训练样本;第一设备利用多个第一训练样本训练第一神经网络和第二神经网络,分别得到第一生成器和第一判别器,该第一生成器为训练完成的第一神经网络,该第一判别器为训练完成的第二神经网络。其中,该第一神经网络为生成对抗网络中的生成器,该第二神经网络为所述生成对抗网络中的判别器。
可选的,训练过程中,第一训练样本中的第一信息和从隐空间中随机选择的数据作为第一神经网络的输入;第一神经网络的输出和第一信息输入第二神经网络,得到第一输出;该第一信息和该第一信息对应的第三信息输入第二神经网络,得到第二输出;第一输出和第一标签输入第二损失函数,得到第二损失函数输出;第二输出和第二标签输入第三损失函数,得到第三损失函数输出;第一输出和第三标签输入第四损失函数,得到第四损失函数输出;利用第二损失函数输出和第三损失函数输出计算第二神经网络的梯度,利用梯度下降算法训练第二神经网络;利用第四损失函数输出计算第一神经网络的梯度,利用梯度下降算法训练第一神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。
可选的,每个第一训练样本中还包括一个从隐空间中随机选择的信息。隐空间是指随机噪声。
可见,本方案利用采集到的真实信息来训练生成模型,以使这个生成模型可以用一部分信息生成(或推理、预测)出另一部分信息。
结合第一方面,在一种可能的设计中,第一设备发送第一消息之后,该方法还包括:第一设备接收来自第二设备的第一更新指示,该第一更新指示用于指示第一设备重新训练该第一生成器;第一设备在当前场景,当前用户画像或当前无线信道特征下重新获取第一类型的多个第七信息、每个第七信息对应的第二类型的第八信息、以及隐空间;第一设备利用多个第七信息、每个第七信息对应的第八信息、以及隐空间重新训练该第一生成器;第一设备发送重新训练完成的第一生成器。
可见,本方案在收到更新指示时,重新采集信息训练第一生成器,以使重新训练得到的第一生成器适用于当前场景,当前用户画像或当前无线信道特征。
第二方面,本申请提供一种信息生成方法,该方法包括:第三设备向第二设备发送第三消息,并接收来自第二设备的第四消息。其中,该第三消息指示第三生成器的全部或部分,该第三生成器所支持的输入包括第一类型的第四信息。该第三生成器用于第二生成器所对应的神经网络的训练。第四消息指示第二生成器的全部或部分。该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,该第四信息与该第一信息不同且第三生成器和第二生成器不同。
结合第二方面,在一种可能的设计中,第三设备在接收到第四消息之后,该方法还包括:第三设备基于该第二生成器所支持的输入将第一类型的第一信息输入该第二生成器生成第二类型的第二信息。
结合第二方面,在一种可能的设计中,第三设备发送第三消息之前,该方法还包括:第三设备获取第一类型的多个第四信息、和每个第四信息对应的第二类型的第六信息,其中一个第四信息、和该第四信息对应的第六信息组成一个第二训练样本;第三设备利用多个第二训练样本训练第五神经网络,得到第三生成器,该第三生成器为训练完成的第五神经网络。其中,第四信息和第六信息均为真实环境下采集的不同种类的信息。
可选的,训练过程中,第二训练样本中的第四信息和从隐空间中随机选择的数据作为第五神经网络的输入;第五神经网络的输出和第二训练样本中的第六信息作为损失函数的输入;利用损失函数的输出计算第五神经网络的梯度,利用梯度下降算法训练第五神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。
可选的,每个第二训练样本中还包括一个从隐空间中随机选择的信息。隐空间是指随机噪声。
结合第二方面,在一种可能的设计中,第三设备发送第三消息之前,该方法还包括:第三设备获取第一类型的多个第四信息、和每个第四信息对应的第二类型的第六信息,其中一个第四信息、和该第四信息对应的第六信息组成一个第二训练样本;第三设备利用多个第二训练样本训练第五神经网络和第六神经网络,分别得到第三生成器和第三判别器,该第三生成器为训练完成的第五神经网络,该第三判别器为训练完成的第六神经网络。其中,该第五神经网络为生成对抗网络中的生成器,该第六神经网络为所述生成对抗网络中的判别器。
可选的,训练过程中,第二训练样本中的第四信息和从隐空间中随机选择的数据作为第五神经网络的输入;第五神经网络的输出和第四信息输入第六神经网络,得到第五输出;该第四信息和该第四信息对应的第六信息输入第六神经网络,得到第六输出;第五输出和第一标签输入损失函数A,得到损失函数A输出;第六输出和第二标签输入损失函数B,得到第损失函数B输出;第五输出和第三标签输入损失函数C,得到损失函数C输出;利用损失函数A输出和损失函数B输出计算第六神经网络的梯度,利用梯度下降算法训练第六神经网络;利用损失函数C输出计算第五神经网络的梯度,利用梯度下降算法训练第五神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。
可选的,每个第二训练样本中还包括一个从隐空间中随机选择的信息。隐空间是指随机噪声。
结合第二方面,在一种可能的设计中,第三设备发送第三消息之后,该方法还包括:第三设备接收来自第二设备的第二更新指示,该第二更新指示用于指示第三设备重新训练该第三生成器;第三设备在当前场景,当前用户画像或当前无线信道特征下重新获取第一类型的多个第九信息、每个第九信息对应的第二类型的第十信息、以及隐空间;第一设备利用多个第九信息、每个第九信息对应的第十信息、以及隐空间重新训练该第三生成器;第一设备发送重新训练完成的第三生成器。
第三方面,本申请提供一种信息生成方法,该方法包括:第二设备接收第一消息和第三消息,并向第一设备发送第二消息,向第三设备发送第四消息。其中,第一消息指示第一生成器的全部或部分。第三消息指示第三生成器的全部或部分。第一生成器所支持的输入包括第一类型的第一信息,第三生成器所支持的输入包括第一类型的第四信息。第一生成器和第三生成器用于第二生成器所对应的神经网络的训练。第二消息或第四消息指示第二生成器的全部或部分。第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息。第四信息与第一信息不同,且第一生成器、第三生成器以及第二生成器各不相同。
本方案通过充分利用通信设备(即第一设备或第三设备)采集的信息,把这些信息用来训练生成模型,以使这个生成模型可以用一部分信息生成(或推理、预测)出另一部分信息,从而实现通信辅助探测、探测辅助通信,使通信网络向着更智能化、更自适应的方向发展。另外,本方案还通过汇总多个通信设备(即前述第一设备和第三设备)的生成模型,把它们训练成一个多场景的生成模型(即第二生成器),通过不断地汇总训练,在通信网络中,这个生成模型逐渐自动演进为全场景生成模型。不仅可以解决单个通信设备采集的信息太过单一的问题,还可以快速提升生成模型的泛化能力。
结合第三方面,在一种可能的设计中,第二设备发送第二消息之前,该方法还包括:第二设备获取第一类型的多个第一信息和第一类型的多个第四信息;一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集;第二设备利用该训练样本集中的多个训练样本训练第三神经网络,得到第二生成器,该第二生成器为训练完成的第三神经网络。第二生成器分别用于支持根据第一信息生成第二类型的第二信息,根据第四信息生成第二类型的第五信息。
可选的,每个第三训练样本还包括一个从隐空间中随机选择的信息。每个第四训练样本还包括一个从隐空间中随机选择的信息。
结合第三方面,在一种可能的设计中,第二设备发送第二消息之前,该方法还包括:第二设备获取第一类型的多个第一信息和第一类型的多个第四信息;一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集;第二设备利用该训练样本集中的多个训练样本训练第三神经网络和第四神经网络,分别得到第二生成器和第二判别器,该第二生成器为训练完成的第三神经网络,该第二判别器为训练完成的第四神经网络。其中,第三神经网络为生成对抗网络中的生成器,第四神经网络为该生成对抗网络中的判别器。
可选的,每个第三训练样本还包括一个从隐空间中随机选择的信息。每个第四训练样本还包括一个从隐空间中随机选择的信息。
可见,本方案利用第一设备采集的信息和第三设备采集的信息来训练第三神经网络,以使训练完成的第三神经网络逐渐自动演进为全场景生成模型。
结合第三方面,在一种可能的设计中,第二设备接收到第一消息之后,该方法还包括:第二设备向第一设备发送第一更新指示,该第一更新指示用于指示第一设备重新训练该第一生成器;第二设备接收第一设备发送的重新训练完成的第一生成器。
结合第三方面,在一种可能的设计中,第二设备接收到第三消息之后,该方法还包括:第二设备向第三设备发送第二更新指示,该第二更新指示用于指示第三设备重新训练该第三生成器;第二设备接收第三设备发送的重新训练完成的第三生成器。
可见,本方案在第二设备发现第一设备或第三设备需要重新训练生成器的情况下,通过指示信息指示第一设备或第三设备重新训练,以使重新训练得到的生成器适用于各自设备当前所处场景。
第四方面,本申请提供一种信息生成装置,该信息生成装置可以是第一设备或第一设备中的芯片。该信息生成装置包括:收发模块,用于向第二设备发送第一消息,该第一消息指示第一生成器的全部或部分,该第一生成器所支持的输入包括第一类型的第一信息,该第一生成器用于第二生成器所对应的神经网络的训练;该收发模块,还用于从该第二设备接收第二消息,该第二消息指示第二生成器的全部或部分,该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,该第四信息与该第一信息不同且第一生成器和第二生成器不同。
结合第四方面,在一种可能的设计中,该信息生成装置还包括生成模块,用于基于该第二生成器所支持的输入将第一类型的第四信息输入该第二生成器生成第二类型的第五信息。
结合第四方面,在一种可能的设计中,该信息生成装置还包括获取模块和训练模块。该获取模块,用于获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、和该第一信息对应的第三信息组成一个第一训练样本;该训练模块,用于利用多个第一训练样本训练第一神经网络,得到第一生成器,该第一生成器为训练完成的第一神经网络。
可选的,训练过程中,第一训练样本中的第一信息和从隐空间中随机选择的数据作为第一神经网络的输入;第一神经网络的输出和第一训练样本中的第三信息作为第一损失函数的输入;利用第一损失函数的输出计算第一神经网络的梯度,利用梯度下降算法训练第一神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。
可选的,每个第一训练样本中还包括一个从隐空间中随机选择的信息。隐空间是指随机噪声。
结合第四方面,在一种可能的设计中,该信息生成装置还包括获取模块和训练模块。该获取模块,用于获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、和该第一信息对应的第三信息组成一个第一训练样本;该训练模块,用于利用多个第一训练样本训练第一神经网络和第二神经网络,分别得到第一生成器和第一判别器,该第一生成器为训练完成的第一神经网络,该第一判别器为训练完成的第二神经网络。其中,第一神经网络为生成对抗网络中的生成器,第二神经网络为该生成对抗网络中的判别器。
可选的,训练过程中,第一训练样本中的第一信息和从隐空间中随机选择的数据作为第一神经网络的输入;第一神经网络的输出和第一信息输入第二神经网络,得到第一输出;该第一信息和该第一信息对应的第三信息输入第二神经网络,得到第二输出;第一输出和第一标签输入第二损失函数,得到第二损失函数输出;第二输出和第二标签输入第三损失函数,得到第三损失函数输出;第一输出和第三标签输入第四损失函数,得到第四损失函数输出;利用第二损失函数输出和第三损失函数输出计算第二神经网络的梯度,利用梯度下降算法训练第二神经网络;利用第四损失函数输出计算第一神经网络的梯度,利用梯度下降算法训练第一神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。
可选的,每个第一训练样本中还包括一个从隐空间中随机选择的信息。隐空间是指随机噪声。
结合第四方面,在一种可能的设计中,上述收发模块,还用于接收第一更新指示,该第一更新指示用于指示该信息生成装置重新训练该第一生成器;上述获取模块,还用于重新获取该第一类型的多个第七信息、每个第七信息对应的该第二类型的第八信息、以及隐空间;上述训练模块,还用于利用该多个第七信息、每个第七信息对应的第八信息、以及隐空间重新训练该第一生成器;该收发模块,还用于发送重新训练完成的第一生成器。
第五方面,本申请提供一种信息生成装置,该信息生成装置可以是第三设备或第三设备中的芯片。该信息生成装置包括:收发模块,用于向第二设备发送第三消息,该第三消息指示第三生成器的全部或部分,该第三生成器所支持的输入包括第一类型的第四信息,该第三生成器用于第二生成器所对应的神经网络的训练;该收发模块,还用于从该第二设备接收第四消息,该第四消息指示第二生成器的全部或部分,该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,该第四信息与该第一信息不同且第三生成器和第二生成器不同。
结合第五方面,在一种可能的设计中,该信息生成装置还包括生成模块,用于基于该第二生成器所支持的输入将第一类型的第一信息输入该第二生成器生成第二类型的第二信息。
结合第五方面,在一种可能的设计中,该信息生成装置还包括获取模块和训练模块。该获取模块,用于获取第一类型的多个第四信息、和每个第四信息对应的第二类型的第六信息,其中一个第四信息、和该第四信息对应的第六信息组成一个第二训练样本;该训练模块,用于利用多个第二训练样本训练第五神经网络,得到第三生成器,该第三生成器为训练完成的第五神经网络。
可选的,训练过程中,第二训练样本中的第四信息和从隐空间中随机选择的数据作为第五神经网络的输入;第五神经网络的输出和第二训练样本中的第六信息作为损失函数的输入;利用损失函数的输出计算第五神经网络的梯度,利用梯度下降算法训练第五神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。
可选的,每个第二训练样本中还包括一个从隐空间中随机选择的信息。隐空间是指随机噪声。
结合第五方面,在一种可能的设计中,该信息生成装置还包括获取模块和训练模块。该获取模块,用于获取第一类型的多个第四信息、和每个第四信息对应的第二类型的第六信息,其中一个第四信息、和该第四信息对应的第六信息组成一个第二训练样本;该训练模块,用于利用多个第二训练样本训练第五神经网络和第六神经网络,分别得到第三生成器和第三判别器,该第三生成器为训练完成的第五神经网络,该第三判别器为训练完成的第六神经网络。其中,第五神经网络为生成对抗网络中的生成器,第六神经网络为该生成对抗网络中的判别器。
可选的,训练过程中,第二训练样本中的第四信息和从隐空间中随机选择的数据作为第五神经网络的输入;第五神经网络的输出和第四信息输入第六神经网络,得到第五输出;该第四信息和该第四信息对应的第六信息输入第六神经网络,得到第六输出;第五输出和第一标签输入损失函数A,得到损失函数A输出;第六输出和第二标签输入损失函数B,得到第损失函数B输出;第五输出和第三标签输入损失函数C,得到损失函数C输出;利用损失函数A输出和损失函数B输出计算第六神经网络的梯度,利用梯度下降算法训练第六神经网络;利用损失函数C输出计算第五神经网络的梯度,利用梯度下降算法训练第五神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。
可选的,每个第二训练样本中还包括一个从隐空间中随机选择的信息。隐空间是指随机噪声。
结合第五方面,在一种可能的设计中,上述收发模块,还用于接收第二更新指示,该第二更新指示用于指示该信息生成装置重新训练该第三生成器;上述获取模块,还用于重新获取该第一类型的多个第九信息、每个第九信息对应的该第二类型的第十信息、以及隐空间;上述训练模块,还用于利用该多个第九信息、每个第九信息对应的第十信息、以及隐空间重新训练该第三生成器;该收发模块,还用于发送重新训练完成的第三生成器。
第六方面,本申请提供一种信息生成装置,该信息生成装置可以是第二设备或第二设备中的芯片。该信息生成装置包括:收发模块,用于接收第一消息和第三消息,第一消息指示第一生成器的全部或部分,第三消息指示第三生成器的全部或部分,该第一生成器所支持的输入包括第一类型的第一信息,该第三生成器所支持的输入包括第一类型的第四信息,该第一生成器和该第三生成器用于第二生成器所对应的神经网络的训练;该收发模块,还用于向第一设备发送第二消息,该第二消息指示第二生成器的全部或部分,该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,该第四信息与该第一信息不同,且第一生成器、第三生成器以及第二生成器各不相同。
结合第六方面,在一种可能的设计中,该信息生成装置还包括获取模块和训练模块。该获取模块,用于获取该第一类型的多个第一信息和该第一类型的多个第四信息;该训练模块,用于利用该训练样本集中的多个训练样本训练第三神经网络,得到第二生成器,该第二生成器为训练完成的第三神经网络。其中,一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集。该第二生成器分别用于支持根据该第一信息生成第二类型的第二信息,根据该第四信息生成第二类型的第五信息。
可选的,每个第三训练样本还包括一个从隐空间中随机选择的信息。每个第四训练样本还包括一个从隐空间中随机选择的信息。
结合第六方面,在一种可能的设计中,该信息生成装置还包括获取模块和训练模块。该获取模块,用于获取该第一类型的多个第一信息和该第一类型的多个第四信息;该训练模块,用于利用该训练样本集中的多个训练样本训练第三神经网络和第四神经网络,分别得到第二生成器和第二判别器,该第二生成器为训练完成的第三神经网络,该第二判别器为训练完成的第四神经网络。其中,一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集。第三神经网络为生成对抗网络中的生成器,第四神经网络为生成对抗网络中的判别器。该第二生成器分别用于支持根据该第一信息生成第二类型的第二信息,根据该第四信息生成第二类型的第五信息。
可选的,每个第三训练样本还包括一个从隐空间中随机选择的信息。每个第四训练样本还包括一个从隐空间中随机选择的信息。
结合第六方面,在一种可能的设计中,上述收发模块,还用于向该第一设备发送第一更新指示,该第一更新指示用于指示该第一设备重新训练该第一生成器;上述收发模块,还用于接收该第一设备发送的重新训练完成的第一生成器。
结合第六方面,在一种可能的设计中,上述收发模块,还用于向该第三设备发送第二更新指示,该第二更新指示用于指示该第三设备重新训练该第三生成器;上述收发模块,还用于接收该第三设备发送的重新训练完成的第三生成器。
上述任一方面的一种实现方式中,第一生成器所支持的输入为第一类型的信息,输出为第二类型的信息。第二生成器所支持的输入为第一类型的信息,输出为第二类型的信息。第三生成器所支持的输入为第一类型的信息,输出为第二类型的信息。其中,第一类型为场景类,第二类型为无线信道特征类;或者,第一类型为用户画像和场景类,第二类型为无线信道特征类;或者,第一类型为无线信道特征类,第二类型为用户画像类;或者,第一类型为无线信道特征和场景类,第二类型为用户画像类;或者,第一类型为无线信道特征类,第二类型为场景类;或者,第一类型为无线信道特征和用户画像类,第二类型为场景类。
可选的,无线信道特征类包括以下一种或多种子类型:信道冲击响应信息子类型、信道状态信息子类型。
信道冲击响应信息是对无线信道直接测量得到的信息,包括以下一种或多种信息:信道矩阵、信道冲击响应、信道频率响应、信道的多径时延扩展、信道的多径组成、信道的幅度、信道的相位、信道冲击响应的实部、信道冲击响应的虚部、信道功率时延谱、信道角度功率谱等。
信道状态信息是对无线信道状态的指示,包括以下一种或多种信息:信道状态信息(channel state information,CSI)、测量报告(Measurement reports,MR)、信道功率、干扰功率、噪声功率、信干噪比、信道质量指示(channel quality indicator,CQI)、参考信号接收功率(reference signal received power,RSRP)、参考信号接收质量(referencesignal received quality,RSRQ)等。
可选的,场景类的信息是指与无线通信场景相关的信息。无线通信场景是指对当前无线通信环境和环境中物体的描述。场景类包括以下一种或多种类型:环境描述信息子类型、环境感知信息子类型。
环境描述信息是对无线传输环境的描述,包括以下一种或多种信息:二维地图、三维地图、经纬度坐标、点云数据、环境布局图、环境中物体的尺寸、环境中物体的相对位置、环境中物体的材质、环境中接入网设备的位置、交通流量信息等。
环境感知信息是从传感器获得的环境信息,包括以下一种或多种信息:光传感器获得的拍摄图像、深度相机获得的深度信息、距离传感器获得的距离信息、加速度传感器获得的加速度信息、其它传感器获得的数据。传感器包括光传感器、感应式(Inductive)传感器、电容式(Capacitive)传感器、磁力传感器、温度传感器、加速度传感器、压力传感器等。
可选的,用户画像类信息是指与用户行为画像相关的信息。用户行为画像是指对用户设备(这里是第一设备或第三设备)在客观通信条件下的参数选择和行为规律的总结。用户画像类包括以下一种或多种子类型:用户参数子类型、用户行为信息子类型。
用户设备参数是指用户设备的通信参数,包括以下一种或多种信息:用户设备的硬件和软件参数,如设备天线参数、设备物理层参数,设备的型号、平均发射功率、设备的电量、国际移动用户识别码、设备识别码等。
用户行为信息是对用户在通信过程中行为的描述,包括以下一种或多种信息:用户设备的地理位置、历史位置分布、移动速度、移动路径,用户设备的业务特征,如服务类型、用户体验、平均延时、平均丢包率、收发数据量、历史接入小区等。
上述任一方面的一种实现方式中,第一信息为第一设备所处环境的环境图像和第一设备的地理位置信息,第三信息为第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,第二信息为该第一信息输入第一生成器生成的信道冲击响应。同理,第四信息为第三设备所处环境的环境图像和第三设备的地理位置信息,第六信息为第三设备在所处环境和地理位置情况下测量信道的信道冲击响应,第五信息为该第四信息输入第三生成器生成的信道冲击响应。
可见,本方案的第一生成器和第三生成器学习到的是环境图像和地理位置信息、与信道之间的关系,可用于通信系统评估信道状态。
上述任一方面的一种实现方式中,第一信息为第一设备所处环境的环境图像和第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,第三信息为第一设备的地理位置信息,第二信息为该第一信息输入第一生成器生成的第一设备的地理位置信息。同理,第四信息为第三设备所处环境的环境图像和第三设备的地理位置信息,第六信息为第三设备在所处环境和地理位置情况下测量信道的信道冲击响应,第五信息为该第四信息输入第三生成器生成的第三设备的地理位置信息。
可见,本方案的第一生成器和第三生成器学习到的是环境图像和信道冲击响应、与地理位置信息之间的关系,可用于设备的定位。
上述任一方面的一种实现方式中,第一消息还指示第一生成器所支持的输入。可选的,第一消息指示第一生成器所支持的输入包括:第一消息包括第一信息、第一信息的标识、第一类型、第一类型的标识中的一个或多个。
可见,本方案通过第一消息指示第一生成器所支持的输入,可以充分告知第二设备、第一生成器的使用方式,另外通过在第一消息中携带第一信息的标识、第一类型、第一类型的标识,可以减少空口资源的开销。
上述任一方面的一种实现方式中,第三消息该指示第三生成器所支持的输入。可选的,第三消息指示第三生成器所支持的输入包括:第三消息包括第四信息、第四信息的标识、第一类型、第一类型的标识中的一个或多个。
可见,本方案通过第三消息指示第三生成器所支持的输入,可以充分告知第二设备、第三生成器的使用方式,另外通过在第三消息中携带第四信息的标识、第一类型、第一类型的标识,可以减少空口资源的开销。
上述任一方面的一种实现方式中,第二消息还指示第二生成器所支持的输入。可选的,第二消息指示第二生成器所支持的输入包括:第二消息包括第四信息、第四信息的标识、第一类型、第一类型的标识中的一个或多个。本方案通过第二消息指示第一设备未训练场景下的信息(即第四信息),以使第一设备可以使用这个第二生成器来生成未训练场景下的信息,从而辅助第一设备在此场景下的通信。
上述任一方面的一种实现方式中,第四消息还指示第二生成器所支持的输入。可选的,第四消息指示第二生成器所支持的输入包括:第四消息包括第一信息、第一信息的标识、第一类型、第一类型的标识中的一个或多个。本方案通过第四消息指示第三设备未训练场景下的信息(即第一信息),以使第三设备可以使用这个第二生成器来生成未训练场景下的信息,从而辅助第三设备在此场景下的通信。
上述任一方面的一种实现方式中,第一消息中还包括第一生成器的标识,第一生成器的标识与第一生成器所支持的输入对应。第三消息中还包括第三生成器的标识,第三生成器的标识与第三生成器所支持的输入对应。
可见,本方案通过将生成器ID与生成器所支持的输入一一对应,来隐含指示生成器所支持的输入,以使第二设备根据该生成器ID获取对应的生成器所支持的输入,避免了生成器所支持的输入的单独上传和下发,可以节省信令开销和空口资源。
上述任一方面的一种实现方式中,第一消息指示第一生成器的全部包括第一生成器的结构和参数,该参数包括权值和偏置值。第三消息指示第三生成器的全部包括第三生成器的结构和参数,该参数包括权值和偏置值。
上述任一方面的一种实现方式中,第一消息指示第一生成器的部分包括第一生成器的结构和部分层的参数,该参数包括权值和偏置值。第三消息指示第三生成器的包括第三生成器的结构和部分层的参数,该参数包括权值和偏置值。
可见,本方案在传输生成器时,通过传输生成器的全部参数(结构、权值和偏置值)或部分参数(结构、部分层的权值和偏置值)来实现。
第七方面,本申请提供一种神经网络的训练方法,该方法包括:第一设备获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、该第一信息对应的第三信息组成一个第一训练样本;第一设备利用多个第一训练样本训练第一神经网络,得到第一生成器;或者,第一设备利用多个第一训练样本训练第一神经网络和第二神经网络,分别得到第一生成器和第一判别器,该第一神经网络为生成对抗网络中的生成器,该第二神经网络为该生成对抗网络中的判别器。其中,该第一生成器为训练完成的第一神经网络,该第一判别器为训练完成的第二神经网络。该第一生成器用于根据该第一信息生成第二类型的第二信息。第一信息和第三信息均为真实环境下采集的不同种类的信息。
可选的,每个第一训练样本中还包括一个从隐空间中随机选择的信息。隐空间是指随机噪声。
可选的,第一设备利用多个第一训练样本训练第一神经网络的过程中:第一训练样本中的第一信息和从隐空间中随机选择的数据作为第一神经网络的输入;第一神经网络的输出和第一训练样本中的第三信息作为第一损失函数的输入;利用第一损失函数的输出计算第一神经网络的梯度,利用梯度下降算法训练第一神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。
可选的,第一设备利用多个第一训练样本训练第一神经网络和第二神经网络的过程中:第一训练样本中的第一信息和从隐空间中随机选择的数据作为第一神经网络的输入;第一神经网络的输出和第一信息输入第二神经网络,得到第一输出;该第一信息和该第一信息对应的第三信息输入第二神经网络,得到第二输出;第一输出和第一标签输入第二损失函数,得到第二损失函数输出;第二输出和第二标签输入第三损失函数,得到第三损失函数输出;第一输出和第三标签输入第四损失函数,得到第四损失函数输出;利用第二损失函数输出和第三损失函数输出计算第二神经网络的梯度,利用梯度下降算法训练第二神经网络;利用第四损失函数输出计算第一神经网络的梯度,利用梯度下降算法训练第一神经网络。
可见,本方案利用真实采集到的信息来训练生成模型,以使这个生成模型可以用一部分信息生成(或推理、预测)出另一部分信息。
结合第七方面,在一种可能的设计中,第一设备得到第一生成器后,该方法还包括:第一设备向第二设备发送第一消息,第一消息指示第一生成器的全部或部分,该第一生成器所支持的输入包括第一类型的第一信息。
结合第七方面,在一种可能的设计中,第一设备向第二设备发送第一消息之后,该方法还包括:第一设备接收来自第二设备的第二消息。第二消息指示第二生成器的全部或部分。该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,该第四信息与该第一信息不同且第一生成器和第二生成器不同。该第二生成器分别用于支持根据该第一信息生成第二类型的第二信息,根据该第四信息生成第二类型的第五信息。
第八方面,本申请提供一种神经网络的训练装置,该神经网络的训练装置可以是第一设备或其中的芯片。该神经网络的训练装置包括:获取模块,用于获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、和该第一信息对应的第三信息组成一个第一训练样本;训练模块,用于利用多个第一训练样本训练第一神经网络,得到第一生成器;或者,训练模块,用于利用多个第一训练样本训练第一神经网络和第二神经网络,分别得到第一生成器和第一判别器,该第一神经网络为生成对抗网络中的生成器,该第二神经网络为该生成对抗网络中的判别器。其中,该第一生成器为训练完成的第一神经网络,该第一判别器为训练完成的第二神经网络。该第一生成器用于根据该第一信息生成第二类型的第二信息。第一信息和第三信息均为真实环境下采集的不同种类的信息。
可选的,每个第一训练样本中还包括一个从隐空间中随机选择的信息。隐空间是指随机噪声。
结合第八方面,在一种可能的设计中,该神经网络的训练装置还包括收发模块,用于向第二设备发送第一消息,第一消息指示第一生成器的全部或部分,该第一生成器所支持的输入包括第一类型的第一信息。
结合第八方面,在一种可能的设计中,该神经网络的训练装置还包括收发模块,用于接收来自第二设备的第二消息。第二消息指示第二生成器的全部或部分。该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,该第四信息与该第一信息不同且第一生成器和第二生成器不同。该第二生成器分别用于支持根据该第一信息生成第二类型的第二信息,根据该第四信息生成第二类型的第五信息。
上述第七方面或第八方面的一种实现方式中,第一类型为场景类,第二类型为无线信道特征类;或者,第一类型为用户画像和场景类,第二类型为无线信道特征类;或者,第一类型为无线信道特征类,第二类型为用户画像类;或者,第一类型为无线信道特征和场景类,第二类型为用户画像类;或者,第一类型为无线信道特征类,第二类型为场景类;或者,第一类型为无线信道特征和用户画像类,第二类型为场景类。
上述第七方面或第八方面的一种实现方式中,第一信息为第一设备所处环境的环境图像和第一设备的地理位置信息,第三信息为第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,第二信息为该第一信息输入第一生成器生成的信道冲击响应。
上述第七方面或第八方面的一种实现方式中,第一信息为第一设备所处环境的环境图像和第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,第三信息为第一设备的地理位置信息,第二信息为该第一信息输入第一生成器生成的第一设备的地理位置信息。
上述第七方面或第八方面的一种实现方式中,第一消息还指示第一生成器所支持的输入。可选的,第一消息指示第一生成器所支持的输入包括:第一消息包括第一信息、第一信息的标识、第一类型、第一类型的标识中的一个或多个。
上述第七方面或第八方面的一种实现方式中,第二消息还指示第二生成器所支持的输入。可选的,第二消息指示第二生成器所支持的输入包括:第二消息包括第四信息、第四信息的标识、第一类型、第一类型的标识中的一个或多个。
上述第七方面或第八方面的一种实现方式中,第一消息指示第一生成器的全部包括第一生成器的结构和参数,该参数包括权值和偏置值。
上述第七方面或第八方面的一种实现方式中,第一消息指示第一生成器的部分包括第一生成器的结构和部分层的参数,该参数包括权值和偏置值。
上述第七方面或第八方面的一种实现方式中,第一消息中还包括第一生成器的标识,第一生成器的标识与第一生成器所支持的输入对应。
第九方面,本申请提供另一种神经网络的训练方法,该方法包括:第二设备获取第一类型的多个第一信息和第一类型的多个第四信息,其中,一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集;第二设备利用该训练样本集中的多个训练样本训练第三神经网络,得到第二生成器,该第二生成器为训练完成的第三神经网络;或者,第二设备利用该训练样本集中的多个训练样本训练第三神经网络和第四神经网络,分别得到第二生成器和第二判别器,该第三神经网络为生成对抗网络中的生成器,该第四神经网络为该生成对抗网络中的判别器。其中,该第二生成器为训练完成的第三神经网络,该第二判别器为训练完成的第四神经网络。该第二生成器分别用于支持根据该第一信息生成第二类型的第二信息,根据该第四信息生成第二类型的第五信息。应理解,该第一信息与该第二信息不相同,该第二信息和该第五信息也不相同。第一生成器来自第一设备,第三生成器来自第三设备。
可见,本方案利用来自不同设备采集的信息来训练第三神经网络,可以将收集的各个生成器的输入输出映射学到一个统一的模型中,训练完成的第二生成器同时具有对第二信息的分布模拟能力和对第五信息的分布模拟能力。
结合第九方面,第二设备获取第一类型的多个第一信息和第一类型的多个第四信息之前,该方法还包括:第二设备接收第一消息和第三消息。第一消息指示第一生成器的全部或部分,第三消息指示第三生成器的全部或部分,第三消息指示第三生成器的全部或部分。第一生成器所支持的输入包括第一类型的第一信息,第三生成器所支持的输入包括第一类型的第四信息。第一生成器和第三生成器用于第二生成器所对应的神经网络的训练。
结合第九方面,第二设备得到第二生成器之后,该方法还包括:第二设备向第一设备发送第二消息,并向第三设备发送第四消息。第二消息或第四消息指示第二生成器的全部或部分。第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息。第四信息与第一信息不同,且第一生成器、第三生成器以及第二生成器各不相同。
第十方面,本申请提供一种神经网络的训练装置,该神经网络的训练装置可以是第二设备或其中的芯片。该神经网络的训练装置包括:获取模块,用于获取该第一类型的多个第一信息和该第一类型的多个第四信息,其中,一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集;训练模块,用于利用该训练样本集中的多个训练样本训练第三神经网络,得到第二生成器,该第二生成器为训练完成的第三神经网络;或者,训练模块,用于利用该训练样本集中的多个训练样本训练第三神经网络和第四神经网络,分别得到第二生成器和第二判别器,该第三神经网络为生成对抗网络中的生成器,该第四神经网络为该生成对抗网络中的判别器。其中,该第二生成器为训练完成的第三神经网络,该第二判别器为训练完成的第四神经网络。该第二生成器分别用于支持根据该第一信息生成第二类型的第二信息,根据该第四信息生成第二类型的第五信息。应理解,该第一信息与该第二信息不相同,该第二信息和该第五信息也不相同。第一生成器来自第一设备,第三生成器来自第三设备。
结合第十方面,该神经网络的训练装置还包括收发模块,用于接收第一消息和第三消息。第一消息指示第一生成器的全部或部分,第三消息指示第三生成器的全部或部分,第三消息指示第三生成器的全部或部分。第一生成器所支持的输入包括第一类型的第一信息,第三生成器所支持的输入包括第一类型的第四信息。第一生成器和第三生成器用于第二生成器所对应的神经网络的训练。
结合第十方面,该神经网络的训练装置还包括收发模块,向第一设备发送第二消息,并向第三设备发送第四消息。第二消息或第四消息指示第二生成器的全部或部分。第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息。第四信息与第一信息不同,且第一生成器、第三生成器以及第二生成器各不相同。
上述第九方面或第十方面的一种实现方式中,第一类型为场景类,第二类型为无线信道特征类;或者,第一类型为用户画像和场景类,第二类型为无线信道特征类;或者,第一类型为无线信道特征类,第二类型为用户画像类;或者,第一类型为无线信道特征和场景类,第二类型为用户画像类;或者,第一类型为无线信道特征类,第二类型为场景类;或者,第一类型为无线信道特征和用户画像类,第二类型为场景类。
上述第九方面或第十方面的一种实现方式中,第一信息为第一设备所处环境的环境图像和第一设备的地理位置信息,第三信息为第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,第二信息为该第一信息输入第一生成器生成的信道冲击响应。同理,第四信息为第三设备所处环境的环境图像和第三设备的地理位置信息,第六信息为第三设备在所处环境和地理位置情况下测量信道的信道冲击响应,第五信息为该第四信息输入第三生成器生成的信道冲击响应。
上述第九方面或第十方面的一种实现方式中,第一信息为第一设备所处环境的环境图像和第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,第三信息为第一设备的地理位置信息,第二信息为该第一信息输入第一生成器生成的第一设备的地理位置信息。同理,第四信息为第三设备所处环境的环境图像和第三设备的地理位置信息,第六信息为第三设备在所处环境和地理位置情况下测量信道的信道冲击响应,第五信息为该第四信息输入第三生成器生成的第三设备的地理位置信息。
上述第九方面或第十方面的一种实现方式中,第一消息还指示第一生成器所支持的输入。可选的,第一消息指示第一生成器所支持的输入包括:第一消息包括第一信息、第一信息的标识、第一类型、第一类型的标识中的一个或多个。
上述第九方面或第十方面的一种实现方式中,第三消息还指示第三生成器所支持的输入。可选的,第三消息指示第三生成器所支持的输入包括:第三消息包括第四信息、第四信息的标识、第一类型、第一类型的标识中的一个或多个。
上述第九方面或第十方面的一种实现方式中,第二消息还指示第二生成器所支持的输入。可选的,第二消息指示第二生成器所支持的输入包括:第二消息包括第四信息、第四信息的标识、第一类型、第一类型的标识中的一个或多个。
上述第九方面或第十方面的一种实现方式中,第四消息包括第一信息、第一信息的标识、第一类型、第一类型的标识中的一个或多个。
上述第九方面或第十方面的一种实现方式中,第一消息指示第一生成器的全部包括第一生成器的结构和参数,该参数包括权值和偏置值。第三消息指示第三生成器的全部包括第三生成器的结构和参数,该参数包括权值和偏置值。
上述第九方面或第十方面的一种实现方式中,第一消息指示第一生成器的部分包括第一生成器的结构和部分层的参数,该参数包括权值和偏置值。第三消息指示第三生成器的包括第三生成器的结构和部分层的参数,该参数包括权值和偏置值。
上述第九方面或第十方面的一种实现方式中,第一消息中还包括第一生成器的标识,第一生成器的标识与第一生成器所支持的输入对应。第三消息中还包括第三生成器的标识,第三生成器的标识与第三生成器所支持的输入对应。
第十一方面,本申请提供一种通信装置,该通信装置可以包括收发器和存储器,可选的包括处理器。其中,该存储器用于存储计算机程序,该收发器用于收发各种信号,该计算机程序包括程序指令,当该处理器运行该程序指令时,使得该通信装置执行上述第一方面、或上述第二方面、或上述第三方面、或第一方面的任意一种可能的实现方式、或上述第二方面的任意一种可能的实现方式、或上述第三方面的任意一种可能的实现方式描述的信息生成方法。其中,收发器可以为通信装置中的射频模块,或,射频模块和天线的组合,或,芯片或电路的输入输出接口。
第十二方面,本申请提供一种通信装置,该通信装置可以包括收发器和存储器,可选的包括处理器。其中,该存储器用于存储计算机程序,该收发器用于收发各种信号,该计算机程序包括程序指令,当该处理器运行该程序指令时,使得该通信装置执行上述第七方面、或上述第九方面、或第七方面的任意一种可能的实现方式、或上述第九方面的任意一种可能的实现方式描述的神经网络的训练方法。其中,收发器可以为通信装置中的射频模块,或,射频模块和天线的组合,或,芯片或电路的输入输出接口。
第十三方面,本申请提供一种可读存储介质,该可读存储介质上存储有程序指令,当其在计算机上运行时,使得计算机执行上述第一方面、或上述第二方面、或上述第三方面、或第一方面的任意一种可能的实现方式、或上述第二方面的任意一种可能的实现方式、或上述第三方面的任意一种可能的实现方式描述的信息生成方法。
第十四方面,本申请提供一种可读存储介质,该可读存储介质上存储有程序指令,当其在计算机上运行时,使得计算机执行上述第七方面、或上述第九方面、或上述第七方面的任意一种可能的实现方式、或上述第九方面的任意一种可能的实现方式描述的神经网络的训练方法。
第十五方面,本申请提供一种包含程序指令的程序产品,当其运行时,使得上述第一方面、或上述第二方面、或上述第三方面、或第一方面的任意一种可能的实现方式、或上述第二方面的任意一种可能的实现方式、或上述第三方面的任意一种可能的实现方式描述的信息生成方法被执行。
第十六方面,本申请提供一种包含程序指令的程序产品,当其运行时,使得计算机执行上述第七方面、或上述第九方面、或上述第七方面的任意一种可能的实现方式、或上述第九方面的任意一种可能的实现方式描述的神经网络的训练方法。
第十七方面,本申请提供一种装置,该装置可以以芯片的形式实现,也可以为设备的形式,该装置包括处理器。该处理器用于读取并执行存储器中存储的程序,以执行上述第一方面至第三方面中的一项或多项,或,上述第一方面至第三方面的任意可能的实现方式中的一项或多项提供的信号生成方法。或者,该处理器用于读取并执行存储器中存储的程序,以执行上述第七方面和第九方面中的一项或多项,或,上述第七方面和第九方面的任意可能的实现方式中的一项或多项提供的信号生成方法。可选的,该装置还包括存储器,该存储器与该处理器通过电路连接。进一步可选的,该装置还包括通信接口,该处理器与该通信接口连接。该通信接口用于接收需要处理的数据和/或信息,该处理器从该通信接口获取该数据和/或信息,并对该数据和/或信息进行处理,并通过该通信接口输出处理结果。该通信接口可以是输入输出接口。
可选的,上述的处理器与存储器可以是物理上相互独立的单元,或者,存储器也可以和处理器集成在一起。
第十八方面,本申请提供一种通信系统,该通信系统包括上述第四方面描述的信息生成装置和上述第五方面描述的信息生成装置、上述第六方面描述的信息生成装置,上述第八方面描述的神经网络的训练装置,或,上述第十方面描述的神经网络的训练装置等中的一项或多项。
实施本申请实施例,可以充分利用真实场景中采集的信息训练生成模型,以使这个生成模型可以用一部分信息生成(或推理、或预测)出另一部分信息,从而实现通信辅助探测、探测辅助通信,使通信网络向着更智能化、更自适应的方向发展。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1a是本申请实施例提供的无线通信系统的一简化示意图;
图1b是本申请实施例提供的无线通信系统的另一简化示意图;
图2是包含3个层的神经网络示意图;
图3是一个神经元根据输入计算输出的示意图;
图4是反向传播算法的示意图;
图5是本申请实施例提供的信息生成方法的示意流程图;
图6a是本申请实施例提供的场景信息表达的一示意图;
图6b是本申请实施例提供的场景信息表达的另一示意图;
图6c是本申请实施例提供的场景信息表达的又一示意图;
图7是本申请实施例提供的生成单元和判别单元的自学习框图;
图8是本申请实施例提供的一种神经网络的训练方法的示意流程图;
图9是本申请实施例提供的另一种神经网络的训练方法的示意流程图;
图10是本申请实施例提供的第三神经网络的训练框图;
图11是本申请实施例提供的不同设备中神经网络的输入输出示意图;
图12是本申请实施例提供的信息生成装置的一结构示意图;
图13是本申请实施例提供的信息生成装置的另一结构示意图;
图14是本申请实施例提供的通信装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一信息和第二信息仅仅是为了区分不同的信息,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c;a和b;a和c;b和c;或a和b和c。其中a,b,c可以是单个,也可以是多个。
为便于理解本申请实施例的提供的信息生成方法,下面将对本申请实施例提供的信息生成方法的系统架构进行说明。可理解的,本申请实施例描述的系统架构是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定。
本申请实施例提供的信息生成方法可以应用于5G、6G、卫星通信等无线通信系统中。参见图1a,图1a是本申请实施例提供的无线通信系统的一简化示意图。如图1a所示,该无线通信系统包括无线接入网100。无线接入网100可以是下一代(例如6G或更高版本)无线接入网,或传统(例如5G、4G、3G或2G)无线接入网。一个或多个通信设备(120a-120j,统称为120)可以相互连接或连接到无线接入网100中的一个或多个网络设备(110a、110b,统称为110)。可选的,图1a只是示意图,该无线通信系统中还可以包括其它设备,如还可以包括核心网设备、无线中继设备和/或无线回传设备等,在图1a中未画出。
可选的,在实际应用中,该无线通信系统可以同时包括多个网络设备(也称为接入网设备),也可以同时包括多个通信设备。一个网络设备可以同时服务于一个或多个通信设备。一个通信设备也可以同时接入一个或多个网络设备。本申请实施例对该无线通信系统中包括的通信设备和网络设备的数量不做限定。
其中,网络设备可以是网络侧的一种用于发射或接收信号的实体,如基站。网络设备可以为通信设备通过无线方式接入到该无线通信系统中的接入设备,如网络设备可以是基站。基站可以广义的覆盖如下中的各种名称,或与如下名称进行替换,比如:节点B(NodeB)、演进型基站(evolved NodeB,eNB)、下一代基站(next generation NodeB,gNB)、中继站、接入点、传输点(transmitting and receiving point,TRP)、发射点(transmitting point,TP)、主站MeNB、辅站SeNB、多制式无线(MSR)节点、家庭基站、网络控制器、接入节点、无线节点、接入点(AP)、传输节点、收发节点、基带单元(BBU)、射频拉远单元(RRU)、有源天线单元(AAU)、射频头(RRH)、中心单元(CU)、分布单元(DU)、定位节点等。基站可以是宏基站、微基站、中继节点、施主节点或类似物,或其组合。基站还可以指用于设置于前述设备或装置内的通信模块、调制解调器或芯片。基站还可以是移动交换中心以及设备到设备(Device-to-Device,D2D)、车辆外联(vehicle-to-everything,V2X)、机器到机器(machine-to-machine,M2M)通信中承担基站功能的设备、6G网络中的网络侧设备、未来的通信系统中承担基站功能的设备等。基站可以支持相同或不同接入技术的网络。本申请的实施例对网络设备所采用的具体技术和具体设备形态不做限定。
基站(BS)可以是固定的,也可以是移动的。例如,基站110a、110b是静止的,并负责来自通信设备120的一个或多个小区中的无线传输和接收。图1a中示出的直升机或无人机120i可以被配置成充当移动基站,并且一个或多个小区可以根据移动基站120i的位置移动。在其他示例中,直升机或无人机(120i)可以被配置成用作与基站110a通信的通信设备。
通信设备可以是用户侧的一种用于接收或发射信号的实体,如手机。通信设备可以用于连接人、物和机器。通信设备120可以广泛应用于各种场景,例如蜂窝通信、设备到设备D2D、车到所有V2X、端到端P2P、机器到机器M2M、机器类型通信MTC、物联网IOT、虚拟现实VR、增强现实AR、工业控制、自动驾驶、远程医疗、智能电网、智能家具、智能办公、智能穿戴、智能交通、智慧城市、无人机、机器人、遥感、被动传感、定位、导航与跟踪、自主交付与移动等。通信设备120可以是3GPP标准的用户设备(UE)、固定设备、移动设备、手持设备、可穿戴设备、蜂窝电话、智能电话、会话发起协议(SIP)电话、笔记本电脑、个人计算机、智能书、车辆、卫星、全球定位系统(GPS)设备、目标跟踪设备、无人机、直升机、飞行器、船只、遥控设备、智能家居设备、工业设备。通信设备120可以为以上各种场景中的无线设备或用于设置于无线设备的装置,例如,上述设备中的通信模块、调制解调器或芯片等。通信设备也可以称为终端、终端设备、用户设备(user equipment,UE)、移动台(mobile station,MS)、移动终端(mobile terminal,MT)等。通信设备还可以是未来的无线通信系统中的通信设备。通信设备可以用于专用网设备或者通用设备中。本申请的实施例对通信设备所采用的具体技术和具体设备形态不做限定。
可选的,UE可以用于充当基站。例如,UE可以充当调度实体,其在V2X、D2D或P2P等中的UE之间提供侧行链路信号。如图1a所示,蜂窝电话120a和汽车120b利用侧行链路信号彼此通信。蜂窝电话120a和智能家居设备120d之间通信,而无需通过基站110a中继通信信号。
可选的,无线通信系统通常由小区组成,每个小区包含一个基站(base station,BS),基站向多个移动台(mobile station,MS)提供通信服务。其中基站包含基带单元(baseband unit,BBU)和远端射频单元(remote radio unit,RRU)。BBU和RRU可以放置在不同的地方,例如:RRU拉远,放置于高话务量的区域,BBU放置于中心机房。BBU和RRU也可以放置在同一机房。BBU和RRU也可以为一个机架下的不同部件。
参见图1b,图1b是本申请实施例提供的无线通信系统的另一简化示意图。为了简单起见,图1b仅示出了基站110、UE 120以及网络130。基站110包括接口111和处理器112。处理器112可选地可以存储程序114。基站110可选地可以包括存储器113。存储器113可选地可以存储程序115。UE 120包括接口121和处理器122。处理器122可选地可以存储程序124。UE120可选地可以包括存储器123。存储器123可选地可以存储程序125。这些组件一起工作,以提供本发明中描述的各种功能。例如,处理器112和接口121一起工作以提供基站110与UE120之间的无线连接。处理器122和接口121共同作用,实现UE 120的下行传输和/或上行传输。
网络130可以包括一个或多个网络节点130a、130b,以提供核心网功能。网络节点130a、130b可以是下一代(例如,6G或更高版本)核心网节点,或传统(例如5G、4G、3G或2G)核心网节点。例如,网络130a、130b可以是接入管理功能(AMF)、移动性管理实体(MME)等。网络130还可以包括公共交换电话网络(PSTN)、分组数据网络、光网络、互联网协议(IP)网络中的一个或多个网络节点。广域网(WAN)、局域网(LAN)、无线局域网(WLAN)、有线网络、无线网络、城域网和其他网络,以使UE 120和/或基站110之间能够进行通信。
处理器(例如,存储器112和/或存储器122)可包括一个或多个处理器并实现为计算设备的组合。处理器(例如,存储器112和/或存储器122)可分别包括以下一种或多种:微处理器、微控制器、数字信号处理器(DSP)、数字信号处理设备(DSPD)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、选通逻辑、晶体管逻辑、分立硬件电路、处理电路或其它合适的硬件、固件和/或硬件和软件的组合,用于执行本申请中所描述的各种功能。处理器(例如,存储器112和/或存储器122)可以是通用处理器或专用处理器。例如,处理器112和/或处理器122可以是基带处理器或中央处理器。基带处理器可用于处理通信协议和通信数据。中央处理器可用于使基站110和/或UE 120执行软件程序,并处理软件程序中的数据。
接口(例如,接口111和/或121)可包括用于实现与一个或多个计算机设备(例如,UE、BS和/或网络节点)之间的通信。在一些实施例中,接口可以包括用于耦合有线连接的电线、或用于耦合无线收发器的管脚、或用于无线连接的芯片和/或管脚。在一些实施例中,接口可以包括发射器、接收器、收发器和/或天线。接口可以被配置为使用任何可用的协议(例如3GPP标准)。
本申请中的程序在广义上用于表示软件。软件的非限制性示例是程序代码、程序、子程序、指令、指令集、代码、代码段、软件模块、应用程序、软件应用程序等。程序可以在处理器和/或计算机中运行,以使基站110和/或UE 120执行本申请中描述的各种功能和/或过程。
内存(例如存储器113和/或存储器123)可存储由处理器112、122在执行软件时操纵的数据。存储器113、123可以使用任何存储技术实现。例如,存储器可以是处理器和/或计算机能够访问的任何可用存储介质。存储介质的非限制性示例包括:RAM、ROM、EEPROM、CD-ROM、可移动介质、光盘存储器、磁盘存储介质、磁存储设备、闪存、寄存器、状态存储器、远程挂载存储器、本地或远程存储器组件,或能够携带或存储软件、数据或信息并可由处理器/计算机访问的任何其它介质。
内存(例如存储器113和/或存储器123)和处理器(例如处理器112和/或处理器122)可以分开设置或集成在一起。存储器可以用于与处理器连接,使得处理器能够从存储器中读取信息,在存储器中存储和/或写入信息。存储器113可以集成在处理器112中。存储器123可以集成在处理器122中。处理器(例如处理器113和/或处理器123)和存储器(例如处理器112和/或处理器122)可以设置在集成电路中(例如,该集成电路可以设置在UE或基站或其他网络节点中)。
上述内容简要阐述了本申请实施例的系统架构,为更好地理解本申请实施例的技术方案,下面将简要介绍神经网络(neural network)和由2个神经网络组成的生成对抗网络(generative adversarial network,GAN)。
1、神经网络
神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。神经网络至少包括3层,一个输入层、一个中间层(也称隐藏层)以及一个输出层。更深一些的神经网络可能在输入层和输出层之间包含更多的隐藏层。以最简单的神经网络为例,对其内部的结构和实现进行说明,参见图2,图2是包含3个层的神经网络示意图。如图2所示,该神经网络包括3个层,分别是输入层、中间层以及输出层,其中输入层有3个神经元,隐藏层有4个神经元,输出层有2个神经元。神经元之间的每条连线对应一个权重(其值称为权值),这些权值通过训练可以更新。每个神经元还可以对应一个偏置值,这些偏置值通过训练可以更新。更新神经网络是指更新这些权值和偏置值。知道了神经网络的结构,即前面的神经元的输出如何输入后面的神经元,以及权值和偏置值,就知道了该神经网络的全部信息。
由图2可知,每个神经元可能有多个输入连线,每个神经元根据输入计算输出。参见图3,图3是一个神经元根据输入计算输出的示意图。如图3所示,一个神经元包含3个输入,1个输出,以及2个计算功能,输出的计算公式可以表示为:
输出=非线性函数(输入1*权值1+输入2*权值2+输入3*权值3+偏置值)……………(1-1)
其中,非线性函数可以是softmax函数,tanh函数(又称正切三角函数),sigmoid函数等。应理解,softmax函数是归一化指数函数,它能将一个含任意实数的K维向量z“压缩”到另一个K维实向量σ(z)中,使得每一个元素的范围都在(0,1)之间,并且所有元素的和为1,其函数表达式如下述公式(1-2)所示。tanh函数又称正切三角函数,其函数表达式如下述公式(1-3)所示。sigmoid函数也称S型生长曲线,其具有单增以及反函数单增特性,常被用作神经网络的激活函数,它可以将一个实数映射到(0,1)的区间,其函数表达式如下述公式(1-4)所示。
每个神经元可能有多条输出连线,一个神经元的输出作为下一个神经元的输入。应理解,输入层只有输出连线,输入层的每个神经元是输入神经网络的值,每个神经元的值直接作为所有输出连线的输入。输出层只有输入连线,采用上述公式(1-1)的计算方式,可选的,输出层可以没有非线性函数的计算,也就是说前述公式(1-1)可以变换成:输出=输入1*权值1+输入2*权值2+输入3*权值3+偏置值。
一种神经网络的训练方法可以如下。定义一个损失函数,损失函数通常用于计算神经网络的输出和目标数据的差距。损失函数越小,表示神经网络的输出越好的拟合目标数据。一个以均方误差作为损失函数的例子如下:
loss=(yout-ytarget)2 ………………………………………………(1-5)
其中,yout表示神经网络的输出,ytarget表示目标数据,最小化损失函数(即公式(1-5)中的loss)是指最小化两者(即yout和ytarget)数值上的差异。应理解,损失函数除了均方误差损失函数外,损失函数还可以是交叉熵损失函数、绝对值损失函数等,本申请不限定损失函数的种类。
可选的,最小化损失函数通常采用数学中的求导,但因为损失函数的参数不止一个,求导后计算导数等于0的运算量很大,所以通常使用梯度下降算法。梯度下降算法每次计算权值和偏置值当前的梯度,然后让权值和偏置值向着梯度的反方向前进一段距离,不断重复,直到梯度接近零时截止。通常在梯度接近零时,所有的权值和偏置值恰好达到使损失函数处于一个最低值的状态。
在神经网络模型中,由于结构复杂,每次计算梯度的代价很大。因此还需要使用反向传播算法。反向传播算法是利用神经网络的结构进行的计算,不是一次计算所有权值的梯度,而是从输出层往输入层方向传播。首先计算输出层的梯度,然后是输出层与中间层连接权值的梯度,接着是中间层的梯度,再然后是中间层与输入层连接权值的梯度,最后是输入层的梯度。计算结束后,就得到所要的所有连线权值的梯度。
参见图4,图4是反向传播算法的示意图。如图4所示,梯度的计算从后往前,一层层反向传播。其中,前缀E表示相对导数。在得到所有连线权值的梯度后,可以更新权值。更新权值的计算方式如下述公式(1-6)所示:
Wnew=Wold–lr*E ………………………………………………………(1-6)
其中,Wnew表示新的权值,Wold表示旧的权值(或原来的权值),E表示该权值对应的梯度,lr表示学习速率(learning rate)。lr用于控制权值朝着梯度的反方向前进的快慢,通常lr的取值为0.1、0.01、0.001、0.0001、0.00001等。lr可以是构建神经网络时预设的。
应理解,更新偏置值的方法与更新权值的方法类似,此处不再赘述。
2、生成对抗网络
生成型神经网络(Generative Neural Network)是一类特殊的深度学习神经网络,不同于一般神经网络主要执行的分类任务和预测任务,生成型神经网络可以学习一组训练样本所服从的概率分布函数,从而可以用来对随机变量进行建模,也可以用来建立变量间的条件概率分布。常见的生成型神经网络包括生成对抗网络(GenerativeAdversarial Network,GAN)和变分自编码器(Variational Autoencoder,VAE)。本申请关注生成对抗网络。
生成对抗网络(Generative Adversarial Network,简称GAN)是非监督式学习的一种方法,通过两个神经网络相互博弈的方式进行学习。生成对抗网络按照功能可以分成两部分:生成网络(简称为生成器)和判别网络(简称为判别器)。生成网络的输入是从隐空间(latent space)中随机选取的样本,生成网络的输出需要尽量模仿训练集中的真实样本。隐空间(latent space)是指随机噪声,如高斯分布的随机向量。判别网络的输入是真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来,而生成网络则要尽可能地欺骗判别网络。换句话说,生成网络对输入的随机噪声进行加工处理,输出生成样本;判别网络将生成网络输出的生成样本与训练集中的训练样本进行比对,判断生成样本与训练样本是否服从同一个概率分布,输出真假的判断。两个网络相互对抗博弈(生成网络希望尽可能生成服从训练集分布的样本,判别网络希望尽可能分辨出生成样本与训练集的区别),通过联合训练生成网络和判别网络,不断调整参数,可使二者达到均衡状态,最终目的是使判别网络无法判断生成网络的输出是否真实,即生成网络输出的生成样本完全服从训练的样本分布,判别网络认为生成样本与训练集同分布。
生成对抗网络(GAN)常用于生成图像,包括一个生成器(Generator)和一个判别器(Discriminator)。生成器的输入为隐空间,即随机噪声;生成器的输出是一张伪图像。从真实数据集(Real Data)中获取真实图像,将伪图像和真实图像分别输入判别器,让判别器区分真(Real)和伪(Fake)。生成器和判别器相互对抗训练,理想情况下当训练结束时生成器可以生成和真实图像极为相似的伪图像,判别器此时无法区别输入图像的真伪,即判别器评判真和伪的概率都为0.5。
应理解,生成器即生成网络,两者可相互替换使用;判别器即判别网络,两者亦可相互替换使用。
随着通信技术和机器学习的结合逐渐增加,考虑用生成对抗网络去实现信道的建模。具体地,利用GAN进行信道建模的方法与GAN生成图像的流程类似。隐空间输入生成器,输出伪信道;从真实测量的信道数据集中获取真实信道,将伪信道和真实信道输入判别器,让判别器判断输入信道的真伪;最终,生成器可以生成和真实信道极为相似的伪信道。这样,这个生成器相当于实现了信道建模,即对任意输入的隐空间随机值,可以生成信道。
但是,上述利用GAN进行信道建模的方法仅是对一个特定的真实信道数据集的模拟,相当于把整个隐空间映射到这个特定的信道数据分布上,这样的生成器只能模拟这个特定的信道数据,也就是说,这种方式得到的生成器只能用于这个特定的场景。而实际信道数据具有多样性,这种只能生成特定信道数据的生成器的作用有限,它不能泛化到其它通信环境,例如,以室内具有丰富多径的信道训练的生成器不能用于室外环境。应理解,如果为每个特定的场景都训练一个特定的生成器,则需要将每个特定场景对应的生成器都存储下来,需要的存储空间大,不利于设备之间共享各个特定场景对应的生成器(因为需要的空口资源很大),实现复杂度高。
此外,上述利用GAN进行信道建模的方法还缺少在网络设备中在线训练和使用生成器的信令流程设计;并且,上述利用GAN进行信道建模的方法仅是GAN在图像领域工作的迁移,没有结合无线通信的特点。上述利用GAN进行信道建模的方法中的通信设备只关注自身、当前所处的状态,仅利用了自身产生的经验信息,没有对其它通信设备作出贡献。
因此,本申请实施例提供一种信息生成方法,通过充分利用通信设备采集的信息,把这些信息用来训练生成模型,以使这个生成模型可以用一部分信息生成(或推理、预测)出另一部分信息,从而实现通信辅助探测、探测辅助通信,使通信网络向着更智能化、更自适应的方向发展。另外,本申请实施例考虑到单个通信设备采集的信息太过单一,为了快速提升生成模型的泛化能力,通过汇总多个通信设备的生成模型,将它们训练成一个多场景的生成模型,通过不断地汇总、训练,在通信网络中,这个生成模型逐渐自动演进为全场景生成模型。换句话说,本申请实施例可以利用训练得到的一个全场景生成模型生成不同场景下的信息,无需针对每个特定场景都存储一个对应的生成器,需要的存储空间小,便于设备之间共享该全场景生成模型(因为需要的空口资源小),实现复杂度低。
下面将结合更多的附图对本申请提供的技术方案进行详细说明。
本申请提供的技术方案通过三个实施例来详细说明。其中,实施例一详细阐述信息生成方法。实施例二阐述第一设备中第一神经网络的训练方法。实施例三阐述第二设备中第三神经网络的训练方法。可理解的,本申请实施例一至实施例三所描述的技术方案可以任一组合形成新的实施例且所涉及概念或方案相同或相似的部分可以相互参考或组合。下面分别对各个实施例进行详细说明。
应理解,本申请中的第一设备和第三设备可以是不同的通信设备,如不同的UE,且第一设备和第三设备位于不同的场景中,比如第一设备处于室内环境(办公室、住所、室内购物中心等),第三设备处于室外环境(街道等)。本申请中的第二设备可以是网络设备,如基站。
实施例一
本申请实施例一主要介绍信息生成方法在空口上的信令交互流程。
参见图5,图5是本申请实施例提供的信息生成方法的示意流程图。应理解,该信息生成方法是以一个网络设备与多个通信设备(为便于描述,以2个通信设备为例)组成的通信系统中实施为例进行阐述的。其中,第一设备和第三设备为不同的通信设备,且位于不同的场景中;第二设备为网络设备。如图5所示,该信息生成方法包括但不限于以下步骤:
S101,第一设备向第二设备发送第一消息,该第一消息指示第一生成器的全部或部分,该第一生成器所支持的输入包括第一类型的第一信息,该第一生成器用于第二生成器所对应的神经网络的训练。
可选的,第一设备获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,并将一个第一信息和该第一信息对应的第三信息作为一个第一训练样本,从而得到多个第一训练样本。可选的,每个第一训练样本中还包括一个从隐空间随机选择的信息。第一设备可以利用多个第一训练样本训练第一神经网络得到第一生成器,该第一生成器为训练完成的第一神经网络,换句话说,该第一生成器的结构(即神经网络的神经元之间的连接关系)、权值和偏置值与训练完成的第一神经网络的结构、权值和偏置值相同。或者,第一设备可以利用多个第一训练样本训练第一神经网络和第二神经网络,分别得到第一生成器和第一判别器,该第一生成器为训练完成的第一神经网络,该第一判别器为训练完成的第二神经网络。其中,该第一神经网络为生成对抗网络中的生成器,该第二神经网络为该生成对抗网络中的判别器。第一设备训练第一神经网络和/或第二神经网络的过程如下文实施例二的描述,此处不展开说明。
第一设备获得第一生成器后,向第二设备发送第一消息,该第一消息用于指示该第一生成器的全部或部分,可选的还用于指示该第一生成器所支持的输入。该第一生成器所支持的输入可以包括第一类型的第一信息。该第一生成器用于第二生成器所对应的神经网络的训练,其使用方式参见实施例三中第二生成器对应的神经网络的训练过程。其中,该第一生成器支持根据第一类型的第一信息生成第二类型的第二信息。
可选的,该第一消息指示第一生成器的全部,可通过在该第一消息中携带第一生成器的所有神经元之间的连接关系(即第一生成器的结构)、权值和偏置值来实现。该第一消息指示第一生成器的部分,可通过在该第一消息中携带第一生成器的结构(指所有层神经元之间的连接关系)和部分层的权值和偏置值来实现。
应理解,如果第一消息指示第一生成器的全部(比如,第一消息中包括第一生成器的结构、权值和偏置值),则第二设备可以获得完整的第一生成器,无需第二设备再次训练。如果第一消息指示第一生成器的部分(比如,第一消息中包括第一生成器的结构、和部分层的权值以及偏置值),则第二设备只能获得第一生成器的部分,第二设备需要还原第一生成器的另外部分,以得到第一生成器的完整参数。
一种可能的实现中,假设第一生成器总共有6层(应理解,这里第一生成器的层数仅是示例,本申请实施例不对第一生成器的层数进行限定,实际应用中,第一生成器的层数可以根据具体情况设定),第一消息中包括这6层的结构和前3层的权值和偏置值,因此第二设备收到该第一生成器的部分之后,固定前三层的权值和偏置值训练后3层,以获得后3层的权值和偏置值。
另外一种可能的实现中,第二设备预存一个第二生成器,假设该第二生成器具有6层(应理解,这里第一生成器的层数仅是示例,本申请实施例不对第一生成器的层数进行限定,实际应用中,第一生成器的层数可以根据具体情况设定)。第二设备将该第二生成器的结构和前三层的权值和偏置值发给第一设备和第三设备,第一设备和第三设备根据收到的第二生成器的结构和前3层的权值和偏置值分别训练后3层的权值和偏置值,并分别得到第一生成器和第三生成器。第一设备发送第一生成器的后3层的权重和偏置值给第二设备,第二设备根据收到的第一生成器的后3层的权重和偏置值,结合第二生成器的前3层的权重和偏置值,还原得到完整的第一生成器。第三设备同理,在此不再赘述。
可选的,该第一消息还用于指示第一生成器所支持的输入,可通过在该第一消息中携带第一信息、第一信息的标识、第一类型、第一类型的标识中一个或多个来实现,还可通过在该第一消息中携带第一生成器的标识来实现。该第一生成器的标识与该第一生成器所支持的输入(即第一类型的第一信息)对应。应理解,如果第一消息包括第一信息的标识、第一类型、或第一类型的标识、第一生成器的标识中的一个或多个,第二设备则可以根据该第一消息携带的这一个或多个信息去获取第一信息。
可选的,第一消息可以包括一条消息或多条消息。比如可以通过第一消息所包括的消息A指示第一生成器的全部或部分,通过第一消息所包括的消息B指示该第一生成器所支持的输入。可选的,该消息B中可以包括第一生成器的标识,包括第一信息、第一信息的标识、第一类型、第一类型的标识中的一个或多个,来指示第一生成器所支持的输入。由于消息A和消息B是分两个不同的消息发送给第二设备的,而第一生成器又是与该第一生成器所支持的输入(即第一类型的第一信息)对应的,即第一生成器与第一信息对应,所以消息A中也可以携带第一生成器的标识。这个标识可以区分各个生成器所支持的输入与各个生成器之间的对应关系。也就是说,虽然第一生成器和第一生成器所支持的输入可以分两个消息来指示(或空口上可以分开传输),但第一生成器和第一生成器所支持的输入是绑定的,否则第一生成器无法被使用,即保存第一生成器的设备(这里指第二设备)要同时保存第一生成器所支持的输入。
例如,用于指示第一生成器的全部或部分的信令(如消息A)如下述表1所示,用于指示第一生成器所支持的输入的信令(如消息B)如下述表2所示。
表1
表2
可见,根据唯一的生成器ID,可以将生成器与其所支持的输入对应起来。
可选的,该第一生成器所支持的输入为第一类型的信息,输出为第二类型的信息。其中,第一类型和第二类型存在以下几种可能:(a)第一类型是场景类,第二类型是无线信道特征类;或者,第一类型是用户画像和场景类,第二类型是无线信道特征类。换句话说,第一生成器根据输入的与场景相关的信息,输出/生成与无线信道特征相关的信息。(b)第一类型是无线信道特征类,第二类型是用户画像类;或者,第一类型是无线信道特征和场景类,第二类型是用户画像类。换句话说,第一生成器根据输入的与无线信道特征相关的信息,输出/生成与用户相关的信息。(c)第一类型是无线信道特征类,第二类型是场景类;或者,第一类型是无线信道特征和用户画像类,第二类型是场景类。换句话说,第一生成器根据输入的与无线信道特征相关的信息,输出/生成与场景相关的信息。
应理解,由于第一生成器是用于生成无线环境中的信息,所以真实测量的无线信道是训练这个第一生成器对应的第一神经网络时需要使用的信息。
可选的,当第一类型为无线信道特征类时,第一类型的信息是指与无线信道特征相关的信息。无线信道特征是指无线信道的特征。无线信道特征类是指与无线信道特征相关的信息类型,包括以下一种或多种子类型:信道冲击响应信息子类型、信道状态信息子类型。
当第一类型为信道冲击响应信息子类型时,第一类型的信息是指与信道冲击响应信息相关的信息。其中,信道冲击响应信息是对无线信道直接测量得到的信息,也可以是基于对无线信道进行测量获得的结果进行处理后对无线信道状态的反映,信道冲击响应可以包括以下一种或多种信息:信道矩阵、信道冲击响应、信道频率响应、信道的多径时延扩展、信道的多径组成、信道的幅度、信道的相位、信道冲击响应的实部、信道冲击响应的虚部、信道功率时延谱、信道角度功率谱等。其中,信道矩阵是多输入多输出(multiple inputmultiple output,MIMO)下的信道冲击响应。
当第一类型为信道状态信息子类型时,第一类型的信息是指与信道状态信息相关的信息。其中,信道状态信息是对无线信道状态的指示,可以是对无线信道进行测量获得的直接结果,比如信道功率,参考信号接收功率(reference signal received power,RSRP),也可以是基于对无线信道进行测量获得的结果进行处理后对无线信道状态的反映,比如,测量报告,信道状态信息。信道状态信息可以包括以下一种或多种信息:信道状态信息(channel state information,CSI)、测量报告(Measurement reports,MR)、信道功率、干扰功率、噪声功率、信干噪比、信道质量指示(channel quality indicator,CQI)、参考信号接收功率(reference signal received power,RSRP)、参考信号接收质量(referencesignal received quality,RSRQ)等。
可选的,当第一类型为场景类时,第一类型的信息是指与无线通信场景相关的信息。无线通信场景是指对当前无线通信环境和环境中物体的描述。场景类包括以下一种或多种子类型:环境描述信息子类型、环境感知信息子类型。
当第一类型为环境描述信息子类型时,第一类型的信息是指与环境描述信息相关的信息。其中,环境描述信息是对无线传输环境的描述,包括以下一种或多种信息:二维地图、三维地图、经纬度坐标、点云数据、环境布局图、环境中物体的尺寸、环境中物体的相对位置、环境中物体的材质、环境中接入网设备的位置、交通流量信息等。
其中,点云数据(point cloud data)是指在一个三维坐标系统中的一组向量的集合。点云数据除了具有几何位置以外,还可以包括颜色信息和强度信息。颜色信息通常是通过相机获取彩色影像,然后将对应位置的像素的颜色信息(RGB)赋予点云中对应的点。强度信息的获取是激光扫描仪接收装置采集到的回波强度,此强度信息与目标的表面材质、粗糙度、入射角方向,以及仪器的发射能量,激光波长有关。
当第一类型为环境感知信息子类型时,第一类型的信息是指与环境感知信息相关的信息。其中,环境感知信息是从传感器获得的环境信息,包括以下一种或多种信息:光传感器获得的拍摄图像、深度相机获得的深度信息、距离传感器获得的距离信息、加速度传感器获得的加速度信息、其它传感器获得的数据。传感器包括光传感器、感应式(Inductive)传感器、电容式(Capacitive)传感器、磁力传感器、温度传感器、加速度传感器、压力传感器等。
可选的,当第一类型为用户画像类时,第一类型的信息是指与用户行为画像相关的信息。用户行为画像是指对用户设备(这里是第一设备或第三设备)在客观通信条件下的参数选择和行为规律的总结。用户画像类是指与用户行为画像相关的信息类型,包括以下一种或多种子类型:用户参数子类型、用户行为信息子类型。
当第一类型为用户参数子类型时,第一类型的信息是指与用户设备参数相关的信息。其中,用户设备参数是指用户设备的通信参数,包括以下一种或多种信息:用户设备的硬件和软件参数,如设备天线参数、设备物理层参数,设备的硬件参数、平均发射功率、设备的电量、国际移动用户识别码、设备识别码等。
其中,物理层参数是指通信设备的物理层(physical layer)的算法、配置的参数或做出的决策,如波束选择结果、调制编码策略(modulation and coding schemes,MCS)选择结果、预编码矩阵的选择等。设备的硬件参数,如该设备内采用的模数转换(ADC)模块的精度等。
当第一类型为用户行为信息子类型时,第一类型的信息是指与用户行为信息相关的信息。其中,用户行为信息是对用户在通信过程中行为的描述,包括以下一种或多种信息:用户设备的地理位置、历史位置分布、移动速度、移动路径,用户设备的业务特征,如服务类型、用户体验、平均延时、平均丢包率、收发数据量、历史接入小区等。
应理解,用户画像和场景类是指用户画像类+场景类,换句话说,第一类型的信息包括两部分,一部分是用户画像类信息,另一部分是场景类信息。无线信道特征和场景类是指无线信道特征类+场景类信息,换句话说,第一类型的信息包括两部分,一部分是无线信道特征类信息,另一部分是场景类信息。无线信道特征和用户画像类是指无线信道特征类+用户画像类,换句话说,第一类型的信息包括两部分,一部分是无线信道特征类信息,另一部分是用户画像类信息。
一个示例中,上述第一信息是第一设备所处环境的环境图像(比如俯瞰图)和第一设备的地理位置信息(比如,全球定位系统获取到的位置)。上述第三信息(训练第一神经网络时使用的真值,或第一训练样本中与第一信息对应的第二类型的信息)是第一设备在所处环境和地理位置情况下测量信道的功率时延谱。上述第二信息是第一生成器根据输入的环境图像和地理位置信息,输出/生成的信道的功率时延谱。换句话说,第一生成器能够根据输入的环境图像和地理位置信息,输出信道的功率时延谱,即该第一生成器用于生成信道(比如,用于通信系统评估信道状态),即第一生成器学习到的是环境图像和地理位置信息、与信道之间的关系。
应理解,该第二信息与该第三信息具有相似的概率分布,也就是说,第一生成器的输出与训练时使用的真值具有相似的概率分布。例如,假设第一神经网络训练过程学习的是信道的功率时延谱数据,假设这些数据的信道时延从30纳秒到300纳秒内均匀分布,那最后训练完成的第一神经网络(即第一生成器)输出的也应是在这个范围内的均匀分布。应理解,均匀分布只是举例,也可以是其他分布类型,实际可以是多少概率信道时延在50纳秒,多少概率信道时延在100纳秒。
另一个示例中,上述第一信息是第一设备所处环境的环境图像(比如俯瞰图)和第一设备在所处环境和地理位置情况下测量信道的信道冲击响应。上述第三信息(训练第一神经网络时使用的真值,或第一训练样本中与第一信息对应的第二类型的信息)是第一设备在所处环境中的真实地理位置信息(比如,全球定位系统获取到的位置)。上述第二信息是第一生成器根据输入的环境图像和测量信道的信道冲击响应,输出/生成的第一设备的地理位置信息。换句话说,第一生成器能够根据输入的环境图像和测量信道的信道冲击响应,输出第一设备的地理位置信息,即该第一生成器用于生成地理位置信息(比如,用于定位场景中),即第一生成器学习到的是环境图像和信道冲击响应、与地理位置信息之间的关系。
应理解,该第二信息与该第三信息具有相似的概率分布,也就是说,第一生成器的输出与训练时使用的真值具有相似的概率分布。例如,假设第一神经网络训练过程学习的是用户设备在建筑物中的位置数据,假设这些数据的用户设备的位置有50%在办公室A内,50%在会议室B内,那最后训练完成的第一神经网络(即第一生成器)输出的也应是接近一半在办公室A内,一半在会议室B内。
又一个示例中,上述第一信息是第一设备在所处环境和地理位置情况下测量信道的信道冲击响应。上述第三信息(训练第一神经网络时使用的真值,或第一训练样本中与第一信息对应的第二类型的信息)是第一设备在所处环境中的环境感知信息(比如,第一设备和前方障碍物的距离)。上述第二信息是第一生成器根据输入的测量信道的信道冲击响应,输出/生成的第一设备和前方障碍物的距离。换句话说,第一生成器能够根据输入的测量信道的信道冲击响应,输出第一设备和前方障碍物的距离,即该第一生成器用于生成距离感知信息(比如,用于测距场景中),即第一生成器学习到的是信道冲击响应、与距离信息之间的关系。
应理解,该第二信息与该第三信息具有相似的概率分布,也就是说,第一生成器的输出与训练时使用的真值具有相似的概率分布。例如,假设第一神经网络训练过程学习的是第一设备和前方障碍物的距离,假设这些距离数据从0.3米到300米内均匀分布,那最后训练完成的第一神经网络(即第一生成器)输出的也应是在这个范围内的均匀分布。
S102,第三设备向第二设备发送第三消息,该第三消息指示第三生成器的全部或部分,该第三生成器所支持的输入包括第一类型的第四信息,该第三生成器用于第二生成器所对应的神经网络的训练。
可选的,第三设备获取第一类型的多个第四信息、和每个第四信息对应的第二类型的第六信息,并将一个第四信息和该第四信息对应的第六信息作为一个第二训练样本,从而得到多个第二训练样本。可选的,每个第二训练样本中还包括一个从隐空间随机选择的信息。第三设备可以利用多个第二训练样本训练第五神经网络得到第三生成器,该第三生成器为训练完成的第五神经网络,换句话说,该第三生成器的结构(即神经网络的神经元之间的连接关系)、权值和偏置值与训练完成的第五神经网络的结构、权值和偏置值相同。或者,第三设备可以利用多个第二训练样本训练第五神经网络和第六神经网络,分别得到第三生成器和第三判别器,该第三生成器为训练完成的第五神经网络,该第三判别器为训练完成的第六神经网络。其中,该第五神经网络为生成对抗网络中的生成器,该第六神经网络为该生成对抗网络中的判别器。第三设备训练第五神经网络和/或第六神经网络的过程参考下文实施例二中训练第一神经网络和/或第二神经网络的描述,此处不展开说明。
第三设备获得第三生成器后,向第二设备发送第三消息,该第三消息用于指示该第三生成器的全部或部分,可选的还用于指示该第三生成器所支持的输入。该第三生成器所支持的输入可以包括第一类型的第四信息。该第三生成器用于第二生成器所对应的神经网络的训练,其使用方式参见实施例三中第二生成器对应的神经网络的训练过程。其中,该第三生成器支持根据第一类型的第四信息生成第二类型的第五信息。
可选的,该第三消息用于指示该第三生成器的全部可通过在该第三消息中携带第三生成器的所有神经元之间的连接关系(即第三生成器的结构)、权值和偏置值来实现。该第三消息指示第三生成器的部分,可通过在该第三消息中携带第三生成器的结构(指所有层神经元之间的连接关系)和部分层的权值和偏置值来实现。
应理解,如果第三消息指示第三生成器的全部(比如,第三消息中包括第三生成器的结构、权值和偏置值),则第二设备可以获得完整的第三生成器,无需第二设备再次训练。如果第三消息指示第三生成器的部分(比如,第三消息中包括第三生成器的结构、部分层的权值和偏置值),则第二设备只能获得第三生成器的部分,第二设备需要对第三生成器的另外部分的权值和偏置值进行赋值,获得赋值的参数的方法可以是通过读取预存的神经网络参数、也可以是通过获取其它带有神经网络参数的消息、也可以是赋值初始化参数再通过训练更新这些参数。
可选的,该第三消息还用于指示第三生成器所支持的输入,可通过在该第三消息中携带第四信息、第四信息的标识、第一类型、第一类型的标识中一个或多个来实现,还可通过在该第三消息中携带第三生成器的标识来实现。该第三生成器的标识与该第三生成器所支持的输入(即第一类型的第四信息)对应。应理解,如果第三消息包括第四信息的标识、第一类型、或第一类型的标识、第三生成器的标识中的一个或多个,第二设备则需要根据该第三消息携带的这一个或多个信息去获取第四信息。
可选的,第三消息可以包括一条消息或多条消息。比如可以通过第三消息所包括的消息C指示第一生成器的全部或部分,通过第一消息所包括的消息D指示该第三生成器所支持的输入。可选的,该消息D可以包括第三生成器的标识,包括第四信息、第四信息的标识、第一类型、第一类型的标识中的一个或多个,来指示第三生成器所支持的输入。由于消息C和消息D是分两个不同的消息发送给第二设备的,而第三生成器又是与该第三生成器所支持的输入(即第一类型的第四信息)对应的,即第三生成器与第四信息对应,所以消息A中也需要携带第三生成器的标识。这个标识可以区分各个生成器所支持的输入与各个生成器之间的对应关系。也就是说,虽然第三生成器和第三生成器所支持的输入可以分两个消息来指示(或空口上可以分开传输),但第三生成器和第三生成器所支持的输入是绑定的,否则第三生成器无法被使用,即保存第三生成器的设备(这里指第二设备)要同时保存第三生成器所支持的输入。
可选的,该第三生成器所支持的输入为第一类型的信息,输出为第二类型的信息。其中,第一类型和第二类型可参考步骤S101中关于“第一类型”和“第二类型”的相应描述,此处不再赘述。
可选的,上述第四信息与上述第一信息是同种类型的不同信息,上述第六信息与上述第三信息也是同种类型的不同信息,上述第五信息和上述第二信息是不同生成器生成的同种类型的信息,参考前述相应描述,此处不再赘述。
应理解,上述第三生成器所支持的输入与前述第一生成器所支持的输入是同种类型的信息,输出亦是同种类型的信息。例如,前述第一生成器所支持的输入是第一设备所处环境的环境图像和第一设备的地理位置信息,输出是根据输入生成的信道的功率时延谱;则第三生成器所支持的输入就是第三设备所处环境的环境图像和第三设备的地理位置信息,输出是根据输入生成的信道的功率时延谱。第一生成器和第三生成器的区别在于:两者训练时采用不同无线环境中的信息,比如,第一生成器采用的是室内环境(办公室、住所、室内购物中心等)中的信息训练的,第三生成器是采用室外环境(街道等)中的信息训练的。换句话说,两者用于不同的场景中。
可理解的,步骤S101和步骤S102的执行顺序不做限定。既可以是步骤S101在前,步骤S102在后;也可以是步骤S102在前,步骤S101在后;还可以是步骤S101和步骤S102同时/并行执行。
S103,第二设备接收第一消息和第三消息。
具体地,第二设备接收来自第一设备的第一消息和来自第三设备的第三消息。该第一消息用于指示第一生成器的全部或部分,可选的还用于指示该第一生成器所支持的输入,该第三消息用于指示第三生成器的全部或部分,可选的还用于指示该第三生成器所支持的输入。该第一生成器所支持的输入包括第一类型的第一信息,该第三生成器所支持的输入包括第一类型的第四信息。该第一生成器和该第三生成器用于第二生成器所对应的神经网络的训练。
S104,第二设备向第一设备发送第二消息,该第二消息指示第二生成器的全部或部分,该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,该第四信息与该第一信息不同且第一生成器和第二生成器不同。
S105,第二设备向第三设备发送第四消息,该第四消息指示第二生成器的全部或部分以及第二生成器所支持的输入,该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,该第四信息与该第一信息不同且第三生成器和第二生成器不同。
可选的,第二设备获取第一类型的多个第一信息和该第一类型的多个第四信息,并将一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,从而得到多个第三训练样本;将一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息作为一个第四训练样本,从而得到多个第四训练样本。第二设备将该多个第三训练样本和该多个第四训练样本作为一个训练样本集。可选的,每个第三训练样本还包括一个从隐空间中随机选择的信息;每个第四训练样本还包括一个从隐空间中随机选择的信息。
第二设备利用该训练样本集中的多个训练样本训练第三神经网络,得到第二生成器,该第二生成器为训练完成的第三神经网络,换句话说,该第二生成器的结构(即神经网络的神经元之间的连接关系)和权值与训练完成的第三神经网络的结构和权值相同。
或者,第二设备利用该训练样本集中的多个训练样本训练第三神经网络和第四神经网络,分别得到第二生成器和第二判别器,该第二生成器为训练完成的第三神经网络,该第二判别器为训练完成的第四神经网络。其中,该第三神经网络为生成对抗网络中的生成器,该第四神经网络为该生成对抗网络中的判别器。该第一生成器和该第三生成器用于第二生成器所对应的神经网络(即第三神经网络)的训练。第二设备训练第三神经网络和/或第四神经网络的过程如下文实施例三的描述,此处不展开说明。
可见,第三神经网络的训练样本集中既有第一设备采集的信息,也有第三设备采集的信息,并且通过汇总多个通信设备的生成模型,把它们训练成一个多场景的生成模型(即第二生成器),通过不断地汇总训练,在通信网络中,以使这个生成模型逐渐自动演进为全场景生成模型。
第二设备获得第二生成器后,向第一设备发送第二消息;还向第三设备发送第四消息。该第二消息或该第四消息用于指示第二生成器的全部或部分以及第二生成器所支持的输入。该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息。该第四信息与该第一信息不同且第一生成器、第二生成器以及第三生成器各不相同。该第二生成器分别用于支持根据该第一信息生成第二类型的第二信息,根据该第四信息生成第二类型的第五信息。应理解,该第二信息和该第五信息也不相同。
可选的,如果上述第一消息或消息B指示第一生成器所支持的输入,通过在该第一消息或消息B中携带第一信息来实现,换句话说,如果第一消息或消息B中包括多个第一信息,则第二设备从接收到的该第一消息或消息B中获取多个第一信息。上述第三消息(或第三消息所包括的消息D)与第一消息(或第一消息所包括的消息B)同理,如果该第三消息或消息D指示第三生成器的输入,通过在该第三消息或消息D中携带第四信息来实现,换句话说,如果第三消息或消息D中包括多个第四信息,则第二设备从接收到的该第三消息或消息D中获取多个第四信息。
可选的,如果上述第一消息或第一消息所包括的消息B指示第一生成器所支持的输入,通过在该第一消息或消息B中携带第一信息的标识来实现,换句话说,如果第一消息或消息B中包括第一信息的标识,则第二设备可以从标识与信息的映射关系表中获取与该第一信息的标识对应的信息,这个信息由多个第一信息组成。其中,标识与信息的映射关系表可以标准化,并预存在第二设备中。应理解,上述第三消息(或第三消息所包括的消息D)与第一消息(或第一消息所包括的消息B)同理,如果上述第三消息或消息D指示第三生成器所支持的输入,通过在该第三消息或消息D中携带第四信息的标识来实现,换句话说,如果第三消息或消息D中包括第四信息的标识,则第二设备可以从标识与信息的映射关系表中获取与该第四信息的标识对应的信息。
一个示例中,假设第一信息是用户画像和场景类信息,即,第一信息的第一类型是用户画像和场景类。如下述表3所示,第一消息或消息B中包括场景序号1(即第一信息的标识),第二设备从地图库中选择第一设备所在区域范围为500m*500m大小(可以是预设大小)的地图,该地图可以是三维地图,即包括建筑物高度信息,或点云数据。第二设备在地图上的主要道路上任意放置第一设备标志物,形成场景信息表达(应理解,这里的场景信息表达由多个第一信息组成)。进一步的,第一消息或消息B中还包括第一设备的主要移动范围,从而第二设备可以获得第一设备更具体的场景信息表达,如第一设备的主要移动范围为子网格1,则第二设备获得的场景信息表达可以是图6a所示。其中,图6a是本申请实施例提供的场景信息表达的一示意图;图6b是本申请实施例提供的场景信息表达的另一示意图;图6c是本申请实施例提供的场景信息表达的又一示意图。
表3
应理解,当第一信息是地图时,需要第一设备和第二设备可以访问同样的地图数据,并对地图规定同样的网格划分。对主要道路、楼栋建筑物、楼层等规定有同样的理解。比如,第一设备和第二设备访问地图数据库的接口,向接口发送获取地图数据的指令,指令包含了场景序号(即第一信息的标识)、第二设备所在位置、第一设备所在位置等信息。地图数据库的接口根据这些指令信息,反馈统一的地图数据给第二设备和第一设备。地图数据库内部规定了如何根据指令反馈统一的地图数据,例如,地图数据以每500m为粒度在经度和纬度上划分了网格,以第一设备所处经纬度查找网格,获得该网格的500m*500m的地图数据。地图数据库根据道路宽度划分主要道路、小路、快速路等,并根据指令输入反馈对应道路的位置。地图数据库可以对每个网格内的购物中心编号,并按照室内地图区分各个楼层。地图数据库可以保证第二设备和第一设备可以获取同样的场景信息表达。也就是说,地图数据库可以保证第二设备和第一设备可以获取同样的第一信息。
可见,本申请实施例通过尽可能压缩指示第一生成器所支持的输入和第三生成器所支持的输入,只在第一消息(或消息B)中携带第一信息的标识,在第三消息(或消息D)中携带第四信息的标识,可以减少空口资源的开销。
可选的,如果上述第一消息或消息B指示第一生成器所支持的输入,通过在该第一消息或消息B中携带第一类型或第一类型的标识来实现,换句话说,如果第一消息或消息B中包括第一类型或第一类型的标识,则第二设备根据信息类型与信息的映射关系,获取该第一类型的多个第一信息或获取与该第一类型的标识对应的多个第一信息。其中,类型与信息的映射关系表可以标准化,并预存在第二设备中。或者,第二设备预存的不是类型和信息的映射关系,而是类型和如何获取该类型对应的信息的方法的映射。第二设备根据第一消息或消息B中包括的第一类型或第一类型的标识,查找与该第一类型对应的信息的获取方法,按照查找到的方法获取多个第一信息。
例如,当第一设备和第二设备在通信中,第一设备的信道传输环境就是第二设备的信道传输环境,尤其是在时分复用(TDD)系统中,第一设备的测量信道和第二设备的测量信道具有相似的分布。此时,如果第一消息或消息B中指示第一类型为无线信道特征类时,第二设备根据这个类型,可以通过信道测量的方法,获得该类型对应的信道作为第一信息。
可选的,如果上述第一消息或消息B指示第一生成器所支持的输入,通过在该第一消息或消息B中携带第一生成器的标识来实现,换句话说,如果第一消息或消息B中包括第一生成器的标识,则第二设备根据生成器标识与信息类型的映射关系,确定该第一生成器的标识对应的信息类型,再从预定义的信息类型与信息的映射关系,获取该第一生成器的标识对应的信息类型所对应的多个第一信息。其中,生成器标识与信息类型的映射关系,和信息类型与信息的映射关系,均可标准化,并预存在第二设备中。应理解,上述第三消息(或消息D)与第一消息(或消息B)同理,如果上述第三消息或消息D指示第三生成器所支持的输入,通过在该第三消息或消息D中携带第三生成器的标识来实现,换句话说,如果第三消息或消息D中包括第三生成器的标识,则第二设备根据生成器标识与信息类型的映射关系,确定该第三生成器的标识对应的信息类型,再从预定义的信息类型与信息的映射关系,获取该第三生成器的标识对应的信息类型所对应的多个第四信息。
一个示例中,假设第一信息是场景类信息。假设可能的场景类信息有64种,生成器ID隐含指示第一信息的类型,该类型的标识可以是生成器ID的数值除以64得到余数m。这样既保证了生成器ID的唯一性,又隐含指示了第一信息的类型,从而隐含指示第一信息。
可见,本申请实施例通过在生成器ID中隐含指示第一信息的类型,以使第二设备根据该类型获取第一信息,避免了单独的第一信息的上传和下发,可以节省信令开销和空口资源。
可选的,如果上述第一消息只指示第一生成器的全部或部分,不指示该第一生成器所支持的输入,也就是说,第一设备只告诉第二设备第一生成器的全部或部分,既不告诉该第一生成器的标识也不告诉第一信息。第二设备已知第一设备的一些信息。第二设备可以根据已知的第一设备的信息,推测第一设备在训练第一神经网络时使用的训练样本(此训练样本中包括了第一信息)。
一个示例中,假设第一信息是用户画像和场景类信息。假设第二设备已知第一设备的大致活动范围,第一设备的行为画像等信息,则第二设备可以推测出第一设备在训练第一神经网络时使用的第一信息。此时,第一设备不需要发送与第一信息相关的信息,只需要发送第一生成器,由第二设备在内部自动为该第一生成器添加相应的信息。同样,第二设备在下发第二生成器时,也可以不发送第四信息,第一设备收到第二生成器时,默认配置该第二生成器用于当前的场景或预设的场景或请求的场景下。其中,第二设备发送第二消息之前,可以接收来自第一设备的第一请求,用于请求某个场景对应的生成器。第二设备可以下发适用于各种场景下的第二生成器,也可以下发仅使用该某个场景下的生成器。
可选的,如果上述第一消息指示第一生成器的全部(即该第一消息中携带第一生成器的结构、权值和偏置值),则第二设备获得完整的第一生成器。如果上述第一消息指示第一生成器的部分(比如,第一消息中包括第一生成器的结构、部分层的权值和偏置值),则第二设备只能获得第一生成器的部分,则第二设备利用获取到的第一类型的多个第一信息和每个第一信息对应的第二类型的第三信息训练该第一生成器,从而还原第一生成器的另外部分,得到第一生成器的完整参数。
可选的,上述第三消息与上述第一消息同理,如果上述第三消息指示第三生成器的全部(即该第三消息中携带第三生成器的结构、权值和偏置值),则第二设备获得完整的第三生成器。如果上述第三消息指示第三生成器的部分(比如,第三消息中包括第三生成器的结构、部分层的权值和偏置值),则第二设备只能获得第三生成器的部分,则第二设备利用获取到的第一类型的多个第四信息和每个第四信息对应的第二类型的第六信息训练该第三生成器的另外部分层,从而还原第三生成器的另外部分,得到第一生成器的完整参数。
可选的,该第二消息或该第四消息用于指示该第二生成器的全部可通过在该第二消息或该第四消息中携带第二生成器的所有神经元之间的连接关系(即第二生成器的结构)、权值和偏置值来实现。该第二消息或第四消息指示第二生成器的部分,可通过在该第二消息或第四消息中携带第二生成器的结构(指所有层神经元之间的连接关系)和部分层的权值和偏置值来实现。
应理解,如果第二消息或第四消息指示第二生成器的全部(比如,第二消息或第四消息中包括第二生成器的结构、权值和偏置值),则第一设备和第三设备可以获得完整的第二生成器,无需第一设备和第三设备再次训练。如果第二消息或第四消息指示第二生成器的部分(比如,第二消息或第四消息中包括第二生成器的结构、部分层的权值和偏置值),则第一设备或第三设备只能获得第二生成器的部分,第一设备或第三设备需要还原第二生成器的另外部分,以得到第二生成器的完整参数。
可选的,该第二消息指示第二生成器所支持的输入,可通过在该第二消息中携带第四信息、第四信息的标识、第一类型、第一类型的标识中的一个或多个来实现,还可通过在该第二消息中携带第二生成器的标识来实现。该第二生成器的标识与该第二生成器所支持的输入(即第一类型的第一信息和第四信息)对应。虽然第二生成器所支持的输入包括第一类型的第一信息和第四信息,但因为第二消息是发送给第一设备的,所以可以不用在第二消息中携带与第一信息相关的信息。应理解,如果第二消息包括第四信息的标识、第一类型、或第一类型的标识、第二生成器的标识中的一个或多个,第一设备则需要根据该第二消息携带的这一个或多个信息去获取第四信息。
应理解,该第四消息与该第二消息同理。该第四消息指示第二生成器所支持的输入,可通过在该第四消息中携带第一信息、第一信息的标识、第一类型、第一类型的标识中的一个或多个来实现,还可通过在该第四消息中携带第二生成器的标识来实现。该第二生成器的标识与该第二生成器所支持的输入(即第一类型的第一信息和第四信息)对应。虽然第二生成器所支持的输入包括第一类型的第一信息和第四信息,但因为第四消息是发送给第三设备的,所以可以不用在第四消息中携带与第四信息相关的信息。应理解,如果第四消息包括第一信息的标识、第一类型、或第一类型的标识、第二生成器的标识中的一个或多个,第三设备则需要根据该第四消息携带的这一个或多个信息去获取第一信息。
可选的,该第二生成器所支持的输入为第一类型的信息,输出为第二类型的信息。其中,第一类型和第二类型的含义可参考步骤S101中关于“第一类型”和“第二类型”的相应描述,此处不再赘述。
可理解的,步骤S104和步骤S105的执行顺序不做限定。既可以是步骤S104在前,步骤S105在后;也可以是步骤S105在前,步骤S104在后;还可以是步骤S104和步骤S105同时或并行执行。
S106,第一设备接收该第二消息。
S107,第三设备接收该第四消息。
具体地,第一设备接收来自第二设备的第二消息。第三设备接收来自第二设备的第四消息。该第二消息和该第四消息用于指示第二生成器的全部或部分,可选的还指示第二生成器所支持的输入。该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,该第四信息与该第一信息不同且第一生成器和第二生成器不同。
可选的,如果上述第二消息或上述第四消息指示第二生成器的全部(即该第二消息或该第四消息中携带第二生成器的结构和权值),则第一设备或第三设备获得完整的第二生成器。如果上述第二消息或上述第四消息指示第二生成器的部分(比如,第二消息或第四消息中包括第二生成器的结构和部分层的权值),则第一设备或第三设备只能获得第二生成器的部分。第一设备利用获取到的多个第三训练样本和多个第四训练样本该第二生成器的另外部分层,或者,第三设备利用获取到的多个第三训练样本和多个第四训练样本训练该第二生成器的另外部分层,以得到第二生成器的另外部分层的权值。
可选的,第一设备接收上述第二消息之后,可以基于该第二生成器所支持的输入将第一类型的第四信息输入该第二生成器生成第二类型的第五信息。也就是说,第一设备在获得第二生成器后,可以利用该第二生成器生成第一设备未训练过的场景下的信息。
一个示例中,假设第一生成器是在室内环境,如室内购物中心中训练得到,即训练时使用的第一信息和第三信息均为第一设备在该室内购物中心内采集的信息。假设第三生成器是在室外环境,如街道中训练得到,即训练时使用的第四信息和第六信息均为第三设备在该街道上采集的信息。假设第一设备预判出自己将从室内购物中心移动到街道上,或者第一设备已经从室内购物中心移动到街道上,则第一设备可以将第四信息输入第二生成器生成第五信息,以辅助第一设备在街道上的通信,调整第一设备的通信参数。
例如,第一设备将街道上的建筑物布局图和用户设备的可能位置输入第二生成器,生成大量信道冲击响应,将这些信道冲击响应作为信道模型输入第一设备内的链路仿真器,利用强化学习等机器学习的方法探索该信道模型下的更优的物理层参数,如信道编码配置参数。将探索得到的更优的信道编码配置参数用于第一设备在街道上的通信中。
可理解的,步骤S106和步骤S107的执行顺序不做限定。既可以是步骤S106在前,步骤S107在后;也可以是步骤S107在前,步骤S106在后;还可以是步骤S106和步骤S107同时/并行执行。
可见,本申请实施例通过充分利用通信设备(即第一设备或第三设备)采集的信息,把这些信息用来训练生成模型,以使这个生成模型可以用一部分信息生成(或推理、预测)出另一部分信息,从而通信辅助探测、探测辅助通信,使通信网络向着更智能化、更自适应的方向发展。另外,本申请实施例还通过汇总多个通信设备(即前述第一设备和第三设备)的生成模型,把它们训练成一个多场景的生成模型(即第二生成器),通过不断地汇总训练,在通信网络中,这个生成模型逐渐自动演进为全场景生成模型。不仅可以解决单个通信设备采集的信息太过单一的问题,还可以快速提升生成模型的泛化能力。此外,全场景生成模型和多个单场景生成模型相比,由于神经网络的复杂度并不因为功能的叠加成线性叠加,即,即使功能叠加了,一个全场景生成模型的神经网络的参数相比多个单场景生成模型的神经网络的参数总和少很多,因而,可以减少神经网络的参数的存储需求及空口传输需求。
实施例二
本申请实施例二主要介绍第一设备中第一神经网络,或第一神经网络和第二神经网络的训练方法。应理解,第三设备中第五神经网络和/或第六神经网络的训练方法与第一设备中第一神经网络和/或第二神经网络的训练方法类似,此处不再赘述。
可选的,第一设备中包括生成单元和判别单元,分别对应第一神经网络和第二神经网络。参见图7,图7是本申请实施例提供的生成单元和判别单元的自学习框图。下面分别介绍这两个单元的输入和输出,以及如何利用已知信息(如上述第一信息)生成未知信息(如上述第二信息)。如图7所示,待学习信息(如上述第三信息)和已知信息(如上述第一信息)拼接后输入判别单元,判别单元通过训练不断缩小判别单元的输出和真值的差距。已知信息和隐空间中的信息拼接后输入生成单元,生成单元输出伪信息。伪信息和已知信息拼接后输入判别单元,判别单元通过训练不断缩小判别单元的输出和伪值的差距,生成单元通过训练不断缩小判别单元的输出和真值的差距。通过判别单元和生成单元的训练,最终生成单元根据已知信息生成的伪信息和该已知信息对应的待学习信息非常接近。此时判别单元不能正确判断输入的信息是生成单元生成的,还是真实的待学习信息。换句话说,生成单元的学习目标是尽可能的使输出的伪信息与真实的待学习信息相似,来欺骗判别单元,即,使判别单元无法区分输入的信息是生成单元生成的,还是真实的待学习信息。
其中,上述生成单元和上述判别单元的实现方式可以是神经网络,并且可以采用任意的神经网络结构,如卷积神经网络、全连接神经网络、基于注意力机制的神经网络、长短期记忆神经网络等。此时,生成单元可以称为生成网络、判别单元可以称为判别网络。生成网络的输出比较灵活,可以根据不同类型的已知信息做出相应的改变。判别网络的输出相对固定,一般只输出一个值,这个值跟真值标签更接近时,则认为判别网络判断该输入为真值,反之,这个输出值跟伪值标签更接近时,认为判别网络判断该输入为伪值。比如,判别网络的输出为0到1之间的一个值,真值标签为1,伪值标签为0,当判别网络的输出的值越接近1,说明判别网络判断判别网络的输入为真值的可能越大,当判别网络的输出的值越接近0,说明判别网络判断判别网络的输入为伪值的可能越大。
拼接是指两个数据通过增加某一维的维度的方式结合在一起,变成一个多维数据。例如,当已知信息为一个256*256的灰度图像时,它的数据量为256*256个,是一个二维矩阵。设计随机噪声(或随机噪声,或隐空间)的维度同样为256*256,即随机噪声包含256*256个随机值,也是一个二维矩阵。此时,拼接随机噪声和已知信息,组成了一个256*256*2的三维张量,三维张量的第三维的维度为2,分别对应随机噪声和已知信息。
下面将具体介绍第一神经网络和第二神经网络的训练方法。
参见图8,图8是本申请实施例提供的一种神经网络的训练方法的示意流程图。该神经网络的训练方法可以应用于通信设备中,具体可以应用在第一设备或第三设备中,图8以第一设备为例进行介绍。如图8所示,该神经网络的训练方法包括但不限于以下步骤:
S201,第一设备获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、该第一信息对应的第三信息组成一个第一训练样本。
具体地,第一设备采集多个第一类型的第一信息,和每个第一信息对应的第二类型的第三信息。应理解,第一信息和第三信息均为真实环境中采集到的不同类型的信息。可选的,第一设备生成隐空间。应理解,隐空间(latent space)是指随机噪声,本申请中采用高斯分布的随机向量。第一设备将一个第一信息、和该第一信息对应的第三信息作为一个训练样本,记为第一训练样本,从而可以得到多个第一训练样本。可选的每个第一训练样本中还可以包括从该隐空间中随机选择的一个数据。该多个第一训练样本各不相同。应理解,第一训练样本的数量等于第一信息的数量。
比如,第一设备采集第一信息可以包括第一设备通过相机拍摄获取的环境图像和第一设备通过全球定位系统获得的地理位置信息,第一设备采集第三信息可以是第一设备在当前环境和地理位置下测量的信道冲击响应。
一个示例中,第一信息是第一设备所处环境的环境图像(比如俯瞰图)和第一设备的地理位置信息(比如,全球定位系统获取到的位置)。第三信息是第一设备在所处环境和地理位置情况下测量信道的功率时延谱。其中,第一信息对应的第一类型是用户画像和场景类,第三信息对应的第二类型是无线信道特征类。
另一个示例中,第一信息是第一设备所处环境的环境图像(比如俯瞰图)和第一设备在所处环境和地理位置情况下测量信道的信道冲击响应。第三信息是第一设备在所处环境中的真实地理位置信息(比如,全球定位系统获取到的位置)。其中,第一信息对应的第一类型是无线信道特征和场景类,第三信息对应的第二类型是用户画像类。
又一个示例中,第一信息是第一设备所处环境的环境图像和第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,第三信息是当前小区的人流量分布。或者,第一信息是第一设备当前的信道信息,第三信息是佩戴该第一设备的用户的心率分布。或者,第一信息是第一设备(第一设备为车载终端)测量的信道信息,第三信息是车辆与障碍物的距离分布。其中,第一信息对应的第一类型是无线信道特征类,第三信息对应的第二类型是用户画像类或场景类。
S202,第一设备利用多个第一训练样本训练第一神经网络,得到第一生成器,该第一生成器为训练完成的第一神经网络。
具体地,第一设备将第一训练样本中的第一信息和从隐空间中随机选择的数据作为第一神经网络的输入;将第一神经网络的输出和第一训练样本中的第三信息作为第一损失函数的输入;利用第一损失函数的输出计算第一神经网络的梯度,利用梯度下降算法训练第一神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。训练完成的第一神经网络记为第一生成器,也就是说,该第一生成器的结构与训练完成的第一神经网络的结构相同,且该第一生成器的权值和偏置值与训练完的第一神经网络的权值和偏置值也相同。
可选的,第一设备利用多个第一训练样本训练第一神经网络(即GAN中的生成器)和第二神经网络(即GAN中的判别器),分别得到第一生成器和第一判别器。训练完成的第一神经网络记为第一生成器,训练完成的第二神经网络记为第一判别器。也就是说,该第一生成器的结构、权值和偏置值、与训练完成的第一神经网络的结构、权值和偏置值相同,该第一判别器的结构、权值和偏置值、与训练完成的第二神经网络的结构、权值和偏置值相同。其中,在训练过程中:第一训练样本中的第一信息和从隐空间中随机选择的数据作为第一神经网络的输入;第一神经网络的输出和第一信息输入第二神经网络,得到第一输出;该第一信息和该第一信息对应的第三信息输入第二神经网络,得到第二输出;其中,第一神经网络的输出和第一信息,以及,该第一信息和该第一信息对应的第三信息是分时输入第二神经网络的;第一输出和第一标签(即伪值标签)输入第二损失函数,得到第二损失函数输出;第二输出和第二标签(即第一真值标签)输入第三损失函数,得到第三损失函数输出;第一输出和第三标签(即第二真值标签,可以和第一真值标签相同或不同)输入第四损失函数,得到第四损失函数输出;利用第二损失函数输出和第三损失函数输出计算第二神经网络的梯度,利用梯度下降算法训练第二神经网络;利用第四损失函数输出计算第一神经网络的梯度,利用梯度下降算法训练第一神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。训练完成的第一神经网络记为第一生成器,训练完成的第二神经网络记为第一判别器。
可选的,当以下任一情形或类似情形发生时,需要重新训练第一生成器:a、第一设备最初训练生成器时的场景信息发生变化,比如,当第一设备处于同样的地理位置时,其周边环境发生了变化,如以前是空旷室外,现在有很多建筑物,或是,比如以前是草坪,现在种了很多高大的树木。b、第一设备最初训练生成器时使用的数据量较少。c、第一设备最初训练生成器时的神经网络结构发生变化,其中,神经网络结构是指神经元之间的连接关系。d、最初训练生成器时的设备与当前设备的参数差别较大。如两个设备的设备参数差别较大,例如一个设备为4天线,另一个设备为64天线。e、最初训练生成器时第一设备的行为与当前设备的行为不相同,如一个设备为步行速度,另一个设备为骑行速度。也即,场景,用户画像或无线信道特征中的一项或多项发生的变化使得这些类型的信息输入生成器后获得的输出偏离了真实分布,则,生成器需重新被训练。
一种实现方式,当第一设备自己发现需要重新训练第一生成器,或者,收到第二设备重新训练第一生成器的请求,比如,第一更新指示时,可以重新获取第一类型的多个第七信息,和每个第七信息对应的第二类型的第八信息,可选的获取隐空间。利用这多个第七信息、每个第七信息对应的第八信息、以及隐空间重新训练第一生成器,并将重新训练完成的第一生成器通过信令发送给第二设备。应理解,这里的第七信息等效于上述第一信息,第八信息等效于上述第三信息。
其中,根据第一更新指示的具体内容或第一设备的预先设定,第一设备可以选择从零开始重新训练第一生成器,或者在原第一生成器的基础上继续训练。第一设备还可以根据第一更新指示的具体内容,选择利用历史数据训练第一生成器,或者采集新数据训练第一生成器。
可见,本申请实施例利用采集到的信息来训练生成模型,以使这个生成模型可以用一部分信息生成(或推理、预测)出另一部分信息,从而实现通信辅助探测、探测辅助通信,使通信网络向着更智能化、更自适应的方向发展。
为便于理解第一神经网络的训练方式,下面举例说明。以下示例中,第一信息为第一设备所处环境的环境图像和第一设备的地理位置信息,第三信息为真实信道(即第一设备在所处环境和地理位置情况下测量信道的信道冲击响应)。
一个示例中,第一神经网络为生成对抗网络中的生成器,第二神经网络为生成对抗网络中的判别器。
开始第一次迭代(每次迭代重复以下步骤):
(1)从数据集中加载一个数据组(batch),该数据组包含batch_size(数据组大小)个样本。其中,每个样本中包含一个第一信息和该第一信息对应的真实信道(即第三信息),样本等同于真实值(real)。第一信息包括环境图像和用户位置(这里的用户位置就是第一设备的地理位置)。
(2)真实值(即第一信息和真实信道)输入第二神经网络(或生成对抗网络中的判别器D),输出outD_real(即得到第二输出)。
(3)outD_real(即第二输出)和真值标签(即第二标签)计算损失值lossD_real,损失函数(即第三损失函数)采用交叉熵,真值标签为1。
(4)根据lossD_real(即第三损失函数输出)回传计算梯度。
(5)产生batch_size份高斯分布随机向量z(即隐空间)。
(6)用z替换样本中的真实信道,形成第一伪样本。也就是说,第一伪样本中包括第一信息和高斯分布随机向量。
(7)第一伪样本输入第一神经网络(或生成对抗网络中的生成器G),输出信道伪值(fake)。
(8)用第一神经网络输出的伪值替换样本中的真实信道,形成第二伪样本,第二伪样本输入第二神经网络,输出outD_fake(即得到第一输出)。也就是说,第二伪样本中包括第一神经网络的输出和第一信息。
(9)outD_fake(即第一输出)和伪值标签(即第一标签)计算损失值lossD_fake,损失函数(即第二损失函数)采用交叉熵,伪值标签为0。
(10)根据lossD_fake(即第二损失函数输出)回传计算梯度。
(11)根据步骤(4)和步骤(10)计算的梯度值使用Adam优化器更新第二神经网络的参数(这里指权值和偏置值)。
(12)第二伪样本输入第二神经网络,输出outDG。
(13)outDG和真值标签(即第三标签)计算损失值lossDG(即第四损失函数输出),损失函数采用交叉熵,真值标签为1。
(14)第二伪样本和样本计算平均绝对误差,得到l1loss。
(15)lossMix=lossDG+l1loss。
(16)根据lossMix回传计算梯度。
(17)根据步骤(16)计算的梯度值使用Adam优化器更新第一神经网络和第二神经网络的参数(这里指权值和偏置值)。
其中,损失函数(loss function)或称代价函数、目标函数,代表对输入做某种计算后输出一个目标值,训练的目的可以是最小化该目标值,或最大化该目标值。损失函数可以是一个公式,例如,损失函数可以是均方误差公式,对输入的两组值计算均方误差。
上述根据损失计算梯度,是指为了让训练朝更优的方向进行,一般需要使损失函数最小化,而计算损失函数的梯度可以找到让损失函数下降程度最大的方向,从而更快的实现损失函数最小化这个目标。沿着这个梯度方向更新神经网络参数,就是在原有的神经网络参数基础上减去学习速率乘以损失函数的导数(参见前述公式(1-6)所示)。其中,学习速率可以是预设的,代表沿着这个梯度方向下降的快慢,值越小则下降越慢。
应理解,上述示例仅介绍了单次迭代过程,实际训练过程中,可以迭代多次,直至训练达到预设条件时,停止迭代,结束训练,此时说明训练完成。
还应理解,第二设备中第三神经网络的训练流程与第一神经网络的上述训练流程相同,不同之处在于数据集中的每个样本的真实信道由第一生成器根据第一信息生成。
作为一个可选实施例,由于生成器是由神经网络组成的,神经网络又有很多层,每一层包含多个神经元,神经元与神经元之间的连接具有权值,每个神经元具有偏置值。所以,为了减小传输生成器的开销,一种可能的实现方式中,生成器对应的神经网络在训练时可以保持至少一层的权值和偏置值固定不变,仅训练权值和偏置值没有固定的层。例如,处于同一办公室的多个通信设备,他们的场景信息非常接近,如果完全单独训练,对计算资源和频谱资源的消耗比较大,此时,所有通信设备都可以采用预存在通信设备内的适合于该场景的预训练神经网络,在该预训练神经网络的基础上微调,通过输入自身采集的信息,改变该预训练神经网络的部分权值和偏置值。这样,每个通信设备只需要分享微调之后改变的部分权值和偏置值即可,不需要发送全部的权值和偏置值。
另一种可能的实现方式中,如果通信设备内没有预存适合于当前场景的预训练神经网络,则可以由第二设备发送全场景生成器(如上述第二生成器)或历史上同一场景其它通信设备训练完成的生成器给当前通信设备。发送时可以只发送生成器的部分权值和偏置值,由通信设备训练剩余的部分权值和偏置值。
例如,假设生成器是五层的神经网络结构,第二设备发送前三层给所有通信设备。每个通信设备收到前三层之后,固定前三层,只训练后两层,并将训练完成的后两层的权值和偏置值发送给第二设备。
可见,在训练时固定一部分层的权值和偏置值,只训练另一部分层的权值和偏置值,可以保证各个通信设备的生成器的固定层部分统一,还可以减少上行发送开销。
可选的,生成器每次更新时,可以只更新一层的权值和偏置值。比如,通信设备确定生成器需要更新时,利用不断采集的数据继续训练生成器,但固定前四层的权值和偏置值,只训练后一层的权值和偏置值,在训练完成后,只需要向第二设备发送生成器的后一层的权值和偏置值,不需要重复发送前四层的权值和偏置值。这样可以大大减小空口开销。
实施例三
本申请实施例三主要介绍第二设备中第三神经网络,或,第三神经网络和第四神经网络的训练方法。
参见图9,图9是本申请实施例提供的另一种神经网络的训练方法的示意流程图。该神经网络的训练方法可以应用于网络设备中,具体可以应用在第二设备中。如图9所示,该神经网络的训练方法包括但不限于以下步骤:
S301,第二设备获取第一类型的多个第一信息和第一类型的多个第四信息。其中,一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集。
具体地,第二设备获取第一类型的多个第一信息和该第一类型的多个第四信息,其获取方式可参考前述实施例一中的相应描述,此处不再赘述。应理解,第一信息和第四信息均为真实环境中采集到的同种类型的不同信息。可选的,第二设备生成隐空间。应理解,隐空间(latent space)是指随机噪声,本申请中采用高斯分布的随机向量。第二设备将一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,从而得到多个第三训练样本;并将一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息作为一个第四训练样本,从而得到多个第四训练样本。第二设备将该多个第三训练样本和该多个第四训练样本作为一个训练样本集。可选的,每个第三训练样本还包括一个从隐空间中随机选择的信息;每个第四训练样本还包括一个从隐空间中随机选择的信息。该训练样本集中的每个训练样本各不相同。
一个示例中,第一信息是第一设备所处环境的环境图像(比如俯瞰图)和第一设备的地理位置信息(比如,全球定位系统获取到的位置)。第二信息是第一生成器根据输入的环境图像和地理位置信息,输出/生成的信道的功率时延谱。同理,第四信息是第三设备所处环境的环境图像和第三设备的地理位置信息。第五信息是第三生成器根据输入的环境图像和地理位置信息,输出/生成的信道的功率时延谱。其中,第一信息和第四信息对应的第一类型是用户画像和场景类,第二信息和第五信息对应的第二类型是无线信道特征类。
另一个示例中,第一信息是第一设备所处环境的环境图像(比如俯瞰图)和第一设备在所处环境和地理位置情况下测量信道的信道冲击响应。第二信息是第一生成器根据输入的环境图像和测量信道的信道冲击响应,输出/生成的第一设备的地理位置信息。同理,第四信息是第三设备所处环境的环境图像和第三设备在所处环境和地理位置情况下测量信道的信道冲击响应。第五信息是第三生成器根据输入的环境图像和测量信道的信道冲击响应,输出/生成的第一设备的地理位置信息。其中,第一信息和第四信息对应的第一类型是无线信道特征和场景类,第二信息和第五信息对应的第二类型是用户画像类。
又一个示例中,第一信息是第一设备所处环境的环境图像和第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,第二信息是第一生成器根据输入的环境图像,生成的人流量分布。同理,第四信息是第三设备所处环境的环境图像和第三设备在所处环境和地理位置情况下测量信道的信道冲击响应,第五信息是第三生成器根据输入的环境图像生成的人流量分布。或者,第一信息是第一设备当前的信道信息,第二信息是第一生成器根据输入的信道信息,生成的佩戴该第一设备的用户的心率分布。同理,第四信息是第三设备当前的信道信息,第五信息是第三生成器根据输入的信道信息,生成的佩戴该第三设备的用户的心率分布。或者,第一信息是第一设备(第一设备为车载终端)测量的信道信息,第二信息是第一生成器根据输入的信道信息输出的车辆与障碍物的距离分布。同理,第四信息是第三设备(第三设备也是车载终端)测量的信道信息,第五信息是第三生成器根据输入的信道信息输出的车辆与障碍物的距离分布。其中,第一信息和第二信息对应的第一类型是无线信道特征类,第二信息和第五信息对应的第二类型是用户画像类或场景类。
S302,第二设备利用该训练样本集中的多个训练样本训练第三神经网络,得到第二生成器,该第二生成器为训练完成的第三神经网络。
具体地,第二设备将上述训练样本集中训练样本的第一信息/第四信息、和从隐空间中随机选择的数据作为第三神经网络的输入;将第三神经网络的输出和该第一信息输入第一生成器得到的第二信息/该第四信息输入第三生成器得到的第五信息作为第五损失函数的输入;利用第五损失函数的输出计算第三神经网络的梯度,利用梯度下降算法训练第三神经网络。当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。训练完成的第三神经网络记为第二生成器,也就是说,该第二生成器的结构与训练完成的第三神经网络的结构相同,且该第二生成器的权值和偏置值与训练完的第三神经网络的权值和偏置值也相同。
可选的,第二设备利用训练样本集中的多个训练样本训练第三神经网络(即GAN中的生成器)和第四神经网络(即GAN中的判别器),分别得到第二生成器和第二判别器。训练完成的第三神经网络记为第二生成器,训练完成的第四神经网络记为第二判别器。也就是说,该第二生成器的结构、权值和偏置值、与训练完成的第三神经网络的结构、权值和偏置值相同,该第二判别器的结构、权值和偏置值、与训练完成的第四神经网络的结构、权值和偏置值相同。
其中,在训练过程中,以单次迭代过程为例,假设本次迭代从训练样本集中取到的是某个第三训练样本:上述训练样本集中训练样本的第一信息、和从隐空间中随机选择的数据作为第三神经网络的输入;第三神经网络的输出和第一信息输入第四神经网络,得到第三输出;第一信息和该第一信息输入第一生成器得到的第二信息输入第四神经网络,得到第四输出;其中,第三神经网络的输出和第一信息,以及,第一信息和该第一信息输入第一生成器得到的第二信息,是分时输入第四神经网络的;第三输出和第四标签(即,伪值标签)输入第六损失函数,得到第六损失函数输出;第四输出和第五标签(即,真值标签1)输出第七损失函数,得到第七损失函数输出;第三输出和第六标签(即,真值标签2,可以和真值标签1相同或不同)输入第八损失函数,得到第八损失函数输出;利用第六损失函数输出和第七损失函数输出计算第四神经网络的梯度,利用梯度下降算法训练第四神经网络;利用第八损失函数输出计算第三神经网络的梯度,利用梯度下降算法训练第三神经网络。
应理解,如果训练过程中,下次迭代时从训练样本集中取到的是某个第四训练样本,则前述迭代过程中的第一信息替换为第四信息,第一生成器替换为第三生成器,第二信息替换为第五信息。
当训练达到预设条件时,结束训练,此时训练完成。预设条件可以是以下一个或多个:损失函数的值达到预设值,训练使用的训练样本总数达到预设值,训练的时间达到预设值,训练的次数达到预设值等。训练完成的第三神经网络记为第二生成器,训练完成的第四神经网络记为第二判别器。
可选的,上述第二生成器用于支持根据第一信息生成第二类型的第二信息,根据第四信息生成第二类型的第五信息。
可见,因为第三神经网络的训练样本集中既有第一设备采集的信息,也有第三设备采集的信息,所以通过第三神经网络的训练可以把收集的各个生成器的输入输出映射学到一个统一的模型中,训练完成的第二生成器同时具有第一生成器对第三信息的分布模拟能力和第三生成器对第六信息的分布模拟能力。
为便于理解第三神经网络的训练方式,下面举例说明。以下示例中,第一信息为第一设备所处环境的环境图像和第一设备的地理位置信息,第二信息为该第一信息输入第一生成器得到的信道冲击响应(或称为伪信道);第四信息为第三设备所处环境的环境图像和第三设备的地理位置信息,第五信息为该第四信息输入第三生成器得到的信道冲击响应(或称为伪信道)。
一个示例中,第三神经网络为生成对抗网络中的生成器,第四神经网络为生成对抗网络中的判别器。参见图10,图10是本申请实施例提供的第三神经网络的训练框图。第二设备接收来自第一设备的多个第一信息和第一生成器,并接收来自第三设备的多个第四信息和第三生成器。如图10所示,每次迭代重复以下步骤:
(1)第一信息和从隐空间随机选取的一个数据输入第一生成器,输出第一伪信道(即第二信息)。或者,第四信息和从隐空间随机选取的一个数据输入第三生成器,输出第三伪信道(即第五信息)。
(2)第一信息(或者第四信息)和从隐空间随机选取的一个数据输入第三神经网络(生成对抗网络中的生成器G),输出第二伪信道。
(3)第一伪信道(或者第三伪信道)和第一信息(或者第四信息)输入第四神经网络(生成对抗网络中的判别器D),输出第一判别结果(即第四输出)。
(4)第二伪信道和第一信息(或者第四信息)输入第四神经网络,输出第二判别结果(即第三输出)。
(5)第一判别结果(即第四输出)和标签A(即第五标签,真值标签1)输入损失函数A(即第七损失函数),得到损失A(即第七损失函数输出)。损失函数A为交叉熵。
(6)第二判别结果(即第三输出)和标签B(即第四标签,伪值标签)输入损失函数B(即第六损失函数),得到损失B(即第六损失函数输出)。损失函数B为交叉熵。
(7)第二判别结果(即第三输出)和标签A(即第六标签,真值标签2)输入损失函数C(即第八损失函数),得到损失C(即第八损失函数输出)。损失函数C为交叉熵。
(8)第一伪信道(或者第三伪信道)和第二伪信道输入损失函数D,得到损失D。损失函数D为交叉熵。
(9)损失A和损失B相加得到第四神经网络的损失。
(10)损失C和损失D相加得到第三神经网络的损失。
(11)基于第四神经网络的损失计算第一梯度,并利用优化器(基于随机梯度下降的任意优化器,如Adam优化器)和第一梯度更新第四神经网络参数(这里指权值和偏置值)。
(12)基于第三神经网络的损失计算第二梯度,并利用优化器(基于随机梯度下降的任意优化器,如Adam优化器)和第二梯度更新第三神经网络参数(这里指权值和偏置值)。
可选的,上述步骤(7)计算损失C时,也可以是第二判别结果和标签C输入损失函数C,得到损失C。标签A为1,标签B为0,标签C为-1。
上述步骤(8)计算损失D时,可以是:第一伪信道(或者第三伪信道)和第二伪信道先输入信道特征提取器中,分别得到第一伪信道特征(或者第三伪信道特征)和第二伪信道特征,再将第一伪信道特征(或者第三伪信道特征)和第二伪信道特征输入损失函数D,得到损失D。该信道特征提取器也可以是一个神经网络。
上述步骤(10),还可以是:直接将损失C作为第三神经网络的损失。
应理解,上述示例仅介绍了单次迭代过程,实际训练过程中,可以迭代多次,直至训练达到预设条件时,停止迭代,结束训练,此时说明训练完成。
还应理解,每次迭代时均是从多个第一信息和多个第四信息中随机选取一个信息开始,如果选到的是第一信息,则上述步骤(1)至步骤(12)相应地采用第一信息;如果选到的是第四信息,则上述(1)至步骤(12)相应地采用第四信息。
可见,第二设备训练时,可以不需要真实的测量信道作为判别器的真实值输入,而是用第一设备和第三设备训练完成的第一生成器和第三生成器,生成与真实信道极为相似的伪信道作为真实值输入,可以减小空口上发送真实测量信道的开销,即发送兆字节(Mbyte,MB)量级生成器替代发送吉字节(Gigabyte,GB)量级真实测量信道。
结合前述实施例二和前述实施例三的一个示例,介绍在不同设备中训练神经网络时的输入和输出。参见图11,图11是本申请实施例提供的不同设备中神经网络的输入输出示意图。如图11所示,第一信息为第一设备所处环境的环境图像(或称为第一环境图像)和第一设备的地理位置信息(或称为第一用户位置),第四信息为第三设备所处环境的环境图像(或称为第三环境图像)和第三设备的地理位置信息(或称为第三用户位置)。第三信息为真实信道的功率时延谱(即第一设备在所处环境和地理位置情况下测量信道的功率时延谱),第六信息也为真实信道功率时延谱(即第三设备在所处环境和地理位置情况下测量信道的信道功率时延谱)。如图11所示,第一设备和第三设备可以是通信设备,第二设备可以是接入网设备。因此第一设备和第二设备的通信传输需要经历空口(Air Interface),第三设备和第二设备也是同理。
其中,第一设备内:生成器(第一神经网络)的输入为随机噪声(即隐空间)和第一信息,生成器(第一神经网络)的输出为伪信道功率时延谱,第一信息包括第一环境图像和第一用户位置。判别器(第二神经网络)的真值输入为第一信息、和该第一信息对应的第三信息,伪值输入为生成器(第一神经网络)的输出和第一信息。第三信息为真实信道功率时延谱。训练生成器(第一神经网络)和判别器(第二神经网络),将训练完成的生成器(第一神经网络)和判别器(第二神经网络),分别记为第一生成器和第一判别器。
第三设备内:生成器(第五神经网络)的输入为随机噪声(即隐空间)和第四信息,生成器(第五神经网络)的输出为伪信道功率时延谱,第四信息包括第三环境图像和第三用户位置。判别器(第六神经网络)的真值输入为第四信息、和该第四信息对应的第六信息,伪值输入为生成器(第五神经网络)的输出和第四信息。第六信息为真实信道功率时延谱。训练生成器(第五神经网络)和判别器(第六神经网络),将训练完成的生成器(第五神经网络)和判别器(第六神经网络),分别记为第三生成器和第三判别器。
第二设备内:生成器(第三神经网络)的输入为随机噪声和、来自第一设备的第一信息或来自第三设备的第四信息,输出为伪信道功率时延谱。第一信息包括第一环境图像和第一用户位置,第四信息包括第三环境图像和第三用户位置。判别器(第四神经网络)的真值输入为第一信息和该第一信息输入第一生成器得到的第二信息、或者判别器(第四神经网络)的真值输入为第四信息和该第四信息输入第三生成器得到的第五信息,判别器(第四神经网络)的伪值输入为生成器(第三神经网络)的输出和第一信息、或伪值输入为生成器(第三神经网络)的输出和第四信息。第二信息为第一生成器根据输入的第一信息输出的信道功率时延谱,第五信息为第三生成器根据输入的第四信息输出的信道功率时延谱。训练生成器(第三神经网络)和判别器(第四神经网络),将训练完成的生成器(第三神经网络)和判别器(第五神经网络),分别记为第二生成器和第二判别器。
第一设备、第二设备、以及第三设备之间的信令交互:第一设备发送第一生成器给第二设备,还发送第一信息给第二设备。第三设备发送第三生成器给第二设备,还发送第四信息给第二设备。第二设备发送第二生成器给第一设备和第三设备,并发送来自第三设备的第四信息给第一设备,发送来自第一设备的第一信息给第三设备。换句话说,第二设备分享全场景模型(即第二生成器)。
由图11可以看出,第一信息/第四信息需要输入生成器和判别器,即生成器的输入和输出是对应的,且本申请利用已训练完成的生成器(第一生成器或第三生成器)给正在训练的判别器(第四神经网络)提供真实值,可以配合通信网络,尽量减小通信网络传输真实测量信道的开销。
应理解,图11中的加号不是代表数值相加,而是指拼接操作,即在第一设备中将第一信息和随机噪声拼接后,作为生成器的输入;在第三设备中将第四信号和随机噪声拼接后,作为另一生成器的输入。
可见,本申请增加第一信息/第四信息作为条件输入,第一信息/第四信息不仅作为条件输入生成器,也需要作为条件输入判别器。判别器的输入为:伪信道功率时延谱和第一信息/第四信息的拼接,或者真实信道功率时延谱和第一信息/第四信息的拼接。可以实现的效果是,生成器具有了条件输入,给定什么样的场景,生成器就输出和该场景对应的信道,只要生成器已经完成了对应场景或类似场景的训练。
上述内容详细阐述了本申请的方法,为便于更好地实施本申请实施例的上述方案,本申请实施例还提供了相应的装置或设备。
参见图12,图12是本申请实施例提供的信息生成装置的一结构示意图。该信息生成装置可以为第二设备或者可以设置于第二设备中的芯片或电路。如图12所示,该信息生成装置1可包括:
收发模块11,用于接收第一消息和第三消息,第一消息指示第一生成器的全部或部分,可选的还指示该第一生成器所支持的输入,第三消息指示第三生成器的全部或部分,可选的还指示该第三生成器所支持的输入,该第一生成器所支持的输入包括第一类型的第一信息,该第三生成器所支持的输入包括第一类型的第四信息,该第一生成器和该第三生成器用于第二生成器所对应的神经网络的训练;该收发模块11,还用于向第一设备发送第二消息,该第二消息指示第二生成器的全部或部分以及第二生成器所支持的输入,该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,该第四信息与该第一信息不同且第一生成器、第三生成器以及第二生成器各不相同。
可选的,上述第一生成器所支持的输入为第一类型的信息,输出为第二类型的信息。上述第二生成器所支持的输入为第一类型的信息,输出为第二类型的信息。上述第三生成器所支持的输入为第一类型的信息,输出为第二类型的信息。其中,第一类型为场景类,第二类型为无线信道特征类。或者,第一类型为用户画像和场景类,第二类型为无线信道特征类。或者,第一类型为无线信道特征类,第二类型为用户画像类。或者,第一类型为无线信道特征和场景类,第二类型为用户画像类。或者,第一类型为无线信道特征类,第二类型为场景类。或者,第一类型为无线信道特征和用户画像类,第二类型为场景类。
可选的,该信息生成装置1还包括获取模块12和训练模块13。该获取模块12,用于获取该第一类型的多个第一信息和该第一类型的多个第四信息;该训练模块13,用于利用该训练样本集中的多个训练样本训练第三神经网络,得到第二生成器,该第二生成器为训练完成的第三神经网络。其中,一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集。该第二生成器分别用于支持根据该第一信息生成第二类型的第二信息,根据该第四信息生成第二类型的第五信息。
可选的,该信息生成装置1还包括获取模块12和训练模块13。该获取模块12,用于获取该第一类型的多个第一信息和该第一类型的多个第四信息;该训练模块13,用于利用该训练样本集中的多个训练样本训练第三神经网络和第四神经网络,分别得到第二生成器和第二判别器,该第二生成器为训练完成的第三神经网络,该第二判别器为训练完成的第四神经网络。其中,一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集。第三神经网络为生成对抗网络中的生成器,第四神经网络为生成对抗网络中的判别器。该第二生成器分别用于支持根据该第一信息生成第二类型的第二信息,根据该第四信息生成第二类型的第五信息。
可选的,上述每个第三训练样本还包括一个从隐空间中随机选择的信息。上述每个第四训练样本还包括一个从隐空间中随机选择的信息。
可选的,上述第一消息指示第一生成器所支持的输入包括:第一消息包括该第一信息、该第一信息的标识、该第一类型、该第一类型的标识中的一个或多个。
可选的,上述第三消息指示第三生成器所支持的输入包括:该第三消息包括该第四信息、该第四信息的标识、该第一类型、该第一类型的标识中的一个或多个。
可选的,上述第二消息指示第二生成器所支持的输入包括:第二消息包括该第四信息、该第四信息的标识、该第一类型、该第一类型的标识中的一个或多个。
可选的,上述无线信道特征类包括以下一种或多种子类型:信道冲击响应信息子类型、信道状态信息子类型。
可选的,上述场景类包括以下一种或多种类型:环境描述信息子类型、环境感知信息子类型。
可选的,上述用户画像类包括以下一种或多种子类型:用户参数子类型、用户行为信息子类型。
可选的,上述第一信息为该第一设备所处环境的环境图像和该第一设备的地理位置信息,上述第二信息为该第一信息输入该第一生成器生成的信道冲击响应。上述第四信息为该第三设备所处环境的环境图像和该第三设备的地理位置信息,上述第五信息为该第四信息输入该第三生成器生成的信道冲击响应。
可选的,上述第一信息为该第一设备所处环境的环境图像和该第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,上述第二信息为该第一信息输入该第一生成器生成的该第一设备的地理位置信息。上述第四信息为该第三设备所处环境的环境图像和该第三设备在所处环境和地理位置情况下测量信道的信道冲击响应,上述第五信息为该第四信息输入该第三生成器生成的该第三设备的地理位置信息。
可选的,上述第一消息中还包括该第一生成器的标识,第一生成器的标识与该第一生成器所支持的输入对应。上述第三消息中还包括该第三生成器的标识,第三生成器的标识与该第三生成器所支持的输入对应。
可选的,上述收发模块11,还用于向该第一设备发送第一更新指示,该第一更新指示用于指示该第一设备重新训练该第一生成器;上述收发模块11,还用于接收该第一设备发送的重新训练完成的第一生成器。
可选的,上述第一消息指示第一生成器的全部包括第一生成器的结构、权值和偏置值。上述第三消息指示第三生成器的全部包括第三生成器的结构、权值和偏置值。
可选的,上述第一消息指示第一生成器的部分包括第一生成器的结构和部分层的权值和偏置值。上述第三消息指示第三生成器的包括第三生成器的结构和部分层的权值和偏置值。
其中,上述获取模块12和上述训练模块13可以集成为一个模块,例如处理模块。
具体实现中,各个模块或单元的实现还可以对应参照前述实施例一或三中第二设备的相应描述,执行上述实施例一或三中第二设备所执行的方法和功能。
参见图13,图13是本申请实施例提供的信息生成装置的另一结构示意图。该信息生成装置可以为第一设备或第三设备,或者其中的芯片或电路。如图13所示,该信息生成装置2可包括:
一种设计中,收发模块21,用于向第二设备发送第一消息,该第一消息指示第一生成器的全部或部分,可选的还指示该第一生成器所支持的输入,该第一生成器所支持的输入包括第一类型的第一信息,该第一生成器用于第二生成器所对应的神经网络的训练;该收发模块21,还用于从该第二设备接收第二消息,该第二消息指示第二生成器的全部或部分以及第二生成器所支持的输入,该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,该第四信息与该第一信息不同且第一生成器和第二生成器不同。
可选的,该信息生成装置2还包括生成模块22。该生成模块22,用于基于该第二生成器所支持的输入将第一类型的第四信息输入该第二生成器生成第二类型的第五信息。
可选的,第一生成器所支持的输入为第一类型的信息,输出为第二类型的信息。第二生成器所支持的输入为第一类型的信息,输出为第二类型的信息。其中,第一类型为场景类,第二类型为无线信道特征类。或者,第一类型为用户画像和场景类,第二类型为无线信道特征类。或者,第一类型为无线信道特征类,第二类型为用户画像类。或者,第一类型为无线信道特征和场景类,第二类型为用户画像类。或者,第一类型为无线信道特征类,第二类型为场景类。或者,第一类型为无线信道特征和用户画像类,第二类型为场景类。
可选的,该信息生成装置2还包括获取模块23和训练模块24。该获取模块24,用于获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、和该第一信息对应的第三信息组成一个第一训练样本;该训练模块24,用于利用多个第一训练样本训练第一神经网络,得到第一生成器,该第一生成器为训练完成的第一神经网络。
可选的,该信息生成装置2还包括获取模块23和训练模块24。该获取模块24,用于获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、和该第一信息对应的第三信息组成一个第一训练样本;该训练模块24,用于利用多个第一训练样本训练第一神经网络和第二神经网络,分别得到第一生成器和第一判别器,该第一生成器为训练完成的第一神经网络,该第一判别器为训练完成的第二神经网络。其中,第一神经网络为生成对抗网络中的生成器,第二神经网络为该生成对抗网络中的判别器。
可选的,上述第一消息指示第一生成器所支持的输入包括:第一消息包括该第一信息、该第一信息的标识、该第一类型、该第一类型的标识中的一个或多个。
可选的,上述第二消息指示第二生成器所支持的输入包括:第二消息包括该第四信息、该第四信息的标识、该第一类型、该第一类型的标识中的一个或多个。
可选的,上述无线信道特征类包括以下一种或多种子类型:信道冲击响应信息子类型、信道状态信息子类型。
可选的,上述场景类包括以下一种或多种类型:环境描述信息子类型、环境感知信息子类型。
可选的,上述用户画像类包括以下一种或多种子类型:用户参数子类型、用户行为信息子类型。
可选的,上述第一信息为该信息生成装置2所处环境的环境图像和该信息生成装置2的地理位置信息,上述第三信息为该信息生成装置2在所处环境和地理位置情况下测量信道的信道冲击响应。
可选的,上述第一信息为该信息生成装置2所处环境的环境图像和该信息生成装置2在所处环境和地理位置情况下测量信道的信道冲击响应,上述第三信息为该信息生成装置2的地理位置信息。
可选的,上述第一消息中还包括该第一生成器的标识,第一生成器的标识与该第一生成器所支持的输入对应。
可选的,上述收发模块21,还用于接收第一更新指示,该第一更新指示用于指示该第一设备重新训练该第一生成器;上述获取模块23,还用于重新获取该第一类型的多个第七信息、每个第七信息对应的该第二类型的第八信息、以及隐空间;上述训练模块24,还用于利用该多个第七信息、每个第七信息对应的第八信息、以及隐空间重新训练该第一生成器;该收发模块21,还用于发送重新训练完成的第一生成器。
可选的,上述第一消息指示第一生成器的全部包括第一生成器的结构、权值和偏置值。
可选的,上述第一消息指示第一生成器的部分包括第一生成器的结构和部分层的权值和偏置值。
其中,上述生成模块22、获取模块23、以及训练模块24可以集成为一个模块,例如处理模块。
具体实现中,上述各个模块或单元的实现还可以对应参照前述实施例一或二中第一设备的相应描述,执行上述实施例一或二中第一设备所执行的方法和功能。
另一种设计中,收发模块21,用于向第二设备发送第三消息,该第三消息指示第三生成器的全部或部分,可选的还指示该第三生成器所支持的输入,该第三生成器所支持的输入包括第一类型的第四信息,该第三生成器用于第二生成器所对应的神经网络的训练;该收发模块21,还用于从该第二设备接收第四消息,该第四消息指示第二生成器的全部或部分以及第二生成器所支持的输入,该第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,该第四信息与该第一信息不同且第三生成器和第二生成器不同。
可选的,该信息生成装置2还包括生成模块22。该生成模块22,用于基于该第二生成器所支持的输入将第一类型的第一信息输入该第二生成器生成第二类型的第二信息。
可选的,第三生成器所支持的输入为第一类型的信息,输出为第二类型的信息。第二生成器所支持的输入为第一类型的信息,输出为第二类型的信息。其中,第一类型为场景类,第二类型为无线信道特征类。或者,第一类型为用户画像和场景类,第二类型为无线信道特征类。或者,第一类型为无线信道特征类,第二类型为用户画像类。或者,第一类型为无线信道特征和场景类,第二类型为用户画像类。或者,第一类型为无线信道特征类,第二类型为场景类。或者,第一类型为无线信道特征和用户画像类,第二类型为场景类。
可选的,该信息生成装置2还包括获取模块23和训练模块24。该获取模块24,用于获取第一类型的多个第四信息、和每个第四信息对应的第二类型的第六信息,其中一个第四信息、和该第四信息对应的第六信息组成一个第二训练样本;该训练模块24,用于利用多个第二训练样本训练第五神经网络,得到第三生成器,该第三生成器为训练完成的第五神经网络。
可选的,该信息生成装置2还包括获取模块23和训练模块24。该获取模块24,用于获取第一类型的多个第四信息、和每个第四信息对应的第二类型的第六信息,其中一个第四信息、和该第四信息对应的第六信息组成一个第二训练样本;该训练模块24,用于利用多个第二训练样本训练第五神经网络和第六神经网络,分别得到第三生成器和第三判别器,该第三生成器为训练完成的第五神经网络,该第三判别器为训练完成的第六神经网络。其中,第五神经网络为生成对抗网络中的生成器,第六神经网络为该生成对抗网络中的判别器。
可选的,上述第三消息指示第三生成器所支持的输入包括:该第三消息包括该第四信息、该第四信息的标识、该第一类型、该第一类型的标识中的一个或多个。
可选的,上述第四消息指示第二生成器所支持的输入包括:第四消息包括该第一信息、该第一信息的标识、该第一类型、该第一类型的标识中的一个或多个。
可选的,上述无线信道特征类包括以下一种或多种子类型:信道冲击响应信息子类型、信道状态信息子类型。
可选的,上述场景类包括以下一种或多种类型:环境描述信息子类型、环境感知信息子类型。
可选的,上述用户画像类包括以下一种或多种子类型:用户参数子类型、用户行为信息子类型。
可选的,上述第四信息为该信息生成装置2所处环境的环境图像和该信息生成装置2的地理位置信息,上述第六信息为该信息生成装置2在所处环境和地理位置情况下测量信道的信道冲击响应。
可选的,上述第四信息为该信息生成装置2所处环境的环境图像和该信息生成装置2在所处环境和地理位置情况下测量信道的信道冲击响应,上述第六信息为该信息生成装置2的地理位置信息。
可选的,上述第三消息中还包括该第三生成器的标识,第三生成器的标识与该第三生成器所支持的输入对应。
可选的,上述收发模块21,还用于接收第二更新指示,该第二更新指示用于指示该第三设备重新训练该第三生成器;上述获取模块23,还用于重新获取该第一类型的多个第九信息、每个第九信息对应的该第二类型的第十信息、以及隐空间;上述训练模块24,还用于利用该多个第九信息、每个第九信息对应的第十信息、以及隐空间重新训练该第三生成器;该收发模块21,还用于发送重新训练完成的第三生成器。
可选的,上述第三消息指示第三生成器的全部包括第三生成器的结构、权值和偏置值。
可选的,上述第三消息指示第三生成器的包括第三生成器的结构和部分层的权值和偏置值。
具体实现中,上述各个模块或单元的实现还可以对应参照前述实施例一中第三设备的相应描述,执行上述实施例一中第三设备所执行的方法和功能。
参见图14,图14是本申请实施例提供的通信装置的结构示意图。如图14所示,本申请实施例提供的通信装置1000可用于实现上述方法实施例中描述的方法,可以参见上述方法实施例中的说明。该通信装置1000可以是前述第一设备、前述第二设备以及前述第三设备中的任意一种。
通信装置1000包括一个或多个处理器1001。处理器1001可以是通用处理器或者专用处理器等。例如可以是基带处理器、或中央处理器。基带处理器可以用于对通信协议以及通信数据进行处理,中央处理器可以用于对装置(如,通信设备、基站或芯片等)进行控制,执行软件程序,处理软件程序的数据。该装置可以包括收发单元,用以实现信号的输入(接收)和输出(发送)。例如,装置可以为芯片,该收发单元可以是芯片的输入和/或输出电路,或者通信接口。该芯片可以用于通信设备或接入网设备(比如基站)。又如,装置可以为通信设备(比如UE)或接入网设备(比如基站),该收发单元可以为收发器,射频芯片等。
通信装置1000包括一个或多个处理器1001,该一个或多个处理器1001可实现前述任一实施例中第一设备、或第二设备、或第三设备的方法。
可选的,处理器1001除了实现前述任一实施例的方法,还可以实现其他功能。
可选的,一种设计中,处理器1001也可以包括指令1003,所述指令可以在所述处理器上被运行,使得通信装置1000执行上述任一方法实施例中描述的方法。
在又一种可能的设计中,通信装置1000也可以包括电路,所述电路可以实现前述任一方法实施例中第一设备或第二设备或第三设备的功能。
在又一种可能的设计中,通信装置1000中可以包括一个或多个存储器1002,其上存有指令1004,所述指令可在所述处理器上被运行,使得通信装置1000执行上述任一方法实施例中描述的方法。可选的,所述存储器中还可以存储有数据。可选的处理器中也可以存储指令和/或数据。例如,所述一个或多个存储器1002可以存储上述实施例中所描述的第一应用层测量配置,或者上述实施例中所涉及的其他信息,比如业务类型等。所述处理器和存储器可以单独设置,也可以集成在一起。
在又一种可能的设计中,通信装置1000还可以包括收发单元1005以及天线1006,或者,包括通信接口。收发单元1005可以称为收发机、收发电路、或者收发器等,用于通过天线1006实现装置的收发功能。所述通信接口(图中未示出),可以用于核心网设备和接入网设备,或是,接入网设备和接入网设备之间的通信。可选的,该通信接口可以为有线通信的接口,比如光纤通信的接口。
处理器1001可以称为处理单元,对装置(比如通信设备或者基站或者AMF)进行控制。
应理解,在本申请实施例中的处理器可以是中央处理单元(central processingunit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(digital signalprocessor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
还应理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的随机存取存储器(random accessmemory,RAM)可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
上述实施例,可以全部或部分地通过软件、硬件(如电路)、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线,例如光纤,或是无线,例如红外、无线、微波等,方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序代码,当该计算机程序代码在计算机上运行时,使得该计算机执行前述实施例所描述的第一设备的方法步骤;或者当该计算机程序代码在计算机上运行时,使得该计算机执行前述实施例所描述的第二设备的方法步骤;或者当该计算机程序代码在计算机上运行时,使得该计算机执行前述实施例所描述的第三设备的方法步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有程序指令,当其在计算机上运行时,使得该计算机执行前述实施例所描述的第一设备的方法步骤;或者当该计算机程序代码在计算机上运行时,使得该计算机执行前述实施例所描述的第二设备的方法步骤;或者当该计算机程序代码在计算机上运行时,使得该计算机执行前述实施例所描述的第三设备的方法步骤。
本申请实施例还提供一种装置,该装置可以为芯片。该芯片包括处理器。该处理器用于读取并执行存储器中存储的计算机程序,以执行前述任一实施例的任意可能的实现方式中的方法。可选的,该芯片还包括存储器,该存储器与该处理器通过电路或电线连接。进一步可选的,该芯片还包括通信接口,该处理器与该通信接口连接。该通信接口用于接收需要处理的数据和/或信号,该处理器从该通信接口获取该数据和/或信号,并对该数据和/或信号进行处理,并通过该通信接口输出处理结果。该通信接口可以是输入输出接口。
可选的,上述的处理器与存储器可以是物理上相互独立的单元,或者,存储器也可以和处理器集成在一起。
本申请的另一实施例中,还提供一种通信系统,该通信系统包括通信设备和网络设备。示例性的,通信设备可以为前述实施例中的第一设备和第三设备,网络设备可以为前述实施例中的第二设备。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (41)
1.一种信息生成方法,其特征在于,包括:
第二设备接收第一消息和第三消息,第一消息指示第一生成器的全部或部分,第三消息指示第三生成器的全部或部分,所述第一生成器所支持的输入包括第一类型的第一信息,所述第三生成器所支持的输入包括第一类型的第四信息,所述第一生成器和所述第三生成器用于第二生成器所对应的神经网络的训练;
所述第二设备向第一设备发送第二消息,所述第二消息指示第二生成器的全部或部分,所述第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,所述第四信息与所述第一信息不同且第一生成器、第三生成器以及第二生成器各不相同。
2.根据权利要求1所述的方法,其特征在于,所述第一生成器所支持的输入为第一类型的信息,输出为第二类型的信息;
所述第二生成器所支持的输入为第一类型的信息,输出为第二类型的信息;
所述第三生成器所支持的输入为第一类型的信息,输出为第二类型的信息;
其中,第一类型为场景类,第二类型为无线信道特征类;
或者,第一类型为用户画像和场景类,第二类型为无线信道特征类;
或者,第一类型为无线信道特征类,第二类型为用户画像类;
或者,第一类型为无线信道特征和场景类,第二类型为用户画像类;
或者,第一类型为无线信道特征类,第二类型为场景类;
或者,第一类型为无线信道特征和用户画像类,第二类型为场景类。
3.根据权利要求1或2所述的方法,其特征在于,所述第二设备发送第二消息之前,所述方法还包括:
所述第二设备获取所述第一类型的多个第一信息和所述第一类型的多个第四信息;
一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集;
所述第二设备利用所述训练样本集中的多个训练样本训练第三神经网络,得到第二生成器,所述第二生成器为训练完成的第三神经网络;
所述第二生成器分别用于支持根据所述第一信息生成第二类型的第二信息,根据所述第四信息生成第二类型的第五信息。
4.根据权利要求1或2所述的方法,其特征在于,所述第二设备发送第二消息之前,所述方法还包括:
所述第二设备获取所述第一类型的多个第一信息和所述第一类型的多个第四信息;
一个第一信息、和该第一信息输入第一生成器得到的第二类型的一个第二信息组成一个第三训练样本,一个第四信息、和该第四信息输入第三生成器得到的第二类型的一个第五信息组成一个第四训练样本,多个第三训练样本和多个第四训练样本组成一个训练样本集;
所述第二设备利用所述训练样本集中的多个训练样本训练第三神经网络和第四神经网络,分别得到第二生成器和第二判别器,所述第二生成器为训练完成的第三神经网络,所述第二判别器为训练完成的第四神经网络;
其中,所述第三神经网络为生成对抗网络中的生成器,所述第四神经网络为所述生成对抗网络中的判别器。
5.根据权利要求3或4所述的方法,其特征在于,每个第三训练样本还包括一个从隐空间中随机选择的信息;
每个第四训练样本还包括一个从隐空间中随机选择的信息。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述第一消息还指示第一生成器所支持的输入;
所述第一消息指示第一生成器所支持的输入包括:
第一消息包括所述第一信息、所述第一信息的标识、所述第一类型、所述第一类型的标识中的一个或多个。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述第三消息还指示第三生成器所支持的输入;
所述第三消息指示第三生成器所支持的输入包括:
所述第三消息包括所述第四信息、所述第四信息的标识、所述第一类型、所述第一类型的标识中的一个或多个。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述第二消息还指示第二生成器所支持的输入;
所述第二消息指示第二生成器所支持的输入包括:
第二消息包括所述第四信息、所述第四信息的标识、所述第一类型、所述第一类型的标识中的一个或多个。
9.根据权利要求2-8任一项所述的方法,其特征在于,所述无线信道特征类包括以下一种或多种子类型:
信道冲击响应信息子类型、信道状态信息子类型。
10.根据权利要求2-9任一项所述的方法,其特征在于,所述场景类包括以下一种或多种类型:
环境描述信息子类型、环境感知信息子类型。
11.根据权利要求2-10任一项所述的方法,其特征在于,所述用户画像类包括以下一种或多种子类型:
用户参数子类型、用户行为信息子类型。
12.根据权利要求3-5任一项所述的方法,其特征在于,所述第一信息为所述第一设备所处环境的环境图像和所述第一设备的地理位置信息,所述第二信息为该第一信息输入所述第一生成器生成的信道冲击响应;
所述第四信息为所述第三设备所处环境的环境图像和所述第三设备的地理位置信息,所述第五信息为该第四信息输入所述第三生成器生成的信道冲击响应。
13.根据权利要求3-5任一项所述的方法,其特征在于,所述第一信息为所述第一设备所处环境的环境图像和所述第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,所述第二信息为该第一信息输入所述第一生成器生成的所述第一设备的地理位置信息;
所述第四信息为所述第三设备所处环境的环境图像和所述第三设备在所处环境和地理位置情况下测量信道的信道冲击响应,所述第五信息为该第四信息输入所述第三生成器生成的所述第三设备的地理位置信息。
14.根据权利要求1-13任一项所述的方法,其特征在于,所述第一消息中还包括所述第一生成器的标识,第一生成器的标识与所述第一生成器所支持的输入对应;
所述第三消息中还包括所述第三生成器的标识,第三生成器的标识与所述第三生成器所支持的输入对应。
15.根据权利要求1-14任一项所述的方法,其特征在于,所述方法还包括:
所述第二设备向所述第一设备发送第一更新指示,所述第一更新指示用于指示所述第一设备重新训练所述第一生成器;
所述第二设备接收所述第一设备发送的重新训练完成的第一生成器。
16.根据权利要求1-15任一项所述的方法,其特征在于,所述第一消息指示第一生成器的全部包括第一生成器的结构和参数;
第三消息指示第三生成器的全部包括第三生成器的结构和参数。
17.根据权利要求1-15任一项所述的方法,其特征在于,所述第一消息指示第一生成器的部分包括第一生成器的结构和部分层的参数;
第三消息指示第三生成器的包括第三生成器的结构和部分层的参数。
18.一种信息生成方法,其特征在于,包括:
第一设备向第二设备发送第一消息,所述第一消息指示第一生成器的全部或部分,所述第一生成器所支持的输入包括第一类型的第一信息,所述第一生成器用于第二生成器所对应的神经网络的训练;
所述第一设备从所述第二设备接收第二消息,所述第二消息指示第二生成器的全部或部分,所述第二生成器所支持的输入包括第一类型的第一信息和第一类型的第四信息,其中,所述第四信息与所述第一信息不同且第一生成器和第二生成器不同。
19.根据权利要求18所述的方法,其特征在于,所述方法还包括:
所述第一设备基于所述第二生成器所支持的输入将第一类型的第四信息输入所述第二生成器生成第二类型的第五信息。
20.根据权利要求18或19所述的方法,其特征在于,所述第一生成器所支持的输入为第一类型的信息,输出为第二类型的信息;
所述第二生成器所支持的输入为第一类型的信息,输出为第二类型的信息;
其中,第一类型为场景类,第二类型为无线信道特征类;
或者,第一类型为用户画像和场景类,第二类型为无线信道特征类;
或者,第一类型为无线信道特征类,第二类型为用户画像类;
或者,第一类型为无线信道特征和场景类,第二类型为用户画像类;
或者,第一类型为无线信道特征类,第二类型为场景类;
或者,第一类型为无线信道特征和用户画像类,第二类型为场景类。
21.根据权利要求18-20任一项所述的方法,其特征在于,所述第一设备发送第一消息之前,所述方法还包括:
第一设备获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、和该第一信息对应的第三信息组成一个第一训练样本;
所述第一设备利用多个第一训练样本训练第一神经网络,得到第一生成器,所述第一生成器为训练完成的第一神经网络。
22.根据权利要求18-20中任一项所述的方法,其特征在于,所述第一设备发送第一消息之前,所述方法还包括:
第一设备获取第一类型的多个第一信息、和每个第一信息对应的第二类型的第三信息,其中一个第一信息、和该第一信息对应的第三信息组成一个第一训练样本;
所述第一设备利用多个第一训练样本训练第一神经网络和第二神经网络,分别得到第一生成器和第一判别器,所述第一生成器为训练完成的第一神经网络,所述第一判别器为训练完成的第二神经网络;
其中,所述第一神经网络为生成对抗网络中的生成器,所述第二神经网络为所述生成对抗网络中的判别器。
23.根据权利要求21或22所述的方法,其特征在于,每个第一训练样本还包括一个从隐空间中随机选择的信息。
24.根据权利要求18-23任一项所述的方法,其特征在于,所述第一消息还指示第一生成器所支持的输入;
所述第一消息指示第一生成器所支持的输入包括:
第一消息包括所述第一信息、所述第一信息的标识、所述第一类型、所述第一类型的标识中的一个或多个。
25.根据权利要求18-24任一项所述的方法,其特征在于,所述第二消息还指示第二生成器所支持的输入;
所述第二消息指示第二生成器所支持的输入包括:
第二消息包括所述第四信息、所述第四信息的标识、所述第一类型、所述第一类型的标识中的一个或多个。
26.根据权利要求19-25任一项所述的方法,其特征在于,所述无线信道特征类包括以下一种或多种子类型:
信道冲击响应信息子类型、信道状态信息子类型。
27.根据权利要求19-26任一项所述的方法,其特征在于,所述场景类包括以下一种或多种类型:
环境描述信息子类型、环境感知信息子类型。
28.根据权利要求19-27任一项所述的方法,其特征在于,所述用户画像类包括以下一种或多种子类型:
用户参数子类型、用户行为信息子类型。
29.根据权利要求21-23任一项所述的方法,其特征在于,所述第一信息为所述第一设备所处环境的环境图像和所述第一设备的地理位置信息,所述第三信息为所述第一设备在所处环境和地理位置情况下测量信道的信道冲击响应。
30.根据权利要求21-23任一项所述的方法,其特征在于,所述第一信息为所述第一设备所处环境的环境图像和所述第一设备在所处环境和地理位置情况下测量信道的信道冲击响应,所述第三信息为所述第一设备的地理位置信息。
31.根据权利要求18-30任一项所述的方法,其特征在于,所述第一消息中还包括所述第一生成器的标识,第一生成器的标识与所述第一生成器所支持的输入对应。
32.根据权利要求18-31任一项所述的方法,其特征在于,所述第一设备发送第一消息之后,所述方法还包括:
所述第一设备接收第一更新指示,所述第一更新指示用于指示所述第一设备重新训练所述第一生成器;
所述第一设备重新获取所述第一类型的多个第七信息、每个第七信息对应的所述第二类型的第八信息、以及隐空间;
所述第一设备利用所述多个第七信息、每个第七信息对应的第八信息、以及隐空间重新训练所述第一生成器;
所述第一设备发送重新训练完成的第一生成器。
33.根据权利要求18-32任一项所述的方法,其特征在于,所述第一消息指示第一生成器的全部包括第一生成器的结构和参数。
34.根据权利要求18-32任一项所述的方法,其特征在于,所述第一消息指示第一生成器的部分包括第一生成器的结构和部分层的参数。
35.一种信息生成装置,其特征在于,包括用于执行权利要求1-17中任一项所述方法的单元或模块。
36.一种信息生成装置,其特征在于,包括用于执行权利要求18-34中任一项所述方法的单元或模块。
37.一种通信装置,其特征在于,包括:
一个或多个处理器和一个或多个存储器;
其中,所述一个或多个存储器用于存储计算机程序,所述一个或多个处理器用于执行存储于所述一个或多个存储器中的计算机程序,以使得所述通信装置执行如权利要求1-17中任一项所述的方法。
38.一种通信装置,其特征在于,包括:
一个或多个处理器和一个或多个存储器;
其中,所述一个或多个存储器用于存储计算机程序,所述一个或多个处理器用于执行存储于所述一个或多个存储器中的计算机程序,以使得所述通信装置执行如权利要求18-34中任一项所述的方法。
39.一种可读存储介质,其特征在于,用于存储程序,所述程序被一个或多个处理器执行,使得包括所述一个或多个处理器的装置执行如权利要求1-17中任一项所述的方法。
40.一种可读存储介质,其特征在于,用于存储程序,所述程序被一个或多个处理器执行,使得包括所述一个或多个处理器的装置执行如权利要求18-34中任一项所述的方法。
41.一种通信系统,其特征在于,包括如权利要求37所述的装置和如权利要求38所述的装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011556035.5A CN114666188A (zh) | 2020-12-24 | 2020-12-24 | 信息生成方法及相关装置 |
EP21909446.3A EP4266215A4 (en) | 2020-12-24 | 2021-12-22 | INFORMATION GENERATION METHOD AND RELATED APPARATUS |
PCT/CN2021/140357 WO2022135450A1 (zh) | 2020-12-24 | 2021-12-22 | 信息生成方法及相关装置 |
US18/339,474 US20230336382A1 (en) | 2020-12-24 | 2023-06-22 | Information generation method and related apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011556035.5A CN114666188A (zh) | 2020-12-24 | 2020-12-24 | 信息生成方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114666188A true CN114666188A (zh) | 2022-06-24 |
Family
ID=82024464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011556035.5A Pending CN114666188A (zh) | 2020-12-24 | 2020-12-24 | 信息生成方法及相关装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230336382A1 (zh) |
EP (1) | EP4266215A4 (zh) |
CN (1) | CN114666188A (zh) |
WO (1) | WO2022135450A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023208948A1 (en) * | 2022-04-25 | 2023-11-02 | Deep Render Ltd | Method and data processing system for lossy image or video encoding, transmission and decoding |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11038769B2 (en) * | 2017-11-16 | 2021-06-15 | Verizon Patent And Licensing Inc. | Method and system for virtual network emulation and self-organizing network control using deep generative models |
US11501438B2 (en) * | 2018-04-26 | 2022-11-15 | Elekta, Inc. | Cone-beam CT image enhancement using generative adversarial networks |
US10949706B2 (en) * | 2019-01-16 | 2021-03-16 | Microsoft Technology Licensing, Llc | Finding complementary digital images using a conditional generative adversarial network |
US10832450B2 (en) * | 2019-03-27 | 2020-11-10 | GM Global Technology Operations LLC | Semantic preserved style transfer |
CN110097130B (zh) * | 2019-05-07 | 2022-12-13 | 深圳市腾讯计算机系统有限公司 | 分类任务模型的训练方法、装置、设备及存储介质 |
CN110197229B (zh) * | 2019-05-31 | 2022-06-07 | 腾讯医疗健康(深圳)有限公司 | 图像处理模型的训练方法、装置及存储介质 |
US11166022B2 (en) * | 2019-06-04 | 2021-11-02 | Google Llc | Quantization constrained neural image coding |
-
2020
- 2020-12-24 CN CN202011556035.5A patent/CN114666188A/zh active Pending
-
2021
- 2021-12-22 WO PCT/CN2021/140357 patent/WO2022135450A1/zh unknown
- 2021-12-22 EP EP21909446.3A patent/EP4266215A4/en active Pending
-
2023
- 2023-06-22 US US18/339,474 patent/US20230336382A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4266215A4 (en) | 2024-05-15 |
WO2022135450A1 (zh) | 2022-06-30 |
EP4266215A1 (en) | 2023-10-25 |
US20230336382A1 (en) | 2023-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190253900A1 (en) | Method and device for communications in millimeter-wave networks | |
EP3844982A1 (en) | Method and apparatus for location services | |
KR20190092548A (ko) | 포지셔닝 방법 및 시스템, 및 관련 디바이스 | |
WO2020048594A1 (en) | Procedure for optimization of self-organizing network | |
CN105519171A (zh) | 无线基站、无线通信系统以及无线通信方法 | |
US11012133B2 (en) | Efficient data generation for beam pattern optimization | |
CN114144977B (zh) | 波束赋形方法、装置、无线接入网设备及可读存储介质 | |
WO2022073207A1 (zh) | 模型评估方法及装置 | |
US20230129288A1 (en) | Method and device for ris automatic setup | |
WO2022017012A1 (zh) | 一种网络配置方法及装置 | |
US20230336382A1 (en) | Information generation method and related apparatus | |
WO2022048921A1 (en) | Hierarchical positioning for low cost and low power asset tracking | |
Yu et al. | Distributed signal strength prediction using satellite map empowered by deep vision transformer | |
US20230362039A1 (en) | Neural network-based channel estimation method and communication apparatus | |
WO2024012331A1 (zh) | 一种确定人工智能ai模型的方法及装置 | |
WO2021237463A1 (en) | Method and apparatus for position estimation | |
KR102460265B1 (ko) | 시각적 정보를 이용한 공간적 전력 할당 방법 및 장치 | |
WO2023185566A1 (zh) | 用于无线通信的方法和电子设备以及计算机可读存储介质 | |
WO2024094036A1 (zh) | 通信方法和通信装置 | |
WO2024109682A1 (zh) | 一种用于定位的方法及装置 | |
WO2023097634A1 (zh) | 定位方法、模型训练方法和设备 | |
WO2023236979A1 (zh) | 定位模型的选择方法、终端及网络侧设备 | |
US20230189024A1 (en) | Location simulation for wireless devices | |
WO2023160633A1 (zh) | 一种通信方法及装置 | |
WO2023160656A1 (zh) | 一种通信方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |