WO2023036164A1

WO2023036164A1 - 一种基于物理信息神经网络的模型训练方法及相关装置

Info

Publication number: WO2023036164A1
Application number: PCT/CN2022/117447
Authority: WO
Inventors: 刘红升; 时北极; 翁冰雅; 杨康; 王紫东
Original assignee: 华为技术有限公司
Priority date: 2021-09-13
Filing date: 2022-09-07
Publication date: 2023-03-16
Also published as: CN115809695A

Abstract

本申请公开了一种基于PINNs的模型训练方法，该PINNs中包括第一神经网络和偏微分方程，该第一神经网络包括至少两个残差网络通道，在模型训练过程中，可以使用至少两个残差网络通道对训练样本进行处理，而且每个残差网络通道对应的系数不同，用不同的系数乘上相同的训练样本，就可以将一个数据扩展为多个数据，而且还可以通过多个残差网络通道捕捉不同频率的信号，从而提高了模型训练的精确度。

Description

一种基于物理信息神经网络的模型训练方法及相关装置

本申请要求于2021年9月13日提交中国专利局、申请号为202111069844.8、发明名称为“一种基于物理信息神经网络的模型训练方法及相关装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，具体涉及一种基于物理信息神经网络的模型训练方法及相关装置。

背景技术

电磁仿真是各类天线及天线阵列设计、优化、分析的主要技术，通过电磁仿真可以计算出所仿真天线的一些性能指标，如回波损耗、天线能量效率等，从而可以指导天线的设计或优化。

传统的电磁仿真的性能指标的计算方法可以是对天线的仿真域先进行网格划分，然后在离散的网格上求解麦克斯韦方程，计算得到全量的电磁场从而进行下一步的优化分析。统计结果表明，离散网格划分通常耗时几十分钟到几个小时不等，对于千万级左右的计算网格，控制方程的求解则需耗时4到8个小时，这种计算方法耗时过多。

目前也有通过物理信息神经网络(Physical Informed Neural Networks，PINNs)模型计算电磁仿真的性能指标的方案，但目前训练得到的PINNs模型所计算出的电磁仿真的性能指标的精度不高，不利于天线的优化。

发明内容

本申请提供一种基于物理信息神经网络(Physical Informed Neural Networks，PINNs)的模型训练方法，用于提升模型训练的准确度。本申请还提供了相应的装置、计算机设备、计算机可读存储介质和计算机程序产品等。

本申请第一方面提供一种基于物理信息神经网络PINNs的模型训练方法，该物理信息神经网络包括第一神经网络和偏微分方程，第一神经网络包括至少两个残差网络通道，该方法包括：从天线的仿真域获取多个采样点数据，多个采样点数据包括有源区的采样点数据、无源区的采样点数据、仿真域的边界的数据，以及仿真域的初始数据，仿真域包括有源区和无源区；向第一神经网络的每个残差网络通道输入多个训练样本中每个训练样本与每个残差网络通道对应系数的乘积，每个训练样本包括一个采样点数据和仿真域对应的隐向量，每个残差网络通道对应的系数不同；通过第一神经网络对输入每个残差网络通道中的数据进行处理，以得到输出数据集，其中，输出数据集包括有源输出数据、无源输出数据、边界输出数据和初始输出数据；通过偏微分方程对输出数据集进行处理，以得到总损失函数，总损失函数与有源损失函数、无源损失函数、边界损失函数和初始损失函数有关；根据总损失函数更新第一神经网络中的参数，以得到第二神经网络；将第二神经网络作为第一神经网络，迭代执行上述训练过程，直到第二神经网络达到收敛条件，以得到用于天线的电磁仿真的目标物理信息神经网络模型。

本申请中，PINNs就是把物理方程作为限制加入神经网络中使训练的结果满足物理规律。而这个限制其实就是通过把物理方程迭代前后的残差加到神经网络的损失函数里，让物理方程也“参与”到了训练过程。这样，神经网络在训练迭代时候优化的不仅仅的网络自己的损失函数，还有物理方程每次迭代的残差，使得最后训练出来的结果满足物理规律。

本申请中，第一神经网络用于表示一次迭代前的神经网络，第二神经网络用于表示一次迭代后的神经网络。第一神经网络包括多个残差网络通道，本申请中的多个包括两个或两个以上。每个残差网络通道都可以将输入数据转换为电磁形式的输出数据。

本申请中，偏微分方程可以是点源麦克斯韦方程。

本申请中，天线的仿真域指的是模拟出的天线电磁波的覆盖区域。天线可以理解为是终端的天线，也可以是网络设备的天线。不同终端或网络设备的天线通常不同，所以，不同天线的仿真域也不同。

本申请中，仿真域包括有源区、无源区和边界，有源区指的是模拟在天线阵列中加入激励源，被激励源影响的包含激励源在内的近源区域，边界指的是仿真域的边沿，无源区指的是仿真域中除有源区和边界之外的区域。仿真域的边界通常有反弹边界或吸收边界，不同类型的边界对电磁仿真的结果影响很大。

本申请中，天线的仿真域可以包括多个不同天线各自的仿真域，每个仿真域对应的隐向量可以不相同。

本申请中，采样点数据指的是采样点对应的数据。采样点数据有四种类型，有源区的采样点数据、无源区的采样点数据、仿真域的边界的数据以及仿真域的初始数据。仿真域的初始数据通常指仿真域初始状态(通常指的是时间维度上t＝0时)的电场数据和磁场数据，初始状态的仿真域的电场数据和磁场数据通常为零。采样点数据通常是四维的，包括采样点的三维空间坐标，以及采样点的一维时间信息，采样点数据的形式可以表示为U＝(x，y，z，t)。

本申请中，训练样本指的是用于训练模型的样本数据。该训练样本中不仅包括采样点数据，还包括仿真域对应的隐向量Z。训练样本可以表示为X＝(Z,U)的形式。

本申请中，隐向量Z用来表征不同电磁仿真场景的参数设置。本申请中，隐向量Z采用低维向量，常用的维度选择可以是16，32，64，128等。

本申请中，因为采样点数据有四种类型，所以训练样本也有四种类型，分别为包含有源区的采样点数据的训练样本，包含无源区的采样点数据的训练样本，包含仿真域的边界的数据的训练样本，包含仿真域的初始数据的训练样本。

本申请中，将每种类型的训练样本逐个输入每个残差网络通道中，每个残差网络通道都会得到该种类型的输出数据，然后再将每个残差网络通道的输出数据汇总，就可以得到对应输入的一个输出数据。因此，输出数据也有四种类型，分别为有源输出数据，无源输出数据，边界输出数据和初始输出数据。另外，每个残差网络通道的系数不同，这样可以对同一个训练样本进行差异化变化，从而提高模型训练精度。

本申请中，因为训练样本有四种类型，所以输出数据也有四种类型，损失函数也有四种类型，通过四种类型的损失函数得到总损失函数再更新第一神经网络中的参数，以得到第二神经网络。

本申请中，可以采用梯度下降的方法更新第一神经网络中的参数。

本申请中，目标PINNs模型是相对于开始模型训练前的初始PINNs模型来说的，初始PINNs的第一神经网络中参数通常是较大的，在模型训练过程中，通过训练样本，不断的更新第一神经网络中的参数，直到达到收敛条件，得到第二神经网络，这时第二神经网络中的参数可以理解为固定下来，这时的整个模型称为目标PINNs模型。

由以上第一方面的描述可知，因为PINNs的第一神经网络中包括多个残差网络通道，而且每个残差网络通道对应的系数不同，这样，在模型训练阶段就可以用不同的系数乘上相同的训练样本，就可以将一个数据扩展为多个数据，而且还可以通过多残差网络通道捕捉不同频率的信号，从而提高了模型训练的准确度。

在第一方面的一种可能的实现方式中，有源区是仿真域中，以激励源对应的点源为中心，以第一长度为半径的区域，第一长度与连续概率密度函数中的第一参数相关，连续概率密度函数趋近于狄拉克函数，点源的函数为连续概率密度函数与激励源的信号的乘积；无源区是仿真域中除有源区和边界之外的区域。

本申请中，将激励源视为点源，点源的函数可以表示为J(x,t)＝η _α(x)g(t)，相比于现有的点源的函数J(x,t)＝δ(x-x ₀)g(t)，将狄拉克函数δ(x-x ₀)替换为连续概率密度函数η _α(x)。其中，J(x,t)表示点源的函数，δ(x-x ₀)表示狄拉克函数，g(t)表示激励源的信号，x ₀表示激励源的位置。该点源的函数表示在仿真域的x ₀处施加g(t)形式的激励源信号。

本申请中，采用连续概率密度函数η _α(x)替换δ(x-x ₀)，该连续概率密度函数趋近于狄拉克函数，可以表示为δ(x-x ₀)～η _α(x)。该η _α(x)表示的是抽象出的典型分布，具体的形式可以是高斯分布的形式、柯西分布的形式或指数分布的形式。

该种可能的实现方式中，通过趋近于狄拉克函数的连续概率密度函数η _α(x)代替狄拉克函数，克服了PINNs不能处理点源问题的瓶颈。

在第一方面的一种可能的实现方式中，有源输出数据为多个训练样本中的一个训练样本包含有源区的采样点数据时每个残差网络通道的输出数据之和，无源输出数据为多个训练样本中的一个训练样本包含无源区的采样点数据时每个残差网络通道的输出数据之和，边界输出数据为多个训练样本中的一个训练样本包含边界数据时每个残差网络通道的输出数据之和，初始输出数据为多个训练样本中的一个训练样本包含初始数据时每个残差网络通道的输出数据之和。

一种可能的实现方式中，可以是对每个残差网络通道输出的数据乘以一些系数，再相加求和。

该种可能的实现方式中，可以将每个残差网络通道的输出数据相加，也可以对每个残差网络通道输出的数据乘以一些系数，再相加求和。本申请这种通过对多个残差网络通道的输出数据做加和再做偏微分的方式可以提高模型训练的准确度。

在第一方面的一种可能的实现方式中，每个残差网络通道包括正弦周期性激活函数；正弦周期性激活函数用于将每个残差网络通道中的数据转换为电场参数和磁场参数作为每个残差网络通道的输出数据。

该种可能的实现方式中，每个残差网络通道都可以包括残差网络和正弦周期性激活函数，残差网络可以优化第一神经网络模型，提高第一网络模型的性能，正弦周期性激活函数可以将得到电场数据和磁场数据，这种残差网络和正弦周期性激活函数相结合的方式，可以有效提升模型的准确度。

在第一方面的一种可能的实现方式中，每个残差网络通道对应的系数按照指数级递增。

该种可能的实现方式中，多个残差网络通道中的每个残差网络通道对应的系数按照指数级递增，如有四个残差网络通道，则四个残差网络通道的系数可以分别为1、2、4和8，这种指数级递增的方式有利于快速拉开同一数据的差距，从而提高了模型训练的准确度。

在第一方面的一种可能的实现方式中，上述步骤：通过偏微分方程对输出数据集进行处理，以得到总损失函数，包括：每次将输出数据集中的一个输出数据作为偏微分方程的已知量，对偏微分方程进行运算，以得到一个输出数据对应的损失函数；对输出数据集中的每个输出数据对应的损失函数按照预设关系进行累加，以得到总损失函数。

在第一方面的一种可能的实现方式中，预设关系中包括可学参数和超参数，与总损失函数有关的不同损失函数对应的可学参数不同，可学参数会随着第一神经网络中的参数更新而更新，超参数用于辅助可学参数加权对应的损失函数。

在第一方面的一种可能的实现方式中，根据总损失函数更新第一神经网络中的参数时，该方法还包括：更新仿真域的隐向量，以及预设关系中的可学参数。

本申请第二方面提供一种增量学习的方法，该方法包括：获取来自于待优化天线的仿真域的多个采样点数据，多个采样点数据包括有源区的采样点数据、无源区的采样点数据、仿真域的边界的数据，以及仿真域的初始数据，仿真域包括有源区和无源区；向目标物理信息神经网络输入多个样本数据，其中，每个样本数据包括一个采样点数据和仿真域的第一隐向量，目标物理信息神经网络为上述第一方面或上述第一方面任一种可能的实现方式训练得到的目标物理信息神经网络模型；通过目标物理信息神经网络得到与每个样本数据对应的输出数据；控制标物理信息神经网络中的参数不变，根据输出数据调整仿真域的第一隐向量，以得到第二隐向量；将第二隐向量作为第一隐向量，通过不同的样本数据迭代执行上述对第一隐向量的调整，直到输出数据满足待优化天线的预设要求，以得到与仿真域相匹配的第二隐向量。

该第二方面中，在增量学习过程中，冻结目标物理信息神经网络中的参数，通过目标物理信息神经网络的输出数据来反复调节待优化天线的仿真域的隐向量，直到得到与仿真域相匹配的隐向量，这种方式可以快速学习出隐向量，提高了新电磁仿真场景的隐向量的获取速度。

本申请第三方面提供一种电磁仿真的方法，该方法包括使用上述第一方面或上述第一方面任一种可能的实现方式训练得到的目标物理信息神经网络模型对天线进行仿真，以得到该天线的电磁场分布。

本申请第四方面提供一种基于物理信息神经网络的模型训练装置，该装置具有实现上述第一方面或第一方面任意一种可能实现方式的方法的功能。该功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块，例如：获取单元以及一个或多个处理单元。

本申请第五方面提供一种增量学习的装置，该装置具有实现上述第二方面的方法的功能。该功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块，例如：获取单元以及一个或多个处理单元。

本申请第六方面提供一种电磁仿真的装置，该装置具有实现上述第三方面的方法的功能。该功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块，例如：一个或多个处理单元。

本申请第七方面提供一种计算机设备，该计算机设备包括至少一个处理器、存储器、输入/输出(input/output，I/O)接口以及存储在存储器中并可在处理器上运行的计算机执行指令，当计算机执行指令被处理器执行时，处理器执行如上述第一方面或第一方面任意一种可能的实现方式的方法。

本申请第八方面提供一种计算机设备，该计算机设备包括至少一个处理器、存储器、输入/输出(input/output，I/O)接口以及存储在存储器中并可在处理器上运行的计算机执行指令，当计算机执行指令被处理器执行时，处理器执行如上述第二方面的方法。

本申请第九方面提供一种计算机设备，该计算机设备包括至少一个处理器、存储器、输入/输出(input/output，I/O)接口以及存储在存储器中并可在处理器上运行的计算机执行指令，当计算机执行指令被处理器执行时，处理器执行如上述第三方面的方法。

本申请第十方面提供一种存储一个或多个计算机执行指令的计算机可读存储介质，当计算机执行指令被处理器执行时，处理器执行如上述第一方面或第一方面任意一种可能的实现方式的方法。

本申请第十一方面提供一种存储一个或多个计算机执行指令的计算机可读存储介质，当计算机执行指令被处理器执行时，处理器执行如上述第二方面的方法。

本申请第十二方面提供一种存储一个或多个计算机执行指令的计算机可读存储介质，当计算机执行指令被处理器执行时，处理器执行如上述第三方面的方法。

本申请第十三方面提供一种存储一个或多个计算机执行指令的计算机程序产品，当计算机执行指令被处理器执行时，处理器执行如上述第一方面或第一方面任意一种可能的实现方式的方法。

本申请第十四方面提供一种存储一个或多个计算机执行指令的计算机程序产品，当计算机执行指令被处理器执行时，处理器执行如上述第二方面的方法。

本申请第十五方面提供一种存储一个或多个计算机执行指令的计算机程序产品，当计算机执行指令被处理器执行时，处理器执行如上述第三方面的方法。

本申请第十六方面提供了一种芯片系统，该芯片系统包括至少一个处理器，至少一个处理器用于实现上述第一方面或第一方面任意一种可能的实现方式中所涉及的功能。在一种可能的设计中，芯片系统还可以包括存储器，存储器，用于保存处理人工智能模型的装置必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。

本申请第十七方面提供了一种芯片系统，该芯片系统包括至少一个处理器，至少一个处理器用于实现上述第二方面中所涉及的功能。在一种可能的设计中，芯片系统还可以包括存储器，存储器，用于保存基于人工智能模型的数据处理的装置必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。

本申请第十八方面提供了一种芯片系统，该芯片系统包括至少一个处理器，至少一个处理器用于实现上述第二方面中所涉及的功能。在一种可能的设计中，芯片系统还可以包括存储器，存储器，用于保存基于人工智能模型的数据处理的装置必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。

附图说明

图1是本申请实施例提供的物理信息神经网络模型的一结构示意图；

图2是本申请实施例提供的一模型训练示意图；

图3是本申请实施例提供的一天线的仿真域的示意图；

图4是本申请实施例提供的模型训练方法的一实施例示意图；

图5是本申请实施例提供的模型训练方法的一示例示意图；

图6是本申请实施例提供的电源麦克斯韦方程的一示例示意图；

图7是本申请实施例提供的增量学习的方法的一实施例示意图；

图8是本申请实施例提供的一增量学习的方法的另一实施例示意图；

图9是本申请实施例提供的一实验效果对比图；

图10是本申请实施例提供的电磁仿真的一实施例示意图；

图11是本申请实施例提供的模型训练装置的一实施例示意图；

图12是本申请实施例提供的增量学习的装置的一实施例示意图；

图13是本申请实施例提供的一计算机设备的一结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。本领域普通技术人员可知，随着技术发展和新场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请实施例提供一种基于物理信息神经网络(Physical Informed Neural Networks，PINNs)的模型训练方法，用于提升模型训练的准确度，从而提高电磁仿真的准确度。本申请还提供了相应的装置、计算机设备、计算机可读存储介质和计算机程序产品等。以下分别进行详细说明。

天线可以通过电磁仿真进行优化。目前可以通过人工智能(artificial intelligence,AI)技术预先训练神经网络模型，使用该神经网络模型来完成电磁仿真的过程，确定出待优化天线的电磁场分布以及性能指标等仿真结果，进而根据仿真结果对天线进行优化。

因为电磁场分布具有很强的物理特性，所以针对电磁仿真的神经网络模型多是PINNs模型。PINNs就是把物理方程作为限制加入神经网络中使训练的结果满足物理规律。而这个限制其实就是通过把物理方程迭代前后的残差加到神经网络的损失函数里，让物理方程也“参与”到了训练过程。这样，神经网络在训练迭代时候优化的不仅仅的网络自己的损失函数，还有物理方程每次迭代的残差，使得最后训练出来的结果满足物理规律。

为了更好的使用PINNs模型进行电磁仿真，本申请实施例提供以下几个方面的内容：一、提供一种新型结构的PINNs模型；二、基于天线的仿真域对该新型结构的PINNs模型进行训练，以得到目标PINNs模型；三、使用该目标PINNs模型进行增量学习，以得到新电磁仿真场景的隐向量；四、使用目标PINNs模型进行电磁仿真，以得到天线仿真域中各点的电磁场数据。该模型训练的过程、增量学习的过程都以及电磁仿真的过程都可以是在计算机设备上进行的，该计算机设备可以是服务器、终端设备或虚拟机(virtual machine，VM)。

终端设备(也可以称为用户设备(user equipment，UE))是一种具有无线收发功能的设备，可以部署在陆地上，包括室内或室外、手持或车载；也可以部署在水面上(如轮船等)；还可以部署在空中(例如飞机、气球和卫星上等)。所述终端可以是手机(mobile phone)、平板电脑(pad)、带无线收发功能的电脑、虚拟现实(virtual reality，VR)终端、增强现实(augmented reality，AR)终端、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。

VM可以是在物理机的硬件资源上采用虚拟化的方式划分出来的虚拟化的设备。

下面对本申请实施例所涉及到的内容依次进行介绍。

一、新型结构的PINNs模型。

本申请实施例提供的新型结构的PINNs模型可以参阅图1进行理解。如图1所示，本申请实施例提供的新型结构的PINNs模型可以包括第一神经网络和偏微分方程(partial differential equation，PDE)，该第一神经网络包括至少两个残差网络通道，如图1中所示的第一神经网络包括n个残差网络通道，如：残差网络通道1、残差网络通道2，…，残差网络通道n。偏微分方程可以是点源麦克斯韦方程。

每个残差网络通道都有对应的系数，n个残差网络通道各自对应的系数可以按照指数级递增。如n＝4时，有四个残差网络通道，这四个残差网络通道各自对应的系数可以分别为1、2、4和8。如n＝5时，有五个残差网络通道，这五个残差网络通道各自对应的系数可以分别为1、2、4、8和16。

每个残差网络通道都可以包括残差网络和正弦周期性激活函数。其中，残差网络和正弦周期性激活函数可以表示为x→φ _i(x)＝x+sin(W _ix+b _i)，其中，x表示残差，sin(W _ix+b _i)表示正弦周期性激活函数。

本申请实施例中，残差网络可以优化第一神经网络，提高第一神经网络的性能，正弦周期性激活函数用于将每个残差网络通道中的数据转换为电场参数和磁场参数作为每个残差网络通道的输出数据。这种残差网络和正弦周期性激活函数相结合的方式，可以有效提升模型的准确度。

二、基于天线的仿真域对该新型结构的PINNs模型进行训练，以得到目标PINNs模型。

本申请实施例提供的模型训练的过程可以参阅图2进行理解。如图2所示，向PINNs模型中输入训练样本，通过第一神经网络对训练样本进行处理，以得到输出数据，通过偏微分方程对输出数据进行处理，以得到损失函数，再通过损失函数更新第一神经网络中的参数，计算机设备迭代执行该训练过程，直到达到收敛条件，得到目标PINNs模型。

本申请实施例用于训练PINNs模型的训练样本是来自于天线的仿真域的，天线的仿真域指的是模拟出的天线电磁波的覆盖区域。天线可以理解为是终端的天线，也可以是网络设备的天线。不同终端或网络设备的天线通常不同，所以，不同天线的仿真域也不同。

本申请实施例中的天线可以是采用脉冲激励源进行加源的天线。这样，天线的仿真域包括有源区、无源区和边界。天线的结构可以是如图3所示的蝶形结构100，该蝶形结构的天线包括两个相对的三角形结构。模拟该天线电磁波所覆盖的区域可以理解为是这个蝶形天线的仿真域101，如图3中的可以在两个三角形的中间位置进行加源，可以将该激励源理解为是点源102，包含点源102的近源区域为有源区103，仿真域101中除有源区103和该仿真域101的边界之外的区域为无源区104。

也理解为：有源区是仿真域中，以激励源对应的点源为中心，以第一长度为半径的区域，第一长度与连续概率密度函数中的第一参数相关，连续概率密度函数趋近于狄拉克函数，点源的函数为连续概率密度函数与激励源的信号的乘积；无源区是仿真域中除有源区和边界之外的区域，或者除掉边界，仿真域内部除有源区之外的区域。

本申请实施例中，除掉边界的仿真域可以用Ω表示，有源区可以用Ω ₀表示，无源区可以用Ω ₁表示，这样，Ω ₀＝{(x ₀+x)∈Ω,||x||≤3α}，Ω ₁＝Ω-Ω ₀。其中，x ₀表示激励源对应的点源的中心，x表示第一长度的半径，α表示连续概率密度函数中的第一参数。本申请实施例中，α的取值可以是根据需求设置的，通常是仿真域长度的1/100～1/200，仿真域的时间范围和空间范围都可以是根据天线确定的。

本申请实施例中，将激励源视为点源，点源的函数可以表示为J(x,t)＝η _α(x)g(t)，相比于现有的点源的函数J(x,t)＝δ(x-x ₀)g(t)，将狄拉克函数δ(x-x ₀)替换为连续概率密度函数η _α(x)。其中，J(x,t)表示点源的函数，δ(x-x ₀)表示狄拉克函数，g(t)表示激励源的信号，x ₀表示激励源的位置。该点源的函数表示在仿真域的x ₀处施加g(t)形式的激励源信号。

本申请中实施例中，采用连续概率密度函数η _α(x)替换δ(x-x ₀)，该连续概率密度函数趋近于狄拉克函数，可以表示为δ(x-x ₀)～η _α(x)。该η _α(x)表示的是抽象出的典型分布，具体的形式可以是高斯分布的形式、柯西分布的形式或指数分布的形式。几种分布的形式可以参阅下表1进行理解。

表1：

本申请实施例中，通过趋近于狄拉克函数的连续概率密度函数η _α(x)代替狄拉克函数，克服了PINNs不能处理点源问题的瓶颈。

本申请实施例提供的基于PINNs的模型训练方法的一实施例可以参阅图4进行理解，如图4所示，本申请实施例提供的基于PINNs的模型训练方法的一实施例可以包括：

201.计算机设备从天线的仿真域获取多个采样点数据。

其中，多个采样点数据包括有源区的采样点数据、无源区的采样点数据、仿真域的边界的数据，以及仿真域的初始数据，仿真域包括有源区和无源区。

本申请实施例中，采样点数据有四种类型，有源区的采样点数据、无源区的采样点数据、仿真域的边界的数据以及仿真域的初始数据。仿真域的边界通常有反弹边界或吸收边界，不同类型的边界对电磁仿真的结果影响很大，仿真域的初始数据通常指仿真域初始状态(通常指的是时间维度上t＝0时)的电场数据和磁场数据，初始状态的仿真域的电场数据和磁场数据通常为零。采样点数据通常是四维的，包括采样点的三维空间坐标，以及采样点的一维时间信息，采样点数据的形式可以表示为U＝(x，y，z，t)。按照采样点数据的类型表示，有源区的采样点数据可以表示为U _SRC，无源区的采样点数据U _{NO_SRC}，仿真域的边界数据U _BC，仿真域的初始数据U _IC。

202.计算机设备向第一神经网络的每个残差网络通道输入多个训练样本中每个训练样本与每个残差网络通道对应系数的乘积。

其中，每个训练样本包括一个采样点数据和仿真域对应的隐向量。

训练样本指的是用于训练PINNs模型的样本数据。该训练样本中不仅包括采样点数据，还包括仿真域对应的隐向量Z。训练样本可以表示为X＝(Z,U)的形式。按照训练样本的类型表示，包含U _SRC的训练样本可以表示为X _SRC＝(Z,U _SRC)，包含U _{NO_SRC}的训练样本可以表示为X _{NO_SRC}＝(Z,U _{NO_SRC})，包含U _BC的训练样本可以表示为X _BC＝(Z,U _BC)，包含U _IC的训练样本可以表示为X _IC＝(Z,U _IC)。

隐向量Z用来表征不同电磁仿真场景的参数设置。本申请实施例中，隐向量Z采用低维向量，常用的维度选择可以是16，32，64，128等。

每个残差网络通道对应的系数不同。如图5所示，第一神经网络中有n个残差网络通道，由残差网络通道1到残差网络通道n，其中，残差网络通道1对应的系数为a ₁，残差网络通道2对应的系数为a ₂，…，残差网络通道n对应的系数为a _n，这n个残差网络通道的系数也可以用集合的形式表示为{a ₁,a ₂,…,a _n}。这样，当训练样本为X时，每个残差网络通道的输入即可表示为{a ₁X,a ₂X,…,a _nX}。该X可以是上述X _SRC、X _{NO_SRC}、X _BC和X _IC中的任意一个。

若训练样本来自于多个电磁仿真场景，即来自于多种不同天线的仿真域，那么，针对每个不同的仿真域都会有一个对应的隐向量，如有N个不同的仿真域，那么N个隐向量可以表示为{Z ₁,…Z _N}。当有N个仿真域时，来自于第i个仿真域的训练样本可以表示为{X _i,SRC＝(Z _i,U _i,SRC),X _{i,NO_SRC}＝(Z _i,U _{i,NO_SRC}),X _i,IC＝(Z _i,U _i,IC),X _i,BC＝(Z _i,U _i,BC)}。

203.计算机设备通过第一神经网络对输入每个残差网络通道中的数据进行处理，以得到输出数据集。

其中，输出数据集包括有源输出数据、无源输出数据、边界输出数据和初始输出数据。

可选地，本申请实施例中，有源输出数据为多个训练样本中的一个训练样本包含有源区的采样点数据时每个残差网络通道的输出数据之和，无源输出数据为多个训练样本中的一个训练样本包含无源区的采样点数据时每个残差网络通道的输出数据之和，边界输出数据为多个训练样本中的一个训练样本包含边界数据时每个残差网络通道的输出数据之和，初始输出数据为多个训练样本中的一个训练样本包含初始数据时每个残差网络通道的输出数据之和。

本申请实施例中，不限于直接将各残差网络通道的输出数据直接相加求和这种方式，也可以是对每个残差网络通道输出的数据乘以一些系数，再相加求和。

该输出数据集可以表示为{Y _SRC,Y _{NO_SRC},Y _BC,Y _IC}。其中，每个Y都可以是通过每个残差网络通道的系数乘以对应类型的X，然后再对每个残差网络通道的输出做相加求和得到的，可以表示为Y＝Y ₁+Y ₂…+Y _n，其中，Y ₁表示残差网络通道1的输出数据，Y _n表示残差网络通道n的输出数据。

204.计算机设备通过偏微分方程对输出数据集进行处理，以得到总损失函数。

其中，总损失函数根据有源损失函数、无源损失函数、边界损失函数和初始损失函数得到。

有源损失函数指的是通过有源输出数据得到的损失函数，无源损失函数指的是通过无源输出数据得到的损失函数，边界损失函数指的是通过边界输出数据得到的损失函数，初始损失函数指的是通过初始输出数据得到的损失函数。有源损失函数可以用L _SRC表示，无源损失函数可以用L _{NO_SRC}表示，边界损失函数可以用L _BC表示，初始损失函数可以用L _IC表示。

可选地，得到总损失函数的过程可以是：每次将输出数据集中的一个输出数据作为偏微分方程的已知量，对偏微分方程进行运算，以得到一个输出数据对应的损失函数；对输出数据集中的每个输出数据对应的损失函数按照预设关系进行累加，以得到总损失函数。其中，预设关系中包括可学参数，不同损失函数对应的可学参数不同。

该偏微分方程可以是点源麦克斯韦方程，输出数据Y通常是六维的，会包括三维的电场数据，以及三维的磁场数据，如图6所示，将输出数据Y中的电场数据和磁场数据作为已知量代入如图6所示的电源麦克斯韦方程，然后进行计算，可以计算的到对应的损失函数。图6中的E表示电场，H表示磁场，下表x、y、z分别表示三维空间。

总损失函数可以是按照预设关系进行累加得到的，预设关系中包括可学参数和超参数，与总损失函数有关的不同损失函数对应的可学参数不同，可学参数会随着第一神经网络中的参数更新而更新，超参数用于辅助可学参数加权对应的损失函数。

该预设关系可以表示为：

其中，L _total表示总损失函数，L _i表示四种类型的损失函数，ε为超参数，该超参数的取值可以为0.01，当然，此处只是超参数取值的一个示例，本申请中，不限定超参数的具体值，λ _i为可学参数,i＝1,2,3,4。

本申请实施例中，通过超参数和可学参数实现动态加权损失函数，平衡各项损失函数权重，可以加速神经网络训练过程中的收敛速度。

205.计算机设备根据总损失函数更新第一神经网络中的参数，以得到第二神经网络。

本申请中，第一神经网络用于表示一次迭代前的神经网络，第二神经网络用于表示一次迭代后的神经网络。

另外，在更新第一神经网络中的参数θ时，还可以更新仿真域的隐向量Z，以及上述预设关系中的可学参数λ。也就是可以根据L _total更新θ、Z和λ。

本申请实施例中，更新θ、Z和λ可以采用梯度下降的方法，在本轮迭代的θ、Z和λ的基础上进行下调，得到新的θ、Z和λ，开始下一轮迭代过程。

将第二神经网络作为第一神经网络，迭代执行上述训练过程，直到第二神经网络达到收敛条件，以得到目标物理信息神经网络模型。

本申请实施例中，目标PINNs模型是相对于开始模型训练前的初始PINNs模型来说的，初始PINNs的第一神经网络中参数通常是较大的，在模型训练过程中，通过训练样本，不断的更新第一神经网络中的参数，直到达到收敛条件，得到第二神经网络，这时第二神经网络中的参数可以理解为固定下来，这时的整个模型称为目标PINNs模型。

本申请实施例中，因为PINNs的第一神经网络中包括多个残差网络通道，而且每个残差网络通道对应的系数不同，这样，在模型训练阶段就可以用不同的系数乘上相同的训练样本，就可以将一个数据扩展为多个数据，而且还可以通过多残差网络通道捕捉不同频率的信号，从而提高了模型训练的准确度。

三、使用目标PINNs模型进行增量学习。

如图7所示，本申请实施例提供的增量学习的一实施例包括：

301.计算机设备获取来自于待优化天线的仿真域的多个采样点数据。

多个采样点数据包括有源区的采样点数据、无源区的采样点数据、仿真域的边界的数据，以及仿真域的初始数据，仿真域包括有源区和无源区。

本申请实施例中的采样点数据可以参阅上述步骤201中的采样点数据进行理解，只是本申请实施例中的采样点数据来自于待优化天线的仿真域，或者说来自于新电磁仿真场景的仿真域。

302.计算机设备向目标物理信息神经网络输入多个样本数据，其中，每个样本数据包括一个采样点数据和仿真域的第一隐向量。

目标物理信息神经网络为基于PINNs的模型训练方法得到的目标物理信息神经网络。

303.计算机设备通过目标物理信息神经网络得到与每个样本数据对应的输出数据。

304.计算机设备控制标物理信息神经网络中的参数不变，根据输出数据调整仿真域的第一隐向量，以得到第二隐向量。

本申请实施例对隐向量的调节可以是通过梯度下降方式进行调节。

将第二隐向量作为第一隐向量，通过不同的样本数据迭代执行上述对第一隐向量的调整，直到输出数据满足待优化天线的预设要求，以得到与仿真域相匹配的第二隐向量。

本申请实施例中，可以将第一隐向量理解为是迭代前的隐向量，第二隐向量理解为是迭代后的隐向量。

本申请实施例中，在增量学习过程中，冻结目标物理信息神经网络中的参数，通过目标物理信息神经网络的输出数据来反复调节待优化天线的仿真域的隐向量，直到得到与仿真域相匹配的隐向量，这种方式可以快速学习出隐向量，提高了新电磁仿真场景的隐向量的获取速度。

上述增量学习的过程可以参阅图8的示例进行理解，如图8所示，针对新的电磁仿真场景，可以采用已经训练好的目标PINNs模型，保持该目标PINNs模型中的θ在每轮迭代过程中都不改变，向目标PINNs模型中输入{Xnew, _SRC,＝(Znew,Unew- _SRC),Xnew， _{NO_SRC}＝(Znew,Unew- _{NO_SRC})，Xnew, _IC＝(Znew,Unew- _IC)，Xnew, _BC＝(Znew,Unew- _BC)}，通过目标PINNs模型的输出数据Y来调整输入数据X中的Z，直到输出数据Y满足预设要求，得到与新电磁仿真场景相匹配的隐向量Z。

关于增量学习的方案，开发人员做了相关实验，如图9所示为采用本申请提供的增量学习方案得到新电磁仿真场景的隐向量Z相比于原始方法得到新电磁仿真场景的隐向量Z的时间对比图，从图9中可以看出，在5％的误差情况下，本申请方案只需要200秒就可以得到新电磁仿真场景的隐向量Z，而采用原始方法得到新电磁仿真场景的隐向量Z需要3337秒，本申请的方案在速度上提高了很多。

四、使用目标PINNs模型进行电磁仿真，以得到天线仿真域中各点的电磁场数据。

通过上述模型训练的过程训练得到目标PINNs模型后，可以将该目标PINNs模型以模型文件的形式存储，在用于电磁仿真的计算机设备(如：终端设备、服务器或VM等)需要使用该目标PINNs模型时，可以是用于电磁仿真的计算机设备主动加载该目标PINNs模型的模型文件。也可以是存储该目标PINNs模型的模型文件主动发送给用于电磁仿真的计算机设备安装该目标PINNs模型的模型文件。

如图10所示，计算机设备上安装该目标PINNs模型后，就可以使用该目标PINNs模型进行电磁仿真。仿真结果可以是图10所示的电磁场分布示意图，也可以是所仿真天线的一些性能指标，如：天线仿真域中各点的电磁场数据，本申请实施例中，电磁场数据包括电场数据和磁场数据，如：电场强度和磁场强度等。这样，就可以通过电磁仿真的结果对天线进行优化设计。

本申请实施例所提供的电磁仿真的方案，采用多残差网络通道的目标PINNs模型执行电磁仿真过程，很大程度上提升了电磁仿真的精准度。

以上描述了基于物理信息神经网络的模型训练方法，以及增量学习的方法，下面结合附图11介绍本申请实施例提供的基于物理信息神经网络的模型训练装置40，该基于物理信息神经网络的模型训练装置40包括：

获取单元401，用于从天线的仿真域获取多个采样点数据，多个采样点数据包括有源区的采样点数据、无源区的采样点数据、仿真域的边界的数据，以及仿真域的初始数据，仿真域包括有源区和无源区。该获取单元401的功能可以参阅上述方法实施例中的步骤201进行理解。

第一处理单元402，用于向第一神经网络的每个残差网络通道输入多个训练样本中每个训练样本与每个残差网络通道对应系数的乘积，每个训练样本包括获取单元401获取的一个采样点数据和仿真域对应的隐向量，每个残差网络通道对应的系数不同。该第一处理单元402的功能可以参阅上述方法实施例中的步骤202进行理解。

第二处理单元403，用于通过第一神经网络对第一处理单元402输入每个残差网络通道中的数据进行处理，以得到输出数据集，其中，输出数据集包括有源输出数据、无源输出数据、边界输出数据和初始输出数据。该第二处理单元403的功能可以参阅上述方法实施例中的步骤203进行理解。

第三处理单元404，用于通过偏微分方程对输出数据集进行处理，以得到总损失函数，总损失函数根据有源损失函数、无源损失函数、边界损失函数和初始损失函数得到。该第三处理单元404的功能可以参阅上述方法实施例中的步骤204进行理解。

第四处理单元405，用于根据总损失函数更新第一神经网络中的参数，以得到第二神经网络。该第四处理单元405的功能可以参阅上述方法实施例中的步骤205进行理解。

可选地，有源区是仿真域中，以激励源对应的点源为中心，以第一长度为半径的区域，第一长度与连续概率密度函数中的第一参数相关，连续概率密度函数趋近于狄拉克函数，点源的函数为连续概率密度函数与激励源的信号的乘积；无源区是仿真域中除有源区和边界之外的区域。

可选地，有源输出数据为多个训练样本中的一个训练样本包含有源区的采样点数据时每个残差网络通道的输出数据之和，无源输出数据为多个训练样本中的一个训练样本包含无源区的采样点数据时每个残差网络通道的输出数据之和，边界输出数据为多个训练样本中的一个训练样本包含边界数据时每个残差网络通道的输出数据之和，初始输出数据为多个训练样本中的一个训练样本包含初始数据时每个残差网络通道的输出数据之和。

可选地，每个残差网络通道包括正弦周期性激活函数；正弦周期性激活函数用于将每个残差网络通道中的数据转换为电场参数和磁场参数作为每个残差网络通道的输出数据。

可选地，每个残差网络通道对应的系数按照指数级递增。

可选地，第三处理单元404，用于每次将输出数据集中的一个输出数据作为偏微分方程的已知量，对偏微分方程进行运算，以得到一个输出数据对应的损失函数；对输出数据集中的每个输出数据对应的损失函数按照预设关系进行累加，以得到总损失函数。

预设关系中包括可学参数和超参数，与总损失函数有关的不同损失函数对应的可学参数不同，可学参数会随着第一神经网络中的参数更新而更新，超参数用于辅助可学参数加权对应的损失函数。

可选地，第四处理单元405，还用于更新仿真域的隐向量，以及预设关系中的可学参数。

可选地，预设关系中包括可学参数，不同损失函数对应的可学参数不同。

以上所描述的基于物理信息神经网络的模型训练装置40可以参阅前述方法实施例部分的相应描述进行理解，此处不做重复赘述。

如图12所示，本申请实施例提供的增量学习的装置50的一实施例包括：

获取单元501，用于获取来自于待优化天线的仿真域的多个采样点数据，多个采样点数据包括有源区的采样点数据、无源区的采样点数据、仿真域的边界的数据，以及仿真域的初始数据，仿真域包括有源区和无源区。该获取单元501可以执行上述方法实施例中的步骤301。

第一处理单元502，用于向目标物理信息神经网络输入多个样本数据，其中，每个样本数据包括一个采样点数据和仿真域的第一隐向量，目标物理信息神经网络为基于物理信息神经网络的模型训练方法得到的目标物理信息神经网络。该第一处理单元502可以执行上述方法实施例中的步骤302。

第二处理单元503，用于通过目标物理信息神经网络得到与每个样本数据对应的输出数据。该第二处理单元503可以执行上述方法实施例中的步骤303。

第三处理单元504，用于控制标物理信息神经网络中的参数不变，根据输出数据调整仿真域的第一隐向量，以得到第二隐向量。该第三处理单元504可以执行上述方法实施例中的步骤304。

本申请实施例提供一种电磁仿真的装置，该电磁仿真的装置安装有上述目标物理信息神经网络模型，该电磁仿真的装置可以通过该目标物理信息神经网络模型对天线进行仿真，以得到所述天线的仿真域的电磁场分布。

图13所示，为本申请的实施例提供的计算机设备60的一种可能的逻辑结构示意图。该计算机设备60可以是基于物理信息神经网络的模型训练装置，也可以是增量学习的装置或者电磁仿真的装置。该计算机设备60包括：处理器601、通信接口602、存储器603以及总线604。处理器601、通信接口602以及存储器603通过总线604相互连接。在本申请的实施例中，处理器601用于对计算机设备60的动作进行控制管理，例如，处理器601用于执行图1至图9的方法实施例中的过程，通信接口602用于支持计算机设备60进行通信。存储器603，用于存储计算机设备60的程序代码和数据。

其中，处理器601可以是中央处理器单元，通用处理器，数字信号处理器，专用集成电路，现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器601也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，数字信号处理器和微处理器的组合等等。总线604可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图13中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在本申请的另一实施例中，还提供一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，当设备的处理器执行该计算机执行指令时，设备执行上述基于物理信息神经网络的模型训练方法、增量学习的方法或者执行上述电磁仿真的方法。

在本申请的另一实施例中，还提供一种计算机程序产品，该计算机程序产品包括计算机执行指令，该计算机执行指令存储在计算机可读存储介质中；当设备的处理器执行该计算机执行指令时，设备执行上述基于物理信息神经网络的模型训练方法、增量学习的方法或者执行上述电磁仿真的方法。

在本申请的另一实施例中，还提供一种芯片系统，该芯片系统包括处理器，该处理器用于实现上述基于物理信息神经网络的模型训练方法、增量学习的方法或者执行上述电磁仿真的方法。在一种可能的设计中，芯片系统还可以包括存储器，存储器，用于保存进程间通信的装置必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请实施例的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请实施例所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请实施例各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请实施例各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上，仅为本申请实施例的具体实施方式，但本申请实施例的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请实施例的保护范围之内。因此，本申请实施例的保护范围应以权利要求的保护范围为准。

Claims

一种基于物理信息神经网络PINNs的模型训练方法，其特征在于，所述物理信息神经网络包括第一神经网络和偏微分方程，所述第一神经网络包括至少两个残差网络通道，所述方法包括：

从天线的仿真域获取多个采样点数据，所述多个采样点数据包括有源区的采样点数据、无源区的采样点数据、所述仿真域的边界的数据，以及所述仿真域的初始数据，所述仿真域包括所述有源区和所述无源区；

向所述第一神经网络的每个残差网络通道输入多个训练样本中每个训练样本与所述每个残差网络通道对应系数的乘积，所述每个训练样本包括一个采样点数据和所述仿真域对应的隐向量，所述每个残差网络通道对应的系数不同；

通过所述第一神经网络对输入所述每个残差网络通道中的数据进行处理，以得到输出数据集，其中，所述输出数据集包括有源输出数据、无源输出数据、边界输出数据和初始输出数据；

通过所述偏微分方程对所述输出数据集进行处理，以得到总损失函数，所述总损失函数与有源损失函数、无源损失函数、边界损失函数和初始损失函数有关；

根据所述总损失函数更新所述第一神经网络中的参数，以得到第二神经网络；

将所述第二神经网络作为所述第一神经网络，迭代执行上述训练过程，直到所述第二神经网络达到收敛条件，以得到用于所述天线的电磁仿真的目标物理信息神经网络模型。
根据权利要求1所述的模型训练方法，其特征在于，

所述有源区是所述仿真域中，以激励源对应的点源为中心，以第一长度为半径的区域，所述第一长度与连续概率密度函数中的第一参数相关，所述连续概率密度函数趋近于狄拉克函数；

所述无源区是所述仿真域中除所述有源区和所述仿真域的边界之外的区域。
根据权利要求1或2所述的模型训练方法，其特征在于，

所述有源输出数据为所述多个训练样本中的一个训练样本包含所述有源区的采样点数据时所述每个残差网络通道的输出数据之和；

所述无源输出数据为所述多个训练样本中的一个训练样本包含所述无源区的采样点数据时所述每个残差网络通道的输出数据之和；

所述边界输出数据为所述多个训练样本中的一个训练样本包含所述仿真域的边界的数据时所述每个残差网络通道的输出数据之和；

所述初始输出数据为所述多个训练样本中的一个训练样本包含所述初始数据时所述每个残差网络通道的输出数据之和。
根据权利要求1-3任一项所述的模型训练方法，其特征在于，所述每个残差网络通道包括正弦周期性激活函数；

所述正弦周期性激活函数用于将所述每个残差网络通道中的数据转换为电场参数和磁场参数作为所述每个残差网络通道的输出数据。
根据权利要求1-4任一项所述的模型训练方法，其特征在于，所述每个残差网络通道对应的系数按照指数级递增。
根据权利要求1-5任一项所述的模型训练方法，其特征在于，所述通过所述偏微分方程对所述输出数据集进行处理，以得到总损失函数，包括：

每次将所述输出数据集中的一个输出数据作为所述偏微分方程的已知量，对所述偏微分方程进行运算，以得到所述一个输出数据对应的损失函数；

对所述输出数据集中的每个输出数据对应的损失函数按照预设关系进行累加，以得到所述总损失函数。
根据权利要求6所述的模型训练方法，其特征在于，所述预设关系中包括可学参数和超参数，与所述总损失函数有关的不同损失函数对应的可学参数不同，所述可学参数会随着所述第一神经网络中的参数更新而更新，所述超参数用于辅助所述可学参数加权对应的损失函数。
根据权利要求7所述的模型训练方法，其特征在于，所述根据所述总损失函数更新所述第一神经网络中的参数时，所述方法还包括：

更新所述仿真域的隐向量，以及所述预设关系中的所述可学参数。
一种增量学习的方法，其特征在于，包括：

获取来自于待优化天线的仿真域的多个采样点数据，所述多个采样点数据包括有源区的采样点数据、无源区的采样点数据、所述仿真域的边界的数据，以及所述仿真域的初始数据，所述仿真域包括所述有源区和所述无源区；

向目标物理信息神经网络输入多个样本数据，其中，每个样本数据包括一个采样点数据和所述仿真域的第一隐向量，所述目标物理信息神经网络为上述权利要求1-8任一项的模型训练方法得到的目标物理信息神经网络；

通过所述目标物理信息神经网络得到与所述每个样本数据对应的输出数据；

控制所述标物理信息神经网络中的参数不变，根据所述输出数据调整所述仿真域的第一隐向量，以得到第二隐向量；

将所述第二隐向量作为所述第一隐向量，通过不同的样本数据迭代执行上述对所述第一隐向量的调整，直到所述输出数据满足所述待优化天线的预设要求，以得到与所述仿真域相匹配的第二隐向量。
一种基于物理信息神经网络的模型训练装置，其特征在于，所述物理信息神经网络包括第一神经网络和偏微分方程，所述第一神经网络包括至少两个残差网络通道，所述模型训练装置包括：

获取单元，用于从天线的仿真域获取多个采样点数据，所述多个采样点数据包括有源区的采样点数据、无源区的采样点数据、所述仿真域的边界的数据，以及所述仿真域的初始数据，所述仿真域包括所述有源区和所述无源区；

第一处理单元，用于向所述第一神经网络的每个残差网络通道输入多个训练样本中每个训练样本与所述每个残差网络通道对应系数的乘积，所述每个训练样本包括一个采样点数据和所述仿真域对应的隐向量，所述每个残差网络通道对应的系数不同；

第二处理单元，用于通过所述第一神经网络对输入所述每个残差网络通道中的数据进行处理，以得到输出数据集，其中，所述输出数据集包括有源输出数据、无源输出数据、边界输出数据和初始输出数据；

第三处理单元，用于通过所述偏微分方程对所述输出数据集进行处理，以得到总损失函数，所述总损失函数与有源损失函数、无源损失函数、边界损失函数和初始损失函数有关；

第四处理单元，用于根据所述总损失函数更新所述第一神经网络中的参数，以得到第二神经网络；

将所述第二神经网络作为所述第一神经网络，迭代执行上述训练过程，直到所述第二神经网络达到收敛条件，以得到用于所述天线的电磁仿真的目标物理信息神经网络模型。
根据权利要求10所述的模型训练装置，其特征在于，

所述第三处理单元，用于每次将所述输出数据集中的一个输出数据作为所述偏微分方程的已知量，对所述偏微分方程进行运算，以得到所述一个输出数据对应的损失函数；对所述输出数据集中的每个输出数据对应的损失函数按照预设关系进行累加，以得到所述总损失函数。
根据权利要求10所述的模型训练装置，其特征在于，

所述第四处理单元，还用于更新所述仿真域的隐向量，以及所述预设关系中的可学参数。
一种增量学习的装置，其特征在于，包括：

获取单元，用于获取来自于待优化天线的仿真域的多个采样点数据，所述多个采样点数据包括有源区的采样点数据、无源区的采样点数据、所述仿真域的边界的数据，以及所述仿真域的初始数据，所述仿真域包括所述有源区和所述无源区；

第一处理单元，用于向目标物理信息神经网络输入多个样本数据，其中，每个样本数据包括一个采样点数据和所述仿真域的第一隐向量，所述目标物理信息神经网络为上述权利要求1-8任一项的模型训练方法得到的目标物理信息神经网络；

第二处理单元，用于通过所述目标物理信息神经网络得到与所述每个样本数据对应的输出数据；

第三处理单元，用于控制所述标物理信息神经网络中的参数不变，根据所述输出数据调整所述仿真域的第一隐向量，以得到第二隐向量；

将所述第二隐向量作为所述第一隐向量，通过不同的样本数据迭代执行上述对所述第一隐向量的调整，直到所述输出数据满足所述待优化天线的预设要求，以得到与所述仿真域相匹配的第二隐向量。
一种计算设备，其特征在于，包括一个或多个处理器和存储有计算机程序的计算机可读存储介质；

所述计算机程序被所述一个或多个处理器执行时实现如权利要求1-8任一项或实现如权利要求9所述的方法。
一种芯片系统，其特征在于，包括一个或多个处理器，所述一个或多个处理器被调用用于执行如权利要求1-8任一项所述的方法或执行如权利要求9所述的方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被一个或多个处理器执行时实现如权利要求1-8任一项所述的方法或实现如权利要求9所述的方法。
一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序当被一个或多个处理器执行时用于实现如权利要求1-8任一项所述的方法或实现如权利要求9所述的方法。