CN117172163B - 幅相控制电路的幅相二维优化方法、系统、介质及电子设备 - Google Patents

幅相控制电路的幅相二维优化方法、系统、介质及电子设备 Download PDF

Info

Publication number
CN117172163B
CN117172163B CN202311027486.3A CN202311027486A CN117172163B CN 117172163 B CN117172163 B CN 117172163B CN 202311027486 A CN202311027486 A CN 202311027486A CN 117172163 B CN117172163 B CN 117172163B
Authority
CN
China
Prior art keywords
amplitude
phase
solution set
optimal state
control circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311027486.3A
Other languages
English (en)
Other versions
CN117172163A (zh
Inventor
胥昕
范麟
阳润
谢卓恒
王琼玫
何林逊
龙德伟
贾美平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Southwest Integrated Circuit Design Co ltd
Original Assignee
Chongqing Southwest Integrated Circuit Design Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Southwest Integrated Circuit Design Co ltd filed Critical Chongqing Southwest Integrated Circuit Design Co ltd
Priority to CN202311027486.3A priority Critical patent/CN117172163B/zh
Publication of CN117172163A publication Critical patent/CN117172163A/zh
Application granted granted Critical
Publication of CN117172163B publication Critical patent/CN117172163B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种幅相控制电路的幅相二维优化方法、系统、介质及电子设备,基于极坐标映射将幅相控制电路的多个状态的幅相特性转化成相互影响制约的半径‑弧度坐标,保留了幅度‑相位二维特性,避免了矢量合成算法中数据因维度下降造成的系统性计算误差和整体评估偏差,降低了整体幅度偏差离散度及相位偏差,提升了数据格式化精度,通过在极坐标位置上直接距离的判定抽取方式,能更加直观简洁地抽取出最优状态解,并非提升了最优状态解的抽取精度;通过引入人类反馈信号强化学习算法建立奖励模型的方式解决多个幅相控制电路最优状态解的方式实现自适应优化,历史数据和实测数据的动态校准保证了大批量幅相电路状态优化的稳定性和数据可历史追溯性。

Description

幅相控制电路的幅相二维优化方法、系统、介质及电子设备
技术领域
本发明涉及电子通信技术领域,特别是涉及一种幅相控制电路的幅相二维优化方法、系统、介质及电子设备。
背景技术
幅相控制电路是一种主要用于电子对抗雷达、数字移动通信、微波毫米波通信等电子通信系统中的关键元器件,其功能是将输入信号的幅度与相位进行一定值的控制后进行输出。现代相控阵系统具有较多的通道数且工作在复杂的电磁环境中,对每个通道的幅相控制精度提出较为苛刻的要求,而幅相控制电路作为相控阵系统幅相控制的核心单元,提升幅相控制电路的幅相控制精度是未来相控阵系统发展的必然趋势。
幅相控制电路控制状态众多(一般在10K以上),遍历所有控制状态实现幅相控制效率低下,如何通过算法快速计算推理得到最优的幅相控制状态,以较低的幅相控制状态(通常2K以下)表征幅相控制电路的所有状态特性,为幅相控制电路的幅相控制精度提供最优解。同时,通过算法的方式在多个幅相电路选取统一的最优状态解集,满足一个状态表征一批幅相电路的整体趋势,为幅相二维优化算法研究的目的。
但是,首先,现有技术中的幅相二维优化算法通过将衰减和移相值按矢量合成方式实施正则化操作实现状态的抽取,抽取优化后的数据再通过反正则化还原,算法的矢量合成机制采用了取算术平方根的方式进行,在合成向量的方向标定上,采用正负号判别或合成角弧度区分,由于矢量合成过程中,调幅-调相两个分量符号经平方计算后,原有符号和偏移已经模糊化,在处理象限边沿的矢量状态时,由于测试设备反馈数据的特性,极易造成抽取状态与标称状态不处于同一象限,无法精准有效抽取理想状态;其次,正则化和反正则化方式简单,多采用幅度-相位对应关系的归一化处理,在被筛查状态数量较大的应用场景下,比例缩放正则化的方式无法实现精细筛查,计算出误差的标准差值精度低;最后,该方案没有应对多芯片的最优状态抽取方案,无法通过自适应或强化学习等先进算法统筹出适合于所有芯片的统一最优解决方案,需要针对单一芯片电路抽取不同的幅度-相位状态组,无法应用于一个状态表征多芯片幅相特性的需求场景。
因此,目前亟需一种精度更高、适用范围更广的幅相二维优化技术方案。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种幅相控制电路的幅相二维优化技术方案,通过二维极坐标映射提升状态数据格式化精准度,通过在极坐标位置间上对标准状态直接距离判定的方式快速高效地抽取出最优状态解,对多个芯片抽取的所有状态植入人类反馈信号强化学习算法,利用人工智能技术的方式,建立奖励模型判断大量芯片对每一种状态的偏好比重,引入权值的方式,以海量数据遴选出最优状态解,满足多芯片幅相特性采用单一状态组表征的需求。
为实现上述目的及其他相关目的,本发明提供的技术方案如下。
一种幅相控制电路的幅相二维优化方法,包括:
获取所述幅相控制电路的m个幅相理论状态组和n个幅相实测状态组,将m个所述幅相理论状态组和n个所述幅相实测状态组逐一映射到极坐标系中,并获取所述极坐标系中每个所述幅相理论状态组与各个所述幅相实测状态组的距离;
抽取所述极坐标系中与每个所述幅相理论状态组的距离最小的所述幅相实测状态组,得到至少一个所述幅相控制电路的实际最优状态解集;
获取所述幅相控制电路的误差要求,判断所述实际最优状态解集是否满足所述误差要求,不满足所述误差要求的则进一步判定是否需要回滚优化,若需要回滚优化则采用回滚机制进行匹配抽取优化,更新所述实际最优状态解集,再判断更新后的所述实际最优状态解集是否满足所述误差要求,如此循环迭代,直到更新后的所述实际最优状态解集满足所述误差要求,或者直到更新后的所述实际最优状态解集不满足所述误差要求且不需要回滚优化;
根据满足所述误差要求的所述实际最优状态解集,或者根据不满足所述误差要求且不需要回滚优化的所述实际最优状态解集对应的更新前后的各个所述实际最优状态解集,统计得到所述幅相控制电路的目标最优状态解集;
将所述目标最优状态解集中的元素,映射还原成幅度值-相位值状态对;
其中,m、n分别为大于等于2的正整数。
可选地,采用如下公式将m个所述幅相理论状态组和n个所述幅相实测状态组逐一映射到极坐标系中:
X=(Att+Gain)*cosPs;
Y=(Att+Gain)*sinPs;
其中,Att表示所述幅相理论状态组或者所述幅相实测状态组的幅度值,Gain表示默认增益,Ps表示所述幅相理论状态组或者所述幅相实测状态组的相位值,X表示所述幅相理论状态组或者所述幅相实测状态组在所述极坐标系中的X轴坐标位置,Y表示所述幅相理论状态组或者所述幅相实测状态组在所述极坐标系中的Y轴坐标位置。
可选地,所述抽取所述极坐标系中与每个所述幅相理论状态组的距离最小的所述幅相实测状态组,得到至少一个所述幅相控制电路的实际最优状态解集的步骤,包括:
针对每个所述幅相控制电路,抽取所述极坐标系中与每个所述幅相理论状态组的距离最小的所述幅相实测状态组,作为所述幅相理论状态组的实际最优状态,统计各个所述幅相理论状态组对应的所述实际最优状态,得到所述幅相控制电路的所述实际最优状态解集;
针对多个所述幅相控制电路,对各个所述幅相控制电路的实际最优状态解集进行深度学习,计算得到各个所述幅相控制电路的统一最优状态解集,以所述统一最优状态解集作为每个所述幅相控制电路的所述实际最优状态解集。
可选地,所述针对多个所述幅相控制电路,对各个所述幅相控制电路的实际最优状态解集进行深度学习,计算得到各个所述幅相控制电路的统一最优状态解集的步骤,包括:
建立偏好权值分配模型,所述偏好权值分配模型的输入为每个所述幅相理论状态组下各个所述幅相控制电路对应的所述实际最优状态,所述偏好权值分配模型抽取并输出权值最高的一个所述实际最优状态,作为每个所述幅相理论状态组下各个所述幅相控制电路的统一最优状态;
针对各个所述幅相理论状态组,逐一通过所述建立偏好权值分配模型进行训练推导,得到各个所述幅相理论状态组对应的所述统一最优状态,进而统计得到各个所述幅相控制电路的统一最优状态解集。
可选地,在所述偏好权值分配模型中,采用人类反馈信号强化学习算法对各个所述幅相控制电路对应的所述实际最优状态的权值进行自适应优化,具体包括:
在统计得到当前的所述统一最优状态解集之后,利用自然语言处理算法,根据当前的所述统一最优状态解集构建奖励模型;
根据历史的所述幅相实测状态组和历史的所述统一最优状态解集的响应,向所述奖励模型引入模拟人类反馈信号;
针对各个所述幅相理论状态组,逐一计算对应的历史的各个所述幅相实测状态组与对应的历史的所述统一最优状态解集之间的第一KL散度,逐一计算对应的当前的各个所述幅相实测状态组与对应的当前的所述统一最优状态解集之间的第二KL散度,逐一比较所述第一KL散度与所述第二KL散度,得到对应的奖励信号;
针对各个所述幅相理论状态组,逐一利用近端策略优化算法,根据对应的所述奖励信号计算更新所述奖励模型的模型参数,进而更新优化历史的所述统一最优状态解集,根据优化后的历史的所述统一最优状态解集得到自适应优化后的各个所述幅相控制电路对应的所述实际最优状态的权值。
可选地,通过编写GPU程序来加速所述人类反馈信号强化学习算法中所述奖励模型模型的训练和迭代。
可选地,所述获取所述幅相控制电路的误差要求,判断所述实际最优状态解集是否满足所述误差要求的步骤,包括:
获取所述误差要求,所述误差要求至少包括误差均方根阈值;
基于所述实际最优状态解集及各个所述幅相理论状态组,计算所述幅相控制电路的误差均方根;或者基于所述统一最优状态解集及各个所述幅相理论状态组,计算各个所述幅相控制电路的联合误差均方根;
比较所述幅相控制电路的误差均方根与所述误差均方根阈值的大小,若所述幅相控制电路的误差均方根大于或者等于所述误差均方根阈值,则所述实际最优状态解集不满足所述误差要求,若所述幅相控制电路的误差均方根小于所述误差均方根阈值,则所述实际最优状态解集满足所述误差要求;或者比较各个所述幅相控制电路的联合误差均方根与所述误差均方根阈值的大小,若各个所述幅相控制电路的联合误差均方根大于或者等于所述误差均方根阈值,则所述实际最优状态解集不满足所述误差要求,若各个所述幅相控制电路的联合误差均方根小于所述误差均方根阈值,则所述实际最优状态解集满足所述误差要求。
可选地,所述不满足所述误差要求的则进一步判定是否需要回滚优化的步骤,包括:
针对不满足所述误差要求的所述实际最优状态解集,获取回滚阈值和所述实际最优状态解集的回滚优化累计次数;
比较所述实际最优状态解集的回滚优化累计次数与所述回滚阈值的大小,若所述实际最优状态解集的回滚优化累计次数小于所述回滚阈值,则所述实际最优状态解集需要回滚优化,若所述实际最优状态解集的回滚优化累计次数等于所述回滚阈值,则所述实际最优状态解集不需要回滚优化。
可选地,所述采用回滚机制进行匹配抽取优化,更新所述实际最优状态解集的步骤,包括:
针对各个所述幅相理论状态组,重新组合匹配所述幅相理论状态组与所述幅相实测状态组的对应关系;
构建神经网络模型,针对各个所述幅相理论状态组,逐一通过所述神经网络模型计算重新匹配后的所述幅相理论状态组与对应的所述幅相实测状态组的交叉熵,并逐一判断所述交叉熵是否满足交叉熵要求,若不满足所述交叉熵要求则需要再次组合匹配所述幅相理论状态组与所述幅相实测状态组的对应关系,直到对应的所述交叉熵满足所述交叉熵要求,得到优化更新后的所述实际最优状态解集。
可选地,所述根据满足所述误差要求的所述实际最优状态解集,或者根据不满足所述误差要求且不需要回滚优化的所述实际最优状态解集对应的更新前后的各个所述实际最优状态解集,统计得到所述幅相控制电路的目标最优状态解集的步骤,包括:
若所述实际最优状态解集满足所述误差要求,则直接将所述实际最优状态解集作为所述幅相控制电路的目标最优状态解集;
若所述实际最优状态解集不满足所述误差要求且不需要回滚优化,则获取所述实际最优状态解集对应的更新前后的各个所述实际最优状态解集,计算对应的所述幅相控制电路的误差均方根或者各个所述幅相控制电路的联合误差均方根,并从中找出所述幅相控制电路的误差均方根最小的所述实际最优状态解集或者各个所述幅相控制电路的联合误差均方根最小的所述实际最优状态解集,作为所述幅相控制电路的目标最优状态解集。
一种幅相控制电路的幅相二维优化系统,包括:
数据采集单元,用于获取所述幅相控制电路的幅相理论状态组和幅相实测状态组,用于获取所述幅相控制电路的误差要求;
第一处理单元,用于将所述幅相理论状态组和所述幅相实测状态组逐一映射到极坐标系中,并获取所述极坐标系中每个所述幅相理论状态组与各个所述幅相实测状态组的距离;
第二处理单元,用于抽取所述极坐标系中与每个所述幅相理论状态组的距离最小的所述幅相实测状态组,得到至少一个所述幅相控制电路的实际最优状态解集;
第三处理单元,用于判断所述实际最优状态解集是否满足所述误差要求,不满足所述误差要求的则进一步判定是否需要回滚优化,若需要回滚优化则采用回滚机制进行匹配抽取优化,更新所述实际最优状态解集,再判断更新后的所述实际最优状态解集是否满足所述误差要求,如此循环迭代,直到更新后的所述实际最优状态解集满足所述误差要求,或者直到更新后的所述实际最优状态解集不满足所述误差要求且不需要回滚优化;
第四处理单元,用于根据满足所述误差要求的所述实际最优状态解集,或者根据不满足所述误差要求且不需要回滚优化的所述实际最优状态解集对应的更新前后的各个所述实际最优状态解集,统计得到所述幅相控制电路的目标最优状态解集;
第五处理单元,用于将所述目标最优状态解集中的元素,映射还原成幅度值-相位值状态对;
输出单元,用于输出所述幅度值-相位值状态对。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的幅相控制电路的幅相二维优化方法。
一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的幅相控制电路的幅相二维优化方法。
如上所述,本发明提供的幅相控制电路的幅相二维优化方法、系统、介质及电子设备,至少具有以下有益效果:
在获取幅相控制电路的幅相理论状态组和幅相实测状态组后,将幅相理论状态组和幅相实测状态组逐一映射到极坐标系中,并获取极坐标系中每个幅相理论状态组与各个幅相实测状态组的距离,再抽取极坐标系中与每个幅相理论状态组的距离最小的幅相实测状态组,得到幅相控制电路的实际最优状态解集,通过二维极坐标映射,幅度-相位作为两个不同维度的分量,实现了坐标象限的归一化,规避了象限临界点问题,也可以避免矢量合成法平方后符号一致的问题,提高了状态数据格式化精度,通过在极坐标位置上幅相实测状态组与对幅相理论状态组之间的直接距离的判定抽取方式,能更加直观简洁地抽取出最优状态解,且可以实现细粒度的精准分析,提升了最优状态解的抽取精度;同时,采用回滚机制对不满足误差要求的实际最优状态解集进行匹配抽取优化,进一步提升了最优状态解的抽取精度,并提高了最优状态解的适用范围。
附图说明
图1显示为现有技术中幅相控制电路的幅相校准方法的流程图。
图2显示为本发明中幅相控制电路的幅相二维优化方法的步骤示意图。
图3显示为本发明一可选实施例中幅相数据二维极坐标映射的仿真结果图。
图4显示为本发明一可选实施例中幅相控制电路的幅相二维优化方法的流程图。
图5显示为本发明一可选实施例中幅相控制电路的幅相二维优化方法的部分流程图。
图6显示为本发明一可选实施例中幅相控制电路的幅相二维优化方法的偏好权值分配流程图。
图7显示为本发明一可选实施例中基于人类反馈信号强化学习算法的自适应算法流程图。
图8显示为本发明一可选实施例中回滚优化的流程图。
图9显示为本发明一可选实施例中的稀疏连接原理图。
图10显示为本发明一可选实施例中幅相控制电路的幅相二维优化系统的结构框图。
图11显示为本发明一可选实施例中用户终端的硬件结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
请参阅图1至图11。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
如前述在背景技术中所述的,发明人研究发现,如图1所示,现有幅相二维优化算法通过将衰减和移相值按矢量合成方式实施正则化操作实现状态的抽取。其中,正则化操作的方式如下:
首先,分别计算出基准调幅和基准调相每个状态的步进值,记为att和ps,然后将基准调幅和基准调相状态数组除以步进值,得到调幅正则值数组Att_Reg_Array和调相正则值数组Ps_Reg_Array,针对调幅正则值数组Att_Reg_Array和调相正则值数组Ps_Reg_Array中的每个状态i,i为正整数,通过矢量合成的方式正则化操作,其公式原理如下:
现有幅相二维优化算法的实施方法按以下步骤进行:首先,通过上式计算,将反映幅相特性的幅相二维正则值数组Reg_Array转化为一维向量,再以理论标准值的一维向量组为基准,将实测状态按照同样的正则化规则将实际衰减值和移相值转化为实测状态向量组。然后,按照调幅优化的方式迭代筛选(抽取)出最优化的二维(衰减和移相)状态向量组(即长度实际状态和标称状态矢量距离最短的状态点),具体根据均方根误差(rms值)进行筛选。最后,将该向量组按索引和反正则化的方式转换为实测的衰减值数组和移相值数组(一维向量向二维转换),完成幅相二维优化。
在一定程度上,上述幅相二维优化算法可以实现调幅-调相状态的抽取和筛查,但由于其算法本身特性的局限性及得出的最终结果模糊性的影响,不难反向验证出该算法存在的缺陷和隐患:
(1)、上述幅相二维优化算法的矢量合成机制采用了取算术平方根的方式进行,在合成向量的方向标定上,采用正负号判别或合成角弧度区分,由于矢量合成过程中,调幅-调相两个分量符号经平方计算后,原有符号和偏移已经模糊化,在处理象限边沿(如相位值逼近0°、90°、180°、270°)的矢量状态时,由于测试设备反馈数据的特性(如360.5°表示为-0.5°),极易造成抽取状态与标称状态不处于同一象限(当时该算法得出的实际向量距离最短),无法精准有效抽取理想状态;
(2)、正则化和反正则化方式简单,多采用幅度-相位对应关系的归一化处理,在被筛查状态数量较大(如幅度8位、相位8位,共16位65536态)的应用场景下,比例缩放正则化的方式无法实现精细筛查,计算出误差的标准差值精度低,一般在3°以上;
(3)、该方案没有应对多芯片的最优状态抽取方案,无法通过自适应或强化学习等先进算法统筹出适合于所有芯片的统一最优解决方案,需要针对单一芯片电路抽取不同的幅度-相位状态组,无法应用于一个状态表征多芯片幅相特性的需求场景。
基于此,如图2所示,本发明提出一种幅相控制电路的幅相二维优化方法,其包括步骤:
S1、获取幅相控制电路的m个幅相理论状态组和n个幅相实测状态组,将m个幅相理论状态组和n个幅相实测状态组逐一映射到极坐标系中,并获取极坐标系中每个幅相理论状态组与各个幅相实测状态组的距离;
S2、抽取极坐标系中与每个幅相理论状态组的距离最小的幅相实测状态组,得到至少一个幅相控制电路的实际最优状态解集;
S3、获取幅相控制电路的误差要求,判断实际最优状态解集是否满足误差要求,不满足误差要求的则进一步判定是否需要回滚优化,若需要回滚优化则采用回滚机制进行匹配抽取优化,更新实际最优状态解集,再判断更新后的实际最优状态解集是否满足误差要求,如此循环迭代,直到更新后的实际最优状态解集满足误差要求,或者直到更新后的实际最优状态解集不满足误差要求且不需要回滚优化;
S4、根据满足误差要求的实际最优状态解集,或者根据不满足误差要求且不需要回滚优化的实际最优状态解集对应的更新前后的各个实际最优状态解集,统计得到幅相控制电路的目标最优状态解集;
S5、将目标最优状态解集中的元素,映射还原成幅度值-相位值状态对;
其中,m、n分别为大于等于2的正整数。
详细地,在步骤S1中,采用如下公式将m个幅相理论状态组和n个幅相实测状态组逐一映射到极坐标系中:
X=(Att+Gain)*cosPs;
Y=(Att+Gain)*sinPs;
其中,Att表示幅相理论状态组或者幅相实测状态组的幅度值(或者衰减值),Gain表示默认增益,Ps表示幅相理论状态组或者幅相实测状态组的相位值,X表示幅相理论状态组或者幅相实测状态组在极坐标系中的X轴坐标位置,Y表示幅相理论状态组或者幅相实测状态组在极坐标系中的Y轴坐标位置。
更详细地,在步骤S1中,不同于调幅-相位坐标的矢量合成算法和简单极坐标分配算法,本发明将采集的表征幅相芯片特性的幅度和相位按照相互关联和制约的方式重新定义极坐标映射法则,其核心计算公式为上述公式。为了避免出现位于坐标原点的(X,Y)坐标,本发明采用Att+Gain的方式引入增益偏移的方式消除出现原点坐标的不确定场景。在上述公式中,幅度值Att表示坐标距原点的长度,相位值Ps表示偏移的位置,幅度之余相位的余弦函数确定X轴坐标位置,正弦函数确定Y轴坐标位置,在所有幅相理论状态组(或者所有标准状态)的(X,Y)坐标映射入极坐标系之后,再根据标准坐标点找出距离最近的实测(X,Y)值(即幅相实测状态组),最后通过反正则化还原成幅度值-相位值状态对。
在本发明的一可选实施例中,一个典型的16384态实测幅度-相位坐标映射的mATLAB仿真结果如图3所示。
需要说明的是,在步骤S1中,主要是进行状态映射及距离统计,如图4所示,面向一个或多个幅相控制电路(或者幅相多功能芯片)的幅度值-相位值状态,同时格式化幅相理论状态组(即理论状态组调幅和移相数据)和幅相实测状态组(即理实测状态组调幅和移相数据),将数量较多的幅相实测状态组(一般n≥65536)和能表征电路或者芯片特性的数量较少的幅相理论状态组(一般m≤2048)映射到极坐标体系之中,实现数据格式化和正则化。然后,在考虑角度偏移权重比的情况下,针对每个幅相理论状态组,获取幅相理论状态组的坐标点与各个幅相实测状态组的坐标点之间的距离并进行统计排序,得到对应的距离集合。
详细地,在本发明中,如图4-图5所示,抽取极坐标系中与每个幅相理论状态组的距离最小的幅相实测状态组,得到至少一个幅相控制电路的实际最优状态解集的步骤S2,进一步包括:
S21、针对每个幅相控制电路,抽取极坐标系中与每个幅相理论状态组的距离最小的幅相实测状态组,作为幅相理论状态组的实际最优状态,统计各个幅相理论状态组对应的实际最优状态,得到幅相控制电路的实际最优状态解集;
S22、针对多个幅相控制电路,对各个幅相控制电路的实际最优状态解集进行深度学习,计算得到各个幅相控制电路的统一最优状态解集,以统一最优状态解集作为每个幅相控制电路的实际最优状态解集。
更详细地,在步骤S21中,如图4所示,针对每个幅相控制电路,对相应的距离集合进行排序筛查,抽取极坐标系中与幅相理论状态组的坐标点距离最小的实测点位对应的幅相实测状态组,作为幅相理论状态组的实际最优状态,统计各个幅相理论状态组对应的实际最优状态,最终整理成数据长度和幅相理论状态组数一致的幅相实测状态组,并记录相应的控制档位(在实测状态中的序号),为单一幅相控制电路(或芯片)的状态组,得到幅相控制电路的实际最优状态解集。如果存在多个类似芯片,则记录多个状态组,组成最优状态-芯片索引的二维矩阵。
更详细地,在步骤S22中,如图4-图5所示,先判断是否存在多个幅相控制电路(或芯片),若是则对各个幅相控制电路的实际最优状态解集进行深度学习,计算得到各个幅相控制电路的统一最优状态解集,以统一最优状态解集作为每个幅相控制电路的实际最优状态解集;若否则直接整理输出单一幅相控制电路的实际最优状态解集。
其中,如图4-图5所示,针对多个幅相控制电路,对各个幅相控制电路的实际最优状态解集进行深度学习,计算得到各个幅相控制电路的统一最优状态解集的步骤S22,进一步包括:
S221、建立偏好权值分配模型,偏好权值分配模型的输入为每个幅相理论状态组下各个幅相控制电路对应的实际最优状态,偏好权值分配模型抽取并输出权值最高的一个实际最优状态,作为每个幅相理论状态组下各个幅相控制电路的统一最优状态;
S222、针对各个幅相理论状态组,逐一通过建立偏好权值分配模型进行训练推导,得到各个幅相理论状态组对应的统一最优状态,进而统计得到各个幅相控制电路的统一最优状态解集。
更详细地,在步骤S22中,在需要处理大量的幅相控制电路(或者芯片),选取最能表征批次整体幅相特性的应用场景时,采用偏好权值分配的方法,搭建网络模型,整理出折中整个批次标准状态的唯一解,在本发明一可选实施例中,其流程如图6所示。
详细地,如图6所示,权值分配算法逐标准状态统计,旨在找出最接近标准状态幅度-相位点的实测状态集合。首选,将所有幅相芯片筛查出的某一标准状态的最优实测状态纳入nLP网络,假设有芯片数量为N,则网络对应的输入输出即为N-1,在层数为m(m值随N大小决定,一般不超过169层)的网络模型中,每一个芯片都将N个状态带入自身幅度-相位场景中进行权值计算,越接近理想值,系数越接近为1,最后得到每个状态的权值公式为:
其中,WN为第N个芯片中权值累加结果,n为N个芯片每个最优状态的数量,wi为权重初始值,均为1,ki为分配系数,在0~1之间,理想状态为1。WN最大值即为每一个芯片偏好最优解,其权值绝对值也最大,即为满足多芯片幅相特性的最优唯一状态解。将每一个标准态逐一进行上述模型训练和推导,即可得出最优状态解集,该解集并不是某一只芯片的最优状态,但为表征一批(或一类)芯片的整体最优状态集。
需要说明的是,NLP算法在特定场景下(特征提取单一化,数据量小)可以使用简单的卷积网络算法(如CNN、KNN、LSTM等)实现,在此不作限定。
进一步地,在偏好权值分配模型中,采用人类反馈信号强化学习算法(RLHF算法)对各个幅相控制电路对应的实际最优状态的权值进行自适应优化,如图7所示,其具体包括:
St1、在统计得到当前的统一最优状态解集之后,利用自然语言处理算法,根据当前的统一最优状态解集构建奖励模型;
St2、根据历史的幅相实测状态组和历史的统一最优状态解集的响应,向奖励模型引入模拟人类反馈信号;
St3、针对各个幅相理论状态组,逐一计算对应的历史的各个幅相实测状态组与对应的历史的统一最优状态解集之间的第一KL散度,逐一计算对应的当前的各个幅相实测状态组与对应的当前的统一最优状态解集之间的第二KL散度,逐一比较第一KL散度与第二KL散度,得到对应的奖励信号;
St4、针对各个幅相理论状态组,逐一利用近端策略优化算法,根据对应的奖励信号计算更新奖励模型的模型参数,进而更新优化历史的统一最优状态解集,根据优化后的历史的统一最优状态解集得到自适应优化后的各个幅相控制电路对应的实际最优状态的权值。
详细地,如图7所示,本发明中偏好权值分配模型的核心算法为人类反馈信号强化学习算法(RLHF,Reinforcement Learning from Human Feedback),该算法同时提供最优状态解集的自适应优化,在每一类(或每一批芯片)的最优状态解集完成筛查之后,根据当前解集为输入数据利用NLP算法构建一个奖励模型(RAM,reward model),接下来,根据历史测试数据和最优解集的响应来引入模拟人类反馈信号,历史测试幅度-相位数据和当前测试的幅度-相位数据分别对历史最优解集和当前最优解集以KL散度来计算“奖励/惩罚”的大小,反馈最终的reward信号,根据逐状态的每一个reward结果,利用近端策略优化算法(PPO算法),更新模型参数,优化并记录历史最优状态解集,完成自适应优化流程。
其中,通过编写GPU程序来加速人类反馈信号强化学习算法中奖励模型模型的训练和迭代,而不是采用CPU进行训练,如该算法模型的训练和迭代可使用TensorFlow-GPU库,在GPU平台引入Machine Learning的方式加速这一进程;奖励模型可以根据不同的应用场景选取特定的模型类型,如小规模的GPT-3至大体量的Gopher,K/L奖励模型算法可以采用其他策略函数(或模型)实现,在此不再赘述。
详细地,在步骤S3中,如图4-图5所示,获取幅相控制电路的误差要求,判断实际最优状态解集是否满足误差要求的步骤,进一步包括:
S31、获取误差要求,误差要求至少包括误差均方根阈值;
S32、基于实际最优状态解集及各个幅相理论状态组,计算幅相控制电路的误差均方根;或者基于统一最优状态解集及各个幅相理论状态组,计算各个幅相控制电路的联合误差均方根;
S33、比较幅相控制电路的误差均方根与误差均方根阈值的大小,若幅相控制电路的误差均方根大于或者等于误差均方根阈值,则实际最优状态解集不满足误差要求,若幅相控制电路的误差均方根小于误差均方根阈值,则实际最优状态解集满足误差要求;或者比较各个幅相控制电路的联合误差均方根与误差均方根阈值的大小,若各个幅相控制电路的联合误差均方根大于或者等于误差均方根阈值,则实际最优状态解集不满足误差要求,若各个幅相控制电路的联合误差均方根小于误差均方根阈值,则实际最优状态解集满足误差要求。
更详细地,在步骤S3中,通过实际最优状态解集的误差均方根与对应的误差均方根阈值的比较结果来判断得到的实际最优状态解集的精度是否足够,精度不够的则需要进一步判断是否需要回滚;同时,需要判断是否存在多个幅相控制电路(或芯片),若否则根据实际最优状态解集及各个幅相理论状态组,计算得到单个幅相控制电路的误差均方根,若是则根据统一最优状态解集及各个幅相理论状态组,计算得到各个幅相控制电路的联合误差均方根,最后再将单个幅相控制电路的误差均方根与误差均方根阈值进行比较,或者将各个幅相控制电路的联合误差均方根与误差均方根阈值进行比较。
详细地,在步骤S3中,如图4-图5所示,不满足误差要求的则进一步判定是否需要回滚优化的步骤,进一步包括:
S34、针对不满足误差要求的实际最优状态解集,获取回滚阈值和实际最优状态解集的回滚优化累计次数;
S35、比较实际最优状态解集的回滚优化累计次数与回滚阈值的大小,若实际最优状态解集的回滚优化累计次数小于回滚阈值,则实际最优状态解集需要回滚优化,若实际最优状态解集的回滚优化累计次数等于回滚阈值,则实际最优状态解集不需要回滚优化。
更详细地,在步骤S34~S35中,不满足误差要求的则进一步根据对应的回滚优化累计次数是否达到回滚阈值来判定是否需要回滚优化,还没达到回滚阈值的则可以继续回滚优化,达到了回滚阈值的则不需要再回滚优化。其中,回滚阈值可根据实际需求灵活设定。
详细地,在步骤S3中,如图8所示,采用回滚机制进行匹配抽取优化,更新实际最优状态解集的步骤,进一步包括:
S36、针对各个幅相理论状态组,重新组合匹配幅相理论状态组与幅相实测状态组的对应关系;
S37、构建神经网络模型,针对各个幅相理论状态组,逐一通过神经网络模型计算重新匹配后的幅相理论状态组与对应的幅相实测状态组的交叉熵,并逐一判断交叉熵是否满足交叉熵要求,若不满足交叉熵要求则需要再次组合匹配幅相理论状态组与幅相实测状态组的对应关系,直到对应的交叉熵满足交叉熵要求,得到优化更新后的实际最优状态解集。
需要说明的是,本发明采用的误差校准算法采用回滚校正机制来实现状态的自适应优化,原理是根据要抽取的标准态数量搭建一定规模的神经网络层,通过回归算法计算交叉熵,该交叉熵即为某一个距标准状态最优解的实测状态的缺失值(或者损失值,由缺失函数计算得出),多个标准态的交叉熵集合即为整个算法结论的联合误差。
为了避免随标准状态的增加出现实测状态距标准值所计算出的交叉熵出现较大波动的情况,通常为优先抽取的实测状态综合缺失值更符合匹配后续抽取的状态,从而导致缺失值误差增加,无法抽取到实际最优状态(通常情况下,这也是贪婪算法的弊病),本发明采用回滚抽取状态的方式,搭建神经网络,重新计算误差值(交叉熵),在现有状态中重新组合匹配实测状态和标准状态对应关系,利用有限次数的回滚机制筛选出实际最优解,其实现原理如图8所示。
更详细地,如图8所示,网络模型拟采用神经网络算法,核心算法函数为是Sigmoid函数(也可以选择Tanh函数),具有前向传输/反馈校准特性,其函数表达式为:
其中,N为当前输出值,K为输出范围内最大值,T为时间,r(0≤r≤1)为输入随权值变化速率(也称学习率,本发明采用黄金分割法,默认设为0.618),假设N0为随机生成的初始输出值,可将上式写为积分表达式,可得出输出结果随输入值与权值的关系:
在上式中,由-rT即为经权重分配后的单个输入值,设为x,输出最大范围经归一化处理后K取值为1,初始输出N0设为平均值,即同时令S(x)=N,则可推导出输出随输入和权值影响的对应关系,通过权值匹配出当前权值对应的特征向量,最终多个特征向量的集合构成特征矩阵。网络通过每次的反馈算法函数进行有监督学习,最终得到精准的特征向量组(特征矩阵),这种二次特征提取技术使计算结果对输入样本具有较高的畸变容忍能力。
其中,神经网络通过稀疏连接(Sparse Connectivity)实现相邻层之间的联系,利用输入数据的空间局部性,在第m层的隐层单元只与m-1层的输入单元的局部区域(又被称为空间连续接受域)有连接,这种结构将学习到的过滤器(对应输入信号中最大激活单元)限制在局部空间模式。如图9所示,多个这样的层叠累积后,会使得过滤器(不再是线性的)逐渐成为全局的(即覆盖了更大的区域)。稀疏连接是优化算法的途径之一,稀疏连接的原理如图9所示。发明的回滚机制即采用上述算法提取特征系数,通过缺失函数实现缺失值的统计,继而迭代出最优化状态组解集。
详细地,在步骤S3中,如图4-图5所示,获取幅相控制电路的误差要求,判断实际最优状态解集是否满足误差要求,不满足误差要求的则进一步判定是否需要回滚优化,若需要回滚优化则采用回滚机制进行匹配抽取优化,更新实际最优状态解集,再判断更新后的实际最优状态解集是否满足误差要求,如此循环迭代,直到更新后的实际最优状态解集满足误差要求,或者直到更新后的实际最优状态解集不满足误差要求但是对应的回滚优化累计次数达到了回滚阈值进而不需要再回滚优化。如此,得到满足误差要求的实际最优状态解集,或者得到对应的回滚优化累计次数达到回滚阈值的实际最优状态解集。
详细地,根据满足误差要求的实际最优状态解集,或者根据不满足误差要求且不需要回滚优化的实际最优状态解集对应的更新前后的各个实际最优状态解集,统计得到幅相控制电路的目标最优状态解集的步骤S4,进一步包括:
S41、若实际最优状态解集满足误差要求,则直接将实际最优状态解集作为幅相控制电路的目标最优状态解集;
S42、若实际最优状态解集不满足误差要求且不需要回滚优化,则获取实际最优状态解集对应的更新前后的各个实际最优状态解集,计算对应的幅相控制电路的误差均方根或者各个幅相控制电路的联合误差均方根,并从中找出幅相控制电路的误差均方根最小的实际最优状态解集或者各个幅相控制电路的联合误差均方根最小的实际最优状态解集,作为幅相控制电路的目标最优状态解集。
更详细地,在步骤S41中,若得到的实际最优状态解集满足了误差要求,则直接对实际最优状态解集进行整理输出,作为幅相控制电路的目标最优状态解集。
更详细地,在步骤S42中,若得到的实际最优状态解集不满足误差要求且不需要回滚优化,则获取实际最优状态解集多次所对应的各个实际最优状态解集,并判断是否存在多个幅相控制电路(或芯片),若否则根据各个实际最优状态解集及各个幅相理论状态组,计算单个的幅相控制电路对应的误差均方根,并从中找出单个幅相控制电路的误差均方根最小的实际最优状态解集作为单个幅相控制电路的目标最优状态解集;若是则根据各个实际最优状态解集及各个幅相理论状态组,计算各个幅相控制电路的联合误差均方根,并从中找出各个幅相控制电路的联合误差均方根最小的实际最优状态解集作为各个幅相控制电路的目标最优状态解集。
详细地,在步骤S5中,将目标最优状态解集中的元素,映射还原成幅度值-相位值状态对。通过反正则化还原目标最优状态解集,得到状态幅相控制电路的目标最优实测状态组。
如此一来,本发明针对多功能幅相控制电路中对幅相一致性要求较高的应用场景,提供的基于极坐标映射的幅相二维优化算法将多功能芯片中多个状态的幅相特性转化成相互影响和相互制约的半径-弧度坐标,保留幅度-相位二维特性,避免了矢量合成算法中数据因维度下降造成的系统性计算误差和整体评估偏差,较传统幅相电路优化算法,整体幅度偏差离散度从2dB左右降低至0.5dB以内,相位偏差从3°左右降低至1.5°以内,显著地提升了幅相优化精度,更精准地实现幅相控制电路状态的优化。
本发明中采用的通过引入RLHF算法建立奖励模型的方式解决多个幅相控制电路最优状态解的方式实现自适应优化算法,较传统神经网络模型为统计的最优幅相特性选取的一种折中状态的方式具备更小的系统误差,自适应优化算法首次实现历史数据和实测数据的动态校准(奖励模型参数变更)保证了大批量幅相电路状态优化的稳定性和数据可历史追溯性,利用TensorFlow-GPU加速模型的训练,可实现更快速的模型更新和优化,极大提高筛查效率。在1TB数据量以上、标准状态数2048以上的模型应用场景中,模型计算误差较简单神经网络的5%倍基准值降低至1%倍基准值以内,奖励模型引入NLP算法具有先天的响应效率优势,自适应算法响应时间较典型神经网络模型的30s/GB缩减至10s/GB以内,具备显著的效率优势。
本发明较传统方式或算法同时具备在精度和效率两个维度的明显优势,特别是和状态数量较多(实测态16384以上,标准态1024以上),幅相电路批次数量大(单批电路数量30K提上)的场景。
同时,基于上述幅相控制电路的幅相二维优化方法的设计思路,本发明还提供一种幅相控制电路的幅相二维优化系统,用于执行前述方法实施例中所述的幅相控制电路的幅相二维优化方法,由于系统实施例的技术原理与前述方法实施例的技术原理相似,因而不再对同样的技术细节做重复性赘述。
如图10所示,在本发明的一可选实施例中,幅相控制电路的幅相二维优化系统包括:
数据采集单元11,用于获取幅相控制电路的幅相理论状态组和幅相实测状态组,用于获取幅相控制电路的误差要求;
第一处理单元12,用于将幅相理论状态组和幅相实测状态组逐一映射到极坐标系中,并获取极坐标系中每个幅相理论状态组与各个幅相实测状态组的距离;
第二处理单元13,用于抽取极坐标系中与每个幅相理论状态组的距离最小的幅相实测状态组,得到至少一个幅相控制电路的实际最优状态解集;
第三处理单元14,用于判断实际最优状态解集是否满足误差要求,不满足误差要求的则进一步判定是否需要回滚优化,若需要回滚优化则采用回滚机制进行匹配抽取优化,更新实际最优状态解集,再判断更新后的实际最优状态解集是否满足误差要求,如此循环迭代,直到更新后的实际最优状态解集满足误差要求,或者直到更新后的实际最优状态解集不满足误差要求且不需要回滚优化;
第四处理单元15,用于根据满足误差要求的实际最优状态解集,或者根据不满足误差要求且不需要回滚优化的实际最优状态解集对应的更新前后的各个实际最优状态解集,统计得到幅相控制电路的目标最优状态解集;
第五处理单元16,用于将目标最优状态解集中的元素,映射还原成幅度值-相位值状态对;
输出单元17,用于输出幅度值-相位值状态对。
其中,各个功能单元的功能及原理可参照上述幅相控制电路的幅相二维优化方法的相关描述,在此不再赘述。
基于上述幅相控制电路的幅相二维优化方法的设计思路,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本实施例中任一项所述的幅相控制电路的幅相二维优化方法。
其中,计算机可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
基于上述幅相控制电路的幅相二维优化方法的设计思路,本发明还提供了一种电子设备,该电子设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的幅相控制电路的幅相二维优化方法。
在实际应用中,该电子设备可以作为用户终端,也可以作为服务器,用户终端的例子可以包括:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准语音层面3,moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准语音层面4,moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等,本申请实施例对于具体的设备不加以限制。
图11为本发明一可选实施例提供的用户终端的硬件结构示意图。如图11所示,该用户终端可以包括:输入设备200、处理器201、输出设备202、存储器203和至少一个通信总线204。通信总线204用于实现元件之间的通信连接。存储器203可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,存储器203中可以存储各种程序,用于完成各种处理功能以及实现本实施例的方法步骤。
可选的,处理器201例如可以为中央处理器(Central Processing Unit,简称CPU)、应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,处理器201通过有线或无线连接耦合到输入设备200和输出设备202。
可选的,输入设备200可以包括多种输入设备,例如可以包括面向用户的用户接口、面向设备的设备接口、软件的可编程接口、摄像头、传感器中至少一种。可选的,该面向设备的设备接口可以是用于设备与设备之间进行数据传输的有线接口、还可以是用于设备与设备之间进行数据传输的硬件插入接口(例如USB接口、串口等);可选的,该面向用户的用户接口例如可以是面向用户的控制按键、用于接收语音输入的语音输入设备以及用户接收用户触摸输入的触摸感知设备(例如具有触摸感应功能的触摸屏、触控板等);可选的,上述软件的可编程接口例如可以是供用户编辑或者修改程序的入口,例如芯片的输入引脚接口或者输入接口等;输出设备202可以包括显示器、音响等输出设备。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
综上所述,在本发明所提供的幅相控制电路的幅相二维优化方法、系统、介质及电子设备中,基于极坐标映射将幅相控制电路的多个状态的幅相特性转化成相互影响和相互制约的半径-弧度坐标,保留了幅度-相位二维特性,避免了矢量合成算法中数据因维度下降造成的系统性计算误差和整体评估偏差,较传统幅相电路优化算法,整体幅度偏差离散度从2dB左右降低至0.5dB以内,相位偏差从3°左右降低至1.5°以内,显著地提升了数据格式化精度,更精准地实现幅相控制电路状态的优化,通过在极坐标位置上幅相实测状态组与对幅相理论状态组之间的直接距离的判定抽取方式,能更加直观简洁地抽取出最优状态解,且可以实现细粒度的精准分析,提升了最优状态解的抽取精度;同时,采用回滚机制对不满足误差要求的实际最优状态解集进行匹配抽取优化,进一步提升了最优状态解的抽取精度,并提高了最优状态解的适用范围;通过引入人类反馈信号强化学习算法建立奖励模型的方式解决多个幅相控制电路最优状态解的方式实现自适应优化算法,较传统神经网络模型为统计的最优幅相特性选取的一种折中状态的方式具备更小的系统误差,自适应优化算法首次实现历史数据和实测数据的动态校准(奖励模型参数变更)保证了大批量幅相电路状态优化的稳定性和数据可历史追溯性,利用TensorFlow-GPU加速模型的训练,可实现更快速的模型更新和优化,极大地提高了筛查效率。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (12)

1.一种幅相控制电路的幅相二维优化方法,其特征在于,包括:
获取所述幅相控制电路的m个幅相理论状态组和n个幅相实测状态组,将m个所述幅相理论状态组和n个所述幅相实测状态组逐一映射到极坐标系中,并获取所述极坐标系中每个所述幅相理论状态组与各个所述幅相实测状态组的距离;
抽取所述极坐标系中与每个所述幅相理论状态组的距离最小的所述幅相实测状态组,得到至少一个所述幅相控制电路的实际最优状态解集;
获取所述幅相控制电路的误差要求,判断所述实际最优状态解集是否满足所述误差要求,不满足所述误差要求的则进一步判定是否需要回滚优化,若需要回滚优化则采用回滚机制进行匹配抽取优化,更新所述实际最优状态解集,再判断更新后的所述实际最优状态解集是否满足所述误差要求,如此循环迭代,直到更新后的所述实际最优状态解集满足所述误差要求,或者直到更新后的所述实际最优状态解集不满足所述误差要求且不需要回滚优化;
根据满足所述误差要求的所述实际最优状态解集,或者根据不满足所述误差要求且不需要回滚优化的所述实际最优状态解集对应的更新前后的各个所述实际最优状态解集,统计得到所述幅相控制电路的目标最优状态解集;
将所述目标最优状态解集中的元素,映射还原成幅度值-相位值状态对;
其中,m、n分别为大于等于2的正整数;
采用如下公式将m个所述幅相理论状态组和n个所述幅相实测状态组逐一映射到极坐标系中:
X=(Att+Gain)*cosPs;
Y=(Att+Gain)*sinPs;
其中,Att表示所述幅相理论状态组或者所述幅相实测状态组的幅度值,Gain表示默认增益,Ps表示所述幅相理论状态组或者所述幅相实测状态组的相位值,X表示所述幅相理论状态组或者所述幅相实测状态组在所述极坐标系中的X轴坐标位置,Y表示所述幅相理论状态组或者所述幅相实测状态组在所述极坐标系中的Y轴坐标位置。
2.根据权利要求1所述的幅相控制电路的幅相二维优化方法,其特征在于,所述抽取所述极坐标系中与每个所述幅相理论状态组的距离最小的所述幅相实测状态组,得到至少一个所述幅相控制电路的实际最优状态解集的步骤,包括:
针对每个所述幅相控制电路,抽取所述极坐标系中与每个所述幅相理论状态组的距离最小的所述幅相实测状态组,作为所述幅相理论状态组的实际最优状态,统计各个所述幅相理论状态组对应的所述实际最优状态,得到所述幅相控制电路的所述实际最优状态解集;
针对多个所述幅相控制电路,对各个所述幅相控制电路的实际最优状态解集进行深度学习,计算得到各个所述幅相控制电路的统一最优状态解集,以所述统一最优状态解集作为每个所述幅相控制电路的所述实际最优状态解集。
3.根据权利要求2所述的幅相控制电路的幅相二维优化方法,其特征在于,所述针对多个所述幅相控制电路,对各个所述幅相控制电路的实际最优状态解集进行深度学习,计算得到各个所述幅相控制电路的统一最优状态解集的步骤,包括:
建立偏好权值分配模型,所述偏好权值分配模型的输入为每个所述幅相理论状态组下各个所述幅相控制电路对应的所述实际最优状态,所述偏好权值分配模型抽取并输出权值最高的一个所述实际最优状态,作为每个所述幅相理论状态组下各个所述幅相控制电路的统一最优状态;
针对各个所述幅相理论状态组,逐一通过所述建立偏好权值分配模型进行训练推导,得到各个所述幅相理论状态组对应的所述统一最优状态,进而统计得到各个所述幅相控制电路的统一最优状态解集。
4.根据权利要求3所述的幅相控制电路的幅相二维优化方法,其特征在于,在所述偏好权值分配模型中,采用人类反馈信号强化学习算法对各个所述幅相控制电路对应的所述实际最优状态的权值进行自适应优化,具体包括:
在统计得到当前的所述统一最优状态解集之后,利用自然语言处理算法,根据当前的所述统一最优状态解集构建奖励模型;
根据历史的所述幅相实测状态组和历史的所述统一最优状态解集的响应,向所述奖励模型引入模拟人类反馈信号;
针对各个所述幅相理论状态组,逐一计算对应的历史的各个所述幅相实测状态组与对应的历史的所述统一最优状态解集之间的第一KL散度,逐一计算对应的当前的各个所述幅相实测状态组与对应的当前的所述统一最优状态解集之间的第二KL散度,逐一比较所述第一KL散度与所述第二KL散度,得到对应的奖励信号;
针对各个所述幅相理论状态组,逐一利用近端策略优化算法,根据对应的所述奖励信号计算更新所述奖励模型的模型参数,进而更新优化历史的所述统一最优状态解集,根据优化后的历史的所述统一最优状态解集得到自适应优化后的各个所述幅相控制电路对应的所述实际最优状态的权值。
5.根据权利要求4所述的幅相控制电路的幅相二维优化方法,其特征在于,通过编写GPU程序来加速所述人类反馈信号强化学习算法中所述奖励模型模型的训练和迭代。
6.根据权利要求2所述的幅相控制电路的幅相二维优化方法,其特征在于,所述获取所述幅相控制电路的误差要求,判断所述实际最优状态解集是否满足所述误差要求的步骤,包括:
获取所述误差要求,所述误差要求至少包括误差均方根阈值;
基于所述实际最优状态解集及各个所述幅相理论状态组,计算所述幅相控制电路的误差均方根;或者基于所述统一最优状态解集及各个所述幅相理论状态组,计算各个所述幅相控制电路的联合误差均方根;
比较所述幅相控制电路的误差均方根与所述误差均方根阈值的大小,若所述幅相控制电路的误差均方根大于或者等于所述误差均方根阈值,则所述实际最优状态解集不满足所述误差要求,若所述幅相控制电路的误差均方根小于所述误差均方根阈值,则所述实际最优状态解集满足所述误差要求;或者比较各个所述幅相控制电路的联合误差均方根与所述误差均方根阈值的大小,若各个所述幅相控制电路的联合误差均方根大于或者等于所述误差均方根阈值,则所述实际最优状态解集不满足所述误差要求,若各个所述幅相控制电路的联合误差均方根小于所述误差均方根阈值,则所述实际最优状态解集满足所述误差要求。
7.根据权利要求6所述的幅相控制电路的幅相二维优化方法,其特征在于,所述不满足所述误差要求的则进一步判定是否需要回滚优化的步骤,包括:
针对不满足所述误差要求的所述实际最优状态解集,获取回滚阈值和所述实际最优状态解集的回滚优化累计次数;
比较所述实际最优状态解集的回滚优化累计次数与所述回滚阈值的大小,若所述实际最优状态解集的回滚优化累计次数小于所述回滚阈值,则所述实际最优状态解集需要回滚优化,若所述实际最优状态解集的回滚优化累计次数等于所述回滚阈值,则所述实际最优状态解集不需要回滚优化。
8.根据权利要求7所述的幅相控制电路的幅相二维优化方法,其特征在于,所述采用回滚机制进行匹配抽取优化,更新所述实际最优状态解集的步骤,包括:
针对各个所述幅相理论状态组,重新组合匹配所述幅相理论状态组与所述幅相实测状态组的对应关系;
构建神经网络模型,针对各个所述幅相理论状态组,逐一通过所述神经网络模型计算重新匹配后的所述幅相理论状态组与对应的所述幅相实测状态组的交叉熵,并逐一判断所述交叉熵是否满足交叉熵要求,若不满足所述交叉熵要求则需要再次组合匹配所述幅相理论状态组与所述幅相实测状态组的对应关系,直到对应的所述交叉熵满足所述交叉熵要求,得到优化更新后的所述实际最优状态解集。
9.根据权利要求8所述的幅相控制电路的幅相二维优化方法,其特征在于,所述根据满足所述误差要求的所述实际最优状态解集,或者根据不满足所述误差要求且不需要回滚优化的所述实际最优状态解集对应的更新前后的各个所述实际最优状态解集,统计得到所述幅相控制电路的目标最优状态解集的步骤,包括:
若所述实际最优状态解集满足所述误差要求,则直接将所述实际最优状态解集作为所述幅相控制电路的目标最优状态解集;
若所述实际最优状态解集不满足所述误差要求且不需要回滚优化,则获取所述实际最优状态解集对应的更新前后的各个所述实际最优状态解集,计算对应的所述幅相控制电路的误差均方根或者各个所述幅相控制电路的联合误差均方根,并从中找出所述幅相控制电路的误差均方根最小的所述实际最优状态解集或者各个所述幅相控制电路的联合误差均方根最小的所述实际最优状态解集,作为所述幅相控制电路的目标最优状态解集。
10.一种幅相控制电路的幅相二维优化系统,其特征在于,包括:
数据采集单元,用于获取所述幅相控制电路的幅相理论状态组和幅相实测状态组,用于获取所述幅相控制电路的误差要求;
第一处理单元,用于将所述幅相理论状态组和所述幅相实测状态组逐一映射到极坐标系中,并获取所述极坐标系中每个所述幅相理论状态组与各个所述幅相实测状态组的距离;
第二处理单元,用于抽取所述极坐标系中与每个所述幅相理论状态组的距离最小的所述幅相实测状态组,得到至少一个所述幅相控制电路的实际最优状态解集;
第三处理单元,用于判断所述实际最优状态解集是否满足所述误差要求,不满足所述误差要求的则进一步判定是否需要回滚优化,若需要回滚优化则采用回滚机制进行匹配抽取优化,更新所述实际最优状态解集,再判断更新后的所述实际最优状态解集是否满足所述误差要求,如此循环迭代,直到更新后的所述实际最优状态解集满足所述误差要求,或者直到更新后的所述实际最优状态解集不满足所述误差要求且不需要回滚优化;
第四处理单元,用于根据满足所述误差要求的所述实际最优状态解集,或者根据不满足所述误差要求且不需要回滚优化的所述实际最优状态解集对应的更新前后的各个所述实际最优状态解集,统计得到所述幅相控制电路的目标最优状态解集;
第五处理单元,用于将所述目标最优状态解集中的元素,映射还原成幅度值-相位值状态对;
输出单元,用于输出所述幅度值-相位值状态对;
其中,所述第一处理单元采用如下公式将所述幅相理论状态组和所述幅相实测状态组逐一映射到极坐标系中:
X=(Att+Gain)*cosPs;
Y=(Att+Gain)*sinPs;
其中,Att表示所述幅相理论状态组或者所述幅相实测状态组的幅度值,Gain表示默认增益,Ps表示所述幅相理论状态组或者所述幅相实测状态组的相位值,X表示所述幅相理论状态组或者所述幅相实测状态组在所述极坐标系中的X轴坐标位置,Y表示所述幅相理论状态组或者所述幅相实测状态组在所述极坐标系中的Y轴坐标位置。
11.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的幅相控制电路的幅相二维优化方法。
12.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至9任一项所述的幅相控制电路的幅相二维优化方法。
CN202311027486.3A 2023-08-15 2023-08-15 幅相控制电路的幅相二维优化方法、系统、介质及电子设备 Active CN117172163B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311027486.3A CN117172163B (zh) 2023-08-15 2023-08-15 幅相控制电路的幅相二维优化方法、系统、介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311027486.3A CN117172163B (zh) 2023-08-15 2023-08-15 幅相控制电路的幅相二维优化方法、系统、介质及电子设备

Publications (2)

Publication Number Publication Date
CN117172163A CN117172163A (zh) 2023-12-05
CN117172163B true CN117172163B (zh) 2024-04-12

Family

ID=88930947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311027486.3A Active CN117172163B (zh) 2023-08-15 2023-08-15 幅相控制电路的幅相二维优化方法、系统、介质及电子设备

Country Status (1)

Country Link
CN (1) CN117172163B (zh)

Citations (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1580821A (en) * 1977-01-17 1980-12-03 Trt Telecom Radio Electr Digital echo canceller for a modem for data transmission by means of modulation of a carrier
IL119340A0 (en) * 1995-10-16 1997-01-10 Loral Aerospace Corp Adaptive digital symbol recovery for amplitude phase keyed digital communication systems
US6172562B1 (en) * 1998-01-06 2001-01-09 Alcatel Device for controlling the amplitude and the phase of a radio frequency signal
JP2005311780A (ja) * 2004-04-22 2005-11-04 Japan Radio Co Ltd アレイアンテナ通信装置及び制御方法
JP2008116415A (ja) * 2006-11-08 2008-05-22 National Institute Of Advanced Industrial & Technology 伝送線路特性のモデル化方法およびそのモデル化装置
CN101552589A (zh) * 2009-05-14 2009-10-07 上海交通大学 基于继电反馈的交流伺服系统自整定方法
CN102386870A (zh) * 2011-11-16 2012-03-21 武汉滨湖电子有限责任公司 一种功率放大器幅相控设备及控制方法
JP2013183504A (ja) * 2012-02-29 2013-09-12 Daihatsu Motor Co Ltd 電動車両のガタ詰め制御装置
CN104617948A (zh) * 2014-12-19 2015-05-13 中国电子科技集团公司第二十四研究所 有源幅相控制电路
JP2016024057A (ja) * 2014-07-22 2016-02-08 パナソニック株式会社 赤外線応力測定システムにおける応力値の補正方法およびその方法を用いた赤外線応力測定システム
CN105391668A (zh) * 2015-10-28 2016-03-09 重庆西南集成电路设计有限责任公司 基于rfid的相移键控信号解调方法
CN105429230A (zh) * 2015-12-22 2016-03-23 重庆西南集成电路设计有限责任公司 基于人工神经网络算法的电池管理系统及方法
WO2018090417A1 (zh) * 2016-11-15 2018-05-24 中国电子科技集团公司第四十一研究所 基于双级预失真的超宽带复杂格式矢量调制误差修正方法
CN109376329A (zh) * 2018-09-05 2019-02-22 哈尔滨工程大学 一种基于量子鸟群演化机制的阵列幅相误差校正方法
CN109472059A (zh) * 2018-10-17 2019-03-15 西安电子科技大学 基于测量应变的相控阵天线幅相补偿方法
CN111046591A (zh) * 2019-12-31 2020-04-21 哈尔滨工程大学 传感器幅相误差与目标到达角度的联合估计方法
CN112003276A (zh) * 2020-08-18 2020-11-27 西安热工研究院有限公司 基于多目标闪电算法的pss幅相协调优化参数整定方法、系统、设备及存储介质
CN114301549A (zh) * 2021-12-29 2022-04-08 重庆西南集成电路设计有限责任公司 幅相控制电路的幅相校准方法、系统、介质及电子设备
CN114460544A (zh) * 2022-01-25 2022-05-10 中国电子科技集团公司第三十八研究所 一种相控阵射频多波束形成网络及控制方法
CN114624742A (zh) * 2020-12-14 2022-06-14 清华大学 用于极化敏感阵列的幅相误差校准定位方法及装置
WO2022134661A1 (zh) * 2020-12-21 2022-06-30 哈尔滨工业大学 可调磁通永磁同步电机全速域效率最优控制磁化状态选择方法及在线控制方法
CN115000704A (zh) * 2022-06-22 2022-09-02 中国电子科技集团公司第二十九研究所 一种分层计算的二维相控阵波束控制方法及系统
CN115333143A (zh) * 2022-07-08 2022-11-11 国网黑龙江省电力有限公司大庆供电公司 基于双神经网络的深度学习多智能体微电网协同控制方法
CN116028822A (zh) * 2023-03-30 2023-04-28 国网福建省电力有限公司 一种电能表误差状态评估方法、系统、设备及存储介质
WO2023071672A1 (zh) * 2021-10-25 2023-05-04 山东大学 一种基于非线性鲁棒估计的电网信息快速精准感知方法
CN116203517A (zh) * 2023-02-27 2023-06-02 深圳大学 基于可重构智能表面辅助的阵列误差校准方法及相关设备
CN116306199A (zh) * 2022-09-07 2023-06-23 电子科技大学 一种基于多元矢量控制交叉眼干扰技术实现的高效优化方法

Patent Citations (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1580821A (en) * 1977-01-17 1980-12-03 Trt Telecom Radio Electr Digital echo canceller for a modem for data transmission by means of modulation of a carrier
IL119340A0 (en) * 1995-10-16 1997-01-10 Loral Aerospace Corp Adaptive digital symbol recovery for amplitude phase keyed digital communication systems
US6172562B1 (en) * 1998-01-06 2001-01-09 Alcatel Device for controlling the amplitude and the phase of a radio frequency signal
JP2005311780A (ja) * 2004-04-22 2005-11-04 Japan Radio Co Ltd アレイアンテナ通信装置及び制御方法
JP2008116415A (ja) * 2006-11-08 2008-05-22 National Institute Of Advanced Industrial & Technology 伝送線路特性のモデル化方法およびそのモデル化装置
CN101552589A (zh) * 2009-05-14 2009-10-07 上海交通大学 基于继电反馈的交流伺服系统自整定方法
CN102386870A (zh) * 2011-11-16 2012-03-21 武汉滨湖电子有限责任公司 一种功率放大器幅相控设备及控制方法
JP2013183504A (ja) * 2012-02-29 2013-09-12 Daihatsu Motor Co Ltd 電動車両のガタ詰め制御装置
JP2016024057A (ja) * 2014-07-22 2016-02-08 パナソニック株式会社 赤外線応力測定システムにおける応力値の補正方法およびその方法を用いた赤外線応力測定システム
CN104617948A (zh) * 2014-12-19 2015-05-13 中国电子科技集团公司第二十四研究所 有源幅相控制电路
CN105391668A (zh) * 2015-10-28 2016-03-09 重庆西南集成电路设计有限责任公司 基于rfid的相移键控信号解调方法
CN105429230A (zh) * 2015-12-22 2016-03-23 重庆西南集成电路设计有限责任公司 基于人工神经网络算法的电池管理系统及方法
WO2018090417A1 (zh) * 2016-11-15 2018-05-24 中国电子科技集团公司第四十一研究所 基于双级预失真的超宽带复杂格式矢量调制误差修正方法
CN109376329A (zh) * 2018-09-05 2019-02-22 哈尔滨工程大学 一种基于量子鸟群演化机制的阵列幅相误差校正方法
CN109472059A (zh) * 2018-10-17 2019-03-15 西安电子科技大学 基于测量应变的相控阵天线幅相补偿方法
CN111046591A (zh) * 2019-12-31 2020-04-21 哈尔滨工程大学 传感器幅相误差与目标到达角度的联合估计方法
CN112003276A (zh) * 2020-08-18 2020-11-27 西安热工研究院有限公司 基于多目标闪电算法的pss幅相协调优化参数整定方法、系统、设备及存储介质
CN114624742A (zh) * 2020-12-14 2022-06-14 清华大学 用于极化敏感阵列的幅相误差校准定位方法及装置
WO2022134661A1 (zh) * 2020-12-21 2022-06-30 哈尔滨工业大学 可调磁通永磁同步电机全速域效率最优控制磁化状态选择方法及在线控制方法
WO2023071672A1 (zh) * 2021-10-25 2023-05-04 山东大学 一种基于非线性鲁棒估计的电网信息快速精准感知方法
CN114301549A (zh) * 2021-12-29 2022-04-08 重庆西南集成电路设计有限责任公司 幅相控制电路的幅相校准方法、系统、介质及电子设备
CN114460544A (zh) * 2022-01-25 2022-05-10 中国电子科技集团公司第三十八研究所 一种相控阵射频多波束形成网络及控制方法
CN115000704A (zh) * 2022-06-22 2022-09-02 中国电子科技集团公司第二十九研究所 一种分层计算的二维相控阵波束控制方法及系统
CN115333143A (zh) * 2022-07-08 2022-11-11 国网黑龙江省电力有限公司大庆供电公司 基于双神经网络的深度学习多智能体微电网协同控制方法
CN116306199A (zh) * 2022-09-07 2023-06-23 电子科技大学 一种基于多元矢量控制交叉眼干扰技术实现的高效优化方法
CN116203517A (zh) * 2023-02-27 2023-06-02 深圳大学 基于可重构智能表面辅助的阵列误差校准方法及相关设备
CN116028822A (zh) * 2023-03-30 2023-04-28 国网福建省电力有限公司 一种电能表误差状态评估方法、系统、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Location Method of Amplitude-Phase Controlled Phase Shifting Transformer Considering New Energy Consumption;Xiaochen Gao et al.;《IEEE》;20230730;全文 *
幅相控制精度对射频仿真目标位置误差的影响;武鹏飞;何秋茹;《现代防御技术》;20161215;第44卷(第6期);全文 *

Also Published As

Publication number Publication date
CN117172163A (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
CN110363279B (zh) 基于卷积神经网络模型的图像处理方法和装置
Liu et al. Deep proximal unrolling: Algorithmic framework, convergence analysis and applications
US20180218518A1 (en) Data compaction and memory bandwidth reduction for sparse neural networks
CN111832437B (zh) 建筑图纸识别方法、电子设备及相关产品
CN114186632B (zh) 关键点检测模型的训练方法、装置、设备、存储介质
CN111160550A (zh) 训练方法、信息处理设备和非暂态计算机可读存储介质
CN114677565B (zh) 特征提取网络的训练方法和图像处理方法、装置
WO2022000861A1 (zh) 图像篡改区域的定位方法、装置及存储介质
CN111831844A (zh) 图像检索方法、图像检索装置、图像检索设备及介质
CN110651273B (zh) 一种数据处理方法及设备
CN112328715A (zh) 视觉定位方法及相关模型的训练方法及相关装置、设备
CN115797565B (zh) 三维重建模型训练方法、三维重建方法、装置及电子设备
CN110620586A (zh) 数据压缩方法、装置和终端设备
CN113094746A (zh) 基于本地化差分隐私的高维数据发布方法及相关设备
CN112488297A (zh) 一种神经网络剪枝方法、模型生成方法及装置
CN114925651A (zh) 一种电路走线确定方法及相关设备
Liu et al. Active contour driven by adaptive‐scale local‐energy signed pressure force function based on bias correction for medical image segmentation
CN117172163B (zh) 幅相控制电路的幅相二维优化方法、系统、介质及电子设备
CN114301549B (zh) 幅相控制电路的幅相校准方法、系统、介质及电子设备
CN115412401B (zh) 训练虚拟网络嵌入模型及虚拟网络嵌入的方法和装置
CN115330579B (zh) 模型水印的构建方法、装置、设备及存储介质
CN113191208B (zh) 一种用于遥感图像实例分割的特征提取方法和计算机设备
CN114065913A (zh) 模型量化方法、装置及终端设备
CN110134813B (zh) 图像检索方法、图像检索装置及终端设备
CN113490954A (zh) 神经网络、运算方法以及程序

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant