CN112585894A - 用于选择训练对象的系统和方法 - Google Patents
用于选择训练对象的系统和方法 Download PDFInfo
- Publication number
- CN112585894A CN112585894A CN201980054185.5A CN201980054185A CN112585894A CN 112585894 A CN112585894 A CN 112585894A CN 201980054185 A CN201980054185 A CN 201980054185A CN 112585894 A CN112585894 A CN 112585894A
- Authority
- CN
- China
- Prior art keywords
- model
- channel
- training objects
- training
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Amplifiers (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
本发明描述用于训练机器学习(ML)模型以预测多信道放大器设备的目标信道的增益的方法和系统。可使用训练对象的现有集合预先训练ML模型。接着可利用训练后ML模型来建议待标记的另外的有用的训练对象,这将通过在给定信道输入的接通/断开值的情况下更精确地预测目标信道增益来改进ML模型的性能。
Description
相关申请的交叉参考
本申请要求2018年8月16日提交的标题为“用于选择训练对象的系统和方法(SYSTEMS AND METHODS FOR SELECTING TRAINING OBJECTS)”的第62/764,784号美国临时申请和2019年8月14日提交的标题为“用于选择训练对象的系统和方法(SYSTEMS ANDMETHODS FOR SELECTING TRAINING OBJECTS)”的第16/540,883号美国申请的权益,这些文献的全部内容以引用的方式并入本文中。
技术领域
本发明大体上涉及放大器设备的领域,尤其涉及与训练用于预测多信道放大器设备的目标信道的增益的机器学习(machine learning,ML)模型有关的系统和方法。
背景技术
多信道放大器设备可用于放大信号,例如电信号或光信号。多信道放大器设备的目标信道的增益可包括与该目标信道相关联的输出端口的输出信号的功率与在该目标信道相关联的输入端口处的输入信号的功率之间的对数差。可构造模型以预测多信道放大器设备的每一信道的增益。在信号添加到信道或从信道去除时,预测那些信号的添加或去除将如何影响多信道放大器的其它信道的增益可能是有用的。上述模型可用于预测信道中添加信号或去除信号的影响。
发明内容
以下概述仅出于说明性目的,并且不意图限制或约束详细描述。以下概述只以简化形式呈现各种所描述的方面,作为以下提供的更详细描述的序言。
多信道放大器设备(下文称为放大器设备)可用于放大信号,例如电信号或光信号。例如,掺铒光纤放大器可用于放大经由光纤发送的光信号。放大器设备的每一信道的增益不仅在对应信道输入端口处,而且在放大器设备的一个或多个其它输入端口处受信号的电压或功率影响。多信道放大器的活动和非活动信道的特定组合被称为输入组合或信道负载。放大器设备的目标信道的增益的模型可用于确定或预测放大器设备的目标信道(即,所关注的选定信道)的增益。放大器设备的目标信道的增益的模型可接收对应于目标信道的输入端口的功率值(下文称为信号强度值)和放大器设备的一个或多个其它输入端口的电压或功率值作为输入,并且模型可输出目标信道的对应的预测增益。
放大器设备的目标信道的增益的模型可通过测试放大器设备的每一可能输入组合且针对每一可能输入组合测量放大器设备的目标信道的所得增益来构造。可在放大器设备的输入和/或输出端口处针对每一信道测量电压和/或电流。增益的模型可基于输入组合预测目标信道的电压增益和/或电流增益。每一信道的输入和/或输出信号的功率可根据所测量的电压和电流来计算。增益的模型可基于输入组合预测信道处的功率增益。输入组合是指放大器设备的输入可接通或断开的不同方式。例如,如果放大器设备上存在10个信道,则存在210个不同可能输入组合,因为实际上每一输入可接通或断开(2种可能性)。然而,在放大器设备包括许多信道时,针对放大器设备的每一可能输入组合测量放大器设备的输入端口和/或输出端口处的信号强度(电流和/或电压)以便确定目标信道的增益可能是耗时的。可能优选的是,在不针对每一可能输入组合测量放大器设备的输入和输出信号强度的情况下学习放大器设备的目标信道的增益的模型。
可使用需要许多训练对象的机器学习(ML)算法来学习放大器设备的目标信道(例如,放大器设备的选定信道)的增益的模型。每一训练对象可以是响应于特定输入组合的一个或多个所测量的增益。训练对象可呈<x,y>对的格式,其中x为放大器设备的输入信道的全部或子集的值的向量,即,哪些信道为活动的且哪些信道为非活动的,并且y为当x的信道负载应用到放大器设备时目标信道的增益。在给定放大器设备的输入组合的情况下,目标信道的习得模型(下文称为ML模型)用于预测目标信道的增益。用于目标信道的增益的ML模型是将给定输入组合映射到增益值的模型。在给定输入组合的情况下,ML模型可用于预测放大器设备的信道的增益。在此实施例中,ML算法可使用训练对象来学习ML模型。在其它实施例中,可使用神经网络(或决策树,或任何其它ML方法)和训练对象来学习ML模型。在给定放大器设备的输入组合的情况下,由神经网络或决策树近似得出的习得的ML模型(也称为生成的ML模型)可用于预测放大器设备的目标信道的增益。
可使用各种方法选择训练对象以用于标记。例如训练对象可由算法从尚未标记的所有可能输入组合的池中选择。可使用随机抽样,即随机选择训练对象。可使用主动式学习模型,其中标记的训练对象的初始集合用于生成ML模型(例如,生成的ML模型),并且接着额外训练对象被选择(由生成的ML模型)、标记且用于进一步改进生成的ML模型(例如,改进生成的ML模型的系数)。如果恰当地进行,则主动式学习模型比执行随机抽样更高效。
根据广义方面,提供一种方法,其包括:使用标记的训练对象的集合和ML算法训练机器学习(ML)模型以生成用于预测与放大器设备的多个信道中的目标信道相关联的增益的ML模型,标记的训练对象的集合中的每一标记的训练对象包括放大器设备的信道负载的指示和目标信道的增益的指示;接收多个未标记训练对象,每一未标记训练对象包括放大器设备的信道负载的指示;从未标记训练对象确定额外标记的训练对象以用于进一步训练生成的ML模型,所述确定包括:基于生成的ML模型的类型和未标记训练对象的集合确定方差模型;基于方差模型的最大值从多个未标记训练对象选择候选训练对象;基于由候选训练对象指示的信道负载接收目标信道的所测量的增益值;以及基于候选训练对象和增益值生成额外标记的训练对象;以及将额外标记的训练对象添加到标记的训练对象的集合。所述方法还包括使用包括额外标记的训练对象的标记的训练对象的集合进一步训练生成的ML模型。
根据另一广义方面,提供一种生成额外训练对象以用于训练放大器设备的多个信道中的目标信道的增益的生成的机器学习(ML)模型的方法,所述生成的ML模型已使用标记的训练对象的集合进行学习,训练对象的集合的每一标记的训练对象包括放大器设备的信道负载的指示和目标信道的增益的指示。所述方法包括:接收多个未标记训练对象,每一未标记训练对象包括放大器设备的信道负载的指示;从未标记训练对象确定额外标记的训练对象以用于进一步训练生成的ML模型。所述确定包括:基于生成的ML模型的类型和未标记训练对象的集合确定方差模型;确定用于方差模型的多个信道负载;使用方差模型和多个信道负载确定多个方差参数,其中多个方差参数中的每一方差参数对应于多个信道负载中的一个信道负载;基于多个方差参数选择多个信道负载中的一个信道负载;基于选定信道负载从多个未标记训练对象确定候选训练对象;基于由候选训练对象指示的信道负载接收目标信道的所测量的增益值;以及基于候选训练对象和增益值生成额外标记的训练对象。所述方法还包括使用包括额外标记训练对象的标记训练对象的集合进一步训练生成的ML模型。
在某些情况下,可存在关于多少训练对象可被标记的预算和/或关于可用于进行标记的时间量的限制。可能优选的是,在给定关于训练对象的预算和/或标记时间约束的情况下,选择将提供放大器设备的目标信道的最精确ML模型的额外训练对象。额外训练对象可由算法从尚未标记的候选训练对象的集合选择。
此处的概述并非本文中所描述的新颖特征的穷尽性列举,并且不限制权利要求书。下文更详细地描述这些和其它特征。
附图说明
根据以下描述、权利要求书和附图,将更好地理解本申请公开的这些和其它特征、方面和优势。本申请公开借助于实例说明,且不受附图的限制,在附图中相同编号指示类似元件。
图1是可用于实施根据本文中所描述的代表性实施例的设备和方法的计算系统的框图。
图2展示根据本申请公开的一个或多个说明性方面的放大器设备的简图。
图3展示根据本申请公开的一个或多个说明性方面的放大器设备的信道之间的交互的简图。
图4展示根据本申请公开的一个或多个说明性方面的训练机器学习(ML)模型的简图。
图5是根据本申请公开的一个或多个说明性方面的用于生成ML模型且生成用于训练生成的ML模型的额外标记的训练对象的方法的流程图。
图6是根据本申请公开的一个或多个说明性方面的用于选择用于生成ML模型的特征的方法的流程图。
图7是根据本申请公开的一个或多个说明性方面的用于对特征进行排序的方法的流程图。
图8是根据本申请公开的一个或多个说明性方面的用于选择模型的方法的流程图。
图9是根据本申请公开的一个或多个说明性方面的用于基于方差确定额外训练对象的方法的流程图。
图10是根据本申请公开的一个或多个说明性方面的用于对方差模型求解且从池中选择额外训练对象的方法的流程图。
图11是根据本申请公开的一个或多个说明性方面的用于对方差模型求解且生成额外训练对象的方法的流程图。
图12是根据本申请公开的一个或多个说明性方面的用于迭代地确定最大方差及从池中选择额外训练对象的方法的流程图。
图13是根据本申请公开的一个或多个说明性方面的用于迭代地确定最大方差及生成额外训练对象的方法的流程图。
图14是根据本申请公开的一个或多个说明性方面的用于迭代地确定最大经验方差及从池中选择额外训练对象的方法的流程图。
图15是根据本申请公开的一个或多个说明性方面的用于迭代地确定最大经验方差及生成额外训练对象的方法的流程图。
图16是根据本申请公开的一个或多个说明性方面的用于生成多信道放大器的模型的方法的流程图。
图17是根据本申请公开的一个或多个说明性方面的用于确定待激活的额外信道的方法的流程图。
图18是根据本申请公开的一个或多个说明性方面的用于确定光信噪比的方法的流程图。
具体实施方式
在各种说明性实施例的以下描述中,参考构成本申请部分内容的附图,且借助于对这些附图的说明展示本申请公开的方面可实践的各种实施例。应理解,在不脱离本申请公开的范围的情况下,可利用其它实施例,且可进行结构或功能方面的修改。
放大器设备可用于放大信号,例如电信号或光信号。放大器设备可包括中继器,和/或可执行中继器的功能。放大器设备可包括光学放大器和/或中继器,例如掺铒光纤放大器(Erbium-doped fiber amplifier,EDFA)。例如,光学放大器可耦合到光纤且放大通过光纤发送的光信号的功率,所述光纤可被称为链路。放大器设备可包括多信道放大器,其中存在多个输入端口和输出端口,并且每一信道具有对应的输入端口和输出端口。
放大器设备的模型可表示放大器设备的各种物理属性。可使用机器学习(ML)算法和包括训练对象的训练数据集来学习(或生成)多信道放大器的给定信道的增益的模型。ML算法可以是监督学习ML算法,并且训练对象可以是标记的训练对象。习得或生成的ML模型可接收给定信道的输入端口的输入值和放大器设备的其它信道的一个或多个输入端口的输入值,并且输出放大器设备的给定信道(例如,目标信道)的预测输出(例如,增益)。针对给定信道,习得或生成的ML模型可指示信道的输入端口处的信号的信号强度值(例如,功率)与信道的输出端口处的预测信号强度值(例如,功率)之间的对数差。输入和输出信号强度值之间的此对数差可被称为信道的增益或信道增益。
构造或构建用于多信道放大器的给定信道的增益的模型的一个“强力”方法将是,针对放大器的目标信道的一种输入组合,测量放大器的输出端口处的输出信号强度值,基于给定信道的输出信号强度值与输入信号强度值的比率确定信道的增益,以及针对给定信道的所有可能输入组合重复这些步骤。在使用此“强力”方法之后,多信道放大器的给定信道的增益值可通过针对特定输入组合检索给定信道的对应输出(例如,使用查找表)来确定。然而,可能优选的是,例如耗时较少的是,在不针对给定信道的每一个可能输入组合测量输入和输出信号强度值的情况下学习放大器设备的给定信道的增益的模型。为了在不针对每一个可能输入组合测量给定信道的输出信号强度值的情况下对放大器的给定信道的增益建模,可使用各种机器学习(ML)算法。在一些实施例中,ML算法可用于学习函数。
可通过提供待学习的具有训练对象的集合的ML算法来训练信道的增益的ML模型。训练ML模型可得到在给定放大器的一个或多个输入值的情况下可用于预测放大器的目标信道的增益值的ML模型(下文称为生成的ML模型)。在生成ML模型之后,可将额外训练对象添加到训练对象的集合以形成更新后训练对象的集合,所述更新后训练对象的集合可接着提供到用于进一步训练生成的ML模型的ML算法,由此生成改进的生成的ML模型。
可使用主动式学习过程确定额外训练对象,其中生成的ML模型用于选择额外训练对象。主动式学习可比随机选择训练对象针对生成的ML模型提供更有效的训练对象。例如,具有所要精确度的ML模型可使用通过主动式学习选择的1000个训练对象来训练,而使用随机抽样学习的ML模型可能使用10,000个随机选定的训练对象来实现相同的所要的精确度水平。
光学链路可构造成和/或用于传输数据。光学链路可包括一个或多个放大器设备。可使用一个或多个ML模型以便改进光路设置的性能、改进链路的信噪比、预测链路的性能、改进网络优化、更高效地分配资源和/或用于其它目的。
图1是可用于实施根据本文中所描述的代表性实施例的方法的计算系统100的框图。特定计算系统100可利用所展示的组件的全部或仅组件的子集,并且集成水平可在不同计算系统100之间变化。此外,计算系统100可含有组件的多个例子,例如多个处理单元、处理器、存储器、传输器、接收器等。计算系统100可为任何类型的合适的计算设备,例如物理计算机、数据中心内的服务器或虚拟机。计算系统100可包括中央处理单元(centralprocessing unit,CPU)114、总线120和/或存储器108,并且可任选地还包括海量存储设备104、视频适配器110和/或输入/输出(input/output,I/O)接口112(以虚线展示)。本领域的技术人员将了解CPU 114代表了处理能力。在一些实施例中,代替CPU 114或除CPU 114之外,计算系统100还可包括专用处理单元。例如,计算系统100可包括图形处理单元(GraphicProcessing Unit,GPU)、张量处理单元(Tensor Processing Unit,TPU)、神经处理单元(Neural Processing Unit,NPU)和/或可提供其它所谓的加速处理器(或处理加速器)来作为CPU 114的补充或代替。
存储器108可包括任何类型的非暂时性系统存储器,例如静态随机存取存储器(static random access memory,SRAM)、动态随机存取存储器(dynamic random accessmemory,DRAM)、同步DRAM(synchronous DRAM,SDRAM)、只读存储器(ROM),或其组合等。例如,存储器108可包括用于在启动时使用的ROM和用于程序以及数据存储以供在执行程序时使用的DRAM。总线120可以是包括存储器总线或存储器控制器、外围总线和/或视频总线的任何类型的若干总线架构中的一种或多种。存储器108可包括软件102。软件102可从存储器108检索且由CPU 114和/或例如GPU、TPU、NPU等处理加速器(未说明)执行。
海量存储设备104可包括任何类型的非暂时性存储设备,用于存储数据、程序和其它信息且用于使得可经由总线120存取数据、程序和其它信息。海量存储设备104可包括,例如,固态驱动器、硬盘驱动器、磁盘驱动器、和/或光盘驱动器中的一个或多个。
视频适配器110和I/O接口112可提供接口以将外部输入和输出设备耦合到计算系统100。输入和输出设备的实例包括耦合到视频适配器110的显示器118和耦合到I/O接口112的例如触摸屏等I/O设备116。可将其它设备耦合到计算系统100,并且可利用额外或较少的接口。举例来说,例如通用串行总线(universial serial bus,USB)(未示出)等串行接口可用于提供用于外部设备的接口。
计算系统100还可包括一个或多个网络接口106,所述网络接口可包括例如以太网缆线等有线链路和/或无线链路中的至少一个以接入一个或多个网络122。网络接口106可允许计算系统100经由网络122与远程实体通信。例如,网络接口106可经由一个或多个传输器/传输天线和一个或多个接收器/接收天线提供无线通信。计算系统100可与局域网或广域网通信以用于数据处理以及与例如其它处理单元、因特网或远程存储设施等远程设备的通信。
图2展示了根据本申请的一个或多个说明性方面公开的多信道放大器设备210(下文称为放大器设备210)的简图。出于本实例的目的,放大器设备210为光学放大器,例如掺铒光纤放大器(EDFA)。在图2中所说明的示例实施例中,放大器设备210包括四十(40)个信道。放大器设备210可接收一个或多个信号x1-x40作为输入,并且输出一个或多个放大后的信号y1-y40,如下文进一步详细描述。输入信号和放大后的输出信号为光信号。尽管图2中所说明的多信道放大器设备210为光学放大器,但将了解,在其它实施例中,放大器设备210可为另一类型的放大器设备,例如其中输入信号和放大后的输出信号为电信号的电放大器。
放大器设备210包括四十个输入端口220-1--220-40(通常称为输入端口220(input port220),且共同称为输入端口220(input ports 220))和四十个输出端口225-2--225-40(通常称为输出端口225(output port 225),且共同称为输出端口225(outputports 225))。放大器设备210的每一信道包括一对输入和输出端口。例如,信道1包括输入端口220-1和输出端口225-1。每一对应输入端口220-1--220-40可经由对应输入缆线(例如光纤)230-1--230-40(通常称为输入缆线230(input cable 230),且共同称为输入缆线230(input cables 230)中的一个接收输入信号(x1-x40)。每一对应输出端口225-1--225-40可经由对应输出缆线240-1--240-40(通常称为输出缆线240(output cable 240),且共同称为输出缆线240(output cables 240))中的一个输出放大后的信号中的一个。针对放大器设备210的每一信道,可计算增益。可通过确定输出端口225中的一个输出端口处的输出信号(例如功率)的信号强度值与输入端口220的对应输入端口处的信号(例如功率)的信号强度值的对数差来计算增益。例如,包括输入端口220-3和输出端口225-3的放大器的第三信道的增益可由以下公式log(y3)-log(x3)计算。包括输入端口220-3和输出端口225-3的第三信道的增益可被称为第三信道的信道增益。例如,log(y40)与log(x40)之间的差可被称为信道40的增益,或跨越信道40的增益。每一信道的增益可以分贝(dB)为单位进行测量。尽管放大器设备210说明为具有四十个信道,但放大器设备210可包括任何数目个信道,例如80个、96个等。
包括输入端口220的每一信道可被称为活动或非活动的。预定阈值可用于确定信道的输入端口220是否为活动的。可测量在输入端口220处经由输入缆线230接收的输入信号的信号强度且将其与预定阈值进行比较以确定输入端口220是活动的还是非活动的。在给定信道的输入端口220处的信号强度高于阈值时,给定信道被定义为活动的,并且在给定信道的输入端口220处的信号强度低于阈值时,给定信道被定义为非活动的。活动信道可指示数据当前正通过对应于所述信道的输入端口传输。
包括输入端口220的哪些信道在放大器设备210上为活动的指示可被称为信道负载(也称为输入组合)。例如,[1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1]的信道负载指示放大器设备210的所有奇数编号的信道(x1、x3、x5、…、x39)是活动的,且放大器设备210的所有偶数编号的信道(x2、x4、x6、…、x40)是非活动的。换句话说,在此实例中,所有奇数编号的输入信号具有高于预定阈值的信号强度值,并且所有偶数编号的信号具有低于预定阈值的信号强度值。
多个放大器设备210可以彼此连接,即级联,例如在链路上以各种间隔相连。链路可包括长距离光纤连接。用于级联放大器设备210的每一信道的模型可用于确定长距离光纤连接上的光信噪比。
每一个信道的增益可受各种因素影响,例如放大器设备210的信道负载、放大器设备210的使用年限、放大器设备210的当前温度和/或其它因素。在例如温度和信道负载等其它因素归一化时,制造差异或其它差异可能使得所制造的每一个个体放大器设备210提供不同增益。可生成放大器设备210的信道中的一个的增益的模型,其中模型接收放大器设备210的信道负载且输出信道中的所述一个的增益。对于所制造的每一放大器设备210,可能优选的是生成特定针对于所述放大器设备210的模型。
图3展示根据本申请的一个或多个说明性方面公开的放大器设备210的信道之间的交互的简图。如图3中所说明,信道的增益可不仅受对应于相同信道的输入端口220处的输入信号影响,而且受放大器设备210的其它信道的全部或子集的输入端口220处的输入信号影响。例如,如所说明,包括输入端口220-1和输出端口225-1的第一信道的增益可不仅受输入端口220-1处的输入信号影响,而且受放大器设备210的所有其它信道(例如输入端口(220-2--220-40))的输入端口220-2--220-40处的输入信号影响。
对于所制造的每一放大器设备210,每一输入端口220对放大器设备210的每一信道的增益的影响可能是不同的。例如,对于第一放大器设备210,包括输入端口220-3的信道是否为活动的对包括输出端口225-2的信道的增益可具有较大影响,但对于另一放大器设备210,包括输入端口220-3的信道是否为活动的对包括输出端口225-2的信道的增益可能没有影响。可针对所制造的放大器设备210的每一信道训练模型以对所述特定放大器设备210的所关注的一个输出端口的增益建模。
图4展示了根据本申请公开的一个或多个说明性方面的一种用于生成额外标记训练对象的方法的简图,所述额外标记训练对象用于训练放大器设备210的目标信道的生成的ML模型。所说明的方法400可通过提供可供学习的具有标记的训练对象410的生成的ML模型420来训练例如放大器设备210等放大器设备的目标信道的生成的ML模型。在给定信道负载(在本文中也称为输入组合的情况下,生成的ML模型可预测放大器设备210的目标信道的增益。在一些实施例中,生成的ML模型在使用标记的训练对象训练时可得到改进的生成的ML模型420。如下文进一步详细描述,在给定输入组合(或信道负载)的情况下,改进的生成的ML模型420可预测放大器设备210的目标信道的增益。
标记的训练对象410的集合可包括对应于放大器设备210的所测量的数据的集合。训练对象410的集合中的每一标记的训练对象可包括放大器设备210的每一信道的输入端口220的输入值和放大器设备210的目标信道的对应的所测量的增益。例如,对于图2中所说明的放大器设备210,对于信道1的增益的生成的ML模型,每一训练对象410可采用格式[x1、x2、...x40][y1]。信道的所测量的增益以分贝(dB)为单位。信号强度值(例如功率)可由用于测量放大器设备210的输出端口225处的信号强度的设备测量。信号强度值(例如功率)可由技术员测量。低于阈值的任何输入信号映射到-1,并且高于阈值的任何输入信号映射到1。
标记的训练对象的输入值可能已从连续输入值(例如分贝)转换成二进制值。可选择阈值,并且大于阈值的值可设置成‘1’,并且小于阈值的值可设置成‘-1’。例如,可将阈值设置成-36dB,在此情况下,-23dB的输入值将表示为‘1’,并且-49dB的输入值将表示为‘-1’。
标记的训练对象410的集合可包括任何数目个标记的训练对象。可预先确定包括在标记的训练对象410的集合中的标记的训练对象的数目。例如,可采用五千个增益测量,每一增益测量具有不同信道负载,且因此标记的训练对象410的集合可包括五千个标记的训练对象。可基于用于收集标记的训练对象410的集合所要的时间量确定包括在标记的训练对象410的集合中的标记的训练对象的数目。
在给定信道负载的情况下,可使用标记的训练对象410训练生成的ML模型420以生成改进的生成的ML模型以用于预测放大器设备210的目标信道的增益。生成的ML模型420可接收信道负载作为输入,其中信道负载是输入端口的全部或一部分的活动或非活动的值。
在某些实施例中,可能优选的是,在初始训练ML模型420(例如,生成的ML模型420)之后进一步优化生成的ML模型420。所提议的方法可在两个情境中操作;1)其中存在未标记候选训练对象430的集合(到目前为止不用于训练生成的ML模型420)以从其中选择额外训练对象440,和2)其中不存在可用的未标记训练对象。在此情境下,生成的ML模型420用于生成额外训练对象440。选择/生成额外训练对象的过程被称为“主动式学习”。在两个情境中,将由ML模型420选择/生成的额外训练对象发送到实验室技术员以用于进行标记(即,增益测量)。针对每一额外训练对象440,将标记(即,增益测量)添加到额外训练对象440以生成额外标记的训练对象。接着将额外标记的训练对象添加到标记的训练对象410的集合以用于进一步训练生成的ML模型420以生成改进的生成的ML模型420。
例如,可通过基于由ML模型所预测的增益输出的不确定性水平计算方差的算法选择额外训练对象440。可选择生成的ML模型420具有最大不确定性的信道负载作为额外训练对象440。方差可用作不确定性的量度,并且可选择目标信道增益的具有最高方差的信道负载作为额外训练对象440。本文中描述用于选择额外训练对象440的各种方法。
如果存在未标记候选训练对象集合430,则从其中选择额外训练对象440。可将对应于未标记候选训练对象430的信道负载应用到放大器设备210,并且可以例如由技术员测量目标信道的输入端口和输出端口处的信号强度。接着通过计算输出端口处的信号强度值与输入信道处的信号强度值的比率来确定目标信道的增益。测量目标信道的输入端口和输出端口处的信号强度、在给定特定信道负载的情况下确定目标信道的增益以及将所确定的增益添加到未标记候选训练对象可被称为对未标记候选训练对象430进行标记。未标记候选训练对象430可包括额外训练对象440。可确定一个或多个额外训练对象440。在确定一个或多个额外训练对象440之后,可对额外训练对象440进行标记且将其添加到先前用于训练生成的ML模型420的训练对象410的集合。可使用更新后的标记的训练对象410的集合进一步训练生成的ML模型420以生成改进的生成的ML模型420(例如,以进一步学习生成的ML模型420的系数)。所得改进的ML模型420可接着用于从信道负载预测放大器设备的目标信道的增益。迭代地,可通过收集额外训练对象440、对额外训练对象440进行标记,和更新标记的训练对象410的集合,以及使用更新后的标记的训练对象410的集合进一步训练ML模型420,来进一步优化生成的ML模型420(例如,进一步训练以学习生成的ML模型420的系数)。
可预先确定所选择/生成的额外训练对象440的数目,和/或可预先确定收集额外训练对象440的次数。例如,每当进一步训练生成的ML模型420时,可收集一百个额外训练对象440,并且此过程可重复十次,由此总共生成一千个额外训练对象440可被标记且提供到生成的ML模型420以生成改进的生成的ML模型420。可基于满足阈值(例如,生成的ML模型420的阈值错误率)确定所收集的额外训练对象440的数目和/或额外训练对象440被收集的次数。
图5是根据本申请公开的一个或多个说明性方面的用于生成ML模型且用于生成用于训练生成的ML模型420的额外标记的训练对象的方法500的流程图。在一个或多个实施例中,方法500或其一个或多个步骤可由一个或多个计算设备或实体执行。例如,方法500可由供计算系统100执行的软件执行。软件包括存储在例如非暂时性计算机可读介质等计算机可读介质中的计算机可执行指令。对执行方法500的软件的编码在关于本申请的本领域的普通技术人员的范围内。可按次序省略或改变流程图中所说明的方法500的一些步骤或步骤的部分。应强调,除非另外指明,否则图5中所展示的方法500不需要按如所展示的准确序列执行;并且同样地,可并行而非按序列执行各种步骤。
在步骤505处,可接收选择的放大器设备210的目标信道。所述选择可包括放大器设备210的任何信道。可选择放大器设备210的任何所关注的目标信道。例如,如果放大器设备210包括40个信道,则因此可选择放大器设备210的40个信道中的任一个作为目标信道。所述选择可由用户进行或自动进行,例如在其中存在多个所关注的目标信道的迭代过程中进行。在一些实施例中,算法可重复地执行方法500的步骤505-536且通过放大器210的信道中的每一个迭代,从而得到针对放大器设备210的每一信道习得的ML模型(例如生成的ML模型)。
在步骤508处,可接收或生成标记的训练对象410的集合。可由用户预先确定和/或选择包括在标记的训练对象410的集合中的标记的训练对象的数目。
在步骤510处,可生成对应于选定目标信道的额外特征,这可被称为“特征生成”。可由算法和/或函数生成额外特征。每一输入端口(即,信道输入)处的输入信号的信号强度值可被称为主要效应。例如,在图2中,放大器设备210的主要效应为x1-x40。放大器设备210的信道的数目与主要效应的数目相同。例如,包括40个信道的放大器设备210恰好具有40个主要效应。
额外特征可包括基于主要效应生成的特征。针对每一个主要效应xi和xj,2路交互(或成对交互)可为生成的xixj。例如,可针对包括40个信道的放大器设备210生成高达780个2路交互。可生成任何组合和任何量的额外特征,例如三阶交互或更高。在一些情况下,可生成额外特征的仅一部分。例如,尽管可针对包括40个信道的放大器设备210生成高达780个2路交互,但在一些情况下,可能生成较小数目个2路交互和/或将其用于对目标信道建模。
可选择和/或预先确定生成的额外特征的数目和/或额外特征的最高阶次。可基于方法500的所要执行时间选择或预先确定待生成的额外特征的数目。生成较少额外特征可使得方法500或方法500的部分更快速地执行。
可针对包括在标记的训练对象410的集合中的每一标记的训练对象生成额外特征。生成的额外特征可与训练对象410的集合一起存储,例如在数据库或列表中。在一些情况下,可能不生成额外特征,并且数据库或列表可仅包括主要效应。
在步骤515处,可减少添加到标记的训练对象410的集合中的每一标记的训练对象以用于对目标信道的增益建模(例如,用于学习目标信道的增益的生成的ML模型)的额外特征的数目。可创建包括主要效应和额外特征的特征列表。特征列表中的每一主要效应和额外特征在下文中被称为特征。在步骤505处,主要效应和/或额外特征中的一些可具有与目标信道的增益的最小相关性。在步骤515处,可确定且从特征列表去除具有与目标信道的增益的最小相关性的主要效应和额外特征。在步骤515处,可使用各种方法来从特征列表选择和去除特征(例如,主要效应或额外特征)。下文和图6中所描述的方法600是可用于在步骤515处从特征列表去除特征以减少包括在特征列表中的特征的数目的方法的一个实例。
可检查包括在特征列表中的每一特征(例如,主要效应或额外特征)以确定所述特征(例如,主要效应或额外特征)对目标信道的增益的影响程度。可针对包括在特征列表中的特征中的每一个确定性能量度。性能量度可包括特征与目标信道的增益之间的相关性。包括在标记的训练对象410的集合中的标记的训练对象可用于针对包括在特征列表中的每一特征计算性能量度。接着可基于其性能量度从特征列表去除特征。如果其性能量度未能满足阈值,例如预定阈值,则可去除特征。可基于性能量度对包括在特征列表中的特征进行排序。可对特征列表中的特征的全部或子集进行排序。可从排序后特征中选择预定数目个特征。选定的排序后特征可保持在特征列表中且可从特征列表去除其它特征。
可将初始地从特征列表去除的特征添加回到列表。如果选择例如2路交互等额外特征,但尚未选择作为所述额外特征的分量的主要效应,则可将主要效应添加回到特征列表。例如,如果x2x30包括在特征列表中,但从特征列表去除x30,则接着可将x30添加回到特征列表,因为其形成选定特征x2x30的分量。
可能未检查一些特征;确切而言,可在没有任何检查的情况下将那些特征保持在特征列表中。对应于目标信道的特征(即,目标信道的主要效应)和/或与目标信道相邻的特征可在没有检查的情况下保持在特征列表中。例如,如果在步骤505处选择对应于信道28的信道,则可在不确定那些特征的任何性能量度的情况下保持主要效应x28、x29和x30。可认识到,例如对应于目标信道的输入端口230和相邻信道的输入端口230等某些输入端口230的输入将对目标信道的增益具有相对较大的影响。因此,跳过对那些主要效应(即,输入端口)的影响的检查可能更高效,因为那些主要效应将预期在检查之后保持在特征列表中。
在步骤520处,可对在步骤515之后保留的特征进行排序。在一些情况下,可能不执行步骤515,在此情况下,将在步骤520处对所有特征进行排序。例如,如果在步骤510处不生成额外特征,则可在步骤520处对所有主要效应进行排序。排序算法可用于对包括在特征列表中的特征进行排序。排序算法可检查标记的训练对象410的集合以执行排序。可基于目标端口与特征中的每一个之间的相关性对所述特征进行排序。可生成包括等级和对应特征中的每一个的排序后的特征列表。排序后的特征列表可包括根据排序算法基于每一特征对目标端口的增益的影响程度从最相关到最不相关的特征。
可在不相对于某些特征执行排序算法的情况下将所述特征排序在列表的顶部处。对应于目标端口(例如,目标信道的主要效应)的信道的特征,和/或与目标端口的信道相邻的特征(例如,与目标端口相邻的信道的主要效应)可在没有检查的情况下保持和/或排序在列表的顶部处。关于正被建模的放大器设备210的知识和/或其它域知识可用于确定将对哪些特征进行排序,而不对那些特征执行排序算法。例如,如果先前发现特定特征的值对目标端口的输出具有较大影响,则可在不对特定特征执行排序算法的情况下将所述特征排序在列表的顶部处。在步骤525处,可通过将特征从排序后的特征列表添加到ML模型特征来更新用于生成ML模型的ML模型特征。可按其排序的次序将排序后特征添加到ML模型特征。例如,首先可发指令给ML模型以使用前四个排序后特征生成ML模型420,并且接着可发指令给ML模型以基于前五个排序后特征生成ML模型,并且可将针对两个生成的ML模型中的每一个计算的性能量度彼此进行比较。
在步骤530处,可使用更新后ML模型特征生成ML模型。可通过使用来自步骤520处生成的排序后的特征列表的预定数目个排名最高的特征生成ML模型。例如,可使用排序后的特征列表中的四个排名最高的特征生成ML模型。
可使用包括在标记的训练对象410的集合中的标记的训练对象训练ML模型,所述标记的训练对象的集合可包括在步骤508处接收的标记的训练对象。可通过将标记的训练对象从标记的训练对象410的集合提供到待学习的机器学习算法(例如最小平方算法)来训练ML模型。训练可包括手动特征选择。
ML模型420可包括以下各项中的一个或多个:线性函数、二次函数、基于树的集合模型或任何其它合适类型的函数。训练后ML模型420可接收包括模型中的特征中的每一个的二进制值的信道负载作为输入,并且输出目标信道的预测增益。
在步骤535处,可计算ML模型的性能量度。ML模型的性能量度可包括ML模型对与包括在标记的训练对象410的集合中的每一标记的训练对象相关联的信道负载的目标信道的增益的预测程度的指示,换句话说,ML模型对标记的训练对象410的集合的拟合程度的指示。可使用例如贝叶斯信息量准则(Bayesian information criterion,BIC)算法、赤池信息量准则(Akaike information criterion,AIC)或交叉验证(Cross Validation,CV)等算法测量ML模型的性能量度。
在步骤536处,可进行关于ML模型是否将进一步训练的确定。
可基于所计算的ML模型的性能量度进行在步骤536处的确定。例如,在步骤535处由ML模型所预测的增益值与实际增益值或ML模型的任何其它性能量度之间的误差量。如果性能量度未能满足阈值,则方法500可返回到步骤525以便将另一特征从排序后的特征列表添加到用于生成ML模型的ML特征的列表。如果性能量度满足阈值,则方法500进行到步骤537。
在步骤537处,可存储选定信道的生成的ML模型420。可将ML模型420存储在数据库中。可将生成的ML模型420例如发送到服务器和/或任何其它设备。生成的ML模型420可与放大器设备210相关联。生成的ML模型420可与用于相同放大器设备210的其它生成的ML模型420相关联,例如与用于放大器设备210的其它目标输出端口(例如,信道)的生成的ML模型420相关联。生成的ML模型420可包括与所关注的特定目标输出端口相关联的指示。
在步骤540处,可针对生成的ML模型420确定方差模型。方差模型可针对生成的ML模型420的每一输入组合输出方差量或所估计的方差量。换句话说,针对生成的ML模型420的输入(在生成生成的ML模型420的过程中使用的主要效应和额外特征)的每一集合,方差模型可输出实际或所估计的方差。在给定输入的组合的情况下,方差量可指示生成的ML模型420的输出预测增益的不确定性的量。
在步骤545处,可使用在步骤540处生成的方差模型选择一个或多个候选训练对象430。方差模型的最大值可指示信道负载(例如,输入组合),在所述信道负载处生成的ML模型420基于所述信道负载(例如,输入组合)对目标输出端口(例如,信道)的预测增益具有最高的不确定性。可基于使方差模型最大化的信道负载(例如,输入组合)确定候选训练对象430。候选训练对象430可包括信道负载(例如,输入组合)。
使方差模型最大化的信道负载(例如,输入组合)可包括放大器设备210的输入端口的全部或一部分的输入值。例如,对于作为40信道放大器设备的放大器设备210,存储在步骤537处的生成的ML模型420可包括对应于特定输入值的五个特征,并且因此方差模型可包括所述五个特征。可针对不在信道负载(例如,输入组合)中的输入端口确定可接受的值。这些其它输入端口的值可随机选择(全部设置成非活动的,全部设置成活动的)或使用任何其它方法选择。
在步骤550处,对在步骤545处所选择的候选训练对象430进行标记,所述候选训练对象为额外训练对象440。额外训练对象440可包括候选训练对象的信道负载(例如,输入组合)。每一额外训练对象440标记有目标信道的所确定增益,对应于候选训练对象430的信道负载(例如,输入组合)。
可通过将选定候选训练对象430发送到用于将值输入到放大器设备210且测量目标输出端口(例如,信道)的增益的设备来对选定候选训练对象430(其为额外训练对象440)进行标记。可将候选训练对象430显示给用户,并且用户可将放大器设备210的输入端口设置成在候选训练对象430中提供的值。换句话说,用户可基于候选训练对象430将放大器设备210的输入端口的全部或子集设置成活动的或非活动的。用户可针对信道测量放大器设备210的输出端口处的信号强度值以便计算信道增益。
在步骤555处,标记的训练对象410的集合可被更新以包括额外标记的训练对象。在步骤550的每一迭代处,可选择额外训练对象并且在观测到额外训练对象y(x)的信道负载(例如,输入组合)的目标信道的增益且对额外训练对象进行标记之后,标记的训练对象410的集合可被更新以包括额外标记的训练对象。可在将此额外标记的训练对象添加到设计矩阵之后估计新线性系数xn×p。在添加额外标记的训练对象之后,新设计矩阵可为其中X包括标记的训练对象410的集合,并且x包括额外标记的训练对象。边缘和条件方差可一致,并且可描述为为了使预测方差最大化,最大化算法可保持比例不变。在x作为固定范数以避免按比例调整 的情况下,其中σ2可为常数。方差最大化算法可描述为 其中x T x=c2,并且其中emin可为与XTX的最小特征值相关联的特征向量。在其中特征空间为二进制的(即)的情况下,则宽松近似可为
方法500可在步骤560处继续,并且标记的训练对象410的更新后集合可用于进一步训练生成的ML模型420且生成改进的生成的ML模型420。尽管图5中未说明,但方法500可从步骤540继续到步骤560,并且考虑到额外标记的训练对象,可使方差最大化。方法500可基于计数器选择是否返回到步骤540。例如,在每10个额外标记的训练对象已添加到标记的训练对象410的集合之后,可生成进一步改进的生成的ML模型420(例如,可进一步改进生成的ML模型的系数)。
图6是根据本申请公开的一个或多个说明性方面的用于选择用于生成ML模型的特征的方法600的流程图。在一个或多个实施例中,方法600或其一个或多个步骤可由一个或多个计算设备或实体执行。例如,方法600可由供计算系统100的处理单元执行的软件执行。软件包括存储在例如非暂时性计算机可读介质等计算机可读介质中的计算机可执行指令。对执行方法500的软件的编码在关于本申请的本领域的普通技术人员的范围内。可按次序省略或改变流程图中所展示的方法600的一些步骤或步骤的部分。应强调,除非另外指明,否则图6中所展示的方法600不需要按如所展示的准确序列执行;并且同样地,可并行而非按序列执行各种步骤。
在步骤605处,可确定对应于选定目标端口或目标信道的特征。可确定主要特征和/或额外特征的任何组合。在步骤605处执行的动作可类似于上文在步骤510处所描述的那些动作。可针对每一训练对象410计算对应于特征的数据且可将所述数据与训练对象410一起存储。
在步骤610处,可计算目标端口或目标信道的增益与每一特征之间的相关性。训练对象410可用于确定目标端口或目标信道的增益与每一特征之间的相关性。相关性可计算为皮尔森(Pearson)相关性和/或任何其它类型的相关函数。
在步骤615处,可基于特征与目标端口或目标信道的增益的相关性的强度对所述特征进行排序。在步骤620处,可创建具有若干排名最高的特征的列表。可预先确定和/或选择列表中的所述若干排名最高的特征。例如,列表可包括二十个排名最高的特征,所述特征具有与目标端口或目标信道的增益的最强相关性。可基于阈值相关性强度确定所述若干排名最高的特征。满足阈值相关性强度的所有特征可包括在列表中。
在步骤625处,可扫描列表以确定是否包括额外特征的所有分量。额外特征可包括成对交互,例如xixj。例如,如果x3x7包括在特征列表中,则可扫描列表以确定x3是否存在于列表中和/或x7是否存在于列表中。
如果额外特征的所有主要效应未包括在特征列表中,则在步骤635处可将遗失的主要效应添加到列表。如果额外特征的所有主要效应包括在列表中,则在步骤630处可存储特征列表。
在步骤635处,可将遗失的主要效应的全部或一部分添加到特征列表。如上文关于图5的步骤515所描述,如果主要效应形成列表中的额外特征的一部分,则可将主要效应添加到特征列表。
在步骤630处可存储特征列表。例如,特征列表可存储在数据库中。可将特征列表传输到另一函数或算法。例如可通过使用下文所描述的排序方法700对特征列表进行排序。
图7是根据本申请公开的一个或多个说明性方面的用于对特征进行排序的方法700的流程图。在一个或多个实施例中,方法700或其一个或多个步骤可由一个或多个计算设备或实体执行。例如,方法700可由供计算系统100的处理单元执行的软件执行。对执行方法700的软件的编码在关于本申请的本领域的普通技术人员的范围内。软件包括存储在例如非暂时性计算机可读介质等计算机可读介质中的计算机可执行代码或指令。可按次序省略或改变流程图中的一些步骤或步骤的部分。应强调,除非另外指明,否则图7中所展示的方法700不需要按如所展示的准确序列执行;并且同样地,可并行而非按序列执行各种步骤。
在步骤705处,在给定输入组合的情况下,生成线性ML模型420以预测选定目标信道的增益。ML模型420可以是包括来自例如使用方法600生成的特征列表等特征列表的主要效应的线性模型。包括40个主要效应的线性模型的实例为其中在给定信道负载(或者称为输入组合)的情况下,包括对应于目标信道的信道ch的所估计的预测增益。b的每一值包括系数,并且x的每一值包括主要效应。
在步骤710处,对应于目标信道和相邻端口的主要效应可放置在排序后的特征列表中。对应于目标端口的特征可包括对应于与相同于目标端口的信道相关联的输入端口的特征。相邻端口可包括与输入端口相邻的一个或多个端口。对应于其它输入端口的特征可放置在未排序特征列表中。线性模型中目标端口的输入端口的系数和相邻输入端口的系数可设置成预定值。例如,在以上给定的实例线性模型中,系数bch-1、bch和bch+1可设置成值‘1’。在此实例中,其它系数b可设置成值‘0’。
可创建排序后的特征列表。对应于目标端口的主要效应和对应于相邻输入端口的主要效应可放置在排序后的特征列表的顶部处。例如,xch-1、xch和xch+1可放置在排序后的特征列表中。域知识可用于确定哪些主要效应放置在排序后的特征列表中。任何特征或特征的组合可放置在排序后的特征列表中。
在步骤715处,可确定线性模型的残差值。可通过从目标端口的所测量的增益中减去排序后的特征列表中的特征的值来计算残差值。用于确定残差值的公式的实例为ych-(bch-1xch-1+bchxch+bch+1xch+1)。
在步骤720处,可确定未排序特征列表中的特征。所确定的特征可包括与在步骤715处所确定的残差值最相关的特征。在步骤725处,可将在步骤720处所确定的特征从未排序特征列表移动到排序后的特征列表。在步骤720处所确定的特征可添加为排序后的特征列表中的排名最低的特征。
在步骤730处,可作出关于是否已对所有特征进行排序的确定。如果没有特征保留在未排序特征列表中,则可在740处存储排序后的特征列表。排序后的特征列表可存储在数据库中和/或被传输。
如果在步骤730处特征保留在未排序特征列表中,则可在步骤720处确定与残差最相关的下一个特征。
图8是用于选择根据本申请公开的一个或多个说明性方面生成的ML模型的方法800的流程图。在一个或多个实施例中,方法800或其一个或多个步骤可由一个或多个计算设备或实体执行。例如,方法800的部分可由计算系统100的组件执行。方法800或其一个或多个步骤可体现在计算机可执行指令中,所述计算机可执行指令存储在例如非暂时性计算机可读介质等计算机可读介质中。可按次序省略或改变流程图中的一些步骤或步骤的部分。
在步骤805处,可使用标记的训练对象410的集合生成ML模型420。ML模型420可由此生成ML模型420。可生成模型列表,其中模型列表包括一个或多个特征,例如主要特征和额外特征。
在步骤810处,可计算ML模型420的性能量度。性能量度可基于ML模型420和/或训练对象410的集合。例如,BIC算法可用于确定性能量度。在此实例中,BIC算法的输出可包括性能量度。性能量度可指示ML模型420与训练对象410的拟合程度。可将ML模型420和/或性能量度存储在例如数据库或列表中。
在步骤815处,可将来自排序后的特征列表的特征添加到模型列表。所添加的特征可包括排序后的特征列表中的排名最高的特征。可将一个或多个排名最高的特征添加到模型列表。特征列表中的排名第一的特征可为对应于目标端口的特征。例如,如果选择与信道40相关联的目标端口,则在步骤815处模型列表可包括x40。对应于目标端口的特征可从排序后的特征列表中去除且放置在模型列表中。
在步骤820处,可使用训练对象410的集合训练ML模型420。训练对象可被扩增以包括来自特征列表的特征。可使用这些扩增后训练对象训练在步骤820处训练的ML模型420,并且模型可由此包括来自特征列表的特征。例如,如果模型列表包括特征x2和x7,则ML模型420可包括特征x2和x7。
在步骤825处,可确定对应于在步骤820处生成的ML模型420的性能量度。可以与在步骤810处计算性能量度相同或类似的方式计算性能量度。例如,如果在步骤810处使用BIC算法,则可在步骤825处使用BIC算法。可将ML模型420和/或性能量度存储在例如数据库或列表中。
在步骤830处,可检查上述排序后列表以确定上述排序后列表是否为空。如果上述排序后列表不为空,则方法800可进行到步骤815,其中来自上述排序后列表的排名最高的特征可移动到模型列表。训练对象可被扩增以包括排名最高的特征。接着在步骤820处,可生成且使用扩增后训练对象训练额外ML模型420。
如果在步骤830处排序后列表为空,则方法800可进行到步骤835。在步骤835处,可比较步骤810和825处针对每一ML模型420所计算的性能量度。可确定具有最佳性能量度的ML模型420。具有最佳性能量度的ML模型420可为最佳拟合(即,最佳预测)训练对象410的集合的ML模型420。
在步骤840处,可存储用于生成具有最佳性能量度的ML模型420的特征。可存储对应于最佳性能量度的ML模型420。特征和/或ML模型420可用于生成候选训练对象430和/或额外训练对象440。在给定用于生成ML模型420的特征的输入值时,ML模型420可用于预测目标端口的增益。
图9是根据本申请公开的一个或多个说明性方面的用于基于方差确定额外标记的训练对象的方法900的流程图。在一个或多个实施例中,方法900或其一个或多个步骤可由例如计算系统100等一个或多个计算系统执行。例如,方法900的部分可由计算系统100的组件执行。方法900或其一个或多个步骤可体现在计算机可执行指令中,所述计算机可执行指令存储在例如非暂时性计算机可读介质等计算机可读介质中。可按次序省略或改变流程图中的一些步骤或步骤的部分。
在步骤905处,可生成生成的ML模型420的方差模型。可基于生成的ML模型420的类型和/或标记的训练对象410的集合生成方差模型。标记的训练对象410的集合可能已用于训练产生生成的ML模型420的ML模型。
在步骤910处,可检查方差模型以确定其是否为闭合形式函数。如果方差模型不呈闭合形式,则方法900可在步骤915处继续。
在步骤915处,可估计最大方差。方差可包括生成的ML模型420的所预测增益值的方差。可针对一个或多个信道负载(例如,输入组合)使用方差模型计算方差。可生成方差模型中的特征的所有可能输入组合的集合,并且可针对所有输入组合的集合中的每一输入组合计算方差。可基于对应于每一输入组合的所预测增益值的所估计方差对输入组合进行排序。可存储具有最高估计方差的一个或多个输入组合。例如,可选择和/或存储五十个排名最高的输入组合。
如果在步骤910处确定方差模型呈闭合形式,则方法900可在步骤920处继续。在步骤920处,方法900可确定在步骤905处所创建的方差模型是否存在已知解。已知解可能提供方差模型的一个或多个最大值。换句话说,已知解可能标识具有最高方差的一个或多个信道负载(例如,输入组合)。
如果存在已知解,则可在步骤930处确定方差模型的一个或多个最大值。可存储对应于一个或多个最大值的信道负载(例如,输入组合)。可存储具有最高方差的多个信道负载(例如,输入组合)。例如,可确定和存储具有最高方差的五十个信道负载(例如,输入组合)。可在步骤930处使用下文以及图10和11中所描述的方法1000和1100来确定对应于最高方差的候选训练对象430。
如果方差模型不存在已知解,则可在步骤925处通过迭代信道负载(例如,输入组合)的集合来确定最大方差。信道负载(例如,输入组合)的集合可包括方差模型中使用的特征的所有可能信道负载(例如,输入组合)。针对信道负载(例如,输入组合)的集合中的每一信道负载(例如,输入组合),可使用方差模型计算方差。可基于所计算的方差对信道负载(例如,输入组合)进行排序,并且可选择和/或存储排名最高的信道负载(例如,输入组合)中的一个或多个。可在步骤925处使用下文以及图12和13中所描述的方法1200和1300来确定候选训练对象430。
图10是根据本申请公开的一个或多个说明性方面的用于对方差模型求解且从池中选择额外训练对象的方法1000的流程图。在一个或多个实施例中,方法1000或其一个或多个步骤可由一个或多个计算设备或实体执行。例如,方法1000的部分可由计算系统100的组件执行。方法1000或其一个或多个步骤可体现在计算机可执行指令中,所述计算机可执行指令存储在例如非暂时性计算机可读介质等计算机可读介质中。可按次序省略或改变流程图中的一些步骤或步骤的部分。
方法1000可用于基于方差模型确定额外训练对象440。在方差模型为具有已知解的闭合形式方差模型时可使用方法1000。
在步骤1005处,可基于标记的训练对象410的集合生成设计矩阵。设计矩阵可包括标记的训练对象410的全部或一部分。设计矩阵可包括标记的训练对象410中的每一个的一部分。设计矩阵的列可包括一个或多个特征,例如用于生成ML模型420的特征。设计矩阵的行可包括标记的训练对象410。设计矩阵的每一行可包括一个训练标记的对象410。
在步骤1010处,设计矩阵可用于确定具有最大方差的信道负载(例如,输入组合)。可确定和/或生成方差模型,例如具有已知解的闭合形式方差模型。可使用设计矩阵对方差模型求解,以确定具有最高方差的一个或多个信道负载(例如,输入组合)。针对设计矩阵的每一列,即针对每一选定特征,信道负载(例如,输入组合)可包括‘1’或‘-1’值。
可使用sign(emin)确定最大方差,其中emin为对应于XTX的最小特征值的特征向量,并且其中X为设计矩阵。特征向量emin可包括具有最大方差的信道负载(例如,输入组合)。
在步骤1015处,可搜索候选训练对象430的池以获取满足在步骤1010处所确定的信道负载(例如,输入组合)的训练对象。候选训练对象430的池可包括一个或多个训练对象,所述一个或多个训练对象已被标记(例如,包括候选训练对象430的信道负载(例如,输入组合)的所测量的增益值)但尚未用于进一步训练生成的ML模型420在步骤1010处所确定的信道负载(例如,输入组合)可包括候选训练对象430的特征的子集。例如,候选训练对象430可包括四十个不同特征的值,而信道负载(例如,输入组合)可包括那些特征中的五个特征的值。在步骤1015处,可搜索候选训练对象430的池以获取与所确定的信道负载(例如,输入组合)中的特征的子集匹配的候选训练对象430。不在所确定的信道负载(例如,输入组合)中的其余特征的值可为‘-1’和‘1’的任何组合。
如果在步骤1020处未找到与信道负载(例如,输入组合)匹配的准确候选训练对象430,则可在步骤1025处确定候选训练对象430的池中的下一个具有最高方差的候选训练对象430。可确定下一个具有最高方差的信道负载(例如,输入组合),并且可搜索候选训练对象430的未标记池以获取匹配的候选训练对象430。如果搜索不成功,则可确定具有第三高方差的输入组合,并且可重复此过程直到找到候选训练对象430为止。
在找到候选训练对象430之后,在步骤1020或步骤1025处,可接收对应于候选训练对象430的增益。可请求对应于候选训练对象430的信道负载(例如,输入组合)的增益。例如,可查询存储信道负载(例如,输入组合)的增益值的数据库以获取对应于候选训练对象430的信道负载(例如,输入组合)的增益。增益可为所测量的增益,例如在给定候选训练对象430的信道负载(例如,输入组合)情况下,放大器设备210的输出端口的所测量的增益。可将候选训练对象430传输到用户或用于测量目标端口(例如,信道)的增益的设备。在给定候选训练对象430的信道负载(例如,输入组合)的情况下,操作员或设备可接着测量目标输出端口(例如,信道)的增益。
在步骤1035处,对应于候选训练对象430的额外训练对象440可为额外标记的训练对象,所述额外标记的训练对象添加到标记的训练对象410的集合以产生标记的训练对象410的更新后集合。可从候选训练对象430的池中去除候选训练对象430并将其添加到标记的训练对象410的集合。额外训练对象440可包括候选训练对象430的信道负载(例如,输入组合)和目标输出端口(例如,信道)的所测量的增益。除标记的训练对象410的集合中的其它标记的训练对象之外,额外标记的训练对象可用于进一步训练目标输出端口(例如,目标信道)的ML模型420。
图11是根据本申请公开的一个或多个说明性方面的用于对方差模型求解且生成额外训练对象的方法1100的流程图。在一个或多个实施例中,方法1100或其一个或多个步骤可由一个或多个计算设备或实体执行。例如,方法1100的部分可由计算设备100的组件执行。方法1100或其一个或多个步骤可体现在计算机可执行指令中,所述计算机可执行指令存储在例如非暂时性计算机可读介质等计算机可读介质中。可按次序省略或改变流程图中的一些步骤或步骤的部分。
方法1100可用于基于方差模型确定额外训练对象440。在方差模型为具有已知解的闭合形式方差模型时可使用方法1100。
在步骤1105处,可基于标记的训练对象410的集合生成设计矩阵。在步骤1110处,设计矩阵可用于确定具有最大方差的一个或多个信道负载(或输入组合)。在步骤1105和1110处执行的动作可类似于上文分别关于步骤1005和1010所描述的那些动作。
在步骤1115处,可生成未标记候选训练对象430。相比于图10,在未标记候选训练对象选自未标记候选训练对象430的未标记池的情况下,任何可能的信道负载(例如,输入组合)可供用于在步骤1115处生成的未标记候选训练对象430。可通过随机选择未包括在信道负载(例如,输入组合)中的其余特征的值来生成未标记候选训练对象430。例如,如果在步骤1110处所确定的信道负载(例如,输入组合)具有七个特征的值,但生成的ML模型420对应于四十个信道的放大器210的信道,则其余三十三个信道的值可随机选择且在未标记候选训练对象430中使用。其余特征的值可全部设置成‘-1’,可全部设置成‘1’,可随机选择或可以其它方式确定。可通过组合针对其它目标端口(例如,目标信道)生成的未标记候选训练对象来确定其余特征的值。
在步骤1120处,可接收对应于未标记候选训练对象430的增益。在步骤1120处执行的动作可类似于上文关于步骤1030所描述的那些动作。例如,可将未标记候选训练对象430显示给用户,并且用户可基于未标记候选训练对象430配置放大器设备210,并且测量一个或多个输出端口的增益。
在步骤1125处,对应于未标记候选训练对象430的额外训练对象440可被标记且添加到标记的训练对象410的集合。额外训练对象440可包括未标记候选训练对象430的信道负载(例如,输入组合)且可标记有目标端口(例如,目标信道)的所测量的增益以生成标记的额外训练对象。除标记的训练对象410的集合中的其它标记的训练对象之外,额外标记的训练对象可用于针对目标端口(例如,目标信道)进一步训练生成的ML模型420。
图12是根据本申请公开的一个或多个说明性方面的用于迭代地确定最大方差且从池中选择额外训练对象的方法1200的流程图。在一个或多个实施例中,方法1200或其一个或多个步骤可由一个或多个计算设备或实体执行。例如,方法1200的部分可由计算设备100的组件执行。方法1200或其一个或多个步骤可体现在计算机可执行指令中,所述计算机可执行指令存储在例如非暂时性计算机可读介质等计算机可读介质中。可按次序省略或改变流程图中的一些步骤或步骤的部分。
方法1200可用于基于方差模型确定额外训练对象440。在方差模型为不具有已知解的闭合形式方差模型时可使用方法1200。
在步骤1205处,可基于标记的训练对象410的集合创建设计矩阵。在步骤1205处执行的动作可类似于上文关于步骤1005所描述的那些动作。
在步骤1210处,可确定设计矩阵中的主要效应的所有可能的信道负载(例如,输入组合)。可生成方差模型中的主要效应的所有可能的信道负载(例如,输入组合)的集合。针对设计矩阵中的主要效应中的每一个,每一信道负载(例如,输入组合)可包括‘1’或‘-1’值。
在步骤1215处,可确定使方差最大化的一个或多个信道负载(例如,输入组合)。可确定和/或接收对应于设计矩阵的方差模型。可将每一信道负载(或输入组合)应用到方差模型,并且可输出对应于每一信道负载(例如,输入组合)的方差。可存储每一信道负载(例如,输入组合)的方差。接着可基于方差对每一信道负载(例如,输入组合)进行排序,以确定具有最高方差的一个或多个信道负载(例如,输入组合)。方差可计算为x T(XTX)-1 x,其中X为设计矩阵,并且每一信道负载(例如,输入组合)为x。
在步骤1220处,可搜索未标记候选训练对象430的未标记池以获取与在步骤1215处确定的信道负载(例如,输入组合)匹配的未标记候选训练对象。在步骤1225处,方法1200可确定在未标记池中是否找到准确的未标记候选训练对象430。如果未找到匹配的未标记候选训练对象430,则可在步骤1230处确定未标记池中具有最高方差的未标记候选训练对象430。
在步骤1225或步骤1230处已确定未标记候选训练对象430之后,可在步骤1235处使用生成的ML模型420预测对应于未标记候选训练对象430的信道负载(例如,输入组合)的增益。在步骤1240处,包括候选训练对象430的信道负载(例如,输入组合)的额外训练对象440可标记有目标端口的所测量的增益,并且标记的额外训练对象可添加到标记的训练对象410的集合。在步骤1220-40处执行的动作可类似于上文关于步骤1015-35所描述的动作。
图13是根据本申请公开的一个或多个说明性方面的用于迭代地确定最大方差且生成额外训练对象的方法1300的流程图。在一个或多个实施例中,方法1300或其一个或多个步骤可由一个或多个计算设备或实体执行。例如,方法1300可由供计算设备100的处理器执行的软件的例程或子例程执行。方法1300或其一个或多个步骤可体现在计算机可执行指令中,所述计算机可执行指令存储在例如非暂时性计算机可读介质等计算机可读介质中。可按次序省略或改变流程图中的一些步骤或步骤的部分。
方法1300可用于基于方差模型确定额外训练对象440。在方差模型为不具有已知解的闭合形式方差模型时可使用方法1300。
在步骤1305处,可基于标记的训练对象410的集合创建设计矩阵。在步骤1305处执行的动作可类似于上文关于步骤1005所描述的那些动作。在步骤1310处,可确定设计矩阵中的主要效应的所有可能的信道负载(例如,输入组合)。在步骤1215处,可确定使方差最大化的信道负载(例如,输入组合)。在步骤1310和1315处执行的动作可类似于上文分别关于步骤1210和1215所描述的那些动作。
在步骤1320处,可通过随机选择未包括在信道负载(例如,输入组合)中的其余特征的值来生成候选训练对象430。相比于图12,在未标记候选训练对象选自未标记候选训练对象430的未标记池的情况下,任何可能的信道负载(例如,输入组合)可供用于在步骤1320处生成的候选训练对象430。在步骤1320处执行的动作可类似于上文关于步骤1115所描述的那些动作。在步骤1325处,可接收对应于未标记候选训练对象430的信道负载(例如,输入组合)的增益。在步骤1325处执行的动作可类似于上文关于步骤1030所描述的那些动作。在步骤1330处,对应于未标记候选训练对象430的额外训练对象440可被标记且添加到标记的训练对象410的集合以产生标记的训练对象410的更新后集合。在步骤1330处执行的动作可类似于上文关于步骤1125所描述的那些动作。
图14是根据本申请公开的一个或多个说明性方面的用于迭代地确定最大经验方差且从未标记候选训练对象的池中选择额外训练对象440的方法1400的流程图。在一个或多个实施例中,方法1400或其一个或多个步骤可由一个或多个计算设备或实体执行。例如,方法1400的部分可由计算系统100的组件执行。方法1400或其一个或多个步骤可体现在计算机可执行指令中,所述计算机可执行指令存储在例如非暂时性计算机可读介质等计算机可读介质中。可按次序省略或改变流程图中的一些步骤或步骤的部分。
方法1400可用于基于所估计方差确定额外训练对象440。可在估计方差时使用方法1400。
在步骤1405处,可基于标记的训练对象410的集合创建设计矩阵。在步骤1405处执行的动作可类似于上文关于步骤1005所描述的那些动作。在步骤1410处,可确定设计矩阵中的主要效应的所有可能的信道负载(例如,输入组合)。在步骤1410处执行的动作可类似于上文关于步骤1210所描述的那些动作。
在步骤1415处,可确定具有最高所估计方差的信道负载(例如,输入组合)。可将在步骤1410处确定的可能信道负载(例如,输入组合)中的每一个输入到方差模型,并且可针对可能信道负载(例如,输入组合)中的每一个确定所估计方差。可基于其所估计方差对信道负载(例如,输入组合)进行排序,并且可选择排名最高的信道负载(例如,输入组合)中的一个或多个。
方差模型可包括目标端口(例如,目标信道)的一个或多个生成的ML模型420,例如一个或多个树。为了计算信道负载(或输入组合)的所估计方差,可将信道负载(例如,输入组合)输入到生成的ML模型420中的每一个。生成的ML模型420可各自输出输入组合的目标端口(例如,目标信道)的所估计或所预测增益。可基于这些所计算的增益值估计方差。具有相对宽的增益值范围的信道负载(例如,输入组合)可具有比所有所计算的增益值均非常类似的信道负载(或输入组合)更高的所估计方差。
在步骤1420处,可搜索候选训练对象430的未标记池以获取与在步骤1415处确定的信道负载(例如,输入组合)匹配的未标记候选训练对象。在步骤1425处,方法1400可确定在未标记池中是否找到准确的未标记候选训练对象430。如果未找到匹配的未标记候选训练对象430,则可在步骤1430处确定未标记池中具有最高方差的未标记候选训练对象430。
在步骤1425或步骤1430处已确定未标记候选训练对象430之后,可在步骤1435处接收对应于未标记候选训练对象430的增益。在步骤1440处,包括未标记候选训练对象430的信道负载(例如,输入组合)的额外训练对象440可标记有目标端口的所测量的增益以生成额外标记的训练对象,并且额外标记的训练对象可添加到标记的训练对象410的集合以产生标记的训练对象410的更新后集合。在步骤1420-40处执行的动作可类似于上文关于步骤1015-35所描述的动作。
图15是根据本申请公开的一个或多个说明性方面的用于迭代地确定最大经验方差且生成额外训练对象的方法1500的流程图。在一个或多个实施例中,方法1500或其一个或多个步骤可由一个或多个计算系统执行。例如,方法1500的部分可由计算系统100执行。方法1500或其一个或多个步骤可体现在计算机可执行指令中,所述计算机可执行指令存储在例如非暂时性计算机可读介质等计算机可读介质中。可按次序省略或改变流程图中的一些步骤或步骤的部分。
方法1500可用于基于生成的ML模型的预测的所估计方差来确定额外训练对象440。
在步骤1505处,可基于标记的训练对象410的集合创建设计矩阵。在步骤1505处执行的动作可类似于上文关于步骤1005所描述的那些动作。在步骤1510处,可确定设计矩阵中的主要效应的所有可能的输入组合。在步骤1510处执行的动作可类似于上文关于步骤1210所描述的那些动作。在步骤1515处,可确定使所估计方差最大化的信道负载(例如,输入组合)。在步骤1515处执行的动作可类似于上文关于步骤1415所描述的那些动作。
在步骤1520处,可通过随机选择未包括在信道负载(例如,输入组合)中的其余特征的值来生成未标记候选训练对象430。相比于图14,在候选训练对象选自候选训练对象430的未标记池的情况下,任何可能的信道负载(例如,输入组合)可供用于在步骤1520处生成的未标记候选训练对象430。在步骤1520处执行的动作可类似于上文关于步骤1115所描述的那些动作。在步骤1525处,可接收目标信道的增益,其中通过测量目标信道的输入信号强度和输出信号强度来确定目标信道的增益。在步骤1525处执行的动作可类似于上文关于步骤1030所描述的那些动作。在步骤1530处,包括未标记候选训练对象430的信道负载(例如,输入组合)的额外训练对象440可标记有目标信道的增益值以生成额外标记的训练对象,并且额外标记的训练对象可添加到标记的训练对象410的集合。在步骤1530处执行的动作可类似于上文关于步骤1125所描述的那些动作。
图16是根据本申请公开的一个或多个说明性方面的用于生成多信道放大器的每一信道的模型的方法1600的流程图。在一个或多个实施例中,方法1600或其一个或多个步骤可由一个或多个计算系统执行。例如,方法1600的部分可由计算系统100的处理单元执行。方法1600或其一个或多个步骤可体现在计算机可执行指令中,所述计算机可执行指令存储在例如非暂时性计算机可读介质等计算机可读介质中。可按次序省略或改变流程图中的一些步骤或步骤的部分。
在步骤1605处,可制造放大器210。可在制造设施中(例如,在生产线上)制造放大器210。可针对放大器210收集标记的训练对象410的初始集合。可通过将各种信号输入到放大器210的输入端口且测量放大器210的一个或多个输出端口上的所得增益来收集标记的训练对象410的集合。在收集标记的训练对象410时,可针对放大器210的所有输出端口测量所得增益。
在步骤1610处,可生成用于放大器210的第一目标信道的ML模型420。生成的ML模型420可对放大器210的单个信道的增益建模。生成的ML模型420可包括线性模型、二次模型、基于树的集合模型和例如神经网络、树等任何其它类型的ML模型420。在放大器210在制造设施处时,例如当放大器210在生产线上时,可生成ML模型420。可在测试设施处生成ML模型420,所述测试设施可在与制造设施相同或不同的位置处。可使用上文所描述的方法500的步骤505-536来生成ML模型420。
在步骤1615处,可确定是否已针对放大器设备210的每一输出端口(例如,信道)生成了ML模型420。在一些情况下,可使用所要信道的列表,并且确定可为是否已针对对应于所要信道的输出端口中的每一个生成了ML模型420。如果存在待为其生成ML模型420的更多输出端口(例如,信道),则可在步骤1620处生成用于下一个输出端口(例如,信道)的ML模型420。此过程可重复直到已针对放大器设备210的每一输出端口(例如,信道)或放大器设备210的所要信道中的每一个生成ML模型420为止。
每当针对相同放大器设备210的输出端口(例如,信道)生成ML模型420,标记的训练对象410的集合可增加大小,因为额外训练对象440被标记且添加到标记的训练对象410的集合,由此更新标记的训练对象410的集合。标记的训练对象410的集合的大小增加可针对每一连续输出端口(例如,信道)提高ML模型的精确度和/或效率。换句话说,当生成更多ML模型420时,用于生成每一ML模型420的时间量可比用于生成先前生成的ML模型420的时间量减少。
在步骤1625处,可将生成的ML模型420中的每一个存储在例如数据库中。生成的ML模型420可与放大器设备210相关联。生成的ML模型420可与放大器设备210的序列号一起存储。ML模型420可加载到放大器设备210的存储单元。可将生成的ML模型存储在与放大器设备210相关联的存储设备上。
图17是根据本申请公开的一个或多个说明性方面的用于确定待激活的额外信道的方法1700的流程图。在一个或多个实施例中,方法1700或其一个或多个步骤可由一个或多个计算系统执行。例如,方法1700的部分可由计算系统100的处理单元执行。软件包括存储在例如非暂时性计算机可读介质等计算机可读介质中的n计算机可执行指令。可按次序省略或改变流程图中的一些步骤或步骤的部分。
在步骤1705处,可接收激活一个或多个额外信道和/或去活放大器设备210的一个或多个信道的请求。例如,技术员可在一个位置处安装设备,并且可请求将新安装的设备连接到放大器设备210的输出端口225-1--225-40。在另一实例中,可不再使用服务,并且可去活对应于所述信道的输入和/或输出端口。
在步骤1710处,可确定放大器设备210的当前信道负载。当前信道负载可指示哪些信道和/或端口为活动的和哪些信道和/或端口为非活动的。例如,信道负载可指示输出端口225-1--225-40中的哪些连接到缆线,和/或输入端口220-1--220-40中的哪些为活动的。可通过查询数据库来确定信道负载,其中数据库可包括网络配置信息。可由例如技术员等用户确定信道负载。可通过查询放大器设备210来确定信道负载。可通过监测网络活动性来确定信道负载。
在步骤1715处,可检索放大器设备210的每一信道的增益的生成的ML模型420。可从数据库检索生成的ML模型420。例如技术员等用户可输入放大器设备210的序列号和/或其它标识信息以检索生成的ML模型420。
在步骤1720处,生成的ML模型420可用于确定待激活或去活的一个或多个额外信道。在步骤1710处确定的当前信道负载可与生成的ML模型420中的一个或多个一起使用以确定待激活的额外信道。可选择额外信道以使信道负载中的当前活动信道的增益的任何改变最小化。可基于使具有现有活动信号的信道上的信号功率的差异最小化而选择信道。
图18是根据本申请公开的一个或多个说明性方面的用于确定光信噪比的方法1800的流程图。在一个或多个实施例中,方法1800或其一个或多个步骤可由一个或多个计算系统执行。例如,方法1800可由计算系统100的处理单元执行。方法1800或其一个或多个步骤可体现在计算机可执行指令中,所述计算机可执行指令存储在例如非暂时性计算机可读介质等计算机可读介质中。可按次序省略或改变流程图中的一些步骤或步骤的部分。
在步骤1805处,可接收放大器210的一个或多个标识符和/或放大器位置。放大器210和放大器位置可对应于链路,例如用于数据传输的链路。链路可包括光纤连接。针对每一放大器210,可接收放大器210的标识符和/或放大器210的位置。放大器210的标识符可包括序列号和/或任何其它标识信息。放大器210的位置可包括距链路上的其它对象的一个或多个距离,例如距其它放大器210的距离。例如可通过在链路上传输数据来测量放大器210的位置。
在步骤1810处,可接收链路的信道负载的指示。信道负载可指示链路上的一个或多个活动信道。在步骤1815处,可检索链路上的每一个放大器210中的每一信道的生成的ML模型。在步骤1810和1815处执行的动作可类似于上文关于步骤1710和1715所描述的那些动作。
在步骤1820处,可针对链路对例如光信噪比(optical signal-to-noise ratio,OSNR)等所预测信噪比(Signal-to-Noise Ratio,SNR)进行预测。可使用链路上的每一放大器210的每一信道的信道负载和生成的ML模型预测OSNR。可针对链路的一个或多个信道确定OSNR。可针对链路的每一信道单独地计算OSNR。
尽管上文描述了示例实施例,但取决于特定结果或应用,可以任何所要方式组合、划分、省略、重新布置、修改或扩增各种特征和步骤。本文中的各种元件已描述为“A和/或B”,其意在表示以下中的任一个:“A或B”、“A和B”、“A中的一个或多个和B中的一个或多个”。本领域的技术人员将容易地想到各种更改、修改和改进。如通过本申请公开显而易见的此类更改、修改和改进意图为本说明书的一部分(尽管本文中未明确陈述),并且意图在本申请公开的范围内。因此,前文描述仅是示例性的,而不是限制性的。本专利仅受到如所附权利要求书和其等效物中所限定的内容的限制。
Claims (24)
1.一种方法,其特征在于,包括:
使用标记的训练对象的集合和机器学习(ML,machine learning)算法训练ML模型以生成用于预测与放大器设备的多个信道中的目标信道相关联的增益的ML模型,所述标记的训练对象的集合中的每一标记的训练对象包括所述放大器设备的信道负载的指示,和所述目标信道的增益的指示;
接收多个未标记训练对象,每一未标记训练对象包括所述放大器设备的信道负载的指示;
从所述未标记训练对象确定额外标记的训练对象以用于进一步训练所述生成的ML模型,所述确定包括:
基于所述生成的ML模型的类型和所述未标记训练对象的集合确定方差模型;
基于所述方差模型的最大值从所述多个未标记训练对象选择候选训练对象;
基于由所述候选训练对象指示的所述信道负载接收所述目标信道的所测量的增益值;
基于所述候选训练对象和所述增益值生成所述额外标记的训练对象;
将所述额外标记的训练对象添加到所述标记的训练对象的集合;以及
使用包括所述额外标记的训练对象的所述标记的训练对象的集合进一步训练所述生成的ML模型。
2.根据权利要求1所述的方法,其特征在于,训练包括:
接收所述标记的训练对象的集合;
确定对应于所述标记的训练对象的集合的特征列表;
对所述特征列表中的所述特征进行排序,由此生成排序后的特征列表;
扩增所述标记的训练对象以包括在所述排序后的特征列表中的特征的子集;以及
使用所述扩增后的标记的训练对象和所述ML算法训练所述ML模型以生成所述ML模型。
3.根据权利要求2所述的方法,其特征在于,所述特征的子集包括所述排序后列表中的若干排名最高的特征。
4.根据权利要求3所述的方法,其特征在于,还包括通过确定使所述生成的ML模型的性能量度最优的所述排序后的特征列表中的特征组合来确定所述若干排名最高的特征。
5.根据权利要求1至4中任一权利要求所述的方法,其特征在于,所述生成的ML模型包括线性模型。
6.根据权利要求5所述的方法,其特征在于,还包括确定所述方差模型的闭合形式解,并且基于所述方差模型的所述闭合形式解确定所述方差模型的所述最大值。
7.根据权利要求1至6中任一权利要求所述的方法,其特征在于,还包括:
确定对应于所述候选训练对象的多个所预测增益值;以及
确定所述多个所预测增益值的方差。
8.根据权利要求7所述的方法,其特征在于,从所述多个未标记训练对象选择所述候选训练对象包括:基于所述多个所预测增益值的所述方差选择所述候选训练对象。
9.根据权利要求1至8中任一权利要求所述的方法,其特征在于,还包括:显示所述候选训练对象。
10.根据权利要求9所述的方法,其特征在于,还包括:显示所述目标信道的指示。
11.一种生成用于训练放大器设备的多个信道中目标信道的增益的生成的机器学习(ML,machine learning)模型的额外训练对象的方法,所述生成的ML模型已使用标记的训练对象的集合进行学习,所述训练对象的集合中的每一标记的训练对象包括所述放大器设备的信道负载的指示,和所述目标信道的增益的指示,其特征在于,所述方法包括:
接收多个未标记训练对象,每一未标记训练对象包括所述放大器设备的信道负载的指示;
从所述未标记训练对象确定额外标记的训练对象以用于进一步训练所述生成的ML模型,所述确定包括:
基于所述生成的ML模型的类型和所述未标记训练对象的集合确定方差模型;
确定用于所述方差模型的多个信道负载;
使用所述方差模型和所述多个信道负载确定多个方差参数,其中所述多个方差参数中的每一方差参数对应于所述多个信道负载中的一个信道负载;
基于所述多个方差参数选择所述多个信道负载的一个信道负载;
基于所述选定信道负载从所述多个未标记训练对象确定候选训练对象;
基于由所述候选训练对象指示的信道负载接收所述目标信道的所测量的增益值;
基于所述候选训练对象和所述增益值生成额外标记的训练对象;以及
使用包括所述额外标记的训练对象的所述标记的训练对象的集合进一步训练所述生成的ML模型。
12.根据权利要求11所述的方法,其特征在于,训练包括:
接收所述标记的训练对象的集合;
确定对应于所述标记的训练对象的集合的特征列表;
去除所述特征列表中的一个或多个特征;
通过对所述特征列表中的所述特征进行排序生成排序后的特征列表;以及
使用所述排序后列表中的一定数量的排名最高的特征生成所述ML模型。
13.根据权利要求12所述的方法,其特征在于,还包括通过确定使所述生成的ML模型的性能量度最优的所述排序后的特征列表中的特征的组合确定所述排名最高的特征的所述数量。
14.根据权利要求11至13中任一权利要求所述的方法,其特征在于,所述候选训练对象指示使所述方差模型最大化的信道负载。
15.根据权利要求11至14中任一权利要求所述的方法,其特征在于,还包括将所述候选训练对象发送到用于测量所述放大器设备的一个或多个增益值的设备。
16.根据权利要求11至15中任一权利要求所述的方法,其特征在于,所述生成的ML模型包括二次模型。
17.根据权利要求11至16中任一权利要求所述的方法,其特征在于,所述生成的ML模型包括一个或多个树模型。
18.根据权利要求11至17中任一权利要求所述的方法,其特征在于,确定所述多个信道负载包括确定用于所述方差模型的所有可能的信道负载的集合。
19.根据权利要求11至18中任一权利要求所述的方法,其特征在于,确定所述多个方差参数包括针对所述多个信道负载中的每一信道负载:
确定对应于所述相应信道负载的多个所预测增益值;以及
确定所述多个所预测增益值的经验方差。
20.根据权利要求19所述的方法,其特征在于,确定所述多个所预测增益值包括确定多个树中的每一个树的输出。
21.一种计算系统,其特征在于,包括:
处理器;以及
存储计算机可读指令的存储器,所述计算机可读指令在由所述处理器执行时使得所述处理器执行权利要求1至10中任一权利要求所述的方法。
22.一种存储指令的计算机可读介质,其特征在于,所述指令在由计算系统执行时使得所述计算系统执行权利要求1至10中任一权利要求所述的方法。
23.一种计算系统,其特征在于,包括:
处理器;以及
存储计算机可读指令的存储器,所述计算机可读指令在由所述处理器执行时使得所述处理器执行权利要求11至20中任一权利要求所述的方法。
24.一种存储指令的计算机可读介质,其特征在于,所述指令在由计算系统执行时使得所述计算系统执行权利要求11至20中任一权利要求所述的方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862764784P | 2018-08-16 | 2018-08-16 | |
US62/764,784 | 2018-08-16 | ||
US16/540,883 US11615342B2 (en) | 2018-08-16 | 2019-08-14 | Systems and methods for generating amplifier gain models using active learning |
US16/540,883 | 2019-08-14 | ||
PCT/CN2019/100716 WO2020035015A1 (en) | 2018-08-16 | 2019-08-15 | Systems and methods for selecting training objects |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112585894A true CN112585894A (zh) | 2021-03-30 |
CN112585894B CN112585894B (zh) | 2022-10-18 |
Family
ID=69522946
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980054185.5A Active CN112585894B (zh) | 2018-08-16 | 2019-08-15 | 用于选择训练对象的系统和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11615342B2 (zh) |
CN (1) | CN112585894B (zh) |
WO (1) | WO2020035015A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210269846A1 (en) * | 2020-02-27 | 2021-09-02 | Bruker Daltonik Gmbh | Method for the spectrometric characterization of microorganisms |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020204219A1 (ko) * | 2019-04-01 | 2020-10-08 | 엘지전자 주식회사 | 인공지능을 이용한 사물 인식 학습에서 아웃라이어를 분류하는 방법 및 분류장치와 로봇 |
US11551150B2 (en) * | 2020-07-06 | 2023-01-10 | Google Llc | Training and/or utilizing a model for predicting measures reflecting both quality and popularity of content |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101635600A (zh) * | 2009-08-26 | 2010-01-27 | 东南大学 | 认知无线电中基于干扰温度的信道与功率联合分配方法 |
US20100172423A1 (en) * | 2009-01-08 | 2010-07-08 | Qualcomm Incorporated | Preamble sequences for wireless communication systems |
US20120269519A1 (en) * | 2011-04-21 | 2012-10-25 | Futurewei Technologies, Inc. | Apparatus and Method to Calculate a Noise Figure of an Optical Amplifier for Wavelength Channels in a Partial-Fill Scenario to Account for Channel Loading |
CN105451326A (zh) * | 2014-06-24 | 2016-03-30 | 华为技术有限公司 | 一种定位方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110166161B (zh) | 2015-06-02 | 2020-10-20 | 麻省理工学院 | 在波分复用光通信网络中用于业务减损的自动评估的方法 |
US20180005136A1 (en) * | 2016-07-01 | 2018-01-04 | Yi Gai | Machine learning in adversarial environments |
CN106448684A (zh) | 2016-11-16 | 2017-02-22 | 北京大学深圳研究生院 | 基于深度置信网络特征矢量的信道鲁棒声纹识别系统 |
-
2019
- 2019-08-14 US US16/540,883 patent/US11615342B2/en active Active
- 2019-08-15 CN CN201980054185.5A patent/CN112585894B/zh active Active
- 2019-08-15 WO PCT/CN2019/100716 patent/WO2020035015A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100172423A1 (en) * | 2009-01-08 | 2010-07-08 | Qualcomm Incorporated | Preamble sequences for wireless communication systems |
CN101635600A (zh) * | 2009-08-26 | 2010-01-27 | 东南大学 | 认知无线电中基于干扰温度的信道与功率联合分配方法 |
US20120269519A1 (en) * | 2011-04-21 | 2012-10-25 | Futurewei Technologies, Inc. | Apparatus and Method to Calculate a Noise Figure of an Optical Amplifier for Wavelength Channels in a Partial-Fill Scenario to Account for Channel Loading |
CN105451326A (zh) * | 2014-06-24 | 2016-03-30 | 华为技术有限公司 | 一种定位方法及装置 |
Non-Patent Citations (2)
Title |
---|
CARMELO J.A. BASTOS-FILHO,ERICK DE A. BARBOZA: "Estimating the spectral gain and the noise figure of EDFA using artificial neural networks", 《 2017 19TH INTERNATIONAL CONFERENCE ON TRANSPARENT OPTICAL NETWORKS (ICTON)》 * |
JIMING LI: "Active learning for hyperspectral image classification with a stacked autoencoders based neural network", 《2015 7TH WORKSHOP ON HYPERSPECTRAL IMAGE AND SIGNAL PROCESSING: EVOLUTION IN REMOTE SENSING (WHISPERS)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210269846A1 (en) * | 2020-02-27 | 2021-09-02 | Bruker Daltonik Gmbh | Method for the spectrometric characterization of microorganisms |
US11661620B2 (en) * | 2020-02-27 | 2023-05-30 | Bruker Daltonik Gmbh | Method for the spectrometric characterization of microorganisms |
Also Published As
Publication number | Publication date |
---|---|
US11615342B2 (en) | 2023-03-28 |
US20200057961A1 (en) | 2020-02-20 |
WO2020035015A1 (en) | 2020-02-20 |
CN112585894B (zh) | 2022-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112585894B (zh) | 用于选择训练对象的系统和方法 | |
US11092460B2 (en) | Sensor control support apparatus, sensor control support method and non-transitory computer readable medium | |
CN111526119B (zh) | 异常流量检测方法、装置、电子设备和计算机可读介质 | |
CN109902190B (zh) | 图像检索模型优化方法、检索方法、装置、系统及介质 | |
KR20140030838A (ko) | 군집 분석 지원 시스템 및 방법과, 이를 지원하는 장치 | |
JP7294369B2 (ja) | 情報処理に用いられる方法、装置、電子機器及びプログラム | |
CN111260243A (zh) | 风险评估方法、装置、设备及计算机可读存储介质 | |
US10248462B2 (en) | Management server which constructs a request load model for an object system, load estimation method thereof and storage medium for storing program | |
CN114116829A (zh) | 异常数据分析方法、异常数据分析系统和存储介质 | |
CN114219562A (zh) | 模型的训练方法、企业信用评估方法和装置、设备、介质 | |
CN116306806A (zh) | 故障诊断模型确定方法、装置及非易失性存储介质 | |
KR101806669B1 (ko) | 특허 분석을 이용한 기술이전 예측정보 제공 방법 및 장치 | |
CN112733897B (zh) | 确定多维样本数据的异常原因的方法和设备 | |
KR101064256B1 (ko) | 최대 개념강도 인지기법을 이용한 최적의 데이터베이스 선택장치 및 그 방법 | |
CN117763316A (zh) | 一种基于机器学习的高维数据降维方法及降维系统 | |
US9411031B2 (en) | Hypothesis-driven classification of materials using nuclear magnetic resonance relaxometry | |
CN111967168A (zh) | 一种加速退化试验方案优化设计方法 | |
CN117595927A (zh) | 用于光网络的运行状态监控系统及其方法 | |
JP5167596B2 (ja) | データセット選択装置および実験計画システム | |
CN104572820A (zh) | 模型的生成方法及装置、重要度获取方法及装置 | |
US20230214668A1 (en) | Hyperparameter adjustment device, non-transitory recording medium in which hyperparameter adjustment program is recorded, and hyperparameter adjustment program | |
CN114268365A (zh) | 一种基于可视化技术的通信光缆智能预警方法及系统 | |
CN114742199A (zh) | 一种基于注意力机制的神经网络宏架构搜索方法及系统 | |
US11410749B2 (en) | Stable genes in comparative transcriptomics | |
US20240061867A1 (en) | Cluster-based dataset evolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |