WO2019219052A1

WO2019219052A1 - 一种预测方法、训练方法、装置及计算机存储介质

Info

Publication number: WO2019219052A1
Application number: PCT/CN2019/087185
Authority: WO
Inventors: 周敏; 杨文森; 张建锋
Original assignee: 华为技术有限公司
Priority date: 2018-05-18
Filing date: 2019-05-16
Publication date: 2019-11-21
Also published as: CN109905271B; CN109905271A; US20200410376A1

Abstract

本申请提供了一种预测方法、训练方法、装置以及计算机可读存储介质。该方法包括：获取目标设备的待预测第一指标数据；将所述待预测第一指标数据输入第一预测模型，得到所述目标设备的预测第二指标数据；将所述预测第二指标数据输入第二预测模型，得到所述目标设备的预测结果，其中，所述第二预测模型根据第二训练数据训练得到，所述第二训练数据包括所述目标设备的第二指标数据和第三指标数据。本申请提供的技术方案可以更准确地体现第一指标数据与第三指标数据之间的函数关系，可以根据待预测的第一指标数据准确地预测出目标设备的预测结果(预测第三指标数据)。

Description

一种预测方法、训练方法、装置及计算机存储介质

本申请要求于2018年05月18日提交中国专利局、申请号为201810481548.0、申请名称为“一种预测方法、训练方法、装置及计算机存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信领域，并且更具体地，涉及一种预测方法、训练方法、装置及计算机存储介。

背景技术

在训练模型过程中，可以获取到设备的训练数据，并可以根据训练数据得到预测模型。在预测过程中，可以根据得到的预测模型以及实际情况对未来的一些情况进行预测。

现有技术中，在训练模型过程中，可以直接获取一个网络设备的两个训练数据，可以根据该两个训练数据，直接训练得到预测模型。

例如，通信网络运营商在开展业务活动之前，需要根据使用某种服务的数(也可以称为用户数指标)的假设值预测通信设备未来的资源占用率(也可以称为资源占用率指标)，可以对可能过载的网络设备提前进行扩容，从而保障系统平稳运行。

现有技术中，直接训练目标设备的用户数指标与资源占用率指标之间的函数关系，并根据假设的用户数以及用户数与资源占用率之间的函数关系预测资源占用率。由于在数据样本采集周期内，目标设备的用户数指标有可能缺乏大幅度变化，使得样本数据缺乏多样性。用户数与资源占用率之间的关系不会在数据中充分体现，很难得到准确的用户数与资源占用率之间的函数关系，并且预测出的该函数关系很难实现大范围的外推预测。

因此，在采集到的一个训练数据样本多样性不足的情况下，如何通过两个训练数据得到准确的预测模型，可以根据其中一个预测数据准确预测出另一个数据成为亟需要解决的问题。

发明内容

本申请提供一种预测方法、训练方法、装置及计算机存储介质，可以通过两个训练数据得到准确的预测模型，可以根据其中一个预测数据准确预测出另一个数据。

第一方面，提供了一种预测方法，包括：获取目标设备的待预测第一指标数据；将所述待预测第一指标数据输入第一预测模型，得到所述目标设备的预测第二指标数据；将所述预测第二指标数据输入第二预测模型，得到所述目标设备的预测结果。

本申请实施例中第一预测模型可以根据第一训练数据训练得到，第二预测模型根据第二训练数据训练得到。

应理解，第一训练数据可以包括多个设备的第一指标数据和第二指标数据，也就是说，第一指标数据和第二指标数据可以来自包括目标设备在内的多个网络设备。

本申请实施例中对第一指标数据和第二指标数据不做具体限定，可以是任意的两个指标数据。

可选地，在一些实施例中，第一指标数据可以是用户数，第二指标数据可以是话务量。

第二训练数据可以包括目标设备的第二指标数据和第三指标数据。

应理解，第一指标数据和第二指标数据可以来自目标设备。

本申请实施例中对第二指标数据和第三指标数据不做具体限定，可以是任意的两个指标数据。

可选地，在一些实施例中，第二指标数据可以是话务量，第三指标数据可以是资源占用率。

本申请对提及的目标设备和/或网络设备(也可以称为通信网络设备)不做具体限定，可以包括但不限于网络中的任意子网、网元、网元的子设备(例如单板)、网元的功能单元(例如模块)。例如，通信网络设备可以包括但不限于网络适配器、网络收发器、网络媒体转换设备、多路复用器、中断器、集线器、网桥、交换机、路由器、网关等。

下面以第一指标数据为用户数，第二指标数据为话务量为例，进行详细说明。

应理解，本申请实施例中用户数指标可以表示为在网络通信设备中使用某种服务的用户数。

应理解，同一个网络通信设备可以有多个用户数指标。作为一个示例，用户数可以表示为“2G+3G”用户数指标。作为另一个示例，用户数还可以表示为“4G用户数”指标。作为另一个示例，用户数还可以表示为“注册用户数”指标。本申请实施例对此不做具体限定。

本申请实施例中话务量指标可以理解为在网络通信设备中使用某种服务的数量。

应理解，同一个设备可以有多个话务量指标。作为一个示例，通信网络设备中的话务量可以用于表示网络设备的“总占用话务量”指标。作为另一个示例，通信网络设备中的话务量还可以用于表示网络设备的“Gi接口包数”指标。作为另一个示例，通信网络设备中的话务量还可以用于表示网络设备的“SGi用户面报文包数”指标。本申请实施例对此不做具体限定。

应理解，本申请实施例中资源占用率指标可以表示为在网络通信设备中的资源消耗量。

应理解，不同的设备可以具有不同的资源占用率指标。作为一个示例，资源占用率指标可以表示为“CPU峰值占用率”。作为另一个示例，资源占用率指标还可以表示为“内存占用率”。作为另一个示例，资源占用率还可以表示为“License占用量”。本申请实施例对此不做具体限定。

本申请实施例中多个网络设备可以是与目标设备的用户数指标和话务量指标的指标关系具有一致性的网络设备。

应理解，其他网络设备的用户数指标和话务量指标的指标关系与目标设备的用户数指标和话务量指标的指标关系相同或具有大致相同的变化趋势。

如果其他网络设备的用户数指标和话务量指标的指标关系与目标设备中用户数指标和话务量指标的指标关系具有一致性，可以采集多个网络设备(包括目标设备以及其他网络设备)的用户数指标和话务量指标，可以扩大用户数指标的数据样本多样性。由于其他网络设备的用户数指标和话务量指标的指标关系与目标设备的用户数指标和话务量指标的指标关系相同或具有大致相同的变化趋势，通过对采集到的多个网络设备(包括目标设备以及其他网络设备)的用户数指标和话务量指标进行训练，得到的预测模型可以适用于目标设备以及其他网络设备。用训练出来的预测模型可以准确的预测目标设备及其他网络设备的预测资源占用率。

例如，网元ATS0和网元ATS1属于同类型的通信设备。通信设备可以具有层级分解结构，网元ATS0可以分解为模块VCU0、VCU1、DPU0(网元ATS0的业务可以负载在其下的三个模块(VCU0、VCU1、DPU0)之间平均分配)。网元ATS1可以分解为模块VCU0、VCU1、DPU0(网元ATS1的业务也可以负载在其下的三个模块(VCU0、VCU1、DPU0)之间平均分配)。用户数指标(例如，“注册用户数”指标)可以对应到网元(ATS0、ATS1)，话务量指标(例如，“总占用话务量”指标)可以对应到网元(ATS0、ATS1)，资源占用率指标(例如，“CPU峰值占用率”指标)可以对应到网元(ATS0、ATS1)下设的模块(VCU0、VCU1、DPU0、)。网元ATS0和网元ATS1属于同类型的通信设备，“注册用户数”指标和“总占用话务量”指标均对应到网元，并且“注册用户数”指标和“总占用话务量”指标的定义在网元ATS0和网元ATS1上相同。因此，“注册用户数”指标和“总占用话务量”指标之间的相关关系在网元ATS0和网元ATS1之间具有跨设备组合通用性(网元ATS0和网元ATS1上的用户数指标和话务量指标的指标关系具有一致性)。

上述技术方案中，可以通过采集到的多个设备(包括目标设备与其他网络设备)的第一训练数据训练出第一预测模型，可以扩大第一指标数据的历史数据样本的多样性。再可以通过采集到的目标设备的第二训练数据训练出第二预测模型，从而可以更准确地体现第一指标数据与第二指标数据之间的函数关系。

结合第一方面，在一种可能的实现方式中，该方法还包括：获取第一训练数据；根据第一训练数据得到第一预测模型。

应理解，第一预测模型用于根据目标设备的第一指标数据预测目标设备的第二指标数据。

本申请实施例对通过第一训练数据训练出第一预测模型的实现方式不做具体限定，作为一个示例，可以是对第一训练数据回归分析，得到第一预测模型。作为另一个示例，还可以是对第一训练数据进行过原点回归分析，得到第一预测模型。

本申请实施例对通过第二训练数据训练出第二预测模型的实现方式不做具体限定，作为一个示例，可以是对第二训练数据回归分析，得到第二预测模型。作为另一个示例，还可以是对第二训练数据进行过原点回归分析，得到第二预测模型。作为另一个示例，还可以是对第二训练数据进行分位数回归分析，得到第二预测模型。

本申请实施例中也可以对第一指标数据、第二指标数据、第三指标数据(例如，用户数指标、话务量指标、资源占用率指标)进行回归分析之前，还可以对指标数据进行特征处理。作为一个示例，可以对指标数据进行标准化(standardization)处理。作为另一个示例，可以对指标数据进行归一化(normalization)处理。作为另一个示例，可以对指标数据进行降维处理。

上述技术方案中，可以将待预测第一指标数据输入第一预测模型，可以得到目标设备的预测结果。

结合第一方面，在一种可能的实现方式中，对该第一训练数据中的第一指标数据进行主成分分析，得到主成分分析模型；根据该主成分分析模型，对该第一训练数据进行降维处理，得到降维后的第三训练数据；根据该第三训练数据，训练该第一预测模型。

本申请实施中对第一训练数据进行降维的方式有多种，本申请对比不做具体限定。作为一个示例，可以对第一训练数据进行主成分分析。例如，可以对第一训练数据中的第二指标数据进行主成分分析，得到主成分分析模型，可以根据该主成分分析模型对第一训练数据进行降维处理，可以得到降维后的第三训练数据。作为另一个示例，可以对第一训练数据进行低方差滤波(low variance filter)处理，可以实现对第一训练数据进行降维处理。作为另一个示例，可以对第一训练数据进行反向特征消除(backward feature elimination)处理，可以实现对第一训练数据进行降维处理。

应理解，主成分分析的处理方法可以一种统计方法，可以通过正交变换将一组可能存在相关性的第二指标数据转换为一组线性不相关的变量，转换后的变量可以称为第二指标数据主成分。

上述技术方案中，对第一指标数据进行降维，避免通过对第二训练数据进行回归分析可能遇到的由第一指标数据的共线性导致的计算困难。

结合第一方面，在一种可能的实现方式中，通过对该第一训练数据进行回归分析，得到该第一预测模型。

本申请实施例中，根据第一训练数据训练得到第一预测模型的方法有很多，本申请不做具体限定。作为一个示例，可以通过对第一训练数据进行回归分析，得到该第一预测模型。作为另一个示例，还可以通过对第一训练数据进行过原点的回归分析，得到该第一预测模型。

上述技术方案中，可以通过回归分析的方法训练得到第一预测模型，可以准确地计量各个因素之间的相关程度和拟合程度的高低，计算简单，易于实现。

结合第一方面，在一种可能的实现方式中，在该第一训练数据的多样性满足预设条件的情况下，对该第一训练数据进行过原点回归分析；在该第一训练数据的多样性不满足该预设条件的情况下，对该第一训练数据进行不过原点回归分析。

本申请实施例中，可以对第一指标数据的数据多样性进行判断。如果第一训练数据中的第一指标数据的数据多样性不满足预设条件，可以对第一训练数据中的第一指标数据标和第二指标数据进行约束过坐标原点的回归分析。如果第一训练数据中的第一指标数据的数据多样性满足预设条件，可以对第一训练数据中的第一指标数据和第二指标数据不约束过坐标原点的回归分析。

应理解，上文提及的预设条件可以表示一个预设阈值，如果第一指标数据的数据多样性达到预设阈值，可以用于表示该第一指标数据的数据多样性满足预设条件。

应理解，对数据进行过坐标原点的回归分析以及不过坐标原点的回归分析均可以看作是对数据进行回归分析。约束过坐标原点的回归分析得到的模型可以没有常数项，不约束过坐标原点的回归分析得到的模型可以有常数项。

还应理解，在一些实施例中，可以在对第一指标数据进行多样性判断之前，可以对第一指标数据进行一些特征处理，本申请对此不做具体限定。作为一个示例，可以对第一指标数据进行归一化(Normalization)处理，可以对经过该归一化处理的第一指标数据进行数据多样性的判断。作为另一个示例，可以对第一指标数据进行标准化(Standardization)处理，可以对经过该标准化处理的第一指标数据进行数据多样性的判断。作为另一个示例，可以对第一指标数据进行降维处理，可以对经过该降维处理的第一指标数据进行数据多样性的判断。

上述技术方案中，可以在第一训练数据中的第一指标数据的多样性不满足预设条件的情况下，对第一指标数据和第二指标数据进行约束过坐标原点的回归分析，避免可能由数据集的第一指标数据的多样性不足导致的模型外推不准确。可以在第一训练数据中的第一指标数据的多样性满足预设条件的情况下，使用不约束过原点的回归分析，充分利用数据集提供的信息，得到更准确的模型。

结合第一方面，在一种可能的实现方式中，通过对该第二训练数据进行回归分析，得到该第二预测模型。

本申请实施例中，可以对第二训练数据进行过原点的回归分析，训练得到第二预测模型。还可以对第二训练数据进行不做坐标原点的回归分析，训练得到第二预测模型。本申请对此不做具体限定。

具体对第二训练数据进行回归分析的方法，可参见对第一训练数据中的描述，此处不再赘述。

结合第一方面，在一种可能的实现方式中，通过对该第二训练数据进行分位数回归分析，得到该第二预测模型。

应理解，分位数回归分析可以是回归分析的方法之一。分位数可以是将随机变量的分布范围按照概率的比例做分割的数值点，分位数回归可以预测指标的上界或下界。作为一个示例，分位数参数为0.1可以用于表示将变量的分布范围分为2个部分，变量小于0.1分位数的概率可以为0.1。例如，要预测的是第三指标数据的下界，可以选择低分位数0.1或0.2。

本申请实施例中对通过第二训练数据中的第二指标数据和第三指标数据做分位数回归的方法不做具体限定。作为一个示例，可以使用线性分位数回归方法。作为另一个示例，还可以使用非线性分位数回归方法。

上述技术方案中，第二预测模型用分位数回归分析建立，能预测第三指标数据上界和下界而不是平均值，满足应用需求对边界值的关切。

第二方面，提供了一种训练方法，包括：获取第一训练数据和第二训练数据；根据第一训练数据得到第一预测模型；根据第二训练数据得到第二预测模型。

可选地，在一些实施例中，第一指标数据可以是第一指标数据，第二指标数据可以是第二指标数据，第三指标数据可以是第三指标数据。

结合第二方面，在一种可能的实现方式中，获取目标设备的待预测第一指标数据；将所述待预测第一指标数据输入第一预测模型，得到所述目标设备的预测第二指标数据；将所述预测第二指标数据输入所述第二预测模型，得到所述目标设备的预测结果。

训练第一预测模型具体的方法，请参考第一方面中对预测方法的描述，此处不再赘述。

结合第二方面，在一种可能的实现方式中，对该第一训练数据中的第二指标数据指标进行主成分分析，得到主成分分析模型；根据该主成分分析模型，对该第一训练数据进行降维处理，得到降维后的第三训练数据；根据该第三训练数据，训练该第一预测模型。

结合第二方面，在一种可能的实现方式中，通过对该第一训练数据进行回归分析，得到该第一预测模型。

结合第二方面，在一种可能的实现方式中，在该第一训练数据的多样性满足预设条件的情况下，对该第一训练数据进行过原点回归分析；在该第一训练数据的多样性不满足该预设条件的情况下，对该第一训练数据进行不过原点回归分析。

结合第二方面，在一种可能的实现方式中，获取该目标设备的第二训练数据；根据该第二训练数据，训练该目标设备的第二预测模型。

本申请实施例中，可以在根据预测第一指标数据指标，通过第一预测模型和第二预测模型得到预测第三指标数据之前，还可以根据获取的第二训练数据，训练得到第二预测模型。

训练第二预测模型具体的方法，请参考第一方面中对训练方法的描述，此处不再赘述。

结合第二方面，在一种可能的实现方式中，通过对该第二训练数据进行回归分析，得到该第二预测模型。

结合第二方面，在一种可能的实现方式中，通过对该第二训练数据进行分位数回归分析，得到该第二预测模型。

结合第二方面，在一种可能的实现方式中，目标设备与其他网络设备之间的第一指标数据指标和第二指标数据指标的指标关系具有一致性。

也就是说，如果多个设备之间的第一指标数据和第二指标数据的指标关系具有一致性，可以获取多个设备的第一指标数据和第二指标数据，通过训练该多个设备的第一指标数据和第二指标数据得到的预测模型可以适用于多个设备。

第三方面，提供了一种对租户数量指标和资源消耗量指标之间的数值关系建模的方法，包括：在描述租户数量指标的特征和服务使用量指标的特征之间的数值关系的第一数据集上，做第一回归分析得到第一预测模型；在描述服务使用量指标的特征和资源消耗量指标的特征之间的数值关系的第二数据集上，做第二回归分析得到第二预测模型。所述第一数据集中的任一数据样本，都对应某个设备组合在某一条件下的所述租户数量指标的取值和所述服务使用量指标的取值。所述设备组合中某些设备的所述租户数量指标的原值，被直接作为所述数据样本的所述租户数量指标的特征，或被输入第一特征处理，由第一特征处理的输出值作为所述数据样本的所述租户数量指标的特征。所述设备组合中某些设备的所述服务使用量指标的原值，被直接作为所述数据样本的所述服务使用量指标的特征，或被输入第二特征处理，由第二特征处理的输出值作为所述数据样本的所述服务使用量指标的特征。

第一数据集中，由全体数据样本分别对应的设备组合组成的集合是非单一的：所述数据集中存在至少一对数据样本，所述租户数量指标中存在至少一个，这对数据样本的这个租户数量指标的原值取自不同的两个设备。

所述第二数据集中的任一数据样本，都对应某个设备组合在某一条件下的所述服务使用量指标的取值和所述资源消耗量指标的取值。所述设备组合中某些设备的所述服务使用量指标的原值，被直接作为所述数据样本的所述服务使用量指标的特征，或被输入第二特征处理，由第二特征处理的输出值作为所述数据样本的所述服务使用量指标的特征。所述设备组合中某些设备的所述资源消耗量指标的原值，被直接作为所述数据样本的所述资源消耗量指标的特征，或被输入第三特征处理，由第三特征处理的输出值作为所述数据样本的所述资源消耗量指标的特征。

结合第三方面，在一种可能的实现方式中，所述服务使用量指标，是根据所述租户数量指标和所述服务使用量指标确的。

结合第三方面，在一种可能的实现方式中，所述第一数据集中，提供所述租户数量指标的原值的设备与提供所述服务使用量指标的原值的设备之间的负载分配关系，在不同数据样本之间是相似的。

结合第三方面，在一种可能的实现方式中，所述第二特征处理，在输入值为全零或近似全零的情况下，输出值为全零或近似全零。

结合第三方面，在一种可能的实现方式中，所述第二特征处理包括第一平移变换，所述第一平移变换由如下步骤确定：

对全零或近似全零的输入值进行所述第二特征处理中的部分处理，根据所述部分处理的输出值确定第一平移变换。

结合第三方面，在一种可能的实现方式中，所述第一回归分析包括：在所述第一数据集上对所述租户数量指标的特征和所述服务使用量指标的特征做约束过原点的回归分析。

结合第三方面，在一种可能的实现方式中，当所述第一数据集上的所述租户数量指标的多样性不满足预设条件时，在所述第一数据集上对所述租户数量指标的特征和所述服务使用量指标的特征做约束过原点的回归分析，得到第一预测模型。

结合第三方面，在一种可能的实现方式中，所述第一回归分析包括：当所述第一数据集上的所述租户数量指标的多样性满足预设条件时，在所述第一数据集上对所述租户数量指标的特征和所述服务使用量指标的特征做不约束过原点的回归分析，得到第一预测模型。

结合第三方面，在一种可能的实现方式中，所述第二特征处理包括：在所述第一数据集上对设备的某些服务使用量指标进行第一降维映射处理，得到所述服务使用量指标的特征。

结合第三方面，在一种可能的实现方式中，所述第一降维映射处理包括：通过服务使用量主成分模型进行特征处理，所述服务使用量主成分模型由如下步骤确定：

在描述某些服务使用量指标的特征之间的数值关系的第三数据集上，做主成分分析，得到服务使用量主成分模型；

结合第三方面，在一种可能的实现方式中，所述第一特征处理，在输入值为全零或近似全零的情况下，输出值为全零或近似全零。

结合第三方面，在一种可能的实现方式中，所述第一特征处理包括第二平移变换，第一平移变换由如下步骤确定：对全零或近似全零输入值进行所述第一特征处理中的部分处理，根据所述部分处理输出值确定第二平移变换。

结合第三方面，在一种可能的实现方式中，所述第一特征处理包括：在所述第一数据集上对设备的某些租户数量指标进行第二降维映射处理，得到所述租户数量指标的特征。

结合第三方面，在一种可能的实现方式中，所述第二降维映射处理包括：通过租户数量主成分模型进行特征处理，租户数量主成分模型由如下步骤确定：

在描述租户数量指标的特征之间的数值关系的第四数据集上，做主成分分析，得到描述租户数量指标主成分模型；

结合第三方面，在一种可能的实现方式中，所述第二回归分析，包括：在所述第二数据集上对所述服务使用量指标的特征和所述资源消耗量指标的特征做分位数回归分析，得到第二预测模型。

第四方面，提供了一种对租户数量指标和资源消耗量指标之间的数值关系建模的装置，包括：

第一处理模块，用于在描述租户数量指标的特征和服务使用量指标的特征之间的数值关系的第一数据集上，做第一回归分析得到第一预测模型；

第二处理模块，用于在描述服务使用量指标的特征和资源消耗量指标的特征之间的数值关系的第二数据集上，做第二回归分析得到第二预测模型。所述第一数据集中的任一数据样本，都对应某个设备组合在某一条件下的所述租户数量指标的取值和所述服务使用量指标的取值。所述设备组合中某些设备的所述租户数量指标的原值，被直接作为所述数据样本的所述租户数量指标的特征，或被输入第一特征处理，由第一特征处理的输出值作为所述数据样本的所述租户数量指标的特征。所述设备组合中某些设备的所述服务使用量指标的原值，被直接作为所述数据样本的所述服务使用量指标的特征，或被输入第二特征处理，由第二特征处理的输出值作为所述数据样本的所述服务使用量指标的特征。

其中，第一数据集中，由全体数据样本分别对应的设备组合组成的集合是非单一的：所述数据集中存在至少一对数据样本，所述租户数量指标中存在至少一个，这对数据样本的这个租户数量指标的原值取自不同的两个设备。

结合第四方面，在一种可能的实现方式中，所述服务使用量指标，是根据所述租户数量指标和所述服务使用量指标确的。

结合第四方面，在一种可能的实现方式中，所述第一数据集中，提供所述租户数量指标的原值的设备与提供所述服务使用量指标的原值的设备之间的负载分配关系，在不同数据样本之间是相似的。

结合第四方面，在一种可能的实现方式中，所述第二特征处理，在输入值为全零或近似全零的情况下，输出值为全零或近似全零。

结合第四方面，在一种可能的实现方式中，所述第二特征处理包括第一平移变换，所述第一平移变换由如下步骤确定：

结合第四方面，在一种可能的实现方式中，所述第一回归分析包括：在所述第一数据集上对所述租户数量指标的特征和所述服务使用量指标的特征做约束过原点的回归分析。

结合第四方面，在一种可能的实现方式中，所述第一处理模块具体用于：当所述第一数据集上的所述租户数量指标的多样性不满足预设条件时，在所述第一数据集上对所述租户数量指标的特征和所述服务使用量指标的特征做约束过原点的回归分析，得到第一预测模型。

结合第四方面，在一种可能的实现方式中，所述第一回归分析包括：当所述第一数据集上的所述租户数量指标的多样性满足预设条件时，在所述第一数据集上对所述租户数量指标的特征和所述服务使用量指标的特征做不约束过原点的回归分析，得到第一预测模型。

结合第四方面，在一种可能的实现方式中，所述第二特征处理包括：在所述第一数据集上对设备的某些服务使用量指标进行第一降维映射处理，得到所述服务使用量指标的特征。

结合第四方面，在一种可能的实现方式中，所述第一降维映射处理包括：通过服务使用量主成分模型进行特征处理，所述服务使用量主成分模型由如下步骤确定：

结合第四方面，在一种可能的实现方式中，所述第一特征处理，在输入值为全零或近似全零的情况下，输出值为全零或近似全零。

结合第四方面，在一种可能的实现方式中，所述第一特征处理包括第二平移变换，第一平移变换由如下步骤确定：对全零或近似全零输入值进行所述第一特征处理中的部分处理，根据所述部分处理输出值确定第二平移变换。

结合第四方面，在一种可能的实现方式中，所述第一特征处理包括：在所述第一数据集上对设备的某些租户数量指标进行第二降维映射处理，得到所述租户数量指标的特征。

结合第四方面，在一种可能的实现方式中，所述第二降维映射处理包括：通过租户数量主成分模型进行特征处理，租户数量主成分模型由如下步骤确定：

结合第四方面，在一种可能的实现方式中，所述第二回归分析，包括：在所述第二数据集上对所述服务使用量指标的特征和所述资源消耗量指标的特征做分位数回归分析，得到第二预测模型。

第五方面，提供了一种训练装置，包括：第一获取模块，用于获取第一训练数据和第二训练数据；第一训练模块，用于根据所述第一训练数据训练得到第一预测模型；第二训练模块，用于根据所述第二训练数据训练得到第二预测模型。

应理解，该第一训练数据包括多个网络设备(例如，该目标设备以及其他网络设备)的第一指标数据指标和第二指标数据指标，该第二训练数据包括该目标设备的第二指标数据指标和第三指标数据指标。

第一预测模型用于指示该目标设备的第一指标数据指标与第二指标数据指标的映射关系。该第二预测模型用于指示该目标设备的第二指标数据指标与第三指标数据指标的映射关系。

结合第五方面，在一种可能的实现方式中，该装置还包括：第二获取模块，用于获取所述目标设备的待预测第一指标数据；第一确定模块，用于将所述待预测第一指标数据输入预测模型，得到所述目标设备的预测第二指标数据；第二确定模块，用于将所述预测第二指标数据输入所述第二预测模型，得到所述目标设备的预测结果。

应理解，预测模型包括所述第一预测模型和所述第二预测模型，所述第一预测模型根据所述第一训练数据训练得到，所述第二预测模型根据所述第二训练数据训练得到。

结合第五方面，在一种可能的实现方式中，该第一训练模块具体用于：对该第一训练数据中的第二指标数据指标进行主成分分析，得到主成分分析模型；根据该主成分分析模型，对该第一训练数据进行降维处理，得到降维后的第三训练数据；根据该第三训练数据，训练该第一预测模型。

结合第五方面，在一种可能的实现方式中，该第一训练模块具体用于：通过对该第一训练数据进行回归分析，得到该第一预测模型。

结合第五方面，在一种可能的实现方式中，该第一训练模块具体用于：在该第一训练数据的多样性满足预设条件的情况下，对该第一训练数据进行过原点回归分析；在该第一训练数据的多样性不满足该预设条件的情况下，对该第一训练数据进行不过原点回归分析。

结合第五方面，在一种可能的实现方式中，该第二训练模块具体用于：通过对该第二训练数据进行回归分析，得到该第二预测模型。

结合第五方面，在一种可能的实现方式中，该第二训练模块具体用于：通过对该第二训练数据进行分位数回归分析，得到该第二预测模型。

结合第五方面，在一种可能的实现方式中，该目标设备与其他网络设备的第一指标数据指标和第二指标数据指标的指标关系具有一致性。

第六方面，提供了一种预测装置，包括：第一获取模块，用于获取目标设备的待预测第一指标数据；第一确定模块，用于将所述待预测第一指标数据输入第一预测模型，得到所述目标设备的预测第二指标数据；第二确定模块，用于将所述预测第二指标数据输入第二预测模型，得到所述目标设备的预测结果。

应理解，所述第一预测模型根据第一训练数据训练得到，所述第二预测模型根据第二训练数据训练得到，所述第一训练数据包括多个设备的第一指标数据和第二指标数据，所述第二训练数据包括所述目标设备的第二指标数据和第三指标数据，所述多个设备包括所述目标设备。

结合第六方面，在一种可能的实现方式中，该装置还包括：第二获取模块，用于获取第一训练数据，第一训练模块，用于根据所述第一训练数据训练得到第一预测模型。

应理解，第一预测模型用于根据所述目标设备的第一指标数据预测所述目标设备的第二指标数据。

结合第六方面，在一种可能的实现方式中，该第一训练模块具体用于：对该第一训练数据中的第二指标数据指标进行主成分分析，得到主成分分析模型；根据该主成分分析模型，对该第一训练数据进行降维处理，得到降维后的第三训练数据；根据该第三训练数据，训练该第一预测模型。

结合第六方面，在一种可能的实现方式中，该第一训练模块具体用于：通过对该第一训练数据进行回归分析，得到该第一预测模型。

结合第六方面，在一种可能的实现方式中，该第一训练模块具体用于：在该第一训练数据的多样性满足预设条件的情况下，对该第一训练数据进行过原点回归分析；在该第一训练数据的多样性不满足该预设条件的情况下，对该第一训练数据进行不过原点回归分析。

结合第六方面，在一种可能的实现方式中，该装置还包括：第三获取模块，用于获取该目标设备的第二训练数据，该第二训练数据包括该目标设备的第二指标数据指标和第三指标数据指标；第二训练模块，用于根据该第二训练数据，训练该目标设备的第二预测模型，该第二预测模型用于指示该目标设备的第二指标数据指标与第三指标数据指标的映射关系。

结合第六方面，在一种可能的实现方式中，该第二训练模块具体用于：通过对该第二训练数据进行回归分析，得到该第二预测模型。

结合第六方面，在一种可能的实现方式中，该第二训练模块具体用于：通过对该第二训练数据进行分位数回归分析，得到该第二预测模型。

结合第六方面，在一种可能的实现方式中，该目标设备与其他网络设备之间的的第一指标数据和第二指标数据的指标关系具有一致性。

第七方面，提供了一种训练装置，包括存储器和处理器，所述存储器用于存储程序；所述处理器用于执行所述存储器中存储的程序，当所述程序被执行时，所述处理器用于执行第二方面或第二方面任意一种实现方式中的方法。

第八方面，提供了一种预测装置，包括存储器和处理器，所述存储器用于存储程序；所述处理器用于执行所述存储器中存储的程序，当所述程序被执行时，所述处理器用于执行第一方面或第一方面任意一种实现方式中的方法。

第九方面，提供了一种租户数量指标和资源消耗量指标之间的数值关系建模的装置，其特征在于，包括存储器和处理器，所述存储器用于存储程序；所述处理器用于执行所述存储器中存储的程序，当所述程序被执行时，所述处理器执行如执行第三方面或第三方面任意一种实现方式中的方法。

第十方面，提供了一种计算机可读存储介质，包括计算机指令，当所述计算机指令在所述训练装置上运行时，使得所述训练装置执行第二方面或第二方面任意一种实现方式所述的方法。

第十一方面，提供了一种计算机可读存储介质，包括计算机指令，当所述计算机指令在所述预测装置上运行时，使得所述预测装置用于执行第一方面或第一方面任意一种实现方式所述的方法。

第十二方面，提供了一种计算机可读存储介质，包括计算机指令，当所述计算机指令在所述租户数量指标和资源消耗量指标之间的数值关系建模的装置上运行时，使得所述预测装置用于执行第三方面或第三方面任意一种实现方式所述的方法。

第十三方面，提供了一种芯片，包括存储器和处理器，所述存储器用于存储程序；所述处理器用于执行所述存储器中存储的程序，当所述程序被执行时，所述处理器执行第一方面或第一方面任意一种实现方式所述的方法。

第十四方面，提供了一种芯片，包括存储器和处理器，所述存储器用于存储程序；所述处理器用于执行所述存储器中存储的程序，当所述程序被执行时，所述处理器执行第二方面或第二方面任意一种实现方式所述的方法。

第十五方面，提供了一种计算机程序产品，当该计算机程序产品在计算机上运行时，使得该计算机执行第一方面或第一方面任意一种实现方式所述的方法。

第十六方面，提供了一种计算机程序产品，当该计算机程序产品在计算机上运行时，使得该计算机执行第二方面或第二方面任意一种实现方式所述的方法。

附图说明

图1是本申请实施例提供的一种预测方法的示意性流程图。

图2是本申请实施例提供的一种可能的指标之间跨设备组合通用性场景的示意性流程图。

图3是本申请另一实施例提供的一种可能的指标之间跨设备组合通用性场景示意性流程图。

图4是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。

图5是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。

图6是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。

图7是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。

图8是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。

图9是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。

图10是本申请实施例提供的训练装置1000的示意性结构图。

图11是本申请实施例提供的预测装置1100的示意性结构图。

图12是本申请实施例提供的训练装置1200的示意性结构图。

图13是本申请实施例提供的预测装置1300的示意性结构图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。

本申请对根据第一指标数据以及预测模型预测第二指标数据的适用场景不做具体限定。可以应用于各种通信网络设备，也可以应用于各种计算机设备，例如，可以应用于数据运营中心的计算机设备。

本申请实施例提供一种预测方法，可以根据目标设备的待预测第一指标数据准确地预测出目标设备的预测结果(第三指标数据)。下面结合图1对本申请实施例进行详细描述。

图1是本申请实施例提供的一种预测方法的示意性流程图。图1的方法可以包括步骤110-130，下面分别对步骤110-130进行详细描述。

在步骤110中，获取目标设备的待预测第一指标数据。

本申请实施例中的目标设备也可以称为待建模设备。

本申请实施例对设备(也可以称为网络通信设备)的类型不做具体限定，可以是任意一种通信网络设备。例如，该设备可以是通用语音业务服务器(advanced telephony server，ATS)，又如，该设备还可以是统一分组网关(unified packet gateway，UGW)。

在步骤120中，将待预测的第一指标数据输入到第一预测模型，得到目标设备的预测第二指标数据。

本申请实施例对预测模型不做具体限定。作为一个示例，可以是一个预测模型。作为另一个示例，也可以是两个预测模型，例如，预测模型可以包括第一预测模型和第二预测模型。

应理解，所述第一预测模型根据第一训练数据训练得到，第二预测模型根据第二训练数据训练得到。

本申请实施例中第一训练数据可以包括多个设备的第一指标数据和第二指标数据。

应理解，第一指标数据和第二指标数据可以来自包括目标设备在内的多个网络设备。

本申请实施例中对第一指标数据和第二指标数据不做具体限定，可以是具有正相关性的两个指标数据，也可以是具有负相关的两个指标数据。

在步骤130中，将预测第二指标数据输入第二预测模型，得到目标设备的预测结果。

本申请实施例中第二预测模型可以根据第二训练数据训练得到，第二训练数据可以包括目标设备的第二指标数据和第三指标数据。

应理解，第二指标数据和第三指标数据可以来自目标设备，也可以来自包括目标设备在内的多个网络设备，本申请对此不做具体限定。

本申请实施例中，可以将第一预测模型输出的预测第二指标输入到第二预测模型，可以得到目标设备的预测结果，也就是第二预测模型输出的预测第三指标数据。

可选地，在一些实施例中，第一指标数据可以是用户数，第二指标数据可以是话务量，第三指标数据可以是资源占用率。

应理解，“话务量”指标可以与“用户数”指标(也可称为用户数)、用户通信的频繁程度、用户通信所占时长有关。如果单位时间内“用户数”指标越多，通信所占用的时间越长，此时“话务量”指标越大。

上文提及的多个设备之间的用户数指标和话务量指标的指标关系具有一致性，也就是说多个设备之间的用户数指标和话务量指标的指标关系相同或具有大致相同的变化趋势。

下面会结合图2至图3对多个设备的用户数指标和话务量指标的指标关系具有一致性进行详细描述，此处暂不详述。

本申请实施例中资源占用率指标可以表示为在网络通信设备中的资源消耗量。资源占用率可以是用户数对应的一定资源占用率。例如，一定数量的用户数对应CPU占用率为80％。

本申请实施例中，可以通过采集到的多个设备(包括目标设备与其他网络设备)的第一训练数据训练出第一预测模型，可以扩大第一指标数据的历史数据样本的多样性。再可以通过采集到的目标设备的第二训练数据训练出第二预测模型，从而可以更准确地体现第一指标数据与第二指标数据之间的函数关系。

可选地，在一些实施例中，还可以获取第一训练数据，根据第一训练数据训练得到第一预测模型。

可选地，在一些实施例中，还可以获取第二训练数据，根据第二训练数据训练得到第二预测模型。

本申请实施例中，第一预测模型可以用于用于根据所述目标设备的第一指标数据预测所述目标设备的第二指标数据。第二预测模型用于根据所述第一预测模型得到的所述目标设备的第二指标数据预测所述目标设备的第三指标数据。

下面以第一指标数据为用户数，第二指标数据为话务量，第三指标数据为资源占用率为例，进行详细说明。

可选地，在一些实施例中，第二预测模型也可称为“用户数-话务量”模型。

本申请实施例中可以对第一训练数据中的用户数指标和/或话务量指标直接进行训练，可以得到第一预测模型，还可以对用户数指标和/或话务量指标进行特征处理，并对特征处理之后的数据进行训练，得到第一预测模型。本申请对此不做具体限定。

应理解，对从设备采集到的指标(例如，用户数指标、话务量指标、资源占用率指标)经过特征处理，可以使经过特征处理之后的数据具备一定的数值特性，以便于数学工具的使用。例如某些维度在一定区间内，具有一定的均值、方差等等。例如，标准化(Standardization)和归一化(Normalization)都是对数据进行一定变换，是常用的特征处理手段。

对从设备采集到的指标(例如，用户数指标、话务量指标、资源占用率指标)经过特征处理，也可以提取指标中的某种信息以方便后续分析。例如，可以标识出数值的正负号。

本申请实施例中对用户数指标和/或话务量指标进行特征处理的具体实现方式有很多。作为一个示例，可以对用户数指标和/或话务量指标进行标准化(standardization)处理。作为另一个示例，还可以对用户数指标和/或话务量指标进行归一化(normalization)处理。作为另一个示例，还可以对用户数指标和/或话务量指标进行降维处理，例如，可以对用户数指标和/或话务量指标进行主成分分析。后面会结合具体的实施例进行详细描述，此处暂不详述。

本申请实施例对通过第一训练数据训练出第一预测模型的实现方式不做具体限定，作为一个示例，可以是对第一训练数据回归分析，得到第一预测模型。作为另一个示例，还可以是对第一训练数据进行过原点回归分析，得到第一预测模型。后面会结合具体的实施例进行详细描述，此处暂不详述。

本申请实施例中，第二预测模型可以用于表示目标设备的话务量指标和资源占用率指标之间的映射关系。

可选地，在一些实施例中，第二预测模型也可称为“话务量-资源占用率”模型。

本申请实施例中可以对第二训练数据中的话务量指标和/或资源占用率指标直接进行训练，可以得到第二预测模型，还可以对话务量指标和/或资源占用率指标进行特征处理，并对特征处理之后的数据进行训练，得到第二预测模型。本申请对此不做具体限定。

本申请实施例中对话务量指标和/或资源占用率指标进行特征处理的具体实现方式有很多。作为一个示例，可以对话务量指标和/或资源占用率指标进行标准化(standardization)处理。作为另一个示例，还可以对话务量指标和/或资源占用率指标进行归一化(normalization)处理。作为另一个示例，还可以对话务量指标和/或资源占用率指标进行降维处理，例如，可以对话务量指标和/或资源占用率指标进行主成分分析。后面会结合具体的实施例进行详细描述，此处暂不详述。

本申请实施例对通过第二训练数据训练出第二预测模型的实现方式不做具体限定，作为一个示例，可以是对第二训练数据回归分析，得到第二预测模型。作为另一个示例，还可以是对第二训练数据进行过原点回归分析，得到第二预测模型。后面会结合具体的实施例进行详细描述，此处暂不详述。

本申请实施例中，可以通过采集到的多个设备(包括目标设备与其他网络设备)的第一训练数据训练出第一预测模型，可以扩大用户数指标的历史数据样本的多样性。再可以通过采集到的目标设备的第二训练数据训练出第二预测模型，从而可以更准确地体现用户数指标与资源占用率指标之间的函数关系。

可选地，在一些实施例中，可以获取目标设备的预测用户数，可以根据该预测用户数，通过上文提及的第一预测模型以及第二预测模型，可以得到目标设备中预测用户数对应的预测资源占用率。

本申请实施例中，可以根据预测的用户数，可以得到网络设备(目标设备)准确的预测资源占用率。网络运营商可以在开展活动之前，可以获取到预测的用户数对应的网络设备的资源占用率，可以对会过载的网络设备进行提前扩容。

下面结合具体的例子，更加详细地描述本申请实施例提及的目标设备与所述其他网络设备的用户数指标和话务量指标的指标关系具有一致性的具体实现方式。应注意，下文的例子仅仅是为了帮助本领域技术人员理解本申请实施例，而非要将申请实施例限制于所示例的具体数值或具体场景。本领域技术人员根据文所给出的例子，显然可以进行各种等价的修改或变化，这样的修改和变化也落入本申请实施例的范围内。

应理解，图2-图3中的用户数对应于上文中的第一指标数据，话务量对应于上文中的第二指标数据，资源占用率对应于上文中的第三数据指标。

图2是本申请实施例提供的一种可能的指标之间跨设备组合通用性场景的示意性流程图。如图2所示，网元ATS0和网元ATS1属于同类型的通信设备。通信设备可以具有层级分解结构，网元ATS0可以分解为模块VCU0、VCU1、DPU0，网元ATS1可以分解为模块VCU0、VCU1、DPU0。

网元ATS可以是一种通用语音业务服务器，作为一个示例，网元ATS可以提供基本呼叫业务，例如，网元ATS可以向用户提供基本的语音呼叫、时频电话功能。作为另一个示例，网元ATS可以提供一些补充业务，例如，网元ATS可以提供显示类、限呼类、转移类、回叫类、会议类、提醒类等增强附加的系统功能。

网元ATS0的业务可以负载在其下的三个模块(VCU0、VCU1、DPU0)之间平均分配，网元ATS1的业务也可以负载在其下的三个模块(VCU0、VCU1、DPU0)之间平均分配。其中，调度处理单元(dispatch process unit，DPU)可以用于执行工程师组态的控制策略，可以实现数据采集、标度变换、报警限值检查、操作记录、顺序时间记录等功能。

参见图2，用户数指标(例如，“注册用户数”指标)可以对应到网元(ATS0、ATS1)，话务量指标(例如，“总占用话务量”指标)可以对应到网元(ATS0、ATS1)，资源占用率指标(例如，“CPU峰值占用率”指标)可以对应到网元(ATS0、ATS1)下设的模块(VCU0、VCU1、DPU0)。

网元ATS0和网元ATS1属于同类型的通信设备，“注册用户数”指标和“总占用话务量”指标均对应到网元，并且“注册用户数”指标和“总占用话务量”指标的定义在网元ATS0和网元ATS1上相同。因此，“注册用户数”指标和“总占用话务量”指标之间的相关关系在网元ATS0和网元ATS1之间具有跨设备组合通用性。也就是说，通过“注册用户数”指标和“总占用话务量”指标之间的相关关系训练出的模型既可以适用于网元ATS0，也可以同样适用于网元ATS1。例如，如果网元ATS0和网元ATS1上的“注册用户数”指标相同，网元ATS0和网元ATS1上的“总占用话务量”指标可以相同或近似相同。

应理解，图2所示的用户数指标(例如，“注册用户数”指标)以及话务量指标(例如，“总占用话务量”指标)可以来自目标设备(例如，网元ATS0)以及其他网络设备(例如，网元ATS1)。由于网元ATS0和网元ATS1上的“注册用户数”指标和“总占用话务量”指标之间的指标关系具有相同或大致相同的变化趋势，可以采集网元ATS0和网元ATS1上的用户数指标和话务量指标，可以扩大用户数指标的历史数据样本的多样性。

图3是本申请另一实施例提供的一种可能的指标之间跨设备组合通用性场景的示意性流程图。如图3所示，网元UGW0、UGW1、UGW2属于同类型的通信设备。通信设备可以具有层级分解结构，网元UGW0可以分解为模块SPU实例0、SPU实例1，网元UGW1可以分解为模块SPU实例0、SPU实例1，网元UGW2可以分解为模块SPU实例0、SPU实例1、SPU实例2。

网元UGW可以是一种统一分组网关，网元UGW0的业务可以负载在其下的模块SPU实例中。其中，服务处理单元(service process unit，SPUSPU)实例可以用于提供负载均衡、防火墙、等网络应用场景中的业务功能需求，其中，SPU提供的高效的负载均衡方案，可以解决信息科技(information technology，IT)系统中响应慢、应用时延过大、设备流量不均等问题，保证服务的可靠性、提高服务的响应速度、方便业务灵活扩展。

参见图3，网元UGW0的业务可以负载在其下的两个模块(SPU实例0、SPU实例1)之间平均分配，网元UGW1的业务可以负载在其下的两个模块(SPU实例0、SPU实例1)之间平均分配，网元UGW2的业务可以负载在其下的三个模块(SPU实例0、SPU实例1、SPU实例2)之间平均分配。

用户数指标(例如，“2G+3G用户数”指标、“4G用户数”指标)可以对应到网元(UGW0、UGW1、UGW2)，话务量指标(例如，“Gi接口包数”指标、“SGi接口包数”指标)可以对应到网元(UGW0、UGW1、UGW2)，话务量指标(例如，“GW接收用户面报文包数”指标)可以对应到SPU实例。

网元UGW0、UGW1、UGW2属于同类型的通信设备，“2G+3G用户数”指标、“4G用户数”指标、“Gi接口包数”指标以及“SGi接口包数”指标均对应到网元，并且“2G+3G用户数”指标、“4G用户数”指标、“Gi接口包数”指标以及“SGi接口包数”指标的定义在网元UGW0、UGW1、UGW2上相同。因此，“2G+3G用户数”指标、“4G用户数”指标、“Gi接口包数”指标以及“SGi接口包数”指标之间的相关关系在网元UGW0、UGW1、UGW2之间具有跨设备组合通用性。

由于“GW接收用户面报文包数”指标对应到网元其下的模块SPU实例中，如图3所示，网元UGW2的SPU实例数不同于网元UGW0和网元UGW1的实例数，可以导致业务负载在网元UGW2的SPU实例间的分解关系可以不同于网元UGW0和网元UGW1。因此，“2G+3G用户数”指标、“4G用户数”指标以及“GW接收用户面报文包数”指标之间的相关关系在网元UGW0和UGW1之间具有跨设备组合通用性，而在网元UGW0、UGW1、UGW2之间不具有跨设备组合通用性。

如图3所示，用户数指标(例如，“2G+3G用户数”指标、“4G用户数”指标)和话务量指标(例如，“Gi接口包数”指标、“SGi接口包数”指标、“GW接收用户面报文包数”指标)之间的相关关系可以在网元UGW0和UGW1之间具有跨设备组合通用性。也就是说，通过“2G+3G用户数”指标、“4G用户数”指标、“Gi接口包数”指标、“SGi接口包数”指标、“GW接收用户面报文包数”指标之间的相关关系训练出的模型可以适用于网元UGW0，也可以同样适用于网元UGW1。

应理解，用户数指标(例如，“2G+3G用户数”指标、“4G用户数”指标)和话务量指标(例如，“Gi接口包数”指标、“SGi接口包数”指标、“GW接收用户面报文包数”指标)之间的相关关系可以在网元UGW0和UGW1之间具有跨设备组合通用性。可以采集目标设备(例如，网元UGW0)以及其他网络设备(例如，网元UGW1)的用户数指标和话务量指标的数据，可以扩大用户数指标的历史数据样本的多样性。

可选地，在一些实施例中，可以通过对第一训练数据和/或第二训练数据进行回归分析，得到第一预测模型。

本申请实施例中，可以通过回归分析的方法训练得到第一预测模型和/或第二预测模型，可以准确地计量各个因素之间的相关程度和拟合程度的高低，计算简单，易于实现。

下面结合图4以通过对第一训练数据和/或第二训练数据进行回归分析，训练得到第一预测模型和/或第二预测模型为例，进行详细举例说明。

图4是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。图4包括步骤410-450，下面分别对步骤410-450进行详细描述。

下面以图3所示的训练场景为例对训练第一预测模型以及第二预测模型的流程进行详细描述。

应理解，图3所示的待建模设备可以对应到本申请实施例中的目标设备。

在步骤410中，根据待建模设备，确定待预测“资源占用率”指标、“用户数”指标、“话务量”指标。

如图3所示，根据待建模设备，确定待预测的用户数指标是UGW网元的“2G+3G用户数”指标和UGW网元的“4G用户数”指标。待预测的资源占用率指标是SPU实例的“CPU峰值占用率”指标。待预测的话务量指标是UGW网元的“Gi接口包数”指标、UGW网元的“SGi用户面报文包数”指标、SPU实例的“GW接收用户面报文包数”指标。

在步骤420中，根据“用户数”指标和“话务量”指标的相关关系的跨设备通用性，选择与待建模设备具有通用性的设备，得到设备组合列表1。根据设备组合列表1获取第一训练数据，包含“用户数”指标和“话务量”指标。

根据UGW0、UGW1、UGW2为同类型设备，UGW网元的“2G+3G用户数”指标、UGW网元的“4G用户数”指标和UGW网元的“Gi接口包数”指标、UGW网元的“SGi用户面报文包数”指标在3个设备的定义是一致的，而且都是对应到网元，可以判断这些指标之间的相关关系在3个设备UGW0、UGW1、UGW2之间具有跨设备组合通用性。但是SPU实例的“GW接收用户面报文包数”指标并不对应到UGW网元，而且因为UGW2的SPU实例数量不同于UW0和UGW1，可以导致业务负载在UGW2的SPU实例间的分解关系不同于UGW0和UGW1。因此UGW网元的“2G+3G用户数”指标、UGW网元的“4G用户数”指标和SPU实例的“GW接收用户面报文包数”指标在4个设备组合UGW0和SPU实例0、UGW0和SPU实例1、UGW1和SPU实例0、UGW1和SPU实例1之间具有跨设备组合通用性，也在3个设备组合UGW2和SPU实例0、UGW2和SPU实例1、UGW2和SPU实例2之间具有跨设备组合通用性，但不在这7个设备组合之间具有跨设备组合通用性。

根据用户数指标是UGW网元的“2G+3G用户数”指标和UGW网元的“4G用户数”指标，话务量指标是UGW网元的“Gi接口包数”指标、UGW网元的“SGi用户面报文包数”指标、SPU实例的“GW接收用户面报文包数”指标，确定数值样本来自4个设备组合：UGW0和SPU实例0、UGW0和SPU实例1、UGW1和SPU实例0、UGW1和SPU实例1。以1个设备组合在全天峰值时间(例如17:00)上的“2G+3G用户数”指标和“4G用户数”指标、“Gi接口包数”指标、“SGi用户面报文包数”指标、“GW接收用户面报文包数”指标的值做为一个数据样本，获取第一训练数据。

第一训练数据可以选择4个设备组合作为数据来源，也可以选择3个设备组合作为数据来源，本实施例中选择4个设备组合。

在步骤430中，对第一训练数据中的“用户数”指标和“话务量”指标进行回归分析，得到“用户数-话务量模型”。

可以获取网元UGW0和UGW1的数据，包括：网元的“2G+3G用户数”指标、“4G用户数”指标、“Gi接口包数”指标、“SGi用户面报文包数”指标和SPU实例的“GW接收用户面报文包数”指标。可以对获取的网元UGW0和UGW1的数据进行筛选，并可以对筛选之后的数据进行回归分析，可以得到网元UGW0和网元UGW1的“用户数-话务量模型”(也可以称为第一预测模型)。例如，以每天17:00作为峰值时点进行筛选，可以对筛选后数据中的“2G+3G用户数”指标、“4G用户数”指标和“Gi接口包数”指标、“SGi用户面报文包数”指标、“GW接收用户面报文包数”指标进行回归分析，可以训练得到网元UGW0和网元UGW1的“用户数-话务量模型”(第一预测模型)。

在步骤440中，根据待建模设备获取第二训练数据，包含“话务量”指标和“资源占用率”指标。

根据话务量指标是UGW网元的“Gi接口包数”指标、UGW网元的“SGi用户面报文包数”指标、SPU实例的“GW接收用户面报文包数”指标，资源占用率指标是SPU实例的“CPU峰值占用率”指标，确定数据样本来自目标设备：UGW0和SPU实例0。以该设备在全天任一时间点的“Gi接口包数”指标、“SGi用户面报文包数”指标、“GW接收用户面报文包数”指标、“CPU峰值占用率”的值作为一个数据样本，获取第二训练数据。

在步骤450中，对第二训练数据中的“话务量”指标和“资源占用率”指标进行回归分析，训练得到“话务量-资源占用率模型”。

以UGW0和SPU实例0(目标设备)中的“Gi接口包数”指标、“SGi用户面报文包数”指标、“GW接收用户面报文包数”作为话务量指标，以UGW0和SPU实例0(目标设备)中的“CPU峰值占用率”指标作为资源占用率指标，对话务量指标和资源占用率指标的做回归分析，可以训练得到UGW0和SPU实例0(目标设备)的“话务量-资源占用率模型”(第二预测模型)。

可选地，在一些实施例中，对网元UGW0的SPU实例0的预测流程可以如下所示：

步骤1：根据网元UGW0的SPU实例0的设备类型是UGW设备下的SPU设备，可以确定第一预测模型(“用户数-话务量模型”)输入的“用户数”指标是网元的“2G+3G用户数”指标和网元的“4G用户数”指标，进而可以确定“预测2G+3G用户数”和“预测4G用户数”。

步骤2：根据待预测设备是网元UGW0的SPU实例0，可以确定该设备对应的第一预测模型(“用户数-话务量模型”)和“预测注册用户数”，可以得到“预测Gi接口包数”、“预测SGi用户面报文包数”、“预测GW接收用户面报文千字节数”。

步骤3：根据待预测设备是UGW0的SPU实例0，可以确定对应的第二预测模型(“话务量-资源占用率模型”)。可以根据“话务量-资源占用率模型”和“预测Gi接口包数”、“预测SGi用户面报文包数”、“预测GW接收用户面报文千字节数”，得到“预测CPU峰值占用率”。

可选地，在一些实施例中，还可以通过对第二训练数据进行分位数回归分析，得到第二预测模型。

应理解，分位数回归分析可以是回归分析的方法之一。分位数可以是将随机变量的分布范围按照概率的比例做分割的数值点，分位数回归可以预测指标的上界或下界。作为一个示例，分位数参数为0.1可以用于表示将变量的分布范围分为2个部分，变量小于0.1 分位数的概率可以为0.1。例如，要预测的是资源占用率指标的下界，可以选择低分位数0.1或0.2。

本申请实施例通过对第二训练数据中的第二指标数据和第三指标数据做分位数回归的方法不做具体限定。作为一个示例，可以使用线性分位数回归方法。作为另一个示例，还可以使用非线性分位数回归方法。

本申请实施例中，第二预测模型通过分位数回归分析进行训练，可以预测第三指标数据的上界和下界而不是平均值，可以满足应用需求对边界值的关切。

可选地，可以在图4的基础上，通过对第二训练数据中的话务量指标和资源占用率指标进行分位数回归，可以训练得到第二预测模型。下面结合图5，对这种实现方式进行详细描述。

图5是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。图5包括步骤510-550，步骤510-540分别与步骤410-440对应，具体可参见图4的描述，此处不再赘述。

在步骤510中，根据待建模设备，确定待预测“资源占用率”指标、“用户数”指标、“话务量”指标。

在步骤520中，根据“用户数”指标和“话务量”指标的相关关系的通用性，选择与待建模设备具有通用性的设备，得到设备组合列表1。根据设备组合列表1获取第一训练数据，包含“用户数”指标和“话务量”指标。

在步骤530中，对第一训练数据中的“用户数”指标和“话务量”指标进行回归分析，得到“用户数-话务量”模型。

在步骤540中，根据待建模设备获取第二训练数据，包含“话务量”指标和“资源占用率”指标。

在步骤550中，通过对第二训练数据中的话务量指标和资源占用率指标做分位数回归分析，训练得到“话务量-资源占用率模型”。

以UGW0和SPU实例0(目标设备)中的“Gi接口包数”指标、“SGi用户面报文包数”指标、“GW接收用户面报文包数”作为话务量指标，以“CPU峰值占用率”指标作为资源占用率指标，对话务量指标和资源占用率指标的做分位数回归分析，可以训练得到UGW0和SPU实例0(目标设备)的“话务量-资源占用率模型”(第二预测模型)。

作为一个示例，要预测的是“CPU峰值占用率”指标的上界，可以选择高比例的分位数，例如0.8或0.9。作为另一个示例，要预测的是“CPU峰值占用率”指标的下界，可以选择低比例的分位数，例如0.1或0.2。

本申请实施例中，第二预测模型用分位数回归分析建立，可以预测第三指标数据的上界和下界而不是平均值，满足应用需求对边界值的关切。

可选地，在一些实施例中，可以通过对第一训练数据中的第一指标数据和第二指标数据做回归分析建立第一预测模型的过程中，可以加入“约束建模”特性。也就是说，可以对第一指标数据的数据多样性进行判断。如果第一训练数据中的第一指标数据的数据多样性不满足预设条件，可以对第一训练数据中的第一指标数据和第二指标数据进行约束过坐标原点的回归分析。如果第一训练数据中的第一指标数据的数据多样性满足预设条件，可以对第一训练数据中的第一指标数据和第二指标数据不约束过坐标原点的回归分析。

本申请实施例中，在第一训练数据中的第一指标数据的多样性满足预设条件的情况下，使用不约束过原点的回归分析，充分利用数据集提供的信息，得到更准确的模型。

本申请实施例中，对第一指标数据和第二指标数据进行约束过坐标原点的回归分析，避免可能由数据集的第一指标数据的多样性不足导致的模型外推不准确。

应理解，对数据进行过坐标原点的回归分析以及不过坐标原点的回归分析均可以看作是对数据进行回归分析。约束过坐标原点的回归分析得到的模型可以没有常数项，不约束过坐标原点的回归分析得到的模型可以有常数项。作为一个示例，过坐标原点得到的回归模型可以在变量X为0时，预测的变量Y一定为0。过坐标原点的回归分析可以更容易计算，易于实现。通常可以将过指定非坐标原点的回归分析转化为过坐标原点的回归分析。作为另一个示例，不过坐标原点得到的回归模型可以在变量X为0时，预测的变量Y不一定为0。

可选地，在图4的基础上，可以增加对用户数指标多样性的判断。下面结合图6，对这种实现方式进行详细描述。

图6是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。图6的方法包括步骤610-670。下面分别对步骤610-670进行详细描述。

在步骤610中，根据待建模设备，确定待预测“资源占用率”指标、“用户数”指标、“话务量”指标。

在步骤620中，根据“用户数”指标和“话务量”指标的相关关系的跨设备通用性，选择与待建模设备具有通用性的设备，得到设备组合列表1。根据设备组合列表1获取第一训练数据，包含“用户数”指标和“话务量”指标。

在步骤630中，判断第一训练数据中的“用户数”指标的多样性是否满足预设条件。

如果第一训练数据中的用户数指标的数据多样性满足预设条件，可以通过执行步骤640来建立第一预测模型(也可称为“用户数-话务量模型”)。如果第一训练数据中的“用户数”指标的数据多样性不满足预设条件，可以通过执行步骤650来建立第一预测模型。

可以对第一训练数据中的2G+3G用户数”指标和“4G用户数”指标的多样性进行判断。

在步骤640中，对第一训练数据中的“用户数”指标和“话务量”指标进行约束过坐标原点的回归分析，得到“用户数-话务量模型”。

如果第一训练数据中的用户数指标(“2G+3G用户数”指标、“4G用户数”指标)中的至少一个的多样性不满足预设条件，可以对第一训练数据中的“2G+3G用户数”指标、“4G用户数”指标和“Gi接口包数”指标、“SGi用户面报文包数”指标、“GW接收用户面报文包数”指标进行约束过坐标原点的回归分析，可以得到“用户数-话务量模型”(第一预测模型)。

具体的回归分析建立第一预测模型请参考图4中步骤430的描述，此处不再赘述。

在步骤650中，对第一训练数据中的用户数指标和话务量指标进行不约束过坐标原点的回归分析，得到“用户数-话务量模型”。

如果第一训练数据中的用户数指标(“2G+3G用户数”指标、“4G用户数”指标)的多样性满足预设条件，可以对第一训练数据中的“2G+3G用户数”指标、“4G用户数”指标和“Gi接口包数”指标、“SGi用户面报文包数”指标、“GW接收用户面报文包数”指标进行不约束过坐标原点的回归分析，可以得到“用户数-话务量模型”(第一预测模型)。

在步骤660中，根据待建模设备获取第二训练数据，包含“话务量”指标和“资源占用率”指标。

步骤660与图4所示的步骤440对应，具体请参考图4的描述，此处不再赘述。

在步骤670中，通过对第二训练数据中的话务量指标和资源占用率指标做回归分析，建立描述话务量指标和资源占用率指标之间的数值关系的第二预测模型。

以UGW0和SPU实例0(目标设备)中的“Gi接口包数”指标、“SGi用户面报文包数”指标、“GW接收用户面报文包数”作为话务量指标，以“CPU峰值占用率”指标作为资源占用率指标，对话务量指标和资源占用率指标的做回归分析，建立描述话务量指标和资源占用率指标之间的数值关系的第二预测模型。

本申请实施例中，可以在扩大了训练模型的数据来源的基础上，对可能仍然得不到多样性的数据的情况，可以进行一种备案以完成建模，可以满足实际需求。

可选地，在一些实施例中，可以通过对第一训练数据和第二训练数据中的第一指标数据和第二指标数据做过原点的回归分析建立第一预测模型的过程中，还可以对第一训练数据和第二训练数据中的第二指标数据进行特征处理。如果第二指标数据特征处理的输入值为全零或近似全零，第二指标数据特征处理的输出值为全零或近似全零。可以对经过特征之后的第二指标数据和第一指标数据做过原点的回归分析，训练得到第一预测模型。还可以对经过特征之后的第二指标数据和第三指标数据做过原点的回归分析，建立第二预测模型。

本申请实施例中，在对第二指标数据进行特征处理的过程中，可以将所有特征处理全零或近似全零的输入值映射为所有特征处理全零或近似全零的输出值，以配合对第一训练数据进行约束过原点的回归分析。

应理解，本申请实施例中对第一训练数据和第二训练数据中的第二指标数据进行特征处理的方法不做具体限定。作为一个示例，可以对第一训练数据和第二训练数据中的第二指标数据进行降维处理，例如，可以对第二指标数据进行主成分分析。作为另一个示例，还可以对第一训练数据和第二训练数据中的第二指标数据进行标准化处理。作为另一个示例，还可以对第一训练数据和第二训练数据中的第二指标数据进行归一化处理。

本申请实施例中，对租户数量和使用服务量进行约束过坐标原点的回归分析，避免可能由数据集的第一指标数据的多样性不足导致的模型外推不准确。

可选地，在一些实施例中，可以对第一训练数据和第二训练数据中的第二指标数据进行降维处理。

应理解，降维处理可以将高维的数据映射为低维的数据，降低数据冗余，可被视为一种特征处理。主成分分析是一种常用的降维处理的方法。

本申请实施例对第一训练数据和第二训练数据中的第二指标数据进行降维处理的实现方式不做具体限定。作为一个示例，可以在第一训练数据和第二训练数据上对第二指标数据进行主成分分析，可以得到第二指标数据主成分。

应理解，可以对第一训练数据中的第二指标数据进行主成分分析，得到主成分分析模型，可以根据得到的主成分分析模型，对第一训练数据进行降维处理，得到降维后的第三训练数据，可以根据得到的第三训练数据，训练所述第一预测模型。

应理解，作为一个示例，进行主成分分析的第二指标数据可以是第二指标数据原值。作为另一个示例，进行主成分分析的第二指标数据可以是对第二指标数据原值进行标准化之后的数值。作为另一个示例，进行主成分分析的第二指标数据可以是对第二指标数据原值进行归一化之后的数值。

本申请实施例中，对第二指标数据进行降维，避免通过对第二训练数据进行回归分析可能遇到的由第二指标数据的共线性导致的计算困难。

可选的，在一些实施例中，在图4的基础上，可以对第一训练数据中的第二指标数据通过主成分分析，达到对第一训练数据中的第二指标数据降维的目的。下面结合图7，对这种实现方式进行详细描述。

应理解，对数据进行主成分分析是对数据进行降维处理的其中一种实现方式，本申请对此不做具体限定。

对第一训练数据中的第二指标数据的历史数做主成分析，可以得到第二指标数据主成分模型，

可选地，在一些实施例中，第二指标数据主成分模型的输出变量可以是多维的，但是不可能多于输入变量的维度。作为一个示例，本申请实施例中的第二指标数据可以是3个维度，输出的第二指标数据主成分可以为少于3个维度，例如，包括两个维度：第二指标数据主成分1和第二指标数据主成分2。

应理解，上文提及的第二指标数据主成分可以用于表示该第二指标数据经过主成分分析后得到的一组变量。主成分分析可以是一种统计方法，可以通过正交变换将一组可能存在相关性的第二指标数据转换为一组线性不相关的变量，转换后的变量可以称为第二指标数据主成分。

可选地，在一些实施例中，回归分析的输入变量可以不是第二指标数据的原值，而是经过特征处理的值。具体的特征处理可以参见前文对特征处理的描述，此处不再赘述。

图7是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。图7包括步骤710-780，下面分别对步骤710-780进行详细描述。

在步骤710中，根据待建模设备，确定待预测“资源占用率”指标、“用户数”指标、“话务量”指标。

如图3所示，根据待建模用户数指标是UGW网元的“2G+3G用户数”指标和UGW网元的“4G用户数”指标，待建模资源占用率指标是SPU实例的“CPU峰值占用率”指标，确定话务量指标是UGW网元的“Gi接口包数”指标、UGW网元的“SGi用户面报文包数”指标、SPU实例的“GW接收用户面报文包数”指标。

在步骤720中，根据“用户数”指标和“话务量”指标的相关关系的跨设备通用性，选择与待建模设备具有通用性的设备，得到设备组合列表1。根据设备组合列表1获取第一训练数据，包含“用户数”指标和“话务量”指标。

步骤720中获取第一训练数据的方法与图4所示的步骤420对应，具体请参照图4的描述，此处不再赘述。

在步骤730中，对第一训练数据中的“话务量”指标做主成分分析，得到“话务量主成分模型”。

可以通过对第一训练数据中的“话务量”指标做主成分分析，可以得到话务量主成分模型，从而可以实现对“话务量”指标实现降维的目的。

可以获取网元UGW0和UGW1的第一训练数据，包括：网元的“2G+3G用户数”指标、“4G用户数”指标、“Gi接口包数”指标、“SGi用户面报文包数”指标和SPU实例的“GW接收用户面报文包数”指标。

可以对第一训练数据中的“话务量”指标(例如，“Gi接口包数”指标、“SGi用户面报文包数”指标和SPU实例的“GW接收用户面报文包数”指标)做主成分分析，可以得到话务量主成分模型。

在步骤740中，用“话务量主成分模型”对第一训练数据进行处理。

通过步骤730中得到的“话务量主成分模型”对第一训练数据中的“Gi接口包数”指标、“SGi用户面报文包数”指标和“GW接收用户面报文包数”指标进行处理，得到第三训练数据。

可以获取网元UGW0和UGW1的数据，包括：网元的“2G+3G用户数”指标、“4G用户数”指标、“Gi接口包数”指标、“SGi用户面报文包数”指标和SPU实例的“GW接收用户面报文包数”指标。可以对获取的网元UGW0和UGW1的数据进行筛选，并可以对筛选之后的数据进行回归分析，可以得到第三训练数据。

在步骤750中，对第三训练数据中的“用户数”指标和“话务量”指标做回归分析，得到“用户数-话务量”模型。

可以对第三训练数据中的“用户数”指标和“话务量”指标做回归分析，可以得到网元UGW0和网元UGW1的“用户数-话务量模型”(也可以称为第一预测模型)。例如，以每天17:00作为峰值时点进行筛选，可以对筛选后第三训练数据数据中的“2G+3G用户数”指标、“4G用户数”指标和“Gi接口包数”指标、“SGi用户面报文包数”指标、“GW接收用户面报文包数”指标进行回归分析，可以得到网元UGW0和网元UGW1的“用户数-话务量模型”(第一预测模型)。

在步骤760中，根据待建模设备获取第二训练数据，包含“话务量”指标和“资源占用率”指标。

第二训练数据也可以选择其它设备组合例如UGW0和SPU实例1，本实施例选择UGW0和SPU实例0。

在步骤770中，用“话务量主成分模型”对第二训练数据进行处理。

在第二训练数据上，用步骤730中建立的“话务量主成分模型”对“Gi接口包数”指标、“SGi用户面报文包数”指标和“GW接收用户面报文包数”指标做特征处理，得到话务量指标。

在步骤780中，对第二训练数据中的“话务量”指标和“资源占用率”指标进行回归分析，得到“话务量-资源占用率模型”。

以UGW0和SPU实例0(目标设备)中的“Gi接口包数”指标、“SGi用户面报文包数”指标、“GW接收用户面报文包数”作为话务量指标，以UGW0和SPU实例0(目标设备)中的“CPU峰值占用率”指标作为资源占用率指标，对话务量指标和资源占用率指标的做回归分析，训练得到“话务量-资源占用率模型”(第二预测模型)。

应理解，图7中的虚线箭头可以用于表示对另一步骤的间接影响。例如，步骤730与步骤770之间的虚线箭头可以用于表示步骤730中建立的话务量主成分模型对执行步骤770的间接影响。

本申请实施例中，可以对第二指标数据进行主成分分析，可以对第二指标数据进行变形后形成彼此相互独立的主成分，可以避免话务量共线性导致难以计算的问题。

还应理解，主成分分析得到的模型，描述的是一个映射。可以将原空间中的点对应到映射空间中的点，原空间中的原点在映射空间中并不一定在原点。可以在映射空间中，将原空间的原点经过平移变换可以到原点。

可选地，在一些实施例中，在图7的基础上可以增加对第一指标数据多样性的判断。如果第一指标数据的多样性满足上文提及的预设条件，可以对第一训练数据中的第一指标数据和第二指标数据进行过原点的回归分析。如果第一指标数据的多样性不满足上文提及的预设条件，可以对第一训练数据中的第一指标数据和第二指标数据进行不过原点的回归分析。下面结合图8对这种实现方式进行详细描述。

应理解，在图7(对第一训练数据和第二训练数据中的第二指标数据进行主成分分析)的基础上可以增加对第一指标数据多样性的判断。作为一个示例，如果第一指标数据多样性满足预设条件，可以对第一指标数据和第二指标数据(话务量主成分)进行不约束过原点的回归分析。作为另一个示例，如果第一指标数据多样性不满足预设条件，可以对第一指标数据和第二指标数据(话务量主成分)进行约束过原点的回归分析。在进行约束过原点的回归分析过程中，对第二指标数据进行主成分分析后，原空间中的原点在映射空间中并不一定在原点。可以在映射空间中，将原空间的原点经过平移变换可以到原点，从而可以对第一指标数据和第二指标数据(话务量主成分)进行约束过原点的回归分析。

图8本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。图8包括步骤810-890，下面分别对步骤810-890进行详细描述。

在步骤810中，根据待建模设备，确定待预测“资源占用率”指标、“用户数”指标、“话务量”指标。

如图3所示，根据待建模用户数指标是UGW网元的“2G+3G用户数”指标和UGW网元的“4G用户数”指标，待建模资源占用率指标是SPU实例的“CPU峰值占用率”指标，确定话务量指标是UGW网元的“Gi接口包数”指标、UGW网元的“SGi用户面报文包数” 指标、SPU实例的“GW接收用户面报文包数”指标。

在步骤820中，根据“用户数”指标和“话务量”指标的相关关系的跨设备通用性，选择与待建模设备具有通用性的设备，得到设备组合列表1。根据设备组合列表1获取第一训练数据，包含“用户数”指标和“话务量”指标。

步骤820与图7所示的步骤720对应，具体请参考图7的描述，此处不再赘述。

在步骤830中，对第一训练数据中的“用户数”指标和“话务量”指标进行主成分分析，得到“话务量主成分模型”。

步骤830与图7所示的步骤730对应，具体请参考图7的描述，此处不再赘述。

在步骤840中，判断第一训练数据中的“用户数”指标的数据多样性是否足够。

可以对第一训练数据上的用户数指标的多样性进行判断，如果第一训练数据中的用户数指标的数据多样性满足预设条件，可以通过执行步骤850。如果第一训练数据中的用户数指标的数据多样性不满足预设条件，可以先执行步骤860，在执行步骤850。

在步骤850中，用“话务量主成分模型”对第一训练数据进行处理。

如果第一训练数据中的用户数指标的数据多样性满足预设条件，在第一训练数据上，用步骤830中建立的话务量主成分模型对“Gi接口包数”指标、“SGi用户面报文包数”指标和“GW接收用户面报文包数”指标做特征处理，得到第三训练数据。

在步骤860中，确定一个平移变换，将该平移变换加入“话务量主成分模型”。

如果第一训练数据中的用户数指标的数据多样性满足预设条件，需要对第一训练数据上的用户数指标和话务量指标(话务量主成分)做约束过原点的回归分析。主成分分析得到的模型可以将原空间中的点对应到映射空间中的点，原空间中的原点在映射空间中并不一定在原点。如果第一训练数据和第二训练数据上的话务量指标处理的输入值为全零或近似全零，话务量指标处理的输出值不为全零或近似全零，可以根据不为全零或近似全零的输出值确定一个平移变化T，可以将第一训练数据和第二训练数据上的不为全零或近似全零的输出值经过平移变换T后使得话务量指标处理的输出值为全零或近似全零。

在步骤870中，对第三训练数据中的“用户数”指标和“话务量”指标进行回归分析，得到“用户数-话务量模型”。

在第三训练数据上，以“2G+3G用户数”指标、“4G用户数”指标作为用户数指标，对用户数指标和话务量指标做回归分析，训练得到第一预测模型。

在步骤880中，根据待建模设备获取第二训练数据，包含“话务量”指标和“资源占用率”指标。

步骤880与图7中所示的步骤760对应，具体请参考图7的描述，此处不再赘述。

在步骤890中，用“话务量主成分模型”对第二训练数据进行处理。

步骤890与图7中所示的步骤770对应，具体请参考图7的描述，此处不再赘述。

在步骤895中，对第二训练数据中的“话务量”指标和“资源占用率”指标做回归分析，得到“话务量-资源占用率模型”。

在第二训练数据上，以“CPU峰值占用率”指标作为资源占用率指标，对话务量指标和资源占用率指标的做回归分析，训练得到“话务量-资源占用率模型”(第二预测模型)。

应理解，图8中的虚线箭头可以用于表示对另一步骤的间接影响。例如，步骤830与步骤860之间的虚线箭头可以用于表示步骤830中建立的话务量主成分模型对执行步骤 860的间接影响。又如，步骤830与步骤890之间的虚线箭头可以用于表示步骤830中建立的话务量主成分模型对执行步骤890的间接影响。

本申请实施例中，在对第二指标数据进行主成分分析得到第二指标数据主成分后，如果数据的多样性仍不能满足预设条件，可以加入平移变换，可以将第二指标数据主成分空间中的非原点回归分析转换为原点回归分析(将原空间原点对应到映射空间原点)，计算简单，易于实现。

可选地，在一些实施例中，可以在第一训练数据上对第一指标数据做过原点的回归分析建立第一预测模型的过程中，还可以在第一数据上对第一指标数据进行特征处理。如果第一指标数据处理的输入值为全零或近似全零，第一指标数据处理的输出值为全零或近似全零。可以对该第一指标数据和第二指标数据做过原点的回归分析，建立第一预测模型。

本申请实施例中，在得到第一指标数据的特征处理，应将所有特征全零或近似全零的输入值映射为所有特征全零或近似全零的输出值，以配合第一训练数据上的约束过原点的回归分析。

应理解，本申请实施例中在第一训练数据上对第一指标数据进行特征处理的方法不做具体限定。作为一个示例，可以是在第一训练数据上对第一指标数据进行降维处理，例如，可以对第一指标数据进行主成分分析。作为另一个示例，还可以是在第一训练数据上对第一指标数据进行标准化处理。作为另一个示例，还可以是在第一训练数据上对第一指标数据进行归一化处理。

可选地，在一些实施例中，可以在对第一指标数据和第二指标数据做过原点的回归分析建立第一预测模型的过程中，如果第一指标数据处理的输入值为全零或近似全零，第一指标数据处理的输出值不为全零或近似全零，可以根据不为全零或近似全零的输出值确定一个平移变化，可以将不为全零或近似全零的输出值经过平移变换后使得第一指标数据处理的输出值为全零或近似全零。再可以对该第一指标数据和第二指标数据做过原点的回归分析，建立第一预测模型。

应理解，本申请实施例中对第一指标数据进行特征处理的方法不做具体限定。作为一个示例，可以是对第一指标数据进行降维处理，例如，可以对第一指标数据进行主成分分析。作为另一个示例，还可以是对第一指标数据进行标准化处理。作为另一个示例，还可以是对第一指标数据进行归一化处理。

本申请实施例中，在得到第一指标数据的特征处理，应将所有特征全零或近似全零的输入值映射为所有特征全零或近似全零的输出值，以配合第一训练数据上的约束过原点的回归分析。如果特征处理不满足不满足，通过加入平移变换，可以使之满足要求。

可选的，在一些实施例中，在图4的基础上，可以对第一训练数据的第一指标数据通过主成分分析做降维，得到第一指标数据降维特征。下面结合图9，对这种实现方式进行详细描述。

应理解，作为一个示例，进行主成分分析的第一指标数据可以是第一指标数据原值。作为另一个示例，进行主成分分析的第一指标数据可以是对第一指标数据原值进行标准化之后的数值。作为另一个示例，进行主成分分析的第一指标数据可以是对第一指标数据原值进行归一化之后的数值。

图9是本申请另一实施例提供的训练第一预测模型和第二预测模型的示意性流程图。图9包括步骤910-970，下面分别对步骤910-970进行详细描述。

在步骤910中，根据待建模设备，确定待预测“资源占用率”指标、“用户数”指标、“话务量”指标。

步骤910与图4所示的步骤410对应，具体请参照图4的描述，此处不再赘述。

在步骤920中，根据“用户数”指标和“话务量”指标的相关关系的跨设备通用性，选择与待建模设备具有通用性的设备，得到设备组合列表1。根据设备组合列表1获取第一训练数据，包含“用户数”指标和“话务量”指标。

步骤920中获取第一训练数据与图4所示的步骤420对应，具体请参照图4的描述，此处不再赘述。

在步骤930中，对第一训练数据中的“用户数”指标做主成分分析，建立“用户数主成分模型”。

可以通过对第一训练数据中的“用户数”指标做主成分分析，可以得到“用户数主成分模型”，从而可以实现对“用户数”指标实现降维的目的。

可以对第一训练数据中的“2G+3G用户数”指标、“4G用户数”指标做主成分分析，可以得到“用户数主成分模型”。

在步骤940中，用“用户数主成分模型”对第一训练数据进行处理。

通过用户数主成分模型对第一训练数据中的“2G+3G用户数”指标、““4G用户数”指标进行处理，得到第四训练数据。

在步骤950中，对第四训练数据中的“用户数”指标和“话务量”指标做回归分析，得到“用户数-话务量模型”。

在第四训练数据上，以“Gi接口包数”指标、“SGi用户面报文包数”指标和“GW接收用户面报文包数”指标作为话务量指标，用户数主成分作为用户数指标。对用户数指标和话务量指标做回归分析，训练得到“用户数-话务量模型”(第一预测模型)。

在步骤960中，根据待建模设备获取第二训练数据，包含“话务量”指标和“资源占用率”指标。

在步骤970中，对第二训练数据中的“话务量”指标和“资源占用率”指标做回归分析，得到第二预测模型。

在第二训练数据上，以“CPU峰值占用率”指标作为资源占用率指标，对话务量指标和资源占用率指标的做回归分析，训练得到第二预测模型。

本申请实施例中，可以对第一指标数据指标进行主成分分析，可以对第一指标数据指标进行变形后形成彼此相互独立的主成分，可以避免第一指标数据指标共线性导致难以计算的问题。

可选地，在一些实施例中，可以同时对第一指标数据指标和第二指标数据进行主成分分析。

应理解，可以在图7或图8的基础上可以对第一指标数据指标进行主成分分析。

可选地，本申请实施例提供了一种预测方法，可以获取目标设备的预测第一指标数据指标，通过第一预测模型和第二预测模型，可以得到预测的第三指标数据指标。

训练第一预测模型和第二预测模型的方法请参照上文训练第一预测模型和训练第二预测模型的方法，此处不再赘述。

上文结合图1-图9，详细描述了本申请实施例提供的预测方法以及训练方法，下面将结合图10-图13，详细描述本申请实施例提供的装置实施例。

图10是本申请实施例提供的训练装置的示意性示意图。图10中的训练装置1000可以执行图1-图9中的任一实施例描述的训练方法。

图10中的训练装置1000可以包括：

第一获取模块1001，用于获取第一训练数据和第二训练数据；

其中，第一训练数据包括多个设备的第一指标数据和第二指标数据，所述第二训练数据包括目标设备的第二指标数据和第三指标数据所述目标设备为所述多个设备中的任一个设备。

第一训练模块1002，用于根据所述第一训练数据训练得到第一预测模型；

其中，第一预测模型用于根据所述目标设备的第一指标数据预测所述目标设备的第二指标数据。

第二训练模块1003，用于根据所述第二训练数据训练得到第二预测模型；

其中，第二预测模型用于根据所述第一预测模型得到的所述目标设备的第二指标数据预测所述目标设备的第三指标数据。

可选地，在一些实施例中，第一指标数据为用户数，所述第二指标数据为话务量，所述第三指标数据为资源占用率。

可选地，在一些实施例中，装置1000还包括：

第二获取模块1004，用于获取所述目标设备的待预测第一指标数据。

第一确定模块1005，用于将所述待预测第一指标数据输入所述第一预测模型，得到所述目标设备的预测第二指标数据。

第二确定模块1006，用于将所述预测第二指标数据输入所述第二预测模型，得到所述目标设备的预测结果。

其中，所述预测模型包括所述第一预测模型和所述第二预测模型，所述第一预测模型根据所述第一训练数据训练得到，所述第二预测模型根据所述第二训练数据训练得到。

可选地，在一些实施例中，第一训练模块1002具体用于：对第一训练数据中的第二指标数据进行主成分分析，得到主成分分析模型；根据主成分分析模型，对第一训练数据进行降维处理，得到降维后的第三训练数据；根据第三训练数据，训练第一预测模型。

可选地，在一些实施例中，第一训练模块1002具体用于：通过对第一训练数据进行回归分析，得到第一预测模型。

可选地，在一些实施例中，第一训练模块1002具体用于：在第一训练数据的多样性满足预设条件的情况下，对第一训练数据进行过原点回归分析；在第一训练数据的多样性不满足预设条件的情况下，对第一训练数据进行不过原点回归分析。

可选地，在一些实施例中，所述第二训练模块1003具体用于：通过对第二训练数据进行回归分析，得到第二预测模型。

可选地，在一些实施例中，第二训练模块1003具体用于：通过对第二训练数据进行分位数回归分析，得到第二预测模型。

可选地，在一些实施例中，多个设备之间的第一指标数据和第二指标数据的指标关系具有一致性。

图11是本申请实施例提供的预测装置的示意性示意图。图11中的预测装置1100可以用于执行第二方面或第二方面中任一种可能的实现方式中的预测方法。图11中的预测装置1100可以包括：

第一获取模块1101，用于获取目标设备的待预测第一指标数据；

第一确定模块1102，用于将所述待预测第一指标数据输入第一预测模型，得到所述目标设备的预测第二指标数据；

第二确定模块1103，用于将所述预测第二指标数据输入第二预测模型，得到所述目标设备的预测结果。

其中，所述预测模型包括第一预测模型和第二预测模型，所述第一预测模型根据第一训练数据训练得到，所述第二预测模型根据第二训练数据训练得到，所述第一训练数据包括多个设备的第一指标数据和第二指标数据，所述第二训练数据包括所述目标设备的第二指标数据和第三指标数据，所述多个设备包括所述目标设备。

可选地，在一些实施例中，装置1100还包括：

第二获取模块1104，用于获取所述第一训练数据。

第一训练模块1105，用于根据所述第一训练数据训练得到第一预测模型。

可选地，在一些实施例中，第一训练模块1105具体用于：

对所述第一训练数据中的第二指标数据进行主成分分析，得到主成分分析模型；根据所述主成分分析模型，对所述第一训练数据进行降维处理，得到降维后的第三训练数据；根据所述第三训练数据，训练所述第一预测模型。

可选地，在一些实施例中，第一训练模块1105具体用于：通过对所述第一训练数据进行回归分析，得到所述第一预测模型。

可选地，在一些实施例中，第一训练模块1105具体用于：在所述第一训练数据的多样性满足预设条件的情况下，对所述第一训练数据进行过原点回归分析；在所述第一训练数据的多样性不满足所述预设条件的情况下，对所述第一训练数据进行不过原点回归分析。

可选地，在一些实施例中，装置1100还包括：

第三获取模块1106，用于获取所述第二训练数据。

第二训练模块1107，用于根据所述第二训练数据训练得到第二预测模型。

可选地，在一些实施例中，第二训练模块1107具体用于：通过对所述第二训练数据进行回归分析，得到所述第二预测模型。

可选地，在一些实施例中，第二训练模块1107具体用于：通过对所述第二训练数据进行分位数回归分析，得到所述第二预测模型。

可选地，在一些实施例中，所述多个设备之间的第一指标数据指标和第二指标数据的指标关系具有一致性。

图12是本申请实施例提供的训练装置的示意性结构图。图12中的训练装置1200可以执行图1-图9的任一实施例描述的训练方法。图12中的训练装置1200可以包括存储器1201和处理器1202。存储器1201可用于存储程序，处理器1202可用于执行所述存储器中存储的程序。当存储器1201中存储的程序被执行时，所述处理器1202可用于执行上文任一实施例描述的训练方法。

处理器1202例如可以是中央处理器(Central Processing Unit，CPU)，通用处理器，数字信号处理器(Digital Signal Processor，DSP)，专用集成电路(Application-Specific Integrated Circuit，ASIC)，现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

相应的，该存储器1201可以用于存储该对用户数指标和资源占用率指标之间的数值关系建模的装置的程序代码和数据。因此，该存储器1201可以是处理器1202内部的存储单元，也可以是与处理器1202独立的外部存储单元，还可以是包括处理器1202内部的存储单元和与处理器1202独立的外部存储单元的部件。

图13是本申请实施例提供的预测装置的示意性结构图。图13中的预测装置1300可以用于执行第二方面或第二方面中任一种可能的实现方式中的预测方法。图13中预测装置1300可以包括存储器1301和处理器1302。存储器1301可用于存储程序，处理器1302可用于执行所述存储器中存储的程序。当存储器1301中存储的程序被执行时，所述处理器1302可用于执行上文任一实施例描述的训练方法。

处理器1302例如可以是中央处理器(Central Processing Unit，CPU)，通用处理器，数字信号处理器(Digital Signal Processor，DSP)，专用集成电路(Application-Specific Integrated Circuit，ASIC)，现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

相应的，该存储器1301可以用于存储该对用户数指标和资源占用率指标之间的数值关系建模的装置的程序代码和数据。因此，该存储器1301可以是处理器1302内部的存储单元，也可以是与处理器1302独立的外部存储单元，还可以是包括处理器1302内部的存储单元和与处理器1302独立的外部存储单元的部件。

本申请实施例提供了一种计算机可读存储介质，包括计算机指令，当所述计算机指令在训练装置上运行时，使得所述训练装置执行第一方面或第一方面任意一种实现方式所述的训练方法。

本申请实施例提供了一种计算机可读存储介质，包括计算机指令，当所述计算机指令在预测装置上运行时，使得所述预测装置执行第二方面或第二方面任意一种实现方式所述的预测方法。

本申请实施例提供了一种芯片，包括存储器和处理器，所述存储器用于存储程序；所述处理器用于执行所述存储器中存储的程序，当所述程序被执行时，所述处理器执行第一方面或第一方面任意一种实现方式中的方法。

本申请实施例提供了一种芯片，包括存储器和处理器，所述存储器用于存储程序；所述处理器用于执行所述存储器中存储的程序，当所述程序被执行时，所述处理器执行第二方面或第二方面任意一种实现方式中的方法。

本申请实施例提供了一种计算机程序产品，当该计算机程序产品在计算机上运行时，使得该计算机执行第一方面或第一方面任意一种实现方式的方法。

本申请实施例提供了一种计算机程序产品，当该计算机程序产品在计算机上运行时，使得该计算机执行第二方面或第二方面任意一种实现方式的方法。

应理解，在本申请实施例中，术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系。例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其他任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc，DVD))、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种对租户数量指标和资源消耗量指标之间的数值关系建模的方法，其特征在于，包括：

在描述租户数量指标的特征和服务使用量指标的特征之间的数值关系的第一数据集上，做第一回归分析得到第一预测模型；

在描述服务使用量指标的特征和资源消耗量指标的特征之间的数值关系的第二数据集上，做第二回归分析得到第二预测模型；

所述第一数据集中的任一数据样本，都对应某个设备组合在某一条件下的所述租户数量指标的取值和所述服务使用量指标的取值，所述设备组合中某些设备的所述租户数量指标的原值，被直接作为所述数据样本的所述租户数量指标的特征，或被输入第一特征处理，由第一特征处理的输出值作为所述数据样本的所述租户数量指标的特征，所述设备组合中某些设备的所述服务使用量指标的原值，被直接作为所述数据样本的所述服务使用量指标的特征，或被输入第二特征处理，由第二特征处理的输出值作为所述数据样本的所述服务使用量指标的特征；

第一数据集中，由全体数据样本分别对应的设备组合组成的集合是非单一的：所述数据集中存在至少一对数据样本，所述租户数量指标中存在至少一个，这对数据样本的这个租户数量指标的原值取自不同的两个设备；

所述第二数据集中的任一数据样本，都对应某个设备组合在某一条件下的所述服务使用量指标的取值和所述资源消耗量指标的取值。所述设备组合中某些设备的所述服务使用量指标的原值，被直接作为所述数据样本的所述服务使用量指标的特征，或被输入第二特征处理，由第二特征处理的输出值作为所述数据样本的所述服务使用量指标的特征。所述设备组合中某些设备的所述资源消耗量指标的原值，被直接作为所述数据样本的所述资源消耗量指标的特征，或被输入第三特征处理，由第三特征处理的输出值作为所述数据样本的所述资源消耗量指标的特征。
如权利要求1所述的方法，其特征在于，所述服务使用量指标，是根据所述租户数量指标和所述服务使用量指标确的。
如权利要求1所述的方法，其特征在于，所述第一数据集中，提供所述租户数量指标的原值的设备与提供所述服务使用量指标的原值的设备之间的负载分配关系，在不同数据样本之间是相似的。
如权利要求1或2所述的方法，其特征在于，所述第二特征处理，在输入值为全零或近似全零的情况下，输出值为全零或近似全零。
如权利要求4所述的方法，其特征在于，所述第二特征处理包括第一平移变换，所述第一平移变换由如下步骤确定：

对全零或近似全零的输入值进行所述第二特征处理中的部分处理，根据所述部分处理的输出值确定第一平移变换。
如权利要求1所述的方法，其特征在于，所述第一回归分析包括：

在所述第一数据集上对所述租户数量指标的特征和所述服务使用量指标的特征做约束过原点的回归分析。
如权利要求6所述的方法，其特征在于，所述“在所述第一数据集上对所述租户数量指标的特征和所述服务使用量指标的特征做约束过原点的回归分析”，包括：

当所述第一数据集上的所述租户数量指标的多样性不满足预设条件时，在所述第一数据集上对所述租户数量指标的特征和所述服务使用量指标的特征做约束过原点的回归分析，得到第一预测模型。
如权利要求1所述的方法，其特征在于，所述第一回归分析包括：

当所述第一数据集上的所述租户数量指标的多样性满足预设条件时，在所述第一数据集上对所述租户数量指标的特征和所述服务使用量指标的特征做不约束过原点的回归分析，得到第一预测模型。
如权利要求1所述的方法，其特征在于，所述第二特征处理包括：

在所述第一数据集上对设备的某些服务使用量指标进行第一降维映射处理，得到所述服务使用量指标的特征。
如权利要求9所述的方法，其特征在于，所述第一降维映射处理包括：

通过服务使用量主成分模型进行特征处理，所述服务使用量主成分模型由如下步骤确定：

在描述某些服务使用量指标的特征之间的数值关系的第三数据集上，做主成分分析，得到服务使用量主成分模型。
如权利要求1所述的方法，其特征在于，所述第一特征处理，在输入值为全零或近似全零的情况下，输出值为全零或近似全零。
如权利要求11所述的方法，其特征在于，所述第一特征处理包括第二平移变换，第一平移变换由如下步骤确定：

对全零或近似全零输入值进行所述第一特征处理中的部分处理，根据所述部分处理输出值确定第二平移变换。
如权利要求1所述的方法，其特征在于，所述第一特征处理包括：

在所述第一数据集上对设备的某些租户数量指标进行第二降维映射处理，得到所述租户数量指标的特征。
如权利要求13所述的方法，其特征在于，所述第二降维映射处理包括：

通过租户数量主成分模型进行特征处理，租户数量主成分模型由如下步骤确定：

在描述租户数量指标的特征之间的数值关系的第四数据集上，做主成分分析，得到描述租户数量指标主成分模型。
如权利要求1所述的方法，其特征在于，所述第二回归分析，包括：

在所述第二数据集上对所述服务使用量指标的特征和所述资源消耗量指标的特征做分位数回归分析，得到第二预测模型。
一种对租户数量指标和资源消耗量指标之间的数值关系建模的装置，其特征在于，包括用于执行如权利要求1至15中任一项所述的方法的模块。
一种对租户数量指标和资源消耗量指标之间的数值关系建模的装置，其特征在于，包括存储器和处理器，

所述存储器用于存储程序；

所述处理器用于执行所述存储器中存储的程序，当所述程序被执行时，所述处理器执行如权利要求1至15中任一项所述的方法。
一种计算机可读存储介质，其特征在于，包括计算机指令，当所述计算机指令在所述对租户数量指标和资源消耗量指标之间的数值关系建模的装置上运行时，使得所述对租户数量指标和资源消耗量指标之间的数值关系建模的装置执行如权利要求1至15中任一项所述的方法。