CN104679754A

CN104679754A - 用于数据预测的模型选择设备和方法

Info

Publication number: CN104679754A
Application number: CN201310616088.5A
Authority: CN
Inventors: 王云芝; 夏迎炬; 孙健; 李中华
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2013-11-27
Filing date: 2013-11-27
Publication date: 2015-06-03
Anticipated expiration: 2033-11-27
Also published as: CN104679754B

Abstract

提供一种用于数据预测的模型选择设备和方法。该模型选择设备包括：矩阵分解单元，被配置为对预测矩阵进行奇异值分解，其中，预测矩阵的行/列向量是样本向量，列/行向量是对应维度的特征向量，样本向量之一是包含待预测特征序列的待预测向量；模型选择单元，被配置为基于由矩阵分解单元通过进行奇异值分解获得的、能够反映预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。根据本公开的方案可以降低矩阵计算维度、减少噪声，从而达到自动、准确地选择预测模型的效果。

Description

用于数据预测的模型选择设备和方法

技术领域

本公开一般地涉及数据预测领域，尤其涉及一种用于数据预测的模型选择设备和方法。

背景技术

在数据挖掘领域，对于诸如预测、分类等任务，可用的模型很多。例如对于预测任务而言，常见的可用模型包括线性回归模型、支持向量回归模型、以及诸如极端学习机的基于神经网络的模型等。

这些模型分别有其适用特点，对于不同的数据预测任务，甚至在不同数据集上，效果存在差异。一般说来，某些特定模型在特定任务和数据集上效果会比别的模型更好。

为了达到最好的数据预测效果，常需要在前期对可选模型进行选择，以便使用最适合当前任务下的当前数据集的最好模型，提高预测准确度。

现有的针对数据预测任务的模型选择，大多数依赖一定程度上的人工挑选。例如，在数据集的一个子集上用初步试验选取效果较好的模型，或者使用交叉验证的方法，将数据集分成多份，一部分用于训练，一部分用于验证。无论是哪种方法，都要依赖一定程度的人工干预，并且往往只能通过完整数据集上很小比例的子集结果完成模型选择，局限性较大。同时，操作起来比较繁琐，时间损耗也较大，效果却很有可能不够准确。

发明内容

鉴于存在的问题，本公开的目的是提供一种新型的可以广泛应用于数据预测任务的自动模型选择方法。这种方法和传统方法相比，可以通过自动的、无人工干预的模型选择过程，实现更高效、更准确的模型选择过程，提高模型使用效果。

根据本公开的一个方面，提供一种用于数据预测的模型选择设备，包括：矩阵分解单元，被配置为对预测矩阵进行奇异值分解，其中，所述预测矩阵的行/列向量是样本向量，列/行向量是对应维度的特征向量，样本向量之一是包含待预测特征序列的待预测向量；模型选择单元，被配置为基于由矩阵分解单元通过进行奇异值分解获得的、能够反映预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。

由于基于通过奇异值分解获得的子矩阵来选择要应用于待预测特征序列的预测模型，降低了矩阵计算的维度、去除了噪声，只保留了影响最大的原始数据维度，因而能够自动、准确地为待预测特征序列的每个维度选择最佳预测模型。

在根据本公开的实施例中，模型选择单元可以被配置为：计算子矩阵中对应于已知向量的各子已知向量和对应于待预测向量的向量之间的相似度，已知向量是样本向量中待预测向量之外的样本向量；以及相似度最高的若干个子已知向量所对应的已知向量的所有预测维度的最佳模型作为候选模型，其中，预测维度是已知向量的预测所包含的预测单元。

利用奇异值分解的子矩阵中的向量的意义与原矩阵的向量的意义相对应的特点，使用子矩阵来计算各向量间的相似度，从而大大减小了计算量。并且使用相似度较高的已知向量的各维度的最佳预测模型作为待预测向量的预测模型的候选，完成了预测模型的初步选择。

在根据本公开的实施例中，模型选择单元可以被配置为：通过将候选模型在相似度最高的若干个已知向量中对应预测维度出现的次数按候选模型在所有先前预测中成为最佳模型的概率加权来计算候选模型的得分；以及将分值最高的候选模型确定为待预测序列的对应预测维度的最佳模型。

在完成模型的初步选择后，为了得到最佳的预测模型，还可以对候选模型进行进一步打分评估。通过将候选模型在相似度最高的若干个已知向量中对应预测维度出现的次数按候选模型在所有先前预测中成为最佳模型的概率加权来计算候选模型的得分，同时考虑了候选模型在历史数据集中出现的概率以及其在对应预测维度出现的概率，使得模型的选择更加准确。

在根据本公开的实施例中，待预测特征序列可以包括维数等于待预测特征个数的、具有给定初设值的元素。

元素的给定初设值的设定能够方便后续的矩阵计算。

在根据本公开的实施例中，该模型选择设备还可以包括预测矩阵构造单元，被配置为利用待预测特征序列与已知样本序列来构造预测矩阵。

在根据本公开的实施例中，预测矩阵构造单元可以被配置为：预测矩阵构造单元被配置为：将已知样本序列与待预测特征序列按特定顺序扩展为第一扩展序列，以用作待预测向量；参照第一扩展序列的扩展方式对已知样本序列进行扩展，得到第二扩展序列组，以用作已知向量组；以及将第一扩展序列和第二扩展序列组构造为矩阵，并且，将待预测特征序列中的各元素设置为给定初设值。

通过使用待预测序列和已知数据进行序列的扩展、矩阵的构建来获得包括具有对应关系的待预测向量和已知向量的预测矩阵，从而为简化预测模型的选择提供了方便。

根据本公开的一个方面，还提供一种用于数据挖掘的模型选择方法，包括：对预测矩阵进行奇异值分解，其中，预测矩阵的行/列向量是样本向量，列/行向量是对应维度的特征向量，样本向量之一是包含待预测特征序列的待预测向量；基于通过奇异值分解获得的、能够反映预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。

根据本公开的用于数据预测的模型选择设备和模型选择方法可以通过自动的、无人工干预的模型选择过程，通过对原始数据集的充分利用，实现更高效、准确的模型选择过程，提高模型使用效果。

附图说明

参照下面结合附图对本公开的实施例的说明，会更加容易地理解本公开的以上和其它目的、特点和优点。在附图中，相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。在附图中不必依照比例绘制出单元的尺寸和相对位置。

图1是例示根据本公开实施例的用于数据预测的模型选择设备的结构框图。

图2是例示根据本公开另一实施例的用于数据预测的模型选择设备的结构框图。

图3是例示根据本公开实施例的用于数据预测的模型选择方法的流程图。

图4是例示根据本公开实施例的用于确定预测候选模型的方法的流程图。

图5是例示根据本公开实施例的用于确定预测最佳模型的方法的流程图。

图6是例示根据本公开实施例的用于构造预测矩阵的方法的流程图。

图7是示出实现本发明的计算机的示例性结构的框图。

具体实施方式

下面参照附图来说明本公开的实施例。应当注意，为了清楚的目的，附图和说明中省略了与本公开无关的、本领域技术人员已知的部件和处理的表示和描述。

图1示出根据本公开实施例的模型选择设备100的结构框图。模型选择设备100可以包括矩阵分解单元101和模型选择单元102。矩阵分解单元101被配置为对预测矩阵进行奇异值分解。模型选择单元102被配置为基于由矩阵分解单元101通过进行奇异值分解获得的、能够反映预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。

奇异值分解可以将一个比较复杂的矩阵用更小更简单的几个子矩阵的相乘来表示。这些子矩阵描述的是原矩阵的重要的特性。例如，用A表示原矩阵，则矩阵A的奇异值分解可以用式（1）表示：

A=U∑V^T （1）

其中，U是左奇异矩阵，U中的向量称为左奇异向量，U的行向量的意义与矩阵A的行向量的意义相对应；∑是奇异值矩阵，其对角线元素为降序排列的奇异值；V^T（V的转置）是右奇异矩阵，V^T中的向量称为右奇异向量，V^T的列向量的意义与矩阵A的列向量的意义相对应。

由于U的行向量的意义和V^T的列向量的意义分别与矩阵A的行和列向量的意义相对应，所以对A中某一向量中的未知序列的预测可以用U或V^T中对应的向量来进行。

在本公开的实施例中，假设矩阵A是包含待预测向量的原始矩阵(待预测矩阵的实例)。即，矩阵A由已知历史数据和未知的待预测数据构成；矩阵A的行/列向量是样本向量，列/行向量是对应维度的特征向量；矩阵A的样本向量之一是包含待预测特征序列的待预测向量。矩阵A可以由用户预先准备好并输入到模型选择设备100中，以供矩阵分解单元101进行分解，并将分解结果提供给模型选择单元102进行模型选择。

模型选择单元102基于由矩阵分解单元101通过进行奇异值分解获得的、能够反映预测矩阵A的样本向量的子矩阵（U或V^T）来选择要应用于待预测特征序列的预测的模型。

模型选择单元102具体如何利用奇异值分解所得到的子矩阵中相应的向量来对预测矩阵A中的待预测向量的预测模型进行选择，本领域技术人员可以根据需要采用不同的方案。例如，对预测矩阵进行奇异值分解后，可以利用分解后的子矩阵，按照与原矩阵对应的行或列向量进行聚类或者分类等，找出与待预测序列对应的向量同类的历史向量，根据同类历史向量的预测模型选择最适合当前待预测序列的预测模型。聚类方法例如可以使用层次聚类、K平均算法聚类（K-means）等。分类方法例如可以使用K最邻近算法（KNN）等。或者，也可以直接计算当前待预测序列对应向量与历史向量之间的相似度，选出最相似的历史向量，再根据这些相似历史向量的预测模型选择最适合当前预测序列的模型。

无论采用哪种方案，由于采用了子矩阵（U或V^T）来代替预测矩阵A进行预测的模型选择，降低了要进行计算的矩阵的维度，从而简化了计算。此外，根据奇异值分解固有的特性，可以在计算中降低维度、去除噪声，只保留影响最大的原始数据维度，从而达到自动、准确地选择预测模型的目的。

模型选择设备100可以对由用户预先准备并进行输入的预测矩阵进行处理。或者，可选择地，模型选择设备100也可以基于用户对待预测特征的指定和所存储的已知历史数据，来自动构造预测矩阵A。

图2是例示根据本公开实施例的模型选择设备200的框图。除了与模型选择设备100中功能和结构相同的矩阵分解单元101和模型选择单元102之外，模型选择设备200还可以包括预测矩阵构造单元201。预测矩阵构造单元201可以被配置为利用待预测特征序列与已知样本序列来构造预测矩阵。例如，预测矩阵构造单元201可以被配置为：将已知样本序列与待预测特征序列按特定顺序扩展为第一扩展序列，以用作待预测向量；然后，参照第一扩展序列的扩展方式对已知样本序列进行扩展，得到第二扩展序列组，以用作已知向量；以及将第一扩展序列和第二扩展序列组构造为矩阵，并且，将所述待预测特征序列中的各元素设置为给定初设值。

为了便于理解，下面举例描述预测矩阵构造单元201对预测矩阵A进行构造的可选方式。将以电力生产领域中进行的电力负荷预测应用为例进行描述。本领域技术人员能够了解，该应用只是示例性的，根据本公开的模型选择可以应用于任何领域的数据预测任务。此外，虽然在所举电力负荷预测的应用中，待预测向量和已知样本向量中的元素都是按照时间顺序排列的，但是本领域技术人员将会理解：在其它应用中，待预测的数据以及已知样本数据也可以是按照时间序列之外的规律排列的，只要已知样本向量组（第二扩展序列组）和待预测向量（第一扩展序列）的构造规则相同即可。

在电力生产领域，需要对未来某特定时间段的电力负荷进行预测。例如，可能需要对某个月份中的n天的电力负荷进行预测。将该待预测的n天的电力负荷的待预测特征序列表示为P=（p₁,p₂,…,p_n），其中p₁,p₂,…,p_n按时间顺序排列。假设已知待预测特征序列之前的m天的电力负荷数据，其序列表示为Q=（q₁,q₂,…,q_m）（“已知样本序列”的例子），其中，q₁,q₂,…,q_m按时间顺序排列。则，可以使用已知的前m天的数据序列对待预测特征序列进行扩展，以构成待预测向量（“第一扩展序列”的例子）。待预测向量用P’表示，如式（2）。

P’=（q₁,q₂,…,q_m,p₁,p₂,…,p_n）（2）

接下来，可以为待预测序列（p₁,p₂,…,p_n）填补特定初设值。可以根据需要来设定该特定初设值。例如，为方便起见，可以将待预测特征序列中的元素全部初始设置为0，或其它固定值。统一的初设值可以方便后期的计算。或者，例如，可以针对原始数据的特点进行适当调整，将待预测特征序列中的每个维度补充对应维度的已知值的平均值等。

下面，以为全部元素设置初始值0为例，P’可以表示为如式（3）所示。

P’=（q₁,q₂,…,q_m,0,0,…,0）（3）

在获得待预测向量P’之后，预测矩阵构造单元201可以参照P’的扩展方式对已知样本序列进行扩展，以得到已知向量组。例如，使用电力负荷历史数据集中的前若干个月中、与待预测向量中各元素对应的日期相对应的日期的电力负荷来构造已知向量组（“第二扩展序列组”的例子）。

举一个更具体的例子。假设期望预测8月份15日至20日的电力负荷数据，而已知8月15日前的所有日期的电力负荷数据。当用L_YDD表示Y月DD日的电力负荷时，作为待预测特征序列的8月15日至20日的待预测的电力负荷数据序列为（L₈₁₅,L₈₁₆,…L₈₂₀）。然后，使用例如8月1日至14日的已知电力负荷数据(L₈₀₁,L₈₀₂,..,L₈₁₄)对该待预测序列进行扩展，以得到维数为20的待预测向量(L₈₀₁,L₈₀₂,..,L₈₁₄,L₈₁₅,L₈₁₆,…L₈₂₀)（“第一扩展序列”）。接下来，使用已知的前若干个月的、与待预测向量中的各元素对应的日期相对应的日期的电力负荷来构造已知向量组。例如，已知向量组中可以包括7组向量，分别用前1至7月的1至20日的电力负荷序列构成。即，该已知向量组包括向量(L_i01,L_i02,..,L_i14,L_i15,L_i16,…L_i20)，其中，i=1,…,7。

在获得已知向量组之后，预测矩阵构造单元201可以将待预测向量和已知向量组构造为矩阵，作为预测矩阵。对于上面描述的具体例子，该矩阵包括向量(L_i01,L_i02,..,L_i14,L_i15,L_i16,…L_i20)，其中，i=1,…,8。

更一般地，待预测矩阵B可以表示为式（4）：

B = [\begin{matrix} {P^{'}}_{1} \\ {P^{'}}_{2} \\ . \\ . \\ . \\ {P^{'}}_{w} \end{matrix}] = [\begin{matrix} q_{11} & q_{12} & . . . & q_{1 n} & p_{11} & p_{12} & . . . & p_{1 n} \\ q_{21} & q_{22} & . . . & q_{2 n} & p_{21} & p_{22} & . . . & p_{2 n} \\ q_{w 1} & q_{w 2} & . . . & q_{wn} & 0 & 0 & . . . & 0 \end{matrix}] - - - (4)

其中p’_w是待预测向量，对应于上面式（3）中的P’。p’₁,p’₂,…p’_w-1是由已知样本序列构成的已知向量组（“第二扩展序列组”）。

以式（4）所示的待预测矩阵B为例，矩阵B的行向量是每个月份的电力负荷的样本向量；矩阵B的列向量是每一天（维度）的电力负荷的特征向量。

上面以举例的方式说明了预测矩阵构造单元201构造待预测矩阵的方式。本领域技术人员将会理解，在根据图1的模型选择设备100的情况下，用户也可以参考上述的方式来预先准备待预测矩阵。例如，使待预测矩阵中的待预测特征序列包括维数等于待预测特征个数的、具有给定初设值的元素。

在一个实施例中，可以直接对矩阵B进行奇异值分解。在这种情况下，所获得的左奇异矩阵的行向量将反映矩阵B的样本向量。因而，可以基于左奇异矩阵来选择要应用于待预测特征序列的预测的模型。

在另外的实施例中，可选择地，可以对矩阵B进行转置。转置后的矩阵B^T的行向量是每一天（维度）的电力负荷的特征向量；矩阵B^T的列向量是每个月份的电力负荷的样本向量。因而，对矩阵B^T进行奇异值分解的结果，使得所获得的右奇异值矩阵的列向量将反映矩阵B^T的样本向量。

下面，描述根据本公开的模型选择设备的一个实施例。在模型选择设备100和200中，都可以这样来配置模型选择单元102：使得模型选择单元102计算与能够反映预测矩阵的样本向量的子矩阵中对应于已知向量的各子已知向量和对应于待预测向量的向量之间的相似度；以及将相似度最高的若干个子已知向量所对应的已知向量的所有预测维度的最佳模型作为候选模型。这里所说的预测维度即已知向量的预测所包含的预测单元。

以对预测矩阵B^T进行奇异值分解为例。分解后的右奇异矩阵的列向量反映预测矩阵B^T的样本向量。因而，对右奇异矩阵列向量之间相似度的计算将反映矩阵B^T中对应样本向量之间的相似度。而对维度较矩阵B^T的维度降低的子矩阵进行计算，以代替对B^T进行计算，降低了计算成本。

将右奇异矩阵中的、对应于矩阵B^T中的由已知数据构成的已知向量的列向量称为子已知向量。通过计算右奇异矩阵的列向量中、与B^T的待预测向量相对应的向量和其子已知向量之间的相似度，可以反映预测矩阵B^T的待预测向量与已知向量之间的相似度。从而，利用具有较大相似度的已知向量的预测所使用的最佳预测模型作为对待预测向量进行预测的候选模型。

相似度的计算可以采用任何度量。例如但不限于欧氏（Euclidean）距离、闵可夫斯基(Minkowski)距离、马氏(Mahalanobis)距离等。在采用距离度量计算相似度的情况下，距离越大，则相似度越小，反之，则相似度越大。

在右奇异矩阵中计算出各子已知向量与对应于待预测向量的向量的相似度后，将相似度最高的若干个子已知向量所对应的已知向量的所有预测维度的最佳模型作为候选模型。这里请注意：对于一个已知向量，作为其预测单元的每一个预测维度都对应于一个最佳模型，因此，每一个具有较高相似度的已知向量可以提供一组（若干个）候选模型。

以上，完成了对预测模型的粗选。根据需要，本领域技术人员可以采用粗选的模型开始进行待预测特征序列的预测工作。可选择地，也可以进一步对预测模型进行更精确地选择。

例如，模型选择单元102可以进一步被配置为通过将候选模型在相似度最高的若干个已知向量中对应预测维度出现的次数按候选模型在所有先前预测中成为最佳模型的概率加权来计算候选模型的得分。并且，模型选择单元102可以被配置为将分值最高的候选模型确定为待预测序列的对应预测维度的最佳模型。

继续以上面电力负荷预测为例。在整个数据集中寻找与待预测月份最相似（相似度最高）的前N个历史月份，然后计算这N个最相似历史月份中的最佳模型分布情况，以确定最适合当前预测月份的模型。

具体来说，假设所有候选模型集合为M，M={M₁,M₂,…,M_d}。M中的每一个元素M_i均代表一个可用于预测的候选模型。如下按式(5)为每个候选模型打分，得分S={S₁,S₂,…,S_d}为候选模型M_i在相似度最高的若干个已知向量中对应预测维度出现的次数按M_i在所有先前预测中成为最佳模型的概率的加权：

S={S₁,S₂,…,S_d}其中，

其中，w_Mj是权重，代表模型在整个历史数据集中是最好模型的概率分布；而T_Mj代表模型M_j在对应维度被选为最佳模型的次数。

由此，可以用式（6）表示适合当前预测月份的模型为：

M_最佳=M_j其中j=argmaxS_j (6)

通过将候选模型在相似度最高的若干个已知向量中对应预测维度出现的次数按候选模型在所有先前预测中成为最佳模型的概率加权来计算候选模型的得分，同时考虑了候选模型在历史数据集中出现的概率以及其在对应预测维度出现的概率，使得模型的选择更加准确。

下面，将参照图3描述根据本公开实施例的模型选择设备所执行的预测模型选择方法的流程。在步骤S301中，模型选择设备接收由用户预先准备的预测矩阵。预测矩阵的行/列向量是样本向量，列/行向量是对应维度的特征向量，样本向量之一是包含待预测特征序列的待预测向量。

在步骤S302中，模型选择设备对接收的预测矩阵进行奇异值分解，以得到能够反映预测矩阵的样本向量的子矩阵。奇异值分解的方法适用本领域已知的各种方法。

在步骤S303中，模型选择设备基于所获得的能够反映预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。

通过使用经过奇异值分解获得的只保留影响最大的原始数据维度的子矩阵来选择预测模型，降低了矩阵计算的成本，在滤除噪声的情况下使得模型选择更加准确。具体地，使用何种方式对子矩阵进行处理以选择预测模型，本领域技术人员可以根据需要选择适当的方式。例如，对预测矩阵进行奇异值分解后，可以利用分解后的子矩阵，按照与原矩阵对应的行或列向量进行聚类或者分类等，找出与待预测序列对应的向量同类的历史向量，根据同类历史向量的预测模型选择最适合当前待预测序列的预测模型。聚类方法例如可以使用层次聚类、K平均算法聚类（K-means）等。分类方法例如可以使用K最邻近算法（KNN）等。或者，也可以直接计算当前待预测序列对应向量与历史向量之间的相似度，选出最相似的历史向量，再根据这些相似历史向量的预测模型选择最适合当前预测序列的模型。

在步骤S304中，将所获得的预测模型输出给后续预测装置，以依据获得的模型对待预测特征序列进行预测。然后，模型选择设备的模型选择处理结束。

下面参照图4描述根据本公开实施例的基于获得的奇异值分解子矩阵确定预测候选模型的方法。

例如，在步骤S401中，根据本公开的模型选择设备中的模型选择单元接收经矩阵分解单元进行了奇异值分解所获得的奇异值分解子矩阵。该子矩阵能够反映预测矩阵的样本向量。具体地，子矩阵中的向量与预测矩阵中的相应向量具有对应的关系。

在步骤S402中，计算子矩阵中对应于已知向量的各子已知向量和对应于待预测向量的向量之间的相似度。这里所说的已知向量是预测矩阵的样本向量中待预测向量之外的样本向量，即，用已知数据构造的样本向量。待预测向量是待预测矩阵中包含待预测特征序列的向量。

相似度的计算可以采用任何度量。例如但不限于欧氏距离、闵可夫斯基距离、马氏距离等。在采用距离度量计算相似度的情况下，距离越大，则相似度越小，反之，则相似度越大。

在步骤S403中，将相似度最高的若干个子已知向量所对应的已知向量的所有预测维度的最佳模型作为候选模型。这里所述的预测维度是已知向量的预测所包含的预测单元。每一个预测维度对应于一个子任务，每一个子任务对应于一个最佳模型。

在步骤S404中，将所选择的候选模型输出，以供预测设备进行预测，或者供后续处理设备进行进一步选择。

下面参照图5描述根据本公开实施例的在获得候选模型集合之后进行进一步精确选择的方法的流程。图5中的步骤S501至S503对应于图4中的步骤S401至S403，因而下面省略其详细描述。

在步骤S504中，通过将候选模型在相似度最高的若干个已知向量中对应预测维度出现的次数按候选模型在所有先前预测中成为最佳模型的概率加权来计算候选模型的得分。

计算得分的具体公式已经在上文中描述，这里省略其详细描述。

在步骤S505中，将分值最高的候选模型确定为待预测序列的对应预测维度的最佳模型，并将该最佳模型输出到预测设备。

下面将参照图6的流程图描述基于已知样本序列和指定的待预测数据自动地进行预测矩阵构造的方法的例子。

如图6所示，在步骤S601中，根据本公开模型选择设备的预测矩阵构造单元接收预先存储的已知样本序列，并接收对哪些数据进行预测的指示。

在步骤S602中，预测矩阵构造单元将已知样本序列与待预测序列按特定顺序进行扩展，以获得第一扩展序列。该第一扩展序列在之后获得的预测矩阵中成为作为样本向量的待预测向量。

在步骤S603中，参照第一扩展序列的扩展方式，对已知样本序列进行扩展，以得到第二扩展序列组。该第二扩展序列组在之后获得的预测矩阵中成为作为样本向量的已知向量。

在步骤S604中，将第一扩展序列和第二扩展序列组结合，以构造预测矩阵。

在步骤S605中，将待预测序列中的各元素设置为给定初设值。给定初设值例如诸如0的固定数值，或者是基于对应维度的已知值确定的平均值等。这里，请注意：对待预测序列的各元素的初设值设定也可以在矩阵构造之前，例如但不限于在第一扩展序列生成时进行。

这种基于奇异值分解的模型选择方法简化了传统的模型选择过程。而且，根据奇异值分解的特性，可以在矩阵计算中降低维度、滤除噪声，只保留影响最大的原始数据维度，从而达到自动的、精确的模型选择，并通过应用更好的模型改进后续的数据预测效果。

以上结合具体实施例描述了本发明的基本原理，但是，需要指出的是，对本领域的普通技术人员而言，能够理解本发明的方法和装置的全部或者任何步骤或者部件，可以在任何计算装置（包括处理器、存储介质等）或者计算装置的网络中，以硬件、固件、软件或者它们的组合加以实现，这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。

因此，本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。计算装置可以是公知的通用装置。因此，本发明的目的也可以仅仅通过提供包含实现方法或者装置的程序代码的程序产品来实现。也就是说，这样的程序产品也构成本发明，并且存储有这样的程序产品的存储介质也构成本发明。显然，存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。

在通过软件和/或固件实现本发明的实施例的情况下，从存储介质或网络向具有专用硬件结构的计算机，例如图7所示的通用计算机700安装构成该软件的程序，该计算机在安装有各种程序时，能够执行各种功能等等。

图7是示出实现本发明的计算机的示例性结构的框图。在图7中，中央处理单元（CPU）701根据只读存储器（ROM）702中存储的程序或从存储部分708加载到随机存取存储器（RAM）703的程序执行各种处理。在RAM703中，也根据需要存储当CPU701执行各种处理时所需的数据。

CPU701、ROM702和RAM703经由总线704彼此连接。输入/输出接口705也连接到总线704。

下述部件连接到输入/输出接口705：输入部分706，包括键盘、鼠标等；输出部分707，包括显示器，诸如阴极射线管（CRT）、液晶显示器（LCD）等，以及扬声器等；存储部分708，包括硬盘等；以及通信部分709，包括网络接口卡诸如LAN卡、调制解调器等。通信部分709经由网络诸如因特网执行通信处理。

根据需要，驱动器710也连接到输入/输出接口705。可拆卸介质711诸如磁盘、光盘、磁光盘、半导体存储器等根据需要被安装在驱动器710上，使得从中读出的计算机程序根据需要被安装到存储部分708中。

在通过软件实现上述步骤和处理的情况下，从网络诸如因特网或存储介质诸如可拆卸介质711安装构成软件的程序。

本领域的技术人员应当理解，这种存储介质不局限于图7所示的其中存储有程序、与方法相分离地分发以向用户提供程序的可拆卸介质711。可拆卸介质711的例子包含磁盘、光盘(包含光盘只读存储器（CD-ROM）和数字通用盘（DVD）)、磁光盘（包含迷你盘（MD））和半导体存储器。或者，存储介质可以是ROM702、存储部分708中包含的硬盘等，其中存有程序，并且与包含它们的方法一起被分发给用户。

本发明还提出一种存储有机器可读取的指令代码的程序产品。指令代码由机器读取并执行时，可执行上述根据本发明实施例的方法。

相应地，用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等。

另外，根据本发明的实施例的某些用于组合工具的方法和装置，能够扩大组合的使用范围。

本领域的普通技术人员应理解，在此所例举的是示例性的，本发明并不局限于此。

作为一个示例，上述方法的各个步骤以及上述设备的各个组成模块和/或单元可以实施为软件、固件、硬件或其组合，并作为相应设备中的一部分。上述装置中各个组成模块、单元通过软件、固件、硬件或其组合的方式进行配置时可使用的具体手段或方式为本领域技术人员所熟知，在此不再赘述。

作为一个示例，在通过软件或固件实现的情况下，可以从存储介质或网络向具有专用硬件结构的计算机（例如图7所示的通用计算机700）安装构成该软件的程序，该计算机在安装有各种程序时，能够执行各种功能等。

在上面对本发明具体实施例的描述中，针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用，与其它实施方式中的特征相组合，或替代其它实施方式中的特征。

应该强调，术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在，但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。

此外，本发明的方法不限于按照说明书中描述的时间顺序来执行，也可以按照其它的时间顺序地、并行地或独立地执行。因此，本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。

尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露，但是，应该理解，本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本发明的保护范围内。

本发明还可以以下面的实施方式实现：

1.一种用于数据预测的模型选择设备，包括：

矩阵分解单元，被配置为对预测矩阵进行奇异值分解，其中，预测矩阵的行/列向量是样本向量，列/行向量是对应维度的特征向量，样本向量之一是包含待预测特征序列的待预测向量；

模型选择单元，被配置为基于由矩阵分解单元通过进行奇异值分解获得的、能够反映预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。

2.根据项1的模型选择设备，其中，模型选择单元被配置为：

计算子矩阵中对应于已知向量的各子已知向量和对应于待预测向量的向量之间的相似度，已知向量是样本向量中待预测向量之外的样本向量；以及

将相似度最高的若干个子已知向量所对应的已知向量的所有预测维度的最佳模型作为候选模型，其中，预测维度是已知向量的预测所包含的预测单元。

3.根据项2的模型选择设备，其中，模型选择单元被配置为：

通过将候选模型在相似度最高的若干个已知向量中对应预测维度出现的次数按候选模型在所有先前预测中成为最佳模型的概率加权来计算候选模型的得分；以及

将分值最高的候选模型确定为待预测序列的对应预测维度的最佳模型。

4.根据项1至3中任一个的模型选择设备，其中，待预测特征序列包括维数等于待预测特征个数的、具有给定初设值的元素。

5.根据项1至3中任一个的模型选择设备，还包括预测矩阵构造单元，被配置为利用待预测特征序列与已知样本序列来构造预测矩阵。

6.根据项5的模型选择设备，其中，预测矩阵构造单元被配置为：

将已知样本序列与待预测特征序列按特定顺序扩展为第一扩展序列，以用作待预测向量；

参照第一扩展序列的扩展方式对已知样本序列进行扩展，得到第二扩展序列组，以用作已知向量组；以及

将第一扩展序列和第二扩展序列组构造为矩阵，并且，将待预测特征序列中的各元素设置为给定初设值。

7.一种用于数据挖掘的模型选择方法，包括：

对预测矩阵进行奇异值分解，其中，预测矩阵的行/列向量是样本向量，列/行向量是对应维度的特征向量，样本向量之一是包含待预测特征序列的待预测向量；

基于通过奇异值分解获得的、能够反映预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。

8.根据项7的模型选择方法，其中，对模型进行选择包括：

9.根据项8的模型选择方法，其中，对模型进行选择还包括：

10.根据项7至9中任一个的模型选择方法，其中，待预测向量包括维数等于待预测特征个数的、具有给定初设值的元素。

11.根据项7至9中任一个的模型选择方法，还包括：利用待预测序列与已知样本序列来构造预测矩阵。

12.根据项11的模型选择方法，其中，预测矩阵的构造包括：

将已知样本序列与待预测序列按特定顺序扩展为第一扩展序列，以用作待预测向量；

将第一扩展序列和第二扩展序列组构造为矩阵，并且，将待预测序列中的各元素设置为给定初设值。

Claims

1.一种用于数据预测的模型选择设备，包括：

矩阵分解单元，被配置为对预测矩阵进行奇异值分解，其中，所述预测矩阵的行/列向量是样本向量，列/行向量是对应维度的特征向量，所述样本向量之一是包含待预测特征序列的待预测向量；

模型选择单元，被配置为基于由所述矩阵分解单元通过进行奇异值分解获得的、能够反映所述预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。

2.根据权利要求1所述的模型选择设备，其中，所述模型选择单元被配置为：

计算所述子矩阵中对应于已知向量的各子已知向量和对应于所述待预测向量的向量之间的相似度，所述已知向量是所述样本向量中待预测向量之外的样本向量；以及

将相似度最高的若干个子已知向量所对应的已知向量的所有预测维度的最佳模型作为候选模型，其中，所述预测维度是所述已知向量的预测所包含的预测单元。

3.根据权利要求2所述的模型选择设备，其中，所述模型选择单元被配置为：

通过将候选模型在相似度最高的所述若干个已知向量中对应预测维度出现的次数按所述候选模型在所有先前预测中成为最佳模型的概率加权来计算候选模型的得分；以及

4.根据权利要求1至3中任一个所述的模型选择设备，还包括预测矩阵构造单元，被配置为利用待预测特征序列与已知样本序列来构造预测矩阵。

5.根据权利要求4所述的模型选择设备，其中，所述预测矩阵构造单元被配置为：

将第一扩展序列和第二扩展序列组构造为矩阵，并且，将所述待预测特征序列中的各元素设置为给定初设值。

6.一种用于数据挖掘的模型选择方法，包括：

对预测矩阵进行奇异值分解，其中，所述预测矩阵的行/列向量是样本向量，列/行向量是对应维度的特征向量，所述样本向量之一是包含待预测特征序列的待预测向量；

基于通过奇异值分解获得的、能够反映所述预测矩阵的样本向量的子矩阵来选择要应用于待预测特征序列的预测的模型。

7.根据权利要求6所述的模型选择方法，其中，对模型进行选择包括：

8.根据权利要求7所述的模型选择方法，其中，对模型进行选择还包括：

9.根据权利要求6至8中任一个所述的模型选择方法，还包括：利用待预测序列与已知样本序列来构造预测矩阵。

10.根据权利要求9所述的模型选择方法，其中，所述预测矩阵的构造包括：

将第一扩展序列和第二扩展序列组构造为矩阵，并且，将所述待预测序列中的各元素设置为给定初设值。