CN110766066B

CN110766066B - 一种基于fnn的张量异质集成车联网缺失数据估计方法

Info

Publication number: CN110766066B
Application number: CN201910993396.7A
Authority: CN
Inventors: 张婷; 张德干; 张捷; 高瑾馨; 王法玉; 李可
Original assignee: Tianjin University of Technology
Current assignee: Tianjin University of Technology
Priority date: 2019-10-18
Filing date: 2019-10-18
Publication date: 2023-06-23
Anticipated expiration: 2039-10-18
Also published as: CN110766066A

Abstract

一种基于FNN的张量异质集成车联网缺失数据估计方法。车联网通过大量的传感器收集的数据来获得交通状况信息。然而数据缺失、异常数据等低质问题一直严重制约着车联网的发展和应用。FNNTEL方法针对大型路网数据缺失、低质异常问题，对时空多维数据集中进行鲁棒的缺失数据归算，采用张量分解数据采样新策略；首次将异质集成思想引入到交通数据归算建模中，构建张量分解的异质集成模型，既能保留交通数据的多维性，又能提取底层的多模式关联；将模糊神经网络对模型进行优化。与近年来较为先进的BGCP、HTD、XalRTC等算法相比，FNNTEL方法提高了数据缺失重构能力，降低了数据的插补误差，有效提高归算精度。

Description

一种基于FNN的张量异质集成车联网缺失数据估计方法

技术领域

本发明属于物联网与大数据处理领域，具体涉及一种基于FNN的张量异质集成车联网缺失数据估计方法。

背景技术

随着车联网(Internet of Vehicles，IOV)和传感器技术的飞速发展，大量的城市交通数据通过环路探测器、微波检测器、视频传感器以及浮动车等路网中固定或移动的传感器不断收集，用以捕捉交通路网的基本状态和动态，从而形成交通多维大数据。然而由于固定传感器空间范围有限，移动传感器具有高度不稳定的空间和时间分辨率，同时数据集采集过程常常伴随着传感器故障或传输失真等有损通信等因素，不可避免的造成流量数据缺失、丢失或异常等现象的发生，甚至可能会导致出现高比例的数据丢失。据报道，德州交通研究所数据库显示，交通流量数据的缺失率通常在16％到93％之间。在加拿大阿尔伯塔省近7％的交通数据在7年内失踪，有时失踪率高达90％。第十七届世界智能交通系统大会上，中国研究人员在报告中强调，北京经常发生交通数据丢失的情况。由此可见，数据缺失、异常数据等低质量问题一直是一个严重制约着车联网的发展和应用的难点。因此，为了充分利用不完整的时空数据，精确估计缺失数据、修复异常数据是交通数据处理的重要任务。

交通路网数据具有数据规模交大、多网多源、复杂异构，采集方式(流式与批式)多样，高维且结构复杂等特点。而张量能够最大程度保持数据内在结构特性，捕获数据的全局结构，更好的表达高阶数据复杂的本质结构。张量分解以低维子空间的形式表示张量近似内在结构。同时，相邻道路的交通状态趋向于强相关,意味着道路网络可以用低维模型来表示。张量完成方法利用这些模式来估计缺失值，通过获得不完全张量的合适的低秩逼近。因此，在交通研究领域数据缺失估计中效果较好。

发明内容

本发明的目的是解决车联网(IOV)通过大量的传感器收集到的交通状况信息，长期存在的数据缺失、异常数据等低质问题，为此提供一种基于模糊神经网络(FNN)的张量异质集成车联网缺失数据估计方法(FNNTEL)。在路网交通数据不完整时空数据插补估计中，归算最优结果是一个NP-hard问题。近年来学术界针对交通数据缺失恢复做了许多研究，但如何充分利用时空交通模式提高数据插补性能问题仍然是努力的方向。目前提出的解决问题的方法综合起来主要为插值、统计学习和预测三类。插值函数法通常假定缺失数据的问题局限于某些已知的连接和时间间隔，利用历史数据获取目标道路与其邻近或过去道路之间的关系函数，这种技术需要完整的历史数据来得到关系模型，如历史数据有缺少值，这些方法将无法使用。然而在实际场景中，未损坏的历史数据也有可能不可用。此外，有研究人员提出基于EM imputation methods的利用观测数据与潜在变量之间的贝叶斯主成分分析(BPCA)算法和概率主成分分析(PPCA)来解决缺失数据问题。然而由于EM方法的固有特性和矩阵模型的固有特性，当缺失率较高时，这些方法的性能可能较差。多数关于张量分解的研究，取决于范数最小化寻找原始含缺失数据张量的低秩近似表示。这种优化方法因为仅计算单点估计，当丢失率很大时通常倾向于过拟合，在处理稀疏张量时，难以捕获全局信息并做出良好的估计。本发明针对大型路网缺失数据问题，建立在张量模式基础上，将张量分解的处理方法进行异质集成，并利用FNN方法进行建模。与近年来较为先进的BGCP、HTD、XalRTC等算法相比，FNNTEL方法提高了数据缺失重构能力，降低了数据的插补误差，即使在数据量级较大的情况下，依然收到理想的效果，具有一定的实用价值。

本发明提供的基于FNN的张量异质集成车联网缺失数据估计方法，主要包括如下关键步骤：

第1、系统模型建立；主要包括：

第1.1、建立数据张量模型；

第1.2、建立多维数据插补模型。

第2、采样阶段；对包含不完成缺失的原始数据形成张量数据集，对数据集进行Bootstrap自主采样，形成最终张量数据集；具体包括：

第2.1、原始数据形成张量数据集，对原始的交通多维数据进行采集，大量的城市交通数据通过环路探测器、微波检测器、视频传感器以及浮动车等路网中固定或移动的传感器不断收集，进行张量设置与性能度量；

第2.2、采用新策略对张量进行采样。运用Bootstrap技术，根据均匀概率分布，对含缺失、低质等原始张量数据进行随机抽样，获取多个有多样性差异的样本，样本规模与原始张量数据集一样；

第2.3、通过新策略采样对张量进行采样，增加了张量分解性能间的差异度，从而提高了数据缺失估计的精度。形成最终张量数据集。

第3、模型构建阶段。根据相关参数对不同张量分解器进行设定，针对基分解器进行最优权值计算，最终形成分解器组件，根据目标函数最终形成张量异质集成模型；具体包括：

第3.1、分别对利用新策略采样得到的数据进行张量分解，形成分解器组件，提高多样性和准确性；

第3.2、对基分解器进行最优权值计算；

第3.3、异质集成新的组件模型。

第4、模型优化阶段。首先通过训练进行模糊神经网络(FNN)构建，接着对形成的张量异质集成模型进行优化，对比目标函数选择最优。

第4.1、通过训练与预测，进行模糊神经网络(FNN)的构建；

第4.2、针对异质集成新的张量模型，进行FNN优化；

第4.3、对比目标函数选择最优。

本发明的优点和积极效果是：

本发明主要设计一种基于FNN的张量异质集成车联网缺失数据估计方法，该方法的研究主要针对，车联网(IOV)交通数据原始信息采集的数据缺失、异常数据等低质问题。FNNTEL方法建立在张量模式基础上，张量分解异质集成建模，并利用FNN方法进行优化。与近年来较为先进的BGCP、HTD、XalRTC等算法相比，FNNTEL方法提高了数据缺失重构能力，降低了数据的插补误差，即使在数据量级较大的情况下，依然收到理想的效果，具有一定的实用价值。

附图说明

图1是FNNTEL方法的流程图；

图2(a)是FNN模型训练结果图；

图2(b)是FNN模型预测数据结果图；

图3(a)是城市路网数据10％-90％随机性缺失多维交通数据序列展示图，数据来源为A城市路网交通速度数据集，数据量180万条；

图3(b)是高速路网数据10％-90％结构性缺失多维交通数据序列展示图，数据来源为B城市局部高速公路路网交通速度数据集，数据量15万条；

图4是B城市高速公路某天6个观测点路段时间序列图；

图5(a)是A城市路网数据时间序列里某个观测点某天采集点的数据图；

图5(b)是A城市观测点平均数据图，红色标记显示为休息日的平均速度；

图6(a)是城市路网数据选择不同等级引起的算法重建性能的变化图；

图6(b)是高速路网数据选择不同等级引起的算法重建性能的变化图；

图7(a)是城市路网数据在不同数据缺失率下的相对误差图；

图7(b)是高速路网数据在不同数据缺失率下的相对误差图；

图8(a)是城市路网数据在不同数据缺失率下的绝对误差图；

图8(b)是高速路网数据在不同数据缺失率下的绝对误差图；

图9(a)是城市路网数据在不同数据缺失率下的均方根误差图；

图9(b)是高速路网数据在不同数据缺失率下的均方根误差图；

图10(a)是城市路网数据在对应路段随机数据缺失达到40％时的数据缺失估计值及真实值对比图；

图10(b)是城市路网数据在对应路段随机数据缺失达到95％时的数据缺失估计值及真实值对比图；

图11(a)是高速公路路网数据在对应路段光纤数据缺失达到40％时的数据缺失估计值及真实值对比图；

图11(b)是高速路网数据在在对应路段光纤数据缺失达到70％时的数据缺失估计值及真实值对比图。

具体实施方式

本实施例设计的方法是借助MATLAB2016开发工具对本发明方法进行仿真实验。将该方法和BGCP、HTD、XalRTC、CP_WOPT方法进行对比分析。在相同的测试环境与测试参数下，分析对比这五种不同的方法的相对误差、绝对误差估计精度和均方根误差。参见附图1，具体实施过程详述如下：

步骤1、系统模型建立：

步骤1.1、建立数据张量模型

1)数据集张量设置

道路用线段L_i表示，E为大小为p的测试道路网，

在区间道路L_i上的平均速度(t_j-Δt，t_j)为V(L_i，t_j)，采样间隔Δt为10min。每个链路L_i创建一个速度剖面a_i∈Rⁿ，如a_i＝[V(L_i，t₁),...,V(L_i，t_n)]^T。速度配置文件包含每个道路一天的速度数据，则速度数据矩阵A∈R^n×p，比如

令D∈R^n×p为相应的缺失数据矩阵。集合Ω收录词条的位置在D的速度数据是可用的，集合Θ＝Ω^C表示在D丢失速度值的位置。创建路网配置张量X∈Rⁿ ^×p×q，q为60天的数据。通过叠放在一起的网络配置矩阵{X₁,X₂,...X_q}从不同的日子形成3阶张量，其中，不完全张量由D∈R^n×p×q表示。

2)路网选取与数据来源

首先选取A城市交通委员会发布的大规模城市路网交通速度数据集作为实验数据之一，将速度数据构造成X表示的原始张量。该数据集包含两个月内(2016年8-9月)的200个路段的车辆行驶速度观测，以10min为采集周期(每天144个测试采集)。数据集设置为三阶张量(路段×天数×每天时间间隔，尺寸为200×60×144)，数据量为180万。为更好的进行实验测试，接下来我们选取B城市高速公路开放的速度采集数据集为实验数据之二，该数据集包含20天内(2015年9月15-10月5日)的26个高速路段的车辆行驶速度观测，以5min为采集周期(每天288个测试采集)。数据集设置为三阶张量(路段×天数×每天时间间隔，尺寸为26×20×288)，数据量为15万。

步骤1.2、建立多维数据插补模型

在步骤1.1中建立的张量模型基础上，首先构建张量分解模型，在此基础上对张量的基分解器进行异质集成，并利用模糊神经网络对集成结果进行优化，该模型表征了数据插补及优化的过程。

步骤2、采样阶段：

步骤2.1、原始数据形成张量数据集

对原始的交通多维数据进行采集，大量的城市交通数据通过环路探测器、微波检测器、视频传感器以及浮动车等路网中固定或移动的传感器不断收集，进行张量设置与性能度量。

定义1加权相对误差(WRE)。为实际张量数据A与估计张量数据

之间的误差：

式中符号o代表两张量之间的元素相乘。张量W∈R^n×p×q为带权值的张量：

张量A∈R^n×p×q的Fresenius范数||A||_F定义为：

定义2均方根误差(RMSE)的估计算法如下：

式中|Θ|代表集Θ的大小。我们计算了估算速度数据中的偏差，如下所示：

计算估计值方差如下：

式中

代表式(6)中和

的平均值。

定义3加权绝对误差(MAD)表示如下：

定义4平均绝对百分比相对误差(MAPE)表示如下：

步骤2.2、采用新策略对张量进行采样

运用Bootstrap技术，根据均匀概率分布，对含缺失、低质等原始张量数据进行随机抽样，获取多个有多样性差异的样本，样本规模与原始张量数据集一样，增加张量分解性能间的差异度，从而提高了数据缺失估计的精度。

对样本张量X运用Bootstrap技术，形成新的张量X’，则X’中不包含某个样本的概率为：

步骤2.3、通过新策略采样对张量进行采样，增加了张量分解性能间的差异度，从而提高了数据缺失估计的精度。形成最终张量数据集。

步骤3、模型构建阶段：

张量分解的目标是利用参数相对较少的简单结构，有效地再现多元数据中不同模态之间的复杂依赖关系和高阶相互作用，用高阶奇异值分解等工具来实现对体数据的近似。根据相关参数对不同张量分解器进行设定，针对基分解器进行最优权值计算，最终形成分解器组件，根据目标函数最终形成张量异质集成模型。

步骤3.1、设定基分解器

分别对利用新策略采样得到的数据进行张量分解，设定基分解器，形成分解器组件，提高多样性和准确性。

设X∈R^n×p×q表示路网速度数据三阶张量，其中n为道路区间，p为天数，q为每日数据采集点，此张量分布是由堆叠在一起的从不同时间中获得的网络分布矩阵{X₁,X₂,...,X_q}得到。

定义5CANDECOMP/PARAFAC模型。即张量CP分解，基本思想是近似使用低秩结构，做奇异值分解(SVD)的高阶推广。如下所示：设D为不完整张量配置，通过以下方式对观测数据进行重建误差最小化，得到一个合适的低秩近似

定义6HOSVD模型。张量HOSVD算法基于Tucker分解模型，将一个张量表示成一个核心张量和各维上因子矩阵相乘的形式[31]，是SVD在张量的高阶推广。其中

表示核心张量，为原始张量在各个维度上主成份的相关系数，因子矩阵

为各个维度上的主成份。

定义7HalRTC模型。高精度低秩张量完成模型，目标函数如公式(12)所示，其中，符号||·||_*表示迹范数。

步骤3.2、对基分解器进行权值最优组合

针对路网交通不完整时空数据插补，采用异质集成学习思想，把多个单一模型进行权值最优组合，从而获得更准确、稳定和强壮的最优结果。针对不同的张量基分解器模型进行异质集成形成组件分解器。

张量分解模型由张量分解提取出的主成分以及相关系数构成，以分解模型与原始张量的误差为优化目标，恢复张量结构下缺失的数据。由于张量秩的不确定性，分解模型与原始张量之间总是存在一定的误差，为进一步缩小误差，根据秩值设定权值最优，基于集成学习的异质集成张量分解模型并进行优化，从而提高数据插补精度。根据对比分析，所采取的张量分解模型分别为加权优化张量分解模型CP_WOPT、HOSVD-WOPT模型以及HalRTC模型，分别从不完整的网络配置张量D中获得相应的估计

CP_WOPT算法。利用CP分解模型，采用梯度优化的方法，基于一阶导数求解原始张量与分解模型之间误差的最优解。针对大规模稀疏张量，CP-WOPT算法采用稀疏的张量表示法，可解决大规模、高缺失比的张量插补问题。如公式(14)所示，W为与含缺失值的原始张量X大小相同的张量，其中已知元素值取1，未知元素值取0。A⁽¹⁾，A⁽²⁾，…，A^(N)为因子矩阵。

HOSVD–WOPT算法。算法是针对稀疏张量的基于Tucker分解模型，WOPT为带权值的优化。

HalRTC算法。矩阵B_i(i)表示张量B_i在模态i下的展开。

将张量模型进行异质集成，得到集成张量插补模型为：

步骤3.3、异质集成新的组件模型

张量分解的异质集成需要选择合适的分解器。由于每种分解器都各有其优缺点，其性能不仅取决于应用场景、数据集的类型，还需要考虑算法秩值、时间复杂度和精度等。因此，将多个种类的分解器进行集成，放大各自的优势，弥补缺陷。根据算法性能，这里选取CP_WOPT、HOSVD_WOPT及HalRTC算法作为组件的基张量分解器，对M_i进行张量分解。

对遴选的张量分解器做最优权值集成。权值代表分解器在集成中的重要性，计算3个基分解器函数A_w(x)，A_t(x)，A_h(x)最优权值p1，p2，p3，并可将其推广到N阶。分解器的泛化误差如公式，如公式(18)所示。

其中，A_i(x)表示分解器函数，

表示最优分解器。我们定义第i个分解器与第j个分解器的相关度如公式(19)所示。

加入组件分解器权重，根据公式(18)、(19)得到异质集成得泛化误差，如公式(20)所示。

张量分解器集成基于最优权值选取，伪代码描述如下：

步骤4、模型优化阶段：

原始张量和分解模型之间总是存在一定的误差，实际应用中，通常张量分解模型秩的设定为经验值设定。从实验中得知，CP算法便于理解和实现，但是该算法不能够确保获得全局最优的解，也不能保证收敛到某个驻点。最终的生成的CP分解模型在很大程度上依赖于初始的猜测值，这也使得CP分解模型不够“准确”，容易造成原始张量和CP分模型之间较大的误差，并不能完全提取出张量的主成分。算法适用于数据缺失比例不是很高的情况，如果数据缺失比例过大，该算法不仅运算速度非常慢，而且很有可能根本不收敛。HOSVD模型将张量的主成分存入因子矩阵，各维之间的协方差存入核心张量中，其较CP模型分解精度较高，但算法时间较长。HalRTC模型利用ADMMs方法，进行高质量低秩完成。因此，我们需要在算法秩值、时间复杂度和精度之间做一个权衡。附图6(a)是城市路网数据选择不同等级引起的算法重建性能的变化图；附图6(b)是高速路网数据选择不同等级引起的算法重建性能的变化图；

通过训练进行模糊神经网络(FNN)构建，接着对形成的张量异质集成模型进行优化，对比目标函数选择最优。

步骤4.1、通过训练与预测，进行模糊神经网络(FNN)的构建

T-S模糊神经网络具有很强的自适应能力，网络由前件网络和后件网络两部分组成，前件网络用来匹配模糊规则，后件网络用来产生模糊规则。

1)前件网络：前件网络由四层组成，第一层为模糊神经网络输入层。设输入向量x＝[x₁，x₂，…，x_n]^T，x_i为输入层的输入值，用于表示张量分解的各项指标m。中间一层为模糊化层，针对输入数据进行模糊处理，计算各输入分量执行相应的隶属度函数

其中i＝1,2,…n；j＝1,2,…m，n为输入参数，m为模糊子集数。隶属度函数如公式(21)所示，其中

和

分别为隶属度函数的中心和宽度。中间二层为模糊规则层，用于匹配模糊规则的前件，将隶属度进行模糊计算，采用模糊算子为连乘算子，如公式(22)所示。中间三层实现归一化计算，如公式(23)所示。

2)后件网络：后件网络由各结构相同的并列子网组成，每个子网产生一个输出量。T-S模糊规则后件是输入变量的线性组合，模糊系统的输出量为每条规则的输出量的加权平均。后件网络的第一层是输入层，其中x₀＝1，为模糊规则后件常数项。第二层计算每一条模糊规则后件，如公式(24)所示，其中

为模糊系统参数，y^j为输出。第三层为归一化后实际输出，如公式(25)所示。

3)模糊神经网络学习算法

网络期望输出与实际输出误差值e的计算，如公式(26)所示，其中，y_d为期望输出值，y_c为实际输出值。系数修正如公式(27)所示，参数修正如公式(28)、(29)、(30)所示，

其中，α为网络学习率。

步骤4.2、针对异质集成新的张量模型，进行FNN优化

对原始缺失数据进行张量分解，在组件分解器的基础上，张量分解异质集成的目标是优化组件分解器，最终使得路网数据得到最优插值结果。

利用组件分解器形成最优结果是一个全局优化问题。最直接和最常见的评价函数是集成分解器的预测误差。通常传统遗传算法、粒子群算法等针对全局优化效果较好，但算法复杂，计算效率相对较低。针对非线性候选集，T-S模糊神经网络模型易于优化。

在基于最优权值集成的张量分解器的基础上，用平均绝对百分比误差(MAPE)、加权相对误差(MAD)、均方根误差(RMSE)三个指标估算性能，秩值R选取范围为5-35，形成训练集

构建模糊神经网络模型进行优化，使得归算精度最高，从而优化插补结果。

第一层：模糊神经网络的输入层。模型分别引入CP_WOPT、HOSVD_WOPT及HalRTC基张量分解器的MAPE、MAD、RMSE，m＝9个精度指标，作为模型的输入函数。结合最优权值集成为输入的每个参数都对其定义了模糊集合的具体位置等级。指定

为模糊神经网络的每层输出值，对模糊神经网络本身进行样本训练。

第二层：模糊神经网络隶属函数生成层。针对输入数据进行模糊处理，计算各输入分量执行相应的隶属度函数μ(x_i)，其中

和

分别为隶属度函数的中心和宽度。

第三层：模糊神经网络规则层。相连系统输入变量的模糊子集。输入是隶属度，输出是相应规则的权重因子。

第四层：系统输出层。最优目标函数的性能指标。d_m是第m集对应于期望输出的输入矢量；y_m是对应于实际输出第m个输入向量，N是训练样本的总数。

实验中选取了100个训练数据集进行模型训练，选取20个数据集进行模型测试，其隐含层节点由经验公式

求得，其中M为隐藏节点数，I为输入节点数，O为输出节点数，

为经验值。目标函数如公式(18)所示：

其中，x_w、x_t、x_h分别为基础张量分解器。取100次运行集成运行结果数据，进行100次迭代进化，进行模型训练。训练及预测结果见附图2(a)和图2(b)。

测试环境与测试数据设置：

实验依托路网采集真实数据集，在不同数据规模、不同数据路网形式以及类元素随机缺失和类结构性光纤缺失的情况下，对模型性能进行实验研究。实验数据一：选取A城市路网交通速度数据集，数据量180万条；实验数据二：B城市局部高速公路路网交通速度数据，数据量15万条，在随机缺失数据10％-90％以及极端缺失和恶劣天气下的结构性光纤缺失情况进行了测试。将数据构造成X表示的原始张量，其中A城市数据用X₁∈R^214×61×144表示，B城市数据用X₂∈R^10×20×288表示。实验中，两种实验数据的缺失率

从10％到90％。附图3(a)为A城市路网交通数据10％-90％随机性缺失多维交通数据序列展示图；附图3(b)为B城市高速公路路网交通数据10％-90％光纤结构性缺失多维交通数据序列展示图；附图4为选取B城市高速公路某天11个观测点时间序列图；附图5(a)为A城市路网数据时间序列里某个观测点某天144个采集点的数据图及观测点平均数据；图5(b)是A城市观测点平均数据图，红色标记显示为休息日的平均速度；

本实例的实验测试结果如下：

1.由附图7可以看出，本发明提出的FNNTEL算法在不同数据集、不同缺失率(10％-90％)下的相对误差(Mape)，FNNTEL算法较FaLRTC、SaLRTC、BDCP、HTD归算精度好，且算法稳定性高。

2.由附图8可以看出，本发明提出的FNNTEL算法在不同数据集、不同缺失率(10％-90％)下的绝对误差(Mad)，FNNTEL算法较FaLRTC、SaLRTC、BDCP、HTD归算精度较好，且算法稳定性较高，只有在缺失80％以上精度有所波动。

3.由附图9可以看出，本发明提出的FNNTEL算法在不同数据集、不同缺失率(10％-90％)下的均方根误差(Rmse)，FNNTEL算法较FaLRTC、SaLRTC、BDCP、HTD归算精度较好，算法稳定性较高。

4.由附图10可以看出，本发明提出的FNNTEL算法在不同数据环境下，随机数据缺失在某路段的缺失修复数据与真实数据对比效果显示，尽管数据缺失情况严重，在已知的数据信息很少时，模型修复后的数据依然准确度较高，且能较完整反映出交通流的情况。

5.由附图11可以看出，本发明提出的FNNTEL算法在不同数据环境下，结构性光纤数据缺失在某路段的缺失修复数据与真实数据对比效果显示，尽管数据缺失情况严重，在已知的数据信息很少时，模型修复后的数据依然准确度较高，进一步证明了模型的优越性。由此可见，模型在随机缺失和结构性光纤缺失情景中具有一致和稳健的表现。

表1和表2给出了不同模型在不同道路类型，不同的数据缺失率下的估计精度误差。

表1百万级城市路网数据不同的数据缺失率下的估计精度

表2十万级高速路网数据不同的数据缺失率下的估计精度

Claims

1.一种基于FNN的张量异质集成车联网缺失数据估计方法，其特征在于该方法主要包括如下步骤：

第1、系统模型构建

包括数据张量模型和多维数据插补模型的建立；

第2、采样阶段

包括原始数据形成张量数据集，对数据集进行Bootstrap自主采样，形成最终张量数据集；

第3、模型构建阶段

根据相关参数形成分解器组件，针对基分解器进行最优权值计算，根据目标函数最终形成张量异质集成模型；目标函数如公式(12)所示，

为因子矩阵；

第3.1、分别对利用新策略采样得到的数据进行张量分解，形成分解器组件；

第3.2、对基分解器进行最优权值计算；

针对路网交通不完整时空数据插补，采用异质集成学习思想，把多个单一模型进行权值最优组合，针对不同的张量基分解器模型进行异质集成形成组件分解器，张量分解模型由张量分解提取出的主成分以及相关系数构成，以分解模型与原始张量的误差为优化目标，恢复张量结构下缺失的数据，张量分解模型分别为加权优化张量分解模型CP_WOPT、HOSVD-WOPT模型以及HalRTC模型，分别从不完整的网络配置张量D中获得相应的估计

CP_WOPT算法是利用CP分解模型，采用梯度优化的方法，基于一阶导数求解原始张量与分解模型之间误差的最优解，针对大规模稀疏张量，CP-WOPT算法采用稀疏的张量表示法，如公式(14)所示，W为与含缺失值的原始张量X大小相同的张量，其中已知元素值取1，未知元素值取0，A⁽¹⁾,A⁽²⁾,…,A^(N)为因子矩阵；

HOSVD–WOPT算法是针对稀疏张量的基于Tucker分解模型，WOPT为带权值的优化；

HalRTC算法是：

矩阵B_i(i)表示张量B_i在模态i下的展开，将张量模型进行异质集成，得到集成张量插补模型为：

第3.3、异质集成新的组件模型；

张量分解的异质集成选取CP_WOPT、HOSVD_WOPT及HalRTC算法作为组件的基张量分解器，对遴选的张量分解器做最优权值集成，权值代表分解器在集成中的重要性，计算3个基分解器函数A_w(x)，A_t(x)，A_h(x)最优权值p1，p2，p3，并可将其推广到N阶，分解器的泛化误差如公式，如公式(18)所示，