CN112836439A

CN112836439A - 用于处理传感器数据的方法和设备

Info

Publication number: CN112836439A
Application number: CN202011329844.2A
Authority: CN
Inventors: A·卢克; M·坎德米尔
Original assignee: Robert Bosch GmbH
Current assignee: Robert Bosch GmbH
Priority date: 2019-11-25
Filing date: 2020-11-24
Publication date: 2021-05-25
Also published as: KR20210064070A; US20210158158A1; EP3825921A1

Abstract

根据各种实施例，提供了用于处理传感器数据的方法和设备，所述方法包括：接收输入传感器数据；从作为初始状态的输入传感器数据开始确定多个结束状态，包括针对每个结束状态确定状态序列，其中确定状态序列包括针对以初始状态开始直到结束状态的序列的每个状态，第一贝叶斯神经网络响应于输入相应状态来确定漂移项样本；第二贝叶斯神经网络响应于输入相应状态来确定扩散项样本；以及通过对随机微分方程进行采样来确定后续状态，所述随机微分方程包括作为漂移项的漂移项样本和作为扩散项的扩散项样本。所述方法进一步包括从所确定的多个结束状态确定结束状态概率分布，以及从结束状态概率分布确定输入传感器数据的处理结果。

Description

用于处理传感器数据的方法和设备

技术领域

本公开涉及用于处理传感器数据的方法和设备。

背景技术

传感器数据的回归分析结果可以应用于各种控制任务。例如，在自主驾驶场景中，车辆可以执行对指示道路曲率的传感器数据的回归分析以导出最大速度。然而，在许多应用中，相关的不仅有结果是什么（例如上面示例中的最大速度），而且还有结果有多确定。例如，在自主驾驶场景中，车辆控制器应当在相应地控制车辆之前，将最大可能的最大速度的预测是否具有足够的确定性考虑在内。

Ricky T. Q. Chen, Yulia Rubanova, Jesse Bettencourt, David Duvenaud的出版物“Neural Ordinary Differential Equations”（NeurIPS，2018）引入了一种管控常微分方程（ODE）动力学的神经网络，作为学习系统中的通用构造块。输入模式被设置为该ODE的初始值。然而，这是完全确定性的动力学系统，因此它不能表达不确定性。

发明内容

鉴于上述情况，为输出提供不确定性信息的灵活的机器学习方法是合期望的。

具有独立权利要求1（对应于下面的示例1）和独立权利要求7（对应于下面的示例7）的特征的方法和设备允许通过将流动力学（flow dynamics）建模为随机微分方程（SDE）并且量化预测不确定性，而与确定性方法相比实现改进的鲁棒性。具体地，通过在SDE的漂移和扩散项上分配贝叶斯神经网络（BNN）来改进鲁棒性。通过以该方式使用BNN，引入了来自BNN权重的第二随机性源（除了用于扩散的维纳过程之外），所述第二随机性源改进鲁棒性和预测不确定性分配的质量。

另外，与基于丢弃（dropout）的方法相比，根据独立权利要求的方法和设备不需要手动丢弃率调整，并且提供比固定率丢弃更丰富的解族（solution family）。

在下文中，给出了各种示例。

示例1是一种用于处理传感器数据的方法，所述方法包括接收输入传感器数据；从作为初始状态的输入传感器数据开始确定多个结束状态，包括针对每个结束状态确定状态序列，其中确定状态序列包括针对以初始状态开始直到结束状态的序列的每个状态，第一贝叶斯神经网络响应于输入相应状态来确定漂移项样本；第二贝叶斯神经网络响应于输入相应状态来确定扩散项样本；以及通过对随机微分方程进行采样来确定后续状态，所述随机微分方程包括作为漂移项的漂移项样本和作为扩散项的扩散项样本；从所确定的多个结束状态确定结束状态概率分布；以及从结束状态概率分布确定输入传感器数据的处理结果。

示例2是根据示例1的方法，进一步包括使用随机梯度朗之万（Langevin）动力学来训练第一贝叶斯神经网络和第二贝叶斯神经网络。

SGLD允许推断模型参数，规避诸如近似分布的有限表达性之类的变分推断的缺点。

示例3是根据示例1或2的方法，其中处理结果包括控制值和关于控制值的不确定性信息。

不确定性信息允许标识模型的错误预测（或至少是模型对于其不确信的预测），并且因此避免错误的控制决策。

示例4是根据示例3的方法，其中确定结束状态概率分布包括估计结束状态的均值向量和协方差矩阵，并且其中从结束状态概率分布确定处理结果包括从结束状态的所估计的均值向量确定预测均值以及从结束状态的所估计的协方差矩阵确定预测方差。

向量取值的结束状态因此可以被降低到一维值（包括在方差方面的不确定性信息），其可以例如用于致动器控制。

示例5是根据示例4的方法，其中确定处理结果包括通过线性层处理所估计的均值向量和所估计的协方差矩阵，所述线性层执行所估计的均值向量到一维预测均值的仿射映射以及所估计的协方差矩阵到一维预测方差的线性映射。

处理结果的线性推导允许不确定性信息从结束状态概率分布到处理结果的适当传播。

示例6是根据示例1至5中任一个的方法，包括使用处理结果控制致动器。

基于第一示例的方法控制致动器允许确保例如车辆的安全控制。

示例7是适于执行根据示例1至6中任一个的方法的神经网络设备。

示例8是一种软件或硬件代理、特别是机器人，其包括适于提供传感器数据的传感器和根据示例7的神经网络设备，其中所述神经网络设备被配置为执行传感器数据的回归或分类。

示例9是根据示例8的软件或硬件代理，包括致动器和控制器，所述控制器被配置为使用来自神经网络设备的输出来控制至少一个致动器。

示例10是一种包括计算机指令的计算机程序，所述计算机指令当由计算机执行时，使计算机执行根据示例1至6中任一个的方法。

示例11是一种包括计算机指令的计算机可读介质，所述计算机指令当由计算机执行时，使计算机执行根据示例1至6中任一个的方法。

附图说明

在附图中，相同的参考符号贯穿不同的视图一般指代相同的部分。附图不一定是按比例的，而是一般将重点置于说明本发明的原理上。在以下描述中，参考以下附图描述了各个方面，其中：

图1示出了用于自主驾驶场景中的回归的示例。

图2示出了根据实施例的机器学习模型的图示。

图3示出了图示根据实施例的用于处理传感器数据的方法的流程图。

具体实施方式

以下详细描述参考了附图，附图通过图示的方式示出了其中本发明可以被实践的本公开的具体细节和方面。在不脱离本发明的范围的情况下，可以利用其他方面，并且可以进行结构、逻辑和电气改变。本公开的各个方面不一定相互排斥，因为本公开的一些方面可以与本公开的一个或多个其他方面相组合以形成新的方面。

在下文中，将更详细地描述各种示例。

图1示出了用于自主驾驶场景中的回归的示例。

在图1的示例中，例如汽车、货车或摩托车之类的车辆101被提供有车辆控制器102。

车辆控制器102包括例如处理器（例如CPU（中央处理单元））103之类的数据处理组件、以及存储器104，该存储器104用于存储车辆控制器102根据其进行操作的控制软件和处理器103对其进行操作的数据。

在该示例中，存储的控制软件包括指令，该指令当由处理器103执行时，使处理器实现回归算法105。

存储在存储器104中的数据可以包括来自一个或多个传感器107的输入传感器数据。例如，一个或多个传感器107可以包括测量车辆101速度和表示道路曲率的传感器数据（其可以例如从由用于确定道路方向的对象检测处理的图像传感器数据中导出）、道路状况等的传感器。因此，传感器数据例如可以是多维的（曲率、道路状况……）。回归结果例如可以是一维的。

车辆控制器102处理传感器数据并且确定例如最大速度之类的回归结果，并且可以使用回归结果控制车辆。例如，如果回归结果指示高于车辆101的测量当前速度的最大速度，则它可以致动中断108。

回归算法105可以包括机器学习模型106。可以使用训练数据来训练机器学习模型106以做出预测（诸如最大速度）。由于与控制任务相关的安全问题，可以选择机器学习模型106，其不仅输出回归结果，而且还输出其对回归结果的确定性的指示。当控制车辆101时，控制器102可以将该确定性考虑在内，例如，在预测的确定性低（例如在预定阈值以下）的情况下，即使它在预测的最大速度以下也制动。

广泛使用的机器学习模型是深度神经网络。深度神经网络被训练成实现将输入数据（换言之，输入模式）非线性变换成输出数据（输出模式）的函数。如果神经网络作为残差神经网络，则它的处理流水线可以被视为跨偶数时间间隔被离散化的ODE（常微分方程）系统。在连续时间ODE方面重新表述该模型被称为神经ODE。

根据各种实施例，提供了一种通用贝叶斯神经模型（其例如可以用作机器学习模型106），其包括求解SDE（统计微分方程）作为用以对激活图的流进行建模的中间步骤。SDE的漂移函数和扩散函数被实现为贝叶斯神经网（BNN）。

根据神经-ODE方法，神经网络的处理被公式表示为：

，

其中

反映神经网络的参数，并且

是层

的输出。这可以解释为用于求解具有步长大小为1的ODE的显式欧拉方案。

利用该解释，上面的方程可以被重新公式表示为：

。

因此，ODE演算可以用于通过神经网络进行传播。为了使该方程为随机的，考虑随机常微分方程。以一般形式，它们被给出为：

。

该方程由漂移

和扩散

管控，漂移

对确定性部分进行建模，扩散

对随机部分进行建模。对于

，获得标准的ODE。求解上面的方程需要针对布朗运动

积分，所述布朗运动

反映微分方程的随机部分。该微分方程的一种常见且容易的近似方法是欧拉-丸山（Euler-Maruyama）方案：

是具有以下性质的高斯随机变量：

。

当变量

是向量

时，该近似也成立。在这种情况下，扩散项是输入和时间的矩阵取值函数

，并且对应的

被建模为独立于P的维纳过程

，其中

作为P维单位矩阵。

如上面所陈述的，根据各种实施例，

和

各自由相应的贝叶斯神经网络（BNN）提供，其中计算

的BNN的权重由

标示，并且计算

的BNN的权重由

标示。权重可以至少部分地在BNN之间共享，即

。

结果得到的概率性机器学习模型可以通过下式来描述

。

第一行是关于SDE参数（在这种情况下是BNN的权重）的先验，第二行是SDE的解，并且最后一行是适合于机器学习模型的输出空间的可能性。𝑇是对应于模型容量的流的持续时间。

图2示出了机器学习模型的图示。

输入是向量x。

对于作为初始条件的（输入观察）向量x，表示连续时间激活图h(t)的随机过程201的实现被确定为SDE的解。从1到T的所有t的h(t)（其中例如

）可以被看作输入模式x在每一时刻t处的潜在表示。机器学习模型进行该确定的部分被称为差分贝叶斯神经网（DBNN）。它包括相应地提供SDE的均值项和扩散项的BNN 202、203（每个将h(t)和t取作输入）。DBNN输出一个输出值h(T)（其可以是与输入向量x相同维度的向量）。

取决于应用，附加的（例如线性）层204计算模型的输出y，例如对于输入传感器数据向量x的回归结果。该附加层204可以特别地将h(T)（其可以被看作结束状态）的维度降低到期望的输出维度，例如从向量h(T)生成实数y。

随机过程的概率分布由下式给出

其中

是对应于维纳过程

的布朗运动。应当注意的是，在方程右手侧的第二个积分是伊藤积分，不像第一个积分。相关的SDE是

其中𝑚(.,.)是管控动力学流的漂移项，并且𝐿(.,.)是扩散项，其使运动在每一刻抖动。概率

不具有跨所有神经网架构一般化的封闭式表达。然而，可能的是通过诸如欧拉-丸山之类的离散化规则从其取得近似样本。

根据一个实施例，作为应变方法，根据下式通过蒙特卡罗积分将随机过程排除在可能性之外，

其中

是第m次欧拉-丸山平局在时间T的实现。在已经将随机过程积分出来的情况下，可以通过关于

的近似后验推断问题来训练模型。对随机过程h的样本驱动的解自然地集成到马尔可夫链蒙特卡罗（MCMC）方案中。根据一个实施例，具有块衰减结构的随机梯度朗之万动力学（SGLD）用于受益于作为子例程的梯度下降算法（其对有效地训练神经网络是必要的）。

在下文中，描述了一种用于模型的训练算法，即用于监督式学习以从训练数据（包括多个小批次）确定θ ₁和θ ₂的算法。

应当注意的是，可以使用反向传播来确定梯度

。进一步应当注意的是，θ ₁的概率分布和θ ₂的概率分布可以通过存储最新迭代（例如针对最后的100i）的值来确定，以到达经训练的BNN 202、203。

对于回归，附加的线性层204被置于h(T)上方，以便匹配输出维数。由于分布

的性质可以在均值

和协方差（的乔莱斯基分解（Choleskydecompose））

方面来被估计。两个矩可以被确定，并且然后通过线性层204传播。因此，预测均值被建模为

，并且预测方差被建模为

。在假设不相关的激活图维度的情况下，将

设计为对角矩阵是可能的。

此外，可以通过在

的乔莱斯基分解上分配DBNN输出来使

参数化，或者可以采取形式

的任何其他结构。当选择P < D时，可能的是严重地减小高维输入的可学习参数的数量。

总之，根据各种实施例，提供了如图3中所图示的方法。

图3示出了图示根据实施例的用于处理传感器数据的方法的流程图300。

在301中，接收输入传感器数据。

在302中，从作为初始状态的输入传感器数据开始确定多个结束状态。

这包括针对每个结束状态确定状态序列，其中确定状态序列包括针对以初始状态开始直到结束状态的序列的每个状态，

第一贝叶斯神经网络响应于输入相应状态来确定漂移项样本；

第二贝叶斯神经网络响应于输入相应状态来确定扩散项样本；和

通过对随机微分方程进行采样来确定后续状态，所述随机微分方程包括作为漂移项的漂移项样本和作为扩散项的扩散项样本。

在303中，从确定的多个结束状态确定结束状态概率分布。

在304中，从结束状态概率分布确定输入传感器数据的处理结果。

根据各种实施例，换言之，在求解随机微分方程的每个步骤处，使用BNN来提供漂移项和扩散项。除了通过求解随机微分方程（通过对布朗运动进行采样）而提供的不确定性信息之外，由BNN（通过对BNN权重进行采样）提供的不确定性信息也为处理结果提供信息，该处理结果例如是回归结果，例如用于取决于传感器数据来控制设备。

图3的方法可以在将输入模式映射到输出模式的所有学习系统中用作通用构造块。它可以充当中间处理步骤，其提供丰富的映射族，然后可以将其参数调整到特定的数据集。只要可以使用前馈神经网络，就可以使用图3的方法。此外，它在安全关键的应用中尤其有用，在安全关键的应用中，在取决于计算机系统的预测采取下游行动之前，该预测需要被证实，或者需要考虑其不确定性。

特别地，图3的方法可以应用于所有监督式学习设定中，在监督式学习设定中，可以针对输出表达可能性分布（例如针对连续输出的正态分布，针对离散输出的多项式分布）。此外，它可以应用于其中潜在表示与观察具有相同维数的任何生成方法中。它可以进一步应用于在推断问题（诸如变分推断）中使用合成BNN权重分布作为近似分布的超网中。应用的示例是图像分割和强化学习。

图3的方法可以由包括一个或多个数据处理单元的一个或多个计算机执行。术语“数据处理单元”可以理解为允许数据或信号处理的任何类型的实体。例如，可以根据由数据处理单元执行的至少一个（即，一个或多于一个）具体功能来处置数据或信号。数据处理单元可以包括模拟电路、数字电路、复合信号电路、逻辑电路、微处理器、微控制器、中央处理单元（CPU）、图形处理单元（GPU）、数字信号处理器（DSP）、可编程门阵列（FPGA）集成电路或其任何组合，或者由它形成。实现相应功能的任何其他方式（其将在下面更详细地描述）也可以被理解为数据处理单元或逻辑电路。将理解的是，本文详细描述的一个或多个方法步骤可以由数据处理单元通过由数据处理单元执行的一个或多个具体功能来执行（例如来实现）。

第一贝叶斯神经网络和第二贝叶斯神经网络可以通过针对多个训练数据单元中的每一个，将训练数据单元针对输入传感器训练数据的处理结果与训练数据单元的参考值进行比较来训练。

一般地，图3的方法可以用于从输入传感器数据生成控制数据，例如用于控制机器人的数据。术语“机器人”可以理解为指代任何物理系统（具有其移动被控制的机械部件），诸如计算机控制的机器、车辆、家用器具、电动工具、制造机器、个人助理或访问控制系统。

神经网络可以用于对数据进行回归或分类。术语分类被理解为包括语义分割，例如图像的语义分割（其可以被视为逐像素分类）。术语分类也被理解为包括检测，例如对象的检测（无论该对象是否存在，其都可以被视为分类）。回归特别地包括时间序列建模。

尽管本文已经说明和描述了具体实施例，但是本领域的普通技术人员将领会，在不脱离本发明的范围的情况下，多种替代和/或等同的实现方式可以代替所示出和描述的具体实施例。本申请意图覆盖本文讨论的具体实施例的任何改编或变型。因此，意图本发明仅由权利要求及其等同物来限制。

Claims

1.一种用于处理传感器数据的方法，所述方法包括：

接收输入传感器数据；

从作为初始状态的输入传感器数据开始确定多个结束状态，包括针对每个结束状态确定状态序列，其中确定状态序列包括针对以初始状态开始直到结束状态的序列的每个状态，

通过对随机微分方程进行采样来确定后续状态，所述随机微分方程包括作为漂移项的漂移项样本和作为扩散项的扩散项样本；

从所确定的多个结束状态确定结束状态概率分布；以及

从结束状态概率分布确定输入传感器数据的处理结果。

2.根据权利要求1所述的方法，进一步包括：

使用随机梯度朗之万动力学训练第一贝叶斯神经网络和第二贝叶斯神经网络。

3.根据权利要求1或2所述的方法，其中处理结果包括控制值和关于控制值的不确定性信息。

4.根据权利要求3所述的方法，其中确定结束状态概率分布包括估计结束状态的均值向量和协方差矩阵，并且其中从结束状态概率分布确定处理结果包括从结束状态的所估计的均值向量确定预测均值以及从结束状态的所估计的协方差矩阵确定预测方差。

5.根据权利要求4所述的方法，其中确定处理结果包括通过线性层处理所估计的均值向量和所估计的协方差矩阵，所述线性层执行所估计的均值向量到一维预测均值的仿射映射以及所估计的协方差矩阵到一维预测方差的线性映射。

6.根据权利要求1至5中任一项所述的方法，包括使用处理结果控制致动器。

7.一种适于执行根据权利要求1至6中任一项的方法的神经网络设备。

8.一种软件或硬件代理、特别是机器人，包括

适于提供传感器数据的传感器；和

根据权利要求7的神经网络设备，其中所述神经网络设备被配置为执行传感器数据的回归或分类。

9.根据权利要求8所述的软件或硬件代理，包括致动器和控制器，所述控制器被配置为使用来自神经网络设备的输出来控制至少一个致动器。

10.一种包括计算机指令的计算机程序，所述计算机指令当由计算机执行时，使计算机执行根据权利要求1至6中任一项的方法。

11.一种包括计算机指令的计算机可读介质，所述计算机指令当由计算机执行时，使计算机执行根据权利要求1至6中任一项的方法。