CN116508081A

CN116508081A - 用于车辆交通信号优化的设备和方法

Info

Publication number: CN116508081A
Application number: CN202080106722.9A
Authority: CN
Inventors: 克里斯蒂安•阿克塞尼; 斯蒂法诺•波托利; 戈茨·布拉舍
Original assignee: Huawei Cloud Computing Technologies Co Ltd
Current assignee: Huawei Cloud Computing Technologies Co Ltd
Priority date: 2020-11-09
Filing date: 2020-11-09
Publication date: 2023-07-28
Also published as: WO2022096130A1

Abstract

本发明描述了一种车辆交通控制设备(1801)，用于通过以下方式控制交通信号(303，1001)：存储(1701)多个数据集，对于相应的过去时间段，每个数据集包括以下内容的表示：(i)在过去一段时间内交通信号的状况，(ii)在过去一段时间之前的第一交通状况和(iii)在过去一段时间之后的第二交通状况；检测(1702)当前交通状况；比较(1703)当前交通状况与第一交通状况；并根据该比较，选择(1704)数据集之一，并使交通信号采用该数据集中表示的状况。通过这种设备，可以根据当前交通状况，利用先前场景中的决策来优化交通信号。

Description

用于车辆交通信号优化的设备和方法

技术领域

本发明涉及车辆交通控制，具体而言，涉及根据当前交通状况，利用先前场景中的决策来优化交通控制决策和信号。

背景技术

交通拥堵给城市基础设施带来严峻挑战，也因等待交通浪费时间而影响居民的社会经济生活。

交通响应信号控制系统是一种调整位于道路交通基础设施中的交通信号设置(例如，调整周期、绿色分割和偏移)的方法。这些设置根据对交通状况的估计实时优化给定的目标函数，例如最大限度地减少行驶时间或停车，以改善车辆流量，如图1所示。控制信号(例如，交通灯的绿灯时间/红灯时间)与测得的结果(例如，在任意固定时间内通过某个点的车辆数量，称为交通流)之间的联想描述了道路、交叉口或区域交通的时间和空间动力学。为了优化流量和最大限度地减少延迟时间，系统需要找到最佳的交通信号配时。

在图2中，描述了一个典型的道路交通场景。对于单个交叉口，交通动力学(即红灯(R)、绿灯(G)和黄灯(Y)中的每一个的交通灯配时)决定了流量控制，并且车辆的瞬态(例如，启动损失、有效流量)按其顺序和到交通灯的距离(例如，队列疏散率)排序，直到可以达到饱和流量的连续绿灯时间。在图2中，Y_i是在交通信号相位之间出现的黄灯加全红灯间隔，以在冲突的运动被释放之前提供交叉口的间隙；I₂是信号相位之间的时间，在此期间交叉口不被任何车辆使用；d_i是当控制信号导致车道组降低速度或停止时产生的延迟分量，它是通过与非受控条件比较来测量的；C_i是信号完成一个周期长度的总时间；R_i是信号周期中，对于给定的相位或车道组，信号为红灯的周期；G_i是信号交叉口给定移动的绿灯指示持续时间；I₁是由于需要对绿灯相位的启动做出反应并加速，在大于饱和车头时距的信号交叉口排队的前几辆车所消耗的额外时间。

为了最大限度地减少等待时间，已经考虑了优化相邻交叉口交通灯信号顺序的方法。这些方法需要评估通过的车辆数量，并相应调整交通灯的配时，以最大限度地提高流量。

许多以前的模型在大规模场景实践中表现不佳的原因之一是，它们在控制交通信号时未能充分利用交通流的因果耦合或联想和内在动力学。此外，典型的(静态)系统在描述系统及其连续变化(方差)时，不会随着计算工作量的增加而扩展。

因此，我们希望开发一种克服这些问题的交通控制设备和方法。

发明内容

根据第一方面，提供了一种车辆交通控制设备，其用于通过以下方式控制交通信号：存储多个数据集，对于相应的过去时间段，每个数据集包括以下内容的表示：(i)在过去一段时间内交通信号的状况，(ii)在过去一段时间之前的第一交通状况和(iii)在过去一段时间之后的第二交通状况；检测当前交通状况；将当前交通状况与第一交通状况进行比较；并根据该比较，选择其中一个数据集，并使交通信号采用该数据集中所表示的状况。

通过这种设备，可以根据当前交通状况，利用先前场景中的决策来优化交通信号。

第一和第二交通状况的表示可以包括指示交通流的数据。交通信号的状况的表示可以包括指示交通信号的绿灯时间(或另一流许可模式)的数据。

该设备可以用于进一步根据预定目标来选择数据集之一。该设备可用于根据当前交通状况选择数据集之一，以优化目标。目标可以是最大限度地提高交通流。因此，该设备可以允许车流量最大化，从而减少交通拥堵和等待时间。

检测到的当前交通状况可以包括交通数据的时间序列。利用该序列，可以评估一段时间内的交通状况。

可以利用一个或多个传感器收集的传感数据推导检测到的当前交通状况，每个传感器包括摄像机和感应回路之一。这样的传感器可以设置在具体环境中，并可以捕获当前交通状况。例如，摄像机可以记录一系列图像，然后利用这些图像确定交通流(即每任意固定时间单位通过一个点的汽车数量)。

该设备可用于根据输入数据的部分时间序列来检测当前交通状况。因此，使用不连续或间歇性操作的传感器仍能检测当前的交通状况。

该设备可用于根据多个交通上下文之一来检测当前交通状况。所述多个交通上下文可以包括交通车道的绿灯时间和交通车道的交通流。当仅根据该数据(即，根据不连续的交通传感器或间歇性操作的交通灯)呈现部分信息时，设备可以检索完整的上下文(例如，所有流和绿灯时序)。或者，设备可以学习记忆，以便在根据另一个类别(即车道上的交通流)呈现数据上下文时，从一个类别(即车道的绿灯时间)回忆联想的数据上下文。

可以使用人工智能模型学习多个数据集。因此，可以学习数据之间的联想。

人工智能模型可以是神经网络。一种方便的实现。例如，神经网络可以是循环神经网络，如Hopfield网络，其使用相关学习来收敛到其中权重最小化交通测量中约束的能量函数(例如，测得的流量和分配的绿灯时间之间的约束)的方案。

该设备可以用于学习过去一段时间的交通信号的状况与过去一段时间之后的第二交通状况之间的映射。这样就可以学习随后可以由设备使用的联想。

该设备可用于根据检测到的当前交通状况，随时间迭代更新模型的参数。因此，设备可以实时适应变化，这是交通控制的一个重要特征。这样可以提高性能。

此外，该设备还可以用于根据所选择的数据集生成交通信号的时间计划。时间计划可以针对未来的一段时间。该未来的一段时间可以在检测到当前交通状况的时间段之后。因此，该设备的输出可以应用于交通控制单元，后者又会更新交通信号，以便根据存储的数据集和当前状况最大化交通流。

该设备可以由一个或多个计算机处理器实现。因此可以将设备部署在专用硬件或云中。

根据第二方面，提供了一种控制车辆交通信号的方法，该方法包括：存储多个数据集，对于相应的过去时间段，每个数据集包括以下内容的表示：(i)在过去一段时间内交通信号的状况，(ii)在过去一段时间之前的第一交通状况和(iii)在过去一段时间之后的第二交通状况；检测当前交通状况；将当前交通状况与第一交通状况进行比较；并根据该比较，选择其中一个数据集，并使交通信号采用该数据集中所表示的状况。

该方法可以包括进一步根据预定目标来选择数据集之一。该方法可以包括根据当前交通状况选择数据集之一，以优化目标。目标可以是最大限度地提高交通流。因此，该方法可以允许车流量最大化，从而减少交通拥堵和等待时间。

可以利用一个或多个传感器收集的传感数据推导检测到的当前交通状况，每个传感器包括摄像机和感应回路之一。从每个传感器接收的数据可以包括值的时间序列。因此，传感器连续生成的数据可以随着时间的推移测量交通指标。

该方法可以包括根据输入数据的部分时间序列来检测当前交通状况。因此，使用不连续或间歇性操作的传感器能检测当前的交通状况。

该方法可以包括根据多个交通上下文之一来检测当前交通状况。所述多个交通上下文可以包括交通车道的绿灯时间和交通车道的交通流。该方法可以包括在仅根据该数据(即，根据不连续的交通传感器或间歇性操作的交通灯)呈现部分信息时，检索具有完整的上下文(例如，流和绿灯时序)的数据集。或者，可以学习记忆，以便在根据另一个类别(即车道上的交通流)呈现数据上下文时，从一个类别(即车道的绿灯时间)回忆联想的数据上下文。

该方法可以包括学习过去一段时间的交通信号的状况与过去一段时间之后的第二交通状况之间的映射。

该方法可以包括根据检测到的当前交通状况，随时间迭代更新模型的参数。因此，该方法可以实时适应变化，这是交通控制的一个重要特征。这样可以提高性能。

此外，该方法可以包括根据所选择的数据集生成交通信号的时间计划。时间计划可以针对未来的一段时间。该未来的一段时间可以在检测到当前交通状况的时间段之后。因此，该设备的输出可以应用于交通控制单元，后者又会更新交通信号，以便根据存储的数据集和当前状况最大化交通流。

车辆交通信号优选为交通灯，但是，也可以使用其他交通信号。

附图说明

下面结合附图通过示例的方式对本发明进行描述。在附图中：

图1示出了区域交通控制系统、本地交通灯和流量控制的图形描述。

图2示出了通用交通灯信号控制系统和相关内部动力学的概述。

图3示出了设备所用架构的概述。

图4示出了组成该设备的模块。

图5示出了内部神经网络动力学。

图6示出了一个示例神经网络结构和吸引子/记忆动力学解释。

图7示出了一个示例性神经网络，并将学习规则映射到交通动态。

图8示出了记忆动力学。

图9示出了本文描述的设备的运行时功能的示例。

图10(a)示出了显示具有多个交通信号的道路交通基础设施的区域布局的示例性实例，其中每个交通信号都位于相应的道路交通交叉口。图10(b)示出了如何将基础设施建模为5x5(N＝5)城市道路基础设施，该基础设施由用于控制道路网中流量的耦合振荡器系统描述。

图11示出了显示网络内部结构的设备的示例性实例。

图12示出了显示从时间序列中学习记忆模式的网络的设备的示例性实例。

图13示出了显示规模记忆回忆能力的设备的示例性实例。

图14(a)至14(c)示出了显示异联想记忆模式的设备的示例性实例。有三个输入：图14(a)所示的键(M＝2，控制信号)、图14(b)所示的值(K＝3，交通流)和图14(b)所示的学习信号。

图15(a)示出了显示异联想记忆模式分析可视化的设备的示例性实例。

图15(b)示出了显示异联想记忆模式分析的设备的示例性实例。

图16示出了本文所述方法的初步性能评估。

图17示出了用于控制车辆交通信号的方法的步骤的流程图。

图18示出了用于实现本文所述方法的设备的示例。

具体实施方式

本发明的实施例涉及交通控制的领域，具体而言，涉及根据当前交通状况，利用先前场景中的决策来优化交通控制决策。在一些实施例中，本文描述的设备还可以学习用于交通信号优化的上下文记忆(联想)。

典型的交通控制系统会检测各种交通变量(如交通流或等候车辆的队列)，以便计算最大限度地提高车流的交通信号的配时。为了优化交通控制，本文描述的设备可以利用先前获得的关于所采取的操作(例如，交通信号配时配置，或绿灯时间)以及作为该操作的结果的测得的结果(例如，测得的交通流是什么)的知识，并可以将其应用于当前交通状况以优化目标，例如最大化交通流。这可以通过回忆相应的联想或记忆来减少重新计算信号的需求，从而使控制循环更快。

交通数据通常以时间序列的形式接收，时间序列是从各种来源(例如传感器，如摄像机、街道感应回路传感器、污染传感器、噪音传感器、天气传感器)收集的一系列时间索引值(即包含各种类型数据的元组，例如车辆数量、车辆速度等)，并按时间顺序排列。这些传感器通常在空间上分布于城市基础设施中。

尽管是高度非线性的，但交通动力学在某些时间尺度上是有规律的。这种规律性和可用的传感数据可用于明智地提取交通上下文，这些上下文随后可用于优化交通状况。

描述道路交通的丰富时空信息，连同交通信号产生的控制信号，描述了复杂的动力学。这种动力学可以通过联想来捕获，而联想可以通过学习所采取的操作(如交通灯配时)和测得的结果(如车辆流量)的对来获得。尽管具有高度非线性的特性，但交通是由高粒度(例如每日概况)或中等粒度(例如早晨和下午)的规则形状描述的。这些规律可以支持学习联想，从而加快交通控制设备适应变化和改进控制目标的能力。

本文描述的设备可以聚合描述当前交通上下文(例如，根据传感器数据确定的车辆交通流)和生成的控制信号的各种道路交通变量或时间序列；从这些聚合操作和交通状况的后果中学习联想；以及最后，利用从当前交通(例如，当前交通流)感测的给定信息，根据从先前经验中学习到的联想，预测交通信号配时的最佳控制信号。如上所述，可以这样做以优化目标，例如最大化交通流。

总之，该设备用于存储多个数据集，在此也称为记忆或联想。对于相应的过去时间段，每个数据集包括以下内容的表示：(i)过去一段时间内交通信号的状况，(ii)过去一段时间之前的第一交通状况和(iii)过去一段时间之后的第二交通状况。记忆可以本地存储在设备内，也可以远程存储，例如在云中，并根据需要由设备检索。

然后，设备检测当前的交通状况。可以评估一段时间内的当前交通状况，例如5分钟或30分钟。检测到的当前交通状况可以包括交通数据的时间序列。例如，设备可以通过从一个或多个传感器(例如摄像机或感应回路)接收传感数据来检测当前交通状况，这可以给出当前交通流的指示。如下文详述，设备可以根据输入数据的部分时间序列来检测当前交通状况。例如，根据不连续或间歇性工作的传感器收集的数据。

然后，设备将当前交通状况与多个数据集的相应过去一段时间之前的第一交通状况进行比较。根据该比较，设备选择其中一个数据集，并使交通信号采用该数据集中表示的状况。

设备可以用于进一步根据预定目标来选择数据集之一，并且可以选择数据集之一以优化目标。例如，预定目标可以是优化交通流。

该设备可用于根据多个交通上下文之一来检测当前交通状况。所述多个交通上下文可以包括交通车道的绿灯时间和交通车道的交通流。如下文详述，设备可以使用自联想或异联想模式。

多个数据集可以使用人工智能模型，特别是神经网络来学习，如下文详述。该设备可以用于学习过去一段时间的交通信号的状况与过去一段时间之后的第二交通状况之间的映射。为了提高模型的准确性，设备可以用于根据检测到的当前交通状况，随时间迭代更新模型的参数。

此外，该设备还可以用于根据所选择的数据集生成交通信号的时间计划。这就可以生成信号的时间计划，以最大限度地提高车辆的流量。因此，这种方法可用于控制交通信号序列，以随后最大限度地提高车辆的流量并缓解拥堵。

道路交通流的优化优选连续执行，以适应当前交通数据的输入流(例如检测到的交通流、绿灯时间等)，并相应地更新学习的模型。所考虑的场景非常适合这样的设备，即该设备能够连续计算描述交通状况的最佳配时，学习联想描述交通控制环路动力学的变量(即测得的流量、交通信号配时)，并适应变化以改进道路交通控制。

当数据进入设备时，计算的处理时间跨度有限，资源分配和执行时间有限，从而产生执行简单操作的结果。本发明的实施例可以克服资源贪婪、计算昂贵且复杂的现有方法，例如参考微分方程和数值方法的复杂分析流模型、经验方法、非线性控制系统。

完整系统300具有如图3所示的模块化结构。这些模块根据输入的传感时间序列数据协同工作。稍后将参考图4更详细地描述模块的元素。通常，该系统具有灵活的基础设施，该基础设施获取描述交通状况(例如，汽车流量)或其他传感器的测得的传感数据，以及交通信号控制时间序列。这样的上下文信息包含内在联想模式，上下文记忆学习模块301提取这些内在联想模式并将其表示为高效计算基底中的记忆。该系统具有适用于任何道路交通布局、大小和架构(即每个方向的车道数量等)的可解释输出/预测，该功能由上下文记忆预测模块302支持。来自模块302的输出可用于控制交通信号303，其可以位于道路交通交叉口304(两条或更多道路的交叉口)。当前交通数据可以由位于一个或多个交叉口的至少一个传感器确定。

为了增强其普遍适用性，该设备不需要显式编码交通约束，而是利用和学习数据之间的时间相关性和因果联想，如绿灯时间控制信号(或交通信号的其他流量许可模式)和在给定分配的绿灯时间通过的车辆流量。该设备可以通过利用学习系统的交通信号中内在的因果联想动力学来最小化执行成本。更准确地说，交通数据对，即操作(例如，交通灯的绿灯时间)和结果或后果(例如，经过的车辆的流量/数量或其他数量)被转换为上下文表示，描述了在特定过去一段时间内的特定交通情况的记忆。

当部署好并用于预测时，设备可以仅输入当前测得的流量变量(如交通流)，并可以在多个数据集中描述的学习记忆的情况下，回忆当前状况下的合适控制信号配置或绿灯时间。该设备具有灵活的基础设施，可学习和存储测得的交通数据与生成该数据的相应交通控制信号之间的联想，并回忆它们以加快类似交通状况下的计算速度。因此，该设备提供了一个轻量级学习系统，能够通过利用交通上下文中的因果耦合，在测得的交通数据和相应的控制信号之间求解局部或全局交通动力学。

总体目标可以是控制交通信号的配时(例如，交通灯的绿灯时间，或交通信号的另一个流量许可模式的配时)，以便通过利用动力学和自适应系统中的操作和结果时间相关性之间的因果关系来实现最大吞吐量。

在实现细节方面，从图4中设备的通用架构开始，该设备可以包括以下子模块。

上下文内存学习模块的示例如图4中的401所示。学习模型能够捕获道路交通基础设施中测得的交通数据和交通控制信号之间的局部和全局交互的动力学和约束，如403所示。

系统从道路交通基础设施接收测得的数据403，例如测得的流量和通过交叉口的车道、方向或总计(在所有车道和方向上)的分配的绿灯时间(或其他流量许可模式)。完整的交通上下文数据被馈送到循环神经网络(例如，Hopfield网络，如下所述)，该神经网络使用相关学习来收敛到一个方案，其中权重最小化交通测量中约束的能量函数(即测得的流量和分配的绿灯时间之间的约束)。神经网络实现由微分方程给出的时间动力学，该微分方程使用系统的循环(时间共激活)特性收敛到描述特定交通上下文的最小能量解。该系统是根据历史数据进行训练的。基本上，这些是不同的交通数据上下文模式(例如，交通流的元组和相应的分配绿灯时间)。系统学习在状态空间(记忆)中存储表示输入数据中特定相关模式的独立点。此外，该系统还可以将有关道路基础设施(邻接矩阵)的空间信息实际上嵌入到时间动力学中，使动力学更加丰富和具体，这有助于建立更清晰的记忆。

因此，设备可以有利地学习数据模式作为联想。该设备可以学习信号与观察到的结果之间的联想，与预先的交通状况(即，过去一段时间内的交通信号的状况、过去一段时间之前的第一交通状况和过去一段时间之后的第二交通状况)相比，以在面对新的交通状况时加快操作。设备可以将这些联想作为记忆进行回忆。联想记忆的想法是，当呈现当前数据时(例如，部分元组，如仅观察到的结果)，仍然可以概括出最像数据的实际记忆。

如上所述，实现这一目标的一种方法是使用Hopfield网络。Hopfield网络是一个循环神经网络，其神经元数量与输入大小和动力学一样多，用作一个动力学系统，如图5所示。在Hopfield网络术语中，吸引子对应于记忆。在这种情况下，记忆是一个元组(例如，测得的交通数据(流)和交通信号的控制信号(绿灯时间))。有一个描述活动动力学的潜在能量函数。从任何初始状态开始，系统的状态会演化到最终状态，即能量函数的最小值。联想记忆的现象与由能量函数或势能控制的动力学概念相匹配，如图6所示。

可以使用描述每个量(即流量、绿灯时间)如何包括在网络动力学中的直观方程执行道路交通控制动力学到网络动力学的映射，如图7中的上半部分所示。如前所述，学习联想背后的机制是根据能量最小化，这是Hopfield网络固有的过程，如图7中的下半部分所示。

因此，该设备可以将传感数据(可以从中导出交通状况信息，如流量)和控制信号值映射到能够提取随后支持预测的因果联想和时间相关性的学习机制。

上下文记忆预测模块在图4中的402处示出。该模块部署训练好的学习模块401，也可以单独使用。设备的该模块采用训练后的循环神经网络，该神经网络存储各种学习的记忆，以便在404所示的当前交通状况下推理或回忆完整信息，包括部分或不完整的输入模式。例如，在给定当前交通流的情况下推理绿灯时间，或在给定分配的绿灯时间下推理交通流。

此外，该系统还可以有利地回忆给定嘈杂或不完整输入模式的数据模式(记忆)。请记住，吸引子对应于记忆。在这种情况下，记忆是一个元组(例如，测得的交通数据，交通信号的控制信号(例如，绿灯时间))。联想记忆的现象与由能量函数或势能控制的动力学概念相匹配。能量函数术语描述了系统动力学如何惩罚违反交通约束(例如，作为预设值的较大绿灯时间、负绿灯时间或每个采样时间不可能的流量值)，以及网络强制执行最小化目标函数/能量，从而减少了成本高昂的优化需求(见图7的下半部分)。

在一个示例中，将所需的一组状态M视为记忆。假设选择网络权重，使得每个记忆矢量M是能量函数E的局部最小值。从关于某些记忆k的部分信息开始，意味着开始相对更接近Mk而不是其他记忆(盆地)，如图8所示。然后，这种起始状态很可能在以Mk为最低点的E的“山谷”内。如果是这样，则动力学会生成最终状态Mk，即正确的记忆重建。

因此，设备可以有利地在两种模式下学习。设备可以学习记忆，以便在仅根据该数据(即，根据不连续的交通传感器或故障的交通灯)呈现部分信息时，设备可以检索完整的上下文(即所有存储的流量和绿灯时序)，这称为自联想。或者，设备可以学习记忆，以便在根据另一个类别(即车道上的交通流)呈现数据上下文时，从一个类别(即车道的绿灯时间)回忆联想的数据上下文，这称为异联想。

上述模块401和402可以在系统运行时协同工作，如图9所示。

因此，运行时序列和相应的功能模块可以利用从测得的数据和控制信号之间的历史数据联想中学习的记忆来推理给定测得的交通数据的新控制信号，并且可以使用自联想和异联想模式。此外，该设备还可以通过训练神经网络，利用交通上下文序列之间的内在交通约束和时间动力学，从测得的数据和控制信号模式之间的历史数据联想中学习。

这样一来的计算成本是最小的，基本上是输入交通模式和训练的循环神经网络的权重矩阵之间的点积。记忆的存储容量由神经元的数量决定，这些神经元基本上共享描述时间演化和时间相关性提取的相同动态方程。

该概念适用于核心商业智能垂直方案(即交通优化)，该方案需要快速有效地计算交通灯信号以优化车辆的流量，并且无需重新配置即可部署设备以适应任意规模的道路交通状况和每一种粒度(例如车道、交叉口级别)。

下面结合图10至15描述示例性实现。

设备的操作在示例交通优化场景中实例化，现在将在本发明的计算流水线中逐步描述功能和性能。其中描述了自联想和异联想操作模式。

如图10(a)所示，道路基础设施的区域布局包括多个交通信号1001，每个交通信号位于相应的道路交通交叉口1002。在本示例中，如图10(b)所示，该基础设施的一部分被建模为5x5(N＝5)城市道路基础设施，由用于控制道路网中流量的耦合振荡器系统描述。本示例中使用的5x5(N＝5)城市道路基础设施用于控制整个道路网中的流量。在该示例性网络中，交通信号1001位于交叉口1002处。图11描述了系统的自联想操作模式的示例数据，以及训练系统的若干时间序列模式的映射。此过程取代了计算量大的优化，并确保系统收敛到稳定状态，即描述了最佳交通灯信号的状态。

图11中的配置是针对M＝3个交通灯控制信号和流量时间序列模式实例化的。该模块分析网络将噪声矢量转换为干净版本(即恢复记忆)的能力。选择其中一个模式(P3)，并对其进行少量随机失真(标准偏差噪声＝0.6)，网络在与该失真模式相对应的状态下初始化。然后，可以绘制网络状态与对应于所需稳定点/记忆的每个模式的相似性，如图12所示。网络的状态最好向它最接近的模式收敛(相似性)。

图13展示了当架构扩展时，网络能够很好地泛化到M＝10模式，目的是避免对可用作网络状态空间中稳定点的交通数据矢量的种类施加任何限制。这使得网络能够处理干扰输入(即混合模式或加权组合)。在本例中，选中模式P1和P10，并对其进行少量随机失真(标准偏差噪声＝0.65)。然后将它们线性组合(此处使用输入＝0.6*P1+0.4*P10)。然后，网络收敛到最突出的模式，并且由于干扰，部分收敛到其他类似模式，如图13所示。

对于异联想交通记忆实例化，使用5x5(N＝5)城市道路基础设施来控制整个道路网中的流量。能够学习输入输出映射(或异联想记忆)对于存储和调用联想非常有用。有三个输入：图14(a)所示的键(M＝2，控制信号)、图14(b)所示的值(K＝3，交通流)和图14(c)所示的学习信号。该模型分两个阶段连续运行：第一阶段学习联想集，第二阶段通过将学习信号从0切换到–1(即禁止学习)来测试记忆的回忆。

整个学习过程如图15(a)所示，其中随着网络提取键和值之间的时间联想，对应于交通信号和汽车流量，在学习期间训练误差减少。在回忆或推理期间，尖峰描述了网络以新模式(即新数据集)呈现的时刻。

为了直观地说明全局网络动力学的工作原理，图15(b)显示了异联想操作的动力学以及训练前后记忆的定位。在本示例中，每个记忆包括一对交通信号和交通流值；换句话说，描述道路交通的因果联想。

如图16所示，根据典型系统中使用的最先进方法进行了初步性能评估，并进行了推理，观察了特定交叉口序列的运行时间和需求系数之间的关系。如黑色箭头所示，本文所述方法的累积车辆延迟与需求系数在最高需求系数(即10秒对比31.8秒)下优于最先进的方法。该表描述了中间部分中的直方图值。此外，在一些实施例中，本文描述的方法的运行时间比动态规划(Dynamic Programming，MILP)方法(事实上的标准)小一个数量级。

总之，交通上下文学习和记忆系统从历史数据中学习，主要是传感数据(即特定车道/方向/交叉口中的交通流时间序列)和控制数据(即为每个车道/方向分配的绿灯时间)，并建立联想(即记忆)，这是必不可少的，因为其操作(即控制信号)产生了相应的结果(即汽车的流量)。

图17示出了用于控制车辆交通信号的方法的流程图。在步骤1701，该方法包括存储多个数据集，对于相应的过去时间段，每个数据集包括以下内容的表示：(i)过去一段时间内交通信号的状况，(ii)过去一段时间之前的第一交通状况和(iii)过去一段时间之后的第二交通状况。在步骤1702，该方法包括检测当前交通状况。在步骤1703，该方法包括将当前交通状况与第一交通状况进行比较。在步骤17-4，该方法包括根据该比较选择数据集之一，并使交通信号采用该数据集中表示的状况。

图18示出了用于使用本文描述的方法来控制车辆交通的设备1801的示例。这样的设备1801通常具备一些板载处理能力。具体可以由处理器1802提供。此外，该设备还可以包括存储器1803，用于存储数据集和/或用于存储该设备使用的模型。

该设备还可以包括能够通过网络与其他实体1805、1806通信的收发器1804。这些实体可以在物理上远离设备1801。该网络可以是公共可访问的网络，如互联网。实体1805、1806可以是云端实体。实体1805是计算实体。实体1806是命令和控制实体。这些实体是逻辑实体。在实践中，它们可以由一个或多个物理设备(如服务器和数据存储)提供，并且两个或多个实体的功能可以由单个物理设备提供。每个实现实体的物理设备包括处理器和存储器。此外，这些设备还可以包括用于向设备1801的收发器1804发送数据和从其接收数据的收发器。存储器以非瞬时性的方式存储可由处理器执行的代码，以本文描述的方式实现相应的实体。

在某些实现方式中，命令和控制实体1806可用于训练设备中使用的人工智能模型。即使可以有效地描述生成的模型，这通常也是一项计算密集型任务，因此，在具备充足能量和计算资源的云中执行算法的开发可以提高效率。可以预期，这比在典型的成像设备上形成这样的模型更有效。

在一种实现方式中，一旦算法在云中开发，命令和控制实体就可以自动形成相应的模型，并将其传输到设备。在本示例中，该模型由处理器1802在设备1801处实现。

在另一种可能的实现方式中，交通数据可以由设备接收，并可以由收发器1804发送到云端进行处理。然后，所产生的模型可以发送回设备1801，如图18中的1807所示。

因此，该方法能够以多种方式部署，例如在云中、在设备上，或者在专用硬件中。如上所述，云设施可以执行培训以开发新模型或改进现有模型。根据数据语料库附近的计算能力，培训可以在源数据附近进行，也可以在云中进行，例如使用推理引擎。该方法也可以在设备上、专用硬件中或云中实现。

本文描述的设备和方法可以在一些实现方式中解决交通优化领域中固有的约束优化问题(即，最大限度地提高交通流量，以及最大限度地缩短交通灯处的等待时间)。该设备可以将约束优化映射到通用时间动力学(即损失函数)，避免显式问题的形成和优化需求。该设备使用高效的循环神经网络，其动力学在学习记忆时强制执行流量优化中的内在约束。

因此，本发明的实施例可以提供一种新的方法，用于利用上下文交通信息、控制信号序列(例如绿灯时间分配)和测得的结果(例如，由此产生的交通流)之间的时间相关性来控制城市区域中的交通信号偏移。这使得在能够学习交通元素(例如，控制信号和测得的结果)之间的联想的系统中利用道路交通上下文之间的时间相关性，并使用学习的联想来回忆或重建交通上下文的部分模式或推理上下文的相应缺失部分(例如，推理给定交通流的绿灯时间或推理给定分配的绿灯时间的交通流)。

不仅如此，这还可以使从测得的数据中自动学习交通约束，以从历史数据中提取潜在的联想，以便加快新数据的计算并适应不断变化的交通状况，并能够使用神经网络有效处理交通的局部和全局约束(即，相同的处理范式可以应用于城市区域的车道、方向或交叉口级别)。

此外，该系统可以使用学习的记忆(联想)作为控制区域交叉口中偏移信号的手段，并通过使用循环神经网络中的时间动力学学习原理，大幅节约计算成本，从而避免约束优化。

该系统可以部署在需要灵活性和可扩展性的多种场景(独立于道路几何形状、大小和配置以及可用数据)中，并可以通过利用交通流上下文的内在特征，将与所有道路交叉口中昂贵的计算系统相关的成本降至最低，并能够嵌入空间信息，以驱动系统动力学走向最优控制。

本文描述的设备和方法可以帮助在能够学习此类因果数据之间的多个联想的系统中，使用测得的数据(例如，交通流)和控制信号(例如，分配的绿灯时间)有效地表示交通上下文。这有助于避免昂贵的优化方法和控制信号重新计算，方法是利用先前学习的交通数据模式，并在给定部分信息(即交通流或分配的绿灯时间)的情况下推理与部分信息相对应的最佳完整上下文。通过存储多个记忆(即多个完整的交通上下文)来支持可扩展性，并能够以不同的粒度(例如，每个车道、每个方向、每个交叉口)部署。该设备和方法通常可以允许高效计算新的交通控制信号(即绿灯时间)，这些信号嵌入并利用固有的交通约束和物理学，而无需明确需要对约束进行建模。此外，它还可以为道路交通基础设施和与几何无关的控制提供方案，允许在不同级别建模交通动力学，并使用相同的学习机制，独立于车道数量或交叉口布局。

在使用Hopfield网络的情况下，利用了Hopfield网络的特性，但扩展到允许在联想(联想记忆)或以异联想记忆的形式(即交通配时信号的键值对-汽车流量)中表示各种上下文交通时间序列数据。联想记忆的想法是，当一个记忆线索被呈现时(例如，部分元组，如仅观察到的结果)，最像线索的实际记忆将被重述。异联想行为假设系统能够学习用于存储和回忆联想的输入-输出映射(或异联想记忆)，如交通灯绿灯时间和经过的汽车流量之间的联想。该设备可以在两种模式下运行而无需修改系统，通过在(尖峰)神经网络中采用有效的实现，并通过利用Hopfield网络的时间动力学，避免引入整数规划典型的约束优化负担。

无论部署场景如何，本发明的实施例可以提供用于构建交通上下文的记忆的学习机制，能够学习控制信号之间的时间相关性和可从噪声或不完整输入数据中回忆的联想中的测得的结果的设备，以及能够使用实现微分方程建模和捕获交通特性的循环神经网络描述交通动力学的设备和方法。这就可以使用固定资源预算进行快速高效的建模、表示、学习和预测。这样的轻资源型(内存、大小、计算)系统可以有利地部署在各种边缘或云设备上。

该设备可以充当计算系统中的缓存机制，能够识别正在进行的交通模式，并将它们与在该特定当前状况下表现良好的交通信号配置相匹配。所提出的设备可与任何可用的交通传感数据一起使用。该设备由灵活的仪器支持，有助于确保低延迟、高传入事件率和固定资源预算的更新。此外，该设备可以部署在任何类型的交叉口中而无需预训练，并且与交叉口布局、大小和可用的交通数据指标无关。这在降低部署成本方面提供了显著优势，因为底层的上下文学习机制是有效的，可以转移到具有不同几何形状但交通动力学相似(即典型的城市交通动力学)的新道路基础设施上。

本文描述的设备和方法具有通过利用先前学习的模式优化决策时间和控制信号(例如绿灯时间分配)的“短路”重新计算的能力。在面对新的交通状况时，这种对联想的记忆有能力加快操作速度。因此，该设备可以有利地利用交通模式之间学习到的上下文联想，以推理当控制信号可用时的交通流，以及测得的流量值的绿灯时间。

申请人在此单独公开本文描述的每一个别特征及两个或两个以上此类特征的任意组合。以本领域技术人员的普通知识，能够根据本说明书将此类特征或组合作为整体实现，而不考虑此类特征或特征的组合是否能解决本文所公开的任何问题；且不对权利要求书的范围造成限制。申请人指出，本发明的方面可以包括任何这样的单独特征或特征的组合。鉴于上文描述，可以在本发明的范围内进行各种修改对本领域技术人员来说是显而易见的。

Claims

1.一种车辆交通控制设备(1801)，用于通过以下方式控制交通信号(303，1001)：

存储(1701)多个数据集，对于相应的过去时间段，每个数据集包括以下内容的表示：(i)过去一段时间内交通信号的状况，(ii)过去一段时间之前的第一交通状况和(iii)过去一段时间之后的第二交通状况；

检测(1702)当前交通状况(404)；

比较(1703)当前交通状况与第一交通状况；

根据比较，选择(1704)数据集之一，并使交通信号采用该数据集中表示的状况。

2.根据权利要求1所述的设备(1801)，其特征在于，所述设备用于进一步根据预定目标来选择数据集之一。

3.根据权利要求2所述的设备(1801)，其特征在于，所述设备用于根据当前交通状况(404)选择数据集之一，以优化目标。

4.根据前述权利要求中任一项所述的设备(1801)，其特征在于，所述检测到的当前交通状况(404)包括交通数据的时间序列。

5.根据前述权利要求中任一项所述的设备(1801)，其特征在于，所述检测到的当前交通状况(404)来自从一个或多个传感器收集的传感数据，每个传感器包括摄像机和感应回路之一。

6.根据前述权利要求中任一项所述的设备(1801)，其特征在于，所述设备用于从输入数据的部分时间序列检测当前交通状况。

7.根据前述权利要求中任一项所述的设备(1801)，其特征在于，所述设备用于根据多个交通上下文之一检测当前交通状况(404)。

8.根据权利要求7所述的设备(1801)，其特征在于，所述多个交通上下文包括交通车道的绿灯时间和交通车道的交通流。

9.根据前述权利要求中任一项所述的设备(1801)，其特征在于，所述多个数据集是使用人工智能模型学习的。

10.根据权利要求9所述的设备(1801)，其特征在于，所述人工智能模型是神经网络。

11.根据权利要求9或10所述的设备(1801)，其特征在于，所述设备用于学习所述过去一段时间的所述交通信号的状况与所述过去一段时间之后的所述第二交通状况之间的映射。

12.根据权利要求9至11中任一项所述的设备(1801)，其特征在于，所述设备用于根据检测到的当前交通状况，随时间迭代更新所述模型的参数。

13.根据前述权利要求中任一项所述的设备(1801)，其特征在于，所述设备还用于根据所述选定的数据集生成所述交通信号的时间计划。

14.根据前述权利要求中任一项所述的设备(1801)，其特征在于，所述设备由一个或多个计算机处理器实现。

15.一种用于控制车辆交通信号(303，1001)的方法(1700)，其特征在于，所述方法包括：

检测(1702)当前交通状况；

比较(1703)当前交通状况与第一交通状况；

16.根据权利要求15所述的方法(1700)，其特征在于，包括进一步根据预定目标来选择数据集之一。

17.根据权利要求15或16所述的方法(1700)，其特征在于，所述方法包括根据当前交通状况选择数据集之一，以优化所述目标。

18.根据权利要求15至17中任一项所述的方法(1700)，其特征在于，所述检测到的当前交通状况(404)包括交通数据的时间序列。

19.根据权利要求15至18中任一项所述的方法(1700)，其特征在于，所述检测到的当前交通状况(404)来自从一个或多个传感器收集的传感数据，每个传感器包括摄像机和感应回路之一。

20.根据权利要求15至19中任一项所述的方法(1700)，其特征在于，所述方法包括从输入数据的部分时间序列检测当前交通状况。

21.根据权利要求15至20中任一项所述的方法(1700)，其特征在于，所述方法包括根据多个交通上下文中的一个检测当前交通状况。

22.根据权利要求15至21中任一项所述的方法(1700)，其特征在于，所述多个交通上下文包括交通车道的绿灯时间和交通车道的交通流。

23.根据权利要求15至22中任一项所述的方法(1700)，其特征在于，所述多个数据集是使用人工智能模型学习的。

24.根据权利要求23所述的方法(1700)，其特征在于，所述人工智能模型是神经网络。

25.根据权利要求23或24所述的方法(1700)，其特征在于，所述方法包括学习过去一段时间的交通信号的状况与过去一段时间之后的第二交通状况之间的映射。

26.根据权利要求23至25中任一项所述的方法(1700)，其特征在于，所述方法包括根据检测到的当前交通状况，随时间迭代更新模型的参数。

27.根据权利要求15至26中任一项所述的方法(1700)，其特征在于，所述方法包括根据所述选定的数据集生成所述交通信号的时间计划。