CN114862010A - 一种基于时空数据的流量确定方法、装置、设备和介质 - Google Patents
一种基于时空数据的流量确定方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN114862010A CN114862010A CN202210470739.3A CN202210470739A CN114862010A CN 114862010 A CN114862010 A CN 114862010A CN 202210470739 A CN202210470739 A CN 202210470739A CN 114862010 A CN114862010 A CN 114862010A
- Authority
- CN
- China
- Prior art keywords
- data
- network model
- spatiotemporal
- flow data
- spatio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Abstract
本发明实施例公开了一种基于时空数据的流量确定方法、装置、电子设备和计算机可读存储介质,涉及计算机技术领域。该实施例包括:获取目标区域内的第一历史流量数据;将所述历史流量数据作为输入数据输入预设的时空网络模型,得到所述目标区域在目标时间段内的目标流量数据,所述预设的时空网络模型包括时空特征层,所述时空特征层通过多种尺度的卷积核获得所述历史流量数据的多种卷积特征,并通过自注意力机制从所述多种卷积特征中确定所述历史流量数据的时空特征。该实施例能够准确确定各个区域的流量变化和历史流量之间的关系以及确定不同区域之间的流量流转之间的关系,从而准确预测目标区域的流量。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种基于时空数据的流量确定方法、装置、设备和介质。
背景技术
近年来,深度学习在自然语言处理、计算机视觉方面取得了很大成功。这些成功一方面依赖于大数据和硬件算力的发展,另一方面也依赖于神经网络架构的发展。在具体的应用场景中,如目标检测等,很多具有针对性、定制化的特征提取网络模型被研发。但是,在时空领域具有针对性的网络模型很少,而现有的网络模型是借鉴其他领域的模型进行特征提取,这些模型往往忽略了时空数据的特性,因此效果差强人意。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明实施例提供一种基于时空数据的流量确定方法、装置、设备和介质。
第一方面,本发明实施例提供了一种基于时空数据的流量确定方法,包括:获取目标区域内的第一历史流量数据;将所述历史流量数据作为输入数据输入预设的时空网络模型,得到所述目标区域在目标时间段内的目标流量数据;其中,所述预设的时空网络模型包括时空特征层,所述时空特征层通过多种尺度的卷积核获得所述历史流量数据的多种卷积特征,并通过自注意力机制从所述多种卷积特征中确定所述历史流量数据的时空特征,以使所述预设的时空网络模型根据所述时空特征,确定所述目标区域在目标时间段内的目标流量数据。
在可选地实施例中,所述方法还包括:在所述预设的时空网络模型包括多个相邻的时空特征层的情况下,将所述多个相邻的时空特征层中前一个时空特征层的输出数据输入后一个时空特征层,以确定所述输出数据的时空特征。
在可选地实施例中,所述方法还包括:在所述预设的时空网络模型还包括第一卷积层的情况下,将所述历史流量数据输入所述第一卷积层,获取所述历史流量数据的高维特征,并将所述高维特征输入所述时空特征层。
在可选地实施例中,所述方法还包括:在所述预设的时空网络模型还包括第二卷积层的情况下,将所述时空特征输入所述第二卷积层,对所述时空特征进行降采样操作,以获得所述目标区域在目标时间段内的目标流量数据。
在可选地实施例中,所述方法还包括根据如下步骤训练得到所述预设的时空网络模型:对训练区域进行格化划分,确定多个网格区域;针对每一所述网格区域,获取所述网格区域在多个时间段内的第二历史流量数据;将所述多个网格区域在同一时间段内的第二历史流量数据进行拼接,得到所述同一时间段的第二流量特征数据;根据所述多个时间段内的所述第二流量特征数据,得到历史流量序列,将所述历史流量序列作为训练数据集;对所述训练数据集进行训练,以获得所述预设的时空网络模型。
在可选地实施例中,对所述训练数据集进行训练,以获得所述预设的时空网络模型包括:确定滑动窗口的尺寸;利用所述滑动窗口从所述历史流量序列中抽取输入样本,所述输入样本的数据量与所述滑动窗口的尺寸一致;根据所抽取的输入样本,从所述历史流量序列中抽取输出样本,所述输出样本作为所述输入样本对应的标签;基于所述输入样本和所述标签进行训练,以获得所述预设的时空网络模型。
在可选地实施例中,确定滑动窗口的尺寸包括:确定所述滑动窗口的尺寸为N;
利用所述滑动窗口从所述历史流量序列中抽取输入样本包括:确定起始时刻;从所述历史流量序列中抽取所述起始时刻对应的历史流量数据,以及抽取所述起始时刻之前的(N-1)个时刻所对应的历史流量数据,将所述起始时刻对应的历史流量数据以及所述起始时刻之前的(N-1)个时刻所对应的历史流量数据,作为输入样本;
根据所抽取的输入样本,从所述历史流量序列中抽取输出样本包括:从所述历史流量序列中抽取所述起始时刻后的下一时刻对应的历史流量数据作为输出样本。
在可选地实施例中,获取目标区域内的第一历史流量数据包括:对所述目标区域进行栅格化划分,确定多个网格区域;针对每一所述网格区域,获取所述网格区域的第一历史流量数据;根据每一所述网格区域的第一历史流量数据,确定所述目标区域的第一流量特征数据;将所述历史流量数据作为输入数据输入预设的时空网络模型包括:将所述目标区域的第一流量特征数据作为输入数据输入预设的时空网络模型。
第二方面,本发明实施例提供了一种基于时空数据的流量确定装置,包括:获取模块,用于获取目标区域内的第一历史流量数据;确定模块,用于将所述历史流量数据作为输入数据输入预设的时空网络模型,得到所述目标区域在目标时间段内的目标流量数据;其中,所述预设的时空网络模型包括至少一个时空特征层,所述时空特征层通过多种尺度的卷积核获得所述历史流量数据的多种卷积特征,并通过自注意力机制从所述多种卷积特征中确定所述历史流量数据的时空特征,以使所述预设的时空网络模型根据所述时空特征,确定所述目标区域在目标时间段内的目标流量数据。
在可选地实施例中,所述确定模块还用于:在所述预设的时空网络模型包括多个相邻的时空特征层的情况下,将所述多个相邻的时空特征层中前一个时空特征层的输出数据输入后一个时空特征层,以确定所述输出数据的时空特征。
在可选地实施例中,所述确定模块还用于:在所述预设的时空网络模型还包括第一卷积层的情况下,将所述历史流量数据输入所述第一卷积层,获取所述历史流量数据的高维特征,并将所述高维特征输入所述时空特征层。
在可选地实施例中,所述确定模块还用于:在所述预设的时空网络模型还包括第二卷积层的情况下,将所述时空特征输入所述第二卷积层,对所述时空特征进行降采样操作,以获得所述目标区域在目标时间段内的目标流量数据。
在可选地实施例中,所述装置还包括训练模块,用于:对训练区域进行格化划分,确定多个网格区域;针对每一所述网格区域,获取所述网格区域在多个时间段内的第二历史流量数据;将所述多个网格区域在同一时间段内的第二历史流量数据进行拼接,得到所述同一时间段的第二流量特征数据;根据所述多个时间段内的所述第二流量特征数据,得到历史流量序列,将所述历史流量序列作为训练数据集;对所述训练数据集进行训练,以获得所述预设的时空网络模型。
在可选地实施例中,所述训练模块还用于:确定滑动窗口的尺寸;利用所述滑动窗口从所述历史流量序列中抽取输入样本,所述输入样本的数据量与所述滑动窗口的尺寸一致;根据所抽取的输入样本,从所述历史流量序列中抽取输出样本,所述输出样本作为所述输入样本对应的标签;基于所述输入样本和所述标签进行训练,以获得所述预设的时空网络模型。
在可选地实施例中,所述训练模块还用于确定所述滑动窗口的尺寸为N;确定起始时刻;从所述历史流量序列中抽取所述起始时刻对应的历史流量数据,以及抽取所述起始时刻之前的(N-1)个时刻所对应的历史流量数据,将所述起始时刻对应的历史流量数据以及所述起始时刻之前的(N-1)个时刻所对应的历史流量数据,作为输入样本;从所述历史流量序列中抽取所述起始时刻后的下一时刻对应的历史流量数据作为输出样本。
在可选地实施例中,所述获取模块还用于:对所述目标区域进行栅格化划分,确定多个网格区域;针对每一所述网格区域,获取所述网格区域的第一历史流量数据;根据每一所述网格区域的第一历史流量数据,确定所述目标区域的第一流量特征数据;将所述历史流量数据作为输入数据输入预设的时空网络模型包括:将所述目标区域的第一流量特征数据作为输入数据输入预设的时空网络模型。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使得所述处理器执行以下步骤:获取目标区域内的第一历史流量数据;将所述历史流量数据作为输入数据输入预设的时空网络模型,得到所述目标区域在目标时间段内的目标流量数据;其中,所述预设的时空网络模型包括至少一个时空特征层,所述时空特征层通过多种尺度的卷积核获得所述历史流量数据的多种卷积特征,并通过自注意力机制从所述多种卷积特征中确定所述历史流量数据的时空特征,以使所述预设的时空网络模型根据所述时空特征,确定所述目标区域在目标时间段内的目标流量数据。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例的基于时空数据的流量确定方法。
上述实施例中的一个或多个技术方案至少具有如下优点的部分或全部:
通过预设的时空网络模型对目标区域内的历史流量数据进行分析,确定该目标区域在目标时间段内的目标流量数据,其中该预设的时空网络模型包括时空特征层,该时空特征层包括多种尺度的卷积核,以此为不同的区域提供大小不同的感受野,并使用注意力机制动态为每个区域选择感受野,能够准确确定各个区域的流量变化和历史流量之间的关系以及确定不同区域之间的流量流转之间的关系,从而准确预测目标区域的流量。本发明实施例的基于时空数据的流量确定方法,可以对城市级的流量进行监控预测和管控,提供更加精准的客流量预测,从而实现更加精细的管控方案,实现更精细的城市规划;该方法可以应用于城市中密集人流量区域的发现和广告投放、动态广告位定价等场景中。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示意性地示出了本发明实施例的时空网络模型的时空特征层的示意图;
图2示意性地示出了本发明实施例时空网络模型的结构示意图;
图3示意性地示出了本发明实施例的训练时空网络模型的方法的主要步骤的示意图;
图4示意性地示出了本发明实施例训练时空网络模型的方法的子步骤的流程图;
图5示意性地示出了本发明实施例的基于时空数据的流量确定方法的流程图;
图6示意性地示出了本发明实施例的基于时空数据的流量确定装置的结构示意图;
图7示意性地示出了适用于本发明实施例的基于时空数据的流量确定方法的系统架构;
图8示意性示出了本发明实施例提供的电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
在时空预测领域,目前可以使用神经网络进行时空数据建模,例如可以在ST-ResNet引入残差神经网络,通过残差神经网络进行时空特征提取。其中,时空特征包括了时序依赖和空间依赖两个维度的特征,时间依赖是指每个区域的流量变化和历史流量之间的关系,空间依赖指不同区域之间的流量流转之间的关系。在残差神经网络中,使用固定大小的感受野,如3*3,5*5等,并且进行了空间位置的参数共享,具有空间不变性。然而,在时空预测领域,应用场景并不满足这种空间不变性的关系。例如,在预测流量的场景中,流量的变化和流量流转的变化会受到居民活动的影响,如受到居民日常出行的影响,从而不同的城市区域的流量和周围区域的关系是不同的,不具备空间不变性。另外,使用固定大小的感受野也没有体现不同区域的差异性。如图1所示,对某市的流量进行分析,选取一段时间计算不同区域流量的皮尔逊相关系数,并选择该市的两个区域和其他区域进行对比,结果如图1所示。由该图可知,在城市范围内不同位置的流量具有较大的差异性,不同位置的区域和周围的区域之间的作用关系不同。因此,仅使用卷积神经网络并不能很好地建模时空数据。
为解决上述技术问题或者至少部分地解决上述技术问题,本发明实施例提供了一种基于时空数据的流量确定方法,该方法通过预设的时空网络模型对目标区域内的历史流量数据进行分析,确定该目标区域在目标时间段内的目标流量数据,其中该预设的时空网络模型包括时空特征层,该时空特征层包括多种尺度的卷积核,以此为不同的区域提供大小不同的感受野,并使用注意力机制动态为每个区域选择感受野,能够准确确定各个区域的流量变化和历史流量之间的关系以及确定不同区域之间的流量流转之间的关系,从而准确预测目标区域的流量。
本发明实施例的时空网络模型包括时空特征层,该时空特征层主要为了解决不同位置的感受野不一致的问题。针对同一个区域,该时空特征层首先使用不同的卷积核进行时空特征的提取,然后对于这个区域提取的特征结果,使用一个注意力机制自动选择有效的特征,从而提取时空数据的时空特征,以此实现针对不同的区域使用不同的卷积核,即实现针对不同的区域使用不同的感受野进行时空特征的提取。其中,时空数据是同时具有时间和空间维度的数据,例如城市中的人流量数据、车流量数据等。为方便理解本发明实施例中的时空网络模型,下面以图1为例,对本发明的时空网络模型进行说明。
图1示意性地示出了本发明实施例的时空网络模型的时空特征层的结构示意图。在图1中,H,W表示某区域进行栅格化划分后经纬度方向的网格的数量。c,c’表示该区域的流量的通道数,如流入量、流出量、驻留量等。K1,K2分别表示不同的卷积核的大小,例如3*3,5*5,7*7等。如图1所示,本实施例针对原始范围内的两个不同区域,使用两个不同大小的卷积核进行时空特征的提取,而卷积核的大小是通过一个自注意力机制来动态选择的。
结合图1,本发明实施例的时空网络模型的时空特征层的实现过程如下:
首先,本实施例设置了一个多种尺度的卷积核集合K={3*3,5*5,7*7,9*9,11*11},然后,对于原始区域的输入特征图X,在每个位置(xi,yj),分别使用不同的卷积核进行特征图计算:
f3|=Conv3(X);
f5|=Conv5(X);
f7|=Conv7(X);
f9|=Conv9(X);
f11|=Conv11(X)。
在获得多种卷积特征之后,该时空特征层使用自注意力机制从该多种卷积特征中选择有效的特征,具体过程如下:
其中,Wk是一个可学习的参数矩阵,用于增加时空网络模型的容量,可以建模复杂的关系,k1,k2是卷积核的大小。是通过映射后的特征,是计算了两个不同的卷积核输出特征的相关性,softmax()是归一化函数,是归一化后的权重,si,j是通过不同卷积核融合的特征,即时空特征。
综上,本发明实施例的时空网络模型针对同一个区域,该时空特征层首先使用不同的卷积核进行时空特征的提取,然后对于这个区域提取的特征结果,使用一个注意力机制自动选择有效的特征,从而提取时空数据的时空特征,以此实现针对不同的区域使用不同的卷积核,即实现针对不同的区域使用不同的感受野进行时空特征的提取,体现了不同区域的差异性,充分考虑了时空数据的特性。
在可选地实施例中,本发明实施例的时空网络模型可以包括一个时空特征层,也可以包括多个相邻的时空特征层,该多个相邻的时空特征层中,前一个时空特征层的输出数据为下一个时空特征层的输入数据。在本实施例中,为了充分考虑到原始区域中相距较远的子区域之间的关系,可以使用多个相邻的时空特征层。
在可选地实施例中,本发明实施例的时空网络模型除了时空特征层,还可以包括第一卷积层和第二卷积层。如图2所示,该时空网络模型包括第一卷积层、两个时空特征层以及第二卷积层。其中,第一卷积层用于进行高维特征的提取,即提取原始的输入数据的高维特征,然后时空特征层提取时空特征,第二卷积层对该时空特征进行降维操作,获得要预测的结果。本实施例通过第一卷积层和第二卷积层,在提高模型准确性的同时降低了计算量,提升了效率。
为了得到上述时空网络模型,需要获取训练样本进行训练。作为示例,该时空网络模型的训练过程如图3所示,该过程包括:
步骤S301:对训练区域进行栅格化划分,确定多个网格区域;
步骤S302:针对每一所述网格区域,获取所述网格区域在多个时间段内的第二历史流量数据;
步骤S303:将所述多个网格区域在同一时间段内的第二历史流量数据进行拼接,得到所述同一时间段的第二流量特征数据;
步骤S304:根据所述多个时间段内的所述第二流量特征数据,得到历史流量序列,将所述历史流量序列作为训练数据集;
步骤S305:对所述训练数据集进行训练,以获得所述预设的时空网络模型。
在训练时空网络模型的过程中,首先需要获取训练样本数据。在本实施例中,对训练区域进行栅格化划分,获得多个网格区域。其中,训练区域可以是城市,也可以是城市中的某个区域。更进一步的,该训练区域可以是目标区域,也可以包括目标区域,还可以包含在目标区域内(即训练区域在目标区域内)。在训练区域与目标区域的范围相同时,训练得到的时空网络模型在预测目标区域的流量时结果最准确。在获得多个网格区域之后,统计每个网格区域的第二历史流量数据x∈Rn×m×f,m和n分别表示网格区域的长度和宽度,f表示每个网格区域的流量特征,例如包括网格区域的驻留流量、流入流量和流出流量。在本实施例中,可以将以30分钟为时间步长统计网格区域的流量特征。对于给定的网格区域Dij,统计时间片段t(半个小时内)的流入流量:t-1时刻不在网格区域Dij中,t时刻在网格区域Dij中。统计时间片段t(半个小时内)的流出流量:t-1时刻在网格区域Dij中,t时刻不在网格区域Dij中。统计时间片段t(半个小时内)的驻留流量:t-1时刻在网格区域Dij中,t时刻也在网格区域Dij中。在确定各个网格区域的第二历史流量数据之后,将多个网格区域在同一时间段内的第二历史流量数据进行拼接,得到所述同一时间段的第二流量特征数据(该流量特征数据包含时间依赖和空间依赖),例如将多个网格区域在t时刻的第二历史流量数据拼接,得到Xt,将t+1时刻的第二历史流量数据拼接得到Xt+1,从而得到历史流量序列{X1,X2,…,Xt,Xt+1}。然后,根据该历史流量序列作为训练数据集进行训练,得到该时空网络模型。
具体的,如图4所示,根据该历史流量序列作为训练数据集进行训练,得到该时空网络模型的过程包括:
步骤S401:确定滑动窗口的尺寸;
步骤S402:利用所述滑动窗口从所述历史流量序列中抽取输入样本,所述输入样本的数据量与所述滑动窗口的尺寸一致;
步骤S403:根据所抽取的输入样本,从所述历史流量序列中抽取输出样本,所述输出样本作为所述输入样本对应的标签;
步骤S404:基于所述输入样本和所述标签进行训练,以获得所述预设的时空网络模型。
在获得历史流量序列之后,基于该历史流量序列构造时空网络模型的输入样本和输出样本。具体地,本实施例采用滑动窗口的方式构造训练样本,更具体地,该过程包括:设定滑动窗口的尺寸为N,即滑动窗口的大小为N;确定起始时刻;从所述历史流量序列中抽取所述起始时刻对应的历史流量数据,以及抽取所述起始时刻之前的(N-1)个时刻所对应的历史流量数据,将所述起始时刻对应的历史流量数据以及所述起始时刻之前的(N-1)个时刻所对应的历史流量数据,作为输入样本;从所述历史流量序列中抽取所述起始时刻后的下一时刻对应的历史流量数据作为输出样本。例如,在时刻t抽取历史长度为N的数据作为训练数据,并进行未来一步的预测,于是有:
其中,Xt,Xt-1,…,Xt-N+1表示输入样本,Xt+1表示输出样本,即标签。
在构造输入样本和输出样本之后,通过BP算法进行训练,学习网络中的参数。BP算法(Error Back Propagation,误差后向传播算法)由信号的正向传播和误差的反向传播两个过程组成,期望通过在神经网络的训练过程中自适应的调整各神经元间的连接权值,以寻求最佳的输入输出间的映射函数,使得目标函数或损失函数达到最小,完成分类、回归等任务。
在获得上述时空网络模型之后,可以利用该时空网络模型预测目标区域在目标时间段内的目标流量数据。例如使用滑动窗口,提出最后一段时间的历史流量特征:Input=(XL,XL-1,…,XL-N+1),然后利用训练得到的时空网络模型进行预测,获得时空网络模型预测目标区域在目标时间段内的目标流量数据。在可选地实施例中,在对目标区域的流量数据进行预测时,输入时空网络模型的输入数据也可以不是从第二历史流量数据中获取的。
具体的,如图5所示,利用该时空网络模型对目标区域的流量进行预测的过程包括:
步骤S501:获取目标区域内的第一历史流量数据。其中,流量数据包括驻留流量、流入流量和流出流量。
步骤S502:将所述历史流量数据作为输入数据输入预设的时空网络模型,得到所述目标区域在目标时间段内的目标流量数据;其中,所述预设的时空网络模型包括时空特征层,所述时空特征层通过多种尺度的卷积核获得所述历史流量数据的多种卷积特征,并通过自注意力机制从所述多种卷积特征中确定所述历史流量数据的时空特征,以使所述预设的时空网络模型根据所述时空特征,确定所述目标区域在目标时间段内的目标流量数据。
其中,获取目标区域内的第一历史流量数据的过程可以包括对所述目标区域进行栅格化划分,确定多个网格区域;针对每一所述网格区域,获取所述网格区域的第一历史流量数据;根据每一所述网格区域的第一历史流量数据,确定所述目标区域的第一流量特征数据,将所述目标区域的第一流量特征数据作为输入数据输入预设的时空网络模型,获得预测结果,即目标区域在目标时间段内的目标流量数据。
在本实施例的应用场景中,所预测的流量数据为时空数据,具有特殊性,每个区域的流量变化和历史流量之间的关系,以及不同区域之间的流量流转的关系不同,因此,若时空网络模型是以目标区域的历史流量数据为训练数据训练得到的,则该时空网络模型预测目标区域的流量的效果优于预测其他区域的流量。若需要预测其他区域的流量则需要该时空网络模型进行迁移学习。
图6示意性地示出了本发明实施例的基于时空数据的流量确定装置600的主要模块的示意图,如图6所示,该基于时空数据的流量确定装置600包括:
获取模块601,用于获取目标区域内的第一历史流量数据;
确定模块602,用于将所述历史流量数据作为输入数据输入预设的时空网络模型,得到所述目标区域在目标时间段内的目标流量数据;其中,所述预设的时空网络模型包括至少一个时空特征层,所述时空特征层通过多种尺度的卷积核获得所述历史流量数据的多种卷积特征,并通过自注意力机制从所述多种卷积特征中确定所述历史流量数据的时空特征,以使所述预设的时空网络模型根据所述时空特征,确定所述目标区域在目标时间段内的目标流量数据。
本发明实施例的基于时空数据的流量确定装置,通过预设的时空网络模型对目标区域内的历史流量数据进行分析,确定该目标区域在目标时间段内的目标流量数据,其中该预设的时空网络模型包括时空特征层,该时空特征层包括多种尺度的卷积核,以此为不同的区域提供大小不同的感受野,并使用注意力机制动态为每个区域选择感受野,能够准确确定各个区域的流量变化和历史流量之间的关系以及确定不同区域之间的流量流转之间的关系,从而准确预测目标区域的流量。
在可选地实施例中,所述确定模块还用于:当所述预设的时空网络模型包括多个相邻的时空特征层时,将所述多个相邻的时空特征层中前一个时空特征层的输出数据输入后一个时空特征层,以确定所述输出数据的时空特征。
在可选地实施例中,所述预设的时空网络模型还包括第一卷积层;所述确定模块还用于:将所述历史流量数据输入所述第一卷积层,获取所述历史流量数据的高维特征,并将所述高维特征输入所述时空特征层。
在可选地实施例中,所述预设的时空网络模型还包括第二卷积层;所述确定模块还用于:将所述时空特征输入所述第二卷积层,对所述时空特征进行降采样操作,以获得所述目标区域在目标时间段内的目标流量数据。
在可选地实施例中,所述装置还包括训练模块,用于:对训练区域进行格化划分,确定多个网格区域;针对每一所述网格区域,获取所述网格区域在多个时间段内的第二历史流量数据;将所述多个网格区域在同一时间段内的第二历史流量数据进行拼接,得到所述同一时间段的第二流量特征数据;根据所述多个时间段内的所述第二流量特征数据,得到历史流量序列,将所述历史流量序列作为训练数据集;对所述训练数据集进行训练,以获得所述预设的时空网络模型。
在可选地实施例中,所述训练模块还用于:确定滑动窗口的尺寸;利用所述滑动窗口从所述历史流量序列中抽取输入样本,所述输入样本的数据量与所述滑动窗口的尺寸一致;根据所抽取的输入样本,从所述历史流量序列中抽取输出样本,所述输出样本作为所述输入样本对应的标签;基于所述输入样本和所述标签进行训练,以获得所述预设的时空网络模型。
在可选地实施例中,所述训练模块还用于确定所述滑动窗口的尺寸为N;确定起始时刻;从所述历史流量序列中抽取所述起始时刻对应的历史流量数据,以及抽取所述起始时刻之前的(N-1)个时刻所对应的历史流量数据,将所述起始时刻对应的历史流量数据以及所述起始时刻之前的(N-1)个时刻所对应的历史流量数据,作为输入样本;从所述历史流量序列中抽取所述起始时刻后的下一时刻对应的历史流量数据作为输出样本。
在可选地实施例中,所述获取模块还用于:对所述目标区域进行栅格化划分,确定多个网格区域;针对每一所述网格区域,获取所述网格区域的第一历史流量数据;根据每一所述网格区域的第一历史流量数据,确定所述目标区域的第一流量特征数据;将所述历史流量数据作为输入数据输入预设的时空网络模型包括:将所述目标区域的第一流量特征数据作为输入数据输入预设的时空网络模型。
图7示意性地示出了适用于本发明实施例的基于时空数据的流量确定方法的系统架构。
如图7所示,适用于本发明实施例的基于时空数据的流量确定方法的系统架构800包括:终端设备801、802、803,网络804和服务器805。网络804用以在终端设备801、802、803和服务器805之间提供通信链路的介质。网络804可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等。
终端设备801、802、803通过网络804与服务器805交互,以接收或发送消息等。终端设备801、802、803上可以安装有各种通讯客户端应用。
服务器805可以是提供各种服务的服务器。服务器可以对接收到的请求或消息进行分析和处理,并将数据处理后得到的结果反馈给终端设备。
需要说明的是,本发明实施例所提供的基于时空数据的流量确定方法一般可以由服务器805执行。本发明实施例所提供的基于时空数据的流量确定方法也可以由不同于服务器805且能够与终端设备801、802、803和/或服务器805通信的服务器或服务器集群执行。
应该理解的是,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图8示意性示出了本发明一实施例的电子设备的示意图。如图8所示,本发明实施例提供的电子设备800包括处理器801、通信接口802、存储器803和通信总线804,其中,处理器801、通信接口802和存储器803通过通信总线804完成相互间的通信;存储器803,用于存放至少一可执行指令;处理器801,用于执行存储器上所存放的可执行指令时,实现如上所述的基于时空数据的流量确定方法。
具体而言,当实现上述模型迭代方法时,上述可执行指令使得上述处理器执行以下步骤:
获取目标区域内的第一历史流量数据;
将所述历史流量数据作为输入数据输入预设的时空网络模型,得到所述目标区域在目标时间段内的目标流量数据,所述预设的时空网络模型包括时空特征层,所述时空特征层通过多种尺度的卷积核获得所述历史流量数据的多种卷积特征,并通过自注意力机制从所述多种卷积特征中确定所述历史流量数据的时空特征。
上述存储器803可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器803具有用于执行上述方法中的任何方法步骤的程序代码的存储空间。例如,用于程序代码的存储空间可以包括分别用于实现上面的方法中的各个步骤的各个程序代码。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,光盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为便携式或者固定存储单元。该存储单元可以具有与上述电子设备中的存储器803类似布置的存储段或者存储空间等。程序代码可以例如以适当形式进行压缩。通常,存储单元包括用于执行根据本发明的实施例的方法步骤的程序,即可以由例如诸如801之类的处理器读取的代码,这些代码当由电子设备运行时,导致该电子设备执行上面所描述的方法中的各个步骤。
本发明实施例还提供了一种计算机可读存储介质。上述计算机可读存储介质上存储有计算机程序,上述计算机程序被处理器执行时实现如上所述的基于时空数据的流量确定方法。
该计算机可读存储介质可以是上述实施例中描述的设备/装置中所包含的;也可以是单独存在,而未装配入该设备/装置中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本发明实施例的方法。
根据本发明的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
本发明的实施例提供的上述各个技术方案可以全部或部分步骤以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明的实施例的电子设备中的一些或者全部部件的一些或者全部功能。本发明的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。实现本发明的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者步骤与另一个实体或步骤区分开来,而不一定要求或者暗示这些实体或步骤之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (11)
1.一种基于时空数据的流量确定方法,其特征在于,包括:
获取目标区域内的第一历史流量数据;
将所述历史流量数据作为输入数据输入预设的时空网络模型,得到所述目标区域在目标时间段内的目标流量数据;其中,所述预设的时空网络模型包括时空特征层,所述时空特征层通过多种尺度的卷积核获得所述历史流量数据的多种卷积特征,并通过自注意力机制从所述多种卷积特征中确定所述历史流量数据的时空特征,以使所述预设的时空网络模型根据所述时空特征,确定所述目标区域在目标时间段内的目标流量数据。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述预设的时空网络模型包括多个相邻的时空特征层的情况下,将所述多个相邻的时空特征层中前一个时空特征层的输出数据输入后一个时空特征层,以确定所述输出数据的时空特征。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述预设的时空网络模型还包括第一卷积层的情况下,将所述历史流量数据输入所述第一卷积层,获取所述历史流量数据的高维特征,并将所述高维特征输入所述时空特征层。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:在所述预设的时空网络模型还包括第二卷积层的情况下,将所述时空特征输入所述第二卷积层,对所述时空特征进行降采样操作,以获得所述目标区域在目标时间段内的目标流量数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括根据如下步骤训练得到所述预设的时空网络模型:
对训练区域进行格化划分,确定多个网格区域;
针对每一所述网格区域,获取所述网格区域在多个时间段内的第二历史流量数据;
将所述多个网格区域在同一时间段内的第二历史流量数据进行拼接,得到所述同一时间段的第二流量特征数据;
根据所述多个时间段内的所述第二流量特征数据,得到历史流量序列,将所述历史流量序列作为训练数据集;
对所述训练数据集进行训练,以获得所述预设的时空网络模型。
6.根据权利要求5所述的方法,其特征在于,对所述训练数据集进行训练,以获得所述预设的时空网络模型包括:
确定滑动窗口的尺寸;
利用所述滑动窗口从所述历史流量序列中抽取输入样本,所述输入样本的数据量与所述滑动窗口的尺寸一致;
根据所抽取的输入样本,从所述历史流量序列中抽取输出样本,所述输出样本作为所述输入样本对应的标签;
基于所述输入样本和所述标签进行训练,以获得所述预设的时空网络模型。
7.根据权利要求6所述的方法,其特征在于,确定滑动窗口的尺寸包括:确定所述滑动窗口的尺寸为N;
利用所述滑动窗口从所述历史流量序列中抽取输入样本包括:确定起始时刻;从所述历史流量序列中抽取所述起始时刻对应的历史流量数据,以及抽取所述起始时刻之前的(N-1)个时刻所对应的历史流量数据,将所述起始时刻对应的历史流量数据以及所述起始时刻之前的(N-1)个时刻所对应的历史流量数据,作为输入样本;
根据所抽取的输入样本,从所述历史流量序列中抽取输出样本包括:从所述历史流量序列中抽取所述起始时刻后的下一时刻对应的历史流量数据作为输出样本。
8.根据权利要求7所述的方法,其特征在于,获取目标区域内的第一历史流量数据包括:
对所述目标区域进行栅格化划分,确定多个网格区域;
针对每一所述网格区域,获取所述网格区域的第一历史流量数据;
根据每一所述网格区域的第一历史流量数据,确定所述目标区域的第一流量特征数据;
将所述历史流量数据作为输入数据输入预设的时空网络模型包括:将所述目标区域的第一流量特征数据作为输入数据输入预设的时空网络模型。
9.一种基于时空数据的流量确定装置,其特征在于,包括:
获取模块,用于获取目标区域内的第一历史流量数据;
确定模块,用于将所述历史流量数据作为输入数据输入预设的时空网络模型,得到所述目标区域在目标时间段内的目标流量数据;其中,所述预设的时空网络模型包括至少一个时空特征层,所述时空特征层通过多种尺度的卷积核获得所述历史流量数据的多种卷积特征,并通过自注意力机制从所述多种卷积特征中确定所述历史流量数据的时空特征,以使所述预设的时空网络模型根据所述时空特征,确定所述目标区域在目标时间段内的目标流量数据。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使得所述处理器执行以下步骤:
获取目标区域内的第一历史流量数据;
将所述历史流量数据作为输入数据输入预设的时空网络模型,得到所述目标区域在目标时间段内的目标流量数据;其中,所述预设的时空网络模型包括至少一个时空特征层,所述时空特征层通过多种尺度的卷积核获得所述历史流量数据的多种卷积特征,并通过自注意力机制从所述多种卷积特征中确定所述历史流量数据的时空特征,以使所述预设的时空网络模型根据所述时空特征,确定所述目标区域在目标时间段内的目标流量数据。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210470739.3A CN114862010A (zh) | 2022-04-28 | 2022-04-28 | 一种基于时空数据的流量确定方法、装置、设备和介质 |
PCT/CN2023/082204 WO2023207411A1 (zh) | 2022-04-28 | 2023-03-17 | 一种基于时空数据的流量确定方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210470739.3A CN114862010A (zh) | 2022-04-28 | 2022-04-28 | 一种基于时空数据的流量确定方法、装置、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114862010A true CN114862010A (zh) | 2022-08-05 |
Family
ID=82634920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210470739.3A Pending CN114862010A (zh) | 2022-04-28 | 2022-04-28 | 一种基于时空数据的流量确定方法、装置、设备和介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114862010A (zh) |
WO (1) | WO2023207411A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115515184A (zh) * | 2022-11-04 | 2022-12-23 | 北京众森信和科技有限公司 | 一种业务数据的发送方法 |
WO2023207411A1 (zh) * | 2022-04-28 | 2023-11-02 | 京东城市(北京)数字科技有限公司 | 一种基于时空数据的流量确定方法、装置、设备和介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101682B (zh) * | 2020-09-25 | 2024-04-09 | 北京百度网讯科技有限公司 | 流量模式预测方法、装置、服务器以及可读介质 |
CN112910711B (zh) * | 2021-02-03 | 2021-12-24 | 山东大学 | 一种基于自注意力卷积网络的无线业务流量预测方法、设备及介质 |
CN113743505A (zh) * | 2021-09-06 | 2021-12-03 | 辽宁工程技术大学 | 基于自注意力和特征融合的改进ssd目标检测方法 |
CN114039871B (zh) * | 2021-10-25 | 2022-11-29 | 中山大学 | 一种蜂窝流量预测的方法、系统、装置及介质 |
CN114066052A (zh) * | 2021-11-15 | 2022-02-18 | 国网江苏省电力有限公司营销服务中心 | 基于改进tcn修正累积误差的可调节负荷功率多步预测方法 |
CN114862010A (zh) * | 2022-04-28 | 2022-08-05 | 京东城市(北京)数字科技有限公司 | 一种基于时空数据的流量确定方法、装置、设备和介质 |
-
2022
- 2022-04-28 CN CN202210470739.3A patent/CN114862010A/zh active Pending
-
2023
- 2023-03-17 WO PCT/CN2023/082204 patent/WO2023207411A1/zh unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023207411A1 (zh) * | 2022-04-28 | 2023-11-02 | 京东城市(北京)数字科技有限公司 | 一种基于时空数据的流量确定方法、装置、设备和介质 |
CN115515184A (zh) * | 2022-11-04 | 2022-12-23 | 北京众森信和科技有限公司 | 一种业务数据的发送方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2023207411A1 (zh) | 2023-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814977B (zh) | 训练事件预测模型的方法及装置 | |
CN110766142A (zh) | 模型生成方法和装置 | |
EP3574453A1 (en) | Optimizing neural network architectures | |
CN114862010A (zh) | 一种基于时空数据的流量确定方法、装置、设备和介质 | |
CN110659744A (zh) | 训练事件预测模型、评估操作事件的方法及装置 | |
US11443335B2 (en) | Model-based deep reinforcement learning for dynamic pricing in an online ride-hailing platform | |
CN113038386A (zh) | 基于学习模型的设备定位 | |
WO2019082009A1 (en) | REGRESSION FOR SET OF MEASUREMENT DATA | |
CN113643532B (zh) | 一种区域交通的预测方法以及设备 | |
CN111415199A (zh) | 一种基于大数据的客户预测更新方法、装置及存储介质 | |
CN116106988A (zh) | 天气预测方法、装置、电子设备及存储介质 | |
CN114417174B (zh) | 内容推荐方法、装置、设备及计算机存储介质 | |
CN111667024A (zh) | 内容推送方法、装置、计算机设备和存储介质 | |
CN113253336B (zh) | 一种基于深度学习的地震预测方法和系统 | |
CN117252307B (zh) | 流量预测方法、装置、计算机设备和存储介质 | |
JP2022074133A (ja) | 多変量時系列モデリングおよび予測のためのコンピューティングデバイス、コンピュータ実装方法、およびコンピュータ可読記憶媒体(改良された多変量時系列モデリングおよび予測のための複数時系列にわたる確率的非線形関係および外部要因) | |
CN116684330A (zh) | 基于人工智能的流量预测方法、装置、设备及存储介质 | |
CN117217779A (zh) | 预测模型的训练方法、装置及信息预测方法、装置 | |
CN113869614B (zh) | 一种基于时空图卷积的行人流早期预测方法 | |
CN115017362A (zh) | 数据处理方法、电子设备及存储介质 | |
CN114358186A (zh) | 一种数据处理方法、装置及计算机可读存储介质 | |
CN111178987B (zh) | 训练用户行为预测模型的方法和装置 | |
CN115455276A (zh) | 推荐对象的方法、装置、计算机设备和存储介质 | |
CN112560953A (zh) | 私家车非法营运的识别方法、系统、设备及存储介质 | |
CN113094602A (zh) | 酒店推荐方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |