CN112183824B - 一种线上线下关联的城市客流量预测方法 - Google Patents

一种线上线下关联的城市客流量预测方法 Download PDF

Info

Publication number
CN112183824B
CN112183824B CN202010953142.5A CN202010953142A CN112183824B CN 112183824 B CN112183824 B CN 112183824B CN 202010953142 A CN202010953142 A CN 202010953142A CN 112183824 B CN112183824 B CN 112183824B
Authority
CN
China
Prior art keywords
passenger flow
online
offline
area
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010953142.5A
Other languages
English (en)
Other versions
CN112183824A (zh
Inventor
周蜀杰
曾园园
江昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202010953142.5A priority Critical patent/CN112183824B/zh
Publication of CN112183824A publication Critical patent/CN112183824A/zh
Application granted granted Critical
Publication of CN112183824B publication Critical patent/CN112183824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Optimization (AREA)
  • Molecular Biology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供了一种线上线下关联的城市客流量预测方法,一方面充分捕获了历史客流量数据的时间依赖性,并结合了天气、节假日、重大活动事件等外部因素特征,另一方面通过各区域中用户在不同状态下的线上访问内容情况构建了线上线下行为的关联性。将两部分的特征通过一个训练好的单隐层全连接网络融合后能够更加准确地预测所有区域的客流量漫入漫出情况,充分考虑突发事件对客流量变化的影响。

Description

一种线上线下关联的城市客流量预测方法
技术领域
本发明涉及智慧城市应用相关的客流量预测技术、以及大数据分析、深度神经网络技术领域,具体涉及一种线上线下关联的城市客流量预测方法。
背景技术
随着物联网技术的快速发展,物联网技术使得城市向更加智能的方向发展。基于物联网的智慧城市涉及大量城市中密布的传感器,异构网络基础设施,智能信息处理和城市计算等技术。城市客流量预测是面向智慧城市应用的重要组成部分之一。
当前,广泛的智能物联网设备和服务为我们提供了更多获取城市人群流量数据的便利。我们可以通过授权的智能设备从互连的数据网络中获得多种用于城市人群检测的安全数据,包括用户轨迹数据和在线浏览数据等。这些异构人群信息的集成网络系统有助于城市安全规划和管理。随着社会的进步和城市化进程的加快,城市人口快速增长。大规模的城市人群移动给城市公共安全带来了巨大挑战,城市客流量预测,特别是即时客流量预测,对于城市公共安全至关重要。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
现有的技术方法依赖历史数据进行预测,不能很好地预测突发事件所带来的人流量变化。
发明内容
本发明提出一种线上线下关联的城市客流量预测方法,用于解决或者至少部分解决现有技术的方法依赖历史数据进行预测,从而预测准确性不高的技术问题。
为了解决上述技术问题,本发明提供了一种线上线下关联的城市客流量预测方法,包括:
S1:构建基于扩张因果卷积的线下客流量分布特征提取模块,用于根据捕获时间依赖关系的特征以及外部特征,得到线下客流量分布特征;
S2:构建线上访问注意点分布特征提取模块,用于根据用户在线下进入、离开、停留不同区域的三种情况下的线上访问内容分类的情况获得线上访问注意点分布特征;
S3:构建线上线下交互模块,用于融合线下客流量分布特征和线上访问注意点分布特征,并预测出下一时刻的客流量;
S4:线下客流量分布特征提取模块、线上访问注意点分布特征提取模块以及线上线下交互模块构成城市客流量预测模型,并对预测模型进行训练;
S5:利用训练好的城市客流量预测模型对城市客流量进行预测。
在一种实施方式中,S1中捕获时间依赖关系的特征为张量形式,通过下述方式得到:
根据功能类型对空间区域网络进行划分,统计每个时刻下各个空间区域的漫入数和漫出数,构建二维客流量矩阵,连续多个时刻上的矩阵构成时间序列;
将构成的连续时刻上的二维矩阵按照不同的时间间隔进行分片,分片后构成三个张量,分别用于捕获长期依赖、周期性依赖和短期依赖关系。
在一种实施方式中,基于扩张因果卷积的线下客流量分布特征提取模块为多层DCNN网络,S1具体包括:
将用于捕获时间依赖关系的三个张量作为输入,通过多层DCNN网络学习输出特征矩阵,再通过哈德玛积将三种特征以及外部特征进行融合,输出表征时间依赖关系的客流量特征Xflow,作为线下客流量分布特征。
在一种实施方式中,空间网络区域某一时刻漫入数和漫出数的计算方式为:
Figure BDA0002677699240000021
Figure BDA0002677699240000022
其中,
Figure BDA0002677699240000023
是t时刻用户移动轨迹的集合,Tr:l1→l2→...→l|Tr|是用户轨迹,k为轨迹的所经过的区域总数,lk表示最终到达的区域,lk-1表示轨迹中前一个经过的区域,(i,j)表示第i类区域中的第j个区域。
在一种实施方式中,基于扩张因果卷积的线下客流量分布特征提取模块通过历史的时间序列来预测下一时刻的客流量矩阵,该过程抽象为计算极大似然函数的过程,具体如下:
Figure BDA0002677699240000031
其中,w是模型中训练得到的参数,扩张因果卷积网络由多层扩张卷积构成,每一层扩张卷积后输出一个特征图,特征图可以由下式得到:
Figure BDA0002677699240000032
其中d是扩张因子,Ml是通道数,在每层因果卷积中对输入的向量的每d个元素应用卷积核,以获得距离较远的节点之间的关联关系,每层因果卷积后输出一个2通道的特征矩阵,最终输出预测的漫入漫出数矩阵,并通过一个Tanh函数归一化至[-1,1]区间。
在一种实施方式中,S2中用户在线下进入、离开、停留不同区域的三种情况下的线上访问内容分类的情况采用张量形式表示,通过以下方式获取:
构建三种情况下的线上线下关联关系张量,分别计算用户进入、离开、停留某区域的情况下访问不同类别线上内容的用户数。
在一种实施方式中,线上访问注意点分布特征提取模块为多层DCNN网络,S2具体包括:
将构建出的三种情况下的线上线下特征关联的张量作为输入,分别得到每种情况下的关联性特征矩阵,再通过哈德玛积进行矩阵融合得到融合后的线上线下关联特征XAP
在一种实施方式中,在t时刻三种线下用户行为状态定义为:
Figure BDA0002677699240000033
Figure BDA0002677699240000034
Figure BDA0002677699240000035
Figure BDA0002677699240000036
表示t时刻下停留在区域(i,j)并进行线上访问的人数,
Figure BDA0002677699240000037
表示t时刻下进入区域(i,j)并进行线上访问的人数,
Figure BDA0002677699240000041
表示t时刻下离开区域(i,j)并进行线上访问的人数,其中
Figure BDA0002677699240000042
是t时刻用户移动轨迹的集合,p:l1→l2→...→l|p|是用户轨迹,k为轨迹的所经过的区域总数,rk表示最终到达的区域,rk-1表示轨迹中前一个经过的区域,(i,j)表示第i类区域中的第j个区域ck是用户在区域rk中访问的线上内容,在t时刻,停留、进入、离开三种情况下所有区域中访问N种类别线上内容的用户数构成了这三个张量。
在一种实施方式中,步骤S3包括具体包括:
S3.1:构建一个全连接的单隐层网络;
S3.2:将线下客流量分布特征和线上访问注意点分布特征输入单隐层网络,通过训练得到全连接单隐层网络中的权重参数,最终融合获得Xt+1,即下一时刻的客流量分布。
在一种实施方式中,步骤S3.1中构建的全连接单隐层网络包含三个权重参数W1,W2和WR,输入矩阵与隐藏层间的权重参数W1,W2用于衡量两个输入向量对最终结果的影响关系,输入矩阵与W1,W2相乘得到隐藏层矩阵,隐藏层矩阵与输出之间的权重参数WR用于表征隐藏层隐藏层矩阵之间的关系,隐藏层矩阵与WR结合得到最终输出,通过反复更新权重得到训练好的单隐层网络。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明提供的一种线上线下关联的城市客流量预测方法,首先构建预测模型的各个模块,然后对预测模型进行训练;再利用训练好的城市客流量预测模型对城市客流量进行预测。预测模型包括基于扩张因果卷积的线下客流量分布特征提取模块、线上访问注意点分布特征提取模块以及线上线下交互模块。通过基于扩张因果卷积的线下客流量分布特征提取模块、线上访问注意点分布特征提取模块可以分别提取线下客流量分布特征以及线上访问注意点分布特征,因果卷积具有良好的序列建模能力,扩张卷积可以获得良好的感知野,捕捉了时间序列的因果关系,有助于多维特征的融合。线上线下交互模块可以融合线下客流量分布特征和线上访问注意点分布特征,并预测出下一时刻的客流量,解决了现有的技术方法中存在的不能很好地预测突发事件所引起的人流量变化等局限性,结合线上访问内容更加精准地对突发事件引起的客流量变化情况进行预测,提高预测的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种线上线下关联的城市客流量预测方法的流程框图;
图2为本发明实施例中扩张因果卷积的示意图;
图3为本发明实施例中通过扩张因果卷积提取线上线下特征的流程示意图;
图4为本发明实施例中全连接单隐层融合网络的框图。
具体实施方式
本发明实施例提供了一种线上线下关联的城市客流量预测方法,采用扩张因果卷积(DCNN)一方面捕获时间上短期、周期性、长期的依赖关系,结合天气、节假日等外部因素,另一方面捕获线上线下行为的关联性,充分考虑突发事件及其带来的线上行为对线下的用户群体移动情况的影响,更加精确地对下一时刻的客流量分布情况进行预测。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种线上线下关联的城市客流量预测方法,包括:
S1:构建基于扩张因果卷积的线下客流量分布特征提取模块,用于根据捕获时间依赖关系的特征以及外部特征,得到线下客流量分布特征;
S2:构建线上访问注意点分布特征提取模块,用于根据用户在线下进入、离开、停留不同区域的三种情况下的线上访问内容分类的情况获得线上访问注意点分布特征;
S3:构建线上线下交互模块,用于融合线下客流量分布特征和线上访问注意点分布特征,并预测出下一时刻的客流量;
S4:线下客流量分布特征提取模块、线上访问注意点分布特征提取模块以及线上线下交互模块构成城市客流量预测模型,并对预测模型进行训练;
S5:利用训练好的城市客流量预测模型对城市客流量进行预测。
具体来说,时间依赖关系的特征包括长期依赖、周期性依赖、短期依赖特征,外部特征包括天气、节假日等特征。S1可以通过下述方式来实现:划分空间区域类型,并根据空间区域网络构建漫入数/漫出数二维矩阵矩阵,将客流量漫入数/漫出数矩阵根据时间间隔不同划分为张量,分别捕获长期依赖、周期性依赖、短期依赖特征,再结合如天气、节假日等外部特征,融合得到客流量特征分布。
S2可以根据用户在线下进入/离开/停留不同区域的三种情况下的线上访问内容分类的情况构建线上内容访问情况张量,并将三个张量输入扩张因果卷积DCNN模块以获得线上访问与线下活动的关联性矩阵。
S3可以构建一个全连接的单隐层网络用于学习客流量依赖关系Xflow和线上线下关联特征XAP之间的关系权重,并根据学习出的权重进行融合,最终得到输出为预测的下一时刻的客流量矩阵。
本发明主要技术特点包括:1)设计了线上线下交互模块,如图1中所示的线上线下关联单隐层网络,捕捉在线内容浏览和离线人群移动之间的依赖关系,帮助预测瞬时流量变化。2)设计了基于扩展因果卷积的人群和注意点分布分析模块(客流量分布的DCNN与注意点分布的DCNN两个部分,即线下客流量分布特征提取模块和线上访问注意点分布特征提取模块)。如图1中,因果卷积具有良好的序列建模能力,扩张卷积可以获得良好的感知野,用于捕捉了时间序列的因果关系,有助于多维特征的融合。
在一种实施方式中,S1中捕获时间依赖关系的特征为张量形式,通过下述方式得到:
根据功能类型对空间区域网络进行划分,统计每个时刻下各个空间区域的漫入数和漫出数,构建二维客流量矩阵,连续多个时刻上的矩阵构成时间序列;
将构成的连续时刻上的二维矩阵按照不同的时间间隔进行分片,分片后构成三个张量,分别用于捕获长期依赖、周期性依赖和短期依赖关系。
具体实施过程中,空间区域网络中包含多个区域,区域根据功能类型不同进行划分,划分类型共5类,包括商业区、中心商务区、居民区、旅游景点、职能区域,每个分类下包含多个子区域,统计每个区域中每个时刻下的漫入数和漫出数,分别构建漫入数矩阵和漫出数矩阵,然后共同构成一个二维的客流量矩阵。
例如,选取某城市中两个月的数据,将城市中的多个区域按照区域功能划分编号,统计每个区域中的漫入数和漫出数,按照不同的时间间隔划分成三个张量,分别输入到DCNN模块中(线下客流量分布特征提取模块)捕获长期依赖、周期性依赖、短期依赖特征,将外部特征嵌入向量,并与时间依赖特征融合,得到客流量分布特征。
在一种实施方式中,基于扩张因果卷积的线下客流量分布特征提取模块为多层DCNN网络,S1具体包括:
将用于捕获时间依赖关系的三个张量作为输入,通过多层DCNN网络学习输出特征矩阵,再通过哈德玛积将三种特征以及外部特征进行融合,输出表征时间依赖关系的客流量特征Xflow,作为线下客流量分布特征。
请参见图2,为本发明实施例中扩张因果卷积的示意图。
在一种实施方式中,空间网络区域某一时刻漫入数和漫出数的计算方式为:
Figure BDA0002677699240000071
Figure BDA0002677699240000072
其中,
Figure BDA0002677699240000073
是t时刻用户移动轨迹的集合,Tr:l1→l2→...→l|rr|是用户轨迹,k为轨迹的所经过的区域总数,lk表示最终到达的区域,lk-1表示轨迹中前一个经过的区域,(i,j)表示第i类区域中的第j个区域。
具体来说,根据上述定义计算每个区域中的漫入数漫出数分别构建出漫入数矩阵与漫出数矩阵(矩阵中的各个元素表示t时刻各个区域的漫入数和漫出数),合成一个2通道的客流量矩阵。每个时刻上的各区域客流量均可构成一个这样的矩阵,连续时间上的客流量矩阵构成一个时间序列。
在一种实施方式中,基于扩张因果卷积的线下客流量分布特征提取模块通过历史的时间序列来预测下一时刻的客流量矩阵,该过程抽象为计算极大似然函数的过程,具体如下:
Figure BDA0002677699240000081
其中,w是扩张因果卷积DCNN模型中训练得到的参数,扩张因果卷积网络由多层扩张卷积构成,每一层扩张卷积后输出一个特征图,特征图可以由下式得到:
Figure BDA0002677699240000082
其中d是扩张因子,Ml是通道数,在每层因果卷积中对输入的向量的每d个元素应用卷积核,以获得距离较远的节点之间的关联关系,每层因果卷积后输出一个2通道的特征矩阵,最终输出预测的漫入漫出数矩阵,并通过一个Tanh函数归一化至[-1,1]区间。
在一种实施方式中,S2中用户在线下进入、离开、停留不同区域的三种情况下的线上访问内容分类的情况采用张量形式表示,通过以下方式获取:
构建三种情况下的线上线下关联关系张量,分别计算用户进入、离开、停留某区域的情况下访问不同类别线上内容的用户数。
具体来说,线上线下特征关联张量用于学习捕获线上线下特征依赖关系,将用户的线下行为分为进入、离开、停留某区域三种情况,分别在每种情况下统计用户在不同区域中访问线上特定内容的情况,以此构成三个张量。
具体来说,将用户线下行为分为进入、离开、停留某区域三种,将用户的线上访问行为进行分类,线上访问内容共分为17类,包括购物、搜索、交通、新闻、社交、视频、音乐等常见的线上访问内容,涉及到的具体内容包括淘宝、京东、百度、高德地图、微信、QQ等APP的访问情况。将每种线下行为情况下的用户在各区域访问不同线上内容的用户数构建成张量。并输入DCNN模块用于捕获线上线下行为的关联性,参见图3。
在一种实施方式中,线上访问注意点分布特征提取模块为多层DCNN网络,S2具体包括:
将构建出的三种情况下的线上线下特征关联的张量作为输入,分别得到每种情况下的关联性特征矩阵,再通过哈德玛积进行矩阵融合得到融合后的线上线下关联特征XAP
具体来说,在一种实施方式中,将t时刻下的三个张量分别输入DCNN模块(线上访问注意点分布特征提取模块),进行线上线下关联特征的特征提取,每个DCNN模块输出一种情况下的特征矩阵,然后通过哈德玛积将三个DCNN模块的输出矩阵进行融合,得到融合后的线上线下关联矩阵XAP
在一种实施方式中,在t时刻三种线下用户行为状态定义为:
Figure BDA0002677699240000091
Figure BDA0002677699240000092
Figure BDA0002677699240000093
Figure BDA0002677699240000094
表示t时刻下停留在区域(i,j)并进行线上访问的人数,
Figure BDA0002677699240000095
表示t时刻下进入区域(i,j)并进行线上访问的人数,
Figure BDA0002677699240000096
表示t时刻下离开区域(i,j)并进行线上访问的人数,其中
Figure BDA0002677699240000097
是t时刻用户移动轨迹的集合,p:l1→l2→...→l|p|是用户轨迹,k为轨迹的所经过的区域总数,rk表示最终到达的区域,rk-1表示轨迹中前一个经过的区域,(i,j)表示第i类区域中的第j个区域ck是用户在区域rk中访问的线上内容,在t时刻,停留、进入、离开三种情况下所有区域中访问N种类别线上内容的用户数构成了这三个张量,即上述三种线下用户行为状态定义。
在一种实施方式中,步骤S3包括具体包括:
S3.1:构建一个全连接的单隐层网络;
S3.2:将线下客流量分布特征和线上访问注意点分布特征输入单隐层网络,通过训练得到全连接单隐层网络中的权重参数,最终融合获得Xt+1,即下一时刻的客流量分布。
具体来说,在一种实施方式中,构建一个全连接的单隐层神经网络用于学习学习客流量依赖关系Xflow和线上线下关联特征XAP之间的关系权重,参见图4,通过神经网络训练迭代得到最终的网络权重,并根据权重比例对客流量依赖关系Xflow和线上线下关联特征XAP进行融合,最终输出预测的下一时刻的客流量矩阵Xt+1
请参见图4,为本发明实施例中全连接单隐层融合网络的框图。
在一种实施方式中,步骤S3.1中构建的全连接单隐层网络包含三个权重参数W1,W2和WR,输入矩阵与隐藏层间的权重参数W1,W2用于衡量两个输入向量对最终结果的影响关系,输入矩阵与W1,W2相乘得到隐藏层矩阵,隐藏层矩阵与输出之间的权重参数WR用于表征隐藏层隐藏层矩阵之间的关系,隐藏层矩阵与WR结合得到最终输出,通过反复更新权重得到训练好的单隐层网络。
具体来说,将时间依赖关系特征矩阵与线上线下依赖关系特征矩阵输入全连接单隐层网络,具体计算方式为:
Figure BDA0002677699240000101
Figure BDA0002677699240000102
Figure BDA0002677699240000103
其中H1,H2分别为隐藏层矩阵,Xt+1为预测出的下一时刻的客流量分布矩阵。
本发明提供的方法具有如下优点或者有益技术效果:
本发明提出了一种线上线下关联的城市客流量预测方法,通过对时间间隔进行不同的划分,更好地捕获了长期、短期和周期性的时间依赖关系,结合了天气、节假日、重大活动等事件有利于更加准确地捕获一些非趋势性的客流量变化。将用户线上访问行为与线下行为相结合,能够更好地捕捉即时的用户群体行为,帮助更加准确地预测有突发状况下的客流量变化情况。
本发明中所描述的具体实施的例子仅仅是对本发明的方法和步骤的举例说明。本发明所述技术领域的技术人员可以对所描述的具体实施步骤做相应的修改或补充或变形(即采用类似的替代方式),但是不会背离本发明的原理和实质或者超越所附权利要求书所定义的范围。本发明的范围仅由所附权利要求书限定。

Claims (9)

1.一种线上线下关联的城市客流量预测方法,其特征在于,包括:
S1:构建基于扩张因果卷积的线下客流量分布特征提取模块,用于根据捕获时间依赖关系的特征以及外部特征,得到线下客流量分布特征;
S2:构建线上访问注意点分布特征提取模块,用于根据用户在线下进入、离开、停留不同区域的三种情况下的线上访问内容分类的情况获得线上访问注意点分布特征;
S3:构建线上线下交互模块,用于融合线下客流量分布特征和线上访问注意点分布特征,并预测出下一时刻的客流量;
S4:线下客流量分布特征提取模块、线上访问注意点分布特征提取模块以及线上线下交互模块构成城市客流量预测模型,并对预测模型进行训练;
S5:利用训练好的城市客流量预测模型对城市客流量进行预测;
其中,S1中捕获时间依赖关系的特征为张量形式,通过下述方式得到:
根据功能类型对空间区域网络进行划分,统计每个时刻下各个空间区域的漫入数和漫出数,构建二维客流量矩阵,连续多个时刻上的矩阵构成时间序列;
将构成的连续时刻上的二维矩阵按照不同的时间间隔进行分片,分片后构成三个张量,分别用于捕获长期依赖、周期性依赖和短期依赖关系。
2.如权利要求1所述的城市客流量预测方法,其特征在于,基于扩张因果卷积的线下客流量分布特征提取模块为多层DCNN网络,S1具体包括:
将用于捕获时间依赖关系的三个张量作为输入,通过多层DCNN网络学习输出特征矩阵,再通过哈德玛积将三种特征以及外部特征进行融合,输出表征时间依赖关系的客流量特征Xflow,作为线下客流量分布特征。
3.如权利要求 1所述的城市客流量预测方法,其特征在于,空间网络区域某一时刻漫入数和漫出数的计算方式为:
Figure FDA0003677191550000011
Figure FDA0003677191550000012
其中,P是t时刻用户移动轨迹的集合,Tr:l1→l2→…→l|Tr|是用户轨迹,k为轨迹的所经过的区域总数,k表示最终到达的区域,k-1表示轨迹中前一个经过的区域,(i,j)表示第i类区域中的第j个区域。
4.如权利要求2所述的城市客流量预测方法,其特征在于,基于扩张因果卷积的线下客流量分布特征提取模块通过历史的时间序列来预测下一时刻的客流量矩阵,该过程抽象为计算极大似然函数的过程,具体如下:
Figure FDA0003677191550000021
其中,w是模型中训练得到的参数,扩张因果卷积网络由多层扩张卷积构成,每一层扩张卷积后输出一个特征图,特征图由下式得到:
Figure FDA0003677191550000022
其中d是扩张因子,Ml-1是通道数,在每层因果卷积中对输入的向量的每d个元素应用卷积核,以获得距离较远的节点之间的关联关系,每层因果卷积后输出一个2通道的特征矩阵,最终输出预测的漫入漫出数矩阵,并通过一个Tanh函数归一化至[-1,1]区间。
5.如权利要求1所述的城市客流量预测方法,其特征在于,S2中用户在线下进入、离开、停留不同区域的三种情况下的线上访问内容分类的情况采用张量形式表示,通过以下方式获取:
构建三种情况下的线上线下关联关系张量,分别计算用户进入、离开、停留某区域的情况下访问不同类别线上内容的用户数。
6.如权利要求5所述的城市客流量预测方法,其特征在于,线上访问注意点分布特征提取模块为多层DCNN网络,S2具体包括:
将构建出的三种情况下的线上线下特征关联的张量作为输入,分别得到每种情况下的关联性特征矩阵,再通过哈德玛积进行矩阵融合得到融合后的线上线下关联特征XAP
7.如权利要求5所述的城市客流量预测方法,其特征在于,在t时刻三种线下用户行为状态定义为:
Figure FDA0003677191550000023
Figure FDA0003677191550000024
Figure FDA0003677191550000025
Figure FDA0003677191550000026
表示t时刻下停留在区域(i,j)并进行线上访问的人数,
Figure FDA0003677191550000027
表示t时刻下进入区域(i,j)并进行线上访问的人数,
Figure FDA0003677191550000028
表示t时刻下离开区域(i,j)并进行线上访问的人数,其中
Figure FDA0003677191550000029
是t时刻用户移动轨迹的集合,p:l1→l2→…→l|p|是用户轨迹,k为轨迹的所经过的区域总数,rk表示最终到达的区域,rk-1表示轨迹中前一个经过的区域,(i, j)表示第i类区域中的第j个区域ck是用户在区域rk中访问的线上内容,在t时刻,停留、进入、离开三种情况下所有区域中访问M种类别线上内容的用户数构成了这三个张量。
8.如权利要求1所述的城市客流量预测方法,其特征在于,步骤S3包括具体包括:
S3.1:构建一个全连接的单隐层网络;
S3.2:将线下客流量分布特征和线上访问注意点分布特征输入单隐层网络,通过训练得到全连接单隐层网络中的权重参数,最终融合获得Xt+1,即下一时刻的客流量分布。
9.如权利要求8所述的城市客流量预测方法,其特征在于,步骤S3.1中构建的全连接单隐层网络包含三个权重参数W1,W2和WR,输入矩阵与隐藏层间的权重参数W1,W2用于衡量两个输入向量对最终结果的影响关系,输入矩阵与W1,W2相乘得到隐藏层矩阵,隐藏层矩阵与输出之间的权重参数WR用于表征隐藏层矩阵之间的关系,隐藏层矩阵与WR结合得到最终输出,通过反复更新权重得到训练好的单隐层网络。
CN202010953142.5A 2020-09-11 2020-09-11 一种线上线下关联的城市客流量预测方法 Active CN112183824B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010953142.5A CN112183824B (zh) 2020-09-11 2020-09-11 一种线上线下关联的城市客流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010953142.5A CN112183824B (zh) 2020-09-11 2020-09-11 一种线上线下关联的城市客流量预测方法

Publications (2)

Publication Number Publication Date
CN112183824A CN112183824A (zh) 2021-01-05
CN112183824B true CN112183824B (zh) 2022-07-19

Family

ID=73920557

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010953142.5A Active CN112183824B (zh) 2020-09-11 2020-09-11 一种线上线下关联的城市客流量预测方法

Country Status (1)

Country Link
CN (1) CN112183824B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766600B (zh) * 2021-01-29 2023-05-26 武汉大学 一种城市区域人群流量预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967532A (zh) * 2017-10-30 2018-04-27 厦门大学 融合区域活力的城市交通流量预测方法
CN108053080A (zh) * 2017-12-30 2018-05-18 中国移动通信集团江苏有限公司 区域用户数量统计值预测方法、装置、设备及介质
CN110322064A (zh) * 2019-06-27 2019-10-11 清华大学 城市出行需求预测方法
CN111612249A (zh) * 2020-05-20 2020-09-01 北京百度网讯科技有限公司 用于预测人流量的方法、装置、设备以及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10733877B2 (en) * 2017-11-30 2020-08-04 Volkswagen Ag System and method for predicting and maximizing traffic flow

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967532A (zh) * 2017-10-30 2018-04-27 厦门大学 融合区域活力的城市交通流量预测方法
CN108053080A (zh) * 2017-12-30 2018-05-18 中国移动通信集团江苏有限公司 区域用户数量统计值预测方法、装置、设备及介质
CN110322064A (zh) * 2019-06-27 2019-10-11 清华大学 城市出行需求预测方法
CN111612249A (zh) * 2020-05-20 2020-09-01 北京百度网讯科技有限公司 用于预测人流量的方法、装置、设备以及存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Crowd Flow Prediction by Deep Spatio-Temporal Transfer Learning;Leye Wang, Xu Geng, Xiaojuan Ma, Feng Liu, Qiang Yang;《Artificial Intelligence》;arXiv:1802.00386;20180201;全文 *
Revealing Urban Dynamics by Learning Online and Offline Behaviours Together;Tong Xia,Yong Li等;《Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies》;doi.org/10.1145/3314417;20190331;第3卷(第1期);全文 *
Urban flow prediction from spatiotemporal data using machine learning: A survey;PengXie等;《Information Fusion》;20200731;第59卷;全文 *
基于卷积神经网络的人口流量预测;蔡乐等;《电脑与信息技术》;20191215(第06期);全文 *
基于时空残差网络的区域客流量预测方法;董丽丽等;《计算机测量与控制》;20200625(第06期);全文 *
基于深度时空网络的地铁站点客流短时预测;黎旭成等;《交通与运输》;20200831;全文 *

Also Published As

Publication number Publication date
CN112183824A (zh) 2021-01-05

Similar Documents

Publication Publication Date Title
Zhang et al. Curb-gan: Conditional urban traffic estimation through spatio-temporal generative adversarial networks
Luo et al. Fine-grained service-level passenger flow prediction for bus transit systems based on multitask deep learning
Al-Molegi et al. Move, attend and predict: An attention-based neural model for people’s movement prediction
CN113283902B (zh) 一种基于图神经网络的多通道区块链钓鱼节点检测方法
CN114692984A (zh) 基于多步耦合图卷积网络的交通预测方法
Deng et al. The pulse of urban transport: Exploring the co-evolving pattern for spatio-temporal forecasting
Wang et al. Deep temporal multi-graph convolutional network for crime prediction
Zou et al. Short-term traffic flow prediction based on PCC-BiLSTM
Xiong et al. DCAST: a spatiotemporal model with DenseNet and GRU based on attention mechanism
CN116502763A (zh) 一种基于时空图神经网络的人群拥堵预测方法及系统
Wang et al. AI and deep learning for urban computing
CN116434569A (zh) 基于stnr模型的交通流量预测方法及系统
Jiang et al. Crowd flow prediction for social internet-of-things systems based on the mobile network big data
Peng et al. When urban safety index inference meets location-based data
CN112183824B (zh) 一种线上线下关联的城市客流量预测方法
Sandagiri et al. ANN Based Crime Detection and Prediction using Twitter Posts and Weather Data
Zhang et al. Off-deployment traffic estimation—a traffic generative adversarial networks approach
Diao et al. DMSTG: Dynamic Multiview Spatio-Temporal Networks for Traffic Forecasting
Cavallaro et al. A novel spatial–temporal analysis approach to pedestrian groups detection
Gunduz et al. Predicting next location of Twitter users for surveillance
Lima et al. Cognitive smart cities and deep learning: A classification framework
Miyazawa et al. City-scale human mobility prediction model by integrating GNSS trajectories and SNS data using long short-term memory
CN111222666B (zh) 一种数据计算方法和装置
Solomon et al. Predicting application usage based on latent contextual information
CN114912354B (zh) 一种预测蚊媒传染病风险的方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant