CN111709778A - 出行流量预测方法、装置、电子设备和存储介质 - Google Patents

出行流量预测方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN111709778A
CN111709778A CN202010478519.6A CN202010478519A CN111709778A CN 111709778 A CN111709778 A CN 111709778A CN 202010478519 A CN202010478519 A CN 202010478519A CN 111709778 A CN111709778 A CN 111709778A
Authority
CN
China
Prior art keywords
group
target
hidden vector
region
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010478519.6A
Other languages
English (en)
Other versions
CN111709778B (zh
Inventor
刘浩
熊辉
吴奇宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010478519.6A priority Critical patent/CN111709778B/zh
Publication of CN111709778A publication Critical patent/CN111709778A/zh
Application granted granted Critical
Publication of CN111709778B publication Critical patent/CN111709778B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Traffic Control Systems (AREA)

Abstract

本申请公开了出行流量预测方法、装置、电子设备和存储介质,涉及人工智能大数据技术领域,涉及智能交通应用。具体实现方案为:根据多个区域的历史流量特征,生成每个区域的隐向量,根据多个群体的历史流量特征,生成每个群体的隐向量,根据每个区域的隐向量和每个群体的隐向量,确定隐向量相关的目标区域和目标群体,根据目标区域的隐向量和目标群体的隐向量预测目标区域中的目标群体的出行流量。本申请中基于每个区域的隐向量和每个群体的隐向量,确定相关的目标区域和目标群体,使得在相关群体间进行信息共享,实现了精准的群体流量预测,解决了现有技术中无法准确确定群体间相关性,导致出行流量预测准确度较低的技术问题。

Description

出行流量预测方法、装置、电子设备和存储介质
技术领域
本申请涉及人工智能大数据技术领域,尤其涉及智能交通应用,具体涉及出行流量预测方法、装置、电子设备和存储介质。
背景技术
在进行户外广告投放,或者是提供出行服务时,往往是基于预测的出行流量进行的。例如,在进行广告投放时,可以选取目标群体出行最密集的时段进行投放,从而提高投放效率。相似地,在提供出行服务时,若预先了解到出行流量和群体构成信息,则能够提供更为灵活和个性化的服务。
但通过对出行行为进行观测,发现不同的时间和不同的地区的不同群体具有不同的出行模式。基于历史观测数据,对不同地区的不同群体预测不同时刻的出行流量是较为困难的工作。为了能够在线下投放更加精确的个性化广告,以提高广告投放的效果,或者是能够提供更为有针对性的出行服务,亟需提供一种能够准确预测出行流量的方案。
发明内容
提供了一种用于出行流量预测方法、装置、电子设备和存储介质。
根据第一方面,提供了一种出行流量预测方法,基于每个区域的隐向量和每个群体的隐向量,确定存在相关关系的目标区域和目标群体,使得在相关群体间进行信息共享,避免了不相关群体间的信息共享导致的噪声引入,实现了精准的群体流量预测,解决了现有技术中无法准确确定群体间相关性,导致出行流量预测准确度较低的技术问题。
本申请的第二方面提出一种出行流量预测装置。
本申请的第三方面提出一种电子设备。
本申请的第四方面提出一种存储有计算机指令的非瞬时计算机可读存储介质。
根据第一方面,提供了一种出行流量预测方法,该方法包括:
根据多个区域的历史流量特征,生成每个所述区域的隐向量,其中,所述区域的隐向量用于指示所述区域的历史流量特征变化规律;
根据多个群体的历史流量特征,生成每个所述群体的隐向量,其中,所述群体的隐向量用于指示所述群体的历史流量特征变化规律;
根据所述每个区域的隐向量和所述每个群体的隐向量,确定隐向量相关的目标区域和目标群体;以及
根据所述目标区域的隐向量和所述目标群体的隐向量预测所述目标区域中的所述目标群体的出行流量。
根据第二方面,提供了一种出行流量预测装置,该装置包括:
生成模块,用于根据多个区域的历史流量特征,生成每个所述区域的隐向量,其中,所述区域的隐向量用于指示所述区域的历史流量特征变化规律;根据多个群体的历史流量特征,生成每个所述群体的隐向量,其中,所述群体的隐向量用于指示所述群体的历史流量特征变化规律;
确定模块,用于根据所述每个区域的隐向量和所述每个群体的隐向量,确定隐向量相关的目标区域和目标群体;
预测模块,用于根据所述目标区域的隐向量和所述目标群体的隐向量预测所述目标区域中的所述目标群体的出行流量。
根据第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的出行流量预测方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行第一方面所述的出行流量预测方法。
本发明实施例所提供的技术方案,可以包含如下的有益效果:
根据多个区域的历史流量特征,生成每个区域的隐向量,其中,区域的隐向量用于指示区域的历史流量特征变化规律,根据多个群体的历史流量特征,生成每个群体的隐向量,其中,群体的隐向量用于指示群体的历史流量特征变化规律,根据每个区域的隐向量和每个群体的隐向量,确定隐向量相关的目标区域和目标群体,以及根据目标区域的隐向量和目标群体的隐向量预测目标区域中的目标群体的出行流量,本申请中基于每个区域的隐向量和每个群体的隐向量,确定存在相关关系的目标区域和目标群体,使得在相关群体间进行信息共享,避免了不相关群体间的信息共享导致的噪声引入,实现了精准的人群流量预测。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例所提供的一种出行流量预测方法的流程示意图;
图2为本申请实施例提供的另一种出行流量预测方法的流程示意图;
图3为本申请实施例提供的区域相关图的示意图;
图4为本申请实施例提供的区域相关图的示意图;
图5为本申请实施例提供的又一种出行流量预测方法的流程示意图;
图6为本申请实施例提供的一种分类模型的示意图;
图7为本申请实施例提供的再一种出行流量预测方法的结构示意图;
图8为本申请实施例提供的一种出行流量预测装置的结构示意图;
图9是根据本申请实施例的出行流量预测方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面参考附图描述本申请实施例的出行流量预测方法、装置、电子设备和存储介质。
图1为本申请实施例所提供的一种出行流量预测方法的流程示意图。
相关技术中,对于不同区域中的不同群体流量进行预测时,一种预测方法是会忽略群体之间的相关性,导致预测的准确性较低。一种预测方法是认为所有群体之间都具有相关性,而实际应用中,有些群体之间并不相关,例如,高消费群体和低消费群体,这种预测方法会使得信息在不相关的群体之间传递,引入较大的噪声,导致预测的准确性较低。本申请实施例中,基于历史流量特征,识别区域和群体之间的相关性,从而对存在相关性的区域和群体预测出行流量,避免了不相关群体间的信息共享导致的噪声引入,实现了精准的群体流量预测。
如图1所示,该方法包括以下步骤:
步骤101,根据多个区域的历史流量特征,生成每个区域的隐向量,其中,区域的隐向量用于指示区域的历史流量特征变化规律。
其中,流量是指的群体的出行流量,而出行流量中包含流入的流量和留出的流量,历史流量特征指示了当前时刻之前的某个历史时刻,各个区域中的群体出行流量情况。
作为一种实现方式,每个区域的历史流量特征,是根据该区域与在地理位置上与该区域相邻的多个区域的历史出行流量确定的,从而每个区域的历史流量特征包含了相邻区域之间空间上的相关关系。其中,每个区域的历史流量特征中包含多个维度,每个维度对应一个群体在一个历史时刻的历史流量值,其中,群体是根据城市中的人群进行分类得到的,分类的方式可以根据具体场景的需求进行划分,例如,群体可以是根据人群的消费类型划分得到的,例如,高消费群体,中等消费群体和低消费群体等。又或者是根据人群的性别和年龄划分的,例如,男性群体、女性群体,和老年群体等,对于群体的划分,本实施例中不进行限定。其中,每个区域的历史流量特征的确定方式,下述实施例中会详细介绍。
需要说明的是,历史时刻可以是本领域技术人员根据需求,将一段历史时间,划分为的多个历史时刻,例如,将10点整至10点30的历史时间区间作为一个历史时刻,本实施例中不进行限定。
作为一种可能的实现方式,将每一个区域的历史流量特征,输入门控神经网络(Gated Recurrent Unit,GRU),输出每个区域的隐向量,具体来说,针对每一区域,将历史时刻t对应的区域的历史流量特征,和历史时刻t-1对应的门控神经网络的输出,输入门控神经网络,结合门机制可以得到历史时刻t的门控神经网络输出的隐向量,由于历史时刻t对应的区域的历史流量特征包含了该区域与相邻区域间的空间依赖关系,而t-1时刻门控神经网络输出的隐向量,包含了t时刻之前时空上的相关关系,从而,通过门控神经网络聚合了各个历史时刻,每个区域的历史流量特征,得到每个区域的隐向量,该隐向量包含了时间上的相关关系,也包含了空间上的相关关系,指示了相应区域的历史流量特征变化规律。
步骤102,根据多个群体的历史流量特征,生成每个群体的隐向量,其中,群体的隐向量用于指示群体的历史流量特征变化规律。
本实施例中,每个群体的历史流量特征,是根据该群体与该群体存在相关关系的多个群体的历史出行流量确定的,从而每个群体的历史流量特征包含了群体间的相关关系,增加每个群体携带的历史流量特征包含的信息。其中,每个群体的历史流量特征中包含多个维度,每个维度对应一个区域在一个历史时刻的历史出行流量值。其中,群体的历史流量特征的确定方式,下述实施例中会详细介绍
需要说明的是,历史时刻可以是本领域技术人员根据需求,将一段历史时间,划分为的多个历史时间区间,每个历史时间区间对应一个历史时刻,例如,历史时间为8点-12点,每30分钟作为一个历史时刻,其中,10点整至10点30分即为其中一个历史时刻,本实施例中不进行限定。
作为一种可能的实现方式,将每一个群体的历史流量特征,输入门控神经网络(Gated Recurrent Unit,GRU),输出每个群体的隐向量,具体来说,针对每一群体,将历史时刻t对应的群体的历史流量特征,和历史时刻t-1对应的门控神经网络的输出,输入门控神经网络,结合门机制可以得到历史时刻t的门控神经网络输出的隐向量,由于历史时刻t对应的群体的历史流量特征包含了该群体与相邻群体间的空间依赖关系,而t-1时刻门控神经网络输出的隐向量,包含了t时刻之前群体间在时空上的相关关系,从而,通过门控神经网络聚合了在各个历史时刻每个群体的历史流量特征,得到每个群体的隐向量,该群体的隐向量包含了时间上的相关关系,也包含了空间上的相关关系,指示了相应群体的历史流量特征变化规律。
步骤103,根据每个区域的隐向量和每个群体的隐向量,确定隐向量相关的目标区域和目标群体。
本实施例中,根据每个区域的隐向量和每个群体的隐向量,确定隐向量相关的目标区域和目标群体,也就是说由于区域的隐向量中包含了各个群体在该区域的流量特征,而群体的隐向量中包含了该群体在不同区域的流量特征,从而可以基于隐向量,从多个区域和群体中,确定存在相关关系的目标区域和目标群体,以建立群体间的相关性,相较于现有技术中,将所有的群体间都认为具有相关关系,导致不相关的群体间信息交互引入较多噪声的技术方案,本申请基于隐向量,建立相关的目标区域和目标群体,以充分考量实际具有相关关系的群体间的相关性,以实现未来流量的精准预测。
步骤104,根据目标区域的隐向量和目标群体的隐向量预测目标区域中的目标群体的出行流量。
本实施例中,由于目标区域的隐向量和目标群体的隐向量之间存在相关关系,而目标区域的隐向量指示了目标区域的历史流量特征变化规律,而目标群体的隐向量用于指示目标群体的历史流量特征变化规律,从而可将存在相关关系的目标区域的隐向量和目标群体的隐向量包含的信息进行融合,由于融合得到的隐向量中包含了区域中各个群体的流量信息,也包含了群体在各个区域的流量信息,从而,根据该融合隐向量以预测目标区域中的目标群体的出行流量,实现了精准的群体流量预测。
本实施例的出行流量预测方法中,根据多个区域的历史流量特征,生成每个区域的隐向量,其中,区域的隐向量用于指示区域的历史流量特征变化规律,根据多个群体的历史流量特征,生成每个群体的隐向量,其中,群体的隐向量用于指示群体的历史流量特征变化规律,根据每个区域的隐向量和每个群体的隐向量,确定隐向量相关的目标区域和目标群体,以及根据目标区域的隐向量和目标群体的隐向量预测目标区域中的目标群体的出行流量。本申请中通过多个区域的历史流量特征和多个群体的历史流量特征,确定存在相关关系的区域和群体,建立了各区域中存在相关关系的群体间的信息共享,而避免了不相关群体间的信息共享导致的噪声引入,实现了更精准的群体流量预测。
基于上一实施例,本实施例提供了另一种出行流量预测方法的流程示意图,进一步说明了如何根据区域的历史流量间的相关性,确定区域的历史流量特征,以及如何根据群体的历史流量间的相关性,确定群体的历史流量特征。
图2为本申请实施例提供的另一种出行流量预测方法的流程示意图,如图2所示,该方法包含以下步骤:
步骤201,获取区域相关图,根据区域相关图,确定各区域通过边连接的相邻区域。
本实施例中,根据预测的需求,将需要进行出行流量预测的特定区域,例如,某个城市,某个乡镇等,划分为多个区域,多个区域之间既有地理位置上相邻的区域,即空间上相邻的区域,也有地理位置上相隔较远的区域,即空间上不相邻的区域,由于空间上相邻区域之间具有更强的相关性,因此,将地理位置上相邻的两个区域之间连接一条边,以生成区域相关图,其中,区域相关图中包括各区域,以及连接不同区域的边,连接不同区域的边用于指示所连接的不同区域在地理位置上具有相邻关系。
需要说明的是,区域的划分和大小可根据实际的预测需求进行确定,本实施例中不进行限定。
图3为本申请实施例提供的区域相关图的示意图,如图3所示,区域相关性图中的每个结点是不同的区域,图3中不同的节点图像符号代表了对应区域的功能性不同,由于相互邻接的区域之间具有更强的相关性,因此,将空间地理位置上相邻的两个区域之间连接一条边,以表示两个区域在地理位置上具有相邻关系。
步骤202,根据每一区域的历史出行流量,以及相邻区域的历史出行流量,生成区域的历史流量特征。
其中,区域相关图中的每一个区域都具有对应的区域历史出行流量,区域的历史出行流量中包含多个维度,每个维度对应一个群体的历史出行流量。例如,有3个群体,分别为男人、女人和老人,其中,男人群体在区域1中的历史出行流量值为A1,女人群体在区域1中的的历史出行流量值为A2,老人群体在区域1中的历史出行流量值为A3,那么区域1的历史出行流量可表示为[A1,A2,A3]。
需要说明的是,本步骤中的区域的历史出行流量是对应一个历史时刻的历史出行流量。
作为本实施例的一种可能的实现方式,将每一区域的历史出行流量和相邻区域的历史出行流量,通过图神经网络模型生成相应区域的历史流量特征,也就是说利用图神经网络模型来实时计算每一区域,与该区域相邻区域间的相关性。其中,图神经网络模型为预先基于各区域间的空间依赖关系建立的,区域间的空间依赖关系通过区域间的群体历史出行流量确定。具体地,利用图神经网络模型的注意力机制确定相应区域与相邻区域之间的权重,其中,注意力机制例如为自注意力机制self-attention,本实施例中不进行限定。具体通过下述公式1和公式2实现:
cij=Attention(waxi,waxj)(公式1)
Figure BDA0002516576160000071
其中,Wa为图神经网络模型在训练过程中学习到的参数,xi表示第i个区域的历史出行流量的向量,xj表示第j个区域的历史出行流量的向量,cij为xi和xj的注意力系数,通过注意力机制即Attention()函数获得,Ni表示相关图中与第i个区域相邻的各区域,则根据图注意力机制学习得到第i个节点对应的区域和相邻的第j个节点对应的区域之间边的权重αij,权重αij指示了第i个节点对应的区域和相邻的第j个节点对应的区域之间的相关度大小。
进而,针对每个区域,根据确定的与相邻区域间的权重αij,利用下述的公式3,将相应区域的历史出行流量的向量,与其相邻的各个区域的历史出行流量的向量进行融合,以生成该区域的历史流量特征。
Figure BDA0002516576160000081
其中,σ是激活函数。
本实施例中,根据预先构建得到的区域相关图,确定空间上相邻的各区域,针对每一区域,将该区域相邻的各区域的历史出行流量进行加权融合,以生成该区域的历史流量特征,也就是说将给区域相邻的各区域的历史出行流量聚合起来,将聚合后得到的新的历史出行流量,作为该区域的历史出行流量特征,实现了充分利用相邻区域的历史出行流量间的相关性,增加了该区域中包含的历史出行流量的信息。
步骤203,根据多个区域的历史流量特征,生成每个区域的隐向量,其中,区域的隐向量用于指示区域的历史流量特征变化规律。
具体,可参照上一实施例中的步骤101,原理相同,此处不再赘述。
步骤204,获取群体相关图。
其中,对要进行出行流量预测的特定区域中的人进行群体的分类,例如,流量预测的区域为一个城市,对该城市中的人进行群体的划分,得到多个群体,例如,群体可以是根据人的消费类型划分得到的,例如,高消费群体,中等消费群体和低消费群体等。又或者是根据人群的性别和年龄划分的,例如,男性群体、女性群体,儿童群体和老年群体等,对于群体的划分,本实施例中不进行限定。
本实施例中,根据划分得到的各个群体,确定各个群体之间在历史出行流量上的相似性,将历史出行流量具有相似性的群体间用边进行连接,以建立两个群体间的相关关系,根据各个群体,以及连接群体间的边,构成群体相关图,也就是说群体相关图中包括各群体,以及连接不同群体的边,其中,连接不同群体的边用于指示所连接的不同群体在历史出行流量上存在相似性。
由于历史流量序列间具有相关关系的群体间具有更强的相关性,因此,在本发明实施例的一种可能的实现方式中,为了提高获取到的群体相关图的准确性,可基于皮尔斯相关系数确定群体的历史流量序列间的相关性,获取群体相关图,具体可以包含如下步骤:
对每一群体,根据各历史时刻的历史出行流量,生成相应群体的流量序列;
采用皮尔斯相关系数,计算任意两群体的流量序列的相似程度;
对每一群体,按照相似程度从大到小顺序,对其余群体排序,以确定排序为前设定个数的相邻群体;
在群体相关图中,通过边连接各群体和对应的相邻群体。
其中,皮尔斯相关系数pcc(l,k),利用下述的公式4实现:
Figure BDA0002516576160000091
其中,t为各历史时刻,T为各历史时刻的集合,l和k是任意的两个群体,
Figure BDA0002516576160000092
Figure BDA0002516576160000093
是t时刻的历史流量xt n,l和xt n,k的均值,n代表区域,|R|表示所有区域的集合。
例如,共有5个群体,分别称为群体1、群体2、群体3、群体4和群体5,利用皮尔斯相关系数,计算出任意两群体的流量序列间的相似程度,以群体1为例,按照群体1与群体2-群体5之间的相似程度,将群体2-群体5按照相似程度从大到小排序,排序为:群体4,群体5,群体2和群体3,设定个数为2,则群体4和群体5为相邻群体,进而,在群体相关图中,通过边连接群体1和对应的相邻群体4,以及通过边连接群体1和对应的相邻群体5,同理,通过边连接各群体和对应的相邻群体,得到群体相关图。本实施例中,通过计算群体的流量序列间的相似程度,提高了群体间相似程度确定的准确性,也提高了构造的群体相关图的可靠性。
以真实场景中的群体为例,生成的群体相关图,如图4所示,以群体间是否存在边的连接,来识别不同群体间的相关性,例如,孕妇群体和妈妈群体因为都关注儿童,从而具有相关性,孕妇群体和行动不便的群体间,因都属于需要特别关注的群体,因而,也具有相关性,针对图4本实施例中不一一列举。
步骤205,根据群体相关图,确定各群体通过边连接的相邻群体。
其中,群体相关图中包含了存在相关关系的各群体,从而根据群体相关图中的各条边,确定边连接的相邻群体,例如,群体1和群体4即为通过边连接的相邻群体。
步骤206,根据每一群体的历史出行流量,以及相邻群体的历史出行流量,生成群体的历史流量特征。
其中,相关图中的每一个群体都具有对应的历史出行流量,群体的历史出行流量中包含各个区域的历史出行流量值。
作为本实施例的一种可能的实现方式,将每一群体的历史出行流量和相邻群体的历史出行流量,通过图神经网络生成相应群体的历史流量特征。具体地,利用图神经网络的注意力机制确定相应群体与相邻群体之间的权重,具体通过下述公式5和公式6实现:
cl,k=Attention(waxl,waxk) (公式5)
Figure BDA0002516576160000101
其中,Wa为图神经网络的参数,clk为xl和xk的注意力系数,xl表示第l个群体的历史出行流量的向量,xk表示第k个群体的历史出行流量的向量,Nl表示相关图中与第l个群体相邻的各群体,则根据图注意力机制学习得到第l个群体和相邻的第k个群体之间边的权重αlk
进而,利用下述的公式7,将相应群体的历史出行流量的向量,与其相邻的各个群体的历史出行流量的向量进行融合,以生成该群体的历史流量特征,即为x’l
Figure BDA0002516576160000102
其中,σ是激活函数。
步骤207,根据多个群体的历史流量特征,生成每个群体的隐向量,其中,群体的隐向量用于指示群体的历史流量特征变化规律。
步骤208,根据每个区域的隐向量和每个群体的隐向量,确定隐向量相关的目标区域和目标群体。
步骤209,根据目标区域的隐向量和目标群体的隐向量预测目标区域中的目标群体的出行流量。
具体地,步骤207-步骤209可参照上一实施例中的步骤102-步骤104,原理相同,此处不再赘述。
本实施例的出行流量预测方法中,根据构造的区域相关图,确定相邻区域,针对每一区域,将相邻区域的历史出行流量融合至该区域的历史出行流量,以生成该区域的历史流量特征,增加了该区域的历史出行流量特征包含的信息量,充分利用相邻区域的历史出行流量间的相关性特征。同理,通过构造的群体相关图,确定相邻的群体,针对每一群体,将相邻群体的历史出行流量融合至该群体的历史出行流量,以生成该群体的历史流量特征,充分利用了相邻群体的历史出行流量,增加了该群体的历史出行流量特征包含的信息量,进而,基于确定的区域的历史流量特征和群体的历史流量特征,提高目标区域中的目标群体的出行流量预测的准确性。
基于上一实施例,图5为本申请实施例提供的又一种出行流量预测方法的流程示意图,详细说明了如何通过分组,确定每一组中的目标区域和目标群体。
如图5所示,上述步骤103或步骤208,还可以包含以下步骤:
步骤301,根据每个区域的隐向量和每个群体的隐向量,对多个区域以及多个群体分组,得到属于同一分组的目标区域和目标群体。
其中,同一分组内的目标区域和目标群体的隐向量相关。
本实施例中,通过分组,将相关度较高的区域和群体分至同一组中,实现了基于群体的相关性进行分组,以使得后续进行流量预测时充分考虑了不同群体间的相关性。
可选地,在将多个区域和多个群体进行分组前,先对每个区域的隐向量和每个群体的隐向量进行非线性变换,以将用于指导分组的信息保留下来,将冗杂的信息去除,降低数据的复杂度,以提高后续分组时数据的利用率和提高分组的效率和准确度。
在本申请实施例的一种可能的实现方式中,利用预先训练得到的分类模型进行识别,其中,分类模型已经预先学习到了群体属于每一分组的概率,以及区域属于每一分组的概率。从而,将每一个群体的隐向量输入分类模型,得到群体属于每一分组的概率,以及将每一个区域的隐向量输入分类模型,得到区域属于每一分组的概率,对各分组,统计属于相应分组的概率不为零的群体和区域,作为相应分组的目标区域和目标群体,由于不同群体间的相关性是不同的,基于区域的隐向量和群体的隐向量中包含的群体的历史流量信息,将具有相关关系的区域和群体分配至同一组中,实现了充分和准确的考虑群体间的相关性,提高了预测的效率和准确度。
在本发明实施例的一种可能的实现方式,将每一个群体的隐向量输入分类模型,得到群体属于每一分组的概率,以及将每一个区域的隐向量输入分类模型,得到区域属于每一分组的概率,还可以包含以下的步骤:
对每一分组,生成分组的分组任务,其中,每一分组任务,对应一个群体的隐向量,或一个区域的隐向量,每一分组的分组任务总数是根据群体总数和区域总数确定的;
执行每一分组的分组任务,以将分组任务对应的隐向量,输入分组的分类模型,得到输入的隐向量所对应群体或区域属于分组的概率;
其中,每一分组对应的分类模型,包括顺序连接的全连接层和分组层,其中,全连接层,为相应分组内各分组任务共用,分组层为多个,每一个分组任务对应一个分组层。
图6为本申请实施例提供的一种分类模型的示意图,本实施中以一个分组对应的分类模型中包含6个分组层为例进行说明,如图6所示,该分组对应的分组任务为6个,也就是说分组任务对应的群体总数和区域总数的和为6,其中,分组1-分组3对应群体1的隐向量-群体3的隐向量,而分组4-分组6,对应区域1的隐向量-区域3的隐向量。执行每一分组的分组任务,以将分组任务对应的群体的隐向量,以及分组任务对应的区域的隐向量,输入分组的分类模型,得到输入的群体隐向量所对应群体属于该分组的概率,以及输入的区域隐向量所对应区域属于该分组的概率。
需要说明的是,针对相同的区域隐向量和群体隐向量,利用多个分组对应的分类模型进行分组的概率识别时,同一群体隐向量所对应群体属于不同分组的概率不同,以及输入的区域隐向量所对应区域属于不同分组的概率不同,也就是说不同的分组中包含的群体和区域是相同的,而群体和区域在不同的分组中对应的概率不同,从而实现了通过不同的分组,来实现群体和区域间不同相关性的分布,从而实现了充分考虑不同群体间的相关性。
本实施例的出行流量预测方法中,在每一分组内,利用多任务的方式构建分组模型,以进行分组预测,由于分组模型在模型训练的过程中已经自动学习了哪些群体和区域更相关,应该被分到同一分组内,增强了相关任务之间信息共享的同时,避免了不相关任务之间的信息传递引入的噪声,提高了分组预测的准确性。
基于上述实施例,本申请提供了又一种出行流量预测方法的可能的实现方式,图7为本申请实施例提供的再一种出行流量预测方法的结构示意图,进一步说明了如何基于各个分组,进行出行流量预测。
如图7所示,根据目标区域的隐向量和目标群体的隐向量预测目标区域中的目标群体的出行流量,包含以下步骤:
步骤501,在每一分组内,根据属于分组的概率,将目标区域的隐向量和目标群体的隐向量进行加权,得到目标区域和目标群体在分组内的融合隐向量。
具体地,在每一分组内,根据属于分组的概率,先将目标区域的隐向量利用分组的概率进行加权,将目标群体的隐向量利用对应的分组的概率进行加权,再将加权得到的目标区域的隐向量和目标群体的隐向量进行拼接,得到目标区域和目标群体在分组内的融合隐向量,该融合隐向量用于后续进行流量预测。
例如,在分组中,目标区域的隐向量属于分组的概率为wj,目标群体的隐向量属于分组的概率为wl,利用分组的概率计算目标区域的加权隐向量为
Figure BDA0002516576160000131
其中,j代表第j个目标区域,k代表对应的分组,同理,得到目标群体的加权隐向量为
Figure BDA0002516576160000132
其中,l代表第l个目标群体。将目标区域的加权隐向量和目标群体的加权隐向量进行拼接融合,得到目标区域j和目标群体l在分组k内的融合隐向量,记为
Figure BDA0002516576160000133
需要理解的是,通过将加权得到的目标区域的隐向量和目标群体的隐向量进行拼接以得到融合向量,实现了对融合隐向量的扩维,使得融合隐向量携带更多的信息,而这种将两个向量直接进行拼接的扩维方式,相比于传统的将两个向量进行相乘的扩维方式,降低了网络的参数,大大降低了运算的复杂度。
步骤502,将每一分组内的融合隐向量输入相应分组的预测模型,得到目标区域和目标群体在分组内的预测出行流量。
其中,预测模型为一个多层神经网络。
其中,各个分组内的预测出行流量,通过以下公式8实现。
Figure BDA0002516576160000134
其中,k代表分组,例如,k=2,即当前对第2个分组内的出行流量进行预测。t为当前时刻,τ为未来的某个时刻,fk为预测模型的全连接层。
本实施例中在得到每一分组内的融合隐向量后,将融合隐向量输入相应分组的预测模型,即通过公式8,可预测未来一段时间内,目标区域中,目标群体在该分组内的预测出行流量。例如,可预测当前时刻t至未来的t+τ时间内,在分组1中,目标区域1中,目标群体2的预测出行流量;分组1中,目标区域1中,目标群体3的预测出行流量;分组1中,目标区域2中,目标群体2的预测出行流量,即可预测得到分组1中,每一个目标区域中,对应的目标群体的预测出行流量,同理,可预测得到每一个分组中,目标区域中,目标群体的预测出行流量,本实施例中不一一列举。
步骤503,根据目标区域和目标群体在每一分组内的预测出行流量,预测得到目标区域中目标群体的出行流量。
在本申请实施例的一种可能的方式,获取上述步骤中确定的目标区域和目标群体在每一分组内的预测出行流量,将所有分组内的预测出行流量进行融合,得到目标区域中目标群体的预测出行流量,由于不同的分组中,预测得到的预测出行流量,充分考虑了不同的群体之间的不同的相关关系,提高了群体流量预测的准确性。
在本发明实施例的另一种可能的实现方式中,可根据目标区域和目标群体属于每一分组的概率,对分组内的预测出行流量进行加权,得到目标区域中目标群体的出行流量,具体通过以下的公式9实现。
Figure BDA0002516576160000141
具体地,将各分组内预测得到的出行流量,根据目标区域和目标群体属于每一分组的概率,进行加权求和,以将各个分组内预测得到的出行流量进行聚合,得到目标区域中目标群体的出行流量的最终的预测结果,由于各个分组中群体间的相关性不同,通过将各个分组内预测得到的结果进行加权聚合,实现了将群体间的各种不同的相关情况进行了考虑,实现了准确建立群体间的相关性,提高了区域中群体的出行流量预测的准确性。
本实施例的出行流量预测方法中,在每一分组内,根据分组的概率,将目标区域的隐向量和目标群体的隐向量进行加权,得到目标区域和目标群体在分组内的融合隐向量,以增加融合隐向量携带的信息,进而,利用分组对应的预测模型,基于融合隐向量,预测得到该分组内,未来各个时刻目标群体在目标区域中的预测出行流量,进而,根据各个分组内由于各个分组中群体间的相关性不同,通过将各个分组内预测得到的结果进行加权聚合,实现了将群体间的各种不同的相关情况进行了考虑,提高了区域中群体的出行流量预测的准确性。
上述实施例中描述了根据分类模型进行分组,以得到群体或区域属于每一分组的概率,为此,本实施例针对分类模型的训练方法进行说明,具体如下:
构建一个自监督的分类模型,分类模型如图5所示的分类模型的架构,对该分类模型进行训练。以区域为例,区域的隐向量为hj,为了提高后续分组的准确性,先对区域的隐向量利用公式10进行非线性变化。
h'j=σ(wfhj) (公式10)
其中,σ是非线性激活函数,Wf是一个全连接层,通过非线性变化,实现了将区域隐向量中可用于分组的信息保留下来,将不可用于分组的信息去除,降低了区域的隐向量中包含的信息量,以提高后续分组的准确性和效率。
进一步,将非线性变化后的区域的隐向量输入分类模型中,确定分类模型中区域在进行分组时对应的损失函数,见公式11和公式12:
Figure BDA0002516576160000142
Figure BDA0002516576160000143
其中,Wc是一个全连接层,
Figure BDA0002516576160000144
表示各分组对应类别的分类向量,
Figure BDA0002516576160000145
表示第i维的分类分数,o1表示分类任务的损失函数。同理,可以得到群体进行分组时的损失函数o2。因此最终的分类损失为对群体进行分组时对应的损失函数与对区域进行分组时对应的损失函数的和,记为oc,在oc最小时,分类模型训练完成,该分类模型已经学习到了不同的区域和不同的群体属于各分组的概率,通过分类模型进行分组,提高了分组的效率。
为了实现上述实施例,本申请还提供了一种出行流量预测装置。
图8为本申请实施例提供的一种出行流量预测装置的结构示意图。
如图8所示,该装置包含:生成模块31、确定模块32和预测模块33。
生成模块31,用于根据多个区域的历史流量特征,生成每个区域的隐向量,其中,区域的隐向量用于指示所述区域的历史流量特征变化规律;根据多个群体的历史流量特征,生成每个群体的隐向量,其中,群体的隐向量用于指示群体的历史流量特征变化规律。
确定模块32,用于根据每个区域的隐向量和每个群体的隐向量,确定隐向量相关的目标区域和目标群体。
预测模块33,用于根据目标区域的隐向量和目标群体的隐向量预测目标区域中的目标群体的出行流量。
在本发明实施例的一种可能的实现方式中,该装置还包括:
获取模块,用于获取区域相关图;其中,所述区域相关图中包括各区域,以及连接不同区域的边;所述连接不同区域的边用于指示所连接的不同区域在地理位置上相邻。
上述确定模块32,还用于根据所述区域相关图,确定各所述区域通过边连接的相邻区域。
上述生成模块31,用于根据每一所述区域的历史出行流量,以及相邻区域的历史出行流量,生成所述区域的历史流量特征。
作为一种可能的实现方式,上述获取模块,还用于获取群体相关图;其中,所述群体相关图中包括各群体,以及连接不同群体的边;所述连接不同群体的边用于指示所连接的不同群体在历史出行流量上存在相似性。
上述确定模块32,还用于根据所述群体相关图,确定各群体通过边连接的相邻群体。
上述生成模块31,还用于根据每一所述群体的历史出行流量,以及相邻群体的历史出行流量,生成所述群体的历史流量特征。
作为一种可能的实现方式,上述获取模块,还用于:
对每一群体,根据各历史时刻的历史出行流量,生成相应群体的流量序列,采用皮尔斯相关系数,计算任意两群体的流量序列的相似程度,对每一群体,按照所述相似程度从大到小顺序,对其余群体排序,以确定排序为前设定个数的相邻群体,在群体相关图中,通过边连接各群体和对应的相邻群体。
作为一种可能的实现方式,上述确定模块32,还用于:
根据所述每个区域的隐向量和所述每个群体的隐向量,对所述多个区域以及所述多个群体分组,得到属于同一分组的目标区域和目标群体;其中,同一分组内的所述目标区域和所述目标群体的隐向量相关。
作为一种可能的实现方式,上述确定模块32,包括:
分类单元,用于将每一个所述群体的隐向量输入分类模型,得到所述群体属于每一分组的概率,以及将每一个所述区域的隐向量输入所述分类模型,得到所述区域属于每一所述分组的概率。
统计单元,用于对各所述分组,统计属于所述分组的概率不为零的群体和区域,作为所述分组的目标区域和目标群体。
作为一种可能的实现方式,上述预测模块33,包括:
融合单元,用于在每一所述分组内,根据属于所述分组的概率,将所述目标区域的隐向量和所述目标群体的隐向量进行加权,得到所述目标区域和所述目标群体在所述分组内的融合隐向量。
第一预测单元,用于将每一所述分组内的融合隐向量输入相应分组的预测模型,得到所述目标区域和所述目标群体在所述分组内的预测出行流量。
第二预测单元,用于根据所述目标区域和所述目标群体在每一所述分组内的预测出行流量,预测得到所述目标区域中所述目标群体的出行流量。
作为一种可能的实现方式,上述第二预测单元,还用于:
根据所述目标区域和所述目标群体属于每一所述分组的概率,对所述分组内的预测出行流量进行加权,得到所述目标区域中所述目标群体的出行流量。
作为一种可能的实现方式,上述分类单元,用于:
对每一所述分组,生成所述分组的分组任务;其中,每一所述分组任务,对应一个所述群体的隐向量,或一个所述区域的隐向量;每一所述分组的分组任务总数是根据群体总数和区域总数确定的,执行每一所述分组的分组任务,以将所述分组任务对应的隐向量,输入所述分组的分类模型,得到输入的隐向量所对应群体或区域属于所述分组的概率;
其中,每一所述分组对应的分类模型,包括顺序连接的全连接层和分组层;其中,所述全连接层,为相应分组内各分组任务共用;所述分组层为多个,每一个所述分组任务对应一个所述分组层。
需要说明的是,前述对出行流量预测方法实施例的解释说明也适用于该实施例的出行流量预测方法,此处不再赘述。
本实施例的出行流量预测装置中,根据多个区域的历史流量特征,生成每个区域的隐向量,其中,区域的隐向量用于指示区域的历史流量特征变化规律,根据多个群体的历史流量特征,生成每个群体的隐向量,其中,群体的隐向量用于指示群体的历史流量特征变化规律,根据每个区域的隐向量和每个群体的隐向量,确定隐向量相关的目标区域和目标群体,以及根据目标区域的隐向量和目标群体的隐向量预测目标区域中的目标群体的出行流量。本申请中通过多个区域的历史流量特征和多个群体的历史流量特征,确定存在相关关系的区域和群体,建立了各区域中存在相关关系的群体间的信息共享,而避免了不相关群体间的信息共享导致的噪声引入,实现了更精准的群体流量预测。
为了实现上述实施例,本申请实施例提出了一种电子设备,包:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如前述方法实施例所述的出行流量预测方法。
为了实现上述实施例,本申请实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如前述方法实施例所述的出行流量预测方法。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图9所示,是根据本申请实施例的出行流量预测方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图9所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的出行流量预测方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的出行流量预测方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的出行流量预测方法对应的程序指令/模块(例如,附图8所示的生成模块31、确定模块32和预测模块33)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的出行流量预测方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据出行流量预测方法的电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至出行流量预测方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
出行流量预测方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与出行流量预测方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,根据多个区域的历史流量特征,生成每个区域的隐向量,其中,区域的隐向量用于指示区域的历史流量特征变化规律,根据多个群体的历史流量特征,生成每个群体的隐向量,其中,群体的隐向量用于指示群体的历史流量特征变化规律,根据每个区域的隐向量和每个群体的隐向量,确定隐向量相关的目标区域和目标群体,以及根据目标区域的隐向量和目标群体的隐向量预测目标区域中的目标群体的出行流量。本申请中通过多个区域的历史流量特征和多个群体的历史流量特征,确定存在相关关系的区域和群体,建立了各区域中存在相关关系的群体间的信息共享,而避免了不相关群体间的信息共享导致的噪声引入,实现了更精准的群体流量预测。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (20)

1.一种出行流量预测方法,所述方法包括:
根据多个区域的历史流量特征,生成每个所述区域的隐向量,其中,所述区域的隐向量用于指示所述区域的历史流量特征变化规律;
根据多个群体的历史流量特征,生成每个所述群体的隐向量,其中,所述群体的隐向量用于指示所述群体的历史流量特征变化规律;
根据所述每个区域的隐向量和所述每个群体的隐向量,确定隐向量相关的目标区域和目标群体;以及
根据所述目标区域的隐向量和所述目标群体的隐向量预测所述目标区域中的所述目标群体的出行流量。
2.根据权利要求1所述的出行流量预测方法,其中,所述根据所述每个区域的隐向量和所述每个群体的隐向量,确定隐向量相关的目标区域和目标群体,包括:
根据所述每个区域的隐向量和所述每个群体的隐向量,对所述多个区域以及所述多个群体分组,得到属于同一分组的目标区域和目标群体;其中,同一分组内的所述目标区域和所述目标群体的隐向量相关。
3.根据权利要求2所述的出行流量预测方法,其中,所述根据所述每个区域的隐向量和所述每个群体的隐向量,对所述多个区域以及所述多个群体分组,得到属于同一分组的目标区域和目标群体,包括:
将每一个所述群体的隐向量输入分类模型,得到所述群体属于每一分组的概率,以及将每一个所述区域的隐向量输入所述分类模型,得到所述区域属于每一所述分组的概率;
对各所述分组,统计属于所述分组的概率不为零的群体和区域,作为所述分组的目标区域和目标群体。
4.根据权利要求3所述的出行流量预测方法,其中,所述根据所述目标区域的隐向量和所述目标群体的隐向量预测所述目标区域中的所述目标群体的出行流量,包括:
在每一所述分组内,根据属于所述分组的概率,将所述目标区域的隐向量和所述目标群体的隐向量进行加权,得到所述目标区域和所述目标群体在所述分组内的融合隐向量;
将每一所述分组内的融合隐向量输入相应分组的预测模型,得到所述目标区域和所述目标群体在所述分组内的预测出行流量;
根据所述目标区域和所述目标群体在每一所述分组内的预测出行流量,预测得到所述目标区域中所述目标群体的出行流量。
5.根据权利要求4所述的出行流量预测方法,其中,所述根据所述目标区域和所述目标群体在每一所述分组内的预测出行流量,预测得到所述目标区域中所述目标群体的出行流量,包括:
根据所述目标区域和所述目标群体属于每一所述分组的概率,对所述分组内的预测出行流量进行加权,得到所述目标区域中所述目标群体的出行流量。
6.根据权利要求3所述的出行流量预测方法,其中,所述将每一个所述群体的隐向量输入分类模型,得到所述群体属于每一分组的概率,以及将每一个所述区域的隐向量输入所述分类模型,得到所述区域属于每一所述分组的概率,包括:
对每一所述分组,生成所述分组的分组任务;其中,每一所述分组任务,对应一个所述群体的隐向量,或一个所述区域的隐向量;每一所述分组的分组任务总数是根据群体总数和区域总数确定的;
执行每一所述分组的分组任务,以将所述分组任务对应的隐向量,输入所述分组的分类模型,得到输入的隐向量所对应群体或区域属于所述分组的概率;
其中,每一所述分组对应的分类模型,包括顺序连接的全连接层和分组层;其中,所述全连接层,为相应分组内各分组任务共用;所述分组层为多个,每一个所述分组任务对应一个所述分组层。
7.根据权利要求1-6任一项所述的出行流量预测方法,其中,所述根据多个区域的历史流量特征,生成每个所述区域的隐向量之前,还包括:
获取区域相关图;其中,所述区域相关图中包括各区域,以及连接不同区域的边;所述连接不同区域的边用于指示所连接的不同区域在地理位置上相邻;
根据所述区域相关图,确定各所述区域通过边连接的相邻区域;
根据每一所述区域的历史出行流量,以及相邻区域的历史出行流量,生成所述区域的历史流量特征。
8.根据权利要求1-6任一项所述的出行流量预测方法,其中,所述根据多个群体的历史流量特征,生成每个所述群体的隐向量之前,还包括:
获取群体相关图;其中,所述群体相关图中包括各群体,以及连接不同群体的边;所述连接不同群体的边用于指示所连接的不同群体在历史出行流量上存在相似性;
根据所述群体相关图,确定各群体通过边连接的相邻群体;
根据每一所述群体的历史出行流量,以及相邻群体的历史出行流量,生成所述群体的历史流量特征。
9.根据权利要求8所述的出行流量预测方法,其中,所述获取群体相关图,包括:
对每一群体,根据各历史时刻的历史出行流量,生成相应群体的流量序列;
采用皮尔斯相关系数,计算任意两群体的流量序列的相似程度;
对每一群体,按照所述相似程度从大到小顺序,对其余群体排序,以确定排序为前设定个数的所述相邻群体;
在群体相关图中,通过边连接各群体和对应的所述相邻群体。
10.一种出行流量预测装置,所述装置包括:
生成模块,用于根据多个区域的历史流量特征,生成每个所述区域的隐向量,其中,所述区域的隐向量用于指示所述区域的历史流量特征变化规律;根据多个群体的历史流量特征,生成每个所述群体的隐向量,其中,所述群体的隐向量用于指示所述群体的历史流量特征变化规律;
确定模块,用于根据所述每个区域的隐向量和所述每个群体的隐向量,确定隐向量相关的目标区域和目标群体;
预测模块,用于根据所述目标区域的隐向量和所述目标群体的隐向量预测所述目标区域中的所述目标群体的出行流量。
11.根据权利要求10所述的出行流量预测装置,其中,所述确定模块,还用于:
根据所述每个区域的隐向量和所述每个群体的隐向量,对所述多个区域以及所述多个群体分组,得到属于同一分组的目标区域和目标群体;其中,同一分组内的所述目标区域和所述目标群体的隐向量相关。
12.根据权利要求11所述的出行流量预测装置,其中,所述确定模块,包括:
分类单元,用于将每一个所述群体的隐向量输入分类模型,得到所述群体属于每一分组的概率,以及将每一个所述区域的隐向量输入所述分类模型,得到所述区域属于每一所述分组的概率;
统计单元,用于对各所述分组,统计属于所述分组的概率不为零的群体和区域,作为所述分组的目标区域和目标群体。
13.根据权利要求12所述的出行流量预测装置,其中,所述预测模块,包括:
融合单元,用于在每一所述分组内,根据属于所述分组的概率,将所述目标区域的隐向量和所述目标群体的隐向量进行加权,得到所述目标区域和所述目标群体在所述分组内的融合隐向量;
第一预测单元,用于将每一所述分组内的融合隐向量输入相应分组的预测模型,得到所述目标区域和所述目标群体在所述分组内的预测出行流量;
第二预测单元,用于根据所述目标区域和所述目标群体在每一所述分组内的预测出行流量,预测得到所述目标区域中所述目标群体的出行流量。
14.根据权利要求13所述的出行流量预测装置,其中,所述第二预测单元,还用于:
根据所述目标区域和所述目标群体属于每一所述分组的概率,对所述分组内的预测出行流量进行加权,得到所述目标区域中所述目标群体的出行流量。
15.根据权利要求12所述的出行流量预测装置,其中,所述分类单元,用于:
对每一所述分组,生成所述分组的分组任务;其中,每一所述分组任务,对应一个所述群体的隐向量,或一个所述区域的隐向量;每一所述分组的分组任务总数是根据群体总数和区域总数确定的;
执行每一所述分组的分组任务,以将所述分组任务对应的隐向量,输入所述分组的分类模型,得到输入的隐向量所对应群体或区域属于所述分组的概率;
其中,每一所述分组对应的分类模型,包括顺序连接的全连接层和分组层;其中,所述全连接层,为相应分组内各分组任务共用;所述分组层为多个,每一个所述分组任务对应一个所述分组层。
16.根据权利要求10-15任一项所述的出行流量预测装置,其中,所述装置,还包括:
获取模块,用于获取区域相关图;其中,所述区域相关图中包括各区域,以及连接不同区域的边;所述连接不同区域的边用于指示所连接的不同区域在地理位置上相邻;
上述确定模块,还用于根据所述区域相关图,确定各所述区域通过边连接的相邻区域;
生成模块,用于根据每一所述区域的历史出行流量,以及相邻区域的历史出行流量,生成所述区域的历史流量特征。
17.根据权利要求10-15任一项所述的出行流量预测装置,其中,
所述获取模块,还用于获取群体相关图;其中,所述群体相关图中包括各群体,以及连接不同群体的边;所述连接不同群体的边用于指示所连接的不同群体在历史出行流量上存在相似性;
所述确定模块,还用于根据所述群体相关图,确定各群体通过边连接的相邻群体;
所述生成模块,还用于根据每一所述群体的历史出行流量,以及相邻群体的历史出行流量,生成所述群体的历史流量特征。
18.根据权利要求17所述的出行流量预测装置,其中,所述获取模块,还用于:
对每一群体,根据各历史时刻的历史出行流量,生成相应群体的流量序列,采用皮尔斯相关系数,计算任意两群体的流量序列的相似程度,对每一群体,按照所述相似程度从大到小顺序,对其余群体排序,以确定排序为前设定个数的所述相邻群体,在群体相关图中,通过边连接各群体和对应的所述相邻群体。
19.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的出行流量预测方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的出行流量预测方法。
CN202010478519.6A 2020-05-29 2020-05-29 出行流量预测方法、装置、电子设备和存储介质 Active CN111709778B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010478519.6A CN111709778B (zh) 2020-05-29 2020-05-29 出行流量预测方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010478519.6A CN111709778B (zh) 2020-05-29 2020-05-29 出行流量预测方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN111709778A true CN111709778A (zh) 2020-09-25
CN111709778B CN111709778B (zh) 2023-04-07

Family

ID=72538272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010478519.6A Active CN111709778B (zh) 2020-05-29 2020-05-29 出行流量预测方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN111709778B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396218A (zh) * 2020-11-06 2021-02-23 南京航空航天大学 基于城市区域多模态融合的人群流量预测方法
CN114390079A (zh) * 2022-03-24 2022-04-22 成都秦川物联网科技股份有限公司 一种智慧城市公共场所管理方法和物联网系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013162862A1 (en) * 2012-04-26 2013-10-31 International Business Machines Corporation System, method and program product for providing populace movement sensitive weather forecasts
WO2017202226A1 (zh) * 2016-05-23 2017-11-30 中兴通讯股份有限公司 人群流量的确定方法及装置
CN108960293A (zh) * 2018-06-12 2018-12-07 玩咖欢聚文化传媒(北京)有限公司 基于fm算法的ctr预估方法及系统
CN110288157A (zh) * 2019-06-27 2019-09-27 电子科技大学 一种基于注意力机制和lstm的径流预测方法
CN110445632A (zh) * 2018-05-04 2019-11-12 北京京东尚科信息技术有限公司 一种预防客户端崩溃的方法和装置
CN110781433A (zh) * 2019-10-11 2020-02-11 腾讯科技(深圳)有限公司 数据类型的确定方法和装置、存储介质及电子装置
CN111275479A (zh) * 2020-01-07 2020-06-12 北京爱笔科技有限公司 一种人流量预测方法、装置及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013162862A1 (en) * 2012-04-26 2013-10-31 International Business Machines Corporation System, method and program product for providing populace movement sensitive weather forecasts
WO2017202226A1 (zh) * 2016-05-23 2017-11-30 中兴通讯股份有限公司 人群流量的确定方法及装置
CN107423742A (zh) * 2016-05-23 2017-12-01 中兴通讯股份有限公司 人群流量的确定方法及装置
CN110445632A (zh) * 2018-05-04 2019-11-12 北京京东尚科信息技术有限公司 一种预防客户端崩溃的方法和装置
CN108960293A (zh) * 2018-06-12 2018-12-07 玩咖欢聚文化传媒(北京)有限公司 基于fm算法的ctr预估方法及系统
CN110288157A (zh) * 2019-06-27 2019-09-27 电子科技大学 一种基于注意力机制和lstm的径流预测方法
CN110781433A (zh) * 2019-10-11 2020-02-11 腾讯科技(深圳)有限公司 数据类型的确定方法和装置、存储介质及电子装置
CN111275479A (zh) * 2020-01-07 2020-06-12 北京爱笔科技有限公司 一种人流量预测方法、装置及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHO, SUNG-BAE等: "Clustered embedding using deep learning to analyze urban mobility based on complex transportation data" *
李玺;查宇飞;张天柱;崔振;左旺孟;侯志强;卢湖川;王菡子;: "深度学习的目标跟踪算法综述" *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396218A (zh) * 2020-11-06 2021-02-23 南京航空航天大学 基于城市区域多模态融合的人群流量预测方法
CN112396218B (zh) * 2020-11-06 2024-01-09 南京航空航天大学 基于城市区域多模态融合的人群流量预测方法
CN114390079A (zh) * 2022-03-24 2022-04-22 成都秦川物联网科技股份有限公司 一种智慧城市公共场所管理方法和物联网系统
CN114390079B (zh) * 2022-03-24 2022-06-03 成都秦川物联网科技股份有限公司 一种智慧城市公共场所管理方法和物联网系统
US11868926B2 (en) 2022-03-24 2024-01-09 Chengdu Qinchuan Iot Technology Co., Ltd. Systems and methods for managing public place in smart city

Also Published As

Publication number Publication date
CN111709778B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
US10762443B2 (en) Crowdsourcing system with community learning
US10599449B1 (en) Predictive action modeling to streamline user interface
US10713574B2 (en) Cognitive distributed network
CN111639710A (zh) 图像识别模型训练方法、装置、设备以及存储介质
CN111612249B (zh) 用于预测人流量的方法、装置、设备以及存储介质
CN111143686B (zh) 资源推荐方法及装置
CN114265979B (zh) 确定融合参数的方法、信息推荐方法和模型训练方法
CN111523597A (zh) 目标识别模型训练方法、装置、设备以及存储介质
CN111708876B (zh) 生成信息的方法和装置
CN111695695B (zh) 用户决策行为量化分析方法及装置
CN111753914A (zh) 模型优化方法和装置、电子设备及存储介质
CN114036398B (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
CN111460384B (zh) 策略的评估方法、装置和设备
CN111259222A (zh) 物品推荐方法、系统、电子设备及存储介质
CN112163676A (zh) 多任务服务预测模型训练方法、装置、设备以及存储介质
CN111931067A (zh) 兴趣点推荐方法、装置、设备和介质
CN111695680B (zh) 成绩预测方法、成绩预测模型训练方法、装置及电子设备
CN111709778B (zh) 出行流量预测方法、装置、电子设备和存储介质
CN115114439B (zh) 多任务模型推理、多任务信息处理的方法和装置
CN111680597A (zh) 人脸识别模型处理方法、装置、设备和存储介质
CN113868537B (zh) 一种基于多行为会话图融合的推荐方法
CN112269943B (zh) 一种信息推荐系统及方法
CN112819497B (zh) 转化率预测方法、装置、设备和存储介质
CN115618079A (zh) 会话推荐方法、装置、电子设备及存储介质
CN114463590A (zh) 信息处理方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant