CN116959241A - 一种交通信息的估计方法 - Google Patents

一种交通信息的估计方法 Download PDF

Info

Publication number
CN116959241A
CN116959241A CN202310608671.5A CN202310608671A CN116959241A CN 116959241 A CN116959241 A CN 116959241A CN 202310608671 A CN202310608671 A CN 202310608671A CN 116959241 A CN116959241 A CN 116959241A
Authority
CN
China
Prior art keywords
time
estimated
representing
cell
distribution function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310608671.5A
Other languages
English (en)
Inventor
刘小娟
张翊卓
唐宏安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Technology
Original Assignee
Chongqing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Technology filed Critical Chongqing University of Technology
Priority to CN202310608671.5A priority Critical patent/CN116959241A/zh
Publication of CN116959241A publication Critical patent/CN116959241A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/012Measuring and analyzing of parameters relative to traffic conditions based on the source of data from other sources than vehicle or roadside beacons, e.g. mobile networks
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Analysis (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Optimization (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了一种交通信息的估计方法,方法包括构建累积分布函数生成器,所述累积分布函数生成器包括一个输入层、一个输出层以及一个中间层;所述中间层的神经元分别采用指数分布函数、正态分布函数或对数正态分布函数作为激活函数;利用构建的累积分布函数生成器输出估计的通话时间的累积分布函数,对估计的通话时间的累积分布函数进行求导,从而获得估计的通话时间的概率密度函数;通过估计的通话时间的概率密度函数和蜂窝网络信号的数量估计出交通信息,所述交通信息包括交通流量、车速或交通密度。本发明优点:能够对通话保持时间与下一次通话到达的时间进行更准确预测,有效提升交通数据估计模型估计出的交通信息的准确率。

Description

一种交通信息的估计方法
技术领域
本发明涉及计算机技术领域,特别涉及一种交通信息的估计方法。
背景技术
蜂窝流动车辆数据能够被用于估计交通信息,通常主要使用到的蜂窝网络信号包括HO(Handover/Handoff,切换)信号、NLU(Normal Location Update,常规性位置更新)信号、CA(Call Arrival,通话到达)信号和PLU(Periodic LocationUpdate,周期性位置更新)信号。
目前,在基于蜂窝流动车辆数据的交通信息估计方法中,利用蜂窝网络信号数据的方式有两类:第一类,通过连续的蜂窝网络信号序列估计交通信息,其利用手机在移动过程中产生的蜂窝流动车辆数据的时空特征,通过同一部手机连续发生的两次蜂窝网络事件,获取发生的时间差与距离差,从而对交通信息进行估计;但这类方法需要对同一部手机持续追踪,获取其在观察时段内与基站的所有交互行为,这会产生一定的隐私问题。
第二类,通过统计蜂窝网络信号的数量估计交通信息,其通过统计方法,从蜂窝网络流动车辆数据中统计出每个时间段内每个Cell(小区)内发生的各类蜂窝网络信号数量,并使用机器学习或概率统计方法估计交通信息;这类方法由于统计后的数据对IMSI不敏感,能够在一定程度上避免隐私泄露,但如何从蜂窝流动车辆数据中获取有效的时空特征是一个需要解决的问题;Lin等人(具体参见Lin B Y,Chen C H,Lo C C.A trafficinformation estimation model usingperiodic location update events fromcellular network[C]//International Conferenceon Intelligent Computing andInformation Science,Berlin,Heidelberg.2011,135:72–77)提出利用概率密度函数,从蜂窝流动车辆数据中获取用户的通话行为,并从中提取时空特征用于交通信息估计;但该方法使用指数分布来近似通话间隔时间的分布,而通话保持时间和通话间隔时间的分布的概率密度函数通常呈多峰形态,导致估计出的交通信息的准确率较差。
发明内容
本发明要解决的技术问题,在于提供一种交通信息的估计方法,解决现有技术存在估计出的交通信息的准确率较差问题。
本发明提供了一种交通信息的估计方法,所述估计方法包括:
构建累积分布函数生成器,所述累积分布函数生成器包括一个输入层、一个输出层以及一个中间层;所述中间层的神经元分别采用指数分布函数、正态分布函数或对数正态分布函数作为激活函数;所述输入层用于输入蜂窝流动车辆数据中实际收集的通话时间,所述中间层用于对所述输入层输入的通话时间进行训练学习,所述输出层用于输出估计的通话时间的累积分布函数;
利用构建的累积分布函数生成器输出估计的通话时间的累积分布函数,对估计的通话时间的累积分布函数进行求导,从而获得估计的通话时间的概率密度函数;
通过估计的通话时间的概率密度函数和蜂窝网络信号的数量估计出交通信息,所述交通信息包括交通流量或车速。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:通过利用累积分布函数生成器生成估计的通话时间的累积分布函数,累积分布函数生成器的中间层的神经元分别采用指数分布函数、正态分布函数或对数正态分布函数作为激活函数,并对估计的通话时间的累积分布函数进行求导获得估计的通话时间的概率密度函数,且通过估计的通话时间的概率密度函数和蜂窝网络信号的数量对交通信息进行估计,因此通过本发明的技术方案,能够对用户的通话行为进行准确建模,拟合多峰概率密度函数的累积分布函数,从而获取符合实际情况的通话保持时间和通话间隔时间的概率密度函数,进而能够对通话保持时间与下一次通话到达的时间进行更准确预测,有效提升交通数据估计模型估计出的交通信息的准确率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明一种交通信息的估计方法的执行流程图;
图2为本发明累积分布函数生成器的结构示意图;
图3为本发明基于通话保持时间的累积分布函数生成器的结构示意图;
图4为本发明基于通话间隔时间的累积分布函数生成器的结构示意图;
图5为本发明实施例1中HO信号发生的空间示意图;
图6为本发明实施例1中HO信号发生的时间示意图;
图7为本发明实施例2中CA信号发生的时间示意图;
图8为本发明实施例2中NLU信号发生的空间示意图;
图9为本发明实施例3中第一种情况的PLU信号发生的空间示意图;
图10为本发明实施例3中第一种情况的PLU信号发生的时间示意图;
图11为本发明实施例3中第二种情况的PLU信号发生的空间示意图;
图12为本发明实施例3中第二种情况的PLU信号发生的时间示意图;
图13为本发明中估计的累积分布函数与实际的累积分布函数的拟合结构图;
图14为本发明示例的交通流量、车速和蜂窝网络信号的变化趋势图。
具体实施方式
实施例1
本发明一种交通信息的估计方法,如图1所示,所述估计方法包括:
构建累积分布函数生成器,如图2所示,所述累积分布函数生成器包括一个输入层100、一个输出层300以及一个中间层200;所述中间层200的神经元分别采用指数分布函数、正态分布函数或对数正态分布函数作为激活函数,并去除所有的偏置,即通过指数分布函数、正态分布函数或对数正态分布函数共同组成混合分布函数,并作为所述中间层200的激活函数;所述输入层100用于输入蜂窝流动车辆数据中实际收集的通话时间,所述中间层200用于对所述输入层100输入的通话时间进行训练学习,所述输出层300用于输出估计的通话时间的累积分布函数;
利用构建的累积分布函数生成器输出估计的通话时间的累积分布函数,对估计的通话时间的累积分布函数进行求导,从而获得估计的通话时间的概率密度函数;
通过估计的通话时间的概率密度函数和蜂窝网络信号的数量估计出交通信息,所述交通信息包括交通流量或车速。
因在基于蜂窝网络信号的交通数据估计模型中,通话间隔时间和通话保持时间是两个重要的影响因素,在现实情况下,用户的通话行为高度随机,通话保持时间和通话间隔时间的概率密度函数可能呈多峰形态;而现有概率分布模型都采用单一的分布函数作为激活函数,无法有效的模拟出实际分布情况。本发明通过利用累积分布函数生成器生成估计的通话时间的累积分布函数,累积分布函数生成器的中间层200的神经元分别采用指数分布函数、正态分布函数或对数正态分布函数作为激活函数,并对估计的通话时间的累积分布函数进行求导获得估计的通话时间的概率密度函数,且通过估计的通话时间的概率密度函数和蜂窝网络信号的数量对交通信息进行估计,因此通过本发明的技术方案,能够对用户的通话行为进行准确建模,拟合多峰概率密度函数的累积分布函数,从而获取符合实际情况的通话保持时间和通话间隔时间的概率密度函数,进而能够对通话保持时间与下一次通话到达的时间进行更准确预测,有效提升交通数据估计模型估计出的交通信息的准确率。
在本发明中,所述通话时间包括通话保持时间和/或通话间隔时间,所述通话保持时间为单次通话从接听到挂断的持续时间,所述通话间隔时间为两次通话到达的间隔时间;所述估计的通话时间的概率密度函数包括估计的通话保持时间的概率密度函数和估计的通话间隔时间的概率密度函数。由于在具体实施时,若已知某次通话的到达时刻,即可通过通话间隔时间推算出下一次通话的到达时刻,同理通过通话间隔时间,也可以推算出通话的结束时刻;因此,通过研究这两种因素的分布情况对预测下一次通话到达与通话时间至关重要。
在本发明中,如图3所示,当所述输入层100输入的是蜂窝流动车辆数据中实际收集的通话保持时间th时,所述中间层200的指数分布函数f11(th)的公式如下:
其中,λ1表示指数分布函数f11(th)的参数;
所述中间层200的正态分布函数f12(th)的公式如下:
其中,μ1表示正态分布函数f12(th)的均值,σ1表示正态分布函数f12(th)的标准差;
所述中间层200的对数正态分布函数f13(th)的公式如下:
其中,μ2表示对数正态分布函数f13(th)的均值,σ2表示对数正态分布函数f13(th)的标准差;
所述输出层300输出的估计通话保持时间的累积分布函数的公式如下:
其中,w11表示指数分布函数f11(th)的权重,w12表示正态分布函数f12(th)的权重,w13表示对数正态分布函数f13(th)的权重;
所述中间层200在训练学习的过程中,使用的损失函数的公式如下:
其中,Fh表示统计得到的真实通话保持时间的累积分布函数,表示累积分布函数生成器生成的估计通话保持时间的累积分布函数。
在本发明中,如图4所示当所述输入层100输入的是蜂窝流动车辆数据中实际收集的通话间隔时间ta时,所述中间层200的指数分布函数f21(ta)的公式如下:
其中,λ2表示指数分布函数f21(ta)的参数;
所述中间层200的正态分布函数f22(ta)的公式如下:
其中,μ3表示正态分布函数f22(ta)的均值,σ3表示正态分布函数f22(ta)的方差;
所述中间层200的对数正态分布函数f23(ta)的公式如下:
其中,μ4表示对数正态分布函数f23(ta)的均值,σ4表示对数正态分布函数f23(ta)的标准差;
所述输出层300输出的估计通话间隔时间的累积分布函数的公式如下:
其中,w21表示指数分布函数f21(ta)的权重,w22表示正态分布函数f22(ta)的权重,w23表示对数正态分布函数f23(ta)的权重;
所述中间层200在训练学习的过程中,使用的损失函数的公式如下:
其中,Fa表示统计得到的真实通话间隔时间的累积分布函数,表示累积分布函数生成器生成的估计通话间隔时间的累积分布函数。
在本发明中,通过对估计的通话保持时间的累积分布函数和通话间隔时间的累积分布函数进行求导,能够获得估计的通话保持时间的概率密度函数和估计的通话间隔时间的概率密度函数;因此,能够对通话保持时间与下一次通话到达的时间进行预测,以通话到达时间预测为例,通话间隔时间th大于某个时间x的概率可以表示为以下公式:
其中,表示估计的通话保持时间的概率密度函数。
本发明在具体实施时,需要从实际的蜂窝流动车辆数据中收集大量的通话保持时间和通话间隔时间,再将收集到的大量的通话保持时间和通话间隔时间通过输入层100输入至累积分布函数生成器内,累积分布函数生成器可通过指数分布函数、正态分布函数或对数正态分布函数共同组成的混合分布函数对输入的通话保持时间和通话间隔时间进行分布规律学习,并通过输出层300输出估计的通话保持时间的累积分布函数和估计的通话间隔时间的累积分布函数。
作为本发明的一种具体实施方式,可利用某段时间内在某处发生的HO事件的次数来估计交通流量的大小,HO事件是蜂窝网络中一个重要的事件。在蜂窝网络中,因负责与手机通讯连接的基站的信号范围存在限制;若手机移动至基站信号覆盖范围之外,手机便与新基站相连接以保持通话;在通话中从一个基站转向连接另一个基站的过程被称为HO事件;这一动作会被所处基站记录,包括切换发生的时间、涉及的基站等信息,因此在某段时间内某个Cell范围内发生的HO信号的数量可由蜂窝流动车辆数据统计得到。为了更好的展示蜂窝网络中的HO机制,如图5所示,假设车辆处拨出/接收到一通电话,当车辆向/>处前进时,会在离开Celli驶入Celli+1产生HO信号(即/>处),同理在行驶至Celli+2时通话结束,会在/>处产生第二次HO信号;
如图6所示,当手机在t0时刻发生通话到达时(即拨出/接收一通电话),经过了时间x后驶入Celli内,由于电话未挂断,手机会与旧基站断开连接,且与新基站建立连接;此时在t1时刻发生了HO事件。假设手机在t2时刻挂断电话,可以得到以下信息:
t0时刻至t2时刻的时间差为通话保持时间th
假设车辆在Celli内的平均车速为ui,Celli在目标路段上的覆盖长度为li,车辆在该Celli内的行驶时间可以由li/ui求得;
若要使手机在t1时刻的Cell boundary处发生HO事件,需要保证手机的通话保持时间th大于驶入Celli的时间,即th>x。
因此,所述的通过估计的通话时间的概率密度函数和蜂窝网络信号的数量估计出交通信息具体包括:通过估计的通话保持时间的概率密度函数和HO信号的数量估计出交通流量,HO信号的数量与估计的交通流量之间的关系如以下公式:
通过以上式(12),得到估计的交通流量如以下公式:
其中,Pr[th>x]表示通话保持时间th大于驶入Celli的时间x的概率,x由通话到达的时刻与驶入Celli的时刻计算得到,Celli表示第i个小区(即一个基站所发射信号的覆盖范围),i为正整数;表示估计的通话保持时间的概率密度函数,其通过对估计的通话保持时间的累积分布函数/>进行求导得到;/>表示估计得到的Celli处的交通流量;hi表示Celli处记录的HO信号的数量。
实施例2
与实施例1的不同之处在于:在该实施例2中,主要使用某个Cell内发生的CA信号的数量来估计车速。通话到达(CA)是蜂窝网络中一个重要的事件,其在播出/接收到电话时发生,此时与手机连接的基站会记录CA事件发生的事件、所处基站ID等信息;因此在某段时间内某个Cell范围内发生的CA信号的数量可由蜂窝流动车辆数据统计得到。
如图7所示,当车辆行驶至t0时刻时,发生第一次CA事件,经过了时间x后,在t1时刻驶入Celli内;随后在t2时刻发生了第二次CA事件,最后在t3时刻驶出Celli。通过分析各个事件发生的时刻与位置,可以得出以下信息:
t0时刻至t2时刻的时间差为两次通话的通话间隔时间ta
假设车辆在Celli内的平均车速为ui,Celli在目标路段上的覆盖长度为li,车辆在该Celli内的行驶时间可以由li/ui求得;
若要使手机在t2时刻发生第二次CA事件,需要保证两次通话的通话间隔时间ta大于驶入Celli的时间且小于驶出Celli的时间,即t1<t2<t3
因此,所述通过估计的通话时间的概率密度函数和蜂窝网络信号的数量估计出交通信息包括:通过估计的通话间隔时间的概率密度函数和CA信号的数量估计出车速,CA信号的数量与估计车速之间的关系如以下公式:
因式(14)中使用车流量qi作为计算参数,而真实车流量不可知,故使用NLU信号或HO信号估计的车流量作为参数,CA信号的数量与估计车速之间的关系进一步如以下公式:
其中,表示通话间隔时间ta大于驶入Celli的时间x且小于驶出Celli的时间/>的概率,x由通话达到的时刻与驶入Celli的时刻计算得到,Celli表示第i个小区(即一个基站所发射信号的覆盖范围),i为正整数;li表示Celli在公路上的覆盖长度,/>表示估计得到的Celli处的车速;/>表示估计的通话间隔时间的概率密度函数,其通过对估计的通话间隔时间的累积分布函数/>进行求导得到;ci表示Celli处记录的CA信号的数量,qi表示Celli内的车流量;qN,i表示使用NLU信号或HO信号估计的车流量;
使用牛顿下山法寻求满足误差ε小于0.00001的近似解,求解的过程如以下:
其中,表示牛顿下山法的目标方程,/>表示牛顿下山法的目标方程的导数;ωk表示牛顿下山法的迭代参数,/>表示牛顿下山法中第k次迭代的Celli处的估计车速值,k为正整数;/>表示牛顿下山法中第k+1次迭代迭代的Celli处的估计车速值。
在本发明的实施例2中,当qN,i表示使用HO信号估计的车流量(即交通流量)时,交通流量的具体估计过程请参照实施例1的详细介绍,在此就不再赘述了。
当qN,i表示使用NLU信号估计的车流量(即交通流量)时,交通流量的具体估计过程如下:利用某段时间内在某处发生的NLU事件的次数来估计交通流量。在蜂窝网络中,为保证蜂窝网络的通讯正常,同时为了方便更快捷的找到自己本身,手机等通讯设备会采用一系列机制来保持自身位置信息更新;NLU便是其中更新机制之一,且NLU信号是一种十分重要且频繁发生的蜂窝网络信号,其在手机发生跨LA时发生。如图8所示,道路上包含了三个LA,当车辆从LAj-1(即处)行驶至LAj(即/>处)时,手机将在两个LA之间(即/>处)发生一次NLU;同理随着车辆继续前进,当其从LAj驶出并驶入LAj+1时,将发生第二次NLU事件。
如图8所示,假设每小时发生在LAj-1与LAj交界处的NLU信号的数量为nj,发生在LAj与LAj+1交界处的NLU信号的数量为nj+1,qi、qi+1、qi+2分别表示在LAj中的三个Cell左边界的交通流量。因此,依据发生的NLU信号的数量估计Celli的交通流量的公式如下:
其中,表示在LAj-1与LAj交界处的估计交通流量,qi表示通过该位置的实际交通流量;nj表示LAj内NLU信号的数量。
因手机在LA内部移动并不会触发NLU事件,因此,位于LA内部的Celli+1与Celli+2无法获得发生的NLU信号的数量;对于这些Cell,交通流量的公式如下:
其中,和/>分别表示在两处的基于HO信号数量估计的交通流量,nj+1代表在LAj+1发生的NLU信号的数量,i和j均为正整数。
实施例3
与实施例1的不同之处在于:在该实施例3中,使用在某个Cell内发生的PLU信号的数量来估计车速。作为一种位置更新机制,周期位置更新(PLU)能够避免手机在某个LA内存留时间过久无法触发NLU而造成的位置信息更新延迟问题。对于PLU事件,自手机上一次位置更新后,通过一个设定的循环时间tc,手机会自动触发PLU事件。此外,由于发生CA事件时,基站会记录其发生位置,因此CA事件也会对手机位置进行更新;所以对于PLU事件的发生需要同时考虑CA事件对其影响。由PLU事件发生的特性可知,当通话间隔时间大于循环时间时,会在上一次位置更新后经过一段循环时间正常触发PLU事件;如果通话间隔时间小于循环时间,则会先发生CA事件,原本在循环时间后触发的PLU事件不会发生,计时器会自CA事件发生的时刻重新计时。
因此,所述通过估计的通话时间的概率密度函数和蜂窝网络信号的数量估计出交通信息包括:通过估计的通话间隔时间的概率密度函数和PLU信号的数量估计出车速,假设相邻两个PLU信号发生的间隔时间为一个循环时间,第一种情况:
如图9所示,当在t0时刻发生第一次PLU事件,经过了一个循环事件tc后,在Celli内发生了第二次PLU事件;车辆进入、驶出Celli的时间分别为t1和t3;循环时间tc的时长通常视各网络运营商设定,本发明中设定循环时间tc的时长为1小时。为了更好的展示利用PLU信号估计车速的过程,如图10所示,从图10中可以获得如下信息:
t0时刻至t2时刻的时间差为两次PLU事件发生的间隔时间,即为一个循环时间tc
假设车辆在Celli内的平均车速为ui,Celli在目标路段上的覆盖长度为li,车辆在Celli内的行驶时间可以由li/ui求得;
若要使手机在t2时刻发生第二次PLU事件,则需要保证在通话间隔时间ta大于循环时间tc的情况下,即ta>tc,循环时间tc需要大于驶入Celli的时间且小于驶出Celli的时间,即tc<x+li/ui
因此,当通话间隔时间大于循环时间时,PLU信号的数量与估计车速之间的关系如以下公式:
其中,ps1表示第一种情况下Celli处记录的PLU信号的数量,Celli表示第i个小区,i为正整数;qi表示Celli处的交通流量;Pr(ta>tc)表示通话间隔时间ta大于循环时间tc的概率,表示循环时间tc大于驶入Celli的时间且小于驶出Celli的时间的概率,x由通话达到的时刻与驶入Celli的时刻计算得到,/>表示估计得到的Celli处的车速,li表示Celli在公路上的覆盖长度;
第二种情况:当通话间隔时间ta小于循环时间tc时,手机会在计时器触发PLU事件之前通过CA事件更新位置;因此会影响到第二次PLU事件发生的时间。如图11所示,在t0时刻发生第一次PLU事件后,经过了ta时间后发生了第一次CA事件,此时的通话间隔时间小于循环时间;因此计时器会重新计时,再次经过了循环时间tc后,在t3时刻发生了第二次PLU事件;此时通话间隔时间大于循环时间,于是自第一次CA事件后,第二次CA事件在t5时刻发生。为了更好的展示利用PLU信号估计车速的过程,如图12所示,从图12中可以获得如下信息:
t0时刻至t1时刻的时间差小于循环时间tc
t1时刻至t3时刻的时间差为循环时间tc
假设车辆在Cellj内的平均车速为uj,Cellj在目标路段上的覆盖距离为lj,车辆在Cellj内的行驶时间可以由lj/uj求得;
若要使手机在t3时刻发生第二次PLU事件,则需要保证在第一次的通话间隔时间大于循环时间(即tavtc)的情况下,第二次的通话间隔时间大于循环时间(即ta>tc),循环时间tc大于驶入Cellj的时间且小于驶出Cellj的时间,即tc<y+lj/uj
因此,当通话间隔时间小于循环时间时,PLU信号的数量与估计车速之间的关系如以下公式:
其中,ps2表示第二种情况下Cellj处记录的PLU信号的数量,Cellj表示第j个小区,j为正整数;qj表示Cellj处的交通流量,Pr(ta<tc)表示通话间隔时间ta小于循环时间tc的概率;表示第一次的通话间隔时间ta大于循环时间tc,第二次的通话间隔时间ta大于循环时间tc,循环时间tc大于驶入Cellj的时间且小于驶出Cellj的概率,y由通话达到的时刻与驶入Cellj的时刻计算得到,/>表示估计得到的Cellj处的车速,lj表示Cellj在公路上的覆盖长度;
综合以上两种情况,PLU信号的数量与估计车速之间的关系如以下公式:
其中,通话间隔时间大于循环时间的概率如以下公式:
根据式(24)和式(25),在Cellm内的估计平均车速通过以下公式计算得到:
其中,pm表示两种情况下Cellm内的PLU信号的总数,表示在Cellm内的估计平均车速,qm表示两种情况下Cellm内的交通流量,Pr(ta>tc)表示通话间隔时间ta大于循环时间tc的概率,lm表示Cellm在公路上的覆盖长度,Cellm表示第m个小区。
需要说明的是:公式(12)-公式(26)中涉及的λ1、μ1、σ1、μ2、σ2、w11、w12、w13、λ2、μ3、σ3、μ4、σ4、w21、w22、w23和/>所表示的含义均与前文描述的含义相同,故在公式(12)-公式(26)中就不再赘述了。
优选的,在通话保持时间的累积分布函数中,λ1取值为1,μ1取值为1,σ1取值为0.2,μ2取值为-0.09116,σ2取值为0.42699,w11取值为0.2,w12取值为0.4,w13取值为0.4;在通话间隔时间的累积分布函数中,λ2取值为60,μ3取值为1/60,σ3取值为0.2/3600,μ4取值为-4.18551,σ4取值为0.42699,w21取值为0.2,w22取值为0.4,w23取值为0.4。
本发明在具体实施时,在基于蜂窝网络信号的交通信息估计模型中,通话保持时间和通话间隔时间数据由蜂窝流动车辆数据中统计得到。对于通话保持时间,可以通过从蜂窝流动车辆数据中提取同一部手机的通话开始时刻与通话结束时刻进行计算得到,而通话间隔时间可以从蜂窝流动车辆数据中提取每部手机的连续两次CA发生的时间,并通过计算时间差得到。对于通话保持时间和通话间隔时间的真实累积分布函数的计算,先从蜂窝流动车辆数据中统计得到最长通话保持时间与最短通话保持时间,或最长通话间隔时间与最短通话间隔时间;其次,将统计到的时间范围(即最长到最短的范围内)等分成若干份,依次统计各个小的时间区间内存在多少个通话保持时间或通话间隔时间,并将每个小区间的数量与总数进行计算,即可得到落在某个区间范围的概率;最后将每个区间的概率逐级累加,从而生成真实通话保持时间的累积分布函数和真实通话间隔时间的累积分布函数。因实际的累积分布函数是一个离散集,无法用于实际计算;同时,符合该分布的概率密度函数为多峰函数,无法使用单一概率分布模型进行模拟。因此,为了拟合这两种混合分布,本发明的累积分布函数生成器可以通过学习这两个数据集来估计出通话保持时间和通话间隔时间的目标累积分布函数。
通过实际的拟合测试,如图13所示,可以看出估计的累积分布函数(以星号表示)和实际的累积分布函数(以加号表示)几乎重合,其中,图13中左半部分表示的是通话保持时间,右半部分表示的是通话间隔时间;这意味着本发明累积分布函数生成器可以有效地从实际数据中提取分布规律;因此,估计的通话保持时间和通话间隔时间的累积分布函数能够很好的应用于基于蜂窝网络信号的交通信息估计。
下面以某一个目标路段上的Cell4在一天内记录到的交通流量、车速、交通密度以及各类蜂窝网络信号的数量为例进行说明,具体记录的数据如以下表1:
表1Cell4一天内记录的交通信息以及蜂窝网络信号的数据
如图14所示,该图14显示了一天内Cell4中交通流量(辆车/小时)、NLU信号的数量(事件/小时)和HO信号的数量(事件/小时)的变化;如图14(1)所示,蜂窝网络的NLU信号的数量的变化曲线采用三角点线表示,HO蜂窝网络信号的数量的变化曲线采用圆点线段表示,交通流采用星号虚线表示;左侧数轴代表流量,右侧数轴代表蜂窝网络信号的数量。从图中可以看出,星号虚线和三角点线几乎重合,而圆点线段则漂浮在三角点线周围;因此可以看出NLU信号和HO信号与交通流量呈正相关,利用蜂窝网络的NLU信号和HO信号的数量来估计交通流量是合理的。
如图14所示,该图14显示了一天内Cell4中车速(公里/小时)、CA信号的数量(事件/小时)和PLU信号的数量(事件/小时)之间的关系。如图14(2)所示,蜂窝网络的CA信号的数量的变化曲线采用圆点线段表示,蜂窝网络的PLU信号的数量的变化曲线采用三角点线表示,车速采用星号虚线表示。为了显示它们之间的关系,将车速的数轴倒置。从图中可以看出,圆点线段和三角点线的变化趋势与反转后星号虚线的变化趋势相同,因此可以认为蜂窝网络的CA和PLU信号的数量与车速成反比关系;因此,利用CA信号的数量和PLU信号的数量来估计车速是合理的。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。

Claims (7)

1.一种交通信息的估计方法,其特征在于:所述估计方法包括:
构建累积分布函数生成器,所述累积分布函数生成器包括一个输入层、一个输出层以及一个中间层;所述中间层的神经元分别采用指数分布函数、正态分布函数或对数正态分布函数作为激活函数;所述输入层用于输入蜂窝流动车辆数据中实际收集的通话时间,所述中间层用于对所述输入层输入的通话时间进行训练学习,所述输出层用于输出估计的通话时间的累积分布函数;
利用构建的累积分布函数生成器输出估计的通话时间的累积分布函数,对估计的通话时间的累积分布函数进行求导,从而获得估计的通话时间的概率密度函数;
通过估计的通话时间的概率密度函数和蜂窝网络信号的数量估计出交通信息,所述交通信息包括交通流量或车速。
2.根据权利要求1所述一种交通信息的估计方法,其特征在于:所述通话时间包括通话保持时间和/或通话间隔时间,所述通话保持时间为单次通话从接听到挂断的持续时间,所述通话间隔时间为两次通话到达的间隔时间;
所述估计的通话时间的概率密度函数包括估计的通话保持时间的概率密度函数和估计的通话间隔时间的概率密度函数。
3.根据权利要求2所述一种交通信息的估计方法,其特征在于:当所述输入层输入的是蜂窝流动车辆数据中实际收集的通话保持时间th时,所述中间层的指数分布函数f11(th)的公式如下:
其中,λ1表示指数分布函数f11(th)的参数;
所述中间层的正态分布函数f12(th)的公式如下:
其中,μ1表示正态分布函数f12(th)的均值,σ1表示正态分布函数f12(th)的标准差;
所述中间层的对数正态分布函数f13(th)的公式如下:
其中,μ2表示对数正态分布函数f13(th)的均值,σ2表示对数正态分布函数f13(th)的标准差;
所述输出层输出的估计通话保持时间的累积分布函数的公式如下:
其中,w11表示指数分布函数f11(th)的权重,w12表示正态分布函数f12(th)的权重,w13表示对数正态分布函数f13(th)的权重;
所述中间层在训练学习的过程中,使用的损失函数的公式如下:
其中,Fh表示统计得到的真实通话保持时间的累积分布函数,表示累积分布函数生成器生成的估计通话保持时间的累积分布函数。
4.根据权利要求2所述一种交通信息的估计方法,其特征在于:当所述输入层输入的是蜂窝流动车辆数据中实际收集的通话间隔时间ta时,所述中间层的指数分布函数f21(ta)的公式如下:
其中,λ2表示指数分布函数f21(ta)的参数;
所述中间层的正态分布函数f22(ta)的公式如下:
其中,μ3表示正态分布函数f22(ta)的均值,σ3表示正态分布函数f22(ta)的标准差;
所述中间层的对数正态分布函数f23(ta)的公式如下:
其中,μ4表示对数正态分布函数f23(ta)的均值,σ4表示对数正态分布函数f23(ta)的标准差;
所述输出层输出的估计通话间隔时间的累积分布函数的公式如下:
其中,w21表示指数分布函数f21(ta)的权重,w22表示正态分布函数f22(ta)的权重,w23表示对数正态分布函数f23(ta)的权重;
所述中间层在训练学习的过程中,使用的损失函数的公式如下:
其中,Fa表示统计得到的真实通话间隔时间的累积分布函数,表示累积分布函数生成器生成的估计通话间隔时间的累积分布函数。
5.根据权利要求3所述一种交通信息的估计方法,其特征在于:所述的通过估计的通话时间的概率密度函数和蜂窝网络信号的数量估计出交通信息具体包括:
通过估计的通话保持时间的概率密度函数和HO信号的数量估计出交通流量,HO信号的数量与估计的交通流量之间的关系如以下公式:
通过以上式(11),得到估计的交通流量如以下公式:
其中,Pr[th>x]表示通话保持时间th大于驶入Celli的时间x的概率,x由通话到达的时刻与驶入Celli的时刻计算得到,Celli表示第i个小区;表示估计的通话保持时间的概率密度函数;/>表示估计得到的Celli处的交通流量;hi表示Celli处记录的HO信号的数量。
6.根据权利要求4所述一种交通信息的估计方法,其特征在于:所述通过估计的通话时间的概率密度函数和蜂窝网络信号的数量估计出交通信息包括:
通过估计的通话间隔时间的概率密度函数和CA信号的数量估计出车速,CA信号的数量与估计车速之间的关系如以下公式:
因式(13)中使用车流量qi作为计算参数,而真实车流量不可知,故使用NLU信号或HO信号估计的车流量作为参数,CA信号的数量与估计车速之间的关系进一步如以下公式:
其中,表示通话间隔时间ta大于驶入Celli的时间x且小于驶出Celli的时间/>的概率,x由通话达到的时刻与驶入Celli的时刻计算得到,Celli表示第i个小区,li表示Celli在公路上的覆盖长度,/>表示估计得到的Celli处的车速;/>表示估计的通话间隔时间的概率密度函数;ci表示Celli处记录的CA信号的数量,qi表示Celli内的车流量;qN,i表示使用NLU信号或HO信号估计的车流量;
使用牛顿下山法寻求满足误差ε小于0.00001的近似解,求解的过程如以下:
其中,表示牛顿下山法的目标方程,/>表示牛顿下山法的目标方程的导数;ωk表示牛顿下山法的迭代参数,/>表示牛顿下山法中第k次迭代的Celli处的估计车速值;/>表示牛顿下山法中第k+1次迭代迭代的Celli处的估计车速值。
7.根据权利要求2所述一种交通信息的估计方法,其特征在于:所述通过估计的通话时间的概率密度函数和蜂窝网络信号的数量估计出交通信息包括:
通过估计的通话间隔时间的概率密度函数和PLU信号的数量估计出车速,假设相邻两个PLU信号发生的间隔时间为一个循环时间,第一种情况:当通话间隔时间大于循环时间时,PLU信号的数量与估计车速之间的关系如以下公式:
其中,ps1表示第一种情况下Celli处记录的PLU信号的数量,Celli表示第i个小区;qi表示Celli处的交通流量;Pr(ta>tc)表示通话间隔时间ta大于循环时间tc的概率,表示循环时间tc大于驶入Celli的时间且小于驶出Celli的时间的概率,x由通话达到的时刻与驶入Celli的时刻计算得到,/>表示估计得到的Celli处的车速,li表示Celli在公路上的覆盖长度;
第二种情况:当通话间隔时间小于循环时间时,PLU信号的数量与估计车速之间的关系如以下公式:
其中,ps2表示第二种情况下Cellj处记录的PLU信号的数量,Cellj表示第j个小区;qj表示Cellj处的交通流量,Pr(ta<tc)表示通话间隔时间ta小于循环时间tc的概率;表示第一次的通话间隔时间ta大于循环时间tc,第二次的通话间隔时间ta大于循环时间tc,循环时间tc大于驶入Cellj的时间且小于驶出Cellj的概率,y由通话达到的时刻与驶入Cellj的时刻计算得到,/>表示估计得到的Cellj处的车速,lj表示Cellj在公路上的覆盖长度;
综合以上两种情况,PLU信号的数量与估计车速之间的关系如以下公式:
其中,通话间隔时间大于循环时间的概率如以下公式:
根据式(21)和式(22),在Cellm内的估计平均车速通过以下公式计算得到:
其中,pm表示两种情况下Cellm内的PLU信号的总数,表示在Cellm内的估计平均车速,qm表示两种情况下Cellm内的交通流量,Pr(ta>tc)表示通话间隔时间ta大于循环时间tc的概率,lm表示Cellm在公路上的覆盖长度,Cellm表示第m个小区。
CN202310608671.5A 2023-05-28 2023-05-28 一种交通信息的估计方法 Pending CN116959241A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310608671.5A CN116959241A (zh) 2023-05-28 2023-05-28 一种交通信息的估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310608671.5A CN116959241A (zh) 2023-05-28 2023-05-28 一种交通信息的估计方法

Publications (1)

Publication Number Publication Date
CN116959241A true CN116959241A (zh) 2023-10-27

Family

ID=88451849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310608671.5A Pending CN116959241A (zh) 2023-05-28 2023-05-28 一种交通信息的估计方法

Country Status (1)

Country Link
CN (1) CN116959241A (zh)

Similar Documents

Publication Publication Date Title
CN108234198B (zh) 一种基站流量预测方法和设备
EP4037256A1 (en) Bandwidth prediction method and apparatus, electronic device and storage medium
CN112257934A (zh) 一种基于时空动态神经网络的城市人流预测方法
CN108874823A (zh) 智能客服的实现方法和装置
CN107018493A (zh) 一种基于连续时序马尔科夫模型的地理位置预测方法
CN106355289A (zh) 一种基于位置服务的景区客流量预测方法
CN106339769B (zh) 一种面向移动社会网络的用户出行预测方法
CN110378002A (zh) 基于移动轨迹的社会关系建模方法
CN102480763B (zh) 向移动设备提供数据的方法和装置
CN112385267B (zh) Ue的目标小区确定方法、装置、通信设备及存储介质
CN105787858A (zh) 一种高速公路网态势推演方法
CN106709840B (zh) 一种基于移动网络数据的城市常住人口估算方法
CN113993172B (zh) 一种基于用户移动行为预测的超密集网络切换方法
CN104410973A (zh) 一种播放录音的诈骗电话识别方法和系统
CN107734200B (zh) 一种基于最大似然的通信网用户呼叫行为预测方法及装置
CN116959241A (zh) 一种交通信息的估计方法
Li et al. Mobile user location prediction based on user classification and markov model
CN116721540A (zh) 一种交通信息估计的优化方法
Grigoreva et al. Reducing mobility management signaling for automotive users in LTE advanced
CN109994128B (zh) 语音质量问题定位方法、装置、设备及介质
CN112351429A (zh) 基于深度学习的有害信息检测方法及系统
CN108932627A (zh) Cpa广告的消耗速度的预估方法、装置及可读存储介质
CN114158073B (zh) 网络切片部署方法、装置、设备及存储介质
CN116701551A (zh) 异常预测方法、装置、设备及存储介质
Rottkamp et al. A time-inhomogeneous markov model for resource availability under sparse observations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination