CN111275073A - 一种基于手机信令数据的区域人流分析方法 - Google Patents

一种基于手机信令数据的区域人流分析方法 Download PDF

Info

Publication number
CN111275073A
CN111275073A CN202010013365.3A CN202010013365A CN111275073A CN 111275073 A CN111275073 A CN 111275073A CN 202010013365 A CN202010013365 A CN 202010013365A CN 111275073 A CN111275073 A CN 111275073A
Authority
CN
China
Prior art keywords
data
mobile phone
signaling data
region
regional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010013365.3A
Other languages
English (en)
Other versions
CN111275073B (zh
Inventor
陈海波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Sci Tech University ZSTU
Original Assignee
Zhejiang Sci Tech University ZSTU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Sci Tech University ZSTU filed Critical Zhejiang Sci Tech University ZSTU
Priority to CN202010013365.3A priority Critical patent/CN111275073B/zh
Publication of CN111275073A publication Critical patent/CN111275073A/zh
Application granted granted Critical
Publication of CN111275073B publication Critical patent/CN111275073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于手机信令数据的区域人流分析方法,其特征在于,包括以下步骤:A、采集手机原始信令数据,并对手机原始信令数据进行筛选和过滤,得到有效手机信令数据;B、对分析地域进行区域划分,将有效手机信令数据按照经纬度匹配到各个区域,并将匹配后的每个区域的有效手机信令数据按照时段划分为多维时序数据,同时,对
Figure DDA0002357952620000012

Description

一种基于手机信令数据的区域人流分析方法
技术领域
本发明涉及一种区域人流分析方法,特别是一种基于手机信令数据的区域人流分析方法。
背景技术
近年来,受到经济发展的推动,城市之间、区县之间人们的旅游,出差、学习、娱乐等活动日益增长,对城市基础设施资源配置、城市治安防范、人流疏导等城市管理问题提出了更高的要求,也带来了一系列的问题,城市规划不合理、交通配套设施不完善导致出行滞留、周边拥堵、资源不平衡都阻碍了城市的健康发展。如何利用大数据资源,基于机器学习技术准确及时的把握人流的区域特征,通过人流动态变化规律预测短时、中期或长期区域客流变化,对于提升智慧城市管理能力具有重要意义,成为当前研究和应用的热点之一。
由于人流的转移规律具有时段性、地域性的差异,不同的时间范围人流移动的方向、速度也会有特征差异,例如周六和周一、平时早高峰和正午,其人流移动具有明显差异,使用全部历史进行预测实际上忽略了这种差异性,降低了人流分析和预测的实用意义。同时受到天气、经济环境和地区事件的影响,目前的方法大多使用全部历史信令数据采用统计方法建立单一的预测模型进行预测,并没有考虑手机信令数据在跨区域流动中的时效性特征和地域拓扑特征,这影响了区域人流预测的准确性和实现效率。而且,伴随着近年来经济状况和交通水平的快速发展,人流的移动特征也出现变化,数据随着时间的迁移,其对分析的作用也逐步降低,使用全部历史数据建立单一的模型会降低模型的时效性。因此,需要一种更为行之有效的方法来弥补以上不足。
发明内容
本发明的目的在于,提供一种基于手机信令数据的区域人流分析方法。本发明具有能够有效提升区域人流预测的准确性和时效性的特点。
本发明的技术方案:一种基于手机信令数据的区域人流分析方法,包括以下步骤:
A、采集手机原始信令数据,并对手机原始信令数据进行筛选和过滤,得到有效手机信令数据;
B、对分析地域进行区域划分,将有效手机信令数据按照经纬度匹配到各个区域,并将匹配后的每个区域的有效手机信令数据按照时段划分为多维时序数据,如式(1)所示,
Figure BDA0002357952610000021
Figure BDA0002357952610000022
其中,DT表示所有区域的T时段的状态,
Figure BDA0002357952610000023
表示第i个区域在T时段的状态,
Figure BDA0002357952610000024
表示区域i在时段T的留存数,
Figure BDA0002357952610000025
表示第i个小区在时段T的扩散数,
Figure BDA0002357952610000026
表示区域j在T-1时刻向区域i的扩散数;
同时,对
Figure BDA0002357952610000027
Figure BDA0002357952610000028
作归一化处理,归一化处理公式(2)为:
Figure BDA0002357952610000031
Figure BDA0002357952610000032
其中,
Figure BDA0002357952610000033
分别表示区域i在时段T归一化前、后的留存数,maxs为所有区域的所有时段留存数的最大值;
Figure BDA0002357952610000034
分别表示区域j在T-1时刻向区域i扩散数归一化前、后的值;maxq为所有区域在所有时段向其他区域归一化前扩散值的最大值;
C、采用在线混合高斯模型对留存的多维时序数据进行聚类,形成多个人流迁移状态的特征类;
D、对聚类后的每个特征类数据分别建立不同参数的马尔科夫链预测模型,对未来时段的区域客流分布进行预测。
前述的一种基于手机信令数据的区域人流分析方法中,手机原始信令数据筛选和过滤的具体方法为:将手机原始信令数据划分为触发型事件数据和周期性事件数据,所述触发型事件数据是指手机开关机数据、摘机数据、挂机数据或跨区切换数据,周期性事件数据是指固定时间间隔的手机状态上报事件数据;选取周期性事件数据和跨区切换数据,并去除周期性事件数据和跨区切换数据中的小区编码缺失和漂移数据,得到有效手机信令数据;
所述的手机原始信令数据包含ID、时间戳、位置区编号、小区编号和事件类型信息数据。
前述的一种基于手机信令数据的区域人流分析方法中,步骤B中,
Figure BDA0002357952610000035
Figure BDA0002357952610000036
的具体计算方式为:
c1、对所有的有效手机信令数据按照时间字段先后顺序排序,构成信令队列;
c2、若信令队列为空,则计算结束,否则取出信令队列中第一个信令数据G;
c3、根据G的小区编号所对应的的经纬度匹配到步骤B中的相应区域中,再根据G的时间匹配到步骤B中的时段中,令AG、TG分别为G所匹配的区域和时段。
c4、在队列中从G开始向后查找与G的ID相同的信令数据,记为GN;
c5、若GN不存在,则令
Figure BDA0002357952610000041
回到步骤c2;
c6、若GN匹配的时段TGN=TG,则从队列中删除GN,回到步骤c4;
c7、若GN匹配的时段TGN=TG+1,则判断AG是否与AGN相等,当相等时则
Figure BDA0002357952610000042
当不相等时则
Figure BDA0002357952610000043
c8、从信令队列中删除GN,回到步骤c4。
前述的一种基于手机信令数据的区域人流分析方法中,区域划分以地区行政区边界为依据进行划分。
前的一种基于手机信令数据的区域人流分析方法中,步骤C中利用在线混合高斯模型进行聚类的具体方法为:
第一步、令K为高斯模型数,混合高斯模型H(x)定义为:
Figure BDA0002357952610000044
初始的k值为N,
Figure BDA0002357952610000045
ui和Σi分别表示高斯的均值和方差;
第二步、随着有效手机信令数据的更新,动态的对混合高斯模型进行更新,更新算法如下:
输入:X={x1,x2,...,xM}为M个新到达的区域状态,
H(x|k,u1,u2...,uk,Σ1k,...,Σk)为当前的混合高斯模型,
L={y1,y2,...}为所有未归类的区域状态,初始状态时L为空集;
输出:H(x|kn,u’1,u’2...,u’kn,Σ’1,Σ’2,...,Σ’kn)为更新后的混合高斯模型;
第三步、进行聚类,聚类过程为:
1)t=1;
2)E={E1,E2.,..,Ek}={N(xt|uii)|i={1,2,...,k}};
3)E={(E1-min(E))/(max(E)-min(E)),..,(Ek-min(E))/(max(E)-min(E))};
4)I=argmax(E),V=max(E);
5)如果V<p1,则L=L∪{xt},xt表示第t条区域状态数据;反之,则执行步骤7);其中,p1为归属阈值,取值[0.5,0.8];
6)如果|L|>=p2,则对L中所有数据采用EM算法单独进行混合高斯聚类,得到新模型HL,令H=H∪HL,并令L={};其中,p2为未归类数据上限;
7)将xt归入H中第I个高斯分量,并按照如下公式(4)重新计算第I个分量的均值和方差:
Figure BDA0002357952610000051
8)t=t+1,若t>M,算法结束,反之则回到步骤1)。
前述的一种基于手机信令数据的区域人流分析方法中,建立马尔科夫链预测模型对未来时段的区域客流分布进行预测的方法如下:
d1)输入:H(x|k,u1,u2...,uk,Σ1k,...,Σk)为最新的混合高斯模型,并令
Figure BDA0002357952610000061
表示最新时段的区域状态;
输出:
Figure BDA0002357952610000062
即T+1时段预测的人流分布
d2)预测的过程为:
d2.1)E={E1,E2.,..,Ek}={N(DT|uii)|i={1,2,...,k}},
d2.2)I=argmax(E),则DT归属第I个高斯分量,取uI作为马尔科夫转移矩阵;
d2.3)对每一个区域,按照下面公式,预测其下一个时段的区域状态:
Figure BDA0002357952610000063
其中i=1,...,N。
与现有技术相比,本发明通过对手机原始信令数据进行筛选和过滤,然后再按区域进行划分,根据区域和时间段对有效手机信令数据进行划分,对于数据进行合理分类,便于后续的聚类;本发明采用一种在线混合高斯模型对留存的数据进行聚类,形成多个人流迁移状态的特征类,基于手机信令大数据分析来实现区域人流的短时预测,采用实时方式随着信令数据的更新而修正模型,同时考虑到近期的信令数据比历史信令数据对预测更有价值,使用一种在线的方式完成聚类,使得聚类模型参数随着时间推移持续更新,同时也使得该方法能够支持不间断的实时执行,从而使其具有良好的时效性。并对聚类后的每个特征类数据分别建立相对应的马尔科夫链预测模型,对于特征样本较少不足以支持预测的情况,则采用基于区域拓扑关系的人流扩散方法来实现预测,从而实现了一种具有自适应能力的实时区域人流预测,进而能够有效提升区域人流预测的准确性和时效性。综上所述,本发明具有能够有效提升区域人流预测的准确性和时效性的特点。
具体实施方式
下面结合实施例对本发明作进一步的说明,但并不作为对本发明限制的依据。
实施例1。一种基于手机信令数据的区域人流分析方法,包括以下步骤:
A、采集手机原始信令数据,并对手机原始信令数据进行筛选和过滤,得到有效手机信令数据;
B、对分析地域进行区域划分,将有效手机信令数据按照经纬度匹配到各个区域,并将匹配后的每个区域的有效手机信令数据按照时段划分为多维时序数据,如式(1)所示,
Figure BDA0002357952610000071
Figure BDA0002357952610000072
其中,DT表示所有区域的T时段的状态,
Figure BDA0002357952610000073
表示第i个区域在T时段的状态,
Figure BDA0002357952610000074
表示区域i在时段T的留存数,
Figure BDA0002357952610000075
表示第i个小区在时段T的扩散数,
Figure BDA0002357952610000076
表示区域j在T-1时刻向区域i的扩散数;由于拓扑距离远的区域之间扩散关系小,因此
Figure BDA0002357952610000077
实际上隐含了区域之间的拓扑关系;
同时,对
Figure BDA0002357952610000078
Figure BDA0002357952610000079
作归一化处理,归一化处理公式(2)为:
Figure BDA00023579526100000710
Figure BDA00023579526100000711
其中,
Figure BDA00023579526100000712
分别表示区域i在时段T归一化前、后的留存数,maxs为所有区域的所有时段留存数的最大值;
Figure BDA00023579526100000713
分别表示区域j在T-1时刻向区域i扩散数归一化前、后的值;maxq为所有区域在所有时段向其他区域归一化前扩散值的最大值;
C、采用在线混合高斯模型对留存的多维时序数据进行聚类,形成多个人流迁移状态的特征类;
D、对聚类后的每个特征类数据分别建立不同参数的马尔科夫链预测模型,对未来时段的区域客流分布进行预测。
手机原始信令数据筛选和过滤的具体方法为:将手机原始信令数据划分为触发型事件数据和周期性事件数据,所述触发型事件数据是指手机开关机数据、摘机数据、挂机数据或跨区切换数据,周期性事件数据是指固定时间间隔的手机状态上报事件数据;选取周期性事件数据和跨区切换数据,并去除周期性事件数据和跨区切换数据中的小区编码缺失和漂移数据,得到有效手机信令数据;
所述的手机原始信令数据包含ID、时间戳、位置区编号、小区编号和事件类型信息数据。
步骤B中,
Figure BDA0002357952610000081
Figure BDA0002357952610000082
的具体计算方式为:
c1、对所有的有效手机信令数据按照时间字段先后顺序排序,构成信令队列;
c2、若信令队列为空,则计算结束,否则取出信令队列中第一个信令数据G;
c3、根据G的小区编号所对应的的经纬度匹配到步骤B中的相应区域中,再根据G的时间匹配到步骤B中的时段中,令AG、TG分别为G所匹配的区域和时段。
c4、在队列中从G开始向后查找与G的ID相同的信令数据,记为GN;
c5、若GN不存在,则令
Figure BDA0002357952610000091
回到步骤c2;
c6、若GN匹配的时段TGN=TG,则从队列中删除GN,回到步骤c4;
c7、若GN匹配的时段TGN=TG+1,则判断AG是否与AGN相等,当相等时则
Figure BDA0002357952610000092
当不相等时则
Figure BDA0002357952610000093
c8、从信令队列中删除GN,回到步骤c4。
区域划分以地区行政区边界为依据进行划分。
步骤C中利用在线混合高斯模型进行聚类的具体方法为:
第一步、令K为高斯模型数,混合高斯模型H(x)定义为:
Figure BDA0002357952610000094
初始的k值为N,
Figure BDA0002357952610000095
模型值需要计算各高斯的均值和方差,ui和Σi分别表示高斯的均值和方差,两者均通过EM算法得到;
第二步、随着有效手机信令数据的更新,动态的对混合高斯模型进行更新,更新算法如下:
输入:X={x1,x2,...,xM}为M个新到达的区域状态,
H(x|k,u1,u2...,uk,Σ1k,...,Σk)为当前的混合高斯模型,
L={y1,y2,...}为所有未归类的区域状态,初始状态时L为空集;
输出:H(x|kn,u’1,u’2...,u’kn,Σ’1,Σ’2,...,Σ’kn)为更新后的混合高斯模型;
第三步、进行聚类,聚类过程为:
1)t=1;
2)E={E1,E2.,..,Ek}={N(xt|uii)|i={1,2,...,k}};
3)E={(E1-min(E))/(max(E)-min(E)),..,(Ek-min(E))/(max(E)-min(E))};
4)I=argmax(E),V=max(E);
5)如果V<p1,则说明xt无法归入到现有的高斯模型中去,L=L∪{xt},xt表示第t条区域状态数据;反之,则执行步骤7);其中,p1为归属阈值,取值[0.5,0.8],默认值为0.6;
6)如果|L|>=p2,说明L中已经有足够多的未归类数据,则对L中所有数据采用EM算法单独进行混合高斯聚类,得到新模型HL,令H=H∪HL,并令L={};其中,p2为未归类数据上限,具体取值为取值为前24个时段的信令数据量的均值;
7)将xt归入H中第I个高斯分量,并按照如下公式(4)重新计算第I个分量的均值和方差:
Figure BDA0002357952610000101
8)t=t+1,若t>M,算法结束,反之则回到步骤1)。
这样就实现了对每一个DT,都归属到唯一的特征类,实际测试中发现归属到同一个特征类的时段区域客流分布数据具有明显的时效性,例如节假日、周末和平时的明显归属于不同类,同时也受到其他复杂未知因素的干扰。
建立马尔科夫链预测模型对未来时段的区域客流分布进行预测的方法如下:
d1)输入:H(x|k,u1,u2...,uk,Σ1k,...,Σk)为最新的混合高斯模型,并令
Figure BDA0002357952610000111
表示最新时段的区域状态;
输出:
Figure BDA0002357952610000112
即T+1时段预测的人流分布
d2)预测的过程为:
d2.1)E={E1,E2.,..,Ek}={N(DT|uii)|i={1,2,...,k}},
d2.2)I=argmax(E),则DT归属第I个高斯分量,取uI作为马尔科夫转移矩阵;
d2.3)对每一个区域,按照下面公式,预测其下一个时段的区域状态:
Figure BDA0002357952610000113
其中i=1,...,N。
实施例2。一种基于手机信令数据的区域人流分析方法,结合一个具体实例对本发明作进一步详细说明发明的具体实施过程。
1.选择杭州市一年(2018年6月-2019年6月)的移动信令数据,去除缺失小区编码、漂移等无效数据,保留周期性数据和区域切换事件型数据,并按照平均10分钟间隔采样信令数据,共得到有效信令数据约4.7亿条。
将杭州市按照行政区划划分为十一个区域,设定半小时为1个时段,可得到17520个时段。根据信令数据计算各个区域在每个时段的状态,并进行归一化处理。以2018年12月1日早高峰8:00-8:30分为例,计算该时段的状态如下表1所示,
表1
Figure BDA0002357952610000121
3.令K=11为初始高斯模型数,对17520个时段进行聚类,为了验证实时在线更新和马尔科夫预测的准确性,选择2019年7月1日到2019年8月31日的信令数据进行在线模型更新,M取值48即一天的时段更新一次。
4.同时对2019年7月1日到2019年8月31日每一时段采用步骤D的方法进行预测分析,得到2976条各区域预测状态,为了比较预测结果与实际结果的准确性,同时对该时间段内的数据按照步骤B的方法计算每个时段的状态作为真实数据。分别对11个区域,计算预测状态向量和真实状态向量的曼哈顿距离。根据经验,取曼哈顿距离0.6为有效距离下限,则可计算相对准确率如表2所示。
表2.
区域 曼哈顿距离 相对准确率
1 0.715 83.916%
2 0.7326 81.9%
3 0.6019 99.684%
4 0.8043 74.599%
5 0.7209 83.229%
6 0.6515 92%
7 0.6992 85.8%
8 0.7004 85.665
9 0.7276 82.462%
10 0.83 72.289%
11 0.8625 69.565%

Claims (6)

1.一种基于手机信令数据的区域人流分析方法,其特征在于,包括以下步骤:
A、采集手机原始信令数据,并对手机原始信令数据进行筛选和过滤,得到有效手机信令数据;
B、对分析地域进行区域划分,将有效手机信令数据按照经纬度匹配到各个区域,并将匹配后的每个区域的有效手机信令数据按照时段划分为多维时序数据,如式(1)所示,
Figure FDA0002357952600000011
Figure FDA0002357952600000012
其中,DT表示所有区域的T时段的状态,
Figure FDA0002357952600000013
表示第i个区域在T时段的状态,
Figure FDA0002357952600000014
表示区域i在时段T的留存数,
Figure FDA0002357952600000015
表示第i个小区在时段T的扩散数,
Figure FDA0002357952600000016
表示区域j在T-1时刻向区域i的扩散数;
同时,对
Figure FDA0002357952600000017
Figure FDA0002357952600000018
作归一化处理,归一化处理公式(2)为:
Figure FDA0002357952600000019
Figure FDA00023579526000000110
其中,
Figure FDA00023579526000000111
分别表示区域i在时段T归一化前、后的留存数,maxs为所有区域的所有时段留存数的最大值;
Figure FDA00023579526000000112
分别表示区域j在T-1时刻向区域i扩散数归一化前、后的值;maxq为所有区域在所有时段向其他区域归一化前扩散值的最大值;
C、采用在线混合高斯模型对留存的多维时序数据进行聚类,形成多个人流迁移状态的特征类;
D、对聚类后的每个特征类数据分别建立不同参数的马尔科夫链预测模型,对未来时段的区域客流分布进行预测。
2.根据权利要求1所述的一种基于手机信令数据的区域人流分析方法,其特征在于:手机原始信令数据筛选和过滤的具体方法为:将手机原始信令数据划分为触发型事件数据和周期性事件数据,所述触发型事件数据是指手机开关机数据、摘机数据、挂机数据或跨区切换数据,周期性事件数据是指固定时间间隔的手机状态上报事件数据;选取周期性事件数据和跨区切换数据,并去除周期性事件数据和跨区切换数据中的小区编码缺失和漂移数据,得到有效手机信令数据;
所述的手机原始信令数据包含ID、时间戳、位置区编号、小区编号和事件类型信息数据。
3.根据权利要求1所述的一种基于手机信令数据的区域人流分析方法,其特征在于,步骤B中,
Figure FDA0002357952600000021
Figure FDA0002357952600000022
的具体计算方式为:
c1、对所有的有效手机信令数据按照时间字段先后顺序排序,构成信令队列;
c2、若信令队列为空,则计算结束,否则取出信令队列中第一个信令数据G;
c3、根据G的小区编号所对应的的经纬度匹配到步骤B中的相应区域中,再根据G的时间匹配到步骤B中的时段中,令AG、TG分别为G所匹配的区域和时段。
c4、在队列中从G开始向后查找与G的ID相同的信令数据,记为GN;
c5、若GN不存在,则令
Figure FDA0002357952600000031
回到步骤c2;
c6、若GN匹配的时段TGN=TG,则从队列中删除GN,回到步骤c4;
c7、若GN匹配的时段TGN=TG+1,则判断AG是否与AGN相等,当相等时则
Figure FDA0002357952600000032
当不相等时则
Figure FDA0002357952600000033
c8、从信令队列中删除GN,回到步骤c4。
4.根据权利要求1所述的一种基于手机信令数据的区域人流分析方法,其特征在于:区域划分以地区行政区边界为依据进行划分。
5.根据权利要求1所述的一种基于手机信令数据的区域人流分析方法,其特征在于,步骤C中利用在线混合高斯模型进行聚类的具体方法为:
第一步、令K为高斯模型数,混合高斯模型H(x)定义为:
Figure FDA0002357952600000034
初始的k值为N,
Figure FDA0002357952600000035
ui和Σi分别表示高斯的均值和方差;
第二步、随着有效手机信令数据的更新,动态的对混合高斯模型进行更新,更新算法如下:
输入:X={x1,x2,...,xM}为M个新到达的区域状态,
H(x|k,u1,u2...,uk,Σ1k,...,Σk)为当前的混合高斯模型,
L={y1,y2,...}为所有未归类的区域状态,初始状态时L为空集;
输出:H(x|kn,u′1,u'2...,u'kn,Σ'1,Σ'2,...,Σ'kn)为更新后的混合高斯模型;
第三步、进行聚类,聚类过程为:
1)t=1;
2)E={E1,E2.,..,Ek}={N(xt|uii)|i={1,2,...,k}};
3)E={(E1-min(E))/(max(E)-min(E)),..,(Ek-min(E))/(max(E)-min(E))};
4)I=argmax(E),V=max(E);
5)如果V<p1,则L=L∪{xt},xt表示第t条区域状态数据;反之,则执行步骤7);其中,p1为归属阈值,取值[0.5,0.8];
6)如果|L|>=p2,则对L中所有数据采用EM算法单独进行混合高斯聚类,得到新模型HL,令H=H∪HL,并令L={};其中,p2为未归类数据上限;
7)将xt归入H中第I个高斯分量,并按照如下公式(4)重新计算第I个分量的均值和方差:
Figure FDA0002357952600000041
8)t=t+1,若t>M,算法结束,反之则回到步骤1)。
6.根据权利要求5所述的一种基于手机信令数据的区域人流分析方法,其特征在于,建立马尔科夫链预测模型对未来时段的区域客流分布进行预测的方法如下:
d1)输入:H(x|k,u1,u2...,uk,Σ1k,...,Σk)为最新的混合高斯模型,
并令
Figure FDA0002357952600000042
表示最新时段的区域状态;
输出:
Figure FDA0002357952600000043
即T+1时段预测的人流分布
d2)预测的过程为:
d2.1)E={E1,E2.,..,Ek}={N(DT|uii)|i={1,2,...,k}},
d2.2)I=argmax(E),则DT归属第I个高斯分量,取uI作为马尔科夫转移矩阵;
d2.3)对每一个区域,按照下面公式,预测其下一个时段的区域状态:
Figure FDA0002357952600000051
其中i=1,...,N。
CN202010013365.3A 2020-01-07 2020-01-07 一种基于手机信令数据的区域人流分析方法 Active CN111275073B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010013365.3A CN111275073B (zh) 2020-01-07 2020-01-07 一种基于手机信令数据的区域人流分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010013365.3A CN111275073B (zh) 2020-01-07 2020-01-07 一种基于手机信令数据的区域人流分析方法

Publications (2)

Publication Number Publication Date
CN111275073A true CN111275073A (zh) 2020-06-12
CN111275073B CN111275073B (zh) 2023-04-28

Family

ID=71111952

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010013365.3A Active CN111275073B (zh) 2020-01-07 2020-01-07 一种基于手机信令数据的区域人流分析方法

Country Status (1)

Country Link
CN (1) CN111275073B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113178196A (zh) * 2021-04-20 2021-07-27 平安国际融资租赁有限公司 音频数据提取方法、装置、计算机设备和存储介质
CN113449932A (zh) * 2021-08-30 2021-09-28 深圳市城市交通规划设计研究中心股份有限公司 基于马尔科夫链的旅游交通需求预测方法、装置及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170113045A1 (en) * 2015-10-26 2017-04-27 The Trustees Of The University Of Pennsylvania Real-time seizure prediction informed by hidden markov model event states
CN108810808A (zh) * 2018-05-29 2018-11-13 深圳市综合交通运行指挥中心 一种基于手机信令数据的区域客流饱和度计算方法
CN109842848A (zh) * 2017-09-22 2019-06-04 江苏智谋科技有限公司 一种基于手机信令的区域人流量预测平台
CN109902865A (zh) * 2019-02-20 2019-06-18 广州视源电子科技股份有限公司 人流量安全性的识别方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170113045A1 (en) * 2015-10-26 2017-04-27 The Trustees Of The University Of Pennsylvania Real-time seizure prediction informed by hidden markov model event states
CN109842848A (zh) * 2017-09-22 2019-06-04 江苏智谋科技有限公司 一种基于手机信令的区域人流量预测平台
CN108810808A (zh) * 2018-05-29 2018-11-13 深圳市综合交通运行指挥中心 一种基于手机信令数据的区域客流饱和度计算方法
CN109902865A (zh) * 2019-02-20 2019-06-18 广州视源电子科技股份有限公司 人流量安全性的识别方法、装置、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113178196A (zh) * 2021-04-20 2021-07-27 平安国际融资租赁有限公司 音频数据提取方法、装置、计算机设备和存储介质
CN113449932A (zh) * 2021-08-30 2021-09-28 深圳市城市交通规划设计研究中心股份有限公司 基于马尔科夫链的旅游交通需求预测方法、装置及系统

Also Published As

Publication number Publication date
CN111275073B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN107610469B (zh) 一种考虑多因素影响的日维度区域交通指数预测方法
CN106912015B (zh) 一种基于移动网络数据的人员出行链识别方法
CN107977673B (zh) 一种基于大数据的经济活动人口识别方法
CN107656987B (zh) 一种基于lda模型的地铁站点功能挖掘方法
CN110390349A (zh) 基于XGBoost模型的公交车客流量预测建模方法
CN109376906B (zh) 基于多维度轨迹的出行时间预测方法、系统及电子设备
CN106332052B (zh) 基于移动通信终端的微区域治安预警方法
CN113806419B (zh) 基于时空大数据的城市区域功能识别模型及识别方法
CN111275073B (zh) 一种基于手机信令数据的区域人流分析方法
CN111695722A (zh) 一种城市轨道交通车站节假日短时客流预测方法
CN110084402B (zh) 一种基于站点优选和蚂蚁寻迹的公交自适应调度方法
CN114463972A (zh) 一种基于etc门架通信数据的路段区间交通分析预测方法
CN112001829A (zh) 一种基于手机信令数据的人口分布判断方法
CN108648445A (zh) 基于交通大数据的动态交通态势预测方法
CN115204477A (zh) 一种上下文感知图递归网络的自行车流量预测方法
CN113537596B (zh) 一种城市轨道交通新线站点短时客流预测方法
CN115269758A (zh) 面向乘客诱导的路网客流状态推演方法及系统
CN112101132A (zh) 一种基于图嵌入模型和度量学习的交通状况预测方法
CN109254984B (zh) 基于od数据感知城市动态结构演化规律的可视分析方法
CN113112076A (zh) 一种客流集散模式发现及预测方法
CN110545522B (zh) 一种基于移动大数据的用户位置及功能区的识别方法
CN116797045A (zh) 夜间灯光融合多源数据的城镇化格局分析方法
CN111275482A (zh) 基于机器学习的轨道交通实时动态清分方法
CN115510056A (zh) 一种利用手机信令数据进行宏观经济分析的数据处理系统
CN113744525A (zh) 一种基于特征提取与深度学习的交通分布预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Chen Haibo

Inventor after: Liang Daolei

Inventor before: Chen Haibo

GR01 Patent grant
GR01 Patent grant