CN102184512B - 利用手机数据发现城市活动中异常事件的方法 - Google Patents

利用手机数据发现城市活动中异常事件的方法 Download PDF

Info

Publication number
CN102184512B
CN102184512B CN2011101196167A CN201110119616A CN102184512B CN 102184512 B CN102184512 B CN 102184512B CN 2011101196167 A CN2011101196167 A CN 2011101196167A CN 201110119616 A CN201110119616 A CN 201110119616A CN 102184512 B CN102184512 B CN 102184512B
Authority
CN
China
Prior art keywords
incident
data
event
events
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2011101196167A
Other languages
English (en)
Other versions
CN102184512A (zh
Inventor
陈飞
王文俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN2011101196167A priority Critical patent/CN102184512B/zh
Publication of CN102184512A publication Critical patent/CN102184512A/zh
Application granted granted Critical
Publication of CN102184512B publication Critical patent/CN102184512B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于城市管理和信息技术领域,涉及一种利用手机数据发现城市活动中异常事件的方法,包括下列步骤:(1)从某个区域的已知事件中选择符合标准的事件;(2)利用手机计费数据对符合上述标准的事件进行参与者的筛选和参与者家庭住址的定位,之后对所有的事件进行计数统计来特征化这些事件,得到标准库的数据集;(3)对标准库的数据集里的未经训练的事件数据进行聚类训练;(4)对于发生在该区域里的待检测的新事件,进行计数统计和聚类训练,并判断该事件是否为可能为异常事件。本发明能够快速发现事件参与者的来源和事件类型之间的关系,从事件参与者的来源分布推测出事件类型或者推测是否为异常事件。

Description

利用手机数据发现城市活动中异常事件的方法
技术领域
本发明属于城市管理和信息技术领域,涉及一种城市异常事件发现方法。
背景技术
随着城市化步伐的加快,能够理解和预测群体事件对于城市管理者尤其是对大城市的管理者来说是一个严重的挑战。当不能准确地确定参加事件的人数时(例如,从门票收入),传统预测的手段是靠直觉和经验来估计群体性事件的。即使知道了参加事件的准确人数,那么预测事件参与者对城市管理的影响也是很困难的。
事件预测可以采用基于人群分析的方法,在人群分析方法中有事件推理和人群建模两个概念。事件推理的目标是在给定数据(例如一个地方和集成通话的图像)情况下检测人群是否存在。事件推理中的事件可能是可预测的,也可能是对应一个实际的公共异常事件;人群建模的任务包括建立人群模式或者人群描述,这些模式或者描述能够预测或者模拟人群行为。一个成功的人群模型考虑到了有效的应用,例如空间的预测,计划的可行性,防止危险情况或以及计划一个应急疏散都是有效的应用。从三个层次对人群建模进行分析:微观、宏观、介观。在微观层面上,个人是研究对象,而在宏观层面上的研究对象是群组。介观层次上的建模包括前两者的特性,既要把一个群体看成一个有均一水平的团体又要考虑个体之间的相互作用以及个体的特点。
对于人群行为的建模,能够涉及到几个不同的领域。在计算机视觉中,人群建模是通过视觉手段分析人群的视频数据来表现周期性行为。在物理学中,受到流体动力学,群,元胞自动机的启发发展了许多方法。在过去几年,“普遍计算社区”开发了一些技术,例如GSM、蓝牙或者无线定位技术;这样一来我们可以利用这些技术大规模地分析人群事件并得到更重要的信息。
从数据收集的角度来看,传统的人群分析方法由来自控制点的数据聚合(如售出门票数量;在宾馆的夜晚,每个房间的人数;总人数)以及从随机选择的个人调查组成。在90年代,从计算机视觉研究带来另外的(非侵入性的)方法,即检测密度(人在空间的数量),地点,速度,和人群形状,通过这些方法提取人群的相关特点。虽然可以对这些属性进行有用的分析,但是可用相机的数量限制了这种研究。
随着移动电话的爆发,连同现在的传感器和更先进的通信系统(如GPS、数码相机、蓝牙、WiFi)的出现,使得用中大量的数据来研究群体、个体或者个体与群里的结合成为可能。
前述各种技术带来了不同的挑战但是这使得相关事件的推论成为可能。当事件被定位在空间时用传统的方法进行分析是缓慢的、精确的。计算机视觉允许事件的自动推理同时也提供了事件的一些特性,例如上面提到的有限的可视化数据。采用如通信或者GPS这样的数字足迹跟踪可以有更广阔的区域,但是与前述方法比精度比较低。就细节水平而言,传统的方法在宏观粒度(除非个性化数据收集)上是能胜任的,计算机视觉是适用与任何粒度水平尤其适用与宏观和介观分析,而这种利用手机位置移动数据或者叫数字足迹(这些手机数据是通过手机的计费数据获得)的方法在个人隐私受到很好的保护时能用于任何粒度的分析,即微观水平。当然,这种方法的精度是依靠研究中技术的渗透速率(例如人群中手机用户的数量)决定的。
为能够在国家、地区或城市管理的水平上调查异常事件对经济和城市拥塞的影响,从而更有效实现交通规划及交通物流管理就必须清楚地了解的中、大规模的异常事件及其经济影响。其中一个问题是在中大规模事件中了解人群模式的稳定性。如果可以找到人群的规律性,那么就可以开发出基于这种人群模式的服务了,并来完善事件的经验(例如,事件后提供疏散建议);相反的,也可以通过了解居民更愿意参加哪类事件来特征化居民。这就会绘出到每个区域的爱好结构图,反过来在定位系统上增加爱好结构图,那么增加了偏好值的地理信息会变成有关的空间语境信息。
如果事件参与者的来源位置和事件类型直接相关,就可以通过参与者的来源信息能够预测事件类型。已经有人确定了事件参与者的来源和事件类型之间存在着关系,那么对于大规模事件就可以通过考虑它的事件类型来推测出是否为异常事件和这个大规模事件额外的需求。例如,可以提供一些关于交通管理决策中的关键信息,增加从某个区域到事件地点的公家车路线的数量等。
发明内容
本发明的目的是提供一种能够快速发现事件参与者的来源和事件类型之间的关系,从事件参与者的来源分布推测出事件类型或者推测是否为异常事件的事件预测方法。本发明的技术方案如下:
一种利用手机数据发现城市活动中异常事件的方法,包括下列步骤:
(1)从某个区域的已知事件中选择符合下列标准的事件;
-参与人数应该满足所设定的规模;
-在空间上相对于相邻事件是独立的;
-事件的场地是明确区域;
-在时间上和该区域的任何事件是独立的;
-至少持续一段时间;
(2)利用手机计费数据对符合上述标准的事件进行参与者的筛选和参与者家庭住址的定位,之后对所有的事件进行计数统计来特征化这些事件,得到标准库的数据集,步骤如下:
2-1从电信运营商那里获得匿名手机计费数据;
2-2将用户每使用一次手机视为发生一次用户事件,对于所搜集到的每个用户的手机信号,统计各个用户事件的间隔时间,利用由经度、纬度组成的位置点pi和时间戳ti来特征化用户移动行为的个体位置测量数据mi
2-3从个体位置测量数据中按照下列方法提取轨迹:
a.设一个轨迹是一个用户按时间顺序访问过的n个位置序列Traj={p1→p2→…→pn};
b.对轨迹进行分割得到子轨迹;
c.设定时间阈值Tth和空间阈值Sth,对每个子轨迹,确定用户停止移动的时间和呼叫停止位置点,用一组连续的呼叫停止位置点来表征用户的停止序列p={ps,ps+1…,pm},其中
Figure GDA0000150982850000031
j≤m,max(distan ce(pi,pj))<Sth且tm-ts>Tth,序列中的每个呼叫停止位置点称之为用户的停留点;
2-4用户的家庭位置被认为成在晚上最频繁的停留点,据此推断用户的家庭住址;
2-5根据下列判据,判断一个用户是否是事件的参与者
i)用户在与事件相同的位置单元停留
ii)停留时间至少和事件时间有70%的重叠
iii)家庭住址和事件位置单元是不同的
2-6统计各个事件发生的位置单元、参加事件的人数、事件类型,对事件进行计数统计的特征化,建立标准库的数据集;
(3)设事件类型数为K,并设定对数据集进行聚类训练的初始类中心,对标准库的数据集里的未经训练的事件数据进行如下的聚类训练:
1)计算每两个事件之间的距离,并选择最大距离和最小距离;令a=最大距离/K,b=最小距离/K,进行下一步;
2)对数据集中的每个事件做如下操作:
a)从当前的初始类中心中找到与该事件最近的类中心;
b)如果该事件与最近类中心的距离小于a,则该事件被划分到该类,否则,将该事件作为一个新的类中心;
3)若类中心的个数大于K个,从各个类中心中选取包含事件个数最多的K个类中心作为初始类中心,否则,选取所有的类中心作为初始类中心;
5)重复以下操作,直到每个初始类中心m的距离变化小于b:
a)计算每个事件与各个初始类中心的距离,将其划分到最近的类;
b)重新计算每个类中心m、半径d和标准差c;
(4)对于发生在该区域里并符合步骤(1)列出的标准的待检测的新事件,采用步骤(2)的方法,对事件进行参与者的筛选和参与者家庭住址的定位,之后对待检测的新事件进行计数统计,得到新的事件数据,再按照步骤(3)的方法聚类训练,并计算待检测的新事件和每个类中心m的距离,从中选择一个最小的距离minD;如果minD小于(d+3c)则该事件的类型不是异常事件,否则判断该事件可能为异常事件。
作为优选实施方式,本发明的利用手机数据发现城市活动中异常事件的方法,在对每个子轨迹,确定用户停止移动的时间和呼叫停止位置点之前,对于轨迹,先利用低通滤波器滤去由于手机计费数据噪音产生的子轨迹噪音;所述的位置单元即是根据邮编划定的行政区域。
运用本发明对大规模手机轨迹进行分析,可以将居民的家庭住址和其所参加的社会事件联系起来。研究表明二者有密切的联系:相同类型的事件在其空间来源上有相似性。因此可以利用这些相似性来检测事件是否异常数据;还可以更有效实现交通规划及交通物流管理事件就必须清楚地了解的大规模的异常事件及其经济影响;也可以用发现的这种模式融入到城市管理和建设规划中去,为城市管理提供有效的服务。
附图说明
图1电话信号时间间隔统计曲线,图中,中位数(实线),第一个数(点划线),三位数(虚线)个体的电话信号时间间隔。
图2观众检测方法示意图。
图3部分聚类结果。(a)为棒球比赛,(b)为莎士比亚话剧演出。
图4核心技术流程图,(a)为聚类流程图(b)为事件预测流程图。
具体实施方式
本发明主要是利用手机数据来对社会中人群的流动进行分析,通过处理手机的计费数据得到手机用户的位置信息并把它们和平时发生的正常事件联系在一起进行分析,得到正常事件的类型与参与者的家庭住址有联系,通过这种联系来探测一个新的事件参与者的分布是不是符合正常事件的参与者分布,如果不符合该事件就可能是异常事件必须进一步关注。这个过程主要分为两个部分,分别是标准库建立过程和实时预测过程,这两个过程主要涉及到了数据描述、准备数据(预处理)和数据处理三个主要的步骤,下面对这两个过程进行详细说明。
1)标准库建立
(1)首先在以往的事件列表中选择大规模事件,这些事件必须符合一定的要求,下面详细叙述事件数据。对于事件选择,找到在研究时间段上最大的事件集合是很重要的,这个集合里的事件必须是满足一定要求的事件:
-参与人数应该满足一定的规模,以便有大量的可识别用户。
-在空间上对相邻事件是独立的。为了避免对结果解释的含糊不清,决定对于任意两个同时发生的大型事件的间隔最小是1千米。
-事件的场地应该是非常明确的区域。
-在时间上和该区域的任何事件是独立的(例如,不在一天发生)。对于一个正确的分析,确保统计的参与(不参与)这个事件的人尽量少地依靠其他事件,如果很大程度上依靠其他事件这样会导致错误的结果。
-至少持续2个小时。这个假设是为了剔除实际不是参与者的偶尔停留
这样规定的目的是减少不同事件之间的相互影响和准确确定事件附近的人是不是参与者。另外考虑的是从大量事件种类(表演艺术、体育赛事、家庭事件、音乐和室外电影)中选择事件。
(2)利用手机计费数据对符合标准的事件进行参与者的筛选,并进行参与者家庭住址的定位,之后就是对所有的事件进行计数统计(即统计某个事件中来自某个区域的参与者有多少人)来特征化这些事件,这样就得到标准库的数据集。下面对这个过程进行详细描述:
首先从电信运营商那里获得匿名手机计费数据。
其次是利用手机计费数据来获得用户的停止序列。为了推断用户的停止序列,首先特征化个体的呼叫行为和验证是否有足够的频率用足够好的时间分辨率来检测用户的移动行为,由经度、纬度组成的位置点pi和时间戳ti来特征化表征用户移动行为的每个个体位置测量点mi。将用户每使用一次手机视为发生一次用户事件,对于所搜集到的每个用户的手机信号,统计各个用户事件的间隔时间。
因为用户事件间隔时间可以跨越几十年,所以用每个用户事件分布的第一个四分位数、第三个四分位数和中位数来特征化这个分布。例如附图1显示的是某地区所有用户手机信号时间间隔的第一个四分位数、第三个四分位数和中位数的分布。这个中位数的算术平均是84分钟(这些中位数的几何平均是10.3分钟)。这对于探测位置的变化已经足够小了,用户停留时间低至1.5个小时(这个时间比社会事件的平均时间长度短)。
为了提取停止序列,首先从个体位置测量中提取轨迹。一个轨迹是一个用户按时间顺序访问过的位置序列,Traj={p1→p2→…→pn}。通过一个空间阈值ΔS对轨迹进行分割得到子轨迹,其中distan ce(pi,pi+1)>ΔS,i=1…n。这个分割的目的是消除两个记录点(pi,pi+1)之间比ΔS还大的空间间隔。如果这样一个间隔找到了,那么pi就会变成子轨迹的最后一个点,并且pi+1就变成新子轨迹的开始点。一旦探测到子轨迹,首先以恒定的时间Tc重新采样然后利用低通滤波器滤去数据中的噪音。
对每个子轨迹确定用户停止移动的时间和呼叫停止位置S。一个停止序列的提取需要两个参数:时间阈值Tth和空间阈值Sth。因此,一个单独的停止S会被视为一个虚拟的位置,而一个停止序列被一组连续的位置点特征化,即:p={ps,ps+1…,pm},其中
Figure GDA0000150982850000051
j≤m,max(distance(pi,pj))<Sth且tm-ts>Tth
下一步是根据这些序列来判别参与者,进一步确定参与者的家庭住址。判断一个用户是否参加事件,就要进行下面的检查
iv)用户在与事件相同的位置单元停留
v)停留时间至少和事件时间有70%的重叠
vi)家庭住址和事件位置是不同的
在附图2中说明了这种假设。考虑到不能以很高的频率检测用户位置所以不需要全部重叠;每个用户的家庭位置就可以被认为成在晚上最频繁的停留点。
然后利用停留和家庭地址信息能够推导出用户的移动并能探测出他们是否要参加一个事件。
最后就是对所有的事件进行计数统计的特征化,形成如表1的关系数据表,包括事件编号、邮编(以邮编划分用户所在的行政区域,这里用邮编来表征前面所述的位置单元)、参加事件的人数、事件类型几个字段。
表1训练、测试数据集
Figure GDA0000150982850000061
2)聚类分析
对上面步骤中特征化的事件进行聚类分析,找到分类的标准。聚类的任务就是根据特征向量之间的相似度找到对它们进行分类的标准。在做数据分析时对数据集用10倍交叉的方法来进行分析,即把数据集分成10份,每次用数据集的十分之一的数据来测试方法,使用剩余的数据来进行训练时。这样就会进行10次训练测试的分析。
对聚类来说,K-means方法是解决聚类问题的一种典型方法,简单、快速,但也有其自身的缺点。其中一个重大缺陷是聚类结果受初始类中心选择影响很大,选择不同的初始类中心,得到的聚类结果可能差别很大。如果类中心选择不合适的话,容易陷入局部最优,得到的聚类结果很不理想。为了得到提高收敛速度和更好的聚类结果,这里采用改进Leader方法来对K-means方法中初始化K个中心进行了改进(其中K=#事件类型),并与在事件的预测时使用均值和标准差形成混合聚类方法;对于初始化时阈值的设置采用首先计算出数据项之间的最大值,然后用最大值的均值来当作阈值。下面对本发明采用的混合聚类方法进行详细介绍。混合聚类方法的流程图见图6,具体过程如下:
输入:一个新事件数据。
输出:事件类型。
1)是否是已经训练过数据集,如果训练过数据集则转到第7步;否则进行下一步
2)在要训练的事件库中任意选择1个事件作为起始的class(即初始类中心,也可以称之为初始leader集)并进行下一步
3)计算每两个事件之间的距离,并选择最大距离和最小距离;令a=最大距离/K(#事件类型),b=最小距离/K(#事件类型);进行下一步
4)对事件库中的每个事件做如下操作
a)从当前的class中找到与该事件最近的class
b)如果该事件与最近class的距离小于a,进行下一步否则,将该事件作为一个新的class归属到Leader集中
c)该事件被划分到该class所属的类
5)从Leader集中选取包含事件个数最多的k个class,更新初始类中心。
6)重复以下操作,直到每个类的中心距离变化小于b
a)计算每个事件与各个类中心的距离,将其划分到最近的类
b)重新计算每个类的中心m和半径d和标准差c
7)计算新事件和每个类中心m的距离,从中选择一个最小的距离minD;如果minD小于(d+3c)则该事件的类型不是异常事件,否则该事件可能为异常事件
具体的方法描述如下:
首先准备测试数据集和训练数据集,详细设计见附图4。
训练数据集的方法如下:
输入:k,data[p][q]
(1)计算data[p]中每项之间的距离,选择出最大MAX和最小MIN,设a=MAX/K,b=MIN/K
(2)初始化Leader_Num[p-1],令Leader_Num[i]=0,i=0,1,2……,p-1;设Leader[p-1][q]
(3)任意选择i,令Leader[0]=data[i]
(4)For(int i=0;i<q;i++)
(5){从所有的data中找到与Leader[i]最近的data[j],距离为distance,if(distance<a)则Leader Num[i]++;else Leader[i+1]=data[j]}
(6)选择Leader_Num中最大的K项对应的Leader作为初始中心点,令c[0]=Leader[0],…c[k-1]=Leader[k-1]
(7)对于data[0],data[2]…,data[p]。计算分别对事件i比较,假定最小,就标记为j
(8)对于所有标记为j点,重新计算c[j][m]=(∑[data[i][m]/num(j)]即c[j]={所有标记为j的data[j]之和}/标记为j的个数;计算半径d[j],计算c[j]的标准差b[j]=∑(data[i]-c[j])2
(9)重复(2)(3),直到所有c[j]值的变化小于b,返回c[j],d[j]和b[j]
得到的数据集c[j]和b[j]就是聚类方法得到的分类标准。
3)有了上面得到的标准之后,就可以对新发生的事件进行预测,检测该新事件的事件类型,如果不是已近存在的事件类型那么该事件就有可能是异常事件。当一个事件快结束时从电信运营商那里及时得到这个时段的手机计费数据,并利用上面叙述的方法得到该事件的参与者人数并对该事件进行计数统计以此来对这个事件进行特征化。这样特征化的事件就成为了测试数据集。对测试数据集预测事件分类的方法如下:
输入:data[p][q],c[k][q];
(1)对于data[0],data[2]…,data[p]。计算
比较Distance[i][j],假定Distance[i][j]最小并且Distance[i][j]<d[j]+3*b[j],就标记为j;表示该事件被预测为j类;否则就被认为是异常事件。
运用本发明的方法,对一个近百万的手机位置跟踪记录的数据集进行分析,将居民的家庭住址和其所参加的社会事件联系起来建构居民的日常事件模式。这里给出了一个例子来如何使用本发明发现社会活动中存在异常事件。由于美国波士顿地区的手机计费数据可以在网上得到并且这些数据是整合过的不涉及到个人隐私问题,所以就利用技术方案中叙述的方法对该市的手机数据进行了实验说明了本发明在发现居民的地理分布和事件类型有一定的联系。
下面对关键步骤中涉及的数据和处理结果,进行简要的说明。在准备中手机数据得到该市的地域图见图3,由于位置的测量是根据信号事件产生的,例如当手机和蜂窝网络交流,所以产生的痕迹和定期采样差很远。此外,手机位置数据比6PS数据有较大的不确定范围,根据提供的基于内部和独立测试报告得知手机位置范围是从220米到320米。事件列表和事件位置信息见表2和图3。对手机数据聚类产生的结果见附图3。
表2部分事件信息列表
Figure GDA0000150982850000081
Figure GDA0000150982850000091
为了检测该方法的可行性对针对数据集的特性设计了8个模型对这个方法进行测试,测试结果见表3。
表3模型准确率
Figure GDA0000150982850000092
8个模型的简单描述如下:
(1)利用邮政编码对区域进行划分并且手机数据集中包括所有参加事件的用户,在事件数据集中只选择某个确定类型的事件
(2)利用邮政编码对区域进行划分并且手机数据集中包括所有参加事件的用户,随机选择任何类型的事件
(3)利用邮政编码对区域进行划分并且手机数据集中不包括本区域参加事件的用户,在事件数据集中只选择某个确定类型的事件
(4)利用邮政编码对区域进行划分并且手机数据集中不包括本区域参加事件的用户,随机选择任何类型的事件
(5)利用与事件之间的距离对区域进行划分并且手机数据集中包括所有参加事件的用户,在事件数据集中只选择某个确定类型的事件
(6)利用与事件之间的距离对区域进行划分并且手机数据集中包括所有参加事件的用户,随机选择任何类型的事件
(7)利用与事件之间的距离对区域进行划分并且手机数据集中不包括本区域参加事件的用户,在事件数据集中只选择某个确定类型的事件
(8)利用与事件之间的距离对区域进行划分并且手机数据集中不包括本区域参加事件的用户,随机选择任何类型的事件
下面对模型和结果做简单说明:前4个模型是以邮政编码对地域进行划分,后四个模型用家庭地址和事件之间的距离(把距离以2000米来离散化)来替换邮编来进行下一步分析。第一个模型在测试集上事件分类有一个惊人的结果89.36%的准确性。从聚类分析,看到大多数参与者来自事件的邮编区域,这表明,居住地离事件地点近的人们更容易被吸引。为了观察在不在附近居民的影响,建立了一个新的预测模型,这个模型只考虑在与事件地点不一样的人们。这个结果是59.57%,还能够指出相同事件类型的来源模式的复发性。
这样就可以根据一定的准确度来预测事件是否为异常事件,不过即使预测出来是异常事件也不能特别肯定就是一个突发事件,因为本发明有一定的准确率。此外如果把该方法应用到别的地区就的用当地的事件数据来训练别准,才能适应该地区的异常事件检测。

Claims (3)

1.一种利用手机数据发现城市活动中异常事件的方法,包括下列步骤:
(1)从某个区域的已知事件中选择符合下列标准的事件;
-参与人数应该满足所设定的规模;
-在空间上相对于相邻事件是独立的;
-事件的场地是明确区域;
-在时间上和该区域的任何事件是独立的;
-至少持续一段时间;
(2)利用手机计费数据对符合上述标准的事件进行参与者的筛选和参与者家庭住址的定位,之后对所有的事件进行计数统计来特征化这些事件,得到标准库的数据集,步骤如下:
1)从电信运营商那里获得匿名手机计费数据;
2)将用户每使用一次手机视为发生一次用户事件,对于所搜集到的每个用户的手机信号,统计各个用户事件的间隔时间,利用由经度、纬度组成的位置点pi和时间戳ti来特征化用户移动行为的个体位置测量数据mi
3)从个体位置测量数据中按照下列方法提取轨迹:
a.设一个轨迹是一个用户按时间顺序访问过的n个位置序列Traj={p1→p2→…→pn};
b.对轨迹进行分割得到子轨迹;
c.设定时间阈值Tth和空间阈值Sth,对每个子轨迹,确定用户停止移动的时间和呼叫停止位置点,用一组连续的呼叫停止位置点来表征用户的停止序列p={ps,ps+1…,pm},其中
Figure FDA0000150982840000011
j≤m,max(distan ce(pi,pj))<Sth且tm-ts>Tth,序列中的每个呼叫停止位置点称之为用户的停留点;
4)用户的家庭位置被认为成在晚上最频繁的停留点,据此推断用户的家庭住址;
5)根据下列判据,判断一个用户是否是事件的参与者
i)用户在与事件相同的位置单元停留
ii)停留时间至少和事件时间有70%的重叠
iii)家庭住址和事件位置单元是不同的
6)统计各个事件发生的位置单元、参加事件的人数、事件类型,对事件进行计数统计的特征化,建立标准库的数据集;
(3)设事件类型数为K,并设定对数据集进行聚类训练的初始类中心,对标准库的数据集里的未经训练的事件数据进行如下的聚类训练:
1)计算每两个事件之间的距离,并选择最大距离和最小距离;令a=最大距离/K,b=最小距离/K,进行下一步;
2)对数据集中的每个事件做如下操作:
a.从当前的初始类中心中找到与该事件最近的类中心;
b.如果该事件与最近类中心的距离小于a,则该事件被划分到该类,否则,将该事件作为一个新的类中心;
3)若类中心的个数大于K个,从各个类中心中选取包含事件个数最多的K个类中心作为初始类中心,否则,选取所有的类中心作为初始类中心;
4)重复以下操作,直到每个初始类中心m的距离变化小于b:
a.计算每个事件与各个初始类中心的距离,将其划分到最近的类;
b.重新计算每个类中心m、半径d和标准差c;
(4)对于发生在该区域里并符合步骤(1)列出的标准的待检测的新事件,采用步骤(2)的方法,对事件进行参与者的筛选和参与者家庭住址的定位,之后对待检测的新事件进行计数统计,得到新的事件数据,再按照步骤(3)的方法聚类训练,并计算待检测的新事件和每个类中心m的距离,从中选择一个最小的距离minD;如果minD小于(d+3c)则该事件的类型不是异常事件,否则判断该事件可能为异常事件。
2.根据权利要求1所述的利用手机数据发现城市活动中异常事件的方法,其特征在于,在对每个子轨迹,确定用户停止移动的时间和呼叫停止位置点之前,对于轨迹,先利用低通滤波器滤去由于手机计费数据噪音产生的子轨迹噪音。
3.根据权利要求1所述的利用手机数据发现城市活动中异常事件的方法,其特征在于,所述的位置单元即是根据邮编划定的行政区域。
CN2011101196167A 2011-05-10 2011-05-10 利用手机数据发现城市活动中异常事件的方法 Expired - Fee Related CN102184512B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011101196167A CN102184512B (zh) 2011-05-10 2011-05-10 利用手机数据发现城市活动中异常事件的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101196167A CN102184512B (zh) 2011-05-10 2011-05-10 利用手机数据发现城市活动中异常事件的方法

Publications (2)

Publication Number Publication Date
CN102184512A CN102184512A (zh) 2011-09-14
CN102184512B true CN102184512B (zh) 2012-11-28

Family

ID=44570683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101196167A Expired - Fee Related CN102184512B (zh) 2011-05-10 2011-05-10 利用手机数据发现城市活动中异常事件的方法

Country Status (1)

Country Link
CN (1) CN102184512B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496127A (zh) * 2011-12-05 2012-06-13 哈尔滨工业大学 对期货市场客户异常的识别方法
CN103186854A (zh) * 2011-12-28 2013-07-03 武汉元宝创意科技有限公司 一种基于手机话费数据挖掘的互联网捐款系统
US9817843B2 (en) * 2014-09-26 2017-11-14 Mcafee, Inc. Notification of human safety reputation of a place based on historical events, profile data, and dynamic factors
WO2016107647A1 (en) * 2014-12-30 2016-07-07 Telecom Italia S.P.A. Method and system for a real-time counting of a number of participants at a public happening
CN106815651A (zh) * 2015-11-27 2017-06-09 亿阳信通股份有限公司 一种社会公共事件风险预警方法及系统
CN106384120B (zh) * 2016-08-29 2019-08-23 深圳先进技术研究院 一种基于手机定位数据的居民活动模式挖掘方法及装置
CN109993181B (zh) * 2017-12-29 2021-08-06 中国移动通信集团山西有限公司 异常行为模式识别方法、装置、设备及介质
CN108804539B (zh) * 2018-05-08 2022-03-18 山西大学 一种时间与空间双视角下的轨迹异常检测方法
CN108763553B (zh) * 2018-06-01 2021-07-20 云南大学 基于密度的停留点识别方法
CN108960656A (zh) * 2018-07-12 2018-12-07 中国科学院地理科学与资源研究所 一种基于手机数据的城市人群疏散风险动态评价方法
CN108924748B (zh) * 2018-07-27 2021-01-19 公安部第一研究所 一种基于元胞自动机的无线室内定位方法
CN111222729B (zh) * 2018-11-23 2022-07-05 北京嘀嘀无限科技发展有限公司 服务类型确定方法、装置、电子设备和存储介质
CN112185579B (zh) * 2020-08-20 2022-09-20 同济大学 一种基于元胞自动机的新冠密切接触人员数据获取方法
CN112396090A (zh) * 2020-10-22 2021-02-23 国网浙江省电力有限公司杭州供电公司 用于电网业务大数据检测分析的聚类方法及装置
CN113421176B (zh) * 2021-07-16 2022-11-01 昆明学院 一种学生成绩分数中异常数据智能筛选方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101692309B (zh) * 2009-09-04 2011-04-27 北京工业大学 基于手机信息的交通出行计算方法
CN102360378A (zh) * 2011-10-10 2012-02-22 南京大学 一种时序数据离群点检测方法

Also Published As

Publication number Publication date
CN102184512A (zh) 2011-09-14

Similar Documents

Publication Publication Date Title
CN102184512B (zh) 利用手机数据发现城市活动中异常事件的方法
Trasarti et al. Mining mobility user profiles for car pooling
Bachir et al. Inferring dynamic origin-destination flows by transport mode using mobile phone data
Zhang et al. Understanding taxi service strategies from taxi GPS traces
Wang et al. PGT: Measuring mobility relationship using personal, global and temporal factors
Caceres et al. Traffic flow estimation models using cellular phone data
CN102982596B (zh) 人流量的统计方法及装置
Zhang et al. Daily OD matrix estimation using cellular probe data
Furletti et al. Identifying users profiles from mobile calls habits
Ma et al. Deriving operational origin-destination matrices from large scale mobile phone data
CN106792523B (zh) 一种基于大规模WiFi活动轨迹的异常行为检测方法
Holleczek et al. Detecting weak public transport connections from cellphone and public transport data
Bakker et al. Measuring fine-grained multidimensional integration using mobile phone metadata: the case of Syrian refugees in Turkey
CN109615572A (zh) 基于大数据的人员亲密度分析的方法及系统
Wirz et al. Towards an online detection of pedestrian flocks in urban canyons by smoothed spatio-temporal clustering of GPS trajectories
CN108023768A (zh) 网络事件链确立方法和网络事件链确立系统
EP2875623A1 (en) Method and system for traffic estimation
CN107341693A (zh) 旅游用户筛选的方法和旅游用户筛选的系统
CN106332052A (zh) 基于移动通信终端的微区域治安预警方法
Chen et al. Sensing the pulse of urban activity centers leveraging bike sharing open data
Saldivar-Carranza et al. Identifying Vehicle Turning Movements at Intersections from Trajectory Data
Doorley et al. Mobility and COVID-19 in Andorra: Country-scale analysis of high-resolution mobility patterns and infection spread
Yang et al. An extended node-place model for comparative studies of transit-oriented development
CN105426414A (zh) 一种基于地理围栏的用户搜索匹配方法及装置
Zhang et al. Understanding the roles of rail stations: Insights from network approaches in the London metropolitan area

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20110914

Assignee: Tianjin University Urban Planning & Design Research Institute

Assignor: Tianjin University

Contract record no.: 2013120000016

Denomination of invention: Method for discovering abnormal events among city activities by using mobile phone data

Granted publication date: 20121128

License type: Exclusive License

Record date: 20130319

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121128

Termination date: 20210510

CF01 Termination of patent right due to non-payment of annual fee