CN108304510B - 公共地图服务用户城市访问行为与poi类型关联规则的提取方法 - Google Patents

公共地图服务用户城市访问行为与poi类型关联规则的提取方法 Download PDF

Info

Publication number
CN108304510B
CN108304510B CN201810055033.4A CN201810055033A CN108304510B CN 108304510 B CN108304510 B CN 108304510B CN 201810055033 A CN201810055033 A CN 201810055033A CN 108304510 B CN108304510 B CN 108304510B
Authority
CN
China
Prior art keywords
access
user
arrival rate
mode
poi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810055033.4A
Other languages
English (en)
Other versions
CN108304510A (zh
Inventor
李锐
周振
王璟琦
董广胜
吴华意
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201810055033.4A priority Critical patent/CN108304510B/zh
Publication of CN108304510A publication Critical patent/CN108304510A/zh
Application granted granted Critical
Publication of CN108304510B publication Critical patent/CN108304510B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种公共地图服务用户城市访问行为与POI类型关联规则的提取方法,包括采集公共地图服务长期运行中产生的访问日志,构建群体用户访问到达率时间序列,提取用户访问长期模式;进行时间序列最优分割,得到用户访问短期模式;获取用户访问行为的空间特征做空间分析;利用POI描述城市空间结构,将公共地图服务用户的访问行为映射到POI,取各POI类型与用户访问模式的关联规则表。本发明挖掘公共地图服务的海量日志数据,提取长时间粒度和短时间粒度用户访问模式及与城市结构的相关性,定量获取城市POI类型与用户访问模式间的关联规则,有助于深刻理解人类行为与城市内在结构间的关联,为城市资源配置、规划管理提供决策支持。

Description

公共地图服务用户城市访问行为与POI类型关联规则的提取 方法
技术领域
本发明涉及网络空间信息服务技术领域,尤其涉及一种公共地图服务用户城市访问行为与POI(Point of Interest,兴趣点)类型关联规则的提取方法。
背景技术
着日益重要的作用,而对于公共地图服务用户的访问行为的获取将有助于理解用户时空行为与城市之间的相互关系。这些用户访问数据中所隐藏的丰富知识远远没有得到充分的发掘和利用。当前的城市问题主要就是人与城市的问题,这些海量的用户对城市的访问数为我们深入了解人与城市的相互关系,分析城市问题症结所在提供了数据基础。因此,如何从海量的人与城市交互数据当中提取有用信息成为了亟待解决的难题。
为了提高公共地图服务平台的性能体验以及更充分的利用它,许多国内外的学者对公共地图服务平台的用户访问模式进行了多方面的分析研究,主要为3方面。
公共地图服务用户行为时空规律研究。D Fisher et al.通过对用户对WebGIS访问请求的热点分析,探究用户的地理意图。Cibulka D.et al.用户访问数据对Web地图服务从X,Y,Scale三个角度测试其服务性能。Quinn,S.et al.根据用户对Web地图瓦片的请求数据挖掘用户请求规律,提出了一种用户对瓦片访问的预测模型。公共地图服务用户行为模型研究。Vinícius G.Braga et al.通过收集真实的用户访问浏览谷歌地图操作数据,建立了一个Web Map用户的描述模型,利用该模型他配置了一个考虑用户思考时间的网络请求负载发生器,以此来对地图服务进行更加真实的评估,结果表明增加了真实用户特征之后可以显著的改变服务器的负载。用户行为与城市空间结构的关联研究。Bateira以核密度估计与网络核密度估计方法,对欧式空间和道路网络空间下的城市POI设施分布特征进行实验分析,探讨其分布规律,并以可视化形式展示POI的分布热点、密度、趋势等分布特征,从宏观上获取城市基础设施的分布规律。陈佳等利用手机定位数据以及POI数据和房价信息挖掘用户的个体特征。
综合三方面的研究现状来看,当前学者在公共地图服务用户行为时空规律研究方面,主要是通过对用户访问数据的时空模式进行挖掘,从而达到对用户访问行为的监测以及预测,进而提出服务器段的一些优化方法。他们的研究过程更注重系统效率以及能耗层面,而对于数据中所隐含的空间层面的信息却没有充分挖掘。而对于用户行为与城市空间结构的研究方面,目前主要利用手机定位数据来进行研究,而手机定位数据通过向用户手机提出位置申请类似“用户签到”来获取用户即时位置,获取及更新频率较慢;公共地图服务用户访问数据是用户使用地图服务时后台产生,数据中包含用户访问位置等大量信息,因此可以利用公共地图服务用户访问数据进行用户行为与城市空间结构的研究方面的研究。
因此,本发明利用公共地图访问日志数据海量的特征,结合城市空间结构数据(POI),定量获取用户城市访问的、行为模式与城市空间结构的相互关系。
发明内容
本发明将针对公共地图服务数据空间层面信息利用欠缺的问题,提供一种公共地图服务用户城市访问行为与POI(Point of Interest,兴趣点)类型关联规则的提取方法。利用公共地图访问日志数据海量的特征,结合城市空间结构数据(POI),获取用户城市访问的、行为模式与城市空间结构的相互关系。
为解决上述技术问题,本发明采用如下的技术方案为一种公共地图服务用户城市访问行为与POI类型关联规则的提取方法,包括以下步骤:
S1、采集公共地图服务长期运行中产生的访问日志,利用时间序列模式挖掘的方法构建群体用户访问到达率时间序列,提取用户访问长期模式,包括工作日模式和节假日模式;
分别对工作日和节假日访问量时间序列进行时间序列最优分割,得到用户访问短期模式;
S2、结合时间变化获取用户访问行为的空间特征,对用户访问点做空间分析,提取并形成用户访问点的分布,并做进一步热点分析获得用户城市访问热点分布;
S3、利用POI描述城市空间结构,进而将公共地图服务用户的访问行为映射到POI,取各POI类型与用户访问模式的关联规则表,定量获取城市空间结构与用户访问行为时空模式的之间的关系。
而且,步骤S1中,提取用户访问的长期模式的实现方式为,
定义用户的访问达到率时序为时间序列S(λ,t)={λ(t1),λ(t2)…λ(ti)…λ(tn)},其中λ和t分别是用户到达时间序列S(λ,t)的用户到达率因子和时间因子,λ(ti)表示时间段ti内到达的用户请求数,n表示时间段的总数,用户到达率即公共地图服务平台服务器端单位时间内收到的地图服务请求;
为样本数据建立访问平均到达率λ(t)时序分析图,以小时为时间单位统计每一日的平均到达率变化图;根据以天为周期的用户到达率时序变化规律,将用户的访问行为长期模式分为工作日模式与节假日模式。
而且,步骤S1中,提取用户访问短期模式的实现方式为,
(1)建立用户访问率到达率矩阵,实现如下,
建立工作日24小时到达率时间序列
Figure BDA0001553504220000021
形成多个周期内访问到达率时间序列的平均到达率矩阵S(λ,t);其中i∈[1,24],dm表示第m天,λ(ti)表示dm天ti时间段内用户访问到达率构成的访问到达率向量;
基于Fisher最优分割算法对矩阵S(λ,t)进行最优分割,将值相似且相邻的行向量λ(ti),λ(ti+1)…λ(tj)聚为一类,形成k类用户访问短期模式,及各模式所在的时间区间集合{T1,T2,…Tk};
(2)计算用户访问到达率向量各访问模式的直径,实现如下,
设Fisher分割后访问到达率向量的访问模式G包含时序{λ(ti),λ(ti+1)…λ(tj)}(j>i),记为G={i,i+1,…,j},则访问模式G的向量均值
Figure BDA0001553504220000031
如下,
Figure BDA0001553504220000032
模式内访问到达率向量的直径为访问到达率向量集的离差平方和θ(i,j)如下,
Figure BDA0001553504220000033
其中,上标T表示转置;
(3)计算访问到达率向量分割损失函数,实现如下,
设M(n,k)为将有序的n个访问到达率向量被分割成k个访问模式的一种分类方法,M(n,k)损失函数为Λ[M(n,k)],
利用递推公式,求出K取不同值时,各分类方法的最小损失函数以及各模式之间分割点;
(4)采用非负斜率方式计算访问到达率向量分割的最优解。
而且,步骤S3中,城市空间结构与用户访问行为时空模式的之间的关系实现如下,
构建访问到达率样本矩阵,得到POI访问到达率矩阵X和日总到达率矩阵Y,计算相应样本数据协方差矩阵,计算非零特征值及特征向量,计算典型向量及相关系数,代入城市样本数据得到每一类POI与工作日模式的典型相关系数,进而得到POI类型与工作日模式关联规则表。
本发明产生的有益效果是:基于用户访问数据,利用时间序列模式挖掘方法得出用户访问行为具有长期模式:工作日模式和节假日模式,及长期模式下多个短期模式;以城市POI数据为切入点,利用POI来描述城市空间结构,进而将公共地图服务用户的访问行为映射到POI,对POI类型与用户访问模式做典型相关分析,提出用POI类型与用户访问模式的关联规则表来定量描述POI对长期和短期用户访问模式下用户访问的空间分布特征的影响。
1.本发明基于公共地图服务用户访问日志数据分析用户城市访问行为时空特征,利用时间序列模式挖掘的方法构建用户访问到达率时间序列,并出用户访问具有2种长期模式:工作日模式和节假日模式;在此基础上基于Fisher最优分割算法得出用户访问行为的短期模式。
2.本发明以空间分析的方法得出用户访问的空间分布与城市空间结构有潜在的关联;基于时空级联模式挖掘方法获得长期和短期时间模式下,用户访问的空间分布差异及城市的空间结构与用户访问行为的时空模式关联性。
3.本发明以城市POI数据为切入点,利用POI来描述城市空间结构,进而将公共地图服务用户的访问行为映射到POI,对POI类型与用户访问模式做典型相关分析,提出用POI类型与用户访问模式的关联规则表来定量描述在长期和短期用户访问模式下,POI对用户访问的空间分布特征的影响。
4.本发明得到了用户城市访问行为与城市空间结构的关系,发现了人们在城市生活当中的行为规律,并进行总结归纳以及验证,为城市建设管理以及减轻城市问题提供一定的决策依据。
附图说明
图1是本发明实施例的流程图。
具体实施方式
本发明技术方案可采用软件技术实现自动流程运行。下面结合附图和实施例对本发明技术方案进一步详细说明。
如图1所示,本发明实施例的公共地图服务用户城市访问行为与POI类型关联规则的提取方法,包括以下步骤:
S1、采集公共地图服务长期运行中产生的访问日志,利用时间序列模式挖掘的方法构建群体用户访问到达率时间序列,提取用户访问长期模式:工作日模式和节假日模式;
利用Fisher最优分割算法分别对工作日和节假日访问量时间序列进行时间序列最优分割,得到用户访问短期模式;
S2、结合时间变化获取用户访问行为的空间特征,对用户访问点做空间分析,提取并形成用户访问点的分布,并做进一步热点分析获得用户城市访问热点分布,城市空间结构在一定程度上影响用户对于城市地图访问行为的时空模式;
S3、利用POI来描述城市空间结构,进而将公共地图服务用户的访问行为映射到POI,利用典型相关分析算法,提取各POI类型与用户访问模式的关联规则表,定量得出城市空间结构与用户访问行为时空模式的之间的关系。
本发明的基本思想为:基于用户访问数据利用时间序列模式挖掘方法得出用户访问行为具有长期模式,再将长期模式细分成若干短期模式;通过时空关联分析得出不同访问模式下用户访问的空间分布特征不同,用户的访问行为模式受到城市空间结构的影响。以城市POI数据为切入点,利用POI来描述城市空间结构,进而将公共地图服务用户的访问行为映射到POI,对POI类型与用户访问模式做典型相关分析,提出用POI类型与用户访问模式的关联规则表来定量描述POI对不同用户访问模式下用户访问的空间分布特征的影响。
同以往对公共地图日志数据的挖掘方法相比,本发明的关键创造点是结合城市空间结构数据(POI),定量获取用户城市访问的、行为模式与城市空间结构的相互关系。
本发明实施例提出的一种公共地图服务用户城市访问行为与POI类型关联规则的提取方法,将此方法应用于某城市,具体步骤如下:
步骤1,用户访问时间模式特征的提取
进行时间序列模式挖掘首要关键是建立用户访问的时间序列,对于类似公共地图服务的网络系统,群体用户访问行为具有一定的长期模式或短期模式,即在不同的时间区间,用户到达率λ的值是变化的。到达率可以有效的反应出不同的时间模式,而在不同时间尺度下,用户的访问在时序上呈现非均质特征,从时间序列的角度分析,若将一个周期的时间分为若干等长时段,每个时段的请求数可以构成一个时间序列,如公式(1):
S(λ,t)={λ(t1),λ(t2)…λ(ti)…λ(tn)} (1)
其中λ和t分别是用户到达时间序列S(λ,t)到达率因子和时间因子,λ(ti)表示ti时间段内到达的用户请求数,n表示时间段的总数。用户到达率即公共地图服务平台服务器端单位时间内收到的地图服务请求。
1)长期模式的提取
为样本数据建立访问平均到达率λ(t)时序分析图。统计样本数据后得到上海2014年2月份28天每一日的平均到达率变化图。公共地图服务平台每天的用户到达率时序变化规律相似,且以天为周期单位。在这种周期分类上,用户工作日的访问行为模式与节假日不同,体现在白日时间的高峰期访问到达率明显不同。因此,可将用户的访问行为分为“工作日模式”与“节假日模式”长期模式。
为精确描述用户在工作日与节假日的这种日间访问模式的差异,本发明提出利用Fisher最优分割算法分别对工作日和节假日访问量时间序列进行时间序列最优分割,得到各自的时间序列模式。
2)短期模式的提取:到达率序列Fisher最优分割
Fisher最优分割算法经常用于对一些有序的样本数据进行线性分割,而时间序列以时间顺序排列,因此对用户访问到达率时间序列用Fisher最优分割算法进行线性分割可以有效且精确的得到用户的日间访问模式。以下是进行到达率时间序列的最优分割步骤:
(1)建立用户访问到到达率矩阵
例如,以2月份所有工作日的24小时到达率时间序列建立多到达率因子时间序列
Figure BDA0001553504220000051
如公式(2)所示,这里到达率因子λ不是单指标的访问到达率,而是同一时间因子t下的访问到达率向量。这里dm表示第m天。λ(ti)表示dm天ti时间段内用户访问到达率构成的访问到达率向量。
Figure BDA0001553504220000067
将公式(2)展开形成多个周期内访问到达率时间序列的平均到达率矩阵,如公式(3):
Figure BDA0001553504220000061
其中λ(tndm)表示dm天tn时间段内用户访问到达率构成的访问到达率向量。
基于Fisher最优分割算法对矩阵S(λ,t)进行最优分割,将值相似且相邻的行向量(访问到达率向量)λ(ti),λ(ti+1)…λ(tj)聚为一类,形成k类用户访问短期模式,及各模式所在的时间区间集合{T1,T2,…Tk}。
(2)计算用户访问到达率向量各访问模式的直径
设分割后访问到达率向量的某一访问模式包含时序{λ(ti),λ(ti+1)…λ(tj)}(j>i),记为G={i,i+1,…,j}。则该访问模式的向量均值
Figure BDA0001553504220000062
如公式(4):
Figure BDA0001553504220000063
设模式内访问到达率向量的直径为访问到达率向量集的离差平方和θ(i,j),如公式(5):
Figure BDA0001553504220000064
其中,上标T表示转置。
(3)计算访问到达率向量分割损失函数
设M(n,k)为将有序的n个访问到达率向量被分割成k个访问模式的一种分类方法,则M(n,k)可表达为公式(6):
Figure BDA0001553504220000065
其中分点为1=i1<i2<…<ik<n=ik+1-1,(ik+1=n+1),设M(n,k)损失函数为Λ[M(n,k)],表达为公式(7):
Figure BDA0001553504220000066
当n,k固定时,Λ[M(n,k)]越小即为各类模式的离差平方和越小,则模式的分类是合理的。因此在此寻找一种合适的分类方法Mb(n,k),使其损失函数Λ[Mb(n,k)]达最小。
利用递推公式(8)求出k取不同值时,各分类方法的最小损失函数以及各模式之间分割点:
Figure BDA0001553504220000071
其中Mb(n,2)表示将n个访问到达率向量分割为2个访问模式的分类方法,其损失函数为Λ[Mb(n,2)]。Mb(l-1,k-1)表示将l-1个访问到达率向量分割为k-1个访问模式的分类方法,其损失函数为Λ[Mb(l-1,k-1)]
(4)计算访问到达率向量分割的最优解
若访问到达率向量分割次数k(1<k<n)已知,求使损失函数值最小的分割方法Mb(n,k),首先寻求分割点lk,使其满足公式(9):
Λ[Mn(n,k)]=Λ[Mb(lk-1,k-1)]+θ(lk,n) (9)
计算得到第k类访问模式Gk={ik,ik+1,…,n}。
然后寻求lk-1,使它满足公式(10),得到第k-1类访问模式Gk-1={ik-1,ik-1+1,…,lk-1}。
Λ[Mb(lk-1,k-1)]=Λ[Mb(lk-1-1,l-2)]+θ(lk-1,lk-1) (10)
根据递推公式(9)可以得到所有类G1,G2,…Gk,则所求的最优分割方法为公式(12)
P(n,k)={G1,G2,…Gk} (11)
如此以来计算得出在k次分割下,各个模式中时间序列的分割点{l1,l2,…lk}。
k值的确定依据Fisher原理:在Fisher最优分割过程中,最小损失函数值Λ随分割数k的增加而减少。而当分割数增加到某一数值后,最小损失函数值曲线将急剧变缓,达到一定的平衡,此时的k值为最佳分割值。本发明优选基于非负斜率方法确定k值,如式(12)所示:
Figure BDA0001553504220000072
当ε(k)较大时,表示分k类优于分k-1类;当ε(k)接近于0时,此时k为合适的取值。由观察最小损失函数值的变化与式(12)可计算出最佳分割取值kworkay,在最优分割方法下公共地图服务用户在工作日对城市访问行为时间模式进行划分,将工作日的用户访问行为进一步细分为kworkay种模式,在各个模式下,访问到达率相对平稳。用相同的方法可以得出用户在节假日对某城市访问行为时间模式,将节假日的用户访问行为进一步细分为kholiday种模式。
步骤2,用户访问空间特征的提取
将用户访问请求中的位置点提取出来,转换为经纬度,可以得到用户访问点的分布。对用户的访问点做热点分析,对访问点集进行空间聚类。将大量的重合点以及短距离内的大量点进行整合收集,创建新的点集要素并添加所关联的事件点计数属性,然后对新产生的点集要素根据计数属性进行可视化,最终得到事件点的热点。
以某城市为例,对不同时间模式下用户访问点做热点分析得到访问点数量多与访问点较少的访问聚集区。
对不同时间模式下用户访问点做S31和S32步骤的空间分析,得到长期和短期模式下用户访问热点分布。
步骤3,建立城市用户访问模式与POI类型关联规则
1)利用城市POI建立城市空间结构
POI数据可以分为许多大类,例如天地图将POI分为交通设施、文化教育、政府机构、旅游景点等16个大类,每一类POI可以代表该类城市功能区的组成部分。对这些POI数据进行统计,可以得到各城市每一种类型POI所占的比例,该比例可描述城市结构。
2)构建城市用户访问模式与POI类型关联规则表
可以对每一种访问模式分别执行以下操作形成一个访问模式与POI类型关联规则表。
定义用户访问模式为P,用
Figure BDA0001553504220000081
表示用户访问模式P下城市c中类别为q的POI的用户访问到达率向量。设c市q类POI的日访问到达率向量为Xcq,日总访问到达率向量为Yc,则,Xcq=(x1,x2,…,xd)T,Yc=(y1,y2,…,yd)T,其中d表示P模式中的第d天,xd表示d天的c市q类POI的用户访问到达率,yd表示d天的总用户访问到达率。对q类POI与P模式之间的相关性进行分析,即对到达率向量Xcq与日总访问到达率向量Yc进行典型相关分析。
本发明实施例以北京、上海、武汉、广州用户访问数据进行综合分析,因此需建立对应的城市POI类型访问到达率矩阵X和日总访问到达率矩阵Y,其中X=(X1,X2,…,Xc)T,Y=(Y1,Y2,…,Yc)T,c=4,即对四座城市数据进行分析。则Xc=(Xc1,Xc2,…,Xcq)T,对WTP模式(工作日模式)下q类POI做典型相关分析步骤如下:
(1)构建访问到达率样本矩阵
用X,Y代表POI访问到达率矩阵和日总到达率矩阵:
Figure BDA0001553504220000082
(2)计算样本数据协方差矩阵
在实际中,协方差矩阵sxx,sxy,syy,syx一般是未知的,可根据样本来进行估计,其中:
Figure BDA0001553504220000091
其中Rn和Cn为矩阵X和Y的行号和列号,xRnCn对应POI访问到达率矩阵中第Rn行第Cn列的元素,
Figure BDA0001553504220000092
为Cn城市下POI访问到达率样本均值,yRnCn为日总达到率矩阵中第Rn行第Cn列的元素,
Figure BDA0001553504220000093
为Cn城市下日总到达率样本均值。
(3)计算非零特征值及特征向量
依据典型相关分析基本定义,其实典型相关问题可以归结为一个约束优化问题,表述如下:目标函数:maxρ(u,v)=aTsxyb,即求解POI访问到达率矩阵和日总到达率矩阵典型相关系数,使相关系数ρ最大。约束条件为:
Figure BDA0001553504220000094
其中,u和v是X和Y的线性组合,线性组合的系数分别为a和b,设a=(ai1,ai2,…,air)T,b=(bj1,bj2,…,bjs)T,其中r为协方差矩阵sxx行数,s为协方差矩阵syy的行数。不同i,j值的选取,决定了ρ(u,v)的不同取值。由下面的推导可以证明,式(15)就是典型相关的求解过程。其推倒过程描述如下。
为求解这个问题,需引入拉格朗日乘数η1/2,η2/2,构造如下目标函数:
Figure BDA0001553504220000095
对a,b求偏导得:
Figure BDA0001553504220000096
将式(17)两方程分别左乘aT,bT,由式(15)知:
η1=η2=ρ(u,v)=η (18)
这说明η的意义为典型相关系数ρ(u,v),由式(17)和(18)得
Figure BDA0001553504220000097
将其代入式(17),用
Figure BDA0001553504220000101
左乘等式两边得
Figure BDA0001553504220000102
同理可得
Figure BDA0001553504220000103
记矩阵
Figure BDA0001553504220000104
为A,矩阵
Figure BDA0001553504220000105
为B。其中I为单位矩阵,η2既为A又为B的特征根,而a与b分别为A与B的特征根η对应的特征向量。并且A和B有相同的非零特征根,非零特征根的数目等于它们的秩。
(4)计算典型向量及相关系数
设A或B的非零特征根为
Figure BDA0001553504220000106
z为互异特征值的个数,其相应的特征向量为a1,a2,…,az与b1,b2,…,bz。记ηh=ρh为X和Y的第h个典型相关系数,(ah,bh)即为X和Y的第h对典型向量,从而可得X和Y的第h对典型变量为
Figure BDA0001553504220000107
其中h=1,2,…z。则工作日模式下q类POI访问到达率矩阵X和日总到达率矩阵Y的典型相关系数为max(ρh)。
代入某城市样本数据即可得到每一类POI与工作日模式的典型相关系数,进而得到POI类型与工作日模式关联规则表。
通过POI类型与用户访问模式关联规则表,可以定量的了解某一类POI与用户的某一种访问模式之间的相关性或关联程度,从POI类型的角度解释形成用户一种访问模式的内在因素,从而进一步说明城市空间结构是如何影响用户的行为模式。统计分析表明用户在工作日模式下访问的热点区域受典型相关系数较高的POI影响,访问集中在这些POI周围。
对不同访问模式下用户访问的热点区域中的POI数量进行统计,计算出各类POI处于热点区域中的比例,热点区域中POI类型所占比例基本与该类POI和所在访问模式的相关系数正相关,即某一访问模式下,POI类型相关系数越高,则该类型POI处于用户访问热点区域的比例越高。
本方法基于公共地图服务群体用户的访问行为具有一定的相似性与模式性,以时间序列模式挖掘和时空级联模式挖掘的手段,发现用户城市访问行为的时间模式以及空间特征,并通过不同城市的对比分析得出用户访问模式与城市本身的空间结构具有一定的相关性。利用POI类型组成描述城市空间结构,提取POI类型与用户访问模式关联规则来定量描述两者之间的相关性,并对关联规则的可靠性进行了验证。本发明方法对于公共地图服务用户城市访问行为的研究有助于深刻理解人类行为与城市内在结构间的关联,为城市资源配置、规划管理提供一定的决策支持。
具体实施时,可采用计算机软件技术实现以上流程的自动运行。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (3)

1.一种公共地图服务用户城市访问行为与POI类型关联规则的提取方法,其特征在于,包括以下步骤:
S1、采集公共地图服务长期运行中产生的访问日志,利用时间序列模式挖掘的方法构建群体用户访问到达率时间序列,提取用户访问长期模式,包括工作日模式和节假日模式;
分别对工作日和节假日访问量时间序列进行时间序列最优分割,得到用户访问短期模式;
S2、结合时间变化获取用户访问行为的空间特征,对用户访问点做空间分析,提取并形成用户访问点的分布,并做进一步热点分析获得用户城市访问热点分布;
S3、利用POI描述城市空间结构,进而将公共地图服务用户的访问行为映射到POI,取各POI类型与用户访问模式的关联规则表,定量获取城市空间结构与用户访问行为时空模式的之间的关系,实现方式包括以下处理,
构建访问到达率样本矩阵,得到POI访问到达率矩阵X和日总到达率矩阵Y,计算相应样本数据协方差矩阵,计算非零特征值及特征向量,计算典型向量及相关系数,代入城市样本数据得到每一类POI与工作日模式的典型相关系数,进而得到POI类型与工作日模式关联规则表。
2.根据权利要求1所述的公共地图服务用户城市访问行为与POI类型关联规则的提取方法,其特征在于:步骤S1中,提取用户访问的长期模式的实现方式为,
定义用户的访问达到率时序为时间序列S(λ,t)={λ(t1),λ(t2)…λ(ti)…λ(tn)},其中λ和t分别是用户到达时间序列S(λ,t)的用户到达率因子和时间因子,λ(ti)表示时间段ti内到达的用户请求数,n表示时间段的总数,用户到达率即公共地图服务平台服务器端单位时间内收到的地图服务请求;
为样本数据建立访问平均到达率λ(t)时序分析图,以小时为时间单位统计每一日的平均到达率变化图;根据以天为周期的用户到达率时序变化规律,将用户的访问行为长期模式分为工作日模式与节假日模式。
3.根据权利要求1所述的公共地图服务用户城市访问行为与POI类型关联规则的提取方法,其特征在于:步骤S1中,提取用户访问短期模式的实现方式为,
(1)建立用户访问率到达率矩阵,实现如下,
建立工作日24小时到达率时间序列
Figure FDA0002971005340000011
形成多个周期内访问到达率时间序列的平均到达率矩阵S(λ,t);其中i∈[1,24],dm表示第m天,λ(ti)表示dm天ti时间段内用户访问到达率构成的访问到达率向量;
基于Fisher最优分割算法对矩阵S(λ,t)进行最优分割,将值相似且相邻的行向量λ(ti),λ(ti+1)…λ(tj)聚为一类,形成k类用户访问短期模式,及各模式所在的时间区间集合{T1,T2,…Tk};
(2)计算用户访问到达率向量各访问模式的直径,实现如下,
设Fisher分割后访问到达率向量的访问模式G包含时序{λ(ti),λ(ti+1)…λ(tj)}(j>i),记为G={i,i+1,…,j},则访问模式G的向量均值
Figure FDA0002971005340000021
如下,
Figure FDA0002971005340000022
模式内访问到达率向量的直径为访问到达率向量集的离差平方和θ(i,j)如下,
Figure FDA0002971005340000023
其中,上标T表示转置;
(3)计算访问到达率向量分割损失函数,实现如下,
设M(n,k)为将有序的n个访问到达率向量被分割成k个访问模式的一种分类方法,M(n,k)损失函数为Λ[M(n,k)],
利用递推公式,求出K取不同值时,各分类方法的最小损失函数以及各模式之间分割点;
(4)采用非负斜率方式计算访问到达率向量分割的最优解。
CN201810055033.4A 2018-01-19 2018-01-19 公共地图服务用户城市访问行为与poi类型关联规则的提取方法 Active CN108304510B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810055033.4A CN108304510B (zh) 2018-01-19 2018-01-19 公共地图服务用户城市访问行为与poi类型关联规则的提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810055033.4A CN108304510B (zh) 2018-01-19 2018-01-19 公共地图服务用户城市访问行为与poi类型关联规则的提取方法

Publications (2)

Publication Number Publication Date
CN108304510A CN108304510A (zh) 2018-07-20
CN108304510B true CN108304510B (zh) 2021-04-16

Family

ID=62865857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810055033.4A Active CN108304510B (zh) 2018-01-19 2018-01-19 公共地图服务用户城市访问行为与poi类型关联规则的提取方法

Country Status (1)

Country Link
CN (1) CN108304510B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593349A (zh) * 2012-08-14 2014-02-19 中国科学院沈阳自动化研究所 感应网络环境下移动位置分析方法
CN106709606A (zh) * 2016-12-29 2017-05-24 平安科技(深圳)有限公司 个性化场景预测方法及装置
CN107562798A (zh) * 2017-08-02 2018-01-09 北京大学(天津滨海)新代信息技术研究院 一种基于用户的时间地理数据的实时信息推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102087985B1 (ko) * 2013-07-22 2020-03-11 삼성전자주식회사 장소를 추천하는 방법 및 그 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593349A (zh) * 2012-08-14 2014-02-19 中国科学院沈阳自动化研究所 感应网络环境下移动位置分析方法
CN106709606A (zh) * 2016-12-29 2017-05-24 平安科技(深圳)有限公司 个性化场景预测方法及装置
CN107562798A (zh) * 2017-08-02 2018-01-09 北京大学(天津滨海)新代信息技术研究院 一种基于用户的时间地理数据的实时信息推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
公共地图服务的群体用户访问行为;吴华意等;《武汉大学学报》;20151031;全文 *

Also Published As

Publication number Publication date
CN108304510A (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
Soh et al. Adaptive deep learning-based air quality prediction model using the most relevant spatial-temporal relations
CN109446186B (zh) 一种基于移动轨迹的社会关系判断方法
CN110324787B (zh) 一种手机信令数据的职住地获取方法
CN112182410B (zh) 基于时空轨迹知识图谱的用户出行模式挖掘方法
CN106931974B (zh) 基于移动终端gps定位数据记录计算个人通勤距离的方法
CN105307121B (zh) 一种信息处理方法及装置
CN107679558A (zh) 一种基于度量学习的用户轨迹相似性度量方法
Du et al. Sensor placement and measurement of wind for water quality studies in urban reservoirs
CN113077097A (zh) 一种基于深度时空相似性的空气质量预测方法
CN112419711B (zh) 基于改进gmdh算法的封闭式停车场停车需求预测方法
CN111242352A (zh) 基于车辆轨迹的停等聚集效应预测方法
CN116681176B (zh) 一种基于聚类和异构图神经网络的交通流预测方法
CN110580552A (zh) 一种普适的区域环境信息移动感知及预测方法
CN109543922B (zh) 用于有桩共享单车站点群的分时段借还量预测方法
CN106844626B (zh) 利用微博关键词和位置信息模拟空气质量的方法及系统
CN108304510B (zh) 公共地图服务用户城市访问行为与poi类型关联规则的提取方法
Zahraie et al. SST clustering for winter precipitation prediction in southeast of Iran: Comparison between modified K-means and genetic algorithm-based clustering methods
Yu et al. RePiDeM: A refined POI demand modeling based on multi-source data
Ma et al. Cellular Network Traffic Prediction Based on Correlation ConvLSTM and Self-Attention Network
CN111967677A (zh) 一种非常规资源甜点分布的预测方法及装置
Abboud et al. How opportunistic mobile monitoring can enhance air quality assessment?
CN117314198B (zh) 历史文化街区功能更新综合分析方法及系统
Zhu et al. SynMob: Creating High-Fidelity Synthetic GPS Trajectory Dataset for Urban Mobility Analysis
CN112749209B (zh) 面向时空数据的移动行为图谱构建方法
Cheng et al. Mobility prediction at points of interest using many-to-one recurrent neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant