CN112667760A - 一种用户出行活动轨迹编码方法 - Google Patents

一种用户出行活动轨迹编码方法 Download PDF

Info

Publication number
CN112667760A
CN112667760A CN202011551902.6A CN202011551902A CN112667760A CN 112667760 A CN112667760 A CN 112667760A CN 202011551902 A CN202011551902 A CN 202011551902A CN 112667760 A CN112667760 A CN 112667760A
Authority
CN
China
Prior art keywords
functional
area
travel
grid
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011551902.6A
Other languages
English (en)
Other versions
CN112667760B (zh
Inventor
吴爱枝
周轶
张鹏
诸彤宇
侯占杰
时德轶
张维
张慧
魏翔
凌鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Academy Of Safety Science And Technology
Beihang University
Original Assignee
Beijing Academy Of Safety Science And Technology
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Academy Of Safety Science And Technology, Beihang University filed Critical Beijing Academy Of Safety Science And Technology
Priority to CN202011551902.6A priority Critical patent/CN112667760B/zh
Publication of CN112667760A publication Critical patent/CN112667760A/zh
Application granted granted Critical
Publication of CN112667760B publication Critical patent/CN112667760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)

Abstract

本发明提供一种用户出行活动轨迹编码方法,根据时空聚类方法对用户每天的位置数据进行聚类,得到用户每天的多个停留点信息;分别对多个停留点信息进行第一次编码,得到各个停留点信息对应的停留点编码信息;根据停留点编码信息从多个停留点信息对应的停留点中筛选出长期停留点,对长期停留点进行第二次编码,得到用户出行特征编码;对位置数据对应的出行区域进行功能划分,得到功能区域划分结果;根据功能区域划分结果对各个用户出行特征编码进行第三次编码,得到用户最终的出行轨迹信息编码。本发明通过多次编码将划分的功能区域特征与用户出行特征编码相结合,最终得到用户的出行轨迹信息编码,能够对多元数据进行有效的融合。

Description

一种用户出行活动轨迹编码方法
技术领域
本发明主要涉及轨迹编码技术领域,具体涉及一种用户出行活动轨迹编码方法。
背景技术
随着城市化进程的不断加快,基础设施建设数量大幅升高,城市规模和形态不断扩大,大量流动人口涌入城市,对城市不同人群的出行分析需求变得十分突出。
通过采集人群出行数据,从人群出行数据中提取区域内人员的出行链,进一步分析不同人员的出行语义并找出具有同一类出行特征的目标人群,并了解目标人群的分布对城市规划、交通管理、安全预警具有很高的实用价值。
采用传统方法的人群出行数据采集(例如:常见的居民出行调查),调查数据种类众多,除了出行相关的数据外,还包含居民个体数据如户籍所在地、性别、年龄、职业、工作地等。在原来城市规模较小、流动人口并不多的情况下,这种调查数据或许可以得到很好的效果。但是随着城市不断的发展,流动人口的不断涌入,城市中不同职能的人群种类变得十分复杂,并且统计用户出行活动轨迹的工作高度依赖人工。而采用大数据技术采集的数据较为冗余,无法对多元数据进行有效的融合。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种用户出行活动轨迹编码方法。
本发明解决上述技术问题的技术方案如下:一种用户出行活动轨迹编码方法,包括如下步骤:
根据时空聚类方法对用户每天的位置数据进行聚类,得到用户每天的多个停留点信息;
分别对所述多个停留点信息进行第一次编码,得到各个停留点信息对应的停留点编码信息;
根据停留点编码信息从所述多个停留点信息对应的停留点中筛选出长期停留点,对所述长期停留点进行第二次编码,得到用户出行特征编码;
基于预设POI区域兴趣数据对所述位置数据对应的出行区域进行功能划分,得到所述出行区域对应的功能区域划分结果;
根据所述功能区域划分结果对各个所述用户出行特征编码进行第三次编码,得到用户最终的出行轨迹信息编码。
本发明解决上述技术问题的另一技术方案如下:一种用户出行活动轨迹编码装置,包括:
聚类模块,用于根据时空聚类方法对用户每天的位置数据进行聚类,得到用户每天的多个停留点信息;
编码模块,用于分别对所述多个停留点信息进行第一次编码,得到各个停留点信息对应的停留点编码信息,根据停留点编码信息从所述多个停留点信息对应的停留点中筛选出长期停留点,对所述长期停留点进行第二次编码,得到用户出行特征编码;
区域划分模块,用于基于预设POI区域兴趣数据对所述位置数据对应的出行区域进行功能划分,得到所述出行区域对应的功能区域划分结果;
编码模块,还用于根据所述功能区域划分结果对各个所述用户出行特征编码进行第三次编码,得到用户最终的出行轨迹信息编码。
本发明解决上述技术问题的另一技术方案如下:一种用户出行活动轨迹编码装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的用户出行活动轨迹编码方法。
本发明解决上述技术问题的另一技术方案如下:一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的用户出行活动轨迹编码方法。
本发明的有益效果是:基于时空聚类方法得到用户每天的停留点信息,并自动对停留点信息进行第一次编码和第二次编码,得到用户出行特征编码,并且基于预设POI区域兴趣数据对区域的进行功能划分,将划分的功能区域特征结合用户出行特征编码进行第三次编码,最终得到用户的出行轨迹信息编码,能够对多元数据进行有效的融合,得到较为准确的用户出行活动轨迹编码,便于更好地应用于人群出行轨迹分类。
附图说明
图1为本发明实施例提供的用户出行活动轨迹编码方法的流程示意图;
图2为本发明实施例提供的比值熵判定功能区和混合区的流程示意图;
图3为本发明实施例提供的用户出行活动轨迹编码方法的整体数据流图;
图4为本发明实施例提供的用户出行活动轨迹编码方法的功能模块示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种用户出行活动轨迹编码方法,包括如下步骤:
S101:根据时空聚类方法对用户每天的位置数据进行聚类,得到用户每天的多个停留点信息;
S102:分别对所述多个停留点信息进行第一次编码,得到各个停留点信息对应的停留点编码信息;
S103:根据停留点编码信息从所述多个停留点信息对应的停留点中筛选出长期停留点,对所述长期停留点进行第二次编码,得到用户出行特征编码;
S104:基于预设POI区域兴趣数据对所述位置数据对应的出行区域进行功能划分,得到所述出行区域对应的功能区域划分结果;
S105:根据所述功能区域划分结果对各个所述用户出行特征编码进行第三次编码,得到用户最终的出行轨迹信息编码。
其中,时空聚类方法的参数设置为时间阈值为30分钟(0.5h),空间阈值为:600米。根据现有的时空聚类方法得到用户每天的多个停留点信息。
上述实施例中,基于时空聚类方法得到用户每天的停留点信息,并自动对停留点信息进行第一次编码和第二次编码,得到用户出行特征编码,并且基于预设POI区域兴趣数据对区域的进行功能划分,将划分的功能区域特征结合用户出行特征编码进行第三次编码,最终得到用户的出行轨迹信息编码,能够对多元数据进行有效的融合,得到较为准确的用户出行活动轨迹编码,便于更好地应用于人群出行轨迹分类。
可选地,作为本发明的一个实施例,所述分别对所述多个停留点信息进行第一次编码,得到各个停留点信息对应的停留点编码信息的过程包括:
将第i个停留点信息记为sloti,i的取值为1、2、3……48;并根据预设编码频率和DN*48bit的编码规则对每天的sloti进行第一次编码,得到各个停留点信息对应的停留点编码信息,其中,DN表示每天的sloti个数,所述48bit为sloti对应的停留点编码信息的字节长度,所述停留点编码信息包括24bit的出行轨迹编码和24bit的区域特征编码,其中,所述出行轨迹编码包括15bit的所在区域网格编号、1bit的长期停留点标识和8bit的停留点与用户出行起始点Home的距离值,所述区域特征编码包括1bit的功能区标识、3bit的功能区判定结果和20bit的出行区域内用户数量。
具体地,预设编码频率为每半个小时编码一次,即0.5h编码一次。
上述实施例中,根据预设编码频率和DN*48bit的编码规则对当天的每个停留点信息进行第一次编码,得到停留点编码信息,便于后期更好地处理停留点编码信息。
可选地,作为本发明的一个实施例,所述根据停留点编码信息从所述多个停留点信息对应的停留点中筛选出长期停留点,对所述长期停留点进行第二次编码,得到用户出行特征编码的过程包括:
根据预设距离单位DisA和所述停留点编码信息对应的停留点与用户出行起始点Home的距离值筛选出长期停留点IsLSPA
根据所述停留点的经纬度信息(lngA,latA)建立与所在区域网格的映射关系,所述映射关系为:
Figure BDA0002857962200000051
其中,A为停留点,lngmin和latmin为修正参数;
根据所述预设距离单位DisA和所述映射关系对所述长期停留点IsLSPA进行第二次编码,编码公式为:
Travel(sloti)={GridA,DisA,IsLSPA},
其中,Travel(sloti)为用户出行特征编码,其中,{,}为将各个信息进行串联的符号。
上述实施例中,从停留点编码信息中的所在区域网格编号得到停留点的经纬度信息进行长期停留点的判断,得到含有长期停留点信息的用户出行特征编码,能够便于后期更好地与区域特征进行融合。
可选地,作为本发明的一个实施例,所述基于预设POI区域兴趣数据对所述位置数据对应的出行区域进行功能划分,得到所述出行区域对应的功能区域划分结果的过程包括:
根据预设网格划分值将所述出行区域进行网格划分,得到多个网格;
基于预设POI区域兴趣数据对所述多个网格进行功能划分,得到多个功能网格;
计算各个功能网格中POI数量N(x)占总体功能网格POI总数量的比例值P(x);
计算所述出行区域的附近区域功能网格中POI数量N’(x)占总体功能网格POI总数量的比例值P′(x),其中,所述附近区域功能网格为距离所述出行区域预设范围值内的网格;
计算所述出行区域中当前功能网格与附近区域内所有功能网格的概率比值,并对所述概率比值进行归一化处理,得到归一化值;
计算所述归一化值的熵值,根据所述熵值确定所述出行区域中当前功能网格的功能区判定信息;
对所有的功能网格对应的功能区判定信息进行评分,将评分最高的功能网格对应的功能区判定信息作为所述出行区域的功能区域判定结果。
上述实施例中,通过网格的形式对区域进行功能网格的划分,并对功能网格进行评分,将评分最高的作为区域的功能区域判定结果,能够确定区域的功能性质。
可选地,作为本发明的一个实施例,所述计算各个功能网格中POI数量N(x)占总体功能网格POI总数量的比例值P(x)的过程包括:
根据第一比例公式计算各个功能网格中POI数量N(x)占总体功能网格POI总数量的比例值P(x),所述第一比例公式为:
Figure BDA0002857962200000061
其中,Xi为功能网格,S为功能网格类型的集合,
Figure BDA0002857962200000071
为总体功能网格POI总数量。
具体地,S={住宅区(RA)、休闲体育区(LA)、风景区(SA)、....、教学区(TA)},即各个功能网格类型的集合。
具体地,在对功能区编码前,将POI类型映射为功能区类型:基于某地图POI类别(type)数据,根据自定义映射规则f,得到自定义POI功能类(feature)映射规则f定义如下:
f:type→feature。
一种映射关系示例如表一所示:
Figure BDA0002857962200000072
可选地,作为本发明的一个实施例,所述计算所述出行区域的附近区域功能网格中POI数量N’(x)占总体功能网格POI总数量的比例值P′(x)的过程包括:
根据第二比例公式计算所述区域的附近区域功能网格中POI数量N’(x)占总体功能网格POI总数量的比例值P′(x),所述第二比例公式为:
Figure BDA0002857962200000073
其中,Xi为功能网格,S为功能网格类型的集合,
Figure BDA0002857962200000081
为总体功能网格POI总数量。
具体地,将区域映射位置到功能网络(x,y),功能区类型z,并使N[x][y][z]=1。设周围1千米(KM)为附近区域功能网络。
上述实施例中,将功能网格划分为各个类型,并集合各个功能网格类型,能够便于判断用户长期出行的区域为何种类型的区域。
可选地,作为本发明的一个实施例,所述计算所述出行区域中当前功能网格与附近区域内所有功能网格的概率比值,并对所述概率比值进行归一化处理,得到归一化值的过程包括:
根据比值公式计算当前功能网格与附近区域功能网格的功能区概率的比值,所述比值公式为:
Figure BDA0002857962200000082
其中,E(x)为比值;
根据归一化公式对所述比值进行归一化处理,所述归一化公式为:
Figure BDA0002857962200000083
其中,T(x)为归一化值,S为功能网格类型的集合。
可选地,作为本发明的一个实施例,所述计算归一化值的熵值,根据所述熵值确定所述出行区域中当前功能网格的功能区判定信息的过程包括:
根据熵值计算公式计算所述归一化值的熵值,所述熵值计算公式为:
Figure BDA0002857962200000084
其中,H(p)为熵值,T(x)为归一化值;
设当前功能网格的熵值表示为H(A),阈值为ε,根据下式判定当前功能网格为混合区或功能区:
Figure BDA0002857962200000091
其中,R(A)为功能区判定信息。
上述实施例中,通过基于POI数据采用比值熵来区分功能区与混合区,采用加权传递得分的算法来对每个功能区进行分类。
图3为本发明实施例提供的比值熵判定功能区和混合区部分的流程示意图;
下面结合附图3具体介绍通过比值熵判定功能区和混合区的过程。
S301:开始;
S302:自定义映射f:将POI数据类型映射为功能区类型,初始化功能网格中POI数量N(x),附近网格N_ground、功能区统计频率P、当前区域比值熵H,功能区分类Result;
S303:输入POI数据;
S304:映射位置到网络(x,y),功能区类型z,并使N[x][y][z]=1;
S305:初始化变量i=0,变量j=0;
S306:统计网格(i,j)周围1千米(KM)的各类功能区频率(附近网格N_ground);
S307:计算网格(i,j)中各个功能区频率N,P=N/N_ground,即:根据第一比例公式计算各个功能网格中POI数量N(x)占总体功能网格POI总数量的比例值
Figure BDA0002857962200000092
并根据第二比例公式计算所述区域的附近区域功能网格中POI数量N’(x)占总体功能网格POI总数量的比例值
Figure BDA0002857962200000093
并计算当前功能网格与附近区域功能网格的功能区概率的比值,并对所述比值进行归一化处理,得到归一化值
Figure BDA0002857962200000094
S308:计算比值熵H;
S309:判断比值熵H是否大于阈值,若是,Result[i][j]=混合区,若否,根据P得到其中占比最大的功能区r;
S310:Result[i][j]=r;
S311:判断所有网格遍历是否完成,若否,(i,j)赋值为下一个网络,并返回SS6;若是,输出所有网格对应的功能分区;
S312:结束。
以上过程,对该区域里的各个网络进行功能区域判定,得到各个网格对应的功能分区结果。
可选地,作为本发明的一个实施例,所述对所有的功能网格对应的功能区判定信息进行评分,将评分最高的功能网格对应的功能区判定信息作为所述出行区域的功能区域判定结果的过程包括:
设出行区域为A,根据评分公式对所有的功能网格对应的功能区判定信息进行评分计算,所述评分公式为:
Fi(A)=numi(A)*factori+aroundResulti(A)*aroundFactori,i∈S,
其中,Fi(A)代表出行区域A的第i类功能区得分之和,numi(A)代表出行区域A内含有第i类功能区POI的数量,factori代表第i类功能区的权值因子,aroundResulti(A)代表出行区域A的附近区域第i类功能网格的得分之和,aroundFactori代表第i类功能区的传递影响因子;
根据评分判定公式计算各个功能网格对应的功能区评分占比SCi(A),所述评分判定公式为:
Figure BDA0002857962200000101
将分值最高的SCi(A)作为所述出行区域A的功能区域判定结果。
上述实施例中,根据分值最高的功能区评分确定功能区域判定结果,提高结果的准确性。
可选地,作为本发明的一个实施例,所述根据所述功能区域划分结果对各个所述用户出行特征编码进行第三次编码,得到用户最终的出行轨迹信息编码的过程包括:
根据所述功能区域划分结果对各个所述用户出行特征编码进行第三次编码,编码公式为:
Encode(sloti)={Travel(sloti),Area(sloti)}
={GridA,DisA,IsLSPA,R(A),RT(A),RN(A)},
其中,Travel(sloti)为用户出行特征编码,Area(sloti)为区域特征,Area(sloti)={R(A),RT(A),RN(A)},R(A)为混合区判定结果,RT(A)为功能区域判定结果,RN(A)为停留在出行区域内的用户数量,{,}为将各个信息进行串联的符号;
将各个所述用户出行特征编码得到的第三次编码进行集合,将Encode(user)作为用户最终的出行轨迹信息编码,所述出行轨迹信息编码为:Encode(user)={Encode(sloti)},sloti∈S,其中,S为功能网格类型的集合。
上述实施例中,综合出行特征和区域特征,即,将划分的功能区域特征结合用户出行特征编码进行第三次编码,最终得到用户的出行轨迹信息编码,能够对多元数据进行有效的融合。
应理解地,根据上述方法可针对所有采样编码时刻得到用户连续多天的行为活动轨迹编码。
图2为本发明实施例提供的用户出行活动轨迹编码方法的整体数据流图。
下面通过图2具体介绍整个轨迹编码过程:
S201:开始;
S202:输入用户某一天的轨迹数据和预设POI区域兴趣数据等多源位置数据;
S203:提取轨迹数据中用户的长期停留点集合LSP并标记:根据时空聚类方法进行用户每天的出行区域数据聚类,得到用户每天的多个停留点信息,根据编码规则分别对多个停留点信息进行第一次编码,得到各个停留点信息对应的停留点编码信息,分别根据各个停留点编码信息确定长期停留点,其中,时空聚类方法的参数设置为时间阈值为30分钟(0.5h),空间阈值为:600米;
S204:设置:初始化变量i=1;初始化编码time[i]全0;初始化每个编码采样时长为0.5h;
S205:记第i个停留点信息为sloti、对应的长期停留点IsLSPA和对应的区域A,根据长期停留点IsLSPA对用户出行特征进行第二次编码,按照预设编码频率,即每个长期停留点IsLSPA相隔0.5h,对其编码一次;
S206:生成出行特征Travel(sloti);
S207:计算区域A中当前功能网格与附近区域功能网格的功能区概率的比值,并对所述比值进行归一化处理,得到归一化值,计算归一化值的熵值H,根据熵值确定当前功能网格的功能区判定信息;
S208:判断H是否大于阈值ε,若是,判断其为混合区,若否,判断为其为最终的功能区;
S209:计算区域特征Area(sloti),Area(sloti)={R(A),RT(A),RN(A)};
S210:根据功能区域判定结果对用户出行特征编码进行第三次编码,得到所述功能区域网格最终的出行轨迹信息编码;
S211:判断变量i是否小于48,若是,则将变量i+1,并返回S5,进行进行下一轮编码,直至变量i等于48跳出循环;
S212:生成用户当天的出行轨迹编码:将各个所述用户出行特征编码得到的第三次编码进行集合,将集合S作为所述功能区域网格最终的出行轨迹信息编码,所述出行轨迹信息编码为Encode(user)={Encode(sloti)},sloti∈S;
S213:结束。
可选地,作为本发明的另一个实施例,如图4所示,一种用户出行活动轨迹编码装置,包括:
聚类模块,用于根据时空聚类方法对用户每天的位置数据进行聚类,得到用户每天的多个停留点信息;
编码模块,用于分别对所述多个停留点信息进行第一次编码,得到各个停留点信息对应的停留点编码信息,根据停留点编码信息从所述多个停留点信息对应的停留点中筛选出长期停留点,对所述长期停留点进行第二次编码,得到用户出行特征编码;
区域划分模块,用于基于预设POI区域兴趣数据对所述位置数据对应的出行区域进行功能划分,得到所述出行区域对应的功能区域划分结果;
编码模块,还用于根据所述功能区域划分结果对各个所述用户出行特征编码进行第三次编码,得到用户最终的出行轨迹信息编码。
可选地,作为本发明的另一个实施例,一种用户出行活动轨迹编码装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的用户出行活动轨迹编码方法。
可选地,作为本发明的另一个实施例,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的用户出行活动轨迹编码方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用户出行活动轨迹编码方法,其特征在于,包括如下步骤:
根据时空聚类方法对用户每天的位置数据进行聚类,得到用户每天的多个停留点信息;
分别对所述多个停留点信息进行第一次编码,得到各个停留点信息对应的停留点编码信息;
根据停留点编码信息从所述多个停留点信息对应的停留点中筛选出长期停留点,对所述长期停留点进行第二次编码,得到用户出行特征编码;
基于预设POI区域兴趣数据对所述位置数据对应的出行区域进行功能划分,得到所述出行区域对应的功能区域划分结果;
根据所述功能区域划分结果对各个所述用户出行特征编码进行第三次编码,得到用户最终的出行轨迹信息编码。
2.根据权利要求1所述的用户出行活动轨迹编码方法,其特征在于,所述分别对所述多个停留点信息进行第一次编码,得到各个停留点信息对应的停留点编码信息的过程包括:
将第i个停留点信息记为sloti,i的取值为1、2、3......48;并根据预设编码频率和DN*48bit的编码规则对每天的sloti进行第一次编码,得到各个停留点信息对应的停留点编码信息,其中,DN表示每天的sloti个数,所述48bit为sloti对应的停留点编码信息的字节长度,所述停留点编码信息包括24bit的出行轨迹编码和24bit的区域特征编码,其中,所述出行轨迹编码包括15bit的所在区域网格编号、1bit的长期停留点标识和8bit的停留点与用户出行起始点Home的距离值,所述区域特征编码包括1bit的功能区标识、3bit的功能区判定结果和20bit的出行区域内用户数量。
3.根据权利要求2所述的用户出行活动轨迹编码方法,其特征在于,所述根据停留点编码信息从所述多个停留点信息对应的停留点中筛选出长期停留点,对所述长期停留点进行第二次编码,得到用户出行特征编码的过程包括:
根据预设距离单位DisA和所述停留点编码信息对应的停留点与用户出行起始点Home的距离值筛选出长期停留点IsLSPA
根据所述停留点的经纬度信息(lngA,latA)建立与所在区域网格的映射关系,所述映射关系为:
Figure FDA0002857962190000021
其中,A为停留点,lngmin和latmin为修正参数;
根据所述预设距离单位DisA和所述映射关系对所述长期停留点IsLSPA进行第二次编码,编码公式为:
Travel(sloti)={GridA,DisA,IsLSPA},
其中,Travel(sloti)为用户出行特征编码,其中,{,}为将各个信息进行串联的符号。
4.根据权利要求3所述的出行活动轨迹编码方法,其特征在于,所述基于预设POI区域兴趣数据对所述位置数据对应的出行区域进行功能划分,得到所述出行区域对应的功能区域划分结果的过程包括:
根据预设网格划分值将所述出行区域进行网格划分,得到多个网格;
基于预设POI区域兴趣数据对所述多个网格进行功能划分,得到多个功能网格;
计算各个功能网格中POI数量N(x)占总体功能网格POI总数量的比例值P(x);
计算所述出行区域的附近区域功能网格中POI数量N′(x)占总体功能网格POI总数量的比例值P′(x),其中,所述附近区域功能网格为距离所述出行区域预设范围值内的网格;
计算所述出行区域中当前功能网格与附近区域内所有功能网格的概率比值,并对所述概率比值进行归一化处理,得到归一化值;
计算所述归一化值的熵值,根据所述熵值确定所述出行区域中当前功能网格的功能区判定信息;
对所有的功能网格对应的功能区判定信息进行评分,将评分最高的功能网格对应的功能区判定信息作为所述出行区域的功能区域判定结果。
5.根据权利要求4所述的出行活动轨迹编码方法,其特征在于,所述计算各个功能网格中POI数量N(x)占总体功能网格POI总数量的比例值P(x)的过程包括:
根据第一比例公式计算各个功能网格中POI数量N(x)占总体功能网格POI总数量的比例值P(x),所述第一比例公式为:
Figure FDA0002857962190000031
其中,Xi为功能网格,S为功能网格类型的集合,
Figure FDA0002857962190000032
为总体功能网格POI总数量。
6.根据权利要求5所述的出行活动轨迹编码方法,其特征在于,所述计算所述出行区域的附近区域功能网格中POI数量N′(x)占总体功能网格POI总数量的比例值P′(x)的过程包括:
根据第二比例公式计算所述区域的附近区域功能网格中POI数量No(x)占总体功能网格POI总数量的比例值P′(x),所述第二比例公式为:
Figure FDA0002857962190000033
其中,Xi为功能网格,S为功能网格类型的集合,
Figure FDA0002857962190000034
为总体功能网格POI总数量。
7.根据权利要求6所述的出行活动轨迹编码方法,其特征在于,所述计算所述出行区域中当前功能网格与附近区域内所有功能网格的概率比值,并对所述概率比值进行归一化处理,得到归一化值的过程包括:
根据比值公式计算当前功能网格与附近区域功能网格的功能区概率的比值,所述比值公式为:
Figure FDA0002857962190000041
其中,E(x)为比值;
根据归一化公式对所述比值进行归一化处理,所述归一化公式为:
Figure FDA0002857962190000042
其中,T(x)为归一化值,S为功能网格类型的集合。
8.根据权利要求7所述的出行活动轨迹编码方法,其特征在于,所述计算归一化值的熵值,根据所述熵值确定所述出行区域中当前功能网格的功能区判定信息的过程包括:
根据熵值计算公式计算所述归一化值的熵值,所述熵值计算公式为:
Figure FDA0002857962190000043
其中,H(p)为熵值,T(x)为归一化值;
设当前功能网格的熵值表示为H(A),阈值为ε,根据下式判定当前功能网格为混合区或功能区:
Figure FDA0002857962190000044
其中,R(A)为功能区判定信息。
9.根据权利要求8所述的出行活动轨迹编码方法,其特征在于,所述对所有的功能网格对应的功能区判定信息进行评分,将评分最高的功能网格对应的功能区判定信息作为所述出行区域的功能区域判定结果的过程包括:
设出行区域为A,根据评分公式对所有的功能网格对应的功能区判定信息进行评分计算,所述评分公式为:
Fi(A)=numi(A)*factori+aroundResulti(A)*aroundFactori,i∈S,
其中,Fi(A)代表出行区域A的第i类功能区得分之和,numi(A)代表出行区域A内含有第i类功能区POI的数量,factori代表第i类功能区的权值因子,aroundResulti(A)代表出行区域A的附近区域第i类功能网格的得分之和,aroundFactori代表第i类功能区的传递影响因子;
根据评分判定公式计算各个功能网格对应的功能区评分占比SCi(A),所述评分判定公式为:
Figure FDA0002857962190000051
将分值最高的SCi(A)作为所述出行区域A的功能区域判定结果。
10.根据权利要求9所述的出行活动轨迹编码方法,其特征在于,所述根据所述功能区域划分结果对各个所述用户出行特征编码进行第三次编码,得到用户最终的出行轨迹信息编码的过程包括:
根据所述功能区域划分结果对各个所述用户出行特征编码进行第三次编码,编码公式为:
Encode(sloti)={Travel(sloti),Area(sloti)}
={GridA,DisA,IsLSPA,R(A),RT(A),RN(A)},
其中,Travel(sloti)为用户出行特征编码,Area(sloti)为区域特征,Area(sloti)={R(A),RT(A),RN(A)},R(A)为混合区判定结果,RT(A)为功能区域判定结果,RN(A)为停留在出行区域内的用户数量,{,}为将各个信息进行串联的符号;
将各个所述用户出行特征编码得到的第三次编码进行集合,将Encode(user)作为用户最终的出行轨迹信息编码,所述出行轨迹信息编码为:
Encode(user)={Encode(sloti)},sloti∈S,其中,S为功能网格类型的集合。
CN202011551902.6A 2020-12-24 2020-12-24 一种用户出行活动轨迹编码方法 Active CN112667760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011551902.6A CN112667760B (zh) 2020-12-24 2020-12-24 一种用户出行活动轨迹编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011551902.6A CN112667760B (zh) 2020-12-24 2020-12-24 一种用户出行活动轨迹编码方法

Publications (2)

Publication Number Publication Date
CN112667760A true CN112667760A (zh) 2021-04-16
CN112667760B CN112667760B (zh) 2022-03-29

Family

ID=75408391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011551902.6A Active CN112667760B (zh) 2020-12-24 2020-12-24 一种用户出行活动轨迹编码方法

Country Status (1)

Country Link
CN (1) CN112667760B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113556698A (zh) * 2021-07-21 2021-10-26 智慧足迹数据科技有限公司 基于手机信令的信息聚类方法、装置、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160116985A1 (en) * 2014-09-30 2016-04-28 Purdue Research Foundation Universal translator for recognizing nonstandard gestures
CN106709419A (zh) * 2016-11-18 2017-05-24 中山大学 一种基于显著轨迹空间信息的视频人体行为识别方法
CN107133269A (zh) * 2017-04-01 2017-09-05 中国人民解放军国防科学技术大学 基于移动目标的频繁位置轨迹生成方法及装置
CN109005515A (zh) * 2018-09-05 2018-12-14 武汉大学 一种基于移动轨迹信息的用户行为模式画像的方法
CN109523186A (zh) * 2018-11-28 2019-03-26 杭州中奥科技有限公司 城市区域划分方法及装置
CN110516708A (zh) * 2019-07-23 2019-11-29 江苏大学 一种基于轨迹与路网匹配的路径预测方法
CN110956188A (zh) * 2018-09-26 2020-04-03 北京融信数联科技有限公司 基于移动通信信令数据的人口行为轨迹数字化编码方法
CN111582948A (zh) * 2020-05-25 2020-08-25 北京航空航天大学 一种基于手机信令数据与poi兴趣点的个体行为分析方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160116985A1 (en) * 2014-09-30 2016-04-28 Purdue Research Foundation Universal translator for recognizing nonstandard gestures
CN106709419A (zh) * 2016-11-18 2017-05-24 中山大学 一种基于显著轨迹空间信息的视频人体行为识别方法
CN107133269A (zh) * 2017-04-01 2017-09-05 中国人民解放军国防科学技术大学 基于移动目标的频繁位置轨迹生成方法及装置
CN109005515A (zh) * 2018-09-05 2018-12-14 武汉大学 一种基于移动轨迹信息的用户行为模式画像的方法
CN110956188A (zh) * 2018-09-26 2020-04-03 北京融信数联科技有限公司 基于移动通信信令数据的人口行为轨迹数字化编码方法
CN109523186A (zh) * 2018-11-28 2019-03-26 杭州中奥科技有限公司 城市区域划分方法及装置
CN110516708A (zh) * 2019-07-23 2019-11-29 江苏大学 一种基于轨迹与路网匹配的路径预测方法
CN111582948A (zh) * 2020-05-25 2020-08-25 北京航空航天大学 一种基于手机信令数据与poi兴趣点的个体行为分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
乔少杰 等: ""一种基于空间编码技术的轨迹特征提取方法"", 《中国科学:信息科学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113556698A (zh) * 2021-07-21 2021-10-26 智慧足迹数据科技有限公司 基于手机信令的信息聚类方法、装置、设备及介质

Also Published As

Publication number Publication date
CN112667760B (zh) 2022-03-29

Similar Documents

Publication Publication Date Title
CN110929939B (zh) 一种基于聚类-信息量耦合模型下的滑坡灾害易发性空间预测方法
CN112035584A (zh) 空间规划情景模拟方法及系统
Guyot et al. The urban form of Brussels from the street perspective: The role of vegetation in the definition of the urban fabric
CN106408110A (zh) 一种旅游景点锁定的方法和系统
AIlard et al. Targeting crime prevention to reduce offending: Identifying communities that generate chronic and costly offenders
CN112667760B (zh) 一种用户出行活动轨迹编码方法
CN115809378A (zh) 一种基于手机信令数据的医疗短缺区识别及布局优化方法
CN112651546A (zh) 一种公交线路优化方法以及系统
CN116437291A (zh) 一种基于手机信令的文化圈规划方法和系统
CN116451931A (zh) 一种公共服务设施选址行政管理决策的数据处理方法
Wang et al. Influence of built environment on subway trip origin and destination: insights based on mobile positioning data
González‐Leonardo et al. Understanding population decline trajectories in Spain using sequence analysis
CN112836890A (zh) 一种预测火灾风险的方法、装置、设备及存储介质
Zhou et al. Big data for intrametropolitan human movement studies A case study of bus commuters based on smart card data
CN116975463A (zh) 出行目的预测方法、预测模型训练方法、设备及存储介质
Luo et al. Modeling urban growth with geographically weighted multinomial logistic regression
CN112668858B (zh) 一种确定区域内目标站点的方法、装置、设备及存储介质
Gomes et al. Measuring happyiness and wellbeing in smart cities
CN116756439B (zh) 选址方法、装置、服务器和计算机可读存储介质
Williams et al. Wider Factors affecting the long-term growth in Rail Travel
Harris 10 Population mapping by geodemographics and digital imagery
CN117493981B (zh) 游客分类方法、装置及电子设备
CN115809825B (zh) 一种学区划分评价方法、装置及介质
CN117893382B (zh) 基于多元特征融合的地质灾害风险评价方法及系统
Stoica et al. Perspectives for the Development of Sustainable Cultural Tourism. Sustainability 2022, 14, 5678

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 101101 building 4, courtyard 57, Yunhe East Street, Tongzhou District, Beijing

Applicant after: Beijing Academy of emergency management science and technology

Applicant after: Beihang University

Address before: 101101 building 4, courtyard 57, Yunhe East Street, Tongzhou District, Beijing

Applicant before: BEIJING ACADEMY OF SAFETY SCIENCE AND TECHNOLOGY

Applicant before: Beihang University

GR01 Patent grant
GR01 Patent grant