CN106446208B - 一种考虑路网契合度的智能手机出行方式识别方法 - Google Patents
一种考虑路网契合度的智能手机出行方式识别方法 Download PDFInfo
- Publication number
- CN106446208B CN106446208B CN201610873364.XA CN201610873364A CN106446208B CN 106446208 B CN106446208 B CN 106446208B CN 201610873364 A CN201610873364 A CN 201610873364A CN 106446208 B CN106446208 B CN 106446208B
- Authority
- CN
- China
- Prior art keywords
- decision tree
- attribute
- trip mode
- sample
- trip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 32
- 238000007637 random forest analysis Methods 0.000 claims abstract description 25
- 230000009471 action Effects 0.000 claims abstract description 10
- 238000003066 decision tree Methods 0.000 claims description 45
- 230000001133 acceleration Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 230000006399 behavior Effects 0.000 claims description 8
- 238000000926 separation method Methods 0.000 claims description 6
- 230000001351 cycling effect Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 3
- 241001269238 Data Species 0.000 claims description 2
- 230000001174 ascending effect Effects 0.000 claims description 2
- 239000012141 concentrate Substances 0.000 claims description 2
- 238000001514 detection method Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 238000005192 partition Methods 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 abstract description 7
- 238000004140 cleaning Methods 0.000 abstract description 2
- 230000007812 deficiency Effects 0.000 abstract description 2
- 238000007796 conventional method Methods 0.000 abstract 1
- 238000011835 investigation Methods 0.000 description 5
- 238000007405 data analysis Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 210000003484 anatomy Anatomy 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Remote Sensing (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Probability & Statistics with Applications (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种考虑路网契合度的智能手机出行方式识别方法,包括:首先,进行数据采集、清洗及行为轨迹属性的提炼;其次,构建与训练随机森林算法,并初步识别出行方式;再次,构建公交线网,对初步识别结果进行公交线路进行契合度匹配,判定轨迹片段的时空表现特征是否符合公交运营情况;最后,修正初步识别结果,并最终确定出行方式。本发明通过将公交线网匹配信息与随机森林算法相结合,弥补了传统方法中无法抵御交通环境干扰的不足,提升了出行方式识别的准确度。
Description
技术领域
本发明属于交通规划中出行行为数据采集与分析领域,涉及一种考虑路网契合度的智能手机出行方式识别方法。
背景技术
随着智能手机信息通讯技术的不断提高,全球定位系统(GPS)模块以及各类传感器已成为手机的标准配置,这为学者们应用智能手机记录居民日常行为轨迹、剖析个体活动出行特征,提供了较大的便利性与可操作性。但是,不同的行为个体在日常活动出行过程往往采取不同的出行策略,这就要求在数据处理环节中采取高效的出行方式识别方法,以便于精确地获得个体出行信息。
现有针对出行方式识别的方法主要通过分析个体出行轨迹的速度、加速度等特征,应用基于监督或非监督的机器学习算法(如支持向量机、神经网络、条件随机场等)来判断手机持有者的出行方式。由于在这些方法中用于学习的属性仅局限于行为轨迹的位移变化特征,因此在道路交通环境恶劣的条件下,无法有效识别并区分不同交通方式的出行特征,严重影响后续个体出行方式的预测与判定。
发明内容
技术问题:本发明提供了一种能够弥补道路交通环境恶劣情况下识别精准度的考虑路网契合度的智能手机出行方式识别方法。
技术方案:本发明的考虑路网契合度的智能手机出行方式识别方法,包括以下步骤:
步骤1、行为轨迹采集与预处理:
采集受访者的步行、自行车、公交、小汽车四种出行方式轨迹数据,将所述出行方式轨迹数据按照时空表现特征提取“链”片段;
步骤2、根据所述“链”片段中各轨迹点的时空表现特征作为学习属性,记为Aj,j∈1,2,...,n,其中n为对应属性的个数;
步骤3、应用随机抽样方法,选取所述行为方式轨迹数据中50%的样本量作为训练样本集,记为TrS,剩余50%的样本量作为预测样本集,记为TeS;
步骤4、确定随机森林中决策树的数量S,记训练集的总样本量为Q,从训练样本集TrS中可重复地随机选取Q个“链”片段作为决策树p的训练样本集,记为RFSp;
步骤5、针对决策树p的各个训练样本集RFSp生成决策树,即从“链”片段的学习属性中遴选适当属性完成各个决策树的生长过程,完成随机森林的构建与训练;
每个决策树的生长过程为:
步骤5-1、针对决策树p的各个训练样本集RFSp进行判定,如果训练样本RFSp中的所有轨迹片段均属于同一种出行方式,则将该决策树设置为单节点树,标记出行方式并结束该决策树的生长过程;否则,计算决策树p各个学习属性的信息增益比gR,选取信息增益比最大的m个属性建立该决策树的分裂属性表;
步骤5-2、从分裂属性表中选取信息增益比gR最大的属性作为决策树节点的分裂属性,将该属性从分裂属性表中剔除,并将训练样本中该属性对应的数值由小到大进行排列,得到{a1,a2,...,ae,...,aE}序列;以每个属性值作为训练样本集RFSp的样本分界点,计算各个样本分界点的加权平均熵,选取熵值最大的属性值作为该决策树节点确定的分界值,并将各个训练样本划分为小于或等于该分界值的样本子集和大于该分界值的样本子集,并构建两个子节点分别存储这两个样本子集;
步骤5-3,对所述子节点的样本构成进行判定,若子节点的样本均属于某一出行方式k,则将出行方式k作为该子节点的标记并进入步骤5-4;否则查询分裂属性表是否为空,如果不为空,则以该子节点的样本构成为基础,返回步骤5-2,如果分裂属性表为空,则进入步骤5-4;
步骤5-4,针对未标记子节点进行样本分析,选取训练样本中所占比例最大的出行方式作为该子节点的标记,并完成随机森林中各决策树的生长过程;
步骤6、应用所述随机森林对预测样本集TeS的各个轨迹片段进行预测,得到轨迹片段的初步判定,判定结果包括步行、自行车出行、公交出行、小汽车出行;
步骤7、构建公交路网,对判定为自行车出行、公交出行、小汽车出行的轨迹片段进行路网匹配分析,具体做法为:
步骤7-1、获取轨迹片段中各个行为轨迹点的分区编号,计算该分区中轨迹点与公交线路之间的路网契合度,将点线之间的直线距离,即路网契合度小于L米的公交线路记为该轨迹点的可能匹配线路集,记录其线段编号;
步骤7-2、根据所述步骤7-1记录的轨迹点的公交线路编号,遍历分析并确定出轨迹点唯一配对的公交线路;
步骤7-3、对存在匹配公交线路的轨迹片段进行分区,具体方式为:遍历每块分区中的各个公交站点,获取公交站点附近D米范围内的行为轨迹子片段;
步骤7-4、分析每个轨迹子片段在瞬时速度、瞬时加速度上的变化趋势:若随着轨迹靠近或远离公交站点,瞬时速度表现出由高到低或由低到高的变化趋势,并且在站点停靠时段前后,瞬时加速度的算术符号不同,则认为该轨迹子片段符合公交运营特征,否则认为该轨迹子片段不符合公交运营特征;
步骤7-5、对进行公交线网匹配的轨迹片段进行最终判定:若不存在能够与该轨迹子片段匹配的公交线路,则维持所述步骤6)的初步判定识别结果;若符合公交运营特征的轨迹子片段占受检测的轨迹子片段总数Y以上,则判定为该行为轨迹整体符合公交运营特征,为公交出行方式。
进一步的,本发明方法中,所述的步骤2中各轨迹点的时空表现特征为速度均值、速度方差、速度最大值以及加速度均值、加速度方差、加速度最大值六种,即n=6。
进一步的,本发明方法中,所述的步骤4中,随机森林中决策树的数量S为500。
进一步的,本发明方法中,所述步骤5-1中分裂属性表的属性个数m为学习属性总数的均方根取整,即m=2。
进一步的,本发明方法中,所述的步骤6中应用随机森林对样本集TeS的各个轨迹片段进行预测的过程为:选取样本集的某一片段TeSi作为预测对象,逐一对随机森林的每一颗决策树进行预测分析,即从决策树的根节点开始,根据轨迹样本在节点上的属性进行逐级归类,当归类次序达到决策树叶节点时,该叶节点的标记即为本决策树对该轨迹片段出行方式的投票结果;按照以上方式遍历随机森林中的各个决策树,得到P个决策树的出行方式投票结果,其中投票最多的出行方式即为随机森林对该轨迹片段的初步判定结果。
进一步的,本发明方法中,所述步骤7-1中路网契合度阈值L取值为30米。
进一步的,本发明方法中,所述步骤7-2的具体流程为:从轨迹片段Vi的首个轨迹点开始遍历检测,若该点及其后续4个轨迹点的可能匹配线路集中存在贯通的公交线段,则计算该公交线段与这五个轨迹点的总契合度,将其中总契合度最好公交线段确定为所匹配的公交线段,否则即不存在能够匹配的公交线路。
进一步的,本发明方法中,所述步骤7-3中公交站点附近范围D取值为50米。
进一步的,本发明方法中,所述步骤7-5中公交运营特征比例值Y取值为80%。
本发明的实施过程可以简述为:首先,通过训练样本集的时空表现特征对随机森林算法进行学习,得到算法中各参数的标定结果;其次,应用标定完毕的随机森林算法对预测样本集进行初步判定,并选取判定结果为自行车、小汽车、公交车方式的轨迹片段作为路网匹配对象;最后,遍历分析与确定各轨迹片段的公交线网匹配结果,将符合公交运营特征的轨迹识别结果修正为公交出行方式。
有益效果:与现有技术相比,本发明具有以下优点:
传统的出行方式识别方法计算过程较为繁杂,且无法解决交通环境对识别准确性的干扰。本发明针对现有技术的不足,通过计算轨迹点的公交线网契合度,将随机森林算法与基于公交路网的轨迹判定规则进行融合,使得新提出的识别方法不仅能够根据轨迹片段的时空特征较高效地完成出行方式的初步划分,并且能够在此基础上将轨迹点的速度、加速度变化趋势与公交运营过程相匹配,进一步实现对潜在已混淆轨迹片段的方式划分修正,增强了本方法对交通环境影响的抗干扰能力,更大程度地提升出行方式识别准确率。
附图说明
图1为本发明方法流程图。
具体实施方式
下面结合实施例和说明书附图,对本发明方法做进一步详细说明。
一、数据采集、清洗及分类
首先,针对本方法的测试需求,确定各类出行方式行为轨迹的调查样本数:根据已有研究成果,用于测试出行方式识别方法的样本量大小取决于研究区域内各类交通出行的速度离散程度,由下式计算得到:
式中,q为调查样本量;CV为速度的变异系数,即样本数据速度的标准差与平均值的比;Zα是指标准正态分布中,置信水平为α时的分位点,本方法使用Z0.90的分位点,相应的值为1.645,即速度变量只有10%在置信区间外;E为精度要求,即可接受的误差百分比,本方法取值为0.05;具体各出行方式调查样本量如表1所示。
表1各出行方式调查样本量计算结果
其次,根据步骤1所示,通过自主研发的《基于智能手机的出行模式采集软件TransGPS Collector V1.0》(软著登字第1027244号)获取各类出行方式的行为轨迹数据,数据属性包括:用户编号、日期时间、纬度、经度、模式、方向、精度、速度等;应用《一种考虑时序DBSCAN的智能手机轨迹链簇识别方法》(申请号:2015104 94163.4)进行数据清洗,清洗后所得到的“链”片段即为本方法的处理对象;
最后,根据步骤2与步骤3所示,计算并存储每个“链”片段的速度均值、速度方差、速度最大值以及加速度均值、加速度方差、加速度最大值;并随机选取其中50%的样本量作为本方法的训练样本集TrS,剩余的样本量作为本方法的预测样本集TeS。
二、构建并训练随机森林
根据步骤4所示,首先应用随机抽样构建随机森林中每颗决策树的训练样本集RFSp;其次,遍历每颗决策树,根据步骤5所示的训练规则,完成该决策树的生长过程,其中步骤5-1中所述的各个学习属性Aj的信息增益比gR为训练样本RFSp的信息增益g与经验熵H之比,根据下式计算:
g(RFSp|Aj)=H(RFSp)-H(RFSp|Aj) (4)
式(2)中RFCk为决策树p训练样本RFSp中某种出行方式k的样本子集,K为出行方式的个数,此处取值为4;
式(3)中RFSpn为训练样本RFSp被某属性Aj不同取值所划分而成的N个样本子集,RFSpnk为样本子集RFSpn中属于出行方式k的集合,即RFSpnk=RFSpn∩RFCk;
步骤5-2中所述的各学习属性Aj分界点的加权平均熵根据下式计算:
式(6)中ae为属性Aj的分界点,RFSaj≤ae为属性值小于等于ae的样本子集,RFSaj>ae为属性值大于ae的样本子集,RFSajk为属性值等于aj的样本中归属于出行方式k的个数;
三、识别并确定出行方式
根据步骤6所示,首先选取预测样本集的任一条数据记录TeSi迭代入随机森林中的各个决策树进行逐级判定,得到各个决策树的投票标记并分方式统计,标记数最多的出行方式即为该数据记录的初步识别结果;其次,遍历预测样本集的每一条数据记录,得到各条记录的方式识别初步识别结果并判定,如果初步识别结果为步行,则认为该数据记录所指向的轨迹片段最终识别结果为步行,否则将该轨迹片段纳入步骤7的判定对象;最后根据步骤7所示,对非步行的轨迹片段进行公交线路契合度计算,验证其轨迹点的时空表现特征是否符合公交运营情况,若符合则判定该轨迹片段的最终识别结果为公交出行,否则随机森林的初步识别结果即为最终识别结果。
通过本发明方法对上述调查数据分析后,得到如表2所示的出行方式识别结果。
表2出行方式识别结果统计
可以看出,本发明所提出的考虑路网契合度的智能手机出行方式识别方法能够较为准确的识别出各类出行方式,总体识别准确度为88.97%,其中步行识别准确度最高(97.14%),其他出行方式的识别准确度也均大于85%。
本发明在基于智能手机的出行行为调查与分析等方面做了有益的探索,具有重要的理论价值和实践意义。尽管本发明的实施例已公开如上,但还应该解释的是,以上实施例仅用于说明并非局限于本发明所描述的技术方案,本领域的普通技术人员应当理解,仍然可以对本发明提及的相关规则或方法进行修改和填充;而一切不脱离本发明的精神和范围的技术方案及其改进,均应涵盖在本发明的权利要求范围。
Claims (8)
1.一种考虑路网契合度的智能手机出行方式识别方法,其特征在于,该方法包括以下步骤:
步骤1、行为轨迹采集与预处理:
采集受访者的步行、自行车、公交、小汽车四种出行方式轨迹数据,将所述出行方式轨迹数据按照时空表现特征提取“链”片段;
步骤2、根据所述“链”片段中各轨迹点的时空表现特征作为学习属性,记为Aj,j∈1,2,...,n,其中n为对应属性的个数,各轨迹点的时空表现特征为速度均值、速度方差、速度最大值以及加速度均值、加速度方差、加速度最大值六种,即n=6;
步骤3、应用随机抽样方法,选取所述行为方式轨迹数据中50%的样本量作为训练样本集,记为TrS,剩余50%的样本量作为预测样本集,记为TeS;
步骤4、确定随机森林中决策树的数量S,记训练集的总样本量为Q,从训练样本集TrS中可重复地随机选取Q个“链”片段作为决策树p的训练样本集,记为RFSp;
步骤5、针对决策树p的各个训练样本集RFSp生成决策树,即从“链”片段的学习属性中遴选适当属性完成各个决策树的生长过程,完成随机森林的构建与训练;
每个决策树的生长过程为:
步骤5-1、针对决策树p的各个训练样本集RFSp进行判定,如果训练样本RFSp中的所有轨迹片段均属于同一种出行方式,则将该决策树设置为单节点树,标记出行方式并结束该决策树的生长过程;否则,计算决策树p各个学习属性的信息增益比gR,选取信息增益比最大的m个属性建立该决策树的分裂属性表;
步骤5-2、从分裂属性表中选取信息增益比gR最大的属性作为决策树节点的分裂属性,将该属性从分裂属性表中剔除,并将训练样本中该属性对应的数值由小到大进行排列,得到{a1,a2,...,ae,...,aE}序列;以每个属性值作为训练样本集RFSp的样本分界点,计算各个样本分界点的加权平均熵,选取熵值最大的属性值作为该决策树节点确定的分界值,并将各个训练样本划分为小于或等于该分界值的样本子集和大于该分界值的样本子集,并构建两个子节点分别存储这两个样本子集;
步骤5-3,对所述子节点的样本构成进行判定,若子节点的样本均属于某一出行方式k,则将出行方式k作为该子节点的标记并进入步骤5-4;否则查询分裂属性表是否为空,如果不为空,则以该子节点的样本构成为基础,返回步骤5-2,如果分裂属性表为空,则进入步骤5-4;
步骤5-4,针对未标记子节点进行样本分析,选取训练样本中所占比例最大的出行方式作为该子节点的标记,并完成随机森林中各决策树的生长过程;
步骤6、应用所述随机森林对预测样本集TeS的各个轨迹片段进行预测,得到轨迹片段的初步识别结果,初步识别结果为步行、自行车出行、公交出行或小汽车出行;如初步识别结果为步行,则认为该数据记录所指向的轨迹片段最终识别结果为步行,否则进入步骤7;
步骤7、构建公交路网,对判定为自行车出行、公交出行、小汽车出行的轨迹片段进行路网匹配分析,具体做法为:
步骤7-1、获取轨迹片段中各个行为轨迹点的分区编号,计算该分区中轨迹点与公交线路之间的路网契合度,将点线之间的直线距离,即路网契合度小于L米的公交线路记为该轨迹点的可能匹配线路集,记录其线段编号,其中L为路网契合度阈值;
步骤7-2、根据所述步骤7-1记录的轨迹点的公交线路编号,遍历分析并确定出轨迹点唯一配对的公交线路;
步骤7-3、对存在匹配公交线路的轨迹片段进行分区,具体方式为:遍历每块分区中的各个公交站点,获取公交站点附近D米范围内的行为轨迹子片段;
步骤7-4、分析每个轨迹子片段在瞬时速度、瞬时加速度上的变化趋势:若随着轨迹靠近或远离公交站点,瞬时速度表现出由高到低或由低到高的变化趋势,并且在站点停靠时段前后,瞬时加速度的算术符号不同,则认为该轨迹子片段符合公交运营特征,否则认为该轨迹子片段不符合公交运营特征;
步骤7-5、对进行公交线网匹配的轨迹片段进行最终判定:若不存在能够与该轨迹子片段匹配的公交线路,则维持所述步骤6)的初步识别结果;若符合公交运营特征的轨迹子片段占受检测的轨迹子片段总数的比例在Y以上,则判定为该行为轨迹整体符合公交运营特征,为公交出行方式,其中Y为公交运营特征比例值。
2.根据权利要求1所述的考虑路网契合度的智能手机出行方式识别方法,其特征在于,所述的步骤4中,随机森林中决策树的数量S为500。
3.根据权利要求1或2所述的考虑路网契合度的智能手机出行方式识别方法,其特征在于,所述步骤5-1中分裂属性表的属性个数m为学习属性总数的均方根取整,即m=2。
4.根据权利要求1或2所述的考虑路网契合度的智能手机出行方式识别方法,其特征在于,所述的步骤6中应用随机森林对预测样本集TeS的各个轨迹片段进行预测的过程为:选取样本集的某一片段TeSi作为预测对象,逐一对随机森林的每一颗决策树进行预测分析,即从决策树的根节点开始,根据轨迹样本在节点上的属性进行逐级归类,当归类次序达到决策树叶节点时,该叶节点的标记即为本决策树对该轨迹片段出行方式的投票结果;按照以上方式遍历随机森林中的各个决策树,得到S个决策树的出行方式投票结果,其中投票最多的出行方式即为随机森林对该轨迹片段的初步判定结果。
5.根据权利要求1或2所述的考虑路网契合度的智能手机出行方式识别方法,其特征在于,所述步骤7-1中路网契合度阈值L取值为30米。
6.根据权利要求1或2所述的考虑路网契合度的智能手机出行方式识别方法,其特征在于,所述步骤7-2的具体流程为:从轨迹片段Vi的首个轨迹点开始遍历检测,若该点及其后续4个轨迹点的可能匹配线路集中存在贯通的公交线段,则计算该公交线段与这五个轨迹点的总契合度,将其中总契合度最高公交线段确定为所匹配的公交线段,否则即不存在能够匹配的公交线路。
7.根据权利要求1或2所述的考虑路网契合度的智能手机出行方式识别方法,其特征在于,所述步骤7-3中公交站点附近范围D取值为50米。
8.根据权利要求1或2所述的考虑路网契合度的智能手机出行方式识别方法,其特征在于,所述步骤7-5中公交运营特征比例值Y取值为80%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610873364.XA CN106446208B (zh) | 2016-09-30 | 2016-09-30 | 一种考虑路网契合度的智能手机出行方式识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610873364.XA CN106446208B (zh) | 2016-09-30 | 2016-09-30 | 一种考虑路网契合度的智能手机出行方式识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106446208A CN106446208A (zh) | 2017-02-22 |
CN106446208B true CN106446208B (zh) | 2019-07-26 |
Family
ID=58172671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610873364.XA Active CN106446208B (zh) | 2016-09-30 | 2016-09-30 | 一种考虑路网契合度的智能手机出行方式识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106446208B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111508228A (zh) * | 2020-04-01 | 2020-08-07 | 佛山市城市规划设计研究院 | 利用手机gps及电子地图数据的公共交通出行链的获取方法 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106997552A (zh) * | 2017-04-07 | 2017-08-01 | 东南大学 | 一种基于智能手机的弹性停车激励系统及方法 |
CN107230350A (zh) * | 2017-06-23 | 2017-10-03 | 东南大学 | 一种基于卡口与手机流量话单数据的城市交通量获取方法 |
CN107845260B (zh) * | 2017-10-26 | 2020-02-14 | 杭州东信北邮信息技术有限公司 | 一种用户公交出行方式的识别方法 |
CN109034181A (zh) * | 2018-06-05 | 2018-12-18 | 广州杰赛科技股份有限公司 | 移动轨迹的分类方法和装置、设备、存储介质 |
CN110826758B (zh) * | 2018-08-14 | 2023-10-13 | 上海零数众合信息科技有限公司 | 行程类型确定方法及装置、存储介质、终端 |
CN109035787B (zh) * | 2018-09-10 | 2020-07-28 | 华南理工大学 | 一种利用移动通信数据识别交通工具类别的方法 |
CN109409731B (zh) * | 2018-10-22 | 2022-04-12 | 北京航空航天大学 | 一种融合断面检测交通数据及众包数据的公路节假日出行特征识别方法 |
CN110097121B (zh) * | 2019-04-30 | 2021-12-07 | 北京百度网讯科技有限公司 | 一种行驶轨迹的分类方法、装置、电子设备及存储介质 |
CN110544378B (zh) * | 2019-09-02 | 2020-11-03 | 上海评驾科技有限公司 | 一种手机用户拥车情况的判断方法 |
CN110751831B (zh) * | 2019-10-10 | 2021-01-22 | 珠海市岭南大数据研究院 | 出行方式识别方法、装置、计算机设备和存储介质 |
CN110852651B (zh) * | 2019-11-20 | 2022-05-31 | 福建工程学院 | 一种考虑路段管制的液态天然气运输网络失效率计算方法 |
CN111163423B (zh) * | 2019-12-25 | 2022-04-12 | 中国联合网络通信集团有限公司 | 数据处理方法、装置、设备及存储介质 |
CN111653099B (zh) * | 2020-06-10 | 2022-06-17 | 南京瑞栖智能交通技术产业研究院有限公司 | 基于手机信令数据的公交客流od获取方法 |
CN111735456A (zh) * | 2020-06-28 | 2020-10-02 | 北京百度网讯科技有限公司 | 一种导航方法、装置、设备以及存储介质 |
CN112542045B (zh) * | 2020-12-01 | 2021-09-24 | 江苏欣网视讯软件技术有限公司 | 基于手机信令识别交通出行方式的方法与系统 |
CN112699942B (zh) * | 2020-12-30 | 2024-08-02 | 东软睿驰汽车技术(沈阳)有限公司 | 一种运营车辆识别方法、装置、设备及存储介质 |
CN112948417B (zh) * | 2021-01-29 | 2023-01-13 | 上海维外科技有限公司 | 一种基于选择交互的样本知识聚合度计算方法、系统以及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105183893A (zh) * | 2015-09-29 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 定位轨迹的分类方法及装置 |
CN105206041A (zh) * | 2015-08-12 | 2015-12-30 | 东南大学 | 一种考虑时序dbscan的智能手机轨迹链簇识别方法 |
CN105550374A (zh) * | 2016-01-29 | 2016-05-04 | 湖南大学 | Spark云服务环境下面向大数据的随机森林并行机器学习方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10473684B2 (en) * | 2014-10-17 | 2019-11-12 | Nokia Technologies Oy | Method and apparatus for providing movement detection based on air pressure data |
-
2016
- 2016-09-30 CN CN201610873364.XA patent/CN106446208B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105206041A (zh) * | 2015-08-12 | 2015-12-30 | 东南大学 | 一种考虑时序dbscan的智能手机轨迹链簇识别方法 |
CN105183893A (zh) * | 2015-09-29 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 定位轨迹的分类方法及装置 |
CN105550374A (zh) * | 2016-01-29 | 2016-05-04 | 湖南大学 | Spark云服务环境下面向大数据的随机森林并行机器学习方法 |
Non-Patent Citations (1)
Title |
---|
Influence of land use characteristics and trip attributes on commuting mode choice: a case of Nanjing;Liu Zhiwei等;《Journal of Southeast University ( English Edition)》;20140331;第30卷(第1期);第107-112页 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111508228A (zh) * | 2020-04-01 | 2020-08-07 | 佛山市城市规划设计研究院 | 利用手机gps及电子地图数据的公共交通出行链的获取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106446208A (zh) | 2017-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106446208B (zh) | 一种考虑路网契合度的智能手机出行方式识别方法 | |
CN105447504B (zh) | 一种交通模式行为识别方法及相应的识别模型构建方法 | |
CN106600960B (zh) | 基于时空聚类分析算法的交通出行起讫点识别方法 | |
CN110245981B (zh) | 一种基于手机信令数据的人群类型识别方法 | |
Li et al. | Transportation mode identification with GPS trajectory data and GIS information | |
CN105206041B (zh) | 一种考虑时序dbscan的智能手机轨迹链簇识别方法 | |
CN105788273B (zh) | 基于低精度时空轨迹数据的城市交叉口自动识别的方法 | |
CN109710701A (zh) | 一种用于公共安全领域大数据知识图谱的自动化构建方法 | |
CN104931960B (zh) | 动向报文与雷达目标态势信息全航迹段数据关联方法 | |
CN106096631A (zh) | 一种基于手机大数据的流动人口分类识别分析方法 | |
CN107948166A (zh) | 基于深度学习的流量异常检测方法及装置 | |
CN108959466A (zh) | 基于bcs-dbscan的出租车载客热点可视化方法及系统 | |
CN109948547A (zh) | 城市绿地景观评价方法、装置、存储介质及终端设备 | |
CN108269024A (zh) | 一种基于大数据的旅游目的地评价方法 | |
CN108960499A (zh) | 一种融合视觉和非视觉特征的服装流行趋势预测系统 | |
CN106066873A (zh) | 一种基于本体的旅游信息推荐方法 | |
CN101937438A (zh) | 网页内容提取方法和装置 | |
CN107330469A (zh) | 一种基于gps轨迹数据的出行方式识别方法 | |
CN109784416B (zh) | 基于手机信令数据的半监督svm的交通方式判别方法 | |
CN104881472A (zh) | 一种基于网络数据收集的旅游线路景点组合推荐方法 | |
CN105355047B (zh) | 多交通检测源动态时间粒度的数据融合处理方法 | |
CN106845559A (zh) | 顾及poi数据空间异质性的地表覆盖验证方法及系统 | |
CN104537052B (zh) | 基于小波分析模极大值算法的交通出行换乘点识别方法 | |
CN111027743A (zh) | 基于分层路网的od最优路径搜索方法及装置 | |
CN112365708A (zh) | 基于多图卷积网络的景区交通量预测模型建立和预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |