CN104715608B - 基于HBase的全天候全域出租车聚集实时监测方法 - Google Patents
基于HBase的全天候全域出租车聚集实时监测方法 Download PDFInfo
- Publication number
- CN104715608B CN104715608B CN201510136748.9A CN201510136748A CN104715608B CN 104715608 B CN104715608 B CN 104715608B CN 201510136748 A CN201510136748 A CN 201510136748A CN 104715608 B CN104715608 B CN 104715608B
- Authority
- CN
- China
- Prior art keywords
- taxi
- grid
- data
- hbase
- moment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/20—Monitoring the location of vehicles belonging to a group, e.g. fleet of vehicles, countable or determined number of vehicles
- G08G1/205—Indicating the location of the monitored vehicles as destination, e.g. accidents, stolen, rental
Abstract
本发明为基于HBase的全天候全域出租车聚集实时监测方法,公开了一种车辆聚集监测方法。本发明首先将监测区域划分成网格,使用历史GPS数据计算出每个网格出租车数的最大值。然后,实时扫描GPS数据,按时刻截取一段时间的数据进行分析,循环扫描每一个网格,如果某个网格连续n个时刻都大于历史最大值,则观察这n个时刻的车数是否呈递增趋势,如果是则继续计算本时刻是否有一定数量的车和上一时刻相同,成立则说明该网格发生车辆聚集,否则扫描下一个网格。本发明利用出租车GPS数据实时监测每个区域,通过海量的历史出租车GPS和实时数据、HBase数据库、Spark计算框架、数据挖掘方法和最小二乘法构建出了一套快速、准确而有效的实时聚集监测方法。
Description
技术领域
本发明属于海量数据挖掘技术领域,是一种基于海量数据挖掘算法的车辆聚集监测方法。
背景技术
出租车是改革开放的产物,出租车行业则是一个特殊行业,城市出租车是一个提供公共服务并且直接关系公共利益的行业,在城市道路运输中占有十分重要的地位。近年来重庆、广东等地接二连三地发生出租车集体罢运罢工事件,主要诉求或原因在于份钱高、黑车多、加气难、罚款多、运价低、经营权争议、公司化剥削、行政垄断等。罢运罢工不仅影响城市居民生活出行,同时也产生了巨额的直接经济损失。因此,如果能及时发现出租车罢工,对方便人们出行和减少经济损失具有重要意义。
发明内容
本发明针对现有技术的不足,提供了一种车辆聚集监测方法。
本发明中如果某一块监测区域中的出租车连续一段时间出现在该区域并且出租车数一直大于该区域的历史最大车数,将认为发生了车辆聚集行为。
本发明的主要目标和内容即是,从出租车GPS数据中实时发现车辆聚集的区域。
本发明技术方案的主要构思是:首先,将监测区域划分成网格,使用历史GPS数据计算出每个网格出租车数的最大值。然后,实时扫描GPS数据,按时刻截取一段时间的数据进行分析,循环扫描每一个网格,如果某个网格连续n个时刻都大于历史最大值,则观察这n个时刻的车数是否呈递增趋势,如果是,则继续计算本时刻是否有一定数量的车和上一时刻相同,成立,则说明该网格发生车辆聚集,否则扫描下一个网格。
本发明方法包含以下步骤:
步骤(1).出租车上传GPS信息至HBase数据库,GPS信息包括上传时间(SCSJ)、经度(JD)、纬度(WD)和车牌号码(CPHM)信息并且按SCSJ排序。
步骤(2).GPS信息数据预处理,具体是:或者车牌号码不符合出租车命名规则的GPS信息从HBase数据库删除,A表示起始经度,B表示终止经度,C表示起始纬度,D表示终止纬度。
步骤(3).根据网格聚类算法,将省(市)按经纬度划分,将区域划分成一个个网格Ci(i=1,2…k),Ci的精度为Δprecision=0.001度。
步骤(4).第一步:以天为单位,选取某个时间段的GPS信息(这个时间段没有发生车辆聚集);第二步:采用Spark技术,从选取的GPS信息中按天计算出每个Ci每隔5分钟的车数;第三步:选取每个Ci在5分钟间隔内的最大值作为车辆聚集的历史最大值maxi。
步骤(5).向前t1分钟,向后扫描t2分钟的数据(包含这t1分钟的数据),将数据对应到Ci,扫描每个Ci和周围相邻的8个,记为Aj(j=1,2…N),等所有Ci扫描完后,重复本步骤,具体是;
5-1.记录T时刻Aj中的车数,如果Aj被认为是车辆聚集区域且Aj的T-n到T共n个时刻的车数都小于则该区域解除报警,否则继续在地图上标红该区域,输出聚集详情;如果Aj没有被认为是车辆聚集区域,计算Aj的T-n到T共n个时刻的车数是否都大于如果都大于则转5-2,否则扫描Aj+1。
5-2.用最小二乘法拟合Aj的T-n到T共n个时刻的车数,如果直线斜率大于g(g>0),则转步骤5-3,否则扫描Aj+1。
5-3.如果T时刻Aj中的CPHM有k%(k≥80)和T-1时刻相同,则认为Aj区域发生车辆聚集,对Aj区域启动报警程序,即在地图上标红该区域,输出聚集详情,否则扫描Aj+1。
本发明具有的有益效果:本发明利用出租车GPS数据实时监测每个区域,通过海量的历史出租车GPS和实时数据、HBase数据库、Spark计算框架、数据挖掘方法和最小二乘法构建出了一套快速、准确而有效的实时聚集监测方法。
本发明为交通管理部门解决出租车罢运提供了可靠的依据,为居民生活出行提供方便。如果本发明在智能交通领域广泛应用,对解决出租车罢运将起到良好的效果。
附图说明
图1为扫描数据的时间轴,向前t1时间,向后扫描t2时间的数据;
图2为按网格划分区域,扫描一个网格的同时扫描周围相邻的8个网格;
图3在地图上按网格划分区域;
图4某个网格在不同时刻的最大车数;
图5用最小二乘法拟合某网格连续5个时刻的车数。
具体实施方式
以下结合附图对本发明作进一步说明。
本发明方法主要涉及三个关键技术:
1、时间无缝:向前t1时间,向后扫描t2时间的数据(包含t1时间),如图1所示。
2、空间无缝:将监测区域划分为网格,横坐标是经度,纵坐标是纬度,如图2所示;监测1个网格的同时监测它周围相邻的8个网格,如果这九个网格的出租车数连续n个时刻都大于历史最大值,n个时刻的车数还呈递增趋势且k%都是同一批出租车,则认为该区域发生车辆聚集。
3、HBase数据库结合Spark计算框架:有别于关系型数据库,HBase数据库和Spark计算框架在面向海量数据分析处理中的优势在本发明中对计算效率起到重要作用,保证了监测的实时性。
本实施例的具体步骤如下:
步骤(1).出租车上传GPS信息至HBase数据库,GPS信息包括上传时间(SCSJ)、经度(JD)、纬度(WD)和车牌号码(CPHM)信息并且按SCSJ排序。
步骤(2).GPS信息数据预处理,具体是:或者车牌号码不符合出租车命名规则的GPS信息从HBase数据库删除,A表示起始经度,B表示终止经度,C表示起始纬度,D表示终止纬度。
步骤(3).根据网格聚类算法,将省(市)按经纬度划分,将区域划分成一个个网格Ci(i=1,2…k),Ci的精度为Δprecision=0.001度,如图3所示。
步骤(4).第一步:以天为单位,选取某个时间段的GPS信息(这个时间段没有发生车辆聚集);第二步:从选取的GPS信息中按天计算出每个Ci每隔5分钟的车数;第三步:选取每个Ci在5分钟间隔内的最大值作为车辆聚集的历史最大值maxi,如图4所示。
步骤(5).向前t1分钟,向后扫描t2分钟的数据(包含这t1分钟的数据),将数据对应到Ci,扫描每个Ci和周围相邻的8个,记为Aj(j=1,2…N),等所有Ci扫描完后,重复本步骤,具体是;
5-1.记录T时刻Aj中的车数,如果Aj被认为是车辆聚集区域且Aj的T-n到T共n个时刻的车数都小于则该区域解除报警,否则继续在地图上标红该区域,输出聚集详情;如果Aj没有被认为是车辆聚集区域,计算Aj的T-n到T共n个时刻的车数是否都大于如果都大于则转5-2,否则扫描Aj+1。
5-2.用最小二乘法拟合Aj的T-n到T共n个时刻的车数,如果直线斜率大于g(g>0),则转步骤5-3,否则扫描Aj+1。
5-3.如果T时刻Aj中的CPHM有k%(k≥80)和T-1时刻相同,则认为Aj区域发生车辆聚集,对Aj区域启动报警程序,即在地图上标红该区域,输出聚集详情,否则扫描Aj+1。
Claims (1)
1.基于HBase的全天候全域出租车聚集实时监测方法,其特征在于该方法的具体步骤是:
步骤(1).出租车上传GPS信息至HBase数据库,所述GPS信息包括上传时间、经度、纬度和车牌号码信息并且按上传时间排序;
步骤(2).GPS信息数据预处理,具体是:或者车牌号码不符合出租车命名规则的GPS信息从HBase数据库删除,A表示起始经度,B表示终止经度,C表示起始纬度,D表示终止纬度;
步骤(3).根据网格聚类算法,将省、市按经纬度划分,将区域划分成一个个网格Ci,i=1,2…k,Ci的精度为Δprecision=0.001度;
步骤(4).第一步:以天为单位,选取某个时间段的GPS信息;第二步:从选取的GPS信息中按天计算出每个网格Ci每隔5分钟的车数;第三步:选取每个网格Ci在5分钟间隔内的最大值作为车辆聚集的历史最大值maxi;
步骤(5).向前扫描t1分钟,向后扫描t2分钟的数据,将数据对应到网格Ci,扫描每个网格Ci和周围相邻的8个网格,记为Aj,j=1,2…N,等所有网格Ci扫描完后,重复本步骤,具体是:
5-1.记录T时刻Aj中的车数,如果Aj被认为是车辆聚集区域且Aj的T-n到T共n个时刻的车数都小于则该区域解除报警,否则在地图上标红该Aj区域,输出聚集详情;如果Aj没有被认为是车辆聚集区域,计算Aj的T-n到T共n个时刻的车数是否都大于如果都大于则转5-2,否则扫描Aj+1;
5-2.用最小二乘法拟合Aj的T-n到T共n个时刻的车数,如果直线斜率大于g,则转步骤5-3,否则扫描Aj+1,g>0;
5-3.如果T时刻Aj中的车牌号码有k%和T-1时刻相同,则认为Aj区域发生车辆聚集,对Aj区域启动报警程序,即在地图上标红该区域,输出聚集详情,否则扫描Aj+1,k≥80。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510136748.9A CN104715608B (zh) | 2015-03-26 | 2015-03-26 | 基于HBase的全天候全域出租车聚集实时监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510136748.9A CN104715608B (zh) | 2015-03-26 | 2015-03-26 | 基于HBase的全天候全域出租车聚集实时监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104715608A CN104715608A (zh) | 2015-06-17 |
CN104715608B true CN104715608B (zh) | 2017-01-11 |
Family
ID=53414894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510136748.9A Active CN104715608B (zh) | 2015-03-26 | 2015-03-26 | 基于HBase的全天候全域出租车聚集实时监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104715608B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105868845A (zh) * | 2016-03-24 | 2016-08-17 | 百度在线网络技术(北京)有限公司 | 风险预警方法和装置 |
CN109598925B (zh) * | 2017-09-30 | 2021-03-02 | 厦门雅迅网络股份有限公司 | 出租车车辆聚集报警方法、终端设备及存储介质 |
CN108021625B (zh) * | 2017-11-21 | 2021-01-19 | 深圳广联赛讯股份有限公司 | 车辆异常聚集地监控方法及系统、计算机可读存储介质 |
CN109859516B (zh) * | 2019-03-13 | 2021-06-15 | 重庆皓石金科技有限公司 | 一种出租汽车异常聚集识别方法及装置 |
CN112084279A (zh) * | 2020-09-04 | 2020-12-15 | 上海经达信息科技股份有限公司 | 一种基于地图点聚合算法的出租车聚集事件的判定方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003187390A (ja) * | 2001-12-19 | 2003-07-04 | Joho Center Fujiwara Kk | タクシー配車システム |
JP3812468B2 (ja) * | 2002-03-15 | 2006-08-23 | 株式会社デンソー | 車両監視システム |
CN101004858A (zh) * | 2007-01-26 | 2007-07-25 | 徐贵超 | 一种减少出租车空驶网络指挥系统 |
CN102117532B (zh) * | 2009-12-31 | 2014-03-19 | 厦门雅迅网络股份有限公司 | 一种基于gps系统实现出租车非法聚集预报警的方法 |
CN103218672B (zh) * | 2013-03-24 | 2016-03-02 | 吉林大学 | 一种基于gps数据网格统计的出租车巡航行为分析方法 |
CN103729499B (zh) * | 2013-12-12 | 2017-01-11 | 深圳先进技术研究院 | 基于公共交通数据的区域人气聚集指数计算系统及方法 |
CN104035954B (zh) * | 2014-03-18 | 2017-05-24 | 杭州电子科技大学 | 一种基于Hadoop的套牌车识别方法 |
CN104021668B (zh) * | 2014-06-26 | 2016-03-09 | 中国科学院自动化研究所 | 一种公共交通供需状态检测与预测系统及方法 |
-
2015
- 2015-03-26 CN CN201510136748.9A patent/CN104715608B/zh active Active
Non-Patent Citations (2)
Title |
---|
"出租车GPS大数据的道路行车可视分析";何贤国 等;《计算机辅助设计与图形学学报》;20141231(第12期);全文 * |
"基于粒子群优化的负载均衡的虚拟网络映射";黄彬彬 等;《电子与信息学报》;20130731(第7期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN104715608A (zh) | 2015-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104715608B (zh) | 基于HBase的全天候全域出租车聚集实时监测方法 | |
CN107194861B (zh) | 一种基于3dgis+bim的路网运营综合监控管理平台及方法 | |
CN106781455A (zh) | 一种基于云计算的区域高速公路信息化系统 | |
CN104766475B (zh) | 一种城市交通瓶颈挖掘方法 | |
CN106021508A (zh) | 基于社交媒体的突发事件应急信息挖掘方法 | |
CN110363964A (zh) | 一种滑坡和泥石流地质灾害监测与应急响应方法 | |
CN202838441U (zh) | 基于地理信息系统的城市内涝交通疏导与救援指挥系统 | |
CN103839118A (zh) | 一种选址方法和装置 | |
CN109190915B (zh) | 一种基于城市规划的碳排放管理系统 | |
CN101853573A (zh) | 一种城市快速路短时交通信息预测系统及方法 | |
CN102700576A (zh) | 城市轨道交通线网客流监测方法 | |
CN103440525A (zh) | 基于Vague值相似度量改进算法的城市湖库水华应急治理多目标多层次决策方法 | |
CN109784667B (zh) | 一种基于夜光遥感数据的房屋空置监测方法 | |
CN112418556B (zh) | 一种基于互联网共享平台下的网格化服务系统 | |
CN111294742A (zh) | 基于信令cdr数据识别伴随手机号码的方法与系统 | |
CN108268972A (zh) | 基于天通与北斗卫星的空天一体化通导电力设施在线监测预警分析系统与方法 | |
CN105261211A (zh) | 一种交通综合因素影响下的公交发车间隔过渡方法 | |
CN110379152B (zh) | 一种共享单车实时监控和再平衡的可视化方法 | |
Lu et al. | Analyzing the evolution of rare events via social media data and k-means clustering algorithm | |
CN201804444U (zh) | 基于gis的区域高等级公路网交通信息管理装置 | |
CN104571122B (zh) | 一种基于轨迹聚类的船舶互助组救援有效性检验方法 | |
CN114519124A (zh) | 一种大气环境污染联防联控治理方法 | |
CN103761332A (zh) | 雷电信息综合快速分析定位系统 | |
CN110020787A (zh) | 一种基于大数据的水生态环境分析方法 | |
CN109784771A (zh) | 基于时序、pca、聚类的土地评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20150617 Assignee: Hangzhou Cheng Road Polytron Technologies Inc Assignor: Hangzhou Electronic Science and Technology Univ Contract record no.: 2019330000034 Denomination of invention: Around-the-clock all-area taxi gathering real-time monitoring method based on HBase Granted publication date: 20170111 License type: Common License Record date: 20190319 |
|
EE01 | Entry into force of recordation of patent licensing contract |