CN116126551A - 一种网约车od数据流的实时聚合及可视化的方法及装置 - Google Patents
一种网约车od数据流的实时聚合及可视化的方法及装置 Download PDFInfo
- Publication number
- CN116126551A CN116126551A CN202211442531.7A CN202211442531A CN116126551A CN 116126551 A CN116126551 A CN 116126551A CN 202211442531 A CN202211442531 A CN 202211442531A CN 116126551 A CN116126551 A CN 116126551A
- Authority
- CN
- China
- Prior art keywords
- data
- point
- aggregation
- clustering
- grid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002776 aggregation Effects 0.000 title claims abstract description 112
- 238000004220 aggregation Methods 0.000 title claims abstract description 112
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012800 visualization Methods 0.000 title claims abstract description 26
- 238000010586 diagram Methods 0.000 claims abstract description 68
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000012544 monitoring process Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 claims description 14
- 238000009826 distribution Methods 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000007405 data analysis Methods 0.000 description 4
- 238000013079 data visualisation Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000007794 visualization technique Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 229920000433 Lyocell Polymers 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/546—Message passing systems or structures, e.g. queues
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种网约车OD数据流的实时聚合及可视化的方法及装置,其中方法包括:基于网约车订单数据提取其中的OD数据,将OD数据上传至消息队列;监听消息队列,以实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数;对OD统计数进行数据预处理以输出处理OD数据;基于OD处理数据并应用流数据聚类方法,通过OD数据相似度模型,更新数据聚合类簇中心与OD统计值,以生成OD聚合数据;根据预设的时间周期通过数据服务接口读取OD聚合数据,基于OD聚合数据绘制三维弧线图,并在三维弧线图上显示聚合流向与OD统计值,以获取OD弧线图;将OD聚合数据及OD弧线图结合到地图上,以获取OD地图。
Description
技术领域
本发明涉及网约车OD数据处理及展示的技术领域,具体涉及一种网约车OD数据流的实时聚合及可视化的方法及装置。
背景技术
随着基于位置服务(LBS)技术的快速发展,以整合供需信息提供预约出行服务的网约车应用也越来越广泛。网约车出行数据的分析与应用对于不断提升网约车服务有着重要意义。
网约车OD(Origin-Destination)交通出行量数据是一类通过提供起点和终点位置稀疏描述移动轨迹的数据,能够体现乘客出行的基本特征。通过大规模数据的聚合与可视化,能够直观地展示上下车热点、流向特征等网约车运营态势,有助于挖掘空间异常和隐藏关系,为网约车调度与营销策略设计、运力投放规划及城市智能交通应用提供有效的支撑。
公告号为CN105095481B的中国发明专利公开了一种大规模出租车OD数据可视分析方法。该发明主要步骤为:消除GPS原始数据噪音;将出租车轨迹的GPS点匹配到相应的道路中;提取出租车上下车客信息并存储;采用bin聚类生成热力图和聚类图;选择感兴趣区域;使用环形像素图和时空堆栈图展示O/D模式时空分析视图。
公告号为CN110232421A的中国发明专利公开了一种逐级合并OD流向时空聚合聚类方法。该发明主要步骤为:构建OD流向集合F;统计流向Fi周边的相似流向数numi;筛选初始聚类类簇并构建流向类族几何Cset;设置OD流向类簇逐级合并等级;逐级对OD流向类簇进行合并并更新类簇集合Cset,完成OD流向聚类过程,能够达到不同时间和空间尺度的聚类结果。
此外,公告号为CN112948651A的中国发明专利公开了一种高效的OD数据可视化方法及系统,通过构建关联相同OD起终点的属性字典,提高OD线绘制效率;CN111063035A公开了一种GIS中OD关系的三维可视化方法及装置,其特征在于根据用户的输入数据生成能够被GIS系统识别的三维曲线并进行三维可视化展示。CN 110716935A公开了一种基于网约车出行的轨迹数据分析与可视化方法与系统,对中小规模轨迹数据进行OD分析、车速分析和车流量分析。
基于上述的现有技术可以看出,现有的网约车OD数据聚合分析与可视化一般是对批量数据进行聚合处理,未能支持实时OD数据流聚合与展示,不能及时反映网约车运营的实时变化情况。导致对网约车的实时调度与管理滞后于当前状态,未能及时调配资源从而影响了服务质量。由此可见,现有技术主要面向批量的OD数据分析,未能支持实时OD数据聚合与展示,难以及时反映网约车运营情况的实时变化。
发明内容
为了克服上述现有技术未能支持实时OD数据聚合与展示的技术缺陷,本发明提供一种网约车OD数据流的实时聚合及可视化的方法及装置。
为了解决上述问题,本发明按以下技术方案予以实现的:
第一方面,本发明公开一种网约车OD数据流的实时聚合及可视化的方法,包括以下步骤:
步骤S1:基于网约车订单数据提取其中的OD数据,所述OD数据包括行程起点和终点的经纬度、上车时间戳和下车时间戳,将OD数据上传至消息队列;
步骤S2:监听消息队列,以实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数;
步骤S3:对OD统计数进行数据预处理以输出处理OD数据,所述处理OD数据包括起始区域中心点、终止区域中心点以及OD统计值;
步骤S4:基于OD处理数据并应用流数据聚类方法,通过OD数据相似度模型,更新数据聚合类簇中心与OD统计值,以生成OD聚合数据;
步骤S5:根据预设的时间周期通过数据服务接口读取OD聚合数据,基于OD聚合数据绘制三维弧线图,并在三维弧线图上显示聚合流向与OD统计值,以获取OD弧线图;
步骤S6:将OD聚合数据及OD弧线图结合到地图上,以获取OD地图,所述OD地图从城市、区/县、镇/街、网格和聚类模式依层级在地图上显示OD聚合数据的空间分布态势与流向。
作为第一方面的一种优选实施,所述实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数,具体包括以下子步骤:
实时获取OD数据,OD数据进行聚类生成OD数据类簇;
获取该OD数据类簇的中心点,以OD数据类簇的中心点代表该类的OD数据;
基于OD数据遍历网约车运营范围内的各区域/某一级别地理网格,以获取边界多边形坐标串;
判断OD数据中起点的坐标值是否落在边界多边形内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为起始区域/网格;
判断OD数据中终点的坐标值是否落在边界多边型内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为终止区域/网格;
按照预设的时间周期,按照区域/地理网格的维度,汇总网约车订单的起始区域/网格与终止区域/网格,以获得OD统计数;
输出该类对应的OD统计数。
作为第一方面的一种优选实施,所述基于OD处理数据并应用流数据聚类方法,具体包括以下子步骤:
初始化聚类生成器及聚类流实例集,设置衰减阈值、精度评估频率和时间窗口属性;
读取网约车订单的OD数据详情表存量数据,以生成初始聚类;
监听消息队列,构建聚类训练实例,从处理OD数据中读取起终点及所属地理网格中心点的经纬度,结合OD数据相似度模型,设置实例属性并随机生成实例的初始类别编号;
添加聚类训练实例至聚类流实例集;
遍历聚类流实例集,聚类生成器依次读取实例执行聚类处理;
输出聚类结果,依次把类别的编号、起终点经纬度、OD统计数和执行时间戳存储在订单实时聚类表中。
作为第一方面的一种优选实施,所述OD数据相似度模型为:
Sim=αSimpoint+βSimcenter
所述OD数据相似度模型模型为了提升OD点数据聚类与地理网格分类的一致性,综合考虑OD点坐标差异与OD点所在地理网格中心点坐标的差异;通过相似度权重系数设置,使同属一个地理网格的OD点聚类程度更高;
其中,所述Sim是OD数据相似性评价系数,所述Simpoint是OD数据坐标相似度,所述Simcenter是OD数据所在地理网格中心点相似度;所述α和β是相似度权重系数,切取值在[0,1]之间,且α+β=1;
所述xo1和yo1是OD数据1的起始点经纬度,所述xo2和yo2是OD数据2的起始点经纬度,所述xd1和yd1是OD数据1的终止点经纬度,所述xd2和yd2是OD数据2的终止点经纬度;
所述xoc1和yoc1是OD数据1的起始点所属地理网格中心点的经纬度,所述xoc2和yoc2是OD数据2的起始点所属地理网格中心点的经纬度,所述xdc1和ydc1是OD数据1的终止点所在地理网格中心点的经纬度,所述xdc2和ydc2是OD数据2的终止点所在地理网格中心点的经纬度。
作为第一方面的一种优选实施,所述OD地图至少包括18个用于显示OD聚合数据的级别;
其中,级别1-7不显示三维弧线图;
级别8-9显示城市之间OD弧线图;
级别10-11显示区/县之间OD弧段图;
级别12-13显示镇/街之间OD弧线图;
级别14显示地理网格之间OD弧线图,六边型网格面积为5.161km2;
级别15显示地理网格之间OD弧线图,六边型网格面积为0.73km2;
级别16-17显示聚类点之间OD弧线图;
级别18以上不显示三维弧线图;
地图显示级别、地面分辨率与显示比例尺数据符合《GB/T 35634-2017公共服务电子地图瓦片数规范》的相关规定。
第二方面,本发明还公开一种网约车OD数据流的实时聚合及可视化的装置,包括:
采集传输模块M1,其用于基于网约车订单数据提取其中的OD数据,所述OD数据包括行程起点和终点的经纬度、上车时间戳和下车时间戳,将OD数据上传至消息队列;
区域统计模块M2,其用于监听消息队列,以实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数;
数据处理模块M3,其用于对OD统计数进行数据预处理以输出处理OD数据,所述处理OD数据包括起始区域中心点、终止区域中心点以及OD统计值;
空间聚类模块M4,其用于基于OD处理数据并应用流数据聚类方法,通过OD数据相似度模型,更新数据聚合类簇中心与OD统计值,以生成OD聚合数据;
弧线展示模块M5,其用于根据预设的时间周期通过数据服务接口读取OD聚合数据,基于OD聚合数据绘制三维弧线图,并在三维弧线图上显示聚合流向与OD统计值,以获取OD弧线图;
地图展示模块M6,其用于将OD聚合数据及OD弧线图结合到地图上,以获取OD地图,所述OD地图从城市、区/县、镇/街、网格和聚类模式依层级在地图上显示OD聚合数据的空间分布态势与流向。
作为第二方面的一种优选实施,所述区域统计模块M2在运行时,具体执行以下步骤:
实时获取OD数据,OD数据进行聚类生成OD数据类簇;
获取该OD数据类簇的中心点,以OD数据类簇的中心点代表该类的OD数据;
基于OD数据遍历网约车运营范围内的各区域/某一级别地理网格,以获取边界多边形坐标串;
判断OD数据中起点的坐标值是否落在边界多边形内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为起始区域/网格;
判断OD数据中终点的坐标值是否落在边界多边型内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为终止区域/网格;
按照预设的时间周期,按照区域/地理网格的维度,汇总网约车订单的起始区域/网格与终止区域/网格,以获得OD统计数;
输出该类对应的OD统计数。
作为第二方面的一种优选实施,所述空间聚类模块M4运行时,具体执行以下步骤:
初始化聚类生成器及聚类流实例集,设置衰减阈值、精度评估频率和时间窗口属性;
读取网约车订单的OD数据详情表存量数据,以生成初始聚类;
监听消息队列,构建聚类训练实例,从处理OD数据中读取起终点及所属地理网格中心点的经纬度,结合OD数据相似度模型,设置实例属性并随机生成实例的初始类别编号;
添加聚类训练实例至聚类流实例集;
遍历聚类流实例集,聚类生成器依次读取实例执行聚类处理;
输出聚类结果,依次把类别的编号、起终点经纬度、OD统计数和执行时间戳存储在订单实时聚类表中。
作为第二方面的一种优选实施,所述OD数据相似度模型为:
Sim=αSimpoint+βSimcenter
所述OD数据相似度模型模型为了提升OD点数据聚类与地理网格分类的一致性,综合考虑OD点坐标差异与OD点所在地理网格中心点坐标的差异;通过相似度权重系数设置,使同属一个地理网格的OD点聚类程度更高;
其中,所述Sim是OD数据相似性评价系数,所述Simpoint是OD数据坐标相似度,所述Simcenter是OD数据所在地理网格中心点相似度;所述α和β是相似度权重系数,切取值在[0,1]之间,且α+β=1;
所述xo1和yo1是OD数据1的起始点经纬度,所述xo2和yo2是OD数据2的起始点经纬度,所述xd1和yd1是OD数据1的终止点经纬度,所述xd2和yd2是OD数据2的终止点经纬度;
所述xoc1和yoc1是OD数据1的起始点所属地理网格中心点的经纬度,所述xoc2和yoc2是OD数据2的起始点所属地理网格中心点的经纬度,所述xdc1和ydc1是OD数据1的终止点所在地理网格中心点的经纬度,所述xdc2和ydc2是OD数据2的终止点所在地理网格中心点的经纬度。
作为第二方面的一种优选实施,所述OD地图至少包括18个用于显示OD聚合数据的级别;
其中,级别1-7不显示三维弧线图;
级别8-9显示城市之间OD弧线图;
级别10-11显示区/县之间OD弧段图;
级别12-13显示镇/街之间OD弧线图;
级别14显示地理网格之间OD弧线图,六边型网格面积为5.161km2;
级别15显示地理网格之间OD弧线图,六边型网格面积为0.73km2;
级别16-17显示聚类点之间OD弧线图;
级别18以上不显示三维弧线图;
地图显示级别、地面分辨率与显示比例尺数据符合《GB/T 35634-2017公共服务电子地图瓦片数规范》的相关规定。
与现有技术相比,本发明的有益效果是:
本发明创造性地结合OD数据预处理、流数据聚类方法、OD数据相似度模型及OD弧线图进行结合后,使得本发明能够生成OD聚合数据的空间分布态势与流向可视化且直观的OD地图,以支持实时OD数据流聚合与展示,能够及时反映网约车运营的实时变化情况。对网约车的实时调度与管理能够匹配当前状态,能及时调配资源从而不影响网约车的服务质量。特别是面向批量的OD数据分析时,能支持实时OD数据聚合与展示,以及时地反映网约车运营情况的实时变化。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明,其中:
图1是本发明的网约车OD数据流的实时聚合及可视化的方法的流程示意图;
图2是本发明的网约车OD数据流的实时聚合及可视化的装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
访问设备和服务器可以通过有线或无线通信方式进行直接或间接地连接。访问设备可以是终端,也可以是服务器。访问设备上运行了目标应用。目标应用是能够向服务器发起数据请求的应用程序,如社交应用、支付应用、游戏应用等。服务器可以是目标应用提供服务的应用服务器,也可以是区别与目标应用所对应应用服务器的代理服务器。服务器用于识别每个访问设备是否属于恶意设备,对来自恶意设备的数据报文进行拦截。当服务器为代理服务器时,代理服务器将不属于来自恶意设备的数据报文转发至应用服务器。终端具体可以是台式终端或移动终端,移动终端具体可以智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。服务器与服务器分别可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
实施例1
如图1所示,第一方面,本发明公开一种网约车OD数据流的实时聚合及可视化的方法,本发明方法是实施至少包括乘客端、数据服务器、消息服务器、应用服务器,本发明实施例具体包括以下步骤:
步骤S1:基于网约车订单数据提取其中的OD数据,所述OD数据包括行程起点和终点的经纬度、上车时间戳和下车时间戳,将OD数据上传至消息队列。
具体地,数据服务器获取来自乘客端提交的网约车订单,从订单中提取OD数据至少包括:起始点经度、起始点纬度、起始时间戳、终止点经度、终止点纬度、终止时间戳。所述消息队列,是指利用高效可靠的消息传递机制进行平台无关的数据交流并基于数据通信来进行分布式系统的集成,组成部分至少包括消息服务器、消息生产者、消息消费者。
优选地,OD消息生产者监听订单实施完成事件,从订单信息中提取OD数据,并转化为Json字符串,发送至消息服务器。
步骤S2:监听消息队列,以实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数。
本步骤具体包括以下子步骤:
实时获取OD数据,OD数据进行聚类生成OD数据类簇;
获取该OD数据类簇的中心点,以OD数据类簇的中心点代表该类的OD数据;
基于OD数据遍历网约车运营范围内的各区域/某一级别地理网格,以获取边界多边形坐标串;
判断OD数据中起点的坐标值是否落在边界多边形内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为起始区域/网格;
判断OD数据中终点的坐标值是否落在边界多边型内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为终止区域/网格;
按照预设的时间周期,按照区域/地理网格的维度,汇总网约车订单的起始区域/网格与终止区域/网格,以获得OD统计数;
输出该类对应的OD统计数。
具体地,数据服务器中的OD消息消费者进程监听消息队列,获取OD数据消息,把Json字符串转换为Json对象,再进行数据预处理。
优选地,所述数据预处理至少包括:
异常数据剔除、数据规范化处理。
其中,异常数据剔除,至少包括以下处理内容:
一是剔除经度取值在[-180,180],纬度取值在[-90,90]以外的数据。二是剔除时间戳年、月、日、时、分、秒超出正常阈值的数据。
数据规范化处理,至少包括以下处理内容:
始终点坐标和底图使用统一的地理坐标系,坐标系可选择:2000国家大地坐标系、GCJ-02坐标系、wgs84坐标系等。OD坐标数据存储为双精度格式,保留5位小数,时间戳存储为日期时间格式。
步骤S3:对OD统计数进行数据预处理以输出处理OD数据,所述处理OD数据包括起始区域中心点、终止区域中心点以及OD统计值。
具体地,数据服务器对经过预处理后的OD数据中读取起终点的经纬度进行空间统计,即起终点与区域/地理网格边界实施空间包含判断操作,如起终点坐标在区域/地理网格内侧,把该区域/网格的代码记录在订单OD数据详情表中,并按特定时间汇总数据。
在执行OD数据空间统计时,具体包括如下两种处理方式:
第一种处理方式,依次对城市、区县、镇街、地理网格执行空间匹配处理,记录OD所属的区域/地理网格。
第二种处理方式,预先构建城市、区县、镇街、地理网格之间的关联关系表。仅对最底层的地理网格执行空间匹配,根据区域/地理网格的关联表,查找并记录OD所属的区域/地理网格。
本实例优选地,结合网约车应用场景汇总区域包括:地级行政区划、区县行政区划、镇街行政区划。地理网格包括:矩形、六边形、Delaunay三角网、Voronoi图。在本实施例中,使用H3六边型格网。H3地理网格是由Uber公司公开的使用六边形网格的地理空间索引系统。具体地,使用7级(面积为:5.1613km2,边长为:1.2206km),8级(面积为:0.7373km2,边长为:0.4614km)H3格网汇总OD数据。
在本实例中,订单OD数据详情表至少包括:订单编号、起点经度、起点纬度、终点经度、终点纬度、起点所属地理网格编号/镇级行政区划代码/区县行政区划代码/城市行政区划代码、终点所属地理网格编号/镇级行政区划代码/区县行政区划代码/城市行政区划代码、执行时间戳。
在本实例中,优选地使用pgsql数据库存储订单OD数据详情表,以物理视图的方式汇总区域/地理网格的OD数统计值,通过执行定时调度任务刷新物理视图,调度时间为1分钟。
步骤S4:基于OD处理数据并应用流数据聚类方法,通过OD数据相似度模型,更新数据聚合类簇中心与OD统计值,以生成OD聚合数据。
具体地,数据服务器对经过预处理后的OD数据中读取起终点的经纬度执行流数据聚类处理。流数据聚类方法是指从大量连续生成的数据中对具有相似性的对象进行分类。流数据聚类算法包括:STREAM算法、CluStream算法、DenStream算法、D-Stream算法。
优选地,本实施例使用MOA(Machine Learning for Data Streams)数据流机器学习框架所提供的ClusterGenerator(聚类生成器)方法实现OD数据流聚类。
具体包括以下子步骤:
初始化聚类生成器及聚类流实例集,设置衰减阈值、精度评估频率和时间窗口属性;
读取网约车订单的OD数据详情表存量数据,以生成初始聚类;
监听消息队列,构建聚类训练实例,从处理OD数据中读取起终点及所属地理网格中心点的经纬度,结合OD数据相似度模型,设置实例属性并随机生成实例的初始类别编号;
添加聚类训练实例至聚类流实例集;
遍历聚类流实例集,聚类生成器依次读取实例执行聚类处理;
输出聚类结果,依次把类别的编号、起终点经纬度、OD统计数和执行时间戳存储在订单实时聚类表中。
本实例优选地,基于OD数据相似性评价模型设置聚类训练实例的属性。OD数据相似度模型为:
Sim=αSimpoint+βSimcenter
所述OD数据相似度模型模型为了提升OD点数据聚类与地理网格分类的一致性,综合考虑OD点坐标差异与OD点所在地理网格中心点坐标的差异;通过相似度权重系数设置,使同属一个地理网格的OD点聚类程度更高;
其中,所述Sim是OD数据相似性评价系数,所述Simpoint是OD数据坐标相似度,所述Simcenter是OD数据所在地理网格中心点相似度;所述α和β是相似度权重系数,切取值在[0,1]之间,且α+β=1;
所述xo1和yo1是OD数据1的起始点经纬度,所述xo2和yo2是OD数据2的起始点经纬度,所述xd1和yd1是OD数据1的终止点经纬度,所述xd2和yd2是OD数据2的终止点经纬度;
所述xoc1和yoc1是OD数据1的起始点所属地理网格中心点的经纬度,所述xoc2和yoc2是OD数据2的起始点所属地理网格中心点的经纬度,所述xdc1和ydc1是OD数据1的终止点所在地理网格中心点的经纬度,所述xdc2和ydc2是OD数据2的终止点所在地理网格中心点的经纬度。
在本实例中,优选地对订单实时聚类表建立物理视图,通过执行定时调度任务刷新物理视图,调度时间为1分钟。
本实施例中还包括:按照一定时间周期,通过数据服务接口读取OD聚合数据。
具体地,数据服务器访问区域/地理网格/点聚类物理视图的聚合结果,发布restful风格的OD数据聚合服务,设置访问url地址。应用服务器通过url地址调用服务,获取OD数据聚合结果。
本实例优选地,OD聚合数据服务使用restful风格、方法为get,支持跨域访问,输入参数包括:聚合类型,查询时间过滤条件,查询空间过滤条件;聚合类型可选项为:城市、区县、镇街、7级H3地理网格、8级H3地理网格、点聚类。响应结果按聚合类数组返回,聚合类数组至少包括:OD聚合类编号、起始点经度、起始点纬度、终止点经度、终止点纬度、聚合说明、OD统计数,响应结果按json格式返回。
步骤S5:根据预设的时间周期通过数据服务接口读取OD聚合数据,基于OD聚合数据绘制三维弧线图,并在三维弧线图上显示聚合流向与OD统计值,以获取OD弧线图。
具体地,应用服务器通过设置定时器,按一定时间间隔(如10秒)读取OD数据聚合服务,获取聚合起始点中心的经纬度、配置显示参数。参数包括:数据绑定、底图绑定、弧线曲度、弧线样式、动画时长、动画执行次数配置。最后,基于当前地图显示层级,在展示终端显示聚合流向及OD数据统计量。终端包括:数据大屏、工作站浏览器、移动终端。
本实例优选地,根据OD聚合数据与当前地图显示级别绘制三维弧线图,地图显示级别与弧线图对应方式如下表所示:地图显示级别、地面分辨率与显示比例尺数据参考《GB/T35634-2017公共服务电子地图瓦片数规范》。具体展示策略可根据应用区域及数据概况调整。
在本实施例优选地,使用腾讯位置服务数据可视化API,基于html5页面展示OD聚合数据。底图采用腾讯地图提供的基础底图服务,地图风格设置为:墨渊。弧线图按照汇总的OD统计数分级设置弧段颜色、线宽及动画颜色。并可以捕捉鼠标选择事件,高亮显示当前选中的弧段并弹出弧段详情窗体,展示弧段所述区域名称、OD统计数信息。为保证数据展示效果美观与清晰,还应设置不同地图层级所显示的最多弧段数。
步骤S6:将OD聚合数据及OD弧线图结合到地图上,以获取OD地图,所述OD地图从城市、区/县、镇/街、网格和聚类模式依层级在地图上显示OD聚合数据的空间分布态势与流向。
具体地,应用服务器监听地图级别变化事件,根据变更后的级别,参照表1中同地图显示级别下OD数据弧线图展示策略向数据服务器请求OD聚合数据服务。基于返回的数据聚合结果,在应用服务器中刷新显示动态弧段图。在OD地图中结合OD聚合数据及OD弧线图,以使OD地图上展示出相应的OD聚合数据的空间分布态势与流向,使OD聚合数据更为直观。
表1:不同地图显示级别下OD数据弧线图展示策略
所述OD地图至少包括18个用于显示OD聚合数据的级别;
其中,级别1-7不显示三维弧线图;级别8-9显示城市之间OD弧线图;级别10-11显示区/县之间OD弧段图;级别12-13显示镇/街之间OD弧线图;级别14显示地理网格之间OD弧线图,六边型网格面积为5.161km2;级别15显示地理网格之间OD弧线图,六边型网格面积为0.73km2;级别16-17显示聚类点之间OD弧线图;级别18以上不显示三维弧线图;OD地图显示级别、地面分辨率与显示比例尺数据符合《GB/T 35634-2017公共服务电子地图瓦片数规范》的相关规定。
综上所述,本发明创造性地结合OD数据预处理、流数据聚类方法、OD数据相似度模型及OD弧线图进行结合后,使得本发明能够生成OD聚合数据的空间分布态势与流向可视化且直观的OD地图,以支持实时OD数据流聚合与展示,能够及时反映网约车运营的实时变化情况。
基于本发明的实施,能够对网约车的实时调度与管理能够匹配当前状态,能及时调配资源从而不影响网约车的服务质量。特别是面向批量的OD数据分析时,能支持实时OD数据聚合与展示,以及时地反映网约车运营情况的实时变化。
本实施例所述的网约车OD数据流的实时聚合及可视化的方法的其它步骤参见现有技术。
实施例2
如图2所示,第二方面,本发明还公开一种网约车OD数据流的实时聚合及可视化的装置,包括:
采集传输模块M1,其用于基于网约车订单数据提取其中的OD数据,所述OD数据包括行程起点和终点的经纬度、上车时间戳和下车时间戳,将OD数据上传至消息队列;
区域统计模块M2,其用于监听消息队列,以实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数;
数据处理模块M3,其用于对OD统计数进行数据预处理以输出处理OD数据,所述处理OD数据包括起始区域中心点、终止区域中心点以及OD统计值;
空间聚类模块M4,其用于基于OD处理数据并应用流数据聚类方法,通过OD数据相似度模型,更新数据聚合类簇中心与OD统计值,以生成OD聚合数据;
弧线展示模块M5,其用于根据预设的时间周期通过数据服务接口读取OD聚合数据,基于OD聚合数据绘制三维弧线图,并在三维弧线图上显示聚合流向与OD统计值,以获取OD弧线图;
地图展示模块M6,其用于将OD聚合数据及OD弧线图结合到地图上,以获取OD地图,所述OD地图从城市、区/县、镇/街、网格和聚类模式依层级在地图上显示OD聚合数据的空间分布态势与流向。
作为第二方面的一种优选实施,所述区域统计模块M2在运行时,具体执行以下步骤:
实时获取OD数据,OD数据进行聚类生成OD数据类簇;
获取该OD数据类簇的中心点,以OD数据类簇的中心点代表该类的OD数据;
基于OD数据遍历网约车运营范围内的各区域/某一级别地理网格,以获取边界多边形坐标串;
判断OD数据中起点的坐标值是否落在边界多边形内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为起始区域/网格;
判断OD数据中终点的坐标值是否落在边界多边型内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为终止区域/网格;
按照预设的时间周期,按照区域/地理网格的维度,汇总网约车订单的起始区域/网格与终止区域/网格,以获得OD统计数;
输出该类对应的OD统计数。
作为第二方面的一种优选实施,所述空间聚类模块M4运行时,具体执行以下步骤:
初始化聚类生成器及聚类流实例集,设置衰减阈值、精度评估频率和时间窗口属性;
读取网约车订单的OD数据详情表存量数据,以生成初始聚类;
监听消息队列,构建聚类训练实例,从处理OD数据中读取起终点及所属地理网格中心点的经纬度,结合OD数据相似度模型,设置实例属性并随机生成实例的初始类别编号;
添加聚类训练实例至聚类流实例集;
遍历聚类流实例集,聚类生成器依次读取实例执行聚类处理;
输出聚类结果,依次把类别的编号、起终点经纬度、OD统计数和执行时间戳存储在订单实时聚类表中。
作为第二方面的一种优选实施,所述OD数据相似度模型为:
Sim=αSimpoint+βSimcenter
所述OD数据相似度模型模型为了提升OD点数据聚类与地理网格分类的一致性,综合考虑OD点坐标差异与OD点所在地理网格中心点坐标的差异;通过相似度权重系数设置,使同属一个地理网格的OD点聚类程度更高;
其中,所述Sim是OD数据相似性评价系数,所述Simpoint是OD数据坐标相似度,所述Simcenter是OD数据所在地理网格中心点相似度;所述α和β是相似度权重系数,切取值在[0,1]之间,且α+β=1;
所述xo1和yo1是OD数据1的起始点经纬度,所述xo2和yo2是OD数据2的起始点经纬度,所述xd1和yd1是OD数据1的终止点经纬度,所述xd2和yd2是OD数据2的终止点经纬度;
所述xoc1和yoc1是OD数据1的起始点所属地理网格中心点的经纬度,所述xoc2和yoc2是OD数据2的起始点所属地理网格中心点的经纬度,所述xdc1和ydc1是OD数据1的终止点所在地理网格中心点的经纬度,所述xdc2和ydc2是OD数据2的终止点所在地理网格中心点的经纬度。
作为第二方面的一种优选实施,所述OD地图至少包括18个用于显示OD聚合数据的级别;
其中,级别1-7不显示三维弧线图;
级别8-9显示城市之间OD弧线图;
级别10-11显示区/县之间OD弧段图;
级别12-13显示镇/街之间OD弧线图;
级别14显示地理网格之间OD弧线图,六边型网格面积为5.161km2;
级别15显示地理网格之间OD弧线图,六边型网格面积为0.73km2;
级别16-17显示聚类点之间OD弧线图;
级别18以上不显示三维弧线图;
OD地图的显示级别、地面分辨率与显示比例尺数据符合《GB/T 35634-2017公共服务电子地图瓦片数规范》的相关规定。
本实施例所述的网约车OD数据流的实时聚合及可视化的装置的其它结构参见现有技术。
实施例3
本发明还公开一种电子设备,至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,所述至少一个处理器执行指令时,具体实现以下的步骤:基于网约车订单数据提取其中的OD数据,所述OD数据包括行程起点和终点的经纬度、上车时间戳和下车时间戳,将OD数据上传至消息队列;监听消息队列,以实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数;对OD统计数进行数据预处理以输出处理OD数据,所述处理OD数据包括起始区域中心点、终止区域中心点以及OD统计值;基于OD处理数据并应用流数据聚类方法,通过OD数据相似度模型,更新数据聚合类簇中心与OD统计值,以生成OD聚合数据;根据预设的时间周期通过数据服务接口读取OD聚合数据,基于OD聚合数据绘制三维弧线图,并在三维弧线图上显示聚合流向与OD统计值,以获取OD弧线图;将OD聚合数据及OD弧线图结合到地图上,以获取OD地图,所述OD地图从城市、区/县、镇/街、网格和聚类模式依层级在地图上显示OD聚合数据的空间分布态势与流向。
实施例4
本发明还公开一种存储介质,存储有计算机程序,所述计算机程序被处理器执行时,具体实现以下步骤:基于网约车订单数据提取其中的OD数据,所述OD数据包括行程起点和终点的经纬度、上车时间戳和下车时间戳,将OD数据上传至消息队列;监听消息队列,以实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数;对OD统计数进行数据预处理以输出处理OD数据,所述处理OD数据包括起始区域中心点、终止区域中心点以及OD统计值;基于OD处理数据并应用流数据聚类方法,通过OD数据相似度模型,更新数据聚合类簇中心与OD统计值,以生成OD聚合数据;根据预设的时间周期通过数据服务接口读取OD聚合数据,基于OD聚合数据绘制三维弧线图,并在三维弧线图上显示聚合流向与OD统计值,以获取OD弧线图;将OD聚合数据及OD弧线图结合到地图上,以获取OD地图,所述OD地图从城市、区/县、镇/街、网格和聚类模式依层级在地图上显示OD聚合数据的空间分布态势与流向。
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,上述编程语言包括面向对象的编程语言—诸如Smalltalk、C++、Java等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,上述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。
Claims (10)
1.一种网约车OD数据流的实时聚合及可视化的方法,其特征在于,包括以下步骤:
基于网约车订单数据提取其中的OD数据,所述OD数据包括行程起点和终点的经纬度、上车时间戳和下车时间戳,将OD数据上传至消息队列;
监听消息队列,以实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数;
对OD统计数进行数据预处理以输出处理OD数据,所述处理OD数据包括起始区域中心点、终止区域中心点以及OD统计值;
基于OD处理数据并应用流数据聚类方法,通过OD数据相似度模型,更新数据聚合类簇中心与OD统计值,以生成OD聚合数据;
根据预设的时间周期通过数据服务接口读取OD聚合数据,基于OD聚合数据绘制三维弧线图,并在三维弧线图上显示聚合流向与OD统计值,以获取OD弧线图;
将OD聚合数据及OD弧线图结合到地图上,以获取OD地图,所述OD地图从城市、区/县、镇/街、网格和聚类模式依层级在地图上显示OD聚合数据的空间分布态势与流向。
2.根据权利要求1所述的网约车OD数据流的实时聚合及可视化的方法,其特征在于,所述实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数,具体包括以下子步骤:
实时获取OD数据,OD数据进行聚类生成OD数据类簇;
获取该OD数据类簇的中心点,以OD数据类簇的中心点代表该类的OD数据;
基于OD数据遍历网约车运营范围内的各区域/某一级别地理网格,以获取边界多边形坐标串;
判断OD数据中起点的坐标值是否落在边界多边形内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为起始区域/网格;
判断OD数据中终点的坐标值是否落在边界多边型内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为终止区域/网格;
按照预设的时间周期,按照区域/地理网格的维度,汇总网约车订单的起始区域/网格与终止区域/网格,以获得OD统计数;
输出该类对应的OD统计数。
3.根据权利要求2所述的网约车OD数据流的实时聚合及可视化的方法,其特征在于,所述基于OD处理数据并应用流数据聚类方法,具体包括以下子步骤:
初始化聚类生成器及聚类流实例集,设置衰减阈值、精度评估频率和时间窗口属性;
读取网约车订单的OD数据详情表存量数据,以生成初始聚类;
监听消息队列,构建聚类训练实例,从处理OD数据中读取起终点及所属地理网格中心点的经纬度,结合OD数据相似度模型,设置实例属性并随机生成实例的初始类别编号;
添加聚类训练实例至聚类流实例集;
遍历聚类流实例集,聚类生成器依次读取实例执行聚类处理;
输出聚类结果,依次把类别的编号、起终点经纬度、OD统计数和执行时间戳存储在订单实时聚类表中。
4.根据权利要求3所述的网约车OD数据流的实时聚合及可视化的方法,其特征在于:
所述OD数据相似度模型为:
Sim=αSimpoint+βSimcenter
所述OD数据相似度模型模型为了提升OD点数据聚类与地理网格分类的一致性,综合考虑OD点坐标差异与OD点所在地理网格中心点坐标的差异;通过相似度权重系数设置,使同属一个地理网格的OD点聚类程度更高;
其中,所述Sim是OD数据相似性评价系数,所述Simpoint是OD数据坐标相似度,所述Simcenter是OD数据所在地理网格中心点相似度;所述α和β是相似度权重系数,切取值在[0,1]之间,且α+β=1;
所述xo1和yo1是OD数据1的起始点经纬度,所述xo2和yo2是OD数据2的起始点经纬度,所述xd1和yd1是OD数据1的终止点经纬度,所述xd2和yd2是OD数据2的终止点经纬度;
所述xoc1和yoc1是OD数据1的起始点所属地理网格中心点的经纬度,所述xoc2和yoc2是OD数据2的起始点所属地理网格中心点的经纬度,所述xdc1和ydc1是OD数据1的终止点所在地理网格中心点的经纬度,所述xdc2和ydc2是OD数据2的终止点所在地理网格中心点的经纬度。
5.根据权利要求4所述的网约车OD数据流的实时聚合及可视化的方法,其特征在于:
所述OD地图至少包括18个用于显示OD聚合数据的级别;
其中,级别1-7不显示三维弧线图;
级别8-9显示城市之间OD弧线图;
级别10-11显示区/县之间OD弧段图;
级别12-13显示镇/街之间OD弧线图;
级别14显示地理网格之间OD弧线图,六边型网格面积为5.161km2;
级别15显示地理网格之间OD弧线图,六边型网格面积为0.73km2;
级别16-17显示聚类点之间OD弧线图;
级别18以上不显示三维弧线图;
地图显示级别、地面分辨率与显示比例尺数据符合《GB/T 35634-2017公共服务电子地图瓦片数规范》的相关规定。
6.一种网约车OD数据流的实时聚合及可视化的装置,其特征在于,包括:
采集传输模块,其用于基于网约车订单数据提取其中的OD数据,所述OD数据包括行程起点和终点的经纬度、上车时间戳和下车时间戳,将OD数据上传至消息队列;
区域统计模块,其用于监听消息队列,以实时获取OD数据并聚类生成OD数据类簇,以OD数据类簇的中心点代表该类的OD数据,并输出该类的OD统计数;
数据处理模块,其用于对OD统计数进行数据预处理以输出处理OD数据,所述处理OD数据包括起始区域中心点、终止区域中心点以及OD统计值;
空间聚类模块,其用于基于OD处理数据并应用流数据聚类方法,通过OD数据相似度模型,更新数据聚合类簇中心与OD统计值,以生成OD聚合数据;
弧线展示模块,其用于根据预设的时间周期通过数据服务接口读取OD聚合数据,基于OD聚合数据绘制三维弧线图,并在三维弧线图上显示聚合流向与OD统计值,以获取OD弧线图;
地图展示模块,其用于将OD聚合数据及OD弧线图结合到地图上,以获取OD地图,所述OD地图从城市、区/县、镇/街、网格和聚类模式依层级在地图上显示OD聚合数据的空间分布态势与流向。
7.根据权利要求6所述的网约车OD数据流的实时聚合及可视化的装置,其特征在于,所述区域统计模块在运行时,具体执行以下步骤:
实时获取OD数据,OD数据进行聚类生成OD数据类簇;
获取该OD数据类簇的中心点,以OD数据类簇的中心点代表该类的OD数据;
基于OD数据遍历网约车运营范围内的各区域/某一级别地理网格,以获取边界多边形坐标串;
判断OD数据中起点的坐标值是否落在边界多边形内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为起始区域/网格;
判断OD数据中终点的坐标值是否落在边界多边型内;
若起点位于边界多边形内,则在网约车订单的OD数据详情表中记录该区域/地理网格为终止区域/网格;
按照预设的时间周期,按照区域/地理网格的维度,汇总网约车订单的起始区域/网格与终止区域/网格,以获得OD统计数;
输出该类对应的OD统计数。
8.根据权利要求7所述的网约车OD数据流的实时聚合及可视化的装置,其特征在于,所述空间聚类模块运行时,具体执行以下步骤:
初始化聚类生成器及聚类流实例集,设置衰减阈值、精度评估频率和时间窗口属性;
读取网约车订单的OD数据详情表存量数据,以生成初始聚类;
监听消息队列,构建聚类训练实例,从处理OD数据中读取起终点及所属地理网格中心点的经纬度,结合OD数据相似度模型,设置实例属性并随机生成实例的初始类别编号;
添加聚类训练实例至聚类流实例集;
遍历聚类流实例集,聚类生成器依次读取实例执行聚类处理;
输出聚类结果,依次把类别的编号、起终点经纬度、OD统计数和执行时间戳存储在订单实时聚类表中。
9.根据权利要求8所述的网约车OD数据流的实时聚合及可视化的装置,其特征在于:
所述OD数据相似度模型为:
Sim=αSimpoint+βSimcenter
所述OD数据相似度模型模型为了提升OD点数据聚类与地理网格分类的一致性,综合考虑OD点坐标差异与OD点所在地理网格中心点坐标的差异;通过相似度权重系数设置,使同属一个地理网格的OD点聚类程度更高;
其中,所述Sim是OD数据相似性评价系数,所述Simpoint是OD数据坐标相似度,所述Simcenter是OD数据所在地理网格中心点相似度;所述α和β是相似度权重系数,切取值在[0,1]之间,且α+β=1;
所述xo1和yo1是OD数据1的起始点经纬度,所述xo2和yo2是OD数据2的起始点经纬度,所述xd1和yd1是OD数据1的终止点经纬度,所述xd2和yd2是OD数据2的终止点经纬度;
所述xoc1和yoc1是OD数据1的起始点所属地理网格中心点的经纬度,所述xoc2和yoc2是OD数据2的起始点所属地理网格中心点的经纬度,所述xdc1和ydc1是OD数据1的终止点所在地理网格中心点的经纬度,所述xdc2和ydc2是OD数据2的终止点所在地理网格中心点的经纬度。
10.根据权利要求9所述的网约车OD数据流的实时聚合及可视化的装置,其特征在于:
所述OD地图至少包括18个用于显示OD聚合数据的级别;
其中,级别1-7不显示三维弧线图;
级别8-9显示城市之间OD弧线图;
级别10-11显示区/县之间OD弧段图;
级别12-13显示镇/街之间OD弧线图;
级别14显示地理网格之间OD弧线图,六边型网格面积为5.161km2;
级别15显示地理网格之间OD弧线图,六边型网格面积为0.73km2;
级别16-17显示聚类点之间OD弧线图;
级别18以上不显示三维弧线图;
地图显示级别、地面分辨率与显示比例尺数据符合《GB/T 35634-2017公共服务电子地图瓦片数规范》的相关规定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211442531.7A CN116126551A (zh) | 2022-11-17 | 2022-11-17 | 一种网约车od数据流的实时聚合及可视化的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211442531.7A CN116126551A (zh) | 2022-11-17 | 2022-11-17 | 一种网约车od数据流的实时聚合及可视化的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116126551A true CN116126551A (zh) | 2023-05-16 |
Family
ID=86294440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211442531.7A Pending CN116126551A (zh) | 2022-11-17 | 2022-11-17 | 一种网约车od数据流的实时聚合及可视化的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116126551A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117573952A (zh) * | 2024-01-16 | 2024-02-20 | 北京睿企信息科技有限公司 | 一种基于地图的信息显示方法、电子设备和存储介质 |
-
2022
- 2022-11-17 CN CN202211442531.7A patent/CN116126551A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117573952A (zh) * | 2024-01-16 | 2024-02-20 | 北京睿企信息科技有限公司 | 一种基于地图的信息显示方法、电子设备和存储介质 |
CN117573952B (zh) * | 2024-01-16 | 2024-03-29 | 北京睿企信息科技有限公司 | 一种基于地图的信息显示方法、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yao et al. | Mapping fine-scale population distributions at the building level by integrating multisource geospatial big data | |
US9183221B2 (en) | Component and method for overlying information bearing hexagons on a map display | |
Li et al. | Spatiotemporal analysis of housing prices in China: A big data perspective | |
US8745516B2 (en) | Real time map rendering with data clustering and expansion and overlay | |
Krueger et al. | Traveldiff: Visual comparison analytics for massive movement patterns derived from twitter | |
CN102147807A (zh) | 基于gis的海量雷电数据时空分析方法 | |
CN104767830A (zh) | 信息发布的管理方法和装置 | |
Wismans et al. | Improving a priori demand estimates transport models using mobile phone data: a Rotterdam-region case | |
CN111080501A (zh) | 基于手机信令数据的真实人群密度时空分布估算方法 | |
Li et al. | Defining the boundaries of urban built-up area based on taxi trajectories: a case study of Beijing | |
Sarkar et al. | Corporate editors in OpenStreetMap: Investigating co‐editing patterns | |
CN113160395B (zh) | 一种基于cim的城市多维信息交互及场景生成的方法、装置及介质 | |
Ertugay et al. | GIS-based stochastic modeling of physical accessibility using GPS-based floating car data and Monte Carlo simulation | |
Hu et al. | Uncovering the association between traffic crashes and street-level built-environment features using street view images | |
CN116126551A (zh) | 一种网约车od数据流的实时聚合及可视化的方法及装置 | |
Guan et al. | Sensing mixed urban land-use patterns using municipal water consumption time series | |
Zhang et al. | Street‐level traffic flow and context sensing analysis through semantic integration of multisource geospatial data | |
Chaudhuri et al. | Application of web-based Geographical Information System (GIS) in tourism development | |
CN110264244B (zh) | 一种广告用户轨迹跟踪管理系统及方法 | |
US20040068520A1 (en) | Information management system | |
Lu et al. | Examining the relationship between social context and community attachment through the daily social context averaging effect | |
CN115169466A (zh) | 一种地块画像方法、装置、电子设备及计算机可读介质 | |
Meng et al. | Travel preference: an indicator of the benefits of urban green space | |
Wu et al. | Unraveling the impact of urban form on location's irreplaceability: An analysis from the perspective of spatiotemporal heterogeneity | |
Zeng et al. | Study on the Change of POI Attraction Based on Taxi Trajectory |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |