CN116029624B - 一种融合货车轨迹和poi数据的货源地识别方法 - Google Patents
一种融合货车轨迹和poi数据的货源地识别方法 Download PDFInfo
- Publication number
- CN116029624B CN116029624B CN202210861935.3A CN202210861935A CN116029624B CN 116029624 B CN116029624 B CN 116029624B CN 202210861935 A CN202210861935 A CN 202210861935A CN 116029624 B CN116029624 B CN 116029624B
- Authority
- CN
- China
- Prior art keywords
- truck
- data
- vehicles
- place
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000007405 data analysis Methods 0.000 claims abstract description 12
- 238000007619 statistical method Methods 0.000 claims abstract description 9
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 27
- 239000000203 mixture Substances 0.000 claims description 18
- 230000000007 visual effect Effects 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 8
- 206010039203 Road traffic accident Diseases 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 230000008030 elimination Effects 0.000 claims description 4
- 238000003379 elimination reaction Methods 0.000 claims description 4
- 230000000284 resting effect Effects 0.000 claims description 4
- 239000004566 building material Substances 0.000 claims description 3
- 230000009193 crawling Effects 0.000 claims description 3
- 230000014759 maintenance of location Effects 0.000 claims description 3
- 238000012847 principal component analysis method Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000011160 research Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000011835 investigation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0833—Tracking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种融合货车轨迹和POI数据的货源地识别方法,包括以下步骤:获取货车运行轨迹数据,所述货车运行轨迹数据进行数据预处理获得特征数据集合,所述特征数据集合包括某一地点经停的车辆数、某一地点车辆的平均速度以及某一地点车辆的平均停留时间,所述特征数据集合通过数据分析获得车辆经过点位特征集,所述车辆经过点位特征集进行筛选获得货主普遍特征集,根据货主普遍特征集统计分析获得所需货主地理位置信息。本方法基于货车轨迹数据的分析,可以得到货车的行驶轨迹规律,从而发现这些货车服务的货主信息和服务规律,解决了不能大范围的进行货车出行端点识别以及出行端点准确率低的问题,以便于企业更好的进行后续的服务和管理。
Description
技术领域
本发明涉及交通大数据和智能交通领域,尤其涉及一种融合货车轨迹和POI数据的货源地识别方法。
背景技术
随着技术的发展,货车车载设备基于大数据服务提供了海量的货车轨迹数据资源,这些轨迹数据记录了货车的经纬度信息,时间信息、行驶速度等信息,但由于目前物流行业信息化程度较低,这些数据并没有得到充分的分析利用。关于货车轨迹数据的研究,现阶段国内研究及应用较少,常见的研究应用方向是利用车辆的轨迹数据对乘客的出行时间、需求量空间分布进行预测和估计;公共交通工具的轨迹数据一般与刷卡数据结合研究,对乘客的出行特征进行识别研究,识别上下车站点的应用现阶段比较成熟。而有关利用车辆轨迹数据识别车辆的出行端点的研究一直处于起步阶段。现存对货运车辆的轨迹数据分析判断货运车辆行驶路径情况,利用GIS技术将轨迹点捕捉到含有拓扑关系的临近路段,通过最短路径算法生成车辆沿道路的线型轨迹,最终获得完整的货运车辆出行轨迹数据,然而该方法依然只适合小范围、数据量较小的情况下的交通调查,不适合应用于现在的大数据分析,同时该方法所获取的货运出行端点准确率较低。
现有人们利用货运卡车轨迹数据,确定了货运卡车停留点,结合货运卡车行驶规律与城市主要物流节点位置,分析得到了城市主要物流节点区域的货车出行端点数据,对该数据进行结构分析,从而获得了城市物流空间、时间特征,但是该方法所适用的区域较小,而且需要已知货运卡车主要起讫点位置,当货运卡车经过的地区增多时,很难将该区域所有可能的位置进行标注,故很难将该方法应用于大范围的货车出行端点识别。
现有技术还包括如何利用货运卡车轨迹数据提取OD信息方法,该方法基于货运卡车停车速度阈值的确定识别出了货运卡车运行轨迹中的停车点,最后用地图匹配方法提取出了货运OD点,对OD点聚类后分析了城市群发展现状。该方法有一定的局限性,无法得到停留点的物流有关信息,如:到达车辆数量、停留时间等,这导致只能对结果进行宏观分析,无法对该地货主的物流情况进行具体分析。
国内还有一些发明研究虽然实现了车辆停靠点的识别,但是无法识别真正货主位置信息。停车点包含很多种,如:加油站、收费站、服务区等,这些都会对真正的货主信息进行干扰,也使得整个数据分析过程要复杂许多。
国外对于货车轨迹数据研究起步较早,但是目前也没有相关完善的研究方法。用已知的休息站和加油站信息来识别车辆轨迹数据中的休息、加油等行为,然而,随着研究区域规模的扩大,由其他原因导致的停车事件所对应的停车点的综合数据变得越来越难以分辨。人们目前采用三个变量(货运卡车的停留时间、到道路网络的距离以及航向变化量)的组合识别货运卡车的行程结束点,在轨迹数据中,小的航向变化表明车辆进行了二次停车,因为这种变化是为了方便货运卡车沿着通往目的地的路线行驶而发生的。然而,航向变化变量可能受到道路拓扑结构的影响(例如弯道)而导致错误的分类,因此该方法在识别货运卡车行程终点的实际应用中存在着准确率低的问题。
综上所述,随着技术的发展,货车车载设备基于大数据服务提供了海量的货车轨迹数据资源,由于目前物流行业信息化程度较低,这些数据并没有得到充分的分析利用,且不能从复杂庞大的地理位置数据信息中去除非货主地理位置数据,保留货主地理位置数据,在识别货运卡车行程终点的实际应用中存在着准确率低的问题。
发明内容
本发明提供一种融合货车轨迹和POI数据的货源地识别方法,以克服基于大数据服务提供的大量货车轨迹数据资源,不能从复杂庞大的地理位置数据信息中去除非货主地理位置数据,保留货主地理位置数据,在识别货运卡车行程终点的实际应用中存在准确率低的问题。
为了实现上述目的,本发明的技术方案是:
一种融合货车轨迹和POI数据的货源地识别方法,包括:
步骤1:获取货车运行轨迹数据,所述货车运行轨迹数据至少包括车辆车牌号、车辆行驶里程数、货车行驶的经纬度、货车行驶时间以及货车行驶速度;
步骤2:根据所述货车运行轨迹数据进行数据预处理获得特征数据集合,所述特征数据集合包括某一地点经停的车辆数、某一地点车辆的平均速度以及某一地点车辆的平均停留时间;
步骤3:根据所述特征数据集合通过数据分析获得车辆经过点位特征集,所述车辆经过点位特征集包括货车在高速路路段的行驶速度、货车在城镇道路路段的行驶速度、货车在乡村道路上的行驶速度、货车停车装卸货物造成的停车地点、货车司机在途吃饭、休息的停留地点、货车加油地点以及交通拥堵或车祸造成的停车地点以及由于城市道路的交通收费造成的停车地点、车辆等待红绿灯造成的停车地点;
步骤4:根据所述车辆经过点位特征集进行筛选获得货主普遍特征集;所述货主普遍特征集包括货车滞留时间大于预设时间值的地点、货车行驶速度小于预设速度值的地点、经过货车数量大于预设车辆数的地点;
步骤5:对所述货主普遍特征集进行统计分析所需货主地理位置信息,进而获得货源地识别的查询信息。
进一步的,所述货车运行轨迹数据通过货车车载定位设备及GPS路测获得。
进一步的,所述步骤2中数据预处理包括数据结构化处理、数据过滤处理及数据特征提取,具体步骤为:
步骤2.1:对所述货车运行轨迹数据进行数据结构化处理,即基于所述货车运行轨迹数据进行整理归类获得初始货车运行轨迹数据;
步骤2.2:对初始货车运行轨迹数据进行数据过滤处理,即基于初始货车运行轨迹数据进行去除残缺数据、重复数据以及噪点获得优化货车运行轨迹数据;
步骤2.3:对所述优化货车运行轨迹数据进行数据特征提取,即基于所述优化货车运行轨迹数据进行特征提取获得特征数据集合,所述特征数据集合包括某一地点经停的车辆数、某一地点车辆的平均速度以及某一地点车辆的平均停留时间。
进一步的,步骤3中根据所述特征数据集合通过数据分析获得所述车辆经过点位特征集,具体步骤为:
步骤3.1:采用降维方式对所述特征数据集合进行降维处理,即基于所述特征数据集合将高维的特征数据运用主成分分析法降维成二维数据,
步骤3.2:对所述二维数据进行归一化处理,即基于所述二维数据进行归一化处理获得优化轨迹数据,所述优化轨迹数据综合所述特征数据集合的特征;
步骤3.3:基于高斯混合聚类法对所述优化轨迹数据进行聚类,假设待聚类的所述优化轨迹数据是一个多高斯分布的混合体,可以分为k个类簇,此处将所述类簇分为必要类簇与补充类簇,所述必要类簇包括货车在高速路路段高速行驶;货车在城镇道路路段正常行驶;货车在乡村道路上慢速行驶;货车停车装卸货造成的停车点;货车司机在途吃饭、休息;货车加油点;交通拥堵等造成的停车点;由于城市道路的交通收费、车辆等待红绿灯等造成的停车点,所述补充类簇可根据用户实际需要进行补充使用,每个类簇样本服从一个高斯混合聚类概率分布模型,则高斯混合聚类的概率分布模型可以表示为:
其中,βi为第i个高斯概率分布模型生成的概率,且k为将数据分为k类,y为s维特征参数样本且长度为L,定义为y=[y1,y2,···,yL],Ci为协方差矩阵,μi为均值向量,p(y|μi,Ci)为第i个多维高斯分布概率密度函数:
由上式可知多维高斯分布概率密度函数完全由协方差矩阵和均值向量确定,则高斯混合模型模型参数λ可表示为:
λ={βi,μi,Ci};i=1,2,...,k
步骤3.4:基于高斯混合模型模型参数λ对聚类后的类簇进行可视化处理,即对聚类后的类簇进行可视化处理获得车辆经过点位特征集,所述车辆经过点位特征集包括货车在高速路路段的行驶速度、货车在城镇道路路段的行驶速度、货车在乡村道路上的行驶速度、货车停车装卸货物造成的停车地点、货车司机在途吃饭、休息的停留地点、货车加油地点以及交通拥堵或车祸造成的停车地点、由于城市道路的交通收费、车辆等待红绿灯等造成的停车地点以及补充类别。
进一步的,步骤4中所述车辆经过点位特征集进行筛选获得货主普遍特征集的筛选方法具体为:
步骤4.1:基于所述车辆经过点位特征集按照在某地经停的车辆数、在某地车辆平均速度以及车辆在该地的平均停留时间的特征点可视化处理获得必要类簇与补充类簇的普通点位可视图,所述普通点位包括点位货车滞留时间、点位货车速度以及点位货车数量;
步骤4.2:所述普通点位可视图基于符合货主普遍特征的原则获得货车运输目的地点位可视图,所述符合货主普遍特征的原则为货车滞留时间大于预设时间值的地点、货车行驶速度小于预设速度值的地点、经过货车数量大于预设车辆数的地点,基于货车运输目的地点位可视图获得包含地理位置数据的货主普遍特征集。
进一步的,步骤5中所述货主普遍特征集统计分析获得所需货主地理位置信息具体步骤为:
步骤5.1:基于地理逆编码对所述货主普遍特征集进行逆编码处理获得所有地理位置的POI信息,所述POI信息通过网上信息爬取以及高德地图API的调用进行关键词查询获得的全国地图信息;
步骤5.2:基于XML解析对所述全国地图信息进行解析获取包含城市用地属性和道路设施信息的POI信息并储存;
步骤5.3:根据POI信息里的城市用地属性和道路设施信息里的语句进行关键词剔除获得所需货主地理位置信息,所述关键词剔除的关键词包括风景名胜地点、住宅公园以及道路路段,所述所需货主地理位置信息包括大型物流园区、工业园区、建材市场、机场、车站以及港口;
步骤5.4:基于ArcGIS软件对所述所需货主地理位置信息在地图上进行可视化处理获得点位信息,所述点位信息即为货源地识别的查询信息。
本发明的有益效果:
本发明公开了一种基于大数据分析并融合货车轨迹和POI数据的货源地识别方法,包括以下步骤:获取货车运行轨迹数据,所述货车运行轨迹数据进行数据预处理获得特征数据集合,所述特征数据集合包括某一地点经停的车辆数、某一地点车辆的平均速度以及某一地点车辆的平均停留时间,所述特征数据集合通过数据分析获得车辆经过点位特征集,所述车辆经过点位特征集进行筛选获得货主普遍特征集,根据货主普遍特征集统计分析获得所需货主地理位置信息。解决了基于大数据服务提供的大量货车轨迹数据资源,不能从复杂庞大的地理位置数据信息中去除非货主地理位置数据,保留货主地理位置数据,在识别货运卡车行程终点的实际应用中存在准确率低的问题,以便于企业更好的进行后续的服务和管理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种融合货车轨迹和POI数据的货源地识别方法的流程图;
图2为本发明一种融合货车轨迹和POI数据的货源地识别方法的货车运行轨迹数据图;
图3为本发明一种融合货车轨迹和POI数据的货源地识别方法的车辆经过点位特征集可视化处理点位图;
图4为本发明一种融合货车轨迹和POI数据的货源地识别方法的普通点位可视图与货车运输目的地点位可视图对比图;
图5为本发明一种融合货车轨迹和POI数据的货源地识别方法的POI信息图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供了一种融合货车轨迹和POI数据的货源地识别方法,如图1所示包括:
步骤1:获取货车运行轨迹数据,所述货车运行轨迹数据至少包括车辆车牌号、车辆行驶里程数、货车行驶的经纬度、货车行驶时间以及货车行驶速度,如图2所示,通过货车车载定位设备及GPS路测获得所述货车运行轨迹数据,并可获得实时精确测量的运行轨迹数据。
步骤2:根据所述货车运行轨迹数据进行数据预处理获得特征数据集合,所述特征数据集合包括某一地点经停的车辆数、某一地点车辆的平均速度以及某一地点车辆的平均停留时间;
步骤3:根据所述特征数据集合通过数据分析获得车辆经过点位特征集,所述车辆经过点位特征集包括货车在高速路路段的行驶速度、货车在城镇道路路段的行驶速度、货车在乡村道路上的行驶速度、货车停车装卸货物造成的停车地点、货车司机在途吃饭、休息的停留地点、货车加油地点以及交通拥堵或车祸造成的停车地点以及由于城市道路的交通收费、车辆等待红绿灯等造成的停车地点;
步骤4:根据所述车辆经过点位特征集进行筛选获得货主普遍特征集;所述货主普遍特征集包括货车滞留时间大于预设时间值的地点、货车行驶速度小于预设速度值的地点、经过货车数量大于预设车辆数的地点;
步骤5:对所述货主普遍特征集进行统计分析所需货主地理位置信息,进而获得货源地识别的查询信息。
通过以上步骤,面对货车轨迹数据海量化、复杂化的变化局势,基于大数据货车轨迹数据,突破原有技术方法的局限性,补充现有的技术方法的空白,从数据中发现货车的行车规律,通过行车规律发现货车停车点,从众多停车点中排除非货主的停车点,最后找出货运的客户群体,找出关键货主,其能够为后续的挖掘分析提供相对可靠的数据信息,而且本发明采用的方法不需要训练数据集,没有数据类型和数据数量的局限性,适用于海量复杂的货车轨迹大数据分析。
在具体实施例中,所述步骤2中数据预处理包括数据结构化处理、数据过滤处理及数据特征提取,具体步骤为:
步骤2.1:对所述货车运行轨迹数据进行数据结构化处理,即基于所述货车运行轨迹数据进行整理归类获得初始货车运行轨迹数据;
步骤2.2:对初始货车运行轨迹数据进行数据过滤处理,即基于初始货车运行轨迹数据进行去除残缺数据、重复数据以及噪点获得优化货车运行轨迹数据;
步骤2.3:对所述优化货车运行轨迹数据进行数据特征提取,即基于所述优化货车运行轨迹数据进行特征提取获得特征数据集合,所述特征数据集合包括某一地点经停的车辆数、某一地点车辆的平均速度以及某一地点车辆的平均停留时间;
所述某一地点经停的车辆数为Xj:
Xj=∑xj,t
式中,xj,t代表在j地t时刻出现的车辆;
所述某一地点车辆的平均速度为
式中,vj,t代表在j地t时刻采集的车速值;
所述某一地点车辆的平均停留时间
式中,mr表示第r辆车在j地出现的频次。
由于货车轨迹数据包含大量的维和属性,对高维空间中数据对象进行聚类是极其困难的,本方法对轨迹数据进行了降维归一化处理,即先采用降维技术对数据进行降维,并归一化处理来统一数据量纲,大大减少了运算量,提高了数据处理和运行效率。通过结合货运大数据和货源地普遍特征,提取所述特征数据集合的三个典型特征量,将货车轨迹数据根据这三个特征量进行量化处理,以便于后续的聚类,提高了识别准确率和效率,填补了目前尚没有基于货车轨迹数据获取货主相关信息的空白。
在具体实施例中,步骤3中根据所述特征数据集合通过数据分析获得所述车辆经过点位特征集,具体步骤为:
步骤3.1:采用降维方式对所述特征数据集合进行降维处理,即基于所述特征数据集合将高维的特征数据运用主成分分析法降维成方便数据分析的二维数据,
步骤3.2:对所述二维数据进行归一化处理,即基于所述二维数据进行归一化处理消除量纲的影响获得优化轨迹数据,所述优化轨迹数据综合所述特征数据集合的特征;
步骤3.3:基于高斯混合聚类法对所述优化轨迹数据进行聚类,假设待聚类的所述优化轨迹数据是一个多高斯分布的混合体,可以分为k个类簇,此处将所述类簇分为必要类簇与补充类簇,所述必要类簇包括货车在高速路路段高速行驶;货车在城镇道路路段正常行驶;货车在乡村道路上慢速行驶;货车停车装卸货造成的停车点;货车司机在途吃饭、休息;货车加油点;交通拥堵等造成的停车点;由于城市道路的交通收费、车辆等待红绿灯等造成的停车点,所述补充类簇可根据用户实际需要进行补充使用,每个类簇样本服从一个高斯混合聚类概率分布模型,则高斯混合聚类的概率分布模型可以表示为:
其中,βi为第i个高斯概率分布模型生成的概率,且k为将数据分为k类,y为s维特征参数样本且长度为L,定义为y=[y1,y2,···,yL],Ci为协方差矩阵,μi为均值向量,p(y|μi,Ci)为第i个多维高斯分布概率密度函数:
由上式可知多维高斯分布概率密度函数完全由协方差矩阵和均值向量确定,则高斯混合模型模型参数λ可表示为:
λ={βi,μi,Ci};i=1,2,...,k
步骤3.4:如图3所示,基于高斯混合模型模型参数λ对聚类后的类簇进行可视化处理,即对聚类后的类簇进行可视化处理获得车辆经过点位特征集,所述车辆经过点位特征集包括货车在高速路路段的行驶速度、货车在城镇道路路段的行驶速度、货车在乡村道路上的行驶速度、货车停车装卸货物造成的停车地点、货车司机在途吃饭、休息的停留地点、货车加油地点以及交通拥堵或车祸造成的停车地点、由于城市道路的交通收费、车辆等待红绿灯等造成的停车地点以及补充类别。
在具体实施例中,步骤4中所述车辆经过点位特征集进行筛选获得货主普遍特征集的筛选方法具体为:
步骤4.1:基于所述车辆经过点位特征集按照在某地经停的车辆数、在某地车辆平均速度以及车辆在该地的平均停留时间的特征点可视化处理获得必要类簇与补充类簇的普通点位可视图,所述普通点位包括点位货车滞留时间、点位货车速度以及点位货车数量;
步骤4.2:所述普通点位可视图基于符合货主普遍特征的原则获得货车运输目的地点位可视图,如图4所示,所述符合货主普遍特征的原则为货车滞留时间大于预设时间值的地点、货车行驶速度小于预设速度值的地点、经过货车数量大于预设车辆数的地点,基于货车运输目的地点位可视图获得包含地理位置数据的货主普遍特征集。
在具体实施例中,步骤5中所述货主普遍特征集统计分析获得所需货主地理位置信息具体步骤为:
步骤5.1:基于地理逆编码对所述货主普遍特征集进行逆编码处理获得所有地理位置的POI信息,如图5所示,所述POI信息基于网上信息爬取以及高德地图API的调用进行关键词查询获得的全国地图信息;
步骤5.2:基于XML解析对所述全国地图信息进行解析获取包含城市用地属性和道路设施信息的POI信息并储存;
步骤5.3:根据POI信息里的城市用地属性和道路设施信息里的语句进行关键词剔除获得所需货主地理位置信息,所述关键词剔除的关键词包括风景名胜地点、住宅公园以及道路路段,所述所需货主地理位置信息包括大型物流园区、工业园区、建材市场、机场、车站以及港口等;
步骤5.4:基于ArcGIS软件对所述所需货主地理位置信息在地图上进行可视化处理获得点位信息,所述点位信息即为货源地识别的查询信息。
通过所述车辆经过点位特征集进行筛选获得货主普遍特征集后,保留的货主普遍特征的类簇都包含了大量的地理位置数据,这些地理位置包含了货主地理信息和非货主地理信息,因此需要对保留的类簇内数据进行地理逆编码,得到所有地理位置的POI信息,POI信息需要通过网上信息爬取,对高德地图API的调用,对全国地图信息进行采集,本发明采用高德地图平台的API相关接口,使用关键词,利用货车轨迹数据对全国的路网、收费站、服务区,高速公路出入口等信息进行爬取,以提取POI信息。并通过XML解析获取每个地点的地点属性,最终获得的POI信息包括了城市用地属性和道路设施信息,将得到的POI信息储存。最后,需要根据POI信息里的城市用地属性和道路设施信息里的语句进行关键词剔除,剔除非装卸点,如风景名胜地点、住宅公园、道路路段等地点,将非货主地理位置全部剔除获得最终的货主信息结果,运用ArcGIS软件将结果在地图中进行可视化处理,方便货源地的识别与查询。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (1)
1.一种融合货车轨迹和POI数据的货源地识别方法,其特征在于,包括:
步骤1:获取货车运行轨迹数据,所述货车运行轨迹数据至少包括车辆车牌号、车辆行驶里程数、货车行驶的经纬度、货车行驶时间以及货车行驶速度;所述货车运行轨迹数据通过货车车载定位设备及GPS路测获得;
步骤2:根据所述货车运行轨迹数据进行数据预处理获得特征数据集合,所述特征数据集合包括某一地点经停的车辆数、某一地点车辆的平均速度以及某一地点车辆的平均停留时间;具体步骤为:
步骤2.1:对所述货车运行轨迹数据进行数据结构化处理,即基于所述货车运行轨迹数据进行整理归类获得初始货车运行轨迹数据;
步骤2.2:对初始货车运行轨迹数据进行数据过滤处理,即基于初始货车运行轨迹数据进行去除残缺数据、重复数据以及噪点获得优化货车运行轨迹数据;
步骤2.3:对所述优化货车运行轨迹数据进行数据特征提取,即基于所述优化货车运行轨迹数据进行特征提取获得特征数据集合,所述特征数据集合包括某一地点经停的车辆数、某一地点车辆的平均速度以及某一地点车辆的平均停留时间;
所述某一地点经停的车辆数为Xj:
Xj=∑xj,t
式中,xj,t代表在j地t时刻出现的车辆;
所述某一地点车辆的平均速度为
式中,vj,t代表在j地t时刻采集的车速值;
所述某一地点车辆的平均停留时间
式中,mr表示第r辆车在j地出现的频次;
步骤3:根据所述特征数据集合通过数据分析获得车辆经过点位特征集,所述车辆经过点位特征集包括货车在高速路路段的行驶速度、货车在城镇道路路段的行驶速度、货车在乡村道路上的行驶速度、货车停车装卸货物造成的停车地点、货车司机在途吃饭、休息的停留地点、货车加油地点以及交通拥堵或车祸造成的停车地点以及由于城市道路的交通收费造成的停车地点、车辆等待红绿灯造成的停车地点;具体步骤为:
步骤3.1:采用降维方式对所述特征数据集合进行降维处理,即基于所述特征数据集合将高维的特征数据运用主成分分析法降维成二维数据,
步骤3.2:对所述二维数据进行归一化处理,即基于所述二维数据进行归一化处理获得优化轨迹数据,所述优化轨迹数据保留所述特征数据集合的特征;
步骤3.3:基于高斯混合聚类法对所述优化轨迹数据进行聚类,假设待聚类的所述优化轨迹数据是一个多高斯分布的混合体,可以分为k个类簇,此处将所述类簇分为必要类簇与补充类簇,所述必要类簇包括货车在高速路路段高速行驶;货车在城镇道路路段正常行驶;货车在乡村道路上慢速行驶;货车停车装卸货造成的停车点;货车司机在途吃饭、休息;货车加油点;交通拥堵造成的停车点;由于城市道路的交通收费、车辆等待红绿灯造成的停车点,所述补充类簇可根据用户实际需要进行补充使用,每个类簇样本服从一个高斯混合聚类概率分布模型,则高斯混合聚类的概率分布模型可以表示为:
其中,βi为第i个高斯概率分布模型生成的概率,且k为将数据分为k类,y为s维特征参数样本且长度为L,定义为y=[y1,y2,···,yL],Ci为协方差矩阵,μi为均值向量,p(y|μi,Ci)为第i个多维高斯分布概率密度函数:
由上式可知多维高斯分布概率密度函数完全由协方差矩阵和均值向量确定,则高斯混合模型模型参数λ可表示为:
λ={βi,μi,Ci};=1,2,…,k
步骤3.4:基于高斯混合模型模型参数λ对聚类后的类簇进行可视化处理,即对聚类后的类簇进行可视化处理获得车辆经过点位特征集,所述车辆经过点位特征集包括货车在高速路路段的行驶速度、货车在城镇道路路段的行驶速度、货车在乡村道路上的行驶速度、货车停车装卸货物造成的停车地点、货车司机在途吃饭、休息的停留地点、货车加油地点以及交通拥堵或车祸造成的停车地点、由于城市道路的交通收费、车辆等待红绿灯造成的停车地点以及补充类别;
步骤4:根据所述车辆经过点位特征集进行筛选获得货主普遍特征集;所述货主普遍特征集包括货车滞留时间大于预设时间值的地点、货车行驶速度小于预设速度值的地点、经过货车数量大于预设车辆数的地点;
所述车辆经过点位特征集进行筛选获得货主普遍特征集的筛选方法具体为:步骤4.1:基于所述车辆经过点位特征集,按照在某地经停的车辆数、在某地车辆平均速度以及车辆在该地的平均停留时间的特征点可视化处理获得必要类簇与补充类簇的普通点位可视图,所述普通点位包括点位货车滞留时间、点位货车速度以及点位货车数量;
步骤4.2:基于符合货主普遍特征的原则对所述普通点位可视图筛选获得货车运输目的地点位可视图,所述符合货主普遍特征的原则为货车滞留时间大于预设时间值的地点、货车行驶速度小于预设速度值的地点、经过货车数量大于预设车辆数的地点,基于货车运输目的地点位可视图获得包含地理位置数据的货主普遍特征集;
步骤5:对所述货主普遍特征集进行统计分析所需货主地理位置信息,进而获得货源地识别的查询信息;
所述货主普遍特征集统计分析获得所需货主地理位置信息具体步骤为:
步骤5.1:基于地理逆编码对所述货主普遍特征集进行逆编码处理获得所有地理位置的POI信息,所述POI信息通过网上信息爬取以及高德地图API的调用进行关键词查询获得的全国地图信息;
步骤5.2:基于XML解析对所述全国地图信息进行解析获取包含城市用地属性和道路设施信息的POI信息并储存;
步骤5.3:根据POI信息里的城市用地属性和道路设施信息里的语句进行关键词剔除,获得所需货主地理位置信息,所述关键词剔除的关键词包括风景名胜地点、住宅公园以及道路路段,所述所需货主地理位置信息包括大型物流园区、工业园区、建材市场、机场、车站以及港口;
步骤5.4:基于ArcGIS软件对所述所需货主地理位置信息在地图上进行可视化处理获得点位信息,所述点位信息即为货源地识别的查询信息。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210861935.3A CN116029624B (zh) | 2022-07-21 | 2022-07-21 | 一种融合货车轨迹和poi数据的货源地识别方法 |
NL2035432A NL2035432A (en) | 2022-07-21 | 2023-07-20 | Computer-implemented method for identifying origin of goods by fusing truck trajectory and poi data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210861935.3A CN116029624B (zh) | 2022-07-21 | 2022-07-21 | 一种融合货车轨迹和poi数据的货源地识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116029624A CN116029624A (zh) | 2023-04-28 |
CN116029624B true CN116029624B (zh) | 2024-02-06 |
Family
ID=86080156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210861935.3A Active CN116029624B (zh) | 2022-07-21 | 2022-07-21 | 一种融合货车轨迹和poi数据的货源地识别方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116029624B (zh) |
NL (1) | NL2035432A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017140175A1 (zh) * | 2016-02-18 | 2017-08-24 | 华南理工大学 | 基于路径识别系统的收费公路网交通信息采集与诱导系统 |
CN109686085A (zh) * | 2018-12-17 | 2019-04-26 | 北京交通大学 | 基于gps数据危险货物运输车辆停留节点活动类型识别方法 |
WO2020186770A1 (zh) * | 2019-03-21 | 2020-09-24 | 江苏智通交通科技有限公司 | 可视化的出租车上下车特征分析方法 |
CN112270460A (zh) * | 2020-09-30 | 2021-01-26 | 交通运输部规划研究院 | 一种基于多源数据的超重货车货源站点识别方法 |
CN112382083A (zh) * | 2020-10-13 | 2021-02-19 | 厦门市交通研究中心 | 一种基于gps数据的货运交通od分析方法、装置及设备 |
CN112613939A (zh) * | 2020-12-14 | 2021-04-06 | 北京优挂信息科技有限公司 | 一种车辆装卸状态的识别方法、装置、存储介质及终端 |
CN113011815A (zh) * | 2021-03-11 | 2021-06-22 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种货车停靠点提取方法和出行特征确定方法、装置 |
CN114298642A (zh) * | 2021-12-31 | 2022-04-08 | 北京交通大学 | 从轨迹数据中提取城市内货车出行od的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8543320B2 (en) * | 2011-05-19 | 2013-09-24 | Microsoft Corporation | Inferring a behavioral state of a vehicle |
-
2022
- 2022-07-21 CN CN202210861935.3A patent/CN116029624B/zh active Active
-
2023
- 2023-07-20 NL NL2035432A patent/NL2035432A/en unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017140175A1 (zh) * | 2016-02-18 | 2017-08-24 | 华南理工大学 | 基于路径识别系统的收费公路网交通信息采集与诱导系统 |
CN109686085A (zh) * | 2018-12-17 | 2019-04-26 | 北京交通大学 | 基于gps数据危险货物运输车辆停留节点活动类型识别方法 |
WO2020186770A1 (zh) * | 2019-03-21 | 2020-09-24 | 江苏智通交通科技有限公司 | 可视化的出租车上下车特征分析方法 |
CN112270460A (zh) * | 2020-09-30 | 2021-01-26 | 交通运输部规划研究院 | 一种基于多源数据的超重货车货源站点识别方法 |
CN112382083A (zh) * | 2020-10-13 | 2021-02-19 | 厦门市交通研究中心 | 一种基于gps数据的货运交通od分析方法、装置及设备 |
CN112613939A (zh) * | 2020-12-14 | 2021-04-06 | 北京优挂信息科技有限公司 | 一种车辆装卸状态的识别方法、装置、存储介质及终端 |
CN113011815A (zh) * | 2021-03-11 | 2021-06-22 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种货车停靠点提取方法和出行特征确定方法、装置 |
CN114298642A (zh) * | 2021-12-31 | 2022-04-08 | 北京交通大学 | 从轨迹数据中提取城市内货车出行od的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116029624A (zh) | 2023-04-28 |
NL2035432A (en) | 2024-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Analyzing spatiotemporal traffic line source emissions based on massive didi online car-hailing service data | |
CN109686085B (zh) | 基于gps数据危险货物运输车辆停留节点活动类型识别方法 | |
Wang et al. | Truck traffic flow prediction based on LSTM and GRU methods with sampled GPS data | |
CN110544373B (zh) | 一种基于北斗车联网的货车预警信息提取与风险识别方法 | |
CN111612670B (zh) | 一种构建机动车排放清单的方法、装置和计算机设备 | |
Yang et al. | Identifying intercity freight trip ends of heavy trucks from GPS data | |
Pan et al. | Exploring spatial variation of the bus stop influence zone with multi-source data: A case study in Zhenjiang, China | |
CN111768619A (zh) | 一种基于卡口数据的快速路车辆od点确定方法 | |
CN108932255B (zh) | 一种车辆综合能力分析方法及装置 | |
Shen et al. | Identification of accident blackspots on rural roads using grid clustering and principal component clustering | |
Chepuri et al. | Travel time reliability analysis on selected bus route of mysore using GPS data | |
Wu et al. | Exploring key spatio-temporal features of crash risk hot spots on urban road network: A machine learning approach | |
Chand et al. | Examining the macro-level factors affecting vehicle breakdown duration | |
CN113095387B (zh) | 基于联网车载adas的道路风险识别方法 | |
CN114912689A (zh) | 基于地图网格索引和xgboost的超限车辆目的地预测方法及系统 | |
CN112767686B (zh) | 一种基于多源数据融合的公路网汽车排放估算方法 | |
CN116824868B (zh) | 车辆非法停驻点识别及拥堵预测方法、装置、设备及介质 | |
CN116029624B (zh) | 一种融合货车轨迹和poi数据的货源地识别方法 | |
CN116092037B (zh) | 融合轨迹空间-语义特征的车辆类型识别方法 | |
Pincay et al. | Partitioning space to identify en-route movement patterns | |
CN116307931A (zh) | 一种面向城市货运物流链的多源数据融合分析方法 | |
CN112949939B (zh) | 基于随机森林模型的出租车载客热点预测方法 | |
Khabiri et al. | Application of data mining algorithm to investigate the effect of intelligent transportation systems on road accidents reduction by decision tree | |
CN112990360A (zh) | 一种基于K-means的网约车载客特征分析方法 | |
Huo et al. | Mining massive truck GPS data for freight OD estimation: Case study of liaoning province in China |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |