CN105045858B - 基于投票的出租车载客点推荐方法 - Google Patents
基于投票的出租车载客点推荐方法 Download PDFInfo
- Publication number
- CN105045858B CN105045858B CN201510404663.4A CN201510404663A CN105045858B CN 105045858 B CN105045858 B CN 105045858B CN 201510404663 A CN201510404663 A CN 201510404663A CN 105045858 B CN105045858 B CN 105045858B
- Authority
- CN
- China
- Prior art keywords
- point
- candidate
- mrow
- passenger
- history
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于投票的出租车载客点推荐方法,步骤包括:提取所有出租车的历史载客点数据,进行先空间后时间的聚类分析得到第一候选点组、进行先时间后空间的聚类分析得到第二候选点组,剔除所有时间属性相同且欧式距离小于预设阈值的第一候选点和第二候选点并通过投票打分加权生成一个新候选点,得到待推荐候选载客点数据集;根据用户请求的目标位置和目标时间从待推荐候选载客点数据集中推荐候选载客点。本发明能够实现空间和时间的有机结合,避免由于时间和空间的变化产生的差异导致载客点分析不准确的问题,具有时空耦合度好、准确性高的优点,能够在为用户推荐具有较大载客概率的候选载客点的同时,满足用户自身的个性化需求。
Description
技术领域
本发明涉及出租车载客点的时空聚类分析数据挖掘技术和推荐技术,具体涉及一种基于投票的出租车载客点推荐方法。
背景技术
随着GPS技术、移动互联网技术、无线电通信技术等科技的不断发展,位置获取和移动计算技术的不断成熟,人们对移动对象实时位置信息的获取越来越便捷,收集这些移动对象的时空轨迹数据所需要的成本也越来越低。如通过智能手机可以感知人的活动轨迹,通过GPS传感器可以感知车辆的行驶轨迹等。移动定位技术的应用已经深入到人们生活的方方面面,由此产生的时空轨迹数据也呈几何级数增长。面对浩如烟海的时空轨迹数据,如何从中挖掘出隐藏的有益信息和实用价值越来越受到研究人员的重视,也有越来越多的研究人员投身到对时空轨迹数据挖掘的研究中去。面对海量的数据,用人工的方式处理研究显然是不现实的,因而迫切的需要一种计算机科学的方法来帮助研究人员处理和研究轨迹数据。
数据挖掘(Data Mining)就是从数据集或是海量数据中挖掘出隐藏的、前所未有的、有益于决策的关系、模式和趋势,并用挖掘出的知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,是知识发现(KDD:Knowledge Discover inDatabase)的重要步骤,已经逐渐成为计算机科学领域的研究热点。此外,他又是计算机科学的一个新的研究领域,是多门学科的交叉,所涉及到的学科包括:数据库与数据仓库、高性能计算、机器学习、人工智能、信号处理、统计学、并行计算等。数据挖掘的功能包括发现概念/类描述(Concept/Class Description)、关联和相关(Association and Relevance)、分类(Classification)、预测(Predication)、趋势分析(Trend Analysis)、离群点和偏差分析(Outlier and Deviation Analysis)以及相关性分析(Correlation Analysis)。由于数据挖掘能够指导实际应用,因此在各行各业的应用非常广泛。可以说,只要该行业拥有具有分析价值与需求的数据库或者数据仓库,皆可以利用数据挖掘的方法进行有目的的挖掘分析。
聚类(Clustering)或聚类分析(Clustering Analysis)是数据挖掘过程中最常用和最重要的技术手段之一。如果将原始的数据投射到一个二维的平面上去,原始数据在该平面上的分布是杂乱无章的。聚类的任务就是根据数据之间的相似性将相似数据组合在一起,使相似的数据在该平面上组合在一起。其中相似的对象构成的组被称为簇(Cluster)。同一个簇中的对象彼此相似,不同簇中的对象彼此相异。聚类不同与分类(Classify),是一种无监督的学习过程,不需要预先定义的类标签或者带标签的训练集,它能根据数据本身的特性将数据分成不同的类。聚类的应用领域也逐渐宽广。如零售业中,通过对用户的消费记录进行聚类可以发现不同客户群,可以将不同的用户群用他们的消费模式定义出来。
时空聚类分析(Spatio-temporal Clustering Analysis)作为时空数据挖掘的一个主要研究内容,是计算机科学与地理信息科学领域交叉研究的中的一个最前沿、最具挑战性的研究课题。时空聚类分析旨在从时空数据库中发现具有相似特征的时空实体集合(即时空簇),同时是传统的聚类分析从空间领域到时空领域的进一步扩展。现有时空聚类方法主要包括时空扫描统计方法、基于密度的方法以及基于时空距离的方法。时空聚类在城市规划、智能交通、环境卫生、地震监测分析以及犯罪热点分析等领域具有重要的应用价值,有助于更好地发现和分析地理现象发展变化趋势、规律与本质特征。
在提取了大量的时空聚类分析结果后,需要呈现给需要的用户就需要进行针对性的推荐。推荐系统(Recommend System)能够通过信息过滤技术处理信息过载问题,帮助用户发现令其感兴趣的信息,并给出推荐,从而使用户从中获利。互联网推荐系统通常使用的过滤技术包括协同过滤推荐、基于内容的推荐、基于知识的推荐和混合推荐等。其中的协同过滤推荐技术是目前应用最广泛的技术,旨在预测用户对给定物品的喜好程度。移动推荐则根据用户当前位置给移动用户推荐其需要的感兴趣的信息。如Foursquare和Facebook等基于位置的社交网络工具通过用户在目的地的“签到”服务,然后给用户推荐位置相关的服务。
虽然国内外学者针对时空聚类分析开展了很多研究,但依然面临两方面的难点:(1)时空数据具有时空耦合的特点。时空数据是空间维和时间维的有机组合,空间数据和时序数据的一些性质并不能直接推广到时空领域。如空间数据不存在过去、现在、将来的区别,而时空数据具有这些特性。(2)时空数据具有时空相关性和时空异质性两个重要性质。时空数据的分布在时间和空间上具有关联性,也会随着时间和空间的变化而产生差异。如出租车载客点的高频位置随着时间的不同呈现不同的分布特征。且目前的许多研究人员就如何提高出租车司机收益、节约能耗等问题上亦进行了很多研究,但仍然忽略了几个关键问题:(1)载客点高频位置同时具有区域性和时段性,即不同时段不同区域的载客点密集区域不同;(2)载客点推荐服务存在区域性,即不同区域的司机对不同类型属性的载客点存在兴趣。
发明内容
本发明要解决的技术问题是:针对现有技术的上述问题,提供一种能够实现空间维度信息和时间维度信息的有机结合,克服时空数据的时空相关性和时空异质性导致数据挖掘准确度不高的缺陷,有效避免由于出租车载客点因时间和空间的变化而产生的差异导致出租车载客点分析不准确的问题,时空耦合度好、出租车载客点时空分析结果准确性高、数据挖掘速度快的基于投票的出租车载客点推荐方法。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于投票的出租车载客点推荐方法,步骤包括:
1)预先从出租车GPS轨迹数据集中提取所有出租车的历史载客点数据,针对所述历史载客点数据首先分别进行先空间后时间聚类分析得到第一候选点组、进行先时间后空间聚类分析得到第二候选点组,然后剔除所有时间属性相同且欧式距离小于预设阈值的第一候选点和第二候选点,并利用所述历史载客点数据分别对被剔除的第一候选点和第二候选点进行投票打分,根据投票得分的权重为被剔除的第一候选点和第二候选点生成一个新候选点,得到由剩下的第一候选点和第二候选点、所有新候选点构成的待推荐候选载客点数据集N;
2)当需要推荐载客点的出租车司机用户发出包含目标位置和目标时间的推荐请求时,根据推荐请求的目标位置及目标时间所属时间段,从所述待推荐候选载客点数据集N中选择候选载客点并返回推荐给发出推荐请求的出租车司机用户;
所述步骤2)的详细步骤包括:
2.1)根据历史载客点数据中历史载客点的出租车司机用户信息,确定所有出租车司机用户和待推荐候选载客点数据集N中的候选载客点之间的历史载客关系集R,所述历史载客关系集R中元素的属性包括出租车司机用户编号、候选载客点编号及载客关系发生时间;
2.2)根据指定的兴趣点类型,对待推荐候选载客点数据集N中的每一个候选载客点所代表区域内的兴趣点进行类型划分,并根据各兴趣点类型比例,为每一个候选载客点确定指定数量个兴趣点类型,并利用周围指定范围内的历史载客点为每一个候选载客点进行投票打分,得到每一个候选载客点的属性包括候选载客点编号、地理位置、所属时间段、指定数量个兴趣点类型、周围指定范围内所有历史载客点对候选载客点的投票得分总和;
2.3)根据待推荐候选载客点数据集N中的每一个候选载客点的属性,计算任意两个候选载客点之间的相似性关系;
2.4)等待需要推荐载客点的出租车司机用户发出包含目标位置和目标时间的推荐请求,当需要推荐载客点的出租车司机用户发出推荐请求时,跳转执行步骤2.5);
2.5)当等待推荐载客点的出租车司机用户u发出请求时,根据请求从所述历史载客关系R中获取出租车司机用户u的历史载客候选载客点集合N(u),所述历史载客候选载客点集合N(u)为待推荐候选载客点数据集N的子集,根据请求的目标位置和目标时间确定出租车司机用户u请求的目标位置周边及目标时间所属时间段内的候选载客点集合Nr(u),并确定历史载客候选载客点集合N(u)中与请求目标位置周边及目标时间所属时间段内的候选载客点集合Nr(u)中待推荐候选载客点i相似性最大的k个候选载客点集合S(i,k,u),根据式(3)计算出租车司机用户u对待推荐候选载客点i的偏好程度,计算出租车司机用户u对请求目标位置周边及目标时间所属时间段内的候选载客点集合Nr(u)中所有待推荐的候选载客点的偏好程度,并根据偏好程度推荐指定数量的候选载客点返回给出租车司机用户u;
式(3)中,P(u,i)表示等待推荐载客点的出租车司机用户u对其请求中位置周边的候选载客点i的偏好程度,Nr(u)表示出租车司机用户u请求目标位置周边及目标时间所属时间段内的候选载客点数据集合,sim(i,j)表示候选载客点i和候选载客点j之间的余弦相似性,S(i,k,u)表示历史载客候选载客点集合N(u)中与请求目标位置周边及目标时间所属时间段内的候选载客点集合Nr(u)中待推荐候选载客点i相似性最大的k个候选载客点集合,N(u)表示出租车司机用户u的历史载客候选载客点集合。
优选地,所述步骤1)中进行先空间后时间聚类分析的详细步骤包括:首先针对所有出租车的历史载客点数据进行区域划分为至少两级区域,针对最低级区域内的历史载客点数据进行空间聚类分析,并逐级针对除最低级区域外的每一级区域,将该级区域内所有的下一级区域的空间聚类分析结果进行空间聚类分析,得到空间聚类分析的临时结果;然后将空间聚类分析的临时结果按照聚类簇中历史载客点的时间属性划分到各个时间段,如果某个时间段内空间聚类分析的临时结果所在时空簇中历史载客点比例大于预设比例阈值,则将该时间段内空间聚类分析的临时结果添加到时间聚类分析的结果中,最终得到由多个包含空间属性、时间属性的第一候选点组成的第一候选点组。
优选地,所述步骤1)中进行先时间后空间聚类分析的详细步骤包括:首先根据所有出租车的历史载客点数据的时间聚集现象,按照时间属性进行时间聚类分析,将历史载客点划分到各个时间段;然后针对出租车的历史载客点数据进行区域划分为至少两级区域,针对最低级区域内的历史载客点数据进行空间聚类分析,并逐级针对除最低级区域外的每一级区域,将该级区域内所有的下一级区域的空间聚类分析结果进行空间聚类分析,最终得到由多个包含空间属性、时间属性的第二候选点组成的第二候选点组。
优选地,所述步骤1)中利用所述历史载客点数据分别对被剔除的第一候选点和第二候选点进行投票打分时,具体是指根据式(1)对第一候选点或第二候选点进行投票打分:
式(1)中,Scorei表示待投票打分的候选点i在Disti,j范围内接受历史载客点的投票得分,d表示预设阈值,Disti,j表示候选点i、与候选点i不同组但时间属性相同的候选点j之间的欧式距离,Disti,j大于0且小于等于预设阈值d,Disti,k表示候选点i和与候选点i所处时空簇中的历史载客点k之间的欧式距离,n表示以Disti,j为半径的区域内的历史载客点数量。
优选地,所述步骤1)中根据投票得分为被剔除的第一候选点和第二候选点生成一个新候选点时,具体是指式(2)为被剔除的第一候选点和第二候选点生成一个具有代表性的新候选点;
式(2)中,Olat,lng表示具有代表性的新候选点的位置信息,Olat,lng的时间属性信息与待筛选数据组中的第一候选点相同,Plat,lng表示待筛选数据组中的第一候选点的位置信息,Scorep表示待筛选数据组中第一候选点的投票得分,Scoreq表示待筛选数据组中第二候选点的投票得分,Distp,q表示待筛选数据组中的第一候选点和第二候选点之间的欧式距离。
优选地,所述步骤2.2)利用周围指定范围内的历史载客点为每一个候选载客点进行投票打分时,具体是指根据式(4)为每一个候选载客点进行投票打分;
式(4)中,式(3)中,Scorei表示候选载客点i周围以d为半径的区域内的历史载客点对候选载客点i的投票得分,d表示预设阈值,Disti,j表示候选载客点i和历史载客点数据中历史载客点j之间的欧式距离,Disti,j大于0且小于等于预设阈值d,n表示以Disti,j为半径的区域内的历史载客点数量。
优选地,所述步骤2.3)计算任意两个候选载客点之间的相似性关系时,具体是指根据式(5)计算其中任意两个候选载客点之间的余弦相似性;
式(5)中,sim(i,j)表示待推荐候选载客点数据集N中第i个候选载客点和第j个候选载客点之间的余弦相似性,和表示待推荐候选载客点数据集N中候选载客点i和j根据所述候选载客点的属性在多维空间构造的向量,|i|和|j|为向量和向量的模。
本发明基于投票的出租车载客点推荐方法具有下述优点:
本发明提出了一种基于投票的出租车载客点推荐方法,旨在提高出租车载客点时空分析结果的准确性,能够在保证载客概率较高的情况下,进行个性化的载客点推荐,主要步骤包括步骤1)的候选载客点生成阶段和步骤2)的载客点推荐两个阶段:在候选载客点生成阶段,通过先空间后时间分析(First Time Last Space Analysis,FTLSA)获得一组候选点,通过先时间后空间分析(First Space Last Time Analysis,FSLTA)获得另一组候选点,并在候选数据过滤时根据投票的思想,让原始训练集中的每个样本依据距离对区域范围内的两组候选数据分别进行投票打分,当两组候选数据中的时间属性相同的第一候选点和第二候选点之间的欧式距离小于一定阈值时,剔除第一候选点和第二候选点,且根据两者的得分的权重计算合适的新候选点取代距离相近的被剔除的第一候选点和第二候选点,能够实现空间维度信息和时间维度信息的有机结合,克服时空数据的时空相关性和时空异质性导致数据挖掘准确度不高的缺陷,有效避免由于出租车载客点因时间和空间的变化而产生的差异导致出租车载客点分析不准确的问题,具有时空耦合度好、出租车载客点时空分析结果准确性高、数据挖掘速度快的优点。在载客点推荐阶段,能够在提高出租车司机用户收益的前提下,根据用户对载客点类别属性的喜好情况,进行出租车司机载客点的个性化推荐。在载客点推荐阶段,根据生成的候选载客点,结合协同过滤的思想,通过计算候选载客点之间的相似关系,计算候选载客点和用户之间的历史载客关系,并根据用户请求的时间和请求的地点,从待推荐候选载客点数据集中选择候选载客点并返回推荐给发出推荐请求的出租车司机用户,为用户提供个性化的推荐服务,能够在提高出租车司机用户收益的前提下,根据用户历史载客的偏好情况,进行出租车司机载客点的个性化推荐。
附图说明
图1为本发明实施例方法的流程示意图。
图2为本发明实施例中公式(1)中候选点的关系示意图。
图3为本发明实施例和现有技术的准确率对比图表。
具体实施方式
如图1所示,本实施例基于投票的出租车载客点推荐方法的步骤包括:
1)预先从出租车GPS轨迹数据集中提取所有出租车的历史载客点数据,针对所述历史载客点数据首先分别进行先空间后时间聚类分析得到第一候选点组、进行先时间后空间聚类分析得到第二候选点组,然后剔除所有时间属性相同且欧式距离小于预设阈值的第一候选点和第二候选点,并利用所述历史载客点数据分别对被剔除的第一候选点和第二候选点进行投票打分,根据投票得分的权重为被剔除的第一候选点和第二候选点生成一个新候选点,得到由剩下的第一候选点和第二候选点、所有新候选点构成的待推荐候选载客点数据集N;
2)当需要推荐载客点的出租车司机用户发出包含目标位置和目标时间的推荐请求时,根据推荐请求的目标位置及目标时间的所属时间段,从所述待推荐候选载客点数据集N中选择候选载客点并返回推荐给发出推荐请求的出租车司机用户。
本实施例中,出租车GPS轨迹数据集来源于微软亚洲研究院GeoLife项目提供的公开轨迹数据集,其中包括北京市167辆出租车从2007年4月到2010年10月的轨迹数据。本实施例中提取得到的历史载客点数据的数据格式为p(tId,uId,Lat,Lng,Date,Time),其属性p.tId表示历史载客点的编号,属性p.uId表示出租车司机用户编号,属性p.Lat表示历史载客点的经度,属性p.Lng表示历史载客点的纬度,属性p.Date表示历史载客点的日期,属性p.Time表示历史载客点的时间。
本实施例中,步骤1)中进行先空间后时间(First Time Last Space Analysis,FSLTA)聚类分析的详细步骤包括:首先针对所有出租车的历史载客点数据进行区域划分为至少两级区域,针对最低级区域内的历史载客点数据进行空间聚类分析,并逐级针对除最低级区域外的每一级区域,将该级区域内所有的下一级区域的空间聚类分析结果进行空间聚类分析,得到空间聚类分析的临时结果;然后将空间聚类分析的临时结果按照聚类簇中历史载客点的时间属性划分到各个时间段,如果某个时间段内空间聚类分析的临时结果所在时空簇中历史载客点比例大于预设比例阈值,则将该时间段内空间聚类分析的临时结果添加到时间聚类分析的结果中,最终得到由多个包含空间属性、时间属性的第一候选点组成的第一候选点组。
本实施例中,步骤1)中进行先时间后空间(First Space Last Time Analysis,FTLSA)聚类分析的详细步骤包括:首先根据所有出租车的历史载客点数据的时间聚集现象,按照时间属性进行时间聚类分析,将历史载客点划分到各个时间段;然后针对出租车的历史载客点数据进行区域划分为至少两级区域,针对最低级区域内的历史载客点数据进行空间聚类分析,并逐级针对除最低级区域外的每一级区域,将该级区域内所有的下一级区域的空间聚类分析结果进行空间聚类分析,最终得到由多个包含空间属性、时间属性的第二候选点组成的第二候选点组。
本实施例中根据历史载客点的时空变化特征,在进行先空间后时间的聚类分析得到第一候选点组、进行先时间后空间的聚类分析得到第二候选点组中的时间聚类分析时,将一天24个小时分别按照时间片(time slots)0.5小时、1小时、2小时、4小时等分来进行时空聚类分析实验,且认为若候选载客点半径50米范围内存在历史载客点,则候选载客点准确。
本实施例中,第一候选点和第二候选点的数据格式均为cp(id,Lat,Lng,Timeslots,method),其属性cp.id表示第一候选点或第二候选点的编号,属性cp.Lat表示第一候选点或第二候选点的经度,属性cp.Lng表示第一候选点或第二候选点的纬度,属性cp.Timeslots表示第一候选点或第二候选点所属的时间段,属性cp.method表示第一候选点或第二候选点的聚类分析方式,所述聚类分析方式用于区分第一候选点和第二候选点。
本实施例中,步骤1)中利用所述历史载客点数据分别对被剔除的第一候选点和第二候选点进行投票打分时,具体是指根据式(1)对第一候选点或第二候选点进行投票打分:
式(1)中,Scorei表示待投票打分的候选点i在Disti,j范围内接受历史载客点的投票得分,d表示预设阈值,Disti,j表示候选点i、与候选点i不同组但时间属性相同的候选点j之间的欧式距离,Disti,j大于0且小于等于预设阈值d,Disti,k表示候选点i和与候选点i所处时空簇中的历史载客点k之间的欧式距离,n表示以Disti,j为半径的区域内的历史载客点数量。候选点i、候选点j、候选点k的关系可参见图2,本实施例中候选点i、候选点k同属于第一候选点组,候选点i、候选点j同属于第二候选点组。
本实施例中,步骤1)中根据投票得分为被剔除的第一候选点和第二候选点生成一个新候选点时,具体是指式(2)为被剔除的第一候选点和第二候选点生成一个具有代表性的新候选点;
式(2)中,Olat,lng表示具有代表性的新候选点的位置信息,Olat,lng的时间属性信息与待筛选数据组中的第一候选点相同,Plat,lng表示待筛选数据组中的第一候选点的位置信息,Scorep表示待筛选数据组中第一候选点的投票得分,Scoreq表示待筛选数据组中第二候选点的投票得分,Distp,q表示待筛选数据组中的第一候选点和第二候选点之间的欧式距离,为加权的权重比例。需要说明的是,除了式(2)为被剔除的第一候选点和第二候选点生成一个具有代表性的新候选点外,还可以等同地采用式(2-1)为被剔除的第一候选点和第二候选点生成一个具有代表性的新候选点;
式(2-1)中,Olat,lng表示具有代表性的新候选点的位置信息,Qlat,lng表示待筛选数据组中的第二候选点的位置信息,Scorep表示待筛选数据组中第一候选点的投票得分,Scoreq表示待筛选数据组中第二候选点的投票得分,Distp,q表示待筛选数据组中的第一候选点和第二候选点之间的欧式距离,为加权的权重比例。
本实施例中,步骤2)的详细步骤包括:
2.1)根据历史载客点数据中历史载客点的出租车司机用户信息,确定所有出租车司机用户和待推荐候选载客点数据集N中的候选载客点之间的历史载客关系集R,所述历史载客关系集R中元素的属性包括出租车司机用户编号、候选载客点编号及载客关系发生时间;本实施例中,历史载客关系集R{r1,r2,..,ri,..,rn}包含n个元素,其中第i个元素ri表示某个用户和某个候选载客点之间的关系,其数据结构为r(uId,cpId,Timeslots),其属性r.uId表示出租车司机用户编号,r.cpId表示候选载客点编号,r.Timeslots表示载客关系发生时间段。
2.2)根据指定的兴趣点(Point of Interest,POI)类型,对待推荐候选载客点数据集N中的每一个候选载客点所代表区域内的兴趣点进行类型划分,并根据各兴趣点类型比例,为每一个候选载客点确定指定数量个兴趣点类型,并利用周围指定范围内的历史载客点为每一个候选载客点进行投票打分,得到每一个候选载客点的属性包括候选载客点编号、地理位置、所属时间段、指定数量个兴趣点类型、周围指定范围内所有历史载客点对候选载客点的投票得分总和;本实施例中,指定的兴趣点(Point of Interest,POI)类型包括“健康”、“餐饮”、“旅游”、“服务”、“购物”、“政府”、“教育”、“企业”、“娱乐”、“住宿”和“其他”共十一个类别,按照每个候选点所代表区域包含的POI的情况,选择占比最大的五个类别作为候选载客点的类别。最终,每一个候选载客点的数据格式为Cp{id,lat,lng,Timeslots,type[1...5],Score},其中属性Cp.id表示候选载客点编号,Cp.lat表示候选载客点的经度,Cp.lng表示候选载客点的纬度,Cp.Timeslots表示候选载客点所属时间段,Cp.type[1...5]表示占比最大五个兴趣点类别,Cp.Score表示历史载客点数据中候选载客点周围一定范围内的所有历史载客点对候选载客点的投票得分,Cp.Score的值越大表明候选载客点周围历史载客点越密集。
2.3)根据待推荐候选载客点数据集N中的每一个候选载客点的属性,计算任意两个候选载客点之间的相似性关系。
2.4)等待需要推荐载客点的出租车司机用户发出包含目标位置和目标时间的推荐请求,当需要推荐载客点的出租车司机用户发出推荐请求时,跳转执行步骤2.5)。
2.5)当等待推荐载客点的出租车司机用户u发出请求时,根据请求从所述历史载客关系R中获取出租车司机用户u的历史载客候选载客点集合N(u),所述历史载客候选载客点集合N(u)为待推荐候选载客点数据集N的子集,根据请求的目标位置和目标时间确定出租车司机用户u请求目标位置周边及目标时间所属时间段内的候选载客点集合Nr(u),并确定历史载客候选载客点集合N(u)中与请求目标位置周边及目标时间所属时间段内候选载客点集合Nr(u)中待推荐候选载客点i相似性最大的k个候选载客点集合S(i,k,u),根据式(3)计算出租车司机用户u对待推荐候选载客点i的偏好程度,计算出租车司机用户u对请求目标位置周边及目标时间所属时间段内候选载客点集合Nr(u)中所有待推荐的候选载客点的偏好程度,并根据偏好程度推荐指定数量的候选载客点返回给出租车司机用户u;
式(3)中,P(u,i)表示等待推荐载客点的出租车司机用户u对其请求中位置周边的候选载客点i的偏好程度,Nr(u)表示出租车司机用户u请求目标位置周边及目标时间所属时间段内候选载客点数据集合,sim(i,j)表示候选载客点i和候选载客点j之间的余弦相似性,S(i,k,u)表示历史载客候选载客点集合N(u)中与请求目标位置周边及目标时间所属时间段内候选载客点集合Nr(u)中待推荐候选载客点i相似性最大的k个候选载客点集合,N(u)表示出租车司机用户u的历史载客候选载客点集合。
本实施例中,步骤2.2)利用周围指定范围内的历史载客点为每一个候选载客点进行投票打分时,具体是指根据式(4)为每一个候选载客点进行投票打分;
式(4)中,式(3)中,Scorei表示候选载客点i周围以d为半径的区域内的历史载客点对候选载客点i的投票得分,d表示预设阈值,Disti,j表示候选载客点i和历史载客点数据中历史载客点j之间的欧式距离,Disti,j大于0且小于等于预设阈值d,n表示以Disti,j为半径的区域内的历史载客点数量。本实施例中,预设阈值d取值为100米。
本实施例中,步骤2.3)计算任意两个候选载客点之间的相似性关系时,具体是指根据式(5)计算其中任意两个候选载客点之间的余弦相似性;
式(5)中,sim(i,j)表示待推荐候选载客点数据集N中第i个候选载客点和第j个候选载客点之间的余弦相似性,和表示待推荐候选载客点数据集N中候选载客点i和j根据所述候选载客点的属性在多维空间构造的向量,|i|和|j|为向量和向量的模。
将本实施例基于投票的出租车载客点推荐方法中候选载客点生成阶段的候选载客点生成方法(Spatio-temporal Clustering Analysis,缩写为STA)与微软亚洲研究软的文献《where to find my next passenger》提供的层次聚类候选点获得方法(简写为MSRA)进行比较,得到本实施例和现有技术的准确率对比图表如表1所示和图3所示。
表1:本实施例载客点生成部分的时空分析方法和现有技术的准确率对比图表。
参见表1可知,与微软亚洲研究软的文献《where to find my next passenger》提供的层次聚类候选点获得方式(简写为MSRA)相比,本实施例中基于投票的出租车载客点推荐方法所采用的投票选择方式(图3中表达为“投票选择”)获得的载客点准确率普遍高于微软亚洲研究软的文献《where to find my next passenger》提供的层次聚类候选点获得方式。参见图3可知,当将本发明步骤4)候选点过滤中的投票选择方式(图3中表达为“投票选择”)更换为直接用步骤2)、3)候选点所在簇中历史载客点求交集的方式(图3中表达为“交集选择”),明显得到的载客点的准确性要低于投票选择方式。
将本实施例基于投票的出租车载客点推荐方法中载客点推荐阶段的载客点推荐方法(ItemCF)的推荐结果与传统的Top-K推荐方法的推荐结果进行对比,得到结果如表2所示。
表2:本实施例载客点推荐方法与传统的Top-K的推荐结果对比表。
推荐方法 | 推荐准确率 |
Top-K | 70.5% |
ItemCF | 87.3% |
参见表2可知,本实施例基于投票的出租车载客点推荐方法中载客点推荐阶段的载客点推荐方法(ItemCF)的推荐结果的推荐准确率达87.3%,相比传统的Top-K推荐方法的推荐结果的准确率高16.8%。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (7)
1.一种基于投票的出租车载客点推荐方法,其特征在于步骤包括:
1)预先从出租车GPS轨迹数据集中提取所有出租车的历史载客点数据,针对所述历史载客点数据首先分别进行先空间后时间聚类分析得到第一候选点组、进行先时间后空间聚类分析得到第二候选点组,然后剔除所有时间属性相同且欧式距离小于预设阈值的第一候选点和第二候选点,并利用所述历史载客点数据分别对被剔除的第一候选点和第二候选点进行投票打分,根据投票得分的权重为被剔除的第一候选点和第二候选点生成一个新候选点,得到由剩下的第一候选点和第二候选点、所有新候选点构成的待推荐候选载客点数据集N;
2)当需要推荐载客点的出租车司机用户发出包含目标位置和目标时间的推荐请求时,根据推荐请求的目标位置及目标时间所属时间段,从所述待推荐候选载客点数据集N中选择候选载客点并返回推荐给发出推荐请求的出租车司机用户;
所述步骤2)的详细步骤包括:
2.1)根据历史载客点数据中历史载客点的出租车司机用户信息,确定所有出租车司机用户和待推荐候选载客点数据集N中的候选载客点之间的历史载客关系集R,所述历史载客关系集R中元素的属性包括出租车司机用户编号、候选载客点编号及载客关系发生时间;
2.2)根据指定的兴趣点类型,对待推荐候选载客点数据集N中的每一个候选载客点所代表区域内的兴趣点进行类型划分,并根据各兴趣点类型比例,为每一个候选载客点确定指定数量个兴趣点类型,并利用周围指定范围内的历史载客点为每一个候选载客点进行投票打分,得到每一个候选载客点的属性包括候选载客点编号、地理位置、所属时间段、指定数量个兴趣点类型、周围指定范围内所有历史载客点对候选载客点的投票得分总和;
2.3)根据待推荐候选载客点数据集N中的每一个候选载客点的属性,计算任意两个候选载客点之间的相似性关系;
2.4)等待需要推荐载客点的出租车司机用户发出包含目标位置和目标时间的推荐请求,当需要推荐载客点的出租车司机用户发出推荐请求时,跳转执行步骤2.5);
2.5)当等待推荐载客点的出租车司机用户u发出请求时,根据请求从所述历史载客关系R中获取出租车司机用户u的历史载客候选载客点集合N(u),所述历史载客候选载客点集合N(u)为待推荐候选载客点数据集N的子集,根据请求的目标位置和目标时间确定出租车司机用户u请求的目标位置周边及目标时间所属时间段内的候选载客点集合Nr(u),并确定历史载客候选载客点集合N(u)中与请求目标位置周边及目标时间所属时间段内的候选载客点集合Nr(u)中待推荐候选载客点i相似性最大的k个候选载客点集合S(i,k,u),根据式(3)计算出租车司机用户u对待推荐候选载客点i的偏好程度,计算出租车司机用户u对请求目标位置周边及目标时间所属时间段内的候选载客点集合Nr(u)中所有待推荐的候选载客点的偏好程度,并根据偏好程度推荐指定数量的候选载客点返回给出租车司机用户u;
<mrow>
<msub>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mi>u</mi>
<mo>,</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>&Element;</mo>
<mi>S</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>k</mi>
<mo>,</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<mi>s</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>&Element;</mo>
<mi>N</mi>
<mrow>
<mo>(</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<mo>|</mo>
<mi>si</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
</mrow>
</mfrac>
<mo>,</mo>
<mi>i</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>r</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>u</mi>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
式(3)中,P(u,i)表示等待推荐载客点的出租车司机用户u对其请求中位置周边的候选载客点i的偏好程度,Nr(u)表示出租车司机用户u请求目标位置周边及目标时间所属时间段内的候选载客点数据集合,sim(i,j)表示候选载客点i和候选载客点j之间的余弦相似性,S(i,k,u)表示历史载客候选载客点集合N(u)中与请求目标位置周边及目标时间所属时间段内的候选载客点集合Nr(u)中待推荐候选载客点i相似性最大的k个候选载客点集合,N(u)表示出租车司机用户u的历史载客候选载客点集合。
2.根据权利要求1所述的基于投票的出租车载客点推荐方法,其特征在于,所述步骤1)中进行先空间后时间聚类分析的详细步骤包括:首先针对所有出租车的历史载客点数据进行区域划分为至少两级区域,针对最低级区域内的历史载客点数据进行空间聚类分析,并逐级针对除最低级区域外的每一级区域,将该级区域内所有的下一级区域的空间聚类分析结果进行空间聚类分析,得到空间聚类分析的临时结果;然后将空间聚类分析的临时结果按照聚类簇中历史载客点的时间属性划分到各个时间段,如果某个时间段内空间聚类分析的临时结果所在时空簇中历史载客点比例大于预设比例阈值,则将该时间段内空间聚类分析的临时结果添加到时间聚类分析的结果中,最终得到由多个包含空间属性、时间属性的第一候选点组成的第一候选点组。
3.根据权利要求2所述的基于投票的出租车载客点推荐方法,其特征在于,所述步骤1)中进行先时间后空间聚类分析的详细步骤包括:首先根据所有出租车的历史载客点数据的时间聚集现象,按照时间属性进行时间聚类分析,将历史载客点划分到各个时间段;然后针对出租车的历史载客点数据进行区域划分为至少两级区域,针对最低级区域内的历史载客点数据进行空间聚类分析,并逐级针对除最低级区域外的每一级区域,将该级区域内所有的下一级区域的空间聚类分析结果进行空间聚类分析,最终得到由多个包含空间属性、时间属性的第二候选点组成的第二候选点组。
4.根据权利要求3所述的基于投票的出租车载客点推荐方法,其特征在于,所述步骤1)中利用所述历史载客点数据分别对被剔除的第一候选点和第二候选点进行投票打分时,具体是指根据式(1)对第一候选点或第二候选点进行投票打分:
<mrow>
<msub>
<mi>Score</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<mfrac>
<mrow>
<msub>
<mi>Dist</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>k</mi>
</mrow>
</msub>
</mrow>
<mrow>
<msub>
<mi>Dist</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
</msub>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
<mo>,</mo>
<msub>
<mi>Dist</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
</msub>
<mo>&Element;</mo>
<mo>(</mo>
<mn>0</mn>
<mo>,</mo>
<mi>d</mi>
<mo>&rsqb;</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
式(1)中,Scorei表示待投票打分的候选点i在Disti,j范围内接受历史载客点的投票得分,d表示预设阈值,Disti,j表示候选点i、与候选点i不同组但时间属性相同的候选点j之间的欧式距离,Disti,j大于0且小于等于预设阈值d,Disti,k表示候选点i和与候选点i所处时空簇中的历史载客点k之间的欧式距离,n表示以Disti,j为半径的区域内的历史载客点数量。
5.根据权利要求4所述的基于投票的出租车载客点推荐方法,其特征在于,所述步骤1)中根据投票得分为被剔除的第一候选点和第二候选点生成一个新候选点时,具体是指式(2)为被剔除的第一候选点和第二候选点生成一个具有代表性的新候选点;
<mrow>
<msub>
<mi>O</mi>
<mrow>
<mi>l</mi>
<mi>a</mi>
<mi>t</mi>
<mo>,</mo>
<mi>ln</mi>
<mi>g</mi>
</mrow>
</msub>
<mo>=</mo>
<msub>
<mi>P</mi>
<mrow>
<mi>l</mi>
<mi>a</mi>
<mi>t</mi>
<mo>,</mo>
<mi>l</mi>
<mi>n</mi>
<mi>g</mi>
</mrow>
</msub>
<mo>+</mo>
<mfrac>
<mrow>
<msub>
<mi>Score</mi>
<mi>p</mi>
</msub>
<mo>*</mo>
<msub>
<mi>Dist</mi>
<mrow>
<mi>p</mi>
<mo>,</mo>
<mi>q</mi>
</mrow>
</msub>
</mrow>
<mrow>
<msub>
<mi>Score</mi>
<mi>q</mi>
</msub>
<mo>+</mo>
<msub>
<mi>Score</mi>
<mi>p</mi>
</msub>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
式(2)中,Olat,lng表示具有代表性的新候选点的位置信息,Olat,lng的时间属性信息与待筛选数据组中的第一候选点相同,Plat,lng表示待筛选数据组中的第一候选点的位置信息,Scorep表示待筛选数据组中第一候选点的投票得分,Scoreq表示待筛选数据组中第二候选点的投票得分,Distp,q表示待筛选数据组中的第一候选点和第二候选点之间的欧式距离。
6.根据权利要求1所述的基于投票的出租车载客点推荐方法,其特征在于,所述步骤2.2)利用周围指定范围内的历史载客点为每一个候选载客点进行投票打分时,具体是指根据式(4)为每一个候选载客点进行投票打分;
<mrow>
<msub>
<mi>Score</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<mfrac>
<mrow>
<msub>
<mi>Dist</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
</msub>
</mrow>
<mi>d</mi>
</mfrac>
<mo>)</mo>
</mrow>
<mo>,</mo>
<msub>
<mi>Dist</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
</msub>
<mo>&Element;</mo>
<mo>(</mo>
<mn>0</mn>
<mo>,</mo>
<mi>d</mi>
<mo>&rsqb;</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
式(4)中,式(3)中,Scorei表示候选载客点i周围以d为半径的区域内的历史载客点对候选载客点i的投票得分,d表示预设阈值,Disti,j表示候选载客点i和历史载客点数据中历史载客点j之间的欧式距离,Disti,j大于0且小于等于预设阈值d,n表示以Disti,j为半径的区域内的历史载客点数量。
7.根据权利要求6所述的基于投票的出租车载客点推荐方法,其特征在于,所述步骤2.3)计算任意两个候选载客点之间的相似性关系时,具体是指根据式(5)计算其中任意两个候选载客点之间的余弦相似性;
<mrow>
<mi>s</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>c</mi>
<mi>o</mi>
<mi>s</mi>
<mrow>
<mo>(</mo>
<mover>
<mi>i</mi>
<mo>&RightArrow;</mo>
</mover>
<mo>,</mo>
<mover>
<mi>j</mi>
<mo>&RightArrow;</mo>
</mover>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<mover>
<mi>i</mi>
<mo>&RightArrow;</mo>
</mover>
<mo>*</mo>
<mover>
<mi>j</mi>
<mo>&RightArrow;</mo>
</mover>
</mrow>
<mrow>
<mrow>
<mo>|</mo>
<mi>i</mi>
<mo>|</mo>
</mrow>
<mrow>
<mo>|</mo>
<mi>j</mi>
<mo>|</mo>
</mrow>
</mrow>
</mfrac>
<mo>,</mo>
<mi>i</mi>
<mo>&Element;</mo>
<mi>N</mi>
<mo>,</mo>
<mi>j</mi>
<mo>&Element;</mo>
<mi>N</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
式(5)中,sim(i,j)表示待推荐候选载客点数据集N中第i个候选载客点和第j个候选载客点之间的余弦相似性,和表示待推荐候选载客点数据集N中候选载客点i和j根据所述候选载客点的属性在多维空间构造的向量,|i|和|j|为向量和向量的模。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510404663.4A CN105045858B (zh) | 2015-07-10 | 2015-07-10 | 基于投票的出租车载客点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510404663.4A CN105045858B (zh) | 2015-07-10 | 2015-07-10 | 基于投票的出租车载客点推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105045858A CN105045858A (zh) | 2015-11-11 |
CN105045858B true CN105045858B (zh) | 2018-04-13 |
Family
ID=54452405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510404663.4A Active CN105045858B (zh) | 2015-07-10 | 2015-07-10 | 基于投票的出租车载客点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105045858B (zh) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10467554B2 (en) | 2013-03-14 | 2019-11-05 | Lyft, Inc. | System for connecting a driver and a rider |
SG10201600024TA (en) * | 2016-01-04 | 2017-08-30 | Grabtaxi Holdings Pte Ltd | System and Method for Multiple-Round Driver Selection |
CN105808784B (zh) * | 2016-03-31 | 2020-07-07 | 北京星选科技有限公司 | 推荐方法和装置 |
CN105825310A (zh) * | 2016-04-11 | 2016-08-03 | 湖南科技大学 | 基于信息熵的出租车寻客路线推荐方法 |
CN106227884B (zh) * | 2016-08-08 | 2019-12-03 | 深圳市未来媒体技术研究院 | 一种基于协同过滤的在线打车推荐方法 |
CN106528597B (zh) * | 2016-09-23 | 2019-07-05 | 百度在线网络技术(北京)有限公司 | 兴趣点的标注方法以及装置 |
CN108536695B (zh) * | 2017-03-02 | 2021-06-04 | 北京嘀嘀无限科技发展有限公司 | 一种地理位置信息点的聚合方法以及装置 |
US9769616B1 (en) | 2017-04-04 | 2017-09-19 | Lyft, Inc. | Geohash-related location predictions |
CN108733715B (zh) * | 2017-04-21 | 2022-02-01 | 北京嘀嘀无限科技发展有限公司 | 建筑物出入口位置的确定方法及装置 |
CN107220312B (zh) * | 2017-05-12 | 2020-08-14 | 华中科技大学 | 一种基于共现图的兴趣点推荐方法及系统 |
CN107862030B (zh) * | 2017-11-01 | 2020-07-31 | 平安科技(深圳)有限公司 | 出险待命位置确定方法、装置、计算机设备和存储介质 |
CN108021628B (zh) * | 2017-11-22 | 2021-12-21 | 华南理工大学 | 一种科技主题的管理系统 |
US10349223B1 (en) | 2017-12-14 | 2019-07-09 | Lyft, Inc. | Initiating transportation requests |
CN108491540B (zh) * | 2018-03-30 | 2022-02-22 | 北京百度网讯科技有限公司 | 文本信息推送方法、装置及智能终端 |
CN111866727B (zh) * | 2018-10-09 | 2024-03-29 | 江苏满运软件科技有限公司 | 司机聚集点的展示方法、装置、电子设备、存储介质 |
CN109508749B (zh) * | 2018-11-30 | 2023-07-25 | 重庆大学 | 一种基于深度知识表达的聚类分析系统及方法 |
CN110175713B (zh) * | 2019-05-22 | 2021-03-30 | 北京交通大学 | 分时租赁汽车用户出行目的预测方法 |
CN110362740B (zh) * | 2019-06-10 | 2022-03-08 | 河海大学 | 一种水利门户信息混合推荐方法 |
CN110472758A (zh) * | 2019-08-19 | 2019-11-19 | 泰康保险集团股份有限公司 | 就医预约方法、装置、设备及可读存储介质 |
CN114041129A (zh) * | 2019-11-04 | 2022-02-11 | 北京嘀嘀无限科技发展有限公司 | 确定上车点名称的系统和方法 |
CN111859178B (zh) * | 2020-04-22 | 2024-04-09 | 北京嘀嘀无限科技发展有限公司 | 一种推荐上车点的方法和系统 |
CN112347376B (zh) * | 2020-09-11 | 2023-10-27 | 辽宁师范大学 | 基于多时空聚类的出租车载客点推荐方法 |
CN112818216B (zh) * | 2021-01-13 | 2021-09-28 | 平安科技(深圳)有限公司 | 客户推荐方法、装置、电子设备及存储介质 |
CN113868553B (zh) * | 2021-09-18 | 2024-06-14 | 湖南科技大学 | 一种层次化的出租车载客推荐方法及系统 |
CN117495432B (zh) * | 2023-11-22 | 2024-05-28 | 北京亿家老小科技有限公司 | 一种多时间尺度投票式用户潜在需求分析方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020284A (zh) * | 2012-12-28 | 2013-04-03 | 刘建勋 | 一种基于时空聚类的出租车载客点推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8738289B2 (en) * | 2011-01-04 | 2014-05-27 | International Business Machines Corporation | Advanced routing of vehicle fleets |
-
2015
- 2015-07-10 CN CN201510404663.4A patent/CN105045858B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020284A (zh) * | 2012-12-28 | 2013-04-03 | 刘建勋 | 一种基于时空聚类的出租车载客点推荐方法 |
Non-Patent Citations (2)
Title |
---|
"Recommending Pick-up Points for Taxi-drivers based on Spatio-temporal Clustering";Mingyue Zhang et al;《2012 Second International Conference on Cloud and Green Computing》;20121231;第67-72页 * |
基于时空上下文协同过滤的出租车载客点推荐算法;钱文逸等;《计算机应用》;20150610;第1659-1662,1667页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105045858A (zh) | 2015-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105045858B (zh) | 基于投票的出租车载客点推荐方法 | |
Yao et al. | Sensing spatial distribution of urban land use by integrating points-of-interest and Google Word2Vec model | |
WO2020238631A1 (zh) | 一种基于手机信令数据的人群类型识别方法 | |
Zhang et al. | The Traj2Vec model to quantify residents’ spatial trajectories and estimate the proportions of urban land-use types | |
Chen et al. | TripImputor: Real-time imputing taxi trip purpose leveraging multi-sourced urban data | |
Zhao et al. | A trajectory clustering approach based on decision graph and data field for detecting hotspots | |
Xu et al. | Characterizing destination networks through mobility traces of international tourists—A case study using a nationwide mobile positioning dataset | |
Kim | Exploring the difference between ridership patterns of subway and taxi: Case study in Seoul | |
Huang et al. | Predicting human mobility with activity changes | |
Chen et al. | What factors influence ridership of station-based bike sharing and free-floating bike sharing at rail transit stations? | |
Guo et al. | Detecting spatial community structure in movements | |
Kang et al. | The Association Between SOC and Land Prices Considering Spatial Heterogeneity Based on Finite Mixture Modeling | |
Mo et al. | A two-stage clustering approach for multi-region segmentation | |
Deng et al. | A density-based approach for detecting network-constrained clusters in spatial point events | |
Hu et al. | Nonnegative matrix tri-factorization with user similarity for clustering in point-of-interest | |
Zhao et al. | Development of a global positioning system data-based trip-purpose inference method for hazardous materials transportation management | |
CN112800210B (zh) | 基于海量公交数据的人群画像算法 | |
CN106528812A (zh) | 一种基于usdr模型的云推荐方法 | |
Zhao et al. | Unveiling cabdrivers’ dining behavior patterns for site selection of ‘taxi canteen’using taxi trajectory data | |
Wu et al. | Research themes of geographical information science during 1991–2020: a retrospective bibliometric analysis | |
CN108898244B (zh) | 一种耦合多源要素的数字标牌位置推荐方法 | |
McKenzie et al. | Measuring urban regional similarity through mobility signatures | |
Dalumpines et al. | Making mode detection transferable: extracting activity and travel episodes from GPS data using the multinomial logit model and Python | |
Zhuang et al. | From compound word to metropolitan station: Semantic similarity analysis using smart card data | |
Liu et al. | BiFlowAMOEBA for the identification of arbitrarily shaped clusters in bivariate flow data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |