CN108171533A - 基于智能公交卡数据的车载广告公交线路推荐方法及装置 - Google Patents
基于智能公交卡数据的车载广告公交线路推荐方法及装置 Download PDFInfo
- Publication number
- CN108171533A CN108171533A CN201711310490.5A CN201711310490A CN108171533A CN 108171533 A CN108171533 A CN 108171533A CN 201711310490 A CN201711310490 A CN 201711310490A CN 108171533 A CN108171533 A CN 108171533A
- Authority
- CN
- China
- Prior art keywords
- bus network
- public bus
- public
- bus
- passenger
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0265—Vehicular advertisement
- G06Q30/0266—Vehicular advertisement based on the position of the vehicle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0254—Targeted advertisements based on statistics
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于智能公交卡数据的车载广告公交线路推荐方法及装置,该方法包括获取指定区域内的公交线路及各公交线路所覆盖的公交车站;获取各公交线路对应的智能公交卡数据SCT,基于智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度和/或各公交线路的客流量;根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。由此,本发明实施例通过收集智能公交卡数据,并借助先进的数据挖掘技术来深度挖掘公交车和乘客的时空流动性以及公交车站的枢纽度,从而为广告投放公交线路的选取提供准确的信息支撑。
Description
技术领域
本发明涉及数据挖掘技术领域,特别是涉及一种基于智能公交卡数据的车载广告公交线路推荐方法及装置。
背景技术
随着城市和公共交通系统的发展,公交已经成为城市居民重要的出行交通工具之一,也是一种渗透力极强的户外广告媒体。尽管公交每天承载着大量的用户群体,然而目标广告收益没有得到很好的效果,其主要原因在于仍然依靠传统简单的粗略计价方式,一般是根据一条公交车线路覆盖的城区范围或者一辆公交车车载的乘客数量来评估公交线路上的广告效果并定价。事实上,这不能科学地评估实际的广告投放效果与收入比。因此广告商纷纷从线下广告投放转向“用户点击计费”这种更加清晰的线上广告方式。
由于城市公交线路繁多复杂,公交车站在不同时段乘客流量差异较大,此外每条公交线路会经过不同的功能区域、乘客类型不同,导致对不同领域的广告效果也不同,因此如何科学、精确地投放广告公交线路是一个亟待解决的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于智能公交卡数据的车载广告公交线路推荐方法及装置。
根据本发明的一方面,提供了一种基于智能公交卡数据的车载广告公交线路推荐方法,包括:
获取指定区域内的公交线路及各公交线路所覆盖的公交车站;
获取各公交线路对应的智能公交卡数据SCT,基于所述智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度和/或各公交线路的客流量;
根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。
可选地,基于所述智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度,包括:
对所述智能公交卡数据进行处理,计算得到乘客的轨迹数据;
根据乘客的轨迹数据中途经车站序列,计算各公交车站作为中转车站的度量的枢纽度。
可选地,所述智能公交卡数据中包括公交线路编号、乘客上下车时间、乘客上下车车站编号,对所述智能公交卡数据进行处理,计算得到乘客的轨迹数据,包括:
将智能公交卡数据中的乘客上下车车站编号记为车站收费编号;
基于所述乘客上下车车站收费编号,按照预设策略计算出智能公交卡数据中乘客上下车车站的逻辑编号;
依据所述乘客上下车车站的逻辑编号确定所述乘客途经车站编号序列,从而得到包含公交线路编号、乘客上下车时间、所述乘客途经车站编号序列的乘客轨迹数据。
可选地,基于所述乘客上下车车站收费编号,按照预设策略计算出乘客上车车站的逻辑编号,包括:
将同一公交车上的智能公交卡数据按照乘客上车时间进行排序,得到排序后的智能公交卡数据;
对排序后的智能公交卡数据进行分组,将排序后的智能公交卡数据中的乘客上车车站收费编号相同的分为一组;
对每一组智能公交卡数据使用聚类算法进行聚类,得到的聚类个数作为车站收费编号对应的实际车站个数;
针对每个聚类中的智能公交卡数据计算上车时间平均值;
将多个聚类按照上车时间平均值进行排序,并按照排序确定每个聚类中智能公交卡数据的乘客上车车站逻辑编号。
可选地,根据乘客的轨迹数据中途经车站序列,计算各公交车站作为中转车站的度量的枢纽度,包括:
基于所述乘客轨迹数据挖掘出长度大于n的序列,记为目标序列,n为正整数;
统计目标序列中与各序列相同的乘客轨迹数量,并作为相应序列的权值;
基于目标序列中各序列的权值,将包含相同车站的序列进行合并,得到连接模式网络;
根据连接模式网络,计算公交线路上的每个公交车站的枢纽度。
可选地,根据计算得到的各公交车站的枢纽度,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐,包括:
将指定区域内的公交线路组成候选线路集合,提取所述候选线路集合中公交线路覆盖的公交车站,组成候选车站集合;
遍历所述乘客轨迹数据,提取包含有所述候选车站集合中任意公交车站的乘客轨迹数据,并组成候选轨迹集合;
结合每个公交车站的枢纽度,计算所述候选轨迹集合中的每条乘客轨迹对于所述候选线路集合中的公交线路的权重;
根据每条乘客轨迹对于所述候选线路集合的公交线路中的权重,计算所述候选线路集合中的任意公交线路的覆盖度,并选取覆盖度最大的公交线路作为广告投放公交线路进行推荐。
可选地,根据每条乘客轨迹对于所述候选线路集合的公交线路中的权重,计算所述候选线路集合中的任意公交线路的覆盖度,包括:
遍历所述候选线路集合中所有公交线路,对于任一公交线路,在所述候选车站集合中提取所述任一公交线路覆盖的公交站集合,并在所述候选轨迹集合中提取该公交站集合覆盖的所有乘客轨迹;
根据每条乘客轨迹对于所述候选线路集合的公交线路中的权重,对该公交站集合覆盖的所有乘客轨迹在所述任一公交线路的权重求和,得到所述任一公交线路的覆盖度。
可选地,所述选取覆盖度最大的公交线路作为广告投放公交线路进行推荐,包括:
从所述候选线路集合中选取覆盖度最大的公交线路,将选取的公交线路添加至预置的已挑选公交线路集合中,并将其从所述候选线路集合中删除;
确定选取的公交线路覆盖的乘客轨迹,将该乘客轨迹添加至预置的已覆盖乘客轨迹集合中,并从所述候选轨迹集合中删除;
判断已挑选公交线路集合中的公交线路的数量是否等于预设阈值;若否,则继续在删减后的候选线路中选取覆盖度最大的公交线路添加至所述预置的已挑选公交线路集合中,直到已挑选公交线路集合中的公交线路的数量等于预设阈值;
将预置的已挑选公交线路集合中的公交线路作为广告投放公交线路进行推荐。
可选地,基于所述智能公交卡数据并按照预设规则计算出各公交线路的客流量,包括:
对所述智能公交卡数据进行筛选操作,提取指定时间范围内的智能公交卡数据;
对所述指定时间范围内的智能公交卡数据进行处理,得到包含指定信息的智能公交卡数据,所述指定信息包括公交卡ID、公交线路ID、乘客上车时间、乘客下车时间、乘客上车车站ID和/或地理位置信息、乘客下车车站ID和/或地理位置信息;
结合各公交车站的数据和包含指定信息的智能公交卡数据,在全天各个时段内,计算每个公交车站上车和下车乘客数量的总和,减去公交卡ID重复的乘客数量,得到每个公交车站在该时段的乘客流量;
根据公交线路数据,确定每条公交线路所经过的所有公交车站;
在全天各个时段内,计算每条公交线路所经过所有公交车站乘客流量的总和,减去公交卡ID重复的乘客数量,得到每条公交线路在该时段的乘客流量,从而得到各公交线路全天时客流量。
可选地,根据计算得到的各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐,包括:
设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围;
结合广告投放需求和各公交线路的客流量,在获取的各公交线路中选取公交线路客流量达到第一阈值的至少一条公交线路,并作为广告投放公交线路进行推荐。
可选地,根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐,包括:
设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围;
结合广告投放需求和各公交线路的客流量,在获取的各公交线路中选取公交线路客流量达到第一阈值的多条公交线路;
从客流量达到第一阈值的多条公交线路中获取其覆盖的公交车站,分析各公交车站的枢纽度;
选取公交车站的枢纽度达到第二阈值的公交车站,并将达到第二阈值的公交车站所属公交线路中的至少一条公交线路作为广告投放公交线路进行推荐。
依据本发明的另一方面,还提供了一种基于智能公交卡数据的车载广告公交线路推荐装置,包括:
获取模块,适于获取指定区域内的公交线路及各公交线路所覆盖的公交车站;
计算模块,适于获取各公交线路对应的智能公交卡数据SCT,基于所述智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度和/或各公交线路的客流量;
推荐模块,适于根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。
可选地,所述计算模块还适于:
对所述智能公交卡数据进行处理,计算得到乘客的轨迹数据;
根据乘客的轨迹数据中途经车站序列,计算各公交车站作为中转车站的度量的枢纽度。
可选地,所述计算模块还适于:
将智能公交卡数据中的乘客上下车车站编号记为车站收费编号;
基于所述乘客上下车车站收费编号,按照预设策略计算出智能公交卡数据中乘客上下车车站的逻辑编号;
依据所述乘客上下车车站的逻辑编号确定所述乘客途经车站编号序列,从而得到包含公交线路编号、乘客上下车时间、所述乘客途经车站编号序列的乘客轨迹数据。
可选地,所述计算模块还适于:
将同一公交车上的智能公交卡数据按照乘客上车时间进行排序,得到排序后的智能公交卡数据;
对排序后的智能公交卡数据进行分组,将排序后的智能公交卡数据中的乘客上车车站收费编号相同的分为一组;
对每一组智能公交卡数据使用聚类算法进行聚类,得到的聚类个数作为车站收费编号对应的实际车站个数;
针对每个聚类中的智能公交卡数据计算上车时间平均值;
将多个聚类按照上车时间平均值进行排序,并按照排序确定每个聚类中智能公交卡数据的乘客上车车站逻辑编号。
可选地,所述计算模块还适于:
基于所述乘客轨迹数据挖掘出长度大于n的序列,记为目标序列,n为正整数;
统计目标序列中与各序列相同的乘客轨迹数量,并作为相应序列的权值;
基于目标序列中各序列的权值,将包含相同车站的序列进行合并,得到连接模式网络;
根据连接模式网络,计算公交线路上的每个公交车站的枢纽度。
可选地,所述推荐模块还适于:将指定区域内的公交线路组成候选线路集合,提取所述候选线路集合中公交线路覆盖的公交车站,组成候选车站集合;
遍历所述乘客轨迹数据,提取包含有所述候选车站集合中任意公交车站的乘客轨迹数据,并组成候选轨迹集合;
结合每个公交车站的枢纽度,计算所述候选轨迹集合中的每条乘客轨迹对于所述候选线路集合中的公交线路的权重;
根据每条乘客轨迹对于所述候选线路集合的公交线路中的权重,计算所述候选线路集合中的任意公交线路的覆盖度,并选取覆盖度最大的公交线路作为广告投放公交线路进行推荐。
可选地,所述推荐模块还适于:
遍历所述候选线路集合中所有公交线路,对于任一公交线路,在所述候选车站集合中提取所述任一公交线路覆盖的公交站集合,并在所述候选轨迹集合中提取该公交站集合覆盖的所有乘客轨迹;
根据每条乘客轨迹对于所述候选线路集合的公交线路中的权重,对该公交站集合覆盖的所有乘客轨迹在所述任一公交线路的权重求和,得到所述任一公交线路的覆盖度。
可选地,所述推荐模块还适于:
从所述候选线路集合中选取覆盖度最大的公交线路,将选取的公交线路添加至预置的已挑选公交线路集合中,并将其从所述候选线路集合中删除;
确定选取的公交线路覆盖的乘客轨迹,将该乘客轨迹添加至预置的已覆盖乘客轨迹集合中,并从所述候选轨迹集合中删除;
判断已挑选公交线路集合中的公交线路的数量是否等于预设阈值;若否,则继续在删减后的候选线路中选取覆盖度最大的公交线路添加至所述预置的已挑选公交线路集合中,直到已挑选公交线路集合中的公交线路的数量等于预设阈值;
将预置的已挑选公交线路集合中的公交线路作为广告投放公交线路进行推荐。
可选地,所述计算模块还适于:对所述智能公交卡数据进行筛选操作,提取指定时间范围内的智能公交卡数据;
对所述指定时间范围内的智能公交卡数据进行处理,得到包含指定信息的智能公交卡数据,所述指定信息包括公交卡ID、公交线路ID、乘客上车时间、乘客下车时间、乘客上车车站ID和/或地理位置信息、乘客下车车站ID和/或地理位置信息;
结合各公交车站的数据和包含指定信息的智能公交卡数据,在全天各个时段内,计算每个公交车站上车和下车乘客数量的总和,减去公交卡ID重复的乘客数量,得到每个公交车站在该时段的乘客流量;
根据公交线路数据,确定每条公交线路所经过的所有公交车站;
在全天各个时段内,计算每条公交线路所经过所有公交车站乘客流量的总和,减去公交卡ID重复的乘客数量,得到每条公交线路在该时段的乘客流量,从而得到各公交线路全天时客流量。
可选地,所述推荐模块还适于:
设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围;
结合广告投放需求和各公交线路的客流量,在获取的各公交线路中选取公交线路客流量达到第一阈值的至少一条公交线路,并作为广告投放公交线路进行推荐。
可选地,所述推荐模块还适于:
设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围;
结合广告投放需求和各公交线路的客流量,在获取的各公交线路中选取公交线路客流量达到第一阈值的多条公交线路;
从客流量达到第一阈值的多条公交线路中获取其覆盖的公交车站,分析各公交车站的枢纽度;
选取公交车站的枢纽度达到第二阈值的公交车站,并将达到第二阈值的公交车站所属公交线路中的至少一条公交线路作为广告投放公交线路进行推荐。
依据本发明的再一方面,还提供了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据上文任意实施例所述的基于智能公交卡数据的车载广告公交线路推荐方法。
依据本发明的再一方面,还提供了一种计算机存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行根据文任意实施例所述的基于智能公交卡数据的车载广告公交线路推荐方法。
在本发明实施例中,首先获取指定区域内的公交线路及各公交线路所覆盖的公交车站。然后,获取各公交线路对应的智能公交卡数据SCT,基于智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度和/或各公交线路的客流量。最后,根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。由此,本发明实施例通过收集智能公交卡数据,并借助先进的数据挖掘技术来深度挖掘公交车和乘客的时空流动性以及公交车站的枢纽度,从而为广告投放公交线路的选取提供准确的信息支撑。进一步地,本发明实施例还有效地克服了现有技术中无法在最适宜的时间、地点将最适合的广告传播给最适合的受众,无法发挥广告的最大价值的问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的基于智能公交卡数据的车载广告公交线路推荐方法的流程示意图;
图2示出了根据本发明一个实施例的乘客的轨迹数据的计算方法的流程示意图;
图3示出了根据本发明一实施例的北京510路公交车各车站编号的示意图;
图4示出了根据本发明一实施例的Temproal-IdeaGraph算法的流程示意图;
图5示出了根据本发明一个实施例的车载广告公交线路推荐过程的整体架构图;
图6示出了根据本发明一个实施例的基于智能公交卡数据的车载广告公交线路推荐装置的结构示意图;
图7示出了用于执行根据本发明的基于智能公交卡数据的车载广告公交线路推荐方法的计算设备的框图;以及
图8示出了用于保持或者携带实现根据本发明的基于智能公交卡数据的车载广告公交线路推荐方法的程序代码的存储单元。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为解决上述技术问题,本发明实施例提供了一种基于智能公交卡数据的车载广告公交线路推荐方法。图1示出了根据本发明一个实施例的基于智能公交卡数据的车载广告公交线路推荐方法的流程示意图。参见图1,该方法至少包括步骤S102至步骤S106。
步骤S102,获取指定区域内的公交线路及各公交线路所覆盖的公交车站。
该步骤中,指定区域可以是指定城市(如北京市、石家庄市等)、指定省份(如河北省、山东省等)、指定城市中的某一行政区域(如北京海淀区、北京朝阳区等)等等,本发明对指定区域不做具体的限定。
步骤S104,获取各公交线路对应的智能公交卡数据(SCT,Smart CardTransaction),基于智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度和/或各公交线路的客流量。
在该实施例中,智能公交卡数据为持卡者乘坐公交车的记录。一条记录包括持卡者一次乘车记录,具体包括公交卡ID、公交卡类型、记录插入时间、公交线路ID、公交车ID、乘客上车时间、乘客下车时间、上车车站ID、下车车站ID等。
该步骤中,枢纽度用于度量公交车站作为中转车站的数量,车站公交车数量越多、换乘人数越大,则枢纽度越大,同时还能度量公交车站客流量。公交车站客流量是指在某一时间段内在该公交车站停留的乘客数量,即在时间段内在该站上车和下车的乘客数量总和,并减去公交卡ID重复的数量。公交线路客流量是指在某一时间段内、某公交线路沿线各车站乘客数量的总和,减去公交卡ID重复的数量。
步骤S106,根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。
本发明实施例通过收集智能公交卡数据,并借助先进的数据挖掘技术来深度挖掘公交车和乘客的时空流动性以及公交车站的枢纽度,从而为广告投放公交线路的选取提供准确的信息支撑。进一步地,本发明实施例还有效地克服了现有技术中无法在最适宜的时间、地点将最适合的广告传播给最适合的受众,无法发挥广告的最大价值的问题。
参见上文步骤S104,现介绍基于智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度的过程。
在该实施例中,若要计算各公交车站的枢纽度,第一步需要对智能公交卡数据进行处理,计算得到乘客的轨迹数据。第二步根据乘客的轨迹数据中途经车站序列,计算各公交车站作为中转车站的度量的枢纽度。
具体的,第一步,对乘客的轨迹数据的计算过程请参见图2及如下步骤:
步骤S202,从智能公交卡数据中获取公交线路编号、乘客上下车时间、乘客上下车车站编号。
步骤S204,将智能公交卡数据中的乘客上下车车站编号记为车站收费编号。
步骤S206,基于乘客上下车车站收费编号,按照预设策略计算出智能公交卡数据中乘客上下车车站的逻辑编号。
由于在现有技术中,智能公交卡数据中(上车和下车)车站编号为车站的收费编号。因此存在多个车站共用同一编号的问题。如图3所示为北京510路公交车各车站编号,在智能公交卡数据中“地铁林萃桥站”和“京师园北门”的编号相同(都为4)。这种编号方式会导致无法精确分析每个车站的客流量和枢纽度的问题,因此需要将车站的收费编号映射为实际的逻辑编号。后文将会具体介绍如何将车站的收费编号映射为实际的逻辑编号。
步骤S208,依据乘客上下车车站的逻辑编号确定乘客途经车站编号序列,从而得到包含公交线路编号、乘客上下车时间、乘客途经车站编号序列的乘客轨迹数据。
例如,以北京510路公交车为例,通过分析得到乘客A途经车站编号序列对应的车站为“双泉堡东”、“地铁林萃桥站”、“京师园北门”、“林萃路口北”,且乘客A的上车时间为8:00,下车时间为8:40。从而可以得到乘客A的轨迹数据为在8:00时刻从“双泉堡东”乘坐510路公交,乘坐四站地后于8:40到达“林萃路口北”下车。此处公交线路编号采用公交车的编号,当然还可以采用其他唯一编码作为相应的公交线路编号,本发明实施例对此不做具体限定。
在本发明一实施例中,将车站的收费编号映射为实际的逻辑编号的过程可以是:首先,将同一公交车上的智能公交卡数据按照乘客上车时间进行排序,得到排序后的智能公交卡数据。
其次,对排序后的智能公交卡数据进行分组,将排序后的智能公交卡数据中的乘客上车车站收费编号相同的分为一组。如图3中的北京510路公交车中,分组之后对应的车站可以是“双泉堡东”分为第一组,“地铁林萃桥站”和“京师园北门”分为第二组、“南沟泥河”分为四组,显示的其他车站分为三组。
然后,对每一组智能公交卡数据使用聚类算法进行聚类,得到的聚类个数作为车站收费编号对应的实际车站个数。此处,可以采用K-Means算法对每一组智能公交卡数据进行聚类。当然还可以采用其他的聚类算法,本发明实施例对此不做具体限定。例如,对上述各组车站进行聚类之后,第一组车站“双泉堡东”对应的智能公交卡数据聚类后,得到的聚类个数为1个,第二组车站“地铁林萃桥站”和“京师园北门”对应的智能公交卡数据聚类后,得到的聚类个数为2个。
最后,针对每个聚类中的智能公交卡数据计算上车时间平均值,将多个聚类按照上车时间平均值进行排序,并按照排序确定每个聚类中智能公交卡数据的乘客上车车站逻辑编号。例如将每个聚类中上车时间平均值小的排在前面,上车时间平均值大的排在后面。
同理,采用上述方式可以计算出乘客下车车站的逻辑编号,此处不再赘述。
第二步,在计算得到乘客的轨迹数据之后,根据乘客的轨迹数据中途经车站序列计算出各公交车站的枢纽度。
本发明实施例可以采用Temproal-IdeaGraph算法挖掘公交车站枢纽度属性,该算法可挖掘数据中的序列以及各个元素主体之间的关系网络。图4为Temproal-IdeaGraph算法的流程示意图,参见图4,该算法可以包括如下步骤:
步骤一、序列模式挖掘,基于乘客轨迹数据挖掘出长度大于n(n为正整数)的序列,并将该序列记为目标序列。统计目标序列中与各序列相同的乘客轨迹数量,并作为相应序列的权值。该实施例中,所有序列集合记为P,某序列记为p(如图4中的pattern1),序列p的权值记为w(p);例如,乘客轨迹的序列形式可为:Station1(简称S1或1,公交车站1),S2,S3…;或S2,S1,S4,S5…;或S2,S4,S8…等。图4中分别示出了pattern1包括公交车站S1,S2,S3;p2包括公交车站1,2;p3包括了公交车站8,9;p4包括了公交车站4,2,6;p5包括了公交车站2,3,6;
步骤二、序列模式合并,基于目标序列中各序列的权值,将包含相同车站的序列进行合并,得到连接模式网络。由1至2这一序列的权值为w1,2至1序列的权值为w2,2至6序列的权值为w4,4至2序列的权值为w4,2至3序列的权值为w1+w5,3至6的权值为w5;
步骤三、枢纽车站发现,根据连接模式网络,计算公交线路上的每个公交车站的枢纽度。如图4中的枢纽车站记为公交车站2。
本发明实施例举例以下公式来计算各公交车站的枢纽度,但需要说明的是,本发明保护的技术方案并不局限以下及说明书中列的各个公式实现的方案,本领域技术人员能够想到通过合理变化、增减比例、调整系数、增加权重等方式依然可以实现本发明技术方案,而这些未穷举的方案也都在本发明保护的范围内。枢纽度的计算公式如下公式1-1所示:
上述公式1中的各参数的计算参见如下公式1-2至1-5:
其中,上述公式中,si为车站i,H(si)为车站si枢纽度,Lstarti为起始车站为si的序列集合,Lendi为终止车站为si的序列集合,Ii→j为其实车站为si、终止车站为sj的序列。
参见上文步骤S106,在本发明一实施例中,可以采用如下步骤,依据计算得到的各公交车站的枢纽度在各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。
首先,将指定区域内的公交线路组成候选线路集合,提取候选线路集合中公交线路覆盖的公交车站,组成候选车站集合。
其次,遍历乘客轨迹数据,提取包含有候选车站集合中任意公交车站的乘客轨迹数据,并组成候选轨迹集合。
然后,结合每个公交车站的枢纽度,计算候选轨迹集合中的每条乘客轨迹对于候选线路集合中的公交线路的权重。
最后,根据每条乘客轨迹对于候选线路集合的公交线路中的权重,计算候选线路集合中的任意公交线路的覆盖度,并选取覆盖度最大的公交线路作为广告投放公交线路进行推荐。在该实施例中,对覆盖度的计算可以采用如下方式。首先,遍历候选线路集合中所有公交线路,对于任一公交线路,在候选车站集合中提取任一公交线路覆盖的公交站集合,并在候选轨迹集合中提取该公交站集合覆盖的所有乘客轨迹。其次,根据每条乘客轨迹对于候选线路集合的公交线路中的权重,对该公交站集合覆盖的所有乘客轨迹在任一公交线路的权重求和,得到任一公交线路的覆盖度。
在本发明一实施例中,在选取覆盖度最大的公交线路作为广告投放公交线路进行推荐的过程中,首先,从候选线路集合中选取覆盖度最大的公交线路,将选取的公交线路添加至预置的已挑选公交线路集合(该公交线路集合的初始状态为空)中,并将其从候选线路集合中删除。其次,确定选取的公交线路覆盖的乘客轨迹,将该乘客轨迹添加至预置的已覆盖乘客轨迹集合(该乘客轨迹集合的初始状态为空)中,并从候选轨迹集合中删除。然后,判断已挑选公交线路集合中的公交线路的数量是否等于预设阈值(如预设阈值为3条、5条等);若否,则继续在删减后的候选线路中选取覆盖度最大的公交线路添加至预置的已挑选公交线路集合中,直到已挑选公交线路集合中的公交线路的数量等于预设阈值。最后,将预置的已挑选公交线路集合中的公交线路作为广告投放公交线路进行推荐。
为了更加清楚地体现本发明方案,下面以一具体实施例对广告投放公交线路进行推荐的过程进行具体介绍。该实施例的指定区域为北京市。该实施例的枢纽度越大,车站客流量越大,途经此车站的广告受众越多。该方法命名为Hub-KRQ,具体步骤如下:
步骤1-1,已挑选公交线路集合设置为空,记为BRresult;已覆盖乘客轨迹集合设置为空,记为Trajcovered;
步骤1-2,将北京市所有公交线路作为候选线路集合,记为BRcan;
步骤1-3,根据公交线路数据提取BRcan所覆盖的所有公交车站,并组成候选车站集合,记为Scan;
步骤1-4,遍历乘客轨迹数据,如果乘客轨迹序列中包含Scan中任意车站,则提取乘客轨迹数据,并组成候选轨迹集合,记为Trajcan;
步骤1-5,根据公式2-1和2-2计算Trajcan中所有轨迹对于BRcan中所有线路的权重w(traj;br):
w(traj;br)=∑s∈itsH(s)公式2-1;its=Its[traj]∩Irs[br]公式2-2
其中,Irs[br]为公交线路br覆盖的公交车站集合,Its[traj]为轨迹traj覆盖的公交车站集合,its为公交线路br与轨迹traj覆盖的公交线路交集,H(s)为公交车站枢纽度;
步骤1-6,遍历BRcan中的所有公交线路,对任意公交线路br,在Scan中提取其覆盖的所有公交车站集合,记为Sbr,在Trajcan中提取Sbr覆盖的乘客轨迹,记为Trajbr,对Trajbr中所有乘客轨迹对于线路权重求和,得到公交线路br的覆盖度Cbr,如下公式2-3:
其中,Irs[br]为提取br覆盖的公交车站集合Sbr,Ist[Irs[br]]为提取Sbr覆盖的乘客轨迹集合Trajbr;
步骤1-7,选择BRcan中覆盖度最大的公交线路brmax,将其加入到已选中公交线路集合BRresult,并从候选公交线路集合BRcan中去除;
步骤1-8,根据公交线路数据提取BRcan所覆盖的所有公交车站,并组成候选车站集合,记为Scan;
步骤1-9,将brmax覆盖的乘客轨迹Trajbrmax从候选轨迹集合Trajcan中去除;
步骤1-10,重复步骤1-6至1-9,直到选出公交线路集合BRresult中公交线路数量满足广告投放者的要求。
本发明实施例对上述过程中各步骤之间的先后顺序不做具体的限定。
继续参见上文步骤S104,现介绍基于智能公交卡数据并按照预设规则计算出各公交车站客流量的过程。
首先,对智能公交卡数据进行筛选操作,提取指定时间范围内的智能公交卡数据。
其次,对指定时间范围内的智能公交卡数据进行处理,得到包含指定信息的智能公交卡数据,指定信息包括公交卡ID、公交线路ID、乘客上车时间、乘客下车时间、乘客上车车站ID和/或地理位置信息、乘客下车车站ID和/或地理位置信息。
上述两个过程是对智能公交卡数据的筛选过程,也可以理解为对智能公交卡数据的清洗。通常涉及如下操作:1、一半情况下,智能公交卡数据中近期的数据参考价值最大,因此根据实际情况提取最近时间范围内的数据(如最近一个月),并去除无效时间记录数据;2、除去智能公交卡数据中的无用信息,如公交卡类型等信息;3、将公交车站编号替换为地理坐标等信息。从而,得到最终的智能公交卡数据包含:公交卡ID、公交线路ID、乘客上车时间、乘客下车时间、上车车站地理位置经纬度和下车车站地理位置经纬度信息。
然后,结合各公交车站的数据和包含指定信息的智能公交卡数据,在全天各个时段内,计算每个公交车站上车和下车乘客数量的总和,减去公交卡ID重复的乘客数量,得到每个公交车站在该时段的乘客流量。
最后,根据公交线路数据,确定每条公交线路所经过的所有公交车站,并在全天各个时段内,计算每条公交线路所经过所有公交车站乘客流量的总和,减去公交卡ID重复的乘客数量,得到每条公交线路在该时段的乘客流量,从而得到各公交线路全天时客流量。
继续参见上文步骤S106,在本发明一实施例中,可以采用如下方式根据计算得到的各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。
具体的,首先,设定广告投放需求,包括投放时间范围(具体到小时)、公交线路数目(如2-3条线路、4条线路等)、公交线路长度范围(如不低于5000米、不低于3000米等)等。然后,结合广告投放需求和各公交线路的客流量,在获取的各公交线路中选取公交线路客流量达到第一阈值的至少一条公交线路,并作为广告投放公交线路进行推荐。
例如,广告投放需求的时间范围为10:00-12:00、公交线路数目为2、公交线路总长度不低于50km,第一阈值为全天时客流量20000人,投放广告的地区为北京市。通过采用上述方式最终选取了2条公交线路,北京市982路和11路,总长度为56km、客流量27722人、旅行功能主题区域覆盖面积为25km2、购物功能主题覆盖面积为17km2。该实施例仅仅是示意性的,不对本发明造成限定。
继续参见上文步骤S106,在本发明一实施例中,还可以采用如下方式根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。
具体的,首先,设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围等。
然后,结合广告投放需求和各公交线路的客流量,在获取的各公交线路中选取公交线路客流量达到第一阈值的多条公交线路。
进而从客流量达到第一阈值的多条公交线路中获取其覆盖的公交车站,分析各公交车站的枢纽度。
最后,选取公交车站的枢纽度达到第二阈值的公交车站,并将达到第二阈值的公交车站所属公交线路中的至少一条公交线路作为广告投放公交线路进行推荐。
在该步骤中,若存在多条公交线路均存在枢纽度达到第二阈值的公交车站,则可以包含公交车站枢纽度较大的一条或多条公交线路,或者选取枢纽度达到第二阈值的公交车站数量较多的一条或多条公交线路。
现以一具体实施例对该实施例进行介绍。在该实施例中,投放广告的地区为北京市,广告投放需求的时间范围为10:00-12:00、公交线路数目为2、公交线路总长度不低于50km,第一阈值为全天时客流量20000人,第二阈值为枢纽度5。本发明实施例对第一阈值和第二阈值的范围不做具体限定。
通过采用上述方式首先选取了2条公交线路,北京市982路和11路,总长度为56km、客流量27722人、旅行功能主题区域覆盖面积为25km2、购物功能主题覆盖面积为17km2。
其中,982路公交路线途经华联、金四季、蓝色港湾、翠微、飘亮、北辰等。11路公交路线途经北京奥林匹克森林公园、地坛公园、南锣鼓巷、北海公园、故宫等。982路覆盖的公交车站中金四季、蓝色港湾的枢纽度分别为4和6。11路覆盖的公交车站中南锣鼓巷、北海公园、故宫的枢纽度分别为6、7、8。由于11路覆盖的公交车站的枢纽度较大,且达到第二阈值的公交车站数量较多,因此,可以优先选取11路公交作为广告投放公交线路进行推荐。该实施例仅仅是示意性的,不对本发明造成限定。
在本发明一实施例中,还可以针对广告投放场景(如定向功能主题场景、定向行政区域场景)进行公交线路的推荐。下面分别以两个实施例介绍在定向功能主题场景、定向行政区域场景下对广告投放公交线路进行推荐的过程。
实施例一
在定向功能主题场景下对广告投放公交线路进行推荐的过程。该实施例的指定区域为北京市。该场景下,公交线路推荐方法考虑乘客轨迹途经地标的主题特征,该方法命名为Topic-KRQ,具体步骤如下:
步骤2-1,设定广告目标功能主题,记为集合Trajtargrt;
步骤2-2,已挑选公交线路集合设置为空,记为BRresult;已覆盖乘客轨迹集合设置为空,记为Trajcovered;
步骤2-3,将北京市所有公交线路作为候选线路集合,记为BRcan;
步骤2-4,根据公交线路数据提取BRcan所覆盖的所有公交车站,并组成候选车站集合,记为Scan;
步骤2-5,根据下面公式3-1计算Scan中每个公交车站的目标功能主题权重:
其中,TDs[t]为公交车站s与主题t相关的POI(Point of Interests,用户兴趣点数据)数量;
步骤2-6,遍历乘客轨迹数据,如果乘客轨迹序列中包含Scan中任意公交车站,则提取乘客轨迹候选数据,并组成候选轨迹集合,记为Trajcan;
步骤2-7,根据下面公式3-2和3-3计算Trajcan中所有乘客轨迹对于BRcan中所有线路的权重w(traj;br):
w(traj;br)=∑s∈itswtarget(s) 公式3-2;
its=Its[traj]∩Irs[br] 公式3-3;
其中,Irs[br]为公交线路br覆盖的公交车站集合,Its[traj]为轨迹traj覆盖的公交车站集合,its为公交线路br与轨迹traj覆盖的公交线路交集;
步骤2-8,遍历BRcan中所有公交线路,对任意公交线路br,在Scan中提取其覆盖的所有公交车站集合,记为Sbr,在Trajcan中提取Sbr覆盖的乘客轨迹,记为Trajbr,对Trajbr中所有轨迹对于线路权重求和,得到公交线路br的覆盖度Cbr,如下面公式3-4:
其中Irs[br]为提取br覆盖的公交车站集合Sbr,Ist[Irs[br]为提取Sbr覆盖的乘客轨迹集合Trajbr;
步骤2-9,选择BRcan中覆盖度最大的公交线路brmax,将其加入到已选中公交线路集合BRresult,并从候选公交线路及和BRcan中去除;
步骤2-10,根据公交线路数据提取BRcan所覆盖的所有公交车站,并组成候选车站集合,记Scan;
步骤2-11,将brmax覆盖的乘客轨迹Trajbrmax从候选轨迹集合Trajcan中去除;
步骤2-12,重复2-6至2-11,直到选出公交线路集合BRresult中公交线路数量满足广告投放者的要求。
实施例二
在定向行政区域场景下对广告投放公交线路进行推荐的过程。该实施例的指定区域为北京市。如果广告投放场景为定向行政区域场景,公交线路推荐方法考虑乘客轨迹途经地标的行政区域特征,该方法命名为District-KRQ,具体步骤如下:
步骤3-1,设定广告目标行政区域,记为集合DTarget;
步骤3-2,已挑选公交线路集合设置为空,记为BRresult;已覆盖乘客轨迹集合设置为空,记为Trajcovered;
步骤3-3,将北京市所有公交线路作为候选线路集合,记为BRcan;
步骤3-4,根据公交线路数据提取BRcan所覆盖的所有公交车站,并组成候选车站集合,记为Scan;
步骤3-5,计算Scan中每个公交车站的目标行政区域权重,如果公交车站所属行政区域为目标行政区域,则权重为1,否则权重为0:记为wTarget(s);
步骤3-6,遍历乘客轨迹数据,如果乘客轨迹序列中包含Scan中任意公交车站,则提取乘客轨迹候选数据,并组成候选轨迹集合,记为Trajcan;
步骤3-7,根据下面公式4-1和4-2计算Trajcan中所有乘客轨迹对于BRcan中所有线路的权重w(traj;br):
w(traj;br)=∑s∈itswtarget(s) 公式4-1;
its=Its[traj]∩Irs[br] 公式4-2;
其中,Irs[br]为公交线路br覆盖的公交车站集合,Its[traj]为轨迹traj覆盖的公交车站集合,irs为公交线路br与轨迹traj覆盖的公交线路交集;
步骤3-8,遍历BRcan中所有公交线路,对任意公交线路br,在Scan中提取其覆盖的所有公交车站集合,记为Sbr,在Trajcan中提取Sbr覆盖的乘客轨迹,记为Trajbr,对Trajbr中所有轨迹对于线路权重求和,得到公交线路br的覆盖度Cbr,如下公式4-3:
其中,Irs[br]为提取br覆盖的公交车站集合Sbr,Ist[Irs[br]]为提取Sbr覆盖的乘客轨迹集合Trajbr;
步骤3-9,选择BRcan中覆盖度最大的公交线路brmax,将其加入到已选中公交线路集合BRresult,并从候选公交线路及和BRcan中去除;
步骤3-10,根据公交线路数据提取BRcan所覆盖的所有公交车站,并组成候选车站集合,记为Scan;
步骤3-11,将brmax覆盖的乘客轨迹Trajbrmax从候选轨迹集合Trajcan中去除;
步骤3-12,重复3-6至3-11,直到选出公交线路集合BRresult中公交线路数量满足广告投放者的要求。
参见图5,现从整体上介绍本发明实施例基于智能公交卡数据SCT、地图数据、用户兴趣点POI数据,针对不同广告投放场景实现广告投放公交线路的推荐的过程。在该实施例中,公交车站站点的多维属性包括枢纽度、行政区划归属、功能主题分布,分别对应于图5的枢纽度、行政区分布、功能主题分布。
针对广泛传播场景,即图5中的乘客流最大化覆盖场景。首先,根据智能公交卡数据提取乘客的轨迹数据。然后,基于乘客轨迹数据采用Temproal-IdeaGraph算法挖掘出公交车站的枢纽度。其中,乘客轨迹数据的提取以及公交车站枢纽度的具体计算过程参见上文内容。进而采用改进的Max k-cover并结合乘客轨迹数据计算指定区域内的任意公交线路的覆盖度,并选取覆盖度最大的公交线路作为广告投放公交线路进行推荐。最后将推荐的公交线路投放至乘客流最大化覆盖的场景中。其中,公交线路覆盖度的具体算法参见上文内容。
针对定向行政区域场景,即图5中的目标行政区最大化覆盖场景。首先,根据地图数据,获取到公交车站的地理位置信息,即图5中的地理坐标映射。然后基于地理位置信息挖掘出公交车站的行政区分布。进而采用改进的Max k-cover并结合乘客轨迹数据计算指定区域内的任意公交线路的覆盖度,并选取覆盖度最大的公交线路作为广告投放公交线路进行推荐。最后将推荐的公交线路投放至目标行政区最大化覆盖的场景中。
针对定向功能主题场景其中,即图5中的目标功能区最大化覆盖场景。首先,根据地图数据收集公交车站的地理位置信息周边指定距离以内的POI数据,即图5中的POIs数据。获得POIs数据之后,通过使用主题分布模型LDA实现话题建模,得到各公交车站的功能主题分布。进而采用改进的Max k-cover并结合乘客轨迹数据计算指定区域内的任意公交线路的覆盖度,并选取覆盖度最大的公交线路作为广告投放公交线路进行推荐。最后将推荐的公交线路投放至目标功能区最大化覆盖的场景中。
在本发明一实施例中,当依据上述方案选取至少一条公交线路,并作为该广告投放场景的广告投放公交线路进行推荐之前,还可以对基于统计的特征属性按照预设策略对公交车身广告投放线路方案的投放效果进行衡量,当衡量结果达到预设的广告投放基准时,再进行推荐。
对公交车身广告投放线路方案的投放效果进行衡量的方式包括如下三种。
方式一、利用PTS(Pois To See)指标衡量投放效果,PTS指平均每个受众沿途所经过的预设主题区域数量,即基于统计的特征属性,衡量平均每个广告受众乘坐公交车时沿途所经过的预设主题区域数量,其中,PTS的值越大,投放效果越好。
方式二、基于统计的特征属性,衡量在预设数量的乘客轨迹中待投放广告产生的功能主题和/或行政区域影响力,其中,影响力数值越大,投放效果越好。
该方式中,采用T_GRP(Topic Gross Rating Points,功能主题毛评点)代表功能主题影响力,T_GRP与GRP(Gross Rating Points,毛评点)类似,用于评估在N个乘客轨迹中广告产生的功能主题影响力,计算公式为T_GRP=PTS×Coverage×N。其中,PTS表示受众对广告的敏感度,Coverage为广告覆盖率,由T_GRP可以评估广告在N个受众中产生的影响。广告覆盖率Coverage是指目标人群中广告受众所占的比例,即全部乘客轨迹中投放线路覆盖的乘客轨迹所占的比例,计算公式如下:
该公式中,traj为所有乘客轨迹集合,traj_covered为公交线路覆盖的广告受众的轨迹集合,numtraj为所有乘客轨迹集合中的轨迹数量,numtraj_covered为公交线路覆盖的广告受众轨迹集合中的轨迹数量。
另外,该方式中,采用D_GRP(District Gross Rating Points,行政区域毛评点)代表行政区域影响力。D_GRP与GRP类似,用于评估在N个乘客轨迹中广告产生的行政区域影响力,计算公式为D_GRP=TDC×OTS×N。其中,TDC指标为受众轨迹中覆盖目标行政区域的比例,OTS为受众平均接触广告的次数。
方式三、利用TDC(Targeted District Coverage)指标衡量投放效果,TDC指投放公交线路覆盖的轨迹中经过目标行政区域的比例,即基于统计的特征属性,衡量公交线路覆盖的轨迹中经过目标行政区域的比例,其中,TDC值越大,投放效果越好。当然,上述三种方式还可以进行任意形式的结合来衡量公交车身广告投放线路方案的投放效果。
在本发明一实施例中,在对公交车身广告投放线路方案的投放效果进行衡量之前,还可以将广告投放线路进行可视化显示,以方便广告投放者对广告投放线路的衡量和调整。例如,广告投放线路均为某一城市的公交线路,那么可以将广告投放线路显示在该城市的地图上。
基于同一发明构思,本发明实施例还提供了一种基于智能公交卡数据的车载广告公交线路推荐装置。图6示出了根据本发明一个实施例的基于智能公交卡数据的车载广告公交线路推荐装置的结构示意图。参见图6,基于智能公交卡数据的车载广告公交线路推荐装置600至少包括获取模块610、计算模块620以及推荐模块630。
现介绍本发明实施例的基于智能公交卡数据的车载广告公交线路推荐装置600的各组成或器件的功能以及各部分间的连接关系:
获取模块610,适于获取指定区域内的公交线路及各公交线路所覆盖的公交车站;
计算模块620,与获取模块610耦合,适于获取各公交线路对应的智能公交卡数据SCT,基于智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度和/或各公交线路的客流量;
推荐模块630,与计算模块620耦合,适于根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。
在本发明一实施例中,计算模块620还适于,对智能公交卡数据进行处理,计算得到乘客的轨迹数据,并根据乘客的轨迹数据中途经车站序列,计算各公交车站作为中转车站的度量的枢纽度。
在本发明一实施例中,计算模块620还适于,将智能公交卡数据中的乘客上下车车站编号记为车站收费编号。基于乘客上下车车站收费编号,按照预设策略计算出智能公交卡数据中乘客上下车车站的逻辑编号。依据乘客上下车车站的逻辑编号确定乘客途经车站编号序列,从而得到包含公交线路编号、乘客上下车时间、乘客途经车站编号序列的乘客轨迹数据。
在本发明一实施例中,计算模块620还适于,将同一公交车上的智能公交卡数据按照乘客上车时间进行排序,得到排序后的智能公交卡数据。对排序后的智能公交卡数据进行分组,将排序后的智能公交卡数据中的乘客上车车站收费编号相同的分为一组。对每一组智能公交卡数据使用聚类算法进行聚类,得到的聚类个数作为车站收费编号对应的实际车站个数。针对每个聚类中的智能公交卡数据计算上车时间平均值。将多个聚类按照上车时间平均值进行排序,并按照排序确定每个聚类中智能公交卡数据的乘客上车车站逻辑编号。
在本发明一实施例中,计算模块620还适于,基于乘客轨迹数据挖掘出长度大于n的序列,记为目标序列,n为正整数。统计目标序列中与各序列相同的乘客轨迹数量,并作为相应序列的权值。基于目标序列中各序列的权值,将包含相同车站的序列进行合并,得到连接模式网络。根据连接模式网络,计算公交线路上的每个公交车站的枢纽度。
在本发明一实施例中,推荐模块630还适于,将指定区域内的公交线路组成候选线路集合,提取候选线路集合中公交线路覆盖的公交车站,组成候选车站集合。遍历乘客轨迹数据,提取包含有候选车站集合中任意公交车站的乘客轨迹数据,并组成候选轨迹集合。结合每个公交车站的枢纽度,计算候选轨迹集合中的每条乘客轨迹对于候选线路集合中的公交线路的权重。根据每条乘客轨迹对于候选线路集合的公交线路中的权重,计算候选线路集合中的任意公交线路的覆盖度,并选取覆盖度最大的公交线路作为广告投放公交线路进行推荐。
在本发明一实施例中,推荐模块630还适于,遍历候选线路集合中所有公交线路,对于任一公交线路,在候选车站集合中提取任一公交线路覆盖的公交站集合,并在候选轨迹集合中提取该公交站集合覆盖的所有乘客轨迹。根据每条乘客轨迹对于候选线路集合的公交线路中的权重,对该公交站集合覆盖的所有乘客轨迹在任一公交线路的权重求和,得到任一公交线路的覆盖度。
在本发明一实施例中,推荐模块630还适于,从候选线路集合中选取覆盖度最大的公交线路,将选取的公交线路添加至预置的已挑选公交线路集合中,并将其从候选线路集合中删除。确定选取的公交线路覆盖的乘客轨迹,将该乘客轨迹添加至预置的已覆盖乘客轨迹集合中,并从候选轨迹集合中删除。判断已挑选公交线路集合中的公交线路的数量是否等于预设阈值;若否,则继续在删减后的候选线路中选取覆盖度最大的公交线路添加至预置的已挑选公交线路集合中,直到已挑选公交线路集合中的公交线路的数量等于预设阈值。将预置的已挑选公交线路集合中的公交线路作为广告投放公交线路进行推荐。
在本发明一实施例中,计算模块620还适于,对智能公交卡数据进行筛选操作,提取指定时间范围内的智能公交卡数据。对指定时间范围内的智能公交卡数据进行处理,得到包含指定信息的智能公交卡数据,指定信息包括公交卡ID、公交线路ID、乘客上车时间、乘客下车时间、乘客上车车站ID和/或地理位置信息、乘客下车车站ID和/或地理位置信息。结合各公交车站的数据和包含指定信息的智能公交卡数据,在全天各个时段内,计算每个公交车站上车和下车乘客数量的总和,减去公交卡ID重复的乘客数量,得到每个公交车站在该时段的乘客流量。根据公交线路数据,确定每条公交线路所经过的所有公交车站。在全天各个时段内,计算每条公交线路所经过所有公交车站乘客流量的总和,减去公交卡ID重复的乘客数量,得到每条公交线路在该时段的乘客流量,从而得到各公交线路全天时客流量。
在本发明一实施例中,推荐模块630还适于,设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围。结合广告投放需求和各公交线路的客流量,在获取的各公交线路中选取公交线路客流量达到第一阈值的至少一条公交线路,并作为广告投放公交线路进行推荐。
在本发明一实施例中,推荐模块630还适于,设定广告投放需求,包括时间范围、公交线路数目、公交线路长度范围。结合广告投放需求和各公交线路的客流量,在获取的各公交线路中选取公交线路客流量达到第一阈值的多条公交线路。从客流量达到第一阈值的多条公交线路中获取其覆盖的公交车站,分析各公交车站的枢纽度。选取公交车站的枢纽度达到第二阈值的公交车站,并将达到第二阈值的公交车站所属公交线路中的至少一条公交线路作为广告投放公交线路进行推荐。
根据上述任意一个优选实施例或多个优选实施例的组合,本发明实施例能够达到如下有益效果:
在本发明实施例中,首先获取指定区域内的公交线路及各公交线路所覆盖的公交车站。然后,获取各公交线路对应的智能公交卡数据SCT,基于智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度和/或各公交线路的客流量。最后,根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。由此,本发明实施例通过收集智能公交卡数据,并借助先进的数据挖掘技术来深度挖掘公交车和乘客的时空流动性以及公交车站的枢纽度,从而为广告投放公交线路的选取提供准确的信息支撑。进一步地,本发明实施例还有效地克服了现有技术中无法在最适宜的时间、地点将最适合的广告传播给最适合的受众,无法发挥广告的最大价值的问题。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的基于智能公交卡数据的车载广告公交线路推荐装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
依据本发明的再一方面,还提供了一种电子设备,包括处理器、以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行根据上文任意实施例的基于智能公交卡数据的车载广告公交线路推荐方法。
依据本发明的再一方面,还提供了一种计算机存储介质,其中,计算机可读存储介质存储一个或多个程序,一个或多个程序当被包括多个应用程序的电子设备执行时,使得电子设备执行根据文任意实施例的基于智能公交卡数据的车载广告公交线路推荐方法。
例如,图7示出了可以实现基于智能公交卡数据的车载广告公交线路推荐方法的计算设备。该计算设备传统上包括处理器710和存储器720形式的计算机程序产品或者计算机可读介质。存储器720可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器720具有存储用于执行上述方法中的任何方法步骤的程序代码731的存储空间730。例如,存储程序代码的存储空间730可以包括分别用于实现上面的方法中的各种步骤的各个程序代码731。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图8所示的便携式或者固定存储单元。该存储单元可以具有与图7的计算设备中的存储器720类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常,存储单元包括用于执行本发明的方法步骤的计算机可读代码731’,即可以由诸如710之类的处理器读取的代码,当这些代码由计算设备运行时,导致该计算设备执行上面所描述的方法中的各个步骤。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。
Claims (10)
1.一种基于智能公交卡数据的车载广告公交线路推荐方法,包括:
获取指定区域内的公交线路及各公交线路所覆盖的公交车站;
获取各公交线路对应的智能公交卡数据SCT,基于所述智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度和/或各公交线路的客流量;
根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。
2.根据权利要求1所述的方法,其中,基于所述智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度,包括:
对所述智能公交卡数据进行处理,计算得到乘客的轨迹数据;
根据乘客的轨迹数据中途经车站序列,计算各公交车站作为中转车站的度量的枢纽度。
3.根据权利要求1或2所述的方法,其中,所述智能公交卡数据中包括公交线路编号、乘客上下车时间、乘客上下车车站编号,对所述智能公交卡数据进行处理,计算得到乘客的轨迹数据,包括:
将智能公交卡数据中的乘客上下车车站编号记为车站收费编号;
基于所述乘客上下车车站收费编号,按照预设策略计算出智能公交卡数据中乘客上下车车站的逻辑编号;
依据所述乘客上下车车站的逻辑编号确定所述乘客途经车站编号序列,从而得到包含公交线路编号、乘客上下车时间、所述乘客途经车站编号序列的乘客轨迹数据。
4.根据权利要求1-3任一项所述的方法,其中,基于所述乘客上下车车站收费编号,按照预设策略计算出乘客上车车站的逻辑编号,包括:
将同一公交车上的智能公交卡数据按照乘客上车时间进行排序,得到排序后的智能公交卡数据;
对排序后的智能公交卡数据进行分组,将排序后的智能公交卡数据中的乘客上车车站收费编号相同的分为一组;
对每一组智能公交卡数据使用聚类算法进行聚类,得到的聚类个数作为车站收费编号对应的实际车站个数;
针对每个聚类中的智能公交卡数据计算上车时间平均值;
将多个聚类按照上车时间平均值进行排序,并按照排序确定每个聚类中智能公交卡数据的乘客上车车站逻辑编号。
5.根据权利要求1-4任一项所述的方法,其中,根据乘客的轨迹数据中途经车站序列,计算各公交车站作为中转车站的度量的枢纽度,包括:
基于所述乘客轨迹数据挖掘出长度大于n的序列,记为目标序列,n为正整数;
统计目标序列中与各序列相同的乘客轨迹数量,并作为相应序列的权值;
基于目标序列中各序列的权值,将包含相同车站的序列进行合并,得到连接模式网络;
根据连接模式网络,计算公交线路上的每个公交车站的枢纽度。
6.根据权利要求1-5任一项所述的方法,其中,根据计算得到的各公交车站的枢纽度,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐,包括:
将指定区域内的公交线路组成候选线路集合,提取所述候选线路集合中公交线路覆盖的公交车站,组成候选车站集合;
遍历所述乘客轨迹数据,提取包含有所述候选车站集合中任意公交车站的乘客轨迹数据,并组成候选轨迹集合;
结合每个公交车站的枢纽度,计算所述候选轨迹集合中的每条乘客轨迹对于所述候选线路集合中的公交线路的权重;
根据每条乘客轨迹对于所述候选线路集合的公交线路中的权重,计算所述候选线路集合中的任意公交线路的覆盖度,并选取覆盖度最大的公交线路作为广告投放公交线路进行推荐。
7.根据权利要求1-6任一项所述的方法,其中,根据每条乘客轨迹对于所述候选线路集合的公交线路中的权重,计算所述候选线路集合中的任意公交线路的覆盖度,包括:
遍历所述候选线路集合中所有公交线路,对于任一公交线路,在所述候选车站集合中提取所述任一公交线路覆盖的公交站集合,并在所述候选轨迹集合中提取该公交站集合覆盖的所有乘客轨迹;
根据每条乘客轨迹对于所述候选线路集合的公交线路中的权重,对该公交站集合覆盖的所有乘客轨迹在所述任一公交线路的权重求和,得到所述任一公交线路的覆盖度。
8.一种基于智能公交卡数据的车载广告公交线路推荐装置,包括:
获取模块,适于获取指定区域内的公交线路及各公交线路所覆盖的公交车站;
计算模块,适于获取各公交线路对应的智能公交卡数据SCT,基于所述智能公交卡数据并按照预设规则计算出各公交车站作为中转车站的度量的枢纽度和/或各公交线路的客流量;
推荐模块,适于根据计算得到的各公交车站的枢纽度和/或各公交线路的客流量,在获取的各公交线路中选取至少一条公交线路,并作为广告投放公交线路进行推荐。
9.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-7任一项所述的基于智能公交卡数据的车载广告公交线路推荐方法。
10.一种计算机存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行根据权利要求1-7任一项所述的基于智能公交卡数据的车载广告公交线路推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711310490.5A CN108171533B (zh) | 2017-12-11 | 2017-12-11 | 基于智能公交卡数据的车载广告公交线路推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711310490.5A CN108171533B (zh) | 2017-12-11 | 2017-12-11 | 基于智能公交卡数据的车载广告公交线路推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108171533A true CN108171533A (zh) | 2018-06-15 |
CN108171533B CN108171533B (zh) | 2021-07-23 |
Family
ID=62524877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711310490.5A Active CN108171533B (zh) | 2017-12-11 | 2017-12-11 | 基于智能公交卡数据的车载广告公交线路推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108171533B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020666A (zh) * | 2019-02-21 | 2019-07-16 | 华南理工大学 | 一种基于乘客行为模式的公共交通广告投放方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886741A (zh) * | 2014-03-13 | 2014-06-25 | 河海大学常州校区 | 一种基于智能公交卡的公交管理系统及方法 |
CN104134343A (zh) * | 2014-06-23 | 2014-11-05 | 上海城市交通设计院有限公司 | 一种基于交通卡数据的乘客上下车时间和位置的获取方法 |
CN105956885A (zh) * | 2016-05-16 | 2016-09-21 | 温州市鹿城区中津先进科技研究院 | 车辆广告投放计价参考值的计算方法及装置 |
WO2017086728A1 (ko) * | 2015-11-20 | 2017-05-26 | 조재만 | 버스를 이용한 광고 장치 |
-
2017
- 2017-12-11 CN CN201711310490.5A patent/CN108171533B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886741A (zh) * | 2014-03-13 | 2014-06-25 | 河海大学常州校区 | 一种基于智能公交卡的公交管理系统及方法 |
CN104134343A (zh) * | 2014-06-23 | 2014-11-05 | 上海城市交通设计院有限公司 | 一种基于交通卡数据的乘客上下车时间和位置的获取方法 |
WO2017086728A1 (ko) * | 2015-11-20 | 2017-05-26 | 조재만 | 버스를 이용한 광고 장치 |
CN105956885A (zh) * | 2016-05-16 | 2016-09-21 | 温州市鹿城区中津先进科技研究院 | 车辆广告投放计价参考值的计算方法及装置 |
Non-Patent Citations (1)
Title |
---|
高联雄: ""智能公交系统数据挖掘研究与应用"", 《中国博士学位论文全文数据库信息科技辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020666A (zh) * | 2019-02-21 | 2019-07-16 | 华南理工大学 | 一种基于乘客行为模式的公共交通广告投放方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108171533B (zh) | 2021-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108053240B (zh) | 生成车载广告投放公交线路方案的方法及装置 | |
CN108182592A (zh) | 公交线路多维特征属性挖掘方法、装置及电子设备 | |
CN110009379A (zh) | 一种选址模型构建和选址方法、装置及设备 | |
Jäger et al. | Assessing conflicts between winter recreational activities and grouse species | |
CN109903125A (zh) | 基于od数据的共享单车借还与停放时空分布可视化方法 | |
CN108154387B (zh) | 公交车身广告投放线路方案的评估方法及装置 | |
CN107909180A (zh) | 公共交通出行用时的处理方法、设备及可读介质 | |
CN108182593B (zh) | 基于地图数据的公交车身广告投放线路定制方法及装置 | |
CN111626777B (zh) | 选址方法、选址决策系统、存储介质及电子设备 | |
Wickham et al. | Watershed level risk assessment of nitrogen and phosphorus export | |
Smith et al. | Classification of sidewalks in street view images | |
Günther et al. | Including parameter uncertainty in an intercomparison of physically-based snow models | |
CN108038728A (zh) | 公交车身广告投放线路方案生成方法、装置及电子设备 | |
Gipps et al. | New technologies for transport route selection | |
Jackson et al. | Nonmotorized site selection methods for continuous and short-duration volume counting | |
CN108108997B (zh) | 车载广告投放公交线路选取方法及装置 | |
CN108171533A (zh) | 基于智能公交卡数据的车载广告公交线路推荐方法及装置 | |
CN106503071A (zh) | Poi信息的处理方法及装置 | |
CN108171534A (zh) | 一种车载广告公交线路推荐方法及装置 | |
CN108171970A (zh) | 一种获取公交车乘客轨迹的方法及装置 | |
CN108053238B (zh) | 面向公交车身广告投放线路定制方法、装置及电子设备 | |
Bergen et al. | Change detection with heterogeneous data using ecoregional stratification, statistical summaries and a land allocation algorithm | |
CN117273476A (zh) | 绿道选线方法、装置、电子设备及介质 | |
Xie et al. | The accessibility of Nanjing urban park based on GIS | |
CN108197973A (zh) | 基于地图数据的车载广告公交线路推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |