CN111275529A - 通勤时间计算方法、系统、电子设备及可读存储介质 - Google Patents

通勤时间计算方法、系统、电子设备及可读存储介质 Download PDF

Info

Publication number
CN111275529A
CN111275529A CN202010071144.1A CN202010071144A CN111275529A CN 111275529 A CN111275529 A CN 111275529A CN 202010071144 A CN202010071144 A CN 202010071144A CN 111275529 A CN111275529 A CN 111275529A
Authority
CN
China
Prior art keywords
subway
time
information
cell
commuting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010071144.1A
Other languages
English (en)
Inventor
李志武
李昭
陈浩
高靖
崔岩
卢述奇
张宵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingwutong Co ltd
Original Assignee
Qingwutong Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingwutong Co ltd filed Critical Qingwutong Co ltd
Priority to CN202010071144.1A priority Critical patent/CN111275529A/zh
Publication of CN111275529A publication Critical patent/CN111275529A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0645Rental transactions; Leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate

Abstract

本发明公开了一种通勤时间计算方法、系统、电子设备及可读存储介质,该方法包括:获取城市的地铁信息和小区信息;根据地铁信息和小区信息得到第一时间,第一时间表征目标小区到通勤地铁站的通勤时间;根据地铁信息得到第二时间,第二时间表征相邻地铁站之间的通勤时间;根据第一时间和第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间。该方法先获取到全国各个城市的地铁信息和小区信息,保证信息的准确性和实时性;之后,根据上述信息确定第一时间和第二时间;再根据上述通勤时间采用最短路径算法计算出目标小区到各个地铁站的通勤时间,采用统一的算法保证了计算结果的一致性和准确性,提高了通勤时间计算的准确性。

Description

通勤时间计算方法、系统、电子设备及可读存储介质
技术领域
本发明涉及房屋地产领域,具体涉及到一种通勤时间计算方法、系统、电子设备及可读存储介质。
背景技术
在租房领域,通勤时间关系着用户租房生活的品质,故用户在租房时通常要考虑居住地与工作地之间的通勤时间,也就是距离上班地点的远近。尤其是在长租公寓的场景下,需要对小区和地铁商圈进行分析,得到用户的通勤时间,更好的为用户推荐房源信息。因此,如何更加准确地计算出通勤时间成为亟待解决的技术问题。
发明内容
有鉴于此,本发明实施例提供了一种通勤时间计算方法、系统、电子设备及可读存储介质,以解决现有技术确定通勤时间不准确的问题。
本发明实施例的技术方案具体如下:
根据第一方面,本发明实施例提供了一种通勤时间计算方法,包括:获取城市的地铁信息和小区信息;根据所述地铁信息和所述小区信息得到第一时间,所述第一时间表征目标小区到通勤地铁站的通勤时间,所述通勤地铁站为与目标小区距离最短的地铁站;根据所述地铁信息得到第二时间,所述第二时间表征相邻地铁站之间的通勤时间;根据所述第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间。
可选地,根据所述地铁信息和所述小区信息得到第一时间,包括:从所述地铁信息和所述小区信息提取各个地铁站的地铁站经纬度和目标小区经纬度;根据各个地铁站的地铁站经纬度和目标小区经纬度计算出目标小区到各个地铁站的距离;根据所述目标小区到各个地铁站的距离和预设平均速度计算出小区到各个地铁站的通勤时间;在所述目标小区到各个地铁站的通勤时间中查找最小通勤时间,将所述最小通勤时间所对应的地铁站作为通勤地铁站,将最小通勤时间作为第一时间。
可选地,根据所述地铁信息得到第二时间,包括:根据所述地铁信息得到各个地铁站的地铁站经纬度;根据各个地铁站的所述地铁站经纬度计算出相邻各个地铁站之间的距离;根据所述相邻各个地铁站之间的距离和地铁运行速度得到第二时间。
可选地,根据所述第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间,包括:根据所述第一时间和所述第二时间,采用迪杰斯特拉算法进行计算,得出目标小区到各个地铁站的通勤时间。
可选地,所述地铁信息包括地铁站名信息、地铁线路信息和地铁线路基本信息;其中,所述地铁站名信息包括地铁站名称和地铁站经纬度;所述地铁线路信息包括线路名称、始发站、终点站、始发站与终点站之间经过的所有站点名称、地铁站在线路上的开通状态;所述地铁线路基本信息包括地铁线所属城市、地铁线名称、开通状态、开通时间、线路划分状况;
和/或,
所述小区信息包括小区所属城市、小区所属行政区域、小区名称以及小区周边商圈信息。
可选地,获取城市的地铁信息和小区信息,包括:通过爬虫工具得到城市的地铁信息和小区信息;将所述地铁信息分别存储至地铁站名信息表、地铁线路表和地铁线路基本信息表,将小区信息存储至小区信息表。
可选地,根据所述第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间的步骤之后,还包括:按照小区标识、地铁站标识、城市名称、通勤时间和分区字段将所述小区到各个地铁站的通勤时间存储至HIVE数据库。
根据第二方面,本发明实施例提供了一种通勤时间计算系统,包括:第一获取模块,用于获取城市的地铁信息和小区信息;第一处理模块,用于根据所述地铁信息和所述小区信息得到第一时间,所述第一时间表征目标小区到通勤地铁站的通勤时间,所述通勤地铁站为与目标小区距离最短的地铁站;第二处理模块,用于根据所述地铁信息得到第二时间,所述第二时间表征相邻地铁站之间的通勤时间;第三处理模块,用于根据所述第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间。
可选地,所述第一处理模块包括:第一处理单元,用于从所述地铁信息和所述小区信息提取各个地铁站的地铁站经纬度和目标小区经纬度;第二处理单元,用于根据各个地铁站的地铁站经纬度和目标小区经纬度计算出目标小区到各个地铁站的距离;第三处理单元,用于根据所述目标小区到各个地铁站的距离和预设平均速度计算出目标小区到各个地铁站的通勤时间;第四处理单元,用于在所述目标小区到各个地铁站的通勤时间中查找最小通勤时间,将所述最小通勤时间所对应的地铁站作为通勤地铁站,将最小通勤时间作为第一时间。
可选地,所述第二处理模块包括:第五处理单元,用于根据所述地铁信息得到各个地铁站的地铁站经纬度;第六处理单元,用于根据各个地铁站的所述地铁站经纬度计算出相邻各个地铁站之间的距离;第七处理单元,用于根据所述相邻各个地铁站之间的距离和地铁运行速度得到第二时间。
可选地,所述第三处理模块包括:第八处理单元,用于根据所述第一时间和所述第二时间,采用迪杰斯特拉算法进行计算,得出目标小区到各个地铁站的通勤时间。
可选地,所述地铁信息包括地铁站名信息、地铁线路信息和地铁线路基本信息;其中,所述地铁站名信息包括地铁站名称和地铁站经纬度;所述地铁线路信息包括线路名称、始发站、终点站、始发站与终点站之间经过的所有站点名称、地铁站在线路上的开通状态;所述地铁线路基本信息包括地铁线所属城市、地铁线名称、开通状态、开通时间、线路划分状况;
和/或,
所述小区信息包括小区所属城市、小区所属行政区域、小区名称以及小区周边商圈信息。
可选地,所述第一获取模块包括:第九处理单元,用于通过爬虫工具得到城市的地铁信息和小区信息;第十处理单元,用于将所述地铁信息分别存储至地铁站名信息表、地铁线路表和地铁线路基本信息表,将小区信息存储至小区信息表。
可选地,还包括:第四处理模块,用于按照小区标识、地铁站标识、城市名称、通勤时间和分区字段将所述小区到各个地铁站的通勤时间存储至HIVE数据库。
根据第三方面,本发明实施例提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器执行上述第一方面任意一项所述的通勤时间计算方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行上述第一方面任意一项所述的通勤时间计算方法。
本发明实施例技术方案,具有如下优点:
本发明实施例提供了一种通勤时间计算方法、系统、电子设备及可读存储介质,其中,该方法包括:获取城市的地铁信息和小区信息;根据所述地铁信息和所述小区信息得到第一时间,所述第一时间表征目标小区到通勤地铁站的通勤时间,所述通勤地铁站为与目标小区距离最短的地铁站;根据所述地铁信息得到第二时间,所述第二时间表征相邻地铁站之间的通勤时间;根据所述第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间。该方法先获取到全国各个城市的地铁信息和小区信息,保证数据信息的准确性和实时性;之后,根据获取到的地铁信息和小区信息确定第一时间和第二时间;再根据上述通勤时间采用最短路径算法计算出目标小区到各个地铁站的通勤时间,采用统一的算法保证了计算结果的一致性和准确性,提高了通勤时间计算的准确性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例通勤时间计算方法的一个具体示例的流程图;
图2为本发明实施例通勤时间计算方法的另一个具体示例的流程图;
图3为本发明实施例通勤时间计算方法的另一个具体示例的流程图;
图4为本发明实施例通勤时间计算方法的另一个具体示例的流程图;
图5为本发明实施例迪杰斯特拉算法的一个具体示例的示意图;
图6为本发明实施例通勤时间计算方法的另一个具体示例的流程图;
图7为本发明实施例爬虫工具的一个具体示例的示意图;
图8为本发明实施例通勤时间计算方法的另一个具体示例的流程图;
图9为本发明实施例通勤时间计算系统的一个具体示例的框图;
图10为本发明实施例的电子设备的示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在租房领域中,每个地铁站都被看成一个比较重要的商圈,所以对于每个小区距离地铁的通行时间对小区的租房等行为有着非常重要的影响;因此计算每个城市(尤其是一些重要的城市)的小区到各个地铁站的通勤时间是非常的有必要。由于每个城市的地铁商圈一直在变动、城市的小区也一直在变化,每个城市的地铁商圈信息、小区数据信息差别比较大,导致信息不准确和不完整;同时,计算各个城市地铁商圈到各个小区的通勤时间的算法不统一、计算的数值标准不统一,不能很好的代表小区和商圈之间的通勤关系;上述多种因素均导致现有技术中计算出的通勤时间不准确。故本实施例中,采用爬虫工具实时获取地铁信息和小区信息,对地铁进行分类存储,并采用迪杰斯特拉算法计算通勤时间,解决了城市地铁商圈数据不准确、不完整,通勤时间计算方法不统一、数值标准不统一的问题,有利于向用户提供精准的房源推荐信息。
基于此,本发明实施例提供了一种通勤时间计算方法,应用于房屋地产领域,如图1所示,该方法可以包括步骤S1-S4。
步骤S1:获取城市的地铁信息和小区信息。
作为示例性的实施例,可以通过爬虫工程获取全国各个城市的地铁信息和各个城市的小区信息;其中,地铁信息包括地铁站名信息、地铁线路信息和地铁线路基本信息;本实施例对此仅作示意性说明,不以此为限。
步骤S2:根据地铁信息和小区信息得到第一时间,第一时间表征目标小区到通勤地铁站的通勤时间,通勤地铁站为与目标小区距离最短的地铁站。
作为示例性的实施例,通过爬虫得到的地铁信息中包括各个地铁站的位置信息,小区信息中包括小区的位置信息,上述位置信息可以是经纬度信息,在其它实施例中,位置信息也可以是其它用于表征位置的信息,如三维位置信息等,仅以此为例,不以此为限。根据地铁站的位置信息和小区的位置信息计算出目标小区到各个地铁站之间的通勤时间,然后找出通勤时间最小的那个地铁站作为最近的通勤地铁站,即该目标小区的通勤地铁站,便可计算出从目标小区到通勤地铁站的通勤时间,也就是第一时间。
本实施例中,目标小区可以是全国城市中的任意小区,具体可以包括一个小区,也可以包括多个小区,在实际应用中根据需要合理设置即可,本实施例对此不作任何限制。
步骤S3:根据地铁信息得到第二时间,第二时间表征相邻地铁站之间的通勤时间。
作为示例性的实施例,通过爬虫爬取到的地铁信息中包括各个地铁站的位置信息,根据上述各个地铁站的位置信息可以计算出相邻两两地铁站之间的距离,用距离除以地铁的运行速度便能够得出相邻两两地铁站之间的通勤时间。
步骤S4:根据第一时间和第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间。
作为示例性的实施例,采用最短路径算法可以计算出各个城市中每一个小区到该城市各个地铁站的通勤时间,最短路径算法可以是迪杰斯特拉(Dijkstra)算法,也可以是其它算法,如弗洛伊德(Floyd)算法等,仅以此为例,不以此为限。
通过上述步骤,先获取到全国各个城市的地铁信息和小区信息,保证数据信息的准确性和实时性;之后,根据获取到的地铁信息和小区信息确定第一时间和第二时间;再根据上述通勤时间采用最短路径算法计算出小区到各个地铁站的通勤时间,采用统一的算法保证了计算结果的一致性和准确性,提高了通勤时间计算的准确性。
作为示例性的实施例,步骤S2根据地铁信息和小区信息得到第一时间的步骤中,如图2所示,具体可包括步骤S21-S24。
步骤S21:从地铁信息和小区信息提取各个地铁站的地铁站经纬度和目标小区经纬度。
作为示例性的实施例,通过爬虫工具获取全国各个城市的地铁信息和各个城市的小区信息,主要采用Python中的requests、bs4、urllib、scrapy库获取网上各个城市的地铁站经纬度和名字等相关信息,同时获取各个城市的所有小区的经纬度和名字。通常,小区包括多个大门,通过爬虫工具可以得到小区各个大门的经纬度,并且还能够识别出小区的正大门。当小区面积较大的时候按小区的正大门所在经纬度计算,例如,当小区的面积大于2万平方米时认为是面积较大的小区,仅以此为例,不以此为限,在实际应用中可根据需要合理设置。
步骤S22:根据各个地铁站的地铁站经纬度和目标小区经纬度计算出目标小区到各个地铁站的距离。
作为示例性的实施例,根据各个城市的每一个地铁站的经纬度和每一个小区的经纬度计算出每一个小区到该城市每一个地铁站的距离。具体地,根据爬取到的小区和地铁的经纬度,通过python的geopy库计算出小区和每个地铁站之间的距离。
步骤S23:根据目标小区到各个地铁站的距离和预设平均速度计算出目标小区到各个地铁站的通勤时间。
作为示例性的实施例,根据人们出行经常选用的交通方式确定预设平均速度;例如,人们从居住小区到地铁站通常采用步行的方式,则预设平均速度为预先设定的平均步行速度;在其它示例性实施例中,若小区到地铁主要通过骑行到达,则预设平均速度可以是根据经验预先设置的平均骑行速度,本实施例对此仅作示意性说明,不以此为限,在其它示例性的实施例中,预设平均速度还可以是预设公交平均速度或者预设驾车平均速度。本实施例中,具体地,可以根据距离指定小区到地铁主要是通过步行达到,根据经验设定一个平均的步行速度,根据计算出小区到地铁站的距离和设定的步行速度,计算出小区到各个地铁站之间的通勤时间。
步骤S24:在目标小区到各个地铁站的通勤时间中查找最小通勤时间,将最小通勤时间所对应的地铁站作为通勤地铁站,将最小通勤时间作为第一时间。
作为示例性的实施例,在目标小区到各个地铁站的通勤时间中查找最小通勤时间,进而找到距离目标小区最近的地铁站,最小通勤时间所对应的地铁站即为通勤地铁站,最小通勤时间即为目标小区到通勤地铁站的通勤时间,得到目标小区到距离最近地铁站的通勤时间,也就是第一时间。
通过上述步骤,根据各个地铁站的地铁站经纬度和小区经纬度得到目标小区到各个地铁站的通勤时间,在多个通勤时间中找到最小值,最小值所对应的地铁站则为该目标小区所对应的通勤地铁站,该最小值则为该目标小区到通勤地铁站的通勤时间,即第一时间,计算方法简单、便捷;在推荐用户房源的时候,考虑用户的工作地商圈和用户可以接受的通勤时间,根据计算得到的小区到各个地铁的通勤时间,给用户推荐在可接受时间范围内的小区房源,有利于向用户精准地推荐房源信息。
作为示例性的实施例,步骤S3根据地铁信息得到第二时间的步骤中,如图3所示,包括步骤S31-S33。
步骤S31:根据地铁信息得到各个地铁站的地铁站经纬度。
具体地,根据爬虫爬取到各个城市中各个地铁站的经纬度信息。
步骤S32:根据各个地铁站的地铁站经纬度计算出相邻各个地铁站之间的距离。
步骤S33:根据相邻各个地铁站之间的距离和地铁运行速度得到第二时间,也就是相邻地铁站之间的通勤时间。
作为示例性的实施例,地铁运行速度可以是预先获取到的,具体可通过爬虫爬取到每一条地铁线的运行速度,也可以是根据经验设置的一个不变的地铁运行速度,仅以此为例,不以此为限。在本实施例中,根据爬虫爬取到各个地铁站的经纬度信息,计算出相邻各个地铁站之间的距离,根据经验设定一个不变的地铁运行速度,根据距离和速度计算出相邻两两地铁站之间的通勤时间。
通过上述步骤计算各个地铁站之间的通勤时间,根据各个地铁站之间的通勤时间可以更加合理地确定小区到各个地铁站的通勤时间;还可以根据地铁站之间的通勤时间合理划分销售负责的商圈范围和区域,便于指导销售划区,提高工作效率。
作为示例性的实施例,步骤S4根据第一时间和第二时间,采用最短路径算法确定小区到各个地铁站的通勤时间的步骤中,如图4所示,包括步骤S41。
步骤S41:根据第一时间和第二时间采用迪杰斯特拉算法确定目标小区到各个地铁站的通勤时间。
具体地,由得到的目标小区到最近邻地铁站的通勤时间和相邻两两地铁站之间的通勤时间,根据迪杰斯特拉算法,计算目标小区到每个地铁站的通勤时间。
迪杰斯特拉(Dijkstra)主要算法思路为:如图5所示,图5中每条线上的数值表示节点到节点之间的权值,利用Dijkstra算法可以计算任意节点到其它节点的最短路径。
主要计算步骤如下:1、指定一个节点,例如要计算'A'节点到其它节点的最短路径;2、引入两个集合(S、U),S集合包含已求出的最短路径的点(以及相应的最短长度),U集合包含未求出最短路径的点(以及A到该点的路径,注意如上图5所示,A→C由于没有直接相连初始时为∞);3、初始化两个集合,S集合初始时,只有当前要计算的节点,A→A=0,U集合初始时为A→B=4,A→C=∞,A→D=2,A→E=∞;4、从U集合中找出路径最短的点,加入S集合,例如A→D=2;5、更新U集合路径,if('D到B,C,E的距离'+'AD距离'<'A到B,C,E的距离'),则更新U;6、循环执行4、5两步骤,直至遍历结束,得到A到其它节点的最短路径。
其中,在本实施例中采用此种算法,每个点代表不同的地铁站点或小区,可假设其中的任意点为小区或地铁站点,进行最短路径的计算。
通过上述步骤,对上述得到的两个通勤时间采用迪杰斯特拉算法计算小区到每个地铁站的通勤时间,采用统一算法计算,保证了结果的一致性和准确性。
作为示例性的实施例,步骤S1获取城市的地铁信息和小区信息的步骤中,如图6所示,包括步骤S11和S12。
步骤S11:通过爬虫工具得到城市的地铁信息和小区信息。
作为示例性的实施例,地铁信息包括地铁站名信息、地铁线路信息和地铁线路基本信息。其中,地铁站名信息包括地铁站名称和地铁站经纬度;地铁线路信息包括线路名称、始发站、终点站、始发站与终点站之间经过的所有站点名称、地铁站在线路上的开通状态;地铁线路基本信息包括地铁线所属城市、地铁线名称、开通状态、开通时间、线路划分状况。线路划分状况主要包括地铁线路是否分南北段运行、东西段运行和环线运行。本实施例中对上述地铁信息的描述,仅作示意性说明,并不以此为限。
作为示例性的实施例,小区信息包括小区所属城市、小区所属行政区域、小区名称以及小区周边商圈信息。小区周边商圈信息主要指距离地铁站最近的商圈。本实施例中对上述小区信息的描述,仅作示意性说明,并不以此为限。
如图7所示,爬虫工具主要包含以下几个单元:
A、引擎(Scrapy),用来处理整个系统的数据流处理,触发事务(框架核心);
B、调度器(Scheduler),用来接收引擎发过来的请求,压入队列中,并在引擎再次请求的时候返回,可以理解为一个URL(抓取网页的网址或者说是链接)的优先队列,由它来决定下一个要抓取的网址是什么,同时去除重复的网址;
C、下载器(Downloader),用于下载网页内容,并将网页内容返回给蜘蛛(Scrapy下载器是建立在twisted这个高效的异步模型上的);
D、爬虫(Spiders),爬虫是主要核心部分,用于从特定的网页中提取自己需要的信息,即所谓的实体(Item),用户也可以从中提取出链接,让Scrapy继续抓取下一个页面;
E、项目管道(Pipeline),负责处理爬虫从网页中抽取的实体,主要的功能是持久化实体、验证实体的有效性、清除不需要的信息;当页面被爬虫解析后,将被发送到项目管道,并经过几个特定的次序处理数据;
引擎首先会将爬虫文件中的起始url获取,提交到调度器中;如果需要从url中下载数据,则调度器会将url通过引擎提交给下载器,下载器根据url去下载指定内容(响应体);下载好的数据会通过引擎移交给爬虫文件,爬虫文件可以将下载的数据进行指定格式的解析;如果解析出的数据需要进行持久化存储,则爬虫文件会将解析好的数据通过引擎移交给管道进行持久化存储。
步骤S12:将地铁信息分别存储至地铁站名信息表、地铁线路表和地铁线路基本信息表,将小区信息存储至小区信息表。
作为示例性的实施例,可通过hive数据库对获取到的数据进行分类存储;根据不同的城市不同的区域对各个小区、地铁进行存储入库;地铁商圈的数据存入地铁数据库中;小区数据存储在小区的数据库中。
具体地,由于各个城市的地铁线路数据复杂,存在整修地铁、换乘站开通线路状态不同、线路分段区域状态不同等其它特殊情况,对地铁的数据信息分为三个不同的表进行分别存储;地铁站名信息存储至地铁站名信息表、地铁线路信息存储至地铁线路表、地铁线路基本信息存储至地铁线路基本信息表。小区信息则存储至小区信息表。
通过上述步骤实现信息的分类存储,便于信息的及时查找和更新,确保了信息的准确性和实时性。
本实施例提供的基于迪杰特斯拉算法的通勤时间计算方法,采用爬虫工具获取地铁信息和小区信息,并对地铁信息进行分类存储,最终采用Dijkstra算法计算通勤时间,解决了城市地铁商圈数据不准确不完整、通勤时间计算方法不统一、数值标准不统一的问题。
作为示例性的实施例,步骤S4根据第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间的步骤之后,如图8所示,还包括步骤S5。
步骤S5:按照小区标识、地铁站标识、城市名称、通勤时间和分区字段将小区到各个地铁站的通勤时间存储至HIVE数据库。
作为示例性的实施例,将计算得到的通勤时间的结果数据存储到HIVE数据库中;数据库的字段主要包括小区标识(如小区id)、地铁站标识(如地铁站id)、城市名、通勤时间和分区字段,该表需要每天定时更新。
通过上述步骤对小区到各个地铁站的通勤时间进行存储,便于数据的保存和后续利用。
在本实施例中还提供了一种通勤时间计算系统,该系统用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例还提供一种通勤时间计算系统,如图9所示,包括:第一获取模块91、第一处理模块92、第二处理模块93和第三处理模块94。
第一获取模块91,用于获取城市的地铁信息和小区信息;详细内容参考步骤S1所述。
第一处理模块92,用于根据所述地铁信息和所述小区信息得到第一时间,所述第一时间表征目标小区到通勤地铁站的通勤时间,所述通勤地铁站为与目标小区距离最短的地铁站;详细内容参考步骤S2所述。
第二处理模块93,用于根据所述地铁信息得到第二时间,所述第二时间表征相邻地铁站之间的通勤时间;详细内容参考步骤S3所述。
第三处理模块94,用于根据所述第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间;详细内容参考步骤S4所述。
作为示例性的实施例,所述第一处理模块包括:第一处理单元,用于从所述地铁信息和所述小区信息提取各个地铁站的地铁站经纬度和目标小区经纬度,详细内容参考步骤S21所述;第二处理单元,用于根据各个地铁站的地铁站经纬度和目标小区经纬度计算出目标小区到各个地铁站的距离,详细内容参考步骤S22所述;第三处理单元,用于根据所述目标小区到各个地铁站的距离和预设平均速度计算出目标小区到各个地铁站的通勤时间,详细内容参考步骤S23所述;第四处理单元,用于在所述目标小区到各个地铁站的通勤时间中查找最小通勤时间,将所述最小通勤时间所对应的地铁站作为通勤地铁站,将最小通勤时间作为第一时间,详细内容参考步骤S24所述。
可选地,所述第二处理模块包括:第五处理单元,用于根据所述地铁信息得到各个地铁站的地铁站经纬度,详细内容参考步骤S31所述;第六处理单元,用于根据各个地铁站的所述地铁站经纬度计算出相邻各个地铁站之间的距离,详细内容参考步骤S32所述;第七处理单元,用于根据所述相邻各个地铁站之间的距离和地铁运行速度得到第二时间,详细内容参考步骤S33所述。
可选地,所述第三处理模块包括:第八处理单元,用于根据所述第一时间和所述第二时间,采用迪杰斯特拉算法进行计算,得出目标小区到各个地铁站的通勤时间,详细内容参考步骤S41所述。
可选地,所述地铁信息包括地铁站名信息、地铁线路信息和地铁线路基本信息;其中,所述地铁站名信息包括地铁站名称和地铁站经纬度;所述地铁线路信息包括线路名称、始发站、终点站、始发站与终点站之间经过的所有站点名称、地铁站在线路上的开通状态;所述地铁线路基本信息包括地铁线所属城市、地铁线名称、开通状态、开通时间、线路划分状况;
和/或,
所述小区信息包括小区所属城市、小区所属行政区域、小区名称以及小区周边商圈信息。
可选地,所述第一获取模块包括:第九处理单元,用于通过爬虫工具得到城市的地铁信息和小区信息,详细内容参考步骤S11所述;第十处理单元,用于将所述地铁信息分别存储至地铁站名信息表、地铁线路表和地铁线路基本信息表,将小区信息存储至小区信息表,详细内容参考步骤S12所述。
可选地,还包括:第四处理模块,用于按照小区标识、地铁站标识、城市名称、通勤时间和分区字段将所述小区到各个地铁站的通勤时间存储至HIVE数据库,详细内容参考步骤S5所述。
本实施例中的通勤时间计算系统是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
上述各个模块的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本发明实施例还提供了一种电子设备,如图10所示,该电子设备包括一个或多个处理器101以及存储器102,图10中以一个处理器101为例。
该控制器还可以包括:输入装置103和输出装置104。
处理器101、存储器102、输入装置103和输出装置104可以通过总线或者其他方式连接,图10中以通过总线连接为例。
处理器101可以为中央处理器(Central Processing Unit,CPU)。处理器101还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者是任何常规的处理器等。
存储器102作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本申请实施例中的通勤时间计算方法对应的程序指令/模块。处理器101通过运行存储在存储器102中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的通勤时间计算方法。
存储器102可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据服务器操作的处理装置的使用所创建的数据等。此外,存储器102可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器102可选包括相对于处理器101远程设置的存储器,这些远程存储器可以通过网络连接至网络连接装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置103可接收输入的数字或字符信息,以及产生与服务器的处理装置的用户设置以及功能控制有关的键信号输入。输出装置104可包括显示屏等显示设备。
一个或者多个模块存储在存储器102中,当被一个或者多个处理器101执行时,执行如图1-8所示的通勤时间计算方法。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指示相关的硬件来完成,被执行的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述通勤时间计算方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种通勤时间计算方法,其特征在于,包括:
获取城市的地铁信息和小区信息;
根据所述地铁信息和所述小区信息得到第一时间,所述第一时间表征目标小区到通勤地铁站的通勤时间,所述通勤地铁站为与目标小区距离最短的地铁站;
根据所述地铁信息得到第二时间,所述第二时间表征相邻地铁站之间的通勤时间;
根据所述第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间。
2.如权利要求1所述的通勤时间计算方法,其特征在于,根据所述地铁信息和所述小区信息得到第一时间,包括:
从所述地铁信息和所述小区信息提取各个地铁站的地铁站经纬度和目标小区经纬度;
根据各个地铁站的地铁站经纬度和目标小区经纬度计算出目标小区到各个地铁站的距离;
根据所述目标小区到各个地铁站的距离和预设平均速度计算出目标小区到各个地铁站的通勤时间;
在所述目标小区到各个地铁站的通勤时间中查找最小通勤时间,将所述最小通勤时间所对应的地铁站作为通勤地铁站,将最小通勤时间作为第一时间。
3.如权利要求1所述的通勤时间计算方法,其特征在于,根据所述地铁信息得到第二时间,包括:
根据所述地铁信息得到各个地铁站的地铁站经纬度;
根据各个地铁站的所述地铁站经纬度计算出相邻各个地铁站之间的距离;
根据所述相邻各个地铁站之间的距离和地铁运行速度得到第二时间。
4.如权利要求1所述的通勤时间计算方法,其特征在于,根据所述第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间,包括:
根据所述第一时间和所述第二时间,采用迪杰斯特拉算法进行计算,得出目标小区到各个地铁站的通勤时间。
5.如权利要求1所述的通勤时间计算方法,其特征在于,
所述地铁信息包括地铁站名信息、地铁线路信息和地铁线路基本信息;其中,所述地铁站名信息包括地铁站名称和地铁站经纬度;所述地铁线路信息包括线路名称、始发站、终点站、始发站与终点站之间经过的所有站点名称、地铁站在线路上的开通状态;所述地铁线路基本信息包括地铁线所属城市、地铁线名称、开通状态、开通时间、线路划分状况;
和/或,
所述小区信息包括小区所属城市、小区所属行政区域、小区名称以及小区周边商圈信息。
6.如权利要求5所述的通勤时间计算方法,其特征在于,获取城市的地铁信息和小区信息,包括:
通过爬虫工具得到城市的地铁信息和小区信息;
将所述地铁信息分别存储至地铁站名信息表、地铁线路表和地铁线路基本信息表,将小区信息存储至小区信息表。
7.如权利要求1-6中任一所述的通勤时间计算方法,其特征在于,根据所述第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间的步骤之后,还包括:
按照小区标识、地铁站标识、城市名称、通勤时间和分区字段将所述小区到各个地铁站的通勤时间存储至HIVE数据库。
8.一种通勤时间计算系统,其特征在于,包括:
第一获取模块,用于获取城市的地铁信息和小区信息;
第一处理模块,用于根据所述地铁信息和所述小区信息得到第一时间,所述第一时间表征目标小区到通勤地铁站的通勤时间,所述通勤地铁站为与目标小区距离最短的地铁站;
第二处理模块,用于根据所述地铁信息得到第二时间,所述第二时间表征相邻地铁站之间的通勤时间;
第三处理模块,用于根据所述第一时间和所述第二时间,采用最短路径算法确定目标小区到各个地铁站的通勤时间。
9.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-7任意一项所述的通勤时间计算方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-7任意一项所述的通勤时间计算方法。
CN202010071144.1A 2020-01-21 2020-01-21 通勤时间计算方法、系统、电子设备及可读存储介质 Pending CN111275529A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010071144.1A CN111275529A (zh) 2020-01-21 2020-01-21 通勤时间计算方法、系统、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010071144.1A CN111275529A (zh) 2020-01-21 2020-01-21 通勤时间计算方法、系统、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN111275529A true CN111275529A (zh) 2020-06-12

Family

ID=71001824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010071144.1A Pending CN111275529A (zh) 2020-01-21 2020-01-21 通勤时间计算方法、系统、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN111275529A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102187285A (zh) * 2008-09-18 2011-09-14 苹果公司 具有通勤时间功能的通信设备及其使用方法
CN103852766A (zh) * 2012-11-30 2014-06-11 上海斐讯数据通信技术有限公司 一种移动终端及其提醒公共交通到站的实现方法
CN105701560A (zh) * 2015-12-31 2016-06-22 百度在线网络技术(北京)有限公司 一种通勤路线信息的确定方法及装置
CN108288215A (zh) * 2018-01-17 2018-07-17 链家网(北京)科技有限公司 一种选房方法及系统
CN108446298A (zh) * 2018-01-25 2018-08-24 链家网(北京)科技有限公司 一种通勤找房方法及装置
CN108681741A (zh) * 2018-04-08 2018-10-19 东南大学 基于ic卡和居民调查数据的地铁通勤人群信息融合方法
CN109800360A (zh) * 2018-12-24 2019-05-24 北京城市网邻信息技术有限公司 小区查询方法、装置、电子设备及存储介质
CN109949123A (zh) * 2019-02-12 2019-06-28 平安科技(深圳)有限公司 房源推荐方法、装置、计算机设备及计算机可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102187285A (zh) * 2008-09-18 2011-09-14 苹果公司 具有通勤时间功能的通信设备及其使用方法
CN103852766A (zh) * 2012-11-30 2014-06-11 上海斐讯数据通信技术有限公司 一种移动终端及其提醒公共交通到站的实现方法
CN105701560A (zh) * 2015-12-31 2016-06-22 百度在线网络技术(北京)有限公司 一种通勤路线信息的确定方法及装置
CN108288215A (zh) * 2018-01-17 2018-07-17 链家网(北京)科技有限公司 一种选房方法及系统
CN108446298A (zh) * 2018-01-25 2018-08-24 链家网(北京)科技有限公司 一种通勤找房方法及装置
CN108681741A (zh) * 2018-04-08 2018-10-19 东南大学 基于ic卡和居民调查数据的地铁通勤人群信息融合方法
CN109800360A (zh) * 2018-12-24 2019-05-24 北京城市网邻信息技术有限公司 小区查询方法、装置、电子设备及存储介质
CN109949123A (zh) * 2019-02-12 2019-06-28 平安科技(深圳)有限公司 房源推荐方法、装置、计算机设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
US11740102B2 (en) Method, apparatus, device and storage medium for determining point of interest area
CN110929162B (zh) 基于兴趣点的推荐方法、装置、计算机设备和存储介质
US11861516B2 (en) Methods and system for associating locations with annotations
US20110208425A1 (en) Mining Correlation Between Locations Using Location History
CN110992681B (zh) 交通路网属性信息生成方法、装置、存储介质及电子设备
CN111666292B (zh) 用于检索地理位置的相似度模型建立方法和装置
CN107689628B (zh) 一种电网环路检测方法
CN109800360B (zh) 小区查询方法、装置、电子设备及存储介质
JP2007219655A (ja) 施設情報管理システム、施設情報管理方法および施設情報管理プログラム
CN105608113A (zh) 判断文本中poi数据的方法及装置
CN111666461B (zh) 检索地理位置的方法、装置、设备和计算机存储介质
CN116698075B (zh) 路网数据处理方法、装置、电子设备及存储介质
CN110598131B (zh) 确定用户常驻区域的方法、装置、存储介质和电子设备
CN108846134A (zh) 一种基于网络爬虫的运维方案推荐系统及方法
JP2009123160A (ja) コンテンツ情報配信装置、コンテンツ情報配信システムおよびコンテンツ情報配信方法
CN111275529A (zh) 通勤时间计算方法、系统、电子设备及可读存储介质
CN111241835B (zh) 基于游客画像的一机游景点游客知识嵌入方法及装置
TW202146850A (zh) 確定路名之處理裝置及方法
CN113761289A (zh) 图学习方法、框架、计算机系统及可读存储介质
CN113868532B (zh) 一种地点推荐方法、装置、电子设备及存储介质
CN113190640B (zh) 兴趣点数据处理方法及装置
CN114419357B (zh) 数据处理方法、装置、计算机及可读存储介质
CN112612825B (zh) 一种确定同行车辆的方法、装置、设备以及存储介质
CN110443493B (zh) 路线相似度确定方法、装置、设备和介质
CN110941768B (zh) 服务推荐方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200612

WD01 Invention patent application deemed withdrawn after publication