CN114996586B - 一种基于时空大数据的个性化出行路径生成方法及系统 - Google Patents

一种基于时空大数据的个性化出行路径生成方法及系统 Download PDF

Info

Publication number
CN114996586B
CN114996586B CN202210829355.6A CN202210829355A CN114996586B CN 114996586 B CN114996586 B CN 114996586B CN 202210829355 A CN202210829355 A CN 202210829355A CN 114996586 B CN114996586 B CN 114996586B
Authority
CN
China
Prior art keywords
poi
attribute
data
road network
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210829355.6A
Other languages
English (en)
Other versions
CN114996586A (zh
Inventor
吴涛
秦建新
曾芷萱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Normal University
Original Assignee
Hunan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Normal University filed Critical Hunan Normal University
Priority to CN202210829355.6A priority Critical patent/CN114996586B/zh
Publication of CN114996586A publication Critical patent/CN114996586A/zh
Application granted granted Critical
Publication of CN114996586B publication Critical patent/CN114996586B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于时空大数据的个性化出行路径生成方法及系统,方法包括:获取用于描述用户出行兴趣的意向POI主题序列,意向POI主题序列包括用户感兴趣的至少一个POI主题;根据意向POI主题序列、预设的POI知识图谱、预设的路网数据集应用隐马尔可夫模型生成个性化出行路径,个性化出行路径至少包括一个POI,一个POI对应属于一个POI主题的一个景点。本发明根据用户的个人出行意向和采集的地理时空大数据进行分析,利用景点信息构建POI知识图谱,对接入的地理时空数据作出更全面的总结,挖掘更深层的数据关联关系,提供更有深度的相关信息,为用户提供更加准确的景点推荐,能够进一步提升推荐的个性化程度。

Description

一种基于时空大数据的个性化出行路径生成方法及系统
技术领域
本发明属于地理空间智能技术领域,具体涉及一种基于时空大数据的个性化出行路径生成方法及系统。
背景技术
近年来,地理空间智能(GeoAI)作为地理空间科学和人工智能深度融合的交叉学科,有力提升了对于地理现象过程的动态感知、智能推理和知识发现的能力。大数据时代基于社会感知的地理空间智能研究和应用主要有智慧出行、灾害预测、测绘、智慧交通、智慧医疗、智慧养老、智慧政务等。目前,智能出行的应用主要集中在道路安全和交通管理、公共交通、智慧停车、路况实时通告、行程导航等方面,其中具有代表有,采用加权方法最小化出行规划的距离成本,作为出行规划的参考依据;或者以最小链路出行时间和出行距离为优化目标的多目标动态路径选择模型,保证乘客在最短出行时间和距离上选择可靠出行路线;或是基于朴素贝叶斯兴趣数据挖掘机器学习的智能旅游路线规划算法。在当前的智慧城市背景下,如何利用先进的信息技术和相关智能技术进行分析整合,对出行路径进行科学的规划,使大众的个性化需求最大化的得到满足是新的趋向。现有的电子地图应用中的路径规划查询过于单一,在个性化出行路径推荐方面,主要侧重于根据实际距离远近、路况来规划路线,即使考虑结合景点热度和推荐度等因素,也仅是单一的针对景点热度和推荐度因素进行结合。随着人们生活范围的不断扩展,路网规模持续增大,有必要设计一种满足个性化日常生活应用的新型路径规划查询方法。
发明内容
本发明要解决的技术问题是提供一种基于时空大数据的融合用户个人意向和景点知识图谱的个性化出行路径生成方法及系统。
为实现上述目的,基于本发明一方面,提供一种基于时空大数据的个性化出行路径生成方法,所述方法包括:获取用于描述用户出行兴趣的意向POI主题序列,所述意向POI主题序列包括用户感兴趣的至少一个POI主题;根据所述意向POI主题序列、预设的POI知识图谱、预设的路网数据集应用隐马尔可夫模型生成个性化出行路径,所述个性化出行路径至少包括一个POI,一个所述POI对应属于一个所述POI主题的一个景点;
其中,每个所述POI对应的特征信息包括第一位置信息,所述路网数据集用于表征实际路网空间,根据所述第一位置信息以及所述路网数据集获取每个所述POI在所述路网数据集中的投影,得到与所述POI对应的POI投影点;
所述隐马尔可夫模型包括由所有POI主题组成的观测状态层和由所有POI组成的第一隐含层、由所有POI对应的所述POI投影点组成的第二隐含层,
应用隐马尔可夫模型的观测状态层获取所述意向POI主题序列,应用隐马尔可夫模型的第一隐含层根据所述意向POI主题序列在所述POI知识图谱中进行寻路,生成一组POI观测序列,所述POI观测序列包括至少一个所述POI,所述POI观测序列的各所述POI与所述意向POI主题序列中各所述POI主题一一对应;
基于所述POI观测序列,应用隐马尔可夫模型的第二隐含层计算所述POI观测序列中每个所述POI对应的每个所述POI投影点的观测概率,然后基于所述POI投影点的观测概率,计算每个所述POI的任一所述POI投影点转移到相邻的POI的任一所述POI投影点的转移概率;
基于计算的所有所述POI投影点的所述观测概率和所述转移概率,采用维特比算法计算,生成个性化出行路径。
在其中一实施例中,所述根据所述意向POI主题序列、预设的POI知识图谱、预设的路网数据集应用隐马尔可夫模型生成个性化出行路径之前,包括:
从多个数据源中获取原始数据并进行对齐纠偏处理和属性规整处理以构建POI数据集,所述POI数据集中,任一POI主题至少包括一个POI,一个所述POI代表一个表征景点本体的实体,每个所述POI对应的特征信息至少包括:主题序列号、POI序列号、至少一个属性以及与所述属性对应的属性值;
应用包括实体、关系、实体的三元组和包括实体、属性、属性值的三元组分别表征不同的POI之间、所述POI与对应的属性之间的关系,构建所述POI知识图谱。
在其中一实施例中,所述从多个数据源中获取原始数据并进行对齐纠偏处理和属性规整处理以构建POI数据集,包括:
从多个数据源中获取包括POI数据和公众评价数据的所述原始数据,对所述POI数据进行对齐纠偏处理;
对所述POI数据和所述公众评价数据进行属性规整处理,对每个所述POI进行POI主题分类;
基于所述POI数据和所述公众评价数据获取与每个所述POI对应的特征信息,构建POI数据集。
在其中一实施例中,所述应用包括实体、关系、实体的三元组和包括实体、属性、属性值的三元组分别表征不同的POI之间、所述POI与对应的属性之间的关系,构建所述POI知识图谱,包括:
构建POI知识图谱的模式层,获取景点本体;
对所述POI数据集中每个所述POI的与所述景点本体对应的景点知识进行特征信息抽取;
将每个表征景点本体的实体进行特征信息对齐;
基于所述景点知识进行知识融合,用包括实体、属性、属性值的三元组表征所述POI与对应的的属性之间的关系,用包括实体、关系、实体的三元组表征不同所述POI之间的关系;
基于实体-属性-属性值的三元组和实体-关系-实体的三元组进行知识加工,引入信息熵作为POI节点和属性节点之间的边的权值,引入关联指数作为POI主题节点与POI节点之间的边的权值;
将构建的所述知识图谱存储在图数据库中。
在其中一实施例中,所述根据所述第一位置信息以及所述路网数据集获取每个所述POI在所述路网数据集中的投影,得到与所述POI对应的POI投影点,包括:
以所述POI为起点,根据所述POI的所述第一位置信息利用大圆距离算法由近及远的依次查找路网数据集中预设数量的与所述POI邻近的路段;
利用大圆距离算法获取所述POI在对应的邻近路段上的投影点,计算出由路网数据集表征的实际路网空间中,所述POI与对应投影点之间的大圆距离;
将所述大圆距离不大于预设距离阈值的所述投影点作为所述POI投影点,任一个所述POI对应包括至少一个所述POI投影点,全部的所述POI投影点构成POI投影点集。
基于本发明的又一方面,提供一种基于时空大数据的个性化出行路径生成系统,包括:
意向获取模块,用于获取用于描述用户出行兴趣的意向POI主题序列,所述意向POI主题序列包括用户感兴趣的至少一个POI主题;
路径生成模块,用于根据所述意向POI主题序列、预设的POI知识图谱、预设的路网数据集应用隐马尔可夫模型生成个性化出行路径,所述个性化出行路径至少包括一个POI,一个所述POI对应属于一个所述POI主题的一个景点。
基于本发明的又一方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上任意一项中所述的方法。
基于本发明的又一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上任意一项中所述的方法。
本发明的基于时空大数据的个性化出行路径生成方法及系统,根据用户的个人出行意向和采集的公众热度推荐度数据进行分析,挖掘旅游热点,基于用户的需求整合线上线下的信息为用户规划可行的个性化出行路径;利用景点信息构建POI知识图谱,将知识图谱引入个性化路径推荐系统,可对接入的地理时空数据作出更全面的总结,挖掘更深层的数据关联关系,提供更有深度的相关信息,为用户提供更加准确的景点推荐,能够进一步提升推荐的个性化程度;通过结合知识图谱网络以及众源时空数据之间的时空动态关系,可以更好的预测用户最可能选择的轨迹移动行为,此外,还可减少传统方法对POI数据和路网数据造成的空间不确定性干扰;利用众源时空大数据获取公众出行偏好,将公众对不同地点的偏好、时间预算、成本预算等信息映射到实际路网空间中,融合个人出行意向进行动态建模分析,为用户提供合适且个性化的出行方案。
附图说明
为了更清楚地说明本发明一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于时空大数据的个性化出行路径生成方法一实施例的流程示意图;
图2为POI在实际路网空间中的位置以及对应的POI投影点的示意图;
图3为本发明基于时空大数据的个性化出行路径生成方法一实施例中POI知识图谱的结构示意图;
图4为本发明基于时空大数据的个性化出行路径生成方法一实施例的双层隐马尔可夫模型结构示意图;
图5为实际路网空间中两个POI之间的大圆距离示意图以及对应的POI投影点之间的路径距离示意图;
图6为本发明基于时空大数据的个性化出行路径生成系统一实施例的结构示意图;
图7为本发明一实施例中电子设备的内部结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,除非另外定义,本发明一个或多个实施例使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
如图1所示,本发明提供一种基于时空大数据的个性化出行路径生成方法,该方法包括:
S1:获取用于描述用户出行兴趣的意向POI主题序列,意向POI主题序列包括用户感兴趣的至少一个POI主题;
S2:根据意向POI主题序列、预设的POI知识图谱、预设的路网数据集应用隐马尔可夫模型生成个性化出行路径,个性化出行路径至少包括一个POI,一个POI对应属于一个POI主题的一个景点。
步骤S2中,隐马尔可夫模型包括由所有POI主题组成的观测状态层和由所有POI组成的第一隐含层、由所有POI对应的POI投影点组成的第二隐含层。根据意向POI主题序列、预设的POI知识图谱、预设的路网数据集应用隐马尔可夫模型生成个性化出行路径,包括:应用隐马尔可夫模型的观测状态层获取意向POI主题序列,应用隐马尔可夫模型的第一隐含层根据意向POI主题序列在POI知识图谱中进行寻路,生成一组POI观测序列,POI观测序列包括至少一个POI,POI观测序列的各POI与意向POI主题序列中各POI主题一一对应;基于POI观测序列,应用隐马尔可夫模型的第二隐含层计算POI观测序列中每个POI对应的每个POI投影点的观测概率,然后基于POI投影点的观测概率,计算每个POI的任一POI投影点转移到相邻的POI的任一POI投影点的转移概率;基于计算的所有POI投影点的观测概率和转移概率,采用维特比算法计算,生成个性化出行路径。
在本实施例中,在进行步骤S1之前,需要先接入众源地理时空大数据,进行数据预处理,以得到生成个性化出行路径所需的路网数据集、POI(Point of Interest)数据集、POI知识图谱、POI投影点集。
具体的,可在相关数据开放平台注册开发者账号,申请路网数据、POI数据、公众评价数据等原始数据的访问权限,以获取数据接入的资格,然后基于数据开放协议对从开放平台接入的原始数据进行抽取、转换、加载等操作。
对于从多个数据源获取的路网数据、POI数据、公众评价数据等原始数据,需要先进行数据预处理。数据预处理具体包括对齐纠偏处理和属性规整处理,其中,对齐纠偏处理具体包括格式转换处理、坐标转换处理、位置纠偏处理。针对路网数据和POI数据,先进行格式转换处理和坐标转换处理。在格式转换处理上,包括SHP(ESRI Shapefile,空间数据开放格式)、OSM(OpenStreetMap,公开地图格式)、KML(Keynote markup language,KML文件格式)、CSV(Comma Separated Values,逗号分隔值格式)等文件格式之间的转换。在坐标转换处理上,主要考虑以WGS-84坐标系(国际上采用的一种地心坐标系)作为主流坐标系,将路网数据中的位置数据和POI数据中的位置数据统一转换为WGS-84坐标系的格式,以使路网数据与POI数据在数据格式和位置数据坐标系上是匹配的。
在对路网数据和POI数据进行格式转换处理和坐标转换处理后,需要进一步进行位置纠偏处理,对于路网数据中和POI数据中存在的位置数据不一致的部分,比如不同数据来源的路网数据之间的不一致、不同数据来源的POI数据之间的不一致、路网数据和POI数据之间的不一致等,在WGS-84坐标系下对路网数据和POI数据进行纠偏和重建,确保路网数据表征的空间与现实中的实际路网空间是对应的,POI数据中每个POI名称对应的位置数据与每个POI名称指代的现实地点的位置是对应的。
在本实施例中,接入的路网数据源自OSM(OpenStreetMap)平台的开放数据,将接入的路网数据进行格式转换处理、坐标转换处理和位置纠偏处理后,得到路网数据集,得到的路网数据集中的每条记录都包含唯一的FID值(查找地址值)、唯一的路段起点和路段终点、唯一的路段长度、唯一的路段经度和纬度。
在本实施例中,接入的POI数据源自百度地图和开源地图平台的开放数据集,POI数据中包含具体的POI名称和与POI名称相关的属性,属性既包括空间属性又包括非空间属性。
在本实施例中,接入的公众评价数据源自不同的大数据显示平台,其主要包含POI名称及对应的公众热度信息和公众推荐度信息,具体的,基于互联网和用户的交互数据,通过PC端或便携式终端上的关键字在线搜索度可快速获取POI的热度趋势,得到各个POI的公众热度信息,同时,通过将互联网上最新的POI推荐度数据(如百度推荐指数)按照月度和季度进行统计和处理,可得到各个POI的公众推荐度信息。POI的公众推荐度信息和公众热度信息中包含了POI对应的公众推荐度和公众热度,进一步的,还包含了POI公众热度高和受公众推荐的具体原因,这些具体原因可对应到POI的一些属性,如景点类型、景点级别、交通方式、位置、受推荐季节、门票价格等等,因此,从公众评价数据中,可以进一步提取的信息是,各个POI被用户选中或优先考虑所基于的具体属性,以及每个POI基于不同的属性被用户优先考虑的概率大小,例如,某一POI因为它的景点级别这一属性被用户选择的次数最多,那么该POI基于景点级别这一属性被用户优先考虑的概率是最大的。
将POI的公众热度和公众推荐度归为POI的两个非空间属性,可知,每个POI的非空间属性一部分是从接入的POI数据中提取的,一部分是从接入的公众评价数据中提取的。基于此,在完成对POI数据的对齐纠偏处理之后,需要进一步对POI数据和公众评价数据进行属性规整处理,目的在于完成对每个POI的属性的规整。
具体的,先基于POI数据和公众评价数据获取与每个POI对应的特征信息,根据POI的特征信息进行属性特征分类,将每个POI的属性特征分为空间属性和非空间属性,对于每个POI的空间属性(即经度信息、纬度信息)按照标准的多叉树中文地址结构进行处理,以作为POI的第一位置信息,对于每个POI的非空间属性,按照语义提取的方式,统计出具体的非空间属性。同时,结合公众评价数据中的POI被用户选中或优先考虑所基于的具体属性,以及每个POI基于不同的属性被用户优先考虑的概率大小等信息,从而统计出每个POI的每一非空间属性对应的属性评价指数,该属性评价指数表明了POI与非空间属性之间的关联度大小,可为后续POI知识图谱的构建提供参考。
在本实施例中,对从多个数据源中获取的POI数据进行属性规整处理还包括对POI数据中的每个POI进行POI主题分类。例如,POI数据中的POI可分为博物馆、车站、城市公园、大学、图书馆、购物中心、建筑标志、剧院、古迹、山、寺庙、体育馆、小吃街、中学、主题乐园等15个不同的POI主题,那么可以预先构建好可识别15个POI主题的识别模型,通过识别模型将POI数据中的每个POI分类到对应的主题,15个POI主题中每个POI主题都有一个对应的主题序列号,POI主题内的每个POI都有一个对应的POI序列号,POI数据经过对齐纠偏处理和属性规整处理后,可以得到规整的POI数据集,POI数据集中,每个POI都与自身的属性建立了对应关系,任一POI主题至少包括一个POI,一个POI代表一个表征景点本体的实体,每个POI对应的特征信息至少包括:第一位置信息、主题序列号、POI序列号、至少一个属性以及与属性对应的属性值。
在本实施例中,需要根据每个POI的第一位置信息以及路网数据集,获取每个POI在路网数据集中的投影,得到与POI对应的POI投影点。利用大圆距离算法实现POI数据集中的POI到路网数据集的投影操作,以得到POI数据集中的每个POI投影到路网数据集中至少一个路段上的POI投影点,所有的POI投影点构成POI投影点集。
具体的,路网数据集表征了实际路网空间,POI在路网数据集上的POI投影点用于表示实际路网空间中与POI相邻的某个路段上的点。利用大圆距离算法实现POI数据集中的POI到路网数据集的投影操作,首先,以POI为起点,根据POI的第一位置信息,利用大圆距离算法将POI与路网数据集中的路段进行匹配,由近及远的依次查找路网数据集中的一定数量的与该POI邻近的路段,可以预先设置好每个POI需要查找的邻近路段的数量;然后,利用大圆距离算法获取POI在对应的邻近路段上的投影点,并计算出由路网数据集表征的实际路网空间中,POI与对应投影点之间的大圆距离;然后,设置合理的POI与投影点之间的距离阈值,将大圆距离不大于距离阈值的投影点作为与POI对应的POI投影点,全部的POI投影点构成POI投影点集。距离阈值用于限制每个POI对应的POI投影点的位置和数量,避免每个POI投影得到的POI投影点与自身距离太远,任一个POI对应包括至少一个POI投影点。
如图2所示,图中
Figure 295419DEST_PATH_IMAGE001
Figure 938890DEST_PATH_IMAGE002
表示POI,
Figure 336373DEST_PATH_IMAGE003
Figure 65295DEST_PATH_IMAGE004
Figure 144109DEST_PATH_IMAGE005
Figure 969983DEST_PATH_IMAGE006
表示路段,
Figure 741629DEST_PATH_IMAGE007
Figure 990470DEST_PATH_IMAGE008
分别为
Figure 872976DEST_PATH_IMAGE001
根据大圆距离算法得到的在
Figure 225460DEST_PATH_IMAGE003
Figure 495904DEST_PATH_IMAGE004
上的POI投影点,
Figure 933839DEST_PATH_IMAGE009
表示
Figure 416773DEST_PATH_IMAGE001
Figure 889342DEST_PATH_IMAGE007
之间的大圆距离,
Figure 2792DEST_PATH_IMAGE010
表示
Figure 990339DEST_PATH_IMAGE001
Figure 214647DEST_PATH_IMAGE008
之间的大圆距离,
Figure 43188DEST_PATH_IMAGE011
Figure 327539DEST_PATH_IMAGE002
根据大圆距离算法得到的在
Figure 740066DEST_PATH_IMAGE005
上的POI投影点,
Figure 830382DEST_PATH_IMAGE012
表示
Figure 11964DEST_PATH_IMAGE002
Figure 263954DEST_PATH_IMAGE011
之间的大圆距离,通过大圆距离算法求解,我们可以精确的确定POI对应的POI投影点的位置信息,即POI投影点的经度、纬度信息。根据POI投影点和路网数据集,即可进一步获取各POI之间的空间关系。
POI投影点的计算公式如下:
Figure 491673DEST_PATH_IMAGE013
(1)
其中,
Figure 57784DEST_PATH_IMAGE014
表示路网数据集中的某一路段,
Figure 657654DEST_PATH_IMAGE015
表示主题序列号,
Figure 18229DEST_PATH_IMAGE016
表示POI序列号,
Figure 733244DEST_PATH_IMAGE017
表示第
Figure 103045DEST_PATH_IMAGE015
个POI主题中的第
Figure 993641DEST_PATH_IMAGE016
个POI,
Figure 180909DEST_PATH_IMAGE018
表示POI投影点序列号,
Figure 789744DEST_PATH_IMAGE019
表示第
Figure 963237DEST_PATH_IMAGE015
个POI主题中的第
Figure 537700DEST_PATH_IMAGE016
个POI的第
Figure 505656DEST_PATH_IMAGE018
个POI投影点,
Figure DEST_PATH_IMAGE020
表示
Figure DEST_PATH_IMAGE021
在路段
Figure 992001DEST_PATH_IMAGE014
上的投影,
Figure DEST_PATH_IMAGE022
表示计算出在路段
Figure 703605DEST_PATH_IMAGE014
上与
Figure 631110DEST_PATH_IMAGE021
距离最小的投影点
Figure 769967DEST_PATH_IMAGE019
在本实施例中,进一步的,采用欧几里得距离公式计算从POI到其对应的POI投影点之间的欧几里得距离。
在计算每个POI对应的POI投影点时,一并计算出POI到其对应的每个POI投影点之间的欧几里得距离,并将计算的欧几里得距离与对应的POI投影点关联存储起来;通过进一步的计算POI到其对应的POI投影点之间的欧几里得距离,可以更直观的描述POI与其对应的不同POI投影点之间的距离远近,以供后续双层隐马尔可夫模型调用。
在本实施例中,在进行POI到路网数据集的投影时,若出现个别POI无法匹配到路网数据集合适路段上的情况,或者,出现路网数据集中接入的数据未严格按照“节点-边”结构存储,导致POI在路网数据集无法投影的情况,则需要对路网数据集中的数据进行拓扑检查、修整和更新。
在其他的实施例中,利用大圆距离算法实现POI数据集中POI到路网数据集的投影操作还可以是:根据POI的第一位置信息利用大圆距离算法由近及远的依次查找路网数据集中与该POI邻近的路段;每查找到一个路段,利用大圆距离算法获取POI在该邻近路段上的投影点,并计算POI与该投影点之间的大圆距离;然后,将大圆距离不大于预设的距离阈值的投影点作为该POI对应的POI投影点,任一个POI对应包括至少一个POI投影点。
在本实施例中,为了挖掘各POI之间、POI与自身属性之间、POI与POI主题之间的深层关系,需要基于POI数据集进一步构建POI知识图谱,通过实体-关系-实体、实体-属性-属性值的三元组的形式描述事实。
首先,构建POI知识图谱的模式层,定义景点本体;其次,根据景点本体,从POI数据集中抽取每个POI的与景点本体对应的景点知识;随后,将从POI数据集中抽取的景点知识进行对齐,以消除矛盾和歧义,比如,POI数据集中可能包括了从百度百科、维基百科以及其他网站上搜集的POI信息,这些POI信息来自于不同的数据源,可能存在某一实体有多种表达,或某个特定称谓对应于多个不同的实体等情况,因此需要对从不同数据源抽取的实体进行对齐;然后,基于定义的景点本体和抽取的景点知识,进行知识融合,主要涉及景点类型、景点级别、交通方式、位置、受推荐季节、门票价格、公众热度、公众推荐度等属性节点与景点节点之间的关系,用包括实体、属性、属性值的三元组表征POI与对应的的属性之间的关系,用包括实体、关系、实体的三元组表征不同POI之间的关系;然后,基于实体-属性-属性值的三元组和实体-关系-实体的三元组进行知识加工,例如,使空间上相邻的POI节点之间通过“周围景点”的边连接起来,使不同的POI节点之间通过一个或多个公共的属性节点间接连接起来,同时,引入信息熵作为POI节点和属性节点之间的边的权值,引入关联指数作为POI主题节点与POI节点之间的边的权值;最后,将知识图谱存储在Neo4j图数据库中,以可视化的形式展示,如图3所示。
具体的,在本实施例中,每个POI对应一个表征景点本体的实体,每个POI和其对应的属性之间,在POI知识图谱中通过(实体,属性,属性值)的三元组的形式描述;POI节点与所属的POI主题节点之间,通过“所属主题”的边连接起来;根据各POI的第一位置信息、各POI的POI投影点、以及路网数据集,我们可获取各POI之间的空间关系,因而在POI知识图谱中,空间上相邻的POI节点之间可通过“周围景点”的边连接起来,即不同的POI之间可通过(实体,关系,实体)的三元组的形式描述;同时,不同的POI节点之间还可能通过一个或多个公共的属性节点间接连接。
在本实施例中,在构建POI知识图谱时,引入信息熵作为POI节点和属性节点之间的边的权值,信息熵表示的是节点之间边的属性,作为评价节点与节点之间关联的可能性大小的指标,两个节点之间边的信息熵越小,说明从其中一个节点到另一个节点的可能性越大。本实施例中,在对POI数据和公众评价数据进行属性规整处理时,已经统计出了每个POI的每一非空间属性对应的属性评价指数,该属性评价指数用于表明POI与非空间属性之间的关联度大小,该关联度大小反映的是POI因为该非空间属性被用户优先选择的概率大小。因此,关于节点与节点之间边的信息熵大小,一方面通过POI的非空间属性对应的属性评价指数来确定,另一方面,通过考察该属性节点是否作为连接两个或多个POI节点的公共节点、以及该属性节点作为公共节点是否实现两个或多个POI节点在空间位置上的邻接等特性来确定。在POI知识图谱中,每个属性节点至少与一个POI节点连接,属性节点连接每个POI节点的边均关联一个对应的信息熵。
对于每一个POI节点而言,致使其被用户优先选择的属性节点往往有多个,而这多个属性节点又有着不同的使POI被用户优先考虑的概率,这在POI知识图谱中就表现为每个POI节点与不同属性节点之间的边的信息熵是不同的。例如,“湖南师范大学”作为一个POI节点,用户可能因为它的“新民学会旧址”这一属性而考虑去,也可能因为它的“岳麓山”这一属性而考虑去,“湖南师范大学”因为“新民学会旧址”这一属性被优先考虑的概率和因为“岳麓山”这一属性被优先考虑的概率是不同的,因此在POI知识图谱中“湖南师范大学”节点与“新民学会旧址”节点之间边的信息熵、“湖南师范大学”节点与“岳麓山”节点之间边的信息熵,两者大小是不同的。
在POI知识图谱中,POI主题节点与对应的POI节点之间通过“所属主题”的边连接,引入关联指数作为POI主题节点与POI节点之间的边的权值,POI知识图谱中的每条“所属主题”边均关联有一个关联指数,关联指数用于表示从一个POI主题节点选择其连接的某一POI节点的可能性大小,关联指数越大,该关联指数对应的POI节点被选中的可能性就越大,关联指数的大小取决于对应的POI节点关联的信息熵大小,POI节点关联的信息熵大小取决于该POI节点连接的属性节点数量以及每个属性节点对应的信息熵。
在本实施例中,每隔一段时间会接入新的众源地理时空大数据,对路网数据集和POI知识图谱的数据进行定时的更新。
在本实施例中,通过构建一个双层隐马尔可夫模型来生成个性化出行路径。
双层隐马尔可夫模型由三层状态空间组成,如图4所示,包括由所有POI主题组成的观测状态层和由所有POI组成的第一隐含层、由所有POI对应的POI投影点组成的第二隐含层。
具体的,观测状态层对应的数据集为观测状态集O,观测状态集O中的每个观测状态On代表了一个POI主题,观测状态层为用户可以直接观测到的状态空间,用户根据可见的观测状态层,选择出多个感兴趣的观测状态,从而生成观测状态按顺序排列的意向POI主题序列。例如,观测状态集O包括博物馆、车站、城市公园、大学、图书馆、购物中心、建筑标志、剧院、古迹、山、寺庙、体育馆、小吃街、中学、主题乐园等15个观测状态(即15个POI主题),用户从可观测到的这15类POI主题中先后选取了城市公园、大学、图书馆、购物中心、建筑标志、剧院、古迹、山等8类,那么由观测状态层就输出了一组观测状态排列为“城市公园、大学、图书馆、购物中心、建筑标志、剧院、古迹、山”的意向POI主题序列。
第一隐含层与观测状态层相关联,每个观测状态代表的POI主题都对应有至少一个可选的POI,观测状态层的所有观测状态对应的所有POI组成了第一隐含层的所有隐含状态,第一隐含层的任务是根据观测状态层获取的意向POI主题序列,检查与意向POI主题序列对应的每个观测状态下的POI,找出每个观测状态下的观测概率最大的一个POI,以生成一组POI观测序列,POI观测序列的各POI与意向POI主题序列中各POI主题一一对应。
第一隐含层对应的数据集为POI知识图谱,第一隐含层生成POI观测序列是通过在POI知识图谱中寻路得到的。具体的,先根据意向POI主题序列在POI知识图谱中找到对应的POI主题节点,然后根据POI知识图谱的节点-边关系,对找到的每个POI主题节点所连接的POI节点进行查找,找出每个POI主题节点连接的POI节点中观测概率最大的POI节点,从而生成一组POI观测序列。
第一隐含层计算的观测概率表示从用户感兴趣的POI主题到推荐出行的具体POI的观测概率,第一隐含层的POI观测概率计算公式为:
Figure DEST_PATH_IMAGE023
(2)
其中,
Figure DEST_PATH_IMAGE024
表示第
Figure 917177DEST_PATH_IMAGE015
个POI主题中的第
Figure DEST_PATH_IMAGE025
个POI,
Figure DEST_PATH_IMAGE026
表示第
Figure 494789DEST_PATH_IMAGE015
个POI主题下第
Figure 73538DEST_PATH_IMAGE025
个POI的关联指数,
Figure DEST_PATH_IMAGE027
表示第
Figure 349010DEST_PATH_IMAGE015
个POI主题下的POI总数,
Figure DEST_PATH_IMAGE028
表示第
Figure 249095DEST_PATH_IMAGE015
个POI主题中的第
Figure 364818DEST_PATH_IMAGE025
个POI的POI观测概率。
第二隐含层与第一隐含层相关联,第一隐含层的所有POI对应的所有POI投影点组成了第二隐含层的所有隐含状态,POI观测序列中每个POI对应的全部POI投影点即为该POI候选的POI投影点,每个POI至少对应有一个POI投影点。第二隐含层的任务是根据第一隐含层获取的POI观测序列,计算POI观测序列中每个POI对应的每个POI投影点的观测概率,然后基于计算的所有POI投影点的观测概率,应用状态转移概率矩阵计算POI观测序列中每个POI的任一POI投影点转移到相邻的POI的任一POI投影点的转移概率,然后基于计算的所有POI投影点的观测概率和转移概率,采用维特比(Viterbi)算法计算出一组具有最优出行路径的POI出行序列。
第二隐含层对应的数据集为POI投影点集,在第二隐含层中,首先,计算从POI观测序列的POI到该POI候选的每一POI投影点的观测概率,具体的,根据POI观测序列,找到POI观测序列中每个POI在POI投影点集的对应的所有POI投影点,然后,根据找到的POI投影点关联的欧几里得距离(在本实施例中在构建POI投影点集时已计算出每个POI投影点关联的欧几里得距离),计算从POI到对应的POI投影点的观测概率。
第二隐含层计算的观测概率表示从POI观测序列的POI到POI对应的POI投影点的观测概率,第二隐含层的POI投影点观测概率计算公式为:
Figure DEST_PATH_IMAGE029
(3)
其中,
Figure DEST_PATH_IMAGE030
表示从POI到POI投影点的欧几里得距离的标准偏差概率参数,
Figure DEST_PATH_IMAGE031
为高斯分布表达式,
Figure DEST_PATH_IMAGE032
表示第
Figure 158593DEST_PATH_IMAGE015
个POI主题中的第
Figure 639253DEST_PATH_IMAGE025
个POI的POI观测概率,
Figure DEST_PATH_IMAGE033
表示
Figure 994011DEST_PATH_IMAGE024
到其对应的第
Figure 851109DEST_PATH_IMAGE018
个POI投影点的欧几里得距离,
Figure DEST_PATH_IMAGE034
表示
Figure 935608DEST_PATH_IMAGE024
对应的POI投影点
Figure DEST_PATH_IMAGE035
的POI投影点观测概率。
在其他的实施例中,POI观测序列的POI到POI对应的POI投影点的观测概率还可以通过POI与对应的POI投影点之间的大圆距离来计算,本实施例采用的欧几里得距离,可以更直观的知道POI与其对应的POI投影点之间的远近,计算起来也更方便。
在第二隐含层中,包含用于计算POI投影点转移概率的状态转移概率矩阵,状态转移概率矩阵表示状态从一种状态转移到另一种状态的概率,在本实施例中,即计算的实际路网空间中从一个POI的某一POI投影点转移到另一个POI的某一POI投影点的概率。
如图5所示,图中
Figure 321590DEST_PATH_IMAGE001
Figure 258584DEST_PATH_IMAGE002
为POI,带箭头的虚线
Figure DEST_PATH_IMAGE036
表示
Figure 653794DEST_PATH_IMAGE001
Figure 264903DEST_PATH_IMAGE002
之间的大圆距离,
Figure 352945DEST_PATH_IMAGE003
Figure 947875DEST_PATH_IMAGE004
Figure 615616DEST_PATH_IMAGE005
Figure 113856DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE037
Figure DEST_PATH_IMAGE038
表示由路网数据集表征的实际路网空间中的路段,
Figure 638378DEST_PATH_IMAGE007
Figure 658287DEST_PATH_IMAGE008
分别为
Figure 988774DEST_PATH_IMAGE001
根据大圆距离算法在
Figure 512159DEST_PATH_IMAGE003
Figure 942004DEST_PATH_IMAGE006
上找到的POI投影点,
Figure 183629DEST_PATH_IMAGE011
Figure 724332DEST_PATH_IMAGE002
根据大圆距离算法在
Figure 931585DEST_PATH_IMAGE004
上找到的POI投影点,带箭头的虚线
Figure DEST_PATH_IMAGE039
表示在实际路网空间中从
Figure 532330DEST_PATH_IMAGE003
上的POI投影点
Figure 323569DEST_PATH_IMAGE007
转移到
Figure 402383DEST_PATH_IMAGE004
上的POI投影点
Figure 962677DEST_PATH_IMAGE011
的路径距离,带箭头的虚线
Figure DEST_PATH_IMAGE040
表示在实际路网空间中从
Figure 468745DEST_PATH_IMAGE006
上的POI投影点
Figure 576641DEST_PATH_IMAGE008
转移到
Figure 459146DEST_PATH_IMAGE004
上的POI投影点
Figure 873947DEST_PATH_IMAGE011
的路径距离,当
Figure 816495DEST_PATH_IMAGE039
Figure 316747DEST_PATH_IMAGE040
时,说明要从
Figure 737364DEST_PATH_IMAGE001
去到
Figure 272250DEST_PATH_IMAGE002
,从POI投影点
Figure 120120DEST_PATH_IMAGE007
转移到POI投影点
Figure 609133DEST_PATH_IMAGE011
,比从POI投影点
Figure 99020DEST_PATH_IMAGE008
转移到POI投影点
Figure 426096DEST_PATH_IMAGE011
的概率更大。通过计算一个POI的某一POI投影点到另一个POI的某一POI投影点之间的路径距离,应用状态转移概率矩阵,即可计算出从一个POI投影点到另一个POI投影点的转移概率。
在本实施例中,可利用QGIS的路径分析工具计算POI观测序列中相邻POI的POI投影点之间的最短路径,由于第一个POI的不确定性,无需计算初始状态概率,因此转移概率计算公式如下:
Figure DEST_PATH_IMAGE041
(4)
Figure DEST_PATH_IMAGE042
(5)
其中,
Figure DEST_PATH_IMAGE043
表示第
Figure 303922DEST_PATH_IMAGE015
个POI主题中的第
Figure 513187DEST_PATH_IMAGE025
个POI,
Figure DEST_PATH_IMAGE044
表示POI序列号,
Figure DEST_PATH_IMAGE045
表示第
Figure DEST_PATH_IMAGE046
个POI主题中的第
Figure 889986DEST_PATH_IMAGE044
个POI,
Figure DEST_PATH_IMAGE047
表示
Figure 133886DEST_PATH_IMAGE043
Figure DEST_PATH_IMAGE048
之间的大圆距离;
Figure DEST_PATH_IMAGE049
表示第
Figure 746395DEST_PATH_IMAGE015
个POI主题中的第
Figure 115059DEST_PATH_IMAGE025
个POI的第
Figure 274645DEST_PATH_IMAGE018
个POI投影点,
Figure DEST_PATH_IMAGE050
表示POI投影点序列号,
Figure DEST_PATH_IMAGE051
表示第
Figure 841893DEST_PATH_IMAGE046
个POI主题中的第
Figure 61522DEST_PATH_IMAGE044
个POI的第
Figure 917482DEST_PATH_IMAGE050
个POI投影点,
Figure DEST_PATH_IMAGE052
表示
Figure DEST_PATH_IMAGE053
Figure DEST_PATH_IMAGE054
之间的路径距离;
Figure DEST_PATH_IMAGE055
表示从一个POI到下一个POI所需的时间间隔,通过两个POI的POI投影点之间的路径距离与道路限速的比值获得,道路限速根据所在区域城市道路车辆的速度限制标准确定,用于间接表示车辆的速度;
Figure DEST_PATH_IMAGE056
为表示路径距离与大圆距离之间差异的概率参数;
Figure DEST_PATH_IMAGE057
表示一个POI的POI投影点与下一个POI的POI投影点之间的转移概率。
最后,基于计算的POI投影点的观测概率和POI投影点之间的转移概率,采用Viterbi算法计算出满足用户需求的最优路径的POI出行序列。Viterbi算法是一种动态编程算法,以使概率最大化的方式将POI投影点的观测概率和转移概率相乘,用于找到最有可能产生观察到的意向POI主题序列的维特比路径,即具有最高概率的最佳路线。
在其他的实施例中,还可以实时的获取POI实时人流量数据和道路拥堵情况数据,在第二隐含层计算POI投影点之间的转移概率的时候,引入POI实时人流量的权值和道路拥堵情况的权值,以根据POI实时人流量数据和道路拥堵情况数据实时调整候选的POI投影点之间的转移概率。
基于同一发明构思,与上述任意实施例方法相对应的,本发明一实施例还提供了一种基于时空大数据的个性化出行路径生成系统,用于实现上述任一实施例所述的基于时空大数据的个性化出行路径生成方法,如图6所示,包括:
意向获取模块10,用于获取用于描述用户出行兴趣的意向POI主题序列,意向POI主题序列包括用户感兴趣的至少一个POI主题;
路径生成模块20,用于根据意向POI主题序列、预设的POI知识图谱、预设的路网数据集应用隐马尔可夫模型生成个性化出行路径,个性化出行路径至少包括一个POI,一个POI对应属于一个POI主题的一个景点。
基于同一发明构思,与上述任意实施例方法相对应的,本发明一实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述的基于时空大数据的个性化出行路径生成方法。
图7示出了本实施例所提供的一种更为具体的电子设备硬件示意图,该设备可以包括:处理器100、存储器200、输入/输出接口300、通信接口400和总线500。其中处理器100、存储器200、输入/输出接口300与通信接口400、总线500实现彼此之间在设备内部的通信连接。
处理器100可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit, ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本发明实施例所提供的技术方案。
存储器200可以采用ROM (Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备、动态存储设备等形式实现。存储器200可以存储操作系统和其他应用程序,在通过软件或者固件来实现本发明实施例所提供的技术方案时,相关的程序代码保存在存储器200中,并由处理器100来调用执行。
输入/输出接口300用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出) ,也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触控屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口400用于连接通信模块(图中未示出) ,以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线500包括一通路,在设备的各个组件(例如处理器100、存储器200,输入/输出接口300和通信接口400)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器100、存储器200、输入/输出接口300、通信接口400以及总线500,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
基于同一发明构思,与上述实施例方法相对应的,本发明一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一实施例所述的基于时空大数据的个性化出行路径生成方法。
本实施例的计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储;该信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机可读存储介质的例子包括但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算机设备访问的信息。
上述实施例的计算机存储介质存储的计算机程序用于使计算机执行如上任一实施例所述的基于时空大数据的个性化出行路径生成方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
本发明的基于时空大数据的个性化出行路径生成方法及系统,根据用户的个人出行意向和采集的公众热度推荐度数据进行分析,挖掘旅游热点,基于用户的需求整合线上线下的信息为用户规划可行的个性化出行路径;利用景点信息构建POI知识图谱,将知识图谱引入个性化路径推荐系统,可对接入的地理时空数据作出更全面的总结,挖掘更深层的数据关联关系,提供更有深度的相关信息,为用户提供更加准确的景点推荐,能够进一步提升推荐的个性化程度;通过结合知识图谱网络以及众源时空数据之间的时空动态关系,可以更好的预测用户最可能选择的轨迹移动行为,此外,还可减少传统方法对POI数据和路网数据造成的空间不确定性干扰;利用众源时空大数据获取公众出行偏好,将公众对不同地点的偏好、时间预算、成本预算等信息映射到实际路网空间中,融合个人出行意向进行动态建模分析,为用户提供合适且个性化的出行方案。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明的保护范围限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明中一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
本发明中一个或多个实施例旨在涵盖落入本发明的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明中一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于时空大数据的个性化出行路径生成方法,其特征在于,所述方法包括:
获取用于描述用户出行兴趣的意向POI主题序列,所述意向POI主题序列包括用户感兴趣的至少一个POI主题;
根据所述意向POI主题序列、预设的POI知识图谱、预设的路网数据集应用隐马尔可夫模型生成个性化出行路径,所述个性化出行路径至少包括一个POI,一个所述POI对应属于一个所述POI主题的一个景点;
其中,每个所述POI对应的特征信息包括第一位置信息,所述路网数据集用于表征实际路网空间,根据所述第一位置信息以及所述路网数据集获取每个所述POI在所述路网数据集中的投影,得到与所述POI对应的POI投影点;
所述隐马尔可夫模型包括由所有POI主题组成的观测状态层和由所有POI组成的第一隐含层、由所有POI对应的所述POI投影点组成的第二隐含层,
应用隐马尔可夫模型的观测状态层获取所述意向POI主题序列,应用隐马尔可夫模型的第一隐含层根据所述意向POI主题序列在所述POI知识图谱中进行寻路,生成一组POI观测序列,所述POI观测序列包括至少一个所述POI,所述POI观测序列的各所述POI与所述意向POI主题序列中各所述POI主题一一对应;
基于所述POI观测序列,应用隐马尔可夫模型的第二隐含层计算所述POI观测序列中每个所述POI对应的每个所述POI投影点的观测概率,然后基于所述POI投影点的观测概率,计算每个所述POI的任一所述POI投影点转移到相邻的POI的任一所述POI投影点的转移概率;
基于计算的所有所述POI投影点的所述观测概率和所述转移概率,采用维特比算法计算,生成个性化出行路径;
其中,所述根据所述意向POI主题序列、预设的POI知识图谱、预设的路网数据集应用隐马尔可夫模型生成个性化出行路径之前,包括:从多个数据源中获取原始数据并进行对齐纠偏处理和属性规整处理以构建POI数据集,所述POI数据集中,任一POI主题至少包括一个POI,一个所述POI代表一个表征景点本体的实体,每个所述POI对应的特征信息至少包括:主题序列号、POI序列号、至少一个属性以及与所述属性对应的属性值,应用包括实体、关系、实体的三元组和包括实体、属性、属性值的三元组分别表征不同的POI之间、所述POI与对应的属性之间的关系,构建所述POI知识图谱;
所述应用包括实体、关系、实体的三元组和包括实体、属性、属性值的三元组分别表征不同的POI之间、所述POI与对应的属性之间的关系,构建所述POI知识图谱,包括:构建POI知识图谱的模式层,获取景点本体;对所述POI数据集中每个所述POI的与所述景点本体对应的景点知识进行特征信息抽取;将每个表征景点本体的实体进行特征信息对齐;基于所述景点知识进行知识融合,用包括实体、属性、属性值的三元组表征所述POI与对应的属性之间的关系,用包括实体、关系、实体的三元组表征不同所述POI之间的关系;基于实体-属性-属性值的三元组和实体-关系-实体的三元组进行知识加工,引入信息熵作为POI节点和属性节点之间的边的权值,引入关联指数作为POI主题节点与POI节点之间的边的权值,所述关联指数的值取决于对应的所述POI节点关联的所述信息熵的值,所述POI节点关联的所述信息熵的值取决于所述POI节点连接的所述属性节点数量以及每个所述属性节点对应的信息熵,所述信息熵的值通过对应的所述属性节点的属性评价指数确定;将构建的所述知识图谱存储在图数据库中。
2.如权利要求1所述的基于时空大数据的个性化出行路径生成方法,其特征在于,所述从多个数据源中获取原始数据并进行对齐纠偏处理和属性规整处理以构建POI数据集,包括:
从多个数据源中获取包括POI数据和公众评价数据的所述原始数据,对所述POI数据进行对齐纠偏处理,所述公众评价数据包括各所述POI被用户优先考虑所基于的属性特征以及每个所述POI基于不同的所述属性特征被用户优先考虑的概率大小;
对所述POI数据和所述公众评价数据进行属性规整处理,对每个所述POI进行POI主题分类,其中,所述对所述POI数据和所述公众评价数据进行属性规整处理包括:
基于所述POI数据和所述公众评价数据获取与每个所述POI对应的特征信息,根据所述特征信息进行属性特征分类,将每个所述POI的属性特征分为空间属性和非空间属性,将所述空间属性作为所述POI的所述第一位置信息,结合各所述POI被用户优先考虑所基于的所述非空间属性以及每个所述POI基于不同的所述非空间属性被用户优先考虑的概率大小,统计出每个所述POI的每一所述非空间属性对应的属性评价指数,所述属性评价指数表明所述POI与所述非空间属性之间的关联度大小;
基于所述POI数据和所述公众评价数据获取与每个所述POI对应的特征信息,构建POI数据集。
3.如权利要求1所述的基于时空大数据的个性化出行路径生成方法,其特征在于,所述根据所述第一位置信息以及所述路网数据集获取每个所述POI在所述路网数据集中的投影,得到与所述POI对应的POI投影点,包括:
以所述POI为起点,根据所述POI的所述第一位置信息利用大圆距离算法由近及远的依次查找路网数据集中预设数量的与所述POI邻近的路段;
利用大圆距离算法获取所述POI在对应的邻近路段上的投影点,计算出由路网数据集表征的实际路网空间中,所述POI与对应投影点之间的大圆距离;
将所述大圆距离不大于预设距离阈值的所述投影点作为所述POI投影点,任一个所述POI对应包括至少一个所述POI投影点,全部的所述POI投影点构成POI投影点集。
4.一种基于时空大数据的个性化出行路径生成系统,其特征在于,所述个性化出行路径生成系统用于实现权利要求1至3中任一项所述的方法。
5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3中任一项所述方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法。
CN202210829355.6A 2022-07-15 2022-07-15 一种基于时空大数据的个性化出行路径生成方法及系统 Active CN114996586B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210829355.6A CN114996586B (zh) 2022-07-15 2022-07-15 一种基于时空大数据的个性化出行路径生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210829355.6A CN114996586B (zh) 2022-07-15 2022-07-15 一种基于时空大数据的个性化出行路径生成方法及系统

Publications (2)

Publication Number Publication Date
CN114996586A CN114996586A (zh) 2022-09-02
CN114996586B true CN114996586B (zh) 2022-11-04

Family

ID=83022440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210829355.6A Active CN114996586B (zh) 2022-07-15 2022-07-15 一种基于时空大数据的个性化出行路径生成方法及系统

Country Status (1)

Country Link
CN (1) CN114996586B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112182410A (zh) * 2020-11-05 2021-01-05 西南交通大学 基于时空轨迹知识图谱的用户出行模式挖掘方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645061B2 (en) * 2010-06-16 2014-02-04 Microsoft Corporation Probabilistic map matching from a plurality of observational and contextual factors

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112182410A (zh) * 2020-11-05 2021-01-05 西南交通大学 基于时空轨迹知识图谱的用户出行模式挖掘方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
An Improved HMM-Based Approach for Planning Individual Routes Using Crowd Sourcing Spatiotemporal Data;Tao Wu;《Sensors》;20201204;第1-4章 *
基于众源地理数据的个性化路线服务框架及应用实验;吴涛;《地理与地理信息科学》;20220120;全文 *

Also Published As

Publication number Publication date
CN114996586A (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
US9715233B1 (en) System and method for inputting a second taxi-start location parameter for an autonomous vehicle to navigate to whilst reducing distraction
Zhao et al. A trajectory clustering approach based on decision graph and data field for detecting hotspots
US9915548B2 (en) Method and apparatus for providing a contextual menu in a map display
Zheng et al. Mining interesting locations and travel sequences from GPS trajectories
US9778060B2 (en) Method and apparatus for providing personalized routing based on user routing behaviors
Krueger et al. Visual analysis of movement behavior using web data for context enrichment
US11714832B2 (en) Method, apparatus, and system for combining location data sources
JP7334205B2 (ja) 目的地の予測方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
Bin et al. A travel route recommendation system based on smart phones and IoT environment
WO2017222550A1 (en) Identifying, processing and displaying data point clusters
Bergman et al. Conflation of OpenStreetMap and mobile sports tracking data for automatic bicycle routing
US11798225B2 (en) 3D building generation using topology
US20220180214A1 (en) Method, apparatus, and system for providing semantic categorization of an arbitrarily granular location
Yuan et al. Human mobility discovering and movement intention detection with GPS trajectories
Zhang et al. Inferring building function: A novel geo-aware neural network supporting building-level function classification
CN112711645B (zh) 一种位置点信息扩展方法、装置、存储介质和电子设备
Cohen et al. Machine‐learning prediction models for pedestrian traffic flow levels: Towards optimizing walking routes for blind pedestrians
Goetz et al. Indoor route planning with volunteered geographic information on a (mobile) web-based platform
Claridades et al. Developing a data model of indoor points of interest to support location‐based services
CN114996586B (zh) 一种基于时空大数据的个性化出行路径生成方法及系统
CN114820960B (zh) 构建图谱的方法、装置、设备和介质
Su et al. Personalized route description based on historical trajectories
US20220180183A1 (en) Method, apparatus, and system for providing place category prediction
Yan Geographic knowledge graph summarization
Xie et al. A Graph Neural Network-Based Map Tiles Extraction Method Considering POIs Priority Visualization on Web Map Zoom Dimension

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant