CN115292507A - 基于知识图谱的交通出行分析方法、装置、设备及介质 - Google Patents
基于知识图谱的交通出行分析方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN115292507A CN115292507A CN202210740988.XA CN202210740988A CN115292507A CN 115292507 A CN115292507 A CN 115292507A CN 202210740988 A CN202210740988 A CN 202210740988A CN 115292507 A CN115292507 A CN 115292507A
- Authority
- CN
- China
- Prior art keywords
- traffic
- service
- travel
- analysis
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 11
- 238000005206 flow analysis Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 13
- 238000005065 mining Methods 0.000 abstract description 2
- 238000000605 extraction Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 9
- 238000003860 storage Methods 0.000 description 9
- 239000010410 layer Substances 0.000 description 7
- 238000007726 management method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000013075 data extraction Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005553 drilling Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000029305 taxis Effects 0.000 description 2
- 241000490229 Eucephalus Species 0.000 description 1
- 101100009348 Mus musculus Depp1 gene Proteins 0.000 description 1
- 101100009350 Rattus norvegicus Depp gene Proteins 0.000 description 1
- 238000012896 Statistical algorithm Methods 0.000 description 1
- SAZUGELZHZOXHB-UHFFFAOYSA-N acecarbromal Chemical compound CCC(Br)(CC)C(=O)NC(=O)NC(C)=O SAZUGELZHZOXHB-UHFFFAOYSA-N 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
Abstract
本申请公开了一种基于知识图谱的交通出行分析方法、装置、设备及介质,所述方法包括:获取预先构建的交通服务知识图谱,其中,所述交通服务知识图谱基于多源交通数据构建;获取用户的出行服务需求,查询与所述出行服务需求对应的出行服务模型;基于所述交通服务知识图谱查询与所述出行服务模型关联的实体信息,根据所述出行服务模型以及所述关联的实体信息计算得到出行服务分析结果。根据本申请实施例提供的交通出行分析方法,通过对城市交通出行相关的公众出行数据进行处理,建立城市交通出行知识图谱,并基于图运算理论进行挖掘、计算,以数据接口的方式为上层的研判决策模型提供数据支持,提高后续交通出行分析服务的计算效率。
Description
技术领域
本发明涉及智能交通技术领域,特别涉及一种基于知识图谱的交通出行分析方法、装置、设备及介质。
背景技术
随着城市交通出行的不断发展,城市交通系统产生的数据也越来越多,且数据类型也越来越复杂。例如,不同的轨道设备在不同生命周期内会产生种类众多、内容庞杂的数据。同时,数据格式以及数据结构也是多种多样的,可包括有结构化数据、半结构化数据及非结构化数据等等。明显地,面对以上情况,基于人工经验、业务规则及运筹学等方面的传统处理方式难以处理这些差异化的且数量庞大的城市交通数据。因业务涉及交通、交管、城管、社企等多源单元,数据表层关系低,不利于整体业务数据的关联应用。
现有技术中,当欲根据差异化的城市交通数据和分析研判决策模型分析出行服务时,主要基于各数据分析人员对业务的理解,自主挑选数据表、字段,并按照个人判断进行分析逻辑代码堆叠。此种做法存在几个问题,一是业务理解需要很大学习成本,且理解程度参差不齐,易出现理解错误问题;二是因数据过于庞杂,导致数据分析逻辑过于繁杂,模型构成成本过高;三是数据下钻难度太大,每层下钻均需要构建相应的数据调取、数据计算等逻辑。另外,现有城市交通出行领域数据主要是以各业务单元核心业务为主,未与实际公众出行的空间特征、聚集特征进行有效绑定,因此无法反应实际出行特征,不利于城市交通出行研判决策。
发明内容
本申请实施例提供了一种基于知识图谱的交通出行分析方法、装置、设备及介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本申请实施例提供了一种基于知识图谱的交通出行分析方法,包括:
获取预先构建的交通服务知识图谱,其中,交通服务知识图谱基于多源交通数据构建;
获取用户的出行服务需求,查询与出行服务需求对应的出行服务模型;
基于交通服务知识图谱查询与出行服务模型关联的实体信息,根据出行服务模型以及关联的实体信息计算得到出行服务分析结果。
在一个可选地实施例中,预先构建交通服务知识图谱,包括:
根据人、车、路、环境以及出行各因素之间的关联关系,构建交通服务知识图谱本体;
根据交通服务知识图谱本体信息,获取构建交通服务知识图谱所需的实体数据需求清单;
根据实体数据需求清单抽取实体数据,并将实体数据与本体关联,得到实体、属性、关系的对应关系;
根据实体、属性、关系的对应关系以及半监督机器学习算法进行半监督式的图谱构建,得到构建好的交通服务知识图谱。
在一个可选地实施例中,得到构建好的交通服务知识图谱之后,还包括:
根据构建好的交通服务知识图谱,以及预设的最短路径算法计算图谱中道路实体之间的距离,并将计算出来的距离数据存储于数据库中。
在一个可选地实施例中,出行服务需求包括出发地与目的地分析服务需求、车流量分析服务需求、事故多发地分析服务需求、交通管制分析服务需求以及路径规划分析服务需求中的一种或多种;
出行服务模型包括出发地与目的地分析模型、车流量分析模型、事故多发地分析模型、交通管制分析模型以及路径规划分析模型中的一种或多种。
在一个可选地实施例中,基于交通服务知识图谱查询与出行服务模型关联的实体信息,根据出行服务模型以及关联的实体信息计算得到出行服务分析结果,包括:
当出行服务需求为出发地与目的地分析需求时,确定与需求对应的出发地与目的地分析模型,从交通服务知识图谱中查询与出发地与目的地分析模型关联的实体信息;
根据出发地与目的地分析模型以及关联的实体信息计算得到出发地与目的地分析结果,出发地与目的地分析结果为POI粒度的精确结果。
在一个可选地实施例中,从交通服务知识图谱中查询与出发地与目的地分析模型关联的实体信息,根据出发地与目的地分析模型以及关联的实体信息计算得到出发地与目的地分析结果,包括:
根据出发地与目的地分析需求得到车辆的起始卡口信息和终点卡口信息;
根据交通服务知识图谱查询起始卡口预设范围内的POI实体,并将查询到的POI实体与起始卡口实体进行关联;
根据交通服务知识图谱查询终点卡口预设范围内的POI实体,并将查询到的POI实体与终点卡口实体进行关联;
基于交通服务知识图谱中的时间维度、图谱深度、数据度量以及链接流量构建查询向量;
根据查询向量从交通服务知识图谱中查询出发地与目的地分析结果。
在一个可选地实施例中,根据查询向量从交通服务知识图谱中查询出发地与目的地分析结果,包括:
计算查询向量中的时间维度因子、图谱深度因子、数据度量因子以及链接流量因子的数值;
采用层次分析法计算每个因子的权重;
计算交通服务知识图谱中每条路径的查询向量的值,查询向量的值为每个因子与其对应的权重的积的和;
将查询向量的值最大的路径对应的起始点POI作为车辆的出发地,将查询向量的值最大的路径的终点POI作为车辆的目的地。
第二方面,本申请实施例提供了一种基于知识图谱的交通出行分析装置,包括:
知识图谱获取模块,用于获取预先构建的交通服务知识图谱,其中,交通服务知识图谱基于多源交通数据构建;
出行服务查询模块,用于获取用户的出行服务需求,查询与出行服务需求对应的出行服务模型;
分析模块,用于基于交通服务知识图谱查询与出行服务模型关联的实体信息,根据出行服务模型以及关联的实体信息计算得到出行服务分析结果。
第三方面,本申请实施例提供了一种电子设备,包括处理器和存储有程序指令的存储器,处理器被配置为在执行程序指令时,执行上述实施例提供的基于知识图谱的交通出行分析方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机可读指令,计算机可读指令被处理器执行以实现上述实施例提供的一种基于知识图谱的交通出行分析方法。
本申请实施例提供的技术方案可以包括以下有益效果:
根据本申请实施例提供的基于知识图谱的交通出行分析方法,可以获取预先构建的交通服务知识图谱,该知识图谱基于多源的交通数据构建,并以数据接口的方式为上层的出行服务模型提供标准化的数据关联查询服务,得到与用户的出行服务需求对应的出行服务分析结果,该方法大大降低了交通出行业务学习成本以及数据关联计算难度,提高了后续交通出行分析服务的计算效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种基于知识图谱的交通出行分析方法的流程示意图;
图2是根据一示例性实施例示出的一种构建的交通服务知识图谱的示意图;
图3是根据一示例性实施例示出的一种车维度的部分知识图谱的示意图;
图4是根据一示例性实施例示出的一种车辆起止卡口的记录信息示意图;
图5是根据一示例性实施例示出的一种卡口周围POI实体的示意图;
图6是根据一示例性实施例示出的一种车辆早晚出行的知识图谱的示意图;
图7是根据一示例性实施例示出的一种查询出的OD分析结果示意图;
图8是根据一示例性实施例示出的一种基于知识图谱的交通出行分析装置的结构示意图;
图9是根据一示例性实施例示出的一种电子设备的结构示意图;
图10是根据一示例性实施例示出的一种计算机存储介质的示意图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本发明的一些方面相一致的系统和方法的例子。
下面将结合附图对本申请实施例提供的基于知识图谱的交通出行分析方法进行详细介绍。参见图1,该方法具体包括以下步骤。
S101获取预先构建的交通服务知识图谱,其中,交通服务知识图谱基于多源数据构建。
其中,知识图谱是人工智能的重要分支技术,本质上是一种语义知识库,用符号形式描述物理世界中的概念及关系,构成网状的知识结构。本申请实施例主要是基于对城市交通出行领域业务数据的深入研究,建立多元实体之间的链接,实现数据与数据之间的多元拓展关联,构建城市交通出行领域知识图谱。
在一个可选地实施方式中,首先,根据人、车、路、环境以及出行各因素之间的关联关系,构建交通服务知识图谱本体。
具体地,对城市交通出行领域涉及的交通、交管、城管、社企服务等部门/单位业务进行分析,按照人、车、路、环境、出行等五个核心因素,按照从顶到底方法对核心因素进行多层子级因素拆分,刻画各因素之间关系,形成多层三元组,三元组包括标签、实体、关系,标签是实体的分类,实体是标签的具体实务,关系是用来描述实体与实体直接联系的,构建完整知识图谱本体,完成城市交通出行知识图谱框架的设计,并存入图数据库中。
具体地,以人、车、路、环境、出行等五个因素作为根节点,按照从顶到底的方法,建立知识图谱。构建知识图谱本体,本体包括:标签class、实体entity、关系relatio。标签class是实体的分类。
其中,实体是标签的具体实物,由基础信息、支持信息两部分组成,基础信息是必须的,而支持信息是非必须的。基础信息用来描写实体的具体样貌;支持信息是区别各个实体的唯一标识的信息,支持信息通常有一个或者多个属性组合而成,支持信息应具有业务意义,在无需或者无法标识出实体唯一性的场景下可以没有支持信息。
关系是用来描述实体与实体直接联系的,由基础信息与支持信息两部分组成,基础信息是必须的,而支持信息是非必须的。基础信息包括:属性、标签、关系名称、FROM_实体、TO_实体;支持信息有两组规则组成:FROM键组合规则、TO键组合规则。通过键组合规则实现将一组实体与另一组实体关联起来。
以车为例,进行逐步拆解、细化,建立车维度的知识图谱本体,并与其它实体因素建立关联关系,构建规则如下:构建实体entity(rootnode,instanceof,class)->entity,提取实体属性property(entiy,type)->property[],创建关联关系relation(from_entity,[r:{property:{name:value}}],to_entity)->r。如下表所示:
根据上表构建的车维度的部分知识图谱本体如图3所示,其他实体因素的构建方法与车维度的类似,将各个实体因素关联起来,得到整体知识图谱本体。构建好的整体知识图谱本体如图2所示,包括人、车、路、环境、出行等多个因素,各个实体因素相互连接,完成数据之间的关系绑定,得到知识图谱本体。
进一步地,根据交通服务知识图谱本体信息,获取构建交通服务知识图谱所需的实体数据需求清单。
按照构建好的知识图谱本体,分析并整理各城市交通出行领域实体数据需求清单,包括数据表、数据字段、数据解释等。在数据库中构建城市交通出行数据底层表,完成数据框架搭建。基于实体数据需求清单,建立数据抽取模型及抽取接口,实现对原始多源数据的对象抽取,并存储至关系数据库中。如原始数据质量较差,需进行数据清洗修正工作,用以确保数据质量。
在一个示例性场景中,根据构建好的知识图谱本体,整理实体数据需求清单,以公交相关数据为例进行说明。整理的公交数据需求清单如下表所示:公交线路:
编码 | 解释 | 格式 |
Xlbh | 线路编号 | String |
Xlmc | 线路名称 | String |
Xlfx | 线路方向 | String |
Xh | 站点序号 | String |
Zdbh | 站点编号 | String |
Ssdw | 所属单位 | String |
Scsj | 上船时间 | datetime |
公交站点:
编码 | 解释 | 格式 |
Zdbh | 站点编号 | String |
Zdmc | 站点名称 | String |
Jd | 经度 | Double |
Wd | 纬度 | Double |
Scsj | 上传时间 | datetime |
公交排班:
公交车辆定位:
编码 | 解释 | 格式 |
Cph | 车牌号 | String |
Jd | 经度 | String |
Wd | 纬度 | String |
Sd | 速度 | String |
Fx | 方向 | String |
Sbsj | 设备时间 | String |
Scsj | 上传时间 | String |
公交刷卡:
编码 | 解释 | 格式 |
Kh | 卡号 | String |
Klx | 卡类型 | String |
Xlbh | 线路编号 | String |
Zdbh | 站点编号 | String |
Cph | 车牌号 | String |
Skrq | 刷卡日期 | String |
Sksj | 刷卡时间 | String |
Scsj | 上传时间 | String |
进一步地,根据实体数据需求清单抽取业务实体数据,并将实体数据与本体关联,得到实体、属性、关系的对应关系。
具体地,基于感知数据中枢/平台,实现对原始多源数据的抽取,其中,多源数据包括卡口过车数据、违法数据、市政公交数据、互联网浮动车数据、网约车数据、停车数据、共享单车数据、气象数据等。完成数据抽取及存储后,对每个实体形成实体、属性、属性值三元组,然后将实体与已构建的知识图谱本体进行关联,完成各实体之间多维、广域的“属性值-属性-实体、实体-关系-实体”模式链路信息关联,得到实体、属性、关系的对应关系,在数据层面实现信息的深度链接,完成城市交通出行领域知识图谱的构建。
其中,将实体与已构建的知识图谱本体进行关联时,首先确定实体,实体是属性赖以存在的基础,并且是自由、独立的,不依赖其他东西而存在。然后确定属性与关系,属性是描述实体某个方面的特征,比如出生日期、身高、体重等,属性是认知世界、描述世界的基础。关系是一类特殊的属性,当实体的某个属性值也是一个实体,这个属性实质上就是关系。最后确定属性值,属性值包括数值类型、日期、文本类型。将确定好的实体、属性、属性值组合实现“属性值-属性-实体实体-关系-实体”抽象,知识图谱上的推理操作一旦遇到一个属性就意味着推理结束。
在一个可选地实施方式中,将业务数据抽取至本体分为实体抽取、关系抽取两类,实现业务实体数据与本体的关联。
实体抽取分为单实体抽取与关联实体抽取两类,单实体抽取是将业务数据抽取独立的实体中,抽取内容包括:属性、标签、主键。关联实体抽取是将业务数据抽取到两个或者两个以上存在关联关系的实体中,并且在抽取实体的同时抽取实体与实体之间的关系。关联实体抽取包括:FROM_实体、TO_实体、关系。关系抽取分为本体关系自动构建以及补充关系两类,是将业务数据抽取到本体的关系中。自动构建是根据本体中应用的关系的规则定时执行抽取关系,其中,本体中应用的关系是指本体与本体之间的关系,实现实体到实体间的关系关联。补充关系抽取,提供FROM_实体、TO_实体列表数据或者规则,实现在现有实体直接完成关系抽取,其中,现有实体是指知识图谱中已经存储的实体,抽取内容包括:TO__[实体|规则]、FROM__[实体|规则]、属性、标签、关系名称。
进一步地,根据构建的实体、关系、属性的对应关系以及半监督机器学习算法进行半监督式的图谱构建,得到构建好的交通服务知识图谱。
在一种可能的实现方式中,对一部分数据与本体进行关联,得到实体、关系、属性的对应关系。基于实体、关系、属性的对应关系,采用半监督机器学习算法,以知识图谱本体为基础,同时学习已构建的图谱中的实体、关系、属性的对应关系,对剩余数据实现半监督式的图谱构建,完成整体知识图谱构建。
在一个可选地实施方式中,还包括根据构建好的交通服务知识图谱,以及预设的最短路径算法计算图谱中道路实体之间的距离,并将计算出来的距离数据存储于数据库中。
知识图谱仅为数据层面的关联关系标定,可按照关系链路进行更深层次的探索。在具体数据应用中,特别是在城市交通出行研判计算过程中,需要在最短的时间内完成最大量、最准确的关系数据查询、计算。可采用最短路径算法Dijkstra计算道路实体之间的距离,并将计算出来的距离数据存储于数据库中。以方便快速查询及调用。
本申请实施例的图谱中结构化数据存储在网络上,包含key/value形式的属性,通过Relationships所定义的关系相连起来,形成关系型网络结构,为算法直接提供计算数据,减少数据转化,提高查询效率,达到为研发底层数据查询、关联查询、结果提取、结果入库等服务,支撑高并发数据查询。现有技术中的数据存储在表格中,需要进一步提取数据,转化数据,因此,本申请的方法可以提高数据查询效率。
S102获取用户的出行服务需求,查询与出行服务需求对应的出行服务模型。
城市交通出行是一项融合交通、交管、城管、社企等多源业务的综合体,基于公众出行订单、公交车、轨道、出租车、网约车、共享单车等运营、停车运营、道路通行等数据,研究公众出行、出行服务、停车运营、道路通行等规律与特征,为交通出行管理和服务提供决策支持。
在一种可能的实现方式中,获取用户输入的出行服务需求,出行服务需求可以包括出发地与目的地分析服务需求、车流量分析服务需求、事故多发地分析服务需求、交通管制分析服务需求以及路径规划分析服务需求中的一种或多种,本申请实施例不做具体限定。
接收到用户输入的出行服务需求之后,调用与该出行服务需求对应的出行服务模型,包括出发地与目的地分析模型(OD分析模型)、车流量分析模型、事故多发地分析模型、交通管制分析模型以及路径规划分析模型中的一种或多种。其中,每种分析模型可根据现有技术中的建模、分析算法预先构建,例如,根据车流量统计算法得到车流量分析模型,根据OD分析算法得到OD分析模型。本申请实施例提供的知识图谱可以应用于多种交通出行分析场景,本申请实施例不做具体限定。
S103基于交通服务知识图谱查询与出行服务模型关联的实体信息,根据出行服务模型以及关联的实体信息计算得到出行服务分析结果。
得到构建好的知识图谱之后,可在此基础上进行数据关系的封装,具体地,在业务应用中根据出行服务业务需求,应用知识图谱中各实体网络的关系,根据实体关系进行业务逻辑组合,提前对数据关系结果数据进行存储,生成直接业务统计数据或者出行服务API,为后续出行服务模型搭建提供数据支撑与计算服务,即封装的数据关系可以是出行服务模型所涉及的某一类业务统计数据,也可以是出行服务API,即出行服务模型。
在一个具体的实施方式中,构建的交通出行知识图谱作为基座,交通出行服务模型库通过API服务接口与知识图谱连接,当有交通出行服务需求时,可基于确定的与交通出行服务需求对应的交通出行服务模型,调用知识图谱中与该目标交通出行服务模型对应的关联的实体信息,关联的实体信息包括基于封装的数据关系得到业务统计数据、实体、属性及关系的对应关系、预先计算的道路实体之间的距离等,进而根据交通服务模型及对应的关联的实体信息计算得到与交通出行服务需求对应的出行服务分析结果。
城市交通出行领域中一个关键场景是私家车出行分析。结合私家车OD分析业务,基于卡口过车数据,对每辆车的出行轨迹进行串并,并结合出行规律、事件间隔等因素,构建私家车OD分析模型,本模型中包括车辆的出发地(O)、目的地(D)、旅行时间、出行距离、出行频率等信息。但此模型存在一个问题,即轨迹点是以卡口位置为准,如图4所示,模型分析的实质是起始卡口点位和终点卡口点位,得到的数据与城市实际空间位置(例如社区、医院、商业等)无关联,无法有效反应公众出行的精确空间性质。
在一个可选地实施例中,当出行服务需求为出发地与目的地分析时,先确定与出发地与目的地分析这一需求对应的出发地与目的地分析模型,从交通服务知识图谱中查询与出发地与目的地分析模型关联的实体信息;根据出发地与目的地分析模型以及关联的实体信息计算得到出发地与目的地分析结果,出发地与目的地分析结果为POI粒度的精确结果。
具体地,根据出发地与目的地分析需求获取车辆的起始卡口信息和终点卡口信息。根据交通服务知识图谱查询起始卡口预设范围内的POI实体,并将查询到的POI实体与起始卡口实体进行关联;根据交通服务知识图谱查询终点卡口预设范围内的POI实体,并将查询到的POI实体与终点卡口实体进行关联。
在一个示例性场景中,根据预设的出发地与目的地分析模型,分析得到车辆的起始卡口信息和终点卡口信息,基于构建的交通服务知识图谱,将卡口坐标为中心点计算半径500米范围内的道路、公交站、社区、医院、学校等实体进行关联,赋予卡口位置更多的空间概念。如图5所示,将卡口与附近的精确POI实体,例如怡苑小区、省二院、碧景园小区、民生银行等进行关联。
如图6所示,为半年某车早晚出行全图谱,通常在一段时间内每辆车与起始地卡口的关系为r{1,n},就是一辆车可能对应多个卡口,起始地卡口与精准POI起点(例如小区)的关系为r{n,n},也就是每个卡口对应多个POI点,每个POI点也可能对应多个卡口,通过对路径的递归与模拟复合计算,最终得到关系r{1,1}。也就是最后不断细化起点、终点的空间颗粒,得到相对准确的车辆的起始地和目的地,从而更加精确的研究私家车出行规律及需求,为进一步的公交线路规划、停车场规划等提供决策支撑。
具体地,基于构建的知识图谱不断细化起点、终点的空间颗粒,得到精确的出发地与目的地分析结果。包括:基于交通服务知识图谱中的时间维度、图谱深度、数据度量以及链接流量构建查询向量。组合成查询向量odvector={time&&deap&&num&&join},根据查询向量从交通服务知识图谱中查询出发地与目的地分析结果。
首先,计算查询向量中的时间维度因子、图谱深度因子、数据度量因子以及链接流量因子的数值。其中,时间维度为图谱中的数据包含的时间段,图谱深度为车辆经过了多少个卡口,数据度量为车辆经过该卡口的次数,链接流量为某个卡口到某个POI点的车次数量。
进一步地,采用层次分析法计算每个因子的权重,例如,引用层次分析法AHP,计算出每个因子的权重,并应用1-5分标度法,如下表所示:
time | deap | num | join | |
time | 1 | 0.333333 | 0.5 | 0.5 |
deap | 3 | 1 | 2 | 5 |
num | 2 | 0.5 | 1 | 5 |
join | 2 | 0.5 | 0.5 | 1 |
获得权重结果:
进一步地,计算交通服务知识图谱中每条路径的查询向量的值,查询向量的值为每个因子与其对应的权重的积的和,将查询向量的值最大的路径对应的起始点POI作为车辆的出发地,将查询向量的值最大的路径的终点POI作为车辆的目的地。
在一个实施例中,查询条件Querypath={Querypath={MATCH(n:Car{name='冀A9845Y'})-[c:pass:0..1]-(deep:kk:*)-[l:join*]>(a:untity{name:'怡苑'})wheremax(sum(time*0.12094,deep*0.41680,pass.num*0.26.94,join*0.19278))return a;}。如图7所示,根据本申请实施例提供的查询方法,输入查询向量,可得起始地POI点为“怡苑”,同理,输入目的地卡口相关的查询向量,可得到精确的目的地POI点。
在一个可选地实施例中,还可以基于本申请实施例中的知识图谱进行其他交通出行业务的分析计算,例如,根据拥堵路段分析模型分析出拥堵路段的卡口信息,结合知识图谱进一步确定精确的POI位置点,反映实际出行的空间特征。
在一个可选地实施例中,还可以基于本申请实施例中的知识图谱进行其他交通出行业务的分析计算,例如,根据知识图谱中的人、车、路、通行、环境关联数据构建事故多发地分析模型,结合图谱中的精确空间特征分析出精确的事故多发地路段,降低了对数据处理的难度,且基于关联数据可以提高计算精度,反映精准的事故多发路段的空间特征。
本申请实施例提供的交通出行分析方法,通过对城市交通出行相关的公众出行数据、车辆(包括私家车、公交车、出租车等)运行数据、道路通行数据、空间地理数据等信息进行研究,整理多维数据关系网,通过实体抽取、实体映射,构建城市交通出行知识图谱。并基于图运算理论进行挖掘、计算,以数据接口的方式为上层的研判决策模型提供标准化的数据关联查询服务,大大降低了业务学习成本以及数据关联计算难度,提高后续交通出行分析服务的计算效率。
本申请实施例还提供一种基于知识图谱的交通出行分析装置,该装置用于执行上述实施例的基于知识图谱的交通出行分析方法,如图8所示,该装置包括:
知识图谱获取模块801,用于获取预先构建的交通服务知识图谱,其中,交通服务知识图谱基于多源交通数据构建;
出行服务查询模块802,用于获取用户的出行服务需求,查询与出行服务需求对应的出行服务模型;
分析模块803,用于基于交通服务知识图谱查询与出行服务模型关联的实体信息,根据出行服务模型以及关联的实体信息计算得到出行服务分析结果。
需要说明的是,上述实施例提供的基于知识图谱的交通出行分析装置在执行基于知识图谱的交通出行分析方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于知识图谱的交通出行分析装置与基于知识图谱的交通出行分析方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
本申请实施例还提供一种与前述实施例所提供的基于知识图谱的交通出行分析方法对应的电子设备,以执行上述基于知识图谱的交通出行分析方法。
请参考图9,其示出了本申请的一些实施例所提供的一种电子设备的示意图。如图9所示,电子设备包括:处理器900,存储器901,总线902和通信接口903,处理器900、通信接口903和存储器901通过总线902连接;存储器901中存储有可在处理器900上运行的计算机程序,处理器900运行计算机程序时执行本申请前述任一实施例所提供的基于知识图谱的交通出行分析方法。
其中,存储器901可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口903(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线902可以是ISA总线、PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。其中,存储器901用于存储程序,处理器900在接收到执行指令后,执行程序,前述本申请实施例任一实施方式揭示的基于知识图谱的交通出行分析方法可以应用于处理器900中,或者由处理器900实现。
处理器900可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器900中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器900可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器901,处理器900读取存储器901中的信息,结合其硬件完成上述方法的步骤。
本申请实施例提供的电子设备与本申请实施例提供的基于知识图谱的交通出行分析方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
本申请实施例还提供一种与前述实施例所提供的基于知识图谱的交通出行分析方法对应的计算机可读存储介质,请参考图10,其示出的计算机可读存储介质为光盘1000,其上存储有计算机程序(即程序产品),计算机程序在被处理器运行时,会执行前述任意实施例所提供的基于知识图谱的交通出行分析方法。
需要说明的是,计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的基于知识图谱的交通出行分析方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于知识图谱的交通出行分析方法,其特征在于,包括:
获取预先构建的交通服务知识图谱,其中,所述交通服务知识图谱基于多源交通数据构建;
获取用户的出行服务需求,查询与所述出行服务需求对应的出行服务模型;
基于所述交通服务知识图谱查询与所述出行服务模型关联的实体信息,根据所述出行服务模型以及所述关联的实体信息计算得到出行服务分析结果。
2.根据权利要求1所述的方法,其特征在于,预先构建交通服务知识图谱,包括:
根据人、车、路、环境以及出行各因素之间的关联关系,构建所述交通服务知识图谱本体;
根据所述交通服务知识图谱本体信息,获取构建所述交通服务知识图谱所需的实体数据需求清单;
根据所述实体数据需求清单抽取实体数据,并将实体数据与本体关联,得到实体、属性、关系的对应关系;
根据所述实体、属性、关系的对应关系以及半监督机器学习算法进行半监督式的图谱构建,得到构建好的所述交通服务知识图谱。
3.根据权利要求2所述的方法,其特征在于,得到构建好的所述交通服务知识图谱之后,还包括:
根据构建好的所述交通服务知识图谱,以及预设的最短路径算法计算图谱中道路实体之间的距离,并将计算出来的距离数据存储于数据库中。
4.根据权利要求1所述的方法,其特征在于,所述出行服务需求包括出发地与目的地分析服务需求、车流量分析服务需求、事故多发地分析服务需求、交通管制分析服务需求以及路径规划分析服务需求中的一种或多种;
所述出行服务模型包括出发地与目的地分析模型、车流量分析模型、事故多发地分析模型、交通管制分析模型以及路径规划分析模型中的一种或多种。
5.根据权利要求1所述的方法,其特征在于,基于所述交通服务知识图谱查询与所述出行服务模型关联的实体信息,根据所述出行服务模型以及所述关联的实体信息计算得到出行服务分析结果,包括:
当所述出行服务需求为出发地与目的地分析需求时,确定与所述需求对应的出发地与目的地分析模型,从所述交通服务知识图谱中查询与所述出发地与目的地分析模型关联的实体信息;
根据所述出发地与目的地分析模型以及关联的实体信息计算得到出发地与目的地分析结果,所述出发地与目的地分析结果为POI粒度的精确结果。
6.根据权利要求5所述的方法,其特征在于,从所述交通服务知识图谱中查询与所述出发地与目的地分析模型关联的实体信息,根据所述出发地与目的地分析模型以及关联的实体信息计算得到出发地与目的地分析结果,包括:
根据所述出发地与目的地分析需求得到车辆的起始卡口信息和终点卡口信息;
根据所述交通服务知识图谱查询所述起始卡口预设范围内的POI实体,并将查询到的POI实体与起始卡口实体进行关联;
根据所述交通服务知识图谱查询所述终点卡口预设范围内的POI实体,并将查询到的POI实体与终点卡口实体进行关联;
基于所述交通服务知识图谱中的时间维度、图谱深度、数据度量以及链接流量构建查询向量;
根据所述查询向量从所述交通服务知识图谱中查询出发地与目的地分析结果。
7.根据权利要求6所述的方法,其特征在于,根据所述查询向量从所述交通服务知识图谱中查询出发地与目的地分析结果,包括:
计算所述查询向量中的时间维度因子、图谱深度因子、数据度量因子以及链接流量因子的数值;
采用层次分析法计算每个因子的权重;
计算所述交通服务知识图谱中每条路径的查询向量的值,所述查询向量的值为每个因子与其对应的权重的积的和;
将查询向量的值最大的路径对应的起始点POI作为车辆的出发地,将查询向量的值最大的路径的终点POI作为车辆的目的地。
8.一种基于知识图谱的交通出行分析装置,其特征在于,包括:
知识图谱获取模块,用于获取预先构建的交通服务知识图谱,其中,所述交通服务知识图谱基于多源交通数据构建;
出行服务查询模块,用于获取用户的出行服务需求,查询与所述出行服务需求对应的出行服务模型;
分析模块,用于基于所述交通服务知识图谱查询与所述出行服务模型关联的实体信息,根据所述出行服务模型以及所述关联的实体信息计算得到出行服务分析结果。
9.一种电子设备,其特征在于,包括处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至7任一项所述的基于知识图谱的交通出行分析方法。
10.一种计算机可读介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令被处理器执行以实现如权利要求1至7任一项所述的一种基于知识图谱的交通出行分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210740988.XA CN115292507A (zh) | 2022-06-28 | 2022-06-28 | 基于知识图谱的交通出行分析方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210740988.XA CN115292507A (zh) | 2022-06-28 | 2022-06-28 | 基于知识图谱的交通出行分析方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115292507A true CN115292507A (zh) | 2022-11-04 |
Family
ID=83821227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210740988.XA Pending CN115292507A (zh) | 2022-06-28 | 2022-06-28 | 基于知识图谱的交通出行分析方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115292507A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116010626A (zh) * | 2023-03-24 | 2023-04-25 | 南方电网数字电网研究院有限公司 | 电力用户知识图谱分析方法、装置和计算机设备 |
CN116701643A (zh) * | 2022-12-15 | 2023-09-05 | 重庆交通大学 | 基于社会传感数据的人群出行行为解析方法及存储介质 |
CN117689304A (zh) * | 2024-02-04 | 2024-03-12 | 交通运输部规划研究院 | 公路大件运输通行路线确定方法及装置 |
-
2022
- 2022-06-28 CN CN202210740988.XA patent/CN115292507A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116701643A (zh) * | 2022-12-15 | 2023-09-05 | 重庆交通大学 | 基于社会传感数据的人群出行行为解析方法及存储介质 |
CN116010626A (zh) * | 2023-03-24 | 2023-04-25 | 南方电网数字电网研究院有限公司 | 电力用户知识图谱分析方法、装置和计算机设备 |
CN116010626B (zh) * | 2023-03-24 | 2023-06-27 | 南方电网数字电网研究院有限公司 | 电力用户知识图谱分析方法、装置和计算机设备 |
CN117689304A (zh) * | 2024-02-04 | 2024-03-12 | 交通运输部规划研究院 | 公路大件运输通行路线确定方法及装置 |
CN117689304B (zh) * | 2024-02-04 | 2024-05-31 | 交通运输部规划研究院 | 公路大件运输通行路线确定方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107092680B (zh) | 一种基于地理网格的政务信息资源整合方法 | |
WO2020228706A1 (zh) | 基于围栏地址的坐标数据处理方法、装置和计算机设备 | |
Hao et al. | The rise of big data on urban studies and planning practices in China: Review and open research issues | |
Bellini et al. | Km4City ontology building vs data harvesting and cleaning for smart-city services | |
CN115292507A (zh) | 基于知识图谱的交通出行分析方法、装置、设备及介质 | |
Kong et al. | RMGen: A tri-layer vehicular trajectory data generation model exploring urban region division and mobility pattern | |
CN109002961B (zh) | 一种基于网络数据的跨区域文化景观间功能结构规划方法 | |
CN103680127A (zh) | 一种利用低采样率浮动车数据计算信号灯控制道路交叉口延误的方法 | |
CN103838825A (zh) | 一种全球地名数据整合与代码编制方法 | |
Huang | Data integration for urban transport planning | |
CN104598548B (zh) | 一种分析农产品价格空间关联性的方法及装置 | |
CN113793500B (zh) | 城市交通道路可计算路网的构建方法及系统 | |
Lu et al. | Exploring travel patterns and static rebalancing strategies for dockless bike-sharing systems from multi-source data: a framework and case study | |
Guillermo et al. | Graph Database-modelled Public Transportation Data for Geographic Insight Web Application | |
Park et al. | Framework for constructing multimodal transport networks and routing using a graph database: A case study in London | |
Chen et al. | Detecting urban commercial patterns using a latent semantic information model: A case study of spatial-temporal evolution in Guangzhou, China | |
Wang et al. | GIS cloud computing based government Big Data analysis platform | |
Du et al. | A novel semantic recognition framework of urban functional zones supporting urban land structure analytics based on open‐source data | |
Beukes et al. | Quantifying the contextual influences on road design | |
Chen et al. | Workflow for generating 3D urban models from open city data for performance-based urban design | |
Dunne et al. | A large scale method for extracting geographical features on bus routes from OpenStreetMap and assessment of their impact on bus speed and reliability | |
Shaji | Spatio-temporal clustering to study vehicle emissions and air quality correlation at Porto | |
Hao et al. | Identification and characterization of urban polycentric structure based on points of interest in Shenyang, China | |
Egami et al. | Schema design of illegally parked bicycles LOD | |
Silva | Spatial data integration from heterogeneous sources for urban computing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |