CN116796006A - 基于知识图谱的公共交通出行人群画像分析方法及系统 - Google Patents
基于知识图谱的公共交通出行人群画像分析方法及系统 Download PDFInfo
- Publication number
- CN116796006A CN116796006A CN202310828534.2A CN202310828534A CN116796006A CN 116796006 A CN116796006 A CN 116796006A CN 202310828534 A CN202310828534 A CN 202310828534A CN 116796006 A CN116796006 A CN 116796006A
- Authority
- CN
- China
- Prior art keywords
- knowledge graph
- knowledge
- travel
- data
- travel mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003703 image analysis method Methods 0.000 title claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000000007 visual effect Effects 0.000 claims abstract description 27
- 230000009467 reduction Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 8
- 238000012800 visualization Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000003475 lamination Methods 0.000 claims description 4
- 238000007726 management method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 7
- 239000010410 layer Substances 0.000 description 6
- 238000001514 detection method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000010191 image analysis Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004080 punching Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000012098 association analyses Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及知识图谱技术领域,提出一种基于知识图谱的公共交通出行人群画像分析方法及系统,该方法主要包括:基于单一交通出行方式的管理业务系统,构建单一交通知识图谱;基于多个单一交通的知识图谱,构建多层级交通出行方式知识图谱;对多层级交通出行方式知识图谱进行优化,获得可视化公共交通出行人群画像知识图谱。本发明通过上述方法可实现人群出行画像的精准闭环,有效的提升了知识图谱的调用效能,提高大模型的训练效率和稳定性。
Description
技术领域
本发明涉及知识图谱技术领域,特别涉及一种基于知识图谱的公共交通出行人群画像分析方法及系统。
背景技术
近年来,随着交通行业的快速发展与智能化服务逐步普及,交通领域对交通出行数据群像分析也提出了更高的要求。城市公共交通指公交、轨道、出租、轮渡等交通方式,衍生出的城市公共交通数据即为公交数据、轨道数据、出租数据及轮渡数据。这些数据不但与城市居民职住情况、出行需求、城市用地有着复杂的关联关系,同时各类公共交通出行方式间同样存在着复杂关联性。
在对城市公共交通出行画像分析过程中,经常需要对居民出行方式、出行时间、出行路径等进行关联分析,期间涉及多种交通方式,往往很难在短时间内获取全面的关联信息,因此也难以满足城市公共交通出行智能化调度管理的需求。
一般来说,城市公共交通出行数据通常分散在不同部门,且不同类型的出行方式均配置了不同的管理系统,彼此之间缺乏对应匹配的关联关系,没有全面统一的公共交通出行可视化视图。
当需要开展城市公共交通出行需求分析时,往往会消耗大量时间来梳理各种交通方式间存在的匹配关联关系,从而降低了出行数据挖掘效率。此外,从不同业务部门及运营企业汇总的公共交通出行数据经常分散在各种不同的文档、图表中,不够直观方便且沟通效率较低,一旦在特殊情况下需要临时梳理多种交通方式出行需求的关联关系,将可能因忽略某些重要关系而造成分析结果的不准确。
发明内容
本发明提供一种基于知识图谱的公共交通出行人群画像分析方法及系统,用以解决现有技术中数据不够直观的缺陷,实现人群出行画像的精准闭环,有效的提升了知识图谱的调用效能,提高大模型的训练效率和稳定性。
本发明提供一种基于知识图谱的公共交通出行人群画像分析方法,包括:
基于单一交通出行方式的管理业务系统,构建单一交通知识图谱;
基于多个单一交通的知识图谱,构建多层级交通出行方式知识图谱;
对多层级交通出行方式知识图谱进行优化,获得可视化公共交通出行人群画像知识图谱。
在一种可能的实施方式中,所述构建单一交通知识图谱,包括:
获取单一交通出行方式的管理业务系统中的基础数据;
对基础数据进行分析,获得实体数据和关系数据;
基于实体数据,进行节点建模;
基于关系数据,进行关系建模。
在一种可能的实施方式中,所述基础数据包括纯文本数据、结构化数据和半结构化数据。
在一种可能的实施方式中,所述构建多层级交通出行方式知识图谱,包括:
基于注册信息数据的信息关联,建立多层级交通出行方式知识图谱;
利用预训练方法,优化多层级交通出行方式知识图谱。
在一种可能的实施方式中,所述利用预训练方法,优化多层级交通出行方式知识图谱,包括:
基于知识图谱的生成式预训练方法;
利用预训练方法,构建预训练框架;
利用预训练方法,捕捉预训练框架的属性信息;
利用预训练框架,捕捉隐含的特征信息。
在一种可能的实施方式中,所述获得可视化公共交通出行人群画像知识图谱,包括:
对多层级交通出行方式知识图谱的层级数据进行布局;
对多层级交通出行方式知识图谱的布局参数进行配置;
对多层级交通出行方式知识图谱进行视觉降噪。
在一种可能的实施方式中,所述对多层级交通出行方式知识图谱进行视觉降噪,包括:
根据文字的层叠关系,对重叠文字进行处理;
利用多边散列排布的算法,对重叠的边线进行处理。
本发明还提供一种基于知识图谱的公共交通出行人群画像分析系统,包括:
构建模块,用于基于单一交通出行方式的管理业务系统,构建单一交通知识图谱和基于多个单一交通的知识图谱,构建多层级交通出行方式知识图谱;
可视化模块,用于对多层级交通出行方式知识图谱进行优化,获得可视化公共交通出行人群画像知识图谱。
在一种可能的实施方式中,所述构建模块包括预训练单元,所述预训练单元,用于优化多层级交通出行方式知识图谱。
在一种可能的实施方式中,所述可视化模块包括:
布局单元,对多层级交通出行方式知识图谱的层级数据进行布局;
配置单元,对多层级交通出行方式知识图谱的布局参数进行配置;
降噪单元,对多层级交通出行方式知识图谱进行视觉降噪。
本发明提供的一种基于知识图谱的公共交通出行人群画像分析方法及系统,通过基于单一交通知识图谱构建多层级交通出行方式知识图谱,并将多层级交通出行方式知识图谱可视化,从而实现人群出行画像的精准闭环,有效的提升了知识图谱的调用效能,提高大模型的训练效率和稳定性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种基于知识图谱的公共交通出行人群画像分析方法的流程示意图;
图2是本发明提供的构建单一交通知识图谱方法的流程示意图;
图3是本发明提供的公交出行知识图谱的结构示意图;
图4是本发明提供的出租出行知识图谱的结构示意图;
图5是本发明提供的轨道出行知识图谱的结构示意图;
图6是本发明提供的轮渡出行知识图谱的结构示意图;
图7是本发明提供的多层级交通出行方式知识图谱方法的流程示意图;
图8是本发明提供的多层级交通出行方式知识图谱的结构示意图;
图9是本发明提供的优化多层级交通出行方式知识图谱方法的流程示意图;
图10是本发明提供的得可视化公共交通出行人群画像知识图谱方法的流程示意图;
图11是本发明提供的对多层级交通出行方式知识图谱进行视觉降噪方法的流程示意图;
图12是本发明提供的一种基于知识图谱的公共交通出行人群画像分析系统的结构示意图。
具体实施方式
为使本发明实施的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行更加详细的描述。
需要说明的是:在附图中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。所描述的实施例是本发明一部分实施例,而不是全部的实施例,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
下面参考图1-11详细描述本发明公开的一种基于知识图谱的公共交通出行人群画像分析方法的第一实施例。
为便于理解本发明实施例的技术方案,以公交、出租车等单一交通出行方式为例,构建可视化公共交通出行人群画像知识图谱,以及利用Neo4j实现专业数据库级别的图数据模型的存储及知识图谱的可视化。
如图1所示,本实施例主要包括以下步骤:
S1、基于单一交通出行方式的管理业务系统,构建单一交通知识图谱。
如图2所示,在步骤S1中,构建单一交通知识图谱,具体包括:
S11、获取单一交通出行方式的管理业务系统中的基础数据。
基于深度学习模型的事件抽取技术,从单一交通出行方式的管理业务系统中抽取不同来源、不同结构的基础数据。
进一步,单一交通出行方式包括公交、出租、轨道和轮渡等出行方式。
进一步,基础数据包括纯文本数据、结构化数据和半结构化数据。
进一步,构建知识图谱的过程是从不同来源、不同结构的数据中进行知识提取,形成知识存入到知识图谱,主要针对纯文本、结构化数据和半结构化数据进行信息抽取。其中,纯文本形式为TXT模式,通过信息抽取汇聚到知识图谱库;结构化数据包括链接数据和数据库,链接数据通过图映射汇聚到知识图谱库,数据库数据则通过D2R转换汇聚到知识图谱库;半结构化数据包括表格、列表、infobox等形式,通过包装器汇聚到知识图谱库。
例如,从公交业务管理系统中抽取公交基础数据,主要包括公交线路信息表和公交刷卡记录表,其中,公交线路信息表包含了公交线路对应站点数据,详细字段包括了线路编号、线路方向、线路名称和站点序号等信息。
公交刷卡记录表记录了各时段人群刷卡记录,详细字段包括了IC卡编号、车辆编号、公交线路编号、上车站点序号、下车站点序号等信息。
S12、对基础数据进行分析,获得实体数据和关系数据。
根据基础数据的类型,将属于实体类型的基础数据进行标记,可标记为实体数据;将属于关系类型的基础数据进行标记,可标记为关系数据。
例如,根据公交人、车、站点之间的关联关系,可将基础数据进行分类,其中,实体数据包括:公交车辆、公交站点、公交线路、IC卡(公交出行者使用的IC卡)、刷卡记录;
关系数据包括:公交车辆与公交线路之间的属于关系、公交线路与公交站点之间的经过关系、IC卡与刷卡出行之间的出行关系、公交站点与刷卡出行的上车关系、公交站点与公交站点之间的相邻关系、刷卡出行与公交站点之间的下车关系,其具体可理解为一个完整的出行线路中实体与实体之间的关系。
如图3所示,S13、基于实体数据,进行节点建模。
节点建模中,将原始数据即为公交线路信息表和公交刷卡记录表,转化为图数据库对应的节点,其中原始数据表中的一条记录对应图数据库中的一个节点,整个原始数据表对应图数据库中某一节点集合即标签。
例如,公交车辆实体:从刷卡记录表中提取vehicle标签(去重),单个节点仅包含车辆编号属性。
公交线路实体:从公交线路信息表中提取车辆线路标签,单个节点包含线路编号、线路名称、线路方向等属性。
公交站点实体:从公交线路信息表中提取站点标签,单个节点包含站点编号、站点名称、站点经纬度等属性。
刷卡记录实体:从刷卡记录表中提取刷卡标签,单个节点包含:刷卡记录编号、公交IC卡编号两个属性。
IC卡标签实体:从公交刷卡记录表中提取IC卡标签(去重),单个节点仅包含IC卡编号属性。
S14、基于关系数据,进行关系建模。
根据基础数据中的数据表(公交线路信息表和公交刷卡记录表)处理节点之间的对应关系。
例如:公交车辆与公交线路之间的属于关系:从刷卡记录表中提取公交车辆与公交线路的属于关系(去重),关系匹配字段为车辆编号与线路。
公交线路与公交站点之间的经过关系:从公交线路信息表中描述了每条公交线路经过公交站点的关系,关系匹配字段为线路编号—>站点编号,关系属性包含站点序号。
公交站点与刷卡记录之间的上车关系:从刷卡记录表中提取公交站点与刷卡记录的上车关系,匹配字段为站点编号—>乘车记录编号,关系属性包含线路编号,上车站点编号,上车时间。
刷卡记录与公交站点之间的下车关系:从刷卡记录表中提取刷卡记录与公交站点的下车关系,匹配字段为乘车记录编号—> 站点编号,关系属性包含线路编号、下车站点序号、下车站点时间。
IC卡与刷卡记录之间的乘坐关系:从刷卡记录表中提取IC卡与刷卡记录出行关系,匹配字段为IC卡编号—>IC卡编号。
公交站点与公交站点之间的相邻关系:从公交线路信息表中根据经纬度坐标记录公交站点的之间的相邻关系,匹配字段为公交站点编号—公交站点编号。
本发明中,通过上述构建单一交通的知识图谱方法,构建出租、轨道和轮渡等单一公共交通出行方式的知识图谱,如图4为出租出行知识图谱,如图5为轨道(地铁)出行知识图谱,如图6为轮渡出行知识图谱。
S2、基于多个单一交通的知识图谱,构建多层级交通出行方式知识图谱。
清分各层级单一出行方式(公交、出租、轨道、轮渡等)下的知识图谱组成,即实体集、关系集、实体和关系之间的相互作用(或三元组)。
如图7和图8所示,在步骤S2中,构建多层级交通出行方式知识图谱,具体包括:
S21、基于注册信息数据的信息关联,建立多层级交通出行方式知识图谱。
基于出行人群对公交、出租、轨道、轮渡等出行方式的注册信息数据,进行多层级交通出行方式知识图谱的关系建立。
进一步,注册信息数据包括公交IC卡、个人ID、轨道IC卡、轮渡IC卡等。
本发明中,利用多种交通出行方式间的注册信息数据,进行了多层级交通出行方式知识图谱嵌入,完成了多层立体公共交通出行知识图谱的构建,实现了人群出行画像的精准闭环。
S22、利用预训练方法,优化多层级交通出行方式知识图谱。
如图9所示,在步骤S22中,优化多层级交通出行方式知识图谱,具体包括:
S221、基于知识图谱的生成式预训练方法(GPT-GNN);
S222、利用预训练方法,构建预训练框架;
S223、利用预训练方法,捕捉预训练框架的属性信息;
S224、利用预训练框架,捕捉隐含的特征信息。
基于知识图谱的生成式预训练方法(GPT-GNN),构建自监督的生成式的预训练框架,通过预训练捕捉知识图谱固有的内在的结构和语义等属性信息,提升多层级交通出行方式知识图谱数据的调用效能。
具体的,采用生成式方法,将公交、出租、轨道、轮渡等出行方式生成知识图谱的节点属性和图的结构信息作为无监督数据,来供GNN进行预训练。例如,生成一个“公交站点”节点,首先可以通过已知的连边比如公交线路的其他站点,生成该站点节点,并进一步预测生成的该站点对应的上下车乘客信息、车辆属性等。已知连边和生成的连边构成结构信息,通过这种交互的方式能够充分利用到单一交通出行方式知识图谱的属性和结构来完成预训练所需的生成任务。
用概率来描述交通出行过程中节点的属性和相互的连接关系,预训练的目标是寻找最大的参数值,其中参数代表的是城市公共交通出行方式中节点属性与连边关系(即图的结构信息)。
采用类似自回归的思想对城市公共交通出行方式中节点进行排序,逐个生成对应的节点和边。最终将多种交通方式的知识图谱分解为不同排列的属性值和连边值,用已知交通出行节点信息,去生成该节点的属性,然后利用该新生成的属性与已知结构信息,共同生成余下的结构信息。
将生成的节点类型分为通过属性生成的节点和通过连边生成的节点,将两种不同类型的生成节点送入GNN网络,得到多种交通出行方式的属性和连边的生成。
其中,对于通过属性生成的节点,如果输入的属性是文本类型,则可以使用如LSTM这类文本生成模型作为生成器;如果输入的属性是向量类型,则可以使用多层感知机等模型来做属性节点的生成。
进一步,各类交通方式连边的生成需要节点属性作为输入,而节点属性同时又通过属性生成。
对训练数据中随机选择10%的标签数据库用于训练,同时确定一个子集作为验证集,利用GPT-GNN模型训练通过两个生成任务:属性生成和边缘生成,并且利用城市公共交通出行方式的属性节点和图形结构之间的相互依赖关系,捕捉隐含的特征信息。
进一步,标签数据库为每个个体出行的全过程刷卡数据,获得标签数据是通过本地公交、地铁、轨道、出租车等管理系统获得。
进一步,通过语音输入个人ID后,自动调用个人出行其余属性数据信息,从而实现捕捉隐含的特征信息。
利用GPT-GNN模型进行多种交通出行人群画像的语言训练,有效提升了知识图谱的调用效能,提高大模型的训练效率和稳定性。
S3、对多层级交通出行方式知识图谱进行优化,获得可视化公共交通出行人群画像知识图谱。
将个人的出行数据导入系统数据库及Web前台渲染,通过系统提供的系统数据库的数据接口完成数据导入,并建立了节点和关系模型,其中,系统数据库为三元组数据库,可自动识别实体和属性,即节点和关系。
多层级交通出行方式知识图谱的关系是一种典型的图数据结构,因此在Web层渲染中采用了力导向图(Force-Directed Graph)的形式去展现。
如图10所示,在步骤S3中,获得可视化公共交通出行人群画像知识图谱,具体包括:
S31、对多层级交通出行方式知识图谱的层级数据进行布局。
首先处理多层级交通出行方式知识图谱,将中心节点关联的子节点按关联关系归类,生成聚簇边和聚簇边节点,同时将子节点分层,为每个子节点定义聚簇中心节点和聚簇半径。
S32、对多层级交通出行方式知识图谱的布局参数进行配置。
为清晰展现出各单一交通的知识图谱的特点,布局形态就需要跟随图谱而变化,根据交通出行方式图谱的特点优化布局参数,并作为配置保存下来,并可通过语音调用可以获取清晰的单层出行方式图谱。
S33、对多层级交通出行方式知识图谱进行视觉降噪。
如图11所示,在步骤S32中,视觉降噪,具体包括:
S331、根据文字的层叠关系,对重叠文字进行处理。
利用遮挡检测技术,对多层级交通出行方式知识图谱中的文字进行检测,获得的重叠文字,根据重叠文字的层叠关系,将置于顶层的重要文字字体加深,将位于底部的文字进行透明度处理,从而避免因文字重叠而无法快速识别对节点和边的描述的重要信息。
进一步,采用DataExa-Kali知识图谱实时可视化引擎,对多层级交通出行方式知识图谱中的重叠文字进行遮挡检测。
S332、利用多边散列排布的算法,对重叠的边线进行处理。
利用多边散列排布的算法,通过边夹角偏移量计算和节点半径裁剪,将关系分散排布在节点周围,减少边线重叠的情况,以达到更清晰的视觉效果。
本发明的可视化公共交通出行人群画像知识图谱模型建立了单一交通方式的人群出行画像,还提供了多层级交通方式间换乘的关联关系,并建立关联关系可视化视图,以及使用更为直观简捷的方法,通过充分利用现有的公共交通出行数据,可帮助政府部门管理人员快速全面了解相关信息,在进一步分析交通出行大数据需求的同时,也为政府管理部门提供了更为高效、规范、易操作的方法。
下面参考图12详细描述,基于同一发明构思,本发明实施例还提供了一种基于知识图谱的公共交通出行人群画像分析系统的第一实施例。
本实施例主要包括:构建模块,用于基于单一交通出行方式的管理业务系统,构建单一交通知识图谱和基于多个单一交通的知识图谱,构建多层级交通出行方式知识图谱。其中,构建单一交通知识图谱具体如下:
获取单一交通出行方式的管理业务系统中的基础数据;
对基础数据进行分析,获得实体数据和关系数据;
基于实体数据,进行节点建模;
基于关系数据,进行关系建模。
构建多层级交通出行方式知识图具体如下:
基于注册信息数据的信息关联,建立多层级交通出行方式知识图谱;
利用预训练方法,优化多层级交通出行方式知识图谱。
可视化模块,用于对多层级交通出行方式知识图谱进行优化,获得可视化公共交通出行人群画像知识图谱。通过对多层级交通出行方式知识图谱的层级数据进行布局;对多层级交通出行方式知识图谱的布局参数进行配置;对多层级交通出行方式知识图谱进行视觉降噪。
在一种可能的实施方式中,构建模块包括预训练单元,预训练单元,用于优化多层级交通出行方式知识图谱。
具体的,基于知识图谱的生成式预训练方法;利用预训练方法,构建预训练框架;利用预训练方法,捕捉预训练框架的属性信息;利用预训练框架,捕捉隐含的特征信息。
在一种可能的实施方式中,可视化模块包括:
布局单元,对多层级交通出行方式知识图谱的层级数据进行布局。首先处理多层级交通出行方式知识图谱,将中心节点关联的子节点按关联关系归类,生成聚簇边和聚簇边节点,同时将子节点分层,为每个子节点定义聚簇中心节点和聚簇半径。
配置单元,对多层级交通出行方式知识图谱的布局参数进行配置。
为清晰展现出各单一交通的知识图谱的特点,布局形态就需要跟随图谱而变化,根据交通出行方式图谱的特点优化布局参数,并作为配置保存下来,并可通过语音调用可以获取清晰的单层出行方式图谱。
降噪单元,对多层级交通出行方式知识图谱进行视觉降噪,其中包括对文字进行处理,利用遮挡检测技术,对多层级交通出行方式知识图谱中的文字进行检测,获得的重叠文字,根据重叠文字的层叠关系,将置于顶层的重要文字字体加深,将位于底部的文字进行透明度处理,从而避免因文字重叠而无法快速识别对节点和边的描述的重要信息。
进一步,采用DataExa-Kali知识图谱实时可视化引擎,对多层级交通出行方式知识图谱中的重叠文字进行遮挡检测。
对边进行处理,利用多边散列排布的算法,通过边夹角偏移量计算和节点半径裁剪,将关系分散排布在节点周围,减少边线重叠的情况,以达到更清晰的视觉效果。
本发明的可视化公共交通出行人群画像知识图谱模型建立了单一交通方式的人群出行画像,还提供了多层级交通方式间换乘的关联关系,并建立关联关系可视化视图,以及使用更为直观简捷的方法,通过充分利用现有的公共交通出行数据,可帮助政府部门管理人员快速全面了解相关信息,在进一步分析交通出行大数据需求的同时,也为政府管理部门提供了更为高效、规范、易操作的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种基于知识图谱的公共交通出行人群画像分析方法,其特征在于,包括:
基于单一交通出行方式的管理业务系统,构建单一交通知识图谱;
基于多个单一交通的知识图谱,构建多层级交通出行方式知识图谱;
对多层级交通出行方式知识图谱进行优化,获得可视化公共交通出行人群画像知识图谱。
2.根据权利要求1所述的一种基于知识图谱的公共交通出行人群画像分析方法,其特征在于,所述构建单一交通知识图谱,包括:
获取单一交通出行方式的管理业务系统中的基础数据;
对基础数据进行分析,获得实体数据和关系数据;
基于实体数据,进行节点建模;
基于关系数据,进行关系建模。
3.根据权利要求2所述的一种基于知识图谱的公共交通出行人群画像分析方法,其特征在于,所述基础数据包括纯文本数据、结构化数据和半结构化数据。
4.根据权利要求1所述的一种基于知识图谱的公共交通出行人群画像分析方法,其特征在于,所述构建多层级交通出行方式知识图谱,包括:
基于注册信息数据的信息关联,建立多层级交通出行方式知识图谱;
利用预训练方法,优化多层级交通出行方式知识图谱。
5.根据权利要求4所述的一种基于知识图谱的公共交通出行人群画像分析方法,其特征在于,所述利用预训练方法,优化多层级交通出行方式知识图谱,包括:
基于知识图谱的生成式预训练方法;
利用预训练方法,构建预训练框架;
利用预训练方法,捕捉预训练框架的属性信息;
利用预训练框架,捕捉隐含的特征信息。
6.根据权利要求1所述的一种基于知识图谱的公共交通出行人群画像分析方法,其特征在于,所述获得可视化公共交通出行人群画像知识图谱,包括:
对多层级交通出行方式知识图谱的层级数据进行布局;
对多层级交通出行方式知识图谱的布局参数进行配置;
对多层级交通出行方式知识图谱进行视觉降噪。
7.根据权利要求6所述的一种基于知识图谱的公共交通出行人群画像分析方法,其特征在于,所述对多层级交通出行方式知识图谱进行视觉降噪,包括:
根据文字的层叠关系,对重叠文字进行处理;
利用多边散列排布的算法,对重叠的边线进行处理。
8.根据权利要求1-7中任一项所述的一种基于知识图谱的公共交通出行人群画像分析方法的分析系统,其特征在于,包括:
构建模块,用于基于单一交通出行方式的管理业务系统,构建单一交通知识图谱和基于多个单一交通的知识图谱,构建多层级交通出行方式知识图谱;
可视化模块,用于对多层级交通出行方式知识图谱进行优化,获得可视化公共交通出行人群画像知识图谱。
9.根据权利要求8所述的分析系统,其特征在于,所述构建模块包括预训练单元,所述预训练单元,用于优化多层级交通出行方式知识图谱。
10.根据权利要求8所述的分析系统,其特征在于,所述可视化模块包括:
布局单元,对多层级交通出行方式知识图谱的层级数据进行布局;
配置单元,对多层级交通出行方式知识图谱的布局参数进行配置;
降噪单元,对多层级交通出行方式知识图谱进行视觉降噪。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310828534.2A CN116796006B (zh) | 2023-07-07 | 2023-07-07 | 基于知识图谱的公共交通出行人群画像分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310828534.2A CN116796006B (zh) | 2023-07-07 | 2023-07-07 | 基于知识图谱的公共交通出行人群画像分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116796006A true CN116796006A (zh) | 2023-09-22 |
CN116796006B CN116796006B (zh) | 2024-01-23 |
Family
ID=88040019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310828534.2A Active CN116796006B (zh) | 2023-07-07 | 2023-07-07 | 基于知识图谱的公共交通出行人群画像分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116796006B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021107444A1 (ko) * | 2019-11-25 | 2021-06-03 | 주식회사 데이터마케팅코리아 | 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치 |
CN114936287A (zh) * | 2022-01-30 | 2022-08-23 | 阿里云计算有限公司 | 预训练语言模型的知识注入方法和相应的交互系统 |
CN114969263A (zh) * | 2022-06-01 | 2022-08-30 | 北方工业大学 | 一种城市交通知识图谱的构建方法、构建装置及应用 |
CN115114533A (zh) * | 2022-07-20 | 2022-09-27 | 北方工业大学 | 基于知识图谱的公共交通出行用户画像构建方法及系统 |
-
2023
- 2023-07-07 CN CN202310828534.2A patent/CN116796006B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021107444A1 (ko) * | 2019-11-25 | 2021-06-03 | 주식회사 데이터마케팅코리아 | 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치 |
CN114936287A (zh) * | 2022-01-30 | 2022-08-23 | 阿里云计算有限公司 | 预训练语言模型的知识注入方法和相应的交互系统 |
CN114969263A (zh) * | 2022-06-01 | 2022-08-30 | 北方工业大学 | 一种城市交通知识图谱的构建方法、构建装置及应用 |
CN115114533A (zh) * | 2022-07-20 | 2022-09-27 | 北方工业大学 | 基于知识图谱的公共交通出行用户画像构建方法及系统 |
Non-Patent Citations (1)
Title |
---|
梁泉;翁剑成;林鹏飞;周伟;荣建;: "基于个体出行图谱的公共交通通勤行为辨别方法研究", 交通运输系统工程与信息, vol. 18, no. 02, pages 100 - 106 * |
Also Published As
Publication number | Publication date |
---|---|
CN116796006B (zh) | 2024-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111506688B (zh) | 一种铁路客运车站多源数据可视化集成展示方法 | |
CN114363842B (zh) | 基于手机信令数据的公交乘客下车站点预测方法及装置 | |
Wei et al. | Evolving characteristics of high-speed railway network structure in Yangtze river delta, China: The perspective of passenger flows | |
CN107316094A (zh) | 一种通勤线路挖掘方法及装置 | |
CN110598971A (zh) | 一种基于蚁群算法的响应式公交服务规划方法 | |
Kong et al. | The method and application of big data mining for mobile trajectory of taxi based on MapReduce | |
CN109740957B (zh) | 一种城市交通网络节点分类方法 | |
Sun et al. | Scientometric analysis and mapping of transit-oriented development studies | |
CN114723596A (zh) | 一种基于多源交通出行数据和主题模型的城市功能区识别方法 | |
Verma et al. | Extracting spatiotemporal commuting patterns from public transit data | |
CN114238491A (zh) | 一种基于异质图的多模式交通运行态势关联规则挖掘方法 | |
Zhang et al. | Approximating actual flows in physical infrastructure networks: the case of the Yangtze River Delta high-speed railway network | |
CN109753541A (zh) | 一种关系网络构建方法和装置、计算机可读存储介质 | |
CN116796006B (zh) | 基于知识图谱的公共交通出行人群画像分析方法及系统 | |
Hörold et al. | Analyzing varying environmental contexts in public transport | |
Zhou et al. | Big data for intrametropolitan human movement studies A case study of bus commuters based on smart card data | |
CN108960684B (zh) | 一种基于不完全轨迹片段的公交乘客闭合出行链挖掘方法 | |
CN116452026A (zh) | 一种基于综合交通的交通枢纽功能评价系统 | |
CN110807078A (zh) | 一种服务于民生规划的公民轨迹大数据服务平台 | |
Yue et al. | Estimation markov decision process of multimodal trip chain between integrated transportation hubs in urban agglomeration based on generalized cost | |
Duan et al. | Optimization of urban bus stops setting based on data mining | |
Deutschmann et al. | Assessing transnational human mobility on a global scale | |
CN114666738A (zh) | 基于手机信令的国土空间规划方法和系统 | |
CN114360037A (zh) | 交通接续运输信息系统 | |
CN113850295A (zh) | 一种基于Weighted-LeaderRank和GMM聚类的站点选址预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |