CN116701643A - 基于社会传感数据的人群出行行为解析方法及存储介质 - Google Patents
基于社会传感数据的人群出行行为解析方法及存储介质 Download PDFInfo
- Publication number
- CN116701643A CN116701643A CN202211619843.0A CN202211619843A CN116701643A CN 116701643 A CN116701643 A CN 116701643A CN 202211619843 A CN202211619843 A CN 202211619843A CN 116701643 A CN116701643 A CN 116701643A
- Authority
- CN
- China
- Prior art keywords
- travel
- data
- knowledge
- behavior
- trip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 9
- 230000006399 behavior Effects 0.000 claims abstract description 102
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000012545 processing Methods 0.000 claims abstract description 25
- 230000004927 fusion Effects 0.000 claims abstract description 9
- 238000005516 engineering process Methods 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims description 37
- 230000011664 signaling Effects 0.000 claims description 18
- 238000010276 construction Methods 0.000 claims description 11
- 238000003058 natural language processing Methods 0.000 claims description 9
- 238000007405 data analysis Methods 0.000 claims description 5
- 239000002131 composite material Substances 0.000 claims description 4
- 230000029305 taxis Effects 0.000 claims description 4
- 238000012098 association analyses Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000001537 neural effect Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 230000001953 sensory effect Effects 0.000 claims 1
- 101100100125 Mus musculus Traip gene Proteins 0.000 description 48
- 230000000694 effects Effects 0.000 description 8
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000011835 investigation Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于社会传感数据的人群出行行为解析方法及存储介质,该解析方法包括:获取多源多模态的出行行为数据,抽取其中包含的个人出行行为、个人出行特征以及关系信息特征,将其作为实体、关系、属性,基于知识图谱的特点进行知识融合和知识加工,在构建的人群出行行为知识图谱基础之上进行相应的图处理分析,得到人群出行行为。本发明基于多源多模态数据支持下的出行行为特征协同提取,多模数据相互验证和补充,构建人群出行行为知识图谱,实现多源多模态人群出行数据关联匹配;在知识图谱基础上利用各种图处理技术实现人群出行行为的解析。
Description
技术领域
本发明涉及大数据分析领域,具体的,涉及利用各种社会传感数据对人群出行行为进行解析的方法以及存储介质,能够利用知识图谱基础进行图处理分析解析人群出行行为,实现多模态社会传感数据的有机融合和人群出行的高效检索和人群出行行为的快速解析。
背景技术
人是城市的主体,其生产生活给城市发展带来重要影响,研究人类行为、人类活动等对解决城市发展中的问题有着重大意义。传统对于人类活动、居民出行活动规律调查主要依赖于出行调查数据,这种方式通常需要入户咨询才能获得户主的日常出行信息,人力、物力、财力等成本较高且样本覆盖率较低、时间跨度较长,此数据很难反映当前的城市居民交通出行规律的发展变化。随着移动互联网使用的不断深化,物联网、大数据、人工智能等技术的飞速发展,使人们的生活方式发生了翻天覆地的变化,由此所产生的各种时空大数据如车载GPS数据、手机信令数据、智能卡数据和社会传感数据等为人类行为、活动等研究带来新的契机和挑战,从多源异构数据中挖掘与人类活动相关的信息支撑智慧城市建设也成为当前学者们的研究热点,被广泛应用于城市空间的职住关系分析,居民出行模式分析,公交的运营和管理,城市功能区域分析等领域。
摄像机是当今社会中最常用的一种摄像监控装置,其本身具备明确的空间位置,它可以帮助我们捕捉到人们和人的互动,并从中获取一些重要的信息,例如人的位置、所在环境、外貌、衣着、行动意图等。传统的摄像头只能采集与记录存储视频的作用,主要还是靠工作人员的主观判断和筛选,才能达到监查的目的。这种方法耗时耗力,而且效率低下,仅对摄像头覆盖局部范围有效、误差也不很大。
对于出行行为的解析,目前已有基于AFC等数据的出行规模影响分析,基于意愿调查数据的出行方式、出行目的选择影响分析和基于大数据的出行特征分析技术,使用单一的数据源无法对人群出行行为进行全面的解析和描述,而基于多源数据的应用分析正是目前对人群行为分析需要重点关注和投入的方面。人群出行轨迹数据如手机信令、出租车GPS数据、公共交通IC卡数据等对人群行为的时空关系由很好的揭示,融合人群出行的各种多模态社会传感数据对人群出行行为进行合理解析可对人群出行进行形象而深刻的表征。
可见,现有的人群出行行为解析,由于样本资料的限制,或者单一公共交通出行模式的数据限制,使得以往公共交通出行特征的提取精度不高,忽视了不同个体的行为特征差异,具有局限性和片面性;而在传统公共交通特征挖掘中,对乘客出行时间、换乘特征等出行特征的提取方法却很少,缺少对个体出行规律和特征的精确表征,从而制约了公共交通整体出行规律的深入挖掘。
综合,如何利用不同来源、不同格式的社会传感数据,对人群出行行为进行解析,并且对人群出行信息进行有效融合,实现人群出行信息的高效检索和出行行为的快速解析,成为现有技术亟需解决的技术问题。
发明内容
本发明的目的在于提出一种基于社会传感数据的人群出行行为解析方法及存储介质,利用知识图谱对多模态社会传感数据中人群出行信息进行有效融合,将人群出行行为中的重要因素,即人物、时间、地点、事件等关键信息和信息之间的关联以图的形式进行统一表述,可以实现人群出行信息的高效检索和出行行为的快速解析,为智慧城市等提供理论支撑。
一种基于社会传感数据的人群出行行为解析方法,其特征在于,包括如下步骤:
出行行为数据获取步骤S110:
获取个人出行相关的多源多模态数据,所述多源多模态数据是与个人出行相关的半结构化、非结构化数据以及结构化数据,例如主要包括手机信令数据、GPS轨迹数据、位置签到数据、能判定位置的视频和文本数据等;
出行行为知识抽取步骤S120:
通过所述多源多模态数据抽取提取实体、关系、属性信息,其中所述实体信息为个人出行行为信息,包括人物、时间、地点和事件,所述属性信息为个人出行特征,包括出行时长、出行距离、出行方式和出行目的,所述关系信息为社会关系,包括社会关系和出行关系,所述社会关系包括亲属、朋友,所述出行关系包括伴随、同城;
知识图谱构建步骤S130:
针对知识抽取后的结果,即实体、关系、属性信息进行知识融合和知识加工,从而构建人群出行行为知识图谱;
人群出行行为解析步骤S140:
利用所构建的人群出行行为知识图谱进行图处理分析以解析人群出行行为,所述图处理分析包括:图查询分析、图特征统计、关联分析、节点分类。
可选的,在出行行为数据获取步骤S110中,
所述半结构化、非结构化数据包括隐含位置信息的摄像监控所拍摄的视频,微博、微信上发表的图片、文本数据;所述结构化数据包括:手机信令、车辆GPS轨迹、公共交通刷卡、POI,即半结构化、非结构化数据以及结构化数据属于多模态社会传感数据。
可选的,在出行行为知识抽取步骤S120中,
抽取个人出行行为信息具体为:将多源多模态数据中个人出行相关信息进行提取,提取的个人出行相关信息包括人物、时间、地点、事件。
可选的,在抽取个人出行行为信息中,
对于半结构化、非结构化数据信息提取:针对视频、图片,采用基于深度学习的图片、视频分析方法,抽取视频、图片中的人物、时间、地点、事件信息;针对微博、微信的文本数据、采用自然语言处理方法,提取文本数据中的人物、时间、地点、事件信息;
对于结构化数据信息提取:针对手机信令数据、车辆GPS数据和公共交通刷卡数据,采用大数据处理分析技术提取各种出行结构化数据中的人物、时间、地点信息。
在出行行为知识抽取步骤S120中,
抽取个人出行特征具体为:针对个人出行相关信息中的人物、时间、地点、事件进行数据分析、处理与建模,提取/估算个人出行特征,并作为个人出行的属性进行存储,包括出行时长、出行距离、出行方式和出行目的。
出行时长建模提取为:通过匹配出租车乘客、公交地铁乘客的上下车时间和GPS时间,以及手机用户的轨迹、停滞点来确定乘客、用户的出行时间,计算到达时间与出发时间的差值来确定出行时长;
出行距离建模提取为:出行距离包括空间中的直线距离和道路距离,所述直线距离通过经纬度直接计算两点之间距离,所述道路距离调用百度地图API计算两点之间道路距离;
出行方式建模提取为:通过手机信令数据和调用地图导航数据进行匹配,通过同一时间段的起始点、终点以及同一时间段的步行、公交、驾车、骑行的出行方式的导航路径与个人轨迹数据的路径匹配和时间匹配程度,综合对比判别个人出行方式;所述出行方式包括单一出行方式和复合出行方式,具体每种出行方式包括步行、自行车、摩托车、私人小汽车、出租车和公共交通;
出行目的建模提取为:基于自然语言处理提取微博数据中的用户出行目,所述出行目的包括工作出行、上学出行、业务出行、购物出行、生活出行、文娱、游憩和回程。
抽取关系信息具体为:基于自然语言处理、机器学习,针对多源多模态数据抽取实体间的关系。
可选的,所述知识融合为:将半结构化数据和非结构化数据抽取的实体、关系、属性信息以结构化方式存储,并与结构化数据提取的实体、关系、属性信息以结构化方式进行合并和存储,形成结构化三元组数据;
所述知识加工,包括本体构建,知识推理;
其中,所述本体构建为:采用数据驱动的自动化本体构建,主要包括:实体并列关系相似度计算、实体上下位关系抽取以及本体的生成;
所述知识推理为:基于知识库中已有的实体关系数据,经过计算机推理,建立实体间的新关联,从而丰富人群出行行为网络,运用基于知识图谱的推理方法,将知识库终点额实体表达为词向量的形式,然后采用神经张量网络模型进行关系推理;
所述构建人群出行行为知识图谱为:使用结构化三元组数据实现。将三元组中的实体存储为对应节点,关系存储为对应边,属性存储为对应节点及边的属性。将定义好的实体节点和关系存储到知Neo4j图数据库中实现知识图谱的可视化展示,其不仅可以显示完整的知识图谱,还可以显示出知识图谱的部分子图。
本发明进一步公开了一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行上述的基于社会传感数据的人群出行行为解析方法。
本发明具有如下的优点:
1、多源多模态数据支持下的出行行为特征协同提取。针对视频、手机信令、公共交通刷卡、车辆GPS定位、POI等多种多模态社会传感数据进行提取、相互验证和补充,从而得到个人出行行为特征数据。
2、利用知识图谱实现人群出行多源多模态数据的数据关联匹配。通过抽取多源多模态视频、手机信令、公共交通刷卡、车辆GPS定位、POI等人群出行行为信息和出行特征信息,以“实体、关系、属性”方式存储,构建人群出行行为知识图谱,实现多源多模态人群出行数据关联匹配。
3、通过个人出行信息、出行特征、实体间的关系构建人群出行知识图谱,在知识图谱基础上利用各种图处理技术实现人群出行行为的解析。
附图说明
图1是根据本发明具体实施例的基于社会传感数据的人群出行行为解析方法的流程图;
图2是根据本发明具体实施例的基于社会传感数据的人群出行行为解析方法的数据流示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本发明在于,获取多源多模态的出行行为数据,抽取其中包含的个人出行行为、个人出行特征以及关系信息特征,将其作为实体、关系、属性,基于知识图谱的特点进行知识融合和知识加工,在构建的人群出行行为知识图谱基础之上进行相应的图处理分析,得到人群出行行为。
具体的,参见图1、图2,分别示出了根据本发明的基于社会传感数据的人群出行行为解析方法的流程图和数据流示意图。
该方法具体包括如下步骤:
出行行为数据获取步骤S110:
获取个人出行相关的多源多模态数据,所述多源多模态数据是与个人出行相关的半结构化、非结构化数据以及结构化数据,例如主要包括手机信令数据、GPS轨迹数据、位置签到数据、能判定位置的视频和文本数据等。
在一个具体的实施例中,所述半结构化、非结构化数据包括隐含位置信息的摄像监控所拍摄的视频,微博、微信上发表的图片、文本数据;所述结构化数据包括:手机信令、车辆GPS轨迹、公共交通刷卡、POI。即半结构化、非结构化数据以及结构化数据属于多模态社会传感数据。
出行行为知识抽取步骤S120:
通过所述多源多模态数据抽取提取实体、关系、属性等信息,其中所述实体信息为个人出行行为信息,包括人物、时间、地点和事件,所述属性信息为个人出行特征,包括出行时长、出行距离、出行方式和出行目的,所述关系信息为社会关系,包括社会关系和出行关系,所述社会关系包括亲属、朋友,所述出行关系包括伴随、同城。
具体的,
抽取个人出行行为信息具体为:将多源多模态数据中个人出行相关信息进行提取,提取的个人出行相关信息包括人物、时间、地点、事件;
其中,对于半结构化、非结构化数据信息提取:针对视频、图片,采用基于深度学习的图片、视频分析方法,运用物体检测、物体识别、图像识别等方式抽取视频、图片等数据中的人物、时间、地点、事件信息;针对微博、微信的文本数据、采用自然语言处理方法,运用关键词提取、语义解析、语义相似度计算、潜在主题分析等方式提取文本数据中的人物、时间、地点、事件信息。
对于结构化数据信息提取:针对手机信令数据、车辆GPS数据和公共交通刷卡数据,采用大数据处理分析技术,运用Python语言、数据分析、地理分析等方式提取各种出行结构化数据中的人物、时间、地点信息。
抽取个人出行特征具体为:针对个人出行相关信息中的人物、时间、地点、事件进行数据分析、处理与建模,提取/估算个人出行特征,并作为个人出行的属性进行存储,包括出行时长、出行距离、出行方式和出行目的。
出行时长建模提取为:出行时长是个人出行的必要时间衡量因素,不同的时间段具有不同的人群出行规律。在一个实施例中,通过匹配出租车乘客、公交地铁乘客的上下车时间和GPS时间,以及手机用户的轨迹、停滞点等来确定乘客、用户的出行时间,计算到达时间与出发时间的差值来确定出行时长。
出行距离建模提取为:出行距离是个人出行的空间衡量因素,出行距离包括空间中的直线距离和道路距离,在一个实施例中,直线距离不受道路约束,通过经纬度可直接计算两点之间距离;道路距离需考虑路网因素,可调用百度地图API计算两点之间道路距离。
出行方式建模提取为:出行方式是个人出行所采用的方法或使用的交通工具,是个人出行重要特征之一。有单一出行方式和复合出行方式,单一出行方式即一次出行只有一种出行方式,或虽然使用一种方式,但用其中一种主要方式进行表述,复合出行方式即列出一次出行所使用的所有方式。出行方式包括步行、自行车、摩托车、私人小汽车、出租车、公共交通等。
在一个实施例中,通过手机信令数据和调用地图导航数据进行匹配,由于手机信令数据记载着个人出行轨迹中各个时间段内的起点(O)、停驻点和终点(D),判别同一OD即起讫点。判别同一OD、同一时间步行、公交、驾车、骑行等出行方式的导航路径与个人轨迹数据的路径匹配和时间匹配程度,综合对比判别个人出行方式。
出行目的建模提取为:出行目的为出行活动发生的原因,为个人出行的重要特征之一,主要包括工作出行、上学出行、业务出行、购物出行、生活出行、文娱、游憩、回程等。本发明的出行目的主要包括上班出行、上学出行、回家、购物娱乐出行和其他出行,在一个实施例中,基于自然语言处理提取微博数据中的用户出行目的,具体包括对内容进行数据清洗、中文分词和去除停用词,对文本进行向量化后再进行聚类,建立LDA主题模型对不用类别的出行目的定义类别标签,最后利用LSTM神经网络模型实现对基于微博数据的个人不同出行目的的识别。
抽取关系信息具体为:基于自然语言处理、机器学习,针对多源多模态数据抽取实体间的关系。
知识图谱构建步骤S130:
针对知识抽取后的结果,即实体、关系、属性信息进行知识融合和知识加工,从而构建人群出行行为知识图谱。
所述知识融合为:将半结构化数据和非结构化数据抽取的实体、关系、属性信息以结构化方式存储,并与结构化数据提取的实体、关系、属性信息以结构化方式进行合并和存储,形成结构化三元组数据;
所述知识加工,包括本体构建,知识推理;
其中,所述本体构建为:采用数据驱动的自动化本体构建,主要包括:实体并列关系相似度计算、实体上下位关系抽取以及本体的生成;
所述知识推理为:基于知识库中已有的实体关系数据,经过计算机推理,建立实体间的新关联,从而丰富人群出行行为网络,运用基于知识图谱的推理方法,将知识库终点额实体表达为词向量的形式,然后采用神经张量网络模型进行关系推理;
所述构建人群出行行为知识图谱为:使用结构化三元组数据实现。将三元组中的实体存储为对应节点,关系存储为对应边,属性存储为对应节点及边的属性。将定义好的实体节点和关系存储到Neo4j图数据库中实现知识图谱的可视化展示,其不仅可以显示完整的知识图谱,还可以显示出知识图谱的部分子图。
人群出行行为解析步骤S140:
利用所构建的人群出行行为知识图谱进行图处理分析以解析人群出行行为,所述图处理分析包括:图查询分析、图特征统计、关联分析、节点分类等。
参见表1,示出了根据本发明的人群出行行为解析方法的具体示例,
表1方法使用效果示例
本发明进一步公开了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时执行上述的基于社会传感数据的人群出行行为解析方法。
本发明具有如下的优点:
1、多源多模态数据支持下的出行行为特征协同提取。针对视频、手机信令、公共交通刷卡、车辆GPS定位、POI等5种多模态社会传感数据进行提取、相互验证和补充,从而得到个人出行行为特征数据。
2、利用知识图谱实现人群出行多源多模态数据的数据关联匹配。通过抽取多源多模态视频、手机信令、公共交通刷卡、车辆GPS定位、POI等人群出行行为信息和出行特征信息,以“实体、关系、属性”方式存储,构建人群出行行为知识图谱,实现多源多模态人群出行数据关联匹配。
3、通过个人出行信息、出行特征、实体间的关系构建人群出行知识图谱,在知识图谱基础上利用各种图处理技术实现人群出行行为的解析。
显然,本领域技术人员应该明白,上述的本发明的各单元或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。
Claims (9)
1.一种基于社会传感数据的人群出行行为解析方法,其特征在于,包括如下步骤:
出行行为数据获取步骤S110:
获取个人出行相关的多源多模态数据,所述多源多模态数据是与个人出行相关的半结构化、非结构化数据以及结构化数据;
出行行为知识抽取步骤S120:
通过所述多源多模态数据抽取提取实体、关系、属性信息,其中所述实体信息为个人出行行为信息,包括人物、时间、地点和事件,所述属性信息为个人出行特征,包括出行时长、出行距离、出行方式和出行目的,所述关系信息为社会关系,包括社会关系和出行关系,所述社会关系包括亲属、朋友,所述出行关系包括伴随、同城;
知识图谱构建步骤S130:
针对知识抽取后的结果,即实体、关系、属性信息进行知识融合和知识加工,从而构建人群出行行为知识图谱;
人群出行行为解析步骤S140:
利用所构建的人群出行行为知识图谱进行图处理分析以解析人群出行行为,所述图处理分析包括:图查询分析、图特征统计、关联分析、节点分类。
2.根据权利要求1所述的人群出行行为解析方法,其特征在于,
在出行行为数据获取步骤S110中,
所述半结构化、非结构化数据包括隐含位置信息的摄像监控所拍摄的视频,微博、微信上发表的图片、文本数据;所述结构化数据包括:手机信令、车辆GPS轨迹、公共交通刷卡、POI,即半结构化、非结构化数据以及结构化数据属于多模态社会传感数据。
3.根据权利要求2所述的人群出行行为解析方法,其特征在于,
在出行行为知识抽取步骤S120中,
抽取个人出行行为信息具体为:将多源多模态数据中个人出行相关信息进行提取,提取的个人出行相关信息包括人物、时间、地点、事件。
4.根据权利要求3所述的人群出行行为解析方法,其特征在于,
在抽取个人出行行为信息中,
对于半结构化、非结构化数据信息提取:针对视频、图片,采用基于深度学习的图片、视频分析方法,抽取视频、图片中的人物、时间、地点、事件信息;针对微博、微信的文本数据、采用自然语言处理方法,提取文本数据中的人物、时间、地点、事件信息;
对于结构化数据信息提取:针对手机信令数据、车辆GPS数据和公共交通刷卡数据,采用大数据处理分析技术提取各种出行结构化数据中的人物、时间、地点信息。
5.根据权利要求2所述的人群出行行为解析方法,其特征在于,
在出行行为知识抽取步骤S120中,
抽取个人出行特征具体为:针对个人出行相关信息中的人物、时间、地点、事件进行数据分析、处理与建模,提取/估算个人出行特征,并作为个人出行的属性进行存储,包括出行时长、出行距离、出行方式和出行目的。
6.根据权利要求5所述的人群出行行为解析方法,其特征在于,
在出行行为知识抽取步骤S120中,
出行时长建模提取为:通过匹配出租车乘客、公交地铁乘客的上下车时间和GPS时间,以及手机用户的轨迹、停滞点来确定乘客、用户的出行时间,计算到达时间与出发时间的差值来确定出行时长;
出行距离建模提取为:出行距离包括空间中的直线距离和道路距离,所述直线距离通过经纬度直接计算两点之间距离,所述道路距离调用百度地图API计算两点之间道路距离;
出行方式建模提取为:通过手机信令数据和调用地图导航数据进行匹配,通过同一时间段的起始点、终点以及同一时间段的步行、公交、驾车、骑行的出行方式的导航路径与个人轨迹数据的路径匹配和时间匹配程度,综合对比判别个人出行方式;所述出行方式包括单一出行方式和复合出行方式,具体每种出行方式包括步行、自行车、摩托车、私人小汽车、出租车和公共交通;
出行目的建模提取为:基于自然语言处理提取微博数据中的用户出行目,所述出行目的包括工作出行、上学出行、业务出行、购物出行、生活出行、文娱、游憩和回程。
7.根据权利要求2所述的人群出行行为解析方法,其特征在于,
在出行行为知识抽取步骤S120中,
抽取关系信息具体为:基于自然语言处理、机器学习,针对多源多模态数据抽取实体间的关系。
8.根据权利要求2所述的人群出行行为解析方法,其特征在于,
在知识图谱构建步骤S130中,
所述知识融合为:将半结构化数据和非结构化数据抽取的实体、关系、属性信息以结构化方式存储,并与结构化数据提取的实体、关系、属性信息以结构化方式进行合并和存储,形成结构化三元组数据;
所述知识加工,包括本体构建,知识推理;
其中,所述本体构建为:采用数据驱动的自动化本体构建,主要包括:实体并列关系相似度计算、实体上下位关系抽取以及本体的生成;
所述知识推理为:基于知识库中已有的实体关系数据,经过计算机推理,建立实体间的新关联,从而丰富人群出行行为网络,运用基于知识图谱的推理方法,将知识库终点额实体表达为词向量的形式,然后采用神经张量网络模型进行关系推理;
所述构建人群出行行为知识图谱为:使用结构化三元组数据实现。将三元组中的实体存储为对应节点,关系存储为对应边,属性存储为对应节点及边的属性,将定义好的实体节点和关系存储到Neo4j图数据库中实现知识图谱的可视化展示,既能够显示完整的知识图谱,还能够显示出知识图谱的部分子图。
9.一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行权利要求1-8中任意一项所述的基于社会传感数据的人群出行行为解析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211619843.0A CN116701643B (zh) | 2022-12-15 | 2022-12-15 | 基于社会传感数据的人群出行行为解析方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211619843.0A CN116701643B (zh) | 2022-12-15 | 2022-12-15 | 基于社会传感数据的人群出行行为解析方法及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116701643A true CN116701643A (zh) | 2023-09-05 |
CN116701643B CN116701643B (zh) | 2024-07-02 |
Family
ID=87836286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211619843.0A Active CN116701643B (zh) | 2022-12-15 | 2022-12-15 | 基于社会传感数据的人群出行行为解析方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116701643B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107229708A (zh) * | 2017-05-27 | 2017-10-03 | 科技谷(厦门)信息技术有限公司 | 一种个性化出行服务大数据应用系统及方法 |
CN109697233A (zh) * | 2018-12-03 | 2019-04-30 | 中电科大数据研究院有限公司 | 一种知识图谱体系搭建方法 |
CN112182410A (zh) * | 2020-11-05 | 2021-01-05 | 西南交通大学 | 基于时空轨迹知识图谱的用户出行模式挖掘方法 |
WO2021196520A1 (zh) * | 2020-03-30 | 2021-10-07 | 西安交通大学 | 一种面向税务领域知识图谱的构建方法及系统 |
CN114066431A (zh) * | 2022-01-10 | 2022-02-18 | 成都同步新创科技股份有限公司 | 一种基于四维出行模型的人员活动图谱实现方法 |
CN115114533A (zh) * | 2022-07-20 | 2022-09-27 | 北方工业大学 | 基于知识图谱的公共交通出行用户画像构建方法及系统 |
CN115292507A (zh) * | 2022-06-28 | 2022-11-04 | 北京北大千方科技有限公司 | 基于知识图谱的交通出行分析方法、装置、设备及介质 |
CN115391547A (zh) * | 2022-06-29 | 2022-11-25 | 上海大学 | 多模态文物知识图谱构建方法、装置及系统和存储介质 |
CN117313849A (zh) * | 2023-10-12 | 2023-12-29 | 湖北华中电力科技开发有限责任公司 | 一种基于多源异构数据融合技术的能源行业知识图谱构建方法及装置 |
-
2022
- 2022-12-15 CN CN202211619843.0A patent/CN116701643B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107229708A (zh) * | 2017-05-27 | 2017-10-03 | 科技谷(厦门)信息技术有限公司 | 一种个性化出行服务大数据应用系统及方法 |
CN109697233A (zh) * | 2018-12-03 | 2019-04-30 | 中电科大数据研究院有限公司 | 一种知识图谱体系搭建方法 |
WO2021196520A1 (zh) * | 2020-03-30 | 2021-10-07 | 西安交通大学 | 一种面向税务领域知识图谱的构建方法及系统 |
CN112182410A (zh) * | 2020-11-05 | 2021-01-05 | 西南交通大学 | 基于时空轨迹知识图谱的用户出行模式挖掘方法 |
CN114066431A (zh) * | 2022-01-10 | 2022-02-18 | 成都同步新创科技股份有限公司 | 一种基于四维出行模型的人员活动图谱实现方法 |
CN115292507A (zh) * | 2022-06-28 | 2022-11-04 | 北京北大千方科技有限公司 | 基于知识图谱的交通出行分析方法、装置、设备及介质 |
CN115391547A (zh) * | 2022-06-29 | 2022-11-25 | 上海大学 | 多模态文物知识图谱构建方法、装置及系统和存储介质 |
CN115114533A (zh) * | 2022-07-20 | 2022-09-27 | 北方工业大学 | 基于知识图谱的公共交通出行用户画像构建方法及系统 |
CN117313849A (zh) * | 2023-10-12 | 2023-12-29 | 湖北华中电力科技开发有限责任公司 | 一种基于多源异构数据融合技术的能源行业知识图谱构建方法及装置 |
Non-Patent Citations (2)
Title |
---|
GENTLEWEI: "知识图谱学习笔记(一):基础概念", 《HTTPS://BLOG.CSDN.NET/GENTLEWEI/ARTICLE/DETAILS/104379775》, 18 February 2020 (2020-02-18), pages 1 - 9 * |
项威;: "事件知识图谱构建技术与应用综述", 计算机与现代化, no. 01, 15 January 2020 (2020-01-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN116701643B (zh) | 2024-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Prelipcean et al. | Transportation mode detection–an in-depth review of applicability and reliability | |
Zhao et al. | Spatio-temporal analysis of passenger travel patterns in massive smart card data | |
Yan et al. | Semantic trajectories: Mobility data computation and annotation | |
Yan et al. | SeMiTri: a framework for semantic annotation of heterogeneous trajectories | |
Renso et al. | How you move reveals who you are: understanding human behavior by analyzing trajectory data | |
Deng et al. | Geospatial big data: New paradigm of remote sensing applications | |
Xiao et al. | Detecting travel modes from smartphone-based travel surveys with continuous hidden Markov models | |
Gao | Geospatial artificial intelligence (GeoAI) | |
Ebrahimpour et al. | Comparison of main approaches for extracting behavior features from crowd flow analysis | |
Balduini et al. | Models and practices in urban data science at scale | |
Rodrigues et al. | Combining taxi and social media data to explore urban mobility issues | |
Wang et al. | Online detection of abnormal passenger out-flow in urban metro system | |
CN112188167B (zh) | 基于5g边云计算的视频浓缩萃取精炼升华的方法和系统 | |
CN112418696A (zh) | 城市交通动态知识图谱的构建方法及装置 | |
Rodrigues et al. | Smaframework: Urban data integration framework for mobility analysis in smart cities | |
CN115114533A (zh) | 基于知识图谱的公共交通出行用户画像构建方法及系统 | |
Wang et al. | AI and deep learning for urban computing | |
Yousfi et al. | Smart big data framework for insight discovery | |
Zhou et al. | The smartphone-based person travel survey system: data collection, trip extraction, and travel mode detection | |
CN116701643B (zh) | 基于社会传感数据的人群出行行为解析方法及存储介质 | |
Liu et al. | Using trajectory data to explore roadway characterization for bikeshare network | |
Chen et al. | Traffic travel pattern recognition based on sparse global positioning system trajectory data | |
Nogueira | A framework for automatic annotation of semantic trajectories | |
CN114386415A (zh) | 数图融合库构建方法及相关设备 | |
da Costa Albuquerque et al. | A proactive application to monitor truck fleets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |