CN115455130A - 一种社交媒体数据与移动轨迹数据的融合方法 - Google Patents
一种社交媒体数据与移动轨迹数据的融合方法 Download PDFInfo
- Publication number
- CN115455130A CN115455130A CN202211403639.5A CN202211403639A CN115455130A CN 115455130 A CN115455130 A CN 115455130A CN 202211403639 A CN202211403639 A CN 202211403639A CN 115455130 A CN115455130 A CN 115455130A
- Authority
- CN
- China
- Prior art keywords
- social media
- data
- vector
- information
- media data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种社交媒体数据与移动轨迹数据的融合方法,首先采用BiGRU模型计算移动轨迹特征向量,有效的利用移动轨迹数据;然后通过胶囊网络模型提取社交媒体信息的高级特征向量;最后采用马氏距离法判断向量间距离并利用基于参数矩阵融合的方法进行融合,获得移动轨迹数据与社交媒体数据融合向量,解决单一数据源对于人物群体行为分析存在局限性问题。
Description
技术领域
本发明涉及智慧城市技术领域,具体的,涉及一种社交媒体数据与移动轨迹数据的融合方法及其存储介质。
背景技术
随着城市规模不断扩大,城市人口显著增加,社会公共场所中如大型集会、演唱会等因群体行为异常导致拥堵或踩踏事件,造成社会财产的损失,严重危及公民的生命安全。
单一数据源对于人物群体行为分析存在一定局限性。人群移动轨迹数据定位准确,可发现城市范围内人群流量异常,但缺乏相关语义信息;社交媒体数据量丰富,包含清楚语义信息,但缺少准确定位信息。考虑到人群移动轨迹数据与社交媒体数据的优势与不足,通过融合不同数据源,对人物群体行为与事件演变精准分析,及时发现异常行为并有效疏导,防止事态进一步恶化,减轻或消除公共安全事件造成的危害与损失,有效支撑城市管理与应急指挥决策。
因此,如何综合社交媒体数据与移动轨迹数据从而准确分析人群行为,及时分析异常行为成为现有技术亟需解决的技术问题。
发明内容
本发明的目的在于针对城市群体行为模式分析受制于社会传感数据与社交媒体数据协同表达缺乏问题,提出一种社交媒体数据与移动轨迹数据的融合方法,探索城市群体行为演化规律,有助于城市管理信息智能化服务。
为达此目的,本发明采用以下技术方案:
一种社交媒体数据与移动轨迹数据的融合方法,其特征在于,包括如下步骤:
移动轨迹数据处理步骤S110:
对群体每个人物行程轨迹点数据进行预处理,将预处理后的轨迹点匹配至路网中还原每个人物行程的移动轨迹,采用BiGRU模型计算移动轨迹特征向量,以表征移动轨迹数据;
社交媒体数据处理步骤S120:
对社交媒体数据预处理,然后对文本向量化以获得文本特征向量,并通过胶囊网络模型提取社交媒体信息的高级特征向量,以表征社交媒体数据;
计算数据距离并融合数据步骤S130:
通过马氏距离法计算在步骤S110中所获得的移动轨迹特征向量与在步骤S120中所提取的社交媒体的高级特征向量间的距离,对于每个移动轨迹特征向量,计算得到与其距离最小的社交媒体的高级特征向量,并采用基于参数矩阵融合的方法对该距离最小的每对向量进行融合。
可选的,在步骤S110中,所述对群体每个人物行程轨迹点数据进行预处理包括:删除无效、异常轨迹点。
可选的,在步骤S110中,所述BiGRU模型为一种双向的改进的循环神经网络。
其中,为移动轨迹输入,为重置门的权重矩阵,为更新门的权重矩阵,为现在信息的权重矩阵,为逐元素相乘,为sigmoid函数,为双曲正切函数,现在信息由过去信息与当前输入共同决定,为时刻的信息输出,包含过去信息和现在信息,更新门用来控制当前的状态需要遗忘多少历史信息和接受多少新信息,重置门用来控制候选状态中有多少信息是从历史信息中得到;
可选的,在步骤S120中,所述社交媒体数据预处理为:过滤掉无关信息,采用正则表达式删除标点符号和删除空格,在文本数据中引入领域词典,对数据作分词处理。
可选的,在步骤S120中,通过胶囊网络模型提取社交媒体信息的高级特征向量具体为:
可选的,在步骤S130中,对S110中每个提取的移动轨迹数据向量,通过马氏距离法计算与S120每个社交媒体数据向量间距离。首先计算与每个社交媒体数据向量间的距离,对计算的距离,…,,按从小到大排序,选择距离最小的一对向量进行融合, 然后计算并选择与距离最小的向量,循环至结束。
其中所述马氏距离法如下式:
可选的,在步骤S130中,所述参数矩阵融合如下式:
本发明进一步公开了一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行上述的社交媒体数据与移动轨迹数据的融合方法。
本发明具有如下优点:
1)由于本发明采用BiGRU模型,通过两个门控单元可以捕捉移动轨迹序列里的依赖关系,更好地提取移动轨迹向量。
2)由于本发明采用胶囊网络,使用动态路由算法减少了卷积神经网络中数据在传播过程中带来的损失,有效的利用社交媒体信息。
3)由于本发明采用马氏距离法计算向量间距离并基于参数矩阵的方法进行融合,可以更准确的融合移动轨迹数据与社交媒体数据,解决单一数据源对于人物群体行为分析存在局限性问题。
附图说明
图1 是根据本发明具体实施例的社交媒体数据与移动轨迹数据的融合方法的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本发明在于采用BiGRU(Bi-Gate Recurrent Unit)模型计算移动轨迹特征向量,有效的利用移动轨迹数据;采用胶囊网络模型提取社交媒体信息的特征向量;最后通过马氏距离法(Mahalanobis Distance)判断向量间距离并利用基于参数矩阵融合的方法进行融合,获得社交媒体数据与移动轨迹数据的融合向量,解决单一数据源对于人物群体行为分析存在局限性问题。
具体的,参见图1,示出了本发明的社交媒体数据与移动轨迹数据的融合方法的流程图,包括如下步骤:
移动轨迹数据处理步骤S110:
对群体每个人物行程轨迹点数据进行预处理,将预处理后的轨迹点匹配至路网中还原每个人物行程的移动轨迹,采用BiGRU模型计算移动轨迹特征向量,以表征移动轨迹数据。
所述对群体每个人物行程轨迹点数据进行预处理包括:删除无效、异常轨迹点。
其中,所述BiGRU模型为一种双向的改进的循环神经网络。
其中,为移动轨迹输入,为重置门的权重矩阵,为更新门的权重矩阵,为现在信息的权重矩阵,为逐元素相乘,为sigmoid函数,为双曲正切函数,现在信息由过去信息与当前输入共同决定,为时刻的信息输出,包含过去信息和现在信息,更新门用来控制当前的状态需要遗忘多少历史信息和接受多少新信息,重置门用来控制候选状态中有多少信息是从历史信息中得到;
社交媒体数据处理步骤S120:
对社交媒体数据预处理,然后对文本向量化以获得文本特征向量,并通过胶囊网络模型提取社交媒体信息的高级特征向量,以表征社交媒体数据。
其中,所述社交媒体数据预处理为:过滤掉无关信息,采用正则表达式删除标点符号和删除空格,在文本数据中引入领域词典,对数据作分词处理。
具体的,通过胶囊网络模型提取社交媒体信息的高级特征向量具体为:
计算数据距离并融合数据步骤S130:
通过马氏距离法计算在步骤S110中所获得的移动轨迹特征向量与在步骤S120中所提取的社交媒体的高级特征向量间的距离,对于每个移动轨迹特征向量,计算得到与其距离最小的社交媒体的高级特征向量,并采用基于参数矩阵融合的方法对该距离最小的每对向量进行融合。
具体的,在步骤S130中,对S110中每个提取的移动轨迹数据向量,通过马氏距离法计算与S120每个社交媒体数据向量间距离。首先计算与每个社交媒体数据向量间的距离,对计算的距离,…,,按从小到大排序,选择距离最小的一对向量进行融合, 然后计算并选择与距离最小的向量,循环至结束。
其中所述马氏距离法如下式:
具体的,在步骤S130中,所述参数矩阵融合如下式:
进一步的,本发明还公开了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时执行上述的社交媒体数据与移动轨迹数据的融合方法。
本发明提供的社交媒体数据与移动轨迹数据的融合方法,与现有技术相比,具有如下优势:
1)由于本发明采用BiGRU模型,通过两个门控单元可以捕捉移动轨迹序列里的依赖关系,更好地提取移动轨迹向量。
2)由于本发明采用胶囊网络,使用动态路由算法减少了卷积神经网络中数据在传播过程中带来的损失,有效的利用社交媒体信息。
3)由于本发明采用马氏距离法计算向量间距离并基于参数矩阵的方法进行融合,可以更准确的融合移动轨迹数据与社交媒体数据,解决单一数据源对于人物群体行为分析存在局限性问题。
显然,本领域技术人员应该明白,上述的本发明的各单元或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。
Claims (9)
1.一种社交媒体数据与移动轨迹数据的融合方法,其特征在于,包括如下步骤:
移动轨迹数据处理步骤S110:
对群体每个人物行程轨迹点数据进行预处理,将预处理后的轨迹点匹配至路网中还原每个人物行程的移动轨迹,采用BiGRU模型计算移动轨迹特征向量,以表征移动轨迹数据;
社交媒体数据处理步骤S120:
对社交媒体数据预处理,然后对文本向量化以获得文本特征向量,并通过胶囊网络模型提取社交媒体信息的高级特征向量,以表征社交媒体数据;
计算数据距离并融合数据步骤S130:
通过马氏距离法计算在步骤S110中所获得的移动轨迹特征向量与在步骤S120中所提取的社交媒体的高级特征向量间的距离,对于每个移动轨迹特征向量,计算得到与其距离最小的社交媒体的高级特征向量,并采用基于参数矩阵融合的方法对距离最小的每对向量进行融合。
2.根据权利要求1所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
在步骤S110中,所述对群体每个人物行程轨迹点数据进行预处理包括:删除无效、异常轨迹点。
3.根据权利要求1所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
在步骤S110中,所述BiGRU模型为一种双向的改进的循环神经网络。
4.根据权利要求3所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
其中,为移动轨迹输入,为重置门的权重矩阵,为更新门的权重矩阵,为现在信息的权重矩阵,为逐元素相乘,为sigmoid函数,为双曲正切函数,现在信息由过去信息与当前输入共同决定,为时刻的信息输出,包含过去信息和现在信息,更新门用来控制当前的状态需要遗忘多少历史信息和接受多少新信息,重置门用来控制候选状态中有多少信息是从历史信息中得到;
5.根据权利要求1所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
在步骤S120中,所述社交媒体数据预处理为:过滤掉无关信息,采用正则表达式删除标点符号和删除空格,在文本数据中引入领域词典,对数据作分词处理。
9.一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行权利要求1-8中任意一项所述的社交媒体数据与移动轨迹数据的融合方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211403639.5A CN115455130B (zh) | 2022-11-10 | 2022-11-10 | 一种社交媒体数据与移动轨迹数据的融合方法 |
PCT/CN2023/118711 WO2024098956A1 (zh) | 2022-11-10 | 2023-09-14 | 一种社交媒体数据与移动轨迹数据的融合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211403639.5A CN115455130B (zh) | 2022-11-10 | 2022-11-10 | 一种社交媒体数据与移动轨迹数据的融合方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115455130A true CN115455130A (zh) | 2022-12-09 |
CN115455130B CN115455130B (zh) | 2023-01-31 |
Family
ID=84295411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211403639.5A Active CN115455130B (zh) | 2022-11-10 | 2022-11-10 | 一种社交媒体数据与移动轨迹数据的融合方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115455130B (zh) |
WO (1) | WO2024098956A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115840857A (zh) * | 2023-02-22 | 2023-03-24 | 昆明理工大学 | 一种联合多元时空轨迹的群体行为模式挖掘方法 |
CN116484309A (zh) * | 2023-03-09 | 2023-07-25 | 重庆市规划和自然资源信息中心 | 户籍人口数据与不动产登记数据融合方法 |
WO2024098956A1 (zh) * | 2022-11-10 | 2024-05-16 | 中国测绘科学研究院 | 一种社交媒体数据与移动轨迹数据的融合方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202488A (zh) * | 2016-07-19 | 2016-12-07 | 西北工业大学 | 估算用户到物理事件距离的方法 |
CN109448379A (zh) * | 2018-12-13 | 2019-03-08 | 中南大学 | 一种社交媒体数据偶发性交通事件的识别及定位方法 |
CN110879856A (zh) * | 2019-11-27 | 2020-03-13 | 国家计算机网络与信息安全管理中心 | 一种基于多特征融合的社交群体分类方法及系统 |
CN112749791A (zh) * | 2021-01-22 | 2021-05-04 | 重庆理工大学 | 一种基于图神经网络和胶囊网络的链路预测方法 |
CN113408588A (zh) * | 2021-05-24 | 2021-09-17 | 上海电力大学 | 一种基于注意力机制的双向gru轨迹预测方法 |
US20210402991A1 (en) * | 2020-06-29 | 2021-12-30 | Uatc, Llc | Object Trajectory Association and Tracking |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110826698A (zh) * | 2019-11-04 | 2020-02-21 | 电子科技大学 | 一种通过上下文相关的图嵌入表示人群移动模式的方法 |
US20210347047A1 (en) * | 2020-05-05 | 2021-11-11 | X Development Llc | Generating robot trajectories using neural networks |
CN114239902A (zh) * | 2021-10-26 | 2022-03-25 | 中国人民公安大学 | 一种用户轨迹预测与异常轨迹检测方法及系统 |
CN114461931A (zh) * | 2021-12-21 | 2022-05-10 | 国家计算机网络与信息安全管理中心 | 一种基于多关系融合分析的用户轨迹预测方法和系统 |
CN115455130B (zh) * | 2022-11-10 | 2023-01-31 | 中国测绘科学研究院 | 一种社交媒体数据与移动轨迹数据的融合方法 |
-
2022
- 2022-11-10 CN CN202211403639.5A patent/CN115455130B/zh active Active
-
2023
- 2023-09-14 WO PCT/CN2023/118711 patent/WO2024098956A1/zh unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202488A (zh) * | 2016-07-19 | 2016-12-07 | 西北工业大学 | 估算用户到物理事件距离的方法 |
CN109448379A (zh) * | 2018-12-13 | 2019-03-08 | 中南大学 | 一种社交媒体数据偶发性交通事件的识别及定位方法 |
CN110879856A (zh) * | 2019-11-27 | 2020-03-13 | 国家计算机网络与信息安全管理中心 | 一种基于多特征融合的社交群体分类方法及系统 |
US20210402991A1 (en) * | 2020-06-29 | 2021-12-30 | Uatc, Llc | Object Trajectory Association and Tracking |
CN112749791A (zh) * | 2021-01-22 | 2021-05-04 | 重庆理工大学 | 一种基于图神经网络和胶囊网络的链路预测方法 |
CN113408588A (zh) * | 2021-05-24 | 2021-09-17 | 上海电力大学 | 一种基于注意力机制的双向gru轨迹预测方法 |
Non-Patent Citations (1)
Title |
---|
张福浩 等: ""一种基于MOST优化的移动目标空间模型"", 《测绘通报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024098956A1 (zh) * | 2022-11-10 | 2024-05-16 | 中国测绘科学研究院 | 一种社交媒体数据与移动轨迹数据的融合方法 |
CN115840857A (zh) * | 2023-02-22 | 2023-03-24 | 昆明理工大学 | 一种联合多元时空轨迹的群体行为模式挖掘方法 |
CN116484309A (zh) * | 2023-03-09 | 2023-07-25 | 重庆市规划和自然资源信息中心 | 户籍人口数据与不动产登记数据融合方法 |
CN116484309B (zh) * | 2023-03-09 | 2023-09-29 | 重庆市规划和自然资源信息中心 | 户籍人口数据与不动产登记数据融合方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115455130B (zh) | 2023-01-31 |
WO2024098956A1 (zh) | 2024-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115455130B (zh) | 一种社交媒体数据与移动轨迹数据的融合方法 | |
CN110889546B (zh) | 一种基于注意力机制的交通流量模型训练方法 | |
US11687728B2 (en) | Text sentiment analysis method based on multi-level graph pooling | |
CN110163299A (zh) | 一种基于自底向上注意力机制和记忆网络的视觉问答方法 | |
Wang et al. | Predictive complex event processing based on evolving Bayesian networks | |
Xie et al. | Deep graph convolutional networks for incident-driven traffic speed prediction | |
Wang et al. | A Deep-forest based approach for detecting fraudulent online transaction | |
CN114647741A (zh) | 工艺自动决策和推理方法、装置、计算机设备及存储介质 | |
CN112084240B (zh) | 一种群租房智能识别、联动治理方法及系统 | |
Pande et al. | Crime detection using data mining | |
CN114461931A (zh) | 一种基于多关系融合分析的用户轨迹预测方法和系统 | |
Ishak et al. | Mining temporal reservoir data using sliding window technique | |
CN113159403A (zh) | 路口行人轨迹预测的方法及装置 | |
Dick et al. | Regranulation: A granular algorithm enabling communication between granular worlds | |
CN112417890B (zh) | 一种基于多样化语义注意力模型的细粒度实体分类方法 | |
Indra et al. | Modeling of optimal deep learning based flood forecasting model using twitter data | |
CN113904844A (zh) | 基于跨模态教师-学生网络的智能合约漏洞检测方法 | |
CN114818682B (zh) | 基于自适应实体路径感知的文档级实体关系抽取方法 | |
Guo | [Retracted] Financial Market Sentiment Prediction Technology and Application Based on Deep Learning Model | |
Wang et al. | A new interactive model for improving the learning performance of back propagation neural network | |
Li et al. | Abnormal behavior recognition based on spatio-temporal context | |
CN112287996B (zh) | 一种基于机器学习的重大事件关键因子挖掘方法 | |
Shujaaddeen et al. | A New Machine Learning Model for Detecting levels of Tax Evasion Based on Hybrid Neural Network | |
CN111242520A (zh) | 特征合成模型的生成方法、装置及电子设备 | |
Patel et al. | Caller behaviour classification using computational intelligence methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |