CN115455130A - 一种社交媒体数据与移动轨迹数据的融合方法 - Google Patents

一种社交媒体数据与移动轨迹数据的融合方法 Download PDF

Info

Publication number
CN115455130A
CN115455130A CN202211403639.5A CN202211403639A CN115455130A CN 115455130 A CN115455130 A CN 115455130A CN 202211403639 A CN202211403639 A CN 202211403639A CN 115455130 A CN115455130 A CN 115455130A
Authority
CN
China
Prior art keywords
social media
data
vector
information
media data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211403639.5A
Other languages
English (en)
Other versions
CN115455130B (zh
Inventor
仇阿根
陶坤旺
朱鹏
赵习枝
刘尚钦
张福浩
陈才
郑莹莹
张志然
张用川
陈颂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese Academy of Surveying and Mapping
Original Assignee
Chinese Academy of Surveying and Mapping
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese Academy of Surveying and Mapping filed Critical Chinese Academy of Surveying and Mapping
Priority to CN202211403639.5A priority Critical patent/CN115455130B/zh
Publication of CN115455130A publication Critical patent/CN115455130A/zh
Application granted granted Critical
Publication of CN115455130B publication Critical patent/CN115455130B/zh
Priority to PCT/CN2023/118711 priority patent/WO2024098956A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种社交媒体数据与移动轨迹数据的融合方法,首先采用BiGRU模型计算移动轨迹特征向量,有效的利用移动轨迹数据;然后通过胶囊网络模型提取社交媒体信息的高级特征向量;最后采用马氏距离法判断向量间距离并利用基于参数矩阵融合的方法进行融合,获得移动轨迹数据与社交媒体数据融合向量,解决单一数据源对于人物群体行为分析存在局限性问题。

Description

一种社交媒体数据与移动轨迹数据的融合方法
技术领域
本发明涉及智慧城市技术领域,具体的,涉及一种社交媒体数据与移动轨迹数据的融合方法及其存储介质。
背景技术
随着城市规模不断扩大,城市人口显著增加,社会公共场所中如大型集会、演唱会等因群体行为异常导致拥堵或踩踏事件,造成社会财产的损失,严重危及公民的生命安全。
单一数据源对于人物群体行为分析存在一定局限性。人群移动轨迹数据定位准确,可发现城市范围内人群流量异常,但缺乏相关语义信息;社交媒体数据量丰富,包含清楚语义信息,但缺少准确定位信息。考虑到人群移动轨迹数据与社交媒体数据的优势与不足,通过融合不同数据源,对人物群体行为与事件演变精准分析,及时发现异常行为并有效疏导,防止事态进一步恶化,减轻或消除公共安全事件造成的危害与损失,有效支撑城市管理与应急指挥决策。
因此,如何综合社交媒体数据与移动轨迹数据从而准确分析人群行为,及时分析异常行为成为现有技术亟需解决的技术问题。
发明内容
本发明的目的在于针对城市群体行为模式分析受制于社会传感数据与社交媒体数据协同表达缺乏问题,提出一种社交媒体数据与移动轨迹数据的融合方法,探索城市群体行为演化规律,有助于城市管理信息智能化服务。
为达此目的,本发明采用以下技术方案:
一种社交媒体数据与移动轨迹数据的融合方法,其特征在于,包括如下步骤:
移动轨迹数据处理步骤S110:
对群体每个人物行程轨迹点数据进行预处理,将预处理后的轨迹点匹配至路网中还原每个人物行程的移动轨迹,采用BiGRU模型计算移动轨迹特征向量,以表征移动轨迹数据;
社交媒体数据处理步骤S120:
对社交媒体数据预处理,然后对文本向量化以获得文本特征向量,并通过胶囊网络模型提取社交媒体信息的高级特征向量,以表征社交媒体数据;
计算数据距离并融合数据步骤S130:
通过马氏距离法计算在步骤S110中所获得的移动轨迹特征向量与在步骤S120中所提取的社交媒体的高级特征向量间的距离,对于每个移动轨迹特征向量,计算得到与其距离最小的社交媒体的高级特征向量,并采用基于参数矩阵融合的方法对该距离最小的每对向量进行融合。
可选的,在步骤S110中,所述对群体每个人物行程轨迹点数据进行预处理包括:删除无效、异常轨迹点。
可选的,在步骤S110中,所述BiGRU模型为一种双向的改进的循环神经网络。
可选的,所述BiGRU模型包括正向GRU模型
Figure 572066DEST_PATH_IMAGE002
和反向GRU模型
Figure 484177DEST_PATH_IMAGE004
,其中正向GRU模型
Figure 461360DEST_PATH_IMAGE006
中对输入的移动轨迹采用正向输入即
Figure 123286DEST_PATH_IMAGE008
,反向GRU模型
Figure 544034DEST_PATH_IMAGE010
对输入的移动轨迹采用反向输入即
Figure 924200DEST_PATH_IMAGE012
每个GRU模型
Figure 705074DEST_PATH_IMAGE014
,由更新门
Figure 237817DEST_PATH_IMAGE016
和重置门
Figure 78735DEST_PATH_IMAGE018
构成,GRU模型内部的信息传播过程如下式:
Figure 680617DEST_PATH_IMAGE020
其中,
Figure 265182DEST_PATH_IMAGE022
为移动轨迹输入,
Figure 386853DEST_PATH_IMAGE024
为重置门
Figure 398672DEST_PATH_IMAGE018
的权重矩阵,
Figure 487850DEST_PATH_IMAGE026
为更新门
Figure 889488DEST_PATH_IMAGE016
的权重矩阵,
Figure 114933DEST_PATH_IMAGE028
为现在信息
Figure 563232DEST_PATH_IMAGE030
的权重矩阵,
Figure 890439DEST_PATH_IMAGE032
为逐元素相乘,
Figure 816807DEST_PATH_IMAGE034
为sigmoid函数,
Figure 896758DEST_PATH_IMAGE036
为双曲正切函数,现在信息
Figure 515959DEST_PATH_IMAGE030
由过去信息
Figure 64883DEST_PATH_IMAGE038
与当前输入
Figure 794941DEST_PATH_IMAGE022
共同决定,
Figure 260558DEST_PATH_IMAGE040
Figure 801392DEST_PATH_IMAGE042
时刻的信息输出,包含过去信息
Figure 86880DEST_PATH_IMAGE038
和现在信息
Figure 620629DEST_PATH_IMAGE030
,更新门
Figure 675173DEST_PATH_IMAGE016
用来控制当前的状态需要遗忘多少历史信息和接受多少新信息,重置门
Figure 401556DEST_PATH_IMAGE018
用来控制候选状态中有多少信息是从历史信息中得到;
最终,所述BiGRU模型的输出
Figure 174340DEST_PATH_IMAGE044
由以下公式定义得出:
Figure 246202DEST_PATH_IMAGE046
其中,
Figure 905984DEST_PATH_IMAGE002
为正向GRU模型输出,
Figure 37888DEST_PATH_IMAGE004
为反向GRU模型输出,
Figure 297968DEST_PATH_IMAGE048
表示
Figure 173520DEST_PATH_IMAGE042
时刻
Figure 953389DEST_PATH_IMAGE002
所对应的权重,
Figure 990615DEST_PATH_IMAGE050
表示
Figure 3570DEST_PATH_IMAGE004
所对应的权重,
Figure 167966DEST_PATH_IMAGE052
表示
Figure 51609DEST_PATH_IMAGE042
时刻
Figure 525315DEST_PATH_IMAGE044
所对应的偏置项。
可选的,在步骤S120中,所述社交媒体数据预处理为:过滤掉无关信息,采用正则表达式删除标点符号和删除空格,在文本数据中引入领域词典,对数据作分词处理。
可选的,在步骤S120中,通过胶囊网络模型提取社交媒体信息的高级特征向量具体为:
利用耦合系数
Figure 494408DEST_PATH_IMAGE054
对输入的文本特征向量
Figure 459566DEST_PATH_IMAGE056
进行加权求和,计算得预测向量
Figure 197715DEST_PATH_IMAGE058
Figure 107902DEST_PATH_IMAGE060
其中:
Figure 315023DEST_PATH_IMAGE056
为输入的文本特征向量,
Figure 70490DEST_PATH_IMAGE054
为耦合系数,
Figure 194304DEST_PATH_IMAGE062
为相邻两层的权值转化矩阵,
Figure 9813DEST_PATH_IMAGE058
为预测向量;
社交媒体信息的高级特征向量
Figure 438651DEST_PATH_IMAGE064
表示为:
Figure 263388DEST_PATH_IMAGE066
其中:
Figure 976129DEST_PATH_IMAGE064
为提取的社交媒体信息的高级特征向量,
Figure 713272DEST_PATH_IMAGE058
为预测向量,
Figure 144253DEST_PATH_IMAGE068
表示对预测向量
Figure 507102DEST_PATH_IMAGE058
求模运算。
可选的,在步骤S130中,对S110中每个提取的移动轨迹数据向量
Figure 74349DEST_PATH_IMAGE070
,通过马氏距离法计算与S120每个社交媒体数据向量
Figure 250902DEST_PATH_IMAGE072
间距离。首先计算
Figure 903601DEST_PATH_IMAGE074
与每个社交媒体数据向量
Figure 804560DEST_PATH_IMAGE072
间的距离,对计算的距离
Figure 242626DEST_PATH_IMAGE076
,…,
Figure 570839DEST_PATH_IMAGE078
,按从小到大排序,选择距离最小的一对向量进行融合, 然后计算并选择与
Figure 976413DEST_PATH_IMAGE080
距离最小的向量,循环至
Figure 415484DEST_PATH_IMAGE082
结束。
其中所述马氏距离法如下式:
Figure 708057DEST_PATH_IMAGE084
其中:
Figure 207171DEST_PATH_IMAGE086
为向量间距离,
Figure 834462DEST_PATH_IMAGE088
为协方差矩阵。
可选的,在步骤S130中,所述参数矩阵融合如下式:
Figure 77224DEST_PATH_IMAGE090
其中:
Figure 755461DEST_PATH_IMAGE092
为移动轨迹数据与社交媒体数据融合后的向量,
Figure 425477DEST_PATH_IMAGE094
Figure 274484DEST_PATH_IMAGE044
的权重矩阵,
Figure 68740DEST_PATH_IMAGE096
Figure 585172DEST_PATH_IMAGE064
的权重矩阵,
Figure 691669DEST_PATH_IMAGE098
为哈达玛乘积运算,
Figure 27972DEST_PATH_IMAGE044
Figure 363270DEST_PATH_IMAGE064
为所选取的距离最小的该对向量。
本发明进一步公开了一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行上述的社交媒体数据与移动轨迹数据的融合方法。
本发明具有如下优点:
1)由于本发明采用BiGRU模型,通过两个门控单元可以捕捉移动轨迹序列里的依赖关系,更好地提取移动轨迹向量。
2)由于本发明采用胶囊网络,使用动态路由算法减少了卷积神经网络中数据在传播过程中带来的损失,有效的利用社交媒体信息。
3)由于本发明采用马氏距离法计算向量间距离并基于参数矩阵的方法进行融合,可以更准确的融合移动轨迹数据与社交媒体数据,解决单一数据源对于人物群体行为分析存在局限性问题。
附图说明
图1 是根据本发明具体实施例的社交媒体数据与移动轨迹数据的融合方法的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本发明在于采用BiGRU(Bi-Gate Recurrent Unit)模型计算移动轨迹特征向量,有效的利用移动轨迹数据;采用胶囊网络模型提取社交媒体信息的特征向量;最后通过马氏距离法(Mahalanobis Distance)判断向量间距离并利用基于参数矩阵融合的方法进行融合,获得社交媒体数据与移动轨迹数据的融合向量,解决单一数据源对于人物群体行为分析存在局限性问题。
具体的,参见图1,示出了本发明的社交媒体数据与移动轨迹数据的融合方法的流程图,包括如下步骤:
移动轨迹数据处理步骤S110:
对群体每个人物行程轨迹点数据进行预处理,将预处理后的轨迹点匹配至路网中还原每个人物行程的移动轨迹,采用BiGRU模型计算移动轨迹特征向量,以表征移动轨迹数据。
所述对群体每个人物行程轨迹点数据进行预处理包括:删除无效、异常轨迹点。
其中,所述BiGRU模型为一种双向的改进的循环神经网络。
所述BiGRU模型包括正向GRU模型
Figure 734208DEST_PATH_IMAGE002
和反向GRU模型
Figure 746026DEST_PATH_IMAGE004
,其中正向GRU模型
Figure 851517DEST_PATH_IMAGE006
中对输入的移动轨迹采用正向输入即
Figure 974194DEST_PATH_IMAGE008
,反向GRU模型
Figure 465218DEST_PATH_IMAGE010
对输入的移动轨迹采用反向输入即
Figure 913517DEST_PATH_IMAGE012
每个GRU模型
Figure 975145DEST_PATH_IMAGE014
,由更新门
Figure 901512DEST_PATH_IMAGE016
和重置门
Figure 512622DEST_PATH_IMAGE018
构成,GRU模型内部的信息传播过程如下式:
Figure 873766DEST_PATH_IMAGE020
其中,
Figure 671958DEST_PATH_IMAGE022
为移动轨迹输入,
Figure 402016DEST_PATH_IMAGE024
为重置门
Figure 602053DEST_PATH_IMAGE018
的权重矩阵,
Figure 877308DEST_PATH_IMAGE026
为更新门
Figure 428375DEST_PATH_IMAGE016
的权重矩阵,
Figure 962125DEST_PATH_IMAGE028
为现在信息
Figure 767401DEST_PATH_IMAGE030
的权重矩阵,
Figure 462824DEST_PATH_IMAGE032
为逐元素相乘,
Figure 501187DEST_PATH_IMAGE034
为sigmoid函数,
Figure 573049DEST_PATH_IMAGE036
为双曲正切函数,现在信息
Figure 232831DEST_PATH_IMAGE030
由过去信息
Figure 364735DEST_PATH_IMAGE038
与当前输入
Figure 359236DEST_PATH_IMAGE022
共同决定,
Figure 234788DEST_PATH_IMAGE040
Figure 746148DEST_PATH_IMAGE042
时刻的信息输出,包含过去信息
Figure 48953DEST_PATH_IMAGE038
和现在信息
Figure 796329DEST_PATH_IMAGE030
,更新门
Figure 960725DEST_PATH_IMAGE016
用来控制当前的状态需要遗忘多少历史信息和接受多少新信息,重置门
Figure 844368DEST_PATH_IMAGE018
用来控制候选状态中有多少信息是从历史信息中得到;
最终,所述BiGRU模型的输出
Figure 318074DEST_PATH_IMAGE044
由以下公式定义得出:
Figure 287167DEST_PATH_IMAGE046
其中,
Figure 255255DEST_PATH_IMAGE002
为正向GRU模型输出,
Figure 258983DEST_PATH_IMAGE004
为反向GRU模型输出,
Figure 903591DEST_PATH_IMAGE048
表示
Figure 376291DEST_PATH_IMAGE042
时刻
Figure 131758DEST_PATH_IMAGE002
所对应的权重,
Figure 989992DEST_PATH_IMAGE050
表示
Figure 805502DEST_PATH_IMAGE004
所对应的权重,
Figure 502849DEST_PATH_IMAGE052
表示
Figure 62006DEST_PATH_IMAGE042
时刻
Figure 774747DEST_PATH_IMAGE044
所对应的偏置项。
社交媒体数据处理步骤S120:
对社交媒体数据预处理,然后对文本向量化以获得文本特征向量,并通过胶囊网络模型提取社交媒体信息的高级特征向量,以表征社交媒体数据。
其中,所述社交媒体数据预处理为:过滤掉无关信息,采用正则表达式删除标点符号和删除空格,在文本数据中引入领域词典,对数据作分词处理。
具体的,通过胶囊网络模型提取社交媒体信息的高级特征向量具体为:
利用耦合系数
Figure 761158DEST_PATH_IMAGE054
对输入的文本特征向量
Figure 942872DEST_PATH_IMAGE056
进行加权求和,计算得预测向量
Figure 40141DEST_PATH_IMAGE058
Figure 872967DEST_PATH_IMAGE060
其中:
Figure 781012DEST_PATH_IMAGE056
为输入的文本特征向量,
Figure 699289DEST_PATH_IMAGE054
为耦合系数,
Figure 600249DEST_PATH_IMAGE062
为相邻两层的权值转化矩阵,
Figure 287582DEST_PATH_IMAGE058
为预测向量。使用判别式学习实现非线性压缩,并通过其实现胶囊层级的激活功能。
社交媒体信息的高级特征向量
Figure 366528DEST_PATH_IMAGE064
表示为:
Figure 772101DEST_PATH_IMAGE066
其中:
Figure 211173DEST_PATH_IMAGE064
为提取的社交媒体信息的高级特征向量,
Figure 766395DEST_PATH_IMAGE058
为预测向量,
Figure 265509DEST_PATH_IMAGE068
表示对预测向量
Figure 892800DEST_PATH_IMAGE058
求模运算。
计算数据距离并融合数据步骤S130:
通过马氏距离法计算在步骤S110中所获得的移动轨迹特征向量与在步骤S120中所提取的社交媒体的高级特征向量间的距离,对于每个移动轨迹特征向量,计算得到与其距离最小的社交媒体的高级特征向量,并采用基于参数矩阵融合的方法对该距离最小的每对向量进行融合。
具体的,在步骤S130中,对S110中每个提取的移动轨迹数据向量
Figure 135562DEST_PATH_IMAGE070
,通过马氏距离法计算与S120每个社交媒体数据向量
Figure 282641DEST_PATH_IMAGE072
间距离。首先计算
Figure 218236DEST_PATH_IMAGE074
与每个社交媒体数据向量
Figure 332822DEST_PATH_IMAGE072
间的距离,对计算的距离
Figure 395587DEST_PATH_IMAGE076
,…,
Figure 646440DEST_PATH_IMAGE078
,按从小到大排序,选择距离最小的一对向量进行融合, 然后计算并选择与
Figure 487357DEST_PATH_IMAGE080
距离最小的向量,循环至
Figure 89240DEST_PATH_IMAGE082
结束。
其中所述马氏距离法如下式:
Figure 424537DEST_PATH_IMAGE084
其中:
Figure 61055DEST_PATH_IMAGE086
为向量间距离,
Figure 72873DEST_PATH_IMAGE088
为协方差矩阵。
具体的,在步骤S130中,所述参数矩阵融合如下式:
Figure 927433DEST_PATH_IMAGE090
其中:
Figure 315689DEST_PATH_IMAGE092
为移动轨迹数据与社交媒体数据融合后的向量,
Figure 541134DEST_PATH_IMAGE094
Figure 989433DEST_PATH_IMAGE044
的权重矩阵,
Figure 51061DEST_PATH_IMAGE096
Figure 977429DEST_PATH_IMAGE064
的权重矩阵,
Figure 322959DEST_PATH_IMAGE098
为哈达玛乘积运算,
Figure 676580DEST_PATH_IMAGE044
Figure 225504DEST_PATH_IMAGE064
为所选取的距离最小的该对向量。
进一步的,本发明还公开了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时执行上述的社交媒体数据与移动轨迹数据的融合方法。
本发明提供的社交媒体数据与移动轨迹数据的融合方法,与现有技术相比,具有如下优势:
1)由于本发明采用BiGRU模型,通过两个门控单元可以捕捉移动轨迹序列里的依赖关系,更好地提取移动轨迹向量。
2)由于本发明采用胶囊网络,使用动态路由算法减少了卷积神经网络中数据在传播过程中带来的损失,有效的利用社交媒体信息。
3)由于本发明采用马氏距离法计算向量间距离并基于参数矩阵的方法进行融合,可以更准确的融合移动轨迹数据与社交媒体数据,解决单一数据源对于人物群体行为分析存在局限性问题。
显然,本领域技术人员应该明白,上述的本发明的各单元或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。

Claims (9)

1.一种社交媒体数据与移动轨迹数据的融合方法,其特征在于,包括如下步骤:
移动轨迹数据处理步骤S110:
对群体每个人物行程轨迹点数据进行预处理,将预处理后的轨迹点匹配至路网中还原每个人物行程的移动轨迹,采用BiGRU模型计算移动轨迹特征向量,以表征移动轨迹数据;
社交媒体数据处理步骤S120:
对社交媒体数据预处理,然后对文本向量化以获得文本特征向量,并通过胶囊网络模型提取社交媒体信息的高级特征向量,以表征社交媒体数据;
计算数据距离并融合数据步骤S130:
通过马氏距离法计算在步骤S110中所获得的移动轨迹特征向量与在步骤S120中所提取的社交媒体的高级特征向量间的距离,对于每个移动轨迹特征向量,计算得到与其距离最小的社交媒体的高级特征向量,并采用基于参数矩阵融合的方法对距离最小的每对向量进行融合。
2.根据权利要求1所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
在步骤S110中,所述对群体每个人物行程轨迹点数据进行预处理包括:删除无效、异常轨迹点。
3.根据权利要求1所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
在步骤S110中,所述BiGRU模型为一种双向的改进的循环神经网络。
4.根据权利要求3所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
所述BiGRU模型包括正向GRU模型
Figure 910733DEST_PATH_IMAGE002
和反向GRU模型
Figure 110770DEST_PATH_IMAGE004
,其中正向GRU模型
Figure 635292DEST_PATH_IMAGE006
中对输入的移动轨迹采用正向输入即
Figure 920780DEST_PATH_IMAGE008
,反向GRU模型
Figure 674103DEST_PATH_IMAGE010
对输入的移动轨迹采用反向输入即
Figure 728647DEST_PATH_IMAGE012
每个GRU模型
Figure 689650DEST_PATH_IMAGE014
,由更新门
Figure 462434DEST_PATH_IMAGE016
和重置门
Figure 547677DEST_PATH_IMAGE018
构成,GRU模型内部的信息传播过程如下式:
Figure 722306DEST_PATH_IMAGE020
其中,
Figure 588631DEST_PATH_IMAGE022
为移动轨迹输入,
Figure 599444DEST_PATH_IMAGE024
为重置门
Figure 6154DEST_PATH_IMAGE018
的权重矩阵,
Figure 35290DEST_PATH_IMAGE026
为更新门
Figure 88828DEST_PATH_IMAGE016
的权重矩阵,
Figure 570625DEST_PATH_IMAGE028
为现在信息
Figure 984289DEST_PATH_IMAGE030
的权重矩阵,
Figure 602352DEST_PATH_IMAGE032
为逐元素相乘,
Figure 826791DEST_PATH_IMAGE034
为sigmoid函数,
Figure 795884DEST_PATH_IMAGE036
为双曲正切函数,现在信息
Figure 747659DEST_PATH_IMAGE030
由过去信息
Figure 301787DEST_PATH_IMAGE038
与当前输入
Figure 680816DEST_PATH_IMAGE022
共同决定,
Figure 137205DEST_PATH_IMAGE040
Figure 892672DEST_PATH_IMAGE042
时刻的信息输出,包含过去信息
Figure 236059DEST_PATH_IMAGE038
和现在信息
Figure 51569DEST_PATH_IMAGE030
,更新门
Figure 995254DEST_PATH_IMAGE016
用来控制当前的状态需要遗忘多少历史信息和接受多少新信息,重置门
Figure 554411DEST_PATH_IMAGE018
用来控制候选状态中有多少信息是从历史信息中得到;
最终,所述BiGRU模型的输出
Figure 17885DEST_PATH_IMAGE044
由以下公式定义得出:
Figure 738716DEST_PATH_IMAGE046
其中,
Figure 966435DEST_PATH_IMAGE002
为正向GRU模型输出,
Figure 814436DEST_PATH_IMAGE004
为反向GRU模型输出,
Figure 381684DEST_PATH_IMAGE048
表示
Figure 273417DEST_PATH_IMAGE042
时刻
Figure 191694DEST_PATH_IMAGE002
所对应的权重,
Figure 840457DEST_PATH_IMAGE050
表示
Figure 262211DEST_PATH_IMAGE004
所对应的权重,
Figure 590424DEST_PATH_IMAGE052
表示
Figure 730418DEST_PATH_IMAGE042
时刻
Figure 185802DEST_PATH_IMAGE044
所对应的偏置项。
5.根据权利要求1所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
在步骤S120中,所述社交媒体数据预处理为:过滤掉无关信息,采用正则表达式删除标点符号和删除空格,在文本数据中引入领域词典,对数据作分词处理。
6.根据权利要求4所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
在步骤S120中,通过胶囊网络模型提取社交媒体信息的高级特征向量具体为:
利用耦合系数
Figure 524379DEST_PATH_IMAGE054
对输入的文本特征向量
Figure 23493DEST_PATH_IMAGE056
进行加权求和,计算得预测向量
Figure 401516DEST_PATH_IMAGE058
Figure 644279DEST_PATH_IMAGE060
其中:
Figure 40625DEST_PATH_IMAGE056
为输入的文本特征向量,
Figure 710641DEST_PATH_IMAGE054
为耦合系数,
Figure 310381DEST_PATH_IMAGE062
为相邻两层的权值转化矩阵,
Figure 91255DEST_PATH_IMAGE058
为预测向量;
社交媒体信息的高级特征向量
Figure 607687DEST_PATH_IMAGE064
表示为:
Figure 448604DEST_PATH_IMAGE066
其中:
Figure 815867DEST_PATH_IMAGE064
为提取的社交媒体信息的高级特征向量,
Figure 400432DEST_PATH_IMAGE058
为预测向量,
Figure 771371DEST_PATH_IMAGE068
表示对预测向量
Figure 330659DEST_PATH_IMAGE058
求模运算。
7.根据权利要求6所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
在步骤S130中,对S110中每个提取的移动轨迹数据向量
Figure 154259DEST_PATH_IMAGE070
,通过马氏距离法计算与S120每个社交媒体数据向量
Figure 542515DEST_PATH_IMAGE072
间距离,首先计算
Figure 502381DEST_PATH_IMAGE074
与每个社交媒体数据向量
Figure 435833DEST_PATH_IMAGE072
间的距离,对计算的距离
Figure 12307DEST_PATH_IMAGE076
,…,
Figure 938675DEST_PATH_IMAGE078
,按从小到大排序,选择距离最小的一对向量进行融合, 然后计算并选择与
Figure 566097DEST_PATH_IMAGE080
距离最小的向量,循环至
Figure 185297DEST_PATH_IMAGE082
结束;
其中所述马氏距离法如下式:
Figure 983489DEST_PATH_IMAGE084
其中:
Figure 713547DEST_PATH_IMAGE086
为向量间距离,
Figure 395808DEST_PATH_IMAGE088
为协方差矩阵。
8.根据权利要求7所述的社交媒体数据与移动轨迹数据的融合方法,其特征在于,
在步骤S130中,所述参数矩阵融合如下式:
Figure 185909DEST_PATH_IMAGE090
其中:
Figure 471397DEST_PATH_IMAGE092
为移动轨迹数据与社交媒体数据融合后的向量,
Figure 739568DEST_PATH_IMAGE094
Figure 544844DEST_PATH_IMAGE044
的权重矩阵,
Figure 505846DEST_PATH_IMAGE096
Figure 13051DEST_PATH_IMAGE064
的权重矩阵,
Figure 84912DEST_PATH_IMAGE098
为哈达玛乘积运算,
Figure 744695DEST_PATH_IMAGE044
Figure 611020DEST_PATH_IMAGE064
为所选取的距离最小的该对向量。
9.一种存储介质,用于存储计算机可执行指令,其特征在于:
所述计算机可执行指令在被处理器执行时执行权利要求1-8中任意一项所述的社交媒体数据与移动轨迹数据的融合方法。
CN202211403639.5A 2022-11-10 2022-11-10 一种社交媒体数据与移动轨迹数据的融合方法 Active CN115455130B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211403639.5A CN115455130B (zh) 2022-11-10 2022-11-10 一种社交媒体数据与移动轨迹数据的融合方法
PCT/CN2023/118711 WO2024098956A1 (zh) 2022-11-10 2023-09-14 一种社交媒体数据与移动轨迹数据的融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211403639.5A CN115455130B (zh) 2022-11-10 2022-11-10 一种社交媒体数据与移动轨迹数据的融合方法

Publications (2)

Publication Number Publication Date
CN115455130A true CN115455130A (zh) 2022-12-09
CN115455130B CN115455130B (zh) 2023-01-31

Family

ID=84295411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211403639.5A Active CN115455130B (zh) 2022-11-10 2022-11-10 一种社交媒体数据与移动轨迹数据的融合方法

Country Status (2)

Country Link
CN (1) CN115455130B (zh)
WO (1) WO2024098956A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115840857A (zh) * 2023-02-22 2023-03-24 昆明理工大学 一种联合多元时空轨迹的群体行为模式挖掘方法
CN116484309A (zh) * 2023-03-09 2023-07-25 重庆市规划和自然资源信息中心 户籍人口数据与不动产登记数据融合方法
WO2024098956A1 (zh) * 2022-11-10 2024-05-16 中国测绘科学研究院 一种社交媒体数据与移动轨迹数据的融合方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202488A (zh) * 2016-07-19 2016-12-07 西北工业大学 估算用户到物理事件距离的方法
CN109448379A (zh) * 2018-12-13 2019-03-08 中南大学 一种社交媒体数据偶发性交通事件的识别及定位方法
CN110879856A (zh) * 2019-11-27 2020-03-13 国家计算机网络与信息安全管理中心 一种基于多特征融合的社交群体分类方法及系统
CN112749791A (zh) * 2021-01-22 2021-05-04 重庆理工大学 一种基于图神经网络和胶囊网络的链路预测方法
CN113408588A (zh) * 2021-05-24 2021-09-17 上海电力大学 一种基于注意力机制的双向gru轨迹预测方法
US20210402991A1 (en) * 2020-06-29 2021-12-30 Uatc, Llc Object Trajectory Association and Tracking

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110826698A (zh) * 2019-11-04 2020-02-21 电子科技大学 一种通过上下文相关的图嵌入表示人群移动模式的方法
US20210347047A1 (en) * 2020-05-05 2021-11-11 X Development Llc Generating robot trajectories using neural networks
CN114239902A (zh) * 2021-10-26 2022-03-25 中国人民公安大学 一种用户轨迹预测与异常轨迹检测方法及系统
CN114461931A (zh) * 2021-12-21 2022-05-10 国家计算机网络与信息安全管理中心 一种基于多关系融合分析的用户轨迹预测方法和系统
CN115455130B (zh) * 2022-11-10 2023-01-31 中国测绘科学研究院 一种社交媒体数据与移动轨迹数据的融合方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202488A (zh) * 2016-07-19 2016-12-07 西北工业大学 估算用户到物理事件距离的方法
CN109448379A (zh) * 2018-12-13 2019-03-08 中南大学 一种社交媒体数据偶发性交通事件的识别及定位方法
CN110879856A (zh) * 2019-11-27 2020-03-13 国家计算机网络与信息安全管理中心 一种基于多特征融合的社交群体分类方法及系统
US20210402991A1 (en) * 2020-06-29 2021-12-30 Uatc, Llc Object Trajectory Association and Tracking
CN112749791A (zh) * 2021-01-22 2021-05-04 重庆理工大学 一种基于图神经网络和胶囊网络的链路预测方法
CN113408588A (zh) * 2021-05-24 2021-09-17 上海电力大学 一种基于注意力机制的双向gru轨迹预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张福浩 等: ""一种基于MOST优化的移动目标空间模型"", 《测绘通报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024098956A1 (zh) * 2022-11-10 2024-05-16 中国测绘科学研究院 一种社交媒体数据与移动轨迹数据的融合方法
CN115840857A (zh) * 2023-02-22 2023-03-24 昆明理工大学 一种联合多元时空轨迹的群体行为模式挖掘方法
CN116484309A (zh) * 2023-03-09 2023-07-25 重庆市规划和自然资源信息中心 户籍人口数据与不动产登记数据融合方法
CN116484309B (zh) * 2023-03-09 2023-09-29 重庆市规划和自然资源信息中心 户籍人口数据与不动产登记数据融合方法

Also Published As

Publication number Publication date
CN115455130B (zh) 2023-01-31
WO2024098956A1 (zh) 2024-05-16

Similar Documents

Publication Publication Date Title
CN115455130B (zh) 一种社交媒体数据与移动轨迹数据的融合方法
CN110889546B (zh) 一种基于注意力机制的交通流量模型训练方法
US11687728B2 (en) Text sentiment analysis method based on multi-level graph pooling
CN110163299A (zh) 一种基于自底向上注意力机制和记忆网络的视觉问答方法
Wang et al. Predictive complex event processing based on evolving Bayesian networks
Xie et al. Deep graph convolutional networks for incident-driven traffic speed prediction
Wang et al. A Deep-forest based approach for detecting fraudulent online transaction
CN114647741A (zh) 工艺自动决策和推理方法、装置、计算机设备及存储介质
CN112084240B (zh) 一种群租房智能识别、联动治理方法及系统
Pande et al. Crime detection using data mining
CN114461931A (zh) 一种基于多关系融合分析的用户轨迹预测方法和系统
Ishak et al. Mining temporal reservoir data using sliding window technique
CN113159403A (zh) 路口行人轨迹预测的方法及装置
Dick et al. Regranulation: A granular algorithm enabling communication between granular worlds
CN112417890B (zh) 一种基于多样化语义注意力模型的细粒度实体分类方法
Indra et al. Modeling of optimal deep learning based flood forecasting model using twitter data
CN113904844A (zh) 基于跨模态教师-学生网络的智能合约漏洞检测方法
CN114818682B (zh) 基于自适应实体路径感知的文档级实体关系抽取方法
Guo [Retracted] Financial Market Sentiment Prediction Technology and Application Based on Deep Learning Model
Wang et al. A new interactive model for improving the learning performance of back propagation neural network
Li et al. Abnormal behavior recognition based on spatio-temporal context
CN112287996B (zh) 一种基于机器学习的重大事件关键因子挖掘方法
Shujaaddeen et al. A New Machine Learning Model for Detecting levels of Tax Evasion Based on Hybrid Neural Network
CN111242520A (zh) 特征合成模型的生成方法、装置及电子设备
Patel et al. Caller behaviour classification using computational intelligence methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant