CN114580738A - 一种社交媒体危机事件预测方法及系统 - Google Patents
一种社交媒体危机事件预测方法及系统 Download PDFInfo
- Publication number
- CN114580738A CN114580738A CN202210201984.4A CN202210201984A CN114580738A CN 114580738 A CN114580738 A CN 114580738A CN 202210201984 A CN202210201984 A CN 202210201984A CN 114580738 A CN114580738 A CN 114580738A
- Authority
- CN
- China
- Prior art keywords
- event
- vector
- candidate
- feature vector
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000013598 vector Substances 0.000 claims abstract description 248
- 238000004364 calculation method Methods 0.000 claims abstract description 28
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 25
- 230000007246 mechanism Effects 0.000 claims abstract description 21
- 238000012549 training Methods 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000013507 mapping Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Molecular Biology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种社交媒体危机事件预测方法及系统。所述方法包括:使用预训练词向量GloVe将原始事件表示成事件向量;根据原始事件的事件向量,使用卷积神经网络和注意力机制获取原始事件的特征向量,包括已知事件的特征向量和候选事件的特征向量;使用点乘相似度计算指标来计算已知事件的特征向量和候选事件的特征向量之间的相似度;根据已知事件的特征向量和候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件。本发明方法利用卷积神经网络和注意力机制来对事件提取特征,并根据事件间的特征相似度进行预测,能够提高事件预测的鲁棒性和准确性;并且本发明方法不依赖外部知识库,具有很强的通用性。
Description
技术领域
本发明涉及人工智能和自然语言处理应用技术领域,特别是涉及一种社交媒体危机事件预测方法及系统。
背景技术
在互联网时代的今天,社交媒体平台拥有世界各地大量的用户。当危机事件(如地震、台风、恐怖袭击等)发生时,相关个人或组织机构会在社交媒体平台上发布关键信息(主要指文本信息),这些信息会迅速传播,进而会吸引更多的人进行讨论和交流,形成一个热门话题。因此,社交媒体已成为危机事件发生期间应急管理的重要信息来源。在对危机事件的应急响应中一项十分有意义的工作是危机事件预警,即根据当前危机事件的发展形势,预测未来可能会发生的事件。
为了利用社交媒体中的有效信息,将文本中相关的危机事件进行结构化描述。一个完整的事件由主语(s)、谓语(v)、宾语(o)和介词宾语/状语(p)4个论元构成,对于缺少4个论元的事件,将对应论元设置为“-”。例如,可以将原始的社交媒体文本“someone hasjust attacked the embassy!”和“someone threw a bomb.”分别描述为(someone,attacked,embassy,-)和(someone,threw,bomb,-)。这样的事件描述中包含大量有价值的信息。给定对事件的描述,人们可以根据常识推断未来会发生什么。例如,给定事件(someone,attacked,embassy,-),可以推断下一个事件(someone,threw,bomb,-)比(someone,threw,basketball,-)更有可能发生,这种关于事件的推断被称为事件预测,在这个例子中将(someone,attacked,embassy,-)这种给定的事件称为已知事件,将(someone,threw,bomb,-)和(someone,threw,basketball,-)这类事件称为候选事件。此外,真实的未来事件被称为后续事件,通过预测得到的事件被称为预测事件。
目前关于社交媒体事件预测的研究的思路主要是利用事件特征来预测事件。事件特征是一种常识性知识,如事件的场景特征和生命力特征等。如图1所示,给定1个已知事件和2个候选事件,事件(someone,attacked,embassy,-)传达出的是一种危险的场景特征,因此可以很容易地选择具有相同场景特征的后续的事件(someone,threw,bomb,-),而排除(someone,threw,basketball,-)。同样的,认为具有紧密联系的事件应该具有相同生命力特征,面对相似的事件描述(we,need,water,-)和(tree,need,water,-),选择(we,need,water,-)作为(we,eat,nothing,day)的后续事件是一种更合理的选择。人类可以很容易理解这种常识性知识,但对于机器来说十分困难。因此,以往的方法主要是引入外部知识库中标注好的事件特征来帮助预测未来事件。但是这类方法过于依赖于外部知识库的质量。如果外部知识中存在错误的标签信息,则会带来噪声或错误的知识。此外,在实际应用中,由于外部知识的用途和领域的不同,并不是所有的事件都有标签信息。例如,有一个与金融事件相关的外部知识库,但现在需要处理关于危机事件的预测。在这种情况下,引入外部知识库对提高模型的预测性能毫无帮助。
因此,如何在不依赖外部知识库的前提下更准确地提取事件特征来帮助预测未来事件,是本领域亟需解决的技术问题。
发明内容
本发明的目的是提供一种社交媒体危机事件预测方法及系统,以在不依赖外部知识库的情况下提高社交媒体危机事件预测的鲁棒性和准确性。
为实现上述目的,本发明提供了如下方案:
一种社交媒体危机事件预测方法,包括:
使用预训练词向量GloVe将原始事件表示成事件向量,生成所述原始事件的事件向量;所述原始事件为关于社交媒体中危机事件的已知事件或候选事件;
根据所述原始事件的事件向量,使用卷积神经网络和注意力机制获取所述原始事件的特征向量;所述原始事件的特征向量包括已知事件的特征向量和候选事件的特征向量;
使用点乘相似度计算指标来计算所述已知事件的特征向量和所述候选事件的特征向量之间的相似度;
根据所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件。
可选地,所述使用预训练词向量GloVe将原始事件表示成事件向量,生成所述原始事件的事件向量,具体包括:
使用预训练词向量GloVe将原始事件的每个论元表示成论元向量;
将所有论元向量并联拼接起来构成所述原始事件的事件向量。
可选地,所述根据所述原始事件的事件向量,使用卷积神经网络和注意力机制获取所述原始事件的特征向量,具体包括:
采用不同卷积核窗口大小的卷积神经网络对所述原始事件的事件向量提取特征映射;
采用注意力机制计算所述特征映射的自注意力矩阵;
根据所述自注意力矩阵计算所述原始事件的全部特征;
将所述原始事件的全部特征中的元素展平,作为所述原始事件的特征向量。
可选地,所述使用点乘相似度计算指标来计算所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,具体包括:
计算所述已知事件的特征向量与所述候选事件的特征向量的内积作为所述已知事件的特征向量和所述候选事件的特征向量之间的相似度。
可选地,所述根据所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件,具体包括:
根据单个已知事件的特征向量和所有候选事件的特征向量之间的相似度生成单个已知事件对所有候选事件的预测概率;
根据所述单个已知事件对所有候选事件的预测概率生成所有已知事件对所有候选事件的预测概率;
将所述所有已知事件对所有候选事件的预测概率送入全连接网络进行学习,得到每个候选事件的概率;
选择最大概率对应的候选事件作为所述危机事件的预测事件。
一种社交媒体危机事件预测系统,包括:
事件向量生成模块,用于使用预训练词向量GloVe将原始事件表示成事件向量,生成所述原始事件的事件向量;所述原始事件为关于社交媒体中危机事件的已知事件或候选事件;
特征向量获取模块,用于根据所述原始事件的事件向量,使用卷积神经网络和注意力机制获取所述原始事件的特征向量;所述原始事件的特征向量包括已知事件的特征向量和候选事件的特征向量;
相似度计算模块,用于使用点乘相似度计算指标来计算所述已知事件的特征向量和所述候选事件的特征向量之间的相似度;
危机事件预测模块,用于根据所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件。
可选地,所述事件向量生成模块具体包括:
论元向量表示单元,用于使用预训练词向量GloVe将原始事件的每个论元表示成论元向量;
事件向量生成单元,用于将所有论元向量并联拼接起来构成所述原始事件的事件向量。
可选地,所述特征向量获取模块具体包括:
特征映射提取单元,用于采用不同卷积核窗口大小的卷积神经网络对所述原始事件的事件向量提取特征映射;
自注意力计算单元,用于采用注意力机制计算所述特征映射的自注意力矩阵;
全部特征计算单元,用于根据所述自注意力矩阵计算所述原始事件的全部特征;
特征向量获取单元,用于将所述原始事件的全部特征中的元素展平,作为所述原始事件的特征向量。
可选地,所述相似度计算模块具体包括:
相似度计算单元,用于计算所述已知事件的特征向量与所述候选事件的特征向量的内积作为所述已知事件的特征向量和所述候选事件的特征向量之间的相似度。
可选地,所述危机事件预测模块具体包括:
第一预测概率生成单元,用于根据单个已知事件的特征向量和所有候选事件的特征向量之间的相似度生成单个已知事件对所有候选事件的预测概率;
第二预测概率生成单元,用于根据所述单个已知事件对所有候选事件的预测概率生成所有已知事件对所有候选事件的预测概率;
候选事件概率学习单元,用于将所述所有已知事件对所有候选事件的预测概率送入全连接网络进行学习,得到每个候选事件的概率;
危机事件预测单元,用于选择最大概率对应的候选事件作为所述危机事件的预测事件。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种社交媒体危机事件预测方法及系统,所述方法包括:使用预训练词向量GloVe将原始事件表示成事件向量,生成所述原始事件的事件向量;所述原始事件为关于社交媒体中危机事件的已知事件或候选事件;根据所述原始事件的事件向量,使用卷积神经网络和注意力机制获取所述原始事件的特征向量;所述原始事件的特征向量包括已知事件的特征向量和候选事件的特征向量;使用点乘相似度计算指标来计算所述已知事件的特征向量和所述候选事件的特征向量之间的相似度;根据所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件。本发明方法利用卷积神经网络和注意力机制来对事件提取特征,并根据事件间的特征相似度进行预测,能够提高事件预测的鲁棒性和准确性;并且本发明方法不依赖外部知识库,具有很强的通用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的利用事件特征来进行事件预测的示意图;图1中正确的后续事件用实心箭头连接;
图2为本发明提供的一种社交媒体危机事件预测方法的流程图;
图3为本发明提供的一种社交媒体危机事件预测方法的原理示意图;
图4为本发明实施例提供的事件预测任务示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种社交媒体危机事件预测方法及系统,以在不依赖外部知识库的情况下提高社交媒体危机事件预测的鲁棒性和准确性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图2为本发明一种社交媒体危机事件预测方法的流程图,图3为本发明一种社交媒体危机事件预测方法的原理示意图。参见图2和图3,本发明一种社交媒体危机事件预测方法包括:
步骤101:使用预训练词向量GloVe将原始事件表示成事件向量,生成所述原始事件的事件向量。
图4为本发明实施例提供的事件预测任务示意图,正确的后续事件在图4中用粗体标出。为了评估方法的有效性,本发明将事件预测任务定义为:用符号e来表示从社交媒体中提取出的危机事件,如图4所示,给定关于台风登陆的一组已知事件<e1,e2,e3,e4,e5>,以及一组候选事件{ec1,ec2,ec3,ec4,ec5},本发明方法的目标是根据已知事件的特征,从候选事件中选出一个最有可能发生事件作为预测事件。
因此,所述步骤101中的原始事件为关于社交媒体中危机事件的已知事件ei或候选事件ecj,后文也简称事件。使用预训练词向量GloVe对事件的每个论元进行向量表示,并将每个论元词向量串联拼接(concatenate)来得到完整事件的向量表示。
所述步骤101具体包括:
步骤1.1:使用预训练词向量GloVe将原始事件的每个论元表示成论元向量。
一个完整的事件由主语(s)、谓语(v)、宾语(o)和介词宾语/状语(p)4个论元构成,对于缺少4个论元的事件,将对应论元设置为“-”。本发明使用预训练词向量GloVe将原始事件(包括已知事件ei和候选事件ecj)的每个论元表示成向量,分别用Vs,Vv,Vo,Vp∈Rd来表示。需要注意的是,对于不在GloVe词典中的论元或者“-”论元,将该论元使用同样维度大小的零向量表示。
步骤1.2:将所有论元向量并联拼接起来构成所述原始事件的事件向量。
将所有论元向量Vs,Vv,Vo,Vp并联拼接起来,即在列的方向进行拼接,从而得到完整事件的向量表示作为所述原始事件的事件向量Ve。即,完整事件的向量Ve可以由以下操作得到:
Ve=[Vs;Vv;Vo;Vp] (1)
其中,Vs,Vv,Vo,Vp∈Rd分别表示主语(s)、谓语(v)、宾语(o)和介词宾语/状语(p)4个论元的论元向量,其中d是词向量的维度大小(d=100),Rd表示包含d个元素的一维向量。[;]表示拼接运算(Concatenation operator)。Ve表示原始事件e(包括已知事件ei和候选事件ecj)的事件向量,Ve∈R4×d。
步骤102:根据所述原始事件的事件向量,使用卷积神经网络和注意力机制获取所述原始事件的特征向量。
与现有危机事件预测方法依赖外部知识库相比,更一般的方法是从事件描述文本中提取事件特征,并利用提取到的事件特征来帮助进行事件预测。随着深度学习的发展,研究者尝试使用卷积神经网络(Convolutional Neural Network,CNN)来提取文本的特征,这种模型在情感分析和问题分类等句子级分类任务中表现出了良好的性能。因此,本发明提出一种新型的社交媒体事件预测框架,其关键在于利用卷积神经网络和注意力机制来对事件提取特征,并根据事件间的特征相似度进行预测,以提高事件预测的鲁棒性和准确性。
本发明步骤102使用不同卷积核大小的卷积神经网络对事件向量提取特征映射(feature map),再对得到的所有特征映射计算自注意力,获取其中重要的信息和它们之间交互信息,由此得到事件的特征向量。
所述步骤102具体包括:
步骤2.1:采用不同卷积核窗口大小的卷积神经网络对所述原始事件的事件向量提取特征映射。
得到事件向量Ve后,采用不同卷积核窗口大小的卷积神经网络对事件向量提取特征映射(feature map)。在卷积运算中,卷积核(kemel)表示为Wh∈Rh×d,其中d是词向量嵌入的维数,h代表卷积的窗口大小,即卷积运算作用的单词数量,本发明方法中,卷积运算作用1或2个单词数量。采用以下公式对一个事件Ve生成特征映射Ch:
Ci=f(Wh·Ve[i∶i+h-1]+b) (2)
Ch=[C1;...;C4-h+1] (3)
其中,Wh∈Rh×d是卷积核。Ve∈R4×d是事件的嵌入向量。Ve[i∶i+h-1]表示事件向量Ve中第i至第i+h-1个论元向量的拼接,i=1,2,...,4-h+1;h是窗口大小,这里只使用h=1和h=2这两种窗口大小的卷积核。例如当i=1,h=1时,Ve[i∶i+h-1]=Ve[1∶1]=[Vs];当i=1,h=2时,Ve[i∶i+h-1]=Ve[1∶2]=[Vs;Vv];当i=2,h=2时,Ve[i∶i+h-1]=Ve[2∶3]=[Vv;Vo];以此类推。b是偏差项。·是点乘运算。f(·)是GELU激活函数。中间参数Ci∈R,特征映射Ch∈R4-h+1。
以上描述了使用一个卷积核对事件提取特征映射的过程。一个事件往往具有多种特征,如语义、情感、生命力和情态等。因此模型使用k个卷积核来获得多种类型的特征。此时,一个事件Ve生成特征映射Ch形状(shape)变为Ch∈R(4-h+1)×k。
步骤2.2:采用注意力机制计算所述特征映射的自注意力矩阵。
采用如下公式对上一步得到的h=1和h=2这两种窗口大小的卷积核生成的特征映射Ch=1,2计算自注意力:
Call=[C1;C2] (4)
其中,C1∈R4×k,C2∈R3×k;Call∈R7×k是h=1和h=2这两种窗口大小的卷积核生成的特征映射的串联拼接,即在行的方向进行的拼接。Wa∈Rk×k为模型参数,是Wa的维度。Softmax(·)为Softmax函数。是自注意力矩阵。
步骤2.3:根据所述自注意力矩阵计算所述原始事件的全部特征。
采用下式计算得到事件的全部特征Call′:
Call′∈R7×k是事件的全部特征。
步骤2.4:将所述原始事件的全部特征中的元素展平,作为所述原始事件的特征向量。
采用下式将事件的全部特征Call′中的元素展平(flatten)作为事件的特征向量F(即将原形状为2个维度的向量平铺成1个维度):
F=Flatten(Call′) (7)
其中,Flatten(·)是展平操作,Call′∈R7×k,F∈R7k,其中R7×k表示7行k列的二维向量,R7k表示包含7k个元素的一维向量。
步骤103:使用点乘相似度计算指标来计算所述已知事件的特征向量和所述候选事件的特征向量之间的相似度。
使用点乘相似度计算指标来计算已知事件和候选事件特征向量之间的相似度。具体地,计算所述已知事件的特征向量与所述候选事件的特征向量的内积作为所述已知事件的特征向量和所述候选事件的特征向量之间的相似度。
其中表示已知事件ei的特征向量;表示候选事件ecj的特征向量。gdot是点乘相似度计算指标,点乘相似度是两个向量的内积,则Sij表示已知事件的特征向量和候选事件的特征向量之间的相似度,n、m分别为已知事件和候选事件的个数。
步骤104:根据所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件。
将已知事件和候选事件特征向量之间的相似度送入一个全连接网络进行决策,从候选事件中选出最可能发生的下一个事件作为预测事件。
所述步骤104具体包括:
步骤4.1:根据单个已知事件的特征向量和所有候选事件的特征向量之间的相似度生成单个已知事件对所有候选事件的预测概率。
Si=[si1;Si2;...;sim] (9)
其中,Sim是上下文事件ei和候选事件ecm之间的相似度。si∈Rm是第i个上下文事件ei和所有候选事件之间的相似度的串联拼接,将其作为单个已知事件ei对所有候选事件的预测概率。
步骤4.2:根据所述单个已知事件对所有候选事件的预测概率生成所有已知事件对所有候选事件的预测概率。
采用下式将所有单个已知事件的预测概率s1,s2,...,sn进行串联拼接,生成所有已知事件对所有候选事件的预测概率s:
s=[S1;S2;...;sn] (10)
S∈Rnm是所有Si的串联拼接,将其作为所有已知事件对所有候选事件的预测概率;Rnm表示包含nm个元素的一维向量。
步骤4.3:将所有已知事件对所有候选事件的预测概率送入全连接网络进行学习,得到每个候选事件的概率。
给定每个已知事件特征向量与每个候选事件特征向量之间的相似度sij,需要根据相似度,从候选事件中选择出一个与所有已知事件特征最接近的事件。这是一项复杂的决策过程,简单的设定规则不能满足所有情况。因此将所有相似度值s送入一个全连接网络,以学习一种合理的决策方法,由此得到每个候选事件的概率pj:
pj=sWf+bf (11)
其中,Wf∈Rnm×m和bf∈Rm分别是全连接网络的权重和偏差项,Rnm×m表示nm行m列的二维向量,Rm表示包含m个元素的一维向量。pj∈Rm是候选事件ecj的概率。
步骤4.4:选择最大概率对应的候选事件作为所述危机事件的预测事件。
最后通过选择概率最大的候选事件作为危机事件的预测事件:
epredict=arg maxpj (12)
arg maxpj表示选择将最大概率对应的候选事件返回,epredict即为预测事件。
在图4所示的实施例中,采用本发明方法预测出的预测事件为ec3,与图4中所示的正确的后续事件相吻合,说明采用本发明社交媒体危机事件预测方法能够准确从候选事件中选出最可能发生的下一个事件。
本发明社交媒体危机事件预测方法利用卷积神经网络来提取事件特征,利用注意力机制来捕捉事件中重要信息及他们之间的交互信息,使用点乘相似度作为事件特征向量的相似度计算指标,使用全连接网络作为决策方法,能够有效地对事件提取特征,并利用提取到的事件特征来预测下一个可能发生的事件,极大提高了事件预测的鲁棒性和准确性。并且本发明方法不依赖外部知识库,具有很强的通用性,可用于在社交媒体危机事件发生期间预测可能出现的事件,而无需提前建立与危机事件相关的外部知识库。
基于本发明提供的一种社交媒体危机事件预测方法,本发明还提供一种社交媒体危机事件预测系统,所述系统包括:
事件向量生成模块,用于使用预训练词向量GloVe将原始事件表示成事件向量,生成所述原始事件的事件向量;所述原始事件为关于社交媒体中危机事件的已知事件或候选事件;
特征向量获取模块,用于根据所述原始事件的事件向量,使用卷积神经网络和注意力机制获取所述原始事件的特征向量;所述原始事件的特征向量包括已知事件的特征向量和候选事件的特征向量;
相似度计算模块,用于使用点乘相似度计算指标来计算所述已知事件的特征向量和所述候选事件的特征向量之间的相似度;
危机事件预测模块,用于根据所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件。
其中,所述事件向量生成模块具体包括:
论元向量表示单元,用于使用预训练词向量GloVe将原始事件的每个论元表示成论元向量;
事件向量生成单元,用于将所有论元向量并联拼接起来构成所述原始事件的事件向量。
所述特征向量获取模块具体包括:
特征映射提取单元,用于采用不同卷积核窗口大小的卷积神经网络对所述原始事件的事件向量提取特征映射;
自注意力计算单元,用于采用注意力机制计算所述特征映射的自注意力矩阵;
全部特征计算单元,用于根据所述自注意力矩阵计算所述原始事件的全部特征;
特征向量获取单元,用于将所述原始事件的全部特征中的元素展平,作为所述原始事件的特征向量。
所述相似度计算模块具体包括:
相似度计算单元,用于计算所述已知事件的特征向量与所述候选事件的特征向量的内积作为所述已知事件的特征向量和所述候选事件的特征向量之间的相似度。
所述危机事件预测模块具体包括:
第一预测概率生成单元,用于将单个已知事件的特征向量和所有候选事件的特征向量之间的相似度进行串联拼接,生成单个已知事件对所有候选事件的预测概率;
第二预测概率生成单元,用于将所有单个已知事件对所有候选事件的预测概率进行串联拼接,生成所述所有已知事件对所有候选事件的预测概率;
候选事件概率学习单元,用于将所述所有已知事件对所有候选事件的预测概率送入全连接网络进行学习,得到每个候选事件的概率;
危机事件预测单元,用于选择最大概率对应的候选事件作为所述危机事件的预测事件。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种社交媒体危机事件预测方法,其特征在于,包括:
使用预训练词向量GloVe将原始事件表示成事件向量,生成所述原始事件的事件向量;所述原始事件为关于社交媒体中危机事件的已知事件或候选事件;
根据所述原始事件的事件向量,使用卷积神经网络和注意力机制获取所述原始事件的特征向量;所述原始事件的特征向量包括已知事件的特征向量和候选事件的特征向量;
使用点乘相似度计算指标来计算所述已知事件的特征向量和所述候选事件的特征向量之间的相似度;
根据所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件。
2.根据权利要求1所述的方法,其特征在于,所述使用预训练词向量GloVe将原始事件表示成事件向量,生成所述原始事件的事件向量,具体包括:
使用预训练词向量GloVe将原始事件的每个论元表示成论元向量;
将所有论元向量并联拼接起来构成所述原始事件的事件向量。
3.根据权利要求2所述的方法,其特征在于,所述根据所述原始事件的事件向量,使用卷积神经网络和注意力机制获取所述原始事件的特征向量,具体包括:
采用不同卷积核窗口大小的卷积神经网络对所述原始事件的事件向量提取特征映射;
采用注意力机制计算所述特征映射的自注意力矩阵;
根据所述自注意力矩阵计算所述原始事件的全部特征;
将所述原始事件的全部特征中的元素展平,作为所述原始事件的特征向量。
4.根据权利要求3所述的方法,其特征在于,所述使用点乘相似度计算指标来计算所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,具体包括:
计算所述已知事件的特征向量与所述候选事件的特征向量的内积作为所述已知事件的特征向量和所述候选事件的特征向量之间的相似度。
5.根据权利要求4所述的方法,其特征在于,所述根据所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件,具体包括:
根据单个已知事件的特征向量和所有候选事件的特征向量之间的相似度生成单个已知事件对所有候选事件的预测概率;
根据所述单个已知事件对所有候选事件的预测概率生成所有已知事件对所有候选事件的预测概率;
将所述所有已知事件对所有候选事件的预测概率送入全连接网络进行学习,得到每个候选事件的概率;
选择最大概率对应的候选事件作为所述危机事件的预测事件。
6.一种社交媒体危机事件预测系统,其特征在于,包括:
事件向量生成模块,用于使用预训练词向量GloVe将原始事件表示成事件向量,生成所述原始事件的事件向量;所述原始事件为关于社交媒体中危机事件的已知事件或候选事件;
特征向量获取模块,用于根据所述原始事件的事件向量,使用卷积神经网络和注意力机制获取所述原始事件的特征向量;所述原始事件的特征向量包括已知事件的特征向量和候选事件的特征向量;
相似度计算模块,用于使用点乘相似度计算指标来计算所述已知事件的特征向量和所述候选事件的特征向量之间的相似度;
危机事件预测模块,用于根据所述已知事件的特征向量和所述候选事件的特征向量之间的相似度,从多个候选事件中选择出危机事件的预测事件。
7.根据权利要求6所述的系统,其特征在于,所述事件向量生成模块具体包括:
论元向量表示单元,用于使用预训练词向量GloVe将原始事件的每个论元表示成论元向量;
事件向量生成单元,用于将所有论元向量并联拼接起来构成所述原始事件的事件向量。
8.根据权利要求7所述的系统,其特征在于,所述特征向量获取模块具体包括:
特征映射提取单元,用于采用不同卷积核窗口大小的卷积神经网络对所述原始事件的事件向量提取特征映射;
自注意力计算单元,用于采用注意力机制计算所述特征映射的自注意力矩阵;
全部特征计算单元,用于根据所述自注意力矩阵计算所述原始事件的全部特征;
特征向量获取单元,用于将所述原始事件的全部特征中的元素展平,作为所述原始事件的特征向量。
9.根据权利要求8所述的系统,其特征在于,所述相似度计算模块具体包括:
相似度计算单元,用于计算所述已知事件的特征向量与所述候选事件的特征向量的内积作为所述已知事件的特征向量和所述候选事件的特征向量之间的相似度。
10.根据权利要求9所述的系统,其特征在于,所述危机事件预测模块具体包括:
第一预测概率生成单元,用于根据单个已知事件的特征向量和所有候选事件的特征向量之间的相似度生成单个已知事件对所有候选事件的预测概率;
第二预测概率生成单元,用于根据所述单个已知事件对所有候选事件的预测概率生成所有已知事件对所有候选事件的预测概率;
候选事件概率学习单元,用于将所述所有已知事件对所有候选事件的预测概率送入全连接网络进行学习,得到每个候选事件的概率;
危机事件预测单元,用于选择最大概率对应的候选事件作为所述危机事件的预测事件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210201984.4A CN114580738B (zh) | 2022-03-03 | 一种社交媒体危机事件预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210201984.4A CN114580738B (zh) | 2022-03-03 | 一种社交媒体危机事件预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114580738A true CN114580738A (zh) | 2022-06-03 |
CN114580738B CN114580738B (zh) | 2024-05-31 |
Family
ID=
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117131944A (zh) * | 2023-10-24 | 2023-11-28 | 中国电子科技集团公司第十研究所 | 面向多领域的交互式危机事件动态预警方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160328482A1 (en) * | 2015-05-08 | 2016-11-10 | Sameena Shah | Social Media Events Detection and Verification |
CN113361258A (zh) * | 2021-05-17 | 2021-09-07 | 山东师范大学 | 基于图卷积网络和选择注意力的方面级情感分析方法及系统 |
CN113886524A (zh) * | 2021-09-26 | 2022-01-04 | 四川大学 | 一种基于短文本的网络安全威胁事件抽取方法 |
CN114021550A (zh) * | 2021-11-04 | 2022-02-08 | 成都中科信息技术有限公司 | 一种基于图卷积神经网络的新闻趋势预测系统及方法 |
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160328482A1 (en) * | 2015-05-08 | 2016-11-10 | Sameena Shah | Social Media Events Detection and Verification |
CN113361258A (zh) * | 2021-05-17 | 2021-09-07 | 山东师范大学 | 基于图卷积网络和选择注意力的方面级情感分析方法及系统 |
CN113886524A (zh) * | 2021-09-26 | 2022-01-04 | 四川大学 | 一种基于短文本的网络安全威胁事件抽取方法 |
CN114021550A (zh) * | 2021-11-04 | 2022-02-08 | 成都中科信息技术有限公司 | 一种基于图卷积神经网络的新闻趋势预测系统及方法 |
Non-Patent Citations (4)
Title |
---|
YIHONG ZHANG 等: "A General Method for Event Detection on Social Media", 《ARXIV:2106.02250V1》, 4 June 2021 (2021-06-04) * |
徐阳;朱良奇;黄勃;马莉媛;朱翌民;: "基于EEMD-Transformer模型的舆情分析:以COVID-19舆情为例", 武汉大学学报(理学版), no. 05, 10 September 2020 (2020-09-10) * |
朱娜娜;张伟男;韩双梅;马海群;: "基于社会传感器的网络安全态势感知与应急管理模型研究", 智能计算机与应用, no. 06, 26 December 2017 (2017-12-26) * |
王冰玉;吴振宇;沈苏彬;陈佳颖;: "社交媒体事件检测研究综述", 计算机技术与发展, no. 09, 28 April 2018 (2018-04-28) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117131944A (zh) * | 2023-10-24 | 2023-11-28 | 中国电子科技集团公司第十研究所 | 面向多领域的交互式危机事件动态预警方法及系统 |
CN117131944B (zh) * | 2023-10-24 | 2024-01-12 | 中国电子科技集团公司第十研究所 | 面向多领域的交互式危机事件动态预警方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111554268B (zh) | 基于语言模型的语言识别方法、文本分类方法和装置 | |
WO2023065545A1 (zh) | 风险预测方法、装置、设备及存储介质 | |
US11631007B2 (en) | Method and device for text-enhanced knowledge graph joint representation learning | |
CN112487203B (zh) | 一种融入动态词向量的关系抽取系统 | |
Vlad et al. | Sentence-level propaganda detection in news articles with transfer learning and BERT-BiLSTM-capsule model | |
US20230205995A1 (en) | Methods and Systems for Automated Detection of Personal Information Using Neural Networks | |
CN112256866A (zh) | 一种基于深度学习的文本细粒度情感分析方法 | |
Halvardsson et al. | Interpretation of swedish sign language using convolutional neural networks and transfer learning | |
CN112800225B (zh) | 一种微博评论情绪分类方法和系统 | |
CN113254675B (zh) | 基于自适应少样本关系抽取的知识图谱构建方法 | |
WO2019160096A1 (ja) | 関係性推定モデル学習装置、方法、及びプログラム | |
CN113628059A (zh) | 一种基于多层图注意力网络的关联用户识别方法及装置 | |
CN113051922A (zh) | 一种基于深度学习的三元组抽取方法及系统 | |
CN114519613B (zh) | 价格数据的处理方法和装置、电子设备、存储介质 | |
CN112989833A (zh) | 一种基于多层lstm的远程监督实体关系联合抽取方法和系统 | |
Vinod et al. | Natural disaster prediction by using image based deep learning and machine learning | |
CN112148997A (zh) | 一种用于灾害事件检测的多模态对抗模型的训练方法和装置 | |
CN114880427A (zh) | 基于多层级注意力机制的模型、事件论元抽取方法及系统 | |
KR102448044B1 (ko) | 속성 맵을 이용한 속성 기반 감정 분석 방법 및 전자 장치 | |
CN117236676A (zh) | 一种基于多模态事件抽取的rpa流程挖掘方法和装置 | |
CN116561748A (zh) | 一种组件子序列相关性感知的日志异常检测装置 | |
CN113609294B (zh) | 一种基于情感分析的生鲜冷链监管方法及系统 | |
CN113806747B (zh) | 一种木马图片检测方法、系统及计算机可读存储介质 | |
CN114580738A (zh) | 一种社交媒体危机事件预测方法及系统 | |
CN114580738B (zh) | 一种社交媒体危机事件预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |