CN110516166B - 舆情事件处理方法、装置、处理设备及存储介质 - Google Patents

舆情事件处理方法、装置、处理设备及存储介质 Download PDF

Info

Publication number
CN110516166B
CN110516166B CN201910813135.2A CN201910813135A CN110516166B CN 110516166 B CN110516166 B CN 110516166B CN 201910813135 A CN201910813135 A CN 201910813135A CN 110516166 B CN110516166 B CN 110516166B
Authority
CN
China
Prior art keywords
event
representation
information
vectorization
public opinion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910813135.2A
Other languages
English (en)
Other versions
CN110516166A (zh
Inventor
张�杰
吴信东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mininglamp Software System Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN201910813135.2A priority Critical patent/CN110516166B/zh
Publication of CN110516166A publication Critical patent/CN110516166A/zh
Application granted granted Critical
Publication of CN110516166B publication Critical patent/CN110516166B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种舆情事件处理方法、装置、处理设备及存储介质,涉及数据处理技术领域。该方法包括:从舆情文本中抽取事件的元素信息;对事件的元素信息进行向量化,得到事件的单个向量化表示;根据事件的时间信息、及预设网络模型,对事件的单个向量化表示进行处理,得到事件序列的向量化表示。通过对所有单个舆情事件信息进行统一格式的向量化表示,可以降低数据的处理复杂度,然后对一系列事件的单个向量化表示按照时间顺序进行处理,得到事件序列的向量化表示,将多个高维的向量化表示转换为低维连续的向量化表示,可以提升数据的利用率,保证表达的完备性和正交性。

Description

舆情事件处理方法、装置、处理设备及存储介质
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种舆情事件处理方法、装置、处理设备及存储介质。
背景技术
随着互联网技术的发展与网络应用的普及,互联网逐渐成为人们获得信息的最主要的渠道,各类新闻报道、专家评论、网民倾向等网络舆情可以在互联网上飞速传播,并可能对现实社会中的企业、个人造成巨大的后续影响。通常,来自于互联网的各类舆情信息往往是非结构化的文本,通过互联网爬虫获得这些信息相对容易,但如何让计算机自动的对其进行加工处理并计算得出最终想要的结论则非常困难。如果能够及时的获取并高效的处理相关的网络舆情信息,可以为很多企业带来实际的收益或减少未来的损失。
现有技术中,在对舆情信息进行处理时,是基于关键词的信息检索技术,首先确定需要监控的舆情关键词集合,然后从海量的舆情文本中做信息检索,如果发现相关度较高的舆情信息,则提示给业务专家做进一步的过滤和后续处理。
但是,信息检索技术筛选出来的舆情文本误报率较高,且无法梳理出多个文本之间的演进关系,从而导致舆情数据的利用率较低。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供一种舆情事件处理方法、装置、处理设备及存储介质,以便于解决现有技术中存在的舆情数据利用率低的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供了一种舆情事件处理方法,包括:
从舆情文本中抽取事件的元素信息;
对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;
根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示。
可选地,所述从舆情文本中抽取事件的元素信息,包括:
根据预设的事件本体结构,对所述舆情文本进行元素提取,确定所述舆情文本中各类型元素的信息;所述事件本体结构包括:所述事件的元素类型,所述事件的元素信息包括:从所述舆情文本提取的各类型元素的信息。
可选地,所述对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示,包括:
根据预设的向量格式,对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;所述向量格式为各元素信息在向量化表示中的排列格式。
可选地,所述单个向量化表示包括如下至少一组片段:事件类型片段、时间片段、地点片段,文本内容片段;
其中,所述事件类型片段包括:用于指示事件类型的元素信息;所述时间片段包括:用于指示时间的元素信息;所述地点片段包括:用于指示地点的元素信息;所述文本内容片段包括:用于指示文本内容的元素信息。
可选地,所述根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的量化表示,包括:
将所述事件的单个向量化表示,输入预设的第一网络模型,得到所述事件序列的向量化表示,所述事件序列的向量化表示用于指示:所述事件发生时刻之前的,所有事件。
可选地,所述根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的量化表示,包括:
将所述事件的单个向量化表示,输入预设的第二网络模型,得到所述事件序列的向量化表示,所述事件序列的向量化表示用于指示:事件发生时刻之前,预设时间段内的所有事件。
第二方面,本申请实施例还提供了一种舆情事件处理装置,包括:抽取模块、表示模块、及转换模块;
所述抽取模块,用于从舆情文本中抽取事件的元素信息;
所述表示模块,用于对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;
所述转换模块,用于根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示。
可选地,所述抽取模块,具体用于根据预设的事件本体结构,对所述舆情文本进行元素提取,确定所述舆情文本中各类型元素的信息;所述事件本体结构包括:所述事件的元素类型,所述事件的元素信息包括:从所述舆情文本提取的各类型元素的信息。
可选地,所述表示模块,具体用于根据预设的向量格式,对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;所述向量格式为各元素信息在向量化表示中的排列格式。
可选地,所述单个向量化表示包括如下至少一组片段:事件类型片段、时间片段、地点片段,文本内容片段;其中,所述事件类型片段包括:用于指示事件类型的元素信息;所述时间片段包括:用于指示时间的元素信息;所述地点片段包括:用于指示地点的元素信息;所述文本内容片段包括:用于指示文本内容的元素信息。
可选地,所述转换模块,具体用于将所述事件的单个向量化表示,输入预设的第一网络模型,得到所述事件序列的向量化表示,所述事件序列的向量化表示用于指示:所述事件发生时刻之前的,所有事件。
可选地,所述转换模块,具体用于将所述事件的单个向量化表示,输入预设的第二网络模型,得到所述事件序列的向量化表示,所述事件序列的向量化表示用于指示:事件发生时刻之前,预设时间段内的所有事件。
第三方面,本申请实施例还提供一种处理设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的程序指令,当处理设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述程序指令,以执行时执行如上述第一方面所述的舆情事件处理方法的步骤。
第四方面,本申请实施例还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面所述的舆情事件处理方法的步骤。
本申请的有益效果是:本申请实施例提供的舆情事件处理方法、装置、处理设备及存储介质,包括:从舆情文本中抽取事件的元素信息;对事件的元素信息进行向量化,得到事件的单个向量化表示;根据事件的时间信息、及预设网络模型,对事件的单个向量化表示进行处理,得到事件序列的向量化表示。通过对所有单个舆情事件信息进行统一格式的向量化表示,可以降低数据的处理复杂度,然后对一系列事件的单个向量化表示按照时间顺序进行处理,得到事件序列的向量化表示,将多个高维的向量化表示转换为低维连续的向量化表示,可以提升数据的利用率,保证表达的完备性和正交性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种舆情事件处理方法的流程示意图;
图2为本申请实施例提供的一种事件本体结构示意图;
图3为本申请实施例提供的长短期记忆网络模型示意图;
图4为本申请实施例提供的一种双向长短期记忆网络模型示意图;
图5为本申请实施例提供的一种舆情事件处理装置的结构示意图;
图6为本申请实施例提供的另一种舆情事件处理装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
图1为本申请实施例提供的一种舆情事件处理方法的流程示意图;如图1所示,该方法包括:
S101、从舆情文本中抽取事件的元素信息。
可选地,对于实时获取的舆情信息,可以以文本的形式进行记录,以便于用户进行查看,本实施例中,可以从舆情文本中抽取事件的元素信息,其中,事件指示当前待处理的目标事件,而事件的元素信息,可以指示表征事件关键要素的信息,也即构成事件的几大要素。
S102、对事件的元素信息进行向量化,得到事件的单个向量化表示。
可选地,可以采用固定长度的向量表示单个事件,也即将单个事件的元素信息进行向量化。其中,为了使得不同类型事件对应的向量化表示格式统一,降低数据处理的复杂度,便于后续的数据处理,本实施例中,可以设定预设的向量格式,从而将不同类型的事件以相同的向量格式进行向量化表示,也即,不同类型的事件均以相同维度的向量进行表示,从而得到每个事件的向量化表示。
需要说明的是,上述对每个事件进行向量化表示,一方面可以将文本信息转换为数字信息,以便于计算机对数据进行快速的识别和处理,另一方面,可以降低每个事件包含的数据信息的维度,从而加快舆情数据的处理速度。
S103、根据事件的时间信息、及预设网络模型,对事件的单个向量化表示进行处理,得到事件序列的向量化表示。
在一些实施例中,上述步骤S102中是对单个事件进行单个向量化表示,也即,是将每个独立的事件进行向量化表示。本实施例中,是对多个不同事件的单个向量化表示进行综合处理,得到事件的综合向量化表示,也即得到事件序列的向量化表示,这样,可以将一系列单个向量化表示转换为低维连续的向量化表示,从而有效提升数据的利用率,保证数据表达的完备性和正交性。其中,事件序列的向量化表示既涵盖了所有专家能够穷举的信息,又能够包含历史时间信息。
可选地,为了维护不同事件之间的演进关系,本实施例中,在对事件的单个向量化表示进行处理时,可以根据每个事件的时间信息(事件发生时间),按时间顺序将每个事件的单个向量化表示输入至预设网络模型中,并通过预设网络模型进行处理,得到事件序列的向量化表示。其中,对事件的单个向量化表示进行处理,得到的事件序列的向量化表示并非单纯的对每个事件的单个向量化表示进行叠加聚合。根据该事件序列的向量化表示,可以获取不同的舆情事件信息,以及不同事件之间的演进关系,以便于用户及时获取舆情信息,并及时跟进事件的发展动态。
其中,不同事件之间的演进关系,即事件的发展过程,根据不同事件之间的演进关系,可以一定程度上帮助用户进行风险预测,有效避免不必要的损失。
下面,以一个企业内部发生的多个舆情事件为例来说明事件之间的演进关系。例如:企业高管犯错、企业股票下跌、企业还款能力下降、企业贷款信誉下跌等。上述即为事件的演进关系,由于高管犯错导致企业的股票下跌,随之带来还款能力下降,从而影响了企业贷款信誉,可能发生贷不到款的情况等,从而对企业的发展造成了严重的影响。通过利用上述获取的事件的序列向量化表示,可以对不同事件之间的演进关系进行分析,从而有效的预防风险的发生。例如,若某企业同样的发生了高管犯错事件,通过对历史舆情事件的分析,获取事件的演进关系,该企业可以预测到其可能面临股票下跌的风险,故该企业可以及时采取相应的措施,制止股票下跌事件的发生,从而保证企业的正常发展。
综上,本申请实施例提供的舆情事件处理方法,包括:从舆情文本中抽取事件的元素信息;对事件的元素信息进行向量化,得到事件的单个向量化表示;根据事件的时间信息、及预设网络模型,对事件的单个向量化表示进行处理,得到事件序列的向量化表示。通过对所有单个舆情事件信息进行统一格式的向量化表示,可以降低数据的处理复杂度,然后对一系列事件的单个向量化表示按照时间顺序进行处理,得到事件序列的向量化表示,将多个高维的向量化表示转换为低维连续的向量化表示,可以提升数据的利用率,保证表达的完备性和正交性。
进一步地,上述步骤S101中,从舆情文本中抽取事件的元素信息,可以:
根据预设的事件本体结构,对舆情文本进行元素提取,确定舆情文本中各类型元素的信息;事件本体结构包括:事件的元素类型,事件的元素信息包括:从舆情文本提取的各类型元素的信息。
可选地,事件本体结构包含的事件的元素类型可以包括:事件类别、触发词、论元等,但也不限于上述的三种元素类型,可以根据事件的具体内容,进行多类型的划分。其中,事件的类别,也即事件属于哪种事件类型,例如:家庭纠纷、自然灾害、食品安全等。而触发词也即触发生成的事件,例如:火灾事件对应的触发词可以是引起火灾等。而论元包含但不限于:事件发生的时间、地点、人物、组织、时间线;其中,人物、组织还可以进一步分为施动者、被动者,时间线可以包含一个或多个子事件。
图2为本申请实施例提供的一种事件本体结构示意图,如图2所示,以火灾为例,根据预设的事件本体结构,抽取的事件元素信息可以包括:事件类别:火灾;触发词:引起火灾;论元:地点:X市Y区Z小区、时间:6月13日下午2点、组织:救援组织,其中包括:A中队、B中队等。此处不再一一进行列举。
可选地,根据上述预定义的事件本体结构,可以对任意事件进行元素信息抽取,得到事件的元素信息。
进一步地,上述步骤S102中,对事件的元素信息进行向量化,得到事件的单个向量化表示,可以包括:
根据预设的向量格式,对事件的元素信息进行向量化,得到事件的单个向量化表示;向量格式为各元素信息在向量化表示中的排列格式。
可选地,预设的向量格式可以是对事件的不同元素信息所采取的预设的排列方式。通常,对于不同类型事件如何用统一的向量格式来表示,可以有多种处理方法。
本申请实施例中,单个向量化表示可以包括如下至少一组片段:事件类型片段、时间片段、地点片段,文本内容片段。其中,事件类型片段可以包括:用于指示事件类型的元素信息;时间片段可以包括:用于指示时间的元素信息;地点片段可以包括:用于指示地点的元素信息;文本内容片段可以包括:用于指示文本内容的元素信息。
表1为本申请实施例提供的一种单个事件向量化表示示意图,如表1中所示:
表1
Figure BDA0002185095680000101
通常,对于任意的舆情事件文本信息,其对应包含有数字信息及文本信息,其中,事件的发生时间、地点经纬度等均属于数字信息,而事件的起因、组织机构、人物等均属于文本信息,对于文本信息,可以采用上述的词汇袋(Bag-of-words)、词频-逆文本频率指数(TF-IDF)、词向量模型(sentence2vec)、注意力机制(attention)中的任意一种算法进行向量化表示,而对于数字信息,可以根据相应的标志位设置方法进行向量化转换。
例如:事件发生的时间为2019年7月6日,根据该时间信息,可以对于上述表1中时间标识片段中的不同位进行相应的标志位设置,是否属于工作日,是,则标志位为1,否,则为0,是否年底,是,则标志位为1,否,则为0,同理,对于事件类型标识片段,也可以根据上述规则进行标志位设置。而对于地点片段,可以直接将地点对应的经纬度信息以实数的形式进行转化,例如:事件发生地点的经度为160°,则,与经度对应的标志位则为160等。
而对于文本内容片段,根据上述四种不同的算法进行转化,得到的标志位均是不同的,而对于不同的文本内容,可以适应性的选择不同的算法进行转化,例如:对于那些不可以忽视词序,语法和句法的场合均不能采用词汇袋的方法等。需要说明的是,上述文本内容片段中不同的标志位可以是实数,也可以如上述对应置0或置1。具体根据算法的处理规则而决定。
通过上述转换过程,可以将单个事件对应的元素信息转换为单个向量化表示,从而降低了计算机处理事件的复杂度,提高了处理效率。
进一步地,上述步骤S103中,根据事件的时间信息、及预设网络模型,对事件的单个向量化表示进行处理,得到事件序列的量化表示,可以包括:
将事件的单个向量化表示,输入预设的第一网络模型,得到事件序列的向量化表示,事件序列的向量化表示用于指示:事件发生时刻之前的,所有事件。
在一些实施例中,可以采用预设的第一网络模型,对事件发生时刻之前的所有事件的单个向量化表示进行处理,得到事件序列的向量化表示。例如:事件A的发生时刻为t,那么,可以将到t时刻为止,之前发生的所有事件对应的单个向量化表示,按照事件发生时间顺序,输入到该第一网络模型中进行处理,得到事件序列的向量化表示。
该第一网络模型例如可以为长短期记忆网络(Long Short-Term Memory,LSTM)模型。图3为本申请实施例提供的长短期记忆网络(LSTM)模型示意图,如图3所示,A为第一网络模型,也即本实施例中采用的长短期记忆网络,输入Xt为t时刻收集的所有事件的单个向量化表示,而输出ht为到t时刻为止,之前所有事件对应的综合向量化表示,也即上述的事件序列的向量化表示。同样的,ht-1为到t-1时刻为止,之前所有事件对应的综合向量化表示,相应的,其对应的输入为t-1时刻收集的所有事件的单个向量化表示。
进一步地,上述步骤S103中,根据事件的时间信息、及预设网络模型,对事件的单个向量化表示进行处理,得到事件序列的量化表示,还可以包括:
将事件的单个向量化表示,输入预设的第二网络模型,得到事件序列的向量化表示,事件序列的向量化表示用于指示:事件发生时刻之前,预设时间段内的所有事件。
在另一些实施例中,可以采用预设的第二网络模型,对事件发生时刻之前,预设时间段内的所有事件的单个向量化表示进行处理,得到事件序列的向量化表示。也即,无需对事件发生时刻之前的所有事件进行处理,可以根据需求,选择对任意时间段内的事件进行处理。例如:事件A的发生时刻为t,那么,可以将t时刻之前的任意预设时间段内的所有事件对应的单个向量化表示,按照事件发生时间顺序,输入到该第二预设网络模型中进行处理,得到事件序列的向量化表示。
例如:事件的发生时间可以包括:1时刻、2时刻、3时刻、4时刻、5时刻、6时刻,其中,6时刻也即上述的t时刻,那么,上述的任意预设时间段可以是1时刻-3时刻,也可以是3时刻-6时刻,或者是2时刻-4时刻等,这样,我们无需实时的立即对当前时刻下发生的所有事件进行事件序列的向量化表示,例如:对于上个月的所有事件,可以在本月时候再进行事件序列的向量化表示。
该第二网络模型例如可以为双向长短期记忆网络(Bi-LSTM)模型。图4为本申请实施例提供的一种双向长短期记忆网络(Bi-LSTM)模型示意图,如图4所示,其中,h3可以是根据3时刻的事件的单个向量化表示,以及4时刻5时刻的事件序列的向量化表示综合得到。另外,h3也可以是根据3时刻的事件的单个向量化表示,以及2时刻1时刻的事件序列的向量化表示综合得到,也即双向处理。具体地,对于上述的长短期记忆网络以及双向长短期记忆网络的处理逻辑,均属于现有的常规技术,此处不再一一赘述,本申请将其应用到了新的领域,但是对于网络本身结构参数等,并未作改进。
当然对于事件的单个向量化的处理,也可以不限于上述的第一网络模型和第二网络模型。通过上述方法,可以将多个事件的单个向量化表示转换为事件序列的向量化表示,这种低维连续的向量化表示可以有效提升数据的利用率,保证表达的完备性和正交性。
进一步地,上述获取到事件序列的向量化表示之后,可以进一步对其应用。例如:通过事件序列的向量化表示的相似度计算,找到相似的事件序列,或者将事件序列的向量化表当做特征向量用于训练分类模型,或者通过聚类算法做异常检测。例如:可以将计算得到的某一个事件序列的向量化表示作为训练分类模型的特征向量,根据该事件序列的向量化表示中包含的不同事件之间的演进关系,可以得到风险预测模型,根据该模型可以对不同企业进行风险预测。例如:当前某企业发生了高管犯错事件,将其输入到风险预测模型中,可以预测出其将面临企业股票下跌的风险,这样,相关人员可以及时的采取措施进行风险预防,从而减少损失,又或者,该企业还参考其他企业之前已经发生的类似事件,所采取的解决措施的相关经验,进行事件处理,从而提高事件处理效率等。
综上所述,本申请实施例提供的舆情事件处理方法,包括:从舆情文本中抽取事件的元素信息;对事件的元素信息进行向量化,得到事件的单个向量化表示;根据事件的时间信息、及预设网络模型,对事件的单个向量化表示进行处理,得到事件序列的向量化表示。通过对所有单个舆情事件信息进行统一格式的向量化表示,可以降低数据的处理复杂度,然后对一系列事件的单个向量化表示按照时间顺序进行处理,得到事件序列的向量化表示,将多个高维的向量化表示转换为低维连续的向量化表示,可以提升数据的利用率,保证表达的完备性和正交性。同时,将多个事件的单个向量化表示按照事件发生时间顺序输入预设模型,进行处理,保证了不同事件之间的演进关系,从而使得得到的事件序列的向量化表示更具参考价值,利用率更高。
图5为本申请实施例提供的一种舆情事件处理装置的结构示意图,如图5所示,该装置包括抽取模块501、表示模块502及转换模块503;
抽取模块501,用于从舆情文本中抽取事件的元素信息;
表示模块502,用于对事件的元素信息进行向量化,得到事件的单个向量化表示;
转换模块503,用于根据事件的时间信息、及预设网络模型,对事件的单个向量化表示进行处理,得到事件序列的向量化表示。
进一步地,抽取模块501,具体用于根据预设的事件本体结构,对舆情文本进行元素提取,确定舆情文本中各类型元素的信息;事件本体结构包括:事件的元素类型,事件的元素信息包括:从舆情文本提取的各类型元素的信息。
进一步地,表示模块502,具体用于根据预设的向量格式,对事件的元素信息进行向量化,得到事件的单个向量化表示;向量格式为各元素信息在向量化表示中的排列格式。
进一步地,单个向量化表示包括如下至少一组片段:事件类型片段、时间片段、地点片段,文本内容片段;其中,事件类型片段包括:用于指示事件类型的元素信息;时间片段包括:用于指示时间的元素信息;地点片段包括:用于指示地点的元素信息;文本内容片段包括:用于指示文本内容的元素信息。
进一步地,转换模块503,具体用于将事件的单个向量化表示,输入预设的第一网络模型,得到事件序列的向量化表示,事件序列的向量化表示用于指示:事件发生时刻之前的,所有事件。
进一步地,转换模块503,具体用于将事件的单个向量化表示,输入预设的第二网络模型,得到事件序列的向量化表示,事件序列的向量化表示用于指示:事件发生时刻之前,预设时间段内的所有事件。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图6为本申请实施例提供的另一种舆情事件处理装置的结构示意图,该装置可以集成于处理设备或者处理设备的芯片,该处理设备可以是服务器,如用于舆情分析的服务器,或者其它具有舆情分析功能的设备。
该装置包括:处理器701、存储器702。
存储器702用于存储程序,处理器701调用存储器702存储的程序,以执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本发明还提供一种程序产品,例如计算机可读存储介质,包括程序,该程序在被处理器执行时用于执行上述方法实施例。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (9)

1.一种舆情事件处理方法,其特征在于,包括:
从舆情文本中抽取事件的元素信息;
所述从舆情文本中抽取事件的元素信息,包括:
根据预设的事件本体结构,对所述舆情文本进行元素提取,确定所述舆情文本中各类型元素的信息;所述事件本体结构包括:所述事件的元素类型,所述事件的元素信息包括:从所述舆情文本提取的各类型元素的信息;
所述舆情文本信息包括数字信息和文本信息;所述数字信息包括事件发生时间、地点经纬度;所述文本信息包括事件的起因、组织机构、人物;
对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;
所述对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示,包括:
对多个不同类型事件的元素信息采用相同的预设向量格式进行向量化,得到多个不同事件的单个向量化表示,其中所述多个不同事件的单个向量化表示均具有相同的维度;
根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示;
所述根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示,包括:
根据多个不同事件的时间信息,按照多个不同事件发生的时间顺序将所述多个不同事件的单个向量化表示输入至所述预设的网络模型中,通过所述预设的网络模型对所述多个不同事件的单个向量化表示进行处理,得到所述事件序列的向量化表示。
2.如权利要求1所述的方法,其特征在于,所述对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示,包括:
根据预设的向量格式,对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;所述向量格式为各元素信息在向量化表示中的排列格式。
3.如权利要求2所述的方法,其特征在于,所述单个向量化表示包括如下至少一组片段:事件类型片段、时间片段、地点片段,文本内容片段;
其中,所述事件类型片段包括:用于指示事件类型的元素信息;所述时间片段包括:用于指示时间的元素信息;所述地点片段包括:用于指示地点的元素信息;所述文本内容片段包括:用于指示文本内容的元素信息。
4.如权利要求1-3中任一所述的方法,其特征在于,所述根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示,包括:
将所述事件的单个向量化表示,输入预设的第一网络模型,得到所述事件序列的向量化表示,所述事件序列的向量化表示用于指示:所述事件发生时刻之前的,所有事件。
5.如权利要求1-3中任一所述的方法,其特征在于,所述根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的量化表示,包括:
将所述事件的单个向量化表示,输入预设的第二网络模型,得到所述事件序列的向量化表示,所述事件序列的向量化表示用于指示:所述事件发生时刻之前,预设时间段内的所有事件。
6.一种舆情事件处理装置,其特征在于,包括:抽取模块、表示模块、及转换模块;
所述抽取模块,用于从舆情文本中抽取事件的元素信息;
所述抽取模块,具体用于根据预设的事件本体结构,对所述舆情文本进行元素提取,确定所述舆情文本中各类型元素的信息;所述事件本体结构包括:所述事件的元素类型,所述事件的元素信息包括:从所述舆情文本提取的各类型元素的信息;所述舆情文本信息包括数字信息和文本信息;所述数字信息包括事件发生时间、地点经纬度;所述文本信息包括事件的起因、组织机构、人物;
所述表示模块,用于对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;
所述转换模块,用于根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示;
所述表示模块,具体还用于对多个不同类型事件的元素信息采用相同的预设向量格式进行向量化,得到多个不同事件的单个向量化表示,其中所述多个不同事件的单个向量化表示均具有相同的维度;
所述转换模块,具体还用于根据多个不同事件的时间信息,按照多个不同事件发生的时间顺序将所述多个不同事件的单个向量化表示输入至所述预设的网络模型中,通过所述预设的网络模型对所述多个不同事件的单个向量化表示进行处理,得到所述事件序列的向量化表示。
7.如权利要求6所述的装置,其特征在于,所述表示模块,具体用于根据预设的向量格式,对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;所述向量格式为各元素信息在向量化表示中的排列格式。
8.一种处理设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的程序指令,当处理设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述程序指令,以执行时执行如权利要求1至5任一所述的舆情事件处理方法的步骤。
9.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至5任一所述的舆情事件处理方法的步骤。
CN201910813135.2A 2019-08-30 2019-08-30 舆情事件处理方法、装置、处理设备及存储介质 Active CN110516166B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910813135.2A CN110516166B (zh) 2019-08-30 2019-08-30 舆情事件处理方法、装置、处理设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910813135.2A CN110516166B (zh) 2019-08-30 2019-08-30 舆情事件处理方法、装置、处理设备及存储介质

Publications (2)

Publication Number Publication Date
CN110516166A CN110516166A (zh) 2019-11-29
CN110516166B true CN110516166B (zh) 2022-10-25

Family

ID=68629403

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910813135.2A Active CN110516166B (zh) 2019-08-30 2019-08-30 舆情事件处理方法、装置、处理设备及存储介质

Country Status (1)

Country Link
CN (1) CN110516166B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649668A (zh) * 2016-12-14 2017-05-10 华南师范大学 一种基于向量模型的海量时空数据检索方法及系统
CN107193796A (zh) * 2016-03-14 2017-09-22 北大方正集团有限公司 一种舆情事件检测方法及装置
CN108009229A (zh) * 2017-11-29 2018-05-08 厦门市美亚柏科信息股份有限公司 舆情事件数据发现的方法、终端设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8904410B2 (en) * 2012-01-31 2014-12-02 MCube Inc. Methods and apparatus for mobile device event detection
CN104915446B (zh) * 2015-06-29 2019-01-29 华南理工大学 基于新闻的事件演化关系自动提取方法及其系统
CN108519993B (zh) * 2018-03-02 2022-03-29 华南理工大学 基于多数据流计算的社交网络热点事件检测方法
CN109670164B (zh) * 2018-04-11 2024-09-20 东莞迪赛软件技术有限公司 基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法
CN109582785A (zh) * 2018-10-31 2019-04-05 天津大学 基于文本向量与机器学习的突发事件舆情演化分析方法
CN109582796A (zh) * 2018-12-05 2019-04-05 深圳前海微众银行股份有限公司 企业舆情事件网络的生成方法、装置、设备及存储介质
CN110162626A (zh) * 2019-04-26 2019-08-23 湘潭大学 一种基于双向lstm的舆情情感热度熵的计算方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193796A (zh) * 2016-03-14 2017-09-22 北大方正集团有限公司 一种舆情事件检测方法及装置
CN106649668A (zh) * 2016-12-14 2017-05-10 华南师范大学 一种基于向量模型的海量时空数据检索方法及系统
CN108009229A (zh) * 2017-11-29 2018-05-08 厦门市美亚柏科信息股份有限公司 舆情事件数据发现的方法、终端设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Multi-agent Event Detection System using k-Nearest Neighbor Classifier;Nor Surayahani Suriani 等;《2014 International Conference on Electronics, Information and Communications (ICEIC)》;20141002;第1-2页 *
基于规则的离散事件系统模型与规则匹配研究;韩江洪等;《系统仿真学报》;20080320(第06期);第1394-1395页 *

Also Published As

Publication number Publication date
CN110516166A (zh) 2019-11-29

Similar Documents

Publication Publication Date Title
Wu et al. Forecasting the US oil markets based on social media information during the COVID-19 pandemic
Xiao et al. Real-time identification of urban rainstorm waterlogging disasters based on Weibo big data
Deshwal et al. Twitter sentiment analysis using various classification algorithms
US10445354B2 (en) System to determine a credibility weighting for electronic records
Susanti et al. Twitter’s sentiment analysis on GSM services using Multinomial Naïve Bayes
Agarwal Sentiment analysis of financial news
Bogle et al. SentAMaL-a sentiment analysis machine learning stock predictive model
Tyagi et al. Sentiment analysis of product reviews using support vector machine learning algorithm
CN111221881B (zh) 用户特征数据合成方法、装置及电子设备
Fu et al. A sentiment-aware trading volume prediction model for P2P market using LSTM
Kathuria et al. Real time sentiment analysis on twitter data using deep learning (Keras)
Li et al. Stock market analysis using social networks
Sood et al. Review the role of artificial intelligence in detecting and preventing financial fraud using natural language processing
Moh et al. On adverse drug event extractions using twitter sentiment analysis
Reddy et al. Prediction of star ratings from online reviews
WO2022178153A1 (en) Framework for early warning of domain-specific events
Abdullah et al. An introduction to data analytics: its types and its applications
CN110516166B (zh) 舆情事件处理方法、装置、处理设备及存储介质
Zubair et al. Extracting news sentiment and establishing its relationship with the s&p 500 index
Harrag et al. Event extraction based on deep learning in food hazard Arabic texts
CN115495587A (zh) 一种基于知识图谱的告警分析方法及装置
Shokoohyar et al. Exploring the heated debate over reopening for economy or continuing lockdown for public health safety concerns about COVID-19 in Twitter
Angelopoulou et al. Analysis of public sentiment on COVID-19 mitigation measures in social media in the United States using machine learning
Hasan et al. Sentiment analysis on cryptocurrency based on tweets and retweets using support vector machines and chi-square
Mentzingen et al. Joining metadata and textual features to advise administrative courts decisions: a cascading classifier approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant