CN110309312A - 一种关联事件获取方法及装置 - Google Patents
一种关联事件获取方法及装置 Download PDFInfo
- Publication number
- CN110309312A CN110309312A CN201810194654.0A CN201810194654A CN110309312A CN 110309312 A CN110309312 A CN 110309312A CN 201810194654 A CN201810194654 A CN 201810194654A CN 110309312 A CN110309312 A CN 110309312A
- Authority
- CN
- China
- Prior art keywords
- event
- historical events
- keyword
- analyzed
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种关联事件获取方法及装置,在获取待分析事件对应的描述文本后,确定描述文本对应的至少一个关键词,并将至少一个关键词中的至少部分关键词确定为待分析事件的关键词,确定与待分析事件的关键词对应的至少一个预设历史事件图谱,从至少一个预设历史事件图谱中获取与待分析事件相关的历史事件,这样就可以通过所获取的与待分析事件相关的历史事件所在预设历史事件图谱确定待分析事件和相关的历史事件之间的相互关系。
Description
技术领域
本发明涉及网络信息处理技术领域,尤其涉及一种关联事件获取方法及装置。
背景技术
随着互联网的不断普及,人类社会进入信息爆炸时代,在这个信息爆炸时代,每一天用户可通过各种媒介平台接收各类数据信息,例如用户通过各种媒介平台获取各种话题对应的至少一个事件,其中一个话题可经历出现、发展、高潮、平淡到最后结束的历程,在这些历程中出现至少一个事件,且不同历程中的事件存在一些关系。但是现有技术仅能对事件进行罗列,因此通过罗列的事件无法确定这些事件之间的相互关系。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的关联事件获取方法及装置,用于通过所获取的与待分析事件相关的历史事件所在预设历史事件图谱确定待分析事件和相关的历史事件之间的相互关系。技术方案如下:
本发明提供一种关联事件获取方法,所述方法包括:
获取待分析事件对应的描述文本;
确定所述描述文本对应的至少一个关键词,并将所述至少一个关键词中的至少部分关键词确定为所述待分析事件的关键词;
确定与所述待分析事件的关键词对应的至少一个预设历史事件图谱;
从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件。
优选的,所述方法还包括:确定所述待分析事件的关键词对应的标签,所述标签用于表示所述关键词所属的类别;
所述确定与所述待分析事件的关键词对应的预设历史事件图谱包括:确定与所述待分析事件的关键词和所述待分析事件的关键词对应的标签对应的所述预设历史事件图谱。
优选的,所述从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件包括:
从所述至少一个预设历史事件图谱中获取所述待分析事件的相似历史事件,将所述相似历史事件、所述相似历史事件的前置历史事件、以及所述相似历史事件的后置历史事件中的至少之一确定为与所述待分析事件相关的历史事件;
和/或,
从所述至少一个预设历史事件图谱中获取所述待分析事件的前置历史事件和/或后置历史事件,将获取的历史事件确定为与所述待分析事件相关的历史事件。
优选的,从所述至少一个预设历史事件图谱中获取所述待分析事件的相似历史事件包括:
确定所述至少一个预设历史事件图谱中各历史事件的关键词,根据所述待分析事件的关键词和各历史事件的关键词,从所述各历史事件中确定出相似历史事件;
和/或,
确定所述至少一个预设历史事件图谱中各历史事件的事件类型,将所述至少一个预设历史事件图谱中事件类型与所述待分析事件的事件类型相同的历史事件确定为相似历史事件;
和/或,
确定所述至少一个预设历史事件图谱中各历史事件的关键词和各历史事件的事件类型,根据所述各历史事件的事件类型和各历史事件的关键词,从所述至少一个预设历史事件图谱的各历史事件中确定出所述相似历史事件。
优选的,所述确定所述描述文本对应的至少一个关键词包括:从所述描述文本中提取关键词和/或确定从所述描述文本衍生出的关键词;
所述将所述至少一个关键词中的至少部分关键词确定为所述待分析事件的关键词包括:
展示所述描述文本对应的至少一个关键词;
获取用户从展示的至少一个关键词中选定的关键词;
将用户从展示的至少一个关键词中选定的关键词确定为所述待分析事件的关键词。
优选的,所述方法还包括:展示所确定的至少一个预设历史事件图谱;
获取用户从展示的至少一个预设历史事件图谱中选定的预设历史事件图谱;
所述从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件包括:从所述选定的预设历史事件图谱中获取与所述待分析事件相关的历史事件。
优选的,所述方法还包括:根据所述待分析事件和所述待分析事件相关的历史事件,生成所述待分析事件的事件关联图谱。
优选的,每个预设历史事件图谱通过以下方式生成:
获取历史事件对应的描述文本;
基于所述描述文本确定该描述文本的至少一个关键词,并确定该描述文本的至少一个关键词所对应的标签,所述标签用于表示与其对应的关键词所属的类别;
将所述历史事件的关键词中的预设数量的关键词确定为匹配关键词;
对每个所述匹配关键词:根据该匹配关键词和该匹配关键词对应的标签,确定与该匹配关键词对应的至少两个历史事件,并连接所述至少两个历史事件,得到该匹配关键词对应的预设历史事件图谱。
本发明还提供一种关联事件获取装置,所述装置包括:
获取单元,用于获取待分析事件对应的描述文本;
关键词确定单元,用于确定所述描述文本对应的至少一个关键词,并将所述至少一个关键词中的至少部分关键词确定为所述待分析事件的关键词;
图谱确定单元,用于确定与所述待分析事件的关键词对应的至少一个预设历史事件图谱;
事件获取单元,用于从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件。
本发明还提供一种存储介质,所述存储介质上存储有程序,所述程序被处理器执行时实现上述关联事件获取方法。
本发明还提供一种处理器,所述处理器用于运行程序,其中所述程序运行时执行上述关联事件获取方法。
借由上述技术方案,在获取待分析事件对应的描述文本后,确定描述文本对应的至少一个关键词,并将至少一个关键词中的至少部分关键词确定为待分析事件的关键词,确定与待分析事件的关键词对应的至少一个预设历史事件图谱,从至少一个预设历史事件图谱中获取与待分析事件相关的历史事件,这样就可以通过所获取的与待分析事件相关的历史事件所在预设历史事件图谱确定待分析事件和相关的历史事件之间的相互关系。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本公开的示例性实施例提供的一种关联事件获取方法的流程图;
图2示出了本公开的示例性实施例提供的一种预设历史事件图谱的示意图;
图3示出了本公开的示例性实施例提供的预设历史事件图谱生成的流程图;
图4示出了本公开的示例性实施例提供的另一种关联事件获取方法的流程图;
图5示出了本公开的示例性实施例提供的再一种关联事件获取方法的流程图;
图6示出了本公开的示例性实施例提供的一种关联事件获取装置的结构示意图;
图7示出了本公开的示例性实施例提供的另一种关联事件获取装置的结构示意图;
图8示出了本公开的示例性实施例提供的再一种关联事件获取装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
请参阅图1,其示出了本公开的示例性实施例提供的一种关联事件获取方法的流程图,用于通过所获取的与待分析事件相关的历史事件所在预设历史事件图谱确定待分析事件和相关的历史事件之间的相互关系,所述图1 所示关联事件获取方法可以包括以下步骤:
101:获取待分析事件对应的描述文本。其中,待分析事件对应的描述文本用于对待分析事件的发生和影响等等进行描述,该描述文本的获取方式可以是:从各种数据渠道采集至少一个原始文本,所采集的原始文本中描述至少一个事件,根据原始文本的使用情况,确定出可视为待分析事件对应的原始文本,并对待分析事件对应的原始文本进行预处理,得到待分析事件对应的描述文本。
在本示例性实施例中,上述各种数据渠道包括但不限于:历史类论坛、微博和微信等等,而从采集的众多原始文本中确定出可视为待分析事件对应的原始文本的可行方式可以是:根据原始文本的点击次数和/或转发次数,从原始文本中描述的至少一个事件确定出待分析事件,并将描述该待分析事件的原始文本确定为待分析事件对应的原始文本,如将点击次数在预设点击次数范围内和/或转发次数在预设转发次数范围内的原始文本确定为描述文本,由此得到热度高于其他事件的热度的原始文本,从而实现有针对性的对一些待分析事件进行分析监控。对于预设点击次数范围和预设转发次数范围来说,可以根据实际应用而定,本实施例不对其进行限定。
在确定出待分析事件对应的原始文本后,对待分析事件对应的原始文本进行预处理是为了去除原始文本中除描述待分析事件的文本(简称待分析事件对应的描述文本)之外的其他文本,如广告文本和与待分析事件的描述无关的其他文本等,对此本示例性实施例不再阐述。
102:确定描述文本对应的至少一个关键词,并将至少一个关键词中的至少部分关键词确定为待分析事件的关键词。
在本实施例中,确定描述文本对应的至少一个关键词的一种可行方式可以是:从描述文本中提取关键词,如可以通过命名实体识别技术识别出描述文本中具有特定意义的关键词,如通过命名实体识别技术识别出描述文本中涉及的对象(如人、公司或机构等)、时间和可指示出事件类型的动词等实体。
如待分析事件对应的描述文本是:在时间1,用户A和用户B签订《关于商业用房转让协议》,约定将用户A的商业用房转让给用户B,商业用房的情况等等,通过命名实体识别技术可以从描述文本中确定出具有特定意义的实体为:时间1、用户A、用户B和商业用房转让等。
在本实施例中,确定描述文本对应的至少一个关键词的另一种可行方式可以是:确定从描述文本衍生出的关键词,所谓衍生出的关键词可用于表明待分析事件可能演化发展的下一阶段事件对应的关键词,如描述文本是:张三的钱包被偷,则衍生出的关键词是:钱包被偷的处理策略、财产保护方法和财产保全方法。又或者在本实施例中,可以将上述两种确定描述文本对应的至少一个关键词的可行方式结合,如从描述文本中提取关键词和确定从描述文本衍生出的关键词。
而待分析事件的关键词可以视为对待分析事件进行概括的各个关键词,如通过待分析事件的关键词可以确定出待分析事件在何时发生、待分析事件在哪些对象之间发生以及待分析事件属于哪种类型事件等等,为此可以将上述可行方式确定出的关键词中的至少部分确定为待分析事件的关键词。
在将描述文本对应的至少一个关键词确定为待分析事件的关键词时,可以将描述文本对应的全部关键词或者从描述文本对应的全部关键词中选取部分关键词作为待分析事件的关键词,例如可以从描述文本对应的全部关键词中随意选取部分作为待分析事件的关键词,如通过命名实体识别技术识别出的具有特定意义的实体确定为待分析事件的关键词,如上述时间 1、用户A、用户B和商业用房转让等确定为待分析事件的关键词。
又或者采用其他方式确定待分析事件的关键词,如采用的方式可以是:展示描述文本对应的至少一个关键词,如可以在显示区域显示描述文本对应的至少一个关键词;获取用户从展示的至少一个关键词中选定的关键词;将用户从展示的至少一个关键词中选定的关键词确定为待分析事件的关键词。
在上述确定待分析事件的关键词的基础上,进一步的,还可以在显示区域中显示没有基于描述文本对应的词语,获取用户从显示的词语中选取词语作为待分析事件的关键词,和/或在显示区域中显示可供用户写入待分析事件的关键词的文本写入区域,将文本写入区域中写入的词语确定为待分析事件的关键词。
103:确定与待分析事件的关键词对应的至少一个预设历史事件图谱。可以理解的是:预设历史事件图谱是表明多个历史事件之间的相互关系的图谱,以通过相互关系表明处于同一预设历史事件图谱中各个历史事件之间的发展顺序,从而根据发展顺序可以得到预设历史事件图谱中的事件演化过程以及任一历史事件的发展路线。
如图2所示预设历史事件图谱,对于预设历史事件图谱中的各个历史事件,一个历史事件视为预设历史事件图谱中的一个事件节点,且可以以历史事件的关键词(如人名等)作为事件节点的标识,这样在确定待分析事件的关键词之后,可以基于待分析事件的关键词确定出包含有待分析事件的关键词的预设历史事件图谱,即与待分析事件的关键词对应的预设历史事件图谱。并且通过预设历史事件图谱中的多个历史事件之间的发展顺序,得到预设历史事件图谱中的事件演化路线,以事件演化路线指示多个历史事件之间的相互关系,如对于任一历史事件来说,通过事件演化路线确定该历史事件的前置历史事件和/或后置历史事件,其中前置历史事件是指在事件演化过程中位于该历史事件之前发生的事件,即发生时间早于该历史事件的发生时间的事件,而后置历史事件则是指在事件演化过程中位于该历史事件之后发生的事件,即发生时间晚于该历史事件的发生时间的事件,其中发生时间用于指示历史事件的发生前后顺序。
对于历史事件的关键词的获取方式请参阅待分析事件的关键词的获取方式,对此本实施例不再阐述。而预设历史事件图谱可以通过图3所示方式生成,图3所示预设历史事件图谱生成过程可以包括以下步骤:
301:获取历史事件对应的描述文本,如采用上述待分析事件对应的描述文本的获取方式来获取历史事件对应的描述文本。
302:基于描述文本确定该描述文本的至少一个关键词,并确定该描述文本的至少一个关键词所对应的标签,如从该描述文本中提取关键词和/或确定从该描述文本衍生出的关键词,具体请参阅上述确定待分析事件对应的描述文本对应的关键词的说明。
标签用于表示与其对应的关键词所属的类别,在本实施例中,可以预先设置描述文本的至少一个关键词与标签的对应关系,这样在提取出关键词之后,根据预先设置的关键词与标签的对应关系,确定出关键词对应的标签。
以关键词为表示人、公司、机构的关键词为例,对于表示人的关键词来说,其对应的标签关键词包括但不限于律师、演员等职位标签;对于表示公司的关键词来说,其对应的标签关键词包括但不限于科技类公司、金融类公司等公司类型标签;对于表示机构的关键词来说,其对应的标签关键词包括但不限于政府机构、私企、公益机构等机构类型标签,而可指示事件类型的动词,其对应的标签可以是事件类型标签。
303:将历史事件的关键词中的预设数量的关键词确定为匹配关键词。其中,预设数量可以是一个或者多个,具体可以根据实际应用而定。相对于作为匹配关键词的关键词来说,可以从一个或多个历史事件的所有关键词中随机选取预设数量的关键词,或者可以根据多个历史事件的关键词的使用情况选取,如获取每个关键词在多个历史事件对应的描述文本中的出现次数,选取预设数量的出现次数大于其他关键词的出现次数的关键词,将所选取出的关键词作为匹配关键词。
以多个历史事件的关键词为:人名1、人名2、公司1、公司2和机构 3这五个关键词,预设数量为两个为例,在本实施例中可以从这五个关键词中随机选取两个关键词,如人名1和公司1分别作为匹配关键词,或者在本实施例中这五个关键词的出现次数分别是:10、12、5、20和21,则选取出现次数在前两位的关键词公司2和机构3作为匹配关键词。
304:对每个匹配关键词:根据该匹配关键词和该匹配关键词对应的标签,确定与该匹配关键词对应的至少两个历史事件,并连接至少两个历史事件,得到该匹配关键词对应的预设历史事件图谱。
其中根据该匹配关键词和该匹配关键词对应的标签,确定与该匹配关键词对应的至少两个历史事件是因为一些匹配关键词相同,但是各自对应的标签不同,如表示人的匹配关键词为人名的情况下,同一个人名的两个人供职两种职位,这就意味着这两个人的人名对应不同的标签,进而需要将这两个人对应的历史事件进行区分,所以本实施例需要同时根据匹配关键词和该匹配关键词对应的标签,确定匹配关键词对应的至少两个历史事件,从而实现确定出对应同一匹配关键词且匹配关键词对应的标签相同的至少两个历史事件。
在确定与该匹配关键词对应的至少两个历史事件的情况下,可以根据至少两个历史事件的发生时间连接至少两个历史事件,从而得到该匹配关键词对应的预设历史事件图谱。在这里需要说明的一点是:预设历史事件图谱可以是单一的匹配关键词对应的图谱,也可以是多个匹配关键词串联得到的图谱,如图2所示预设历史事件图谱,经过人名1和人名2得到针对多个匹配关键词的图谱。
相对应的,在预设历史事件图谱根据历史事件的匹配关键词和匹配关键词对应的标签生成的情况下,为了提高与待分析事件对应的预设历史事件图谱的准确度,本实施例提供的关联事件获取方法在图1所示基础上还包括:确定待分析事件的关键词对应的标签,标签用于表示关键词所属的类别,这样在确定待分析事件对应的预设历史事件图谱时,可以确定与待分析事件的关键词和待分析事件的关键词对应的标签对应的预设历史事件图谱,从而自动过滤包括待分析事件的关键词但与待分析事件的关键词对应的标签不同的预设历史事件,提高确定出的预设历史事件图谱的准确度。
104:从至少一个预设历史事件图谱中获取与待分析事件相关的历史事件。在实施例中,获取与待分析事件相关的历史事件的可行方式包括但不限于如下方式:
一种获取相关的历史事件方式:从至少一个预设历史事件图谱中获取待分析事件的前置历史事件和/或后置历史事件,将获取的历史事件确定为与待分析事件相关的历史事件,即在预设历史事件图谱中确定待分析事件对应的事件节点,并从该预设历史事件图谱中获取该事件节点的前置历史事件和该事件节点的后置历史事件中的至少一个历史事件,其中该事件节点的前置历史事件可以是该事件节点之前的第一个前置历史事件至第N个前置历史事件中的至少一个,该事件节点的后置历史事件可以是该事件节点之后的第一个后置历史事件至第M个后置历史事件中的至少一个,N和 M分别是大于1的自然数,且N小于或等于该事件节点之前的前置历史事件总数,M小于或等于该事件节点之后的后置历史事件总数。若该事件节点为预设历史事件图谱中的最后一个节点,则获取待分析事件的前置历史事件;若该事件节点为预设历史事件图谱中的第一个节点,则获取待分析事件的后置历史事件。
另一种获取相关的历史事件方式:从至少一个预设历史事件图谱中获取待分析事件的相似历史事件,将相似历史事件、相似历史事件的前置历史事件、以及相似历史事件的后置历史事件中的至少之一确定为与待分析事件相关的历史事件。
以上两种获取相关历史事件的方式可以组合使用。
另外,可以理解的是:待分析事件的相似历史事件是与待分析事件具有相似点或相同点的历史事件,如待分析事件的相似历史事件是与待分析事件具有至少一个相同或相似关键词的历史事件、与待分析事件属于同一事件类型的历史事件、与待分析事件属于同一类事件且具有至少一个相同关键词的历史事件中的至少一种,对于待分析事件的相似历史事件的获取方式可参阅以下但不限于以下方式:
第一种获取相似历史事件方式:确定至少一个预设历史事件图谱中各历史事件的关键词,根据待分析事件的关键词和各历史事件的关键词,从各历史事件中确定出相似历史事件。
其中根据待分析事件的关键词和各历史事件的关键词,从各历史事件中确定出相似历史事件的可行方式可以是:根据待分析事件的关键词和各历史事件的关键词,得到待分析事件与任一历史事件的相似度,并根据待分析事件与任一历史事件的相似度,从各历史事件中确定出相似历史事件。
而待分析事件与任一历史事件的相似度的表现形式可以但不限于是:待分析事件与任一历史事件中相同的关键词的个数,或者可以对待分析事件和任一历史事件中的关键词进行运算,得到关键词的词语相似度。在确定出待分析事件与任一历史事件的相似度后,可以选取符合预设条件的历史事件为待分析事件的相似历史事件,如选取相似度高于其他历史事件的相似度的历史事件为相似历史事件或者选取相似度位于预设相似度范围的历史事件为相似历史事件,具体预设条件可以根据实际应用而定,对此本示例性实施例不加以限制。
如待分析事件对应的描述文本是:霍去病攻打匈奴,得到的待分析事件的关键词可以有:霍去病和攻打匈奴,则在确定出的预设历史事件图谱中包含霍去病和攻打匈奴中的至少一个关键词的历史事件可以视为待分析事件的相似历史事件。
第二种获取相似历史事件方式:确定至少一个预设历史事件图谱中各历史事件的事件类型,将至少一个预设历史事件图谱中事件类型与待分析事件的事件类型相同的历史事件确定为相似历史事件,即将预设历史事件图谱中与待分析事件为同一类事件的历史事件确定为相似历史事件。
在本实施例中确定历史事件和待分析事件是否属于同一类事件的可行方式是:根据历史事件和待分析事件的事件类型标签确定,若历史事件和待分析事件的事件类型标签相同,则视历史事件和待分析事件属于同一类事件。
其中确定历史事件和待分析事件的事件类型标签相同的可行方式可以是:统计用于指示历史事件的事件类型的动词和用于指示待分析事件的事件类型的动词中相同动词的个数,若相同动词的个数不小于预设阈值,则确定历史事件和待分析事件的事件类型标签相同,对于预设阈值可以根据实际应用而定,对此本示例性实施例不加以限制。
仍以上述待分析事件对应的描述文本是:霍去病攻打匈奴为例,对于这一待分析事件可以确定出待分析事件为战争事件,则可以从预设历史事件图谱中确定同属于战争事件的历史事件为该待分析事件的相似历史事件。
第三种获取相似历史事件方式:确定至少一个预设历史事件图谱中各历史事件的关键词和各历史事件的事件类型,根据各历史事件的事件类型和各历史事件的关键词,从至少一个预设历史事件图谱的各历史事件中确定出相似历史事件,以使得确定出的相似历史事件为与待分析事件属于同一类事件且具有至少一个相同关键词的历史事件,具体的可以基于上述第二种获取相似历史事件方式确定出属于同一类事件的历史事件,然后再基于上述第一种获取相似历史事件方式从同一类事件的历史事件中选取出相似历史事件,或者基于上述第一种获取相似历史事件方式确定出具有至少一个相同或相似关键词的历史事件,然后再基于第二种获取相似历史事件方式从具有至少一个相同或相似关键词的历史事件选取出相似历史事件,具体请参阅上述两种获取相似历史事件方式的说明,对此不再详述。
仍以上述待分析事件对应的描述文本是:霍去病攻打匈奴为例,对于这一待分析事件可以确定出的相似历史事件是:事件类型属于战争事件且包含霍去病和攻打匈奴中的至少一个关键词的历史事件。
另外以上三种获取相似历史事件方式可以组合使用。
从上述技术方案可知,在获取待分析事件对应的描述文本后,确定描述文本对应的至少一个关键词,并将至少一个关键词中的至少部分关键词确定为待分析事件的关键词,确定与待分析事件的关键词对应的至少一个预设历史事件图谱,从至少一个预设历史事件图谱中获取与待分析事件相关的历史事件,这样就可以通过所获取的与待分析事件相关的历史事件所在预设历史事件图谱确定待分析事件和相关的历史事件之间的相互关系。
由于预设历史事件图谱的待分析事件和相关的历史事件之间可能包含其他历史事件,使得无法直接体现待分析事件和相关的历史事件之间的相互关系,为此本实施例提供的关联事件获取方法还可以如图4所示,在图1 基础上还包括以下步骤:
105:根据待分析事件和待分析事件相关的历史事件,生成待分析事件的事件关联图谱,使得待分析事件的事件关联图谱中仅包括待分析事件和待分析事件相关的历史事件,从而可以根据待分析事件的事件关联图谱中的事件演化路线确定待分析事件和待分析事件相关的历史事件之间的相互关系。
在本实施例中,生成待分析事件的事件关联图谱的可行方式可以是:可以根据待分析事件和待分析事件相关的历史事件各自的发生时间连接待分析事件和待分析事件相关的历史事件,从而得到待分析事件的事件关联图谱。
仍以上述待分析事件对应的描述文本是:霍去病攻打匈奴为例,对于这一待分析事件:霍去病攻打匈奴来说,其相关的历史事件有:关于霍去病的其他历史事件和除霍去病之外的其他人攻打匈奴的历史事件,则可以根据这些事件各自的发生时间连接这些事件,得到该待分析事件的事件关联图谱。
请参阅图5,其示出了本公开的示例性实施例提供的再一种关联事件获取方法的流程图,可以包括以下步骤:
501:获取待分析事件对应的描述文本。
502:确定描述文本对应的至少一个关键词,并将至少一个关键词中的至少部分关键词确定为待分析事件的关键词。
503:确定与待分析事件的关键词对应的至少一个预设历史事件图谱。
在本实施例中,步骤501至步骤503:与步骤101至步骤103相同,对此本实施例不再对步骤501至步骤503进行详细描述。
504:展示所确定的至少一个预设历史事件图谱,如可以在显示区域显示所确定的至少一个预设历史事件图谱。
505:获取用户从展示的至少一个预设历史事件图谱中选定的预设历史事件图谱。在本实施例中,用户可以对展示的至少一个预设历史事件图谱进行选定,也可以对预设历史事件图谱中的历史事件进行选定,以实现由用户根据用户自身需求对预设历史事件图谱进行删减,从而去除与用户自身需求不相符的预设历史事件图谱和历史事件。
506:从选定的预设历史事件图谱中获取与待分析事件相关的历史事件,具体可以参阅上述步骤104中的相关说明,对此本实施例不再阐述。
从上述技术方案可知,通过获取用户从展示的至少一个预设历史事件图谱中选定的预设历史事件图谱的方式,可以去除与用户自身需求不相符的预设历史事件图谱和历史事件,这样从选定的预设历史事件图谱中获取的与待分析事件相关的历史事件更接近于用户自身需求,提高事件获取准确度。
与上述方法实施例相对应,本公开的示例性实施例还提供一种关联事件获取装置,其结构示意图如图6所示,可以包括:获取单元11、关键词确定单元12、图谱确定单元13和事件获取单元14。
获取单元11,用于获取待分析事件对应的描述文本。其中,待分析事件对应的描述文本用于对待分析事件的发生和影响等等进行描述,该描述文本的获取方式可以参阅方法实施例中的相关说明,对此本实施例不再阐述。
关键词确定单元12,用于确定描述文本对应的至少一个关键词,并将至少一个关键词中的至少部分关键词确定为待分析事件的关键词。
在本实施例中,确定描述文本对应的至少一个关键词的一种可行方式可以是:从描述文本中提取关键词,如可以通过命名实体识别技术识别出描述文本中具有特定意义的关键词,如通过命名实体识别技术识别出描述文本中涉及的对象(如人、公司或机构等)、时间和可指示出事件类型的动词等实体。
在本实施例中,确定描述文本对应的至少一个关键词的另一种可行方式可以是:确定从描述文本衍生出的关键词,所谓衍生出的关键词可用于表明待分析事件可能演化发展的下一阶段事件对应的关键词,如描述文本是:张三的钱包被偷,则衍生出的关键词是:钱包被偷的处理策略、财产保护方法和财产保全方法。又或者在本实施例中,可以将上述两种确定描述文本对应的至少一个关键词的可行方式结合,如从描述文本中提取关键词和确定从描述文本衍生出的关键词。
在将描述文本对应的至少一个关键词确定为待分析事件的关键词时,关键词确定单元12可以将描述文本对应的全部关键词或者从描述文本对应的全部关键词中选取部分关键词作为待分析事件的关键词,例如可以从描述文本对应的全部关键词中随意选取部分作为待分析事件的关键词,如通过命名实体识别技术识别出的具有特定意义的实体确定为待分析事件的关键词,如上述时间1、用户A、用户B和商业用房转让等确定为待分析事件的关键词。
又或者采用其他方式确定待分析事件的关键词,如采用的方式可以是:展示描述文本对应的至少一个关键词,如可以在显示区域显示描述文本对应的至少一个关键词;获取用户从展示的至少一个关键词中选定的关键词;将用户从展示的至少一个关键词中选定的关键词确定为待分析事件的关键词。
在上述确定待分析事件的关键词的基础上,进一步的,还可以在显示区域中显示没有基于描述文本对应的词语,获取用户从显示的词语中选取词语作为待分析事件的关键词,和/或在显示区域中显示可供用户写入待分析事件的关键词的文本写入区域,将文本写入区域中写入的词语确定为待分析事件的关键词。
图谱确定单元13,用于确定与待分析事件的关键词对应的至少一个预设历史事件图谱。可以理解的是:预设历史事件图谱是表明多个历史事件之间的相互关系的图谱,以通过相互关系表明处于同一预设历史事件图谱中各个历史事件之间的发展顺序,从而根据发展顺序可以得到预设历史事件图谱中的事件演化过程以及任一历史事件的发展路线。
其中预设历史事件图谱可以以历史事件的关键词(如人名等)作为事件节点的标识,这样图谱确定单元13可以基于待分析事件的关键词确定出包含有待分析事件的关键词的预设历史事件图谱,即与待分析事件的关键词对应的预设历史事件图谱,对于预设历史事件图谱的生成过程请参阅方法实施例中的相关说明,对此本实施例不再阐述。
在这里需要说明的一点是:在预设历史事件图谱根据历史事件的匹配关键词和匹配关键词对应的标签生成的情况下,为了提高与待分析事件对应的预设历史事件图谱的准确度,本实施例提供的关联事件获取装置在图6 所示基础上还包括:标签确定单元,用于确定待分析事件的关键词对应的标签,标签用于表示关键词所属的类别,这样在确定待分析事件对应的预设历史事件图谱时,图谱确定单元13可以确定与待分析事件的关键词和待分析事件的关键词对应的标签对应的预设历史事件图谱,从而自动过滤包括待分析事件的关键词但与待分析事件的关键词对应的标签不同的预设历史事件,提高确定出的预设历史事件图谱的准确度。
事件获取单元14,用于从至少一个预设历史事件图谱中获取与待分析事件相关的历史事件。在实施例中,获取与待分析事件相关的历史事件的可行方式包括但不限于如下方式:
一种获取相关的历史事件方式:从至少一个预设历史事件图谱中获取待分析事件的前置历史事件和/或后置历史事件,将获取的历史事件确定为与待分析事件相关的历史事件,即在预设历史事件图谱中确定待分析事件对应的事件节点,并从该预设历史事件图谱中获取该事件节点的前置历史事件和该事件节点的后置历史事件中的至少一个历史事件,其中该事件节点的前置历史事件可以是该事件节点之前的第一个前置历史事件至第N个前置历史事件中的至少一个,该事件节点的后置历史事件可以是该事件节点之后的第一个后置历史事件至第M个后置历史事件中的至少一个,N和 M分别是大于1的自然数,且N小于或等于该事件节点之前的前置历史事件总数,M小于或等于该事件节点之后的后置历史事件总数。若该事件节点为预设历史事件图谱中的最后一个节点,则获取待分析事件的前置历史事件;若该事件节点为预设历史事件图谱中的第一个节点,则获取待分析事件的后置历史事件。
另一种获取相关的历史事件方式:从至少一个预设历史事件图谱中获取待分析事件的相似历史事件,将相似历史事件、相似历史事件的前置历史事件、以及相似历史事件的后置历史事件中的至少之一确定为与待分析事件相关的历史事件。
以上两种获取相关历史事件的方式可以组合使用,对于前置历史事件和后置历史事件的说明请参阅方法实施例中的相关说明,对此本实施例不再阐述。
另外,可以理解的是:待分析事件的相似历史事件是与待分析事件具有相似点或相同点的历史事件,如待分析事件的相似历史事件是与待分析事件具有至少一个相同或相似关键词的历史事件、与待分析事件属于同一事件类型的历史事件、与待分析事件属于同一类事件且具有至少一个相同关键词的历史事件中的至少一种,对于待分析事件的相似历史事件的获取方式可参阅以下但不限于以下方式:
第一种获取相似历史事件方式:确定至少一个预设历史事件图谱中各历史事件的关键词,根据待分析事件的关键词和各历史事件的关键词,从各历史事件中确定出相似历史事件。
其中根据待分析事件的关键词和各历史事件的关键词,从各历史事件中确定出相似历史事件的可行方式可以是:根据待分析事件的关键词和各历史事件的关键词,得到待分析事件与任一历史事件的相似度,并根据待分析事件与任一历史事件的相似度,从各历史事件中确定出相似历史事件。
而待分析事件与任一历史事件的相似度的表现形式可以但不限于是:待分析事件与任一历史事件中相同的关键词的个数,或者可以对待分析事件和任一历史事件中的关键词进行运算,得到关键词的词语相似度。在确定出待分析事件与任一历史事件的相似度后,可以选取符合预设条件的历史事件为待分析事件的相似历史事件,如选取相似度高于其他历史事件的相似度的历史事件为相似历史事件或者选取相似度位于预设相似度范围的历史事件为相似历史事件,具体预设条件可以根据实际应用而定,对此本示例性实施例不加以限制。
如待分析事件对应的描述文本是:霍去病攻打匈奴,得到的待分析事件的关键词可以有:霍去病和攻打匈奴,则在确定出的预设历史事件图谱中包含霍去病和攻打匈奴中的至少一个关键词的历史事件可以视为待分析事件的相似历史事件。
第二种获取相似历史事件方式:确定至少一个预设历史事件图谱中各历史事件的事件类型,将至少一个预设历史事件图谱中事件类型与待分析事件的事件类型相同的历史事件确定为相似历史事件,即将预设历史事件图谱中与待分析事件为同一类事件的历史事件确定为相似历史事件。
在本实施例中确定历史事件和待分析事件是否属于同一类事件的可行方式是:根据历史事件和待分析事件的事件类型标签确定,若历史事件和待分析事件的事件类型标签相同,则视历史事件和待分析事件属于同一类事件。
其中确定历史事件和待分析事件的事件类型标签相同的可行方式可以是:统计用于指示历史事件的事件类型的动词和用于指示待分析事件的事件类型的动词中相同动词的个数,若相同动词的个数不小于预设阈值,则确定历史事件和待分析事件的事件类型标签相同,对于预设阈值可以根据实际应用而定,对此本示例性实施例不加以限制。
仍以上述待分析事件对应的描述文本是:霍去病攻打匈奴为例,对于这一待分析事件可以确定出待分析事件为战争事件,则可以从预设历史事件图谱中确定同属于战争事件的历史事件为该待分析事件的相似历史事件。
第三种获取相似历史事件方式:确定至少一个预设历史事件图谱中各历史事件的关键词和各历史事件的事件类型,根据各历史事件的事件类型和各历史事件的关键词,从至少一个预设历史事件图谱的各历史事件中确定出相似历史事件,以使得确定出的相似历史事件为与待分析事件属于同一类事件且具有至少一个相同关键词的历史事件,具体的可以基于上述第二种获取相似历史事件方式确定出属于同一类事件的历史事件,然后再基于上述第一种获取相似历史事件方式从同一类事件的历史事件中选取出相似历史事件,或者基于上述第一种获取相似历史事件方式确定出具有至少一个相同或相似关键词的历史事件,然后再基于第二种获取相似历史事件方式从具有至少一个相同或相似关键词的历史事件选取出相似历史事件,具体请参阅上述两种获取相似历史事件方式的说明,对此不再详述。
仍以上述待分析事件对应的描述文本是:霍去病攻打匈奴为例,对于这一待分析事件可以确定出的相似历史事件是:事件类型属于战争事件且包含霍去病和攻打匈奴中的至少一个关键词的历史事件。
另外以上三种获取相似历史事件方式可以组合使用。
从上述技术方案可知,在获取待分析事件对应的描述文本后,确定描述文本对应的至少一个关键词,并将至少一个关键词中的至少部分关键词确定为待分析事件的关键词,确定与待分析事件的关键词对应的至少一个预设历史事件图谱,从至少一个预设历史事件图谱中获取与待分析事件相关的历史事件,这样就可以通过所获取的与待分析事件相关的历史事件所在预设历史事件图谱确定待分析事件和相关的历史事件之间的相互关系。
由于预设历史事件图谱的待分析事件和相关的历史事件之间可能包含其他历史事件,使得无法直接体现待分析事件和相关的历史事件之间的相互关系,为此本实施例提供的关联事件获取装置还可以如图7所示,在图6 基础上还包括:图谱生成单元15,用于根据待分析事件和待分析事件相关的历史事件,生成待分析事件的事件关联图谱,使得待分析事件的事件关联图谱中仅包括待分析事件和待分析事件相关的历史事件,从而可以根据待分析事件的事件关联图谱中的事件演化路线确定待分析事件和待分析事件相关的历史事件之间的相互关系。
在本实施例中,生成待分析事件的事件关联图谱的可行方式可以是:可以根据待分析事件和待分析事件相关的历史事件各自的发生时间连接待分析事件和待分析事件相关的历史事件,从而得到待分析事件的事件关联图谱。
仍以上述待分析事件对应的描述文本是:霍去病攻打匈奴为例,对于这一待分析事件:霍去病攻打匈奴来说,其相关的历史事件有:关于霍去病的其他历史事件和除霍去病之外的其他人攻打匈奴的历史事件,则可以根据这些事件各自的发生时间连接这些事件,得到该待分析事件的事件关联图谱。
请参阅图8,其示出了本公开的示例性实施例提供的再一种关联事件获取装置的结构,在图6基础上还可以包括:展示单元16和图谱获取单元17。
展示单元16,用于展示所确定的至少一个预设历史事件图谱,如可以在显示区域显示所确定的至少一个预设历史事件图谱。
图谱获取单元17,用于获取用户从展示的至少一个预设历史事件图谱中选定的预设历史事件图谱。在本实施例中,用户可以对展示的至少一个预设历史事件图谱进行选定,也可以对预设历史事件图谱中的历史事件进行选定,以实现由用户根据用户自身需求对预设历史事件图谱进行删减,从而去除与用户自身需求不相符的预设历史事件图谱和历史事件。
事件获取单元14,具体用于从选定的预设历史事件图谱中获取与待分析事件相关的历史事件。
从上述技术方案可知,通过获取用户从展示的至少一个预设历史事件图谱中选定的预设历史事件图谱的方式,可以去除与用户自身需求不相符的预设历史事件图谱和历史事件,这样从选定的预设历史事件图谱中获取的与待分析事件相关的历史事件更接近于用户自身需求,提高事件获取准确度。
当然,上述展示单元16和图谱获取单元17还可以包括在图7所示关联事件获取装置,对此本实施例不再阐述。
所述关联事件获取装置包括处理器和存储器,上述获取单元11、关键词确定单元12、图谱确定单元13、事件获取单元14、图谱生成单元15、展示单元16和图谱获取单元17等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来通过所获取的与待分析事件相关的历史事件所在预设历史事件图谱确定待分析事件和相关的历史事件之间的相互关系。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述关联事件获取方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述关联事件获取方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获取待分析事件对应的描述文本;
确定所述描述文本对应的至少一个关键词,并将所述至少一个关键词中的至少部分关键词确定为所述待分析事件的关键词;
确定与所述待分析事件的关键词对应的至少一个预设历史事件图谱;
从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件。
优选的,处理器执行程序时还实现以下步骤:确定所述待分析事件的关键词对应的标签,所述标签用于表示所述关键词所属的类别;
所述确定与所述待分析事件的关键词对应的预设历史事件图谱包括:确定与所述待分析事件的关键词和所述待分析事件的关键词对应的标签对应的所述预设历史事件图谱。
优选的,所述从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件包括:
从所述至少一个预设历史事件图谱中获取所述待分析事件的相似历史事件,将所述相似历史事件、所述相似历史事件的前置历史事件、以及所述相似历史事件的后置历史事件中的至少之一确定为与所述待分析事件相关的历史事件;
和/或,
从所述至少一个预设历史事件图谱中获取所述待分析事件的前置历史事件和/或后置历史事件,将获取的历史事件确定为与所述待分析事件相关的历史事件。
优选的,从所述至少一个预设历史事件图谱中获取所述待分析事件的相似历史事件包括:
确定所述至少一个预设历史事件图谱中各历史事件的关键词,根据所述待分析事件的关键词和各历史事件的关键词,从所述各历史事件中确定出相似历史事件;
和/或,
确定所述至少一个预设历史事件图谱中各历史事件的事件类型,将所述至少一个预设历史事件图谱中事件类型与所述待分析事件的事件类型相同的历史事件确定为相似历史事件;
和/或,
确定所述至少一个预设历史事件图谱中各历史事件的关键词和各历史事件的事件类型,根据所述各历史事件的事件类型和各历史事件的关键词,从所述至少一个预设历史事件图谱的各历史事件中确定出所述相似历史事件。
优选的,所述确定所述描述文本对应的至少一个关键词包括:从所述描述文本中提取关键词和/或确定从所述描述文本衍生出的关键词;
所述将所述至少一个关键词中的至少部分关键词确定为所述待分析事件的关键词包括:
展示所述描述文本对应的至少一个关键词;
获取用户从展示的至少一个关键词中选定的关键词;
将用户从展示的至少一个关键词中选定的关键词确定为所述待分析事件的关键词。
优选的,处理器执行程序时还实现以下步骤:展示所确定的至少一个预设历史事件图谱;
获取用户从展示的至少一个预设历史事件图谱中选定的预设历史事件图谱;
所述从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件包括:从所述选定的预设历史事件图谱中获取与所述待分析事件相关的历史事件。
优选的,处理器执行程序时还实现以下步骤:根据所述待分析事件和所述待分析事件相关的历史事件,生成所述待分析事件的事件关联图谱。
优选的,每个预设历史事件图谱通过以下方式生成:
获取历史事件对应的描述文本;
基于所述描述文本确定该描述文本的至少一个关键词,并确定该描述文本的至少一个关键词所对应的标签,所述标签用于表示与其对应的关键词所属的类别;
将所述历史事件的关键词中的预设数量的关键词确定为匹配关键词;
对每个所述匹配关键词:根据该匹配关键词和该匹配关键词对应的标签,确定与该匹配关键词对应的至少两个历史事件,并连接所述至少两个历史事件,得到该匹配关键词对应的预设历史事件图谱。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取待分析事件对应的描述文本;
确定所述描述文本对应的至少一个关键词,并将所述至少一个关键词中的至少部分关键词确定为所述待分析事件的关键词;
确定与所述待分析事件的关键词对应的至少一个预设历史事件图谱;
从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件。
优选的,当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:确定所述待分析事件的关键词对应的标签,所述标签用于表示所述关键词所属的类别;
所述确定与所述待分析事件的关键词对应的预设历史事件图谱包括:确定与所述待分析事件的关键词和所述待分析事件的关键词对应的标签对应的所述预设历史事件图谱。
优选的,所述从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件包括:
从所述至少一个预设历史事件图谱中获取所述待分析事件的相似历史事件,将所述相似历史事件、所述相似历史事件的前置历史事件、以及所述相似历史事件的后置历史事件中的至少之一确定为与所述待分析事件相关的历史事件;
和/或,
从所述至少一个预设历史事件图谱中获取所述待分析事件的前置历史事件和/或后置历史事件,将获取的历史事件确定为与所述待分析事件相关的历史事件。
优选的,从所述至少一个预设历史事件图谱中获取所述待分析事件的相似历史事件包括:
确定所述至少一个预设历史事件图谱中各历史事件的关键词,根据所述待分析事件的关键词和各历史事件的关键词,从所述各历史事件中确定出相似历史事件;
和/或,
确定所述至少一个预设历史事件图谱中各历史事件的事件类型,将所述至少一个预设历史事件图谱中事件类型与所述待分析事件的事件类型相同的历史事件确定为相似历史事件;
和/或,
确定所述至少一个预设历史事件图谱中各历史事件的关键词和各历史事件的事件类型,根据所述各历史事件的事件类型和各历史事件的关键词,从所述至少一个预设历史事件图谱的各历史事件中确定出所述相似历史事件。
优选的,所述确定所述描述文本对应的至少一个关键词包括:从所述描述文本中提取关键词和/或确定从所述描述文本衍生出的关键词;
所述将所述至少一个关键词中的至少部分关键词确定为所述待分析事件的关键词包括:
展示所述描述文本对应的至少一个关键词;
获取用户从展示的至少一个关键词中选定的关键词;
将用户从展示的至少一个关键词中选定的关键词确定为所述待分析事件的关键词。
优选的,当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:展示所确定的至少一个预设历史事件图谱;
获取用户从展示的至少一个预设历史事件图谱中选定的预设历史事件图谱;
所述从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件包括:从所述选定的预设历史事件图谱中获取与所述待分析事件相关的历史事件。
优选的,当在数据处理设备上执行时,还适于执行初始化有如下方法步骤的程序:根据所述待分析事件和所述待分析事件相关的历史事件,生成所述待分析事件的事件关联图谱。
优选的,每个预设历史事件图谱通过以下方式生成:
获取历史事件对应的描述文本;
基于所述描述文本确定该描述文本的至少一个关键词,并确定该描述文本的至少一个关键词所对应的标签,所述标签用于表示与其对应的关键词所属的类别;
将所述历史事件的关键词中的预设数量的关键词确定为匹配关键词;
对每个所述匹配关键词:根据该匹配关键词和该匹配关键词对应的标签,确定与该匹配关键词对应的至少两个历史事件,并连接所述至少两个历史事件,得到该匹配关键词对应的预设历史事件图谱。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/ 输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列关键词的过程、方法、商品或者设备不仅包括那些关键词,而且还包括没有明确列出的其他关键词,或者是还包括为这种过程、方法、商品或者设备所固有的关键词。在没有更多限制的情况下,由语句“包括一个……”限定的关键词,并不排除在包括关键词的过程、方法、商品或者设备中还存在另外的相同关键词。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (11)
1.一种关联事件获取方法,其特征在于,所述方法包括:
获取待分析事件对应的描述文本;
确定所述描述文本对应的至少一个关键词,并将所述至少一个关键词中的至少部分关键词确定为所述待分析事件的关键词;
确定与所述待分析事件的关键词对应的至少一个预设历史事件图谱;
从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述待分析事件的关键词对应的标签,所述标签用于表示所述关键词所属的类别;
所述确定与所述待分析事件的关键词对应的预设历史事件图谱包括:确定与所述待分析事件的关键词和所述待分析事件的关键词对应的标签对应的所述预设历史事件图谱。
3.根据权利要求1所述的方法,其特征在于,所述从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件包括:
从所述至少一个预设历史事件图谱中获取所述待分析事件的相似历史事件,将所述相似历史事件、所述相似历史事件的前置历史事件、以及所述相似历史事件的后置历史事件中的至少之一确定为与所述待分析事件相关的历史事件;
和/或,
从所述至少一个预设历史事件图谱中获取所述待分析事件的前置历史事件和/或后置历史事件,将获取的历史事件确定为与所述待分析事件相关的历史事件。
4.根据权利要求3所述的方法,其特征在于,从所述至少一个预设历史事件图谱中获取所述待分析事件的相似历史事件包括:
确定所述至少一个预设历史事件图谱中各历史事件的关键词,根据所述待分析事件的关键词和各历史事件的关键词,从所述各历史事件中确定出相似历史事件;
和/或,
确定所述至少一个预设历史事件图谱中各历史事件的事件类型,将所述至少一个预设历史事件图谱中事件类型与所述待分析事件的事件类型相同的历史事件确定为相似历史事件;
和/或,
确定所述至少一个预设历史事件图谱中各历史事件的关键词和各历史事件的事件类型,根据所述各历史事件的事件类型和各历史事件的关键词,从所述至少一个预设历史事件图谱的各历史事件中确定出所述相似历史事件。
5.根据权利要求1所述的方法,其特征在于,所述确定所述描述文本对应的至少一个关键词包括:从所述描述文本中提取关键词和/或确定从所述描述文本衍生出的关键词;
所述将所述至少一个关键词中的至少部分关键词确定为所述待分析事件的关键词包括:
展示所述描述文本对应的至少一个关键词;
获取用户从展示的至少一个关键词中选定的关键词;
将用户从展示的至少一个关键词中选定的关键词确定为所述待分析事件的关键词。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:展示所确定的至少一个预设历史事件图谱;
获取用户从展示的至少一个预设历史事件图谱中选定的预设历史事件图谱;
所述从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件包括:从所述选定的预设历史事件图谱中获取与所述待分析事件相关的历史事件。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述待分析事件和所述待分析事件相关的历史事件,生成所述待分析事件的事件关联图谱。
8.根据权利要求1所述的方法,其特征在于,每个预设历史事件图谱通过以下方式生成:
获取历史事件对应的描述文本;
基于所述描述文本确定该描述文本的至少一个关键词,并确定该描述文本的至少一个关键词所对应的标签,所述标签用于表示与其对应的关键词所属的类别;
将所述历史事件的关键词中的预设数量的关键词确定为匹配关键词;
对每个所述匹配关键词:根据该匹配关键词和该匹配关键词对应的标签,确定与该匹配关键词对应的至少两个历史事件,并连接所述至少两个历史事件,得到该匹配关键词对应的预设历史事件图谱。
9.一种关联事件获取装置,其特征在于,所述装置包括:
获取单元,用于获取待分析事件对应的描述文本;
关键词确定单元,用于确定所述描述文本对应的至少一个关键词,并将所述至少一个关键词中的至少部分关键词确定为所述待分析事件的关键词;
图谱确定单元,用于确定与所述待分析事件的关键词对应的至少一个预设历史事件图谱;
事件获取单元,用于从所述至少一个预设历史事件图谱中获取与所述待分析事件相关的历史事件。
10.一种存储介质,其特征在于,所述存储介质上存储有程序,所述程序被处理器执行时实现如权利要求1至8任意一项所述的关联事件获取方法。
11.一种处理器,其特征在于,所述处理器用于运行程序,其中所述程序运行时执行如权利要求1至8任意一项所述的关联事件获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810194654.0A CN110309312B (zh) | 2018-03-09 | 2018-03-09 | 一种关联事件获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810194654.0A CN110309312B (zh) | 2018-03-09 | 2018-03-09 | 一种关联事件获取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110309312A true CN110309312A (zh) | 2019-10-08 |
CN110309312B CN110309312B (zh) | 2022-02-11 |
Family
ID=68073831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810194654.0A Active CN110309312B (zh) | 2018-03-09 | 2018-03-09 | 一种关联事件获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110309312B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008275A (zh) * | 2019-12-24 | 2020-04-14 | 天津新开心生活科技有限公司 | 数据挖掘方法及装置、存储介质及电子终端 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130097125A1 (en) * | 2011-10-12 | 2013-04-18 | Vmware, Inc. | Automated analysis of unstructured data |
CN104915446A (zh) * | 2015-06-29 | 2015-09-16 | 华南理工大学 | 基于新闻的事件演化关系自动提取方法及其系统 |
CN106033445A (zh) * | 2015-03-16 | 2016-10-19 | 北京国双科技有限公司 | 获取文章关联度数据的方法和装置 |
CN106202563A (zh) * | 2016-08-02 | 2016-12-07 | 西南石油大学 | 一种实时关联事件新闻推荐方法及系统 |
CN107688606A (zh) * | 2017-07-26 | 2018-02-13 | 北京三快在线科技有限公司 | 一种推荐信息的获取方法及装置,电子设备 |
-
2018
- 2018-03-09 CN CN201810194654.0A patent/CN110309312B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130097125A1 (en) * | 2011-10-12 | 2013-04-18 | Vmware, Inc. | Automated analysis of unstructured data |
CN106033445A (zh) * | 2015-03-16 | 2016-10-19 | 北京国双科技有限公司 | 获取文章关联度数据的方法和装置 |
CN104915446A (zh) * | 2015-06-29 | 2015-09-16 | 华南理工大学 | 基于新闻的事件演化关系自动提取方法及其系统 |
CN106202563A (zh) * | 2016-08-02 | 2016-12-07 | 西南石油大学 | 一种实时关联事件新闻推荐方法及系统 |
CN107688606A (zh) * | 2017-07-26 | 2018-02-13 | 北京三快在线科技有限公司 | 一种推荐信息的获取方法及装置,电子设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008275A (zh) * | 2019-12-24 | 2020-04-14 | 天津新开心生活科技有限公司 | 数据挖掘方法及装置、存储介质及电子终端 |
Also Published As
Publication number | Publication date |
---|---|
CN110309312B (zh) | 2022-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10977389B2 (en) | Anonymity assessment system | |
Martin et al. | Counting keys in parallel after a side channel attack | |
US11270227B2 (en) | Method for managing a machine learning model | |
CN111885000A (zh) | 一种基于图神经网络的网络攻击检测方法、系统及装置 | |
CN110472154A (zh) | 一种资源推送方法、装置、电子设备及可读存储介质 | |
US11132358B2 (en) | Candidate name generation | |
US20180018392A1 (en) | Topic identification based on functional summarization | |
CN109598171A (zh) | 一种基于二维码的数据处理方法、装置及系统 | |
CN110348392A (zh) | 车辆匹配方法及设备 | |
CN110119401A (zh) | 用户画像的处理方法、装置、服务器及存储介质 | |
CN110019669A (zh) | 一种文本检索方法及装置 | |
CN107391532A (zh) | 数据过滤的方法和装置 | |
CN108874379A (zh) | 页面的处理方法及装置 | |
CN108694664A (zh) | 业务系统的核对方法及装置、电子设备 | |
US11257222B2 (en) | Iterative approach for weakly-supervised action localization | |
CN107451204A (zh) | 一种数据查询方法、装置及设备 | |
CN109345081A (zh) | 一种数据采集方法、装置及电子设备 | |
CN110209780A (zh) | 一种问题模板生成方法、装置、服务器及存储介质 | |
CN110309312A (zh) | 一种关联事件获取方法及装置 | |
CN110427496B (zh) | 用于文本处理的知识图谱扩充方法及装置 | |
US9286349B2 (en) | Dynamic search system | |
US20230021563A1 (en) | Federated data standardization using data privacy techniques | |
CN110069695A (zh) | 标签处理方法和装置 | |
CN110309273A (zh) | 问答方法和装置 | |
US11503055B2 (en) | Identifying siem event types |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |