CN109886318B - 一种信息处理方法、装置及计算机可读存储介质 - Google Patents

一种信息处理方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN109886318B
CN109886318B CN201910086995.0A CN201910086995A CN109886318B CN 109886318 B CN109886318 B CN 109886318B CN 201910086995 A CN201910086995 A CN 201910086995A CN 109886318 B CN109886318 B CN 109886318B
Authority
CN
China
Prior art keywords
event
entity
entities
event entity
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910086995.0A
Other languages
English (en)
Other versions
CN109886318A (zh
Inventor
李迪民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhizhi Heshu Technology Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN201910086995.0A priority Critical patent/CN109886318B/zh
Publication of CN109886318A publication Critical patent/CN109886318A/zh
Application granted granted Critical
Publication of CN109886318B publication Critical patent/CN109886318B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种信息处理方法、装置及存储介质,包括:服务器将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到若干个第一分类集;在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;获取包含的两个事件实体存在于所有第一分类集中的事件实体对,作为待选择事件实体对;在待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。从本发明实施例提供的技术方案可见,由于将事件实体按照事件发生日期和事件内容进行分类,进而根据获得的分类集进行符合预设规则的事件实体对筛选,因此节省了发掘事件实体之间关系所耗费的时间成本,提高了发掘效率。

Description

一种信息处理方法、装置及计算机可读存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种信息处理方法、装置及计算机可读存储介质。
背景技术
信息处理是指处理海量信息以期发掘有价值信息的过程。在公安领域建立的大数据平台中存在着多种事件信息文件,例如有网吧监控信息文件、住宿管理信息文件、卡口监控信息文件、火车出行信息文件、客运出行信息文件、飞机出行信息文件、出入境管理信息文件等,上述事件数据源记录的都是事件实体(即个人)的活动轨迹数据,信息处理就是在海量信息中找到事件实体与事件实体(即人与人)之间的潜在关系。
相关技术中,在进行信息处理的过程中,往往会将所有信息记录依次进行两两比对以期找到事件实体之间的潜在关系。
然而,由于这种方法需要基于两两信息记录依次进行比对发掘,因此十分耗费时间成本,造成事件实体之间关系的发掘效率低下。
发明内容
为了解决上述技术问题,本发明实施例提供一种信息处理方法、装置及计算机可读存储介质,能够节省时间成本,提高发掘效率。
为了达到本发明实施例目的,本发明实施例提供了一种信息处理方法,包括:
服务器将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到若干个第一分类集;
在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;
获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;
在所述待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
所述将事件实体按照相同的事件发生日期和相同的事件内容进行分类之前,还包括:
根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容。
所述根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容之前,还包括:
开启个数与预设分片数相同的线程;
控制每个线程读取相应的事件实体分片,得到事件实体;
根据获得的事件实体读取所述事件实体与事件信息的对应关系。
所述开启个数与预设分片数相同的线程之前,还包括:
读取事件信息文件,得到事件信息记录;
根据获得的事件信息记录获取并存储事件实体与事件信息的对应关系;
采用预设哈希函数对所述事件实体与事件信息的对应关系中的事件实体依次进行哈希运算,得到哈希值;
对获得的哈希值与所述预设分片数依次进行取模运算,得到结果值;
存储所述事件实体至与根据该事件实体获得的结果值对应的分片,得到事件实体分片。
所述得到第一分类集之后,且在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对之前,还包括:
依次判断每个第一分类集中是否存在不存在于与该第一分类集的事件发生日期相同的第二分类中的事件实体;其中,所述第二分类是将事件实体按照相同的事件发生日期进行分类得到的;
获取所述第一分类集中不存在于与该第一分类集的事件发生日期相同的第二分类中的事件实体,作为待处理事件实体;
所述在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对,包括:
在包含所述待处理事件实体的第一分类集中去除所述待处理事件实体;
在每个去除了所述待处理事件实体后的第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对。
本发明实施例提供了一种服务器,包括:
预处理模块,用于将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到第一分类集;
处理模块,用于在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;
所述处理模块,还用于获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;
所述处理模块,还用于在所述待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
所述预处理模块还用于:
根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容。
所述处理模块还用于:
开启个数与预设分片数相同的线程;
控制每个线程读取相应的事件实体分片,得到事件实体;
根据获得的事件实体读取所述事件实体与事件信息的对应关系。
本发明实施例提供了一种信息处理装置,包括:处理器和存储器,其中,存储器中存储有以下可被处理器执行的命令:
将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到第一分类集;
在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;
获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;
在所述待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
本发明实施例提供了一种计算机可读存储介质,所述存储介质上存储有计算机可执行命令,所述计算机可执行命令用于执行以下步骤:
将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到第一分类集;
在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;
获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;
在所述待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
与现有技术相比,本发明实施例至少包括:服务器将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到第一分类集;在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;在待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。从本发明实施例提供的技术方案可见,由于先将事件实体按照事件发生日期和事件内容进行了分类,进而根据获得的分类集进行事件实体对筛选,最终得到符合预设单事件实体关联规则和预设多事件实体关联规则的事件的事件实体对,因此节省了发掘事件实体之间关系所耗费的时间成本,提高了发掘效率。
本发明实施例的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例而了解。本发明实施例的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明实施例技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明实施例的技术方案,并不构成对本发明实施例技术方案的限制。
图1为本发明实施例提供的一种信息处理方法的流程示意图;
图2为本发明实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明实施例的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
本发明实施例提供一种信息处理方法,如图1所示,该方法包括:
步骤101、服务器将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到若干个第一分类集。
需要说明的是,事件实体、事件发生日期和事件内容是事件信息文件的每条信息记录中所包含的内容。
具体的,事件内容是根据事件信息记录提取出来的且能够标识事件信息记录的信息。举例来说,假设事件信息记录是“张三于2019年1月5日从上海乘坐T94班次火车去往北京”,事件实体是“张三”,事件发生日期是“2019年1月6日”,事件内容是“乘坐T94班次火车”;假设事件信息记录是“李四于2019年1月6日从上海乘坐NZ49005班次飞机去往北京”,事件实体是“李四”,事件发生日期是“2019年1月6日”,事件内容是“乘坐NZ49005班次飞机”。
步骤102、在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对。
需要说明的是,预设单事件实体关联规则是一个事件实体的一条事件信息记录与另一个事件实体的一条事件信息记录之间要使事件实体之间产生联系所应当满足的规则。举例来说,假设事件是出行事件,预设单事件实体关联规则可以是邻座,还可以是买票时间在预设时间内。
步骤103、获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对。
步骤104、在待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
需要说明的是,预设多事件实体关联规则是一个事件实体的多条事件信息记录与另一个事件实体的多条事件信息记录之间要使事件实体之间产生联系所应当满足的规则。举例来说,假设事件是乘坐火车出行事件和住宿事件,预设多事件实体关联规则可以是在相同日期乘坐相同车次的火车,并且在两天之内入住相同地点的相同酒店。
本发明实施例所提供的信息处理方法,服务器将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到第一分类集;在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;在待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。从本发明实施例提供的技术方案可见,由于先将事件实体按照事件发生日期和事件内容进行了分类,进而根据获得的分类集进行事件实体对筛选,最终得到符合预设单事件实体关联规则和预设多事件实体关联规则的事件的事件实体对,因此节省了发掘事件实体之间关系所耗费的时间成本,提高了发掘效率。
可选地,将事件实体按照相同的事件发生日期和相同的事件内容进行分类之前,还包括:
步骤105、根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容。
可选地,根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容之前,还包括:
步骤106、开启个数与预设分片数相同的线程。
步骤107、控制每个线程读取相应的事件实体分片,得到事件实体。
步骤108、根据获得的事件实体读取事件实体与事件信息的对应关系。
可选地,开启个数与预设分片数相同的线程之前,还包括:
步骤109、读取事件信息文件,得到事件信息记录。
步骤110、根据获得的事件信息记录获取并存储事件实体与事件信息的对应关系。
步骤111、采用预设哈希函数对事件实体与事件信息的对应关系中的事件实体依次进行哈希运算,得到哈希值。
步骤112、对获得的哈希值与预设分片数依次进行取模运算,得到结果值。
步骤113、存储事件实体至与根据该事件实体获得的结果值对应的分片,得到事件实体分片。
可选地,得到第一分类集之后,且在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对之前,还包括:
步骤114、依次判断每个第一分类集中是否存在不存在于与该第一分类集的事件发生日期相同的第二分类中的事件实体。
其中,第第二分类是将事件实体按照相同的事件发生日期进行分类得到的。
步骤115、获取第一分类集中不存在于与该第一分类集的事件发生日期相同的第二分类中的事件实体,作为待处理事件实体。
在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对,包括:
步骤102a、在包含待处理事件实体的第一分类集中去除待处理事件实体。
步骤102b、在每个去除了待处理事件实体后的第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对。
本发明实施例还提供一种信息处理方法,该方法包括:
步骤1、读取事件信息文件中的每一条(行)记录,通过编码器将记录转换成事件实体(key)–事件实体信息(value)格式的数据并进行存储,然后将属于相同事件实体事件发生日期的事件实体(key)聚集,再对编码后的事件实体(key)进行哈希运算以得到哈希值,然后将哈希值与预设分片数取模以得到结果值,最后将编码后的事件实体存储到本机磁盘上与该结果值对应的分片中。
步骤2、根据相同日期(date)聚集事件实体(key),然后把聚集后的数据按事件实体(key)编码的哈希值与分片数取模存储到本机磁盘上与该结果值对应的分片中。
需要说明的是,构建这种数据结构的文件的目的是为了能快速检索到某个事件实体的事件发生日期。
步骤3、读取步骤1构建好的标准数据集文件,按相同事件发生日期和事件内容(事件的发生日期和事件内容合并以id进行表示)聚集事件实体,并把聚集的数据按照时间和索引(id)编码后的哈希值与分片数取模存储到本机磁盘上。在聚集相同索引(id)的事件实体(key)时候,通过读取步骤2中建立的事件实体(key)-日期(date)文件并查找该事件实体(key)是否在有效时间(date)内有事件发生为依据进行剪枝判断。
步骤4、读取步骤3建立的索引文件(id-key),计算每个索引(id)下两两事件实体(key)的事件信息(value)是否符合预设单事件实体关联规则,聚集编码后的事件实体(key)—事件实体(key)格式的数据,将数据根据第一个事件实体(key)的哈希值和分片数取模导出到本地磁盘。
步骤5、读取所有索引(id)下符合单事件实体关联规则两两事件实体(key),获取同时存在于所有索引(id)下的两两事件实体(key),判断获得的两两事件实体(key)是否满足预设多事件实体关联规则,并获取满足预设多事件实体关联规则的两两事件实体(key)作为最终输出结果。
本发明实施例提供一种服务器,如图2所示,该服务器2包括:
预处理模块21,用于将将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到若干个第一分类集。
处理模块22,用于在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对。
处理模块22,还用于获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对。
处理模块22,还用于在待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
可选地,预处理模块21还用于:
根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容。
处理模块22还用于:
开启个数与预设分片数相同的线程。
控制每个线程读取相应的事件实体分片,得到事件实体。
根据获得的事件实体读取事件实体与事件信息的对应关系。
可选地,处理模块22还用于:
读取事件信息文件,得到事件信息记录。
根据获得的事件信息记录获取并存储事件实体与事件信息的对应关系。
采用预设哈希函数对事件实体与事件信息的对应关系中的事件实体依次进行哈希运算,得到哈希值。
对获得的哈希值与预设分片数依次进行取模运算,得到结果值。
存储事件实体至与根据该事件实体获得的结果值对应的分片,得到事件实体分片。
可选地,处理模块22还用于:
依次判断每个第一分类集中是否存在不存在于与该第一分类集的事件发生日期相同的第二分类中的事件实体;其中,第二分类是将事件实体按照相同的事件发生日期进行分类得到的。
获取第一分类集中不存在于与该第一分类集的事件发生日期相同的第二分类中的事件实体,作为待处理事件实体。
在包含待处理事件实体的第一分类集中去除待处理事件实体。
在每个去除了待处理事件实体后的第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对。
本发明实施例所提供的服务器,将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到第一分类集;在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;在待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。从本发明实施例提供的技术方案可见,由于先将事件实体按照事件发生日期和事件内容进行了分类,进而根据获得的分类集进行事件实体对筛选,最终得到符合预设单事件实体关联规则和预设多事件实体关联规则的事件的事件实体对,因此节省了发掘事件实体之间关系所耗费的时间成本,提高了发掘效率。
在实际应用中,所述预处理模块21和处理模块22位于服务器中的中央处理器(Central Processing Unit,CPU)、微处理器(Micro Processor Unit,MPU)、数字信号处理器(Digital Signal Processor,DSP)或现场可编程门阵列(Field Programmable GateArray,FPGA)等实现。
本发明实施例还提供一种信息处理装置,包括存储器和处理器,其中,存储器中存储有以下可被处理器执行的命令:
将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到若干个第一分类集。
在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对。
获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对。
在待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
可选地,存储器中还存储有以下可被处理器执行的命令:
根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容。
可选地,存储器中还存储有以下可被处理器执行的命令:
开启个数与预设分片数相同的线程。
控制每个线程读取相应的事件实体分片,得到事件实体。
根据获得的事件实体读取事件实体与事件信息的对应关系。
可选地,存储器中还存储有以下可被处理器执行的命令:
读取事件信息文件,得到事件信息记录。
根据获得的事件信息记录获取并存储事件实体与事件信息的对应关系。
采用预设哈希函数对事件实体与事件信息的对应关系中的事件实体依次进行哈希运算,得到哈希值。
对获得的哈希值与预设分片数依次进行取模运算,得到结果值。
存储事件实体至与根据该事件实体获得的结果值对应的分片,得到事件实体分片。
可选地,存储器中还存储有以下可被处理器执行的命令:
依次判断每个第一分类集中是否存在不存在于与该第一分类集的事件发生日期相同的第二分类中的事件实体;其中,第二分类是将事件实体按照相同的事件发生日期进行分类得到的。
获取第一分类集中不存在于与该第一分类集的事件发生日期相同的第二分类中的事件实体,作为待处理事件实体。
在包含待处理事件实体的第一分类集中去除待处理事件实体。
在每个去除了待处理事件实体后的第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对。
本发明实施例还提供一种计算机可读存储介质,存储介质上存储有计算机可执行命令,计算机可执行命令用于执行以下步骤:
将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到若干个第一分类集。
在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对。
获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对。
在待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
可选地,计算机可执行命令还用于执行以下步骤:
根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容。
可选地,存储器中还存储有以下可被处理器执行的命令:
开启个数与预设分片数相同的线程。
控制每个线程读取相应的事件实体分片,得到事件实体。
根据获得的事件实体读取事件实体与事件信息的对应关系。
可选地,计算机可执行命令还用于执行以下步骤:
读取事件信息文件,得到事件信息记录。
根据获得的事件信息记录获取并存储事件实体与事件信息的对应关系。
采用预设哈希函数对事件实体与事件信息的对应关系中的事件实体依次进行哈希运算,得到哈希值。
对获得的哈希值与预设分片数依次进行取模运算,得到结果值。
存储事件实体至与根据该事件实体获得的结果值对应的分片,得到事件实体分片。
可选地,计算机可执行命令还用于执行以下步骤:
依次判断每个第一分类集中是否存在不存在于与该第一分类集的事件发生日期相同的第二分类中的事件实体;其中,第二分类是将事件实体按照相同的事件发生日期进行分类得到的。
获取第一分类集中不存在于与该第一分类集的事件发生日期相同的第二分类中的事件实体,作为待处理事件实体。
在包含待处理事件实体的第一分类集中去除待处理事件实体。
在每个去除了待处理事件实体后的第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对。
虽然本发明实施例所揭露的实施方式如上,但所述的内容仅为便于理解本发明实施例而采用的实施方式,并非用以限定本发明实施例。任何本发明实施例所属领域内的技术人员,在不脱离本发明实施例所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明实施例的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种信息处理方法,其特征在于,包括:
服务器将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到若干个第一分类集;
在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;
获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;
在所述待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
2.根据权利要求1所述的信息处理方法,其特征在于,所述将事件实体按照相同的事件发生日期和相同的事件内容进行分类之前,还包括:
根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容。
3.根据权利要求2所述的信息处理方法,其特征在于,所述根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容之前,还包括:
开启个数与预设分片数相同的线程;
控制每个线程读取相应的事件实体分片,得到事件实体;
根据获得的事件实体读取所述事件实体与事件信息的对应关系。
4.根据权利要求3所述的信息处理方法,其特征在于,所述开启个数与预设分片数相同的线程之前,还包括:
读取事件信息文件,得到事件信息记录;
根据获得的事件信息记录获取并存储事件实体与事件信息的对应关系;
采用预设哈希函数对所述事件实体与事件信息的对应关系中的事件实体依次进行哈希运算,得到哈希值;
对获得的哈希值与所述预设分片数依次进行取模运算,得到结果值;
存储所述事件实体至与根据该事件实体获得的结果值对应的分片,得到事件实体分片。
5.根据权利要求1所述的信息处理方法,其特征在于,所述得到若干个 第一分类集之后,且在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对之前,还包括:
依次判断每个第一分类集中是否存在与该第一分类集的事件发生日期相同的第二分类中的事件实体;其中,所述第二分类是将事件实体按照相同的事件发生日期进行分类得到的;
获取所述第一分类集中不存在与该第一分类集的事件发生日期相同的第二分类中的事件实体,作为待处理事件实体;
所述在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对,包括:
在包含所述待处理事件实体的第一分类集中去除所述待处理事件实体;
在每个去除了所述待处理事件实体后的第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对。
6.一种服务器,其特征在于,包括:
预处理模块,用于将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到第一分类集;
处理模块,用于在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;
所述处理模块,还用于获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;
所述处理模块,还用于在所述待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
7.根据权利要求6所述的服务器,其特征在于,所述预处理模块还用于:
根据获得的事件实体与事件信息的对应关系获取事件信息中的事件发生日期和事件内容。
8.根据权利要求7所述的服务器,其特征在于,所述处理模块还用于:
开启个数与预设分片数相同的线程;
控制每个线程读取相应的事件实体分片,得到事件实体;
根据获得的事件实体读取所述事件实体与事件信息的对应关系。
9.一种信息处理装置,其特征在于,包括:处理器和存储器,其中,存储器中存储有以下可被处理器执行的命令:
将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到第一分类集;
在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;
获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;
在所述待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机可执行命令,所述计算机可执行命令用于执行以下步骤:
将事件实体按照相同的事件发生日期和相同的事件内容进行分类,得到第一分类集;
在每个第一分类集中分别获取所有由两个事件实体组成且符合预设单事件实体关联规则的事件实体对;
获取所包含的两个事件实体同时存在于所有第一分类集中的事件实体对,作为待选择事件实体对;
在所述待选择事件实体对中获取符合预设多事件实体关联规则的事件实体对作为输出信息。
CN201910086995.0A 2019-01-29 2019-01-29 一种信息处理方法、装置及计算机可读存储介质 Active CN109886318B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910086995.0A CN109886318B (zh) 2019-01-29 2019-01-29 一种信息处理方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910086995.0A CN109886318B (zh) 2019-01-29 2019-01-29 一种信息处理方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109886318A CN109886318A (zh) 2019-06-14
CN109886318B true CN109886318B (zh) 2021-04-30

Family

ID=66927262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910086995.0A Active CN109886318B (zh) 2019-01-29 2019-01-29 一种信息处理方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109886318B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110930115B (zh) * 2019-11-20 2023-02-24 拉扎斯网络科技(上海)有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN111061814A (zh) * 2019-12-10 2020-04-24 北京明略软件系统有限公司 一种建模分析方法、装置、电子设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009090804A1 (ja) * 2008-01-18 2009-07-23 Nikon Corporation 画像群の標題付与装置、画像のグループ化装置、画像群の代表画像決定装置、画像表示装置、カメラおよび画像表示プログラム
CN101755303A (zh) * 2007-06-05 2010-06-23 伊斯曼柯达公司 采用语义分类器的自动题材创建
CN102193951A (zh) * 2010-03-19 2011-09-21 华为技术有限公司 信息抽取的方法及系统
CN103186675A (zh) * 2013-04-03 2013-07-03 南京安讯科技有限责任公司 一种基于网络热词识别的网页自动分类方法
CN103489138A (zh) * 2013-10-16 2014-01-01 国家电网公司 一种输电网故障信息与线路越限信息的相关度分析法
CN103823868A (zh) * 2014-02-26 2014-05-28 中国科学院计算技术研究所 一种面向在线百科的事件识别方法和事件关系抽取方法
CN105389354A (zh) * 2015-11-02 2016-03-09 东南大学 面向社交媒体文本的无监督的事件抽取和分类方法
CN106778817A (zh) * 2016-11-25 2017-05-31 杭州中奥科技有限公司 一种事件的自动分类方法
CN107679209A (zh) * 2017-10-16 2018-02-09 北京神州泰岳软件股份有限公司 分类表达式生成方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101755303A (zh) * 2007-06-05 2010-06-23 伊斯曼柯达公司 采用语义分类器的自动题材创建
WO2009090804A1 (ja) * 2008-01-18 2009-07-23 Nikon Corporation 画像群の標題付与装置、画像のグループ化装置、画像群の代表画像決定装置、画像表示装置、カメラおよび画像表示プログラム
CN102193951A (zh) * 2010-03-19 2011-09-21 华为技术有限公司 信息抽取的方法及系统
CN103186675A (zh) * 2013-04-03 2013-07-03 南京安讯科技有限责任公司 一种基于网络热词识别的网页自动分类方法
CN103489138A (zh) * 2013-10-16 2014-01-01 国家电网公司 一种输电网故障信息与线路越限信息的相关度分析法
CN103823868A (zh) * 2014-02-26 2014-05-28 中国科学院计算技术研究所 一种面向在线百科的事件识别方法和事件关系抽取方法
CN105389354A (zh) * 2015-11-02 2016-03-09 东南大学 面向社交媒体文本的无监督的事件抽取和分类方法
CN106778817A (zh) * 2016-11-25 2017-05-31 杭州中奥科技有限公司 一种事件的自动分类方法
CN107679209A (zh) * 2017-10-16 2018-02-09 北京神州泰岳软件股份有限公司 分类表达式生成方法和装置

Also Published As

Publication number Publication date
CN109886318A (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
US20230126005A1 (en) Consistent filtering of machine learning data
US10579661B2 (en) System and method for machine learning and classifying data
CN111930805B (zh) 一种信息挖掘方法及计算机设备
CN111475612A (zh) 预警事件图谱的构建方法、装置、设备及存储介质
CN111913860B (zh) 一种操作行为分析方法及装置
CN111445597B (zh) 用于机器学习的数据拼接和整合
CN113590556A (zh) 一种基于数据库的日志处理方法、装置及设备
CN109886318B (zh) 一种信息处理方法、装置及计算机可读存储介质
CN110888981A (zh) 基于标题的文档聚类方法、装置、终端设备及介质
CN110895548B (zh) 用于处理信息的方法和装置
Ali et al. Carving of the OOXML document from volatile memory using unsupervised learning techniques
CN112163127B (zh) 关系图谱构建方法、装置、电子设备及存储介质
CN111680072A (zh) 基于社交信息数据的划分系统及方法
US20230394015A1 (en) LIST-BASED DATA STORAGE FOR DATA SEARCHPeter
CN115098585A (zh) 一种基于大数据的法律法规数据自动处理方法及系统
CN112559641B (zh) 拉链表的处理方法及装置、可读存储介质、电子设备
CN111552905B (zh) 一种用户访问关键路径的获取方法及系统
CN113850331A (zh) 报销单异常检测方法、使用方法、装置、设备及存储介质
CN113505172A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN109815270B (zh) 一种关系计算的方法、装置、计算机存储介质及终端
Timonin et al. Research of filtration methods for reference social profile data
CN117194751B (zh) 一种政务电子数据筛选方法及系统
CN118332507B (zh) 一种多源异构司法大数据治理方法及装置
US11928135B2 (en) Edge computing data reproduction and filtering gatekeeper
CN112287186B (zh) 一种用于城市管理的智能分类方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220614

Address after: 15, second floor, east side of clean coal workshop, No. 68, Shijingshan Road, Shijingshan District, Beijing 100043 (cluster registration)

Patentee after: Beijing Zhizhi Heshu Technology Co.,Ltd.

Address before: 102218 5th floor, building 1, China Coal Construction Group building, 398 Zhongdong Road, Dongxiaokou Town, Changping District, Beijing

Patentee before: MININGLAMP SOFTWARE SYSTEMS Co.,Ltd.