CN112416994B - 一种信息处理方法、装置及存储介质 - Google Patents

一种信息处理方法、装置及存储介质 Download PDF

Info

Publication number
CN112416994B
CN112416994B CN201910775229.5A CN201910775229A CN112416994B CN 112416994 B CN112416994 B CN 112416994B CN 201910775229 A CN201910775229 A CN 201910775229A CN 112416994 B CN112416994 B CN 112416994B
Authority
CN
China
Prior art keywords
event
node
user
user node
graph structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910775229.5A
Other languages
English (en)
Other versions
CN112416994A (zh
Inventor
徐海勇
孙遒
陶涛
黄岩
尚晶
杨涛
江勇
柯亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
China Mobile Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
China Mobile Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Suzhou Software Technology Co Ltd, China Mobile Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910775229.5A priority Critical patent/CN112416994B/zh
Publication of CN112416994A publication Critical patent/CN112416994A/zh
Application granted granted Critical
Publication of CN112416994B publication Critical patent/CN112416994B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息处理方法、装置及存储介质。其中,方法包括:利用当前事件的相关信息,从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点;针对至少一个第一用户节点中的每个用户节点,确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点;第一事件节点表征与当前事件性质相同的历史事件;确定相应第一用户节点与至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度。采用本发明的技术方案,利用所述图谱结构,能够挖掘出用户与历史事件的关系。

Description

一种信息处理方法、装置及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种信息处理方法、装置及存储介质。
背景技术
目前,随着计算机技术的快速发展,以及互联网数据的猛烈增长,数据挖掘越来越受关注。对海量数据进行挖掘得到的信息可以是用户与用户之间的关联关系。
以用户关系的数据挖掘为例,首先,获取多个用户的行为数据,如网络访问数据、住宿登记数据等;然后,基于大数据算法,对多个用户的行为数据进行挖掘,得到多个用户之间的关联关系。
上述方式中对用户的行为数据进行挖掘只能得到用户与用户之间的关联关系,无法挖掘出用户与事件的关联关系。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种信息处理方法、装置及存储介质。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种信息处理方法,所述方法包括:
利用当前事件的相关信息,从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点;所述图谱结构中包含有事件节点与用户节点之间的连接结构、用户节点与用户节点之间的连接结构;
针对所述至少一个第一用户节点中的每个用户节点,确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点;所述第一事件节点表征与所述当前事件性质相同的历史事件;
确定相应第一用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;
利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度。
上述方案中,所述相关信息包括当前事件的发生时刻、发生地点;所述从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点,包括:
将所述相关信息与所述图谱结构中至少一个用户节点的属性信息进行匹配;
当所述相关信息与所述属性信息匹配时,获取相应用户节点对应的用户在所述发生地点的停留时长;
将获取的停留时长进行排序,得到排序结果;
将排序结果中满足预设条件的停留时长对应的相应用户节点作为与所述相关信息相匹配的第一用户节点。
上述方案中,所述确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点,包括:
确定与相应第一用户节点的路径长度小于或等于第一预设阈值的至少一个节点;
获取所述至少一个节点的属性信息;
判断获取的属性信息是否满足预设条件;
当确定获取的属性信息满足预设条件时,将相应节点作为所述第一事件节点。
上述方案中,所述利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度,包括:
针对所述至少一个第一事件节点中的每个事件节点,确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重;
将所述权重与相应第一事件节点对应的路径长度求商,得到第一数值;
将第一数值作为相应第一事件节点对应的历史事件与相应第一用户节点对应的用户的关联度。
上述方案中,所述确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重,包括:
判断相应第一事件节点与所述第一用户节点之间是否存在其它节点;
当确定未存在其它节点时,确定相应第一事件节点对应的历史事件的发生时刻;
基于确定的发生时刻、预设权重、当前时刻,确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重。
上述方案中,所述方法还包括:
针对所述至少一个第一用户节点中的每个用户节点,将确定的关联度求和,得到至少一个数值;
将至少一个数值进行排序,得到排序结果;
从排序结果中查找满足预设条件的数值;
当查找到时,将满足预设条件的数值对应的用户作为所述当前事件的关联用户;
在所述图谱结构中添加当前事件的事件节点与关联用户的用户节点之间的路径,以形成所述当前事件和关联用户之间的关系。
上述方案中,所述方法还包括:
当未查找到满足预设条件的数值时,针对所述至少一个第一用户节点中的每个用户节点,确定与相应用户节点的路径长度小于或等于第二预设阈值的至少一个第二用户节点;
针对所述至少一个第二用户节点中的每个用户节点,确定与相应用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第二事件节点;所述第二事件节点表征与所述当前事件性质相同的历史事件;
确定相应第二用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;
利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第二用户节点对应的用户的关联度。
本发明实施例提供一种信息处理装置,所述装置包括:
查找单元,用于利用当前事件的相关信息,从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点;所述图谱结构中包含有事件节点与用户节点之间的连接结构、用户节点与用户节点之间的连接结构;
节点确定单元,用于针对所述至少一个第一用户节点中的每个用户节点,确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点;所述第一事件节点表征与所述当前事件性质相同的历史事件;
路径确定单元,用于确定相应第一用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;
关联度确定单元,用于利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度。
本发明实施例提供一种信息处理装置,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;
其中,所述处理器用于运行所述计算机程序时,执行上面所述任一项信息处理方法的步骤。
本发明实施例提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上面所述任一项信息处理方法的步骤。
本发明实施例提供的信息处理方法、装置及存储介质,利用当前事件的相关信息,从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点;所述图谱结构中包含有事件节点与用户节点之间的连接结构、用户节点与用户节点之间的连接结构;针对所述至少一个第一用户节点中的每个用户节点,确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点;所述第一事件节点表征与所述当前事件性质相同的历史事件;确定相应第一用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度。采用本发明实施例的技术方案,利用当前事件的相关信息,从图谱结构中查找到第一用户节点,以及至少一个第一事件节点,从而,利用第一用户节点与相应第一事件节点在图谱结构中的路径长度,确定第一用户节点对应的用户与相应第一事件节点对应的历史事件的关联度,从而挖掘出用户与历史事件的关系。
附图说明
图1为本发明实施例信息处理方法的实现流程示意图;
图2为本发明实施例关系挖掘系统的示意图;
图3为本发明实施例信息处理装置的组成结构示意图一;
图4为本发明实施例信息处理装置的组成结构示意图二。
具体实施方式
下面结合附图及实施例对本发明再作进一步详细的描述。
相关技术中,随着计算机技术的快速发展,以及互联网数据的猛烈增长,数据挖掘的应用领域越来越广,比如金融领域、司法领域等等。通常,可以基于大数据算法,对海量数据进行挖掘,得到一个用户与另外一个用户的关系,比如一度关系、二度关系;其中,一度关系可以是指与最熟悉的朋友之间的关系,二度关系可以是指与朋友的朋友之间的关系。但是,针对复杂的关系网络,仅使用大数据算法,并不能挖掘出用户与其它用户的三度或更深度的关系。
下面对与数据挖掘相关的专利进行详细描述,具体如下:在专利名称为《一种人员关系分析方法和系统》、申请号为201711394807.8的专利中,记载的是:确定至少一种关联关系的评价规则,并根据每一种关联关系所分别对应的评价规则,对至少两个样本人员的行为数据进行分析处理以形成人员关系网络结构图;每一种关联关系所分别对应的权重系数;根据人员关系网络结构图从各个样本人员中确定出与待查询人员相关联的至少一个目标人员;针对于每一个目标人员,根据人员关系结构图以及每一种关联关系所分别对应的权重系数,计算目标人员与待查询人员之间所对应的关联系数;将各个目标人员的身份标识以及对应的关联系数输出。在专利名称为《一种大数据犯罪团伙的筛查系统和方法》、申请号为201510620821.X的专利中,记载的是:利用指定用户的手机号码,基于拟合算法,自动计算出与该指定用户行为最为接近的人员,并实现指定用户的轨迹再现和位置追踪。在专利名称为《一种基于知识图谱的知识内容权重分析系统及方法》、申请号为201710757392.X的专利中,记载的是:依据教师上课的实际课纲预置教学知识图谱,依靠人工智能技术对课堂教学的实际内容进行分析,能够实时反馈比对分析结果,量化课堂教学知识内容的评估,不断提升教学质量。
综上所述,存在的技术缺陷包括:第一,通过关联关系评价规则。对关系网络中的用户数据进行数据挖掘,得到的是特定用户与另一些特定用户之间的关联关系,也就是说,所述关系网络中只包含用户和用户之间的关系。第二,对用户的手机号码、行为数据进行数据挖掘,得到的是与该指定用户的行为最为接近、与该指定用户进行过通讯的用户。第三,教学知识图谱结构中只包含知识点与知识点之间的关系,不包含用户与用户之间的关系。
基于此,本发明实施例中,利用当前事件的相关信息,从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点;所述图谱结构中包含有事件节点与用户节点之间的连接结构、用户节点与用户节点之间的连接结构;针对所述至少一个第一用户节点中的每个用户节点,确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点;所述第一事件节点表征与所述当前事件性质相同的历史事件;确定相应第一用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度。
本发明实施例提供了一种信息处理方法,如图1所示,该方法包括:
步骤101:利用当前事件的相关信息,从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点。
其中,所述当前事件可以是指在某个时刻某个地点发生的事件,比如刑事案件,具体可以是偷窃事件、受贿事件。所述当前事件的相关信息可以是指事件发生的当前时刻、当前地点等等,还可以是指与事件发生的当前时刻关联的时间范围,与事件发生的当前地点关联的位置范围等等。
实际应用时,为了能够从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点,需要建立所述图谱结构。
具体地,首先,在所述图谱结构中,建立事件节点与用户节点之间的连接结构、用户节点与用户节点之间的连接结构;其中,事件节点可以表示历史事件,具体可以是历史偷窃事件、历史受贿事件等等,用户节点可以表示与历史事件关联的用户。然后,将属性信息等数据导入到对应的用户节点、事件节点。其中,事件节点包含的属性信息可以是:偷窃事件发生的当前时刻及当前地点、偷窃事件涉及的偷窃物体等等,用户节点包含的属性信息可以是:用户的标识信息、名称、性别等等。
需要说明的是,在所述图谱结构中添加事件节点与用户节点之间的连接结构,可以形成用户、事件、物、时间、地点之间的关联关系,可看出,所述图谱结构中不仅包含用户与用户之间的关系,还可以包含用户与事件之间的关系。另外,以北京市为例,可以将北京市所有区域的用户数据、事件数据导入到所述图谱结构中的用户节点、事件节点,并存储到图数据库中,可看出,在所述图谱结构中,能够实现对海量数据的挖掘,得到用户与用户之间的关系,或者用户与事件之间的关系。
实际应用时,所述当前事件发生之后,可以利用时间、空间因素,从所述图谱结构中查找与当前事件匹配的多个用户。
基于此,在一实施例中,所述相关信息包括当前事件的发生时刻、发生地点;所述从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点,包括:将所述相关信息与所述图谱结构中至少一个用户节点的属性信息进行匹配;当所述相关信息与所述属性信息匹配时,获取相应用户节点对应的用户在所述发生地点的停留时长;将获取的停留时长进行排序,得到排序结果;将排序结果中满足预设条件的停留时长对应的相应用户节点作为与所述相关信息相匹配的第一用户节点。
其中,第一用户节点对应的用户可以是指与所述当前事件匹配的用户。
这里,所述将所述相关信息与所述图谱结构中至少一个用户节点的属性信息进行匹配,包括两种情况:
第一种情况,所述图谱结构中的用户节点的属性信息中包括用户的居住地信息,将当前事件的发生地点与用户的居住地进行匹配,确定匹配的用户节点。
举例来说,假设当前事件的发生时刻为北京时间2019年3月21日,发生地点为北京海淀区,则利用所述图谱结构中用户节点的属性信息即用户的居住地,确定与所述当前事件的相关信息即发生地点匹配的用户节点。
第二种情况,确定所述图谱结构中的用户节点对应的用户在历史时刻附着的基站小区,将当前事件的发生地点与基站小区所在的地理位置进行匹配,确定匹配的用户节点。
具体地,获取所述图谱结构中的用户节点对应的用户在历史时刻附着的基站小区;利用历史时刻,以及相应用户在历史时刻附着的基站小区,形成时空点集;基于形成的时空点集,将在某个历史时间段内出现在某个基站小区的用户进行聚类,得到用户集。这样,当获取所述当前事件的发生时刻、发生地点后,可以查找与当前事件的发生地点匹配的用户集,从而基于查找到的用户集,从所述图谱结构中找到对应的用户节点。
需要说明的是,如果确定的用户节点的数量小于预设阈值,则可以将确定的用户节点作为第一用户节点。如果确定的用户节点的数量大于或等于预设阈值,则可以获取相应用户节点对应的用户在所述发生地点的停留时长;将获取的停留时长进行排序,得到排序结果;将排序结果中满足预设条件的停留时长对应的相应用户节点作为与所述相关信息相匹配的第一用户节点。
举例来说,假设在“已知轨迹查人”或是“多案件串联分析”研判中,获取N个当前事件的相关信息,比如当前事件的发生时刻、发生地;基于获取的发生时刻、发生地点,从用户集中查找到与发生时刻、发生地点匹配的M个用户;其中,M、N为正整数,且M≤N。或者,在“同行人员分析”研判中,获取当前事件的相关信息,比如当前事件发生的时间范围、发生地点、出现在发生地点的用户;从多个用户集中查找到与发生地点匹配的用户集;针对查找到的用户集中的用户,获取相应用户在所述发生地点的停留时长,将获取的停留时长进行排序,将排序结果中满足预设条件的停留时长对应的用户节点作为所述第一用户节点。
需要说明的是,步骤101中,可以结合大数据算法,比如聚类算法,从所述图谱结构中,挖掘出与当前事件匹配的用户。
步骤102:针对所述至少一个第一用户节点中的每个用户节点,确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点。
其中,所述第一事件节点表征与所述当前事件性质相同的历史事件。
实际应用时,在所述图谱结构中,如果两个节点之间没有其他节点,则这两个节点之间的路径长度最短。两个节点之间的路径长度越长,这两个节点之间的关联也越小,从而可以基于两个节点在所述图谱结构中的路径长度,确定与第一用户节点关联的至少一个第一事件节点。
基于此,在一实施例中,所述确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点,包括:确定与相应第一用户节点的路径长度小于或等于第一预设阈值的至少一个节点;获取所述至少一个节点的属性信息;判断获取的属性信息是否满足预设条件;当确定获取的属性信息满足预设条件时,将相应节点作为所述第一事件节点。
其中,如果相应节点的属性信息中包含事件的发生时刻、发生地点、事件性质等信息,且节点的属性信息中的事件性质与当前事件的性质相同,比如都是偷窃事件,则将相应节点作为第一事件节点。如果相应节点的属性信息中包含用户的名称、性别等信息,则不将该相应节点作为第一事件节点。
这里,所述第一事件节点可以是指与第一用户节点关联的事件节点。与相应第一用户节点的路径长度大于第一预设阈值的事件节点可以是指与第一用户节点无关的事件节点。
需要说明的是,步骤102中,可以从所述图谱结构中,利用两个节点之间的路径长度,挖掘出与第一用户节点关联的第一事件节点。
步骤103:确定相应第一用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度。
这里,针对所述至少一个第一事件节点中的每个事件节点,所述相应第一事件节点与所述第一用户节点之间可能存在多条路径,每条路径对应一个路径长度,因此,需要从相应第一事件节点与所述第一用户节点之间的多条路径中确定最短路径,将最短路径的路径长度作为相应第一用户节点与相应第一事件节点在所述图谱结构中的路径长度。
需要说明的是,最短路径可以根据两个节点在一条路径上的节点数量确定。比如,如果两个节点之间有两条路径,一条路径上的节点数量为3个,另一条路径上的节点数量为5个,则节点数量较少的路径作为最短路径。
步骤104:利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度。
实际应用时,如果第一用户节点与相应第一事件节点之间的路径长度越长,则相应第一事件节点对应的历史事件与第一用户节点对应的用户之间的关联度就小;如果第一用户节点与相应第一事件节点之间的路径长度越短,则相应第一事件节点对应的历史事件与第一用户节点对应的用户之间的关联度就大。另外,如果第一用户节点与相应第一事件节点之间的路径的权重越小,则相应第一事件节点对应的历史事件与第一用户节点对应的用户之间的关联度就小;另外,如果第一用户节点与相应第一事件节点之间的路径的权重越大,则相应第一事件节点对应的历史事件与第一用户节点对应的用户之间的关联度就大。
基于此,在一实施例中,所述利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度,包括:针对所述至少一个第一事件节点中的每个事件节点,确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重;将所述权重与相应第一事件节点对应的路径长度求商,得到第一数值;将第一数值作为相应第一事件节点对应的历史事件与相应第一用户节点对应的用户的关联度。
这里,对于所述图谱结构中的一个用户节点,可以与其它用户节点相连,也可以与其它事件节点相连;当一个用户节点与另一个用户节点直接相连时,两个节点形成用户与用户的关系,当一个用户节点与另一个事件节点直接相连时,两个节点形成用户和事件的关系;对形成的关系,可以设置初始权重。其中,初始权重可以是默认值,比如0.8。
实际应用时,考虑到历史事件发生的历史时刻可能距离当前时刻较久远,因此,可以对形成的用户与事件的关系,添加半衰期,换句话说,对相应初始权重进行半衰计算,具体就是如果事件发生的历史时刻距离当前时刻越久远,则减小对应的初始权重。如果相应第一事件节点与所述第一用户节点之间没有其它节点,则相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重是对初始权重进行半衰计算后的权重;如果相应第一事件节点与所述第一用户节点之间有其它节点,则相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重是每两个节点之间的权重之和。其中,如果每两个节点都是用户节点,则每两个节点之间的权重是初始权重;如果每两个节点是一个用户节点和一个事件节点,则每两个节点之间的权重是对初始权重进行半衰计算后的权重。
基于此,在一实施例中,所述确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重,包括:判断相应第一事件节点与所述第一用户节点之间是否存在其它节点;当确定未存在其它节点时,确定相应第一事件节点对应的历史事件的发生时刻;基于确定的发生时刻、预设权重、当前时刻,确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重。
这里,确定权重之后,将所述权重与相应第一事件节点对应的路径长度求商,得到相应第一事件节点对应的历史事件与相应第一用户节点对应的用户的关联度。
举例来说,假设第一用户节点表示用户m,第一用户节点对应的第一事件节点包括事件节点1、事件节点2、事件节点3;其中,事件节点1表示与当前事件性质相同的历史事件1,事件节点2表示与当前事件性质相同的历史事件2,事件节点3表示与当前事件性质相同的历史事件3。利用第一用户节点与事件节点1之间的权重,确定用户m和历史事件1的关联度;利用第一用户节点与事件节点2之间的权重,确定用户m和历史事件2的关联度;利用第一用户节点与事件节点3之间的权重,确定用户m和历史事件3的关联度。
需要说明的是,这里,可以从所述图谱结构中,挖掘出第一用户节点对应的用户与相应第一事件节点对应的历史事件的关系。
实际应用时,由于所述第一事件节点对应的历史事件与所述当前事件的性质相同,因此可以针对每个第一用户节点,确定相应第一用户节点对应的用户与对应的所有第一事件节点的关联度之和,对所有第一用户节点对应的关联度之和进行排序,将与历史事件关联度最大的用户作为与当前事件关联的用户。
基于此,在一实施例中,所述方法还包括:针对所述至少一个第一用户节点中的每个用户节点,将确定的关联度求和,得到至少一个数值;将至少一个数值进行排序,得到排序结果;从排序结果中查找满足预设条件的数值;当查找到时,将满足预设条件的数值对应的用户作为所述当前事件的关联用户;在所述图谱结构中添加当前事件的事件节点与关联用户的用户节点之间的路径,以形成所述当前事件和关联用户之间的关系。
其中,满足预设条件可以是指所述数值大于或等于预设阈值。所述关联用户可以是指最有可能参与当前事件的用户。
需要说明的是,由于历史事件是与当前事件性质相同的事件,因此与历史事件关联度较大的用户,与当前事件的关联度也较大,从而可以将满足预设条件的数值对应的用户作为所述当前事件的关联用户。
举例来说,假设第一用户节点包括节点1、节点2、节点3,节点1对应的第一事件节点包括节点a、b、c,节点2对应的第一事件节点包括节点e,f,节点3对应的第一事件节点包括节点g,预设阈值为0.8。如果节点1与节点a、 b、c的关联度之和为0.5,节点2与节点e、f的关联度之和为0.7,节点3与节点g的关联度之和为0.8,则将大于或等于预设阈值的数值0.8对应的节点3的用户作为当前事件的关联用户。
需要说明的是,这里,可以从所述图谱结构中,挖掘出第一用户节点对应的用户与当前事件的关系。
这里,将新确定的关联用户与当前事件的关系添加在所述图谱结构中,也就是,对所述图谱结构的图数据库进行动态更新,一方面可以丰富所述图谱结构中的路径,有助于实现关系的挖掘;另一方面,还可以对后续的新事件的关系挖掘提供支持。
这里,关系的挖掘可以包括深度挖掘和广度挖掘。其中,所述深度挖掘可以是指利用第一用户节点对应的用户,挖掘出当前事件与关联用户的关系;所述广度挖掘可以是指利用与第一用户节点具有连接结构的其它用户节点,挖掘出当前事件与关联用户的关系。这里,由于所述图谱结构的数据可以保存在图数据库中,因此可以使用图数据库语句查询得到当前事件与关联用户的关系。
以深度挖掘为例,假设当前事件为犯罪事件,使用图数据库Neo4j cypher 查询语句为:
Match(cas:CriminalCase),(m:Human),
/节点m表示所述第一用户节点,对应的节点ID为15/
p=allShortestPaths((cas)-[r*1..6]-(m))
/将历史犯罪案件对应的事件节点用cas表示,使用函数 allShortestPaths((cas)-[r*1..6]-(m))找到所有的历史犯罪事件与‘某人员’之间的一度到六度的最短路径集合,用p表示;一度可以是指事件节点与用户节点m 之间无其它节点,六度可以是指事件节点与用户节点m之间有5个节点/
WHERE id(m)=15 with cas,m,collect(p)AS paths
/collect(p)表示的是将p表示为数组paths/
WITH cas,m,paths,size(paths)AS totalPaths
UNWIND paths AS p
WITH cas,m,totalPaths,length(p)AS lenp,p,
/通过length()方法计算出p中数组的长度。再散列p中所有最短路径,也就是针对paths路径集合中的每条路径p,列出每条路径p的某相关历史案件 cas,m人员以及length(p)表示的路径长度/
reduce(weight=0.0,rel in relationships(p)|
/通过reduce方法,遍历每条路径上所有关系的初始权重,利用历史犯罪事件的发生时刻、当前时刻,对初始权重进行半衰计算,得到半衰计算后的权重/
weight+rel.weight*0.5^((timestamp()-rel.updateTime)/30000000000))
/针对p中的每条最短路径,如果相应路径中包含的节点大于两个节点时,将相应路径中两个节点之间的权重进行累加,得到该条路径对应的权重;其中,如果两个节点都是用户节点,则两个节点之间的权重为初始权重;如果两个节点是一个用户节点和一个事件节点,则两个节点之间的权重为半衰计算后的权重。利用每条路径对应的权重,计算m节点对应的人员与某历史犯罪事件cas 的关联度,并将m节点对应的人员与多个历史犯罪事件cas的关联度求和,得到的数值,如果该数值大于预设阈值,可以确定该m节点对应的人员作为当前犯罪事件的嫌疑用户,后续可以展开追踪/
AS weight
RETURN sum(weight/lenp)
实际应用时,当未查找到满足预设条件的数值时,需要利用与第一用户节点具有连接结构的其它用户节点,挖掘出当前事件与关联用户的关系。
基于此,在一实施例中,所述方法还包括:当未查找到满足预设条件的数值时,针对所述至少一个第一用户节点中的每个用户节点,确定与相应用户节点的路径长度小于或等于第二预设阈值的至少一个第二用户节点;针对所述至少一个第二用户节点中的每个用户节点,确定与相应用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第二事件节点;所述第二事件节点表征与所述当前事件性质相同的历史事件;确定相应第二用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第二用户节点对应的用户的关联度。
这里,基于第二用户节点,确定与所述当前事件性质相同的历史事件与相应第二用户节点对应的用户的关联度的具体过程与基于第一用户节点确定的具体过程相同,在此不再赘述。
实际应用时,由于所述第二事件节点对应的历史事件与所述当前事件的性质相同,因此可以针对每个第二用户节点,确定相应第二用户节点对应的用户与对应的所有第二事件节点的关联度之和,对所有第二用户节点对应的关联度之和进行排序,将与历史事件关联度最大的用户作为与当前事件关联的用户。
基于此,在一实施例中,所述方法还包括:针对所述至少一个第二用户节点中的每个用户节点,将确定的关联度求和,得到至少一个数值;将至少一个数值进行排序,得到排序结果;从排序结果中查找满足预设条件的数值;当查找到时,将满足预设条件的数值对应的用户作为所述当前事件的关联用户;在所述图谱结构中添加当前事件的事件节点与关联用户的用户节点之间的路径,以形成所述当前事件和关联用户之间的关系。
需要说明的是,这里,可以从所述图谱结构中,挖掘出第二用户节点对应的用户与相应第二事件节点对应的历史事件的关系,以及第二用户节点对应的用户与所述当前事件的关系。
本发明实施例中,结合图谱结构与大数据技术实现关系挖掘,从而确定出当前事件与关联用户的关系,并将确定的关系添加至所述图谱结构中,从而形成复杂的关系网络,所述关系网络具有帮助强化人员特征、分析深层次的行为特征的特点。另外,还可以确定出第一用户节点对应的用户与历史事件的关联度,进而确定出与当前事件关联的关联用户。第三,建立了从大数据分析到图谱结构关系挖掘再到图数据库语句查询的深度挖掘或广度挖掘的完整体系,如图2所示。
需要说明的是,第一,结合图谱结构与大数据技术,分析得到的人员关联关系数据更加深入。具体地,首先通过大数据算法,确定与当前事件匹配的用户列表,然后再利用所述图谱结构进行深度挖掘或广度挖掘,得到用户列表中的用户与已知历史事件的关联度。第二,所述图谱结构具有完整、动态更新、查询信息全面的特点。具体地,在所述图谱结构中,加入人和事件、物、地点、时间的关联关系,在进行关系挖掘时能够获得更多关联关系的路径,使得通过图谱结构获得的关系更加全面也更加准确。第三,所述图谱结构可以应用于不同的领域,所述图谱结构中的路径的权重可以进行动态更新。具体地,通过持续加入的节点在所述图谱结构中添加新的连接结构,并分配默认的初始权重。
采用本发明实施例的技术方案,利用当前事件的相关信息,结合所述图谱结构,查找到与所述相关信息相匹配的用户、与所述当前事件性质相同的历史事件,并确定出与所述相关信息相匹配的用户与历史事件的关联度,从而挖掘出用户与历史事件的关系。
为了实现本发明实施例的方法,本发明实施例还提供了一种信息处理装置,如图3所示,包括:
查找单元31,用于利用当前事件的相关信息,从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点;所述图谱结构中包含有事件节点与用户节点之间的连接结构、用户节点与用户节点之间的连接结构。
节点确定单元32,用于针对所述至少一个第一用户节点中的每个用户节点,确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点;所述第一事件节点表征与所述当前事件性质相同的历史事件。
路径确定单元33,用于确定相应第一用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度。
关联度确定单元34,用于利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度。
其中,所述当前事件可以是指在某个时刻某个地点发生的事件,具体可以是偷窃事件、受贿事件。所述当前事件的相关信息可以是指事件发生的当前时刻、当前地点等等;还可以是指与事件发生的当前时刻关联的时间范围,与事件发生的当前地点关联的位置范围等等。其中,所述第一事件节点表征与所述当前事件性质相同的历史事件。所述路径长度可以是指相应第一用户节点与第一事件节点在所述图谱结构中的连接路径的长度。
实际应用时,为了能够从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点,需要建立所述图谱结构。
具体地,在所述图谱结构中,建立事件节点与用户节点之间的连接结构、用户节点与用户节点之间的连接结构;然后,将节点的属性信息等数据导入到对应的用户节点、事件节点。其中,事件节点可以包含属性信息,比如,偷窃事件发生的当前时刻及当前地点、偷窃事件涉及的偷窃物体等等,用户节点也可以包含属性信息,比如,用户的标识信息、名字、性别等等。
需要说明的是,在所述图谱结构中添加事件节点与用户节点之间的连接结构,可以形成用户、事件、物、时间、地点之间的关联关系,可看出,所述图谱结构中不仅包含用户与用户之间的关系,还可以包含用户与事件之间的关系。另外,以北京市为例,可以将北京市所有区域的用户数据、事件数据导入到所述图谱结构中的用户节点、事件节点,并存储到图数据库中,可看出,在所述图谱结构中,能够实现对海量数据的挖掘,得到用户与用户之间的关系,或者用户与事件之间的关系。
实际应用时,所述当前事件发生之后,可以利用时间、空间因素,从所述图谱结构中查找与当前事件匹配的多个用户。
基于此,在一实施例中,所述查找单元31,具体用于:将所述相关信息与所述图谱结构中至少一个用户节点的属性信息进行匹配;当所述相关信息与所述属性信息匹配时,获取相应用户节点对应的用户在所述发生地点的停留时长;将获取的停留时长进行排序,得到排序结果;将排序结果中满足预设条件的停留时长对应的相应用户节点作为与所述相关信息相匹配的第一用户节点。
其中,第一用户节点对应的用户可以是指与所述当前事件匹配的用户。
这里,所述将所述相关信息与所述图谱结构中至少一个用户节点的属性信息进行匹配,包括两种情况:
第一种情况,所述图谱结构中的用户节点的属性信息中包括用户的居住地信息,将当前事件的发生地点与用户的居住地进行匹配,确定匹配的用户节点。
举例来说,假设当前事件的发生时刻为北京时间2019年3月21日,发生地点为北京海淀区,则利用所述图谱结构中用户节点的属性信息即用户的居住地,确定与所述当前事件的相关信息即发生地点匹配的用户节点。
第二种情况,确定所述图谱结构中的用户节点对应的用户在历史时刻附着的基站小区,将当前事件的发生地点与基站小区所在的地理位置进行匹配,确定匹配的用户节点。
具体地,获取所述图谱结构中的用户节点对应的用户在历史时刻附着的基站小区;利用历史时刻,以及相应用户在历史时刻附着的基站小区,形成时空点集;基于形成的时空点集,将在某个历史时间段内出现在某个基站小区的用户进行聚类,得到用户集。这样,当获取所述当前事件的发生时刻、发生地点后,可以查找与当前事件的发生地点匹配的用户集,从而基于查找到的用户集,从所述图谱结构中找到对应的用户节点。
需要说明的是,如果确定的用户节点的数量小于预设阈值,则可以将确定的用户节点作为第一用户节点。如果确定的用户节点的数量大于或等于预设阈值,则可以获取相应用户节点对应的用户在所述发生地点的停留时长;将获取的停留时长进行排序,得到排序结果;将排序结果中满足预设条件的停留时长对应的相应用户节点作为与所述相关信息相匹配的第一用户节点。
实际应用时,在所述图谱结构中,如果两个节点之间没有其他节点,则这两个节点之间的路径长度最短。两个节点之间的路径长度越长,这两个节点之间的关联也越小,从而可以基于两个节点在所述图谱结构中的路径长度,确定与第一用户节点关联的至少一个第一事件节点。
基于此,在一实施例中,所述节点确定单元32,具体用于:确定与相应第一用户节点的路径长度小于或等于第一预设阈值的至少一个节点;获取所述至少一个节点的属性信息;判断获取的属性信息是否满足预设条件;当确定获取的属性信息满足预设条件时,将相应节点作为所述第一事件节点。
其中,如果相应节点的属性信息中包含事件的发生时刻、发生地点、事件性质等信息,且节点的属性信息中的事件性质与当前事件的性质相同,比如都是偷窃事件,则将相应节点作为第一事件节点。如果相应节点的属性信息中包含用户的名称、性别等信息,则不将该相应节点作为第一事件节点。
这里,所述第一事件节点可以是指与第一用户节点关联的事件节点。与相应第一用户节点的路径长度大于第一预设阈值的事件节点可以是指与第一用户节点无关的事件节点。
实际应用时,如果第一用户节点与相应第一事件节点之间的路径长度越长,则相应第一事件节点对应的历史事件与第一用户节点对应的用户之间的关联度就小;如果第一用户节点与相应第一事件节点之间的路径长度越短,则相应第一事件节点对应的历史事件与第一用户节点对应的用户之间的关联度就大。另外,如果第一用户节点与相应第一事件节点之间的路径的权重越小,则相应第一事件节点对应的历史事件与第一用户节点对应的用户之间的关联度就小;另外,如果第一用户节点与相应第一事件节点之间的路径的权重越大,则相应第一事件节点对应的历史事件与第一用户节点对应的用户之间的关联度就大。
基于此,在一实施例中,所述关联度确定单元34,具体用于:针对所述至少一个第一事件节点中的每个事件节点,确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重;将所述权重与相应第一事件节点对应的路径长度求商,得到第一数值;将第一数值作为相应第一事件节点对应的历史事件与相应第一用户节点对应的用户的关联度。
实际应用时,考虑到历史事件发生的历史时刻可能距离当前时刻较久远,因此,可以对形成的用户与事件的关系,添加半衰期,换句话说,对相应初始权重进行半衰计算,具体就是如果事件发生的历史时刻距离当前时刻越久远,则减小对应的初始权重。如果相应第一事件节点与所述第一用户节点之间没有其它节点,则相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重是对初始权重进行半衰计算后的权重;如果相应第一事件节点与所述第一用户节点之间有其它节点,则相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重是每两个节点之间的权重之和。其中,如果每两个节点都是用户节点,则每两个节点之间的权重是初始权重;如果每两个节点是一个用户节点和一个事件节点,则每两个节点之间的权重是对初始权重进行半衰计算后的权重。
基于此,在一实施例中,所述关联度确定单元34,具体用于:判断相应第一事件节点与所述第一用户节点之间是否存在其它节点;当确定未存在其它节点时,确定相应第一事件节点对应的历史事件的发生时刻;基于确定的发生时刻、预设权重、当前时刻,确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重。
实际应用时,由于所述第一事件节点对应的历史事件与所述当前事件的性质相同,因此可以针对每个第一用户节点,确定相应第一用户节点对应的用户与对应的所有第一事件节点的关联度之和,对所有第一用户节点对应的关联度之和进行排序,将与历史事件关联度最大的用户作为与当前事件关联的用户。
基于此,在一实施例中,所述装置还包括:用户确定单元,用于针对所述至少一个第一用户节点中的每个用户节点,将确定的关联度求和,得到至少一个数值;将至少一个数值进行排序,得到排序结果;从排序结果中查找满足预设条件的数值;当查找到时,将满足预设条件的数值对应的用户作为所述当前事件的关联用户;在所述图谱结构中添加当前事件的事件节点与关联用户的用户节点之间的路径,以形成所述当前事件和关联用户之间的关系。
其中,满足预设条件可以是指所述数值大于或等于预设阈值。所述关联用户可以是指最有可能参与当前事件的用户。
需要说明的是,由于历史事件是与当前事件性质相同的事件,因此与历史事件关联度较大的用户,与当前事件的关联度也较大,从而可以将满足预设条件的数值对应的用户作为所述当前事件的关联用户。
这里,将新确定的关联用户与当前事件的关系添加在所述图谱结构中,也就是,对所述图谱结构的本体库进行动态更新,一方面可以丰富所述图谱结构中的路径,有助于实现关系的挖掘;另一方面,还可以对后续的新事件的关系确定提供支持。其中,关系可以是用户与用户的关系,也可以是用户与事件的关系。
这里,关系的挖掘可以包括深度挖掘和广度挖掘。其中,所述深度挖掘可以是指利用第一用户节点对应的用户,挖掘出当前事件与关联用户的关系;所述广度挖掘可以是指利用与第一用户节点具有连接结构的其它用户节点,挖掘出当前事件与关联用户的关系。这里,由于所述图谱结构的数据可以保存在图数据库中,因此可以使用图数据库语句查询得到当前事件与关联用户的关系。
实际应用时,当未查找到满足预设条件的数值时,需要利用与第一用户节点具有连接结构的其它用户节点,挖掘出当前事件与关联用户的关系。
基于此,在一实施例中,所述关联度确定单元34,还用于当未查找到满足预设条件的数值时,针对所述至少一个第一用户节点中的每个用户节点,确定与相应用户节点的路径长度小于或等于第二预设阈值的至少一个第二用户节点;针对所述至少一个第二用户节点中的每个用户节点,确定与相应用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第二事件节点;所述第二事件节点表征与所述当前事件性质相同的历史事件;确定相应第二用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第二用户节点对应的用户的关联度。
需要说明的是,基于第二用户节点,确定与所述当前事件性质相同的历史事件与相应第二用户节点对应的用户的关联度的具体过程与基于第一用户节点确定的具体过程相同,在此不再赘述。
实际应用时,所述查找单元31、节点确定单元32、路径确定单元33、关联度确定单元34可由信息处理装置中的处理器实现。
本发明实施例还提供了一种信息处理装置,如图4所示,该信息处理装置 40包括:通信接口41、处理器42、存储器43;其中,
通信接口41,能够与其它设备进行信息交互;
处理器42,与所述通信接口41连接,用于运行计算机程序时,执行上述智能设备侧一个或多个技术方案提供的方法。而所述计算机程序存储在存储器 43上。
当然,实际应用时,信息处理装置40中的各个组件通过总线系统44耦合在一起。可理解,总线系统44用于实现这些组件之间的连接通信。总线系统 44除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为总线系统44。
本申请实施例中的存储器43用于存储各种类型的数据以支持信息处理装置40的操作。这些数据的示例包括:用于在信息处理装置40上操作的任何计算机程序。
上述本申请实施例揭示的方法可以应用于所述处理器42中,或者由所述处理器42实现。所述处理器42可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过所述处理器42中的硬件的集成逻辑电路或者软件形式的指令完成。上述的所述处理器42可以是通用处理器、数字信号处理器(DSP,Digital SignalProcessor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。所述处理器42可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器43,所述处理器42读取存储器43中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,信息处理装置40可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable LogicDevice)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或者其他电子元件实现,用于执行前述方法。
可以理解,本申请实施例的存储器43可以是易失性存储器或者非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM, Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM, Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器 (EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(FlashMemory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random Access Memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器 (SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器 (DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器 (SDRAM,Synchronous Dynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM, Enhanced Synchronous Dynamic Random AccessMemory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random AccessMemory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本申请实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
需要说明的是:“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
需要说明的是:本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种信息处理方法,其特征在于,所述方法包括:
利用当前事件的相关信息,从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点;所述图谱结构中包含有事件节点与用户节点之间的连接结构、用户节点与用户节点之间的连接结构;
针对所述至少一个第一用户节点中的每个用户节点,确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点;所述第一事件节点表征与所述当前事件性质相同的历史事件;
确定相应第一用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;
利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度。
2.根据权利要求1所述的方法,其特征在于,所述相关信息包括当前事件的发生时刻、发生地点;所述从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点,包括:
将所述相关信息与所述图谱结构中至少一个用户节点的属性信息进行匹配;
当所述相关信息与所述属性信息匹配时,获取相应用户节点对应的用户在所述发生地点的停留时长;
将获取的停留时长进行排序,得到排序结果;
将排序结果中满足预设条件的停留时长对应的相应用户节点作为与所述相关信息相匹配的第一用户节点。
3.根据权利要求1所述的方法,其特征在于,所述确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点,包括:
确定与相应第一用户节点的路径长度小于或等于第一预设阈值的至少一个节点;
获取所述至少一个节点的属性信息;
判断获取的属性信息是否满足预设条件;
当确定获取的属性信息满足预设条件时,将相应节点作为所述第一事件节点。
4.根据权利要求1所述的方法,其特征在于,所述利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度,包括:
针对所述至少一个第一事件节点中的每个事件节点,确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重;
将所述权重与相应第一事件节点对应的路径长度求商,得到第一数值;
将第一数值作为相应第一事件节点对应的历史事件与相应第一用户节点对应的用户的关联度。
5.根据权利要求4所述的方法,其特征在于,所述确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重,包括:
判断相应第一事件节点与所述第一用户节点之间是否存在其它节点;
当确定未存在其它节点时,确定相应第一事件节点对应的历史事件的发生时刻;
基于确定的发生时刻、预设权重、当前时刻,确定相应第一事件节点与所述第一用户节点在所述图谱结构中的路径的权重。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对所述至少一个第一用户节点中的每个用户节点,将确定的关联度求和,得到至少一个数值;
将至少一个数值进行排序,得到排序结果;
从排序结果中查找满足预设条件的数值;
当查找到时,将满足预设条件的数值对应的用户作为所述当前事件的关联用户;
在所述图谱结构中添加当前事件的事件节点与关联用户的用户节点之间的路径,以形成所述当前事件和关联用户之间的关系。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当未查找到满足预设条件的数值时,针对所述至少一个第一用户节点中的每个用户节点,确定与相应用户节点的路径长度小于或等于第二预设阈值的至少一个第二用户节点;
针对所述至少一个第二用户节点中的每个用户节点,确定与相应用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第二事件节点;所述第二事件节点表征与所述当前事件性质相同的历史事件;
确定相应第二用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;
利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第二用户节点对应的用户的关联度。
8.一种信息处理装置,其特征在于,所述装置包括:
查找单元,用于利用当前事件的相关信息,从图谱结构中查找与所述相关信息相匹配的至少一个第一用户节点;所述图谱结构中包含有事件节点与用户节点之间的连接结构、用户节点与用户节点之间的连接结构;
节点确定单元,用于针对所述至少一个第一用户节点中的每个用户节点,确定与相应第一用户节点在所述图谱结构中的路径长度小于或等于第一预设阈值的至少一个第一事件节点;所述第一事件节点表征与所述当前事件性质相同的历史事件;
路径确定单元,用于确定相应第一用户节点与所述至少一个第一事件节点在所述图谱结构中的路径长度,得到至少一个路径长度;
关联度确定单元,用于利用得到的至少一个路径长度,确定与所述当前事件性质相同的历史事件与相应第一用户节点对应的用户的关联度。
9.一种信息处理装置,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器用于运行所述计算机程序时,执行权利要求1至7任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
CN201910775229.5A 2019-08-21 2019-08-21 一种信息处理方法、装置及存储介质 Active CN112416994B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910775229.5A CN112416994B (zh) 2019-08-21 2019-08-21 一种信息处理方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910775229.5A CN112416994B (zh) 2019-08-21 2019-08-21 一种信息处理方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN112416994A CN112416994A (zh) 2021-02-26
CN112416994B true CN112416994B (zh) 2022-12-13

Family

ID=74779558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910775229.5A Active CN112416994B (zh) 2019-08-21 2019-08-21 一种信息处理方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112416994B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116501876B (zh) * 2023-05-06 2023-12-08 中译语通科技(陕西)有限公司 用于云端协同数字化服务的大数据跟踪方法及ai系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870578A (zh) * 2014-03-21 2014-06-18 联想(北京)有限公司 一种网络应用的用户间关联信息的显示方法及电子设备
CN107633044A (zh) * 2017-09-14 2018-01-26 国家计算机网络与信息安全管理中心 一种基于热点事件的舆情知识图谱构建方法
CN109255385A (zh) * 2018-09-07 2019-01-22 陈包容 一种自动创建多层次事件和场景图谱特征的方法、装置及其应用
CN109754224A (zh) * 2018-12-29 2019-05-14 贵州小爱机器人科技有限公司 人事关系图谱构建方法、装置以及计算机存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870578A (zh) * 2014-03-21 2014-06-18 联想(北京)有限公司 一种网络应用的用户间关联信息的显示方法及电子设备
CN107633044A (zh) * 2017-09-14 2018-01-26 国家计算机网络与信息安全管理中心 一种基于热点事件的舆情知识图谱构建方法
CN109255385A (zh) * 2018-09-07 2019-01-22 陈包容 一种自动创建多层次事件和场景图谱特征的方法、装置及其应用
CN109754224A (zh) * 2018-12-29 2019-05-14 贵州小爱机器人科技有限公司 人事关系图谱构建方法、装置以及计算机存储介质

Also Published As

Publication number Publication date
CN112416994A (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
Aljawarneh et al. G-SPAMINE: An approach to discover temporal association patterns and trends in internet of things
Kellaris et al. Map-matched trajectory compression
Li et al. Multiple location profiling for users and relationships from social network and content
US9104979B2 (en) Entity recognition using probabilities for out-of-collection data
CN112989055B (zh) 文本识别方法、装置、计算机设备和存储介质
US20160358036A1 (en) Searching for Images by Video
CN109189867A (zh) 基于公司知识图谱的关系发现方法、装置及存储介质
CN110119475B (zh) 一种poi推荐方法及推荐系统
US20140236882A1 (en) Geolocating social media
US8326834B2 (en) Density-based co-location pattern discovery
US20070118539A1 (en) Focused community discovery
CN109063921B (zh) 客户风险预警的优化处理方法、装置、计算机设备和介质
CN111383005B (zh) 数字货币流向追踪方法及装置
Muzammal et al. Trajectory mining using uncertain sensor data
Züfle et al. Handling uncertainty in geo-spatial data
CN108345662B (zh) 一种考虑用户分布区域差异的签到微博数据加权统计方法
Kashian et al. Automatic analysis of positional plausibility for points of interest in OpenStreetMap using coexistence patterns
CN112416994B (zh) 一种信息处理方法、装置及存储介质
Choi et al. Multimodal location estimation of consumer media: Dealing with sparse training data
CN110990541A (zh) 一种实现问答的方法及装置
CN116206453B (zh) 一种基于迁移学习的交通流预测方法、装置及相关设备
Gurjar et al. Comparative Study of Evaluating the Trustworthiness of Data Based on Data Provenance.
AT&T
CN114661920A (zh) 地址编码关联方法、业务数据分析方法及相应装置
CN111339373B (zh) 一种图谱特征的提取方法、系统、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant