CN110457505A - 基于图数据库进行关系挖掘的方法和装置 - Google Patents

基于图数据库进行关系挖掘的方法和装置 Download PDF

Info

Publication number
CN110457505A
CN110457505A CN201910607533.9A CN201910607533A CN110457505A CN 110457505 A CN110457505 A CN 110457505A CN 201910607533 A CN201910607533 A CN 201910607533A CN 110457505 A CN110457505 A CN 110457505A
Authority
CN
China
Prior art keywords
node
relation information
excavated
information
surroundings nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910607533.9A
Other languages
English (en)
Inventor
肇书同
王琪
李杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Terminus Beijing Technology Co Ltd
Original Assignee
Terminus Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Terminus Beijing Technology Co Ltd filed Critical Terminus Beijing Technology Co Ltd
Priority to CN201910607533.9A priority Critical patent/CN110457505A/zh
Publication of CN110457505A publication Critical patent/CN110457505A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种基于图数据库进行关系挖掘的方法、装置、电子设备和计算机可读存储介质,解决了现有关系挖掘方式挖掘深度浅、挖掘范围小、不便于更新以及效率低的问题。其中的基于图数据库进行关系挖掘的方法和装置包括:在图数据库中确定待挖掘的节点;其中所述图数据库包括多个所述节点,其中的每个所述节点通过至少一个连接边与周围的至少一个所述节点连接,所述连接边承载有表征所述连接边两端的所述节点之间关系的关系信息;获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息;以及根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息。

Description

基于图数据库进行关系挖掘的方法和装置
技术领域
本申请涉及数据处理技术领域,具体涉及一种基于图数据库进行关系挖掘的方法、装置、电子设备和计算机可读存储介质。
背景技术
随着信息时代的进步,如何在关系错综复杂的现代社会挖掘出有价值的关系信息成为了一个越来越迫切的需求。企业需要通过关系挖掘以发现潜在的竞争对手或者高端人才,以规避风险或寻求更大的发展。公安机关需要通过关系挖掘来发现或追踪潜在的犯罪嫌疑人,以提高办案效率。然而,如何高效智能地进行关系挖掘仍是数据处理领域的一个难题。
现有技术中存在一些基于数据源进行关系挖掘的方法,但存在如下缺点:(1)、关系数据源来源比较单一,通常只能通过住户上报的个人信息及住房信息来推断人与人之间的关系,且只能通过静态数据加工而成,无法进一步进行关系挖掘;(2)、关系范围小,关系种类不完善,通过现有信息只能得到较小深度的关系或直接关系,无法进一步挖掘深层关系及隐性关系,且现有关系挖掘主体对象通常只有人的关系;(3)、现有关系挖掘缺少更新机制,无法随着关系主体的属性、业务状态及行为动作的变化来实时更新关系网络,无法及时提供准确的信息;(4)、现有技术采用传统的关系型数据库存储关系,执行时间较长,尤其对于深度较大的关系,关系型数据库会表现出严重的延迟,甚至无法执行。由此可见,亟需提供一种能够更加高效智能地进行关系挖掘的方式。
发明内容
有鉴于此,本申请实施例提供了一种基于图数据库进行关系挖掘的方法、装置、电子设备和计算机可读存储介质,解决了现有技术中中关系挖掘方式挖掘深度浅、挖掘范围小、不便于更新以及效率低的问题。
根据本发的一个方面,本申请一实施例提供的一种基于图数据库进行关系挖掘的方法和装置包括:在图数据库中确定待挖掘的节点;其中所述图数据库包括多个所述节点,其中的每个所述节点通过至少一个连接边与周围的至少一个所述节点连接,所述连接边承载有表征所述连接边两端的所述节点之间关系的关系信息;获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息;以及根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息。
在本申请一实施例中,所述根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息包括:将获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息输入神经网络模型,以及获取所述神经网络模型输出的所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息,所述神经网络模型通过预学习的训练过程建立。
在本申请一实施例中,所述获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息包括:以所述待挖掘的节点为中心,逐级获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息;以及当从所述待挖掘的节点到当前的周围节点之间所需经过的连接边数量达到阈值时,停止所述逐级获取的过程。
在本申请一实施例中,所述根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息包括:根据获取到的所述关系信息筛选出与所述待挖掘的节点之间的关系信息满足预设条件的周围节点;以及统一生成所述待挖掘的节点与所述满足预设条件的周围节点之间的关系信息。
在本申请一实施例中,在根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息之后,所述方法进一步包括:在所述图数据库中生成承载获取到的关系信息的连接边。
在本申请一实施例中,所述图数据库基于机器学习的方式更新。
在本申请一实施例中,所述方法进一步包括:过滤掉重复的关系信息。
在本申请一实施例中,所述待挖掘的节点通过第三方指定的方式确定;或,所述在图数据库中确定待挖掘的节点包括:基于预设检索规则在所述图数据库中检索出所述待挖掘的节点。
在本申请一实施例中,所述图数据库中的所述节点包括人的属性信息,所述关系信息包括人际关系信息。
在本申请一实施例中,所述图数据库中的所述节点包括以下信息中的一种:人的属性信息、车的属性信息、房的属性信息和设备的属性信息。
根据本发的另一个方面,本申请一实施例提供的一种基于图数据库进行关系挖掘的装置,包括:确定模块,配置为在图数据库中确定待挖掘的节点;其中所述图数据库包括多个所述节点,其中的每个所述节点通过至少一个连接边与周围的至少一个所述节点连接,所述连接边承载有表征所述连接边两端的所述节点之间关系的关系信息;获取模块,配置为获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息;以及判断模块,配置为根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息。
在本申请一实施例中,所述获取模块进一步配置为:将获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息输入神经网络模型,以及获取所述神经网络模型输出的所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息,所述神经网络模型通过预学习的训练过程建立。
在本申请一实施例中,所述获取模块包括:获取单元,配置为以所述待挖掘的节点为中心,逐级获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息;以及判断单元,配置为当从所述待挖掘的节点到当前的周围节点之间所需经过的连接边数量达到阈值时,停止所述逐级获取的过程。
在本申请一实施例中,所述判断模块包括:筛选单元,配置为根据获取到的所述关系信息筛选出与所述待挖掘的节点之间的关系信息满足预设条件的周围节点;以及生成单元,配置为统一生成所述待挖掘的节点与所述满足预设条件的周围节点之间的关系信息。
在本申请一实施例中,所述装置进一步包括:生成模块,配置为在根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息之后,在所述图数据库中生成承载获取到的关系信息的连接边。
在本申请一实施例中,所述图数据库基于机器学习的方式更新。
在本申请一实施例中,所述装置进一步包括:过滤模块,配置为过滤掉重复的关系信息。
在本申请一实施例中,所述待挖掘的节点通过第三方指定的方式确定;或,所述确定模块进一步配置为:基于预设检索规则在所述图数据库中检索出所述待挖掘的节点。
在本申请一实施例中,所述图数据库中的所述节点包括人的属性信息,所述关系信息包括人际关系信息。
在本申请一实施例中,所述图数据库中的所述节点包括以下信息中的一种:人的属性信息、车的属性信息、房的属性信息和设备的属性信息。
根据本发的另一个方面,本申请一实施例提供的一种电子设备,包括:处理器;以及存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如前任一所述的方法。
根据本发的另一个方面,本申请一实施例提供的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如前任一所述的方法。
本申请实施例提供的一种基于图数据库进行关系挖掘的方法、装置、电子设备和计算机可读存储介质,通过基于图数据库进行关系挖掘,关系数据来源丰富,除上报的个人静态数据外,还可利用个人的居住情况,通行情况,抓拍图像信息及与其有相近行为的他人共同生成关系网络。可挖掘的关系范围深,关系种类多,利用图数据库及其可视化界面,可挖掘多级关系及隐性关系,且关系主体不局限于人,房、车、设备等可采用合同方式构建关系网络。基于图数据库的关系挖掘可根据数据的量级及属性特征进行关系网络的更新,同时可通过机器学习的方式让关系网络自主更新。图数据库相比传统的关系型数据库,有更快的数据库操作,尤其是面对数据量较大的过程,且速度不会随着数据库的增大有明显的降低;图数据库的数据更直观,相应的SQL(结构化查询语言,Structured Query Language)语句也更好写;图数据库存储更灵活,只需要考虑节点属性和连接边属性。不需要创建新的表,以及和其他表的关系。
附图说明
图1所示为本申请一实施例提供的一种基于图数据库进行关系挖掘的方法的流程图。
图2所示为本申请一实施例提供的一种基于图数据库进行关系挖掘的方法中关系信息的获取过程的流程示意图。
图3所示本申请一实施例提供的一种基于图数据库进行关系挖掘的方法中的图数据库的结构示意图。
图4所示为本申请一实施例提供的一种基于图数据库进行关系挖掘的方法中生成关系信息的流程示意图。
图5所示为本申请另一实施例提供的一种基于图数据库进行关系挖掘的装置的结构示意图。
图6所示为本申请另一实施例提供的一种基于图数据库进行关系挖掘的装置的结构示意图。
图7所示为本申请一实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1所示为本申请一实施例提供的一种基于图数据库进行关系挖掘的方法的流程示意图。如图1所示,该基于图数据库进行关系挖掘的方法包括如下步骤:
步骤101:在图数据库中确定待挖掘的节点;其中图数据库包括多个节点,其中的每个节点通过至少一个连接边与周围的至少一个节点连接,连接边承载有表征连接边两端的节点之间关系的关系信息。
图数据库是一种非关系型数据库,它应用图形理论存储实体之间的关系信息,是最接近高性能的一种用于存储数据的数据结构方式之一。图数据库的基本含义是以“图”这种数据结构存储和查询数据,而不是存储图片的数据库。它的数据模型主要是以节点和连接边来体现,也可处理键值对。它的优点是快速解决复杂的关系问题。最常见的应用是社会网络中人与人之间的关系,从而进行以人为基础的关系挖掘,如人人关系,人房关系等,房房关系能,更好的服务于社会治安管理,协助公安机关对重点人员进行关系排查及团伙挖掘,从而提前防范,减少警情发生。由此可见,相对于传统的关系数据库中的各种关联表,图形数据库中的关系可以通过关系能够包含属性这一功能来提供更为丰富的关系展现方式。因此相较于关系型数据库,图形数据库的用户在对事物进行抽象时更利于展现丰富的关系。
应当理解,图数据库中的节点可包括以下信息中的一种:人的属性信息、车的属性信息、房的属性信息和设备的属性信息。当节点对应不同类型的属性信息时,节点之间的关系信息也有不同的表征方式。例如,当图数据库中的节点包括人的属性信息时,关系信息就可包括人际关系信息。图数据库中节点和连接边所承载的关系信息可根据具体的应用场景而调整,以实现不同应用场景下的关系挖掘,本申请对图数据库的具体表现形式不做限定,也不对该基于图数据库进行关系挖掘的方法的应用场景做限定。
在本申请一实施例中,待挖掘的节点可通过第三方指定的方式确定,例如在公安机关破案的场景下,图数据库中的节点就可包括人的属性信息(例如姓名、年龄、性别、职业等),关系信息可包括人际关系信息(例如同学、同事、朋友等)。这样公安机关就可将已确定的犯罪嫌疑人的身份信息确定为待挖掘的节点,并通过关系挖掘找出潜在的同伙犯罪嫌疑人。在另一实施例中,也可基于预设检索规则在图数据库中检索出待挖掘的节点,例如公安机关虽然并未确定犯罪嫌疑人的身份信息,但掌握了一些犯罪嫌疑人的属性信息(例如年龄、性别、职业等),此时也可通过一些检索条件在图数据库中检索到待挖掘的节点,并以此待挖掘的节点挖掘出更多的人际关系。
步骤102:获取从待挖掘的节点到周围节点之间所需经过的所有连接边对应的关系信息。
在图数据库的关系网络中,待挖掘的节点有多个周围节点,该多个周围节点可能要通过一个连接边抵达待挖掘的节点,也可能要辗转多个连接边才能抵达待挖掘的节点。通过获取从待挖掘的节点到周围节点之间所需经过的所有连接边对应的关系信息,可获取可能与待挖掘的节点有关的所有关系信息。
在本申请一实施例中,如图2所示,该关系信息的获取过程可具体包括如下步骤:
步骤1021:以待挖掘的节点为中心,逐级获取从待挖掘的节点到周围节点之间所需经过的所有连接边对应的关系信息。具体而言,可先获取距离待挖掘的节点只有一个连接边的周围节点对应的关系信息,然后再获取距离待挖掘的节点有两个连接边的周围节点对应的关系信息,以此类推。
步骤1022:当从待挖掘的节点到当前的周围节点之间所需经过的连接边数量达到阈值时,停止逐级获取的过程。由于图数据库的关系网络可能十分庞大,距离待挖掘的节点较远的周围节点所对应的关系信息可能并不一定有价值,因此可设定一个阈值,以当逐级获取的级数足够多时,停止逐级获取过程。然而应当理解,该阈值可根据具体的应用场景而调整,本申请不做具体限定。
步骤103:根据获取到的关系信息生成待挖掘的节点与周围节点之间的关系信息,和/或多个周围节点之间的关系信息。
在本申请一实施例中,可将获取到的关系信息生成待挖掘的节点与周围节点之间的关系信息输入神经网络模型,然后获取神经网络模型输出的待挖掘的节点与周围节点之间的关系信息,和/或多个周围节点之间的关系信息。神经网络模型可通过预学习的训练过程建立。
当获取到可能与待挖掘的节点有关的所有关系信息时,则可直接判断待挖掘的节点与某一个周围节点之间的关系信息。例如,在公安机关破案的应用场景下,当发现从待挖掘的节点(对应已知犯罪嫌疑人)到某一个周围节点,所经过的连接边承载了居住关系、家庭关系、同乡关系等关系信息时,则可将该周围节点判断为隐形同伙嫌疑人。再例如,当从待挖掘的节点到某一个周围节点,所经过的连接边承载了如下关系信息时:同乡-->居住房间-->房间内其他住户-->房间所在楼栋-->楼栋包含设备-->设备上通行的人时,则可判断该待挖掘的节点与该周围节点可能是同行关系。再例如图3所示,当节点朱A到马F,所经过的连接边承载了如下关系信息时:住宿-->居住房间1004-->住宿-->冯D-->住宿-->1005-->住宿-->王E-->老乡备-->马F,则说明朱A和马F极有可能是相互认识的,而朱A和马F之间的关系则可推断为同学/同事/老乡的关系。
此外,当获取到可能与待挖掘的节点有关的所有关系信息时,还可直接判断多个周围节点之间的关系信息。例如图3所示,当节点朱A、张B、李C和冯D同时与节点房间1004存在住宿关系时,则可判断朱A、张B、李C和冯D之间可能彼此是同学或同事关系。
由此可见,如图3所示,基于一个图数据库的关系网络,既可在广度意义上实现对于一个节点与周围节点之间关系信息的挖掘,也可在深度意义上实现相距较远的两个节点之间关系信息的挖掘。
在本申请一实施例中,考虑到在关系挖掘的过程中,从待挖掘的节点抵达某一个周围节点的连接边的路径可能有多种,这样的话就可能会挖掘出该待挖掘的节点与该周围节点的多个重复的关系信息,此时可过滤掉这些重复的关系信息。
在本申请另一实施例中,在根据获取到的关系信息生成待挖掘的节点与周围节点之间的关系信息,和/或多个周围节点之间的关系信息之后,可进一步在图数据库中生成承载获取到的关系信息的连接边,从而实现对图数据库的主动更新,以进一步提高后续关系挖掘过程的准确性。
在本申请另一实施例中,如图4所示,根据获取到的关系信息生成待挖掘的节点与周围节点之间的关系信息,和/或多个周围节点之间的关系信息可具体包括如下步骤:
步骤1031:根据获取到的关系信息筛选出与待挖掘的节点之间的关系信息满足预设条件的周围节点。
步骤1032:统一生成待挖掘的节点与满足预设条件的周围节点之间的关系信息。
这样可先根据应用场景的需求筛选出所有满足预设条件的周围节点,然后再统一生成挖掘出的关系信息,可进一步提高关系挖掘的效率。例如在公安破案场景下,当公安机关确定同伙嫌疑人为与待挖掘的节点(对应已知犯罪嫌疑人)有过合住关系的同乡时,就可筛选出所有与待挖掘的节点之间的关系信息同时满足合住和同乡两个条件的周围节点,并将这些筛选出的周围节点统一确定为同伙嫌疑人。然而应当理解,该预设条件可根据具体的应用场景而调整,本申请对该预设条件的具体内容不做限定。
由此可见,本申请实施例提供的一种基于图数据库进行关系挖掘的方法,通过基于图数据库进行关系挖掘,关系数据来源丰富,除上报的个人静态数据外,还可利用个人的居住情况,通行情况,抓怕图像信息及与其有相近行为的他人共同生成关系网络。可挖掘的关系范围深,关系种类多,利用图数据库及其可视化界面,可挖掘多级关系及隐性关系,且关系主体不局限于人,房、车、设备等可采用合同方式构建关系网络。基于图数据库的关系挖掘可根据数据的量级及属性特征进行关系网络的更新,同时可通过机器学习的方式让关系网络自主更新。图数据库相比传统的关系型数据库,有更快的数据库操作,尤其是面对数据量较大的过程,且速度不会随着数据库的增大有明显的降低;图数据库的数据更直观,相应的SQL(结构化查询语言,Structured Query Language)语句也更好写;图数据库存储更灵活,只需要考虑节点属性和连接边属性。不需要创建新的表,以及和其他表的关系。
图5所示为本申请另一实施例提供的一种基于图数据库进行关系挖掘的装置的结构示意图。如图5所示,该基于图数据库进行关系挖掘的装置50包括:
确定模块501,配置为在图数据库中确定待挖掘的节点;其中图数据库包括多个节点,其中的每个节点通过至少一个连接边与周围的至少一个节点连接,连接边承载有表征连接边两端的节点之间关系的关系信息;
获取模块502,配置为获取从待挖掘的节点到周围节点之间所需经过的所有连接边对应的关系信息;以及
判断模块503,配置为根据获取到的关系信息生成待挖掘的节点与周围节点之间的关系信息,和/或多个周围节点之间的关系信息。
在本申请一实施例中,如图6所示,获取模块502进一步配置为:
将获取到的关系信息生成待挖掘的节点与周围节点之间的关系信息输入神经网络模型,以及获取所述神经网络模型输出的所述待挖掘的节点与周围节点之间的关系信息,和/或多个周围节点之间的关系信息,神经网络模型通过预学习的训练过程建立。
在本申请一实施例中,如图6所示,获取模块502包括:
获取单元5021,配置为以待挖掘的节点为中心,逐级获取从待挖掘的节点到周围节点之间所需经过的所有连接边对应的关系信息;以及
判断单元5022,配置为当从待挖掘的节点到当前的周围节点之间所需经过的连接边数量达到阈值时,停止逐级获取的过程。
在本申请一实施例中,如图6所示,判断模块503包括:
筛选单元5031,配置为根据获取到的关系信息筛选出与待挖掘的节点之间的关系信息满足预设条件的周围节点;以及
生成单元5032,配置为统一生成待挖掘的节点与满足预设条件的周围节点之间的关系信息。
在本申请一实施例中,如图6所示,该装置50进一步包括:
生成模块504,配置为在根据获取到的关系信息生成待挖掘的节点与周围节点之间的关系信息,和/或多个周围节点之间的关系信息之后,在图数据库中生成承载获取到的关系信息的连接边。
在本申请一实施例中,图数据库基于机器学习的方式更新。
在本申请一实施例中,如图6所示,该装置50进一步包括:过滤模块505,配置为过滤掉重复的关系信息。
在本申请一实施例中,待挖掘的节点通过第三方指定的方式确定;或,确定模块501进一步配置为:基于预设检索规则在图数据库中检索出待挖掘的节点。
在本申请一实施例中,图数据库中的节点包括人的属性信息,关系信息包括人际关系信息。
在本申请一实施例中,图数据库中的节点包括以下信息中的一种:人的属性信息、车的属性信息、房的属性信息和设备的属性信息。
上述基于图数据库进行关系挖掘的装置50中的各个模块的具体功能和操作已经在上面参考图1到图4描述的基于图数据库进行关系挖掘的方法中进行了详细介绍,因此,这里将省略其重复描述。
需要说明的是,根据本申请实施例的基于图数据库进行关系挖掘的装置50可以作为一个软件模块和/或硬件模块而集成到电子设备70中,换言之,该电子设备70可以包括该基于图数据库进行关系挖掘的装置50。例如,该基于图数据库进行关系挖掘的装置50可以是该电子设备70的操作系统中的一个软件模块,或者可以是针对于其所开发的一个应用程序;当然,该基于图数据库进行关系挖掘的装置50同样可以是该电子设备70的众多硬件模块之一。
在本申请另一实施例中,该基于图数据库进行关系挖掘的装置50与该电子设备70也可以是分立的设备(例如,服务器),并且该基于图数据库进行关系挖掘的装置50可以通过有线和/或无线网络连接到该电子设备70,并且按照约定的数据格式来传输交互信息。
图7所示为本申请一实施例提供的电子设备的结构示意图。如图7所示,该电子设备70包括:一个或多个处理器701和存储器702;以及存储在存储器702中的计算机程序指令,计算机程序指令在被处理器701运行时使得处理器701执行如上述任一实施例的基于图数据库进行关系挖掘的方法。
处理器701可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器702可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器701可以运行程序指令,以实现上文的本申请的各个实施例的基于图数据库进行关系挖掘的方法中的步骤以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如光线强度、补偿光强度、滤光片的位置等信息。
在一个示例中,电子设备70还可以包括:输入装置703和输出装置704,这些组件通过总线系统和/或其他形式的连接机构(图7中未示出)互连。
该输出装置704可以向外部输出各种信息,例如可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图7中仅示出了该电子设备70中与本申请有关的组件中的一些,省略了诸如总线、输入装置/输出接口等组件。除此之外,根据具体应用情况,电子设备70还可以包括任何其他适当的组件。
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,包括计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行如上述任一实施例的基于图数据库进行关系挖掘的方法中的步骤。
计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本说明书上述各种实施例的基于图数据库进行关系挖掘的方法中的步骤。
计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器((RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (22)

1.一种基于图数据库进行关系挖掘的方法,其特征在于,包括:
在图数据库中确定待挖掘的节点;其中所述图数据库包括多个所述节点,其中的每个所述节点通过至少一个连接边与周围的至少一个所述节点连接,所述连接边承载有表征所述连接边两端的所述节点之间关系的关系信息;
获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息;以及
根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息。
2.根据权利要求1所述的方法,其特征在于,所述根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息包括:
将获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息输入神经网络模型,以及获取所述神经网络模型输出的所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息,所述神经网络模型通过预学习的训练过程建立。
3.根据权利要求1所述的方法,其特征在于,所述获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息包括:
以所述待挖掘的节点为中心,逐级获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息;以及
当从所述待挖掘的节点到当前的周围节点之间所需经过的连接边数量达到阈值时,停止所述逐级获取的过程。
4.根据权利要求1所述的方法,其特征在于,所述根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息包括:
根据获取到的所述关系信息筛选出与所述待挖掘的节点之间的关系信息满足预设条件的周围节点;以及
统一生成所述待挖掘的节点与所述满足预设条件的周围节点之间的关系信息。
5.根据权利要求1所述的方法,其特征在于,在根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息之后,进一步包括:
在所述图数据库中生成承载获取到的关系信息的连接边。
6.根据权利要求1所述的方法,其特征在于,所述图数据库基于机器学习的方式更新。
7.根据权利要求1所述的方法,其特征在于,进一步包括:
过滤掉重复的关系信息。
8.根据权利要求1至7中任一所述的方法,其特征在于,所述待挖掘的节点通过第三方指定的方式确定;或,
所述在图数据库中确定待挖掘的节点包括:基于预设检索规则在所述图数据库中检索出所述待挖掘的节点。
9.根据权利要求1至7中任一所述的方法,其特征在于,所述图数据库中的所述节点包括人的属性信息,所述关系信息包括人际关系信息。
10.根据权利要求1至7中任一所述的方法,其特征在于,所述图数据库中的所述节点包括以下信息中的一种:人的属性信息、车的属性信息、房的属性信息和设备的属性信息。
11.一种基于图数据库进行关系挖掘的装置,其特征在于,包括:
确定模块,配置为在图数据库中确定待挖掘的节点;其中所述图数据库包括多个所述节点,其中的每个所述节点通过至少一个连接边与周围的至少一个所述节点连接,所述连接边承载有表征所述连接边两端的所述节点之间关系的关系信息;
获取模块,配置为获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息;以及
判断模块,配置为根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息。
12.根据权利要求11所述的装置,其特征在于,所述获取模块进一步配置为:
将获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息输入神经网络模型,以及获取所述神经网络模型输出的所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息,所述神经网络模型通过预学习的训练过程建立。
13.根据权利要求11所述的装置,其特征在于,所述获取模块包括:
获取单元,配置为以所述待挖掘的节点为中心,逐级获取从所述待挖掘的节点到周围节点之间所需经过的所有连接边对应的所述关系信息;以及
判断单元,配置为当从所述待挖掘的节点到当前的周围节点之间所需经过的连接边数量达到阈值时,停止所述逐级获取的过程。
14.根据权利要求11所述的装置,其特征在于,所述判断模块包括:
筛选单元,配置为根据获取到的所述关系信息筛选出与所述待挖掘的节点之间的关系信息满足预设条件的周围节点;以及
生成单元,配置为统一生成所述待挖掘的节点与所述满足预设条件的周围节点之间的关系信息。
15.根据权利要求11所述的装置,其特征在于,进一步包括:
生成模块,配置为在根据获取到的所述关系信息生成所述待挖掘的节点与所述周围节点之间的关系信息,和/或多个所述周围节点之间的关系信息之后,在所述图数据库中生成承载获取到的关系信息的连接边。
16.根据权利要求11所述的装置,其特征在于,所述图数据库基于机器学习的方式更新。
17.根据权利要求11所述的装置,其特征在于,进一步包括:
过滤模块,配置为过滤掉重复的关系信息。
18.根据权利要求11至17中任一所述的装置,其特征在于,所述待挖掘的节点通过第三方指定的方式确定;或,
所述确定模块进一步配置为:基于预设检索规则在所述图数据库中检索出所述待挖掘的节点。
19.根据权利要求11至17中任一所述的装置,其特征在于,所述图数据库中的所述节点包括人的属性信息,所述关系信息包括人际关系信息。
20.根据权利要求11至17中任一所述的装置,其特征在于,所述图数据库中的所述节点包括以下信息中的一种:人的属性信息、车的属性信息、房的属性信息和设备的属性信息。
21.一种电子设备,包括:
处理器;以及
存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1至10中任一所述的方法。
22.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求1至10中任一所述的方法。
CN201910607533.9A 2019-07-04 2019-07-04 基于图数据库进行关系挖掘的方法和装置 Pending CN110457505A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910607533.9A CN110457505A (zh) 2019-07-04 2019-07-04 基于图数据库进行关系挖掘的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910607533.9A CN110457505A (zh) 2019-07-04 2019-07-04 基于图数据库进行关系挖掘的方法和装置

Publications (1)

Publication Number Publication Date
CN110457505A true CN110457505A (zh) 2019-11-15

Family

ID=68482340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910607533.9A Pending CN110457505A (zh) 2019-07-04 2019-07-04 基于图数据库进行关系挖掘的方法和装置

Country Status (1)

Country Link
CN (1) CN110457505A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111966870A (zh) * 2020-08-14 2020-11-20 深圳市万物云科技有限公司 一种基于图数据库的社区关系实时构建方法及其相关组件
CN112053174A (zh) * 2020-09-29 2020-12-08 中国银行股份有限公司 一种银行客户和柜员关系的确定方法、装置及设备
CN112199544A (zh) * 2020-11-05 2021-01-08 北京明略软件系统有限公司 全图挖掘预警方法、系统、电子设备及计算机可读存储介质
CN115329151A (zh) * 2022-10-17 2022-11-11 北方健康医疗大数据科技有限公司 图数据库的优化方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9317567B1 (en) * 2011-02-16 2016-04-19 Hrl Laboratories, Llc System and method of computational social network development environment for human intelligence
CN107832440A (zh) * 2017-11-17 2018-03-23 北京锐安科技有限公司 一种数据挖掘方法、装置、服务器及计算机可读存储介质
CN108491511A (zh) * 2018-03-23 2018-09-04 腾讯科技(深圳)有限公司 基于图数据的数据挖掘方法和装置、模型训练方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9317567B1 (en) * 2011-02-16 2016-04-19 Hrl Laboratories, Llc System and method of computational social network development environment for human intelligence
CN107832440A (zh) * 2017-11-17 2018-03-23 北京锐安科技有限公司 一种数据挖掘方法、装置、服务器及计算机可读存储介质
CN108491511A (zh) * 2018-03-23 2018-09-04 腾讯科技(深圳)有限公司 基于图数据的数据挖掘方法和装置、模型训练方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111966870A (zh) * 2020-08-14 2020-11-20 深圳市万物云科技有限公司 一种基于图数据库的社区关系实时构建方法及其相关组件
CN112053174A (zh) * 2020-09-29 2020-12-08 中国银行股份有限公司 一种银行客户和柜员关系的确定方法、装置及设备
CN112053174B (zh) * 2020-09-29 2024-03-29 中国银行股份有限公司 一种银行客户和柜员关系的确定方法、装置及设备
CN112199544A (zh) * 2020-11-05 2021-01-08 北京明略软件系统有限公司 全图挖掘预警方法、系统、电子设备及计算机可读存储介质
CN112199544B (zh) * 2020-11-05 2024-02-27 北京明略软件系统有限公司 全图挖掘预警方法、系统、电子设备及计算机可读存储介质
CN115329151A (zh) * 2022-10-17 2022-11-11 北方健康医疗大数据科技有限公司 图数据库的优化方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110688495B (zh) 一种事件信息的知识图谱模型构建方法、装置、存储介质
CN110457505A (zh) 基于图数据库进行关系挖掘的方法和装置
US12026937B2 (en) Method for generating classification model, electronic device, and medium
CN105653559B (zh) 用于在数据库中进行搜索的方法和装置
CN105830081A (zh) 生成用于有针对性地保护重要应用的特定于应用的模型的方法和系统
JP2022537170A (ja) 認知ビデオおよび音声検索集約
US11146599B1 (en) Data stream processing to facilitate conferencing based on protocols
CN106919555A (zh) 用于日志流内包含的数据的字段提取的系统和方法
CN105700819B (zh) 用于网络数据存储的方法和系统
CN108269331A (zh) 一种智能视频大数据处理系统
WO2022160222A1 (zh) 缺陷检测方法及装置、模型训练方法及装置及电子设备
CN106027593A (zh) 用于动态地维护数据结构的方法和系统
Lee et al. Building a generic platform for big sensor data application
CN113157947A (zh) 知识图谱的构建方法、工具、装置和服务器
CN110348719A (zh) 一种基于用户信息知识图谱的风险控制方法、装置和电子设备
Jin et al. Peekaboo: A hub-based approach to enable transparency in data processing within smart homes
US11709996B2 (en) Suggesting captions for content
CN109885693A (zh) 基于知识图谱的快速知识对比方法及系统
CN109903122A (zh) 房产交易信息处理方法、装置、设备及存储介质
Anand et al. Clustering of big data in cloud environments for smart applications
CN115510249A (zh) 一种知识图谱的构建方法及装置、电子设备、存储介质
Vuppalapati Building enterprise IoT applications
CN113326381A (zh) 基于动态本体的语义和知识图谱分析方法、平台及设备
JP2016119082A (ja) ソーシャルネットワーク状況内での選択的なコンテキスト公開を提供するためのコンピュータ実装システム及び方法
WO2024088025A1 (zh) 一种基于多维数据的5gc网元自动化纳管方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191115

RJ01 Rejection of invention patent application after publication