CN114638007B - 基于图数据的社群关系的确定方法及系统、设备及介质 - Google Patents

基于图数据的社群关系的确定方法及系统、设备及介质 Download PDF

Info

Publication number
CN114638007B
CN114638007B CN202210499574.2A CN202210499574A CN114638007B CN 114638007 B CN114638007 B CN 114638007B CN 202210499574 A CN202210499574 A CN 202210499574A CN 114638007 B CN114638007 B CN 114638007B
Authority
CN
China
Prior art keywords
community
members
association
target community
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210499574.2A
Other languages
English (en)
Other versions
CN114638007A (zh
Inventor
潘志锐
卞阳
陈立峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fucun Technology Shanghai Co ltd
Original Assignee
Fucun Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fucun Technology Shanghai Co ltd filed Critical Fucun Technology Shanghai Co ltd
Priority to CN202210499574.2A priority Critical patent/CN114638007B/zh
Publication of CN114638007A publication Critical patent/CN114638007A/zh
Application granted granted Critical
Publication of CN114638007B publication Critical patent/CN114638007B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于图数据的社群关系的确定方法及系统、设备及介质,所述确定方法包括:接收加密标签数据;根据图数据中与加密标签数据对应的节点关系,确定获取目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果并发送至发起端,发起端根据同态加密算法进行解密处理,根据解密处理结果确定第一社群和第二社群是否符合合并条件。本发明充分利用不同机构、不同特征的异构图数据对跨域社群进行联合计算,无需遍历所有图数据即可精准确定各社群间的关联关系,从而可对不同社群进行融合,并且通过隐私集合求交及同态加密算法等方式为各方图数据提供隐私保护,数据安全性及计算效率高,具有较强的可行性和广泛的适用性。

Description

基于图数据的社群关系的确定方法及系统、设备及介质
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于图数据的社群关系的确定方法及系统、设备及介质。
背景技术
图数据库是基于图论实现的一种提供图数据存储、读取、分析的数据库系统,具有原子性、一致性、隔离性、持久性的特点。通过图数据库,个体与个体之间关联关系产生的数据大多数能够以图的形式表现,例如在社交网络、通信、电子商务等领域产生巨量的图数据。现实中各机构所各自拥有的图数据特征比较单一,而出于数据隐私性和安全性考虑,机构间的图数据是相互独立隔离的,很难保证授权分享的同时避免实际图数据的泄漏。
对于社群大数据而言,从海量数据中发现社群关系具有很高的数据利用价值,但由于上述图数据库的数据隐私性和安全性等问题的存在,阻碍了图数据库在社群大数据处理中充分发挥作用。
发明内容
本发明要解决的技术问题是为了克服现有技术中社群关系发现效率低下或效果不佳问题的缺陷,提供一种基于安全图的基于图数据的社群关系的确定方法。
本发明是通过下述技术方案来解决上述技术问题:
本发明的第一方面提供了一种基于图数据的社群关系的确定方法,应用于接收端;所述确定方法包括:
接收加密标签数据;所述加密标签数据由发起端对第一社群和第二社群中的目标社群成员对应的标签信息根据同态加密算法进行加密处理得到;
根据所述图数据中的与所述加密标签数据对应的节点关系,确定获取所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果;
发送所述关联结果至所述发起端,以使所述发起端根据所述同态加密算法对所述关联结果进行解密处理,并根据所述解密处理的结果确定所述第一社群和所述第二社群是否符合合并条件。
较佳地,所述根据所述图数据中的与所述加密标签数据对应和节点关系,确定获取所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果的步骤包括:
分别对每个目标社群成员在所述图数据中进行最短路径查询,以确定所述目标社群成员是否存在具有关联关系的关联成员;
根据对所述目标社群成员是否存在具有关联关系的关联成员的判断结果,获取所述关联结果;其中,所述关联成员与所述目标社群成员属于不同的社群。
较佳地,所述目标社群成员包括所述第一社群和所述第二社群中的原有成员和若干噪声成员;所述关联成员不是所述噪声成员;
所述分别对每个目标社群成员在所述图数据中进行最短路径查询,以确定所述目标社群成员是否存在具有关联关系的关联成员的步骤包括:
分别对每个目标社群成员根据所述图数据进行最短路径查询,以判断是否存在与所述目标社群成员具有关联关系的候选成员;所述候选成员与所述目标社群成员属于不同的社群;
若不存在,则确定所述目标社群成员不存在具有关联关系的关联成员;
若存在,则接收所述接收端发送的所述候选成员对应的加密标签数据,并根据所述同态加密算法,对所述候选成员对应的标签值进行解密,以判断所述候选成员中是否均为噪声成员,若不是,则判断所述目标社群成员存在关联成员。
较佳地,所述根据对所述目标社群成员是否存在具有关联关系的关联成员的判断结果,获取所述关联结果的步骤包括:
根据对每个目标社群成员的判断结果,确定具有关联成员的非噪声成员的目标社群成员在所有的非噪声成员的目标社群成员中的比例参数;
根据所述比例参数获取所述关联结果。
本发明的第二方面提供了一种基于图数据的社群关系的确定方法,应用于发起端;所述确定方法包括:
对第一社群和第二社群中的目标社群成员对应的标签信息,根据同态加密算法进行加密处理以生成加密标签数据,并发送至接收端;
接收所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果,所述关联结果由所述接收端根据所述图数据中的与所述加密标签数据对应的节点关系确定;
根据所述同态加密算法对所述关联结果进行解密处理,并根据所述解密处理的结果确定所述第一社群和所述第二社群是否符合合并条件。
本发明的第三方面提供了一种基于图数据的社群关系的确定系统,应用于接收端;所述确定系统包括:
接收模块,用于接收加密标签数据;所述加密标签数据由发起端对第一社群和第二社群中的目标社群成员对应的标签信息根据同态加密算法进行加密处理得到;
确定模块,用于根据所述图数据中的与所述加密标签数据对应的节点关系,确定获取所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果;
发送模块,用于发送所述关联结果至所述发起端,以使所述发起端根据所述同态加密算法对所述关联结果进行解密处理,并根据所述解密处理的结果确定所述第一社群和所述第二社群是否符合合并条件。
较佳地,所述确定模块包括:
查询单元,用于分别对每个目标社群成员在所述图数据中进行最短路径查询,以确定所述目标社群成员是否存在具有关联关系的关联成员;
关联结果获取单元,用于根据对所述目标社群成员是否存在具有关联关系的关联成员的判断结果,获取所述关联结果;其中,所述关联成员与所述目标社群成员属于不同的社群。
较佳地,所述目标社群成员包括所述第一社群和所述第二社群中的原有成员和若干噪声成员;所述关联成员不是所述噪声成员;
所述查询单元具体用于:分别对每个目标社群成员根据所述图数据进行最短路径查询,以判断是否存在所述目标社群成员存在具有关联关系的候选成员;所述候选成员与所述目标社群成员属于不同的社群;
若不存在,则确定所述目标社群成员不存在具有关联关系的关联成员;
若存在,则接收所述接收端发送的所述候选成员对应的加密标签数据,并根据所述同态加密算法,对所述候选成员对应的标签值进行解密,以判断所述候选成员中是否均为噪声成员,若不是,则确定所述目标社群成员存在关联成员。
较佳地,所述关联结果获取单元具体用于:
根据对每个目标社群成员的判断结果,确定具有关联成员的非噪声成员的目标社群成员在所有的非噪声成员的目标社群成员中的比例参数;
根据所述比例参数获取所述关联结果。
本发明的第四方面提供了一种基于图数据的社群关系的确定系统,应用于发起端;所述确定系统包括:
标签发送模块,用于对第一社群和第二社群中的目标社群成员对应的标签信息,根据同态加密算法进行加密处理以生成加密标签数据,并发送至接收端;
关联结果接收模块,用于接收所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果,所述关联结果由所述接收端根据所述图数据中的与所述加密标签数据对应的节点关系确定;
关联程度确定模块,用于根据所述同态加密算法对所述关联结果进行解密处理,以根据所述解密处理的结果确定所述第一社群和所述第二社群是否符合合并条件。
本发明的第五方面提供了一种电子设备,包括存储器以及与所述存储器连接的处理器,所述处理器执行存储在所述存储器上的计算机程序时实现上述的基于图数据的社群关系的确定方法。
本发明的第六方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的基于图数据的社群关系的确定方法。
本发明的积极进步效果在于:本发明的基于图数据的社群关系的确定方法及系统、设备及介质充分利用不同机构、不同特征的异构图数据对跨域社群进行联合计算,无需遍历所有图数据即可精准确定各社群间的关联关系,从而可对不同社群进行融合,并且通过隐私集合求交及同态加密算法等方式为各方图数据提供隐私保护,数据安全性及计算效率高,且具有广泛的应用场景和较强的可行性。
附图说明
图1为本发明实施例1的基于图数据的社群关系的确定方法的流程图。
图2为本发明实施例1中A社群进行节点加密的示意图。
图3为本发明实施例1中B社群进行节点加密的示意图。
图4为本发明实施例1中关联关系字段更新值的示意图。
图5为本发明实施例2的基于图数据的社群关系的确定方法的流程图。
图6为本发明实施例3的基于图数据的社群关系的确定系统的模块示意图。
图7为本发明实施例4的基于图数据的社群关系的确定系统的模块示意图。
图8为本发明实施例5的电子设备的结构框图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
本发明的基于图数据的社群关系的确定方法及系统用于实现跨域社群数据融合。所谓跨域社群数据,即来源不同或分属于不同的数据域的社群数据集合。实施例中以两方机构参与为例的应用场景进行说明,分别为发起端和接收端。其中,发起端存储有跨域社群数据,即拥有两个或两个以上显式的社群团体知识数据集。并且为便于描述,实施例中均以两个社群团体为例进行说明,即第一社群和第二社群。可以理解,即使对两个以上社群团体也可以有效实现多个社群关系的选择性融合。
实施例1
参见图1所示,本实施例具体提供了一种基于图数据的社群关系的确定方法,应用于接收端;包括:
S1.接收加密标签数据;加密标签数据由发起端对第一社群和第二社群中的目标社群成员对应的标签信息根据同态加密算法进行加密处理得到;
S2.根据图数据中的与加密标签数据对应的节点关系,确定获取目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果;
S3.发送关联结果至发起端,以使发起端根据同态加密算法对关联结果进行解密处理,并根据解密处理的结果确定第一社群和第二社群是否符合合并条件。
本实施例以接收端侧为例进行说明。步骤S1中,第一社群和第二社群中的目标社群成员是跨域数据融合的发现对象,步骤S1通过接收对第一社群和第二社群中的目标社群成员对应的标签信息根据同态加密算法进行加密得到的目标社群成员标签信息密态值,使发起端的跨域数据映射于接收端的图数据库中以便进行关联关系分析。
在此之前,可以对发起端和接收端的数据先行进行顶点对齐处理,具体通过隐私集合求交方法实现,以保证发送给接收端的跨域数据中除图数据库节点外的其他数据的标识信息不会泄漏。具体地,由发起端采用非对称加密算法生成公钥和私钥,接收端接收公钥,并利公钥对图数据中的节点进行盲化处理后发送给接收方,接收方对第一社群和第二社群中所有成员对应的标签值进行明文签名处理,并发送至接收端;接收端对明文签名处理后的所有目标社群成员对应的标签值进行除盲处理,得到第一集合;发起端对盲化节点信息进行盲化签名处理并发送至接收端,接收端对盲化签名处理后的盲化节点信息进行除盲处理,得到第二集合;在接收端对第一集合和第二集合求交获得的成员交集发送至发起端,发起端对成员交集采用上述的非对称加密算法进行解密,实现发起端发送的目标社群成员和接收端图数据库顶点对齐。具体地,发起端可利用包括但不限于RSA算法(一种非对称加密算法)生成公私钥,将其中的公钥发送至接收端,接收端利用公钥对己方图数据库中节点id(标识符)进行盲化处理,将盲化处理后的节点id发送至发起端;发起端对己方的id进行明文签名,同时对接收端的id进行盲化签名,再将双方签名后的id发送至接收端。接收端对双方id进行除盲操作后,再进行密态id求交,最终获取id求交对齐结果,并由接收端将双方密态id对齐结果同步至发起端。
步骤S2根据图数据中的与加密标签数据对应的节点关系,确定获取目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果。
作为较佳的实施方式,步骤S2包括:
S21.分别对每个目标社群成员在图数据中进行最短路径查询,以确定目标社群成员是否存在具有关联关系的关联成员;
较佳地,为了防止发起端的社群数据泄漏给接收端,可以加入一些混淆数据,即通过加入的噪声成员和社群中的原有成员共同组成的目标社群成员进行计算实现数据保密。即目标社群成员包括第一社群和第二社群中的原有成员和若干噪声成员;并且关联成员不是噪声成员;此时,步骤S21包括:
分别对每个目标社群成员根据图数据进行最短路径查询,以判断是否存在与目标社群成员具有关联关系的候选成员;候选成员与目标社群成员属于不同的社群;
若不存在,则确定目标社群成员不存在具有关联关系的关联成员;
若存在,则发起端接收接收端发送的候选成员对应的加密标签数据,并根据同态加密算法,对候选成员对应的标签值进行解密,以判断候选成员中是否均为噪声成员,若不是,则确定目标社群成员存在关联成员。
由于在接收端的加密标签数据为密态值,因此在确认一个候选成员是否为噪声成员时,可以从接收端发送至发起端并由后者将标签值界面后进行噪声成员判断,如果不是噪声成员则表明该候选成员原为社群中的成员,并且在另一社群中具有关联成员,即可确定目标社群成员存在关联成员。
S22.根据对目标社群成员是否存在具有关联关系的关联成员的判断结果,获取关联结果;其中,关联成员与目标社群成员属于不同的社群。
步骤S3发送关联结果至发起端,以使发起端根据同态加密算法对关联结果进行解密处理,并根据解密处理的结果确定第一社群和第二社群是否符合合并条件。
作为较佳的实施方式,目标社群成员包括第一社群和第二社群中的原有成员和若干噪声成员;并且关联成员不是噪声成员时,步骤S3包括:
根据对每个目标社群成员的判断结果,确定具有关联成员的非噪声成员的目标社群成员在所有的非噪声成员的目标社群成员中的比例参数;
根据比例参数获取关联结果。
具体地,发起端已拥有显式数据形式存在的第一社群,用A社群表示;以及第二社群,用B社群表示,分别在A社群、B社群中加入非A社群、非B社群id名单即噪声成员,和社群中的原有成员共同组成的目标社群成员,从而在计算过程中混淆社群关系信息,防止与接收端进行交互时出现信息泄漏 。同时,如图2及图3,对A社群、B社群(均混合了噪声成员)的每个成员添加“是否为社群成员”的属性字段(is_goup),字段值“1”表示是社群成员,字段值“0”表示为非社群成员,并对该字段进行同态加密,用于后期的关联关系程度统计计算。
具体计算过程中,发起端将密态的A社群目标社群成员的混淆名单、B社群目标社群成员的混淆名单发送至接收端,接收端根据己方已有的关系图数据库数据对A社群与B社群对应的各个节点进行最短路径查询,依据最短路径的允许最大路径长度判断A社群与B社群的各节点是否存在关联关系(其中,用关联关系字段is_relation为1和0分别表征具有和不具有关联关系 ),并针对每一个节点进行关联关系值的更新。关联关系更新过程分为两个方面:
当节点a或b的关联关系字段值为空时,如图4所示,直接将节点a或b的关联关系字段值设置为b或a节点的is_group字段值,即1或0。
当节点a或b的关联关系字段值不为空时,将节点a或b的关联关系字段值与待更新值同时发送至发起端,进行同态解密并进行值的比较,选取较大值并进行同态加密,返回至接收端进行节点a或b的关联关系字段值的最终更新。
接收端分别计算A社群到B社群、B社群到A社群存在关联关系的节点数,并对各自社群的每一个节点关联关系值进行累加,将密态结果返回至发起端。发起端分别对A社群、B社群各自的关联关系密态值进行解密,并计算各自方占总节点的比例,再根据实际业务关联关系比例阈值确定A社群与B社群是否融合为同一类社群团体。此外,针对发起端拥有两个以上显式社群关系,可以依据上述流程同时进行社群两两之间的比较计算,直至所有社群团体相互之间不再有高于关联关系阈值时为止。
本实施例的基于图数据的社群关系的确定方法充分利用不同机构、不同特征的异构图数据对跨域社群进行联合计算,无需遍历所有图数据即可精准确定各社群间的关联关系,从而可对不同社群进行融合,并且通过隐私集合求交及同态加密算法等方式为各方图数据提供隐私保护,数据安全性及计算效率高,且具有广泛的应用场景和较强的可行性。
实施例2
参见图5所示,本实施例具体提供了一种基于图数据的社群关系的确定方法,应用于发起端;包括:
S101.对第一社群和第二社群中的目标社群成员对应的标签信息,根据同态加密算法进行加密处理以生成加密标签数据,并发送至接收端;
S102.接收目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果,关联结果由接收端根据图数据中的与加密标签数据对应的节点关系确定;
S103.根据同态加密算法对关联结果进行解密处理,并根据解密处理的结果确定第一社群和第二社群是否符合合并条件。
其中步骤S101对第一社群和第二社群中的目标社群成员对应的标签信息根据同态加密算法进行加密处理,生成的加密标签数据发送至接收端,由接收端根据图数据库的节点关系进一步处理,得到关联结果。步骤S102接收接收端发回的关联结果,步骤S103对关联结果进行解密处理,并根据解密处理的结果确定第一社群和第二社群是否符合合并条件。本领域技术人员可以理解,由于本实施例中是基于发起端确定社群关系,因此其中涉及接收端的实现过程可以参照实施例1。
本实施例的基于图数据的社群关系的确定方法充分利用不同机构、不同特征的异构图数据对跨域社群进行联合计算,无需遍历所有图数据即可精准确定各社群间的关联关系,从而可对不同社群进行融合,并且通过隐私集合求交及同态加密算法等方式为各方图数据提供隐私保护,数据安全性及计算效率高,且具有广泛的应用场景和较强的可行性。
实施例3
参见图6所示,本实施例具体提供了一种基于图数据的社群关系的确定系统,应用于接收端。包括:
接收模块51,用于接收加密标签数据;加密标签数据由发起端对第一社群和第二社群中的目标社群成员对应的标签信息根据同态加密算法进行加密处理得到;
确定模块52,用于根据图数据中的与加密标签数据对应的节点关系,确定获取目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果;
发送模块53,用于发送关联结果至发起端,以使发起端根据同态加密算法对关联结果进行解密处理,并根据解密处理的结果确定第一社群和第二社群是否符合合并条件。
本实施例以接收端侧为例进行说明。第一社群和第二社群中的目标社群成员是跨域数据融合的发现对象,接收模块51通过接收对第一社群和第二社群中的目标社群成员对应的标签信息根据同态加密算法进行加密得到的目标社群成员标签信息密态值,使发起端的跨域数据映射于接收端的图数据库中以便进行关联关系分析。
在此之前,可以对发起端和接收端的数据先行进行顶点对齐处理,具体通过隐私集合求交方法实现,以保证发送给接收端的跨域数据中除图数据库节点外的其他数据的标识信息不会泄漏。具体地,由发起端采用非对称加密算法生成公钥和私钥,接收端接收公钥,并利公钥对图数据中的节点进行盲化处理后发送给接收方,接收方对第一社群和第二社群中所有成员对应的标签值进行明文签名处理,并发送至接收端;接收端对明文签名处理后的所有目标社群成员对应的标签值进行除盲处理,得到第一集合;发起端对盲化节点信息进行盲化签名处理并发送至接收端,接收端对盲化签名处理后的盲化节点信息进行除盲处理,得到第二集合;在接收端对第一集合和第二集合求交获得的成员交集发送至发起端,发起端对成员交集采用上述的非对称加密算法进行解密,实现发起端发送的目标社群成员和接收端图数据库顶点对齐。具体地,发起端可利用包括但不限于RSA算法(一种非对称加密算法)生成公私钥,将其中的公钥发送至接收端,接收端利用公钥对己方图数据库中节点id进行盲化处理,将盲化处理后的节点id发送至发起端;发起端对己方的id进行明文签名,同时对接收端的id进行盲化签名,再将双方签名后的id发送至接收端。接收端对双方id进行除盲操作后,再进行密态id求交,获取id求交对齐结果,并由接收端将双方密态id对齐结果同步至发起端。
作为较佳的实施方式,确定模块52包括:
查询单元521,用于分别对每个目标社群成员在图数据中进行最短路径查询,以确定目标社群成员是否存在具有关联关系的关联成员;
较佳地,为了防止发起端的社群数据泄漏给接收端,可以加入一些混淆数据,即通过加入的噪声成员和社群中的原有成员共同组成的目标社群成员进行计算实现数据保密。即目标社群成员包括第一社群和第二社群中的原有成员和若干噪声成员;并且关联成员不是噪声成员;此时,查询单元521具体用于:分别对每个目标社群成员根据图数据进行最短路径查询,以判断是否存在目标社群成员存在具有关联关系的候选成员;候选成员与目标社群成员属于不同的社群;
若不存在,则确定目标社群成员不存在具有关联关系的关联成员;
若存在,则接收接收端发送的候选成员对应的加密标签数据,并根据同态加密算法,对候选成员对应的标签值进行解密,以判断候选成员中是否均为噪声成员,若不是,则确定目标社群成员存在关联成员。
由于在接收端的加密标签数据为密态值,因此在确认一个候选成员是否为噪声成员时,可以从接收端发送至发起端并由后者将标签值界面后进行噪声成员判断,如果不是噪声成员则表明该候选成员原为社群中的成员,并且在另一社群中具有关联成员,即可确定目标社群成员存在关联成员。
关联结果获取单元522,用于根据对目标社群成员是否存在具有关联关系的关联成员的判断结果,获取关联结果;其中,关联成员与目标社群成员属于不同的社群。
发送模块53发送关联结果至发起端,以使发起端根据同态加密算法对关联结果进行解密处理,并根据解密处理的结果确定第一社群和第二社群是否符合合并条件。
作为较佳的实施方式,目标社群成员包括第一社群和第二社群中的原有成员和若干噪声成员;并且关联成员不是噪声成员时,发送模块53具体用于:根据对每个目标社群成员的判断结果,确定具有关联成员的非噪声成员的目标社群成员在所有的非噪声成员的目标社群成员中的比例参数;根据比例参数获取关联结果。
具体地,发起端已拥有显式数据形式存在的第一社群,用A社群表示;以及第二社群,用B社群表示,分别在A社群、B社群中加入非A社群、非B社群id名单即噪声成员,和社群中的原有成员共同组成的目标社群成员,从而在计算过程中混淆社群关系信息,防止与接收端进行交互时出现信息泄漏。对A社群、B社群(均混合了噪声成员)的每个成员添加“是否为社群成员”的属性字段(is_goup),字段值“1”表示是社群成员,字段值“0”表示为非社群成员,并对该字段进行同态加密,用于后期的关联关系程度统计计算。
具体计算过程中,发起端将密态的A社群目标社群成员的混淆名单、B社群目标社群成员的混淆名单发送至接收端,接收端根据己方已有的关系图数据库数据对A社群与B社群对应的各个节点进行最短路径查询,依据最短路径的允许最大路径长度判断A社群与B社群的各节点是否存在关联关系(其中,用关联关系字段is_relation为1和0分别表征具有和不具有关联关系),并针对每一个节点进行关联关系值的更新。关联关系更新过程分为两个方面:
当节点a或b的关联关系字段值为空时,直接将节点a或b的关联关系字段值设置为b或a节点的is_group字段值,即1或0。
当节点a或b的关联关系字段值不为空时,将节点a或b的关联关系字段值与待更新值同时发送至发起端,进行同态解密并进行值的比较,选取较大值并进行同态加密,返回至接收端进行节点a或b的关联关系字段值的最终更新。
接收端分别计算A社群到B社群、B社群到A社群存在关联关系的节点数,并对各自社群的每一个节点关联关系值进行累加,将密态结果返回至发起端。发起端分别对A社群、B社群各自的关联关系密态值进行解密,并计算各自方占总节点的比例,再根据实际业务关联关系比例阈值确定A社群与B社群是否融合为同一类社群团体。此外,针对发起端拥有两个以上显式社群关系,可以依据上述流程同时进行社群两两之间的比较计算,直至所有社群团体相互之间不再有高于关联关系阈值时为止。
本实施例的基于图数据的社群关系的确定系统充分利用不同机构、不同特征的异构图数据对跨域社群进行联合计算,无需遍历所有图数据即可精准确定各社群间的关联关系,从而可对不同社群进行融合,并且通过隐私集合求交及同态加密算法等方式为各方图数据提供隐私保护,数据安全性及计算效率高,且具有广泛的应用场景和较强的可行性。
实施例4
参见图7所示,本实施例具体提供了一种基于图数据的社群关系的确定系统,应用于发起端;包括:
标签发送模块501,用于对第一社群和第二社群中的目标社群成员对应的标签信息,根据同态加密算法进行加密处理以生成加密标签数据,并发送至接收端;
关联结果接收模块502,用于接收所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果,所述关联结果由所述接收端根据所述图数据中的与所述加密标签数据对应的节点关系确定;
关联程度确定模块503,用于根据所述同态加密算法对所述关联结果进行解密处理,以根据所述解密处理的结果确定所述第一社群和所述第二社群是否符合合并条件。
标签发送模块501对第一社群和第二社群中的目标社群成员对应的标签信息根据同态加密算法进行加密处理,生成的加密标签数据发送至接收端,由接收端根据图数据库的节点关系进一步处理,得到关联结果。关联结果接收模块502接收接收端发回的关联结果,关联程度确定模块503对关联结果进行解密处理,并根据解密处理的结果确定第一社群和第二社群是否符合合并条件。本领域技术人员可以理解,由于本实施例中是基于发起端确定社群关系,因此其中涉及接收端的实现过程可以参照实施例3。
本实施例的基于图数据的社群关系的确定系统充分利用不同机构、不同特征的异构图数据对跨域社群进行联合计算,无需遍历所有图数据即可精准确定各社群间的关联关系,从而可对不同社群进行融合,并且通过隐私集合求交及同态加密算法等方式为各方图数据提供隐私保护,数据安全性及计算效率高,且具有广泛的应用场景和较强的可行性。
实施例5
参见图8所示,本实施例提供了一种电子设备30,包括处理器31、存储器32及存储在存储器32上并可在处理器31上运行的计算机程序,处理器31执行程序时实现实施例1以及实施例 2中的基于图数据的社群关系的确定方法。图8显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
总线33包括数据总线、地址总线和控制总线。
存储器32可以包括易失性存储器,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1以及实施例 2中的基于图数据的社群关系的确定方法。
电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,模型生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器36通过总线33与模型生成的设备30的其它模块通信。可以结合模型生成的设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现实施例1以及实施例 2中的基于图数据的社群关系的确定方法。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行实现实施例1以及实施例 2中的基于图数据的社群关系的确定方法。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (8)

1.一种基于图数据的社群关系的确定方法,其特征在于,应用于接收端;所述确定方法包括:
接收加密标签数据;所述加密标签数据由发起端对第一社群和第二社群中的目标社群成员对应的标签信息根据同态加密算法进行加密处理得到;
根据所述图数据中的与所述加密标签数据对应的节点关系,确定获取所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果;
发送所述关联结果至所述发起端,以使所述发起端根据所述同态加密算法对所述关联结果进行解密处理,并根据所述解密处理的结果确定所述第一社群和所述第二社群是否符合合并条件;
根据所述图数据中的与所述加密标签数据对应和节点关系,确定获取所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果的步骤包括:
分别对每个目标社群成员在所述图数据中进行最短路径查询,以确定所述目标社群成员是否存在具有关联关系的关联成员;
根据对所述目标社群成员是否存在具有关联关系的关联成员的判断结果,获取所述关联结果;其中,所述关联成员与所述目标社群成员属于不同的社群;
所述目标社群成员包括所述第一社群和所述第二社群中的原有成员和若干噪声成员;所述关联成员不是所述噪声成员;
所述分别对每个目标社群成员在所述图数据中进行最短路径查询,以确定所述目标社群成员是否存在具有关联关系的关联成员的步骤包括:
分别对每个目标社群成员根据所述图数据进行最短路径查询,以判断是否存在与所述目标社群成员具有关联关系的候选成员;所述候选成员与所述目标社群成员属于不同的社群;
若不存在,则确定所述目标社群成员不存在具有关联关系的关联成员;
若存在,则接收所述接收端发送的所述候选成员对应的加密标签数据,并根据所述同态加密算法,对所述候选成员对应的标签值进行解密,以判断所述候选成员中是否均为噪声成员,若不是,则判断所述目标社群成员存在关联成员。
2.如权利要求1所述的基于图数据的社群关系的确定方法,其特征在于,所述根据对所述目标社群成员是否存在具有关联关系的关联成员的判断结果,获取所述关联结果的步骤包括:
根据对每个目标社群成员的判断结果,确定具有关联成员的非噪声成员的目标社群成员在所有的非噪声成员的目标社群成员中的比例参数;
根据所述比例参数获取所述关联结果。
3.一种基于图数据的社群关系的确定方法,其特征在于,应用于发起端;所述确定方法包括:
对第一社群和第二社群中的目标社群成员对应的标签信息,根据同态加密算法进行加密处理以生成加密标签数据,并发送至接收端;
接收所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果,所述关联结果由所述接收端根据所述图数据中的与所述加密标签数据对应的节点关系确定;
根据所述同态加密算法对所述关联结果进行解密处理,并根据所述解密处理的结果确定所述第一社群和所述第二社群是否符合合并条件;
其中,所述接收端根据所述图数据中的与所述加密标签数据对应的节点关系确定所述关联结果的步骤包括:
所述接收端分别对每个所述目标社群成员在所述图数据中进行最短路径查询,以确定所述目标社群成员是否存在具有关联关系的关联成员;
根据对所述目标社群成员是否存在具有关联关系的关联成员的判断结果,获取所述关联结果;其中,所述关联成员与所述目标社群成员属于不同的社群;
所述目标社群成员包括所述第一社群和所述第二社群中的原有成员和若干噪声成员;所述关联成员不是所述噪声成员;
所述接收端分别对每个所述目标社群成员在所述图数据中进行最短路径查询,以确定所述目标社群成员是否存在具有关联关系的关联成员的步骤包括:
所述接收端分别对每个目标社群成员根据所述图数据进行最短路径查询,以判断是否存在与所述目标社群成员具有关联关系的候选成员;所述候选成员与所述目标社群成员属于不同的社群;
若不存在,则确定所述目标社群成员不存在具有关联关系的关联成员;
若存在,则接收所述接收端发送的所述候选成员对应的加密标签数据,并根据所述同态加密算法,对所述候选成员对应的标签值进行解密,以判断所述候选成员中是否均为噪声成员,若不是,则判断所述目标社群成员存在关联成员。
4.一种基于图数据的社群关系的确定系统,其特征在于,应用于接收端;所述确定系统包括:
接收模块,用于接收加密标签数据;所述加密标签数据由发起端对第一社群和第二社群中的目标社群成员对应的标签信息根据同态加密算法进行加密处理得到;
确定模块,用于根据所述图数据中的与所述加密标签数据对应的节点关系,确定获取所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果;
发送模块,用于发送所述关联结果至所述发起端,以使所述发起端根据所述同态加密算法对所述关联结果进行解密处理,并根据所述解密处理的结果确定所述第一社群和所述第二社群是否符合合并条件;
所述确定模块包括:
查询单元,用于分别对每个目标社群成员在所述图数据中进行最短路径查询,以确定所述目标社群成员是否存在具有关联关系的关联成员;
关联结果获取单元,用于根据对所述目标社群成员是否存在具有关联关系的关联成员的判断结果,获取所述关联结果;其中,所述关联成员与所述目标社群成员属于不同的社群;
所述目标社群成员包括所述第一社群和所述第二社群中的原有成员和若干噪声成员;所述关联成员不是所述噪声成员;
所述查询单元具体用于:分别对每个目标社群成员根据所述图数据进行最短路径查询,以判断是否存在所述目标社群成员存在具有关联关系的候选成员;所述候选成员与所述目标社群成员属于不同的社群;
若不存在,则确定所述目标社群成员不存在具有关联关系的关联成员;
若存在,则接收所述接收端发送的所述候选成员对应的加密标签数据,并根据所述同态加密算法,对所述候选成员对应的标签值进行解密,以判断所述候选成员中是否均为噪声成员,若不是,则确定所述目标社群成员存在关联成员。
5.如权利要求4所述的基于图数据的社群关系的确定系统,其特征在于,所述关联结果获取单元具体用于:
根据对每个目标社群成员的判断结果,确定具有关联成员的非噪声成员的目标社群成员在所有的非噪声成员的目标社群成员中的比例参数;
根据所述比例参数获取所述关联结果。
6.一种基于图数据的社群关系的确定系统,其特征在于,应用于发起端;所述确定系统包括:
标签发送模块,用于对第一社群和第二社群中的目标社群成员对应的标签信息,根据同态加密算法进行加密处理以生成加密标签数据,并发送至接收端;
关联结果接收模块,用于接收所述目标社群成员与所在社群之外的其他社群中的目标社群成员的关联结果,所述关联结果由所述接收端根据所述图数据中的与所述加密标签数据对应的节点关系确定;
关联程度确定模块,用于根据所述同态加密算法对所述关联结果进行解密处理,以根据所述解密处理的结果确定所述第一社群和所述第二社群是否符合合并条件;
其中,所述接收端分别对每个所述目标社群成员在所述图数据中进行最短路径查询,以确定所述目标社群成员是否存在具有关联关系的关联成员;根据对所述目标社群成员是否存在具有关联关系的关联成员的判断结果,获取所述关联结果;其中,所述关联成员与所述目标社群成员属于不同的社群;
所述目标社群成员包括所述第一社群和所述第二社群中的原有成员和若干噪声成员;所述关联成员不是所述噪声成员;所述接收端分别对每个目标社群成员根据所述图数据进行最短路径查询,以判断是否存在与所述目标社群成员具有关联关系的候选成员;所述候选成员与所述目标社群成员属于不同的社群;若不存在,则确定所述目标社群成员不存在具有关联关系的关联成员;若存在,则接收所述接收端发送的所述候选成员对应的加密标签数据,并根据所述同态加密算法,对所述候选成员对应的标签值进行解密,以判断所述候选成员中是否均为噪声成员,若不是,则判断所述目标社群成员存在关联成员。
7.一种电子设备,其特征在于,包括存储器以及与所述存储器连接的处理器,所述处理器执行存储在所述存储器上的计算机程序时实现权利要求1-3中任一项所述的基于图数据的社群关系的确定方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-3中任一项所述的基于图数据的社群关系的确定方法。
CN202210499574.2A 2022-05-10 2022-05-10 基于图数据的社群关系的确定方法及系统、设备及介质 Active CN114638007B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210499574.2A CN114638007B (zh) 2022-05-10 2022-05-10 基于图数据的社群关系的确定方法及系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210499574.2A CN114638007B (zh) 2022-05-10 2022-05-10 基于图数据的社群关系的确定方法及系统、设备及介质

Publications (2)

Publication Number Publication Date
CN114638007A CN114638007A (zh) 2022-06-17
CN114638007B true CN114638007B (zh) 2022-08-23

Family

ID=81953046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210499574.2A Active CN114638007B (zh) 2022-05-10 2022-05-10 基于图数据的社群关系的确定方法及系统、设备及介质

Country Status (1)

Country Link
CN (1) CN114638007B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969526A (zh) * 2019-12-13 2020-04-07 南京三百云信息科技有限公司 重叠社群处理方法、装置以及电子设备
CN112380267A (zh) * 2020-10-21 2021-02-19 山东大学 一种基于隐私图的社区发现方法
CN113095946A (zh) * 2021-04-28 2021-07-09 福州大学 基于联邦标签传播的保险客户推荐方法及系统
CN114219052A (zh) * 2022-02-23 2022-03-22 富算科技(上海)有限公司 一种图数据融合方法、装置、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10824674B2 (en) * 2016-06-03 2020-11-03 International Business Machines Corporation Label propagation in graphs
CN111159577B (zh) * 2019-12-31 2024-02-27 北京明略软件系统有限公司 一种社群划分方法、装置、存储介质及电子装置
US11328082B2 (en) * 2020-04-13 2022-05-10 Ketch Kloud, Inc. Differential privacy for encrypted data
CN113255002B (zh) * 2021-06-09 2022-07-15 北京航空航天大学 一种保护多方隐私的联邦k近邻查询方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969526A (zh) * 2019-12-13 2020-04-07 南京三百云信息科技有限公司 重叠社群处理方法、装置以及电子设备
CN112380267A (zh) * 2020-10-21 2021-02-19 山东大学 一种基于隐私图的社区发现方法
CN113095946A (zh) * 2021-04-28 2021-07-09 福州大学 基于联邦标签传播的保险客户推荐方法及系统
CN114219052A (zh) * 2022-02-23 2022-03-22 富算科技(上海)有限公司 一种图数据融合方法、装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LDPCD:A NovelMethod for Locally Differential Private Community Detection;Zhang,ZJ;《COMPUTATIONAL INTELLIGENCE AND NEUROSCIENCE》;20220420;全文 *
融合社团划分的社交网络分级隐私保护算法;陆越等;《通信技术》;20180210(第02期);第404-412页 *
面向动态社交网络隐私保护社区发现方法研究;边锦;《中国优秀博硕士学位论文全文数据库(硕士) 基础科学辑》;20220415;第A002-63页 *

Also Published As

Publication number Publication date
CN114638007A (zh) 2022-06-17

Similar Documents

Publication Publication Date Title
JP6941183B2 (ja) データのトークン化
US9158925B2 (en) Server-aided private set intersection (PSI) with data transfer
CN112131316B (zh) 应用于区块链系统的数据处理方法及装置
Salam et al. Implementation of searchable symmetric encryption for privacy-preserving keyword search on cloud storage
GB2522971A (en) Unclonable ID based chip-to-chip communication
Mo et al. On deletion of outsourced data in cloud computing
Yang et al. Publicly verifiable data transfer and deletion scheme for cloud storage
Li et al. An efficient blind filter: Location privacy protection and the access control in FinTech
CN113157778B (zh) 分布式数据仓库的可代理查询方法、系统、设备及介质
US8189790B2 (en) Developing initial and subsequent keyID information from a unique mediaID value
Virvilis et al. A cloud provider-agnostic secure storage protocol
CN107395587B (zh) 一种基于多点协作机制的数据管理方法及系统
CN115021913B (zh) 工业互联网标识解析体系密钥生成方法、系统与存储介质
Wang et al. Efficient and secure storage for outsourced data: A survey
CN114638007B (zh) 基于图数据的社群关系的确定方法及系统、设备及介质
CN112929169B (zh) 秘钥协商方法及系统
Dave et al. Securing SQL with access control for database as a service model
Yang et al. New Publicly Verifiable Data Deletion Supporting Efficient Tracking for Cloud Storage.
Liu et al. Efficient dynamic multi-client searchable encryption supporting fuzzy search
Dwivedi et al. Distributed integrity auditing of cloud data using edge computing and blockchain
Joshi et al. A Survey on Assured Data Deletion in Cloud Storage
Abraham et al. Proving possession and retrievability within a cloud environment: A comparative survey
Huang et al. A Secure and IoT-Enabled Data Sharing System Based on IPFS and IOTA Blockchain
EP4009212A1 (en) Consent management
CN113014375B (zh) 网络威胁情报信息的跨组织处理方法、相关装置和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant