CN111274495B - 用户关系强度的数据处理方法、装置、计算机设备及存储介质 - Google Patents

用户关系强度的数据处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111274495B
CN111274495B CN202010063929.4A CN202010063929A CN111274495B CN 111274495 B CN111274495 B CN 111274495B CN 202010063929 A CN202010063929 A CN 202010063929A CN 111274495 B CN111274495 B CN 111274495B
Authority
CN
China
Prior art keywords
analyzed
users
relationship
path
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010063929.4A
Other languages
English (en)
Other versions
CN111274495A (zh
Inventor
江佳宸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010063929.4A priority Critical patent/CN111274495B/zh
Publication of CN111274495A publication Critical patent/CN111274495A/zh
Application granted granted Critical
Publication of CN111274495B publication Critical patent/CN111274495B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种用户关系强度的数据处理方法、装置、计算机设备及存储介质。所述方法包括:获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据;根据所述关系数据构建节点表和关系表,并将所述节点表和所述关系表导入至图数据库中以得到关联图谱;根据所述关联图谱判断待分析用户之间是否存在关联;若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值;根据所述关系强度值对所述待分析用户进行处理。本发明应用于知识关系分析领域。通过实施本发明实施例的方法可实现关系强度的量化,提高关系强度的精确度,加快信息传递效率,提升系统性能。

Description

用户关系强度的数据处理方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户关系强度的数据处理方法、装置、计算机设备及存储介质。
背景技术
随着互联网的迅速发展,网络上的信息内容呈爆炸式增长,由此带来了信息过载的问题,人们需要花费大量的时间和精力从海量的信息库中寻找自己所需要的信息,这极大降低了人们获取所需信息的效率。因此,利用网络上个体与个体之间的关系网进行有用信息的传递,提高信息获取的效率,己成为当前时代一种很重要的手段,如商品推荐,好友推荐,链路预测,行为预测,隐私保护等。其中,个体与个体之间关系强度是信息在关系网络中传递效率的重要衡量依据。然而业内一些相关研究主要集中于计算在线社交网络中不同用户间的关系强度。例如,利用微博的转发、评论、互粉,微信的关注、点赞等用户行为,计算用户之间的关系强度。而且这些研究都只考虑将用户间存在的关系进行强与弱的区分,也就是说只能判断用户间的关系强度是属于强关系还是弱关系,难以准确地衡量,从而导致信息传递的效率低,造成计算资源和网络资源的浪费,性能差。
发明内容
本发明实施例提供了一种用户关系强度的数据处理方法、装置、计算机设备及存储介质,旨在解决相关技术中关系强度判断的准确性低而导致的信息传递效率低,造成计算资源和网络资源的浪费,性能差的问题。
第一方面,本发明实施例提供了一种用户关系强度的数据处理方法,其包括:获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据;根据所述关系数据构建节点表和关系表,并将所述节点表和所述关系表导入至图数据库中以得到关联图谱;根据所述关联图谱判断待分析用户之间是否存在关联;若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值;根据所述关系强度值对所述待分析用户进行处理。
第二方面,本发明实施例还提供了一种用户关系强度的数据处理装置,其包括:获取单元,用于获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据;构建单元,用于根据所述关系数据构建节点表和关系表,并将所述节点表和所述关系表导入至图数据库中以得到关联图谱;判断单元,用于根据所述关联图谱判断待分析用户之间是否存在关联;计算单元,用于若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值;处理单元,用于根据所述关系强度值对所述待分析用户进行处理。
第三方面,本发明实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现上述方法。
本发明实施例提供了一种用户关系强度的数据处理方法、装置、计算机设备及存储介质。其中,所述方法包括:获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据;根据所述关系数据构建节点表和关系表,并将所述节点表和所述关系表导入至图数据库中以得到关联图谱;根据所述关联图谱判断待分析用户之间是否存在关联;若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值;根据所述关系强度值对所述待分析用户进行处理。本发明实施例由于通过在关系数据中融合金融数据,利用图数据库根据关系数据得到关联图谱,并根据关联图谱计算待分析用户之间的关系强度值,从而利用关系强度值对待分析用户进行处理,可实现关系强度的量化,提高关系强度的精确度,加快信息传递效率,提升系统性能。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的用户关系强度的数据处理方法的流程示意图;
图2为本发明实施例提供的用户关系强度的数据处理方法的子流程示意图;
图3为本发明实施例提供的用户关系强度的数据处理方法的子流程示意图;
图4为本发明实施例提供的用户关系强度的数据处理方法的子流程示意图;
图5为本发明实施例提供的用户关系强度的数据处理方法的子流程示意图;
图6为本发明实施例提供的用户关系强度的数据处理装置的示意性框图;
图7为本发明实施例提供的用户关系强度的数据处理装置的具体单元的示意性框图;
图8为本发明实施例提供的用户关系强度的数据处理装置的第一遍历单元的示意性框图;以及
图9为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
图1为本发明实施例提供的用户关系强度的数据处理方法的示意性流程图。该用户关系强度的数据处理应用与服务器中,该服务器可以是独立的服务器,也可以是集群服务器。
图1是本发明实施例提供的用户关系强度的数据处理方法的流程示意图。如图所示,该方法包括以下步骤S110-S150。
S110、获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据。
在一实施例中,关系数据指的是用户在关系网络中用于与外部产生联系的数据,其中,关系数据主要包括:基本数据、社交数据以及金融数据。基本数据指的是用户的基本信息,其包括姓名、年龄、性别以及联系方式等。金融数据包括银行卡、信用卡、转账以及保单等所对应的信息。社交数据包括微博、QQ群、WIFI以及微信等所产生的数据。
在具体实施中,关系数据存储于预设的数据库中,可直接从预设的数据库中获取用户的关系数据。当然可以理解的是,还可通过网络爬虫的方式从网页中爬取关系数据,譬如,社交数据可通过爬取社交网站从而获取到关系数据。
S120、根据所述关系数据构建节点表和关系表,并将所述节点表和所述关系表导入至图数据库中以得到关联图谱。
在一实施例中,图形数据库是一种非关系型数据库,它应用图形理论存储实体之间的关系信息,例如,neo4j、orientdb、以及dgraph等。其数据存储结构和数据的查询方式都是以图论为基础的,图论中图的基本元素为节点和边,在图数据库中对应的就是节点和关系。在图数据库中,数据与数据之间的关系通过节点和关系构成一个图结构并在此结构上实现数据库的所有特性。也即,在图数据库的图存储结构中,节点对应实体,关系对应实体之间的联系。因此,节点表中表征的是各个实体,其中包括:人物表、联系信息表、银行卡表、信用卡表、转账表、保单表、微博表、QQ群表以及WIFI表等。关系表表征的是各个实体之间的关系,例如,关系表保存了人物与关系事件的联系,如用户A和保单a、公司b之间的联系;用户B和保单a的联系;用户C和公司b的联系,通过关系表可以构建用户A和用户B、C之间的联系。
在具体实施中,在获取到关系数据后,将关系数据整理归类,如将用户数据整理归类到人物表中,将转账数据整理归类到转账表中,构建对应的各个节点表。以及,根据各个实体之间的关系构建关系表,譬如,根据人物与其他实体之间的关系构建关系表,其中,在关系表中通过起始节点和终止节点来描述实体之间的关系。在得到节点表和关系表后,利用图数据库导入工具将节点表和关系表导入至图数据库中,从而生成对应节点表和关系表的关联图谱,其中,图数据库导入工具例如为import,将节点表和关系表以CSV文件的形式利用import可直接进行导入并生成关联图谱,该关联图谱也即是以图存储结构存储的图。利用图数据库生成关联图谱可快速构建用户节点之间的关联关系,提高关系强度的处理速度,提高处理效率。
S130、根据所述关联图谱判断待分析用户之间是否存在关联。
在一实施例中,待分析用户指的是需要分析的用户,待分析用户预先选择确定好。在关系强度的分析处理中,首先需要的是判断待分析用户之间是否存在关联关系,若存在关联关系才进行下一步的分析处理,而不存在关联关系的直接结束处理,以节省系统资源。利用存储在图数据库中的关联图谱可以快速地判断待分析用户之间的关联关系,其中,待分析用户在关联图谱是以节点形式存在的,只需要选中待分析用户对应的节点,遍历与所选中节点相关联的所有节点,获取两节点之间的路径即可。若存在返回的路径,即说明待分析用户之间存在关联关系,可进行下一步的分析处理,若返回的是空值,则直接结束。
在一实施例中,如图2所示,所述步骤S130可包括步骤S131-S133。
S131、遍历所述关联图谱以查询待分析用户之间的所有路径。
S132、若所述待分析用户之间存在路径,则判定所述待分析用户之间存在关联。
S133、若所述待分析用户之间不存在路径,则判定所述待分析用户之间不存在关联。
在一实施例中,遍历一个图形,是指沿着关系访问图形的节点。连接两个节点,从起始节点沿着关系,一步一步导航到终止节点的过程叫做遍历,遍历经过的节点和关系的有序组合称作路径。图的遍历算法主要包括深度优先遍历算法和广度优先算法,深度优先遍历类似于二叉树的深度优先遍历,其基本思想是:从图中某个节点v出发,访问此节点,然后从v的未被访问的邻接点出发深度优先遍历图,直至图中所有和v有路径相通的节点都被访问到;广度优先遍历算法是一个分层遍历的过程,和二叉树的广度优先遍历类似,其基本思想在于:从图中的某一个顶点Vi触发,访问此顶点后,依次访问Vi的各个为层访问过的邻接点,然后分别从这些邻接点出发,直至图中所有顶点都被访问到。在具体实施中,采取深度优先遍历算法或者广度优先算法中的任一一种对关联图谱进行遍历查询待分析节点所有关联节点的路径,若返回所查询的路径,即说明待分析用户之间存在关联,若返回的是空值,则说明待分析用户之间不存在关联。
在一实施例中,如图3所示,所述步骤S131可包括步骤S1311-S1315。
S1311、遍历所述关联图谱以查询待分析用户之间的一度路径。
S1312、若所述待分析用户之间存在一度路径,直接返回所述一度路径的查询结果。
S1313、若所述待分析用户之间不存在一度路径,查询待分析用户之间的下一度路径。
S1314、若所述待分析用户之间存在所述下一度路径,返回所述下一度路径的查询结果。
S1315、若所述待分析用户之间不存在所述下一度路径,查询待分析用户之间的再下一度路径直至所查询的路径的度数达到预设阈值。
在一实施例中,度是指从一个节点到另一个节点的距离,一度就是两个用户只需通过一个关系节点相连,二度就是两个用户之间需要通过两个关系节点相连。在具体实施中,首先查询待分析用户之间一度路径的全路径,若有路径返回则直接返回一度路径的查询结果,若无路径返回,则在查询待分析用户之间二度路径的全路径,若有路径返回则返回二度路径的查询结果,若无路径返回,则再查询下一度路径的全路径,以此类推,直到查询的路径度数达到了预设阈值,例如为10。通过上述按照度数查询路径的方式,可以提高系统的计算效率,节省系统资源,在有一度路径返回时,即可直接计算一度路径的关系强度,而不再计算二度,三度的关系强度,提高了查询性能和查询速度。
S140、若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值。
在一实施例中,预设算法是用于计算关系强度的一种计算方法,关系强度值是用于精确衡量关系强度的程度的一个值。在得到返回的路径,判定待分析用户之间存在关联后,根据查询返回的路径获取对应的边属性参数,将所获取的边属性参数代入至预设算法中进行计算,从而得到待分析用户之间的关系强度值。其中,在计算关系强度值时,融合了金融数据,可以更好地拟合来自现实关系网络的数据,进一步地提高关系强度处理的准确性。
在一实施例中,如图4所示,所述步骤S140可包括步骤S141-S143。
S141、获取所述路径上的边属性参数。
在一实施例中,边属性参数(weigh)指的是边的权重信息,用于计算路径的关系强度。在图存储结构中,节点之间的关系是用边来进行表示的,两个相邻的节点构成一条边,两条边构成一度关系。其中,边属性参数预先配置于关系表中,边属性参数根据关系类型配置,关系类型包括:保单、信用卡、银行卡、公司、银行转账、QQ群、WIFI以及微博等。例如,用户A,24岁,女,居住于深圳;用户B,30岁,男,居住于广州;该关系类型的边属性参数对应为a,b,c,d,其中,a为关系类型本身权重值,b为城市编号,c为用户年龄段,d为用户性别(0,1),其中,权重值根据不同的关系类型设置,如保单关系可认为只有亲密的人才会为他人购买保单,权重设为0.8,而微博关注关系比较普通,设为0.2。在具体实施中,每个节点都有唯一识别的ID,在得到返回的路径后,利用路径上的节点ID即可获取到关系表中对应的边属性参数。
S142、根据所述边属性参数以及预设算法计算每条所述路径的关系强度值。
在一实施例中,一度路径对应一度关系,二度路径对应二度关系,也即几度路径就对应着几度关系。每度关系的关系强度的计算公式如下:
wi=(1+(if bi=bi+1then 0.02 else 0)+(if ci=ci+1then 0.05 else 0)+(ifdi=di+1then 0.03 else 0))*a
其中,wi表示每度关系的关系强度值,a表示权重,b,c,d表示参数,i表示用户。例如,在上述例子中,a表示关系类型的权重,b表示城市,c为用户年龄段,d为用户性别,那么A用户和B用户之间的一度关系的关系强度w=(1+0(城市不同)+0.05(同一年龄段)+0(性别不同))*a。需要说明的是,每度关系的关系强度的计算公式根据实际情况预先设定好。若计算的路径不止一度关系,而是多度关系,那么该路径的关系强度的计算公式如下:
Wi=w1*w2*...wi
其中,W表示每条路径的关系强度,w表示每度关系的关系强度,i表示用户。也即每条路径的关系强度等于每度关系的乘积。例如,在一条二度路径中,其关系强度W=w1*w2。
S143、对每条所述路径的关系强度值进行求和得到所述待分析用户之间的关系强度值。
在一实施例中,待分析用户之间可不止通过一条路径而相互关联,可存在多条路径使得两待分析用户形成关联,形成关联的路径越多,说明待分析用户之间的关系强度值就越大。那么待分析用户之间的关系强度如下:
RS=sum(Wi)
其中,RS表示待分析用户之间的关系强度值,W表示每条路径的关系强度,i表示用户。也即待分析用户之间的关系强度值等于待分析用户之间各个路径的关系强度值之和。通过预设算法利用边属性参数计算待分析用户之间的关系强度值,可实现关系强度的量化,通过精确的数值来衡量关系强度的程度,从而提高了关系强度判断的准确性和可靠性。
S150、根据所述关系强度值对所述待分析用户进行处理。
在一实施例中,在得到待分析用户之间的关系强度值后,利用该关系强度值对待分析用户进行分析处理。在进行分析处理中,可直接利用关系强度值作为依据进行分析处理,也可将关系强度值作为参数值,进一步结合其他数据或者算法模型进行分析处理,根据不同的实际应用场景选择不同的分析处理方式。例如,商品推荐,好友推荐,链路预测,行为预测,隐私保护等应用场景。
在一实施例中,如图5所示,所述步骤S150可包括步骤S151-S152。
S151、判断所述关系强度值是否大于预设阈值。
S152、若所述关系强度值大于预设阈值,则判定所述待分析用户为目标用户。
在一实施例中,对于部分通用的应用场景,例如反欺诈场景,好友推荐场景中,利用关系强度值与预设阈值的对比,即可实现准确的目标用户的判断。在具体实施中,例如在反欺诈场景中,已知一个用户是欺诈用户,需要判断另一个用户的欺诈概率,可以通过该用户和欺诈用户之间的关系强度值判断这两名用户之间的关系强弱。如果关系强度值大于预设阈值,则表明该用户和欺诈用户存在较强的关联,判定该用户为目标用户,存在欺诈风险。相类似的,对于好友推荐场景以及其他类似场景的判断方法也与上述相同。
本发明实施例展示了一种用户关系强度的数据处理方法,通过获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据;根据所述关系数据构建节点表和关系表,并将所述节点表和所述关系表导入至图数据库中以得到关联图谱;根据所述关联图谱判断待分析用户之间是否存在关联;若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值;根据所述关系强度值对所述待分析用户进行处理,可实现关系强度的量化,提高关系强度的精确度,加快信息传递效率,提升系统性能。
图6是本发明实施例提供的一种用户关系强度的数据处理装置200的示意性框图。如图6所示,对应于以上用户关系强度的数据处理方法,本发明还提供一种用户关系强度的数据处理装置200。该用户关系强度的数据处理装置200包括用于执行上述用户关系强度的数据处理方法的单元,该装置可以被配置于服务器中。具体地,请参阅图6,该用户关系强度的数据处理装置200包括:获取单元210、构建单元220、判断单元230、计算单元240以及处理单元250。
获取单元210,用于获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据。
构建单元220,用于根据所述关系数据构建节点表和关系表,并将所述节点表和所述关系表导入至图数据库中以得到关联图谱。
判断单元230,用于根据所述关联图谱判断待分析用户之间是否存在关联。
在一实施例中,如图7所示,所述判断单元230包括:第一遍历单元231、第一判定单元232以及第二判定单元233。
第一遍历单元231,用于遍历所述关联图谱以查询待分析用户之间的所有路径。
第一判定单元232,用于若所述待分析用户之间存在路径,则判定所述待分析用户之间存在关联。
第二判定单元233,用于若所述待分析用户之间不存在路径,则判定所述待分析用户之间不存在关联。
在一实施例中,如图8所示,所述第一遍历单元231包括:第一查询单元2311、第一返回单元2312、第二查询单元2313、第二返回单元2314以及第三查询单元2315。
第一查询单元2311,用于遍历所述关联图谱以查询待分析用户之间的一度路径。
第一返回单元2312,用于若所述待分析用户之间存在一度路径,直接返回所述一度路径的查询结果。
第二查询单元2313,用于若所述待分析用户之间不存在一度路径,查询待分析用户之间的下一度路径。
第二返回单元2314,用于若所述待分析用户之间存在所述下一度路径,返回所述下一度路径的查询结果。
第三查询单元2315,用于若所述待分析用户之间不存在所述下一度路径,查询待分析用户之间的再下一度路径直至所查询的路径的度数达到预设阈值。
计算单元240,用于若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值。
在一实施例中,如图7所示,所述计算单元240包括:获取子单元241、计算子单元242以及求和单元243。
获取子单元241,用于获取所述路径上的边属性参数。
计算子单元242,用于根据所述边属性参数以及预设算法计算每条所述路径的关系强度值。
求和单元243,用于对每条所述路径的关系强度值进行求和得到所述待分析用户之间的关系强度值。
处理单元250,用于根据所述关系强度值对所述待分析用户进行处理。
在一实施例中,如图7所示,所述处理单元250包括:判断子单元251和第三判定单元252。
判断子单元251,用于判断所述关系强度值是否大于预设阈值;
第三判定单元252,用于若所述关系强度值大于预设阈值,则判定所述待分析用户为目标用户。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述用户关系强度的数据处理装置200和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述用户关系强度的数据处理装置可以实现为一种计算机程序的形式,该计算机程序可以在如图9所示的计算机设备上运行。
请参阅图9,图9是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图9,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种用户关系强度的数据处理方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种用户关系强度的数据处理方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据;根据所述关系数据构建节点表和关系表,并将所述节点表和所述关系表导入至图数据库中以得到关联图谱;根据所述关联图谱判断待分析用户之间是否存在关联;若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值;根据所述关系强度值对所述待分析用户进行处理。
在一实施例中,处理器502在实现所述根据所述关联图谱判断待分析用户之间是否存在关联步骤时,具体实现如下步骤:遍历所述关联图谱以查询待分析用户之间的所有路径;若所述待分析用户之间存在路径,则判定所述待分析用户之间存在关联;若所述待分析用户之间不存在路径,则判定所述待分析用户之间不存在关联。
在一实施例中,处理器502在实现所述遍历所述关联图谱以查询待分析用户之间的所有路径步骤时,具体实现如下步骤:遍历所述关联图谱以查询待分析用户之间的一度路径;若所述待分析用户之间存在一度路径,直接返回所述一度路径的查询结果;若所述待分析用户之间不存在一度路径,查询待分析用户之间的下一度路径;若所述待分析用户之间存在所述下一度路径,返回所述下一度路径的查询结果;若所述待分析用户之间不存在所述下一度路径,查询待分析用户之间的再下一度路径直至所查询的路径的度数达到预设阈值。
在一实施例中,处理器502在实现所述若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值步骤时,具体实现如下步骤:获取所述路径上的边属性参数;根据所述边属性参数以及预设算法计算每条所述路径的关系强度值;对每条所述路径的关系强度值进行求和得到所述待分析用户之间的关系强度值。
在一实施例中,处理器502在实现所述根据所述关系强度值对所述待分析用户进行处理步骤时,具体实现如下步骤:判断所述关系强度值是否大于预设阈值;若所述关系强度值大于预设阈值,则判定所述待分析用户为目标用户。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中计算机程序包括程序指令。该程序指令被处理器执行时使处理器执行如下步骤:获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据;根据所述关系数据构建节点表和关系表,并将所述节点表和所述关系表导入至图数据库中以得到关联图谱;根据所述关联图谱判断待分析用户之间是否存在关联;若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值;根据所述关系强度值对所述待分析用户进行处理。
在一实施例中,所述处理器在执行所述程序指令而实现所述根据所述关联图谱判断待分析用户之间是否存在关联步骤时,具体实现如下步骤:遍历所述关联图谱以查询待分析用户之间的所有路径;若所述待分析用户之间存在路径,则判定所述待分析用户之间存在关联;若所述待分析用户之间不存在路径,则判定所述待分析用户之间不存在关联。
在一实施例中,所述处理器在执行所述程序指令而实现所述遍历所述关联图谱以查询待分析用户之间的所有路径步骤时,具体实现如下步骤:遍历所述关联图谱以查询待分析用户之间的一度路径;若所述待分析用户之间存在一度路径,直接返回所述一度路径的查询结果;若所述待分析用户之间不存在一度路径,查询待分析用户之间的下一度路径;若所述待分析用户之间存在所述下一度路径,返回所述下一度路径的查询结果;若所述待分析用户之间不存在所述下一度路径,查询待分析用户之间的再下一度路径直至所查询的路径的度数达到预设阈值。
在一实施例中,所述处理器在执行所述程序指令而实现所述若待分析用户之间存在关联,则根据预设算法计算待分析用户之间的关系强度以得到所述待分析用户之间的关系强度值步骤时,具体实现如下步骤:获取所述路径上的边属性参数;根据所述边属性参数以及预设算法计算每条所述路径的关系强度值;对每条所述路径的关系强度值进行求和得到所述待分析用户之间的关系强度值。
在一实施例中,所述处理器在执行所述程序指令而实现所述根据所述关系强度值对所述待分析用户进行处理步骤时,具体实现如下步骤:判断所述关系强度值是否大于预设阈值;若所述关系强度值大于预设阈值,则判定所述待分析用户为目标用户。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (5)

1.一种用户关系强度的数据处理方法,其特征在于,包括:
获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据;
根据所述关系数据构建节点表和关系表,并利用图数据库导入工具将所述节点表和所述关系表导入至图数据库中以得到关联图谱;
遍历所述关联图谱以查询待分析用户之间的一度路径;若所述待分析用户之间存在一度路径,直接返回所述一度路径的查询结果;若所述待分析用户之间不存在一度路径,查询待分析用户之间的下一度路径;若所述待分析用户之间存在所述下一度路径,返回所述下一度路径的查询结果;若所述待分析用户之间不存在所述下一度路径,查询待分析用户之间的再下一度路径直至所查询的路径的度数达到预设阈值;若所述待分析用户之间存在路径,则判定所述待分析用户之间存在关联;若所述待分析用户之间不存在路径,则判定所述待分析用户之间不存在关联;
若待分析用户之间存在关联,获取所述路径上的边属性参数;根据所述边属性参数以及预设算法计算每条所述路径的关系强度值;对每条所述路径的关系强度值进行求和得到所述待分析用户之间的关系强度值;每度关系的关系强度的计算公式为:
wi=(1+(if bi=bi+1then 0.02else 0)+(if ci=ci+1then 0.05else 0)
+(if di=di+1then 0.03else 0))*a
其中,wi表示每度关系的关系强度值,a表示权重,b,c,d表示参数,i表示用户;
每条路径的关系强度的计算公式如下:
Wi=w1*w2*...wi
其中,W表示每条路径的关系强度,w表示每度关系的关系强度,i表示用户;
根据所述关系强度值对所述待分析用户进行处理。
2.根据权利要求1所述的用户关系强度的数据处理方法,其特征在于,所述根据所述关系强度值对所述待分析用户进行处理,包括:
判断所述关系强度值是否大于预设阈值;
若所述关系强度值大于预设阈值,则判定所述待分析用户为目标用户。
3.一种用户关系强度的数据处理装置,其特征在于,包括:
获取单元,用于获取用户的关系数据,其中,所述关系数据包括:基本数据、社交数据以及金融数据;
构建单元,用于根据所述关系数据构建节点表和关系表,并利用图数据库导入工具将所述节点表和所述关系表导入至图数据库中以得到关联图谱;
判断单元,用于遍历所述关联图谱以查询待分析用户之间的一度路径;若所述待分析用户之间存在一度路径,直接返回所述一度路径的查询结果;若所述待分析用户之间不存在一度路径,查询待分析用户之间的下一度路径;若所述待分析用户之间存在所述下一度路径,返回所述下一度路径的查询结果;若所述待分析用户之间不存在所述下一度路径,查询待分析用户之间的再下一度路径直至所查询的路径的度数达到预设阈值;若所述待分析用户之间存在路径,则判定所述待分析用户之间存在关联;若所述待分析用户之间不存在路径,则判定所述待分析用户之间不存在关联;
计算单元,用于若待分析用户之间存在关联,获取所述路径上的边属性参数;根据所述边属性参数以及预设算法计算每条所述路径的关系强度值;对每条所述路径的关系强度值进行求和得到所述待分析用户之间的关系强度值;每度关系的关系强度的计算公式为:
wi=(1+(if bi=bi+1then 0.02else 0)+(if ci=ci+1then 0.05else 0)
+(if di=di+1then 0.03else 0))*a
其中,wi表示每度关系的关系强度值,a表示权重,b,c,d表示参数,i表示用户;
每条路径的关系强度的计算公式如下:
Wi=w1*w2*...wi
其中,W表示每条路径的关系强度,w表示每度关系的关系强度,i表示用户;
处理单元,用于根据所述关系强度值对所述待分析用户进行处理。
4.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-2中任一项所述的方法。
5.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现如权利要求1-2中任一项所述的方法。
CN202010063929.4A 2020-01-20 2020-01-20 用户关系强度的数据处理方法、装置、计算机设备及存储介质 Active CN111274495B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010063929.4A CN111274495B (zh) 2020-01-20 2020-01-20 用户关系强度的数据处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010063929.4A CN111274495B (zh) 2020-01-20 2020-01-20 用户关系强度的数据处理方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111274495A CN111274495A (zh) 2020-06-12
CN111274495B true CN111274495B (zh) 2023-08-25

Family

ID=70996850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010063929.4A Active CN111274495B (zh) 2020-01-20 2020-01-20 用户关系强度的数据处理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111274495B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709756A (zh) * 2020-06-16 2020-09-25 银联商务股份有限公司 一种可疑社团的识别方法、装置、存储介质和计算机设备
CN111897793A (zh) * 2020-06-20 2020-11-06 中国建设银行股份有限公司 数据的导入方法、装置、电子设备及计算机可读存储介质
CN111949839B (zh) * 2020-08-24 2021-08-24 上海嗨普智能信息科技股份有限公司 数据关联方法、电子设备及介质
CN111966912B (zh) * 2020-09-02 2023-03-10 深圳壹账通智能科技有限公司 基于知识图谱的推荐方法、装置、计算机设备及存储介质
CN112231591B (zh) * 2020-11-06 2024-02-09 烟台大学 考虑社交网络用户群紧密度的信息推荐方法及系统
CN112749237A (zh) * 2020-12-30 2021-05-04 广州金越软件技术有限公司 一种基于图计算的人员关系构建和分析方法
CN113918638A (zh) * 2021-10-22 2022-01-11 平安科技(深圳)有限公司 数据处理链路确定方法、系统、设备及存储介质
CN115470379A (zh) * 2022-11-03 2022-12-13 北京天融信网络安全技术有限公司 用户关系确定方法、装置、设备及介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317789A (zh) * 2014-04-24 2015-01-28 科技谷(厦门)信息技术有限公司 构建乘客社交网络的方法
JP2015049680A (ja) * 2013-08-30 2015-03-16 富士通株式会社 情報処理装置、更新プログラム、更新方法およびソーシャルネットワークシステム
CN105335374A (zh) * 2014-06-19 2016-02-17 北大方正集团有限公司 知识点关联方法及装置、及包含该装置的服务器和客户端
CN106354728A (zh) * 2015-07-16 2017-01-25 富士通株式会社 利用语义图生成对象之间的关联强度的方法和设备
CN107169088A (zh) * 2017-05-12 2017-09-15 中国矿业大学 一种基于时空交互的用户社交关系强度计算方法及系统
CN107943850A (zh) * 2017-11-06 2018-04-20 齐鲁工业大学 数据关联方法、系统及计算机可读存储介质
CN108197224A (zh) * 2017-12-28 2018-06-22 广州虎牙信息科技有限公司 用户群分类方法、存储介质以及终端
CN108369586A (zh) * 2015-10-20 2018-08-03 阿克森维伯股份公司 用于检测网络中的交互和影响的系统和方法
CN110489599A (zh) * 2019-07-08 2019-11-22 深圳壹账通智能科技有限公司 企业关系图谱构建方法、装置、计算机设备以及存储介质
CN110659799A (zh) * 2019-08-14 2020-01-07 深圳壹账通智能科技有限公司 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质
CN110659395A (zh) * 2019-08-14 2020-01-07 平安科技(深圳)有限公司 关系网络图谱构建方法、装置、计算机设备和存储介质
CN110689426A (zh) * 2019-09-30 2020-01-14 中诚信征信有限公司 一种风险识别方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9928624B2 (en) * 2014-10-14 2018-03-27 International Business Machines Corporation Visualization of relationships and strengths between data nodes
US20180181646A1 (en) * 2016-12-26 2018-06-28 Infosys Limited System and method for determining identity relationships among enterprise data entities
CN111737596B (zh) * 2020-08-21 2020-12-11 腾讯科技(深圳)有限公司 人际关系图谱的处理方法、装置、电子设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015049680A (ja) * 2013-08-30 2015-03-16 富士通株式会社 情報処理装置、更新プログラム、更新方法およびソーシャルネットワークシステム
CN104317789A (zh) * 2014-04-24 2015-01-28 科技谷(厦门)信息技术有限公司 构建乘客社交网络的方法
CN105335374A (zh) * 2014-06-19 2016-02-17 北大方正集团有限公司 知识点关联方法及装置、及包含该装置的服务器和客户端
CN106354728A (zh) * 2015-07-16 2017-01-25 富士通株式会社 利用语义图生成对象之间的关联强度的方法和设备
CN108369586A (zh) * 2015-10-20 2018-08-03 阿克森维伯股份公司 用于检测网络中的交互和影响的系统和方法
CN107169088A (zh) * 2017-05-12 2017-09-15 中国矿业大学 一种基于时空交互的用户社交关系强度计算方法及系统
CN107943850A (zh) * 2017-11-06 2018-04-20 齐鲁工业大学 数据关联方法、系统及计算机可读存储介质
CN108197224A (zh) * 2017-12-28 2018-06-22 广州虎牙信息科技有限公司 用户群分类方法、存储介质以及终端
CN110489599A (zh) * 2019-07-08 2019-11-22 深圳壹账通智能科技有限公司 企业关系图谱构建方法、装置、计算机设备以及存储介质
CN110659799A (zh) * 2019-08-14 2020-01-07 深圳壹账通智能科技有限公司 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质
CN110659395A (zh) * 2019-08-14 2020-01-07 平安科技(深圳)有限公司 关系网络图谱构建方法、装置、计算机设备和存储介质
CN110689426A (zh) * 2019-09-30 2020-01-14 中诚信征信有限公司 一种风险识别方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
融入网络结构与社交习惯的不对称用户关系强度计算;琚春华等;《系统工程理论与实践》;第38卷(第8期);2135-2146 *

Also Published As

Publication number Publication date
CN111274495A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
CN111274495B (zh) 用户关系强度的数据处理方法、装置、计算机设备及存储介质
Wang et al. Location recommendation in location-based social networks using user check-in data
Bagci et al. Context-aware friend recommendation for location based social networks using random walk
US9514167B2 (en) Behavior based record linkage
WO2016015444A1 (zh) 一种目标用户的确定方法、设备和网络服务器
CN107357790B (zh) 一种异常消息检测方法、装置及系统
CN111740977B (zh) 投票检测方法及装置、电子设备、计算机可读存储介质
Bo et al. Trust traversal: a trust link detection scheme in social network
KR20180089479A (ko) 사용자 데이터 공유 방법 및 디바이스
Li et al. Efficient weighted probabilistic frequent itemset mining in uncertain databases
Wang et al. Trustworthy and efficient crowdsensed data trading on sharding blockchain
CN113689270B (zh) 黑产设备的确定方法、电子设备、存储介质及程序产品
Pamp et al. Explaining destinations and volumes of international arms transfers: A novel network Heckman selection model
Liu et al. Improving location recommendation with urban knowledge graph
CN112069416B (zh) 基于社区发现的跨社交网络用户身份识别方法
JP6683839B2 (ja) モバイル装置識別子を設定する方法及び装置
EP3652660A1 (en) Systems and methods for joining datasets
Liu et al. A trust prediction approach capturing agents' dynamic behavior
Liu et al. From strangers to neighbors: Link prediction in microblogs using social distance game
CN110543601A (zh) 一种基于中智集的上下文感知兴趣点推荐方法及系统
Al-Zanbouri et al. Data-aware web service recommender system for energy-efficient data mining services
CN112364243A (zh) 一种基于大数据的信息推荐系统
CN112597699A (zh) 一种融入客观赋权法的社交网络谣言源识别方法
CN112185568A (zh) 信息处理方法、装置、计算机设备及存储介质
Yin et al. Link User Identities Across Social Networks Based on Contact Graph and User Social Behavior

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant