CN112800081A - 关联用户获取方法和装置 - Google Patents

关联用户获取方法和装置 Download PDF

Info

Publication number
CN112800081A
CN112800081A CN202110028242.1A CN202110028242A CN112800081A CN 112800081 A CN112800081 A CN 112800081A CN 202110028242 A CN202110028242 A CN 202110028242A CN 112800081 A CN112800081 A CN 112800081A
Authority
CN
China
Prior art keywords
user
candidate
candidate user
target
target user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110028242.1A
Other languages
English (en)
Inventor
吴杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110028242.1A priority Critical patent/CN112800081A/zh
Publication of CN112800081A publication Critical patent/CN112800081A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种关联用户获取方法和装置。该方法包括:将与目标用户具有交互关系的用户组成候选用户集合,并基于目标用户的数据交互记录确定目标用户与候选用户集合中的各个候选用户之间的关联强度;当候选用户集合中存在与目标用户之间的关联强度达到第一设定值的候选用户时,将该候选用户转化为关联用户;将与关联用户具有交互关系的用户重新组成候选用户集合,基于目标用户与各个关联用户之间的关联强度以及关联用户的数据交互记录,重新确定目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,并根据重新确定的关联强度确定关联用户,直至目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度均低于第一设定值。

Description

关联用户获取方法和装置
技术领域
本申请涉及计算机及通信技术领域,特别涉及一种关联用户获取方法和装置。
背景技术
随着信息技术的发展,互联网用户与日俱增,看似独立的互联网用户之间可能存在着关联关系。在信息推荐查找等诸多领域,获取与目标用户具有关联关系的关联用户能够达到事半功倍的效果。
在现有技术中,通常将与目标用户进行数据交互的用户作为关联用户,但是这样查找到的关联用户不够全面。
发明内容
本申请旨在提供一种关联用户获取方法和装置,其能够更加准确全面的查找关联用户。
根据本申请实施例的一个方面,提供了一种关联用户获取方法,包括:获取目标用户的数据交互记录;基于所述目标用户的数据交互记录,将与所述目标用户具有交互关系的用户组成候选用户集合,并基于所述目标用户的数据交互记录确定所述目标用户与所述候选用户集合中的各个候选用户之间的关联强度;当所述候选用户集合中存在与所述目标用户之间的关联强度达到第一设定值的候选用户时,将与所述目标用户之间的关联强度达到所述第一设定值的候选用户转化为关联用户;根据所述关联用户的数据交互记录,确定与所述关联用户具有交互关系的用户,并将与所述关联用户具有交互关系的用户重新组成候选用户集合,基于所述目标用户与各个所述关联用户之间的关联强度以及所述关联用户的数据交互记录,重新确定所述目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,并根据重新确定的关联强度确定所述关联用户,直至所述目标用户与所述重新组成的候选用户集合中各个候选用户之间的关联强度均低于所述第一设定值。
根据本申请实施例的一个方面,提供了一种关联用户获取装置,包括:获取模块,配置为获取目标用户的数据交互记录;第一确定模块,配置为基于所述目标用户的数据交互记录,将与所述目标用户具有交互关系的用户组成候选用户集合,并基于所述目标用户的数据交互记录确定所述目标用户与所述候选用户集合中的各个候选用户之间的关联强度;转化模块,配置为当所述候选用户集合中存在与所述目标用户之间的关联强度达到第一设定值的候选用户时,将与所述目标用户之间的关联强度达到所述第一设定值的候选用户转化为关联用户;第二确定模块,配置为根据所述关联用户的数据交互记录,确定与所述关联用户具有交互关系的用户,并将与所述关联用户具有交互关系的用户重新组成候选用户集合,基于所述目标用户与各个所述关联用户之间的关联强度以及所述关联用户的数据交互记录,重新确定所述目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,并根据重新确定的关联强度确定所述关联用户,直至所述目标用户与所述重新组成的候选用户集合中各个候选用户之间的关联强度均低于所述第一设定值。
在本申请的一个实施例中,基于前述方案,所述第一确定模块配置为:基于所述目标用户的数据交互记录,确定所述候选用户集合中的各个候选用户接收的来自所述目标用户的数据量大小占所述目标用户发送的数据总量大小的比值,作为所述候选用户集合中的各个候选用户对应的第一比值;基于所述候选用户集合中的各个候选用户对应的第一比值,确定所述候选用户集合中的各个候选用户对应的第一衰减系数;计算对应于同一候选用户的第一比值和第一衰减系数的乘积,得到所述目标用户与所述候选用户集合中的各个候选用户之间的关联强度。
在本申请的一个实施例中,基于前述方案,所述第一确定模块配置为:若所述第一比值达到第一设定比值,则基于所述候选用户集合中的各个候选用户对应的第一比值,确定所述候选用户集合中的各个候选用户对应的第一衰减系数。
在本申请的一个实施例中,基于前述方案,所述第二确定模块配置为:基于所述关联用户的数据交互记录,确定所述重新组成的候选用户集合中各个候选用户接收的来自所述关联用户的数据量大小占所述关联用户发送的数据总量的比值,作为所述重新组成的候选用户集合中各个候选用户对应的第二比值;基于所述第二比值以及所述目标用户与所述关联用户之间的关联强度,确定所述重新组成的候选用户集合中各个候选用户的第二衰减系数;计算对应于同一候选用户的第二比值和第二衰减系数的乘积,得到重新确定的所述目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度。
在本申请的一个实施例中,基于前述方案,所述第二确定模块配置为:若所述第二比值达到第二设定比值,则基于所述第二比值以及所述目标用户与所述关联用户之间的关联强度,确定所述重新组成的候选用户集合中各个候选用户的第二衰减系数。
在本申请的一个实施例中,基于前述方案,所述转化模块还配置为:获取所述目标用户的第一用户信息,并获取所述关联用户的第二用户信息;获取所述候选用户集合中与所述目标用户之间的关联强度未达到所述第一设定值的候选用户的第三用户信息;计算所述第一用户信息与所述第三用户信息的匹配度,并计算所述第二用户信息与所述第三用户信息的匹配度;将所述第一用户信息与所述第三用户信息的匹配度加上所述第二用户信息与所述第三用户信息的匹配度,得到所述目标用户与所述候选用户之间的匹配强度;将与所述目标用户之间的所述匹配强度达到第二设定值的候选用户转化为所述关联用户。
在本申请的一个实施例中,基于前述方案,所述转化模块还配置为:若与所述目标用户之间的关联强度未达到所述第一设定值的候选用户具有与所述目标用户对应的关联标记,则将具有所述关联标记的候选用户,转化为所述关联用户。
在本申请的一个实施例中,基于前述方案,所述获取模块还配置为:若所述目标用户的数据交互记录或所述关联用户的数据交互记录中的单笔数据交互量的大小达到第三设定值,则停止获取所述关联用户。
在本申请的一个实施例中,基于前述方案,所述转化模块还配置:为基于所述目标用户与所述关联用户之间的关系,以及所述关联用户之间的相互关系生成用户关系图。
根据本申请实施例的一个方面,提供了一种计算机可读程序介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行上任一项所述的方法。
根据本申请实施例的一个方面,提供了一种电子装置,包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如上任一项所述的方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施例中提供的消息处理方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
在本申请的一些实施例所提供的技术方案中,通过获取目标用户的数据交互记录,基于目标用户的数据交互记录,将与目标用户具有交互关系的用户组成候选用户集合,并基于目标用户的数据交互记录确定目标用户与候选用户集合中的各个候选用户之间的关联强度,当候选用户集合中存在与目标用户之间的关联强度达到第一设定值的候选用户时,将与目标用户之间的关联强度达到第一设定值的候选用户转化为关联用户,以获取与目标用户直接关联的关联用户,再根据关联用户的数据交互记录,确定与关联用户具有交互关系的用户,并将与关联用户具有交互关系的用户重新组成候选用户集合,基于目标用户与各个关联用户之间的关联强度以及关联用户的数据交互记录,重新确定目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,并根据重新确定的关联强度确定关联用户,直至目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度均低于第一设定值,以获取与目标用户具有间接关系的关联用户,从而能够更加全面的查找关联用户,同时,由于在查找与目标用户具有间接关系的关联用户时,考虑到了在该用户与目标用户之间的关联用户与目标用户之间的关联强度,关联强度的影响随着间接关系的层数增加逐渐累积,使得基于关联强度找到的关联用户更加准确,从而实现精准且全面的获取关联用户。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并于说明书一起用于解释本申请的原理。
图1A示出了可以应用本申请一个实施例的技术方案的数据共享系统的示意图;
图1B示出了可以应用本申请一个实施例的区块链示意图;
图1C示出了可以应用本申请一个实施例的区块链中新区块生成的示意图;
图2示意性示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图;
图3示意性示出了根据本申请的一个实施例的关联用户获取方法的流程图;
图4示意性示出了可以应用本申请的一个实施例的获取团队的流程图;
图5示意性示出了可以应用本申请的一个实施例用户关系图;
图6示意性示出了根据本申请的一个实施例的关联用户获取装置的框图;
图7是根据一示例性实施例示出的一种电子装置的硬件图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/ 步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
人工智能技术既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
大数据(Big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着人工智能的发展,大数据也吸引了越来越多的关注,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
大数据处理技术可以应用于获取关联用户,由于其强大的数据处理能力,能够显著提高获取关联用户的效率和准确性。
在本申请的一个实施例中,可以将数据交互记录、用户之间的关联关系等存储在图1A所示的数据共享系统中,参见图1A,数据共享系统100是指用于进行节点与节点之间数据共享的系统,该数据共享系统100中可以包括多个节点101,多个节点101可以是指数据共享系统100中各个客户端。每个节点101在进行正常工作可以接收到输入信息,并基于接收到的输入信息维护该数据共享系统内的共享数据。为了保证数据共享系统内的信息互通,数据共享系统中的每个节点101之间可以存在信息连接,节点101之间可以通过上述信息连接进行信息传输。例如,当数据共享系统中的任意节点接收到输入信息时,数据共享系统中的其他节点便根据共识算法获取该输入信息,将该输入信息作为共享数据中的数据进行存储,使得数据共享系统中全部节点上存储的数据均一致。
对于数据共享系统中的每个节点,均具有与其对应的节点标识,而且数据共享系统中的每个节点均可以存储有数据共享系统中其他节点的节点标识,以便后续根据其他节点的节点标识,将生成的区块广播至数据共享系统中的其他节点。每个节点中可维护一个如下表所示的节点标识列表,将节点名称和节点标识对应存储至该节点标识列表中。其中,节点标识可为IP(Internet Protocol,网络之间互联的协议)地址以及其他任一种能够用于标识该节点的信息,表1中仅以IP地址为例进行说明。
节点名称 节点标识
节点1 117.114.151.174
节点2 117.116.189.145
节点N 119.123.789.258
数据共享系统中的每个节点均存储一条相同的区块链。区块链由多个区块组成,参见图1B,区块链由多个区块组成,创始块中包括区块头和区块主体,区块头中存储有输入信息特征值、版本号、时间戳和难度值,区块主体中存储有输入信息;创始块的下一区块以创始块为父区块,下一区块中同样包括区块头和区块主体,区块头中存储有当前区块的输入信息特征值、父区块的区块头特征值、版本号、时间戳和难度值,并以此类推,使得区块链中每个区块中存储的区块数据均与父区块中存储的区块数据存在关联,保证了区块中输入信息的安全性。
在生成区块链中的各个区块时,参见图1C,区块链所在的节点在接收到输入信息时,对输入信息进行校验,完成校验后,将输入信息存储至内存池中,并更新其用于记录输入信息的哈希树;之后,将更新时间戳更新为接收到输入信息的时间,并尝试不同的随机数,多次进行特征值计算,使得计算得到的特征值可以满足下述公式:
SHA256(SHA256(version+prev_hash+merkle_root+ntime+nbits+x))<TARGET
其中,SHA256为计算特征值所用的特征值算法;version(版本号)为区块链中相关区块协议的版本信息;prev_hash为当前区块的父区块的区块头特征值;merkle_root为输入信息的特征值;ntime为更新时间戳的更新时间; nbits为当前难度,在一段时间内为定值,并在超出固定时间段后再次进行确定;x为随机数;TARGET为特征值阈值,该特征值阈值可以根据nbits确定得到。
这样,当计算得到满足上述公式的随机数时,便可将信息对应存储,生成区块头和区块主体,得到当前区块。随后,区块链所在节点根据数据共享系统中其他节点的节点标识,将新生成的区块分别发送给其所在的数据共享系统中的其他节点,由其他节点对新生成的区块进行校验,并在完成校验后将新生成的区块添加至其存储的区块链中,以保证数据库中存储消息的准确性。
图2示出了可以应用本申请实施例的技术方案的示例性系统架构200的示意图。
如图2所示,系统架构200可以包括客户端201、网络202和服务器203。网络202用以在客户端201和服务器203之间提供通信链路的介质。网络 203可以包括各种连接类型,例如有线通信链路、无线通信链路等等,本申请在此不做限制。
应该理解,图2中的客户端201、网络202和服务器203的数目仅仅是示意性的。根据实现需要,可以具有任意数目的客户端201、网络202和服务器203。比如服务器203可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。客户端201可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
在本申请的一个实施例中,服务器203通过获取客户端201上传的目标用户的数据交互记录,基于目标用户的数据交互记录,将与目标用户具有交互关系的用户组成候选用户集合,并基于目标用户的数据交互记录确定目标用户与候选用户集合中的各个候选用户之间的关联强度,当候选用户集合中存在与目标用户之间的关联强度达到第一设定值的候选用户时,将与目标用户之间的关联强度达到第一设定值的候选用户转化为关联用户,以获取与目标用户直接关联的关联用户,再获取客户端201上传的关联用户的数据交互记录,根据关联用户的数据交互记录,确定与关联用户具有交互关系的用户,并将与关联用户具有交互关系的用户重新组成候选用户集合,基于目标用户与各个关联用户之间的关联强度以及关联用户的数据交互记录,重新确定目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,并根据重新确定的关联强度确定关联用户,直至目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度均低于第一设定值,以获取与目标用户具有间接关系的关联用户,从而能够更加全面的查找关联用户,同时,由于在查找与目标用户具有间接关系的关联用户时,考虑到了在该用户与目标用户之间的关联用户与目标用户之间的关联强度,该用户与目标用户之间的关联用户的关联强度对该用户的关联强度的影响,随着间接关系的层数增加逐渐累积,使得基于关联强度找到的关联用户更加准确,从而实现精准且全面的获取关联用户。
需要说明的是,本申请实施例所提供的关联用户获取方法一般由服务器 203执行,相应地,关联用户获取装置一般设置于服务器203中。但是,在本申请的其它实施例中,客户端201也可以与服务器203具有相似的功能,从而执行本申请实施例所提供的关联用户获取方法。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
图3示意性示出了根据本申请的一个实施例的关联用户获取方法的流程图,该关联用户获取方法的执行主体可以是服务器,比如可以是图2中所示的服务器203。
参照图3所示,该关联用户获取方法至少包括步骤S310至步骤S340,详细介绍如下:
在步骤S310中,获取目标用户的数据交互记录。
在本申请的一个实施例中,目标用户可以是随机指定的,也可以是根据设定的用户信息确定的。
在本申请的一个实施例中,目标用户的数据交互记录可以是目标用户与其他用户进行数据交互时产生的,数据交互记录中可以记载目标用户标识、与目标用户进行交互的用户标识,交互的数据、交互的数据种类和大小、交互中的发送方和接收方等。
在本申请的一个实施例中,数据交互的行为可以是转账之类的资金往来行为,则数据交互记录可以是资金往来记录,数据交互记录中可以记录与目标用户进行资金往来的用户标识和交互的资金数额。
在本申请的一个实施例中,可以从区块链中获取目标数据的数据交互记录。
在步骤S320中,基于目标用户的数据交互记录,将与目标用户具有交互关系的用户组成候选用户集合,并基于目标用户的数据交互记录确定目标用户与候选用户集合中的各个候选用户之间的关联强度。
在本申请的一个实施例中,与目标用户具有交互关系的用户可以是目标用户的数据交互记录中记载的,曾经与目标用户进行过数据传输的用户,可以包括接收目标用户发送数据的用户,也可以包括向目标用户发送数据的用户。
在本申请的一个实施例中,可以基于目标用户的数据交互记录,确定候选用户集合中的各个候选用户与目标用户交互的数据量大小占目标用户交互的数据总量大小的比值,作为候选用户集合中的各个候选用户对应的第一关联比值;基于候选用户集合中的各个候选用户对应的第一关联比值,确定候选用户集合中的各个候选用户对应的第一关联衰减系数;计算对应于同一候选用户的第一关联比值和第一关联衰减系数的乘积,得到目标用户与候选用户集合中的各个候选用户之间的关联强度。
在本申请的一个实施例中,可以只将接收目标用户发送数据的用户作为与目标用户具有交互关系的用户。
在本申请的一个实施例中,可以基于目标用户的数据交互记录,确定候选用户集合中的各个候选用户接收的来自目标用户的数据量大小占目标用户发送的数据总量大小的比值,作为候选用户集合中的各个候选用户对应的第一比值;基于候选用户集合中的各个候选用户对应的第一比值,确定候选用户集合中的各个候选用户对应的第一衰减系数;计算对应于同一候选用户的第一比值和第一衰减系数的乘积,得到目标用户与候选用户集合中的各个候选用户之间的关联强度。
在本申请的一个实施例中,可以是若第一比值达到第一设定比值,则基于候选用户集合中的各个候选用户对应的第一比值,确定候选用户集合中的各个候选用户对应的第一衰减系数;若第一比值未达到第一设定比值,则不计算第一比值对应的第一衰减系数,不将未达到第一设定比值的第一比值对应的候选用户作为关联用户。
在该实施例中,第一设定比值可以根据第一设定值确定,根据其对应关系,提前对第一比值未达到第一设定比值的候选用户进行筛选,以减少工作量,但是由于关联强度和第一比值的计算过程不同,只对第一设定比值进行筛选难免遗漏,因此仍需通过第一设定值对关联强度进行筛选。
在本申请的一个实施例中,可以设定关联关系随着间接关系的层数增加越来越弱,因此第一比值和第一衰减系数的乘积可以小于1,从而使关联强度随着间接关系的层数增加越来越小,从而使得关联强度随着间接关系的层数增加而逐渐收敛,通过使用第一设定值限制关联用户的关联强度,能够限制找到的关联用户的数量,从而实现精准且全面的获取关联用户。
在本申请的一个实施例中,可以使用公式Y1=(M+X1)/N计算第一衰减系数Y1,其中X1表示第一比值,N/M为衰减的修正系数,其中,第一比值的取值范围可以为从0至1,可以设置N>M+1,以使第一衰减系数小于1,而第一衰减系数影响与关联用户具有关联关系的用户对应的关联强度,从而使得根据第一衰减系数得到的与关联用户具有关联关系的用户对应的关联强度小于关联用户对于的关联强度,关联强度随着关联层数的增加逐渐减小,从而实现关联强度逐层收敛。
继续参照图3,在步骤S330中,当候选用户集合中存在与目标用户之间的关联强度达到第一设定值的候选用户时,将与目标用户之间的关联强度达到第一设定值的候选用户转化为关联用户。
在本申请的一个实施例中,可以将候选用户集合中的候选用户与目标用户之间的关联强度进行排序,基于排序确定转化为关联用户的候选用户。
在本申请的一个实施例中,可以按照候选用户集合中的候选用户与目标用户之间的关联强度的大小进行排序,可以是从大到小进行排序,从排序中选取任一候选用户,若该候选用户与目标用户之间的关联强度达到第一设定值,则排序位于该候选用户之前的候选用户均转化为关联用户,再次从未被转化为关联用户的候选用户中选取任一候选用户,重新基于再次选取的任一候选用户与目标用户之间的关联强度,确定位于再次选取的任一候选用户之前的候选用户是否转化为关联用户,直至未被转化为关联用户的候选用户与目标用户之间的关联强度均小于第一设定值。
在本申请的一个实施例中,将候选用户转化为关联用户后,将关联用户从候选用户集中删除。
在步骤S340中,根据关联用户的数据交互记录,确定与关联用户具有交互关系的用户,并将与关联用户具有交互关系的用户重新组成候选用户集合,基于目标用户与各个关联用户之间的关联强度以及关联用户的数据交互记录,重新确定目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,并根据重新确定的关联强度确定关联用户,直至目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度均低于第一设定值。
由于在步骤S330中记载了,当候选用户集合中存在与目标用户之间的关联强度达到第一设定值的候选用户时,将与目标用户之间的关联强度达到第一设定值的候选用户转化为关联用户,可以理解,当重新组成的候选用户集合中存在与目标用户之间的关联强度达到第一设定值的候选用户时,将重新组成的候选用户集合中与目标用户之间的关联强度达到第一设定值的候选用户转化为关联用户,重复执行步骤S330与步骤S340,直至重新组成的候选用户集合中不存在与目标用户之间的关联强度达到第一设定值的候选用户。
在本申请的一个实施例中,重新组成候选用户集合时原候选用户集合解散,若与关联用户具有交互关系的用户曾经在原候选用户集合中,再次将该用户加入重新组成的候选用户集合中,但是该用户与目标用户之间的关联强度也重新计算,是基于该用户关联的关联用户的数据交互记录和该用户关联的的关联用户的关联强度计算得到。
在本申请的一个实施例中,关联用户的数据交互记录中可以记载关联用户的标识、与关联用户具有交互关系的用户的标识、交互数据、交互数据的大小和种类、交互中的发送方和接收方等。
在本申请的一个实施例中,数据交互的行为可以是转账之类的资金往来行为,则数据交互记录可以是资金往来记录,数据交互记录中可以记录与目标用户进行资金往来的用户标识和交互的资金数额。
在本申请的一个实施例中,与关联用户具有交互关系的用户可以是关联用户的数据交互记录中记载的,曾经与关联用户进行过数据传输的用户,可以包括接收关联用户发送数据的用户,也可以包括向关联用户发送数据的用户。
在本申请的一个实施例中,可以基于关联用户的数据交互记录,确定候选用户集合中的各个候选用户与关联用户交互的数据量大小占关联用户交互的数据总量大小的比值,作为候选用户集合中的各个候选用户对应的第二关联比值;基于候选用户集合中的各个候选用户对应的第二关联比值,确定候选用户集合中的各个候选用户对应的第二关联衰减系数;计算对应于同一候选用户的第二关联比值和第二关联衰减系数的乘积,得到关联用户与候选用户集合中的各个候选用户之间的关联强度。
在本申请的一个实施例中,可以只将接收关联用户发送数据的用户作为与关联用户具有交互关系的用户。
在本申请的一个实施例中,可以基于关联用户的数据交互记录,确定重新组成的候选用户集合中各个候选用户接收的来自关联用户的数据量大小占关联用户发送的数据总量的比值,作为重新组成的候选用户集合中各个候选用户对应的第二比值;基于第二比值以及目标用户与关联用户之间的关联强度,确定重新组成的候选用户集合中各个候选用户的第二衰减系数;计算对应于同一候选用户的第二比值和第二衰减系数的乘积,得到目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度。
在本申请的一个实施例中,可以是若第二比值达到第二设定比值,则基于第二比值以及目标用户与关联用户之间的关联强度,确定重新组成的候选用户集合中各个候选用户的第二衰减系数;若第二比值未达到第二设定比值,则不计算第二比值对应的第二衰减系数,不将未达到第二设定比值的第二比值对应的候选用户作为关联用户。
在该实施例中,第二设定比值可以根据第一设定值确定,根据其对应关系,提前对第二比值未达到第二设定比值的候选用户进行筛选,以减少工作量,但是由于关联强度和第二比值的计算过程不同,只对第二设定比值进行筛选难免遗漏,因此仍需通过第一设定值对关联强度进行筛选。
在本申请的一个实施例中,可以使用公式Y2=Y1(M+X2)/N计算第二衰减系数Y2,其中X2表示第二比值,N/M为衰减的修正系数,计算第二衰减系数的修正系数可以与计算第一衰减系数的修正系数相同,其中,第二比值的取值范围可以为从0至1,可以设置N>M+1,以使第二衰减系数小于第一衰减系数,从而实现关联强度随着关联层数的增加逐渐减小,从而实现关联强度逐层收敛。
在图3的实施例中,通过获取目标用户的数据交互记录,基于目标用户的数据交互记录,将与目标用户具有交互关系的用户组成候选用户集合,并基于目标用户的数据交互记录确定目标用户与候选用户集合中的各个候选用户之间的关联强度,当候选用户集合中存在与目标用户之间的关联强度达到第一设定值的候选用户时,将与目标用户之间的关联强度达到第一设定值的候选用户转化为关联用户,以获取与目标用户直接关联的关联用户,再根据关联用户的数据交互记录,确定与关联用户具有交互关系的用户,并将与关联用户具有交互关系的用户重新组成候选用户集合,基于目标用户与各个关联用户之间的关联强度以及关联用户的数据交互记录,重新确定目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,并根据重新确定的关联强度确定关联用户,直至目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度均低于第一设定值,以获取与目标用户具有间接关系的关联用户,从而能够更加全面的查找关联用户,同时,由于在查找与目标用户具有间接关系的关联用户时,考虑到了在该用户与目标用户之间的关联用户与目标用户之间的关联强度,关联强度的影响随着间接关系的层数增加逐渐累积,使得基于关联强度找到的关联用户更加准确,从而实现精准且全面的获取关联用户。
在本申请的一个实施例中,可以获取目标用户的第一用户信息,并获取关联用户的第二用户信息;获取候选用户集合中与目标用户之间的关联强度未达到第一设定值的候选用户的第三用户信息;计算第一用户信息与第三用户信息的匹配度,并计算第二用户信息与第三用户信息的匹配度;将第一用户信息与第三用户信息的匹配度加上第二用户信息与第三用户信息的匹配度,得到目标用户与候选用户之间的匹配强度;将与目标用户之间的匹配强度达到第二设定值的候选用户转化为关联用户。
在该实施例中,通过用户信息之间的匹配度对图3实施例中的关联用户获取进行补充,能够使关联用户的获取更加全面。
在该实施例中,匹配强度的确定是基于现有的目标用户和所有关联用户确定的,相比于只基于目标用户确定匹配强度,能够使根据匹配强度得到的关联用户更加准确和全面。
在本申请的一个实施例中,可以将第一用户信息包含的各项信息与第三用户信息包含的各项信息中相同的项的数量除以总项数,得到第一用户信息与第三用户信息的匹配度;可以将第二用户信息包含的各项信息与第三用户信息包含的各项信息中相同的项的数量除以总项数,得到第二用户信息与第三用户信息的匹配度。
在本申请的一个实施例中,可以在每次获取到新的关联用户时,都计算候选用户集合中与目标用户之间的关联强度未达到第一设定值的候选用户与目标用户的匹配强度。
在本申请的一个实施例中,可以在图3的步骤全部执行完毕后,重新组合的候选用户集合中不存在关联强度达到第一设定值的候选用户时,确定候选用户集合中与目标用户之间的关联强度未达到第一设定值的候选用户与目标用户的匹配强度。
在本申请的一个实施例中,第一用户信息可以包括目标用户的社交账号中的好友、目标用户与社交账号中好友的交流次数及时长、目标用户使用的设备标识、登录地址、目标用户在不同设备中的登录次数等。
在本申请的一个实施例中,第二用户信息可以包括关联用户的社交账号中的好友、关联用户与社交账号中好友的交流次数及时长、关联用户使用的设备标识、登录地址、关联用户在不同设备中的登录次数等。
在本申请的一个实施例中,第三用户信息可以包括关联用户的社交账号中的好友、关联用户与社交账号中好友的交流次数及时长、关联用户使用的设备标识、登录地址、关联用户在不同设备中的登录次数等。
在本申请的一个实施例中,可以基于目标用户与关联用户的交流次数及时长,计算第一用户信息与第三用户信息的匹配度。
在本申请的一个实施例中,可以将目标用户与关联用户的交流次数占目标用户交流总次数,作为第一用户信息与第三用户信息的匹配度;可以将目标用户与关联用户的交流时长占目标用户交流总时长,作为第一用户信息与第三用户信息的匹配度。
在本申请的一个实施例中,可以基于目标用户与关联用户在同一设备中登录社交账号的次数,计算第一用户信息与第三用户信息的匹配度。
在本申请的一个实施例中,可以将目标用户与关联用户在同一设备中登录社交账号的次数占目标用户登录的总次数,作为第一用户信息与第三用户信息的匹配度。
在本申请的一个实施例中,若与目标用户之间的关联强度未达到第一设定值的候选用户具有与目标用户对应的关联标记,则将具有关联标记的候选用户,转化为关联用户。
在本申请的一个实施例中,若使用本申请的方案获取团队,则可以将曾经标记为洗钱用户的候选用户作为关联用户。
在本申请的一个实施例中,若目标用户的数据交互记录或关联用户的数据交互记录中的单笔数据交互量的大小达到第三设定值,则可以确定接收方或发送方的用户是数据的流入方、流出方或归集方,可以认为数据传输到此结束,因此可以停止获取关联用户。
在本申请的一个实施例中,可以基于目标用户与关联用户之间的关系,以及关联用户之间的相互关系生成用户关系图,用户关系图中可以将某个关联用户与获取到该关联用户使用的关联用户进行连线,以使获取关联用户的人清楚的确定目标用户与关联用户之间的关系以及关联用户之间的相互关系。
在本申请的一个实施例中,可以基于目标用户与关联用户之间的关联强度或匹配强度的大小,以不同明度或不同深浅度显示关联用户。
以下对应用本申请实施例的技术方案获取团队的方案进行详细阐述:
图4示意性示出了可以应用本申请的一个实施例的获取团队的流程图,该获取团队方案的执行主体可以是服务器,比如可以是图2中所示的服务器 203。
参照图4所示,该获取团队方案至少包括步骤S410至步骤S420,详细介绍如下:
在步骤S410中,获取用户之间的资金关系数据、非资金关系数据。
在本申请的一个实施例中,可以基于用户的数据交互记录获取用户之间的资金关系数据,可以基于用户信息获取用户的非资金关系数据。
在本申请的一个实施例中,用户信息可以包括用户的社交账号中的好友、用户与社交账号中好友的交流次数及时长、用户使用的设备标识、登录地址、用户在不同设备中的登录次数等。
在步骤S420中,通过交互页面用户数输入的目标用户的账号,基于资金关系数据、非资金关系数据拓展团队。
在本申请的一个实施例中,可以在获取团队的客户端显示输入账号的输入框,输入的账号可以是社交账号或银行账户等。
在本申请的一个实施例中,团队中关联用户的拓展可以包括资金关系扩展和非资金关系拓展。
在本申请的一个实施例中,参照图5,图5示意性示出了可以应用本申请的一个实施例用户关系图,资金关系扩展的过程可以包括:
基于目标用户的账户A的资金交互记录,查询输入框501中输入的目标用户的风险账号A的资金流出和资金流出方的资金占比、资金量,将资金占比作为与目标用户的账号A进行交互的用户的第一比值,当第一比值大于t%,且资金量大于T元,则拓展该用户作为关联用户,如图5中A转出到候选用户的账号C、D和E的第一比值和资金量符合要求,则拓展出C、D和E对应的用户作为A的关联用户,其中,t%和T的值可以根据需要设定;
分别根据C、D和E的第一比值,计算C、D和E对应的第一衰减系数,可以使用公式Y=(M+X)/N计算第一衰减系数,其中,X表示C、D或E 的第一比值,N/M为衰减的修正系数,比如M取1,则N取大于M+1的系数,比如N=2,则Y=(1+X)/2,以使第一衰减系数小于1,例如,A流出到E的资金占比为50%,则第一比值X=50%,则E的第一衰减系数Y=0.75;
根据第一衰减系数以及与账号E进行交互的候选用户,再次向外做资金拓展,如E流出到账号F对应的候选用户的资金占比为30%,则账号F对应的候选用户对应的第一占比为30%,第一占比30%乘第一衰减系数0.75得到账号F对应的候选用户与A对应的目标用户的关联强度为22.5%,若 22.5%>=t%,则拓展出F对应的候选用户为关联用户,若22.5%<=t%,则不拓展F对应的候选用户为关联用户,并停止拓展与账号F交互的用户。
在本申请的一个实施例中,非资金关系扩展的过程可以包括:
基于资金关系拓展得到的团队,计算新用户与基于资金关系拓展得到的团队的所有成员之间的匹配度,匹配度的获取方式可以参照上述实施例;
累加新用户与已有团伙成员之间的所有匹配度,得到新用户与目标用户之间的匹配强度;
若在新用户和其他用户的匹配强度的排名中,新用户与目标用户之间的匹配强度的大小在前N个,或者新用户与目标用户之间的匹配强度大于某阈值K,则在图上显示该新用户,如图5中,账户B对应的候选用户与账户A 对应的目标用户的匹配强度满足条件,则将账户B对应的候选用户作为目标用户的关联用户中的非资金关系用户,显示到图上。
在本申请的一个实施例中,团队的关联用户还可以包括高风险用户,可以判断与已经成型的团队有直接关联关系的用户,若某用户已经被历史上报、人工验证为可疑或者确定是可疑的高风险账户,则展示出来。
在本申请的一个实施例中,可以在每次拓展资金关系用户时,同时拓展非资金关系用户和高风险用户。
在本申请的一个实施例中,每一层拓展均可以暂停,供人工修改拓展参数后手动再做下一次拓展,拓展参数可以包括上述实施例中的第一设定值、第一设定比值、第二设定值、第二设定比值等。
在本申请的一个实施例中,可以针对交易记录特殊的用户做额外处理,比如遇到资金提现、充值占比较大,或者分散转入集中转出、分散转出集中转入等用户时,可以直接停止下一步拓展。这些用户是团伙中资金的流入、流出方或者资金扩散、归集方,遇到这些账户的时候可以认为资金流终止了,所以不再继续往下拓展。
在图4的实施例中,通过上述逻辑的团队拓展,在符合洗钱风险识别的基础上,能综合考虑资金、非资金、关系衰减等因素,准确、自动的拓展出团队,大幅降低了人工拓展和识别风险用户的难度。按现有案例中有70%用户有团伙作案风险,一个团伙平均10个人,则该方法将额外拓展630个新的风险用户,按人工拓展一个风险用户1分钟计算,节省人工消耗630分钟。
本申请主要基于目标客户的出入资金关系,找出与其具有交互关系的关联用户,并根据关联用户的资金出入情况,再加上一个衰减系数,逐步向外拓展出跟目标用户关系最密切的团队。之后再利用已有团伙人员的非资金关系用户和高风险用户补充,完成整个团队的拓展,可以基于拓展出的团队分析目标用户的账户是否是风险账户。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的关联用户获取方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的关联用户获取方法的实施例。
图6示意性示出了根据本申请的一个实施例的关联用户获取装置的框图。
参照图6所示,根据本申请的一个实施例的关联用户获取装置600,包括获取模块601、第一确定模块602、转化模块603和第二确定模块604。
在本申请的一些实施例中,基于前述方案,获取模块601配置为获取目标用户的数据交互记录;第一确定模块602配置为基于目标用户的数据交互记录,将与目标用户具有交互关系的用户组成候选用户集合,并基于目标用户的数据交互记录确定目标用户与候选用户集合中的各个候选用户之间的关联强度;转化模块603配置为当候选用户集合中存在与目标用户之间的关联强度达到第一设定值的候选用户时,将与目标用户之间的关联强度达到第一设定值的候选用户转化为关联用户;第二确定模块604配置为根据关联用户的数据交互记录,确定与关联用户具有交互关系的用户,并将与关联用户具有交互关系的用户重新组成候选用户集合,基于目标用户与各个关联用户之间的关联强度以及关联用户的数据交互记录,重新确定目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,并根据重新确定的关联强度确定关联用户,直至目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度均低于第一设定值。
在本申请的一个实施例中,基于前述方案,第一确定模块602配置为:基于目标用户的数据交互记录,确定候选用户集合中的各个候选用户接收的来自目标用户的数据量大小占目标用户发送的数据总量大小的比值,作为候选用户集合中的各个候选用户对应的第一比值;基于候选用户集合中的各个候选用户对应的第一比值,确定候选用户集合中的各个候选用户对应的第一衰减系数;计算对应于同一候选用户的第一比值和第一衰减系数的乘积,得到目标用户与候选用户集合中的各个候选用户之间的关联强度。
在本申请的一个实施例中,基于前述方案,第一确定模块602配置为:若第一比值达到第一设定比值,则基于候选用户集合中的各个候选用户对应的第一比值,确定候选用户集合中的各个候选用户对应的第一衰减系数。
在本申请的一个实施例中,基于前述方案,第二确定模块604配置为:基于关联用户的数据交互记录,确定重新组成的候选用户集合中各个候选用户接收的来自关联用户的数据量大小占关联用户发送的数据总量的比值,作为重新组成的候选用户集合中各个候选用户对应的第二比值;基于第二比值以及目标用户与关联用户之间的关联强度,确定重新组成的候选用户集合中各个候选用户的第二衰减系数;计算对应于同一候选用户的第二比值和第二衰减系数的乘积,得到重新确定的目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度。
在本申请的一个实施例中,基于前述方案,第二确定模块604配置为:若第二比值达到第二设定比值,则基于第二比值以及目标用户与关联用户之间的关联强度,确定重新组成的候选用户集合中各个候选用户的第二衰减系数。
在本申请的一个实施例中,基于前述方案,转化模块603还配置为:获取目标用户的第一用户信息,并获取关联用户的第二用户信息;获取候选用户集合中与目标用户之间的关联强度未达到第一设定值的候选用户的第三用户信息;计算第一用户信息与第三用户信息的匹配度,并计算第二用户信息与第三用户信息的匹配度;将第一用户信息与第三用户信息的匹配度加上第二用户信息与第三用户信息的匹配度,得到目标用户与候选用户之间的匹配强度;将与目标用户之间的匹配强度达到第二设定值的候选用户转化为关联用户。
在本申请的一个实施例中,基于前述方案,转化模块603还配置为:若与目标用户之间的关联强度未达到第一设定值的候选用户具有与目标用户对应的关联标记,则将具有关联标记的候选用户,转化为关联用户。
在本申请的一个实施例中,基于前述方案,获取模块601还配置为:若目标用户的数据交互记录或关联用户的数据交互记录中的单笔数据交互量的大小达到第三设定值,则停止获取关联用户。
在本申请的一个实施例中,基于前述方案,转化模块603还配置:为基于目标用户与关联用户之间的关系,以及关联用户之间的相互关系生成用户关系图。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图7来描述根据本申请的这种实施方式的电子设备70。图7显示的电子设备70仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,电子设备70以通用计算设备的形式表现。电子设备70的组件可以包括但不限于:上述至少一个处理单元71、上述至少一个存储单元 72、连接不同系统组件(包括存储单元72和处理单元71)的总线73、显示单元74。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元71执行,使得所述处理单元71执行本说明书上述“实施例方法”部分中描述的根据本申请各种示例性实施方式的步骤。
存储单元72可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)721和/或高速缓存存储单元722,还可以进一步包括只读存储单元(ROM)723。
存储单元72还可以包括具有一组(至少一个)程序模块725的程序/实用工具724,这样的程序模块725包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线73可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备70也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备70交互的设备通信,和/或与使得该电子设备70能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口75进行。并且,电子设备70还可以通过网络适配器76与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器76通过总线73与电子设备70的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备70使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本申请实施方式的方法。
根据本申请一个实施例,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本申请的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
根据本申请一个实施例,用于实现上述方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器 (ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、 C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN) 或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备 (例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本申请示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种关联用户获取方法,其特征在于,包括:
获取目标用户的数据交互记录;
基于所述目标用户的数据交互记录,将与所述目标用户具有交互关系的用户组成候选用户集合,并基于所述目标用户的数据交互记录确定所述目标用户与所述候选用户集合中的各个候选用户之间的关联强度;
当所述候选用户集合中存在与所述目标用户之间的关联强度达到第一设定值的候选用户时,将与所述目标用户之间的关联强度达到所述第一设定值的候选用户转化为关联用户;
根据所述关联用户的数据交互记录,确定与所述关联用户具有交互关系的用户,并将与所述关联用户具有交互关系的用户重新组成候选用户集合,基于所述目标用户与各个所述关联用户之间的关联强度以及所述关联用户的数据交互记录,重新确定所述目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,并根据重新确定的关联强度确定所述关联用户,直至所述目标用户与所述重新组成的候选用户集合中各个候选用户之间的关联强度均低于所述第一设定值。
2.根据权利要求1所述的关联用户获取方法,其特征在于,所述基于所述目标用户的数据交互记录确定所述目标用户与所述候选用户集合中的各个候选用户之间的关联强度,包括:
基于所述目标用户的数据交互记录,确定所述候选用户集合中的各个候选用户接收的来自所述目标用户的数据量大小占所述目标用户发送的数据总量大小的比值,作为所述候选用户集合中的各个候选用户对应的第一比值;
基于所述候选用户集合中的各个候选用户对应的第一比值,确定所述候选用户集合中的各个候选用户对应的第一衰减系数;
计算对应于同一候选用户的第一比值和第一衰减系数的乘积,得到所述目标用户与所述候选用户集合中的各个候选用户之间的关联强度。
3.根据权利要求2所述的关联用户获取方法,其特征在于,所述基于所述候选用户集合中的各个候选用户对应的第一比值,确定所述候选用户集合中的各个候选用户对应的第一衰减系数,包括:
若所述第一比值达到第一设定比值,则基于所述候选用户集合中的各个候选用户对应的第一比值,确定所述候选用户集合中的各个候选用户对应的第一衰减系数。
4.根据权利要求1所述的关联用户获取方法,其特征在于,所述基于所述目标用户与各个所述关联用户之间的关联强度以及所述关联用户的数据交互记录,重新确定所述目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,包括:
基于所述关联用户的数据交互记录,确定所述重新组成的候选用户集合中各个候选用户接收的来自所述关联用户的数据量大小占所述关联用户发送的数据总量的比值,作为所述重新组成的候选用户集合中各个候选用户对应的第二比值;
基于所述第二比值以及所述目标用户与所述关联用户之间的关联强度,确定所述重新组成的候选用户集合中各个候选用户的第二衰减系数;
计算对应于同一候选用户的第二比值和第二衰减系数的乘积,得到重新确定的所述目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度。
5.根据权利要求4所述的关联用户获取方法,其特征在于,所述基于所述第二比值以及所述目标用户与所述关联用户之间的关联强度,确定所述重新组成的候选用户集合中各个候选用户的第二衰减系数包括:
若所述第二比值达到第二设定比值,则基于所述第二比值以及所述目标用户与所述关联用户之间的关联强度,确定所述重新组成的候选用户集合中各个候选用户的第二衰减系数。
6.根据权利要求1所述的关联用户获取方法,其特征在于,所述方法还包括:
获取所述目标用户的第一用户信息,并获取所述关联用户的第二用户信息;
获取所述候选用户集合中与所述目标用户之间的关联强度未达到所述第一设定值的候选用户的第三用户信息;
计算所述第一用户信息与所述第三用户信息的匹配度,并计算所述第二用户信息与所述第三用户信息的匹配度;
将所述第一用户信息与所述第三用户信息的匹配度加上所述第二用户信息与所述第三用户信息的匹配度,得到所述目标用户与所述候选用户之间的匹配强度;
将与所述目标用户之间的所述匹配强度达到第二设定值的候选用户转化为所述关联用户。
7.根据权利要求1所述的关联用户获取方法,其特征在于,所述方法还包括:
若与所述目标用户之间的关联强度未达到所述第一设定值的候选用户具有与所述目标用户对应的关联标记,则将具有所述关联标记的候选用户,转化为所述关联用户。
8.根据权利要求1所述的关联用户获取方法,其特征在于,所述方法还包括:
若所述目标用户的数据交互记录或所述关联用户的数据交互记录中的单笔数据交互量的大小达到第三设定值,则停止获取所述关联用户。
9.根据权利要求1所述的关联用户获取方法,其特征在于,所述方法还包括:
基于所述目标用户与所述关联用户之间的关系,以及所述关联用户之间的相互关系生成用户关系图。
10.一种关联用户获取装置,其特征在于,包括:
获取模块,配置为获取目标用户的数据交互记录;
第一确定模块,配置为基于所述目标用户的数据交互记录,将与所述目标用户具有交互关系的用户组成候选用户集合,并基于所述目标用户的数据交互记录确定所述目标用户与所述候选用户集合中的各个候选用户之间的关联强度;
转化模块,配置为当所述候选用户集合中存在与所述目标用户之间的关联强度达到第一设定值的候选用户时,将与所述目标用户之间的关联强度达到所述第一设定值的候选用户转化为关联用户;
第二确定模块,配置为根据所述关联用户的数据交互记录,确定与所述关联用户具有交互关系的用户,并将与所述关联用户具有交互关系的用户重新组成候选用户集合,基于所述目标用户与各个所述关联用户之间的关联强度以及所述关联用户的数据交互记录,重新确定所述目标用户与重新组成的候选用户集合中各个候选用户之间的关联强度,并根据重新确定的关联强度确定所述关联用户,直至所述目标用户与所述重新组成的候选用户集合中各个候选用户之间的关联强度均低于所述第一设定值。
CN202110028242.1A 2021-01-08 2021-01-08 关联用户获取方法和装置 Pending CN112800081A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110028242.1A CN112800081A (zh) 2021-01-08 2021-01-08 关联用户获取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110028242.1A CN112800081A (zh) 2021-01-08 2021-01-08 关联用户获取方法和装置

Publications (1)

Publication Number Publication Date
CN112800081A true CN112800081A (zh) 2021-05-14

Family

ID=75809635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110028242.1A Pending CN112800081A (zh) 2021-01-08 2021-01-08 关联用户获取方法和装置

Country Status (1)

Country Link
CN (1) CN112800081A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574177A (zh) * 2024-01-15 2024-02-20 每日互动股份有限公司 一种用于用户扩线的数据处理方法、装置、介质及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574177A (zh) * 2024-01-15 2024-02-20 每日互动股份有限公司 一种用于用户扩线的数据处理方法、装置、介质及设备
CN117574177B (zh) * 2024-01-15 2024-04-19 每日互动股份有限公司 一种用于用户扩线的数据处理方法、装置、介质及设备

Similar Documents

Publication Publication Date Title
WO2020220823A1 (zh) 用于构建决策树的方法和装置
CN107741976B (zh) 智能应答方法、装置、介质和电子设备
CN106685916A (zh) 电子会议智能
CN106686339A (zh) 电子会议智能
CN110199274A (zh) 用于自动化查询回答生成的系统和方法
CN113590576A (zh) 数据库参数调整方法、装置、存储介质以及电子设备
US11244153B2 (en) Method and apparatus for processing information
CN113282611B (zh) 一种流数据同步的方法、装置、计算机设备及存储介质
CN114091610A (zh) 智能决策方法及装置
CN111027838A (zh) 一种众包任务推送方法、装置、设备及其存储介质
CN110708358A (zh) 会话消息处理方法、电子设备和计算机可读存储介质
CN105871998A (zh) 一种数据展示方法及装置
CN112800081A (zh) 关联用户获取方法和装置
US8683425B2 (en) System for generating application architecture design work products
CN112582073B (zh) 医疗信息获取方法、装置、电子设备和介质
CN112069409B (zh) 基于待办推荐信息的方法和装置、计算机系统和存储介质
CN112348197A (zh) 基于联邦学习的模型生成方法及装置
CN111767953A (zh) 用于训练物品编码模型的方法和装置
CN113239054B (zh) 信息生成方法及相关装置
CN113808582B (zh) 语音识别方法、装置、设备及存储介质
CN115510116A (zh) 数据目录构建方法、装置、介质及设备
CN112417018B (zh) 一种数据共享方法及装置
CN113672603A (zh) 基于多源异构的电力大数据自动化标签实现方法、系统
CN113780827A (zh) 一种物品筛选方法、装置、电子设备及计算机可读介质
CN116915870B (zh) 任务创建请求处理方法、装置、电子设备和可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination