CN117574177A

CN117574177A - 一种用于用户扩线的数据处理方法、装置、介质及设备

Info

Publication number: CN117574177A
Application number: CN202410054533.1A
Authority: CN
Inventors: 董霖; 李文博; 段永康; 张衍林; 方淑铭
Original assignee: Merit Interactive Co Ltd
Current assignee: Merit Interactive Co Ltd
Priority date: 2024-01-15
Filing date: 2024-01-15
Publication date: 2024-02-20
Anticipated expiration: 2044-01-15
Also published as: CN117574177B

Abstract

本发明涉及数据处理领域，尤其涉及一种用于用户扩线的数据处理方法、装置、介质及设备，包括：根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的第一关联程度以及第一关联程度集，根据每一目标用户对应的IP列表和第一关联程度集，获取到任意两个目标用户之间的第二关联程度以及第二关联程度集，根据第二关联程度集和关联程度阈值获取到每一目标用户对应的关联用户列表，通过分析目标IP对应的用户列表之间的关联程度，来表征目标IP之间的关联关系，进一步综合考虑目标IP和目标用户之间的连接关系，以及目标IP之间的关联关系对目标用户之间的关联关系的影响，提高了第二关联程度的准确性，进而提高了用户扩线的准确性。

Description

一种用于用户扩线的数据处理方法、装置、介质及设备

技术领域

本发明涉及数据处理领域，特别是涉及一种用于用户扩线的数据处理方法、装置、介质及设备。

背景技术

随着智能设备的普及以及网络的快速发展，用户的日常生活与智能设备和网络息息相关，因此，在进行用户扩线时，可以依赖于用户的智能设备以及连接的网络信息对用户之间的关联关系进行表征，从而完成关联用户的判断和筛选。

现阶段的用户扩线方法主要是根据用户的年龄、性别、应用程序下载信息和使用信息等自身属性进行相似性分析，即通过对未知用户自身属性与已知用户的自身属性进行相似度计算，确定未知用户是否属于特定的用户组，以基于已知用户完成用户扩线。

但是上述方法中需要预先获取大量的已知用户的属性数据，导致用户扩线的成本较高，且随着智能设备的普及以及网络的广泛应用，用户之间的关联关系复杂多样，而用户自身属性信息随着智能设备和网络变化的改变程度较低，导致上述方法难以准确进行关联用户之间的匹配，进而导致用户扩线的准确性较低。

因此，如何提高用户扩线的准确性成为亟待解决的问题。

发明内容

针对上述技术问题，本发明采用的技术方案为一种用于用户扩线的数据处理方法，所述方法包括如下步骤：

获取到每一目标IP对应的用户列表和每一目标用户对应的IP列表，其中，用户列表中包括若干个目标用户的ID，IP列表中包括若干个目标IP；

根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的第一关联程度，进而获取到第一关联程度集；

根据每一目标用户对应的IP列表和第一关联程度集，获取到任意两个目标用户之间的第二关联程度，进而获取到第二关联程度集；

根据第二关联程度集和预设的关联程度阈值，获取到每一目标用户对应的关联用户列表。

本发明还提供了一种用于用户扩线的数据处理装置，所述装置包括：

数据获取模块，用于获取到每一目标IP对应的用户列表和每一目标用户对应的IP列表，其中，用户列表中包括若干个目标用户的ID，IP列表中包括若干个目标IP；

第一关联程度获取模块，用于根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的第一关联程度，进而获取到第一关联程度集；

第二关联程度获取模块，用于根据每一目标用户对应的IP列表和第一关联程度集，获取到任意两个目标用户之间的第二关联程度，进而获取到第二关联程度集；

关联用户获取模块，用于根据第二关联程度集和预设的关联程度阈值，获取到每一目标用户对应的关联用户列表。

本发明还提供了一种非瞬时性计算机可读存储介质，所述非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序，至少一条指令或至少一段程序由处理器加载并执行以实现上述的用于用户扩线的数据处理方法。

本发明还提供了一种电子设备，包括处理器和上述的非瞬时性计算机可读存储介质。

本发明至少具有以下有益效果：通过获取到每一目标IP对应的用户列表和每一目标用户对应的IP列表，为表征目标用户之间的关联关系，进而对用户进行扩线提供了数据基础；根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的第一关联程度，进而获取到第一关联程度集，通过分析两个目标IP对应的用户列表的相似性，来表征对应的两个目标IP之间的关联程度，提高了IP之间的关联关系的表征准确性；根据每一目标用户对应的IP列表和第一关联程度集，获取到任意两个目标用户之间的第二关联程度，进而获取到第二关联程度集，根据第二关联程度集和预设的关联程度阈值，获取到每一目标用户对应的关联用户列表，进一步综合考虑了目标IP和目标用户之间的连接关系，以及目标IP之间的关联关系对目标用户之间的关联关系的影响，提高了获取到的第二关联程度的准确性，进而提高了用户扩线的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种用于用户扩线的数据处理方法的流程图；

图2为本发明另一实施例提供的一种用于用户扩线的数据处理方法的流程图；

图3本发明实施例提供的一种用于用户扩线的数据处理装置的结构示意图；

图4本发明另一实施例提供的一种用于用户扩线的数据处理装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一

本实施例一提供了一种用于用户扩线的数据处理方法，所述方法包括如下步骤，如图1所示：

S100，获取到每一目标IP对应的用户列表和每一目标用户对应的IP列表，其中，用户列表中包括若干个目标用户的ID，IP列表中包括若干个目标IP。

其中，用户列表是指在预设时间段内连接目标IP的目标用户对应的列表，用户列表包括目标用户的ID和，目标用户的ID是目标用户的唯一身份标识。IP列表是指目标用户在预设时间段内连接的IP的列表。其中，预设时间段可由实施者根据实际情况进行设定，例如，预设时间段可以是一个月、三个月、六个月、一年等时间段。

目标IP对应的用户列表和目标用户的IP列表可以表征目标用户和目标IP之间的对应连接关系，通过对用户列表和IP列表进行相关性分析，可以进一步表征目标用户之间的关联关系，从而确定每一目标用户的关联用户，以完成对用户进行扩线的任务。

上述，获取到每一目标IP对应的用户列表和每一目标用户对应的IP列表，为表征目标用户之间的关联关系，进而对用户进行扩线提供了数据基础。

在一具体实施方式中，为了提高目标用户的扩线质量，从预设用户中筛选得到目标用户，并从预设IP中筛选得到目标IP。

可以理解地，预设用户与预设IP之间的连接关系复杂多样，可能存在连接IP的次数、连接IP的时间点出现异常的用户，以及所属的地理区域位置、连接用户的数量、分配wifi的数量出现异常的IP，导致用户扩线结果的准确性较低。

因此，本实施例获取到每一预设用户在预设时间段内与预设IP进行连接的连接总数量，以及每次连接预设IP的连接时间点，当连接总数量大于预设的数量阈值，且连接时间点在预设的时间点范围内时，将对应的预设用户确定为目标用户，以筛除连接IP的次数、连接IP的时间点出现异常的用户，提高目标用户的质量。

其中，预设的数量阈值和预设的时间点范围可以由实施者根据实际情况进行设定。例如，预设的数量阈值可以是指所有的预设用户与所有的预设IP之间的连接总数量的均值；时间点范围包括时间点上限和时间点下限，具体地，在所有的预设用户与所有的预设IP之间的连接时间点集合中，获取到每一连接时间点对应的出现频次，计算所有的连接时间点对应的出现频次均值，则将对应的出现频次大于出现频次均值的最小的连接时间点确定为时间点下限，将对应的出现频次大于出现频次均值的最大的连接时间点确定为时间点上限，以对预设用户进行筛选来提高目标用户的质量。

同时，本实施例获取到每一预设IP在预设时间段内所属的地理区域位置对应的geohash6值、进行连接的用户总数量和分配wifi的wifi总数量，当geohash6值小于预设的geohash阈值，且用户总数量小于预设的用户数量阈值，且wifi总数量小于预设的wifi数量阈值时，将对应的预设IP确定为目标IP，以筛除所属的地理区域位置、连接用户的数量、分配wifi的数量出现异常的IP，提高目标IP的质量。

其中，预设的geohash阈值、预设的用户数量阈值和预设的wifi数量阈值可以由实施者根据实际情况进行设定。

上述，从预设用户中筛选得到目标用户，并从预设IP中筛选得到目标IP，提高了目标用户和目标IP的质量，进而提高了目标用户的扩线质量。

S200，根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的第一关联程度，进而获取到第一关联程度集。

其中，若两个目标IP对应的用户列表的相似性较高，则表征该两个目标IP之间的关联程度越高，因此，本实施例根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的第一关联程度，进而获取到第一关联程度集。

在一具体实施方式中，在根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的第一关联程度的步骤中还包括如下步骤：

根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的用户交集和用户并集；

根据用户交集获取到第一用户数量；

根据用户并集获取到第二用户数量；

将第一用户数量和第二用户数量的比值，确定为任意两个目标IP之间的第一关联程度。

其中，在一种实施方式中，用户列表可以包括目标用户的ID，用户交集中包括若干个目标用户的ID，具体地，当任意两个目标IP的用户列表中对应的目标用户ID一致时，将该任意两个目标IP对应的目标用户ID确定为用户交集中的目标用户ID，据此获取到任意两个目标IP之间的用户交集，并获取到任意两个目标IP之间的用户并集。

在另一种实施方式中，用户列表还可以包括目标用户的ID和连接时间，连接时间是指目标用户对应的设备连接对应的目标IP的时间，用户交集中包括若干个目标用户的ID，具体地，当任意两个目标IP的用户列表中对应的目标用户ID和连接时间均一致时，将该任意两个目标IP对应的目标用户ID确定为用户交集中的目标用户ID，据此获取到任意两个目标IP之间的用户交集，并获取到任意两个目标IP之间的用户并集。

用户交集对应的第一用户数量在用户并集对应的第二用户数量中的占比越高，表示对应的两个用户列表的相似性较高，进一步表征对应的两个目标IP之间的关联程度越高，因此，将第一用户数量和第二用户数量的比值，确定为对应的任意两个目标IP之间的第一关联程度。

上述，通过分析两个目标IP对应的用户列表的相似性，来表征对应的两个目标IP之间的关联程度，提高了IP之间的关联关系的表征准确性。

S300，根据每一目标用户对应的IP列表和第一关联程度集，获取到任意两个目标用户之间的第二关联程度，进而获取到第二关联程度集。

其中，将目标IP之间的第一关联程度与每一目标用户对应的IP列表相结合，来获取任意两个目标用户之间的第二关联程度，作为对用户进行扩线的基础。

在一具体实施方式中，在根据每一目标用户对应的IP列表和第一关联程度集，获取到任意两个目标用户之间的第二关联程度的步骤中还包括如下步骤：

根据每一目标用户对应的IP列表，获取到任意两个目标用户之间的IP交集和IP并集；

根据第一关联程度集，获取到IP交集中每一目标IP对应的第一权重；

根据IP并集获取到IP数量；

计算IP交集中所有目标IP对应的第一权重之和，将第一权重之和与IP数量的比值，确定为任意两个目标用户之间的第二关联程度。

其中，IP交集和IP并集中均包括若干个目标IP，则根据IP交集中的目标IP之间的第一关联程度获取到IP交集中每一目标IP对应的第一权重，进一步结合IP并集，来表征对应的任意两个目标用户之间的关联程度，据此得到第二关联程度，作为对用户进行扩线的基础，提高了目标用户的扩线准确性。

上述，结合IP交集中的目标IP之间的第一关联程度和IP并集，获取到对应的任意两个目标用户之间的第二关联程度，进一步综合考虑了目标IP和目标用户之间的连接关系，以及目标IP之间的关联关系对目标用户之间的关联关系的影响，提高了获取到的第二关联程度的准确性，从而提高了目标用户的扩线准确性。

在一具体实施方式中，在根据第一关联程度集，获取到IP交集中每一目标IP对应的第一权重的步骤中还包括如下步骤：

将IP交集中的任一目标IP作为待处理IP，将IP交集中除待处理IP的其他目标IP作为候选IP；

根据第一关联程度集，获取到待处理IP与任意候选IP之间的第一关联程度，并计算待处理IP与所有候选IP之间的第一关联程度的均值；

将第一关联程度的均值确定为待处理IP对应的第一权重；

遍历IP交集中的每一目标IP，获取到IP交集中每一目标IP对应的第一权重。

上述，将待处理IP与所有候选IP之间的第一关联程度的均值确定为待处理IP对应的第一权重，结合目标IP之间的关联关系和目标用户与目标IP之间的连接关系，来表征目标用户之间的关联关系，提高了第二关联程度的准确性，进而提高了目标用户的扩线准确性。

S400，根据第二关联程度集和预设的关联程度阈值，获取到每一目标用户对应的关联用户列表。

其中，目标用户之间的第二关联程度越大，表征对应的两个目标用户之间的关联关系越紧密，因此，当第二关联程度大于预设的关联程度阈值时，将对应的两个目标用户确定为关联用户，则可进一步获取到每一目标用户对应的关联用户列表，从而完成对用户的扩线任务。

其中，预设的关联程度阈值可以由实施者根据实际情况进行设定。

在一具体实施方式中，所述方法还包括如下步骤，如图2所示：

S500，根据每一目标IP对应的用户列表和第二关联程度集，更新第一关联程度，获取到任意两个目标IP之间的第三关联程度，进而获取到第三关联程度集；

S600，根据每一目标用户对应的IP列表和第三关联程度集，更新第二关联程度，获取到任意两个目标用户之间的第四关联程度，进而获取到第四关联程度集；

S700，根据第四关联程度集和预设的关联程度阈值，获取到每一目标用户对应的更新后的关联用户列表。

其中，由于目标IP和目标用户之间存在连接关系，因此，目标IP之间的关联关系与目标用户之间的关联关系相互影响，为了进一步提高用户扩线的准确性，在基于目标IP之间的第一关联程度获取到目标用户之间的第二关联程度之后，进一步结合目标IP对应的用户列表和目标用户之间的第二关联程度，更新第一关联程度并得到目标IP之间的第三关联程度，使得第三关联程度比第一关联程度更能准确地表征目标IP之间的关联关系。

然后，进一步结合目标用户对应的IP列表和第三关联程度，更新第二关联程度并得到目标用户之间的第四关联程度，使得第四关联程度比第二关联程度更能准确地表征目标用户之间的关联关系，从而根据第四关联程度集和预设的关联程度阈值，获取到每一目标用户对应的更新后的关联用户列表，提高了更新后的关联用户列表的准确性。

在一具体实施方式中，在根据每一目标IP对应的用户列表和第二关联程度集，更新第一关联程度，获取到任意两个目标IP之间的第三关联程度的步骤中还包括如下步骤：

根据第二关联程度集，获取到用户交集中每一目标用户对应的第二权重；

计算用户交集中所有目标用户对应的第二权重之和，将第二权重之和与第二用户数量的比值，确定为任意两个目标用户之间的第三关联程度。

在一具体实施方式中，在根据每一目标用户对应的IP列表和第三关联程度集，更新第二关联程度，获取到任意两个目标用户之间的第四关联程度的步骤中还包括如下步骤：

根据第三关联程度集，获取到IP交集中每一目标IP对应的第三权重；

计算IP交集中所有目标IP对应的第三权重之和，将第三权重之和与IP数量的比值，确定为任意两个目标用户之间的第四关联程度。

上述，结合目标IP对应的用户列表和目标用户之间的第二关联程度，更新第一关联程度并得到目标IP之间的第三关联程度，提高了对目标IP之间的关联关系的表征准确性，并进一步结合目标用户对应的IP列表和第三关联程度，更新第二关联程度并得到目标用户之间的第四关联程度，提高了对目标用户之间的关联关系的表征准确性，从而提高了用户扩线的准确性。

上述，获取到每一目标IP对应的用户列表和每一目标用户对应的IP列表，为表征目标用户之间的关联关系，进而对用户进行扩线提供了数据基础；根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的第一关联程度，进而获取到第一关联程度集，通过分析两个目标IP对应的用户列表的相似性，来表征对应的两个目标IP之间的关联程度，提高了IP之间的关联关系的表征准确性；根据每一目标用户对应的IP列表和第一关联程度集，获取到任意两个目标用户之间的第二关联程度，进而获取到第二关联程度集，根据第二关联程度集和预设的关联程度阈值，获取到每一目标用户对应的关联用户列表，进一步综合考虑了目标IP和目标用户之间的连接关系，以及目标IP之间的关联关系对目标用户之间的关联关系的影响，提高了获取到的第二关联程度的准确性，进而提高了用户扩线的准确性。

实施例二

本实施例二提供了一种用于用户扩线的数据处理装置，所述装置包括，如图3所示：

数据获取模块31，用于获取到每一目标IP对应的用户列表和每一目标用户对应的IP列表，其中，用户列表中包括若干个目标用户的ID，IP列表中包括若干个目标IP；

第一关联程度获取模块32，用于根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的第一关联程度，进而获取到第一关联程度集；

第二关联程度获取模块33，用于根据每一目标用户对应的IP列表和第一关联程度集，获取到任意两个目标用户之间的第二关联程度，进而获取到第二关联程度集；

关联用户获取模块34，用于根据第二关联程度集和预设的关联程度阈值，获取到每一目标用户对应的关联用户列表。

在一具体实施方式中，上述第一关联程度获取模块32还包括如下子模块：

第一交并集获取子模块，用于根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的用户交集和用户并集；

第一用户数量获取子模块，用于根据用户交集获取到第一用户数量；

第二用户数量获取子模块，用于根据用户并集获取到第二用户数量；

第一关联程度获取子模块，用于将第一用户数量和第二用户数量的比值，确定为任意两个目标IP之间的第一关联程度。

在一具体实施方式中，上述第二关联程度获取模块33还包括如下子模块：

第二交并集获取子模块，用于根据每一目标用户对应的IP列表，获取到任意两个目标用户之间的IP交集和IP并集；

第一权重获取子模块，用于根据第一关联程度集，获取到IP交集中每一目标IP对应的第一权重；

IP数量获取子模块，用于根据IP并集获取到IP数量；

第二关联程度获取子模块，用于计算IP交集中所有目标IP对应的第一权重之和，将第一权重之和与IP数量的比值，确定为任意两个目标用户之间的第二关联程度。

在一具体实施方式中，上述第一权重获取子模块还包括如下单元：

IP分类单元，用于将IP交集中的任一目标IP作为待处理IP，将IP交集中除待处理IP的其他目标IP作为候选IP；

第一均值计算单元，用于根据第一关联程度集，获取到待处理IP与任意候选IP之间的第一关联程度，并计算待处理IP与所有候选IP之间的第一关联程度的均值；

第一权重确定单元，用于将第一关联程度的均值确定为待处理IP对应的第一权重；

IP遍历单元，用于遍历IP交集中的每一目标IP，获取到IP交集中每一目标IP对应的第一权重。

在一具体实施方式中，所述装置还包括如下模块，如图4所示：

第三关联程度获取模块35，用于根据每一目标IP对应的用户列表和第二关联程度集，更新第一关联程度，获取到任意两个目标IP之间的第三关联程度，进而获取到第三关联程度集；

第四关联程度获取模块36，用于根据每一目标用户对应的IP列表和第三关联程度集，更新第二关联程度，获取到任意两个目标用户之间的第四关联程度，进而获取到第四关联程度集；

关联用户列表更新模块37，用于根据第四关联程度集和预设的关联程度阈值，获取到每一目标用户对应的更新后的关联用户列表。

在一具体实施方式中，上述第三关联程度获取模块35还包括如下子模块：

第二权重获取子模块，用于根据第二关联程度集，获取到用户交集中每一目标用户对应的第二权重；

第三关联程度获取子模块，用于计算用户交集中所有目标用户对应的第二权重之和，将第二权重之和与第二用户数量的比值，确定为任意两个目标用户之间的第三关联程度。

在一具体实施方式中，上述第四关联程度获取模块36还包括如下子模块：

第三权重获取子模块，用于根据第三关联程度集，获取到IP交集中每一目标IP对应的第三权重；

第四关联程度获取子模块，用于计算IP交集中所有目标IP对应的第三权重之和，将第三权重之和与IP数量的比值，确定为任意两个目标用户之间的第四关联程度。

需要说明的是，上述模块之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

实施例三

本发明实施例三提供一种非瞬时性计算机可读存储介质，该非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序，至少一条指令或至少一段程序由处理器加载并执行以实现步骤：

S100，获取到每一目标IP对应的用户列表和每一目标用户对应的IP列表。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器，存储，数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（ROM），可编程ROM（PROM），电可编程ROM（EPROM），电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM（SRAM），动态RAM（DRAM），同步DRAM（SDRAM），双数据率SDRAM（DDRSDRAM），增强型SDRAM（ESDRAM），同步链路（Synchlink）DRAM（SLDRAM），存储器总线（Rambus）直接RAM（RDRAM），直接存储器总线动态RAM（DRDRAM），以及存储器总线动态RAM（RDRAM）等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元，模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元，模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

实施例四

本发明实施例四提供一种电子设备，该电子设备包括处理器和本发明实施例三中的非瞬时性计算机可读存储介质。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明，任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改，等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种用于用户扩线的数据处理方法，其特征在于，所述方法包括如下步骤：

获取到每一目标IP对应的用户列表和每一目标用户对应的IP列表，其中，所述用户列表中包括若干个目标用户的ID，所述IP列表中包括若干个目标IP；

根据每一目标用户对应的IP列表和所述第一关联程度集，获取到任意两个目标用户之间的第二关联程度，进而获取到第二关联程度集；

根据所述第二关联程度集和预设的关联程度阈值，获取到每一目标用户对应的关联用户列表。

2.根据权利要求1所述的用于用户扩线的数据处理方法，其特征在于，在根据每一目标IP对应的用户列表，获取到任意两个目标IP之间的第一关联程度的步骤中还包括如下步骤：

根据所述用户交集获取到第一用户数量；

根据所述用户并集获取到第二用户数量；

将所述第一用户数量和所述第二用户数量的比值，确定为所述任意两个目标IP之间的第一关联程度。

3.根据权利要求2所述的用于用户扩线的数据处理方法，其特征在于，在根据每一目标用户对应的IP列表和所述第一关联程度集，获取到任意两个目标用户之间的第二关联程度的步骤中还包括如下步骤：

根据所述第一关联程度集，获取到所述IP交集中每一目标IP对应的第一权重；

根据所述IP并集获取到IP数量；

计算所述IP交集中所有目标IP对应的第一权重之和，将所述第一权重之和与所述IP数量的比值，确定为所述任意两个目标用户之间的第二关联程度。

4.根据权利要求3所述的用于用户扩线的数据处理方法，其特征在于，在根据所述第一关联程度集，获取到所述IP交集中每一目标IP对应的第一权重的步骤中还包括如下步骤：

将所述IP交集中的任一目标IP作为待处理IP，将所述IP交集中除所述待处理IP的其他目标IP作为候选IP；

根据所述第一关联程度集，获取到所述待处理IP与任意候选IP之间的第一关联程度，并计算所述待处理IP与所有候选IP之间的第一关联程度的均值；

将所述第一关联程度的均值确定为所述待处理IP对应的第一权重；

遍历所述IP交集中的每一目标IP，获取到所述IP交集中每一目标IP对应的第一权重。

5.根据权利要求3所述的用于用户扩线的数据处理方法，其特征在于，所述方法还包括如下步骤：

根据每一目标IP对应的用户列表和所述第二关联程度集，更新所述第一关联程度，获取到任意两个目标IP之间的第三关联程度，进而获取到第三关联程度集；

根据每一目标用户对应的IP列表和所述第三关联程度集，更新所述第二关联程度，获取到任意两个目标用户之间的第四关联程度，进而获取到第四关联程度集；

根据所述第四关联程度集和所述预设的关联程度阈值，获取到每一目标用户对应的更新后的关联用户列表。

6.根据权利要求5所述的用于用户扩线的数据处理方法，其特征在于，在根据每一目标IP对应的用户列表和所述第二关联程度集，更新所述第一关联程度，获取到任意两个目标IP之间的第三关联程度的步骤中还包括如下步骤：

根据所述第二关联程度集，获取到所述用户交集中每一目标用户对应的第二权重；

计算所述用户交集中所有目标用户对应的第二权重之和，将所述第二权重之和与所述第二用户数量的比值，确定为所述任意两个目标用户之间的第三关联程度。

7.根据权利要求6所述的用于用户扩线的数据处理方法，其特征在于，在根据每一目标用户对应的IP列表和所述第三关联程度集，更新所述第二关联程度，获取到任意两个目标用户之间的第四关联程度的步骤中还包括如下步骤：

根据所述第三关联程度集，获取到所述IP交集中每一目标IP对应的第三权重；

计算所述IP交集中所有目标IP对应的第三权重之和，将所述第三权重之和与所述IP数量的比值，确定为所述任意两个目标用户之间的第四关联程度。

8.一种用于用户扩线的数据处理装置，其特征在于，所述装置包括：

数据获取模块，用于获取到每一目标IP对应的用户列表和每一目标用户对应的IP列表，其中，所述用户列表中包括若干个目标用户的ID，所述IP列表中包括若干个目标IP；

第二关联程度获取模块，用于根据每一目标用户对应的IP列表和所述第一关联程度集，获取到任意两个目标用户之间的第二关联程度，进而获取到第二关联程度集；

关联用户获取模块，用于根据所述第二关联程度集和预设的关联程度阈值，获取到每一目标用户对应的关联用户列表。

9.一种非瞬时性计算机可读存储介质，所述非瞬时性计算机可读存储介质中存储有至少一条指令或至少一段程序，其特征在于，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-7中任意一项所述的用于用户扩线的数据处理方法。

10.一种电子设备，其特征在于，包括处理器和权利要求9中所述的非瞬时性计算机可读存储介质。