CN110891097B - 一种跨设备用户识别方法及装置 - Google Patents
一种跨设备用户识别方法及装置 Download PDFInfo
- Publication number
- CN110891097B CN110891097B CN201911228993.7A CN201911228993A CN110891097B CN 110891097 B CN110891097 B CN 110891097B CN 201911228993 A CN201911228993 A CN 201911228993A CN 110891097 B CN110891097 B CN 110891097B
- Authority
- CN
- China
- Prior art keywords
- time interval
- determining
- address
- equipment
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/695—Types of network addresses using masks or ranges of addresses
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/50—Address allocation
- H04L61/5061—Pools of addresses
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer And Data Communications (AREA)
Abstract
本申请提供了一种跨设备用户识别方法及装置,包括:基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合;访问日志中包含第一设备或第二设备访问的IP地址以及访问IP地址的时间;针对每一个时间区间内、每一个网际互联协议IP地址对应的第一设备集合中的每一个第一设备,确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合,目标第二设备集合中包括关联设备;基于第一设备在不同第一设备集合中对应的关联设备,从关联设备中确定选定设备,选定设备与第一设备属于同一用户。
Description
技术领域
本申请涉及计算机技术领域,尤其是涉及一种跨设备用户识别方法及装置。
背景技术
随着互联网技术的发展,电脑、智能手机、Pad、智能电视以及移动可穿戴设备等多种电子设备的出现,用户访问的社交平台越来越多,各个社交平台之间的信息互不相同,这就导致无法识别哪些设备的用户为同一用户,从而在资源分配或信息投放时,为同一用户的多个设备重复分配资源或者投放信息,从而导致资源信息的浪费。
发明内容
有鉴于此,本申请的目的在于提供一种跨设备用户识别方法及装置。
第一方面,本申请实施例提供了一种跨设备用户识别方法,包括:
基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合;所述访问日志中包含第一设备或第二设备访问的IP地址以及访问IP地址的时间;
针对每一个时间区间内、每一个网际互联协议IP地址对应的第一设备集合中的每一个第一设备,确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合,所述目标第二设备集合中包括关联设备;
基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,所述选定设备与所述第一设备属于同一用户。
一种可能的实施方式中,所述基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合,包括:
基于每一个第一设备在预设时间段内的访问日志,确定所述第一设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;以及,
基于每一个第二设备在预设时间段内的访问日志,确定所述第二设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;
针对每一个IP地址,基于所述第一设备访问每一个IP地址的时间信息、以及所述第二设备访问每一个IP地址的时间信息,确定在每个时间区间内的访问该IP地址的第一设备集合和第二设备集合。
一种可能的实施方式中,在确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合之前,所述方法,还包括:
确定每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合所包含的第一设备的数量、以及第二设备集合中所包含的第二设备的数量;
将所述第一设备的数量或第二设备的数量超过预设值的设备集合所对应的时间区间确定为目标时间区间,并删除所述目标时间区间内的第一设备集合以及第二设备集合。
一种可能的实施方式中,基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,包括:
确定每一个第一设备在不同第一设备集合中对应的关联设备的并集,并将所述并集中出现次数最多的关联设备确定为目标关联设备,并将所述目标关联设备确定为所述选定设备。
一种可能的实施方式中,所述方法还包括:
分别计算所述第一设备与所述关联设备之间的评价系数;所述评价系数用于表示所述第一设备和关联设备属于同一个用户的可能性。
一种可能的实施方式中,所述基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,包括:
基于所述第一设备在不同第一设备集合中的关联设备、以及所述第一设备与每一个关联设备之间的评价系数,从所述关联设备中确定选定设备。
一种可能的实施方式中,按照以下方法计算所述第一设备与所述目标第二设备集合中的每一个第二设备之间的评价系数:
确定每一个关联时间区间与所述第一设备所在的时间区间之间的时间差,并确定与所述时间差相对应的关联权重;所述关联权重能用于表示所述关联时间区间与所述第一设备所在的时间区间之间的存在同一用户的可能性;
将所述第一设备所在时间区间与所述目标第二设备集合所在的时间区间之间的关联权重,确定为所述第一设备与所述关联设备之间的评价系数。
一种可能的实施方式中,在确定出的所述目标关联设备为多个的情况下,按照以下方法确定所述选定设备:
将与所述第一设备之间的评价系数最大的目标关联设备确定为选定设备。
第二方面,本申请实施例还提供一种跨设备用户识别装置,包括:
第一确定模块,用于基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合;所述访问日志中包含第一设备或第二设备访问的IP地址以及访问IP地址的时间;
第二确定模块,用于针对每一个时间区间内、每一个网际互联协议IP地址对应的第一设备集合中的每一个第一设备,确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合,所述目标第二设备集合中包括关联设备;
筛选模块,用于基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,所述选定设备与所述第一设备属于同一用户。
一种可能的实施方式中,所述第一确定模块,在基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合时,具体用于:
基于每一个第一设备在预设时间段内的访问日志,确定所述第一设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;以及,
基于每一个第二设备在预设时间段内的访问日志,确定所述第二设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;
针对每一个IP地址,基于所述第一设备访问每一个IP地址的时间信息、以及所述第二设备访问每一个IP地址的时间信息,确定在每个时间区间内的访问该IP地址的第一设备集合和第二设备集合。
一种可能的实施方式中,所述第二确定模块,在确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合之前,还用于:
确定每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合所包含的第一设备的数量、以及第二设备集合中所包含的第二设备的数量;
将所述第一设备的数量或第二设备的数量超过预设值的设备集合所对应的时间区间确定为目标时间区间,并删除所述目标时间区间内的第一设备集合以及第二设备集合。
一种可能的实施方式中,所述筛选模块,在基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备时,用于:
确定每一个第一设备在不同第一设备集合中对应的关联设备的并集,并将所述并集中出现次数最多的关联设备确定为目标关联设备,并将所述目标关联设备确定为所述选定设备。
一种可能的实施方式中,所述装置还包括:
计算模块,用于分别计算所述第一设备与所述关联设备之间的评价系数;所述评价系数用于表示所述第一设备和关联设备属于同一个用户的可能性。
一种可能的实施方式中,所述筛选模块,在基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备时,用于:
基于所述第一设备在不同第一设备集合中的关联设备、以及所述第一设备与每一个关联设备之间的评价系数,从所述关联设备中确定选定设备。
一种可能的实施方式中,所述计算模块,用于按照以下方法计算所述第一设备与所述目标第二设备集合中的每一个第二设备之间的评价系数:
确定每一个关联时间区间与所述第一设备所在的时间区间之间的时间差,并确定与所述时间差相对应的关联权重;所述关联权重能用于表示所述关联时间区间与所述第一设备所在的时间区间之间的存在同一用户的可能性;
将所述第一设备所在时间区间与所述目标第二设备集合所在的时间区间之间的关联权重,确定为所述第一设备与所述关联设备之间的评价系数。
一种可能的实施方式中,在确定出的目标关联设备为多个的情况下,所述筛选模块,还用于按照以下方法确定所述选定设备:
将与所述第一设备之间的评价系数最大的目标关联设备确定为选定设备。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面的任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面的任一种可能的实施方式中的步骤。
本申请实施例提供的跨设备用户识别方法及装置,可以基于第一设备和第二设备访问的IP地址以及访问每一个IP地址的时间,确定与每个第一设备相关联的关联设备,并基于第一设备在不同第一设备集合中对应的关联设备,筛选选定设备。基于这种方法,无需对用户的其他操作行为进行分析,提高了跨设备用户识别的效率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种跨设备用户识别方法的流程示意图;
图2示出了本申请实施例所提供的评价系数计算方法的流程图;
图3示出了本申请实施例所提供的一种跨设备用户识别装置的架构示意图;
图4示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
相关技术中,在进行跨设备用户识别时,一种是基于账号信息进行识别,例如同时通过同一个账号登录不同的应用软件,这种情况下可以直接根据账号信息确定用户身份,但是并非所有的应用软件之间的账号都是可以共享的,例如软件A和软件B都可以通过微信登录,但是软件C无法通过微信登录,则对于软件C的用户,无法识别其是否与软件A和软件B的用户是否为同一人。
另外一种方法是通过神经网络模型,获取用户在不同社交软件的操作行为,然后通过训练好的神经网络模型基于获取的不同社交软件的操作行为对用户身份进行预测,然而因为用户在不同社交软件上的操作行为的类型可能不同,这就导致无法通过一个神经网络来对所有社交软件的操作行为进行预测,没有普遍适用性。
本方案提供了一种跨设备用户识别方法,可以通过第一设备和第二设备访问的IP地址以及访问每一个IP地址的时间,确定与每个第一设备相关联的关联设备,并基于第一设备在不同第一设备集合中对应的关联设备,筛选选定设备。基于这种方法,无需对用户的其他操作行为进行分析,提高了跨设备用户识别的效率。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种跨设备用户识别方法进行详细介绍。
参见图1所示,为本公开实施例所提供的一种跨设备用户识别方法的流程示意图,包括以下几个步骤:
步骤101、基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合。
其中,访问日志中包含第一设备或第二设备访问的IP地址以及访问IP地址的时间。
第一设备和第二设备的设备类型可以是以下设备中的任意一种,但第一设备和第二设备的设备类型可以不同:
平板电脑、手机、互联网电视(Over-The-Top TV,OTT TV),个人计算机(PersonalComputer,PC)。
第一设备的访问日志中记载有第一设备访问的IP地址,以及第一设备访问每一个IP地址的时间,第二设备的访问日志中记载有第二设备访问的IP地址,以及第二设备访问每一个IP地址的时间;具体实施中,可以基于每一个第一设备在预设时间段内的访问日志,确定第一设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;以及,基于每一个第二设备在预设时间段内的访问日志,确定第二设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;然后针对每一个IP地址,基于所述第一设备访问每一个IP地址的时间信息、以及所述第二设备访问每一个IP地址的时间信息,确定在每个时间区间内的访问该IP地址的第一设备集合和第二设备集合。
示例性的,若预设时间段为2019年8月10日至2019年8月17日,时间区间为1天,则可以确定第一设备和第二设备在2019年8月10日至2019年8月17日期间访问的所有的IP地址,针对每一个IP地址,可以确定每一天访问该IP地址的第一设备集合和第二设备集合,若第一设备和第二设备共访问了N个IP地址,则针对每一个IP地址,可以确定在2019年8月10日至2019年8月17日期间的每一天内的第一设备集合以及第二设备集合,因此,对于每一个IP地址,可以确定7个第一设备集合,和7个第二设备集合。
步骤102、针对每一个时间区间内、每一个网际互联协议IP地址对应的第一设备集合中的每一个第一设备,确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合,目标第二设备集合中包括关联设备。
考虑到许多公共的IP访问的第一设备和第二设备比较多,在进行跨设备用户识别时,公共IP的数据可能会导致最终结果不准确,因此,在一种可能的实施方式中,在确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合之前,还可以先确定每一个时间区间中每一个IP地址对应的第一设备集合所包含的第一设备的数量、第二设备集合所包含的第二设备的数量,并将第一设备的数量或第二设备的数量超过预设值的设备集合所对应的时间区间确定为目标时间区间,并删除目标时间区间的第一设备集合和第二设备集合。
示例性的,2019年8月10日至2019年8月17日,IP地址为10.0.0.1在2019年8月16日对应的第一设备集合中包含的第一设备的数量为200个,第二设备集合中包含的第二设备的数量为800个,预设值为300,则将2019年8月16日IP地址为10.0.0.1对应的第一设备集合和第二设备集合进行删除。
其中,与第一设备所在的时间区间相关联的关联时间区间可以是距离第一设备所在的时间区间小于预设时长的时间区间,例如若第一设备所在的时间区间为2019年10月10日,预设时长为3天,则与第一设备所在的时间区间相关联的关联时间区间可以为2019年10月7日-2019年10月13日,在2019年10月7日-2019年10月13日内的所有第一设备访问的IP地址所对应的第二设备集合为目标第二设备集合。
步骤103、基于第一设备在不同第一设备集合中对应的关联设备,从关联设备中确定选定设备,选定设备与第一设备属于同一用户。
在基于第一设备在不同第一设备集合中对应的关联设备,从关联设备中确定选定设备时,可以确定每一第一设备在不同第一设备集合中对应的关联设备的并集,并将并集中出现次数最多的关联设备确定为目标关联设备,并将目标关联设备确定为选定设备。
具体的,同一个第一设备可能在不同的时间访问同一个IP地址,同一个IP地址对应的第一设备集合为根据时间划分的,因此,第一设备可能在同一个IP地址对应的不同时间的第一设备集合中,在每一个第一设备集合中,第一设备集合都有其对应的关联设备。
示例性的,第一设备A在第一设备集合1中所对应的关联设备为第二设备1、第二设备2、第二设备3,第一设备A在第一设备集合2所对应的关联设备为第二设备1,第二设备3,第二设备4,第一设备A在第一设备集合3所对应的关联设备为第二设备1,第二设备8,则在确定第一设备A在不同第一设备集合中对应的关联设备的并集中,包括第二设备1、第二设备2、第二设备3、第二设备1,第二设备3,第二设备4、第二设备1,第二设备8,其中,第二设备1在并集中出现次数为3,第二设备2在并集中出现次数为1,第二设备3在并集中出现次数为2,第二设备4在并集中出现次数为1,第二设备8在并集中出现次数为1,因此,第二设备1是在并集中出现次数最多的,第二设备1位第一设备A的目标关联设备。
具体实施过程中,在确定目标关联设备时,可能确定出多个目标关联设备,在这种情况下,还可以分别计算第一设备和关联设备之间的评价系数,评价系数用于表示第一设备和关联设备属于同一个用户的可能性,然后基于第一设备在不同第一设备集合中的关联设备、以及第一设备与每一个关联设备之间的评价系数,从关联设备中确定选定设备。
在一种可能的实施方式中,在计算第一设备与目标第二设备集合中的每一个第二设备之间的评价系数时,可以参照如图2所示的方法,包括以下几个步骤:
步骤201、确定每一个关联时间区间与第一设备所在的时间区间之间的时间差,并确定与时间差相对应的关联权重;关联权重能用于表示关联时间区间与第一设备所在的时间区间之间的存在同一用户的可能性。
步骤202、将第一设备所在时间区间与目标第二设备集合所在的时间区间之间的关联权重,确定为第一设备与关联设备之间的评价系数。
在确定出的目标关联设备为多个的情况下,可以将与第一设备之间的评价系数最大的目标关联设备确定为选定设备。
本申请实施例提供的跨设备用户识别方法,可以基于第一设备和第二设备访问的IP地址以及访问每一个IP地址的时间,确定与每个第一设备相关联的关联设备,并基于第一设备在不同第一设备集合中对应的关联设备,筛选选定设备。基于这种方法,无需对用户的其他操作行为进行分析,提高了跨设备用户识别的效率。
基于相同的构思,本公开实施例还提供了一种跨设备用户识别装置,参见图3所示,为本公开实施例所提供的一种跨设备用户识别装置的架构示意图,包括第一确定模块301、第二确定模块302、筛选模块303、以及计算模块304,具体的:
第一确定模块301,用于基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合;所述访问日志中包含第一设备或第二设备访问的IP地址以及访问IP地址的时间;
第二确定模块302,用于针对每一个时间区间内、每一个网际互联协议IP地址对应的第一设备集合中的每一个第一设备,确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合,所述目标第二设备集合中包括关联设备;
筛选模块303,用于基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,所述选定设备与所述第一设备属于同一用户。
一种可能的实施方式中,所述第一确定模块301,在基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合时,具体用于:
基于每一个第一设备在预设时间段内的访问日志,确定所述第一设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;以及,
基于每一个第二设备在预设时间段内的访问日志,确定所述第二设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;
针对每一个IP地址,基于所述第一设备访问每一个IP地址的时间信息、以及所述第二设备访问每一个IP地址的时间信息,确定在每个时间区间内的访问该IP地址的第一设备集合和第二设备集合。
一种可能的实施方式中,所述第二确定模块302,在确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合之前,还用于:
确定每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合所包含的第一设备的数量、以及第二设备集合中所包含的第二设备的数量;
将所述第一设备的数量或第二设备的数量超过预设值的设备集合所对应的时间区间确定为目标时间区间,并删除所述目标时间区间内的第一设备集合以及第二设备集合。
一种可能的实施方式中,所述筛选模块303,在基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备时,用于:
确定每一个第一设备在不同第一设备集合中对应的关联设备的并集,并将所述并集中出现次数最多的关联设备确定为目标关联设备,并将所述目标关联设备确定为所述选定设备。
一种可能的实施方式中,所述装置还包括:
计算模块304,用于分别计算所述第一设备与所述关联设备之间的评价系数;所述评价系数用于表示所述第一设备和关联设备属于同一个用户的可能性。
一种可能的实施方式中,所述筛选模块303,在基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备时,用于:
基于所述第一设备在不同第一设备集合中的关联设备、以及所述第一设备与每一个关联设备之间的评价系数,从所述关联设备中确定选定设备。
一种可能的实施方式中,所述计算模块304,用于按照以下方法计算所述第一设备与所述目标第二设备集合中的每一个第二设备之间的评价系数:
确定每一个关联时间区间与所述第一设备所在的时间区间之间的时间差,并确定与所述时间差相对应的关联权重;所述关联权重能用于表示所述关联时间区间与所述第一设备所在的时间区间之间的存在同一用户的可能性;
将所述第一设备所在时间区间与所述目标第二设备集合所在的时间区间之间的关联权重,确定为所述第一设备与所述关联设备之间的评价系数。
一种可能的实施方式中,在确定出的目标关联设备为多个的情况下,所述筛选模块303,还用于按照以下方法确定所述选定设备:
将与所述第一设备之间的评价系数最大的目标关联设备确定为选定设备。
基于同一技术构思,本申请实施例还提供了一种电子设备。参照图4所示,为本申请实施例提供的电子设备的结构示意图,包括处理器401、存储器402、和总线403。其中,存储器402用于存储执行指令,包括内存4021和外部存储器4022;这里的内存4021也称内存储器,用于暂时存放处理器401中的运算数据,以及与硬盘等外部存储器4022交换的数据,处理器401通过内存4021与外部存储器4022进行数据交换,当电子设备400运行时,处理器401与存储器402之间通过总线403通信,使得处理器401在执行以下指令:
基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合;所述访问日志中包含第一设备或第二设备访问的IP地址以及访问IP地址的时间;
针对每一个时间区间内、每一个网际互联协议IP地址对应的第一设备集合中的每一个第一设备,确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合,所述目标第二设备集合中包括关联设备;
基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,所述选定设备与所述第一设备属于同一用户。
一种可能的设计中,处理器401执行的指令中,所述基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合,包括:
基于每一个第一设备在预设时间段内的访问日志,确定所述第一设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;以及,
基于每一个第二设备在预设时间段内的访问日志,确定所述第二设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;
针对每一个IP地址,基于所述第一设备访问每一个IP地址的时间信息、以及所述第二设备访问每一个IP地址的时间信息,确定在每个时间区间内的访问该IP地址的第一设备集合和第二设备集合。
一种可能的设计中,处理器401执行的指令中,在确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合之前,所述方法,还包括:
确定每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合所包含的第一设备的数量、以及第二设备集合中所包含的第二设备的数量;
将所述第一设备的数量或第二设备的数量超过预设值的设备集合所对应的时间区间确定为目标时间区间,并删除所述目标时间区间内的第一设备集合以及第二设备集合。
一种可能的设计中,处理器401执行的指令中,基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,包括:
确定每一个第一设备在不同第一设备集合中对应的关联设备的并集,并将所述并集中出现次数最多的关联设备确定为目标关联设备,并将所述目标关联设备确定为所述选定设备。
一种可能的设计中,处理器401执行的指令中,所述方法还包括:
分别计算所述第一设备与所述关联设备之间的评价系数;所述评价系数用于表示所述第一设备和关联设备属于同一个用户的可能性。
一种可能的设计中,处理器401执行的指令中,所述基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,包括:
基于所述第一设备在不同第一设备集合中的关联设备、以及所述第一设备与每一个关联设备之间的评价系数,从所述关联设备中确定选定设备。
一种可能的设计中,处理器401执行的指令中,按照以下方法计算所述第一设备与所述目标第二设备集合中的每一个第二设备之间的评价系数:
确定每一个关联时间区间与所述第一设备所在的时间区间之间的时间差,并确定与所述时间差相对应的关联权重;所述关联权重能用于表示所述关联时间区间与所述第一设备所在的时间区间之间的存在同一用户的可能性;
将所述第一设备所在时间区间与所述目标第二设备集合所在的时间区间之间的关联权重,确定为所述第一设备与所述关联设备之间的评价系数。
一种可能的设计中,处理器401执行的指令中,在确定出的所述目标关联设备为多个的情况下,按照以下方法确定所述选定设备:
将与所述第一设备之间的评价系数最大的目标关联设备确定为选定设备。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任一实施例中所述的跨设备用户识别方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述跨设备用户识别方法的步骤。
本申请实施例所提供的进行跨设备用户识别方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (11)
1.一种跨设备用户识别方法,其特征在于,包括:
基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合;所述访问日志中包含第一设备或第二设备访问的IP地址以及访问IP地址的时间;
针对每一个时间区间内、每一个网际互联协议IP地址对应的第一设备集合中的每一个第一设备,确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合,所述目标第二设备集合中包括关联设备;
基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,所述选定设备与所述第一设备属于同一用户。
2.根据权利要求1所述的方法,其特征在于,所述基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合,包括:
基于每一个第一设备在预设时间段内的访问日志,确定所述第一设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;以及,
基于每一个第二设备在预设时间段内的访问日志,确定所述第二设备访问的至少一个IP地址,以及访问每一个IP地址的时间信息;
针对每一个IP地址,基于所述第一设备访问每一个IP地址的时间信息、以及所述第二设备访问每一个IP地址的时间信息,确定在每个时间区间内的访问该IP地址的第一设备集合和第二设备集合。
3.根据权利要求1所述的方法,其特征在于,在确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合之前,所述方法,还包括:
确定每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合所包含的第一设备的数量、以及第二设备集合中所包含的第二设备的数量;
将所述第一设备的数量或第二设备的数量超过预设值的设备集合所对应的时间区间确定为目标时间区间,并删除所述目标时间区间内的第一设备集合以及第二设备集合。
4.根据权利要求1所述的方法,其特征在于,基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,包括:
确定每一个第一设备在不同第一设备集合中对应的关联设备的并集,并将所述并集中出现次数最多的关联设备确定为目标关联设备,并将所述目标关联设备确定为所述选定设备。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
分别计算所述第一设备与所述关联设备之间的评价系数;所述评价系数用于表示所述第一设备和关联设备属于同一个用户的可能性。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,包括:
基于所述第一设备在不同第一设备集合中的关联设备、以及所述第一设备与每一个关联设备之间的评价系数,从所述关联设备中确定选定设备。
7.根据权利要求5所述的方法,其特征在于,按照以下方法计算所述第一设备与所述目标第二设备集合中的每一个第二设备之间的评价系数:
确定每一个关联时间区间与所述第一设备所在的时间区间之间的时间差,并确定与所述时间差相对应的关联权重;所述关联权重能用于表示所述关联时间区间与所述第一设备所在的时间区间之间的存在同一用户的可能性;
将所述第一设备所在时间区间与所述目标第二设备集合所在的时间区间之间的关联权重,确定为所述第一设备与所述关联设备之间的评价系数。
8.根据权利要求7所述的方法,其特征在于,在确定出的所述目标关联设备为多个的情况下,按照以下方法确定所述选定设备:
将与所述第一设备之间的评价系数最大的目标关联设备确定为选定设备。
9.一种跨设备用户识别装置,其特征在于,包括:
第一确定模块,用于基于获取的至少一个第一设备和至少一个第二设备的访问日志,确定预设时间范围内、每一个时间区间中每一个网际互联协议IP地址对应的第一设备集合、以及第二设备集合;所述访问日志中包含第一设备或第二设备访问的IP地址以及访问IP地址的时间;
第二确定模块,用于针对每一个时间区间内、每一个网际互联协议IP地址对应的第一设备集合中的每一个第一设备,确定与第一设备所在的时间区间相关联的关联时间区间,以及关联时间区间所对应的目标第二设备集合,所述目标第二设备集合中包括关联设备;
筛选模块,用于基于所述第一设备在不同第一设备集合中对应的关联设备,从所述关联设备中确定选定设备,所述选定设备与所述第一设备属于同一用户。
10.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至8任一所述的跨设备用户识别方法的步骤。
11.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至8任一所述的跨设备用户识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911228993.7A CN110891097B (zh) | 2019-12-04 | 2019-12-04 | 一种跨设备用户识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911228993.7A CN110891097B (zh) | 2019-12-04 | 2019-12-04 | 一种跨设备用户识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110891097A CN110891097A (zh) | 2020-03-17 |
CN110891097B true CN110891097B (zh) | 2022-05-17 |
Family
ID=69750389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911228993.7A Active CN110891097B (zh) | 2019-12-04 | 2019-12-04 | 一种跨设备用户识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110891097B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111930995B (zh) * | 2020-08-18 | 2023-12-22 | 湖南快乐阳光互动娱乐传媒有限公司 | 数据处理方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106547800A (zh) * | 2015-09-23 | 2017-03-29 | 北京国双科技有限公司 | 跨设备同步用户行为的方法及装置 |
CN108197190A (zh) * | 2017-12-26 | 2018-06-22 | 北京秒针信息咨询有限公司 | 一种用户识别的方法和装置 |
US10423985B1 (en) * | 2015-02-09 | 2019-09-24 | Twitter, Inc. | Method and system for identifying users across mobile and desktop devices |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10187482B2 (en) * | 2014-05-21 | 2019-01-22 | Oath (Americas) Inc. | Systems and methods for matching online users across devices |
US9864999B2 (en) * | 2015-04-30 | 2018-01-09 | Yahoo Holdings, Inc. | Method for identifying multiple devices belonging to the same group |
US11184449B2 (en) * | 2016-07-19 | 2021-11-23 | Adobe Inc. | Network-based probabilistic device linking |
-
2019
- 2019-12-04 CN CN201911228993.7A patent/CN110891097B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10423985B1 (en) * | 2015-02-09 | 2019-09-24 | Twitter, Inc. | Method and system for identifying users across mobile and desktop devices |
CN106547800A (zh) * | 2015-09-23 | 2017-03-29 | 北京国双科技有限公司 | 跨设备同步用户行为的方法及装置 |
CN108197190A (zh) * | 2017-12-26 | 2018-06-22 | 北京秒针信息咨询有限公司 | 一种用户识别的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110891097A (zh) | 2020-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106960143B (zh) | 用户账号的识别方法及装置、存储介质、电子设备 | |
CN113489713B (zh) | 网络攻击的检测方法、装置、设备及存储介质 | |
CN114095567B (zh) | 数据访问请求的处理方法、装置、计算机设备及介质 | |
CN110474900B (zh) | 一种游戏协议测试方法及装置 | |
CN108804230B (zh) | 一种根据pci设备的类型分配资源的方法、装置及介质 | |
CN109783385B (zh) | 一种产品测试方法和装置 | |
CN110519263B (zh) | 防刷量方法、装置、设备及计算机可读存储介质 | |
TWI701932B (zh) | 一種身份認證方法、伺服器及用戶端設備 | |
CN112511535A (zh) | 一种设备检测方法、装置、设备及存储介质 | |
CN111338958A (zh) | 一种测试用例的参数生成方法、装置及终端设备 | |
CN106789837A (zh) | 网络异常行为检测方法及检测装置 | |
CN114329469A (zh) | Api异常调用行为检测方法、装置、设备及存储介质 | |
CN108270753B (zh) | 注销用户账号的方法及装置 | |
CN110891097B (zh) | 一种跨设备用户识别方法及装置 | |
CN114281260A (zh) | 应用于分布式存储系统的存储方法、装置、设备及介质 | |
CN111951114B (zh) | 一种任务执行方法、装置、电子设备及可读存储介质 | |
CN112613974B (zh) | 一种风险预警方法、装置、设备及可读存储介质 | |
CN112650614A (zh) | 调用链监控方法、装置、电子设备及存储介质 | |
CN114697440A (zh) | 网络管理方法及移动终端 | |
CN116362750A (zh) | 数据筛选方法、装置、电子设备及存储介质 | |
CN115455414A (zh) | 一种安全检测方法和装置 | |
CN114124524A (zh) | 一种云平台权限设置方法、装置、终端设备及存储介质 | |
CN115129809A (zh) | 用户活跃度的确定方法、装置、电子设备及存储介质 | |
CN112836971A (zh) | 配额资源的确定方法和装置、电子设备和存储介质 | |
CN106815001B (zh) | 配置文件信息的检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |