CN110968785B - 目标帐号的识别方法和装置、存储介质及电子装置 - Google Patents
目标帐号的识别方法和装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN110968785B CN110968785B CN201911176909.1A CN201911176909A CN110968785B CN 110968785 B CN110968785 B CN 110968785B CN 201911176909 A CN201911176909 A CN 201911176909A CN 110968785 B CN110968785 B CN 110968785B
- Authority
- CN
- China
- Prior art keywords
- account
- current
- mapping
- time length
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
Abstract
本发明公开了一种目标帐号的识别方法和装置、存储介质及电子装置。其中,该方法包括:获取不同类型的第一帐号集合和第二帐号集合,第一帐号集合包括第一帐号;根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,获取不同类型的第一帐号与第二帐号集合中的每个帐号之间的映射置信度,将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号。本发明解决了现有技术中,获取用户的帐号之间映射类型单一,以及确定用户的账号之间映射关系准确性较低的技术问题。
Description
技术领域
本发明涉及数据处理领域,具体而言,涉及一种目标帐号的识别方法和装置、存储介质及电子装置。
背景技术
随着互联网的发展,用户无时无刻不在线上及线下产生各种行为,而对用户的标识也有诸多形式,比如登录态的QQ帐号、微信号、手机号、邮箱等,以及非登录态时从底层设备获取的IMEI/IDFA/MAC等,将用户的多个账号进行融合,确定出用户的更多的信息,根据多方面的信息确定用户的信息,将帮助商业用户更有效的将对应的资源信息向用户推送。例如,分析用户在一段时间内通过不同的账号浏览过某蓝牙耳机,当消费平台获取这一信息后,可以向用户推送相关的蓝牙耳机,增加商业用户销售该蓝牙耳机的几率。即需要确定多个账号是否是同一用户。
现有常规的帐号的打通,一是在多帐号类型上得不到保证,因为多数是基于用户单领域行为,而用户单领域行为,往往帐号类型相对单一,不能满足一个用户上多帐号类型的打通;二是两两映射间判定置信度最高映射时,方法相对简约,往往某帐号的映射,根据最近上报时间,认为离当前时间越近则越可信,该方式对于某场景下临时切换帐号时会带来较大干扰。
现有技术中判读多个账号之间的映射关系,从用户单一行为流水中,提取相关帐号信息,即针对同一流水记录中出现的帐号,组成映射对,再根据映射上报的时间,以最新上报作为排序因子,作为判定置信度最高的映射。即不同账号之间的打通存在如下缺陷:1),用户单一行为流水,往往是用户在某一领域的行为表现,可以提取的帐号类型相对局限,没有综合考虑其他各种行为,数据样本易偏;2),帐号间映射,简约的根据最新上报时间作为排序因子,容易受到客户端临时切换帐号的波动影响,映射关系准确度缺乏验证;3),打通的帐号类型比较局限,帐号类型丰富度不够。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种目标帐号的识别方法和装置、存储介质及电子装置,以至少解决现有技术中,获取用户的帐号之间映射类型单一,以及确定用户的账号之间映射关系准确性较低的技术问题。
根据本发明实施例的一个方面,提供了一种目标帐号的识别方法,包括:获取第一帐号集合和第二帐号集合,其中,所述第一帐号集合中的帐号的类型为第一帐号类型,所述第二帐号集合中的帐号的类型为不同于所述第一帐号类型的第二帐号类型,所述第一帐号集合包括第一帐号;根据所述第一帐号与所述第二帐号集合中的每个帐号之间的帐号映射参数,获取所述第一帐号与所述第二帐号集合中的每个帐号之间的映射置信度,其中,所述帐号映射参数包括:所述第一帐号与所述第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及所述第一帐号与所述第二帐号集合中的帐号在所述当前时间之前的第二预定时长内累计共同出现的时长和次数,所述第二预定时长大于所述第一预定时长;将所述第二帐号集合中的第二帐号识别为所述第一帐号的关联帐号,其中,所述第二帐号为所述第二帐号集合中与所述第一帐号之间的映射置信度最高的帐号。
根据本发明实施例的另一方面,还提供了一种目标帐号的识别装置,包括:第一获取单元,用于获取第一帐号集合和第二帐号集合,其中,所述第一帐号集合中的帐号的类型为第一帐号类型,所述第二帐号集合中的帐号的类型为不同于所述第一帐号类型的第二帐号类型,所述第一帐号集合包括第一帐号;第二获取单元,用于根据所述第一帐号与所述第二帐号集合中的每个帐号之间的帐号映射参数,获取所述第一帐号与所述第二帐号集合中的每个帐号之间的映射置信度,其中,所述帐号映射参数包括:所述第一帐号与所述第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及所述第一帐号与所述第二帐号集合中的帐号在所述当前时间之前的第二预定时长内累计共同出现的时长和次数,所述第二预定时长大于所述第一预定时长;第一识别单元,用于将所述第二帐号集合中的第二帐号识别为所述第一帐号的关联帐号,其中,所述第二帐号为所述第二帐号集合中与所述第一帐号之间的映射置信度最高的帐号。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述目标帐号的识别方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的目标帐号的识别方法。
在本发明实施例中,通过获取第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类型为第一帐号类型,第二帐号集合中的帐号的类型为不同于第一帐号类型的第二帐号类型,第一帐号集合包括第一帐号;根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第二帐号集合中的每个帐号之间的映射置信度,其中,帐号映射参数包括:第一帐号与第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及第一帐号与第二帐号集合中的帐号在当前时间之前的第二预定时长内累计共同出现的时长和次数,第二预定时长大于第一预定时长;将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号,达到了根据两个时间段内的不同类型的两个账号之间的同时出现的时长和次数,确定两个不同类型账号之间的映射置信度,进而确定不同类型的两个账号属于同一用户的目的,即实现同一用户对应的不同类型账号之间的关联,从而实现了确定不同类型之间账号的置信度的技术效果,进而解决了现有技术中,获取用户的帐号之间映射类型单一,以及确定用户的账号之间映射关系准确性较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的目标帐号的识别方法的应用环境的示意图;
图2是根据本发明实施例的目标帐号的识别方法的流程图;
图3是根据本发明优选实施例的一种打通用户多类型帐号的方法的流程图;
图4是根据本发明实施例的目标帐号的识别装置的结构示意图;
图5是根据本发明实施例的目标帐号的识别的电子装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,还提供了一种目标帐号的识别方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例的一个方面,提供了一种目标帐号的识别方法,可选地,作为一种可选的实施方式,上述目标帐号的识别方法可以但不限于应用于如图1所示的环境目标帐号的识别系统中,其中,该目标帐号的识别系统可以包括但不限于终端设备102、网络110及服务器112。其中,该终端设备102中运行有用户可以通过账号登陆的应用客户端,用于用户在应用客户端中获取相关信息或执行相关操作。
可选地,在本实施例中,上述目标帐号的识别方法可以但不限于应用于服务器104中,用于将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号。其中,上述应用客户端可以但不限于运行在用户设备102中,该用户设备102可以但不限于为手机、平板电脑、笔记本电脑、PC机等支持运行应用客户端的终端设备。上述服务器104和用户设备102可以但不限于通过网络实现数据交互,上述网络可以包括但不限于无线网络或有线网络。其中,该无线网络包括:蓝牙、WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述仅是一种示例,本实施例中对此不作任何限定。
需要说明的是,在本实施例中,用户设备102可能有一个或者多个,一个用户设备102中可以安装多个应用客户端,其用户设备102允许一个用户的多个不同账号登录,多个应用客户端对应不同的或者相同的服务器。例如,用户设备102为手机,手机中安装有多个应用客户端,应用客户端A、应用客户端B,其中应用客户端A和应用客户端B对应不同的服务器,应用客户端A和应用客户端B可以属于不同类型的应用客户端,登录应用客户端A的账号M、登录应用客户端B的账号N以及登录应用客户端C的账号S为不同类型的账号,其中账号M与账号N属于同一类型的账号,账号S为一类型的账号,例如,账号M与账号都用于登录教育类的应用客户端,账号S用于登录游戏类的应用客户端。
进一步的,服务器P可以获取账号S分别与账号M和账号N在当前时间之前的1个月内的共同登录的时长和次数,以及在当前时间之前的2个月内的累计共同出现的时长和次数。根据1个月内共同出现的时长和次数,以及2个月内累计共同出现的时长和次数,获取账号S分别与账号M和账号N之间的映射置信度,将账号M与账号N中与账号S之间的置信度最高的账号确定为账号S的关联账号。达到了根据两个时间段内的不同类型的两个账号之间的同时出现的时长和次数,确定两个不同类型账号之间的映射置信度,进而确定不同类型的两个账号属于同一用户的目的,从而实现了确定不同类型之间账号的置信度的技术效果,进而解决了现有技术中,获取用户的帐号之间映射类型单一,以及确定用户的账号之间映射关系准确性较低的技术问题。
其中,上述服务器104具体过程可以包括但不限于:获取第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类型为第一帐号类型,第二帐号集合中的帐号的类型为不同于第一帐号类型的第二帐号类型,第一帐号集合包括第一帐号;根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第二帐号集合中的每个帐号之间的映射置信度,其中,帐号映射参数包括:第一帐号与第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及第一帐号与第二帐号集合中的帐号在当前时间之前的第二预定时长内累计共同出现的时长和次数,第二预定时长大于第一预定时长;将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号。即目标账号的识别可以在服务器中。
可选的,用户设备102可以获取第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类型为第一帐号类型,第二帐号集合中的帐号的类型为不同于第一帐号类型的第二帐号类型,第一帐号集合包括第一帐号;并通过网络将获取的第一账号集合和第二账号集合发送至服务器104中,服务器104,根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,确定出第一帐号与第二帐号集合中的每个帐号之间的映射置信度,并将第二帐号集合中与第一帐号之间的映射置信度最高的帐号确定为目标账号。即可以在服务器104和用户设备102之间数据交互确定出目标账号。
可选地,作为一种可选的实施方式,如图2所示,根据本发明实施例的目标帐号的识别方法的流程图。上述目标帐号的识别方法包括:
步骤S202,获取第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类型为第一帐号类型,第二帐号集合中的帐号的类型为不同于第一帐号类型的第二帐号类型,第一帐号集合包括第一帐号。
步骤S204,根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第二帐号集合中的每个帐号之间的映射置信度,其中,帐号映射参数包括:第一帐号与第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及第一帐号与第二帐号集合中的帐号在当前时间之前的第二预定时长内累计共同出现的时长和次数,第二预定时长大于第一预定时长。
步骤S206,将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号。
通过上述步骤,通过获取第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类型为第一帐号类型,第二帐号集合中的帐号的类型为不同于第一帐号类型的第二帐号类型,第一帐号集合包括第一帐号;根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第二帐号集合中的每个帐号之间的映射置信度,其中,帐号映射参数包括:第一帐号与第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及第一帐号与第二帐号集合中的帐号在当前时间之前的第二预定时长内累计共同出现的时长和次数,第二预定时长大于第一预定时长;将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号,达到了根据两个时间段内的不同类型的两个账号之间的同时出现的时长和次数,确定两个不同类型账号之间的映射置信度,进而确定不同类型的两个账号属于同一用户的目的,从而实现了确定不同类型之间账号的置信度的技术效果,进而解决了现有技术中,获取用户的帐号之间映射类型单一,以及确定用户的账号之间映射关系准确性较低的技术问题。
可选的,本实施例中的方法可以应用于根据用户不同的数据行为确定该行为属于同一个账号。例如,移动终端获取到账号集合中每个账号在一个月内网购的交易记录、浏览记录,一个月内的每个账号在某应用APP中阅读资讯的浏览记录,还可以是在网络中的搜索相关内容的浏览记录,根据各个场景下的浏览记录,确定出各个场景下的浏览记录是属于同一账号的浏览记录。也就是说,用户有两个账号,根据这两个账号在两个月内共同出现的时长和次数,确定两个账号属于同一个用户。
在步骤S202提供的方案中,第一账号集合可以是表示同一类的多个账号。例如,第一账号集合可以是QQ类型的集合,第二账号集合可以是邮箱账号类型,在QQ类型集合包括多个QQ账号,账号集合为了说明第一账号是账号集合中的任意一个。在第一账号集合中的每一个账号与第二集合中的每个账号都存在映射关系,即形成一对多的关系。
需要说明的是,上述第一账号可以但不限于QQ帐号、微信号、手机号、邮箱、消费平台中的淘宝账号、京东账号等,以及非登录态时从底层设备获取的IMEI/IDFA/MAC等。第二账号集合的账号可以但不限于QQ帐号、微信号、手机号、邮箱等,以及非登录态时从底层设备获取的IMEI/IDFA/MAC等构成的一类账号。
通过上述步骤S202中的方案,不管是有登录态,还是无登录、无论用户使用的是哪类具体帐号,通过对每个用户不同帐号间的打通,不仅可以跨线上线下、跨不同设备、跨不同领域,均可以识别出是同一个用户,更好的融合同一个用户在众多场景下产生的行为,进而为后续用户画像的打通、各推荐领域针对同一用户使用其不同场景下的行为数据成为可能。
在步骤S204提供的方案中,可以获取并确定第一账号与第二账号集合中的每个账号之间的账号映射参数,例如,某用户的QQ账号,与第二邮箱账号集合中的许多账号之间的映射参数,映射参数包括:第一账号和第二账号集合中的每个账号在当前时间之前的一个月内共同出现的时长和次数。例如,第一账号与第二账号集合中的账号1在之前的一个月内共同出现的时长是24小时,共同出现的次数是10次,第一账号与第二账号集合中的账号2在之前的一个月内共同出现的时长是48小时,共同出现的次数是19次。映射参数还包括:第一帐号与第二帐号集合中的帐号在当前时间之前的第二预定时长内累计共同出现的时长和次数。例如,第一账号与第二账号集合中的账号1在之前的三个月内共同出现的时长是100小时,共同出现的次数是30次,第一账号与第二账号集合中的账号2在之前的三个月内共同出现的时长是230小时,共同出现的次数是60次。
通过第一账号与第二账号集合中的每个账号之间的账号映射参数,确定第一账号与第二账号集合中的每个账号之间的映射置信度。相对于现有技术中的,确定第一账号和第二账号之间的映射置信度是根据近一个月的数据,其本方案中的映射置信度,由于考虑的时间因素更对,其获取的映射置信度的准确性更高。
需要说明的是,第二账号集合中可能存在与QQ账号属于同于用户的邮箱账号,也就是说,第一账号集合中的QQ账号和第二账号集合中的邮箱账号都是同一用户的账号。
在步骤S206提供的方案中,将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号。也就是说,第二账号集合的数据库中包括很多不同用户的账号,在第二账号集合中寻找到与第一账号映射置信度最高的账号,将与第一账号之间的映射置信度最高的账号确定为与第一账号属于同一个用户的账号,进而获取到同一个用户的不同类型账号各自的相关信息。更好的融合同一个用户在众多场景下产生的行为。例如,第一账号为QQ账号,第二账号集合是邮箱类的账号,在第二账号集合中确定与第一账号之间映射置信度最高的邮箱账号,进而确定邮箱账号与QQ账号属于同一用户。依次,可以确定QQ账号与其他微信账号之间的映射置信度最高的账号,进而确定QQ账号与微信账号属于同一用户。进而可以确定比如QQ号、设备号、手机号、邮箱号等,是属于同用户的。进而有效的分析用户各个账号之前的用户行为。
作为一种可选的实施例,根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第二帐号集合中的每个帐号之间的映射置信度可以包括:对于第二帐号集合中的每个帐号执行以下操作,其中,在执行以下操作时第二帐号集合中的每个帐号被视为当前帐号;获取第一帐号与当前帐号之间的帐号映射参数,其中,第一帐号与当前帐号之间的帐号映射参数包括:第一帐号与当前帐号在第一预定时长内共同出现的时长和次数,以及第一帐号与当前帐号在第二预定时长内累计共同出现的时长和次数;根据第一帐号与当前帐号之间的帐号映射参数,获取第一帐号与当前帐号之间的映射置信度。在该实施例中,可以将累计的时长和次数作为映射置信度的参数。
通过上述可选的实施例,确定第一账号与第二集合中的每一个账号之间的映射置信度。其映射置信度的确定根据第一预设时长内的共同出现的次数和时长,以及第二预设时间内容累计共同出现的时长和次数。相比现有技术中通过根据第一预设时间内的参数确定的映射置信度,上述可选实施例中的方式,增加第二预设时间内的累计共同出现的时长和次数,确定的映射置信度的准确度更高。
作为一种可选的实施例,获取第一帐号与当前帐号之间的帐号映射参数可以包括:获取第一帐号的数据的产生时间到当前时间的时长、第一帐号与当前帐号在第一预定时长内共同出现的时长和次数,以及第一帐号与当前帐号在第二预定时长内累计共同出现的时长和次数,其中,第一帐号与当前帐号之间的帐号映射参数还包括:第一帐号的数据的产生时间到当前时间的时长。即可以根据第一账号数据产生的时间确定第一账号与第二账号集合中的每个账号之间的共同出现的次数和时长,以及在更长时间内的出现的时长和累计的次数。
需要说明的是,上述可选的实施例中,可以从底层数据上报获取的帐号直接映射关系。为了追求更高映射率,对无法直接映射获取到映射关系的ID,通过二跳中转的方式,借助其他中转映射ID,来获得更高映射率。
作为一种可选的实施例,获取第一帐号与当前帐号之间的帐号映射参数可以包括:在第一帐号具有n路数据源的情况下,获取每路数据源中的第一帐号与当前帐号在第一预定时长内共同出现的时长和次数,以及每路数据源中的第一帐号与当前帐号在第二预定时长内累计共同出现的时长和次数,其中,第一帐号与当前帐号之间的帐号映射参数包括:每路数据源中的第一帐号与当前帐号在第一预定时长内共同出现的时长和次数,以及每路数据源中的第一帐号与当前帐号在第二预定时长内累计共同出现的时长和次数。即,可以用户账号可以来自n路中的数据,进而可以确定每路数据源的第一账号与第二账号集合中的每一个账号之间的映射参数,由于第一账号的数据源可以包括多路,因此,可以获取多个第一账号与第二账号集合中的每个账号之间的映射参数,进而提高映射置信度的准确性。
需要说明的是,n路数据源,来自底层不同数据源头的上报,上报格式千差万别,需对第一帐号进行统一格式对齐。可以从组织形式、大小写、长度等维度进行判断,识别不合法帐号并排除的操作。
作为一种可选的实施例,根据第一帐号与当前帐号之间的帐号映射参数,获取第一帐号与当前帐号之间的映射置信度可以包括:
其中,n表示第一帐号的n路数据源,对于source=i,1<<i<<n:time表示第一帐号的第i路数据源的产生时间到当前时间的时长,monthduration表示第i路数据源中的第一帐号与当前帐号在第一预定时长内共同出现的时长,monthaction表示第i路数据源中的第一帐号与当前帐号在第一预定时长内共同出现的次数,accumulationduration表示第i路数据源中的第一帐号与当前帐号在第二预定时长内累计共同出现的时长,accumulationaction表示第i路数据源中的第一帐号与当前帐号在第二预定时长内累计共同出现的次数,weight1表示与第一预定时长对应的预设权重;weight2表示与第二预定时长对应的预设权重,其中,weight1>weight2。通过上述可选的实施例,可以确定出第一账号与第二账号集合中的每个账号之间的映射置信度。
作为一种可选的实施例,根据第一帐号与当前帐号之间的帐号映射参数,获取第一帐号与当前帐号之间的映射置信度,包括:score=exp-ln2*time*sigmoid(weight1*monthduration*monthaction+weight2*accumulationduration*accumulationaction)
其中,score表示第一帐号与当前帐号之间的映射置信度,time表示第一帐号的数据的产生时间到当前时间的时长,monthduration表示第一帐号与当前帐号在第一预定时长内共同出现的时长,monthaction表示第一帐号与当前帐号在第一预定时长内共同出现的次数,accumulationduration表示第一帐号与当前帐号在第二预定时长内累计共同出现的时长,accumulationaction表示第一帐号与当前帐号在第二预定时长内累计共同出现的次数;weight1表示与第一预定时长对应的预设权重;weight2表示与第二预定时长对应的预设权重,其中,weight1>weight2。
作为一种可选的实施例,将第二帐号集合中的第二帐号识别为第一帐号的关联帐号之后,上述方法还可以包括:根据第一帐号与第三帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第三帐号集合中的每个帐号之间的映射置信度,其中,帐号映射参数包括:第一帐号与第三帐号集合中的帐号在当前时间之前的第三预定时长内共同出现的时长和次数,以及第一帐号与第三帐号集合中的帐号在当前时间之前的第四预定时长内累计共同出现的时长和次数,第四预定时长大于第三预定时长,第三帐号集合中的帐号的类型为不同于第一帐号类型和第二帐号类型的第三帐号类型;将第三帐号集合中的第三帐号识别为第一帐号和第二帐号的关联帐号,其中,第三帐号为第三帐号集合中与第一帐号之间的映射置信度最高的帐号。
通过上述可选的实施例,可以确定第一账号和第三账号集合中的每个账号之间的映射置信度,确定出第三账号集合中与第一账号关联度最高的账号,进而确定该关联度最高的账号与第一账号属于同一用户的账号。例如,用户A的QQ账号和用户A的手机号。进一步的,可以确定用户的一个帐号体系,该账号体系,用于表征线上唯一用户的多种ID体系,比如QQ号、设备号、手机号、邮箱号等。
本发明还提供了一种优选实施例,该优选实施例提供了一种打通用户多类型帐号的方法(相当于目标账号的识别)。
为了更好的理解上述优选实施例,介绍名称如下:
帐号体系:用于表征线上唯一用户的多种ID体系,比如QQ号、设备号、手机号、邮箱号等。
帐号降噪:用于对用户帐号数据,从组织形式、大小写、长度等维度进行判断,识别不合法帐号并排除的操作。
帐号清洗:用户帐号来自底层不同数据源头的上报,上报格式千差万别,需对各帐号进行统一格式对齐。
直接映射:表示从底层数据上报获取的帐号直接映射关系。
二跳拓展映射:为了追求更高映射率,对直接映射获取不到映射关系的ID,通过二跳中转的方式,借助其他中转映射ID,来获得更高映射率。
帐号一对一仲裁:针对帐号间存在一对多或则多对一关系时,判断置信度最高的唯一映射关系的计算策略。
图3是根据本发明优选实施例的一种打通用户多类型帐号的方法的流程图,如图3所示,该方法包括如下步骤:
步骤1,通过用户多源头多行为帐号流水,提取多种用户帐号类型,如用户的QQ号、设备IMEI、设备IDFA、设备MAC、手机号、邮箱号等;
在步骤1中,获取不同代表不同类型的第一账号集合和第二账号集合。
步骤2,帐号合法性判定,即通过各类帐号本身的属性,如帐号特定的字母数字组织形式、长度限定、大小写等,对设备进行降噪,剔除不合法帐号,只保留正确帐号;
步骤3,针对帐号间两两映射,计算相关统计指标,如针对帐号类型A到帐号类型B的映射,计算其最近一个月活跃总天数(第一预定时长内共同出现的时长)、活跃总次数(相第一预定时长内共同出现的次数)和活跃时长,以及按照更长时间窗口,累计的活跃天数(相当于第二预定时长内累计共同出现的时长)、活跃次数(相当于第二预定时长内累计共同出现的次数)和累计活跃时长等;
在步骤3中,可以确定映射参数包括:所述帐号映射参数包括:所述第一帐号与所述第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及所述第一帐号与所述第二帐号集合中的帐号在所述当前时间之前的第二预定时长内累计共同出现的时长和次数,所述第二预定时长大于所述第一预定时长。
步骤4,两两帐号间映射置信度计算,分值计算越高,代表他们之间打通的置信度越高,通过对置信度倒排取TOP1,来确定帐号一对一的唯一映射关系;
在步骤4中,根据所述第一帐号与所述第二帐号集合中的每个帐号之间的帐号映射参数,获取所述第一帐号与所述第二帐号集合中的每个帐号之间的映射置信度。
其中,映射置信度综合打分建模的公式如下:
其中,n表示所述第一帐号的n路数据源,对于source=i,1<<i<<n:
time表示所述第一帐号的第i路数据源的产生时间到所述当前时间的时长,monthduration表示所述第i路数据源中的所述第一帐号与所述当前帐号在所述第一预定时长内共同出现的时长,monthaction表示所述第i路数据源中的所述第一帐号与所述当前帐号在所述第一预定时长内共同出现的次数,accumulationduration表示所述第i路数据源中的所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长,accumulationaction表示所述第i路数据源中的所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的次数,weight1表示与所述第一预定时长对应的预设权重,weight2表示与所述第二预定时长对应的预设权重,其中,weight1>weight2。
需要说明的是,weight1代表第一预定时长对应的整体权重,weight2代表第二预定时长对应的权重,第一预定时长与第二预定时长一般为半年或者更长,weight1因为对应的时间窗与当前时间更接近,所以其权重值要比累计权重weight2要高,表征用户最近行为上报的帐号映射准确的可能性更高。
monthduration代表某两两帐号在最近一个月(相当于第一预定时长)共同出现的总时长,monthaction代表某两两帐号在最近一个月(相当于第一预定时长)共同出现的总次数,共同出现的总时长和总次数越多,该部分计算分值越高,表示该两两帐号打通的可能性越高。
accumulationduration代表某两两帐号累计出现的总时长,accumulationaction代表某两两帐号累计出现的总次数,积累时间窗内,共同出现的总时长和总次数越多,该部分计算分值越高,表示该两两帐号在累计时间维度上打通的可能性越高。
步骤5,通过步骤4中的两两映射置信度计算,获得某两类帐号间最可靠的唯一映射关系之后,该模块是对同一个用户上的多种帐号类型进行的全面打通,通过指定唯一的主帐号类型,其他映射的帐号则通过关联映射的方式进行打通,比如,如果主帐号类型为QQ号,则后面多种帐号类型打通后,即可得到QQ号-手机号=邮箱号-设备IMEI-设备IDFA-设备MAC等,即将表示一个用户的所有帐号全部连通且唯一。
上述优选实施例,通过融合用户多源头行为,根据要打通的不同帐号类型,对用户在多场景下建模,对各源头上报的帐号进行降噪,并构建两两帐号间置信度判定的计算因子(相当于映射参数),通过置信度综合建模有效的判定了最可靠映射,同时将每个用户上的多帐号类型进行关联打通,从而构建了丰富度及准确率都较高的用户帐号体系。进一步的,运营商可以根据用户账号体系,获取用户的行为数据,向用户进行多媒体资源的精准投放。例如,当发现用户在消费平台中的经常浏览某健身器材,以及用户在移动终端中的新闻客户端中历史浏览过健身器材,以及微博客户端中也浏览过该健身器材,则可以在确定该用户的某购物客户端登录时,向该客户端推送关于该健身器材的广告或者商家,以达到健身器材广告以及店铺的向用户的精准投放。
上述优选实施例,融合用户多源头行为场景,对用户帐号体系进行挖掘,有效的解决了传统方式单一用户行为挖掘带来的有偏问题,通过帐号间多因子计算置信度,有效的解决了传统方式简约性帐号打通带来的映射不精准的问题,通过关联一个用户上的多类帐号,有效的解决了传统方式帐号类型单一的局限性,综合以上几个方面,该方案可以有效提升用户帐号映射的类型丰富度,及覆盖度和准确性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述目标帐号的识别方法的目标帐号的识别装置。如图4所示,该目标帐号的识别装置包括:第一获取单元41、第二获取单元43以及第一识别单元45。
第一获取单元41,用于获取第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类型为第一帐号类型,第二帐号集合中的帐号的类型为不同于第一帐号类型的第二帐号类型,第一帐号集合包括第一帐号。
第二获取单元43,用于根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第二帐号集合中的每个帐号之间的映射置信度,其中,帐号映射参数包括:第一帐号与第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及第一帐号与第二帐号集合中的帐号在当前时间之前的第二预定时长内累计共同出现的时长和次数,第二预定时长大于第一预定时长。
第一识别单元45,用于将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号。
通过上述装置,第一获取单元41获取第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类型为第一帐号类型,第二帐号集合中的帐号的类型为不同于第一帐号类型的第二帐号类型,第一帐号集合包括第一帐号;第二获取单元43根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第二帐号集合中的每个帐号之间的映射置信度,其中,帐号映射参数包括:第一帐号与第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及第一帐号与第二帐号集合中的帐号在当前时间之前的第二预定时长内累计共同出现的时长和次数,第二预定时长大于第一预定时长;第一识别单元45将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号。
作为一种可选的实施例,上述第二获取单元可以包括:对于第二帐号集合中的每个帐号执行以下操作,其中,在执行以下操作时第二帐号集合中的每个帐号被视为当前帐号;第一获取模块,用于获取第一帐号与当前帐号之间的帐号映射参数,其中,第一帐号与当前帐号之间的帐号映射参数包括:第一帐号与当前帐号在第一预定时长内共同出现的时长和次数,以及第一帐号与当前帐号在第二预定时长内累计共同出现的时长和次数;第二获取模块,用于根据第一帐号与当前帐号之间的帐号映射参数,获取第一帐号与当前帐号之间的映射置信度。
作为一种可选的实施例,上述第二获取模块可以包括:第一获取子模块,用于获取第一帐号的数据的产生时间到当前时间的时长、第一帐号与当前帐号在第一预定时长内共同出现的时长和次数,以及第一帐号与当前帐号在第二预定时长内累计共同出现的时长和次数,其中,第一帐号与当前帐号之间的帐号映射参数还包括:第一帐号的数据的产生时间到当前时间的时长。
作为一种可选的实施例,上述第二获取模块还用于执行以下操作:在第一帐号具有n路数据源的情况下,获取每路数据源中的第一帐号与当前帐号在第一预定时长内共同出现的时长和次数,以及每路数据源中的第一帐号与当前帐号在第二预定时长内累计共同出现的时长和次数,其中,第一帐号与当前帐号之间的帐号映射参数包括:每路数据源中的第一帐号与当前帐号在第一预定时长内共同出现的时长和次数,以及每路数据源中的第一帐号与当前帐号在第二预定时长内累计共同出现的时长和次数。
作为一种可选的实施例,上述第二获取模块,包括:
其中,n表示第一帐号的n路数据源,对于source=i,1<<i<<n:time表示第一帐号的第i路数据源的产生时间到当前时间的时长,monthduration表示第i路数据源中的第一帐号与当前帐号在第一预定时长内共同出现的时长,monthaction表示第i路数据源中的第一帐号与当前帐号在第一预定时长内共同出现的次数,accumulationduration表示第i路数据源中的第一帐号与当前帐号在第二预定时长内累计共同出现的时长,accumulationaction表示第i路数据源中的第一帐号与当前帐号在第二预定时长内累计共同出现的次数;weight1表示与第一预定时长对应的预设权重;weight2表示与第二预定时长对应的预设权重,其中,weight1>weight2。
作为一种可选的实施例,上述第二获取模块可以包括:
score=exp-ln2*time*sigmoid(weight1*monthduration*monthaction+weight2*accumulationduration*accumulationaction)
其中,score表示第一帐号与当前帐号之间的映射置信度,time表示第一帐号的数据的产生时间到当前时间的时长,monthduration表示第一帐号与当前帐号在第一预定时长内共同出现的时长,monthaction表示第一帐号与当前帐号在第一预定时长内共同出现的次数,accumulationduration表示第一帐号与当前帐号在第二预定时长内累计共同出现的时长,accumulationaction表示第一帐号与当前帐号在第二预定时长内累计共同出现的次数;weight1表示与第一预定时长对应的预设权重;weight2表示与第二预定时长对应的预设权重,其中,weight1>weight2。
作为一种可选的实施例,上述装置还可以包括:第三获取单元,用于将第二帐号集合中的第二帐号识别为第一帐号的关联帐号之后,根据第一帐号与第三帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第三帐号集合中的每个帐号之间的映射置信度,其中,帐号映射参数包括:第一帐号与第三帐号集合中的帐号在当前时间之前的第三预定时长内共同出现的时长和次数,以及第一帐号与第三帐号集合中的帐号在当前时间之前的第四预定时长内累计共同出现的时长和次数,第四预定时长大于第三预定时长,第三帐号集合中的帐号的类型为不同于第一帐号类型和第二帐号类型的第三帐号类型;第二识别单元,用于将第三帐号集合中的第三帐号识别为第一帐号和第二帐号的关联帐号,其中,第三帐号为第三帐号集合中与第一帐号之间的映射置信度最高的帐号。
根据本发明实施例的又一个方面,还提供了一种用于实施上述目标帐号的识别方法的电子装置,如图5所示,该电子装置包括存储器502和处理器504,该存储器502中存储有计算机程序,该处理器504被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类型为第一帐号类型,第二帐号集合中的帐号的类型为不同于第一帐号类型的第二帐号类型,第一帐号集合包括第一帐号;
S2,根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第二帐号集合中的每个帐号之间的映射置信度,其中,帐号映射参数包括:第一帐号与第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及第一帐号与第二帐号集合中的帐号在当前时间之前的第二预定时长内累计共同出现的时长和次数,第二预定时长大于第一预定时长;
S3,将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号。
可选地,本领域普通技术人员可以理解,图5所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图5其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图5中所示更多或者更少的组件(如网络接口等),或者具有与图5所示不同的配置。
其中,存储器502可用于存储软件程序以及模块,如本发明实施例中的目标帐号的识别方法和装置对应的程序指令/模块,处理器504通过运行存储在存储器502内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的目标帐号的识别方法。存储器502可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器502可进一步包括相对于处理器504远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器502具体可以但不限于用于第一账号集合、第二账号集合等信息。作为一种示例,如图5所示,上述存储器502中可以但不限于包括上述目标帐号的识别装置中的第一获取单元41、第二获取单元43以及第一识别单元45。此外,还可以包括但不限于上述目标帐号的识别装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置506用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置506包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置506为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
根据本发明的实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取第一帐号集合和第二帐号集合,其中,第一帐号集合中的帐号的类型为第一帐号类型,第二帐号集合中的帐号的类型为不同于第一帐号类型的第二帐号类型,第一帐号集合包括第一帐号;
S2,根据第一帐号与第二帐号集合中的每个帐号之间的帐号映射参数,获取第一帐号与第二帐号集合中的每个帐号之间的映射置信度,其中,帐号映射参数包括:第一帐号与第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及第一帐号与第二帐号集合中的帐号在当前时间之前的第二预定时长内累计共同出现的时长和次数,第二预定时长大于第一预定时长;
S3,将第二帐号集合中的第二帐号识别为第一帐号的关联帐号,其中,第二帐号为第二帐号集合中与第一帐号之间的映射置信度最高的帐号。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (12)
1.一种目标帐号的识别方法,其特征在于,包括:
获取第一帐号集合和第二帐号集合,其中,所述第一帐号集合中的帐号的类型为第一帐号类型,所述第二帐号集合中的帐号的类型为不同于所述第一帐号类型的第二帐号类型,所述第一帐号集合包括第一帐号;
根据所述第一帐号与所述第二帐号集合中的每个帐号之间的帐号映射参数,获取所述第一帐号与所述第二帐号集合中的每个帐号之间的映射置信度,其中,所述帐号映射参数包括:所述第一帐号与所述第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及所述第一帐号与所述第二帐号集合中的帐号在所述当前时间之前的第二预定时长内累计共同出现的时长和次数,所述第二预定时长大于所述第一预定时长;
其中,根据所述第一帐号与所述第二帐号集合中的每个帐号之间的帐号映射参数,获取所述第一帐号与所述第二帐号集合中的每个帐号之间的映射置信度包括:
所述score表示所述映射置信度,所述第一帐号对应n路数据源,所述source等于i,所述i不小于1且不大于所述n,所述time表示第i路数据源对应的所述第一帐号的产生时间到当前时间的时长,所述monthduration表示所述第i路数据源对应的所述第一帐号与当前帐号在所述第一预定时长内共同出现的时长,所述monthaction表示所述第i路数据源对应的所述第一帐号与当前帐号在所述第一预定时长内共同出现的次数,所述accumulationduration表示所述第i路数据源对应的所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长,所述accumulationaction表示所述第i路数据源对应的所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的次数,所述weight1表示所述第一预定时长对应的预设权重,所述weight2表示所述第二预定时长对应的预设权重,所述weight1大于所述weight2,所述当前帐号为所述第二帐号集合中的每个帐号;
将所述第二帐号集合中的第二帐号识别为所述第一帐号的关联帐号,其中,所述第二帐号为所述第二帐号集合中与所述第一帐号之间的映射置信度最高的帐号。
2.根据权利要求1所述的方法,其特征在于,根据所述第一帐号与所述第二帐号集合中的每个帐号之间的帐号映射参数,获取所述第一帐号与所述第二帐号集合中的每个帐号之间的映射置信度,还包括:
对于所述第二帐号集合中的每个帐号执行以下操作;
获取所述第一帐号与所述当前帐号之间的帐号映射参数,其中,所述第一帐号与所述当前帐号之间的帐号映射参数包括:所述第一帐号与所述当前帐号在所述第一预定时长内共同出现的时长和次数,以及所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长和次数;
根据所述第一帐号与所述当前帐号之间的帐号映射参数,获取所述第一帐号与所述当前帐号之间的映射置信度。
3.根据权利要求2所述的方法,其特征在于,所述获取所述第一帐号与所述当前帐号之间的帐号映射参数,包括:
获取所述第一帐号的数据的产生时间到所述当前时间的时长、所述第一帐号与所述当前帐号在所述第一预定时长内共同出现的时长和次数,以及所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长和次数,其中,所述第一帐号与所述当前帐号之间的帐号映射参数还包括:所述第一帐号的数据的产生时间到所述当前时间的时长。
4.根据权利要求2所述的方法,其特征在于,所述获取所述第一帐号与所述当前帐号之间的帐号映射参数,包括:
获取所述n路数据源中的每路数据源对应的所述第一帐号与所述当前帐号在所述第一预定时长内共同出现的时长和次数,以及所述每路数据源对应的所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长和次数,其中,所述第一帐号与所述当前帐号之间的帐号映射参数包括:所述每路数据源中的所述第一帐号与所述当前帐号在所述第一预定时长内共同出现的时长和次数,以及所述每路数据源中的所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长和次数。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述将所述第二帐号集合中的第二帐号识别为所述第一帐号的关联帐号之后,所述方法还包括:
根据所述第一帐号与第三帐号集合中的每个帐号之间的帐号映射参数,获取所述第一帐号与所述第三帐号集合中的每个帐号之间的映射置信度,其中,所述帐号映射参数包括:所述第一帐号与所述第三帐号集合中的帐号在当前时间之前的第三预定时长内共同出现的时长和次数,以及所述第一帐号与所述第三帐号集合中的帐号在所述当前时间之前的第四预定时长内累计共同出现的时长和次数,所述第四预定时长大于所述第三预定时长,所述第三帐号集合中的帐号的类型为不同于所述第一帐号类型和所述第二帐号类型的第三帐号类型;
将所述第三帐号集合中的第三帐号识别为所述第一帐号和所述第二帐号的关联帐号,其中,所述第三帐号为所述第三帐号集合中与所述第一帐号之间的映射置信度最高的帐号。
6.一种目标帐号的识别装置,其特征在于,包括:
第一获取单元,用于获取第一帐号集合和第二帐号集合,其中,所述第一帐号集合中的帐号的类型为第一帐号类型,所述第二帐号集合中的帐号的类型为不同于所述第一帐号类型的第二帐号类型,所述第一帐号集合包括第一帐号;
第二获取单元,用于根据所述第一帐号与所述第二帐号集合中的每个帐号之间的帐号映射参数,获取所述第一帐号与所述第二帐号集合中的每个帐号之间的映射置信度,其中,所述帐号映射参数包括:所述第一帐号与所述第二帐号集合中的帐号在当前时间之前的第一预定时长内共同出现的时长和次数,以及所述第一帐号与所述第二帐号集合中的帐号在所述当前时间之前的第二预定时长内累计共同出现的时长和次数,所述第二预定时长大于所述第一预定时长;其中,根据所述第一帐号与所述第二帐号集合中的每个帐号之间的帐号映射参数,获取所述第一帐号与所述第二帐号集合中的每个帐号之间的映射置信度包括:
所述score表示所述映射置信度,所述第一帐号对应n路数据源,所述source等于i,所述i不小于1且不大于所述n,所述time表示第i路数据源对应的所述第一帐号的产生时间到当前时间的时长,所述monthduration表示所述第i路数据源对应的所述第一帐号与当前帐号在所述第一预定时长内共同出现的时长,所述monthaction表示所述第i路数据源对应的所述第一帐号与当前帐号在所述第一预定时长内共同出现的次数,所述accumulationduration表示所述第i路数据源对应的所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长,所述accumulationaction表示所述第i路数据源对应的所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的次数,所述weight1表示所述第一预定时长对应的预设权重,所述weight2表示所述第二预定时长对应的预设权重,所述weight1大于所述weight2,所述当前帐号为所述第二帐号集合中的每个帐号;
第一识别单元,用于将所述第二帐号集合中的第二帐号识别为所述第一帐号的关联帐号,其中,所述第二帐号为所述第二帐号集合中与所述第一帐号之间的映射置信度最高的帐号。
7.根据权利要求6所述的装置,其特征在于,所述第二获取单元,包括:
对于所述第二帐号集合中的每个帐号执行以下操作;
第一获取模块,用于获取所述第一帐号与所述当前帐号之间的帐号映射参数,其中,所述第一帐号与所述当前帐号之间的帐号映射参数包括:所述第一帐号与所述当前帐号在所述第一预定时长内共同出现的时长和次数,以及所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长和次数;
第二获取模块,用于根据所述第一帐号与所述当前帐号之间的帐号映射参数,获取所述第一帐号与所述当前帐号之间的映射置信度。
8.根据权利要求7所述的装置,其特征在于,所述第二获取模块,包括:
第一获取子模块,用于获取所述第一帐号的数据的产生时间到所述当前时间的时长、所述第一帐号与所述当前帐号在所述第一预定时长内共同出现的时长和次数,以及所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长和次数,其中,所述第一帐号与所述当前帐号之间的帐号映射参数还包括:所述第一帐号的数据的产生时间到所述当前时间的时长。
9.根据权利要求7所述的装置,其特征在于,所述第二获取模块还用于执行以下操作:
获取所述n路数据源中的每路数据源对应的所述第一帐号与所述当前帐号在所述第一预定时长内共同出现的时长和次数,以及所述每路数据源对应的所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长和次数,其中,所述第一帐号与所述当前帐号之间的帐号映射参数包括:所述每路数据源中的所述第一帐号与所述当前帐号在所述第一预定时长内共同出现的时长和次数,以及所述每路数据源中的所述第一帐号与所述当前帐号在所述第二预定时长内累计共同出现的时长和次数。
10.根据权利要求6至9中任一项所述的装置,其特征在于,所述装置还包括:
第三获取单元,用于所述将所述第二帐号集合中的第二帐号识别为所述第一帐号的关联帐号之后,根据所述第一帐号与第三帐号集合中的每个帐号之间的帐号映射参数,获取所述第一帐号与所述第三帐号集合中的每个帐号之间的映射置信度,其中,所述帐号映射参数包括:所述第一帐号与所述第三帐号集合中的帐号在当前时间之前的第三预定时长内共同出现的时长和次数,以及所述第一帐号与所述第三帐号集合中的帐号在所述当前时间之前的第四预定时长内累计共同出现的时长和次数,所述第四预定时长大于所述第三预定时长,所述第三帐号集合中的帐号的类型为不同于所述第一帐号类型和所述第二帐号类型的第三帐号类型;
第二识别单元,用于将所述第三帐号集合中的第三帐号识别为所述第一帐号和所述第二帐号的关联帐号,其中,所述第三帐号为所述第三帐号集合中与所述第一帐号之间的映射置信度最高的帐号。
11.一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至5任一项中所述的方法。
12.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至5任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911176909.1A CN110968785B (zh) | 2019-11-26 | 2019-11-26 | 目标帐号的识别方法和装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911176909.1A CN110968785B (zh) | 2019-11-26 | 2019-11-26 | 目标帐号的识别方法和装置、存储介质及电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110968785A CN110968785A (zh) | 2020-04-07 |
CN110968785B true CN110968785B (zh) | 2023-03-14 |
Family
ID=70031672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911176909.1A Active CN110968785B (zh) | 2019-11-26 | 2019-11-26 | 目标帐号的识别方法和装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110968785B (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106933829B (zh) * | 2015-12-29 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 一种信息关联方法和设备 |
CN107483381B (zh) * | 2016-06-07 | 2021-10-15 | 中兴通讯股份有限公司 | 关联账户的监控方法及装置 |
CN106777282B (zh) * | 2016-12-29 | 2018-07-13 | 百度在线网络技术(北京)有限公司 | 相关搜索的排序方法和装置 |
CN110019180B (zh) * | 2017-08-10 | 2021-04-30 | 中国电信股份有限公司 | 多源数据账号关联和装置 |
CN109698809B (zh) * | 2017-10-20 | 2021-04-02 | 中移(苏州)软件技术有限公司 | 一种账号异常登录的识别方法及装置 |
CN108335008A (zh) * | 2017-12-13 | 2018-07-27 | 腾讯科技(深圳)有限公司 | 网络信息处理方法和装置、存储介质及电子装置 |
-
2019
- 2019-11-26 CN CN201911176909.1A patent/CN110968785B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110968785A (zh) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009844B (zh) | 确定广告作弊行为的方法、装置及云服务器 | |
US20180253755A1 (en) | Method and apparatus for identification of fraudulent click activity | |
CA3040572C (en) | Methods and apparatus to associate transactions with media impressions | |
CN110300084B (zh) | 基于ip地址的画像方法和装置,电子设备,可读介质 | |
CN106874273B (zh) | 渠道信息统计方法、装置和系统 | |
CN110771126B (zh) | 用于用户设备事件的匹配与归因的系统 | |
CN108737535A (zh) | 一种消息推送方法、存储介质和服务器 | |
CN104537115A (zh) | 用户兴趣的探索方法和装置 | |
CN103620585A (zh) | 虚拟身份管理器 | |
CN104394118A (zh) | 一种用户身份识别方法及系统 | |
CN103248677B (zh) | 互联网行为分析系统及其工作方法 | |
CN106713290B (zh) | 一种识别主用户账号的方法及服务器 | |
WO2018196553A1 (zh) | 标识的获取方法及装置、存储介质以及电子装置 | |
Agarwal et al. | Stop tracking me bro! differential tracking of user demographics on hyper-partisan websites | |
CN113572752A (zh) | 异常流量的检测方法和装置、电子设备、存储介质 | |
CN105871585A (zh) | 终端关联方法及装置 | |
WO2020258102A1 (zh) | 内容推送方法、装置、移动终端及存储介质 | |
CN111815375A (zh) | 广告投放中的用户画像方法及装置 | |
CN111612085A (zh) | 一种对等组中异常点的检测方法及装置 | |
CN112437034A (zh) | 虚假终端检测方法和装置、存储介质及电子装置 | |
CN111699487A (zh) | 用于快速且安全的内容提供的系统 | |
CN110968785B (zh) | 目标帐号的识别方法和装置、存储介质及电子装置 | |
CN110557351B (zh) | 用于生成信息的方法和装置 | |
CN114285896B (zh) | 信息推送方法、装置、设备、存储介质及程序产品 | |
CN105007184A (zh) | 用户行为习惯的获取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40021086 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |