CN108491424A - 用户id关联方法及装置 - Google Patents

用户id关联方法及装置 Download PDF

Info

Publication number
CN108491424A
CN108491424A CN201810124423.2A CN201810124423A CN108491424A CN 108491424 A CN108491424 A CN 108491424A CN 201810124423 A CN201810124423 A CN 201810124423A CN 108491424 A CN108491424 A CN 108491424A
Authority
CN
China
Prior art keywords
user
history log
kinds
feature
types
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810124423.2A
Other languages
English (en)
Other versions
CN108491424B (zh
Inventor
杨也康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Fangjianghu Technology Co Ltd
Original Assignee
Lianjia Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lianjia Beijing Technology Co Ltd filed Critical Lianjia Beijing Technology Co Ltd
Priority to CN201810124423.2A priority Critical patent/CN108491424B/zh
Publication of CN108491424A publication Critical patent/CN108491424A/zh
Application granted granted Critical
Publication of CN108491424B publication Critical patent/CN108491424B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种用户ID关联方法及装置,用户ID关联方法包括:获取目标对象在预设时段内的用户ID历史日志;基于用户ID历史日志确定不同的用户ID之间的关联特征;根据用户ID历史日志建立用户ID映射关系列表,并依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系;若是,则确定该用户ID和对应的其他类型的用户ID之间的置信度为1;否则,则根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值。本发明能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性,并对同一终端不同用户差异性进行准确区分。

Description

用户ID关联方法及装置
技术领域
本发明涉及数据处理技术领域,具体涉及一种用户ID关联方法及装置。
背景技术
随着社会的飞速发展,通过网络获取信息或进行交易等已经成为了人们能够快速且便捷地处理事务的途径,而对于一些企业,如何能够通过获取用户在网络中的行为信息来获取目标客户或需要,已经成为了这些企业亟待解决的问题。
由于用户在网络浏览时往往会产生很多线上行为日志,例如对感兴趣事务的浏览与关注等等,且用户线上使用终端主要包括PC网页、手机APP和手机网页浏览器M站,因此,在用户使用不同的终端时系统会分配不同类型的用户ID去标识用户;此外对于注册用户与非注册用户系统也有不同类型的用户ID实现用户的标识,因此当同一用户使用多种类型的终端产生线上行为,或者同一终端被多个不同用户使用时,则需要对这些相关的用户ID进行关联,否则,由于不同终端的同一用户ID匹配度不高,且同一终端被不同用户使用时无法区分,因此对于单个用户只能发现其局部用户行为,无法了解用户的全部需求。
目前,尚未有一种能够准确且快速地关联相关的用户ID的方法,因此,如何设计一种准确且快速的用户ID的关联方法,是亟待解决的问题。
发明内容
针对现有技术中的问题,本发明提供一种用户ID关联方法及装置,能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性,并对同一终端不同用户差异性进行准确区分。
为解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供一种用户ID关联方法,所述用户ID关联方法包括:
获取目标对象在预设时段内的用户ID历史日志,其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID;
基于所述用户ID历史日志确定不同的用户ID之间的关联特征;
根据所述用户ID历史日志建立用户ID映射关系列表,其中,所述用户ID映射关系列表中存储有每一个用户ID和对应的其他用户ID之间的对应关系;
以及,根据所述用户ID映射关系列表,依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系;
若当前的用户ID和对应的其他类型的用户ID之间是一一映射关系,则确定该用户ID和对应的其他类型的用户ID之间的置信度为1;
若当前的用户ID和对应的其他类型的用户ID不是一一映射关系,则根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值。
进一步地,所述获取目标对象在预设时段内的用户ID历史日志,其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,包括:
获取目标对象在预设时段内的PC端、移动客户端和APP端的用户ID历史日志;
其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,且所述用户ID的类型包括:UCID、UDID和UUID。
进一步地,所述基于所述用户ID历史日志确定不同的用户ID之间的关联特征,包括:
基于所述用户ID历史日志确定不同的用户ID之间的关联特征,且所述关联特征包括:第一特征、第二特征和第三特征;
其中,所述第一特征为两个类型的用户ID同时出现的频次;
所述第二特征为两个类型的用户ID自首次同时出现至最后一次同时出现之间的间隔时段,若两个类型的用户ID仅同时出现过一次,则将所述第二特征的值设置为第一预设值,且所述第一预设值小于或等于所述间隔时段,所述间隔时段小于或等于所述预设时段;
所述第三特征为各类型的用户ID各自对应的历史偏好数据。
进一步地,所述若当前的用户ID和对应的其他类型的用户ID不是一一映射关系,则根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值,包括:
若当前的用户ID和对应的其他类型的用户ID不是一一映射关系,则对该用户ID和对应的其他类型的用户ID之间的第一特征、第二特征和第三特征进行加权计算,并对加权计算的结果进行归一化处理,得到该用户信息中的各类型的用户ID之间的置信度的值。
第二方面,本发明提供一种用户ID关联系统,所述用户ID关联系统包括:
用户ID历史日志获取模块,用于获取目标对象在预设时段内的用户ID历史日志,其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID;
关联特征确定模块,用于基于所述用户ID历史日志确定不同的用户ID之间的关联特征;
用户ID映射关系列表建立模块,用于根据所述用户ID历史日志建立用户ID映射关系列表,其中,所述用户ID映射关系列表中存储有每一个用户ID和对应的其他用户ID之间的对应关系;
映射关系判断模块,用于根据所述用户ID映射关系列表,依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系;
第一置信度设置模块,用于在当前的用户ID和对应的其他类型的用户ID之间是一一映射关系时,确定该用户ID和对应的其他类型的用户ID之间的置信度为1;
第二置信度设置模块,用于在当前的用户ID和对应的其他类型的用户ID不是一一映射关系时,根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值。
进一步地,所述用户ID历史日志获取模块包括:
用户ID历史日志接收单元,用于获取目标对象在预设时段内的PC端、移动客户端和APP端的用户ID历史日志;
其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,且所述用户ID的类型包括:UCID、UDID和UUID。
进一步地,所述关联特征确定模块包括:
关联特征获取单元,用于基于所述用户ID历史日志确定不同的用户ID之间的关联特征,且所述关联特征包括:第一特征、第二特征和第三特征;
其中,所述第一特征为两个类型的用户ID同时出现的频次;
所述第二特征为两个类型的用户ID自首次同时出现至最后一次同时出现之间的间隔时段,若两个类型的用户ID仅同时出现过一次,则将所述第二特征的值设置为第一预设值,且所述第一预设值小于或等于所述间隔时段,所述间隔时段小于或等于所述预设时段;
所述第三特征为各类型的用户ID各自对应的历史偏好数据。
进一步地,所述第二置信度设置模块包括:
关联分析计算单元,用于在当前的用户ID和对应的其他类型的用户ID不是一一映射关系时,对该用户ID和对应的其他类型的用户ID之间的第一特征、第二特征和第三特征进行加权计算,并对加权计算的结果进行归一化处理,得到该用户信息中的各类型的用户ID之间的置信度的值。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述用户ID关联方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述用户ID关联方法的步骤。
由上述技术方案可知,本发明提供的一种用户ID关联方法,通过获取目标对象在预设时段内的用户ID历史日志;基于用户ID历史日志确定不同的用户ID之间的关联特征;根据用户ID历史日志建立用户ID映射关系列表,并依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系;若是,则确定该用户ID和对应的其他类型的用户ID之间的置信度为1;否则,则根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值;能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性,并对同一终端不同用户差异性进行准确区分,从而实现单个用户全量线上数据的统一与回收,并统一用户的所有线上行为。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一中的一种用户ID关联方法的流程示意图;
图2是本发明实施例二中的一种用户ID关联系统的结构示意图;
图3是本发明实施例三中的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的实施例一提供一种用户ID关联方法的具体实施方式,参见图1,所述用户ID关联方法具体包括如下内容:
步骤100:获取目标对象在预设时段内的用户ID历史日志,其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID。
在步骤100中,所述用户ID关联系统获取目标对象在预设时段内的PC端、移动客户端和APP端的用户ID历史日志。可以理解的是,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,且所述用户ID的类型包括:UCID、UDID和UUID。
可以理解的是,UCID是用户通过手机号成功注册后系统为其生成的唯一ID,与电话号码一一对应,只有注册用户才有UCID。
可以理解的是,所述目标对象为目标企业或该目标企业的某一固定推广产品,且所述目标对象对应在PC端、移动客户端和APP端可以为该目标企业或该目标企业的某一固定推广产品在PC端的推广网页、移动客户端的推广网页和安装在移动终端的推广APP。
UDID是用户设备ID,当用户在手机APP里产生行为日志时,系统会根据用户的手机系统,为其生成一个UDID,例如Android系统是系统的IMEI号,IOS系统为设备的IDFA,UDID只在用户使用APP时产生,注册用户与未注册用户都有,并且与手机强关联,每个手机的UDID都是唯一的,PC和M站无UDID,如表1所示。
UUID是根据cookie生成的用户标识ID,如果用户清除浏览器cookie或者卸载重装APP,会生成新的UUID,注册用户与未注册用户都会有UUID。
表1
步骤200:基于所述用户ID历史日志确定不同的用户ID之间的关联特征。
在步骤200中,所述用户ID关联系统基于所述用户ID历史日志确定不同的用户ID之间的关联特征,且所述关联特征包括:第一特征、第二特征和第三特征;其中,所述第一特征为两个类型的用户ID同时出现的频次;所述第二特征为两个类型的用户ID自首次同时出现至最后一次同时出现之间的间隔时段,若两个类型的用户ID仅同时出现过一次,则将所述第二特征的值设置为第一预设值,且所述第一预设值小于或等于所述间隔时段,所述间隔时段小于或等于所述预设时段;所述第三特征为各类型的用户ID各自对应的历史偏好数据。
在一种具体举例中,所述第一特征为共现特征、第二特征为共存特征,以及,第三特征为需求特征。可以理解的是,共现特征是指两个不同类型的ID共同出现的频次,例如注册用户使用PC端,系统会同时记录UCID与UUID,而注册用户使用APP,系统会同时记录UCID,UDID与UUID。共存特征是指两个不同类型的ID从第一次共同出现到最后一次共同出现间隔的天数,如果只共现过一次,则只算一天。需求特征是指我们根据ID的用户日志,计算此ID的用户偏好,例如用户浏览关注的房源价格范围,居室数目等等,来表征该ID的用户需求。
步骤300:根据所述用户ID历史日志建立用户ID映射关系列表,其中,所述用户ID映射关系列表中存储有每一个用户ID和对应的其他用户ID之间的对应关系。
步骤400:根据所述用户ID映射关系列表,依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系;若当前的用户ID和对应的其他类型的用户ID之间是一一映射关系,则进入步骤500;否则进入步骤600。
步骤500:确定该用户ID和对应的其他类型的用户ID之间的置信度为1;
步骤600:根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值。
在步骤600中,所述用户ID关联系统在当前的用户ID和对应的其他类型的用户ID不是一一映射关系时,对该用户ID和对应的其他类型的用户ID之间的第一特征、第二特征和第三特征进行加权计算,并对加权计算的结果进行归一化处理,得到该用户信息中的各类型的用户ID之间的置信度的值。
从上述描述可知,本发明的实施例中的用户ID关联方法,能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性,并对同一终端不同用户差异性进行准确区分,从而实现单个用户全量线上数据的统一与回收,并统一用户的所有线上行为。
在一种具体实施方式中,本发明还提供所述用户ID关联方法中步骤100的具体实施方式,所述步骤100具体包括如下内容:
获取目标对象在预设时段内的PC端、移动客户端和APP端的用户ID历史日志;其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,且所述用户ID的类型包括:UCID、UDID和UUID。
从上述描述可知,本发明的实施例中的用户ID关联方法,通过准确获取目标对象在预设时段内的用户ID历史日志,能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性。
在一种具体实施方式中,本发明还提供所述用户ID关联方法中步骤200的具体实施方式,所述步骤200具体包括如下内容:
基于所述用户ID历史日志确定不同的用户ID之间的关联特征,且所述关联特征包括:第一特征、第二特征和第三特征;其中,所述第一特征为两个类型的用户ID同时出现的频次;所述第二特征为两个类型的用户ID自首次同时出现至最后一次同时出现之间的间隔时段,若两个类型的用户ID仅同时出现过一次,则将所述第二特征的值设置为第一预设值,且所述第一预设值小于或等于所述间隔时段,所述间隔时段小于或等于所述预设时段;所述第三特征为各类型的用户ID各自对应的历史偏好数据。
从上述描述可知,本发明的实施例中的用户ID关联方法,通过基于所述用户ID历史日志准确且快速地确定不同的用户ID之间的关联特征,能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性。
在一种具体实施方式中,本发明还提供所述用户ID关联方法中步骤300的具体实施方式,所述步骤300具体包括如下内容:
若当前的用户ID和对应的其他类型的用户ID不是一一映射关系,则对该用户ID和对应的其他类型的用户ID之间的第一特征、第二特征和第三特征进行加权计算,并对加权计算的结果进行归一化处理,得到该用户信息中的各类型的用户ID之间的置信度的值。
从上述描述可知,本发明的实施例中的用户ID关联方法,能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性,并对同一终端不同用户差异性进行准确区分,从而实现单个用户全量线上数据的统一与回收,并统一用户的所有线上行为。
为进一步的说明本方案,本发明还提供一种用户ID关联方法的应用实例,所述用户ID关联方法的应用实例具体包括如下内容:
以房产交易企业为例,本应用实例通过采用关联分析算法,有效挖掘不同终端用户关联性,区分同一终端不同用户差异性,建立用户ID映射关系列表,从而实现对同一用户的完整线上日志收集。
即通过收集不同终端下用户的线上行为日志,采用关联分析算法进行相关性分析,从而实现对同一用户多个ID的打通,统一用户的所有线上行为。
目前用户线上主要有三种类型的用户ID,分别是UCID,UDID和UUID。
UCID是用户通过手机号成功注册后系统为其生成的唯一ID,与电话号码一一对应,只有注册用户才有UCID。
UDID是用户设备ID,当用户在手机APP里产生行为日志时,系统会根据用户的手机系统,为其生成一个UDID,例如Android系统是系统的IMEI号,IOS系统为设备的IDFA,UDID只在用户使用APP时产生,注册用户与未注册用户都有,并且与手机强关联,每个手机的UDID都是唯一的,PC和M站无UDID。
UUID是根据cookie生成的用户标识ID,如果用户清除浏览器cookie或者卸载重装APP,会生成新的UUID,注册用户与未注册用户都会有UUID。
本应用实例主要解决问题包括两类:
(1)同一用户使用不同终端时,如何将各终端的ID映射为同一用户
(2)同一终端被不同用户使用时,如何判断该终端的归属人,并且去除非归属人记录。
为解决上述问题,本应用实例的技术方案具体包括如下内容:
S1:收集三端历史用户全量日志,包括ucid日志,udid日志,uuid日志,存储到数据库中。
S2:建立三类特征,分别为共现特征,共存特征和需求特征。共现特征是指两个不同类型的ID共同出现的频次,例如注册用户使用PC端,系统会同时记录UCID与UUID,而注册用户使用APP,系统会同时记录UCID,UDID与UUID。共存特征是指两个不同类型的ID从第一次共同出现到最后一次共同出现间隔的天数,如果只共现过一次,则只算一天。需求特征是指我们根据ID的用户日志,计算此ID的用户偏好,例如用户浏览关注的房源价格范围,居室数目等等,来表征该ID的用户需求。
S3:根据上述得到的三类特征,即可解决上面两个问题。首先建立所有ID的共现关系映射,如果ID之间存在一一映射,则认为不存在歧义,ID之间的置信度为1。如果ID之间存在一对多,或多对多关系,则对每对ID计算三类特征的加权得分,最后进行归一化得到两个ID直接的置信度。举例如系统存在一个UUID对应两个UCID,此类情况属于同一终端被两个注册用户使用过,需要找到设备归属人。采用上述方法分别计算UUID与两个UCID的三类特征值,加权求和,然后分别除以总和得到各自的占比,即为每个UCID与该UUID的置信度。
置信度=α×共现特征+β×共存特征+γ×需求特征
从上述描述可知,本发明的应用实例提供的用户ID关联方法,能够有效实现不同终端同一用户ID的关联,并有效解决同一终端被不同用户使用时设备归属人问题,能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性,并对同一终端不同用户差异性进行准确区分,从而实现单个用户全量线上数据的统一与回收,并统一用户的所有线上行为。
本发明的实施例二提供一种能实现所述用户ID关联方法的全部内容的用户ID关联系统的具体实施方式,参见图2,所述用户ID关联系统具体包括如下内容:
用户ID历史日志获取模块10,用于获取目标对象在预设时段内的用户ID历史日志,其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID。
在用户ID历史日志获取模块10中,用户ID历史日志接收单元,用于获取目标对象在预设时段内的PC端、移动客户端和APP端的用户ID历史日志;其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,且所述用户ID的类型包括:UCID、UDID和UUID。
关联特征确定模块20,用于基于所述用户ID历史日志确定不同的用户ID之间的关联特征。
在关联特征确定模块20中,关联特征获取单元,用于基于所述用户ID历史日志确定不同的用户ID之间的关联特征,且所述关联特征包括:第一特征、第二特征和第三特征;其中,所述第一特征为两个类型的用户ID同时出现的频次;所述第二特征为两个类型的用户ID自首次同时出现至最后一次同时出现之间的间隔时段,若两个类型的用户ID仅同时出现过一次,则将所述第二特征的值设置为第一预设值,且所述第一预设值小于或等于所述间隔时段,所述间隔时段小于或等于所述预设时段;所述第三特征为各类型的用户ID各自对应的历史偏好数据。
用户ID映射关系列表建立模块30,用于根据所述用户ID历史日志建立用户ID映射关系列表,其中,所述用户ID映射关系列表中存储有每一个用户ID和对应的其他用户ID之间的对应关系。
映射关系判断模块40,用于根据所述用户ID映射关系列表,依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系。
第一置信度设置模块50,用于在当前的用户ID和对应的其他类型的用户ID之间是一一映射关系时,确定该用户ID和对应的其他类型的用户ID之间的置信度为1。
第二置信度设置模块60,用于在当前的用户ID和对应的其他类型的用户ID不是一一映射关系时,根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值。
在所述第二置信度设置模块60中,关联分析计算单元,用于在当前的用户ID和对应的其他类型的用户ID不是一一映射关系时,对该用户ID和对应的其他类型的用户ID之间的第一特征、第二特征和第三特征进行加权计算,并对加权计算的结果进行归一化处理,得到该用户信息中的各类型的用户ID之间的置信度的值。
本发明提供的用户ID关联系统的实施例具体可以用于执行上述用户ID关联方法的实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
从上述描述可知,本发明的应用实例提供的用户ID关联系统,能够有效实现不同终端同一用户ID的关联,并有效解决同一终端被不同用户使用时设备归属人问题,能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性,并对同一终端不同用户差异性进行准确区分,从而实现单个用户全量线上数据的统一与回收,并统一用户的所有线上行为。
本发明的实施例三提供能够实现上述用户ID关联方法中全部步骤的一种电子设备的具体实施方式,参见图3,所述电子设备具体包括如下内容:
处理器(processor)601、存储器(memory)602、通信接口(CommunicationsInterface)603和总线604;
其中,所述处理器601、存储器602、通信接口603通过所述总线604完成相互间的通信;所述通信接口603用于实现用户ID关联系统及用户端等之间的信息传输;
所述处理器601用于调用所述存储器602中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例一中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤100:获取目标对象在预设时段内的用户ID历史日志,其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID。
在步骤100中,所述用户ID关联系统获取目标对象在预设时段内的PC端、移动客户端和APP端的用户ID历史日志。可以理解的是,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,且所述用户ID的类型包括:UCID、UDID和UUID。
可以理解的是,UCID是用户通过手机号成功注册后系统为其生成的唯一ID,与电话号码一一对应,只有注册用户才有UCID。
可以理解的是,所述目标对象为目标企业或该目标企业的某一固定推广产品,且所述目标对象对应在PC端、移动客户端和APP端可以为该目标企业或该目标企业的某一固定推广产品在PC端的推广网页、移动客户端的推广网页和安装在移动终端的推广APP。
UDID是用户设备ID,当用户在手机APP里产生行为日志时,系统会根据用户的手机系统,为其生成一个UDID,例如Android系统是系统的IMEI号,IOS系统为设备的IDFA,UDID只在用户使用APP时产生,注册用户与未注册用户都有,并且与手机强关联,每个手机的UDID都是唯一的,PC和M站无UDID。
UUID是根据cookie生成的用户标识ID,如果用户清除浏览器cookie或者卸载重装APP,会生成新的UUID,注册用户与未注册用户都会有UUID。
步骤200:基于所述用户ID历史日志确定不同的用户ID之间的关联特征。
在步骤200中,所述用户ID关联系统基于所述用户ID历史日志确定不同的用户ID之间的关联特征,且所述关联特征包括:第一特征、第二特征和第三特征;其中,所述第一特征为两个类型的用户ID同时出现的频次;所述第二特征为两个类型的用户ID自首次同时出现至最后一次同时出现之间的间隔时段,若两个类型的用户ID仅同时出现过一次,则将所述第二特征的值设置为第一预设值,且所述第一预设值小于或等于所述间隔时段,所述间隔时段小于或等于所述预设时段;所述第三特征为各类型的用户ID各自对应的历史偏好数据。
在一种具体举例中,所述第一特征为共现特征、第二特征为共存特征,以及,第三特征为需求特征。可以理解的是,共现特征是指两个不同类型的ID共同出现的频次,例如注册用户使用PC端,系统会同时记录UCID与UUID,而注册用户使用APP,系统会同时记录UCID,UDID与UUID。共存特征是指两个不同类型的ID从第一次共同出现到最后一次共同出现间隔的天数,如果只共现过一次,则只算一天。需求特征是指我们根据ID的用户日志,计算此ID的用户偏好,例如用户浏览关注的房源价格范围,居室数目等等,来表征该ID的用户需求。
步骤300:根据所述用户ID历史日志建立用户ID映射关系列表,其中,所述用户ID映射关系列表中存储有每一个用户ID和对应的其他用户ID之间的对应关系。
步骤400:根据所述用户ID映射关系列表,依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系;若当前的用户ID和对应的其他类型的用户ID之间是一一映射关系,则进入步骤500;否则进入步骤600。
步骤500:确定该用户ID和对应的其他类型的用户ID之间的置信度为1;
步骤600:根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值。
在步骤600中,所述用户ID关联系统在当前的用户ID和对应的其他类型的用户ID不是一一映射关系时,对该用户ID和对应的其他类型的用户ID之间的第一特征、第二特征和第三特征进行加权计算,并对加权计算的结果进行归一化处理,得到该用户信息中的各类型的用户ID之间的置信度的值。
从上述描述可知,本发明的实施例中的电子设备,能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性,并对同一终端不同用户差异性进行准确区分,从而实现单个用户全量线上数据的统一与回收,并统一用户的所有线上行为。
本发明的实施例四提供能够实现上述用户ID关联方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例一的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤100:获取目标对象在预设时段内的用户ID历史日志,其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID。
在步骤100中,所述用户ID关联系统获取目标对象在预设时段内的PC端、移动客户端和APP端的用户ID历史日志。可以理解的是,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,且所述用户ID的类型包括:UCID、UDID和UUID。
可以理解的是,UCID是用户通过手机号成功注册后系统为其生成的唯一ID,与电话号码一一对应,只有注册用户才有UCID。
可以理解的是,所述目标对象为目标企业或该目标企业的某一固定推广产品,且所述目标对象对应在PC端、移动客户端和APP端可以为该目标企业或该目标企业的某一固定推广产品在PC端的推广网页、移动客户端的推广网页和安装在移动终端的推广APP。
UDID是用户设备ID,当用户在手机APP里产生行为日志时,系统会根据用户的手机系统,为其生成一个UDID,例如Android系统是系统的IMEI号,IOS系统为设备的IDFA,UDID只在用户使用APP时产生,注册用户与未注册用户都有,并且与手机强关联,每个手机的UDID都是唯一的,PC和M站无UDID。
UUID是根据cookie生成的用户标识ID,如果用户清除浏览器cookie或者卸载重装APP,会生成新的UUID,注册用户与未注册用户都会有UUID。
步骤200:基于所述用户ID历史日志确定不同的用户ID之间的关联特征。
在步骤200中,所述用户ID关联系统基于所述用户ID历史日志确定不同的用户ID之间的关联特征,且所述关联特征包括:第一特征、第二特征和第三特征;其中,所述第一特征为两个类型的用户ID同时出现的频次;所述第二特征为两个类型的用户ID自首次同时出现至最后一次同时出现之间的间隔时段,若两个类型的用户ID仅同时出现过一次,则将所述第二特征的值设置为第一预设值,且所述第一预设值小于或等于所述间隔时段,所述间隔时段小于或等于所述预设时段;所述第三特征为各类型的用户ID各自对应的历史偏好数据。
在一种具体举例中,所述第一特征为共现特征、第二特征为共存特征,以及,第三特征为需求特征。可以理解的是,共现特征是指两个不同类型的ID共同出现的频次,例如注册用户使用PC端,系统会同时记录UCID与UUID,而注册用户使用APP,系统会同时记录UCID,UDID与UUID。共存特征是指两个不同类型的ID从第一次共同出现到最后一次共同出现间隔的天数,如果只共现过一次,则只算一天。需求特征是指我们根据ID的用户日志,计算此ID的用户偏好,例如用户浏览关注的房源价格范围,居室数目等等,来表征该ID的用户需求。
步骤300:根据所述用户ID历史日志建立用户ID映射关系列表,其中,所述用户ID映射关系列表中存储有每一个用户ID和对应的其他用户ID之间的对应关系。
步骤400:根据所述用户ID映射关系列表,依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系;若当前的用户ID和对应的其他类型的用户ID之间是一一映射关系,则进入步骤500;否则进入步骤600。
步骤500:确定该用户ID和对应的其他类型的用户ID之间的置信度为1;
步骤600:根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值。
在步骤600中,所述用户ID关联系统在当前的用户ID和对应的其他类型的用户ID不是一一映射关系时,对该用户ID和对应的其他类型的用户ID之间的第一特征、第二特征和第三特征进行加权计算,并对加权计算的结果进行归一化处理,得到该用户信息中的各类型的用户ID之间的置信度的值。
从上述描述可知,本发明的实施例中的计算机可读存储介质,能够准确且快速的实现相关的用户ID的关联,能够有效地挖掘不同终端用户之间的关联性,并对同一终端不同用户差异性进行准确区分,从而实现单个用户全量线上数据的统一与回收,并统一用户的所有线上行为。
在本发明的描述中,需要说明的是,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种用户ID关联方法,其特征在于,所述用户ID关联方法包括:
获取目标对象在预设时段内的用户ID历史日志,其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID;
基于所述用户ID历史日志确定不同的用户ID之间的关联特征;
根据所述用户ID历史日志建立用户ID映射关系列表,其中,所述用户ID映射关系列表中存储有每一个用户ID和对应的其他用户ID之间的对应关系;
以及,根据所述用户ID映射关系列表,依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系;
若当前的用户ID和对应的其他类型的用户ID之间是一一映射关系,则确定该用户ID和对应的其他类型的用户ID之间的置信度为1;
若当前的用户ID和对应的其他类型的用户ID不是一一映射关系,则根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值。
2.根据权利要求1所述的用户ID关联方法,其特征在于,所述获取目标对象在预设时段内的用户ID历史日志,其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,包括:
获取目标对象在预设时段内的PC端、移动客户端和APP端的用户ID历史日志;
其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,且所述用户ID的类型包括:UCID、UDID和UUID。
3.根据权利要求1所述的用户ID关联方法,其特征在于,所述基于所述用户ID历史日志确定不同的用户ID之间的关联特征,包括:
基于所述用户ID历史日志确定不同的用户ID之间的关联特征,且所述关联特征包括:第一特征、第二特征和第三特征;
其中,所述第一特征为两个类型的用户ID同时出现的频次;
所述第二特征为两个类型的用户ID自首次同时出现至最后一次同时出现之间的间隔时段,若两个类型的用户ID仅同时出现过一次,则将所述第二特征的值设置为第一预设值,且所述第一预设值小于或等于所述间隔时段,所述间隔时段小于或等于所述预设时段;
所述第三特征为各类型的用户ID各自对应的历史偏好数据。
4.根据权利要求3所述的用户ID关联方法,其特征在于,所述若当前的用户ID和对应的其他类型的用户ID不是一一映射关系,则根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值,包括:
若当前的用户ID和对应的其他类型的用户ID不是一一映射关系,则对该用户ID和对应的其他类型的用户ID之间的第一特征、第二特征和第三特征进行加权计算,并对加权计算的结果进行归一化处理,得到该用户信息中的各类型的用户ID之间的置信度的值。
5.一种用户ID关联系统,其特征在于,所述用户ID关联系统包括:
用户ID历史日志获取模块,用于获取目标对象在预设时段内的用户ID历史日志,其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID;
关联特征确定模块,用于基于所述用户ID历史日志确定不同的用户ID之间的关联特征;
用户ID映射关系列表建立模块,用于根据所述用户ID历史日志建立用户ID映射关系列表,其中,所述用户ID映射关系列表中存储有每一个用户ID和对应的其他用户ID之间的对应关系;
映射关系判断模块,用于根据所述用户ID映射关系列表,依次判断每一个用户ID和对应的其他类型的用户ID之间是否为一一映射关系;
第一置信度设置模块,用于在当前的用户ID和对应的其他类型的用户ID之间是一一映射关系时,确定该用户ID和对应的其他类型的用户ID之间的置信度为1;
第二置信度设置模块,用于在当前的用户ID和对应的其他类型的用户ID不是一一映射关系时,根据该用户ID和对应的其他类型的用户ID之间的关联特征,基于关联分析算法确定该用户ID和对应的其他类型的用户ID之间的置信度的值。
6.根据权利要求5所述的用户ID关联系统,其特征在于,所述用户ID历史日志获取模块包括:
用户ID历史日志接收单元,用于获取目标对象在预设时段内的PC端、移动客户端和APP端的用户ID历史日志;
其中,所述用户ID历史日志包括接收自不同的用户信息中的各用户ID的历史日志,且每个用户信息中均包括一种或多种类型的用户ID,且所述用户ID的类型包括:UCID、UDID和UUID。
7.根据权利要求5所述的用户ID关联系统,其特征在于,所述关联特征确定模块包括:
关联特征获取单元,用于基于所述用户ID历史日志确定不同的用户ID之间的关联特征,且所述关联特征包括:第一特征、第二特征和第三特征;
其中,所述第一特征为两个类型的用户ID同时出现的频次;
所述第二特征为两个类型的用户ID自首次同时出现至最后一次同时出现之间的间隔时段,若两个类型的用户ID仅同时出现过一次,则将所述第二特征的值设置为第一预设值,且所述第一预设值小于或等于所述间隔时段,所述间隔时段小于或等于所述预设时段;
所述第三特征为各类型的用户ID各自对应的历史偏好数据。
8.根据权利要求7所述的用户ID关联系统,其特征在于,所述第二置信度设置模块包括:
关联分析计算单元,用于在当前的用户ID和对应的其他类型的用户ID不是一一映射关系时,对该用户ID和对应的其他类型的用户ID之间的第一特征、第二特征和第三特征进行加权计算,并对加权计算的结果进行归一化处理,得到该用户信息中的各类型的用户ID之间的置信度的值。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述用户ID关联方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至4任一项所述用户ID关联方法的步骤。
CN201810124423.2A 2018-02-07 2018-02-07 用户id关联方法及装置 Active CN108491424B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810124423.2A CN108491424B (zh) 2018-02-07 2018-02-07 用户id关联方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810124423.2A CN108491424B (zh) 2018-02-07 2018-02-07 用户id关联方法及装置

Publications (2)

Publication Number Publication Date
CN108491424A true CN108491424A (zh) 2018-09-04
CN108491424B CN108491424B (zh) 2021-02-12

Family

ID=63344751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810124423.2A Active CN108491424B (zh) 2018-02-07 2018-02-07 用户id关联方法及装置

Country Status (1)

Country Link
CN (1) CN108491424B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929105A (zh) * 2019-11-28 2020-03-27 杭州云徙科技有限公司 一种基于大数据技术的用户id关联方法
CN111340062A (zh) * 2020-02-04 2020-06-26 恩亿科(北京)数据科技有限公司 一种映射关系确定方法及装置
CN112085322A (zh) * 2020-07-30 2020-12-15 北京明略软件系统有限公司 基于鲜活度指标的关联可信度评估方法和装置
CN113114770A (zh) * 2021-04-14 2021-07-13 每日互动股份有限公司 用户识别方法、电子设备和计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120041939A1 (en) * 2010-07-21 2012-02-16 Lior Amsterdamski System and Method for Unification of User Identifiers in Web Harvesting
US20130290711A1 (en) * 2012-04-27 2013-10-31 Google Inc. Providing content to a user across multiple devices
CN103731284A (zh) * 2012-10-11 2014-04-16 腾讯科技(深圳)有限公司 关联多个网络帐号的方法和系统
CN105099729A (zh) * 2014-04-22 2015-11-25 阿里巴巴集团控股有限公司 一种识别用户身份标识的方法和装置
CN105354249A (zh) * 2015-10-16 2016-02-24 晶赞广告(上海)有限公司 多账号关联方法、装置及电子设备
CN106548342A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 一种可信设备确定方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120041939A1 (en) * 2010-07-21 2012-02-16 Lior Amsterdamski System and Method for Unification of User Identifiers in Web Harvesting
US20130290711A1 (en) * 2012-04-27 2013-10-31 Google Inc. Providing content to a user across multiple devices
CN103731284A (zh) * 2012-10-11 2014-04-16 腾讯科技(深圳)有限公司 关联多个网络帐号的方法和系统
CN105099729A (zh) * 2014-04-22 2015-11-25 阿里巴巴集团控股有限公司 一种识别用户身份标识的方法和装置
CN106548342A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 一种可信设备确定方法及装置
CN105354249A (zh) * 2015-10-16 2016-02-24 晶赞广告(上海)有限公司 多账号关联方法、装置及电子设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929105A (zh) * 2019-11-28 2020-03-27 杭州云徙科技有限公司 一种基于大数据技术的用户id关联方法
CN110929105B (zh) * 2019-11-28 2022-11-29 广东云徙智能科技有限公司 一种基于大数据技术的用户id关联方法
CN111340062A (zh) * 2020-02-04 2020-06-26 恩亿科(北京)数据科技有限公司 一种映射关系确定方法及装置
CN112085322A (zh) * 2020-07-30 2020-12-15 北京明略软件系统有限公司 基于鲜活度指标的关联可信度评估方法和装置
CN112085322B (zh) * 2020-07-30 2024-01-23 北京明略软件系统有限公司 基于鲜活度指标的关联可信度评估方法和装置
CN113114770A (zh) * 2021-04-14 2021-07-13 每日互动股份有限公司 用户识别方法、电子设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN108491424B (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
CN108009915B (zh) 一种欺诈用户社区的标记方法及相关装置
CN108491424A (zh) 用户id关联方法及装置
CN107818133B (zh) 一种基于大数据的居民区网络能力分析方法及系统
CN108737535A (zh) 一种消息推送方法、存储介质和服务器
CN105898085B (zh) 骚扰通信账号的识别方法及装置
CN110300084B (zh) 基于ip地址的画像方法和装置,电子设备,可读介质
WO2020257993A1 (zh) 内容推送方法、装置、服务端及存储介质
CN104935462A (zh) 一种端服务器部署方法及装置
CN113449986A (zh) 一种业务分配方法、装置、服务器及存储介质
CN110113748A (zh) 骚扰电话监控方法、装置
CN105959306A (zh) Ip地址的识别方法及装置
CN108376155A (zh) 一种地理位置信息确定方法及装置
CN111415168B (zh) 一种交易告警的方法和装置
CN109685570B (zh) 房地产客户来源检测方法、终端及服务器
CN109450963A (zh) 消息推送方法及终端设备
CN107645583A (zh) 一种联系人排序方法、移动终端及计算机可读存储介质
CN109146122A (zh) 一种概率预测方法、装置、电子设备及计算机存储介质
CN110457604A (zh) 基于人工智能的推荐方法及相关设备
CN110446256A (zh) 一种基于超宽带的基站实现定位的方法及设备
CN109600738A (zh) 用户信息更新方法、装置、设备和存储介质
CN108469938A (zh) 电子书的阅读提醒方法、装置及终端设备
CN113468240A (zh) 基于移动终端上网行为大数据分析的方法
CN111382175B (zh) 一种房屋信息获取方法及装置
CN111125536A (zh) 信息推送方法、装置、计算机设备及存储介质
Mahajan et al. A novel method for automatic electricity billing system using Ad-Hoc networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100085 Floor 101 102-1, No. 35 Building, No. 2 Hospital, Xierqi West Road, Haidian District, Beijing

Applicant after: Seashell Housing (Beijing) Technology Co.,Ltd.

Address before: 100085 Floor 101 102-1, No. 35 Building, No. 2 Hospital, Xierqi West Road, Haidian District, Beijing

Applicant before: LIANJIA(BEIJING) TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
TA01 Transfer of patent application right

Effective date of registration: 20210114

Address after: 101309 room 24, 62 Farm Road, Erjie village, Yangzhen, Shunyi District, Beijing

Applicant after: Beijing fangjianghu Technology Co.,Ltd.

Address before: 100085 Floor 101 102-1, No. 35 Building, No. 2 Hospital, Xierqi West Road, Haidian District, Beijing

Applicant before: Seashell Housing (Beijing) Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant