CN111651741A - 用户身份识别方法、装置、计算机设备和存储介质 - Google Patents
用户身份识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111651741A CN111651741A CN202010506653.2A CN202010506653A CN111651741A CN 111651741 A CN111651741 A CN 111651741A CN 202010506653 A CN202010506653 A CN 202010506653A CN 111651741 A CN111651741 A CN 111651741A
- Authority
- CN
- China
- Prior art keywords
- data
- account
- user
- type
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 230000000875 corresponding effect Effects 0.000 claims abstract description 61
- 230000002596 correlated effect Effects 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 241000700605 Viruses Species 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种用户身份识别方法、装置、计算机设备和存储介质。所述方法包括:获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据;识别历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;根据账号标识数据以及历史账号关系数据,构建每个用户的用户关系数据,每个用户关系数据中包含的账号相互关联且属于同一用户;根据用户关系数据以及用户登录数据,确定第二类应用程序对应的用户身份标识。采用本方法能够在用户未登录第二类应用程序的情况下,根据第一类应用程序的用户登录数据以及用户关系数据,识别出用户身份。
Description
技术领域
本申请涉及互联网技术领域,特别是涉及一种用户身份识别方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的发展,移动终端的应用程序种类越来也丰富,比如即时通讯、电子邮件、网络预订酒店机票、软件管家、手机管家等,这些应用程序极大地方便了人们的工作和生活。这些应用程序一般需要用户先注册,然后给每个用户分配一个唯一账号,该账号与用户的注册信息关联,后续用户可以通过账号和密码登录,可以实现对用户的各种行为数据进行记录。根据用户的行为数据构建用户画像,再基于用户画像对用户进行产品推荐,因此,对用户身份进行识别很有必要。
目前市面上的应用程序可以分为两类:强账号应用程序和弱账号应用程序,强账号应用程序是指用户登录对于应用程序的基础功能是必需的,比如社交软件,弱账号应用程序是指用户登录对于应用程序的基础功能不是必需的,比如手机管家软件,其基础功能是病毒查杀、垃圾清理和骚扰拦截。传统的用户身份识别方法,用户需要经过应用程序的登录流程才可以识别到用户身份,比如在用户更换移动终端登录应用程序时,需要输入之前在该应用程序注册的账号和密码完成登录流程,才可以识别出是哪个用户。即传统的用户身份识别方法在用户未登录相应的应用程序的情况下,无法识别出用户身份。
发明内容
基于此,有必要针对上述技术问题,提供一种能够在用户未登录应用程序的情况下,识别出用户身份的用户身份识别方法、装置、计算机设备和存储介质。
一种用户身份识别方法,所述方法包括:
获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,所述第一类应用程序与所述第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作;
识别所述历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;
根据所述账号标识数据以及所述历史账号关系数据,构建每个用户的用户关系数据,每个所述用户关系数据中包含的账号相互关联且属于同一用户;
根据所述用户关系数据以及所述用户登录数据,确定所述第二类应用程序对应的用户身份标识。
一种用户身份识别装置,所述装置包括:
数据获取模块,用于获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,所述第一类应用程序与所述第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作;
账号标识生成模块,用于识别所述历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;
关系数据构建模块,用于根据所述账号标识数据以及所述历史账号关系数据,构建每个用户的用户关系数据,每个所述用户关系数据中包含的账号相互关联且属于同一用户;
身份标识确定模块,用于根据所述用户关系数据以及所述用户登录数据,确定所述第二类应用程序对应的用户身份标识。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,所述第一类应用程序与所述第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作;
识别所述历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;
根据所述账号标识数据以及所述历史账号关系数据,构建每个用户的用户关系数据,每个所述用户关系数据中包含的账号相互关联且属于同一用户;
根据所述用户关系数据以及所述用户登录数据,确定所述第二类应用程序对应的用户身份标识。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,所述第一类应用程序与所述第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作;
识别所述历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;
根据所述账号标识数据以及所述历史账号关系数据,构建每个用户的用户关系数据,每个所述用户关系数据中包含的账号相互关联且属于同一用户;
根据所述用户关系数据以及所述用户登录数据,确定所述第二类应用程序对应的用户身份标识。
上述用户身份识别方法、装置、计算机设备和存储介质,通过获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,第一类应用程序与第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作;识别历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;根据账号标识数据以及历史账号关系数据,构建每个用户的用户关系数据,每个用户关系数据中包含的账号相互关联且属于同一用户;根据用户关系数据以及用户登录数据,确定第二类应用程序对应的用户身份标识;通过构建用户关系数据,将用户的各种账号关联,在用户未登录第二类应用程序的情况下,根据第一类应用程序的用户登录数据以及用户关系数据,识别出用户身份。
附图说明
图1为一个实施例中用户身份识别方法的应用环境图;
图2为一个实施例中用户身份识别方法的流程示意图;
图3为一个实施例中账号关系数据过滤步骤的流程示意图;
图4为一个实施例中RFM模型和GBDT模型计算置信度的准确率示意图;
图5为另一个实施例中用户身份识别方法的流程示意图;
图6为一个实施例中的连通图示意图;
图7为一个实施例中用户身份识别装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的用户身份识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。用户通过终端102登录第一类应用程序,将第一类应用程序的用户登录数据发送至服务器104。服务器104获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,第一类应用程序与第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作;识别历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;根据账号标识数据以及历史账号关系数据,构建每个用户的用户关系数据,每个用户关系数据中包含的账号相互关联且属于同一用户;根据用户关系数据以及用户登录数据,确定第二类应用程序对应的用户身份标识。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种用户身份识别方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,第一类应用程序与第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作。
第一类应用程序和第二类应用程序是相对概念,第一类应用程序实现对应功能时用户必须登录,第二类应用程序实现对应功能时用户可以选择是否登录;或者第一类应用程序实现对应功能时用户可以选择是否登录,第二类应用程序实现对应功能时用户必须登录。本实施例中以强账号应用程序作为第一类应用程序,弱账号应用程序作为第二类应用程序。非必要的,也可以将弱账号应用程序作为第一类应用程序,强账号应用程序作为第二类应用程序。强账号应用程序是指用户登录对于应用程序的基础功能是必需的,比如社交软件,用户登录数据是指用户登录应用程序时输入的用户信息,比如社交网络账号、手机号等。弱账号应用程序是指用户登录对于应用程序的基础功能不是必需的,比如手机管家软件,其基础功能是病毒查杀、垃圾清理和骚扰拦截。历史账号数据是指移动终端相关的账号,比如移动设备标识(IMEI,International Mobile Equipment Identity)、国际移动用户识别码(IMSI,International Mobile Subscriber Identification Number)、手机号、社交网络账号等,用户可以通过移动终端中应用程序的功能,授权移动终端上报历史账号数据至服务器。历史账号关系数据是指各个账号之间的映射关系,比如移动设备标识与手机号之间的关系、移动设备标识与社交网络账号之间的关系、应用程序给不同用户分配的账号标识与手机号之间的关系、应用程序给不同用户分配的账号标识与社交网络账号之间的关系。
步骤204,识别历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据。
账号类型是指账号的分类属性,比如账号是属于手机号、移动设备标识还是社交网络账号。对同一账号类型的账号分配序列标识,这样可以保证同一个账号的标识不变,比如历史账号数据中包括移动设备标识数据和社交网络账号数据,对移动设备标识数据分配序列标识,比如IMEI1、IMEI2、IMEI3等,对社交网络账号数据分配序列标识,比如IM1、IM2、IM3等。
步骤206,根据账号标识数据以及历史账号关系数据,构建每个用户的用户关系数据,每个用户关系数据中包含的账号相互关联且属于同一用户。
比如,可以基于连通图算法,根据账号标识数据以及历史账号关系数据,构建多个连通图,一个连通图包含一个用户的各种账号。也可以基于社区发现算法,根据账号标识数据以及历史账号关系数据,获得每个用户对应的社区结构,一个社区结构包含一个用户的各种账号。具体地,根据账号标识数据以及历史账号关系数据,构建每个用户的用户关系数据包括:将账号标识数据中的每个账号标识作为节点,根据历史账号关系数据确定各个节点之间的关系;根据各个节点以及节点之间的关系,构建节点关系图;对节点关系图进行分割,得到每个用户的连通图。在节点关系图中,如果任意两个节点之间均有路径相连,包含这些节点的图即为连通图,由此可知,将同一用户的节点聚合至一个连通图中,同一连通图中的各个节点与同一用户关系紧密。
在一个实施例中,根据账号标识数据以及历史账号关系数据,构建每个用户的用户关系数据包括:根据账号标识数据以及历史账号关系数据,获得账号关系图;将账号关系图中的每个节点作为一个社区,计算账号关系图的初始模块度;将每个节点划分至其他社区,获得对应的社区结构以及社区结构的目标模块度;根据目标模块度以及初始模块度,重新划分社区,获得每个用户对应的社区结构。在得到账号关系图后,为分析账号关系图中的哪些节点属于同一个用户,服务器可以通过社区发现算法对账号关系图进行社区划分,将划分至同一社区的节点作为同一个用户的节点。可以通过模块度的方法衡量社区结构强度,模块度的大小主要取决于社区结构中的节点社区分配,即社区划分情况,因此,模块度可以用来定量的衡量社区划分质量,其值越接近1,表示划分的社区结构的强度越强,即划分质量越好。将账号关系图中的每个节点作为一个社区,计算账号关系图的初始模块度,由于初始模块度对应的账号关系图中每个社区包括一个节点,初始模块度为0。服务器在将某个节点划分至其他社区,计算该节点划分至其他社区后,目标社区结构的目标模块度,根据目标模块度与初始模块度的差值,确定该节点划分在哪个社区合适,即划分质量最佳,将该节点划分至差值最大时对应的社区,将在社区划分时存在交集的节点划分至同一社区,由此得到每个用户对应的社区结构。
步骤208,根据用户关系数据以及用户登录数据,确定第二类应用程序对应的用户身份标识。
每个用户关系数据中包含的账号相互关联且属于同一用户,因此可以根据用户登录数据中的账号在用户关系数据中查找,得到对应的用户,由此确定第二类应用程序对应的用户身份标识,即用户无需登录第二类应用程序,根据第一类应用程序的用户登录数据以及用户关系数据即可识别出用户身份。
上述用户身份识别方法中,通过获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,第一类应用程序与第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作;识别历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;根据账号标识数据以及历史账号关系数据,构建每个用户的用户关系数据,每个用户关系数据中包含的账号相互关联且属于同一用户;根据用户关系数据以及用户登录数据,确定第二类应用程序对应的用户身份标识;通过构建用户关系数据,将用户的各种账号关联,在用户未登录第二类应用程序的情况下,根据第一类应用程序的用户登录数据以及用户关系数据,识别出用户身份。
在一个实施例中,如图3所示,接收历史账号数据以及历史账号关系数据包括:步骤302,获取初始账号数据以及初始账号关系数据;步骤304,识别初始账号关系数据的目标关系类型,根据目标关系类型计算初始账号关系数据的置信度;步骤306,过滤置信度低于预设阈值的初始账号关系数据,获得历史账号关系数据以及对应的历史账号数据。账号关系数据中可能存在用户A在用户B的手机上登录用户A的社交网络账号,这条移动设备标识与社交网络账号之间的关系数据,对于用户A来说,该移动设备标识不是用户A的,对于用户B来说,该社交网络账号不是用户B的,因此,这条移动设备标识与社交网络账号之间的关系数据是异常干扰数据,需要剔除这种异常干扰数据。本实施例中,通过计算初始账号关系数据的置信度,过滤置信度低于预设阈值的初始账号关系数据,能够达到剔除异常干扰数据的目的,且在进行置信度计算时,识别初始账号关系数据的目标关系类型,根据目标关系类型计算初始账号关系数据的置信度,可以提高置信度计算的精准度,由此有效剔除异常干扰数据。
在一个实施例中,根据目标关系类型计算初始账号关系数据的置信度之前,还包括:获取账号关系样本数据、对应的置信度样本数据及账号关系样本数据的账号关系类型;通过预设第一模型对账号关系样本数据进行置信度计算,获得第一置信度计算结果,通过预设第二模型对账号关系样本数据进行置信度计算,获得第二置信度计算结果;根据账号关系类型、第一置信度计算结果、第二置信度计算结果以及置信度样本数据,确定账号关系类型与预设第一模型、预设第二模型之间的关系;根据目标关系类型计算初始账号关系数据的置信度包括:根据目标关系类型、账号关系类型与预设第一模型、预设第二模型之间的关系,确定目标关系类型对应的模型;通过目标关系类型对应的模型,计算初始账号关系数据的置信度。不同类型的账号关系数据,通过不同的模型进行置信度计算,所得到的置信度准确率不同,因此,对于不同类型的账号关系数据,需要通过置信度准确率更高的模型进行置信度计算,以提高置信度计算的精准度。比如,移动设备标识与手机号之间的关系数据、移动设备标识与社交网络账号之间的关系数据,如果通过A模型进行置信度计算,准确率为a;如果通过B模型进行置信度计算,准确率为b;a高于b,则在实际应用场景中,选用A模型进行置信度计算。可以通过正负样本数据对GBDT模型进行训练,通过已训练的GBDT模型进行置信度计算。对于移动设备标识与手机号之间的关系数据、移动设备标识与社交网络账号之间的关系数据,通过已训练的GBDT模型计算置信度,如图4所示,GBDT模型的AUC(AreaUnder Curve,ROC曲线下与坐标轴围成的面积)为0.98,准确率为96.9%;对于应用程序给不同用户分配的账号标识与手机号之间的关系数据、应用程序给不同用户分配的账号标识与社交网络账号之间的关系数据,通过RFM模型计算置信度,如图4所示,RFM模型的准确率为96.3%。
在RFM模型中,R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M(Monetary)表示客户在最近一段时间内购买的金额。本方案中用到的R表示上报时间,F表示上报频率,M表示上报源。对第一类型的账号关系数据,分别从上报源、上报时间和上报次数三个方面进行评分。其中,基于上报源的评分可通过公式log(sum(各来源的分数)/50)/2计算,该公式表征的物理意义是上报源越多,分数越高;由于账号关系数据可能有多种数据源,比如可以分为主动上报源和被动上报源,具体地,主动上报源赋值2分,被动上报源根据计算出的与主动上报源之间的准确率赋予不同值,和主动上报源越相似,分数越高,范围为1分~1.9分,取对数是为了对分数进行归一化,除以2的目的是将分值归一化至-1~0之间。基于上报时间的评分可通过公式log(1/(1+(n/30)*n))/4计算,该公式的物理意义为上报时间越近,分数越高;取对数是为了对分数进行归一化,除以4的目的是将分值归一化至-1~0之间,n表示最近上报时间距离当前的天数,1+(n/30)*n表示距离当前时间越长,得到的分数越低,同时为了优化时间衰减,对于一个30天内上报的手机号给的分值更高,衰减更慢,而超过30天上报的数据,则衰减更快,因此分母加上(n/30)优化。基于上报次数的评分可通过公式log(n/7200)/4计算,该公式的物理意义为上报的次数越多,分数越高;取对数是为了对分数进行归一化,除以4的目的是将分值归一化至-1~0之间,n是指账号关系数据的上报次数。对基于上报源的评分、基于上报时间的评分及基于上报次数的评分进行加权计算,得到账号关系数据的置信度,具体的加权计算公式为:0.7*基于上报时间的评分+0.2*基于上报源的评分+0.1*基于上报次数的评分。该加权计算公式的物理意义为上报源,上报时间和上报次数三个方面,上报时间是最重要的一个因素,因此权重更高,其它两个权重更低一些。
在一个实施例中,用户身份识别方法还包括:推送第二类应用程序的登录界面;接收第二类应用程序的用户登录反馈数据,用户登录反馈数据由用户基于登录界面进行交互得到;当检测到用户登录反馈数据为空时,进入获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据的步骤。第二类应用程序设置有用户登录功能,用户可以选择是否登录,对于未登录的用户,通过本申请中提供的用户身份识别方法,识别未登录用户的身份。
在一个实施例中,用户身份识别方法还包括:当检测到用户登录反馈数据不为空时,根据用户登录反馈数据,确定第二类应用程序对应的用户身份标识。第二类应用程序设置有用户登录功能,当用户选择登录时,通过登录账号识别登录用户的身份。
本申请还提供一种应用场景,该应用场景应用上述的用户身份识别方法。具体地,该用户身份识别方法在该应用场景的应用如下:获取账号关系数据,识别账号关系数据的关系类型,当关系类型为预设第一类型时,通过RFM模型计算账号关系数据的置信度,当关系类型为预设第二类型时,通过GBDT模型计算账号关系数据的置信度;过滤置信度低于预设阈值的账号关系数据,对满足条件的账号关系数据以及对应的账号数据,基于连通图算法进行处理,获得每个用户的连通图,每个连通图中包含的账号相互关联且属于同一用户,对应的流程图如图5所示。基于Spark的连通图算法需要使用整型数据作为顶点标识,且为了保证同一账号的顶点标识不变,对满足条件的账号进行编号,生成连通图中的顶点。比如,一条移动设备标识与手机号之间的关系数据为:864399999999999_18988888888,假设该条关系数据中对应的移动设备标识编号为123,手机号编号为678,将移动设备标识编号123和手机号编号678作为两个顶点,分别为起点和终点,由此将123_678关系数据,融入了连通图中。一个实施例中的连通图示意如图6所示,左边的连通图和右边的连通图分别对应一个用户,左边的连通图中的关系数据包括imei1-phone1(移动设备标识1与手机号1的关系)、phone1-imei2(手机号1与移动设备标识2的关系)、imei1-phone2(移动设备标识1与手机号2的关系)、imei1-qq1(移动设备标识1与社交网络账号1的关系)、imei1-imsi1(移动设备标识1与移动用户识别码1的关系)、phone 2-qq2(手机号2与社交网络账号2的关系)、qq1-qq2(社交网络账号1与社交网络账号2的关系),右边的连通图中的关系数据包括imei3-phone3(移动设备标识3与手机号3的关系)、imei3-qq3(移动设备标识3与社交网络账号3的关系)、imei3-imsi2(移动设备标识3与移动用户识别码2的关系)、phone3-imei4(手机号3与移动设备标识4的关系)、qq3-imei4(社交网络账号3与移动设备标识4的关系)、imsi2-imei4(移动用户识别码2与移动设备标识4的关系)。通过连通图算法对所有的账号关系数据进行处理,得到多个连通图,一个连通图对应一个用户的数据,将每个连通图中最小的顶点标识作为该用户的用户标识,每个连通图生成一个用户标识。比如在用户更新手机的场景中,用户在新手机上登录了社交账号,可以通过登录的社交账号将新旧手机关联,新旧手机对应的移动设备标识在同一连通图中,由此可以识别出新手机的用户身份。通过连通图对用户的各种账号关联,可以有效应对用户在更换新机时,无需登录手机管家即可识别出用户身份,由此解决了弱账号应用程序用户身份识别的问题。在准确识别出用户身份之后,根据用户在旧手机上的用户画像,比如软件爱好和游戏爱好等信息,可以对用户使用新手机场景进行精准的产品推荐,比如软件推荐、广告和游戏推荐,提升用户体验和商业价值。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种用户身份识别装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:数据获取模块702、账号标识生成模块704、关系数据构建模块706和身份标识确定模块708,其中:
数据获取模块702,用于获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,第一类应用程序与第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作;
账号标识生成模块704,用于识别历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;
关系数据构建模块706,用于根据账号标识数据以及历史账号关系数据,构建每个用户的用户关系数据,每个用户关系数据中包含的账号相互关联且属于同一用户;
身份标识确定模块708,用于根据用户关系数据以及用户登录数据,确定第二类应用程序对应的用户身份标识。
在一个实施例中,数据获取模块还用于获取初始账号数据以及初始账号关系数据;识别初始账号关系数据的目标关系类型,根据目标关系类型计算初始账号关系数据的置信度;过滤置信度低于预设阈值的初始账号关系数据,获得历史账号关系数据以及对应的历史账号数据。
在一个实施例中,用户身份识别装置还包括模型关系建立模块,用于获取账号关系样本数据、对应的置信度样本数据及账号关系样本数据的账号关系类型;通过预设第一模型对账号关系样本数据进行置信度计算,获得第一置信度计算结果,通过预设第二模型对账号关系样本数据进行置信度计算,获得第二置信度计算结果;根据账号关系类型、第一置信度计算结果、第二置信度计算结果以及置信度样本数据,确定账号关系类型与预设第一模型、预设第二模型之间的关系;数据获取模块还用于根据目标关系类型、账号关系类型与预设第一模型、预设第二模型之间的关系,确定目标关系类型对应的模型;通过目标关系类型对应的模型,计算初始账号关系数据的置信度。
在一个实施例中,关系数据构建模块还用于将账号标识数据中的每个账号标识作为节点,根据历史账号关系数据确定各个节点之间的关系;根据各个节点以及节点之间的关系,构建节点关系图;对节点关系图进行分割,得到每个用户的连通图。
在一个实施例中,关系数据构建模块还用于根据账号标识数据以及历史账号关系数据,获得账号关系图;将账号关系图中的每个节点作为一个社区,计算账号关系图的初始模块度;将每个节点划分至其他社区,获得对应的社区结构以及社区结构的目标模块度;根据目标模块度以及初始模块度,重新划分社区,获得每个用户对应的社区结构。
在一个实施例中,用户身份识别装置还包括未登录处理模块,用于推送第二类应用程序的登录界面;接收第二类应用程序的用户登录反馈数据,用户登录反馈数据由用户基于登录界面进行交互得到;当检测到用户登录反馈数据为空时,进入获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据的步骤。
在一个实施例中,用户身份识别装置还包括正常登录处理模块,用于当检测到用户登录反馈数据不为空时,根据用户登录反馈数据,确定第二类应用程序对应的用户身份标识。
关于用户身份识别装置的具体限定可以参见上文中对于用户身份识别方法的限定,在此不再赘述。上述用户身份识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储账号关系数据、连通图等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户身份识别方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种用户身份识别方法,其特征在于,所述方法包括:
获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,所述第一类应用程序与所述第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作;
识别所述历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;
根据所述账号标识数据以及所述历史账号关系数据,构建每个用户的用户关系数据,每个所述用户关系数据中包含的账号相互关联且属于同一用户;
根据所述用户关系数据以及所述用户登录数据,确定所述第二类应用程序对应的用户身份标识。
2.根据权利要求1所述的方法,其特征在于,所述接收历史账号数据以及历史账号关系数据包括:
获取初始账号数据以及初始账号关系数据;
识别所述初始账号关系数据的目标关系类型,根据所述目标关系类型计算所述初始账号关系数据的置信度;
过滤所述置信度低于预设阈值的初始账号关系数据,获得历史账号关系数据以及对应的历史账号数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标关系类型计算所述初始账号关系数据的置信度之前,还包括:
获取账号关系样本数据、对应的置信度样本数据及所述账号关系样本数据的账号关系类型;
通过预设第一模型对所述账号关系样本数据进行置信度计算,获得第一置信度计算结果,通过预设第二模型对所述账号关系样本数据进行置信度计算,获得第二置信度计算结果;
根据所述账号关系类型、所述第一置信度计算结果、所述第二置信度计算结果以及所述置信度样本数据,确定所述账号关系类型与所述预设第一模型、所述预设第二模型之间的关系;
所述根据所述目标关系类型计算所述初始账号关系数据的置信度包括:
根据所述目标关系类型、所述账号关系类型与所述预设第一模型、所述预设第二模型之间的关系,确定所述目标关系类型对应的模型;
通过所述目标关系类型对应的模型,计算所述初始账号关系数据的置信度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述账号标识数据以及所述历史账号关系数据,构建每个用户的用户关系数据包括:
将所述账号标识数据中的每个账号标识作为节点,根据所述历史账号关系数据确定各个所述节点之间的关系;
根据各个所述节点以及所述节点之间的关系,构建节点关系图;
对所述节点关系图进行分割,得到每个用户的连通图。
5.根据权利要求1所述的方法,其特征在于,所述根据所述账号标识数据以及所述历史账号关系数据,构建每个用户的用户关系数据包括:
根据所述账号标识数据以及所述历史账号关系数据,获得账号关系图;
将所述账号关系图中的每个节点作为一个社区,计算所述账号关系图的初始模块度;
将所述每个节点划分至其他社区,获得对应的社区结构以及所述社区结构的目标模块度;
根据所述目标模块度以及所述初始模块度,重新划分社区,获得每个用户对应的社区结构。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
推送所述第二类应用程序的登录界面;
接收所述第二类应用程序的用户登录反馈数据,所述用户登录反馈数据由用户基于所述登录界面进行交互得到;
当检测到所述用户登录反馈数据为空时,进入所述获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据的步骤。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当检测到所述用户登录反馈数据不为空时,根据所述用户登录反馈数据,确定所述第二类应用程序对应的用户身份标识。
8.一种用户身份识别装置,其特征在于,所述装置包括:
数据获取模块,用于获取第一类应用程序的用户登录数据以及待身份识别的第二类应用程序,接收历史账号数据以及历史账号关系数据,所述第一类应用程序与所述第二类应用程序的区别在于实现对应功能时是否需执行用户登录操作;
账号标识生成模块,用于识别所述历史账号数据的账号类型,对同一账号类型的账号分配序列标识,获得账号标识数据;
关系数据构建模块,用于根据所述账号标识数据以及所述历史账号关系数据,构建每个用户的用户关系数据,每个所述用户关系数据中包含的账号相互关联且属于同一用户;
身份标识确定模块,用于根据所述用户关系数据以及所述用户登录数据,确定所述第二类应用程序对应的用户身份标识。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010506653.2A CN111651741B (zh) | 2020-06-05 | 2020-06-05 | 用户身份识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010506653.2A CN111651741B (zh) | 2020-06-05 | 2020-06-05 | 用户身份识别方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111651741A true CN111651741A (zh) | 2020-09-11 |
CN111651741B CN111651741B (zh) | 2024-05-07 |
Family
ID=72348883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010506653.2A Active CN111651741B (zh) | 2020-06-05 | 2020-06-05 | 用户身份识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111651741B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113420148A (zh) * | 2021-06-22 | 2021-09-21 | 中国平安人寿保险股份有限公司 | 用于敏感内容质检模型的训练文本采集方法、系统及设备 |
CN113783834A (zh) * | 2021-07-29 | 2021-12-10 | 深圳思为科技有限公司 | 一种整合兼容多种登录方式中冗余数据的方法及相关装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011149403A1 (en) * | 2010-05-24 | 2011-12-01 | Telefonaktiebolaget L M Ericsson (Publ) | Classification of network users based on corresponding social network behavior |
CN103716333A (zh) * | 2014-01-10 | 2014-04-09 | 北京飞流九天科技有限公司 | 用于管理应用账号的方法、终端、服务器和系统 |
CN106301978A (zh) * | 2015-05-26 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 团伙成员账号的识别方法、装置及设备 |
WO2017080398A1 (zh) * | 2015-11-12 | 2017-05-18 | 阿里巴巴集团控股有限公司 | 一种用户群体的划分方法和装置 |
US20180232530A1 (en) * | 2017-02-10 | 2018-08-16 | Facebook, Inc. | Methods and Systems for a Frictionless Login to a Service |
CN109558951A (zh) * | 2018-11-23 | 2019-04-02 | 北京知道创宇信息技术有限公司 | 一种欺诈账号检测方法、装置及其存储介质 |
CN109978549A (zh) * | 2019-02-19 | 2019-07-05 | 北京三快在线科技有限公司 | 识别二次放号的方法和装置、存储介质 |
CN110222484A (zh) * | 2019-04-28 | 2019-09-10 | 五八有限公司 | 一种用户身份识别方法、装置、电子设备及存储介质 |
WO2020034760A1 (zh) * | 2018-08-15 | 2020-02-20 | 阿里巴巴集团控股有限公司 | 一种身份信息的识别方法及装置 |
US20200112562A1 (en) * | 2018-10-05 | 2020-04-09 | Mastercard Technologies Canada ULC | Account recommendation based on server-side, persistent device identification |
WO2020087778A1 (zh) * | 2018-11-02 | 2020-05-07 | 深圳壹账通智能科技有限公司 | 多系统登录方法、装置、计算机设备和存储介质 |
-
2020
- 2020-06-05 CN CN202010506653.2A patent/CN111651741B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011149403A1 (en) * | 2010-05-24 | 2011-12-01 | Telefonaktiebolaget L M Ericsson (Publ) | Classification of network users based on corresponding social network behavior |
CN103716333A (zh) * | 2014-01-10 | 2014-04-09 | 北京飞流九天科技有限公司 | 用于管理应用账号的方法、终端、服务器和系统 |
CN106301978A (zh) * | 2015-05-26 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 团伙成员账号的识别方法、装置及设备 |
WO2017080398A1 (zh) * | 2015-11-12 | 2017-05-18 | 阿里巴巴集团控股有限公司 | 一种用户群体的划分方法和装置 |
US20180232530A1 (en) * | 2017-02-10 | 2018-08-16 | Facebook, Inc. | Methods and Systems for a Frictionless Login to a Service |
WO2020034760A1 (zh) * | 2018-08-15 | 2020-02-20 | 阿里巴巴集团控股有限公司 | 一种身份信息的识别方法及装置 |
US20200112562A1 (en) * | 2018-10-05 | 2020-04-09 | Mastercard Technologies Canada ULC | Account recommendation based on server-side, persistent device identification |
WO2020087778A1 (zh) * | 2018-11-02 | 2020-05-07 | 深圳壹账通智能科技有限公司 | 多系统登录方法、装置、计算机设备和存储介质 |
CN109558951A (zh) * | 2018-11-23 | 2019-04-02 | 北京知道创宇信息技术有限公司 | 一种欺诈账号检测方法、装置及其存储介质 |
CN109978549A (zh) * | 2019-02-19 | 2019-07-05 | 北京三快在线科技有限公司 | 识别二次放号的方法和装置、存储介质 |
CN110222484A (zh) * | 2019-04-28 | 2019-09-10 | 五八有限公司 | 一种用户身份识别方法、装置、电子设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113420148A (zh) * | 2021-06-22 | 2021-09-21 | 中国平安人寿保险股份有限公司 | 用于敏感内容质检模型的训练文本采集方法、系统及设备 |
CN113420148B (zh) * | 2021-06-22 | 2024-02-09 | 中国平安人寿保险股份有限公司 | 用于敏感内容质检模型的训练文本采集方法、系统及设备 |
CN113783834A (zh) * | 2021-07-29 | 2021-12-10 | 深圳思为科技有限公司 | 一种整合兼容多种登录方式中冗余数据的方法及相关装置 |
CN113783834B (zh) * | 2021-07-29 | 2023-04-18 | 深圳思为科技有限公司 | 一种整合兼容多种登录方式中冗余数据的方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111651741B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11323347B2 (en) | Systems and methods for social graph data analytics to determine connectivity within a community | |
US10887177B2 (en) | Calculating trust scores based on social graph statistics | |
US10187277B2 (en) | Scoring using distributed database with encrypted communications for credit-granting and identification verification | |
CN107169768B (zh) | 异常交易数据的获取方法和装置 | |
CN107305611B (zh) | 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置 | |
CN110647921B (zh) | 一种用户行为预测方法、装置、设备及存储介质 | |
US20130166601A1 (en) | Systems and methods for conducting reliable assessments with connectivity information | |
WO2021114921A1 (zh) | 基于隐私保护的关系网络构建方法及装置 | |
CN110033302A (zh) | 恶意账户识别方法及装置 | |
CN111651741B (zh) | 用户身份识别方法、装置、计算机设备和存储介质 | |
CN110555172A (zh) | 用户关系挖掘方法及装置、电子设备和存储介质 | |
CN110874638B (zh) | 面向行为分析的元知识联邦方法、装置、电子设备及系统 | |
CN109658120B (zh) | 一种业务数据处理方法以及装置 | |
CN109525933B (zh) | 位置隐私保护方法及装置 | |
CN104992060A (zh) | 用户年龄估计方法及装置 | |
CN110677269B (zh) | 通信用户关系的确定方法、装置和计算机可读存储介质 | |
CN112905987B (zh) | 账号识别方法、装置、服务器及存储介质 | |
CN115208938B (zh) | 用户行为管控方法及装置、计算机可读存储介质 | |
CN116415237B (zh) | 风险设备识别方法、装置、计算机设备和存储介质 | |
CN116934417A (zh) | 对象识别方法、装置、计算机设备、存储介质及程序产品 | |
CN113962712A (zh) | 一种诈骗团伙的预测方法及相关设备 | |
CN117786562A (zh) | 异常检测方法、装置、电子设备及存储介质 | |
CN111259952A (zh) | 异常用户识别方法、装置、计算机设备及存储介质 | |
CN115222405A (zh) | 一种风险评估方法和装置 | |
CN117216370A (zh) | 在线服务的噪声记录的确定方法和装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |