CN113940033B - 用户识别方法及相关产品 - Google Patents
用户识别方法及相关产品 Download PDFInfo
- Publication number
- CN113940033B CN113940033B CN201980097342.0A CN201980097342A CN113940033B CN 113940033 B CN113940033 B CN 113940033B CN 201980097342 A CN201980097342 A CN 201980097342A CN 113940033 B CN113940033 B CN 113940033B
- Authority
- CN
- China
- Prior art keywords
- relation
- relationship
- pairs
- target
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/40—Network security protocols
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
Abstract
本申请实施例公开了一种用户识别方法及相关产品,该方法包括:通过获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对,将多个关系对划分为多个第一关系对和多个第二关系对,根据多个第一关系对确定至少一个参考用户,根据至少一个第一关系对集合和多个第二关系对确定至少一个目标用户,如此,可根据有关联的账号和设备标识和无关联的账号和设备标识进行用户识别,从而,可更加准确地得到用户识别结果。
Description
技术领域
本申请涉及通信技术领域,具体涉及一种用户识别方法及相关产品。
背景技术
目前,现有技术中进行用户识别的方式一般是通过比较用户的两个不同账号发布的信息,例如,提取用户的第一帐号发布的信息中的第一关键词集合,提取用户的第二帐号发布的信息中的第二关键词集合,根据第一关键词集合和第二关键词集合中相同关键词的出现概率来判断两个账号是否属于同一用户。
但是,若同一用户的两个账号分别为在两个不同网络平台上注册的账号,则两个账号发布的信息可能属于不同类型,或者,两个账号为在同一网络平台上注册的账号,但一个为生活学习时使用的账号,一个为工作时使用的账号,则两个账号一般不会发布相似的信息,因此,可能导致识别两个账号是否属于同一用户的结果不准确。
发明内容
本申请实施例提供了一种用户识别方法及相关产品,可根据有关联的账号和设备标识和无关联的账号和设备标识进行用户识别,从而,可更加准确地得到用户识别结果。
第一方面,本申请实施例提供一种用户识别方法,所述方法包括:
获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对;
将所述多个关系对划分为多个第一关系对和多个第二关系对,其中,所述多个第一关系对中每一第一关系对中的账号与其他第一关系对中的账号相同,或者,所述多个第一关系对中每一第一关系对中的设备标识与其他第一关系对中的设备标识相同;所述多个第二关系对中每一第二关系对中的账号与其他第二关系对中的账号均不同,且多个第二关系对中每一第二关系对中的设备标识与其他第二关系对中的设备标识均不同;
根据所述多个第一关系对确定至少一个参考用户,所述至少一个参考用户对应至少一个第一关系对集合,所述至少一个第一关系对集合与所述至少一个参考用户一一对应,所述至少一个第一关系对集合中每一第一关系对集合包含对应参考用户的多个第一关系对;
根据所述至少一个第一关系对集合和所述多个第二关系对确定至少一个目标用户。
第二方面,本申请实施例提供了一种用户识别装置,所述用户识别装置包括:
获取单元,用于获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对;
划分单元,用于将所述多个关系对划分为多个第一关系对和多个第二关系对,其中,所述多个第一关系对中每一第一关系对中的账号与其他第一关系对中的账号相同,或者,所述多个第一关系对中每一第一关系对中的设备标识与其他第一关系对中的设备标识相同;所述多个第二关系对中每一第二关系对中的账号与其他第二关系对中的账号均不同,且多个第二关系对中每一第二关系对中的设备标识与其他第二关系对中的设备标识均不同;
确定单元,用户根据所述多个第一关系对确定至少一个参考用户,所述至少一个参考用户对应至少一个第一关系对集合,所述至少一个第一关系对集合与所述至少一个参考用户一一对应,所述至少一个第一关系对集合中每一第一关系对集合包含对应参考用户的多个第一关系对;
所述确定单元,用于根据所述至少一个第一关系对集合和所述多个第二关系对确定至少一个目标用户。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口,以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
附图说明
下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本申请实施例提供的一种电子设备的结构示意图;
图1B是本申请实施例提供的一种用户识别方法的流程示意图;
图1C是本申请实施例提供的一种构建账号-标识关系图谱的演示示意图;
图1D是本申请实施例提供的一种将账号-标识关系图谱划分为多个账号-标识关系分图谱的演示示意图;
图1E是本申请实施例提供的一种参考特征关系图谱的演示示意图;
图2是本申请实施例公开的另一种用户识别方法的流程示意图;
图3是本申请实施例公开的另一种用户识别方法的流程示意图;
图4是本申请实施例公开的另一种电子设备的结构示意图;
图5A是本申请实施例公开的一种用户识别装置的结构示意图;
图5B是本申请实施例公开的如图5A所示的一种用户识别装置的变型结构。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所涉及到的电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(user equipment,UE),移动台(mobile station,MS),终端设备(terminaldevice),服务器等等。为方便描述,上面提到的设备统称为电子设备。下面对本申请实施例进行详细介绍。
请参阅图1A,图1A是本申请实施例公开的一种电子设备的结构示意图,电子设备100可以包括控制电路,该控制电路可以包括存储和处理电路110。该存储和处理电路110可以存储器,例如硬盘驱动存储器,非易失性存储器(例如闪存或用于形成固态驱动器的其它电子可编程只读存储器等),易失性存储器(例如静态或动态随机存取存储器等)等,本申请实施例不作限制。存储和处理电路110中的处理电路可以用于控制电子设备100的运转。该处理电路可以基于一个或多个微处理器,微控制器,数字主从耳机切换控制器,基带处理器,功率管理单元,音频编解码器芯片,专用集成电路,显示驱动器集成电路等来实现。
存储和处理电路110可用于运行电子设备100中的软件,例如互联网浏览应用程序,互联网协议语音(voice over internet protocol,VOIP)电话呼叫应用程序,电子邮件应用程序,媒体播放应用程序,操作系统功能等。这些软件可以用于执行一些控制操作,例如,基于照相机的图像采集,基于环境光传感器的环境光测量,基于接近传感器的接近传感器测量,基于诸如发光二极管的状态指示灯等状态指示器实现的信息显示功能,基于触摸传感器的触摸事件检测,与在多个(例如分层的)显示器上显示信息相关联的功能,与执行无线通信功能相关联的操作,与收集和产生音频信号相关联的操作,与收集和处理按钮按压事件数据相关联的控制操作,以及电子设备100中其它功能等,本申请实施例不作限制。
电子设备100还可以包括输入-输出电路150。输入-输出电路150可用于使电子设备100实现数据的输入和输出,即允许电子设备100从外部设备接收数据和也允许电子设备100将数据从电子设备100输出至外部设备。输入-输出电路150可以进一步包括传感器170。传感器170可以包括环境光传感器,基于光和电容的接近传感器,触摸传感器(例如,基于光触摸传感器和/或电容式触摸传感器,其中,触摸传感器可以是触控显示屏的一部分,也可以作为一个触摸传感器结构独立使用),加速度传感器,重力传感器,和其它传感器等。
输入-输出电路150还可以包括一个或多个显示器,例如显示器130。显示器130可以包括液晶显示器,有机发光二极管显示器,电子墨水显示器,等离子显示器,使用其它显示技术的显示器中一种或者几种的组合。显示器130可以包括触摸传感器阵列(即,显示器130可以是触控显示屏)。触摸传感器可以是由透明的触摸传感器电极(例如氧化铟锡(ITO)电极)阵列形成的电容式触摸传感器,或者可以是使用其它触摸技术形成的触摸传感器,例如音波触控,压敏触摸,电阻触摸,光学触摸等,本申请实施例不作限制。
音频组件140可以用于为电子设备100提供音频输入和输出功能。电子设备100中的音频组件140可以包括扬声器,麦克风,蜂鸣器,音调发生器以及其它用于产生和检测声音的组件。
通信电路120可以用于为电子设备100提供与外部设备通信的能力。通信电路120可以包括模拟和数字输入-输出接口电路,和基于射频信号和/或光信号的无线通信电路。通信电路120中的无线通信电路可以包括射频收发器电路、功率放大器电路、低噪声放大器、开关、滤波器和天线。举例来说,通信电路120中的无线通信电路可以包括用于通过发射和接收近场耦合电磁信号来支持近场通信(near field communication,NFC)的电路。例如,通信电路120可以包括近场通信天线和近场通信收发器。通信电路120还可以包括蜂窝电话收发器和天线,无线局域网收发器电路和天线等。
电子设备100还可以进一步包括电池,电力管理电路和其它输入-输出单元160。输入-输出单元160可以包括按钮,操纵杆,点击轮,滚动轮,触摸板,小键盘,键盘,照相机,发光二极管和其它状态指示器等。
用户可以通过输入-输出电路150输入命令来控制电子设备100的操作,并且可以使用输入-输出电路150的输出数据以实现接收来自电子设备100的状态信息和其它输出。
请参阅图1B,图1B是本申请实施例提供的一种用户识别方法的流程示意图,本实施例中所描述的用户识别方法,该用户识别方法包括:
101、获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对。
其中,上述账号是指用户在网络平台上注册的账号,例如,用户使用电子设备上的应用时注册的账号。上述设备标识是指使用账号时登录账号的电子设备,设备标识例如可以是国际移动设备标识IMEI,
其中,上述多个关系对中每一关系对用于表示在对应使用时段内,在对应的设备标识所属的电子设备上使用对应的账号的关系。例如,在第一使用时段,在第一设备上登录了第一账号,则可获取第一账号-第一设备标识之间的关系对,在第二使用时段,在第二设备上登录了第一账号,则可获取第一账号-第二设备标识之间的关系对,在第三使用时段,在第二设备上登录了第三账号,则可获取第三账号-第二设备标识之间的关系对,在第四使用时段,在第一设备上登录了第二账号,则可获取第二账号-第一设备标识之间的关系对,以此类推,可以获取多个使用时段对应的多个不同的关系对。
102、将所述多个关系对划分为多个第一关系对和多个第二关系对,其中,所述多个第一关系对中每一第一关系对中的账号与其他第一关系对中的账号相同,或者,所述多个第一关系对中每一第一关系对中的设备标识与其他第一关系对中的设备标识相同;所述多个第二关系对中每一第二关系对中的账号与其他第二关系对中的账号均不同,且多个第二关系对中每一第二关系对中的设备标识与其他第二关系对中的设备标识均不同。
本申请实施例中,可根据将多个关系对之间的关联性将多个关系对划分为多个第一关系对和多个第二关系对,其中,多个第一关系对中每一第一关系对中的账号与其他第一关系对中的账号相同,或者,所述多个第一关系对中每一第一关系对中的设备标识与其他第一关系对中的设备标识相同,例如,在第一使用时段,在第一设备上登录了第一账号,可得到第一账号-第一设备标识之间的关系对,在第二使用时段,在第二设备上登录了第一账号,可得到第一账号-第二设备标识之间的关系对,表明两个关系对中的账号相同、设备标识不同;又例如,在第二使用时段,在第二设备上登录了第一账号,可得到第一账号-第二设备标识之间的关系对,在第三使用时段,在第二设备上登录了第三账号,可得到第三账号-第二设备标识之间的关系对,表明两个关系对中的设备标识相同、账号不同,从而,可将上述三个关系对划分为第一关系对。
其中,多个第二关系对中每一第二关系对中的账号与其他第二关系对中的账号均不同,且多个第二关系对中每一第二关系对中的设备标识与其他第二关系对中的设备标识均不同。例如,在t1-t2时间段内,在设备A上登录了账号a,可得到账号a-设备标识A之间的关系对,在所有关系对中除账号a-设备标识A之间的关系对以外,没有其他关系对中包含账号a或者设备标识A,即,账号a和设备标识A在所有关系对中仅出现一次,可将此类关系对划分为第二关系对,从而,多个第二关系对中每一第二关系对与其他关系对均没有关联。
103、根据所述多个第一关系对确定至少一个参考用户,所述至少一个参考用户对应至少一个第一关系对集合,所述至少一个第一关系对集合与所述至少一个参考用户一一对应,所述至少一个第一关系对集合中每一第一关系对集合包含对应参考用户的多个第一关系对。
本申请实施例中,由于多个第一关系对之间存在关联,多个第一关系对可能对应同一用户,也可能对应不同用户,例如,在第一使用时段,第一用户在第一设备上使用第一账号,在第二使用时段,第一用户在第二设备上登录第一账号,则可根据第一使用时段对应的第一账号使用信息和第二使用时段对应的第二账号使用信息确定上述第一使用时段和第二使用时段是否为同一用户。因此,可针对存在关联的多个第一关系对确定至少一个参考用户。
可选地,上述步骤103中,根据所述多个第一关系对确定至少一个参考用户,可包括以下步骤31-步骤36:
31、根据所述多个第一关系对构建账号-标识关系图谱;
其中,可根据多个第一关系对之间的关联关系构建账号-标识关系图谱,具体地,可将具有相同账号的不同关系对进行连接,将具有相同设备标识的不同关系对进行连接。
可选地,上述步骤31中,根据所述多个第一关系对构建账号-标识关系图谱,可包括以下步骤:
将所述多个第一关系对中每两个存在相同设备标识和不同账号的关系对进行连接,以及将所述多个第一关系对中每两个存在相同账号和不同设备标识的关系对进行连接,得到所述账号-标识关系图谱。
其中,针对多个第一关系对中每一第一关系对,可将该第一关系对中的账号与其他具有相同账号的第一关系对的相同账号进行连接,从而,可以将多个第一关系对连接成账号-标识关系图谱,如图1C所示,为本申请实施例提供的一种构建账号-标识关系图谱的演示示意图,在5个使用时段D1-D5内,分别对应5个第一关系对,其中,s1表示第一账号,i1标识第一设备标识,s2表示第二账号,i2标识第二设备标识,s3表示第三账号,i3标识第三设备标识,s1分别出现在两个关系对中,s2分别出现在两个关系对中,i1分别出现在两个关系对中,i2分别出现在两个关系对中,因此,可将5个关系对进行连接,得到账号-标识关系图谱。
32、从所述账号-标识关系图谱中选取设备标识相同,且账号不同的关系对组合,得到至少一个关系对组合,所述至少一个关系对组合中每一关系对组合包含设备标识相同且账号不同的两个关系对;
其中,上述账号-标识关系图谱是根据相同的账号或者设备标识将多个第一关系对进行连接得到的,因此,可选取其中存在相同设备标识,且账号不同的关系对组合,即每一关系对组合包含设备标识相同且账号不同的两个关系对,例如,如图1C中,第一使用时段D1对应的第一关系对和第四使用时段D4对应的第一关系对之间存在相同的设备标识i1,可选取D1和D4对应的两个第一关系对组成的关系对组合;第二使用时段D2对应的第一关系对和第三使用时段D3对应的第一关系对之间存在相同的设备标识i2,可选取D2和D3对应的两个第一关系对组成的关系对组合。
33、若所述至少一个关系对组合中存在满足第一预设条件的至少一个目标关系对组合;
本申请实施例中,在选取至少一个关系对组合后,可针对每一关系对组合,判断该关系对组合是否满足第一预设条件,进而,可将满足第一预设条件的关系对组合确定为目标关系对组合。
可选地,本申请实施例中,还可包括以下步骤:
A1、确定关系对组合i包含的两个账号对应的两个使用时段是否存在重合时段,所述关系对组合i为所述至少一个关系对组合中任一关系对组合;
A2、获取所述关系对组合i包含的所述两个账号在所述设备标识对应的电子设备上的两个第一特征集;
A3、根据所述两个第一特征集确定所述两个账号之间的第一相似度;
A4、若所述第一相似度小于第一预设阈值,且,所述两个使用时段之间的重合时段小于预设时长,确定所述关系对组合i为满足所述第一预设条件的目标关系对组合。
其中,针对关系对组合i,两个第一关系对中包含相同设备标识和不同的两个账号,从而,可确定使用两个账号对应的使用时段是否存在重合时段,若存在重合时段,且重合时段大于或等于预设时长,表明两个账号可能属于同一用户。
其中,可获取在相同的设备标识对应的电子设备上使用两个账号中每一账号对应的账号使用信息,得到两个账号使用信息,然后,对两个账号使用信息分别进行特征提取,得到两个第一特征集,每一第一特征集对应一个账号,进而,可根据两个第一特征集确定两个账号之间的第一相似度,具体地,可将两个第一特征集中的特征进行特征匹配,得到第一匹配值,若第一匹配值超过预设匹配值,可根据预设的匹配值和相似度之间的对应关系确定第一匹配值对应的第一相似度,若第一相似度大于或等于第一预设阈值,表明两个账号可能属于同一用户。
其中,在第一相似度小于第一预设阈值,并且,两个使用时段之间的重合时段小于预设时长时,表明两个账号可能不属于同一用户,可确定关系对组合i为满足第一预设条件的目标关系对组合。
其中,两个使用时段之间的重合时段小于预设时长,包括两个使用时段之间的重合时段为0的情况,此种情况下,两个使用时段之间不存在重合时段。
34、根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱;
其中,考虑到在存在满足第一预设条件的目标关系对组合时,表明可能存在不属于同一用户的多个账号,即账号-标识关系图谱中包括多个用户对应的关系对,因此,需要将账号-标识关系图谱进行划分,得到多个账号-标识关系分图谱。
可选地,上述步骤34中,根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱,可包括以下步骤:
将所述账号-标识关系图谱中满足所述第一预设条件的至少一个目标关系对组合中每一目标关系组合对进行拆分,得到多个账号-标识关系分图谱。
其中,可将账号-标识关系图谱中满足第一预设条件的至少一个目标关系对组合中每一目标关系组合对进行拆分,如图1D所示,为本申请实施例提供的一种将账号-标识关系图谱划分为多个账号-标识关系分图谱的演示示意图,如图1D所示,D1和D4对应的两个第一关系对组成的关系对组合中为满足第一预设条件的目标关系对组合,因此,可将连接的关系对进行拆分,得到拆分后的2个账号-标识关系分图谱。
35、确定所述多个账号-标识关系分图谱中每一账号-标识关系分图谱对应的参考用户,得到多个参考用户;
其中,在拆分后的多个账号-标识关系分图谱中,不存在满足第一预设条件的目标关系对组合,表明多个账号-标识关系分图谱中每一账号-标识关系分图谱可能对应一个参考用户,因此,可确定多个账号-标识关系分图谱中每一账号-标识关系分图谱对应的参考用户,得到多个参考用户,其中,每一参考用户对应的账号-标识关系分图谱包括的多个第一关系对,因此,每一参考用户对应一个包括多个第一关系对的第一关系对集合。
36、若所述至少一个关系对组合中不存在满足所述第一预设条件的目标关系对组合,确定所述账号-标识关系图谱对应的同一参考用户。
其中,若至少一个关系对组合中不存在满足所述第一预设条件的目标关系对组合,表明账号-标识关系图谱中不存在多个用户对应的账号或设备,因此,可确定账号-标识关系图谱对应的同一参考用户,同一参考用户对应多个第一关系对组成的第一关系对集合。
104、根据所述至少一个第一关系对集合和所述多个第二关系对确定至少一个目标用户。
本申请实施例中,由于步骤102和步骤103中的多个第一关系对为多个关系对中的部分关系对,因此,通过步骤103确定的至少一个参考用户还不能作为最终确定的用户识别结果,其中,至少一个参考用户对应的至少一个第一关系对集合,可作为互不关联的关系对集合,因此,可根据互不关联的至少一个第一关系对集合和互不关联的多个第二关系对确定至少一个目标用户,将至少一个目标用户作为用户识别结果,从而,可得到更加准确的用户识别结果。
可选地,上述步骤104中,根据所述至少一个第一关系对集合和所述多个第二关系对确定至少一个目标用户,可包括以下步骤:
41、获取所述至少一个第一关系对集合中每一第一关系对集合对应的第二特征集,以及获取所述多个第二关系对中每一第二关系对对应的第二特征集,得到多个第二特征集;
其中,为了统一描述,将获取到的至少一个第一关系对集合中每一第一关系对集合对应的特征集作为第二特征集,以及,将获取到的多个第二关系对中每一第二关系对对应的特征集作为第二特征集,从而,可得到多个第二特征集。
42、根据预设算法将所述多个第二特征集进行聚类,得到至少一个类;
其中,上述预设算法可包括以下至少一种:邻近(k-Nearest Neighbor,KNN)算法、均值(k-means clustering,K-means)算法、基于密度的聚类算法(Density-Based SpatialClustering of Applications with Noise,DBscan)等等。
43、确定所述至少一个类中每一类包含的多个第二特征集中每两个第二特征集之间的第二相似度,得到至少一个相似度集,所述至少一个相似度集与所述至少一个类一一对应,所述至少一个相似度集中每一相似度集包含多个第二相似度;
其中,针对每一类,可判断该类包含的多个第二特征集中,每两个第二特征集之间的第二相似度,得到包含多个相似度的相似度集,从而,可得到至少一个类对应的至少一个相似度集。
44、根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到至少一个分组;
其中,针对至少一个类中每一类,可根据该类对应的相似度集中的多个第二相似度,将该类包括的多个第二特征集进行分组。
可选地,上述步骤44中,根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到多个分组,可包括以下步骤:
B1、确定所述至少一个类中每一类对应的相似度集中的多个第二相似度中满足大于第二预设阈值的多个目标第二相似度,
B2、将所述至少一个类中每一类对应的相似度集中的多个目标第二相似度中每一目标第二相似度对应的两个第二特征集进行连接,得到至少一个参考特征关系图谱;
B3、将所述至少一个特征参考关系图谱中每一参考特征关系图谱对应的多个第二特征集划分为一组,得到至少一个分组。
本申请实施例中,针对至少一个类中每一类对应的相似度集中的多个第二相似度,可确定多个第二相似度中大于第二阈值的多个目标第二相似度,第二相似度越大,表明对第二相似度对应的两个第二特征集之间关联越大,因此,可将多个目标第二相似度中每一目标第二相似度对应的两个第二特征集进行连接,从而,可得到至少一个参考特征关系图谱,举例说明,请参阅图1E,图1E为本申请实施例中提供的一种参考特征关系图谱的演示示意图,其中,一个类中包括4个第二特征集,J1-J5表示5个不同的第二特征集,T1,T2,T3,...代表第二特征集中包括的特征,其中,第二特征集J1和第二特征集J2之间相似度大于第二预设阈值,第二特征集J2和第二特征集J3之间相似度大于第二预设阈值,第二特征集J4和第二特征集J5之间相似度大于第二预设阈值,因此,可将J1与J2进行连接,将J2与J3进行连接,将J4与J5进行连接,得到2个参考特征关系图谱。最后,可将至少一个特征参考关系图谱中每一参考特征关系图谱对应的多个第二特征集划分为一组,得到至少一个分组,即每一参考特征关系图谱对应一个分组,该分组包括参考特征关系图谱对应的多个第二特征集。
45、确定所述至少一个分组中每一分组对应的目标用户,得到至少一个目标用户。
本申请实施例中,在将多个第二特征集进行分组后,可确定至少一个分组中每一分组对应的目标用户,得到至少一个目标用户,其中,每一分组包括的多个第二特征集属于一个目标用户的特征集,其中,每一分组的多个第二特征集是根据同一个目标用户使用多个账号的多个账号使用信息进行特征提取得到,因此,可确定多个关系对中与每一分组的多个第二特征集对应的多个账号属于同一用户。
可选地,本申请实施例中,在根据所述至少一个第一关系对集合和所述多个第二关系对确定至少一个目标用户之后,还可包括以下步骤:
C1、获取第一目标用户对应的多个第一目标特征集,所述多个第一目标特征集为所述多个第二特征集中的部分特征集,所述第一目标用户为所述至少一个目标用户中的任一目标用户;
C2、将所述多个第一目标特征集中的相同特征进行连接,得到目标特征关系图谱;
C3、根据所述目标特征关系图谱构建所述第一目标用户的用户画像。
本申请实施例中,在根据多个关系对确定至少一个目标用户后,可根据第一目标用户对应的多个第一目标特征集构建第一目标用户对应的用户画像,其中,第一目标用户对应的多个第一目标特征集中每一第一目标特征集是从一个关系对中的账号使用信息中提取出来的,如此,可根据第一目标用户的多个账号的对应的多个第一目标特征集构建第一目标用户的用户画像,具体地,可将多个第一目标特征集中的相同特征进行连接,得到目标特征关系图谱,然后根据目标特征关系图谱构建第一目标用户的用户画像。
可选地,本申请实施例中,还可包括以下步骤:
D1、获取第二目标用户对应的多个第二目标特征集,所述多个第二目标特征集为所述多个第二特征集中的部分特征集,所述第二目标用户为所述至少一个目标用户中除所述第一目标用户以外的任一目标用户;
D2、根据所述多个第二目标特征集、所述多个第一目标特征集和预设判断规则确定所述第一目标用户和所述第二目标用户之间的用户关系。
其中,针对识别出来的至少一个目标用户中,第一目标用户和第二目标用户为两个不同的用户,本申请实施例中,可根据多个第二目标特征集、多个第一目标特征集和预设判断规则确定第一目标用户和所述第二目标用户之间的用户关系,例如,多个第二目标特征集、多个第一目标特征集中,存在地理位置特征相同和/或IP地址相同时,可确定第一目标用户和所述第二目标用户为亲属关系,进一步地,可根据第一目标用户的第一年龄、第一性别、第一职业等特征,以及第二目标用户的第二年龄、第二性别、第二职业等特征,确定第一目标用户和第二目标用户是夫妻关系,或者父母子女关系。
可以看出,本申请实施例中所描述的用户识别方法,通过获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对,将多个关系对划分为多个第一关系对和多个第二关系对,根据多个第一关系对确定至少一个参考用户,根据至少一个第一关系对集合和多个第二关系对确定至少一个目标用户,如此,可根据有关联的账号和设备标识和无关联的账号和设备标识进行用户识别,从而,可更加准确地得到用户识别结果。
与上述一致地,请参阅图2,图2是本申请实施例提供的另一种用户识别方法的流程示意图,本实施例中所描述的用户识别方法,应用于电子设备,该方法可包括以下步骤:
201、获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对。
202、将所述多个关系对划分为多个第一关系对和多个第二关系对,其中,所述多个第一关系对中每一第一关系对中的账号与其他第一关系对中的账号相同,或者,所述多个第一关系对中每一第一关系对中的设备标识与其他第一关系对中的设备标识相同;所述多个第二关系对中每一第二关系对中的账号与其他第二关系对中的账号均不同,且多个第二关系对中每一第二关系对中的设备标识与其他第二关系对中的设备标识均不同。
203、根据所述多个第一关系对构建账号-标识关系图谱。
204、从所述账号-标识关系图谱中选取设备标识相同,且账号不同的关系对组合,得到至少一个关系对组合,所述至少一个关系对组合中每一关系对组合包含设备标识相同且账号不同的两个关系对。
205、若所述至少一个关系对组合中存在满足第一预设条件的至少一个目标关系对组合。
206、根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱。
207、确定所述多个账号-标识关系分图谱中每一账号-标识关系分图谱对应的参考用户,得到多个参考用户。
208、若所述至少一个关系对组合中不存在满足所述第一预设条件的目标关系对组合,确定所述账号-标识关系图谱对应的同一参考用户。
209、根据至少一个第一关系对集合和所述多个第二关系对确定至少一个目标用户。
其中,上述步骤201-209的具体实现过程可参照图1B所示的方法中相应的描述,在此不再赘述。
可以看出,本申请实施例中所描述的用户识别方法,通过获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对,将多个关系对划分为多个第一关系对和多个第二关系对,根据多个第一关系对构建账号-标识关系图谱,从账号-标识关系图谱中选取设备标识相同,且账号不同的关系对组合,得到至少一个关系对组合,若至少一个关系对组合中存在满足第一预设条件的至少一个目标关系对组合,根据至少一个目标关系对组合将账号-标识关系图谱划分为多个账号-标识关系分图谱,确定多个账号-标识关系分图谱中每一账号-标识关系分图谱对应的参考用户,得到多个参考用户,若至少一个关系对组合中不存在满足第一预设条件的目标关系对组合,确定账号-标识关系图谱对应的同一参考用户,根据至少一个第一关系对集合和多个第二关系对确定至少一个目标用户,如此,可先通过构建关系图谱确定至少一个参考用户,然后根据无关联的至少一个第一关系对集合和多个第二关系对确定至少一个目标用户,从而,可更加准确地得到用户识别结果。
与上述一致地,请参阅图3,为本申请实施例提供的另一种用户识别方法的实施例流程示意图,本实施例中所描述的用户识别方法,本方法可包括以下步骤:
301、获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对。
302、将所述多个关系对划分为多个第一关系对和多个第二关系对,其中,所述多个第一关系对中每一第一关系对中的账号与其他第一关系对中的账号相同,或者,所述多个第一关系对中每一第一关系对中的设备标识与其他第一关系对中的设备标识相同;所述多个第二关系对中每一第二关系对中的账号与其他第二关系对中的账号均不同,且多个第二关系对中每一第二关系对中的设备标识与其他第二关系对中的设备标识均不同。
303、根据所述多个第一关系对构建账号-标识关系图谱。
304、从所述账号-标识关系图谱中选取设备标识相同,且账号不同的关系对组合,得到至少一个关系对组合,所述至少一个关系对组合中每一关系对组合包含设备标识相同且账号不同的两个关系对。
305、若所述至少一个关系对组合中存在满足第一预设条件的至少一个目标关系对组合。
306、根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱。
307、确定所述多个账号-标识关系分图谱中每一账号-标识关系分图谱对应的参考用户,得到多个参考用户。
308、若所述至少一个关系对组合中不存在满足所述第一预设条件的目标关系对组合,确定所述账号-标识关系图谱对应的同一参考用户。
309、获取所述至少一个第一关系对集合中每一第一关系对集合对应的第二特征集,以及获取所述多个第二关系对中每一第二关系对对应的第二特征集,得到多个第二特征集。
310、根据预设算法将所述多个第二特征集进行聚类,得到至少一个类。
311、确定所述至少一个类中每一类包含的多个第二特征集中每两个第二特征集之间的第二相似度,得到至少一个相似度集,所述至少一个相似度集与所述至少一个类一一对应,所述至少一个相似度集中每一相似度集包含多个第二相似度。
312、根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到至少一个分组。
313、确定所述至少一个分组中每一分组对应的目标用户,得到至少一个目标用户。
其中,上述步骤301-313的具体实现过程可参照图1B所示的方法中相应的描述,在此不再赘述。
本申请实施例中所描述的用户识别方法,通过获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对,将多个关系对划分为多个第一关系对和多个第二关系对,根据多个第一关系对构建账号-标识关系图谱,从账号-标识关系图谱中选取设备标识相同,且账号不同的关系对组合,得到至少一个关系对组合,若至少一个关系对组合中存在满足第一预设条件的至少一个目标关系对组合,根据至少一个目标关系对组合将账号-标识关系图谱划分为多个账号-标识关系分图谱,确定多个账号-标识关系分图谱中每一账号-标识关系分图谱对应的参考用户,得到多个参考用户,若至少一个关系对组合中不存在满足第一预设条件的目标关系对组合,确定账号-标识关系图谱对应的同一参考用户,获取每一第一关系对集合对应的第二特征集,以及获取每一第二关系对对应的第二特征集,得到多个第二特征集,根据预设算法将多个第二特征集进行聚类,得到至少一个类,确定每一类包含的多个第二特征集中每两个第二特征集之间的第二相似度,得到至少一个相似度集,根据每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到至少一个分组,确定每一分组对应的目标用户,得到至少一个目标用户,如此,可先通过构建关系图谱确定至少一个参考用户,然后根据特征集之间的相似度确定至少一个目标用户,从而,可更加准确地得到用户识别结果。
与上述一致地,请参阅图4,图4是本申请实施例提供的一种电子设备400,包括:处理器410、存储器420、通信接口430以及一个或多个程序421,所述一个或多个程序421被存储在所述存储器420中,并且被配置成由所述处理器410执行,所述程序包括用于执行以下步骤的指令:
获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对;
将所述多个关系对划分为多个第一关系对和多个第二关系对,其中,所述多个第一关系对中每一第一关系对中的账号与其他第一关系对中的账号相同,或者,所述多个第一关系对中每一第一关系对中的设备标识与其他第一关系对中的设备标识相同;所述多个第二关系对中每一第二关系对中的账号与其他第二关系对中的账号均不同,且多个第二关系对中每一第二关系对中的设备标识与其他第二关系对中的设备标识均不同;
根据所述多个第一关系对确定至少一个参考用户,所述至少一个参考用户对应至少一个第一关系对集合,所述至少一个第一关系对集合与所述至少一个参考用户一一对应,所述至少一个第一关系对集合中每一第一关系对集合包含对应参考用户的多个第一关系对;
根据所述至少一个第一关系对集合和所述多个第二关系对确定至少一个目标用户。
在一个可能的示例中,在所述根据所述多个第一关系对确定至少一个参考用户方面,所述程序421包括用于执行以下步骤的指令:
根据所述多个第一关系对构建账号-标识关系图谱;
从所述账号-标识关系图谱中选取设备标识相同,且账号不同的关系对组合,得到至少一个关系对组合,所述至少一个关系对组合中每一关系对组合包含设备标识相同且账号不同的两个关系对;
若所述至少一个关系对组合中存在满足第一预设条件的至少一个目标关系对组合;
根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱;
确定所述多个账号-标识关系分图谱中每一账号-标识关系分图谱对应的参考用户,得到多个参考用户;
若所述至少一个关系对组合中不存在满足所述第一预设条件的目标关系对组合,确定所述账号-标识关系图谱对应的同一参考用户。
在一个可能的示例中,在所述根据所述多个第一关系对构建账号-标识关系图谱方面,所述程序421包括用于执行以下步骤的指令:
将所述多个第一关系对中每两个存在相同设备标识和不同账号的关系对进行连接,以及将所述多个第一关系对中每两个存在相同账号和不同设备标识的关系对进行连接,得到所述账号-标识关系图谱。
在一个可能的示例中,所述程序421还包括用于执行以下步骤的指令:
确定关系对组合i包含的两个账号对应的两个使用时段是否存在重合时段,所述关系对组合i为所述至少一个关系对组合中任一关系对组合;
获取所述关系对组合i包含的所述两个账号在所述设备标识对应的电子设备上的两个第一特征集;
根据所述两个第一特征集确定所述两个账号之间的第一相似度;
若所述第一相似度小于第一预设阈值,且,所述两个使用时段之间的重合时段小于预设时长,确定所述关系对组合i为满足所述第一预设条件的目标关系对组合。
在一个可能的示例中,在所述根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱方面,所述程序421包括用于执行以下步骤的指令:
将所述账号-标识关系图谱中满足所述第一预设条件的至少一个目标关系对组合中每一目标关系组合对进行拆分,得到多个账号-标识关系分图谱。
在一个可能的示例中,在所述根据所述至少一个第一关系对集合和所述多个第二关系对确定至少一个目标用户方面,所述程序421包括用于执行以下步骤的指令:
获取所述至少一个第一关系对集合中每一第一关系对集合对应的第二特征集,以及获取所述多个第二关系对中每一第二关系对对应的第二特征集,得到多个第二特征集;
根据预设算法将所述多个第二特征集进行聚类,得到至少一个类;
确定所述至少一个类中每一类包含的多个第二特征集中每两个第二特征集之间的第二相似度,得到至少一个相似度集,所述至少一个相似度集与所述至少一个类一一对应,所述至少一个相似度集中每一相似度集包含多个第二相似度;
根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到至少一个分组;
确定所述至少一个分组中每一分组对应的目标用户,得到至少一个目标用户。
在一个可能的示例中,在所述根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到多个分组方面,所述程序421包括用于执行以下步骤的指令:
确定所述至少一个类中每一类对应的相似度集中的多个第二相似度中满足大于第二预设阈值的多个目标第二相似度,
将所述至少一个类中每一类对应的相似度集中的多个目标第二相似度中每一目标第二相似度对应的两个第二特征集进行连接,得到至少一个参考特征关系图谱;
将所述至少一个特征参考关系图谱中每一参考特征关系图谱对应的多个第二特征集划分为一组,得到至少一个分组。
在一个可能的示例中,所述程序421还包括用于执行以下步骤的指令:
获取第一目标用户对应的多个第一目标特征集,所述多个第一目标特征集为所述多个第二特征集中的部分特征集,所述第一目标用户为所述至少一个目标用户中的任一目标用户;
将所述多个第一目标特征集中的相同特征进行连接,得到目标特征关系图谱;
根据所述目标特征关系图谱构建所述第一目标用户的用户画像。
在一个可能的示例中,所述程序421还包括用于执行以下步骤的指令:
获取第二目标用户对应的多个第二目标特征集,所述多个第二目标特征集为所述多个第二特征集中的部分特征集,所述第二目标用户为所述至少一个目标用户中除所述第一目标用户以外的任一目标用户;
根据所述多个第二目标特征集、所述多个第一目标特征集和预设判断规则确定所述第一目标用户和所述第二目标用户之间的用户关系。
请参阅图5A,图5A是本实施例提供的一种用户识别装置的结构示意图。该用户识别装置应用于如图1A所示的电子设备,所述用户识别装置包括获取单元501、运算单元502和确定单元503,其中,
所述获取单元501,用于获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对;
所述划分单元502,用于将所述多个关系对划分为多个第一关系对和多个第二关系对,其中,所述多个第一关系对中每一第一关系对中的账号与其他第一关系对中的账号相同,或者,所述多个第一关系对中每一第一关系对中的设备标识与其他第一关系对中的设备标识相同;所述多个第二关系对中每一第二关系对中的账号与其他第二关系对中的账号均不同,且多个第二关系对中每一第二关系对中的设备标识与其他第二关系对中的设备标识均不同;
所述确定单元503,用户根据所述多个第一关系对确定至少一个参考用户,所述至少一个参考用户对应至少一个第一关系对集合,所述至少一个第一关系对集合与所述至少一个参考用户一一对应,所述至少一个第一关系对集合中每一第一关系对集合包含对应参考用户的多个第一关系对;
所述确定单元503,用于根据所述至少一个第一关系对集合和所述多个第二关系对确定至少一个目标用户。
可选地,在所述根据所述多个第一关系对确定至少一个参考用户方面,所述确定单元503具体用于:
根据所述多个第一关系对构建账号-标识关系图谱;
从所述账号-标识关系图谱中选取设备标识相同,且账号不同的关系对组合,得到至少一个关系对组合,所述至少一个关系对组合中每一关系对组合包含设备标识相同且账号不同的两个关系对;
若所述至少一个关系对组合中存在满足第一预设条件的至少一个目标关系对组合;
根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱;
确定所述多个账号-标识关系分图谱中每一账号-标识关系分图谱对应的参考用户,得到多个参考用户;
若所述至少一个关系对组合中不存在满足所述第一预设条件的目标关系对组合,确定所述账号-标识关系图谱对应的同一参考用户。
可选地,在所述根据所述多个第一关系对构建账号-标识关系图谱方面,所述确定单元503具体用于:
将所述多个第一关系对中每两个存在相同设备标识和不同账号的关系对进行连接,以及将所述多个第一关系对中每两个存在相同账号和不同设备标识的关系对进行连接,得到所述账号-标识关系图谱。
可选地,所述确定单元503还用于:
确定关系对组合i包含的两个账号对应的两个使用时段是否存在重合时段,所述关系对组合i为所述至少一个关系对组合中任一关系对组合;
获取所述关系对组合i包含的所述两个账号在所述设备标识对应的电子设备上的两个第一特征集;
根据所述两个第一特征集确定所述两个账号之间的第一相似度;
若所述第一相似度小于第一预设阈值,且,所述两个使用时段之间的重合时段小于预设时长,确定所述关系对组合i为满足所述第一预设条件的目标关系对组合。
可选地,在所述根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱方面,所述确定单元503具体用于:
将所述账号-标识关系图谱中满足所述第一预设条件的至少一个目标关系对组合中每一目标关系组合对进行拆分,得到多个账号-标识关系分图谱。
可选地,在所述根据所述至少一个第一关系对集合和所述多个第二关系对确定至少一个目标用户方面,所述确定单元503具体用于:
获取所述至少一个第一关系对集合中每一第一关系对集合对应的第二特征集,以及获取所述多个第二关系对中每一第二关系对对应的第二特征集,得到多个第二特征集;
根据预设算法将所述多个第二特征集进行聚类,得到至少一个类;
确定所述至少一个类中每一类包含的多个第二特征集中每两个第二特征集之间的第二相似度,得到至少一个相似度集,所述至少一个相似度集与所述至少一个类一一对应,所述至少一个相似度集中每一相似度集包含多个第二相似度;
根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到至少一个分组;
确定所述至少一个分组中每一分组对应的目标用户,得到至少一个目标用户。
可选地,在所述根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到多个分组方面,所述确定单元503具体用于:
确定所述至少一个类中每一类对应的相似度集中的多个第二相似度中满足大于第二预设阈值的多个目标第二相似度,
将所述至少一个类中每一类对应的相似度集中的多个目标第二相似度中每一目标第二相似度对应的两个第二特征集进行连接,得到至少一个参考特征关系图谱;
将所述至少一个特征参考关系图谱中每一参考特征关系图谱对应的多个第二特征集划分为一组,得到至少一个分组。
可选地,如图5B所示,图5B为图5A所示的用户识别装置的变型结构,其与图5A相比较,还可以包括:连接单元504和构建单元505,其中,
所述获取单元501,还用于获取第一目标用户对应的多个第一目标特征集,所述多个第一目标特征集为所述多个第二特征集中的部分特征集,所述第一目标用户为所述至少一个目标用户中的任一目标用户;
所述连接单元504,用户将所述多个第一目标特征集中的相同特征进行连接,得到目标特征关系图谱;
所述构建单元505,用于根据所述目标特征关系图谱构建所述第一目标用户的用户画像。
可选地,所述获取单元501,还用于获取第二目标用户对应的多个第二目标特征集,所述多个第二目标特征集为所述多个第二特征集中的部分特征集,所述第二目标用户为所述至少一个目标用户中除所述第一目标用户以外的任一目标用户;
所述确定单元503,还用于根据所述多个第二目标特征集、所述多个第一目标特征集和预设判断规则确定所述第一目标用户和所述第二目标用户之间的用户关系。
可以看出,本申请实施例中所描述的用户识别装置,通过获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对,将多个关系对划分为多个第一关系对和多个第二关系对,根据多个第一关系对确定至少一个参考用户,根据至少一个第一关系对集合和多个第二关系对确定至少一个目标用户,如此,可根据有关联的账号和设备标识和无关联的账号和设备标识进行用户识别,从而,可更加准确地得到用户识别结果。
可以理解的是,本实施例的用户识别装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种用户识别方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种用户识别方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (18)
1.一种用户识别方法,其特征在于,所述方法包括:
获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对;
将所述多个关系对划分为多个第一关系对和多个第二关系对,其中,所述多个第一关系对中每一第一关系对中的账号与其他第一关系对中的账号相同,或者,所述多个第一关系对中每一第一关系对中的设备标识与其他第一关系对中的设备标识相同;所述多个第二关系对中每一第二关系对中的账号与其他第二关系对中的账号均不同,且多个第二关系对中每一第二关系对中的设备标识与其他第二关系对中的设备标识均不同;
根据所述多个第一关系对确定至少一个参考用户,所述至少一个参考用户与至少一个第一关系对集合一一对应,所述至少一个第一关系对集合中每一第一关系对集合包含对应参考用户的多个第一关系对;获取所述至少一个第一关系对集合中每一第一关系对集合对应的第二特征集,以及获取所述多个第二关系对中每一第二关系对对应的第二特征集,得到多个第二特征集;
根据预设算法将所述多个第二特征集进行聚类,得到至少一个类;
确定所述至少一个类中每一类包含的多个第二特征集中每两个第二特征集之间的第二相似度,得到至少一个相似度集,所述至少一个相似度集与所述至少一个类一一对应,所述至少一个相似度集中每一相似度集包含多个第二相似度;
根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到至少一个分组;
确定所述至少一个分组中每一分组对应的目标用户,得到至少一个目标用户。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一关系对确定至少一个参考用户,包括:
根据所述多个第一关系对构建账号-标识关系图谱;
从所述账号-标识关系图谱中选取设备标识相同,且账号不同的关系对组合,得到至少一个关系对组合,所述至少一个关系对组合中每一关系对组合包含设备标识相同且账号不同的两个关系对;
若所述至少一个关系对组合中存在满足第一预设条件的至少一个目标关系对组合;
根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱;
确定所述多个账号-标识关系分图谱中每一账号-标识关系分图谱对应的参考用户,得到多个参考用户;
若所述至少一个关系对组合中不存在满足所述第一预设条件的目标关系对组合,确定所述账号-标识关系图谱对应的同一参考用户。
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个第一关系对构建账号-标识关系图谱,包括:
将所述多个第一关系对中每两个存在相同设备标识和不同账号的关系对进行连接,以及将所述多个第一关系对中每两个存在相同账号和不同设备标识的关系对进行连接,得到所述账号-标识关系图谱。
4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
确定关系对组合i包含的两个账号对应的两个使用时段是否存在重合时段,所述关系对组合i为所述至少一个关系对组合中任一关系对组合;
获取所述关系对组合i包含的所述两个账号在所述设备标识对应的电子设备上的两个第一特征集;
根据所述两个第一特征集确定所述两个账号之间的第一相似度;
若所述第一相似度小于第一预设阈值,且,所述两个使用时段之间的重合时段小于预设时长,确定所述关系对组合i为满足所述第一预设条件的目标关系对组合。
5.根据权利要求2所述的方法,其特征在于,所述根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱,包括:
将所述账号-标识关系图谱中满足所述第一预设条件的至少一个目标关系对组合中每一目标关系组合对进行拆分,得到多个账号-标识关系分图谱。
6.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到至少一个分组,包括:
确定所述至少一个类中每一类对应的相似度集中的多个第二相似度中满足大于第二预设阈值的多个目标第二相似度,
将所述至少一个类中每一类对应的相似度集中的多个目标第二相似度中每一目标第二相似度对应的两个第二特征集进行连接,得到至少一个参考特征关系图谱;
将所述至少一个特征参考关系图谱中每一参考特征关系图谱对应的多个第二特征集划分为一组,得到至少一个分组。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取第一目标用户对应的多个第一目标特征集,所述多个第一目标特征集为所述多个第二特征集中的部分特征集,所述第一目标用户为所述至少一个目标用户中的任一目标用户;
将所述多个第一目标特征集中的相同特征进行连接,得到目标特征关系图谱;
根据所述目标特征关系图谱构建所述第一目标用户的用户画像。
8.根据权利要求7所述的方法,其特征在于,
获取第二目标用户对应的多个第二目标特征集,所述多个第二目标特征集为所述多个第二特征集中的部分特征集,所述第二目标用户为所述至少一个目标用户中除所述第一目标用户以外的任一目标用户;
根据所述多个第二目标特征集、所述多个第一目标特征集和预设判断规则确定所述第一目标用户和所述第二目标用户之间的用户关系。
9.一种用户识别装置,其特征在于,所述用户识别装置包括:
获取单元,用于获取多个使用时段中每一使用时段对应的账号和设备标识之间的关系对,得到多个关系对;
划分单元,用于将所述多个关系对划分为多个第一关系对和多个第二关系对,其中,所述多个第一关系对中每一第一关系对中的账号与其他第一关系对中的账号相同,或者,所述多个第一关系对中每一第一关系对中的设备标识与其他第一关系对中的设备标识相同;所述多个第二关系对中每一第二关系对中的账号与其他第二关系对中的账号均不同,且多个第二关系对中每一第二关系对中的设备标识与其他第二关系对中的设备标识均不同;
确定单元,用于户根据所述多个第一关系对确定至少一个参考用户,所述至少一个参考用户与至少一个第一关系对集合一一对应,所述至少一个第一关系对集合中每一第一关系对集合包含对应参考用户的多个第一关系对;所述确定单元,用于获取所述至少一个第一关系对集合中每一第一关系对集合对应的第二特征集,以及获取所述多个第二关系对中每一第二关系对对应的第二特征集,得到多个第二特征集;
所述确定单元,用于根据预设算法将所述多个第二特征集进行聚类,得到至少一个类;
所述确定单元,用于确定所述至少一个类中每一类包含的多个第二特征集中每两个第二特征集之间的第二相似度,得到至少一个相似度集,所述至少一个相似度集与所述至少一个类一一对应,所述至少一个相似度集中每一相似度集包含多个第二相似度;
所述确定单元,用于根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到至少一个分组;
所述确定单元,用于确定所述至少一个分组中每一分组对应的目标用户,得到至少一个目标用户。
10.根据权利要求9所述的装置,其特征在于,在所述根据所述多个第一关系对确定至少一个参考用户方面,所述确定单元用于:
根据所述多个第一关系对构建账号-标识关系图谱;
从所述账号-标识关系图谱中选取设备标识相同,且账号不同的关系对组合,得到至少一个关系对组合,所述至少一个关系对组合中每一关系对组合包含设备标识相同且账号不同的两个关系对;
若所述至少一个关系对组合中存在满足第一预设条件的至少一个目标关系对组合;
根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱;
确定所述多个账号-标识关系分图谱中每一账号-标识关系分图谱对应的参考用户,得到多个参考用户;
若所述至少一个关系对组合中不存在满足所述第一预设条件的目标关系对组合,确定所述账号-标识关系图谱对应的同一参考用户。
11.根据权利要求10所述的装置,其特征在于,在所述根据所述多个第一关系对构建账号-标识关系图谱方面,所述确定单元用于:
将所述多个第一关系对中每两个存在相同设备标识和不同账号的关系对进行连接,以及将所述多个第一关系对中每两个存在相同账号和不同设备标识的关系对进行连接,得到所述账号-标识关系图谱。
12.根据权利要求10或11所述的装置,其特征在于,所述确定单元还用于:
确定关系对组合i包含的两个账号对应的两个使用时段是否存在重合时段,所述关系对组合i为所述至少一个关系对组合中任一关系对组合;
获取所述关系对组合i包含的所述两个账号在所述设备标识对应的电子设备上的两个第一特征集;
根据所述两个第一特征集确定所述两个账号之间的第一相似度;
若所述第一相似度小于第一预设阈值,且,所述两个使用时段之间的重合时段小于预设时长,确定所述关系对组合i为满足所述第一预设条件的目标关系对组合。
13.根据权利要求10所述的装置,其特征在于,在所述根据所述至少一个目标关系对组合将所述账号-标识关系图谱划分为多个账号-标识关系分图谱方面,所述确定单元用于:
将所述账号-标识关系图谱中满足所述第一预设条件的至少一个目标关系对组合中每一目标关系组合对进行拆分,得到多个账号-标识关系分图谱。
14.根据权利要求9所述的装置,其特征在于,在所述根据所述至少一个类中每一类对应的相似度集中的多个第二相似度将对应类的多个第二特征集进行分组,得到多个分组方面,所述确定单元用于:
确定所述至少一个类中每一类对应的相似度集中的多个第二相似度中满足大于第二预设阈值的多个目标第二相似度,
将所述至少一个类中每一类对应的相似度集中的多个目标第二相似度中每一目标第二相似度对应的两个第二特征集进行连接,得到至少一个参考特征关系图谱;
将所述至少一个特征参考关系图谱中每一参考特征关系图谱对应的多个第二特征集划分为一组,得到至少一个分组。
15.根据权利要求14所述的装置,其特征在于,所述装置还包括连接单元和构建单元,其中,
所述获取单元,还用于获取第一目标用户对应的多个第一目标特征集,所述多个第一目标特征集为所述多个第二特征集中的部分特征集,所述第一目标用户为所述至少一个目标用户中的任一目标用户;
所述连接单元,用户将所述多个第一目标特征集中的相同特征进行连接,得到目标特征关系图谱;
所述构建单元,用于根据所述目标特征关系图谱构建所述第一目标用户的用户画像。
16.一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-8任一项所述的方法中的步骤的指令。
17.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-8任一项所述的方法。
18.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储了计算机程序的计算机可读存储介质,所述计算机程序使得计算机执行如权利要求1-8任一项所述的方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/096045 WO2021007757A1 (zh) | 2019-07-15 | 2019-07-15 | 用户识别方法及相关产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113940033A CN113940033A (zh) | 2022-01-14 |
CN113940033B true CN113940033B (zh) | 2023-10-20 |
Family
ID=74210117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980097342.0A Active CN113940033B (zh) | 2019-07-15 | 2019-07-15 | 用户识别方法及相关产品 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113940033B (zh) |
WO (1) | WO2021007757A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115134665B (zh) * | 2021-03-22 | 2024-03-01 | 中国电信股份有限公司 | 基于机顶盒的数据处理方法及装置、存储介质、电子设备 |
CN113521750B (zh) * | 2021-07-15 | 2023-10-24 | 珠海金山数字网络科技有限公司 | 异常账号检测模型训练方法和异常账号检测方法 |
CN113851007B (zh) * | 2021-09-27 | 2023-01-17 | 阿波罗智联(北京)科技有限公司 | 划分时段的方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106960143A (zh) * | 2017-03-23 | 2017-07-18 | 网易(杭州)网络有限公司 | 用户账号的识别方法及装置、存储介质、电子设备 |
CN108390788A (zh) * | 2018-03-05 | 2018-08-10 | 北京奇艺世纪科技有限公司 | 用户识别方法、装置及电子设备 |
WO2018191089A1 (en) * | 2017-04-14 | 2018-10-18 | Microsoft Technology Licensing, Llc | System and method for detecting creation of malicious new user accounts by an attacker |
CN109543040A (zh) * | 2018-11-26 | 2019-03-29 | 北京知道创宇信息技术有限公司 | 相似账户识别方法及装置 |
CN109784013A (zh) * | 2017-11-14 | 2019-05-21 | 阿里巴巴集团控股有限公司 | 一种信息识别的方法、装置以及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10469497B2 (en) * | 2016-05-26 | 2019-11-05 | Dropbox, Inc. | Identifying accounts having shared credentials |
-
2019
- 2019-07-15 WO PCT/CN2019/096045 patent/WO2021007757A1/zh active Application Filing
- 2019-07-15 CN CN201980097342.0A patent/CN113940033B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106960143A (zh) * | 2017-03-23 | 2017-07-18 | 网易(杭州)网络有限公司 | 用户账号的识别方法及装置、存储介质、电子设备 |
WO2018191089A1 (en) * | 2017-04-14 | 2018-10-18 | Microsoft Technology Licensing, Llc | System and method for detecting creation of malicious new user accounts by an attacker |
CN109784013A (zh) * | 2017-11-14 | 2019-05-21 | 阿里巴巴集团控股有限公司 | 一种信息识别的方法、装置以及设备 |
CN108390788A (zh) * | 2018-03-05 | 2018-08-10 | 北京奇艺世纪科技有限公司 | 用户识别方法、装置及电子设备 |
CN109543040A (zh) * | 2018-11-26 | 2019-03-29 | 北京知道创宇信息技术有限公司 | 相似账户识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2021007757A1 (zh) | 2021-01-21 |
CN113940033A (zh) | 2022-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105447036B (zh) | 一种基于观点挖掘的社交媒体信息可信度评估方法及装置 | |
CN113940033B (zh) | 用户识别方法及相关产品 | |
WO2021003673A1 (zh) | 内容推送方法及相关产品 | |
CN113316778B (zh) | 设备推荐方法及相关产品 | |
CN109376781B (zh) | 一种图像识别模型的训练方法、图像识别方法和相关装置 | |
CN113396414A (zh) | 刷量用户识别方法及相关产品 | |
CN105335653A (zh) | 一种异常数据检测方法及装置 | |
CN107743108B (zh) | 一种介质访问控制地址识别方法及装置 | |
CN106791153A (zh) | 应用推送消息分类显示方法、装置及移动终端 | |
CN104091600A (zh) | 一种歌声位置检测方法及装置 | |
CN107317917B (zh) | 应用控制方法及相关产品 | |
CN113396433B (zh) | 用户画像构建方法及相关产品 | |
CN108900385B (zh) | 网络连接方法及相关产品 | |
CN109726726B (zh) | 视频中的事件检测方法及装置 | |
CN104423865B (zh) | 一种在具有触摸屏的终端上进行纸牌显示的方法及装置 | |
CN111027406B (zh) | 图片识别方法、装置、存储介质及电子设备 | |
WO2020252742A1 (zh) | 资源推送方法及相关产品 | |
WO2021000084A1 (zh) | 数据分类方法及相关产品 | |
CN110809234A (zh) | 一种人物类别识别方法和终端设备 | |
WO2020257989A1 (zh) | 设备价值评估方法及相关产品 | |
CN111159110A (zh) | 资料建立方法及系统 | |
CN106445388B (zh) | 上报信息的方法、装置及终端 | |
WO2021003608A1 (zh) | 数据分析方法及相关产品 | |
CN117787207A (zh) | 标准单元库验证方法、装置、存储介质及电子设备 | |
CN116303520A (zh) | 入账数据存储查找方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |