CN112016081B - 标识映射的实现方法、装置、介质和电子设备 - Google Patents
标识映射的实现方法、装置、介质和电子设备 Download PDFInfo
- Publication number
- CN112016081B CN112016081B CN202010896136.0A CN202010896136A CN112016081B CN 112016081 B CN112016081 B CN 112016081B CN 202010896136 A CN202010896136 A CN 202010896136A CN 112016081 B CN112016081 B CN 112016081B
- Authority
- CN
- China
- Prior art keywords
- user
- node
- user group
- nodes
- newly added
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/45—Structures or tools for the administration of authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/44—Program or device authentication
- G06F21/445—Program or device authentication by mutual authentication, e.g. between devices or programs
Abstract
公开了一种标识映射的实现方法、装置、介质以及电子设备。其中的方法包括:获取多个设备标识、多个用户标识以及设备标识和用户标识间的登录关系信息;将多个设备标识分别作为用户画像图中的各设备节点的标识,将多个用户标识分别作为用户画像图中的各用户节点的标识,将登录关系信息作为用户画像图中的设备节点与用户节点间的连线,生成包含至少一个用户团的用户画像图;针对任一用户团,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与同一用户的归一标识的映射关系,且不同用户团的映射关系中的归一标识不相同;对用户画像图中的用户团的结构进行更新处理。本公开有利于提高标识映射的效率以及准确性。
Description
技术领域
本公开涉及计算机技术,尤其是涉及一种标识映射的实现方法、标识映射的实现装置、存储介质以及电子设备。
背景技术
在大数据分析中,标识映射(ID-Mapping)是非常基本但又非常关键的环节之一。标识映射通常用于从多个用户标识和多个设备标识中识别出属于同一个用户的标识,从而有利于形成用户的完整画像。如何准确快速的实现标识映射,是一个值得关注的技术问题。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种标识映射的实现方法、标识映射的实现装置、存储介质以及电子设备。
根据本公开实施例的一个方面,提供了一种标识映射的实现方法,该方法包括:获取多个设备标识和多个用户标识;获取所述多个设备标识和多个用户标识之间的登录关系信息,其中,所述登录关系信息表示用户使用一用户标识执行登录操作时,所使用的终端设备;将所述多个设备标识分别作为用户画像图中的各设备节点的标识,将所述多个用户标识分别作为用户画像图中的各用户节点的标识,将所述登录关系信息作为用户画像图中的设备节点与用户节点间的连线,生成包含至少一个用户团的用户画像图;其中,生成的每一个用户团均包括至少一个节点;针对用户画像图中的任一用户团,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与同一用户的归一标识的映射关系,且不同用户团的映射关系中的归一标识不相同;对所述用户画像图中的用户团的结构进行更新处理。
在本公开一实施方式中,所述节点的属性包括:节点的首次出现时间;所述针对用户画像图中的任一用户团,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与同一用户的归一标识的映射关系,包括:针对用户画像图中的任一用户团,确定该用户团中的首次出现时间最早的节点;将所述首次出现时间最早的节点的标识作为该用户团对应的用户的归一标识,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与所述归一标识的映射关系。
在本公开又一实施方式中,所述对所述用户画像图中的用户团的结构进行更新处理,包括下述至少一步骤:对所述用户画像图中的用户团进行异常检测,并对检测出的异常用户团进行节点删除处理;根据新增节点和基于所述新增节点的新增登录关系信息,确定所述新增节点所属的用户团,并根据所述新增登录关系信息,建立所述新增节点与其所属的用户团中的节点的连线,建立所述新增节点的标识与其所属的用户团的归一标识的映射关系;在确定出新增登录关系信息表示用户画像图中的两个已有节点之间的连线时,在所述两个已有节点间设置连线。
在本公开再一实施方式中,所述对所述用户画像图中的用户团进行异常检测,包括下述至少一步骤:基于用户团所包含的节点数量,对所述用户画像图中的用户团进行异常检测;基于用户团所对应的用户的偏好变化,对所述用户画像图中的用户团进行异常检测。
在本公开再一实施方式中,所述基于用户团所包含的节点数量,对所述用户画像图中的用户团进行异常检测,包括下述至少一步骤:获取所述用户画像图中的各用户团各自包含的节点数量,并将所包含的节点数量超过预定节点数量的用户团,作为检测出的异常用户团;确定在预定时间范围内存在新增节点的各用户团所包含的节点数量的均值,若所述均值与历史均值的差异满足预定差异条件,则确定所述新增节点的各用户团中存在异常用户团。
在本公开再一实施方式中,所述登录关系信息的属性包括:首次登录时间;所述基于用户团所对应的用户的偏好变化,对所述用户画像图中的用户团进行异常检测,包括:针对所述用户画像图中的任一用户团,获取具有该用户团的归一标识的用户在各相邻首次登陆时间之间的偏好,获得各节点各自对应的偏好,若首次登陆时间相邻的两个节点各自对应的偏好的变化满足预定变化条件,则将该用户团作为检测出的异常用户团。
在本公开再一实施方式中,所述对检测出的异常用户团进行节点删除处理,包括:确定异常用户团中的异常节点,并将所述异常节点从异常用户团中删除。
在本公开再一实施方式中,所述确定异常用户团中的异常节点,包括下述至少一步骤:将所述异常用户团中连线数量最多的节点作为异常节点;获取所述异常用户团中的各节点各自对应的偏好,并获取所述异常用户团的偏好中心点,将偏好距离所述用户偏好中心点最远的节点作为异常节点。
在本公开再一实施方式中,所述根据新增节点和基于所述新增节点的新增登录关系信息,确定所述新增节点所属的用户团,包括:在确定出所述新增登录关系信息为所述新增节点与已有用户团中的已有节点的连线时,获取所述新增节点对应的偏好以及所述已有节点对应的偏好;若所述新增节点对应的偏好和所述已有节点对应的偏好的差异满足预定差异条件,则确定所述新增节点属于所述已有用户团;若所述新增节点对应的偏好和所述已有节点对应的偏好的差异不满足预定差异条件,则复制所述已有节点,并在用户画像图中建立包含有所述新增节点和所述复制的已有节点的新用户团。
根据本公开实施例的另一个方面,提供一种标识映射的实现装置,该装置包括:获取标识模块,用于获取多个设备标识和多个用户标识;获取关系模块,用于获取所述多个设备标识和多个用户标识之间的登录关系信息,其中,所述登录关系信息表示用户使用一用户标识执行登录操作时,所使用的终端设备;生成图模块,用于将所述多个设备标识分别作为用户画像图中的各设备节点的标识,将所述多个用户标识分别作为用户画像图中的各用户节点的标识,将所述登录关系信息作为用户画像图中的设备节点与用户节点间的连线,生成包含至少一个用户团的用户画像图;其中,生成的每一个用户团均包括至少一个节点;建立映射模块,用于针对用户画像图中的任一用户团,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与同一用户的归一标识的映射关系,且不同用户团的映射关系中的归一标识不相同;图维护模块,用于对所述用户画像图中的用户团的结构进行更新处理。
在本公开一实施方式中,所述节点的属性包括:节点的首次出现时间;所述建立映射模块进一步用于:针对用户画像图中的任一用户团,确定该用户团中的首次出现时间最早的节点;将所述首次出现时间最早的节点的标识作为该用户团对应的用户的归一标识,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与所述归一标识的映射关系。
在本公开又一实施方式中,所述图维护模块包括下述至少一子模块:第一子模块,用于对所述用户画像图中的用户团进行异常检测,并对检测出的异常用户团进行节点删除处理;第二子模块,用于根据新增节点和基于所述新增节点的新增登录关系信息,确定所述新增节点所属的用户团,并根据所述新增登录关系信息,建立所述新增节点与其所属的用户团中的节点的连线,建立所述新增节点的标识与其所属的用户团的归一标识的映射关系;第三子模块,用于在确定出新增登录关系信息表示用户画像图中的两个已有节点之间的连线时,在所述两个已有节点间设置连线。
在本公开再一实施方式中,所述第一子模块包括下述至少一单元:第一单元,用于基于用户团所包含的节点数量,对所述用户画像图中的用户团进行异常检测;第二单元,用于基于用户团所对应的用户的偏好变化,对所述用户画像图中的用户团进行异常检测。
在本公开再一实施方式中,所述第一单元包括下述至少一子单元:第一子单元,用于获取所述用户画像图中的各用户团各自包含的节点数量,并将所包含的节点数量超过预定节点数量的用户团,作为检测出的异常用户团;第二子单元,用于确定在预定时间范围内存在新增节点的各用户团所包含的节点数量的均值,若所述均值与历史均值的差异满足预定差异条件,则确定所述新增节点的各用户团中存在异常用户团。
在本公开再一实施方式中,所述登录关系信息的属性包括:首次登录时间;所述第二单元进一步用于:针对所述用户画像图中的任一用户团,获取具有该用户团的归一标识的用户在各相邻首次登陆时间之间的偏好,获得各节点各自对应的偏好,若首次登陆时间相邻的两个节点各自对应的偏好的变化满足预定变化条件,则将该用户团作为检测出的异常用户团。
在本公开再一实施方式中,所述第一子模块包括:第三单元,用于确定异常用户团中的异常节点,并将所述异常节点从异常用户团中删除。
在本公开再一实施方式中,所述第三单元包括下述至少一子单元:第三子单元,用于将所述异常用户团中连线数量最多的节点作为异常节点;第四子单元,用于获取所述异常用户团中的各节点各自对应的偏好,并获取所述异常用户团的偏好中心点,将偏好距离所述用户偏好中心点最远的节点作为异常节点。
在本公开再一实施方式中,所述第二子模块进一步用于:在确定出所述新增登录关系信息为所述新增节点与已有用户团中的已有节点的连线时,获取所述新增节点对应的偏好以及所述已有节点对应的偏好;若所述新增节点对应的偏好和所述已有节点对应的偏好的差异满足预定差异条件,则确定所述新增节点属于所述已有用户团;若所述新增节点对应的偏好和所述已有节点对应的偏好的差异不满足预定差异条件,则复制所述已有节点,并在用户画像图中建立包含有所述新增节点和所述复制的已有节点的新用户团。
基于本公开上述实施例提供的一种标识映射的实现方法和装置,通过利用设备标识、用户标识和登录关系信息形成用户画像图,并为用户画像图中的每一个用户团分别设置归一标识,不但可以在占用较少计算资源的情况下,快速的实现标识映射,还可以在占用较少计算资源的情况下,对用户画像图中的用户团的结构进行更新处理。由此可知,本公开提供的技术方案有利于提高标识映射的效率以及准确性。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同描述一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1为本公开的应用场景的一实施例的流程图;
图2为本公开的标识映射的实现方法一个实施例的流程图;
图3为本公开的由于删除节点而拆分出多个用户团一实施例的示意图;
图4为本公开的标识映射的实现装置一个实施例的结构示意图;
图5为本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或者两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅是一种描述关联对象的关联关系,表示可以存在三种关系,如A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开的实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或者专用计算系统环境或配置一起操作。适于与终端设备、计算机系统或者服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施。在分布式云计算环境中,任务可以是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
本公开概述
在实现本公开的过程中,发明人发现,在一用户拥有多个终端设备(如多个智能移动电话、台式机、笔记本电脑以及平板电脑等)的情况下,如果该用户使用不同终端设备,以同一用户账号进行登录,则网络侧应基于该用户的多次登录操作,将上述用户标识和多个终端设备标识映射为同一个用户的归一标识。在一用户使用电话号码、邮箱以及IM(即时通信)号分别进行注册的情况下,如果该用户使用同一终端设备,以不同用户账号进行登录,则网络侧应基于该用户的多次登录操作,将上述终端设备标识和多个用户标识映射为同一个用户的归一标识。在标识映射过程中,通常容易出现由于计算量庞大而导致的占用大量计算资源以及标识映射效率低等现象。
另外,标识映射的准确性有待提高,例如,在标识映射过程中,会出现将不同用户的终端设备误认为是同一个用户的终端设备、将同一用户的不同终端设备误认为是不同用户的终端设备、将不同用户的用户标识误认为是同一个用户的用户标识、以及将同一个用户的多个用户标识误认为是不同用户的用户标识等现象。
示例性概述
本公开提供的标识映射的实现技术的一个应用场景的例子如图1所示。
图1中,在房产领域,假设一房产公司提供一用于房屋租售的网站,且一用户使用其两个电话号码和一个电子邮箱注册了三个用户账号。假设该用户曾经使用其两台智能移动电话、一台平板电话、用户家中的一台计算机以及用户在工作单位的一台计算机,以上述三个用户账号为用户名登录过该网站。
在上述假设的情况下,本公开建立的用户画像图中的一个用户团共包括8个节点。其中的五个节点为设备节点,分别为设备节点100(即用户的一智能移动电话)、设备节点101(即用户的另一智能移动电话)、设备节点102(即用户的平板电脑)、设备节点103(即用户家中的计算机)以及设备节点104(即用户工作单位的计算机)。其中的另三个节点为用户节点,即用户节点105(即用户一智能移动电话的电话号码)、用户节点106(即用户另一智能移动电话的电话号码)以及用户节点107(即用户的电子邮箱)。由图1所示的用户团可知:
1、用户曾经使用设备节点100所示的终端设备,分别以用户节点105所示的用户账号和用户节点107所示的用户账号登录过网站;
2、用户曾经使用设备节点101所示的终端设备,分别以用户节点106所示的用户账号和用户节点107所示的用户账号登录过网站;
3、用户曾经使用设备节点102所示的终端设备,以用户节点107所示的用户账号登录过网站;
4、用户曾经使用设备节点103所示的终端设备,分别以用户节点105所示的用户账号和用户节点107所示的用户账号登录过网站;
5、用户曾经使用设备节点104所示的终端设备,以用户节点107所示的用户账号登录过网站。
本公开可以建立图1所示的用户团中的所有节点的标识分别与同一个归一标识的映射关系,并将该归一标识作为该用户的一标识。本公开可以针对图1中的所有节点各自对应的业务数据,确定该用户在房屋属性枚举值上的偏好,从而在需要向用户推送房屋信息的场景中,本公开可以根据当前确定出的该用户的偏好,为该用户选取相应的房源信息,并推送。例如,如果用户的偏好包括:位置在A城市的B区,面积在40-60平方米之间的一室一厅新房,则可以使向用户推荐的房源信息中包含较多数量的与用户的该偏好相符的房源信息。
示例性方法
图2为本公开的标识映射的实现方法一个实施例的流程图。图2所示的实施例的方法包括步骤:S200、S201、S202、S203以及S204。下面对各步骤分别进行说明。
S200、获取多个设备标识和多个用户标识。
本公开中的设备标识通常是指用于表示一个终端设备的标识。设备标识可以为IMEI(International Mobile Equipment Identity,国际移动设备识别码)、或者Cookie(一种小型文本文件)等。一个设备标识通常对应唯一一个终端设备。
本公开中的用户标识通常是指用于表示一个用户的标识。用户标识可以为电话号码、UCid(UniversalCallIdentifier,通用呼叫标识)或者基于即时通信的小程序标识等。用户标识可以认为是用户账号。在任一时刻,一个用户标识通常对应唯一一个用户。
本公开可以基于预定时间范围内的业务数据,获取多个设备标识和多个用户标识。
S201、获取多个设备标识和多个用户标识之间的登录关系信息。
本公开中的一登录关系信息可以表示出:用户使用一用户标识执行登录操作时,所使用的终端设备,或者说,可以表示出用户在使用一终端设备执行登录操作时,所使用的用户账号。由此可知,登录关系信息可以表示出:终端设备的设备标识和用户标识是否同时出现在一次登录过程中。即登录关系信息可以表示出终端设备的设备标识和用户标识之间是否存在关联。
S202、将多个设备标识分别作为用户画像图中的各设备节点的标识,将多个用户标识分别作为用户画像图中的各用户节点的标识,将登录关系信息作为用户画像图中的设备节点与用户节点间的连线,生成包含至少一个用户团的用户画像图。
本公开可以将设备标识、用户标识和登录关系信息均作为输入,提供给相应的图构建工具(如导入Neo4J等工具中),由图构建工具对导入的信息进行相应处理,从而生成包含至少一个用户团的用户画像图。
本公开生成用户画像图的过程可以认为是:形成结构化数据,并将结构化数据存储在网络上(而不是表中)的过程。从数学角度上看,存储了结构化数据的网络,即为用户画像图。
本公开生成的用户画像图通常包括多个用户团。生成的用户画像图中的任一用户团通常包括至少一个节点。也就是说,S202生成的每一个用户团均包括:至少一个设备节点和/或至少一个用户节点。另外,在一个用户团包括多个节点的情况下,一个用户团中的所有节点是相互连通的,不存在用户团中的一部分节点与另一部分节点没有连接关系的现象。
S203、针对用户画像图中的任一用户团,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与同一用户的归一标识的映射关系,且不同用户团的映射关系中的归一标识不相同。
本公开的归一标识可以唯一标识一个用户团,不同用户团具有不同的归一标识。由于一个用户团对应唯一一个用户,因此,本公开的归一标识可以唯一标识一个用户。本公开中的归一标识可以采用用户团中的某一个节点的标识,也可以与用户团中的所有节点的标识均不相同。
S204、对用户画像图中的用户团的结构进行更新处理。
本公开中的用户团的结构包括:设备节点、用户节点以及设备节点与用户节点间的连线。本公开对用户画像图中的用户团的结构进行更新处理可以至少包括下述五种形式:
1、删除一个用户团中的一个已有节点,并同时删除该已有节点与用户团中的其他节点间的连线;
2、在一个用户团中增加一个新增节点,并同时增加该新增节点与该用户团中的已有节点间的连线;
3、在一个用户团中的两个已有节点间增加连线;
4、在一个用户团中的一已有节点与另一个用户团中的一已有节点间增加连线,从而使两个用户团合并为一个用户团;
5、在用户画像图中增加新的用户团。
本公开在对用户画像图中的用户团的结构进行更新处理的过程中,可能会导致一个用户团只包括一个节点的情况。例如,在将一个用户团中的一已有节点从该用户团中删除之后,该节点独自形成一个用户团。
本公开可以在检测到新增节点时,执行对用户画像图中的用户团的结构进行更新处理的操作。本公开也可以在定时对用户画像图中的用户团进行健康检测时,执行对用户画像图中的用户团的结构进行更新处理的操作。
本公开通过利用设备标识、用户标识和登录关系信息形成用户画像图,并为用户画像图中的每一个用户团分别设置归一标识,不但可以在占用较少计算资源的情况下,快速的实现标识映射,还可以在占用较少计算资源的情况下,对用户画像图中的用户团的结构进行更新处理。由此可知,本公开提供的技术方案有利于提高标识映射的效率以及准确性。
在一个可选示例中,本公开的节点的属性包括:节点的首次出现时间。也就是说,对于设备节点而言,节点的属性为设备节点的首次出现时间;即本公开可以将用户首次利用一终端设备执行一登录操作的时间,作为该终端设备对应的设备节点的首次出现时间。对于用户节点而言,节点的属性为用户节点的首次出现时间;即本公开可以将用户首次利用一用户标识(如用户的电子邮箱或者电话号码等)执行一登录操作的时间,作为该用户标识对应的设备节点的首次出现时间。
可选的,本公开可以利用用户团中的所有节点的属性,确定该用户团的归一标识。具体的,针对用户画像图中的任一用户团,本公开可以先获得该用户团中的所有设备节点的首次出现时间以及所述用户节点的首次出现时间,然后,从中选取首次出现时间最早的节点(可能是设备节点,也可能是用户节点),之后,本公开可以将首次出现时间最早的节点的标识(可能是设备标识,也可能是用户标识)作为该用户团对应的用户的归一标识,从而建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与该归一标识的映射关系。在首次出现时间最早的节点为多个时,可以从多个节点中选取一个节点。例如,随机选取一个节点,再例如,按照优先选取用户节点等选取原则,选取一个节点。
本公开通过将节点的首次出现时间作为节点的属性,有利于后续的用户团结构的更新处理操作。通过将首次出现时间最早的节点的标识作为归一标识,有利于更清晰的掌握各用户的首次登录时间,从而有利于更好的为用户提供服务。
在一个可选示例中,本公开可以采用多种方式对用户画像图中的用户团的结构进行更新处理,下述例举三种不同的实现方式:
方式一、对用户画像图中的用户团进行异常检测,并对检测出的异常用户团进行节点删除处理。
可选的,本公开可以定期对用户画像图中的用户团进行异常检测,也可以在用户团的结构发生变化时,对结构发生变化的用户团进行异常检测。本公开的异常检测可以是针对节点数量的异常检测,也可以是针对用户的偏好的异常检测。针对节点数量的异常检测可以认为是对用户团中的节点的数量是否符合预定数量条件的检测。即基于用户团所包含的节点数量,对用户画像图中的所有用户团或者部分用户团进行异常检测。针对用户的偏好的异常检测可以认为是对用户的偏好变化是否符合预定偏好变化条件的检测。即基于用户团所对应的用户的偏好变化,对用户画像图中的所有用户团或者部分用户团进行异常检测。
可选的,本公开的基于用户团所包含的节点数量,对用户画像图中的所有用户团或者部分用户团进行异常检测的两个例子如下:
第一个例子,本公开可以通过对用户团所包含的节点数量和针对用户团设置的预定节点数量进行比较,完成对用户画像图中的所有用户团或者部分用户团进行异常检测。具体的,本公开可以先获取用户画像图中的每一个用户团当前各自包含的节点数量,然后,对每一个用户团当前包含的节点数量分别进行是否超过预定节点数量的判断,并将判断出的当前包含节点数量超过预定节点数量的用户团,作为异常用户团。本公开中的预定节点数量通常是根据实际情况设置的。在通常情况下,一个用户不会使用太多的终端设备,也不会具有太多的用户标识,因此,一个用户团所包含的节点数量通常不会太大,如果一个用户团所包含的节点数量超过预定节点数量,则很可能是由于两个用户团或者更多用户团中的节点被连接在一起,从而产生用户团的合并导致的。
本公开通过利用预定节点数量,有利于便捷的检测出由于用户团的合并等因素导致的异常用户团;通过对检测出的异常用户团进行节点删除处理,实现了用户团的拆分,有利于避免本应对应不同用户的多个用户团被错误的合并而导致异常用户团的现象。
第二个例子,本公开可以确定在预定时间范围内(也可以称为窗口期)存在新增节点的各用户团所包含的节点数量的均值,若该均值与历史均值的差异满足预定差异条件(如该差异超过预定差异等),则确定新增节点的各用户团中存在异常用户团。
具体的,本公开可以在每一个窗口期(如1小时或者若干小时或者一天等)结束时,获取在该窗口期内,存在新增节点的所有用户团各自包含的节点数量,获得多个节点数量,之后,计算这多个节点数量的均值。如果当前未存储有均值,则本公开可以判断计算出的该均值与预先设置的缺省均值的差异(即两个均值的差值),如果该差异满足预定差异条件(如该差异不超过预定差异等),则确定在该窗口期内,存在新增节点的所有用户团中不存在异常用户团,并存储计算出的均值;如果当前存储有均值,则可以判断当前计算获得的均值与当前存储的最新均值的差异,如果该差异满足预定差异条件(如该差异不超过预定差异等),则确定在该窗口期内,存在新增节点的所有用户团中不存在异常用户团,并存储计算出的均值;如果两个均值的差异不满足预定差异条件(如该差异超过预定差异等),则确定在该窗口期内,存在新增节点的所有用户团中存在异常用户团,不存储计算出的均值。上述预定差异可以为3sigma等。
在存在新增节点的所有用户团中存在异常用户团的情况下,本公开可以对在最近一个窗口期内存在新增节点的每一个用户团当前各自包含的节点数量分别进行是否超过预定节点数量的判断,并将判断出的当前包含节点数量超过预定节点数量的用户团作为异常用户团。
由于在不同窗口期内,正常增加节点的用户团所包含的节点数量的变化通常是平缓的,而用户团的合并等异常现象,会导致增加节点的用户团所包含的节点数量发生较大幅度变化,因此,本公开通过对相邻窗口期各自对应的均值的差值进行判断,有利于便捷的确定出异常用户团存在的范围,从而有利于更加快捷实现异常用户团的定位。
可选的,本公开基于用户团所对应的用户的偏好变化,对用户画像图中的所有用户团或者部分用户团进行异常检测的一个具体实现过程如下所述:
本公开中的登录关系信息具有属性,登录关系信息的属性可以包括:首次登录时间。如果一登录关系表示一设备节点和一用户节点之间的连线,则该登录关系的属性表示:用户使用该设备节点所对应的终端设备,并利用该用户节点的标识(即该用户节点所对应的用户标识),首次执行登录操作的时间。本公开可以以一个用户团中的各登录关系信息的属性为确定用户偏好的时间点,从而本公开可以获得该用户在多个时间段内的偏好,例如,本公开可以按照时间先后顺序对一个用户团中的n个登录关系的属性进行排序,之后,利用属于排序中的第一个时间点和第二个时间点之间的业务数据,获得该用户在第一个时间点和第二个时间点之间的偏好,利用属于排序中的第二个时间点和第三个时间点之间的业务数据,获得该用户在第二个时间点和第三个时间点之间的偏好,……以此类推,本公开可以获得该用户在倒数第二个时间点和最后一个时间点之间的偏好,从而本公开可以获得该用户的n-1个偏好;如果两个相邻的偏好的变化满足预定变化条件(如该用户在相邻时间段中的偏好的变化超过预定变化阈值),则本公开可以将该用户团作为异常用户团。本公开可以利用向量来表示用户的偏好,本公开可以通过计算向量间的距离(如欧式距离等)来表示用户在相邻时间段中的偏好的变化。
本公开通过为登录关系信息设置属性,可以便捷的利用该属性来确定出用户在相邻时间段的偏好的变化。由于一个用户在相邻的两个时间段内的偏好通常具有一定的延续性,即一个用户的偏好的变化通常是渐变,而不是突变的,然而不同用户的偏好有时差异较大,如果在一个时间点之前的用户的偏好和在一个时间点之后的用户的偏好,发生了较大的变化,则很有可能出现分属于两个用户团的节点被设置在一个用户团中的现象。也就是说,如果一个用户团中包含的节点不是属于同一个用户,则可能会出现用户在相邻时间段的偏好的变化较大的现象,例如,由于第一用户借用了第二用户的终端设备使用第一用户的用户账号执行了登录操作,则促使该用户账号对应的用户节点被设置于第二用户对应的用户团中,进而可能会导致两个用户团被合并为一个用户团的现象。本公开通过对相邻时间段的偏好的变化进行判断,有利于提高判断异常用户团的多样性以及准确性。
在一个可选示例中,在确定出异常用户团之后,本公开可以先确定出异常用户团中的异常节点,并将该异常节点从异常用户团中删除。本公开中的一个用户团中的异常节点通常为:不属于该用户团所对应的用户,而属于其他用户的节点。本公开通过对异常用户团进行异常节点定位,并将异常节点从异常用户团中删除,有利于从一个用户团中剥离出属于其他用户的节点,从而有利于保证用户画像图中的用户团的结构的准确性。
可选的,本公开可以采用下述两种方式确定异常用户团中的异常节点:
方式a、将异常用户团中连线数量最多的节点作为异常节点。
本公开的用户团中的每一个节点均至少通过一条连线与其他节点相连。本公开可以对用户团中的每一个节点分别进行连线数量统计操作,并从统计获得的各节点各自对应的连线数量中选取出连线数量最多的节点,该连线数量最多的节点即为异常节点。在将连线数量最多的节点从用户团中删除时,该节点的连线也一并被删除。例如,图1中的用户节点107的连线数量最多(五条连线),如果将用户节点107从图1所示的用户团中删除,那么,用户节点107的五条连线也被删除,从而图1所示的用户团被拆分为五个用户团(如图3所示),即设备节点100、设备节点103和用户节点105为第一个用户团,设备节点101和用户节点106为第二个用户团,设备节点102为第三个用户团,设备节点104为第四个用户团,用户节点107为第五个用户团。
一个节点的连线数量越多,表示与该节点相关联的节点的数量越多,如果一个节点关联了过多的节点,则很有可能出现由于该节点使多个用户团聚合在一起形成一个用户团的现象。例如,由于终端设备中安装的操作系统的限制等因素,在用户登录时,其使用的终端设备的标识可能无法被正常读取,从而使终端设备的标识为一缺省值,这样,众多终端设备的标识可能均为该缺省值,从而使多个用户团被聚合在一起形成一个大用户团。本公开通过将连线数量最多的节点从该用户团中删除,有利于避免多个用户团被聚合在一起形成一个大用户团的现象,从而有利于保证用户画像图中的用户团的结构的准确性。
方式b、获取异常用户团中的各节点各自对应的偏好,并获取异常用户团的偏好中心点,将偏好距离用户偏好中心点最远的节点作为异常节点。一个用户团的偏好中心点可以认为是该用户团所表示的用户的偏好的平均值。偏好距离用户偏好中心点最远可以认为是与用户的偏好的平均值差异最大。
可选的,本公开的异常用户团中的每一个节点均具有属性,即设备节点的首次出现时间或者用户节点的首次出现时间。
在一个例子中,对于异常用户团中的任一个节点,本公开可以利用该节点对应的首次出现时间之前的业务数据,获取该节点所对应的用户的偏好,从而本公开可以获得每一个节点各自对应的该用户的偏好。之后,本公开可以利用该异常用户团中的所有节点各自对应的该用户的偏好确定出该异常用户团的偏好中心点。
在另一个例子中,本公开可以对异常用户团中的所有节点,按照各节点各自的首次出现时间的先后顺序进行排序,对于异常用户团中的任一个节点,本公开可以利用该节点对应的首次出现时间和其前一个节点的首次出现时间之间的业务数据,获取该节点所对应的用户的偏好,从而本公开可以获得每一个节点各自对应的该用户的偏好。之后,本公开可以利用该异常用户团中的所有节点各自对应的该用户的偏好确定出该异常用户团的偏好中心点。
可选的,本公开确定异常用户团的偏好中心点的一个例子可以为:在本公开中的用户的偏好包括m维的情况下,异常用户团中的每一个节点所对应的该用户的偏好均可以表示为(x1,x2,......,xm);如果一个异常用户团中包括n个节点,则本公开可以获得n个x1,n个x2,……,n个xm,本公开可以计算n个x1中的最大值与n个x1中的最小值之间的差值a1、n个x2中的最大值与n个x2中的最小值之间的差值a2、……以及n个xm中的最大值与n个xm中的最小值之间的差值am,本公开可以将计算获得的n个差值作为该异常用户团的偏好中心点,即(a1,a2,......,am)。
可选的,本公开可以计算每一个节点对应的该用户的偏好分别与偏好中心点之间的距离(如欧式距离等),从而可以获得n个距离,本公开可以将计算出的n个距离中的距离最大的节点作为异常节点。本公开在将距离最大的节点作从用户团中删除时,该节点的连线也一并被删除。具体如上述方式a中的描述,在此不再详细说明。另外,对于房产领域而言,本公开中的用户的偏好的维度可以为2,即面积和价格。
相比于两个不同用户的偏好的变化而言,同一个用户的偏好的变化往往较小,因此,本公开通过利用一个用户团内的所有节点各自对应的偏好,计算出偏好中心点,并将偏好距离该偏好中心点最远的节点删除,有利于从该用户团中剥离出不属于该用户团的节点,从而有利于维护用户团的结构的准确性。
方式二、根据新增节点和基于新增节点的新增登录关系信息,确定新增节点所属的用户团,并根据新增登录关系信息,建立新增节点与其所属的用户团中的已有节点的连线,建立该新增节点的标识与其所属的用户团的归一标识的映射关系。
在一个可选示例中,本公开可能出现新增设备节点和新增登录关系信息的现象,也能出现新增用户节点和新增登录关系信息的现象,还可能会出现新增设备节点、新增用户节点以及新增登录关系信息的现象。
一个例子,在用户新购置了一个终端设备的情况下,如果该用户利用该新购置的终端设备,并以自己原来的用户账号执行登录操作,则会产生新增设备节点的现象,且该新购置的终端设备对应的设备节点即为新增节点。该新增设备节点和该用户账号对应的用户节点之间的连线即为新增登录关系信息。
再一个例子,如果一个用户使用其原有的终端设备注册了一个新的用户账号,则会产生新增用户节点的现象,且该新的用户账号对应的用户节点即为新增节点。该原有的设备对应的设备节点和该新的用户账号对应的用户节点之间的连线即为新增登录关系信息。
由上述两个例子可知,在新增节点为新增设备节点或者新增用户节点时,基于新增节点的新增登录关系信息通常表示新增节点与已有用户团中的已有节点的连线。
又一个例子,在用户新购置了一个终端设备的情况下,如果该用户使用该新购置的终端设备注册了一个新的用户账号,则会产生同时新增设备节点和新增用户节点的现象,且该新购置的终端设备对应的设备节点、以及该新的用户账号对应的用户节点即为新增节点。该新增设备节点和该新增用户节点之间的连线即为新增登录关系信息。
可选的,在新增节点为新增设备节点以及新增用户节点时,基于新增节点的新增登录关系信息通常表示两个新增节点间的连线。在该情况下,本公开可以将新增设备节点和新增用户节点作为一个用户团,且在新增设备节点和新增用户节点之间设置连线。
可选的,在确定出新增登录关系信息为新增节点和已有用户团中的已有节点之间的连线时,在一些应用场景中,该新增节点属于该已有用户团,此时,可以直接建立该新增节点与该已有用户团中的已有节点之间的连线即可。在另一些应用场景中,该新增节点不属于该已有用户团,此时,本公开可能需要对已有节点进行复制,并利用新增节点和复制后的节点建立一个新用户团,且该新用户团当前仅包括该新增节点和复制后的节点。本公开可以在该新增节点和复制后的节点之间设置有连线。
可选的,本公开可以根据新增节点对应的偏好以及已有节点对应的偏好,来确定该新增节点是属于已有用户团,还是属于新用户团。具体的,本公开可以根据已有节点的首次出现时间之前的业务数据,确定用户的偏好,从而获得已有节点对应的偏好;本公开可以根据新增节点的首次出现时间之后的业务数据,确定用户的偏好(即新增节点对应的偏好);之后,本公开可以计算新增节点对应的偏好和已有节点对应的偏好之间的差异,如果该差异满足预定差异条件(如差异不超过预定差异等),则本公开可以确定该新增节点属于已有节点所在的已有用户团。如果新增节点对应的偏好和已有节点对应的偏好之间的差异不满足预定差异条件(如差异超过预定差异等),则本公开可以确定该新增节点不属于已有节点所在的已有用户团,本公开应属于复制该已有节点,并在用户画像图中建立包含有该新增节点和该复制的已有节点的新用户团。
在用户的电话号码等用户标识被回收或者被转让等,由其他用户继续使用的情况下,会造成同一个用户标识被不同用户使用的现象,从而可能会导致基于新增设备节点的新增登录关系信息,使新增设备节点直接与已有用户节点相连的现象,也就是说,会出现将新增设备节点作为已有用户节点所在的用户团中的一个设备节点的现象。
在用户的终端设备被转让或者被偷盗等,由其他用户继续使用的情况下,会造成同一个终端设备被不同用户使用的现象,从而可能会导致基于新增用户节点的新增登录关系信息,使新增用户节点直接与已有设备节点相连的现象,也就是说,会出现将新增用户节点作为已有设备节点所在的用户团中的一个用户节点的现象。
上述两种现象均这会导致用户团的结构在更新维护过程中出现问题。本公开通过利用用户的偏好的变化,判断新增节点是属于该已有节点所在用户团,还是与已有节点的复制节点一起属于一个新用户团,有利于避免上述错误现象的发生,从而有利于提高用户团结构的准确性。
方式三、在确定出新增登录关系信息表示用户画像图中已有两个节点之间的连线时,在该已有两个节点间设置连线。
可选的,假设一用户曾经使用其第一终端设备和第一用户标识执行了登录操作,假设该用户曾经使用其第二终端设备和第二用户标识执行了登录操作,假设该用户曾经使用第一终端设备和第二用户标识执行了登录操作。
在上述假设的情况下,第一终端设备对应的设备节点、第二终端设备对应的设备节点、第一用户标识对应的用户节点和第二用户标识对应的用户节点,被设置在同一个用户团中,且第一终端设备对应的设备节点和第一用户标识对应的用户节点之间存在连线,第二终端设备对应的设备节点和第二用户标识对应的用户节点之间存在连线,第一终端设备对应的设备节点和第二用户标识对应的用户节点之间存在连线。
如果该用户在之后的某一天,使用第二终端设备和第一用户标识执行了登录操作,则会产生新增登录关系信息,该新增登录关系信息对应的两个节点均为一个用户团中的已有节点,本公开应在第二终端设备对应的设备节点和第一用户标识对应的用户节点之间设置连线,且该连线的设置并未导致两个用户团的合并。
可选的,假设一用户曾经使用其第一终端设备和第一用户标识执行了登录操作,且假设该用户曾经使用其第二终端设备和第二用户标识执行了登录操作。
在上述假设的情况下,第一终端设备对应的设备节点和第一用户标识对应的用户节点被设置一个用户团中,第二终端设备对应的设备节点和第二用户标识对应的用户节点被设置在另一个用户团中,且第一终端设备对应的设备节点和第一用户标识对应的用户节点之间存在连线,第二终端设备对应的设备节点和第二用户标识对应的用户节点之间存在连线。
如果该用户在之后的某一天,使用其第一终端设备和第二用户标识执行了登录操作,则会产生新增登录关系信息,该新增登录关系信息对应的两个节点为两个用户团中的已有节点,本公开应在第一终端设备对应的设备节点和第二用户标识对应的用户节点之间设置连线,从而使两个用户团合并为一个用户团。
本公开通过利用新增登录关系信息在已有的两个节点间设置连线,有利于使用户团的结构可以随用户的登录操作而自动发生相应的变化,从而有利于提高用户团的结构的准确性。
示例性装置
图4为本公开的标识映射的实现装置一个实施例的结构示意图。该实施例的装置可用于实现本公开上述各方法实施例。
如图4所示,本实施例的装置可以包括:获取标识模块400、获取关系模块401、生成图模块402、建立映射模块403以及图维护模块404。
获取标识模块400用于获取多个设备标识和多个用户标识。
获取关系模块401用于获取上述多个设备标识和多个用户标识之间的登录关系信息。其中的登录关系信息表示用户使用一用户标识执行登录操作时,所使用的终端设备。
生成图模块402用于将获取标识模块400获取的多个设备标识分别作为用户画像图中的各设备节点的标识,将获取标识模块400获取的多个用户标识分别作为用户画像图中的各用户节点的标识,将获取关系模块401获取的登录关系信息作为用户画像图中的设备节点与用户节点间的连线,生成包含至少一个用户团的用户画像图。其中,生成图模块402生成的用户画像图中的每一个用户团均包括:至少一个节点。
建立映射模块403用于针对生成图模块402生成的用户画像图中的任一用户团,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与同一用户的归一标识的映射关系,且不同用户团的映射关系中的归一标识不相同。
可选的,本公开中的每一个节点均具有属性,且节点的属性包括:节点的首次出现时间。针对用户画像图中的任一用户团,本公开中的建立映射模块403可以先确定该用户团中的首次出现时间最早的节点,然后,建立映射模块403可以将首次出现时间最早的节点的标识作为该用户团对应的用户的归一标识,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与该归一标识的映射关系。
图维护模块404用于对用户画像图中的用户团的结构进行更新处理。
可选的,图维护模块404可以包括:第一子模块4041、第二子模块4042以及第三子模块4043中的至少一个。
可选的,第一子模块4041用于对用户画像图中的用户团进行异常检测,并对检测出的异常用户团进行节点删除处理。第一子模块4041可以包括:第一单元40411、第二单元40412和第三单元40413中的至少一个。其中的第一单元40411用于基于用户团所包含的节点数量,对用户画像图中的用户团进行异常检测。其中的第二单元40412用于基于用户团所对应的用户的偏好变化,对用户画像图中的用户团进行异常检测。其中的第三单元40413用于确定异常用户团中的异常节点,并将异常节点从异常用户团中删除。
可选的,上述第一单元40411可以包括:第一子单元404111和第二子单元404112中的至少一个。其中的第一子单元404111用于获取用户画像图中的各用户团各自包含的节点数量,并将所包含的节点数量超过预定节点数量的用户团,作为检测出的异常用户团。其中的第二子单元404112用于确定在预定时间范围内存在新增节点的各用户团所包含的节点数量的均值,若该均值与历史均值的差异满足预定差异条件,则确定新增节点的各用户团中存在异常用户团。
可选的,本公开中的登录关系信息具有属性,登录关系信息的属性包括:首次登录时间。针对用户画像图中的任一用户团,第二单元40412可以获取具有该用户团的归一标识的用户在各相邻首次登陆时间之间的偏好,从而获得各节点各自对应的偏好,若首次登陆时间相邻的两个节点各自对应的偏好的变化满足预定变化条件,则第二单元40412将该用户团作为检测出的异常用户团。
可选的,第三单元40413可以包括:第三子单元404131以及第四子单元404132中的至少一个。其中的第三子单元404131用于将异常用户团中连线数量最多的节点作为异常节点。其中的第四子单元404132用于获取异常用户团中的各节点各自对应的偏好,并获取异常用户团的偏好中心点,第四子单元404132将偏好距离用户偏好中心点最远的节点作为异常节点。
可选的,第二子模块4042用于根据新增节点和基于新增节点的新增登录关系信息,确定新增节点所属的用户团,并根据新增登录关系信息,建立新增节点与其所属的用户团中的节点的连线,建立新增节点的标识与其所属的用户团的归一标识的映射关系。例如,第二子模块4042可以在确定出新增登录关系信息为新增节点与已有用户团中的已有节点的连线时,获取新增节点对应的偏好以及已有节点对应的偏好,若新增节点对应的偏好和已有节点对应的偏好的差异满足预定差异条件,则第二子模块4042确定该新增节点属于上述已有用户团。若新增节点对应的偏好上述已有节点对应的偏好的差异不满足预定差异条件,则第二子模块4042复制上述已有节点,并在用户画像图中建立包含有上述新增节点和上述复制的已有节点的新用户团。
可选的,第三子模块4043用于在确定出新增登录关系信息表示用户画像图中的两个已有节点之间的连线时,在两个已有节点间设置连线。
上述各模块及其包括的子模块和单元具体执行的操作可以参见上述方法实施例中针对图2和图3的描述,在此不再详细说明。
示例性电子设备
下面参考图5来描述根据本公开实施例的电子设备。图5示出了根据本公开实施例的电子设备的框图。如图5所示,电子设备51包括一个或多个处理器511和存储器512。
处理器511可以是中央处理单元(CPU)或者具有标识映射的实现能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备51中的其他组件以执行期望的功能。
存储器512可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器,例如,可以包括:随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器,例如,可以包括:只读存储器(ROM)、硬盘以及闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器511可以运行所述程序指令,以实现上文所述的本公开的各个实施例的标识映射的实现方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备51还可以包括:输入装置513以及输出装置514等,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。此外,该输入设备513还可以包括例如键盘、鼠标等等。该输出装置514可以向外部输出各种信息。该输出设备514可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备51中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备51还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的标识映射的实现方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的标识映射的实现方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列举)可以包括:具有一个或者多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势以及效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备以及系统。诸如“包括”、“包含、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述,以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改等对于本领域技术人员而言,是非常显而易见的,并且在此定义的一般原理可以应用于其他方面,而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式中。尽管以上已经讨论了多个示例方面以及实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (18)
1.一种标识映射的实现方法,包括:
获取多个设备标识和多个用户标识;
获取所述多个设备标识和多个用户标识之间的登录关系信息,其中,所述登录关系信息表示用户使用一用户标识执行登录操作时,所使用的终端设备;所述登录关系信息的属性包括:首次登录时间;
将所述多个设备标识分别作为用户画像图中的各设备节点的标识,将所述多个用户标识分别作为用户画像图中的各用户节点的标识,将所述登录关系信息作为用户画像图中的设备节点与用户节点间的连线,生成包含至少一个用户团的用户画像图;其中,生成的每一个用户团均包括至少一个节点;
针对用户画像图中的任一用户团,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与同一用户的归一标识的映射关系,且不同用户团的映射关系中的归一标识不相同;
对所述用户画像图中的用户团的结构进行更新处理,包括:对所述用户画像图中的用户团进行异常检测,并对检测出的异常用户团进行节点删除处理;
对所述用户画像图中的用户团进行异常检测,包括:针对所述用户画像图中的任一用户团,获取具有该用户团的归一标识的用户在各相邻首次登陆时间之间的偏好,获得各节点各自对应的偏好,若首次登陆时间相邻的两个节点各自对应的偏好的变化超过预定变化阈值,则将该用户团作为检测出的异常用户团。
2.根据权利要求1所述的方法,其中,所述节点的属性包括:节点的首次出现时间;
所述针对用户画像图中的任一用户团,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与同一用户的归一标识的映射关系,包括:
针对用户画像图中的任一用户团,确定该用户团中的首次出现时间最早的节点;
将所述首次出现时间最早的节点的标识作为该用户团对应的用户的归一标识,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与所述归一标识的映射关系。
3.根据权利要求1所述的方法,其中,所述对所述用户画像图中的用户团的结构进行更新处理,还包括:
根据新增节点和基于所述新增节点的新增登录关系信息,确定所述新增节点所属的用户团,并根据所述新增登录关系信息,建立所述新增节点与其所属的用户团中的节点的连线,建立所述新增节点的标识与其所属的用户团的归一标识的映射关系;
在确定出新增登录关系信息表示用户画像图中的两个已有节点之间的连线时,在所述两个已有节点间设置连线。
4.根据权利要求3所述的方法,其中,所述对所述用户画像图中的用户团进行异常检测,还包括:
基于用户团所包含的节点数量,对所述用户画像图中的用户团进行异常检测。
5.根据权利要求4所述的方法,其中,所述基于用户团所包含的节点数量,对所述用户画像图中的用户团进行异常检测,包括下述至少一步骤:
获取所述用户画像图中的各用户团各自包含的节点数量,并将所包含的节点数量超过预定节点数量的用户团,作为检测出的异常用户团;
确定在预定时间范围内存在新增节点的各用户团所包含的节点数量的均值,若所述均值与历史均值的差异满足预定差异条件,则确定所述新增节点的各用户团中存在异常用户团。
6.根据权利要求3所述的方法,其中,所述对检测出的异常用户团进行节点删除处理,包括:
确定异常用户团中的异常节点,并将所述异常节点从异常用户团中删除。
7.根据权利要求6所述的方法,其中,所述确定异常用户团中的异常节点,包括下述至少一步骤:
将所述异常用户团中连线数量最多的节点作为异常节点;
获取所述异常用户团中的各节点各自对应的偏好,并获取所述异常用户团的偏好中心点,将偏好距离所述异常用户团的偏好中心点最远的节点作为异常节点。
8.根据权利要求3至7中任一项所述的方法,其中,所述根据新增节点和基于所述新增节点的新增登录关系信息,确定所述新增节点所属的用户团,包括:
在确定出所述新增登录关系信息为所述新增节点与已有用户团中的已有节点的连线时,获取所述新增节点对应的偏好以及所述已有节点对应的偏好;
若所述新增节点对应的偏好和所述已有节点对应的偏好的差异满足预定差异条件,则确定所述新增节点属于所述已有用户团;
若所述新增节点对应的偏好和所述已有节点对应的偏好的差异不满足预定差异条件,则复制所述已有节点,并在用户画像图中建立包含有所述新增节点和所述复制的已有节点的新用户团。
9.一种标识映射的实现装置,其中,所述装置包括:
获取标识模块,用于获取多个设备标识和多个用户标识;
获取关系模块,用于获取所述多个设备标识和多个用户标识之间的登录关系信息,其中,所述登录关系信息表示用户使用一用户标识执行登录操作时,所使用的终端设备;所述登录关系信息的属性包括:首次登录时间;
生成图模块,用于将所述多个设备标识分别作为用户画像图中的各设备节点的标识,将所述多个用户标识分别作为用户画像图中的各用户节点的标识,将所述登录关系信息作为用户画像图中的设备节点与用户节点间的连线,生成包含至少一个用户团的用户画像图;其中,生成的每一个用户团均包括至少一个节点;
建立映射模块,用于针对用户画像图中的任一用户团,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与同一用户的归一标识的映射关系,且不同用户团的映射关系中的归一标识不相同;
图维护模块,用于对所述用户画像图中的用户团的结构进行更新处理;
所述图维护模块包括:第一子模块,用于对所述用户画像图中的用户团进行异常检测,并对检测出的异常用户团进行节点删除处理;
所述第一子模块包括:第二单元,用于针对所述用户画像图中的任一用户团,获取具有该用户团的归一标识的用户在各相邻首次登陆时间之间的偏好,获得各节点各自对应的偏好,若首次登陆时间相邻的两个节点各自对应的偏好的变化超过预定变化阈值,则将该用户团作为检测出的异常用户团。
10.根据权利要求9所述的装置,其中,所述节点的属性包括:节点的首次出现时间;所述建立映射模块进一步用于:
针对用户画像图中的任一用户团,确定该用户团中的首次出现时间最早的节点;
将所述首次出现时间最早的节点的标识作为该用户团对应的用户的归一标识,建立该用户团中的所有设备节点的标识和所有用户节点的标识分别与所述归一标识的映射关系。
11.根据权利要求9所述的装置,其中,所述图维护模块还包括:
第二子模块,用于根据新增节点和基于所述新增节点的新增登录关系信息,确定所述新增节点所属的用户团,并根据所述新增登录关系信息,建立所述新增节点与其所属的用户团中的节点的连线,建立所述新增节点的标识与其所属的用户团的归一标识的映射关系;
第三子模块,用于在确定出新增登录关系信息表示用户画像图中的两个已有节点之间的连线时,在所述两个已有节点间设置连线。
12.根据权利要求11所述的装置,其中,所述第一子模块还包括:
第一单元,用于基于用户团所包含的节点数量,对所述用户画像图中的用户团进行异常检测。
13.根据权利要求12所述的装置,其中,所述第一单元包括下述至少一子单元:
第一子单元,用于获取所述用户画像图中的各用户团各自包含的节点数量,并将所包含的节点数量超过预定节点数量的用户团,作为检测出的异常用户团;
第二子单元,用于确定在预定时间范围内存在新增节点的各用户团所包含的节点数量的均值,若所述均值与历史均值的差异满足预定差异条件,则确定所述新增节点的各用户团中存在异常用户团。
14.根据权利要求11所述的装置,其中,所述第一子模块包括:
第三单元,用于确定异常用户团中的异常节点,并将所述异常节点从异常用户团中删除。
15.根据权利要求14所述的装置,其中,所述第三单元包括下述至少一子单元:
第三子单元,用于将所述异常用户团中连线数量最多的节点作为异常节点;
第四子单元,用于获取所述异常用户团中的各节点各自对应的偏好,并获取所述异常用户团的偏好中心点,将偏好距离所述异常用户团的偏好中心点最远的节点作为异常节点。
16.根据权利要求11至15中任一项所述的装置,其中,所述第二子模块进一步用于:
在确定出所述新增登录关系信息为所述新增节点与已有用户团中的已有节点的连线时,获取所述新增节点对应的偏好以及所述已有节点对应的偏好;
若所述新增节点对应的偏好和所述已有节点对应的偏好的差异满足预定差异条件,则确定所述新增节点属于所述已有用户团;
若所述新增节点对应的偏好和所述已有节点对应的偏好的差异不满足预定差异条件,则复制所述已有节点,并在用户画像图中建立包含有所述新增节点和所述复制的已有节点的新用户团。
17.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-8中任一项所述的方法。
18.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010896136.0A CN112016081B (zh) | 2020-08-31 | 2020-08-31 | 标识映射的实现方法、装置、介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010896136.0A CN112016081B (zh) | 2020-08-31 | 2020-08-31 | 标识映射的实现方法、装置、介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112016081A CN112016081A (zh) | 2020-12-01 |
CN112016081B true CN112016081B (zh) | 2021-09-21 |
Family
ID=73503986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010896136.0A Active CN112016081B (zh) | 2020-08-31 | 2020-08-31 | 标识映射的实现方法、装置、介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112016081B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040000714A (ko) * | 2002-06-25 | 2004-01-07 | 주식회사 케이티 | 다중 인터넷 도메인에서 타 도메인 컨텐츠 선호도와도메인 방문시간을 이용한 맞춤 서비스 방법 |
CN105224606A (zh) * | 2015-09-02 | 2016-01-06 | 新浪网技术(中国)有限公司 | 一种用户标识的处理方法及装置 |
CN105808988A (zh) * | 2014-12-31 | 2016-07-27 | 阿里巴巴集团控股有限公司 | 一种识别异常账户的方法及装置 |
CN106101116A (zh) * | 2016-06-29 | 2016-11-09 | 东北大学 | 一种基于主成分分析的用户行为异常检测系统及方法 |
CN107169094A (zh) * | 2017-05-12 | 2017-09-15 | 北京小米移动软件有限公司 | 信息聚合方法及装置 |
CN108664480A (zh) * | 2017-03-27 | 2018-10-16 | 北京国双科技有限公司 | 一种多数据源用户信息整合方法和装置 |
CN109670112A (zh) * | 2018-12-20 | 2019-04-23 | 北京城市网邻信息技术有限公司 | 一种用户画像id的生成方法、装置、存储介质及终端 |
CN110019193A (zh) * | 2017-09-25 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 相似帐号识别方法、装置、设备、系统及可读介质 |
CN110489638A (zh) * | 2019-07-08 | 2019-11-22 | 广州视源电子科技股份有限公司 | 一种搜索方法、装置、服务器、系统及存储介质 |
CN110851485A (zh) * | 2018-07-25 | 2020-02-28 | 百度在线网络技术(北京)有限公司 | 社交关系的挖掘方法及装置、计算机设备与可读介质 |
CN110908980A (zh) * | 2018-08-28 | 2020-03-24 | 北京京东金融科技控股有限公司 | 用户标识映射关系建立方法、系统、设备及存储介质 |
CN111177481A (zh) * | 2019-12-30 | 2020-05-19 | 北京友信科技有限公司 | 用户标识映射方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010250502A (ja) * | 2009-04-14 | 2010-11-04 | Nec Corp | 異常操作検出装置、異常操作検出方法、および異常操作検出プログラム |
CN103023718B (zh) * | 2012-11-29 | 2015-12-23 | 北京奇虎科技有限公司 | 一种用户登录监测设备和方法 |
CN107172104B (zh) * | 2017-07-17 | 2019-12-27 | 顺丰科技有限公司 | 一种登录异常检测方法、系统及设备 |
CN109922032B (zh) * | 2017-12-13 | 2022-04-19 | 百度在线网络技术(北京)有限公司 | 用于确定登录账户的风险的方法、装置、设备及存储介质 |
CN109450920A (zh) * | 2018-11-29 | 2019-03-08 | 北京奇艺世纪科技有限公司 | 一种异常账号检测方法及装置 |
CN109905411B (zh) * | 2019-04-25 | 2021-11-16 | 北京腾云天下科技有限公司 | 一种异常用户识别方法、装置和计算设备 |
CN111107072B (zh) * | 2019-12-11 | 2021-01-12 | 中国科学院信息工程研究所 | 一种基于认证图嵌入的异常登录行为检测方法及系统 |
CN111506895A (zh) * | 2020-04-17 | 2020-08-07 | 支付宝(杭州)信息技术有限公司 | 一种应用登录图的构建方法及装置 |
-
2020
- 2020-08-31 CN CN202010896136.0A patent/CN112016081B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040000714A (ko) * | 2002-06-25 | 2004-01-07 | 주식회사 케이티 | 다중 인터넷 도메인에서 타 도메인 컨텐츠 선호도와도메인 방문시간을 이용한 맞춤 서비스 방법 |
CN105808988A (zh) * | 2014-12-31 | 2016-07-27 | 阿里巴巴集团控股有限公司 | 一种识别异常账户的方法及装置 |
CN105224606A (zh) * | 2015-09-02 | 2016-01-06 | 新浪网技术(中国)有限公司 | 一种用户标识的处理方法及装置 |
CN106101116A (zh) * | 2016-06-29 | 2016-11-09 | 东北大学 | 一种基于主成分分析的用户行为异常检测系统及方法 |
CN108664480A (zh) * | 2017-03-27 | 2018-10-16 | 北京国双科技有限公司 | 一种多数据源用户信息整合方法和装置 |
CN107169094A (zh) * | 2017-05-12 | 2017-09-15 | 北京小米移动软件有限公司 | 信息聚合方法及装置 |
CN110019193A (zh) * | 2017-09-25 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 相似帐号识别方法、装置、设备、系统及可读介质 |
CN110851485A (zh) * | 2018-07-25 | 2020-02-28 | 百度在线网络技术(北京)有限公司 | 社交关系的挖掘方法及装置、计算机设备与可读介质 |
CN110908980A (zh) * | 2018-08-28 | 2020-03-24 | 北京京东金融科技控股有限公司 | 用户标识映射关系建立方法、系统、设备及存储介质 |
CN109670112A (zh) * | 2018-12-20 | 2019-04-23 | 北京城市网邻信息技术有限公司 | 一种用户画像id的生成方法、装置、存储介质及终端 |
CN110489638A (zh) * | 2019-07-08 | 2019-11-22 | 广州视源电子科技股份有限公司 | 一种搜索方法、装置、服务器、系统及存储介质 |
CN111177481A (zh) * | 2019-12-30 | 2020-05-19 | 北京友信科技有限公司 | 用户标识映射方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112016081A (zh) | 2020-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10270795B2 (en) | Identifying network security risks | |
US10824608B2 (en) | Feature generation and storage in a multi-tenant environment | |
CA3059709A1 (en) | Risk analysis method, device and computer readable medium | |
US11238507B2 (en) | Extracting, validating, and correcting item attribute values in a database | |
CN113364853B (zh) | 一种业务服务系统、业务请求方法及网关设备 | |
CN111669379B (zh) | 行为异常检测方法和装置 | |
US10992972B1 (en) | Automatic identification of impermissable account sharing | |
CN111314063A (zh) | 一种基于物联网大数据信息管理方法、系统及装置 | |
CN112070545B (zh) | 用于优化信息触达的方法、装置、介质和电子设备 | |
CN109871408B (zh) | 一种多类型数据库适配方法、装置、电子设备及存储介质 | |
CN113761565B (zh) | 数据脱敏方法和装置 | |
CN112116397A (zh) | 用户行为特征实时处理方法、装置、存储介质及电子设备 | |
CN112016081B (zh) | 标识映射的实现方法、装置、介质和电子设备 | |
CN112052152A (zh) | 一种模拟测试的方法和装置 | |
CN112073395B (zh) | 一种文件分发方法和装置 | |
CN116562954A (zh) | 用户渠道归属认定方法、装置、存储介质及程序产品 | |
CN114706610A (zh) | 一种业务流程图生成方法、装置、设备及存储介质 | |
CN112035749A (zh) | 用户行为特征分析方法、推荐方法及相应装置 | |
CN111324707A (zh) | 用户交互方法和装置、计算机可读存储介质、电子设备 | |
CN112131484A (zh) | 一种多人会话建立方法、装置、设备和存储介质 | |
CN113360939B (zh) | 一种安全访问的控制方法和装置 | |
CN113420037B (zh) | 资产数据实时变更方法及装置 | |
CN115987683B (zh) | 区块链网络中节点访问控制方法、装置、设备和介质 | |
US11362977B2 (en) | Method and system for prioritizing communications responses | |
CN116562886A (zh) | 客户信息管理方法和装置、存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210318 Address after: 100085 Floor 101 102-1, No. 35 Building, No. 2 Hospital, Xierqi West Road, Haidian District, Beijing Applicant after: Seashell Housing (Beijing) Technology Co.,Ltd. Address before: Unit 05, room 112, 1st floor, office building, Nangang Industrial Zone, economic and Technological Development Zone, Binhai New Area, Tianjin 300457 Applicant before: BEIKE TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |