具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为便于对本申请实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本申请实施例的限定。
本申请实施例提供的设备与对象之间映射关系的建立方法及装置,适用于在互联网系统中根据不同对象对设备的使用信息,建立设备与对象之间映射关系的场景,尤其适用于根据不同对象对通过多个设备标识信息所标识的设备的使用信息,建立设备与对象之间映射关系的场景。此处,对象用于表示跟自然人相关的单独个体,可以为用来表示单独个体的用户、账户和账号等;此处的设备包括但不限于移动电话、移动电脑、平板电脑、个人数字助理(Personal Digital Assistant,PDA)、媒体播放器、智能电视、智能手表、智能眼镜、智能手环等。而设备的设备标识信息包括但不限于互联网协议(Internet Protocol,IP)地址信息、多媒体访问控制MAC地址信息、会话标识(Session identification)信息、Cookie信息、国际移动设备识别码(International Mobile Equipment Identification Number,IMEI)信息以及国际移动用户识别码(International Mobile SubscriberIdentification Number,IMSI)信息等。
图1为本申请一种实施例提供的设备与对象之间映射关系的建立方法流程图。该方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置,如图1所示,该方法具体可以包括:
步骤110,获取K个对象的行为记录信息,其中,每个对象的行为记录信息中包含N个设备标识信息,N个设备标识信息用于唯一地确定第一设备。
优选地,K和N均为大于1的正整数。
此处的行为记录信息可以是由服务器在对象访问互联网系统的过程中记录在后台数据库中的,其可以为一个或者多个。具体地,在执行本申请的步骤之前,可以由服务器从后台数据库中读取K个对象中每个对象的一个或者多个行为记录信息,在一个例子中,对象A的行为记录信息可以表示为W(A)={W1,W2,…,Wm},其中,m为对象A的行为记录信息的个数,Wi为对象A的第i个行为记录信息,可以理解的是,对不同的对象,m值可以不同,也即服务器记录的不同对象的行为记录信息的个数可以不同。
需要说明的是,在本申请中,上述一个行为记录信息可以只包含N个设备标识信息,如前述例子,可以将对象A的第i个行为记录信息表示为Wi={S1,S2,…,SN},其中,Sj为对象A的第i个行为记录信息中的第j个设备标识信息。在一个具体例子中,上述S1,S2,…,SN可以分别为IP地址信息,MAC地址信息、会话标识信息、Cookie信息、IMEI信息以及IMSI信息等。
可以理解的是,N个设备标识信息可以共同唯一地确定一个设备,因此,上述一个行为记录信息也可以作为一个设备。而本申请的目的就是确定上述m个行为记录信息或者m个设备对应的m个目标对象,并建立该m个设备与m个目标对象的对应关系。
由于,各行为记录信息或者各设备的目标对象的确定方法相同,所以下面将以选取一个行为记录信息或者一个设备对应的目标对象,并建立该一个设备与目标对象的映射关系为例来说。
步骤120,根据K个对象对N个设备标识信息各自所标识的设备的使用信息,确定对应K个对象的行为记录信息的第一行为特征值。
其中,根据K个对象对N个设备标识信息各自所标识的设备的使用信息,确定对应K个对象的行为记录信息的第一行为特征值,具体为:
步骤1201:对K个对象中的第1个对象,从N个设备标识信息中读取第1个设备标识信息,根据第1个对象对第1个设备标识信息所标识的设备的使用信息,确定对应第1个对象的行为记录信息的1个第二行为特征值。
此处,第1个对象可以为K个对象中的任一对象,第1个设备标识信息可以为N个设备标识信息中任一设备标识信息。以K为2,且该两个对象分别为对象A和对象B,以及第1个对象为对象A,读取的第1个标识信息为IP地址信息,且该IP地址信息为192.168.1.6为例,则上述步骤A即为根据对象A对IP地址信息192.168.1.6所标识的设备的使用信息,确定对应对象A的行为记录信息的1个第二行为特征值。具体地,该步骤1201又可以划分为两个步骤:
步骤A:根据第1个对象对第1个设备标识信息所标识的设备的使用频次比例以及整体使用情况,确定对应第1个对象的行为记录信息的初始的第二行为特征值。
也即步骤A为根据对象A对IP地址信息192.168.1.6所标识的设备的使用频次比例以及整体使用情况,确定对应对象A的行为记录信息的初始的第二行为特征值。
其中,对象A对IP地址信息192.168.1.6所标识的设备的使用频次比例可以根据公式1计算:
(公式1)
其中,K为对象的个数,Oj为第j个对象,Si为第i个设备标识信息所标识的设备,tf(Oj,Si)为所述使用频次比例,Fj(Si)为第j个对象对第i个设备标识信息所标识的设备的使用频次,为K个对象对第i个设备标识信息所标识的设备的使用频次。
如前述例子,假设对象集合用U表示,则U={O1,O2},其中,O1可以为对象A,O2可以为对象B。此外,将公式1中的j替换为1,K替换为2,i替换为1之后,公式1中的分子可以解释为对象A对IP地址信息192.168.1.6所标识的设备的使用频次,该使用频次的具体统计过程为:从互联网系统的后台数据库中读取在预设的时间段内(如,1天)对象A的行为记录信息,并统计该所有行为记录信息中包含的IP地址信息192.168.1.6的总个数;公式1中的分母可以解释为对象A以及对象B对IP地址信息192.168.1.6所标识的设备的使用频次之和,对象B对IP地址信息192.168.1.6所标识的设备的使用频次的统计方法同上,在此不复赘述;将公式1中的分子与分母相比之后,就可获得对象A对IP地址信息192.168.1.6所标识的设备的使用频次比例。
而对象A对IP地址信息192.168.1.6所标识的设备的整体使用情况可以根据公式2计算:
(公式2)
其中,Oj为第j个对象,Si为第i个设备标识信息所标识的设备,idf(Oj)为所述整体使用情况,Count(Si)为第i个设备标识信息所标识的设备的个数,Count(Oj,Si)为第j个对象所使用过的第i个设备标识信息所标识的设备的个数。
如前述例子,将公式2中的j替换为1,i替换为1之后,公式2括号中的分子可以解释为IP地址信息192.168.1.6的总个数,具体统计过程为:从互联网系统的后台数据库中读取对象A和对象B的所有行为记录信息,并统计该所有行为记录信息中包含的IP地址信息192.168.1.6的总个数;公式2括号中的分母可以解释为统计对象A的行为记录信息中包含的IP地址信息192.168.1.6的总个数;将公式2中的分子与分母相比并取log值之后,就可获得对象A对IP地址信息192.168.1.6所标识的设备的整体使用情况。
在确定第1个对象对第1个设备标识信息所标识的设备的使用频次比例以及整体使用情况之后,就可以确定对应第1个对象的行为记录信息的初始的第二行为特征值。
可选地,可以通过公式3确定对应第1个对象的行为记录信息的初始的第二行为特征值。
f(Oj,Si)=tf(Oj,Si)×idf(Oj) (公式3)
其中,Oj为第j个对象,Si为第i个设备标识信息所标识的设备,idf(Oj)为所述整体使用情况,tf(Oj,Si)为所述使用频次比例,f(Oj,Si)为对应第j个对象的1个行为记录信息的初始的第二行为特征值。
如前述例子,将公式2中的j替换为1,i替换为1之后,就可获得对应第1个对象的行为记录信息的初始的第二行为特征值。
由此,可以看出,本申请在确定对象的行为特征值时,综合考虑对象对某一设备标识信息标识的设备的使用频次以及整体使用情况(也即自身的活跃程度),从而可以避免现有技术中只统计对象对不同设备的使用频率时,由于部分对象非常活跃,在很多设备上的使用频率均很高,从而误将该对象与多个设备建立映射关系的问题,也即可以提高设备与对象之间映射关系的准确性。
步骤B:对第1个对象的初始的第二行为特征值进行归一化处理,得到对应第1个对象的行为记录信息的第二行为特征值。
可选地,可以根据公式4对第1个对象的初始的第二行为特征值进行归一化处理。
(公式4)
其中,f(Oj,Si)为第j个对象的初始的第二行为特征值,为K个对象的初始的第二行为特征值,g(Oj,Si)为对应第j个对象的1个行为记录信息的第二行为特征值。
如前述例子,将公式2中的j替换为1,K替换为2,i替换为1之后,就可获得对应第1个对象的行为记录信息的1个第二行为特征值,也即可以获得g(O1,S1)。
步骤1202:重复执行上述读取设备标识信息以及确定第二行为特征值的步骤,直至确定对应第1个对象的行为记录信息的N个第二行为特征值。
也即对K个对象中的第1个对象,依次从N个设备标识信息中读取第2,3,…,N个设备标识信息,根据第1个对象对所述第2,3,…,N个设备标识信息所标识的设备的使用信息,确定对应第1个对象的行为记录信息的其它第二行为特征值;直至确定出第1个对象的N个第二行为特征值,也即确定出g(O1,S2),g(O1,S3),…,g(O1,SN)。
此处,g(O1,S2),g(O1,S3),…,g(O1,SN)可以构成第1个对象的特征向量,即当用V(O1)表示第1个对象的特征向量时,V(O1)={g(O1,S2),g(O1,S3),…,g(O1,SN)}。
步骤1203:根据对应第1个对象的行为记录信息的N个第二行为特征值,确定对应第1个对象的行为记录信息的第一行为特征值。
可选地,可以根据公式5确定对应第1个对象的行为记录信息的第一行为特征值。
(公式5)
其中,g(Oj,Si)为第j个对象的第i个第二行为特征值,i=1,2,…,N,l=1,2,…,m,m为第j个对象的行为记录信息的个数,Wl为第l个行为记录信息,M(Wl,Oj)为对应第j个对象的第l个行为记录信息(或者第l个设备)的第一行为特征值。
需要说明的是,公式5中的g(O1,S2),g(O1,S3),…,g(O1,SN)均为非空元素,若其中包含空元素,则可以去掉空元素,然后求解除空元素之外的其它元素的平均值。
如前述例子,将j替换为1,l替换为1,即可获得对应第1个对象的第1个行为记录信息(或者第1个设备)的第一行为特征值。
当然,在实际应用中,也可以通过其它方法确定对应第1个对象的第1个行为记录信息的第一行为特征值,如,通过计算对应第1个对象的第1个行为记录信息的N个第二行为特征值的加权平均值,来确定对应第1个对象的第1个行为记录信息的第一行为特征值等。
步骤1204:依照对应第1个对象的行为记录信息的第一行为特征值的确定方法,确定对应K个对象中除第1个对象之外的其它对象的行为记录信息的第一行为特征值;直至确定对应K个对象的行为记录信息的第一行为特征值。
如前所述,可以确定对应第1个对象的第1个行为记录信息的第一行为特征值,即可以确定M(W1,O1),同理,可以确定对应第2,3,…,K个对象的第1个行为记录信息的第一行为特征值,即可以确定M(W1,O2),M(W1,O3),…,M(W1,OK)。
步骤1201-步骤1204是以确定对应K个对象的1个行为记录信息的第一行为特征值为例,本领域技术人员在不需要作出创造性劳动的情况下依照上述步骤,可以确定出对应K个对象的其它行为记录信息的第一行为特征值。如,在各对象均包含相同个数的行为记录信息时,可以确定出对应第1个对象的m个行为记录信息的m个第一行为特征值:M(W1,O1),M(W2,O1),…,M(Wm,O1);可以确定出对应第2个对象的m个行为记录信息的m个第一行为特征值:M(W1,O2),M(W2,O2),…,M(Wm,O2);以此类推,可以确定出第K个对象的m个行为记录信息的m个第一行为特征值:M(W1,OK),M(W2,Ok),…,M(Wm,Ok)。
步骤130,根据确定的对应K个对象的行为记录信息的第一行为特征值,从K个对象中选取第一行为特征值满足预设条件的对象作为目标对象。
其中,步骤130具体可以为:
将对应K个对象的行为记录信息的第一行为特征值进行比对,将第一行为特征值最大的对象选取为目标对象。
可选地,可以通过公式6选取目标对象。
Map(Wl)=arg max M(Wl,Oj) j=1,2,…,K (公式6)
其中,假设K个对象的行为记录信息的个数相等,且为m,则l=1,2,…,m,Oj为第j个对象,Wl为第l个行为记录信息,M(Wl,Oj)为对应第j个对象的第l个行为记录信息(或者第l个设备)的第一行为特征值。
具体地,当l=1时,也即选取第1个行为记录信息或者第1个设备对应的目标对象时,公式6可以解释为:将M(W1,O1),M(W1,O2),…,M(W1,OK)进行比对,若M(W1,Oj)最大,则可以将第j个对象选取为与第1个行为记录信息或者第1个设备对应的目标对象;同理,可以选取其它行为记录信息或者其它设备对应的目标对象。
步骤140,建立所述第一设备与所述目标对象的映射关系。
在选取多个设备对应的目标对象之后,则可以建立如表1所示的映射关系。
表1
设备名称 |
目标对象 |
设备1 |
账号1 |
设备2 |
账号2 |
… |
… |
设备n |
账号n |
表1中,需要说明的是,各设备均可以采用N个设备标识信息进行标识,也即本申请综合考虑了不同维度的设备标识信息,从而可以提高设备与对象之间匹配的准确性。此外,在建立如表1所示的映射关系之后,可以解决跨平台级别的数据关联问题。如,不同的互联网公司往往会出现一定程度的数据合作,但是不同公司的账号体系往往是不相同的,譬如有些公司会使用用户的邮箱作为登录名,而有些公司会使用手机号作为公司的登录名,用户一般情况下会有多个手机号或者邮箱,这些问题给不同公司的数据合作也带来了很大挑战,不能打通各个平台的账号体系映射关系,数据产生的价值将大打折扣。而在建立如表1所示的映射关系之后,由于设备信息通常是通用的,因此,可以通过设备信息来关联不同公司的账号,从而可以解决跨平台级别的数据关联问题。
此外,本申请通过收集设备上对象的行为记录信息,并基于设备上对象的行为记录信息,来匹配不同设备的不同对象的方法,可以解决现有技术中采集用户的行为记录信息,并基于对用户的行为记录信息的分析,来匹配不同的设备时,由于用户不登录而无法获取用户的行为记录信息,进而不能建立设备与对象之间的映射关系的问题。
与上述设备与对象之间映射关系的建立方法对应地,本申请实施例还提供的一种设备与对象之间映射关系的建立装置,如图2所示,该装置包括:获取单元201、确定单元202、选取单元203以及建立单元204。
获取单元201,用于获取K个对象的行为记录信息,其中,每个对象的行为记录信息中包含N个设备标识信息,N个设备标识信息用于唯一地确定第一设备。
其中,所述设备标识信息包括:互联网协议IP地址信息、多媒体访问控制MAC地址信息、会话标识信息、Cookie信息、国际移动设备识别码IMEI信息以及国际移动用户识别码IMSI信息。
确定单元202,用于根据K个对象对N个设备标识信息各自所标识的设备的使用信息,确定对应K个对象的行为记录信息的第一行为特征值。
确定单元202具体用于:
对K个对象中的第1个对象,从N个设备标识信息中读取第1个设备标识信息,根据第1个对象对第1个设备标识信息所标识的设备的使用信息,确定对应第1个对象的行为记录信息的1个第二行为特征值。
其中,所述根据第1个对象对第1个设备标识信息所标识的设备的使用信息,确定对应第1个对象的行为记录信息的1个第二行为特征值,具体为:
根据第1个对象对第1个设备标识信息所标识的设备的使用频次比例以及整体使用情况,确定对应第1个对象的行为记录信息的初始的第二行为特征值。
可选地,可以根据如下公式计算所述使用频次比例:
其中,K为对象的个数,Oj为第j个对象,Si为第i个设备标识信息所标识的设备,tf(Oj,Si)为所述使用频次比例,Fj(Si)为第j个对象对第i个设备标识信息所标识的设备的使用频次,为K个对象对第i个设备标识信息所标识的设备的使用频次。
可选地,可以根据如下公式计算所述整体使用情况:
其中,Oj为第j个对象,Si为第i个设备标识信息所标识的设备,idf(Oj)为所述整体使用情况,Count(Si)为第i个设备标识信息所标识的设备的个数,Count(Oj,Si)为第j个对象所使用过的第i个设备标识信息所标识的设备的个数。
对对应第1个对象的行为记录信息的初始的第二行为特征值进行归一化处理,得到对应第1个对象的行为记录信息的1个第二行为特征值。
重复执行上述读取设备标识信息以及确定第二行为特征值的步骤,直至确定对应第1个对象的行为记录信息的N个第二行为特征值。
根据对应第1个对象的行为记录信息的N个第二行为特征值,确定对应第1个对象的行为记录信息的第一行为特征值。
依照对应第1个对象的行为记录信息的第一行为特征值的确定方法,确定对应K个对象中除第1个对象之外的其它对象的行为记录信息的第一行为特征值;直至确定对应K个对象的行为记录信息的第一行为特征值。
选取单元203,用于根据确定单元202确定的对应K个对象的行为记录信息的第一行为特征值,从K个对象中选取第一行为特征值满足预设条件的对象作为目标对象。
选取单元203具体用于:
将对应K个对象的行为记录信息的第一行为特征值进行比对,将第一行为特征值最大的对象选取为目标对象。
建立单元204,用于建立所述第一设备与选取单元203选取的所述目标对象的映射关系。
本申请实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本申请提供的装置的具体工作过程,在此不复赘述。
本申请实施例提供的设备与对象之间映射关系的建立装置,获取单元201获取K个对象的行为记录信息,其中,每个对象的行为记录信息中包含N个设备标识信息,N个设备标识信息用于唯一地确定第一设备;确定单元202根据K个对象对N个设备标识信息各自所标识的设备的使用信息,确定对应K个对象的行为记录信息的第一行为特征值;选取单元203根据确定的对应K个对象的行为记录信息的第一行为特征值,从K个对象中选取第一行为特征值满足预设条件的对象作为目标对象;建立单元204建立所述第一设备与所述目标对象的映射关系。由此,可以解决现有技术中由于考虑的设备标识信息单一,而造成的统计结果不准确,进而影响了设备与对象之间映射关系的准确性的问题。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的对象及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施方式而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。