CN105871585A - 终端关联方法及装置 - Google Patents

终端关联方法及装置 Download PDF

Info

Publication number
CN105871585A
CN105871585A CN201510882803.9A CN201510882803A CN105871585A CN 105871585 A CN105871585 A CN 105871585A CN 201510882803 A CN201510882803 A CN 201510882803A CN 105871585 A CN105871585 A CN 105871585A
Authority
CN
China
Prior art keywords
terminal
characteristic information
user
terminal iidentification
candidate set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510882803.9A
Other languages
English (en)
Inventor
李琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Information Technology Beijing Co Ltd
Original Assignee
LeTV Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Information Technology Beijing Co Ltd filed Critical LeTV Information Technology Beijing Co Ltd
Priority to CN201510882803.9A priority Critical patent/CN105871585A/zh
Publication of CN105871585A publication Critical patent/CN105871585A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • H04L63/104Grouping of entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本公开实施例提供了一种终端关联方法及装置,所示方法包括:从多个终端发送的媒体请求信息中提取每个终端的终端标识和至少一个用户识别特征信息,将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组,计算每个候选组中的终端标识之间的关联性,判断是否存在关联性大于预设阈值的候选组,当存在关联性大于预设阈值的候选组时,确定与关联性大于预设阈值的候选组内的终端标识对应的终端归属于同一用户。本公开自动确定各个终端是否属于同一用户,方便用户在不同终端登陆时,不需要登录任何账号即可自动确定不同终端归属于同一用户,方便用户使用,节省用户时间精力。

Description

终端关联方法及装置
技术领域
本公开涉及计算机技术领域,尤其涉及一种终端关联方法及装置。
背景技术
随着智能终端技术的发展,用户接入互联网的方式越来越多。现在,用户不仅可以通过PC,而且可以通过智能手机、平板电脑、超级电视、可穿戴设备等方便地连入互联网。
提供访问内容的服务器,接收到的是一条条通过特定网络协议发送过来的请求,每一条请求都有一个ID来标识发送者的身份。同一个人通过不同的终端发送的请求,ID可能不相同。例如,用户通过浏览器发送请求,服务器收到的ID是浏览器cookie信息,通过手机端发送的请求,服务器接收到的ID是手机端的MAC(Media Access Control,媒体访问控制)地址或者IMEI(International Mobile Equipment Identity,移动设备国际识别码)等。
所以目前当用户需要在不同的终端观看相同的目标内容时,必须在不同终端均使用相同账号登陆或者在各端都使用同一方应用登录同一账号,这样,用户在观看目标内容时,需要反复输入用户账号等信息,操作繁琐,占用很多用户时间及精力。
发明内容
为克服相关技术中存在的问题,本公开提供一种终端关联方法及装置。
根据本公开实施例的第一方面,提供一种终端关联方法,应用于服务器,包括:
从多个终端发送的媒体请求信息中提取每个终端的终端标识和至少一个用户识别特征信息;
将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组;
计算每个候选组中的终端标识之间的关联性;
判断是否存在关联性大于预设阈值的候选组;
当存在关联性大于预设阈值的候选组时,确定与关联性大于预设阈值的候选组内的终端标识对应的终端归属于同一用户。
可选地,所述计算每个候选组中的终端标识之间的关联性,包括:
根据与每个终端标识对应的至少一个用户识别特征信息获取与每个用户识别特征信息对应的预设权重值;
将候选组中的所有终端标识划分成至少一个由两个终端标识组成的终端标识对;
计算每个终端标识对对应的所有用户识别特征信息之间的联合概率;
将候选组中所有终端标识对对应的联合概率的乘积确定为当前候选组中的终端标识之间的关联性。
可选地,所述方法还包括:
获取预设识别特征数据集,所述预设识别特征数据集包含多个用户识别特征信息;
统计每个用户识别特征信息出现的次数;
根据每个用户识别特征信息出现的次数确定每个用户识别特征信息的预设权重值。
可选地,所述将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组,包括:
获取具有相同用户识别特征信息的终端的终端标识的数量;
判断在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量是否小于预设标识数量;
当在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量小于预设标识数量时,将小于预设数量的所述终端标识划分为一个候选组。
可选地,所述将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组,包括:
获取具有相同用户识别特征信息的终端的终端标识;
将在预设时间段内、所述终端标识对应同一用户识别特征信息的累计时长进行排序;
将累计时长最大的预设数量个终端标识划分为一个候选组。
根据本公开实施例的第二方面,提供一种终端关联装置,应用于服务器,包括:
提取模块,用于从多个终端发送的媒体请求信息中提取每个终端的终端标识和至少一个用户识别特征信息;
划分模块,用于将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组;
计算模块,用于计算每个候选组中的终端标识之间的关联性;
判断模块,用于判断是否存在关联性大于预设阈值的候选组;
第一确定模块,用于当存在关联性大于预设阈值的候选组时,确定与关联性大于预设阈值的候选组内的终端标识对应的终端归属于同一用户。
可选地,所述计算模块包括:
权重获取子模块,用于根据与每个终端标识对应的至少一个用户识别特征信息获取与每个用户识别特征信息对应的预设权重值;
标识对划分子模块,用于将候选组中的所有终端标识划分成至少一个由两个终端标识组成的终端标识对;
计算子模块,用于计算每个终端标识对对应的所有用户识别特征信息之间的联合概率;
确定子模块,用于将候选组中所有终端标识对对应的联合概率的乘积确定为当前候选组中的终端标识之间的关联性。
可选地,所述装置还包括:
获取模块,用于获取预设识别特征数据集,所述预设识别特征数据集包含多个用户识别特征信息;
统计模块,用于统计每个用户识别特征信息出现的次数;
第二确定模块,用于根据每个用户识别特征信息出现的次数确定每个用户识别特征信息的预设权重值。
可选地,所述划分模块包括:
数量获取子模块,用于获取具有相同用户识别特征信息的终端的终端标识的数量;
数量判断子模块,用于判断在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量是否小于预设标识数量;
第一划分子模块,用于当在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量小于预设标识数量时,将小于预设数量的所述终端标识划分为一个候选组。
可选地,所述划分模块包括:
标识获取子模块,用于获取具有相同用户识别特征信息的终端的终端标识;
排序子模块,用于将在预设时间段内、所述终端标识对应同一用户识别特征信息的累计时长进行排序;
第二划分子模块,用于将累计时长最大的预设数量个终端标识划分为一个候选组。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开通过从多个终端发送的媒体请求信息中提取每个终端的终端标识和至少一个用户识别特征信息,将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组,计算每个候选组中的终端标识之间的关联性,判断是否存在关联性大于预设阈值的候选组,当存在关联性大于预设阈值的候选组时,可以确定与关联性大于预设阈值的候选组内的所有终端标识对应的终端归属于同一用户。
本公开提供的该方法能够根据各个终端的用户识别特征计算各个终端的关联性,根据关联性是否大与预设阈值确定各个终端是否属于同一用户,方便用户在不同终端登陆时,不需要登录任何账号即可自动确定不同终端归属于同一用户,方便用户使用,节省用户时间精力。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种终端关联方法的流程图;
图2是图1中步骤S103的流程图;
图3是根据一示例性实施例示出的一种终端关联方法的另一种流程图;
图4是图1中步骤S102的一种流程图;
图5是图1中步骤S102的另一种流程图;
图6是根据一示例性实施例示出的一种终端关联装置的结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
为了能够在用户不登录用户账号的情况下,即可自动确定不同的终端归属于同一用户,如图1所示,在本公开的一个实施例中,提供一种终端关联方法,应用于服务器,包括以下步骤。
在步骤S101中,从多个终端发送的媒体请求信息中提取每个终端的终端标识和至少一个用户识别特征信息。
在本公开实施例中,终端标识可以为pc端的浏览器cookie信息,也可以为手机、平板电脑、智能电视等的MAC(Media Access Control,媒体访问控制)地址或者移动设备国际标识码,用户识别特征信息可以为ip地址、wifi信息、uid(User Identification,用户身份证明)、第三方账号信息、操作系统类型、屏幕尺寸、GPS信息和访问内容等,其中,wifi信息可以指wifi账号、wifi热点的ID和密码等,第三方账号信息可以指用户登陆某一终端应用时的登录名和密码等,GPS信息可以指用户使用的终端所处的地理位置信息等,访问内容可以指与用户通过终端访问的媒体内容对应的媒体ID,例如:视频标识vid,音乐标识song id等,各个终端的终端标识和用户识别特征可以如表1所示。
表1
在该步骤中,可以从媒体请求信息的请求头中提取终端标识和用户识别特征信息。
在步骤S102中,将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组。
在该步骤中,以pc、手机和平板电脑为例,如果pc端的终端标识为001,用户识别特征包括ip地址,手机的终端标识为002,用户识别特征包括ip地址、第三方账号信息和GPS信息,平板电脑的终端标识为003,用户识别特征包括第三方账号和访问内容,则可以将001和002划分为一个候选组,将002和003划分为一个候选组。
在步骤S103中,计算每个候选组中的终端标识之间的关联性。
在该步骤中,可以根据候选组中每个终端标识对应的用户识别特征,计算每个候选组中各个终端标识之间的关联性。
在步骤S104中,判断是否存在关联性大于预设阈值的候选组。
在本公开实施例中,预设阈值可以根据历史计算的各个相关联的终端标识的关联性进行统计,然后取平均值等方式确定。
在该步骤中,可以将计算出来的关联性与预设阈值进行比较,如果一个候选组中的终端标识之间的关联性大于预设阈值,则可以确定该候选组中的各个终端标识相关联。
当存在关联性大于预设阈值的候选组时,在步骤S105中,确定与关联性大于预设阈值的候选组内的终端标识对应的终端归属于同一用户。
在该步骤中,可以将各个相关联的终端标识对应的终端确定为属于同一用户的终端。
在该步骤之后,可以检测是否接收到归属于同一用户的任意一个终端发送的媒体请求信息,当检测到媒体请求信息时,获取归属于同一用户的终端的播放记录,将获取的所述播放记录推送到发送媒体请求信息的终端。
本公开实施例提供的该方法,能够根据各个终端的用户识别特征计算各个终端的关联性,进而根据关联性是否大与预设阈值确定各个终端是否属于同一用户,方便用户在不同终端登陆时,不需要登录任何账号即可自动为用户推送用户在其它终端上的播放记录等媒体内容,方便用户使用,节省用户时间精力。
如图2所示,在本公开的又一实施例中,所述步骤S103包括以下步骤。
在步骤S201中,根据与每个终端标识对应的至少一个用户识别特征信息获取与每个用户识别特征信息对应的预设权重值。
在该步骤中,预设权重值可以根据该用户识别特征在预先采集的识别特征数据集中出现的次数确定,在识别特征数据集中某个用户识别特征出现的次数越多,该用户识别特征对应的预设权重值越大。
在步骤S202中,将候选组中的所有终端标识划分成至少一个由两个终端标识组成的终端标识对。
在该步骤中,可以将候选族中的每两个终端标识划分成一个终端标识对,例如,候选组中包括终端标识id1,id2,id3,则划分得到的终端标识对可以为id1和id2,id2和id3,id1和id3。
在步骤S203中,计算每个终端标识对对应的所有用户识别特征信息之间的联合概率。
在该步骤中,假设某一终端标识对中的两个终端标识分别为id1和id2,其中,id1对应的用户识别特征为f1、f2……fm,id2对应的用户识别特征为g1、g2……gn则:
feat(id1)={f1,f2,...fm};
feat(id2)={g1,g2,...gn};
f e a t ( id 1 , id 2 ) = f e a t ( id 1 ) ⊗ f e a t ( id 2 ) = { f 1 g 1 , f 1 g 2 , ... f m g n } ;
其中,figj,(1≤i≤m,1≤j≤n)形式的特征为复合特征,为了衡量每个复合特征的权重,需要一个样本集。样本集包含两种类型的样本,正样本和负样本。假设样本集中的每个候选组只有两个终端标识。正样本中的候选组包含的两个终端标识属于同一用户,负样本中的候选组包含的两个终端标识属于不同的用户。
用S表示正样本集,D表示负样本集。统计P(figj|S)和P(figj|D),前者指S中figj的频率,后者指D中figj的频率。若figj只在D中出现,则假设它在S中的频率为一个常数(例如0.5%),反之亦然。假设P(S)=P(D)=50%,根据贝叶斯公式:
P ( S | f i g j ) = P ( S ) P ( f i g j | S ) P ( D ) P ( f i g j | D ) + P ( S ) P ( f i g j | S )
对于多个复合特征,要计算联合概率,假设各自为正样本的概率为P1,P2,...Pmn,那么多个用户识别特征的联合概率P(属于正样本概率):
P = Π i = 1 m n P i Π i = 1 m n P i + Π i = 1 m n ( 1 - P i ) ;
在步骤S204中,将候选组中所有终端标识对对应的联合概率的乘积确定为当前候选组中的终端标识之间的关联性。
在该步骤中,可以将计算得到的候选组中所有终端标识对计算得到的联合概率P的乘机确定为该候选组中的终端标识之间的关联性。
在实际应用中,我们使用置信度计算算法计算每个计算出的关联性的置信度,假设τ=I1,I2,...Im是终端标识集合,τ表示样本集中出现的所有终端标识。Ii,(1≤i≤m)在本公开实施例中,是指一个终端标识。若t表示终端标识向量,t=(Ij1,Ij2,..Ijn),(1≤j≤m),当t包含Ik(1≤k≤m)时,t[k]=1,则每个终端标识向量t在事务库T中都有一个终端标识对与之对应。假设X是一个终端标识集合,若Ik在X中,则t[k]=1,则称终端标识向量t满足X。
关联规则指其中X是τ中的某些终端标识组成的集合,Ij是τ中的一个终端标识。如果规则在T中至少c%的终端标识向量满足X又满足Ij,则它在T中的置信度为c。
根据联合概率P,可以选择出可靠的终端标识对,作为结果集B,使用准确率和召回率,衡量所提出结果集B的有效性,假设A为参考集,若定义准确率pre和召回率rec为:
p r e ( B | A ) = | A ∩ B | | A |
r e c ( B | A ) = | A ∩ B | | B |
生成参考集A的过程如下:其中假设输入表C的字段依次是用户身份证明uid、ip地址、终端标识id和终端product。
(1).对C按uid划分组,假设不同的id数为c(uid)。选择出1<c(uid)<5的记录,生成表E。选择出c(uid)≥5的记录,生成表F。
(2).对F按ip,uid划分组,假设不同的id数为c(ip,uid)。选择出1<c(ip,uid)<5的记录,生成表G。
(3).对G按两端(例如,手机端mobile_cli、pc端)划分组,假设不同的ip,uid的个数为c(mobile_cli,pc),选择出c(mobile_cli,pc)>1的记录,生成表H。
(4).表E和H分别按uid划分组,输出每个uid对应的各端id(mobile_cli,pc,tv),生成参考集A。
本公开实施例提供的方法,能够快速准确的计算候选组中各个终端标识的关联性,便于根据关联性确定属于同一用户的各个终端设备。
如图3所示,在本公开的又一实施例中,所述方法还包括以下步骤。
在步骤S301中,获取预设识别特征数据集,所述预设识别特征数据集包含多个用户识别特征信息。
在步骤S302中,统计每个用户识别特征信息出现的次数。
在步骤S303中,根据每个用户识别特征信息出现的次数确定每个用户识别特征信息的预设权重值。
本公开实施例提供的该方法,能够自动、准确的为每个用户识别特征确定其对应的预设权重值,进而方便后续计算候选组内各个终端标识的关联性。
如图4所示,在本公开的又一实施例中,所述步骤S102包括以下步骤。
在步骤S401中,获取具有相同用户识别特征信息的终端的终端标识的数量。
在步骤S402中,判断在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量是否小于预设标识数量。
当在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量小于预设标识数量时,在步骤S403中,将小于预设数量的所述终端标识划分为一个候选组。
在本公开实施例中,例如,可以首先聚合同一候选组内的pc端的终端标识、手机端的好总段标识、智能电视端的终端标识,统计在预设时间段内(比如一个月),同一候选组内出现的终端标识,如果该候选组内的不同终端标识的个数小于5,则可以将各端的终端标识放入同一候选组中;或者,也可以聚合同一个第三方账号下的pc端终端标识、手机端的终端标识、智能电视端的终端标识。统计在预设时间段内(比如一个月),使用该第三方账号的终端标识,如果该第三方账号下不同的终端标识的个数小于5,则将各端的终端标识放入同一候选组中。
本公开实施例提供的该方法能够针对同一用户识别特征,判断具有该同一用户识别特征的终端标识是否满足预设标识数量,当满足预设标识数量要求时,可以将这些终端标识自动划分到同一个候选组,分类快速且准确。
如图5所示,在本公开的又一实施例中,所述步骤S102包括以下步骤。
在步骤S501中,获取具有相同用户识别特征信息的终端的终端标识。
在步骤S502中,将在预设时间段内、所述终端标识对应同一用户识别特征信息的累计时长进行排序。
在步骤S503中,将累计时长最大的预设数量个终端标识划分为一个候选组。
在本公开实施例中,以pc端和手机端为例,可以统计在预设时间段内(比如一个月),多个pc端和多个手机端有多少天曾经在同一ip出现过,这个数量命名为count1,可以选择天数count1最大的预设数量个手机端和pc端划分到一个候选组;或者,以pc端和手机端为例,统计在预设时间段内(比如一个月),多个pc端和多个手机端有多少天曾经在同一ip和wifi出现过,这个数量命名为count2,可以选择天数count2最大的预设数量个手机端和pc端划分到一个候选组。
本公开实施例提供的该方法能够利用累计时长,选取具有相同用户识别特征的终端标识累计时长最大的预设数量个终端标识,划分到同一个候选组,分类快速且准确。
如图6所示,在本公开的又一实施例中,提供一种终端关联装置,应用于服务器,包括:提取模块601、划分模块602、计算模块603、判断模块604和第一确定模块605。
提取模块601,用于从多个终端发送的媒体请求信息中提取每个终端的终端标识和至少一个用户识别特征信息。
划分模块602,用于将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组。
计算模块603,用于计算每个候选组中的终端标识之间的关联性。
判断模块604,用于判断是否存在关联性大于预设阈值的候选组。
第一确定模块605,用于当存在关联性大于预设阈值的候选组时,确定与关联性大于预设阈值的候选组内的终端标识对应的终端归属于同一用户。
在本公开的又一实施例中,所述计算模块包括:权重获取子模块、标识对划分子模块、计算子模块和确定子模块。
权重获取子模块,用于根据与每个终端标识对应的至少一个用户识别特征信息获取与每个用户识别特征信息对应的预设权重值。
标识对划分子模块,用于将候选组中的所有终端标识划分成至少一个由两个终端标识组成的终端标识对。
计算子模块,用于计算每个终端标识对对应的所有用户识别特征信息之间的联合概率。
确定子模块,用于将候选组中所有终端标识对对应的联合概率的乘积确定为当前候选组中的终端标识之间的关联性。
在本公开的又一实施例中,所述装置还包括:获取模块、统计模块和第二确定模块。
获取模块,用于获取预设识别特征数据集,所述预设识别特征数据集包含多个用户识别特征信息。
统计模块,用于统计每个用户识别特征信息出现的次数。
第二确定模块,用于根据每个用户识别特征信息出现的次数确定每个用户识别特征信息的预设权重值。
在本公开的又一实施例中,所述划分模块包括:数量获取子模块、数量判断子模块和第一划分子模块。
数量获取子模块,用于获取具有相同用户识别特征信息的终端的终端标识的数量。
数量判断子模块,用于判断在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量是否小于预设标识数量。
第一划分子模块,用于当在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量小于预设标识数量时,将小于预设数量的所述终端标识划分为一个候选组。
在本公开的又一实施例中,所述划分模块包括:标识获取子模块、排序子模块和第二划分子模块。
标识获取子模块,用于获取具有相同用户识别特征信息的终端的终端标识。
排序子模块,用于将在预设时间段内、所述终端标识对应同一用户识别特征信息的累计时长进行排序。
第二划分子模块,用于将累计时长最大的预设数量个终端标识划分为一个候选组。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种终端关联方法,应用于服务器,其特征在于,包括:
从多个终端发送的媒体请求信息中提取每个终端的终端标识和至少一个用户识别特征信息;
将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组;
计算每个候选组中的终端标识之间的关联性;
判断是否存在关联性大于预设阈值的候选组;
当存在关联性大于预设阈值的候选组时,确定与关联性大于预设阈值的候选组内的终端标识对应的终端归属于同一用户。
2.根据权利要求1所述的终端关联方法,其特征在于,所述计算每个候选组中的终端标识之间的关联性,包括:
根据与每个终端标识对应的至少一个用户识别特征信息获取与每个用户识别特征信息对应的预设权重值;
将候选组中的所有终端标识划分成至少一个由两个终端标识组成的终端标识对;
计算每个终端标识对对应的所有用户识别特征信息之间的联合概率;
将候选组中所有终端标识对对应的联合概率的乘积确定为当前候选组中的终端标识之间的关联性。
3.根据权利要求2所述的终端关联方法,其特征在于,所述方法还包括:
获取预设识别特征数据集,所述预设识别特征数据集包含多个用户识别特征信息;
统计每个用户识别特征信息出现的次数;
根据每个用户识别特征信息出现的次数确定每个用户识别特征信息的预设权重值。
4.根据权利要求1至3任一所述的终端关联方法,其特征在于,所述将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组,包括:
获取具有相同用户识别特征信息的终端的终端标识的数量;
判断在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量是否小于预设标识数量;
当在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量小于预设标识数量时,将小于预设数量的所述终端标识划分为一个候选组。
5.根据权利要求1至3任一所述的终端关联方法,其特征在于,所述将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组,包括:
获取具有相同用户识别特征信息的终端的终端标识;
将在预设时间段内、所述终端标识对应同一用户识别特征信息的累计时长进行排序;
将累计时长最大的预设数量个终端标识划分为一个候选组。
6.一种终端关联装置,应用于服务器,其特征在于,包括:
提取模块,用于从多个终端发送的媒体请求信息中提取每个终端的终端标识和至少一个用户识别特征信息;
划分模块,用于将具有相同用户识别特征信息的所有终端的终端标识划分为一个候选组;
计算模块,用于计算每个候选组中的终端标识之间的关联性;
判断模块,用于判断是否存在关联性大于预设阈值的候选组;
第一确定模块,用于当存在关联性大于预设阈值的候选组时,确定与关联性大于预设阈值的候选组内的终端标识对应的终端归属于同一用户。
7.根据权利要求6所述的终端关联装置,其特征在于,所述计算模块包括:
权重获取子模块,用于根据与每个终端标识对应的至少一个用户识别特征信息获取与每个用户识别特征信息对应的预设权重值;
标识对划分子模块,用于将候选组中的所有终端标识划分成至少一个由两个终端标识组成的终端标识对;
计算子模块,用于计算每个终端标识对对应的所有用户识别特征信息之间的联合概率;
确定子模块,用于将候选组中所有终端标识对对应的联合概率的乘积确定为当前候选组中的终端标识之间的关联性。
8.根据权利要求7所述的终端关联装置,其特征在于,所述装置还包括:
获取模块,用于获取预设识别特征数据集,所述预设识别特征数据集包含多个用户识别特征信息;
统计模块,用于统计每个用户识别特征信息出现的次数;
第二确定模块,用于根据每个用户识别特征信息出现的次数确定每个用户识别特征信息的预设权重值。
9.根据权利要求6至8任一所述的终端关联方法,其特征在于,所述划分模块包括:
数量获取子模块,用于获取具有相同用户识别特征信息的终端的终端标识的数量;
数量判断子模块,用于判断在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量是否小于预设标识数量;
第一划分子模块,用于当在预设时间段内、同一所述用户识别特征信息对应的终端标识的数量小于预设标识数量时,将小于预设数量的所述终端标识划分为一个候选组。
10.根据权利要求6至8任一所述的终端关联装置,其特征在于,所述划分模块包括:
标识获取子模块,用于获取具有相同用户识别特征信息的终端的终端标识;
排序子模块,用于将在预设时间段内、所述终端标识对应同一用户识别特征信息的累计时长进行排序;
第二划分子模块,用于将累计时长最大的预设数量个终端标识划分为一个候选组。
CN201510882803.9A 2015-12-03 2015-12-03 终端关联方法及装置 Pending CN105871585A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510882803.9A CN105871585A (zh) 2015-12-03 2015-12-03 终端关联方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510882803.9A CN105871585A (zh) 2015-12-03 2015-12-03 终端关联方法及装置

Publications (1)

Publication Number Publication Date
CN105871585A true CN105871585A (zh) 2016-08-17

Family

ID=56624313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510882803.9A Pending CN105871585A (zh) 2015-12-03 2015-12-03 终端关联方法及装置

Country Status (1)

Country Link
CN (1) CN105871585A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106960143A (zh) * 2017-03-23 2017-07-18 网易(杭州)网络有限公司 用户账号的识别方法及装置、存储介质、电子设备
CN108268566A (zh) * 2017-01-04 2018-07-10 腾讯科技(深圳)有限公司 一种数据关系确定方法及装置
CN110222141A (zh) * 2019-04-30 2019-09-10 北京品友互动信息技术股份公司 数据关联方法及装置、电子设备
CN110366166A (zh) * 2019-07-23 2019-10-22 中国联合网络通信集团有限公司 双卡终端的终端标识关联关系确定方法及系统
CN110851661A (zh) * 2019-10-25 2020-02-28 北京深演智能科技股份有限公司 用户id映射关系的确定方法及装置、电子设备
CN111340062A (zh) * 2020-02-04 2020-06-26 恩亿科(北京)数据科技有限公司 一种映射关系确定方法及装置
CN111930995A (zh) * 2020-08-18 2020-11-13 湖南快乐阳光互动娱乐传媒有限公司 数据处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831114A (zh) * 2011-06-14 2012-12-19 北京思博途信息技术有限公司 实现互联网用户访问情况统计分析的方法及装置
CN103995907A (zh) * 2014-06-13 2014-08-20 北京奇艺世纪科技有限公司 一种访问用户的确定方法
CN104574192A (zh) * 2013-10-25 2015-04-29 华为技术有限公司 在多个社交网络中识别同一用户的方法及装置
CN104899267A (zh) * 2015-05-22 2015-09-09 中国电子科技集团公司第二十八研究所 一种社交网站账号相似度的综合数据挖掘方法
CN105119744A (zh) * 2015-08-17 2015-12-02 百度在线网络技术(北京)有限公司 用户标识的关联关系判断方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831114A (zh) * 2011-06-14 2012-12-19 北京思博途信息技术有限公司 实现互联网用户访问情况统计分析的方法及装置
CN104574192A (zh) * 2013-10-25 2015-04-29 华为技术有限公司 在多个社交网络中识别同一用户的方法及装置
CN103995907A (zh) * 2014-06-13 2014-08-20 北京奇艺世纪科技有限公司 一种访问用户的确定方法
CN104899267A (zh) * 2015-05-22 2015-09-09 中国电子科技集团公司第二十八研究所 一种社交网站账号相似度的综合数据挖掘方法
CN105119744A (zh) * 2015-08-17 2015-12-02 百度在线网络技术(北京)有限公司 用户标识的关联关系判断方法和装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268566A (zh) * 2017-01-04 2018-07-10 腾讯科技(深圳)有限公司 一种数据关系确定方法及装置
CN106960143A (zh) * 2017-03-23 2017-07-18 网易(杭州)网络有限公司 用户账号的识别方法及装置、存储介质、电子设备
CN106960143B (zh) * 2017-03-23 2020-03-17 网易(杭州)网络有限公司 用户账号的识别方法及装置、存储介质、电子设备
CN110222141A (zh) * 2019-04-30 2019-09-10 北京品友互动信息技术股份公司 数据关联方法及装置、电子设备
CN110366166A (zh) * 2019-07-23 2019-10-22 中国联合网络通信集团有限公司 双卡终端的终端标识关联关系确定方法及系统
CN110366166B (zh) * 2019-07-23 2022-02-22 中国联合网络通信集团有限公司 双卡终端的终端标识关联关系确定方法及系统
CN110851661A (zh) * 2019-10-25 2020-02-28 北京深演智能科技股份有限公司 用户id映射关系的确定方法及装置、电子设备
CN110851661B (zh) * 2019-10-25 2023-04-21 北京深演智能科技股份有限公司 用户id映射关系的确定方法及装置、电子设备
CN111340062A (zh) * 2020-02-04 2020-06-26 恩亿科(北京)数据科技有限公司 一种映射关系确定方法及装置
CN111930995A (zh) * 2020-08-18 2020-11-13 湖南快乐阳光互动娱乐传媒有限公司 数据处理方法及装置
CN111930995B (zh) * 2020-08-18 2023-12-22 湖南快乐阳光互动娱乐传媒有限公司 数据处理方法及装置

Similar Documents

Publication Publication Date Title
CN105871585A (zh) 终端关联方法及装置
CN107102941B (zh) 一种测试用例的生成方法及装置
US20220294821A1 (en) Risk control method, computer device, and readable storage medium
CN103368992B (zh) 一种信息推送方法及装置
CN105005582B (zh) 多媒体信息的推荐方法及装置
CN102831176B (zh) 推荐好友的方法及服务器
CN105631707A (zh) 基于决策树的广告点击率预估方法与应用推荐方法及装置
CN103595576B (zh) 一种基于内容提供商标识的互联口icp流量统计系统及方法
CN104750760B (zh) 一种推荐应用软件的实现方法及装置
CN105022761A (zh) 群组查找方法和装置
CN103136228A (zh) 一种图片搜索方法以及图片搜索装置
CN104123324B (zh) 一种未读消息的定位获取方法及装置
US10250521B2 (en) Data stream identifying method and device
CN101957845B (zh) 一种在线应用系统及其实现方法
CN105721944A (zh) 智能电视的新闻资讯推荐方法
CN104572733B (zh) 用户兴趣标签分类的方法及装置
CN107835132B (zh) 一种流量来源跟踪的方法及装置
WO2020257991A1 (zh) 用户识别方法及相关产品
CN111523035B (zh) App浏览内容的推荐方法、装置、服务器和介质
CN110209921B (zh) 媒体资源的推送方法和装置、以及存储介质和电子装置
CN103365913A (zh) 一种搜索结果排序方法和装置
CN109189960A (zh) 信息获取方法、信息获取装置及计算机存储介质
CN103544150A (zh) 为移动终端浏览器提供推荐信息的方法及系统
CN105701224A (zh) 一种基于大数据的证券资讯个性化服务系统
CN113987002A (zh) 基于海量数据分析平台的数据交换方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160817

WD01 Invention patent application deemed withdrawn after publication