CN106445942B - 一种用户跨屏识别方法和装置 - Google Patents

一种用户跨屏识别方法和装置 Download PDF

Info

Publication number
CN106445942B
CN106445942B CN201510475628.1A CN201510475628A CN106445942B CN 106445942 B CN106445942 B CN 106445942B CN 201510475628 A CN201510475628 A CN 201510475628A CN 106445942 B CN106445942 B CN 106445942B
Authority
CN
China
Prior art keywords
client
information
similarity
correspond
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510475628.1A
Other languages
English (en)
Other versions
CN106445942A (zh
Inventor
李探
徐波
万春晓
黄浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201510475628.1A priority Critical patent/CN106445942B/zh
Publication of CN106445942A publication Critical patent/CN106445942A/zh
Application granted granted Critical
Publication of CN106445942B publication Critical patent/CN106445942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用户跨屏识别方法,该方法包括:获取预设时间内用户通过客户端浏览网页时的相关数据信息,所述数据信息包括:地理位置信息、客户端标识、兴趣特征信息;针对每个地理位置信息,执行如下处理:计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度;当所述相似度的值大于第一预设阈值时,确定所述两个不同客户端标识对应同一用户。基于同样的发明构思,本申请还提出一种用户跨屏识别装置,能够提高用户跨屏识别效率。

Description

一种用户跨屏识别方法和装置
技术领域
本发明涉及通信技术领域,特别涉及一种用户跨屏识别方法和装置。
背景技术
随着媒体碎片化时代的到来,任何用户均可能通过个人电脑、智能手机、平板电脑、互动电视(如IPTV)、数字屏幕(如电梯LCD屏幕)、地面电视等进行媒体消费。
由于同一用户,即一个自然人可以通过多个客户端进行消费行为,因此,如何定位某个用户的消费行为,即确定哪些客户端的使用者为同一用户较为困难,也尤为重要。
发明内容
有鉴于此,本申请提供一种用户跨屏识别方法和装置,以提高用户跨屏识别的效率。
为解决上述技术问题,本申请的技术方案是这样实现的:
一种用户跨屏识别方法,该方法包括:
获取预设时间内用户通过客户端浏览网页时的相关数据信息,所述数据信息包括:地理位置信息、客户端标识、兴趣特征信息;
针对每个地理位置信息,执行如下处理:
计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度;
当所述相似度的值大于第一预设阈值时,确定所述两个不同客户端标识对应同一用户。
一种用户跨屏识别装置,该装置包括:获取单元、计算单元和处理单元;
所述获取单元,用于获取预设时间内用户通过客户端浏览网页时的相关数据信息,所述数据信息包括:地理位置信息、客户端标识、兴趣特征信息;
所述计算单元,用于针对所述获取单元获取的数据信息中的每个地理位置信息,计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度;
所述处理单元,用于当所述计算单元计算的相似度的值大于第一预设阈值时,确定所述两个不同客户端标识对应同一用户。
由上面的技术方案可知,本申请中收集预设时间内用户通过客户端浏览网页时的相关数据信息,根据数据信息中的兴趣特征信息,针对任一地理位置信息的不同客户端两两确定对应的用户是否为同一用户。通过本申请提供的技术方案,能够提高跨屏识别用户的效率。
附图说明
图1为本申请实施例中用户跨屏识别组网示意图;
图2为本申请实施例一中用户跨屏识别流程示意图;
图3为本申请实施例二中用户跨屏识别流程示意图;
图4为本申请实施例中应用于上述技术的装置结构示意图;
图5是本申请具体实施例中进行用户跨屏识别的设备的硬件架构组成示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图并举实施例,对本发明的技术方案进行详细说明。
本申请实施例中提供一种用户跨屏识别方法,收集预设时间内用户通过客户端浏览网页时的相关数据信息,根据数据信息中的兴趣特征信息,针对任一地理位置信息的不同客户端两两确定对应的用户是否为同一用户。通过本申请提供的技术方案,能够提高跨屏识别用户的效率。
用户浏览网页时,可以是文字阅读,也可以是音视频的收听和观看,都会在对应服务器上生成并存储浏览对应网页的相关数据信息。
本申请实施例中收集服务器上存储的相关数据信息时,可以从指定的一台服务器上获取,也可以是多台指定的多台服务器上获取,用于进行用户跨屏识别设备可以是上述服务器中的一台服务器,也可以是新增一台设备用于进行用户跨屏识别,本申请实施例中对此不作限制。
参见图1,图1为本申请实施例中用户跨屏识别组网示意图。图1中以从多台服务器上获取相关数据信息,并增加一台设备进行用户跨屏识别为例。下文中简称用于进行用户跨屏识别的设备为设备。
服务器上的数据信息包括:地理位置信息、客户端标识、兴趣特征信息。
地理位置信息为:客户端登陆网络的网络出口因特网协议(Internet Protocol,IP)地址,或基于位置的服务(Location Based Service,LBS)信息。具体实现时,根据网络部署,服务器上存储的相关数据信息中包括的地理位置信息,确定使用对应的地理位置信息即可。
客户端标识,为用户浏览网页时使用的客户端的标识,如手机标识、PC标识等。
兴趣特征信息包括下述各项信息之一或任意组合:频道信息、内容分类信息、内容名称信息、时长信息。在实际应用中,还可以根据实际需要增加兴趣特征包括的信息。
其中,如果通过网页浏览电视频道时,频道信息包括:频道名称,以及浏览该频道的次数,如中央1套,5次;中央2套,3次等;如果通过网页浏览文字、图片时,频道信息包括:娱乐频道,4次、体育频道,5次、星座频道,6次等,在这里不再一一举例。
内容分类信息包括:分类名称和浏览过该分类名称对应的内容的次数,如果通过网页观看电影时,内容分类信息包括:喜剧,3次、动作,3次、悬疑,6次等;如果通过网页听音乐时,内容分类信息包括:流行歌曲,8次、民谣、10次、军营歌曲,2次等。实际应用中,可以根据实际需要按内容进行分类。
内容名称信息包括:内容名称,以及浏览过该名称对应的信息的次数,如通过网页观看电影时,内容名称信息包括:致我们终将逝去的青春,2次、侏罗纪世界,3次、小时代,1次、道士下山,2次等。
时长信息包括时间长度和次数,这里的次数即浏览时长达到对应时间长度的次数;如浏览时长为5分钟到10分钟,5次;浏览50分钟到60分钟,6次等。
下面结合附图,详细说明本申请实施例中实现用户跨屏识别的过程。
实施例一
参见图2,图2为本申请实施例一中用户跨屏识别流程示意图。具体步骤为:
步骤201,设备获取预设时间内用户通过客户端浏览网页时的相关数据信息。
预设时间为实际应用中需要关注的相关数据信息的时间,如1个月、3个月等,用于通过客户端浏览网页时所生成的相关数据信息。
这里的数据信息为上文描述的地理位置信息、客户端标识和兴趣特征信息,当兴趣特征信息包括的信息为多个时,也可以根据实际需要选择获取一个或几个兴趣特征信息包括的信息,如:
当服务器上存储的兴趣特征信息包括:频道信息、内容分类信息、内容名称信息,则可以只选择频道信息,或内容分类信息,也可以这三种信息都获取。
步骤202,针对每个地理位置信息,该设备计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度。
本步骤中的两个不同客户端标识可以为两个不同移动设备标识、两个不同固定设备标识,或一个移动设备标识和一个固定设备标识。
由于同一用户可能通过两台固定设备上网,也可能通过两台移动设备上网,还有可能通过一台移动设备和一台固定设备上网,因此,需针对两台不同客户端分别进行两两跨屏识别。
本步骤中当兴趣特征信息包括一项信息时,计算该项信息之间的相似度即为兴趣特征信息之间的相似度;如果包括多余一项信息时,可以进行如下处理:
该设备为所述兴趣特征信息包括的各项信息分别配置权重值;为各信息分配的权重值可以根据经验配置,也可以使用同一用户通过不同客户端浏览网页时生成的相关数据训练兴趣特征信息中各信息的权重值。
本步骤中计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度,包括:
针对所述兴趣特征信息中的每项信息,计算两个不同客户端标识对应的该项信息之间的相似度,并使用为各项信息配置的权重值对计算得到的各项信息对应的相似度进行加权求和,以获得所述两个不同客户端标识对应的兴趣特征信息之间的相似度。
下面以兴趣特征信息包括一项信息距离说明相似度的计算方法:
假设兴趣特征信息包括频道信息,对于客户端A标识对应的频道信息为体育频道5次和科技频道5次;对于客户端B标识对应的频道信息为娱乐频道6次和汽车频道7次,则客户端A和客户端B对应的兴趣特征信息的相似度为0。
若对于客户端A标识对应的频道信息为体育频道5次和科技频道5次;对于客户端B标识对应的频道信息为体育频道5次和科技频道5次,则客户端A和客户端B对应的兴趣特征信息的相似度为100%。
本申请实施例中还提供一种使用余弦相似度算法计算两个不同客户端标识对应的兴趣特征信息之间的相似度。
下面以具体例子来描述使用余弦相似度计算法来计算相似度的过程:
客户端A对应的频道信息为:(科技频道:10次),(汽车频道:5次),(游戏频道:3次);客户端B对应的频道信息为:(星座频道:10次),(时尚频道:5次),(游戏频道:3次)。
则将客户端A的频道信息记为向量A=(10,5,3,0,0),B=(0,0,3,10,5);其中,对于一个客户端的频道信息的某个频道未记录,而另外一个客户端记录了该频道的信息时,则将未记录对应频道的信息的次数记为0。
如,客户端A记录了科技频道对应的信息,而客户端B未记录科技频道对应的信息,则将客户端B的科技频道信息对应的次数记为0,用于进行相似度计算。
余弦相似度算法计算公式为:
Figure BDA0000775493140000061
将客户端A和客户端B对应的向量带入以上公式则可得到相似度。
步骤203,该设备当确定所述相似度的值大于第一预设阈值时,确定所述两个不同客户端标识对应同一用户。
当确定相似度的值不大于第一预设阈值时,确定所述两个客户端标识对应的用户为不同用户。
第一预设阈值可以根据实际应用配置,如85%等。
实施例二
参见图3,图3为本申请实施例二中用户跨屏识别流程示意图。具体步骤为:
步骤301,设备获取预设时间内用户通过客户端浏览网页时的相关数据信息。
步骤302,针对每个地理位置信息,该设备确定该地理位置信息对应的客户端标识的个数是否大于第二预设阈值,如果是,执行步骤307;否则,执行步骤303。
本步骤是在一个地理位置信息对应过多客户端时,将该地理位置信息对应的数据信息过滤掉。
如果一个地理位置信息对应很多客户端端标识,则说明该地理位置信息可能为公司的地理位置信息,对公司的客户端两两进行跨屏识别,结果大多不是同一用户,会浪费设备的大量处理资源,将不必要的信息过滤掉,从而能够大大节省设备的处理资源。
步骤303,该设备计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息的相似度。
步骤304,该设备确定该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息的相似度是否大于第一预设阈值,如果是,执行步骤305;否则,执行步骤306。
步骤305,该设备确定所述两个不同客户端标识对应同一用户,结束本流程。
步骤306,该设备确定所述两个不同客户端端标识对应不同用户,结束本流程。
步骤307,该设备丢弃该地理位置信息对应的数据信息。
本申请上文各实施例中分别针对客户端两两确定是否对应同一用户,还可以确定两个以上客户端对应的用户是否为同一用户,具体实现如下:
针对被确定为对应同一用户的任两个客户端标识,执行如下处理:
若确定所述两个客户端标识中的第一客户端标识与至少一个第三客户端标识对应同一用户,且所述两个客户端标识中的第二客户端标识,以及所述至少一个第三客户端标识中任两个客户端标识对应不同用户,则从已计算出的各相似度中查找所述第一客户端标识对应的兴趣特征信息分别与所述第二客户端标识及所述至少一个第三客户端标识对应的兴趣特征信息之间的相似度,并确定查找出的相似度中值最大的相似度,确定所述第一客户端标识与所述值最大的相似度对应的客户端标识对应同一用户,所述第一客户端与所述值最大的相似度对应的客户端标识之外的客户端标识对应不同用户。
若确定所述两个客户端标识中的第一客户端标识与至少一个第三客户端标识对应同一用户,且所述两个客户端标识中的第二客户端标识,以及所述至少一个第三客户端标识中任两个客户端标识对应同一用户,则确定第一客户端标识、第二客户端标识,以及所述至少一个第三客户端标识对应同一用户。
以同一地理位置信息对应的三个客户端标识为例:
当确定客户端A和客户端B对应同一用户,客户端A和客户端C对应同一用户,且客户端B和客户端C对应用户为同一用户时,则确定客户端A、客户端B和客户端C对应同一用户。
当确定客户端A和客户端B对应同一用户,客户端A和客户端C对应同一用户,且客户端B和客户端C对应不同用户时,则比较客户端A和客户端B对应的兴趣特征信息的相似度与客户端A与客户端C对应的兴趣特征信息的相似度;
当客户端A和客户端B对应的兴趣特征信息的相似度的值大时,确定客户端A和客户端B对应同一用户,取消客户端A和客户端C对应同一用户的确定,即最终确定客户端A和客户端C对应不同用户;否则,确定客户端A和客户端C对应同一用户,取消客户端A和客户端B对应同一用户的确定,即最终确定客户端A和客户端B对应不同用户。
基于与上述同样的处理方式,可以确定使用任意数目的客户端是否属于同一用户。
基于同样的发明构思,本申请还提出一种用户跨屏识别装置。参见图4,图4为本申请实施例中应用于上述技术的装置结构示意图。该装置包括:获取单元401、计算单元402和处理单元403;
获取单元401,用于获取预设时间内用户通过客户端浏览网页时的相关数据信息,所述数据信息包括:地理位置信息、客户端标识、兴趣特征信息;
计算单元402,用于针对获取单元401获取的数据信息中的每个地理位置信息,计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度;
处理单元403,用于当计算单元402计算的相似度的值大于第一预设阈值时,确定所述两个不同客户端标识对应同一用户。
较佳地,
计算单元402,进一步用于针对每个地理位置信息,确定该地理位置信息对应的客户端标识的个数是否大于第二预设阈值,如果是,丢弃该地理位置信息对应的数据信息;否则,计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度。
较佳地,所述兴趣特征信息包括下述各项信息之一或任意组合:
频道信息、内容分类信息、内容名称信息、时长信息。
较佳地,
计算单元402,进一步用于当所述兴趣特征信息包括多于一项信息时,为所述兴趣特征信息包括的各项信息分别配置权重值;在计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度时,针对所述兴趣特征信息中的每项信息,计算两个不同客户端标识对应的该项信息之间的相似度,并使用为各项信息配置的权重值对计算得到的各项信息对应的相似度进行加权求和,以获得所述两个不同客户端标识对应的兴趣特征信息之间的相似度。
较佳地,
计算单元402,具体用于通过余弦相似度算法计算两个不同客户端标识对应的该项信息之间的相似度。
较佳地,
处理单元403,进一步用于针对被确定为对应同一用户的任两个客户端标识,若确定所述两个客户端标识中的第一客户端标识与至少一个第三客户端标识对应同一用户,且所述两个客户端标识中的第二客户端标识,以及所述至少一个第三客户端标识中任两个客户端标识对应不同用户,则从已计算出的各相似度中查找所述第一客户端标识对应的兴趣特征信息分别与所述第二客户端标识及所述至少一个第三客户端标识对应的兴趣特征信息之间的相似度,并确定查找出的相似度中值最大的相似度,确定所述第一客户端标识与所述值最大的相似度对应的客户端标识对应同一用户,所述第一客户端与所述值最大的相似度对应的客户端标识之外的客户端标识对应不同用户。
较佳地,
处理单元403,进一步用于若确定所述两个客户端标识中的第一客户端标识与至少一个第三客户端标识对应同一用户,且所述两个客户端标识中的第二客户端标识,以及所述至少一个第三客户端标识中任两个客户端标识对应同一用户,则确定第一客户端标识、第二客户端标识,以及所述至少一个第三客户端标识对应同一用户。
上述实施例的单元可以集成于一体,也可以分离部署;可以合并为一个单元,也可以进一步拆分成多个子单元。
本申请各实施例中的各单元可以以机械方式或电子方式实现。例如,一个硬件模块可以包括专门设计的永久性电路或逻辑器件(如专用处理器,如FPGA或ASIC)用于完成特定的操作。硬件模块也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。至于具体采用机械方式,或是采用专用的永久性电路,或是采用临时配置的电路(如由软件进行配置)来实现硬件模块,可以根据成本和时间上的考虑来决定。
以上对本申请具体实施例中的进行用户跨屏识别的设备上的装置进行了说明,下面给出本申请具体实施例中进行用户跨屏识别的设备的硬件架构组成,该设备是可以软硬件结合的可编程设备,具体参见图5,图5是本申请具体实施例中进行用户跨屏识别的设备的硬件架构组成示意图。该设备可包括:处理器510,存储器520,端口530以及总线540。处理器510和存储器520通过总线540互联。处理器510可通过端口530获取和输出数据;其中,
获取单元401被处理器510执行时可以为:获取预设时间内用户通过客户端浏览网页时的相关数据信息;
计算单元402被处理器510执行时可以为:针对获取单元401获取的数据信息中的每个地理位置信息,计算任两个不同客户端标识对应的兴趣特征信息的相似度;
处理单元403被处理器510执行时可以为:当计算单元402计算的相似度的值大于第一预设阈值时,确定所述两个不同客户端标识对应同一用户。
其中,在每次进行用户跨屏识别时,该设备从服务器上获取预设时间内的相关数据信息,进行相关计算、处理,确定两个客户端对应的用户是否为同一用户。
由此可以看出,当存储在存储器520中的指令模块被处理器510执行时,可实现前述技术方案中获取单元、计算单元和处理单元的各种功能。
另外,本发明的实施例中可以通过由设备如计算机执行的数据处理程序来实现。显然,数据处理程序构成了本发明。此外,通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和/或内存)中执行。因此,这样的存储介质也构成了本发明。存储介质可以使用任何类型的记录方式,例如纸张存储介质(如纸带等)、磁存储介质(如软盘、硬盘、闪存等)、光存储介质(如CD-ROM等)、磁光存储介质(如MO等)等。
因此,本发明还公开了一种存储介质,其中存储有数据处理程序,该数据处理程序用于执行本发明上述技术方案。
需要说明的是,图5所示的测试设备只是一个具体的例子,也可以通过其他的与本实施例描述不同结构实现,例如,执行上述指令代码时所完成的操作,也可以由特定应用专用集成电路(ASIC)实现。另外,上述的处理器510可以是一个或多个,如果是多个,则由多个处理器共同负责读取和执行所述指令代码。因此,本申请对测试设备的具体结构不作具体限定。
综上所述,本申请通过收集预设时间内用户通过客户端浏览网页时的相关数据信息,根据数据信息中的兴趣特征信息,针对任一地理位置信息的不同客户端两两确定对应的用户是否为同一用户。通过本申请提供的技术方案,能够提高跨屏识别用户的效率。
本申请实施例中,还对同一地理位置信息对应的公司等非个人用户进行过滤,避免浪费设备处理资源,提高处理效率。
在针对两两客户端确定是否同一用户的基础上,还提出针对多个客户端对应的用户确定是否为同一用户的技术方案,从而为跨屏识别提供了更广泛的应用。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (13)

1.一种用户跨屏识别方法,其特征在于,该方法包括:
获取预设时间内用户通过客户端浏览网页时的相关数据信息,所述数据信息包括:地理位置信息、客户端标识、兴趣特征信息;
针对每个地理位置信息,执行如下处理:
确定该地理位置信息对应的客户端标识的个数是否大于第二预设阈值,如果是,丢弃该地理位置信息对应的数据信息;否则,计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度;所述客户端标识为用户浏览网页时使用的客户端的标识,所述客户端为移动设备或固定设备;
当所述相似度的值大于第一预设阈值时,确定所述两个不同客户端标识对应同一用户;
所述方法进一步包括:针对被确定为对应同一用户的任两个客户端标识,执行如下处理:若确定所述两个客户端标识中的第一客户端标识与至少一个第三客户端标识对应同一用户,且所述两个客户端标识中的第二客户端标识,以及所述至少一个第三客户端标识中任两个客户端标识对应不同用户,则从已计算出的各相似度中查找所述第一客户端标识对应的兴趣特征信息分别与所述第二客户端标识及所述至少一个第三客户端标识对应的兴趣特征信息之间的相似度,并确定查找出的相似度中值最大的相似度,确定所述第一客户端标识与所述值最大的相似度对应的客户端标识对应同一用户,所述第一客户端与所述值最大的相似度对应的客户端标识之外的客户端标识对应不同用户。
2.根据权利要求1所述的方法,其特征在于,所述兴趣特征信息包括下述各项信息之一或任意组合:
频道信息、内容分类信息、内容名称信息、时长信息。
3.根据权利要求2所述的方法,其特征在于,当所述兴趣特征信息包括多于一项信息时,为所述兴趣特征信息包括的各项信息分别配置权重值;
所述计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度,包括:
针对所述兴趣特征信息中的每项信息,计算两个不同客户端标识对应的该项信息之间的相似度,并使用为各项信息配置的权重值对计算得到的各项信息对应的相似度进行加权求和,以获得所述两个不同客户端标识对应的兴趣特征信息之间的相似度。
4.根据权利要求3所述的方法,其特征在于,所述计算两个不同客户端标识对应的该项信息之间的相似度,包括:
通过余弦相似度算法计算两个不同客户端标识对应的该项信息之间的相似度。
5.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:
若确定所述两个客户端标识中的第一客户端标识与至少一个第三客户端标识对应同一用户,且所述两个客户端标识中的第二客户端标识,以及所述至少一个第三客户端标识中任两个客户端标识对应同一用户,则确定第一客户端标识、第二客户端标识,以及所述至少一个第三客户端标识对应同一用户。
6.根据权利要求1-5任意一项所述的方法,其特征在于,
所述地理位置信息为:客户端登陆网络的网络出口因特网协议IP地址,或基于位置的服务LBS信息。
7.一种用户跨屏识别装置,其特征在于,该装置包括:获取单元、计算单元和处理单元;
所述获取单元,用于获取预设时间内用户通过客户端浏览网页时的相关数据信息,所述数据信息包括:地理位置信息、客户端标识、兴趣特征信息;
所述计算单元,用于针对所述获取单元获取的数据信息中的每个地理位置信息,确定该地理位置信息对应的客户端标识的个数是否大于第二预设阈值,如果是,丢弃该地理位置信息对应的数据信息;否则,计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度;所述客户端标识为用户浏览网页时使用的客户端的标识,所述客户端为移动设备或固定设备;
所述处理单元,用于当所述计算单元计算的相似度的值大于第一预设阈值时,确定所述两个不同客户端标识对应同一用户;
所述处理单元,进一步用于针对被确定为对应同一用户的任两个客户端标识,若确定所述两个客户端标识中的第一客户端标识与至少一个第三客户端标识对应同一用户,且所述两个客户端标识中的第二客户端标识,以及所述至少一个第三客户端标识中任两个客户端标识对应不同用户,则从已计算出的各相似度中查找所述第一客户端标识对应的兴趣特征信息分别与所述第二客户端标识及所述至少一个第三客户端标识对应的兴趣特征信息之间的相似度,并确定查找出的相似度中值最大的相似度,确定所述第一客户端标识与所述值最大的相似度对应的客户端标识对应同一用户,所述第一客户端与所述值最大的相似度对应的客户端标识之外的客户端标识对应不同用户。
8.根据权利要求7所述的装置,其特征在于,所述兴趣特征信息包括下述各项信息之一或任意组合:
频道信息、内容分类信息、内容名称信息、时长信息。
9.根据权利要求8所述的装置,其特征在于,
所述计算单元,进一步用于当所述兴趣特征信息包括多于一项信息时,为所述兴趣特征信息包括的各项信息分别配置权重值;在计算该地理位置信息对应的任两个不同客户端标识对应的兴趣特征信息之间的相似度时,针对所述兴趣特征信息中的每项信息,计算两个不同客户端标识对应的该项信息之间的相似度,并使用为各项信息配置的权重值对计算得到的各项信息对应的相似度进行加权求和,以获得所述两个不同客户端标识对应的兴趣特征信息之间的相似度。
10.根据权利要求9所述的装置,其特征在于,
所述计算单元,具体用于通过余弦相似度算法计算两个不同客户端标识对应的该项信息之间的相似度。
11.根据权利要求7所述的装置,其特征在于,
所述处理单元,进一步用于若确定所述两个客户端标识中的第一客户端标识与至少一个第三客户端标识对应同一用户,且所述两个客户端标识中的第二客户端标识,以及所述至少一个第三客户端标识中任两个客户端标识对应同一用户,则确定第一客户端标识、第二客户端标识,以及所述至少一个第三客户端标识对应同一用户。
12.一种测试设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
13.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201510475628.1A 2015-08-05 2015-08-05 一种用户跨屏识别方法和装置 Active CN106445942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510475628.1A CN106445942B (zh) 2015-08-05 2015-08-05 一种用户跨屏识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510475628.1A CN106445942B (zh) 2015-08-05 2015-08-05 一种用户跨屏识别方法和装置

Publications (2)

Publication Number Publication Date
CN106445942A CN106445942A (zh) 2017-02-22
CN106445942B true CN106445942B (zh) 2020-07-03

Family

ID=58093709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510475628.1A Active CN106445942B (zh) 2015-08-05 2015-08-05 一种用户跨屏识别方法和装置

Country Status (1)

Country Link
CN (1) CN106445942B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110113664A (zh) * 2019-04-10 2019-08-09 华南理工大学 一种基于直播频道用户观看行为相似性的用户身份识别方法
CN110866241A (zh) * 2019-10-08 2020-03-06 北京百度网讯科技有限公司 评估模型生成及设备关联方法、装置及存储介质
CN111080349B (zh) * 2019-12-04 2023-04-21 北京悠易网际科技发展有限公司 识别同一用户的多个设备的方法、装置、服务器及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995907A (zh) * 2014-06-13 2014-08-20 北京奇艺世纪科技有限公司 一种访问用户的确定方法
CN104462385A (zh) * 2014-12-10 2015-03-25 山东科技大学 一种基于用户兴趣模型的电影个性化相似度计算方法
CN104767640A (zh) * 2015-03-25 2015-07-08 亚信科技(南京)有限公司 预警方法及预警系统
CN104881459A (zh) * 2015-05-22 2015-09-02 电子科技大学 一种移动社会网络的好友推荐方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636382B (zh) * 2013-11-13 2018-03-06 华为技术有限公司 推理社会关系的方法及装置
CN103973526B (zh) * 2014-05-19 2017-04-19 百度在线网络技术(北京)有限公司 基于网络拓扑结构的定位方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995907A (zh) * 2014-06-13 2014-08-20 北京奇艺世纪科技有限公司 一种访问用户的确定方法
CN104462385A (zh) * 2014-12-10 2015-03-25 山东科技大学 一种基于用户兴趣模型的电影个性化相似度计算方法
CN104767640A (zh) * 2015-03-25 2015-07-08 亚信科技(南京)有限公司 预警方法及预警系统
CN104881459A (zh) * 2015-05-22 2015-09-02 电子科技大学 一种移动社会网络的好友推荐方法

Also Published As

Publication number Publication date
CN106445942A (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
CN110874440B (zh) 一种信息推送及其模型训练的方法、装置及电子设备
US9646006B2 (en) System and method for capturing a multimedia content item by a mobile device and matching sequentially relevant content to the multimedia content item
US9330189B2 (en) System and method for capturing a multimedia content item by a mobile device and matching sequentially relevant content to the multimedia content item
US20180260490A1 (en) Method and system for recommending text content, and storage medium
US20170169341A1 (en) Method for intelligent recommendation
US8856051B1 (en) Augmenting metadata of digital objects
US20140114979A1 (en) Method and apparatus for classifying commodities on e-commerce platform
CN104811424B (zh) 恶意用户识别方法及装置
CN105045818A (zh) 一种图片的推荐方法、装置和系统
CN107391561B (zh) 内容源页面中的广告处理方法、服务器及计算机可读介质
CN106445942B (zh) 一种用户跨屏识别方法和装置
WO2015081720A1 (en) Instant messaging (im) based information recommendation method, apparatus, and terminal
US20160092550A1 (en) Automated search intent discovery
Faheem et al. Smartphone forensic analysis: A case study for obtaining root access of an android samsung s3 device and analyse the image without an expensive commercial tool
WO2019085856A1 (zh) 文本资源的推送方法、装置、存储介质及处理器
CN106095816B (zh) 信息投放方法和装置
US20130191323A1 (en) System and method for identifying the context of multimedia content elements displayed in a web-page
US20180225576A1 (en) Entity disambiguation
CN108804452B (zh) 多媒体资源封面展示方法及装置
TW201933231A (zh) 物品間關係探勘及推薦方法、裝置、計算設備、儲存媒體
CN105117438A (zh) 一种信息处理方法及电子设备
US10049110B2 (en) Content ranking based on person-to-person sharing
CN111782933A (zh) 用于推荐书单的方法和装置
CN108848158B (zh) 一种向移动终端推荐手机游戏的方法、装置和服务器
CN109428774B (zh) 一种dpi设备的数据处理方法及相关的dpi设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant