CN113254318B - 设备标识信息确定方法、装置、电子设备及存储介质 - Google Patents

设备标识信息确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113254318B
CN113254318B CN202110762228.4A CN202110762228A CN113254318B CN 113254318 B CN113254318 B CN 113254318B CN 202110762228 A CN202110762228 A CN 202110762228A CN 113254318 B CN113254318 B CN 113254318B
Authority
CN
China
Prior art keywords
factors
occurrence
equipment
factor
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110762228.4A
Other languages
English (en)
Other versions
CN113254318A (zh
Inventor
毛颖
王志鹏
吴帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110762228.4A priority Critical patent/CN113254318B/zh
Publication of CN113254318A publication Critical patent/CN113254318A/zh
Application granted granted Critical
Publication of CN113254318B publication Critical patent/CN113254318B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开关于一种设备标识信息确定方法、装置、电子设备及存储介质,该方法包括:获取待识别设备在历史时间段内的历史日志数据,历史日志数据包括不同类别的多个设备因子;确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系,目标共现关系表征每个类别的设备因子与其他类别的设备因子之间所形成的设备因子对,在历史日志数据中的共现次数;根据目标共现关系和每个类别的设备因子的属性信息,确定每个类别的设备因子的目标共现次数阈值;基于目标共现次数阈值对设备因子对进行过滤,对过滤后的设备因子对中的设备因子进行聚合,根据聚合后的设备因子确定待识别设备的标识信息。采用本公的技术方案能够提高设备识别的准确率。

Description

设备标识信息确定方法、装置、电子设备及存储介质
技术领域
本公开涉及互联网技术领域,尤其涉及一种设备标识信息确定方法、装置、电子设备及存储介质。
背景技术
多种业务场景(视频推荐、广告投放等)对设备画像的准确性、一致性要求较高,如:广告投放时希望能精准圈选目标受众。为实现此目标,需要精准进行唯一设备识别,具体方式为将设备的多种、多个设备因子进行聚合,从而描述一台设备。
相关技术中通常设置统一的阈值,通过该统一的阈值对所有的设备因子进行过滤,并基于过滤后的设备因子识别一台设备。相关技术中还基于全量历史数据构建共现关系,以此实现对设备的识别。然而通过统一的阈值无法考虑设备因子的自身特性(比如,某些设备因子容易跳变,某些设备因子稳定性高),基于全量历史数据构建共现关系无法兼容设备因子正常跳变的情况(比如,应当允许一定频率的系统升级导致的某些设备因子的正常跳变),从而使得设备识别的准确率较低。
发明内容
本公开提供一种设备标识信息确定方法、装置、电子设备及存储介质,以至少解决相关技术中由于无法考虑设备因子的自身特征或无法兼容设备因子正常跳变的情况,所带来的设备识别准确率较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种设备标识信息确定方法,包括:
获取待识别设备在历史时间段内的历史日志数据,所述历史日志数据包括不同类别的多个设备因子,所述设备因子表征用于识别所述待识别设备的参数信息;
确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系,所述其他类别为所述不同类别中除所述每个类别之外的类别,所述目标共现关系表征所述每个类别的设备因子与所述其他类别的设备因子之间所形成的设备因子对,在所述历史日志数据中的共现次数;
根据所述目标共现关系和所述每个类别的设备因子的属性信息,确定所述每个类别的设备因子的目标共现次数阈值;
基于所述目标共现次数阈值对所述设备因子对进行过滤,得到过滤后的设备因子对;
对所述过滤后的设备因子对中的设备因子进行聚合,得到聚合后的设备因子;
根据所述聚合后的设备因子确定所述待识别设备的标识信息。
在一示例性的实施方式中,所述根据所述目标共现关系和所述每个类别的设备因子的属性信息,确定所述每个类别的设备因子的目标共现次数阈值,包括:
将所述设备因子对按照相应的共现次数进行排序,得到所述每个类别的设备因子对应的设备因子对序列;
将所述设备因子对序列中排序第预设位的设备因子对所对应的共现次数,作为所述每个类别的设备因子对应的异常共现次数阈值;
基于所述属性信息对所述异常共现次数阈值进行调整,得到所述目标共现次数阈值。
在一示例性的实施方式中,所述基于所述属性信息对所述异常共现次数阈值进行调整,得到所述目标共现次数阈值,包括:
基于所述属性信息,从所述多个设备因子中确定出预设数量个第一设备因子和预设数量个第二设备因子,所述第一设备因子表征设备识别准确性的波动数据小于预设阈值的设备因子,所述第二设备因子表征设备识别准确性的波动数据大于或等于所述预设阈值的设备因子;
根据所述预设数量个第一设备因子的属性信息和对应的异常共现次数阈值,确定所述预设数量个第一设备因子对应的第一共现次数调整阈值,根据所述预设数量个第二设备因子的属性信息和对应的异常共现次数阈值,确定所述预设数量个第二设备因子对应的第二共现次数调整阈值;
基于所述第一共现次数调整阈值,对所述预设数量个第一设备因子的异常共现次数阈值进行调整,得到所述预设数量个第一设备因子的目标共现次数阈值;
基于所述第二共现次数调整阈值,对所述预设数量个第二设备因子的异常共现次数阈值进行调整,得到所述预设数量个第二设备因子的目标共现次数阈值。
在一示例性的实施方式中,所述历史日志数据的数量为多个,则所述确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系,包括:
获取每个历史日志数据中所包含的不同类别的预设数量个设备因子;
确定每个历史日志数据中的每个类别的设备因子,与每个历史日志数据中的其他类别的设备因子之间的初始共现关系;
根据所述初始共现关系,确定所述目标共现关系。
在一示例性的实施方式中,所述基于所述目标共现次数阈值对所述设备因子对进行过滤,得到过滤后的设备因子对,包括:
将所述设备因子对中,相应的共现次数不满足所述目标共现次数阈值的设备因子对,作为异常设备因子对;
从所述设备因子对中过滤所述异常设备因子对,得到所述过滤后的设备因子对。
在一示例性的实施方式中,所述基于所述目标共现次数阈值对所述设备因子对进行过滤,得到过滤后的设备因子对,包括:
将所述设备因子对中,相应的共现次数满足所述目标共现次数阈值的设备因子对,作为所述过滤后的设备因子对。
在一示例性的实施方式中,所述对所述过滤后的设备因子对中的设备因子进行聚合,得到聚合后的设备因子,包括:
基于连通图连接算法对所述过滤后的设备因子对中的设备因子进行聚合,得到所述聚合后的设备因子。
在一示例性的实施方式中,所述根据所述聚合后的设备因子确定所述待识别设备的标识信息,包括:
将所述聚合后的设备因子作为所述标识信息,所述标识信息用于唯一识别所述待识别设备。
根据本公开实施例的第二方面,提供一种设备标识信息确定装置,包括:
历史日志数据获取模块,被配置为执行获取待识别设备在历史时间段内的历史日志数据,所述历史日志数据包括不同类别的多个设备因子,所述设备因子表征用于识别所述待识别设备的参数信息;
目标共现关系确定模块,被配置为执行确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系,所述其他类别为所述不同类别中除所述每个类别之外的类别,所述目标共现关系表征所述每个类别的设备因子与所述其他类别的设备因子之间所形成的设备因子对,在所述历史日志数据中的共现次数;
目标共现次数阈值确定模块,被配置为执行根据所述目标共现关系和所述每个类别的设备因子的属性信息,确定所述每个类别的设备因子的目标共现次数阈值;
过滤模块,被配置为执行基于所述目标共现次数阈值对所述设备因子对进行过滤,得到过滤后的设备因子对;
聚合模块,被配置为执行对所述过滤后的设备因子对中的设备因子进行聚合,得到聚合后的设备因子;
标识信息确定模块,被配置为执行根据所述聚合后的设备因子确定所述待识别设备的标识信息。
在一示例性的实施方式中,所述目标共现次数阈值确定模块,包括:
排序单元,被配置为执行将所述设备因子对按照相应的共现次数进行排序,得到所述每个类别的设备因子对应的设备因子对序列;
异常共现次数阈值确定单元,被配置为执行将所述设备因子对序列中排序第预设位的设备因子对所对应的共现次数,作为所述每个类别的设备因子对应的异常共现次数阈值;
调整单元,被配置为执行基于所述属性信息对所述异常共现次数阈值进行调整,得到所述目标共现次数阈值。
在一示例性的实施方式中,所述调整单元,包括:
设备因子确定子单元,被配置为执行基于所述属性信息,从所述多个设备因子中确定出预设数量个第一设备因子和预设数量个第二设备因子,所述第一设备因子表征设备识别准确性的波动数据小于预设阈值的设备因子,所述第二设备因子表征设备识别准确性的波动数据大于或等于所述预设阈值的设备因子;
共现次数调整阈值确定子单元,被配置为执行根据所述预设数量个第一设备因子的属性信息和对应的异常共现次数阈值,确定所述预设数量个第一设备因子对应的第一共现次数调整阈值,根据所述预设数量个第二设备因子的属性信息和对应的异常共现次数阈值,确定所述预设数量个第二设备因子对应的第二共现次数调整阈值;
第一调整子单元,被配置为执行基于所述第一共现次数调整阈值,对所述预设数量个第一设备因子的异常共现次数阈值进行调整,得到所述预设数量个第一设备因子的目标共现次数阈值;
第二调整子单元,被配置为执行基于所述第二共现次数调整阈值,对所述预设数量个第二设备因子的异常共现次数阈值进行调整,得到所述预设数量个第二设备因子的目标共现次数阈值。
在一示例性的实施方式中,所述历史日志数据的数量为多个,则所述目标共现关系确定模块,包括:
设备因子获取单元,被配置为执行获取每个历史日志数据中所包含的不同类别的预设数量个设备因子;
初始共现关系确定单元,被配置为执行确定每个历史日志数据中的每个类别的设备因子,与每个历史日志数据中的其他类别的设备因子之间的初始共现关系;
目标共现关系确定单元,被配置为执行根据所述初始共现关系,确定所述目标共现关系。
在一示例性的实施方式中,所述过滤模块,包括:
异常设备因子对确定单元,被配置为执行将所述设备因子对中,相应的共现次数不满足所述目标共现次数阈值的设备因子对,作为异常设备因子对;
过滤单元,被配置为执行从所述设备因子对中过滤所述异常设备因子对,得到所述过滤后的设备因子对。
在一示例性的实施方式中,所述过滤模块,被配置为执行将所述设备因子对中,相应的共现次数满足所述目标共现次数阈值的设备因子对,作为所述过滤后的设备因子对。
在一示例性的实施方式中,所述聚合模块,被配置为执行基于连通图连接算法对所述过滤后的设备因子对中的设备因子进行聚合,得到所述聚合后的设备因子。
在一示例性的实施方式中,所述标识信息确定模块,被配置为执行将所述聚合后的设备因子作为所述标识信息,所述标识信息用于唯一识别所述待识别设备。
根据本公开实施例的第三方面,提供一种电子设备,包括;
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如上述任一实施方式所述的设备标识信息确定方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备执行如上述任一实施方式所述的设备标识信息确定方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一实施方式所述的设备标识信息确定方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开实施例基于历史时间段内的历史日志数据,构建历史日志数据中的每个类别的设备因子与其他类别的设备因子之间的目标共现关系(该目标共现关系表征每个类别的设备因子与其他类别的设备因子之间所形成的设备因子对,在历史日志数据中的共现次数),并结合每个类别设备因子的属性信息,确定每个类别的设备因子的目标共现次数阈值,接着使用目标共现次数阈值对该设备因子对进行过滤,生成经过认可的过滤后的设备因子对,最后对该过滤后的设备因子对中的设备因子进行聚合,根据聚合后的设备因子确定待识别设备的标识信息。可见,本公开实施例所提供的技术方案既充分考虑了设备因子的自身特性(即结合每个类别的设备因子的属性信息,确定目标共现次数阈值),又引入了动态时间窗口的概念(即使用历史时间段内的历史日志数据),可以允许部分设备因子的合理跳变,提高了过滤后的设备因子对确定的准确率和效率,从而提高了待识别设备的标识信息确定的准确率和效率,进而提高待识别设备的识别准确率和效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种设备标识信息确定方法的应用环境图。
图2是根据一示例性实施例示出的一种设备标识信息确定方法的流程图。
图3是根据一示例性实施例示出的一种确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系的流程图。
图4是根据一示例性实施例示出的一种根据上述目标共现关系和上述每个类别的设备因子的属性信息,确定上述每个类别的设备因子的目标共现次数阈值的流程图。
图5是根据一示例性实施例示出的一种基于上述属性信息对上述异常共现次数阈值进行调整,得到上述目标共现次数阈值的流程图。
图6是根据一示例性实施例示出的基于上述目标共现次数阈值对上述设备因子对进行过滤,得到过滤后的设备因子对的流程图。
图7是根据一示例性实施例示出的一种设备标识信息确定装置框图。
图8是根据一示例性实施例示出的一种用于设备标识信息确定的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
请参阅图1,图1是根据一示例性实施例示出的一种设备标识信息确定方法的应用环境图,该应用环境可以包括客户端01和服务器02。客户端01可以通过有线或无线的方式与服务器02进行通信,本公开对此不做限定。
其中,客户端01可以采集历史时间段内的历史日志数据,并将该历史日志数据发送至服务器02。可选地,该客户端01可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、智能可穿戴设备等终端设备。
其中,服务器02可以用于获取客户端01采集的历史日志数据,并基于历史时间段内的历史日志数据,构建历史日志数据中的每个类别的设备因子与其他类别的设备因子之间的目标共现关系(该目标共现关系表征每个类别的设备因子与其他类别的设备因子之间所形成的设备因子对,在历史日志数据中的共现次数),以及结合每个类别设备因子的属性信息,确定每个类别的设备因子的目标共现次数阈值,以及使用目标共现次数阈值对该设备因子对进行过滤,生成经过认可的过滤后的设备因子对,最后对该过滤后的设备因子对中的设备因子进行聚合,根据聚合后的设备因子确定待识别设备的标识信息。可选地,该服务器02可以是包括独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在另一个示例性的实施例中,本公开实施例提供的设备标识信息确定方法还可以应用于仅包含客户端的应用环境中。其中,客户端可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、智能可穿戴设备等终端设备。客户端在获取历史日志数据,可以构建历史日志数据中的每个类别的设备因子与其他类别的设备因子之间的目标共现关系,从而确定上述待识别设备的标识信息。
以下,对本公开实施例所使用到的技术术语进行说明:
设备因子:指的是设备上可以获取到的一些参数,其可以包括但不限于:国际移动设备识别码(International Mobile Equipment Identity,IMEI)、国际移动用户识别码(International Mobile Subscriber Identity,IMSI)、广告标识符(OAID)、Android ID等。
IMEI:即通常所说的手机序列号,在移动网络中识别每一部独立的手机等移动通信设备,相当于移动电话的身份证。
IMSI:是用于区分蜂窝网络中不同用户的、在所有蜂窝网络中不重复的识别码。
OAID:是移动安全联盟联合国内手机厂商推出的补充设备标准体系方案,为安卓系统10以后不能获取IMEI的替代方案。
Android ID:是系统随机生成的设备ID,为一串64位的编码(十六进制的字符串),通过它可以知道设备的寿命(在设备恢复出厂设置或刷机后,该值可能会改变)。
设备识别:是指通过多种设备因子识别唯一设备的过程。
因子跳变:是指设备与某一设备因子间存在一对多的关系。
因子冲撞:是指设备与某一设备因子间存在多对一的关系。
图2是根据一示例性实施例示出的一种设备标识信息确定方法的流程图,如图2所示,方法用于图1所示的包括客户端和服务器的系统中,可以包括以下步骤。
在步骤S11中,获取待识别设备在历史时间段内的历史日志数据,上述历史日志数据包括不同类别的多个设备因子,上述设备因子表征用于识别上述待识别设备的参数信息。
具体地,待识别设备可以为物理设备或虚拟设备。可选地,物理设备可以为移动电话、智能手机、平板电脑、台式电脑、笔记本电脑等。
示例性地,历史时间段可以为当前时间之前预设时间内的时间段。可选地,可以引入动态时间窗口,通过该动态时间窗口对当前时间之前的时间段进行截取,得到该历史时间段。比如,截取近90天内的日志数据作为上述历史日志数据。
可选地,历史日志数据可以为系统在历史时间段内所产生的过程性事件记录数据,比如,应用程序(Application,APP)启动数据、用户视频观看行为等。通过上述历史日志数据能够了解到具体哪个用户、在具体什么时间、在哪台设备上或者什么应用系统中、做了什么具体的操作。
示例性地,该历史日志数据可以为冷启动日志数据,冷启动指的是切断设备的电源,重新启动。使用历史时间段内的冷启动日志数据,时间窗口的覆盖程度较高,能够保证历史日志数据德的完备性,从而确保后续待识别设备的标识信息确定的准确率。
可选地,设备因子可以包括但不限于:IMEI、IMSI、OAID、Android ID等。
具体地,该历史日志数据得到数量可以为一个或多个,每个历史日志数据中均可以包括不同类别的多个设备因子。
假设历史时间段为近90天,该近90天内有3个历史日志数据(历史日志数据1、历史日志数据2、历史日志数据3)。历史日志数据1涉及的设备因子为:IMEI 1、IMSI 1和OAID 1。历史日志数据2涉及的设备因子为:IMEI 1和Android ID1。历史日志数据3涉及的设备因子为:IMEI 1、Android ID2和OAID2。可见,历史日志数据1包含3个设备因子,该3个设备因子属于3个不同的类别;历史日志数据2包含2个设备因子,该2个设备因子属于2个不同的类别;该历史日志数据3包含3个设备因子,该3个设备因子属于3个不同的类别。需要说明的是OAID 1和OAID2属于同一个类别(即OAID类别),Android ID 1和Android ID2属于同一个类别(即Android ID类别)。
在步骤S13中,确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系,上述其他类别为上述不同类别中除上述每个类别之外的类别,上述目标共现关系表征上述每个类别的设备因子与上述其他类别的设备因子之间所形成的设备因子对,在上述历史日志数据中的共现次数。
可选地,可以确定每个类别的各个设备因子与其他类别的任一设备因子之间的目标共现关系。即目标共现关系可以为个两个不同类别的设备因子之间所形成的共现关系。
在一个可选的实施例中,在该历史日志的数量为1个的情况下,假设该历史日志数据1涉及的设备因子为:IMEI 1、IMSI 1和OAID 1。
以IMEI 1为例,IMEI 1与其他类别的设备因子之间的目标共现关系为:(IMEI 1,IMSI)的共现次数为1,(IMEI 1,OAID)的共现次数为1。
以IMSI 1为例,IMSI 1与其他类别的设备因子之间的目标共现关系为:(IMSI 1,IMEI)的共现次数为1,(IMSI 1,OAID)的共现次数为1。
以OAID 1为例,OAID 1与其他类别的设备因子之间的目标共现关系为:(OAID 1,IMEI)的共现次数为1,(OAID 1,IMSI)的共现次数为1。
其中,(IMEI 1,IMSI)、(IMEI 1,OAID)、(IMSI 1,IMEI)、(IMSI 1,OAID)、(OAID 1,IMEI)和(OAID 1,IMSI)均表示一个设备因子对。
在一个可选的实施例中,图3是根据一示例性实施例示出的一种确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系的流程图。如图3所示,在上述历史日志数据的数量为多个的情况下,则在上述步骤S13中,上述确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系,可以包括:
在步骤S131中,获取每个历史日志数据中所包含的不同类别的预设数量个设备因子。
在步骤S133中,确定每个历史日志数据中的每个类别的设备因子,与每个历史日志数据中的其他类别的设备因子之间的初始共现关系。
在步骤S135中,根据上述初始共现关系,确定上述目标共现关系。
示例性地,在历史日志数据的数量为多个时,可以针对每一个历史日志数据中所涉及的设备因子,构建两两之间的初始共现关系,最后对每一个历史日志数据所构建得到的初始共现关系进行统计汇总,得到上述目标共现关系。
假设,历史时间段内(比如,近90天内)有3条历史日志数据(历史日志数据1、历史日志数据2、历史日志数据3)。历史日志数据1涉及的设备因子为:IMEI 1、IMSI 1和OAID 1。历史日志数据2涉及的设备因子为:IMEI 1和Android ID 1。历史日志数据3涉及的设备因子为:IMEI 1、Android ID 2和OAID 2。
对于历史日志数据1:
以IMEI 1为例,IMEI 1与其他类别的设备因子之间的初始共现关系为:(IMEI 1,IMSI)的共现次数为1,(IMEI 1,OAID)的共现次数为1。
以IMSI 1为例,IMSI 1与其他类别的设备因子之间的初始共现关系为:(IMSI 1,IMEI)的初始共现次数为1,(IMSI 1,OAID)的初始共现次数为1。
以OAID 1为例,OAID 1与其他类别的设备因子之间的初始共现关系为:(OAID 1,IMEI)的共现次数为1,(OAID 1,IMSI)的共现次数为1。
对于历史日志数据2:
以IMEI 1为例,IMEI 1与其他类别的设备因子之间的初始共现关系为:(IMEI 1,Android ID)的共现次数为1。
以Android ID 1为例,Android ID 1与其他类别的设备因子之间的初始共现关系为:(Android ID 1,IMEI)的共现次数为1。
对于历史日志数据3:
以IMEI 1为例,IMEI 1与其他类别的设备因子之间的初始共现关系为:(IMEI 1,Android ID)的共现次数为1,(IMEI 1,OAID)的共现次数为1。
以Android ID 2为例,Android ID 2与其他类别的设备因子之间的初始共现关系为:(Android ID 2,IMEI)的共现次数为1,(Android ID 2,OAID)的共现次数为1。
以OAID 2为例,OAID 2与其他类别的设备因子之间的初始共现关系为:(OAID 2,IMEI)的共现次数为1,(OAID 2,Android ID)的共现次数为1。
接着如上述步骤S135中所述,对上述所有的相同设备因子对的共现次数进行统计汇总,得到每个类别的设备因子与其他类别的设备因子之间的目标共现关系。
以IMEI 1为例,IMEI 1与其他类别的设备因子之间的目标共现关系为:(IMEI 1,OAID)的共现个数为2,(IMEI 1,IMSI)的共现个数为1,(IMEI 1, Android ID)的共现个数为2。
以IMSI 1为例,IMSI 1与其他类别的设备因子之间的目标共现关系为:(IMSI 1,IMEI)的共现个数为1,(IMSI 1,OAID)的共现个数为1,(IMSI 1,Android ID)的共现个数为0。
以OAID 1为例,OAID 1与其他类别的设备因子之间的目标共现关系为:(OAID 1,IMEI)的共现次数为1,(OAID 1,IMSI)的共现次数为1。
以Android ID 1为例,Android ID 1与其他类别的设备因子之间的目标共现关系为:(Android ID 1,IMEI)的共现次数为1,(Android ID 1,IMSI)的共现次数为0,(AndroidID 1,OAID)的共现次数为0。
以Android ID 2为例,Android ID 2与其他类别的设备因子之间的目标共现关系为:(Android ID 2,IMEI)的共现次数为1,(Android ID 2,OAID)的共现次数为1,(AndroidID 2,IMSI)的共现次数为1。
以OAID 2为例,OAID 2与其他类别的设备因子之间的目标共现关系为:(OAID 2,IMEI)的共现次数为1,(OAID 2,Android ID)的共现次数为1,(OAID 2,IMSI)的共现次数为0。
本公开实施例中基于历史时间段内的历史日志数据,构建历史日志数据中的每个类别的设备因子与其他类别的设备因子之间的目标共现关系(该目标共现关系表征每个类别的设备因子与其他类别的设备因子之间所形成的设备因子对,在历史日志数据中的共现次数),即引入了动态时间窗口的概念,可以允许部分设备因子的合理跳变,且自动化程度较高,从而提高后续过滤后的设备因子对确定的准确率和效率,进而提高待识别设备的标识信息确定的准确率和效率以及待识别设备的识别准确率和效率。
在步骤S15中,根据上述目标共现关系和上述每个类别的设备因子的属性信息,确定上述每个类别的设备因子的目标共现次数阈值。
具体地,设备因子的属性信息可以为从设备因子的官方文档中所提取到的特征信息。可选地,设备因子的官方文档可以为从百科、谷歌等搜索引擎中获取到的文档。当然,也可以是从其他渠道获取到的用于介绍该设备因子的官方文档。
在一个可选的实施例中,图4是根据一示例性实施例示出的一种根据上述目标共现关系和上述每个类别的设备因子的属性信息,确定上述每个类别的设备因子的目标共现次数阈值的流程图。如图4所示,在上述步骤S15中,上述根据上述目标共现关系和上述每个类别的设备因子的属性信息,确定上述每个类别的设备因子的目标共现次数阈值,可以包括:
在步骤S151中,将上述设备因子对按照相应的共现次数进行排序,得到上述每个类别的设备因子对应的设备因子对序列。
在步骤S153中,将上述设备因子对序列中排序第预设位的设备因子对所对应的共现次数,作为上述每个类别的设备因子对应的异常共现次数阈值。
在步骤S155中,基于上述属性信息对上述异常共现次数阈值进行调整,得到上述目标共现次数阈值。
具体地,可以根据上述步骤S13中的相应的共现次数,对每个类别的设备因子与上述其他类别的设备因子之间所形成的目标共现关系中的设备因子对进行排序(升序排序或降序排序),得到每个类别的设备因子对应的设备因子对序列,并确定每个类别的设备因子对应的异常区间的分裂值,即异常共现次数阈值。可选地,可以将排序第预设位的设备因子对所对应的共现次数(比如,如1%位置的共现次数)作物该异常共现次数阈值。
示例性地,每个类别的设备因子可能有多个,则每个类别的各个设备因子对应的目标共现次数阈值可以相同:以每个类别的设备因子为Android ID1和Android ID2为例,Android ID1与其他类别的设备因子之间会形成至少一个设备因子对,Android ID2与其他类别的设备因子之间也会形成至少一个设备因子对,在进行排序的时候,可以将AndroidID1对应的设备因子和Android ID2对应的设备因子对序列融合在一起进行排序,从而确定Android ID1和Android ID2对应的同一个异常共现次数阈值,并根据Android ID1和Android ID2对应的属性信息,对该同一个异常共现次数阈值进行调整,得到Android ID1和Android ID2对应的同一个目标共现次数阈值。
示例性地,每个类别的设备因子可能有多个,则每个类别的各个设备因子对应的目标共现次数阈值可以不同:以每个类别的设备因子为Android ID 1和Android ID2为例,Android ID1与其他类别的设备因子之间会形成至少一个设备因子对,Android ID2与其他类别的设备因子之间也会形成至少一个设备因子对,在进行排序的时候,可以分别对Android ID1和Android ID2各自对应的设备因子对进行排序,得到Android ID1和AndroidID2各自对应的设备因子对序列,从而确定Android ID1和Android ID2各自对应的异常共现次数阈值,并根据Android ID1和Android ID2对应的属性信息,对各自对应的异常共现次数阈值进行调整,得到Android ID1和Android ID2各自对应的目标共现次数阈值。
具体地,上述步骤S155中,基于上述属性信息对上述异常共现次数阈值进行调整具体可以为:对于Android ID、IMSI等易跳变的设备因子,可以在异常共现次数阈值的基础上,将异常共现次数阈值调高一些,从而得到目标共现次数阈值(比如,将90天内的周期阈值调整为90),对于IMEI、OAID等不易跳变的设备因子,可以在异常共现次数阈值的基础上,将异常共现次数阈值调低一些,从而得到目标共现次数阈值(比如,将90天内的周期阈值调整为1)。
本公开实施例中,在每个类别的设备因子与其他类别的设备因子之间的目标共现关系的基础上,结合每个类别设备因子的属性信息,从而确定得到每个类别的设备因子的目标共现次数阈值,该目标共现次数阈值的确定能够充分考虑设备因子的自身特性,且自动化程度较高,从而提高目标共现次数阈值确定的准确率较高和效率,进而提高后续待识别设备的标识信息确定的准确率和效率以及待识别设备的识别准确率和效率。
在一个具体的实施例中,图5是根据一示例性实施例示出的一种基于上述属性信息对上述异常共现次数阈值进行调整,得到上述目标共现次数阈值的流程图。如图5所示,上述步骤S155中,上述基于上述属性信息对上述异常共现次数阈值进行调整,得到上述目标共现次数阈值,可以包括:
在步骤S15501中,基于上述属性信息,从上述多个设备因子中确定出预设数量个第一设备因子和预设数量个第二设备因子,上述第一设备因子表征设备识别准确性的波动数据小于预设阈值的设备因子,上述第二设备因子表征设备识别准确性的波动数据大于或等于上述预设阈值的设备因子。
在步骤S15503中,根据上述预设数量个第一设备因子的属性信息和对应的异常共现次数阈值,确定上述预设数量个第一设备因子对应的第一共现次数调整阈值,根据上述预设数量个第二设备因子的属性信息和对应的异常共现次数阈值,确定上述预设数量个第二设备因子对应的第二共现次数调整阈值。
在步骤S15505中,基于上述第一共现次数调整阈值,对上述预设数量个第一设备因子的异常共现次数阈值进行调整,得到上述预设数量个第一设备因子的目标共现次数阈值。
在步骤S15507中,基于上述第二共现次数调整阈值,对上述预设数量个第二设备因子的异常共现次数阈值进行调整,得到上述预设数量个第二设备因子的目标共现次数阈值。
本公开实施例中,除了根据每个类别的设备因子的属性信息对相应的异常共现次数阈值进行调整(比如,调整或调低),得到相应的目标共现次数阈值之外,还可以对多个设备因子分组进行阈值的调整。即将多个设备因子按照属性信息划分为易跳变组和稳定组,将易跳变组的设备因子调整为具有同一目标共现次数阈值,将稳定组的设备因子调整为具有同一目标共现次数阈值。
具体地,上述步骤S15501中的预设数量个第一设备因子可以为稳定组,即设备因子的稳定性较高,不容易发送跳变,通过该稳定性较高的设备因子对设备进行识别,设备识别准确性的波动数据较小。预设数量个第二设备因子可以为易跳变组,即设备因子的稳定性不高,易发生跳变,通过该稳定性较不高的设备因子对设备进行识别,设备识别准确性的波动数据较大。
具体地,在上述步骤S15503中,可以根据预设数量个第一设备因子的属性信息和对应的异常共现次数阈值,为该预设数量个第一设备因子确定同一个第一共现次数调整阈值。示例性地,可以对该预设数量个第一设备因子的异常共现次数阈值进行求平均、加权等数学运算,得到共现次数的数学运算结果,接着再根据预设数量个第一设备因子的属性信息对该数学运算结果进行调整,得到该预设数量个第一设备因子对应的同一个第一共现次数调整阈值(比如,该第一共现次数调整阈值为1)。同理,可以确定预设数量个第二设备因子确定同一个第二共现次数调整阈值(比如,该第一共现次数调整阈值为100)。
示例性地,在上述步骤S15505中,可以直接将同一个第一共现次数调整阈值(比如,该第一共现次数调整阈值为1)作为上述预设数量个第一设备因子的目标共现次数阈值,并直接将同一个第二共现次数调整阈值(比如,该第一共现次数调整阈值为100)作为述预设数量个第二设备因子的目标共现次数阈值。示例性地,还可以再次根据该第一共现次数调整阈值,对上述预设数量个第一设备因子的异常共现次数阈值进行调整,得到上述预设数量个第一设备因子的目标共现次数阈值,以及再次根据上述第二共现次数调整阈值,对上述预设数量个第二设备因子的异常共现次数阈值进行调整,得到上述预设数量个第二设备因子的目标共现次数阈值。
以下,举例对上述步骤S15501-步骤S15507进行说明:
假设多个设备因子为:IMEI 1、IMSI 1、OAID 1、Android ID 1、Android ID2、OAID2。
按照各个设备因子的属性信息,对各个设备因子进行分组,该预设数量个第一设备因子(即稳定组)可以为:IMEI 1、OAID 1和OAID2,预设数量个第二设备因子(即易跳变组)可以为:IMSI 1、Android ID1和Android ID2。则可以根据IMEI 1、OAID 1和OAID 2的属性信息和对应的异常共现次数阈值,确定IMEI 1、OAID 1和OAID 2对应的第一共现次数调整阈值,接着根据IMEI 1、OAID 1和OAID 2对应的第一共现次数调整阈值,对IMEI 1、OAID1和OAID 2的异常共现次数阈值进行调整,得到IMEI 1、OAID 1和OAID 2对应的同一目标共现次数阈值。同理,可以得到IMSI 1、Android ID1和Android ID2对应的同一目标共现次数阈值。
本公开实施例中,通过将多个设备因子按照属性信息划分为易跳变组和稳定组,并为易跳变组设置同一个目标共现次数阈值,为稳定组设置同一个目标共现次数阈值,能够充分考虑到设备因子的自身特性,提高目标共现次数阈值确定的准确率,从而提高后续待识别设备的标识信息确定的准确率以及待识别设备的识别准确率。此外,分组进行目标共现次数阈值的确定,还能够大大提高目标共现次数阈值确定的效率,从而提高后续过滤后的设备因子对确定的效率,进而提高待识别设备的标识信息确定的效率。
在一个示例性的实施例中,还可以通过预设模型,确定每个类别的设备因子的目标共现次数阈值,该预设模型的训练过程可以如下:
获取样本待识别设备在历史样本时间段内的历史样本日志数据,上述历史样本日志数据包括不同样本类别的多个样本设备因子。
确定每个样本类别的样本设备因子与其他样本类别的样本设备因子之间的目标样本共现关系,上述其他样本类别为上述不同样本类别中除上述每个样本类别之外的类别,上述目标样本共现关系表征上述每个样本类别的样本设备因子与上述其他样本类别的样本设备因子之间所形成的样本设备因子对,在上述历史样本日志数据中的样本共现次数。
为每个样本设备因子对标注标签,该标签表征每个样本设备因子对中的两个设备因子是否属于同一设备(即是否用于识别同一设备)。
将上述样本共现次数作为特征,对预设神经网络进行训练,得到每个样本设备因子中的两个设备因子是否属于同一设备的预测结果。
基于该预设结果和上述标签,确定损失数据。
根据该损失数据训练该预设神经网络,得到上述预设模型。
通过上述预设模型确定每个类别的设备因子的目标共现次数阈值的具体过程可以如下:
将每个类别的设备因子与上述其他类别的设备因子之间所形成的设备因子对,在上述历史日志数据中的共现次数,输入上述预设模型进行识别,得到每个类别的设备因子与上述其他类别的设备因子之间所形成的设备因子对中的两个设备因子,是否属于该待识别设备的识别结果。
将其中的两个设备因子不属于该待识别设备的设备因子,作为目标设备因子对。
将所有目标设备因子对所对应的共现次数,按照一定的策略进行计算(比如,排序、求平均、加权等),得到目标设备因子对中的各个设备因子的目标共现次数阈值。
在步骤S17中,基于上述目标共现次数阈值对上述设备因子对进行过滤,得到过滤后的设备因子对。
在一个可选的实施例中,图6是根据一示例性实施例示出的基于上述目标共现次数阈值对上述设备因子对进行过滤,得到过滤后的设备因子对的流程图。如图6所示,在上述步骤S17中,上述基于上述目标共现次数阈值对上述设备因子对进行过滤,得到过滤后的设备因子对,可以包括:
在步骤S171中,将上述设备因子对中,相应的共现次数不满足上述目标共现次数阈值的设备因子对,作为异常设备因子对。
在步骤S173中,从上述设备因子对中过滤上述异常设备因子对,得到上述过滤后的设备因子对。
本公开实施例中,由于前述步骤已经得到了每个类别的设备因子与上述其他类别的设备因子之间所形成的设备因子对,在上述历史日志数据中的共现次数,则可以将共现次数不满足目标共现次数阈值的设备因子对,作为异常设备因子对,该异常设备因子对即为设备因子对黑名单。接着将该异常设备因子对从该上述设备因子对中过滤掉,得到过滤后的设备因子对。
示例性地,可以将每个类别的设备因子与上述其他类别的设备因子之间所形成的所有设备因子对,在上述历史日志数据中的共现次数,与每个类别的设备因子的目标共现次数阈值进行比对,将共现次数大于相应的设备因子的目标共现次数的设备因子对,作为异常设备因子对。
假设,Android ID在历史时间段内(比如,近90天内)的目标共现次数阈值为90,IMEI在历史时间段内(比如,近90天内)的目标共现次数阈值为1。对于(OAID,Android ID)这一设备因子对,当OAID对应90个以上的Android ID(即(OAID,Android ID)的共现次数大于90)时,则将此OAID判定为黑名单设备因子,并将含有该OAID设备因子的设备因子对判定为黑名单设备因子对,即异常设备因子对,并对该异常设备因子对进行过滤。对于(IMEI,Android ID)这一设备因子对,当Android ID对应1个以上的IMEI(即(IMEI,Android ID)的共现次数大于1时),则将此Android ID判定为黑名单设备因子,并对含有该Android ID设备因子的设备因子对判定为黑名单设备因子对,即异常设备因子对,并对该异常设备因子对进行过滤。
在另一个可选的实施例中,在上述步骤S17中,上述基于上述目标共现次数阈值对上述设备因子对进行过滤,得到过滤后的设备因子对,可以包括:将上述设备因子对中,相应的共现次数满足上述目标共现次数阈值的设备因子对,作为上述过滤后的设备因子对。
由于前述步骤已经得到了每个类别的设备因子与上述其他类别的设备因子之间所形成的设备因子对,在上述历史日志数据中的共现次数,则可以将共现次数满足目标共现次数阈值的设备因子对,直接作为过滤后的设备因子对。
本公开实施例中,由于目标共现关系是基于历史时间段内的历史日志数据构建的,目标共现次数阈值是由目标共现关系和设备因子的属性信息共同确定的,使用上述二者共同确定的目标共现次数阈值确定出异常设备因子对,并通过该设备因子对中过滤上述异常设备因子对,得到上述过滤后的设备因子对,不仅充分考虑到了设备因子的自身特性,又引入了动态时间窗口的概念,可以允许部分设备因子的合理跳变,且整个过程的自动化程度较高,从而提高异常设备因子对的确定准确率和效率,进而提高待识别设备的标识信息确定的准确率和效率以及待识别设备的识别准确率和效率。
在步骤S19中,对上述过滤后的设备因子对中的设备因子进行聚合,得到聚合后的设备因子。
在一个可选的实施例中,在上述步骤S19中,上述对上述过滤后的设备因子对中的设备因子进行聚合,得到聚合后的设备因子,可以包括:
基于连通图连接算法对上述过滤后的设备因子对中的设备因子进行聚合,得到上述聚合后的设备因子。
具体地,可以通过连通图连接算法对过滤后的设备因子对中的设备因子进行聚合,得到上述聚合后的设备因子。假设,过滤后的设备因子对为(IMEI、IMSI)和(AndroidID、IMEI),则可以通过连通图连接算法对(IMEI、IMSI)和(Android ID、IMEI)进行聚合,得到聚合后的设备因子(即IMEI、IMSI、Android ID)。
具体地,通过连通图连接算法对过滤后的设备因子对中的设备因子进行聚合的过程可以如下:
对过滤后的设备因子对中的设备因子进行聚合,生成连通图,该连通图由点和边组成。每个过滤后的设备因子对,对应于该连通图中连接该设备因子对中的两个设备因子的边。
在实际应用中,上述生成的连通图中可能存在错误的打通(即,错误的边),这种错误的打通存在的原因可能是由于存在异常的设备因子对所造成的。为了提高聚合精度,可以利用设备因子的属性信息、相对应的目标共现次数阈值等检测连通图中的异常边,并删除检测到的异常边,从而得到聚合后的设备因子。比如,可以作为置信可靠的边开始,采用贪心算法逐对连通,裁断掉那些破坏一定策略的设备因子对,从而保证聚合的准确性。
本公开实施例中通过基于连通图连接算法对过滤后的设备因子对中的设备因子进行聚合,不仅能够提高聚合效率,还能够提高聚合后的设备因子的确定准确率。
在步骤S111中,根据上述聚合后的设备因子确定上述待识别设备的标识信息。
在一个可选的实施例中,在上述步骤S111中,上述根据上述聚合后的设备因子确定上述待识别设备的标识信息,可以包括:
将上述聚合后的设备因子作为上述标识信息,上述标识信息用于唯一识别上述待识别设备。
本公开实施例中,可以直接将聚合后的设备因子作为唯一识别上述待识别设备的标识信息,即通过该聚合后的设备因子可以认定唯一的设备。
具体地,还可以通过上述算法生成一个唯一标识代表聚合后的设备因子。比如,生成一个64位的ID代表聚合后的设备因子。
假设聚合后的设备因子(即IMEI、IMSI、Android ID),则可以将IMEI、IMSI、Android ID作为该待识别设备的标识信息,并为该IMEI、IMSI、Android ID赋予一个唯一性标识,即通过IMEI、IMSI、Android ID认定唯一的待识别设备。
本公开实施例中,根据上述聚合后的设备因子确定上述待识别设备的标识信息,由于聚合后的设备因子是对过滤后的设备因子对中的设备因子进行聚合得到,而过滤后的设备因子对又通过目标共现关系和设备因子的属性信息确定的目标共现次数阈值,对设备因子对进行过滤得到的,由于目标共现关系是基于历史时间段内的历史日志数据构建的,目标共现次数阈值是由目标共现关系和设备因子的属性信息共同确定的,因此聚合后的设备因子不仅充分考虑到了设备因子的自身特性,又引入了动态时间窗口的概念,可以允许部分设备因子的合理跳变,提高聚合后的设备因子的确定准确率,从而提高待识别设备的标识信息确定的准确率以及待识别设备的识别准确率。
本公开实施例基于历史时间段内的历史日志数据,构建历史日志数据中的每个类别的设备因子与其他类别的设备因子之间的目标共现关系(该目标共现关系表征每个类别的设备因子与其他类别的设备因子之间所形成的设备因子对,在历史日志数据中的共现次数),并结合每个类别设备因子的属性信息,确定每个类别的设备因子的目标共现次数阈值,接着使用目标共现次数阈值对该设备因子对进行过滤,生成经过认可的过滤后的设备因子对,最后对该过滤后的设备因子对中的设备因子进行聚合,根据聚合后的设备因子确定待识别设备的标识信息。可见,本公开实施例所提供的技术方案既考虑到了设备因子的自身特性(即结合每个类别的设备因子的属性信息,确定目标共现次数阈值),又引入了动态时间窗口的概念(即使用历史时间段内的历史日志数据),可以允许部分设备因子的合理跳变,提高过滤后的设备因子对确定的准确率和效率,从而提高待识别设备的标识信息确定的准确率和效率,进而提高待识别设备的识别准确率和效率。在待识别设备的识别准确率和效率较高的情况下,可以优化推荐、广告等多种业务场景下的服务能力,更好地为视频推荐、广告投放等场景带来正向收益。且本公开实施例所提供的技术方案的可自动化实现,自动化程度较高,具备高效性和良好的解释性。
图7是根据一示例性实施例示出的一种设备标识信息确定装置框图。参照图7,该装置包括历史日志数据获取模块21,目标共现关系确定模块23,目标共现次数阈值确定模块25,过滤模块27,聚合模块29和标识信息确定模块211。
历史日志数据获取模块21,被配置为执行获取待识别设备在历史时间段内的历史日志数据,上述历史日志数据包括不同类别的多个设备因子,上述设备因子表征用于识别上述待识别设备的参数信息。
目标共现关系确定模块23,被配置为执行确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系,上述其他类别为上述不同类别中除上述每个类别之外的类别,上述目标共现关系表征上述每个类别的设备因子与上述其他类别的设备因子之间所形成的设备因子对,在上述历史日志数据中的共现次数。
目标共现次数阈值确定模块25,被配置为执行根据上述目标共现关系和上述每个类别的设备因子的属性信息,确定上述每个类别的设备因子的目标共现次数阈值。
过滤模块27,被配置为执行基于上述目标共现次数阈值对上述设备因子对进行过滤,得到过滤后的设备因子对。
聚合模块29,被配置为执行对上述过滤后的设备因子对中的设备因子进行聚合,得到聚合后的设备因子。
标识信息确定模块211,被配置为执行根据上述聚合后的设备因子确定上述待识别设备的标识信息。
在一示例性的实施方式中,上述目标共现次数阈值确定模块25,可以包括:
排序单元,被配置为执行将上述设备因子对按照相应的共现次数进行排序,得到上述每个类别的设备因子对应的设备因子对序列。
异常共现次数阈值确定单元,被配置为执行将上述设备因子对序列中排序第预设位的设备因子对所对应的共现次数,作为上述每个类别的设备因子对应的异常共现次数阈值;
调整单元,被配置为执行基于上述属性信息对上述异常共现次数阈值进行调整,得到上述目标共现次数阈值。
在一示例性的实施方式中,上述调整单元,可以包括:
设备因子确定子单元,被配置为执行基于上述属性信息,从上述多个设备因子中确定出预设数量个第一设备因子和预设数量个第二设备因子,上述第一设备因子表征设备识别准确性的波动数据小于预设阈值的设备因子,上述第二设备因子表征设备识别准确性的波动数据大于或等于上述预设阈值的设备因子。
共现次数调整阈值确定子单元,被配置为执行根据上述预设数量个第一设备因子的属性信息和对应的异常共现次数阈值,确定上述预设数量个第一设备因子对应的第一共现次数调整阈值,根据上述预设数量个第二设备因子的属性信息和对应的异常共现次数阈值,确定上述预设数量个第二设备因子对应的第二共现次数调整阈值。
第一调整子单元,被配置为执行基于上述第一共现次数调整阈值,对上述预设数量个第一设备因子的异常共现次数阈值进行调整,得到上述预设数量个第一设备因子的目标共现次数阈值。
第二调整子单元,被配置为执行基于上述第二共现次数调整阈值,对上述预设数量个第二设备因子的异常共现次数阈值进行调整,得到上述预设数量个第二设备因子的目标共现次数阈值。
在一示例性的实施方式中,上述历史日志数据的数量为多个,则上述目标共现关系确定模块23,可以包括:
设备因子获取单元,被配置为执行获取每个历史日志数据中所包含的不同类别的预设数量个设备因子。
初始共现关系确定单元,被配置为执行确定每个历史日志数据中的每个类别的设备因子,与每个历史日志数据中的其他类别的设备因子之间的初始共现关系。
目标共现关系确定单元,被配置为执行根据上述初始共现关系,确定上述目标共现关系。
在一示例性的实施方式中,上述过滤模块27,可以包括:
异常设备因子对确定单元,被配置为执行将上述设备因子对中,相应的共现次数不满足上述目标共现次数阈值的设备因子对,作为异常设备因子对。
过滤单元,被配置为执行从上述设备因子对中过滤上述异常设备因子对,得到上述过滤后的设备因子对。
在一示例性的实施方式中,上述过滤模块,被配置为执行将上述设备因子对中,相应的共现次数满足上述目标共现次数阈值的设备因子对,作为上述过滤后的设备因子对。
在一示例性的实施方式中,上述聚合模块29,被配置为执行基于连通图连接算法对上述过滤后的设备因子对中的设备因子进行聚合,得到上述聚合后的设备因子。
在一示例性的实施方式中,上述标识信息确定模块211,被配置为执行将上述聚合后的设备因子作为上述标识信息,上述标识信息用于唯一识别上述待识别设备。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
在示例性实施例中,还提供了一种电子设备,包括处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行存储器上所存放的指令时,实现上述实施例中任一设备标识信息确定方法的步骤。
该电子设备可以是终端、服务器或者类似的运算装置,以该电子设备是服务器为例,图8是根据一示例性实施例示出的一种用于设备标识信息确定的电子设备的框图,该电子设备30可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)31(中央处理器31可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器33,一个或一个以上存储应用程序323或数据322的存储介质32(例如一个或一个以上海量存储设备)。其中,存储器33和存储介质32可以是短暂存储或持久存储。存储在存储介质32的程序可以包括一个或一个以上模块,每个模块可以包括对电子设备中的一系列指令操作。更进一步地,中央处理器31可以设置为与存储介质32通信,在电子设备30上执行存储介质32中的一系列指令操作。电子设备30还可以包括一个或一个以上电源36,一个或一个以上有线或无线网络接口35,一个或一个以上输入输出接口34,和/或,一个或一个以上操作系统321,例如Windows ServerTM,Mac OS XTM,UnixTM, LinuxTM,FreeBSDTM等等。
输入输出接口34可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备30的通信供应商提供的无线网络。在一个实例中,输入输出接口34包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个示例性实施例中,输入输出接口34可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本领域普通技术人员可以理解,图8所示的结构仅为示意,其并不对上述电子设备的结构造成限定。例如,电子设备30还可包括比图8中所示更多或者更少的组件,或者具有与图8所示不同的配置。
在示例性实施例中,还提供了一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述实施例中任一设备标识信息确定方法的步骤。
在示例性实施例中,还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一种实施方式中提供的设备标识信息确定方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (17)

1.一种设备标识信息确定方法,其特征在于,包括:
获取待识别设备在历史时间段内的历史日志数据,所述历史日志数据包括不同类别的多个设备因子,所述设备因子表征用于识别所述待识别设备的参数信息;
确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系,所述其他类别为所述不同类别中除所述每个类别之外的类别,所述目标共现关系表征所述每个类别的设备因子与所述其他类别的设备因子之间所形成的设备因子对,在所述历史日志数据中的共现次数;
将所述设备因子对按照相应的共现次数进行排序,得到所述每个类别的设备因子对应的设备因子对序列;
将所述设备因子对序列中排序第预设位的设备因子对所对应的共现次数,作为所述每个类别的设备因子对应的异常共现次数阈值;
基于所述每个类别的设备因子的属性信息,对所述异常共现次数阈值进行调整,得到所述每个类别的设备因子的目标共现次数阈值;
基于所述目标共现次数阈值对所述设备因子对进行过滤,得到过滤后的设备因子对;
对所述过滤后的设备因子对中的设备因子进行聚合,得到聚合后的设备因子;
根据所述聚合后的设备因子确定所述待识别设备的标识信息。
2.根据权利要求1所述的设备标识信息确定方法,其特征在于,所述基于所述属性信息对所述异常共现次数阈值进行调整,得到所述目标共现次数阈值,包括:
基于所述属性信息,从所述多个设备因子中确定出预设数量个第一设备因子和预设数量个第二设备因子,所述第一设备因子表征设备识别准确性的波动数据小于预设阈值的设备因子,所述第二设备因子表征设备识别准确性的波动数据大于或等于所述预设阈值的设备因子;
根据所述预设数量个第一设备因子的属性信息和对应的异常共现次数阈值,确定所述预设数量个第一设备因子对应的第一共现次数调整阈值,根据所述预设数量个第二设备因子的属性信息和对应的异常共现次数阈值,确定所述预设数量个第二设备因子对应的第二共现次数调整阈值;
基于所述第一共现次数调整阈值,对所述预设数量个第一设备因子的异常共现次数阈值进行调整,得到所述预设数量个第一设备因子的目标共现次数阈值;
基于所述第二共现次数调整阈值,对所述预设数量个第二设备因子的异常共现次数阈值进行调整,得到所述预设数量个第二设备因子的目标共现次数阈值。
3.根据权利要求1所述的设备标识信息确定方法,其特征在于,所述历史日志数据的数量为多个,则所述确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系,包括:
获取每个历史日志数据中所包含的不同类别的预设数量个设备因子;
确定每个历史日志数据中的每个类别的设备因子,与每个历史日志数据中的其他类别的设备因子之间的初始共现关系;
根据所述初始共现关系,确定所述目标共现关系。
4.根据权利要求1至3中任一项所述的设备标识信息确定方法,其特征在于,所述基于所述目标共现次数阈值对所述设备因子对进行过滤,得到过滤后的设备因子对,包括:
将所述设备因子对中,相应的共现次数不满足所述目标共现次数阈值的设备因子对,作为异常设备因子对;
从所述设备因子对中过滤所述异常设备因子对,得到所述过滤后的设备因子对。
5.根据权利要求1至3中任一项所述的设备标识信息确定方法,其特征在于,所述基于所述目标共现次数阈值对所述设备因子对进行过滤,得到过滤后的设备因子对,包括:
将所述设备因子对中,相应的共现次数满足所述目标共现次数阈值的设备因子对,作为所述过滤后的设备因子对。
6.根据权利要求1至3中任一项所述的设备标识信息确定方法,其特征在于,所述对所述过滤后的设备因子对中的设备因子进行聚合,得到聚合后的设备因子,包括:
基于连通图连接算法对所述过滤后的设备因子对中的设备因子进行聚合,得到所述聚合后的设备因子。
7.根据权利要求1至3中任一项所述的设备标识信息确定方法,其特征在于,所述根据所述聚合后的设备因子确定所述待识别设备的标识信息,包括:
将所述聚合后的设备因子作为所述标识信息,所述标识信息用于唯一识别所述待识别设备。
8.一种设备标识信息确定装置,其特征在于,包括:
历史日志数据获取模块,被配置为执行获取待识别设备在历史时间段内的历史日志数据,所述历史日志数据包括不同类别的多个设备因子,所述设备因子表征用于识别所述待识别设备的参数信息;
目标共现关系确定模块,被配置为执行确定每个类别的设备因子与其他类别的设备因子之间的目标共现关系,所述其他类别为所述不同类别中除所述每个类别之外的类别,所述目标共现关系表征所述每个类别的设备因子与所述其他类别的设备因子之间所形成的设备因子对,在所述历史日志数据中的共现次数;
目标共现次数阈值确定模块,被配置为执行根据所述目标共现关系和所述每个类别的设备因子的属性信息,确定所述每个类别的设备因子的目标共现次数阈值;所述目标共现次数阈值确定模块包括:排序单元,被配置为执行将所述设备因子对按照相应的共现次数进行排序,得到所述每个类别的设备因子对应的设备因子对序列;异常共现次数阈值确定单元,被配置为执行将所述设备因子对序列中排序第预设位的设备因子对所对应的共现次数,作为所述每个类别的设备因子对应的异常共现次数阈值;调整单元,被配置为执行基于所述属性信息对所述异常共现次数阈值进行调整,得到所述目标共现次数阈值;
过滤模块,被配置为执行基于所述目标共现次数阈值对所述设备因子对进行过滤,得到过滤后的设备因子对;
聚合模块,被配置为执行对所述过滤后的设备因子对中的设备因子进行聚合,得到聚合后的设备因子;
标识信息确定模块,被配置为执行根据所述聚合后的设备因子确定所述待识别设备的标识信息。
9.根据权利要求8所述的设备标识信息确定装置,其特征在于,所述调整单元,包括:
设备因子确定子单元,被配置为执行基于所述属性信息,从所述多个设备因子中确定出预设数量个第一设备因子和预设数量个第二设备因子,所述第一设备因子表征设备识别准确性的波动数据小于预设阈值的设备因子,所述第二设备因子表征设备识别准确性的波动数据大于或等于所述预设阈值的设备因子;
共现次数调整阈值确定子单元,被配置为执行根据所述预设数量个第一设备因子的属性信息和对应的异常共现次数阈值,确定所述预设数量个第一设备因子对应的第一共现次数调整阈值,根据所述预设数量个第二设备因子的属性信息和对应的异常共现次数阈值,确定所述预设数量个第二设备因子对应的第二共现次数调整阈值;
第一调整子单元,被配置为执行基于所述第一共现次数调整阈值,对所述预设数量个第一设备因子的异常共现次数阈值进行调整,得到所述预设数量个第一设备因子的目标共现次数阈值;
第二调整子单元,被配置为执行基于所述第二共现次数调整阈值,对所述预设数量个第二设备因子的异常共现次数阈值进行调整,得到所述预设数量个第二设备因子的目标共现次数阈值。
10.根据权利要求8所述的设备标识信息确定装置,其特征在于,所述历史日志数据的数量为多个,则所述目标共现关系确定模块,包括:
设备因子获取单元,被配置为执行获取每个历史日志数据中所包含的不同类别的预设数量个设备因子;
初始共现关系确定单元,被配置为执行确定每个历史日志数据中的每个类别的设备因子,与每个历史日志数据中的其他类别的设备因子之间的初始共现关系;
目标共现关系确定单元,被配置为执行根据所述初始共现关系,确定所述目标共现关系。
11.根据权利要求8至10中任一项所述的设备标识信息确定装置,其特征在于,所述过滤模块,包括:
异常设备因子对确定单元,被配置为执行将所述设备因子对中,相应的共现次数不满足所述目标共现次数阈值的设备因子对,作为异常设备因子对;
过滤单元,被配置为执行从所述设备因子对中过滤所述异常设备因子对,得到所述过滤后的设备因子对。
12.根据权利要求8至10中任一项所述的设备标识信息确定装置,其特征在于,所述过滤模块,被配置为执行将所述设备因子对中,相应的共现次数满足所述目标共现次数阈值的设备因子对,作为所述过滤后的设备因子对。
13.根据权利要求8至10中任一项所述的设备标识信息确定装置,其特征在于,所述聚合模块,被配置为执行基于连通图连接算法对所述过滤后的设备因子对中的设备因子进行聚合,得到所述聚合后的设备因子。
14.根据权利要求8至10中任一项所述的设备标识信息确定装置,其特征在于,所述标识信息确定模块,被配置为执行将所述聚合后的设备因子作为所述标识信息,所述标识信息用于唯一识别所述待识别设备。
15.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的设备标识信息确定方法。
16.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1至7中任一项所述的设备标识信息确定方法。
17.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的设备标识信息确定方法。
CN202110762228.4A 2021-07-06 2021-07-06 设备标识信息确定方法、装置、电子设备及存储介质 Active CN113254318B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110762228.4A CN113254318B (zh) 2021-07-06 2021-07-06 设备标识信息确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110762228.4A CN113254318B (zh) 2021-07-06 2021-07-06 设备标识信息确定方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113254318A CN113254318A (zh) 2021-08-13
CN113254318B true CN113254318B (zh) 2021-10-22

Family

ID=77190864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110762228.4A Active CN113254318B (zh) 2021-07-06 2021-07-06 设备标识信息确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113254318B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107464132A (zh) * 2017-07-04 2017-12-12 北京三快在线科技有限公司 一种相似用户挖掘方法及装置,电子设备
CN108647730A (zh) * 2018-05-14 2018-10-12 中国科学院计算技术研究所 一种基于历史行为共现的数据划分方法及系统
CN110874465A (zh) * 2018-08-31 2020-03-10 浙江大学 基于半监督学习算法的移动设备实体识别方法及装置
CN110874387A (zh) * 2018-08-31 2020-03-10 浙江大学 移动设备识别符共现关系稀疏图的构建方法及装置
CN110895535A (zh) * 2018-09-12 2020-03-20 阿里巴巴集团控股有限公司 数据处理方法、装置及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140095320A1 (en) * 2012-05-10 2014-04-03 Drawbridge, Inc. System and Method for Determining Related Digital Identities

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107464132A (zh) * 2017-07-04 2017-12-12 北京三快在线科技有限公司 一种相似用户挖掘方法及装置,电子设备
CN108647730A (zh) * 2018-05-14 2018-10-12 中国科学院计算技术研究所 一种基于历史行为共现的数据划分方法及系统
CN110874465A (zh) * 2018-08-31 2020-03-10 浙江大学 基于半监督学习算法的移动设备实体识别方法及装置
CN110874387A (zh) * 2018-08-31 2020-03-10 浙江大学 移动设备识别符共现关系稀疏图的构建方法及装置
CN110895535A (zh) * 2018-09-12 2020-03-20 阿里巴巴集团控股有限公司 数据处理方法、装置及电子设备

Also Published As

Publication number Publication date
CN113254318A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
CN111031017B (zh) 一种异常业务账号识别方法、装置、服务器及存储介质
CN106874273B (zh) 渠道信息统计方法、装置和系统
CN106302104B (zh) 一种用户关系识别方法及装置
CN113412608B (zh) 内容推送方法、装置、服务端及存储介质
CN104796434A (zh) 一种消息推送方法及服务器
CN102930444A (zh) 一种移动终端及其应用分类管理方法和系统
CN106130972A (zh) 资源访问控制方法和装置
CN112351088A (zh) 一种cdn缓存方法、装置、计算机设备及存储介质
CN110967632A (zh) 一种确定故障电池的方法、装置、设备及存储介质
CN106878030B (zh) 一种计费方法和装置
CN113672894A (zh) 针对验证码请求的数据处理方法、装置、设备及存储介质
CN113556368A (zh) 用户识别方法、装置、服务器及存储介质
CN109408737B (zh) 用户推荐方法、装置和存储介质
CN113254318B (zh) 设备标识信息确定方法、装置、电子设备及存储介质
CN116028196A (zh) 数据处理方法、装置及存储介质
CN108804670A (zh) 数据推荐方法、装置、计算机设备和存储介质
CN106156210B (zh) 一种确定应用标识匹配列表的方法和装置
US20150205867A1 (en) Method and device for grouping contacts in social network
CN113467718B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN113037792B (zh) 一种业务识别参数的验证方法、装置及网关
CN114422576A (zh) 一种会话清理方法、装置、计算机设备和可读存储介质
CN111097175B (zh) 一种模拟器的确定方法、装置及存储介质
CN113688328A (zh) 匹配目标对象的方法、装置以及存储介质
WO2020258101A1 (zh) 用户相似度计算方法、装置、服务端及存储介质
CN113420236A (zh) 榜单数据展示方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant