CN106612338A - 设备标识信息的处理方法和装置 - Google Patents

设备标识信息的处理方法和装置 Download PDF

Info

Publication number
CN106612338A
CN106612338A CN201510695425.3A CN201510695425A CN106612338A CN 106612338 A CN106612338 A CN 106612338A CN 201510695425 A CN201510695425 A CN 201510695425A CN 106612338 A CN106612338 A CN 106612338A
Authority
CN
China
Prior art keywords
equipment
device identification
sample
coefficient
stabilization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510695425.3A
Other languages
English (en)
Inventor
李斌松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510695425.3A priority Critical patent/CN106612338A/zh
Publication of CN106612338A publication Critical patent/CN106612338A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/30Managing network names, e.g. use of aliases or nicknames

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种设备标识信息的处理方法和装置。其中,该处理方法包括:获取多个设备的设备数据构成的设备样本,其中,设备样本中记录有通过标识算法生成的每个设备的设备标识;获取设备样本中设备标识有误的错判设备的数据;基于错判设备的数据和设备样本中的设备总数确定标识算法的属性参数,其中,属性参数用于描述标识算法的准确率和稳定率;根据准确率和稳定率修正标识算法。通过本申请,解决了现有技术生成设备标识的准确度低的技术问题,提高了生成设备标识的准确率和稳定率。

Description

设备标识信息的处理方法和装置
技术领域
本申请涉及数据处理领域,具体而言,涉及一种设备标识信息的处理方法和装置。
背景技术
目前在电子商务平台出现欺诈、骗保、炒作、炒信和垃圾账号注册等安全事件越来越多。完成上述的安全事件的操作需要个人电脑(PC机)或者手机移动设备,为了跟踪用户的操作行为,可以通过采集执行操作的设备信息生成设备的唯一标识DeviceID,通过该DeviceID限制用户非法操作,以及事后违法行为定位和追踪,但是为了使DeviceID起到其该有的作用,需要生成的DeviceID的准确率和稳定率非常高。
其中,DeviceID是根据采集信息组合哈希(即Hash)生成的32位唯一字符串。为了保证每一个设备生成的DeviceID是唯一的,需要通过采集的设备信息区分采集的设备对象是否为相同设备,以避免同一个设备生成多个DeviceID;也要避免两个不同设备生成相同DeviceID。
现有手机的操作系统主要分为IOS(Internetworking Operating System-Cisco)和Andorid(安卓)两种,对于IOS和Andorid来说,在生成其DeviceID时通过采集到的设备的多个属性数据来确定其ID,而采集到的这些属性数据可能会变化,当同一个设备的部分数据属性发生变化时,基于同样算法生成的该设备的DeviceID可能不同,这样导致生成的设备标识的准确度低,从而无法基于设备标识准确跟踪用户操作行为。
针对现有技术生成设备标识的准确度低的问题,目前尚未提出有效的解决方案。
发明内容
根据本申请实施例的一个方面,提供了一种设备标识信息的处理方法,该处理方法包括:获取多个设备的设备数据构成的设备样本,其中,设备样本中记录有通过标识算法生成的每个设备的设备标识;获取设备样本中设备标识有误的错判设备的数据;基于错判设备的数据和设备样本中的设备总数确定标识算法的属性参数,其中,属性参数用于描述标识算法的准确率和稳定率;根据准确率和稳定率修正标识算法。
根据本申请实施例的另一方面,还提供了一种设备标识信息的处理装置,该处理装置包括:第一获取模块,用于获取多个设备的设备数据构成的设备样本,其中,设备样本中记录有通过标识算法生成的每个设备的设备标识;第二获取模块,用于获取设备样本中设备标识有误的错判设备的数据;确定模块,用于基于错判设备的数据和设备样本中的设备总数确定标识算法的属性参数,其中,属性参数用于描述标识算法的准确率和稳定率;修正模块,用于根据准确率和稳定率修正标识算法。
在本申请实施例中,在获取多个设备的设备数据构成的设备样本之后,获取该设备样本中设备标识有误的错判设备的数据,并基于该错判设备的数据和设备样本的设备总数确定标识算法的准确率和稳定率,并基于该准确率和稳定率修正标识算法,以提升该标识算法的准确率和稳定率。通过上述实施例,根据统计的设备标识有误的设备数据确定的准确率和稳定率修正标识算法,基于经过修正的标识算法生成设备标识能够更好地保证生成的设备标识的准确率和稳定性,进而解决了现有技术生成设备标识的准确度低的技术问题,提高了生成设备标识的准确率和稳定率,以基于设备标识准确跟踪用户操作行为。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种计算机终端的网络环境示意图;
图2是根据本申请实施例的一种设备标识信息的处理方法的流程图;
图3是根据本申请实施例的一种可选的设备标识信息的处理方法的流程图;
图4是根据本申请实施例的一种设备标识信息的处理装置的示意图;以及
图5是根据本申请实施例的一种终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本申请实施例,还提供了一种设备标识信息的处理方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。
可选地,在本实施例中,上述设备标识信息的处理方法可以应用于如图1所示的终端101和服务器103所构成的硬件网络环境中,如图1所示,终端101通过网络与服务器103进行连接,上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
在本申请实施例中,上述的终端可以为移动终端、个人电脑或服务器。
在上述运行环境下,本申请提供了如图2所示的一种设备标识信息的处理方法。
如图2所示,该设备标识信息的处理方法包括如下步骤:
步骤S202:获取多个设备的设备数据构成的设备样本,其中,设备样本中记录有通过标识算法生成的每个设备的设备标识。
步骤S204:获取设备样本中设备标识有误的错判设备的数据。
其中,设备标识有误的错判设备与设备样本中记录的设备标识不具有一一对应的关系,即对应多个设备标识的设备或对应同一个设备标识的多个设备均为错判设备。
步骤S206:基于错判设备的数据和设备样本中的设备总数确定标识算法的属性参数,其中,属性参数用于描述标识算法的准确率和稳定率。
步骤S208:根据准确率和稳定率修正标识算法。
采用本申请实施例,在获取多个设备的设备数据构成的设备样本之后,获取该设备样本中设备标识有误的错判设备的数据,并基于该错判设备的数据和设备样本的设备总数确定标识算法的准确率和稳定率,并基于该准确率和稳定率修正标识算法,以提升该标识算法的准确率和稳定率。通过上述实施例,根据统计的设备标识有误的设备数据确定的准确率和稳定率修正标识算法,基于经过修正的标识算法生成设备标识能够更好地保证生成的设备标识的准确率和稳定性,从而解决了现有技术生成设备标识的准确度低的问题,提高了生成设备标识的准确率和稳定率,以基于设备标识准确跟踪用户操作行为。
具体地,通过服务器获取多个设备的设备数据构成的设备样本,设备数据中记录有多个设备的设备记录,每个设备记录中保存有设备与设备标识的对应关系,该设备可以通过型号、用户账户或其他的设备属性来表示,其中的设备标识是基于标识算法生成的。在获取到设备样本之后,从中提取设备标识有误的错判设备,该错判设备可能对应多个设备标识,也可能多个错判设备对应同一个标识,统计这些错判设备的数据,并基于该错判设备的数据和获取的设备样本的设备总数来确定标识算法的准确率和稳定率,从而可以根据准确率和稳定率修正标识算法,以提高生成设备标识的准确率和稳定率,以保证生成的设备标识的准确度。
上述的设备可以包括个人电脑、移动终端(包括智能手机、平板电脑等)。
其中,设备标识可以用DeviceID表示,DeviceID为用于标识用户机器身份的唯一标识性的ID,是根据采集信息组合哈希(即Hash)生成的32位唯一字符串。
在本申请实施例中,获取多个设备的设备数据构成的设备样本包括:获取在至少两个时间段采集的设备记录;从设备记录中提取同一设备在至少两个时间段内均被采集到的设备数据,得到设备样本。可选地,每个时间段可以为一个月,至少两个时间段可以为两个月。
具体地,获取在至少两个时间段由服务器采集到的设备记录,并从设备记录中提取同一设备在至少两个时间段内均被采集到的设备数据,以获取多个设备的设备数据,设备数据可以包括设备型号、用户账户、设备与设备标识的对应关系及生成的设备标识以及其他的设备属性参数,由这些设备数据构成设备样本。
下面结合图3详述本申请实施例,该设备标识信息的处理方法包括如下步骤:
步骤S301:获取服务器在两个月内采集的设备记录。
步骤S302:从设备记录中提取同一设备在至少两个时间段内均被采集到的设备数据,得到设备样本。
具体地,在获取多个设备的设备数据构成的设备样本后,可以通过判断采集到的设备数据中的两个设备的设备型号和用户账号一致时,确定两个设备为同一设备。
步骤S303:获取设备样本中设备标识有误的错判设备的数据。
步骤S304:基于错判设备的数据和设备样本中的设备总数确定标识算法的准确率和稳定率。
步骤S305:根据准确率和稳定率修正标识算法。
步骤S303至步骤S305的实现方式与上述实施例中的步骤S204至步骤S208的实现方式一致,在此不再赘述。
可选地,假设一个用户同一机型代表唯一设备,在不考虑用户换机型的情况下,为了准确反映设备标识的准确率和稳定率,在获取服务器两个月采集的设备记录之后,从设备记录中提取同一设备在这两个月都被采集到设备数据,得到多个设备的设备数据,由这些设备数据构成设备样本,然后获取设备样本中的错判设备的数据,并通过错判设备的数据和设备样本中的设备总数确定设备标识的准确率和稳定率,以记忆该准确率和稳定率修正标识算法。
通过上述实施例,通过服务器采集并获取多个设备的设备数据,由这些设备数据构成设备样本,从而实现了由多个设备的设备数据构成设备样本,并将构成的设备样本作为设备标识统计分析的样本数据。
在本申请实施例中,获取设备样本中设备标识有误的错判设备的数据包括:若设备样本中同一设备具有至少两个不同的设备标识,则确认同一设备为设备标识有误的误判设备,统计误判设备的数量;若设备样本中同一设备标识对应至少两个不同的设备,则确认至少两个不同的设备为设备标识有误的漏判设备,统计漏判设备的数量,其中,错判设备包括误判设备和漏判设备,错判设备的数据包括漏判设备的数量和误判设备的数量。
具体地,设备标识有误的错判设备与设备样本中记录的设备标识不具有一一对应的关系,即对应多个设备标识的设备或对应同一个设备标识的多个设备均为错判设备。若设备样本中同一设备具有至少两个不同的设备标识,则确认同一设备为设备标识有误的误判设备;若设备样本中同一设备标识对应至少两个不同的设备,则确认至少两个不同的设备为设备标识有误的漏判设备,通过统计误判设备数量和漏判设备数量,即得到设备样本中设备标识有误的错判设备的数据,从而通过错判设备的数据和设备样本中的设备总数确定设备标识的准确率和稳定率。
可选地,设备标识可以用DeviceID表示。获取设备样本中设备标识有误的错判设备的数据,即获取同一个设备生成多个DeviceID的设备数据,同一个设备为设备标识有误的误判设备,并获取两个不同设备生成相同DeviceID的设备数据,两个不同的设备为设备标识有误的漏判设备。
通过上述实施例,获取设备样本中设备标识有误的误判设备数量和漏判设备数量,为确定标识算法的准确率和稳定率提供数据依据。
在本申请实施例中,设备数据中还记录有设备的设备型号和使用设备型号登录终端设备的应用账户的账户名称,其中,在确认同一设备为设备标识有误的误判设备之前,该处理方法还包括:若两个设备的设备型号和对应的账户名称一致,则判定两个设备为同一设备;在确认至少两个不同的设备为设备标识有误的漏判设备之前,该处理方法还包括:若两个设备的设备型号或对应的账户名称不一致,则判定两个设备为不同的设备。
具体地,基于设备的设备型号和使用设备型号登录终端设备的应用账户的账户名称判断两个设备是否为同一设备,若两个设备的设备型号和对应的账户名称一致,则判定两个设备为同一设备;若两个设备的设备型号或对应的账户名称不一致,则判定两个设备为不同的设备。
可选地,设备型号可以用model表示,使用设备型号登录终端设备的应用账户的账户名称可以通过用户nick表示。通过设备型号model和用户nick判断两个设备是否为同一设备,若两个设备的设备型号model和用户nick一致,则判定两个设备为同一设备;若两个设备的设备型号model或用户nick不一致,则判定两个设备为不同设备。
通过上述实施例,基于设备的设备型号和使用设备型号登录终端设备的应用账户的账户名称判断两个设备是否为同一设备之后,获取设备样本中设备标识有误的错判设备的数据,并基于错判设备的数据确定标识算法的准确率和稳定率。
在本申请实施例中,基于错判设备的数据和设备样本中的设备总数确定标识算法的属性参数包括:获取设备样本中的设备总数与漏判设备的数量的第一差值,将第一差值与设备总数的比值作为标识算法的准确率;获取设备样本中的设备总数与误判设备的数量的第二差值,将第二差值与设备总数的比值作为标识算法的稳定率。
可选地,可以通过如下公式获取标识算法的准确率Pa和稳定率Ps,其中,公式包括:Pa=(Na-Nfn)/Na,其中,Na表示设备样本中的设备总数,Nfn表示漏判设备的数量;以及Ps=(Na-Nfp)/Na,其中,Nfp表示误判设备的数量。
具体地,基于错判设备的数据和设备样本中的设备总数确定标识算法的属性参数,属性参数用于描述标识算法的准确率和稳定率,其中,
Na:表示设备样本中的设备总数,即聚类中心中的实际的设备总数;
Nfp:表示误判设备的数量,即同一设备对应多个设备标识(DeviceID)(falsepositive);
Nfn:表示漏判设备的数量,即不同设备对应一个设备标识(DeviceID)(falsenegative);
Pa(准确率):Pa=(Na-Nfn)/Na;
Ps(稳定率):Ps=(Na-Nfp)/Na。
通过上述实施例,获取设备样本中设备标识有误的错判设备的数据,即误判设备的数量和漏判设备的数量,从而通过上述实施例确定标识算法的准确率和稳定率,并基于得到的标识算法的准确率和稳定率判断是否需要修正该标识算法。
在本申请实施例中,统计误判设备的数量包括:统计同一设备对应的至少两个设备标识的标识数量与同一设备的数量的差值,得到误判设备的数量;统计漏判设备的数量包括:统计对应至少两个不同的设备的设备标识的标识数量与至少两个不同的设备的数量的差值,得到漏判设备的数量。
具体地,获取在至少两个时间段由服务器采集到的设备记录,并从设备记录中提取同一设备在至少两个时间段内均被采集到的设备数据,通过统计同一设备对应的至少两个设备标识的标识数量DWC和同一设备的数量DWS,获取误判设备的数量Nfp=DWS-DWC;通过统计对应至少两个不同的设备的设备标识的标识数量UZC和至少两个不同的设备的数量UZS,获取漏判设备的数量Nfn=UZC-UZS,即得到设备样本中设备标识有误的错判设备的数据,从而通过错判设备的数据和设备样本中的设备总数确定设备标识的准确率和稳定率。
可选地,获取同一个设备在至少两个时间段内都被采集到的设备记录,即总设备量数据(deivce count)。
UZC:表示同一设备标识(DeviceID)对应至少两个不同的设备的设备标识的标识数量(count);
UZS:表示同一设备标识(DeviceID)对应至少两个不同的设备的数量(sum);
DWC:表示同一个设备对应的至少两个设备标识(DeviceID)的标识数量(count);
DWS:表示同一个设备对应的至少两个设备标识(DeviceID)的设备的数量(sum);
统计计算公式:
DeviceID稳定率:(DC-(DWS-DWC))/DC,其中,误判设备的数量Nfp=DWS-DWC;
DeviceID准确率:(DC-(UZC-UZS))/DC,其中,漏判设备的数量Nfn=UZC-UZS。
通过上述实施例,通过统计同一设备在至少两个时间段内均被采集到的设备数据,获取误判设备的数量和漏判设备的数量,即得到设备样本中设备标识有误的错判设备的数据,从而通过统计计算公式得到设备标识的准确率和稳定率,该错判设备的数据也为确定标识算法的准确率和稳定率提供数据依据。
在本申请实施例中,根据准确率和稳定率修正标识算法包括:判断准确率是否大于等于第一预设阈值、且稳定率是否大于等于第二预设阈值;若准确率小于第一预设阈值、或稳定率小于第二预设阈值,则修正标识算法,直至准确率大于等于第一预设阈值且稳定率大于等于第二预设阈值。
具体地,基于获取的设备样本中设备标识有误的错误设备的数据与设备样本的设备总数确定标识算法的准确率和稳定率,并基于得到的标识算法的准确率和稳定率判断是否修正标识算法。若准确率小于第一预设阈值、或稳定率小于第二预设阈值,则修正标识算法,直至准确率大于等于第一预设阈值且稳定率大于等于第二预设阈值。
通过上述实施例,基于得到的标识算法的准确率和稳定率,与业务应用场景对准确率和稳定率的要求进行对比,如果不满足要求,则需要不断修正标识算法,以满足不同业务场景对准确率和稳定率的要求。
在本申请实施例中,修正标识算法包括:修正判断模型中各个属性参数的权重,得到修正后的判断模型。在得到修正后的判断模型之后,该处理方法还包括:使用修正后的判断模型判断是否存在与待生成设备标识的第一设备相同的第二设备,其中,第二设备已经具有设备标识;若不存在与第一设备相同的第二设备,则生成第一设备的设备标识。
可选地,设备标识用DeviceID表示,DeviceID是根据采集信息组合哈希(即Hash)生成的32位唯一字符串,为了保证每一个设备生成的DeviceID是唯一的,需要通过采集的设备数据区分是否为相同设备,避免同一个设备生成多个DeviceID,也要避免两个不同设备生成相同DeviceID,而判断设备是否相同采用打分模型,当两个设备的两条记录通过打分模型达到一定分值,则判断为相同设备。
具体地,对参与打分的采集属性参数进行归一化处理,使得每个属性参数的属性值在[0,1]范围内,归一化处理后的每个属性参数用ai表示,每个属性参数的权重系数用ki表示,其中,i为自然数。
Android和IOS(Internetworking Operating System-Cisco)的判断模型(即打分模型)如下:
1、Android判断相同设备需要达到3.2分以上,参与打分的采集属性参数为:AdroidID、Serail、Imei、Wifi、Utdid、Uuid、Imis、Sim、Resolution、Model。
其中,adroidID:归一化处理后的该参数用a1表示,其权重系数用k1表示;
Serail:序列号/串行接口,归一化处理后的该参数用a2表示,其权重系数为用k2表示;
Imei:移动设备国际身份码(International Mobile Equipment Identity),归一化处理后的该参数用a3表示,其权重系数用k3表示;
Wifi:无线保真(Wireless Fidelity),归一化处理后的该参数用a4表示,其权重系数用k4表示;
Utdid:归一化处理后的该参数用a5表示,其权重系数用k5表示;
Uuid:通用唯一识别码(Universally Unique Identifier),归一化处理后的该参数用a6表示,其权重系数用k6表示;
Imis:综合管理信息系统(Integrated Management Information System),归一化处理后的该参数用a7表示,其权重系数用k7表示;
Sim:用户标识卡,归一化处理后的该参数用a8表示,其权重系数用k8表示;
Resolution:分辨率,归一化处理后的该参数用a9表示,其权重系数用k9表示;
Model:设备型号,归一化处理后的该参数用a10表示,其权重系数用k10表示;
在基于设备的属性信息确定该设备的操作系统为Android的情况下,打分模型的分值K=k1a1+k2a2+…+k10a10,当分值达到3.2分以上,则判断两个设备为相同设备。
2、IOS判断相同设备需要达到1.2分以上,参与打分的采集属性参数为:AdvertisingID、Vendorid、Wifi、Utdid、Uuid、Resolution、Model。
其中,advertisingID:广告标识,归一化处理后的该参数用a11表示,其权重系数用k11表示;
Vendorid:供应商识别号,归一化处理后的该参数用a12表示,其权重系数用k12表示;
其他参数在上述实施例中已经给出,对应相同参数的归一化处理后的参数表示和权重系数表示相同,在此不重复列出。
在基于设备的属性信息确定该设备的操作系统为IOS的情况下,打分模型的分值K=k11a11+k12a12+k9a9+k10a10+k4a4+k5a5+k6a6,当分值达到1.2分以上,则判断两个设备为相同设备。
具体地,在得到标识算法的准确率和稳定率之后,若准确率小于第一预设阈值、或稳定率小于第二预设阈值,则需要修正标识算法,通过修正判断模型中各个属性参数得到修正后的判断模型,其中,上述实施例中的打分模型即为判断模型。在得到修正后的判断模型后,基于修正后的判断模型判断待生成设备标识的设备与已经具有设备标识的设备的设备标识是否相同,如果不相同,则生成待生成设备标识的设备的设备标识。
通过上述实施例,在上述打分模型中属性参数的唯一性不同,每一个属性参数的权重不同,通过修正打分模型中各个属性参数的权重,合理设置判断设备相同分值标准和设备不同属性参数的权重,从而提升设备标识的准确率和稳定率。
下面以淘宝交易平台为例详细介绍本申请实施例:
用户可以通过移动终端(如iphone手机)在淘宝交易平台上进行虚拟资源交换操作,在服务器采集两个月的虚拟资源交换的用户操作行为的数据,并使用标识算法计算所有产生用户操作行为的设备的设备标识得到设备记录,使用设备标识信息的处理方法的终端从服务器获取设备记录,并从设备记录中提取同一设备在这两个月都被采集到的设备数据,将其作为设备样本,其中,若两个设备的设备型号model和用户nick一致,则判定两个设备为同一设备。在获取到设备样本之后,从中提取并统计设备标识有误的误判设备数量和漏判设备数量,并基于误判设备数量和漏判设备数量确定标识算法的准确率和稳定率,若准确率小于第一预设阈值(如90%),或稳定率小于第二预设阈值(92%),则修正标识算法,直至准确率大于等于第一预设阈值且稳定率大于等于第二预设阈值时,以提高标识算法的准确率和稳定率。
具体地,修正标识算法可以通过修正打分模型来实现,通过修正打分模型中的属性权重得到修正后的打分模型,该修正后的打分模型可以更加准确地判断是否已经基于该待生成标识的设备生成过设备标识,在生成设备标识时漏判和误判设备减少,从而可以根据稳定率和准确率高的设备标识准确跟踪用户操作行为。
其中,上述的第一预设阈值和第二预设阈值基于该设备标识的处理方法的应用场景来确定,不同的应用场景可以对应不同的第一预设阈值和第二预设阈值。
采用本申请实施例,通过获取在至少两个时间段由服务器采集到的设备记录,并从设备记录中提取同一设备在至少两个时间段内均被采集到的设备数据,从而获取多个设备的设备数据,由这些设备数据构成设备样本,设备样本中记录有通过标识算法生成的每个设备的设备标识,获取设备标识有误的误判设备的数量和漏判设备的数量,基于通过统计的设备样本中的设备标识有误的设备数据确定标识算法的准确率和稳定率,并基于该准确率和稳定率修正标识算法,以提升该标识算法的准确率和稳定率。
通过上述实施例,根据统计的设备标识有误的错判设备数据确定准确率和稳定率,以修正标识算法,基于经过修正的标识算法能够更好地保证生成的设备标识的准确率和稳定性,从而解决了现有技术生成设备标识的准确度低的问题,提高了生成设备标识的准确率和稳定率,以基于设备标识准确跟踪用户操作行为。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例2
根据本申请实施例,还提供了一种设备标识信息的处理装置,如图4所示,该装置包括:第一获取模块20、第二获取模块40、确定模块60以及修正模块80。
其中,第一获取模块20,用于获取多个设备的设备数据构成的设备样本,其中,设备样本中记录有通过标识算法生成的每个设备的设备标识。
第二获取模块40,用于获取设备样本中设备标识有误的错判设备的数据。
确定模块60,用于基于错判设备的数据和设备样本中的设备总数确定标识算法的属性参数,其中,属性参数用于描述标识算法的准确率和稳定率。
修正模块80,用于根据准确率和稳定率修正标识算法。
采用本申请实施例,第一获取模块获取多个设备的设备数据构成的设备样本,第二获取模块获取该设备样本中设备标识有误的错判设备的数据,确定模块基于第二获取模块获取的错判设备的数据和设备样本的设备总数确定标识算法的准确率和稳定率,并基于修正模块修正标识算法,以提升该标识算法的准确率和稳定率。通过上述实施例,根据统计的设备标识有误的设备数据确定的准确率和稳定率修正标识算法,基于经过修正的标识算法生成设备标识能够更好地保证生成的设备标识的准确率和稳定性,从而解决了现有技术生成设备标识的准确度低的问题,提高了生成设备标识的准确率和稳定率,以基于设备标识准确跟踪用户操作行为。
具体地,通过服务器获取多个设备的设备数据构成的设备样本,设备数据中记录有多个设备的设备记录,每个设备记录中保存有设备与设备标识的对应关系,该设备可以通过型号、用户账户或其他的设备属性来表示,其中的设备标识是基于标识算法生成的。在获取到设备样本之后,从中提取设备标识有误的错判设备,该错判设备可能对应多个设备标识,也可能多个错判设备对应同一个标识,统计这些错判设备的数据,并基于该错判设备的数据和获取的设备样本的设备总数来确定标识算法的准确率和稳定率,从而可以根据准确率和稳定率修正标识算法,以提高生成设备标识的准确率和稳定率,以保证生成的设备标识的准确度。
上述的设备可以为个人电脑、移动终端(包括智能手机、平板电脑等)。
其中,设备标识可以用DeviceID表示,DeviceID为用于标识用户机器身份的唯一标识性的ID,是根据采集信息组合哈希(即Hash)生成的32位唯一字符串。
在本申请的上述实施例中,第一获取模块包括:获取子模块和提取子模块。其中,获取子模块,用于获取在至少两个时间段采集的设备记录;提取子模块,用于从设备记录中提取同一设备在至少两个时间段内均被采集到的设备数据,得到设备样本。可选地,每个时间段可以为一个月,至少两个时间段可以为两个月。
具体地,获取子模块获取在至少两个时间段由服务器采集到的设备记录,提取子模块从设备记录中提取同一设备在至少两个时间段内均被采集到的设备数据,以获取多个设备的设备数据,设备数据可以包括设备型号、用户账户、设备与设备标识的对应关系及生成的设备标识以及其他的设备属性参数,由这些设备数据构成设备样本。
可选地,假设一个用户同一机型代表唯一设备,在不考虑用户换机型的情况下,为了准确反映设备标识的准确率和稳定率,在获取服务器两个月采集的设备记录之后,从设备记录中提取同一设备在这两个月都被采集到设备数据,得到多个设备的设备数据,由这些设备数据构成设备样本,然后获取设备样本中的错判设备的数据,并通过错判设备的数据和设备样本中的设备总数确定设备标识的准确率和稳定率,以记忆该准确率和稳定率修正标识算法。
通过上述实施例,通过服务器采集并获取多个设备的设备数据,由这些设备数据构成设备样本,从而实现了由多个设备的设备数据构成设备样本,并将构成的设备样本作为设备标识统计分析的样本数据。
在本申请的上述实施例中,第二获取模块包括:第一处理子模块和第二处理子模块。其中,第一处理子模块,用于若设备样本中同一设备具有至少两个不同的设备标识,则确认同一设备为设备标识有误的误判设备,统计误判设备的数量;第二处理子模块,用于若设备样本中同一设备标识对应至少两个不同的设备,则确认至少两个不同的设备为设备标识有误的漏判设备,统计漏判设备的数量,其中,错判设备包括误判设备和漏判设备,错判设备的数据包括漏判设备的数量和误判设备的数量。
具体地,设备标识有误的错判设备与设备样本中记录的设备标识不具有一一对应的关系,即对应多个设备标识的设备或对应同一个设备标识的多个设备均为错判设备。若设备样本中同一设备具有至少两个不同的设备标识,则第一处理子模块确认同一设备为设备标识有误的误判设备;若设备样本中同一设备标识对应至少两个不同的设备,则第二处理子模块确认至少两个不同的设备为设备标识有误的漏判设备,第一处理子模块统计误判设备的数量,第二处理子模块统计漏判设备数量,即得到设备样本中设备标识有误的错判设备的数据,从而通过错判设备的数据和设备样本中的设备总数确定设备标识的准确率和稳定率。
通过上述实施例,获取设备样本中设备标识有误的误判设备数量和漏判设备数量,为确定标识算法的准确率和稳定率提供数据依据。
在本申请的上述实施例中,处理装置还包括:第一判定模块和第二判定模块,其中,第一判定模块,用于在确认同一设备为设备标识有误的误判设备之前,若两个设备的设备型号和对应的账户名称一致,则判定两个设备为同一设备;第二判定模块,用于在确认至少两个不同的设备为设备标识有误的漏判设备之前,若两个设备的设备型号或对应的账户名称不一致,则判定两个设备为不同的设备,其中,设备数据中还记录有设备的设备型号和使用设备型号登录终端设备的应用账户的账户名称。
具体地,基于设备的设备型号和使用设备型号登录终端设备的应用账户的账户名称判断两个设备是否为同一设备,若两个设备的设备型号和对应的账户名称一致,则第一判定模块判定两个设备为同一设备;若两个设备的设备型号或对应的账户名称不一致,则第二判定模块判定两个设备为不同的设备。
通过上述实施例,基于设备的设备型号和使用设备型号登录终端设备的应用账户的账户名称判断两个设备是否为同一设备之后,获取设备样本中设备标识有误的错判设备的数据,并基于错判设备的数据确定标识算法的准确率和稳定率。
在本申请的上述实施例中,确定模块包括:第一确定子模块和第二确定子模块。其中,第一确定子模块,用于获取设备样本中的设备总数与漏判设备的数量的第一差值,将第一差值与设备总数的比值作为标识算法的准确率;第二确定子模块,用于获取设备样本中的设备总数与误判设备的数量的第二差值,将第二差值与设备总数的比值作为标识算法的稳定率。
具体地,确定模块确定标识算法的属性参数,属性参数用于描述标识算法的准确率和稳定率,第一确定子模块通过获取设备样本中的设备总数与漏判设备的数量的第一差值,将第一差值与设备总数的比值作为标识算法的准确率;第二确定子模块通过获取设备样本中的设备总数与误判设备的数量的第二差值,将第二差值与设备总数的比值作为标识算法的稳定率。
通过上述实施例,获取设备样本中设备标识有误的错判设备的数据,即误判设备的数量和漏判设备的数量,从而通过上述实施例确定标识算法的准确率和稳定率,并基于得到的标识算法的准确率和稳定率判断是否需要修正该标识算法。
在本申请的上述实施例中,第一处理子模块包括:第一统计子模块,用于统计同一设备对应的至少两个设备标识的标识数量与同一设备的数量的差值,得到误判设备的数量;第二处理子模块包括:第二统计子模块,用于统计对应至少两个不同的设备的设备标识的标识数量与至少两个不同的设备的数量的差值,得到漏判设备的数量。
具体地,获取子模块获取在至少两个时间段由服务器采集到的设备记录,提取子模块从设备记录中提取同一设备在至少两个时间段内均被采集到的设备数据,通过第一统计子模块统计同一设备对应的至少两个设备标识的标识数量和同一设备的数量,获取误判设备的数量;通过第二统计子模块统计对应至少两个不同的设备的设备标识的标识数量和至少两个不同的设备的数量,获取漏判设备的数量,即得到设备样本中设备标识有误的错判设备的数据,从而确定模块通过错判设备的数据和设备样本中的设备总数确定设备标识的准确率和稳定率。
通过上述实施例,通过统计同一设备在至少两个时间段内均被采集到的设备数据,获取误判设备的数量和漏判设备的数量,即得到设备样本中设备标识有误的错判设备的数据,从而通过统计计算公式得到设备标识的准确率和稳定率,该错判设备的数据也为确定标识算法的准确率和稳定率提供数据依据。
在本申请的上述实施例中,修正模块包括:第一判断子模块和修正子模块。其中,第一判断子模块,用于判断准确率是否大于等于第一预设阈值、且稳定率是否大于等于第二预设阈值;修正子模块,用于若准确率小于第一预设阈值、或稳定率小于第二预设阈值,则修正标识算法,直至准确率大于等于第一预设阈值且稳定率大于等于第二预设阈值。
具体地,确定模块确定标识算法的准确率和稳定率,在得到标识算法的准确率和稳定率之后,基于该准确率和稳定率判断是否修正标识算法。若准确率小于第一预设阈值,或稳定率小于第二预设阈值,则修正标识算法,直至准确率大于等于第一预设阈值且稳定率大于等于第二预设阈值。
通过上述实施例,基于得到的标识算法的准确率和稳定率,与业务应用场景对准确率的第一预设阈值和稳定率的第二预设阈值的要求进行对比,如果不满足要求,则需要不断修正标识算法,以满足不同业务场景对准确率和稳定率的要求。
在本申请的上述实施例中,修正子模块包括:修正权重子模块,用于修正判断模型中各个属性参数的权重,得到修正后的判断模型。处理装置还包括:第二判断子模块,用于在得到修正后的判断模型之后,使用修正后的判断模型判断是否存在与待生成设备标识的第一设备相同的第二设备,其中,第二设备已经具有设备标识;生成子模块,用于若不存在与第一设备相同的第二设备,则生成第一设备的设备标识。
具体地,在得到标识算法的准确率和稳定率之后,若准确率小于第一预设阈值,或稳定率小于第二预设阈值,则修正标识算法,修正权重子模块修正判断模型中各个属性参数得到修正后的判断模型,在得到修正后的判断模型后,基于修正后的判断模型,第二判断子模块判断待生成设备标识的设备与已经具有设备标识的设备的设备标识是否相同,如果不相同,则生成模块生成待生成设备标识的设备的设备标识。
通过上述实施例,修正标识算法可以通过修正打分模型来实现,打分模型中属性参数的唯一性不同,每一个属性参数的权重不同,通过修正打分模型中各个属性参数的权重,合理设置判断设备相同分值标准和设备不同属性参数的权重,从而提升设备标识的准确率和稳定率。
下面以淘宝交易平台为例详细介绍本申请实施例:
用户可以通过移动终端(如iphone手机)在淘宝交易平台上进行虚拟资源交换操作,在服务器采集两个月的虚拟资源交换的用户操作行为的数据,并使用标识算法计算所有产生用户操作行为的设备的设备标识得到设备记录,使用设备标识信息的处理方法的终端从服务器获取设备记录,并从设备记录中提取同一设备在这两个月都被采集到的设备数据,将其作为设备样本,其中,若两个设备的设备型号model和用户nick一致,则判定两个设备为同一设备。在获取到设备样本之后,从中提取并统计设备标识有误的误判设备数量和漏判设备数量,并基于误判设备数量和漏判设备数量确定标识算法的准确率和稳定率,若准确率小于第一预设阈值(如90%),或稳定率小于第二预设阈值(92%),则修正标识算法,直至准确率大于等于第一预设阈值且稳定率大于等于第二预设阈值时,以提高标识算法的准确率和稳定率。
具体地,修正标识算法可以通过修正打分模型来实现,通过修正打分模型中的属性权重得到修正后的打分模型,该修正后的打分模型可以更加准确地判断是否已经基于该待生成标识的设备生成过设备标识,在生成设备标识时漏判和误判设备减少,从而可以根据稳定率和准确率高的设备标识准确跟踪用户操作行为。
其中,上述的第一预设阈值和第二预设阈值基于该设备标识的处理方法的应用场景来确定,不同的应用场景可以对应不同的第一预设阈值和第二预设阈值。
采用本申请实施例,获取子模块获取在至少两个时间段由服务器采集到的设备记录,提取子模块从设备记录中提取同一设备在至少两个时间段内均被采集到的设备数据,从而获取多个设备的设备数据,由这些设备数据构成设备样本,设备样本中记录有通过标识算法生成的每个设备的设备标识,在获取到设备样本后,第二获取模块获取设备标识有误的误判设备的数量和漏判设备的数量,基于通过统计的设备样本中的设备标识有误的设备数据,确定模块确定标识算法的准确率和稳定率,并基于该准确率和稳定率,通过修正模块修正标识算法,以提升该标识算法的准确率和稳定率。
通过上述实施例,根据统计的设备标识有误的错判设备数据确定准确率和稳定率,以修正标识算法,基于经过修正的标识算法能够更好地保证生成的设备标识的准确率和稳定性,从而解决了现有技术生成设备标识的准确度低的问题,提高了生成设备标识的准确率和稳定率,以基于设备标识准确跟踪用户操作行为。
实施例3
本申请的实施例还提供了一种终端或服务器,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述终端可以执行设备标识信息的处理方法,上述实施例中的设备标识信息的处理装置可以设置在该终端或服务器上。
如图5所示,该服务器或终端包括:一个或多个(图中仅示出一个)处理器201、存储器203、以及传输装置205(如上述实施例中的发送装置),如图5所示,该终端还可以包括输入输出设备207。
其中,存储器203可用于存储软件程序以及模块,如本申请实施例中的设备标识信息的处理方法和装置对应的程序指令/模块,处理器201通过运行存储在存储器203内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的设备标识信息的处理方法。存储器203可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器203可进一步包括相对于处理器201远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置205用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置205包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置205为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器203用于存储应用程序。
处理器201可以通过传输装置205调用存储器203存储的应用程序,以执行下述步骤:获取多个设备的设备数据构成的设备样本,其中,设备样本中记录有通过标识算法生成的每个设备的设备标识;获取设备样本中设备标识有误的错判设备的数据;基于错判设备的数据和设备样本中的设备总数确定标识算法的属性参数,其中,属性参数用于描述标识算法的准确率和稳定率;根据准确率和稳定率修正标识算法。
处理器201还用于执行下述步骤:若设备样本中同一设备具有至少两个不同的设备标识,则确认同一设备为设备标识有误的误判设备,统计误判设备的数量;若设备样本中同一设备标识对应至少两个不同的设备,则确认至少两个不同的设备为设备标识有误的漏判设备,统计漏判设备的数量,其中,错判设备包括误判设备和漏判设备,错判设备的数据包括漏判设备的数量和误判设备的数量。
处理器201还用于执行下述步骤:在确认同一设备为设备标识有误的误判设备之前,若两个设备的设备型号和对应的账户名称一致,则判定两个设备为同一设备;在确认至少两个不同的设备为设备标识有误的漏判设备之前,该处理方法还包括:若两个设备的设备型号或对应的账户名称不一致,则判定两个设备为不同的设备,其中,设备数据中还记录有设备的设备型号和使用设备型号登录终端设备的应用账户的账户名称。
处理器201还用于执行下述步骤:获取设备样本中的设备总数与漏判设备的数量的第一差值,将第一差值与设备总数的比值作为标识算法的准确率;获取设备样本中的设备总数与误判设备的数量的第二差值,将第二差值与设备总数的比值作为标识算法的稳定率。
处理器201还用于执行下述步骤:统计误判设备的数量包括:统计同一设备对应的至少两个设备标识的标识数量与同一设备的数量的差值,得到误判设备的数量;统计漏判设备的数量包括:统计对应至少两个不同的设备的设备标识的标识数量与至少两个不同的设备的数量的差值,得到漏判设备的数量。
采用本申请实施例,在获取多个设备的设备数据构成的设备样本之后,获取该设备样本中设备标识有误的错判设备的数据,并基于该错判设备的数据和设备样本的设备总数确定标识算法的准确率和稳定率,并基于该准确率和稳定率修正标识算法,以提升该标识算法的准确率和稳定率。通过上述实施例,根据统计的设备标识有误的设备数据确定的准确率和稳定率修正标识算法,基于经过修正的标识算法生成设备标识能够更好地保证生成的设备标识的准确率和稳定性,从而解决了现有技术生成设备标识的准确度低的问题,提高了生成设备标识的准确率和稳定率,以基于设备标识准确跟踪用户操作行为。
具体地,通过服务器获取多个设备的设备数据构成的设备样本,设备数据中记录有多个设备的设备记录,每个设备记录中保存有设备与设备标识的对应关系,该设备可以通过型号、用户账户或其他的设备属性来表示,其中的设备标识是基于标识算法生成的。在获取到设备样本之后,从中提取设备标识有误的错判设备,该错判设备可能对应多个设备标识,也可能多个错判设备对应同一个标识,统计这些错判设备的数据,并基于该错判设备的数据和获取的设备样本的设备总数来确定标识算法的准确率和稳定率,从而可以根据准确率和稳定率修正标识算法,以提高生成设备标识的准确率和稳定率,以保证生成的设备标识的准确度。
上述的设备可以为个人电脑、移动终端(包括智能手机、平板电脑等)。
其中,设备标识可以用DeviceID表示,DeviceID为用于标识用户机器身份的唯一标识性的ID,是根据采集信息组合哈希(即Hash)生成的32位唯一字符串。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
需要进一步说明的是,寄存区域为系统的内存和系统处理器中的寄存器。
本领域普通技术人员可以理解,图5所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图5其并不对上述电子装置的结构造成限定。例如,终端还可包括比图5中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图5所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
实施例4
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例所提供的设备标识信息的处理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
获取多个设备的设备数据构成的设备样本,其中,设备样本中记录有通过标识算法生成的每个设备的设备标识;获取设备样本中设备标识有误的错判设备的数据;基于错判设备的数据和设备样本中的设备总数确定标识算法的属性参数,其中,属性参数用于描述标识算法的准确率和稳定率;根据准确率和稳定率修正标识算法。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:若设备样本中同一设备具有至少两个不同的设备标识,则确认同一设备为设备标识有误的误判设备,统计误判设备的数量;若设备样本中同一设备标识对应至少两个不同的设备,则确认至少两个不同的设备为设备标识有误的漏判设备,统计漏判设备的数量,其中,错判设备包括误判设备和漏判设备,错判设备的数据包括漏判设备的数量和误判设备的数量。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:若两个设备的设备型号和对应的账户名称一致,则判定两个设备为同一设备;在确认至少两个不同的设备为设备标识有误的漏判设备之前,该处理方法还包括:若两个设备的设备型号或对应的账户名称不一致,则判定两个设备为不同的设备,其中,设备数据中还记录有设备的设备型号和使用设备型号登录终端设备的应用账户的账户名称。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取设备样本中的设备总数与漏判设备的数量的第一差值,将第一差值与设备总数的比值作为标识算法的准确率;获取设备样本中的设备总数与误判设备的数量的第二差值,将第二差值与设备总数的比值作为标识算法的稳定率。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:统计误判设备的数量包括:统计同一设备对应的至少两个设备标识的标识数量与同一设备的数量的差值,得到误判设备的数量;统计漏判设备的数量包括:统计对应至少两个不同的设备的设备标识的标识数量与至少两个不同的设备的数量的差值,得到漏判设备的数量。
采用本申请实施例,在获取多个设备的设备数据构成的设备样本之后,获取该设备样本中设备标识有误的错判设备的数据,并基于该错判设备的数据和设备样本的设备总数确定标识算法的准确率和稳定率,并基于该准确率和稳定率修正标识算法,以提升该标识算法的准确率和稳定率。通过上述实施例,根据统计的设备标识有误的设备数据确定的准确率和稳定率修正标识算法,基于经过修正的标识算法生成设备标识能够更好地保证生成的设备标识的准确率和稳定性,从而解决了现有技术生成设备标识的准确度低的问题,提高了生成设备标识的准确率和稳定率,以基于设备标识准确跟踪用户操作行为。
具体地,通过服务器获取多个设备的设备数据构成的设备样本,设备数据中记录有多个设备的设备记录,每个设备记录中保存有设备与设备标识的对应关系,该设备可以通过型号、用户账户或其他的设备属性来表示,其中的设备标识是基于标识算法生成的。在获取到设备样本之后,从中提取设备标识有误的错判设备,该错判设备可能对应多个设备标识,也可能多个错判设备对应同一个标识,统计这些错判设备的数据,并基于该错判设备的数据和获取的设备样本的设备总数来确定标识算法的准确率和稳定率,从而可以根据准确率和稳定率修正标识算法,以提高生成设备标识的准确率和稳定率,以保证生成的设备标识的准确度。
上述的设备可以为个人电脑、移动终端(包括智能手机、平板电脑等)。
其中,设备标识可以用DeviceID表示,DeviceID为用于标识用户机器身份的唯一标识性的ID,是根据采集信息组合哈希(即Hash)生成的32位唯一字符串。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (16)

1.一种设备标识信息的处理方法,其特征在于,包括:
获取多个设备的设备数据构成的设备样本,其中,所述设备样本中记录有通过标识算法生成的每个设备的设备标识;
获取所述设备样本中所述设备标识有误的错判设备的数据;
基于所述错判设备的数据和所述设备样本中的设备总数确定所述标识算法的属性参数,其中,所述属性参数用于描述所述标识算法的准确率和稳定率;
根据所述准确率和所述稳定率修正所述标识算法。
2.根据权利要求1所述的处理方法,其特征在于,获取所述设备样本中所述设备标识有误的错判设备的数据包括:
若所述设备样本中同一设备具有至少两个不同的设备标识,则确认所述同一设备为所述设备标识有误的误判设备,统计所述误判设备的数量;
若所述设备样本中同一设备标识对应至少两个不同的设备,则确认所述至少两个不同的设备为所述设备标识有误的漏判设备,统计所述漏判设备的数量,
其中,所述错判设备包括所述误判设备和所述漏判设备,所述错判设备的数据包括所述漏判设备的数量和所述误判设备的数量。
3.根据权利要求2所述的处理方法,其特征在于,所述设备数据中还记录有设备的设备型号和使用所述设备型号登录终端设备的应用账户的账户名称,其中,
在确认所述同一设备为所述设备标识有误的误判设备之前,所述处理方法还包括:若两个设备的所述设备型号和对应的所述账户名称一致,则判定两个设备为所述同一设备;
在确认所述至少两个不同的设备为所述设备标识有误的漏判设备之前,所述处理方法还包括:若两个设备的所述设备型号或对应的所述账户名称不一致,则判定两个设备为所述不同的设备。
4.根据权利要求2所述的处理方法,其特征在于,基于所述错判设备的数据和所述设备样本中的设备总数确定所述标识算法的属性参数包括:
获取所述设备样本中的设备总数与所述漏判设备的数量的第一差值,将所述第一差值与所述设备总数的比值作为所述标识算法的准确率;
获取所述设备样本中的设备总数与所述误判设备的数量的第二差值,将所述第二差值与所述设备总数的比值作为所述标识算法的稳定率。
5.根据权利要求2所述的处理方法,其特征在于,
统计所述误判设备的数量包括:统计所述同一设备对应的至少两个所述设备标识的标识数量与所述同一设备的数量的差值,得到所述误判设备的数量;
统计所述漏判设备的数量包括:统计对应所述至少两个不同的设备的所述设备标识的标识数量与所述至少两个不同的设备的数量的差值,得到所述漏判设备的数量。
6.根据权利要求1所述的处理方法,其特征在于,获取多个设备的设备数据构成的设备样本包括:
获取在至少两个时间段采集的设备记录;
从所述设备记录中提取同一设备在所述至少两个时间段内均被采集到的所述设备数据,得到所述设备样本。
7.根据权利要求1所述的处理方法,其特征在于,根据所述准确率和所述稳定率修正所述标识算法包括:
判断所述准确率是否大于等于第一预设阈值、且所述稳定率是否大于等于第二预设阈值;
若所述准确率小于所述第一预设阈值、或所述稳定率小于所述第二预设阈值,则修正所述标识算法,直至所述准确率大于等于所述第一预设阈值且所述稳定率大于等于所述第二预设阈值。
8.根据权利要求7所述的处理方法,其特征在于,
修正所述标识算法包括:修正判断模型中各个属性参数的权重,得到修正后的判断模型;
在得到修正后的判断模型之后,所述处理方法还包括:
使用所述修正后的判断模型判断是否存在与待生成设备标识的第一设备相同的第二设备,其中,所述第二设备已经具有所述设备标识;
若不存在与所述第一设备相同的所述第二设备,则生成所述第一设备的设备标识。
9.一种设备标识信息的处理装置,其特征在于,包括:
第一获取模块,用于获取多个设备的设备数据构成的设备样本,其中,所述设备样本中记录有通过标识算法生成的每个设备的设备标识;
第二获取模块,用于获取所述设备样本中所述设备标识有误的错判设备的数据;
确定模块,用于基于所述错判设备的数据和所述设备样本中的设备总数确定所述标识算法的属性参数,其中,所述属性参数用于描述所述标识算法的准确率和稳定率;
修正模块,用于根据所述准确率和所述稳定率修正所述标识算法。
10.根据权利要求9所述的处理装置,其特征在于,所述第二获取模块包括:
第一处理子模块,用于若所述设备样本中同一设备具有至少两个不同的设备标识,则确认所述同一设备为所述设备标识有误的误判设备,统计所述误判设备的数量;
第二处理子模块,用于若所述设备样本中同一设备标识对应至少两个不同的设备,则确认所述至少两个不同的设备为所述设备标识有误的漏判设备,统计所述漏判设备的数量,
其中,所述错判设备包括所述误判设备和所述漏判设备,所述错判设备的数据包括所述漏判设备的数量和所述误判设备的数量。
11.根据权利要求10所述的处理装置,其特征在于,所述处理装置还包括:
第一判定模块,用于在确认所述同一设备为所述设备标识有误的误判设备之前,若两个设备的设备型号和对应的账户名称一致,则判定两个设备为所述同一设备;
第二判定模块,用于在确认所述至少两个不同的设备为所述设备标识有误的漏判设备之前,若两个设备的所述设备型号或对应的所述账户名称不一致,则判定两个设备为所述不同的设备,
其中,所述设备数据中还记录有设备的设备型号和使用所述设备型号登录终端设备的应用账户的账户名称。
12.根据权利要求10所述的处理装置,其特征在于,所述确定模块包括:
第一确定子模块,用于获取所述设备样本中的设备总数与所述漏判设备的数量的第一差值,将所述第一差值与所述设备总数的比值作为所述标识算法的准确率;
第二确定子模块,用于获取所述设备样本中的设备总数与所述误判设备的数量的第二差值,将所述第二差值与所述设备总数的比值作为所述标识算法的稳定率。
13.根据权利要求10所述的处理装置,其特征在于,
所述第一处理子模块包括:第一统计子模块,用于统计所述同一设备对应的至少两个所述设备标识的标识数量与所述同一设备的数量的差值,得到所述误判设备的数量;
所述第二处理子模块包括:第二统计子模块,用于统计对应所述至少两个不同的设备的所述设备标识的标识数量与所述至少两个不同的设备的数量的差值,得到所述漏判设备的数量。
14.根据权利要求9所述的处理装置,其特征在于,所述第一获取模块包括:
获取子模块,用于获取在至少两个时间段采集的设备记录;
提取子模块,用于从所述设备记录中提取同一设备在所述至少两个时间段内均被采集到的所述设备数据,得到所述设备样本。
15.根据权利要求9所述的处理装置,其特征在于,所述修正模块包括:
第一判断子模块,用于判断所述准确率是否大于等于第一预设阈值、且所述稳定率是否大于等于第二预设阈值;
修正子模块,用于若所述准确率小于所述第一预设阈值、或所述稳定率小于所述第二预设阈值,则修正所述标识算法,直至所述准确率大于等于所述第一预设阈值且所述稳定率大于等于所述第二预设阈值。
16.根据权利要求15所述的处理装置,其特征在于,
所述修正子模块包括:修正权重子模块,用于修正判断模型中各个属性参数的权重,得到修正后的判断模型;
所述处理装置还包括:
第二判断子模块,用于在得到修正后的判断模型之后,使用所述修正后的判断模型判断是否存在与待生成设备标识的第一设备相同的第二设备,其中,所述第二设备已经具有所述设备标识;
生成子模块,用于若不存在与所述第一设备相同的所述第二设备,则生成所述第一设备的设备标识。
CN201510695425.3A 2015-10-22 2015-10-22 设备标识信息的处理方法和装置 Pending CN106612338A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510695425.3A CN106612338A (zh) 2015-10-22 2015-10-22 设备标识信息的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510695425.3A CN106612338A (zh) 2015-10-22 2015-10-22 设备标识信息的处理方法和装置

Publications (1)

Publication Number Publication Date
CN106612338A true CN106612338A (zh) 2017-05-03

Family

ID=58613205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510695425.3A Pending CN106612338A (zh) 2015-10-22 2015-10-22 设备标识信息的处理方法和装置

Country Status (1)

Country Link
CN (1) CN106612338A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804908A (zh) * 2017-05-04 2018-11-13 腾讯科技(深圳)有限公司 一种设备指纹生成方法、装置及计算设备
CN112330845A (zh) * 2019-07-19 2021-02-05 珠海汇金科技股份有限公司 接入相同设备的处理方法、装置及设备
RU2750642C2 (ru) * 2019-11-27 2021-06-30 Акционерное общество "Лаборатория Касперского" Система и способ регистрации уникального идентификатора мобильного устройства
CN116226115A (zh) * 2023-05-10 2023-06-06 江西飞尚科技有限公司 一种智慧环保扬尘设备监测数据处理方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804908A (zh) * 2017-05-04 2018-11-13 腾讯科技(深圳)有限公司 一种设备指纹生成方法、装置及计算设备
CN112330845A (zh) * 2019-07-19 2021-02-05 珠海汇金科技股份有限公司 接入相同设备的处理方法、装置及设备
RU2750642C2 (ru) * 2019-11-27 2021-06-30 Акционерное общество "Лаборатория Касперского" Система и способ регистрации уникального идентификатора мобильного устройства
CN116226115A (zh) * 2023-05-10 2023-06-06 江西飞尚科技有限公司 一种智慧环保扬尘设备监测数据处理方法及系统
CN116226115B (zh) * 2023-05-10 2023-08-22 江西飞尚科技有限公司 一种智慧环保扬尘设备监测数据处理方法及系统

Similar Documents

Publication Publication Date Title
CN109034660A (zh) 基于预测模型的风险控制策略的确定方法及相关装置
CN107644279A (zh) 评价模型的建模方法及装置
CN109784934A (zh) 一种交易风险控制方法、装置以及相关设备和介质
CN106612338A (zh) 设备标识信息的处理方法和装置
CN107767259A (zh) 贷款风险控制方法、电子装置及可读存储介质
CN107871278A (zh) 服务器、客户关系网络展示的方法及存储介质
CN107688987A (zh) 电子装置、保险推荐方法、及计算机可读存储介质
CN109509087A (zh) 智能化的贷款审核方法、装置、设备及介质
CN105210089A (zh) 生产模拟
CN108985048A (zh) 模拟器识别方法及相关装置
CN113379530A (zh) 用户风险的确定方法、装置和服务器
CN110457601A (zh) 社交账号的识别方法和装置、存储介质及电子装置
CN106257507A (zh) 用户行为的风险评估方法及装置
CN112910953B (zh) 业务数据的推送方法、装置和服务器
CN108066990A (zh) 一种从候选用户列表中选择用户的方法、装置及服务器
CN111784360B (zh) 一种基于网络链接回溯的反欺诈预测方法及系统
CN107945034A (zh) 基于微博财经事件的金融分析方法、应用服务器及计算机可读存储介质
CN106682014A (zh) 游戏展示数据的生成方法和装置
CN108805725A (zh) 风险事件确认方法、服务器及计算机可读存储介质
CN108848501B (zh) 号码的管理方法、装置及服务器
CN104484357B (zh) 数据处理方法及装置和访问频次信息处理方法及装置
CN106407212A (zh) 一种网络账户的类别确定方法、对象聚类方法及装置
CN116302889A (zh) 功能模块的性能测试方法、装置和服务器
CN115967523A (zh) 一种黑产用户识别方法及装置
CN109711984A (zh) 一种基于催收的贷前风险监控方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170503

RJ01 Rejection of invention patent application after publication