CN108596271A - 指纹构建算法的评估方法、装置、存储介质及终端 - Google Patents

指纹构建算法的评估方法、装置、存储介质及终端 Download PDF

Info

Publication number
CN108596271A
CN108596271A CN201810435801.9A CN201810435801A CN108596271A CN 108596271 A CN108596271 A CN 108596271A CN 201810435801 A CN201810435801 A CN 201810435801A CN 108596271 A CN108596271 A CN 108596271A
Authority
CN
China
Prior art keywords
equipment
fingerprint
cluster
developing algorithm
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810435801.9A
Other languages
English (en)
Other versions
CN108596271B (zh
Inventor
于洋
马宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201810435801.9A priority Critical patent/CN108596271B/zh
Publication of CN108596271A publication Critical patent/CN108596271A/zh
Application granted granted Critical
Publication of CN108596271B publication Critical patent/CN108596271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明提供了一种指纹构建算法的评估方法,包括:获取记录样本集,所述记录样本集中包括多个设备记录样本和多个伪造记录样本,每一个记录样本包括若干种设备特征对应的一个字段信息;将所述记录样本集输入至待评估的指纹构建算法,生成设备指纹,以及将第一聚类标签或第二聚类标签添加至所述设备记录样本和伪造记录样本的字段信息中;根据所述设备记录样本的个数和设备指纹的个数计算所述指纹构建算法的误差;若所述误差小于或等于预设误差阈值时,统计并输出每一种设备特征对应的包括第一聚类标签的字段信息个数和包括第二聚类标签的字段信息个数。本发明解决了解决现有技术对指纹构建算法的分析及评估力度不足、精度校验效果欠佳的问题。

Description

指纹构建算法的评估方法、装置、存储介质及终端
技术领域
本发明属于通信技术领域,尤其涉及一种指纹构建算法的评估方法、装置、存储介质及终端。
背景技术
设备指纹是指可以用于唯一标识出设备的设备特征或者独特的设备标识。设备指纹应当是固有的、较难篡改的、唯一的设备标识。目前主要使用单一的设备特征来标识设备,比如设备的硬件ID、移动终端的IME编号、网卡的MAC地址等。这些设备指纹的组成要素单一,被篡改的可能性较高。
基于多设备特征的设备指纹相对于单一设备特征的设备指纹的质量较高。然而现有的基于多设备特征的设备指纹构建算法的精度较低,满足不了对大批量设备数据的验证及分析要求。在构建设备指纹时,主要通过埋点的方式获取多个设备特征,由于设备特征的类别和取值较多,分析及评估力度不足,对指纹构建算法的精度校验及优化存在较大的困难。
发明内容
本发明实施例提供了一种指纹构建算法的评估方法、装置、存储介质及终端,以解决目前指纹构建算法的分析及评估力度不足、精度校验效果欠佳的问题。
本发明实施例提供了一种指纹构建算法的评估方法,所述评估方法包括:
获取记录样本集,所述记录样本集中包括多个设备记录样本和多个伪造记录样本,每一个设备记录样本或伪造记录样本包括若干种设备特征对应的一个字段信息;
将所述记录样本集输入至待评估的指纹构建算法,通过所述指纹构建算法生成设备指纹,以及将第一聚类标签添加至经过指纹构建算法聚类后唯一的字段信息中,将第二聚类标签添加至经过指纹构建算法聚类后不唯一的字段信息中;
根据所述设备记录样本的个数和指纹构建算法所生成的设备指纹的个数计算所述指纹构建算法的误差;
若所述误差小于或等于预设误差阈值时,统计并输出经过所述指纹构建算法后每一种设备特征对应的包括第一聚类标签的字段信息个数和包括第二聚类标签的字段信息个数。
进一步地,所述指纹构建算法的误差计算公式为:
E=abs(N-M)/M
在上式中,E表示指纹构建算法的误差,abs()表示绝对值运算,M表示设备记录样本的个数,N表示所述指纹构建算法所生成的设备指纹的个数。
进一步地,所述将所述记录样本集输入至待评估的指纹构建算法,通过所述指纹构建算法生成设备指纹,以及将第一聚类标签添加至经过指纹构建算法聚类后唯一的字段信息中,将第二聚类标签添加至经过指纹构建算法聚类后不唯一的字段信息中包括:
针对每一种设备特征,获取所述记录样本集中该种设备特征对应的字段信息,对所述字段信息进行聚类分析;
获取所述设备特征在聚类分析后得到的簇,遍历每一个簇,获取该簇中的每一个字段信息与所述簇的聚类中心之间的相似性度量值;若所述相似性度量值在相似性阈值范围内时,在所述设备记录样本或伪造记录样本中保留该字段信息,并将预设的第一聚类标签添加至所述字段信息;否则,将所述设备记录样本或伪造记录样本中的所述字段信息替换为聚类中心,并将预设的第二标聚类签添加至替换后的字段信息中;
针对每一种设备特征,根据该种设备特征在聚类分析得到的簇的个数,计算该种设备特征对应的聚类误差;
获取所述聚类误差中的最大值对应的设备特征,并从所述设备记录样本和伪造记录样本中剔除该设备特征对应的字段信息,得到过滤后的记录样本集;
根据所述过滤后的记录样本集进行聚类分析,得到至少一个组别的记录样本;
遍历每一个组别,根据该组别内的记录样本生成对应的一个设备指纹。
进一步地,所述聚类误差的计算公式为:
ei=abs(Ni-M)
在上式中,ei表示第i种设备特征的聚类误差,abs()表示绝对值运算,Ni表示第i种设备特征在聚类分析后得到的簇的个数,M表示设备记录样本的个数。
进一步地,所述评估方法还包括:
若所述误差大于预设误差阈值时,从过滤后的记录样本集中获取聚类误差最大值对应的设备特征;
从所述过滤后的记录样本集中的设备记录样本和伪造记录样本中剔除该设备特征对应的字段信息,得到再次过滤后的记录样本集;
根据所述再次过滤后的记录样本集进行聚类分析,生成设备指纹,以执行下一次误差评估。
进一步地,所述获取记录样本集包括:
获取预设的多个设备记录样本;
基于预设模拟器对所述多个设备记录样本进行改动,得到多个伪造记录样本。
本发明实施例还提供了一种指纹构建算法的评估装置,所述评估装置包括:
样本获取模块,用于获取记录样本集,所述记录样本集中包括多个设备记录样本和多个伪造记录样本,每一个设备记录样本或伪造记录样本包括若干种设备特征对应的一个字段信息;
校验模块,用于将所述记录样本集输入至待评估的指纹构建算法,通过所述指纹构建算法生成设备指纹,以及将第一聚类标签添加至经过指纹构建算法聚类后唯一的字段信息中,将第二聚类标签添加至经过指纹构建算法聚类后不唯一的字段信息中;
误差计算模块,用于根据所述设备记录样本的个数和指纹构建算法所生成的设备指纹的个数计算所述指纹构建算法的误差;
评估模块,用于若所述误差小于或等于预设误差阈值时,统计并输出经过所述指纹构建算法后每一种设备特征对应的包括第一聚类标签的字段信息个数和包括第二聚类标签的字段信息个数。
进一步地,所述指纹构建算法的误差计算公式为:
E=abs(N-M)/M
在上式中,E表示指纹构建算法的误差,abs()表示绝对值运算,M表示设备记录样本的个数,N表示所述指纹构建算法所生成的设备指纹的个数。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序由处理器执行时实现如上所述的指纹构建算法的评估方法所述的步骤。
本发明实施例还提供了一种终端,所述终端包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的指纹构建算法的评估方法所述的步骤。
本发明实施例通过获取记录样本集,所述记录样本集中包括多个设备记录样本和多个伪造记录样本,每一个设备记录样本或伪造记录样本包括若干种设备特征对应的一个字段信息;然后将所述记录样本集输入至待评估的指纹构建算法,通过所述指纹构建算法生成设备指纹,以及将第一聚类标签或第二聚类标签添加至所述设备记录样本和伪造记录样本的字段信息中,以将原始数据转化为带有聚类特征的数据,用以评估各个设备特征的数据质量;接着根据所述设备记录样本的个数和指纹构建算法所生成的设备指纹的个数计算所述指纹构建算法的误差;若所述误差小于或等于预设误差阈值时,统计并输出经过所述指纹构建算法后每一种设备特征对应的包括第一聚类标签的字段信息个数和包括第二聚类标签的字段信息个数,用以辅助开发人员筛选高质量的设备特征,有利于进一步优化指纹构建算法的稳定性,从而解决了目前对指纹构建算法的分析及评估力度不足、精度校验效果欠佳的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1是本发明实施例提供的指纹构建算法的评估方法的第一实现流程图;
图2是本发明实施例提供的指纹构建算法的评估方法的第二实现流程图;
图3是本发明实施例提供的指纹构建算法的评估方法的第三实现流程图;
图4是本发明实施例提供的指纹构建算法的评估装置的组成结构图;
图5是本发明实施例提供的终端的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了本发明实施例提供的指纹构建算法的评估方法的第一实现流程。本发明实施例提供的所述指纹构建算法的评估方法应用于终端,包括但不限于计算机、服务器。所述指纹是指可用于标识、区分不同设备的设备指纹。参阅图1,所述评估方法包括:
在步骤S101中,获取记录样本集,所述记录样本集中包括多个设备记录样本和多个伪造记录样本。
在本发明实施例中,设备记录为针对每一个设备采集到的设备信息,所述设备记录样本为用于校验指纹构建算法精度的设备记录,是真实的设备信息。所述伪造记录样本是包括虚假的设备信息的设备记录。
其中,每一个设备记录样本或伪造记录样本均包括若干种设备特征对应的一个字段信息。设备记录样本包括哪几种设备特征,伪造记录样本则包括哪几种设备特征。示例性地,假设存在五种设备特征,分别为设备特征A、设备特征B、设备特征C、设备特征D、设备特征E,每一个设备记录样本或伪造记录样本均包括上述设备特征A、设备特征B、设备特征C、设备特征D、设备特征E对应的字段信息,比如设备记录样本1(A1、B1、C1、D1、E1)、设备记录样本2(A2、B2、C2、D2、E2)、设备记录样本3(A3、B3、C3、D3、E3)……,以及伪造记录样本1(A2、B1、C1、D1、E1)、伪造记录样本2(A1、B1、C1、D1、E2)、伪造记录样本3(A1、B2、C1、D1、E1)……。上述A1、A2、A3……均表示设备特征A对应的字段信息,B1、B2、B3……均表示设备特征B对应的字段信息,C1、C2、C3……均表示设备特征C对应的字段信息,D1、D2、D3……均表示设备特征D对应的字段信息,E1、E2、E3……均表示设备特征E对应的字段信息。
可选地,所述设备特征可以从设备基础信息维度、位置信息维度、网络信息维度、系统信息维度以及APP信息维度上获取,包括但不限于IP地址(Internet ProtocolAddress)、ID信息(deveice id)、mac地址(Media Access Control或者Medium AccessControl)、移动设备国际识别码imei(International Mobile Equipment Identity,又称为国际移动设备标识)、国际移动用户识别码imsi(International Mobile SubscriberIdentification Number)、设备号、GPS(Global Positioning System,全球定位系统)地址、热点信息、运营商、APP版本号,以及ios系统信息维度中的广告标示符IDFA(identifierFor Identifier)、Vindor标示符IDFV(identifier For Vendor)、唯一识别码UDID(UniqueDevice Identifier)。所述设备记录样本或伪造记录样本可以为上述设备特征的任意组合。
可选地,所述伪造记录样本可以是根据真实的设备记录篡改其中的一个或多个设备特征得到的设备记录。作为本发明的一个优选示例,所述伪造记录样本可以是基于所述设备记录样本篡改得到的设备记录,所述步骤S101还可以包括:
获取预设的多个设备记录样本;
基于预设模拟器对所述多个设备记录样本进行改动,得到多个伪造记录样本。
在这里,所述预设模拟器包括一个或多个,不同的模拟器改动的设备特征不尽相同,有些模拟器主要改动网络环境、位置信息,比如GPS、mac地址;有些模拟器主要改动设备基础信息,比如imei、Android版本号。
在步骤S102中,将所述记录样本集输入至待评估的指纹构建算法,通过所述指纹构建算法生成设备指纹,以及将第一聚类标签添加至经过指纹构建算法聚类后唯一的字段信息中,将第二聚类标签添加至经过指纹构建算法聚类后不唯一的字段信息中。
在本发明实施例中,所述指纹构建算法通过对输入的若干条记录样本中的各种设备特征进行聚类分析,然后对所述若干条记录样本进行聚类分析,从中挖掘出相同或相似的记录样本来构建出设备指纹。
本发明实施例将获取的记录样本集,即所述设备记录样本和伪造记录样本,输入至待评估的指纹构建算法,通过所述设备指纹构建算法对输入的所述设备记录样本和伪造记录样本进行聚类分析,基于作为影响因素的伪造记录样本下挖掘出相同或相似的设备记录,并在输出层输出所构建的设备指纹,以实现对指纹构建算法的校验。
进一步地,本发明实施例通过在所述指纹构建算法中嵌入打标签的步骤来实现对算法的评估。具体地,在对所述设备记录样本和伪造记录样本中的各种设备特征进行聚类分析的过程中,根据每种设备特征在聚类分析后得到的簇,对所述设备记录样本和伪造记录样本中该种设备特征对应的字段信息打上聚类标签,以将原始数据转化为带有聚类特征的数据,用于评估各个设备特征的数据质量。其中,所述聚类标签包括第一聚类标签和第二聚类标签,所述第一聚类标签表示设备记录样本和伪造记录样本中的字段信息在聚类后是唯一的、不变的,所述第二聚类标签表示字段信息在聚类后是不唯一、变化的。
在步骤S103中,根据所述设备记录样本的个数和指纹构建算法所生成的设备指纹的个数计算所述指纹构建算法的误差。
如前所述,本发明实施例中的待评估的指纹构建算法是通过对输入的若干条记录样本中的设备特征进行聚类分析,然后对所述若干条记录样本进行聚类分析,从中挖掘出相同或相似的设备记录来构建出设备指纹。对于指纹构建算法的输出结果,本发明实施例基于输入数据与输出数据来计算所述指纹构建算法的误差,从而得到所述设备指纹构建算法的精度,且提升了对指纹构建算法的精度校验效果。其中,所述指纹构建算法的误差计算公式可以为:
E=abs(N-M)/M
在上式中,E表示指纹构建算法的误差,abs()表示绝对值运算,M表示设备记录样本的个数,N表示所述指纹构建算法所生成的设备指纹的个数。
在步骤S104中,若所述误差小于或等于预设误差阈值时,统计并输出经过所述指纹构建算法后每一种设备特征对应的包括第一聚类标签的字段信息个数和包括第二聚类标签的字段信息个数。
由上述误差计算公式可以得到,指纹构建算法的误差通过指纹构建算法所生成的设备指纹的个数与输入的设备记录样本的个数之间的差异的绝对值表示。本发明实施例预先设置了可接受的误差阈值。在步骤S103得到所述指纹构建算法的误差后,将所述误差与所述误差阈值比对,判断所述误差是否满足该误差阈值。若所述误差小于或等于预设误差阈值时,表明基于所述指纹构建算法在对记录样本集分析后构建的设备指纹基本覆盖输入的设备记录样本,则遍历每一种设备特征,统计经过所述指纹构建算法后该种设备特征中包括第一聚类标签的字段信息个数和包括第二聚类标签的字段信息个数,并输出所述个数。
所述包括第一聚类标签的字段信息个数和包括第二聚类标签的字段信息个数可以用于辅助开发人员筛选高质量的设备特征,从而实现了对指纹构建算法的深度分析及评估,以及辅助开发人员根据保留下来的设备特征优化用于设备特征聚类分析的算法,提高计算效率及速度,从而实现了对指纹构建算法的优化,有效地解决了现有技术对指纹构建算法的分析及评估力度不足、精度校验效果欠佳的问题,有利于进一步优化指纹构建算法的稳定性。
进一步地,基于图1提供的指纹构建算法的评估方法的第一实现流程的基础上,提出本发明实施例提供的指纹构建算法的评估方法的第二实现流程。
如图2所示,是本发明实施例提供的指纹构建算法的评估方法的第二实现流程示意图。步骤S102所述的将所述记录样本集输入至待评估的指纹构建算法,通过所述指纹构建算法生成设备指纹,以及将第一聚类标签添加至经过指纹构建算法聚类后唯一的字段信息中,将第二聚类标签添加至经过指纹构建算法聚类后不唯一的字段信息中包括:
在步骤S1021中,针对每一种设备特征,获取所述记录样本集中该种设备特征对应的字段信息,对所述字段信息进行聚类分析。
在这里,本发明实施例针对每一种设备特征,从所述设备记录样本和伪造记录样本中获取该种设备特征对应的字段信息,得到该种设备特征对应的一组字段信息,然后对该组字段信息进行聚类分析。其中,每种设备特征对应的字段信息的聚类分析是相互独立的,互相之间不受影响。
可选地,本发明实施例采用相似性度量(Similarity)来进行聚类分析。通过将每个字段信息转换为向量,计算向量之间的距离,得到两个字段信息之间的相似程度,然后根据所述相似程度进行相似性分析,以将这些字段信息进行归类,从而完成对同种设备特征对应的多个字段信息的聚类,得到该种设备特征对应的若干个簇。可选地,所述相似性度量包括但不限于余弦相似度(Cosine Similarity)、皮尔森相关系数(Pearson CorrelationCoefficient)、杰卡德相似系数(Jaccard Similarity Coefficient)、欧氏距离(Euclidean Distance)。
在步骤S1022中,针对每一种设备特征,获取该种设备特征在聚类分析后得到的簇。
在步骤S1023中,遍历每一个簇,获取该簇中的每一个字段信息与该簇的聚类中心之间的相似性度量值。
在本发明实施例中,对设备特征进行聚类分析后的结果包括所述设备特征对应的字段信息聚类得到的簇以及簇的个数。对于每一个簇,本发明实施例获取落在该簇中的字段信息到该簇的聚类中心之间的相似性度量值,以根据该相似性度量值来将字段信息转化为带有聚类标签的字段信息,用以评估各种设备特征的数据质量。在这里,所述相似性度量值反映了字段信息到聚类中心之间的差异。
在步骤S1024中,若所述相似性度量值在相似性阈值范围内时,在所述设备记录样本或伪造记录样本中保留该字段信息,并将预设的第一聚类标签添加至所述字段信息;否则,将所述设备记录样本或伪造记录样本中的所述字段信息替换为聚类中心,并将预设的第二聚类标签添加至替换后的字段信息中。
本发明实施例预先设置了相似性阈值,所述相似性阈值用作字段信息在聚类分析后是否唯一的判断标准。对于一个具体的设备特征A在聚类分析后得到的一个具体的簇C1,若落在该簇C1的一个具体的设备记录样本1或伪造记录样本1中的字段信息A1,到该簇C1的聚类中心M1之间的相似性度量值小于或等于所述相似性阈值时,表明所述字段信息A1与聚类中心M1之间的差异非常小,该字段信息A1具备唯一性,则在该字段信息A1所属的设备记录样本1或伪造记录样本1中保留该字段信息A1,并将预设的第一聚类标签添加至所述字段信息A1中;否则,若字段信息A1到该簇C1的聚类中心M1之间的相似性度量值大于所述相似性阈值时,表明所述字段信息A1与聚类中心M1之间的差异较大,该字段信息A1不具备唯一性,则将该字段信息A1所属的设备记录样本1或伪造记录样本1中的所述字段信息A1替换为聚类中心M1,即替换为聚类中心表示的字段信息,并将预设的第二聚类标签添加至替换后的字段信息中。可选地,所述第一聚类标签可以通过二进制数字中的0表示,所述第二聚类标签可以通过二进制数字中的1表示。
本发明实施例通过上述步骤S1024,将原始的输入数据转换为带有聚类特征的数据,可以用于评估每种设备特征的数据质量,比如若存在一种设备特征B,在对该种设备特征B对应的一组字段信息进行聚类分析,不同设备记录样本和伪造记录样本中该种设备特征B对应的字段信息都带有第一聚类标签,则说明通过该种设备特征B无法区分不同的设备,该种设备特征B对于构建设备指纹的聚类贡献度为0,从而完成对设备特征B的数据质量的评估。
在步骤S1025中,针对每一种设备特征,根据该种设备特征在聚类分析得到的簇的个数,计算该种设备特征对应的聚类误差。
在对每一种设备特征对应的一组字段信息打上标签之后,本发明实施例进一步根据聚类分析的结果中簇的个数,对所述多种设备特征进行过滤。具体为,针对每一种设备特征,计算其对应的聚类误差。可选地,所述聚类误差的计算公式可以为:
ei=abs(Ni-M)
在上式中,ei表示第i种设备特征的聚类误差,abs()表示绝对值运算,Ni表示第i种设备特征在聚类分析后得到的簇的个数,M表示设备记录样本的个数。
在步骤S1026中,获取所述聚类误差中的最大值对应的设备特征,并从所述设备记录样本和伪造记录样本中剔除该设备特征对应的字段信息,得到过滤后的记录样本集。
由上式ei=abs(Ni-M)可知,本发明实施例基于个数差异来表示每一种设备特征的聚类误差,即所述聚类误差ei反映了第i种设备特征聚类后的离散性,聚类误差ei越大,则第i种设备特征在聚类后的离散性越差,该种设备特征对设备指纹构建的参考意义越小;聚类误差ei越小,则第i种设备特征聚类后的离散性越好,该种设备特征对设备指纹构建的参考意义越大。鉴于此,本发明实施例通过比对所有的设备特征对应的聚类误差,获取所述聚类误差中的最大值对应的设备特征,并从设备记录样本和伪造记录样本中剔除该聚类误差最大值对应的设备特征,即从设备记录样本和伪造记录样本中删除该种设备特征对应的字段信息,从而完成对设备特征的初步净化,剔除离散性差的设备特征,以提高用于构建设备指纹的字段信息的质量。
在步骤S1027中,根据所述过滤后的记录样本集进行聚类分析,得到至少一个组别的记录样本。
在完成对字段信息的聚类分析及对设备特征的过滤净化之后,本发明实施例以净化后的设备记录样本和伪造记录样本作为数据集,进行聚类分析,以将所述设备记录样本和伪造记录样本划分为若干个组别,将相同或相似的记录样本划归到同一个组别中。可选地,聚类分析的算法可以采用k-means(K均值)算法、SVM(支持向量机)、KNN(K最近邻)算法等无监督聚类算法。在实际应用中,具体选择哪种算法,通过比较不同算法的精度,选择精度较高的算法来进行聚类。
在步骤S1028中,遍历每一个组别,根据该组别内的记录样本生成对应的一个设备指纹。
对于步骤S1027得到的每一个组别,均代表一种设备,该组别中所包括的记录样本可以理解为该设备的设备记录的变化范围,即通过识别落在该组别内的设备记录样本或伪造记录样本均可以找到该设备。本发明实施例基于每一组别进行加密,生成每种设备对应的唯一的设备指纹。可选地,加密的算法可以采用MD5算法(Message-Digest Algorithm 5,信息-摘要算法),通过MD5算法根据组别内的记录样本生成一个128位的消息摘要,从而完成对设备指纹的构建,保证了不同组别生成的设备指纹是不相同的,不法分子难以对设备指纹进行篡改,有效地提高了所构建出来的设备指纹的唯一性,保证了设备指纹的质量与安全性。
进一步地,基于图2提供的指纹构建算法的评估方法的第二实现流程的基础上,提出本发明实施例提供的指纹构建算法的评估方法的第三实现流程。
如图3所示,是本发明实施例提供的指纹构建算法的评估方法的第三实现流程示意图。在步骤S103根据所述设备记录样本的个数和指纹构建算法所生成的设备指纹的个数计算所述指纹构建算法的误差之后,所述评估方法还包括:
在步骤S105中,若所述误差大于预设误差阈值时,从过滤后的记录样本集中获取聚类误差最大值对应的设备特征。
如前所述,指纹构建算法的误差通过指纹构建算法所生成的设备指纹的个数与输入的设备记录样本的个数之间的差异的绝对值表示。本发明实施例预先设置了可接受的误差阈值。在步骤S103得到所述指纹构建算法的误差后,将所述误差与所述误差阈值比对,判断所述误差是否满足该误差阈值。若所述误差大于所述预设误差阈值时,表明基于所述指纹构建算法在对记录样本集分析后构建的设备指纹未覆盖输入的设备记录样本,则从过滤后的记录样本集中获取聚类误差最大值对应的设备特征,即以步骤S1026剔除聚类误差最大值对应的设备特征后剩余的设备特征为比较对象,再次获取聚类误差最大值对应的设备特征,得到簇的个数Ni离设备记录样本的个数M最远的设备特征。
在步骤S106中,从所述过滤后的记录样本集中的设备记录样本和伪造记录样本中剔除该设备特征对应的字段信息,得到再次过滤后的记录样本集。
根据所获取的聚类误差最大值对应的设备特征,本发明从设备记录样本和伪造记录样本中剔除该种设备特征,即从设备记录样本和伪造记录样本中删除该种设备特征对应的字段信息,从而完成对设备特征的二次净化,剔除离散性差的设备特征,以进一步提高用于构建设备指纹的字段信息的质量。
在步骤S107中,根据所述再次过滤后的记录样本集进行聚类分析,生成设备指纹,以执行下一次误差评估。
在步骤S106完成对记录样本集中的设备特征的再次过滤后,根据再次过滤后的剩余的设备特征进行聚类分析,以执行下一次迭代。然后返回步骤S103,执行对指纹构建算法的下一次误差评估。以此类推,重复执行多次,直至所述指纹构建算法的误差小于或等于预设误差阈值,即所述指纹构建算法在对记录样本集分析后构建的设备指纹基本覆盖输入的设备记录样本。
在这里,本发明实施例通过多次迭代,剔除剔离散性较差的设备特征,提高了用于构建设备指纹的设备特征的质量,进而提高了对指纹构建算法的精度校验效果;通过第一聚类标签和第二聚类标签标记各种设备特征的字段信息,得到各种设备特征的数据质量,可以用于辅助开发人员筛选高质量的设备特征以及优化用于设备特征聚类分析的算法,有利于提高指纹构建算法的计算效率及速度,从而解决了现有技术对指纹构建算法的分析及评估力度不足、精度校验效果欠佳的问题,有利于进一步优化指纹构建算法的稳定性。
应理解,在上述实施例中,各步骤的序号的大小并不意味着执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例2
图4示出了本发明实施例提供的指纹构建算法的评估装置的组成结构图,为了便于说明,仅示出了与本发明实施例相关的部分。
在本发明实施例中,所述指纹构建算法的评估装置用于实现上述图1、图2、图3实施例中所述的指纹构建算法的评估方法,可以是内置于终端的软件单元、硬件单元或者软硬件结合的单元。
参阅图4,所述指纹构建算法的评估装置包括:
样本获取模块41,用于获取记录样本集,所述记录样本集中包括多个设备记录样本和多个伪造记录样本,每一个设备记录样本或伪造记录样本包括若干种设备特征对应的一个字段信息;
校验模块42,用于将所述记录样本集输入至待评估的指纹构建算法,通过所述指纹构建算法生成设备指纹,以及将第一聚类标签添加至经过指纹构建算法聚类后唯一的字段信息中,将第二聚类标签添加至经过指纹构建算法聚类后不唯一的字段信息中;
误差计算模块43,用于根据所述设备记录样本的个数和指纹构建算法所生成的设备指纹的个数计算所述指纹构建算法的误差;
评估模块44,用于若所述误差小于或等于预设误差阈值时,统计并输出经过所述指纹构建算法后每一种设备特征对应的包括第一聚类标签的字段信息个数和包括第二聚类标签的字段信息个数。
可选地,所述指纹构建算法的误差计算公式为:
E=abs(N-M)/M
在上式中,E表示指纹构建算法的误差,abs()表示绝对值运算,M表示设备记录样本的个数,N表示所述指纹构建算法所生成的设备指纹的个数。
可选地,所述校验模块42包括:
第一聚类单元421,用于针对每一种设备特征,获取所述记录样本集中该种设备特征对应的字段信息,对所述字段信息进行聚类分析;
标签添加单元422,用于获取该所述设备特征在聚类分析后得到的簇,遍历每一个簇,获取该簇中的每一个字段信息与该簇的聚类中心之间的相似性度量值;若所述相似性度量值在相似性阈值范围内时,在所述设备记录样本或伪造记录样本中保留该字段信息,并将预设的第一聚类标签添加至所述字段信息;否则,将所述设备记录样本或伪造记录样本中的所述字段信息替换为聚类中心,并将预设的第二聚类标签添加至替换后的字段信息中;
聚类误差计算单元423,用于针对每一种设备特征,根据该种设备特征在聚类分析得到的簇的个数,计算该种设备特征对应的聚类误差。
特征剔除单元424,用于获取所述聚类误差中的最大值对应的设备特征,并从所述设备记录样本和伪造记录样本中剔除该设备特征对应的字段信息,得到过滤后的记录样本集;
第二聚类单元425,用于根据所述过滤后的记录样本集进行聚类分析,得到至少一个组别的记录样本;
指纹生成单元426,用于遍历每一个组别,根据该组别内的记录样本生成对应的一个设备指纹。
可选地,所述聚类误差的计算公式为:
ei=abs(Ni-M)
在上式中,ei表示第i种设备特征的聚类误差,abs()表示绝对值运算,Ni表示第i种设备特征在聚类分析后得到的簇的个数,M表示设备记录样本的个数。
可选地,所述评估装置中的特征剔除单元424还用于:
若所述误差大于预设误差阈值时,从过滤后的记录样本集中获取聚类误差最大值对应的设备特征;从所述过滤后的记录样本集中的设备记录样本和伪造记录样本中剔除该设备特征对应的字段信息,得到再次过滤后的记录样本集。
所述第二聚类单元425还用于根据所述再次过滤后的记录样本集进行聚类分析,得到至少一个组别的记录样本;所述指纹生成单元426还用于遍历每一个组别,根据该组别内的记录样本生成对应的一个设备指纹;然后返回至误差计算模块43,执行下一次误差评估。
可选地,所述样本获取模块41包括:
样本获取单元411,用于获取预设的多个设备记录样本;
样本改动单元412,用于基于预设模拟器对所述多个设备记录样本进行改动,得到多个伪造记录样本。
需要说明的是,本发明实施例中的各模块/单元可以用于实现上述方法实施例中的全部技术方案,其具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
实施例3
本实施例提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现实施例1中指纹构建算法的评估方法,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现实施例2中指纹构建算法的评估装置中各模块/单元的功能,为避免重复,这里不再赘述。
实施例4
图5是本发明实施例提供的一种终端的示意图,所述终端包括但不限于服务器、移动终端。如图5所示,该实施例的终端5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52。所述处理器50执行所述计算机程序52时实现上述指纹构建算法的评估方法实施例中的步骤,例如图1所示的步骤S101至S104,图2实施例中所述的步骤S1021至S1028,图3实施例中所述的步骤S105至S107,或者,所述处理器50执行所述计算机程序52时实现上述指纹构建算法的评估装置实施例中各模块/单元的功能,例如图4所示模块41至44的功能。
示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述终端5中的执行过程。例如,所述计算机程序52可以被分割成样本获取模块、校验模块、误差计算模块、评估模块,各模块具体功能请参见上述实施例的叙述,此处不再赘述。
所述终端5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端5的示例,并不构成对终端5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述终端的控制中心,利用各种接口和线路连接整个终端的各个部分。
所述存储器51可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述终端的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart MediaCard,SMC)、安全数字卡(Secure Digital,SD)、闪存卡(Flash Card),至少一个磁盘存储器件、闪存器件或其他易失性固态存储器件。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种指纹构建算法的评估方法,其特征在于,所述评估方法包括:
获取记录样本集,所述记录样本集中包括多个设备记录样本和多个伪造记录样本,每一个设备记录样本或伪造记录样本包括若干种设备特征对应的一个字段信息;
将所述记录样本集输入至待评估的指纹构建算法,通过所述指纹构建算法生成设备指纹,以及将第一聚类标签添加至经过指纹构建算法聚类后唯一的字段信息中,将第二聚类标签添加至经过指纹构建算法聚类后不唯一的字段信息中;
根据所述设备记录样本的个数和指纹构建算法所生成的设备指纹的个数计算所述指纹构建算法的误差;
若所述误差小于或等于预设误差阈值时,统计并输出经过所述指纹构建算法后每一种设备特征对应的包括第一聚类标签的字段信息个数和包括第二聚类标签的字段信息个数。
2.如权利要求1所述的指纹构建算法的评估方法,其特征在于,所述指纹构建算法的误差计算公式为:
E=abs(N-M)/M
在上式中,E表示指纹构建算法的误差,abs()表示绝对值运算,M表示设备记录样本的个数,N表示所述指纹构建算法所生成的设备指纹的个数。
3.如权利要求1或2所述的指纹构建算法的评估方法,其特征在于,所述将所述记录样本集输入至待评估的指纹构建算法,通过所述指纹构建算法生成设备指纹,以及将第一聚类标签添加至经过指纹构建算法聚类后唯一的字段信息中,将第二聚类标签添加至经过指纹构建算法聚类后不唯一的字段信息中包括:
针对每一种设备特征,获取所述记录样本集中该种设备特征对应的字段信息,对所述字段信息进行聚类分析;
获取所述设备特征在聚类分析后得到的簇,遍历每一个簇,获取该簇中的每一个字段信息与所述簇的聚类中心之间的相似性度量值;若所述相似性度量值在相似性阈值范围内时,在所述设备记录样本或伪造记录样本中保留该字段信息,并将预设的第一聚类标签添加至所述字段信息;否则,将所述设备记录样本或伪造记录样本中的所述字段信息替换为聚类中心,并将预设的第二标聚类签添加至替换后的字段信息中;
针对每一种设备特征,根据该种设备特征在聚类分析得到的簇的个数,计算该种设备特征对应的聚类误差;
获取所述聚类误差中的最大值对应的设备特征,并从所述设备记录样本和伪造记录样本中剔除该设备特征对应的字段信息,得到过滤后的记录样本集;
根据所述过滤后的记录样本集进行聚类分析,得到至少一个组别的记录样本;
遍历每一个组别,根据该组别内的记录样本生成对应的一个设备指纹。
4.如权利要求3所述的指纹构建算法的评估方法,其特征在于,所述聚类误差的计算公式为:
ei=abs(Ni-M)
在上式中,ei表示第i种设备特征的聚类误差,abs()表示绝对值运算,Ni表示第i种设备特征在聚类分析后得到的簇的个数,M表示设备记录样本的个数。
5.如权利要求3所述的指纹构建算法的评估方法,其特征在于,所述评估方法还包括:
若所述误差大于预设误差阈值时,从过滤后的记录样本集中获取聚类误差最大值对应的设备特征;
从所述过滤后的记录样本集中的设备记录样本和伪造记录样本中剔除该设备特征对应的字段信息,得到再次过滤后的记录样本集;
根据所述再次过滤后的记录样本集进行聚类分析,生成设备指纹,以执行下一次误差评估。
6.如权利要求1所述的指纹构建算法的评估方法,其特征在于,所述获取记录样本集包括:
获取预设的多个设备记录样本;
基于预设模拟器对所述多个设备记录样本进行改动,得到多个伪造记录样本。
7.一种指纹构建算法的评估装置,其特征在于,所述评估装置包括:
样本获取模块,用于获取记录样本集,所述记录样本集中包括多个设备记录样本和多个伪造记录样本,每一个设备记录样本或伪造记录样本包括若干种设备特征对应的一个字段信息;
校验模块,用于将所述记录样本集输入至待评估的指纹构建算法,通过所述指纹构建算法生成设备指纹,以及将第一聚类标签添加至经过指纹构建算法聚类后唯一的字段信息中,将第二聚类标签添加至经过指纹构建算法聚类后不唯一的字段信息中;
误差计算模块,用于根据所述设备记录样本的个数和指纹构建算法所生成的设备指纹的个数计算所述指纹构建算法的误差;
评估模块,用于若所述误差小于或等于预设误差阈值时,统计并输出经过所述指纹构建算法后每一种设备特征对应的包括第一聚类标签的字段信息个数和包括第二聚类标签的字段信息个数。
8.如权利要求7所述的指纹构建算法的评估装置,其特征在于,所述指纹构建算法的误差计算公式为:
E=abs(N-M)/M
在上式中,E表示指纹构建算法的误差,abs()表示绝对值运算,M表示设备记录样本的个数,N表示所述指纹构建算法所生成的设备指纹的个数。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序由处理器执行时实现权利要求1至6任一项所述的指纹构建算法的评估方法所述的步骤。
10.一种终端,所述终端包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述权利要求1至6任一项所述的指纹构建算法的评估方法所述的步骤。
CN201810435801.9A 2018-05-09 2018-05-09 指纹构建算法的评估方法、装置、存储介质及终端 Active CN108596271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810435801.9A CN108596271B (zh) 2018-05-09 2018-05-09 指纹构建算法的评估方法、装置、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810435801.9A CN108596271B (zh) 2018-05-09 2018-05-09 指纹构建算法的评估方法、装置、存储介质及终端

Publications (2)

Publication Number Publication Date
CN108596271A true CN108596271A (zh) 2018-09-28
CN108596271B CN108596271B (zh) 2023-05-26

Family

ID=63636013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810435801.9A Active CN108596271B (zh) 2018-05-09 2018-05-09 指纹构建算法的评估方法、装置、存储介质及终端

Country Status (1)

Country Link
CN (1) CN108596271B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110297989A (zh) * 2019-06-25 2019-10-01 北京百度网讯科技有限公司 异常检测的测试方法、装置、设备和介质
CN111680286A (zh) * 2020-02-27 2020-09-18 中国科学院信息工程研究所 物联网设备指纹库的精细化方法
US11586599B1 (en) * 2021-11-11 2023-02-21 Bank Of America Corporation Smart data warehouse protocols

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130238623A1 (en) * 2010-02-04 2013-09-12 Isis Innovation Limited Method of Linking Electronic Database Records
US20150032759A1 (en) * 2012-04-06 2015-01-29 Sk Planet Co., Ltd. System and method for analyzing result of clustering massive data
CN106093852A (zh) * 2016-05-27 2016-11-09 东华大学 一种提高WiFi指纹定位精度与效率的方法
US20170052958A1 (en) * 2015-08-19 2017-02-23 Palantir Technologies Inc. Systems and methods for automatic clustering and canonical designation of related data in various data structures
CN106557777A (zh) * 2016-10-17 2017-04-05 中国互联网络信息中心 一种基于SimHash改进的Kmeans聚类方法
CN107392121A (zh) * 2017-07-06 2017-11-24 同济大学 一种基于指纹识别的自适应设备识别方法及系统
CN107948930A (zh) * 2017-12-31 2018-04-20 电子科技大学 基于位置指纹算法的室内定位优化方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130238623A1 (en) * 2010-02-04 2013-09-12 Isis Innovation Limited Method of Linking Electronic Database Records
US20150032759A1 (en) * 2012-04-06 2015-01-29 Sk Planet Co., Ltd. System and method for analyzing result of clustering massive data
US20170052958A1 (en) * 2015-08-19 2017-02-23 Palantir Technologies Inc. Systems and methods for automatic clustering and canonical designation of related data in various data structures
CN106093852A (zh) * 2016-05-27 2016-11-09 东华大学 一种提高WiFi指纹定位精度与效率的方法
CN106557777A (zh) * 2016-10-17 2017-04-05 中国互联网络信息中心 一种基于SimHash改进的Kmeans聚类方法
CN107392121A (zh) * 2017-07-06 2017-11-24 同济大学 一种基于指纹识别的自适应设备识别方法及系统
CN107948930A (zh) * 2017-12-31 2018-04-20 电子科技大学 基于位置指纹算法的室内定位优化方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
NICK NIKIFORAKIS ET AL: "Cookieless Monster: Exploring the Ecosystem of Web-based Device Fingerprinting" *
QIANG XU ET AL: "Device Fingerprinting in Wireless Networks: Challenges and Opportunities" *
尹心明 等: "基于设备指纹决策树分类的IP 视频专网入网检测方案研究" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110297989A (zh) * 2019-06-25 2019-10-01 北京百度网讯科技有限公司 异常检测的测试方法、装置、设备和介质
CN110297989B (zh) * 2019-06-25 2021-07-23 北京百度网讯科技有限公司 异常检测的测试方法、装置、设备和介质
CN111680286A (zh) * 2020-02-27 2020-09-18 中国科学院信息工程研究所 物联网设备指纹库的精细化方法
US11586599B1 (en) * 2021-11-11 2023-02-21 Bank Of America Corporation Smart data warehouse protocols

Also Published As

Publication number Publication date
CN108596271B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
CN109063966B (zh) 风险账户的识别方法和装置
CN108600414A (zh) 设备指纹的构建方法、装置、存储介质及终端
CN108269012A (zh) 风险评分模型的构建方法、装置、存储介质及终端
CN108595585A (zh) 样本数据分类方法、模型训练方法、电子设备及存储介质
CN108596271A (zh) 指纹构建算法的评估方法、装置、存储介质及终端
CN107368856A (zh) 恶意软件的聚类方法及装置、计算机装置及可读存储介质
CN111090807A (zh) 一种基于知识图谱的用户识别方法及装置
EP3452952A1 (en) User specific classifiers for biometric liveness detection
CN108259637A (zh) 一种基于决策树的nat设备识别方法及装置
CN111931047B (zh) 基于人工智能的黑产账号检测方法及相关装置
CN109690571A (zh) 基于学习的组标记系统和方法
CN110046622A (zh) 一种有目标的攻击样本生成方法、装置、设备及存储介质
CN109033148A (zh) 一种面向多分类的不平衡数据预处理方法、装置及设备
CN107748739A (zh) 一种短信文本模版的提取方法及相关装置
CN115222443A (zh) 客户群体划分方法、装置、设备及存储介质
CN110009012A (zh) 一种风险样本识别方法、装置及电子设备
CN112862020A (zh) 一种数据识别方法、装置及存储介质
CN111353109A (zh) 一种恶意域名的识别方法及系统
CN110210425A (zh) 人脸识别方法、装置、电子设备及存储介质
CN112769540B (zh) 一种侧信道信息泄露的诊断方法、系统、设备及存储介质
CN111385342B (zh) 一种物联网行业识别方法、装置、电子设备及存储介质
CN112991079A (zh) 多卡共现就医欺诈行为检测方法、系统、云端及介质
CN108154177A (zh) 业务识别方法、装置、终端设备及存储介质
CN113349792B (zh) 基于多导联心电信号的分类方法、装置、设备及介质
CN107481394A (zh) 纸币的识别方法、识别装置及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant