CN110458094A - 基于指纹相似度的设备分类方法 - Google Patents

基于指纹相似度的设备分类方法 Download PDF

Info

Publication number
CN110458094A
CN110458094A CN201910735429.8A CN201910735429A CN110458094A CN 110458094 A CN110458094 A CN 110458094A CN 201910735429 A CN201910735429 A CN 201910735429A CN 110458094 A CN110458094 A CN 110458094A
Authority
CN
China
Prior art keywords
sample
similarity
central point
fingerprint
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910735429.8A
Other languages
English (en)
Other versions
CN110458094B (zh
Inventor
林星辰
黄元飞
李燕伟
夏剑锋
张峰
权晓文
王润合
黄石海
赵建聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuanjiang Shengbang (beijing) Network Security Polytron Technologies Inc
National Computer Network and Information Security Management Center
Original Assignee
Yuanjiang Shengbang (beijing) Network Security Polytron Technologies Inc
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yuanjiang Shengbang (beijing) Network Security Polytron Technologies Inc, National Computer Network and Information Security Management Center filed Critical Yuanjiang Shengbang (beijing) Network Security Polytron Technologies Inc
Priority to CN201910735429.8A priority Critical patent/CN110458094B/zh
Publication of CN110458094A publication Critical patent/CN110458094A/zh
Application granted granted Critical
Publication of CN110458094B publication Critical patent/CN110458094B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/12Fingerprints or palmprints
    • G06V40/1365Matching; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明公开了一种基于指纹相似度的设备分类方法,包括:建立已知的同一类型设备的样本集,提取样本集对应的指纹信息,以得平均相似度和中心点样本指纹集;获取样本集内的每个设备与中心点样本指纹集的相似度,计算每个已知类型设备指纹信息相似度到中心点样本指纹集的相似距离,确定最大相似距离;计算未知类型设备集内每个样本与中心点样本指纹集所在的中心点样本的空间距离,若大于最大相似距离,则样本属于中心点样本集所在的样本类型,否则,样本不属于样本类型,若出现未正确识别样本,重新加入样本集,重新计算中心点样本,以完成自动分类。本发明提高了设备分类的效率和准确性,并避免了因信息发送变化导致的指纹识别失败的问题。

Description

基于指纹相似度的设备分类方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于指纹相似度的设备分类方法。
背景技术
随着对网络安全的日渐深入,对于网络资产的梳理变得越来越重要,其中,包括网络设备的操作系统类型、开放的服务、banner信息、证书信息、使用的中间件、Http响应头信息等多个维度的综合信息描述,对设备进行分类和识别。但是随着网络设备、软件的不断更新,应用层协议指纹更新更是层出不穷,传统的指纹识别大多采用单条件逐个匹配,如果中间某一个信息发生变化,则会导致指纹识别失败,采用基于相似度的分类算法则可解决此问题。
发明内容
本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种基于指纹相似度的设备分类方法,提高了设备分类的效率和准确性,并避免了因信息发送变化,导致的指纹识别失败的问题。
为了实现根据本发明的这些目的和其它优点,提供了一种基于指纹相似度的设备分类方法,包括:
步骤1、通过建立已知的同一类型设备的样本集,并提取所述样本集对应的指纹信息,以得到所述指纹信息的平均相似度和中心点样本指纹集。
步骤2、通过获取所述样本集内的每个设备与步骤1所得中心点样本指纹集的相似度,计算每个已知类型设备指纹信息所述相似度到所述中心点样本指纹集的相似距离,并确定最大相似距离。
步骤3、通过计算未知类型设备集内每个样本与所述中心点样本指纹集所在的中心点样本的空间距离,与所述最大相似距离进行比较,若大于所述最大相似距离,则所述样本属于所述中心点样本集所在的样本类型,否则,所述样本不属于所述样本类型,若出现未正确识别的样本,则进入步骤4。
步骤4、通过将未正确识别的样本重新加入所述样本集,以重新计算所述中心点样本,重复步骤1-3,以完成自动分类。
优选的是,步骤1中,所述指纹信息的平均相似度和中心点样本指纹集的具体方法主要包括以下步骤:
步骤2.1、通过多个已知的同一类型的设备建立样本集N,提取所述样本集N内每个设备对应的指纹信息。
步骤2.2、通过计算所述样本集N内每个设备指纹信息对应属性的相似度,取所述相似度的平均值作为平均相似度。
步骤2.3、获取所述相似度中与所述平均值接近的多个相似度作为所述中心点样本指纹集。
优选的是,步骤2中,获取所述相似度的具体方法主要包括以下步骤:
步骤3.1、获取所述样本集内设备对应的多个维度信息,计算与所述中心点样本指纹集的相似度。
步骤3.2、对所述样本集内处所述中心点样本之外的所述设备重复步骤3.1,直至得到除所述中心点样本之外的所有的每个所述设备的相似度。
优选的是,步骤2中,获取所述相似距离的计算方法依据公式1:
公式1
其中,X(i)为样本对应的多个维度信息与所述中心点样本指纹集的相似度;
K(i)为一类型设备的k个指纹与该类型设备中心点样本指纹集的所述平均相似度;
D为样本集N内除所述中心点样本之外的所述样本与所述中心点样本的最大相似距离。
优选的是,步骤3中所述空间距离的计算方法依据公式2:
公式2
其中,A(i)为未知类型的样本集A中样本对应的多个维度信息与所述中心点样本指纹集的相似度;d为所述空间距离。
优选的是,所述未正确识别的样本加入所述样本集的前提是,所述未正确识别的样本类型设定为与所述样本集内样本类型相同。
本发明至少包括以下有益效果:
通过建立样本集,样本集内的每个设备均已知其类型,提取每个已知类型的设备对应的指纹信息,以作为相似度对比的依据,每个设备对应的指纹信息具有唯一性,使实现自动分类的有效基础,同时便于求得平均相似度和中心点样本指纹集;中心点样本指纹集是样本集内每个设备参照的依据,通过获取每个设备的多维度信息与中心点样本指纹集的相似度,从而再以平均相似度为参照,计算得每个相似度到平均相似度的相似距离,并比较所述相似距离,以得到最大相似距离作为阈值,作为未知类型设备样本判断其类型的主要依据,落入所述最大相似距离内的空间距离,可判定该未知类型的样本与样本集类型相同,未落入所述最大相似距离内的空间距离,可判定该未知类型的样本与样本集类型不同;还包括未正确识别的样本,指的是设定相似度值大于样本集内设定的最小相似度,导致判定不精确,此时,需要通过人为干预的方式,设定未正确识别的样本类型与样本集内已知设备的类型相同,从而将其加入到样本集内,建立新的样本集,并重新计算中心点样本,以实现往复循环的自动分类,直至自动分类结束。所述基于指纹相似度的设备分类方法可有效解决因应用层协议指纹更新导致的指纹识别失败的问题,提高了设备分类的效率和准确性。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明所述基于指纹相似度的设备分类方法的流程图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。
如图1所示,本发明提供一种基于指纹相似度的设备分类方法,包括:
步骤1、通过建立已知的同一类型设备的样本集,并提取所述样本集对应的指纹信息,以得到所述指纹信息的平均相似度和中心点样本指纹集。
步骤2、通过获取所述样本集内的每个设备与步骤1所得中心点样本指纹集的相似度,计算每个已知类型设备指纹信息所述相似度到所述中心点样本指纹集的相似距离,并确定最大相似距离。
步骤3、通过计算未知类型设备集内每个样本与所述中心点样本指纹集所在的中心点样本的空间距离,与所述最大相似距离进行比较,若大于所述最大相似距离,则所述样本属于所述中心点样本集所在的样本类型,否则,所述样本不属于所述样本类型,若出现未正确识别的样本,则进入步骤4。
步骤4、通过将未正确识别的样本重新加入所述样本集,以重新计算所述中心点样本,重复步骤1-3,以完成自动分类。
在上述方案中,通过建立样本集,样本集内的每个设备均已知其类型,提取每个已知类型的设备对应的指纹信息,以作为相似度对比的依据,每个设备对应的指纹信息具有唯一性,使实现自动分类的有效基础,同时便于求得平均相似度和中心点样本指纹集;中心点样本指纹集是样本集内每个设备参照的依据,通过获取每个设备的多维度信息与中心点样本指纹集的相似度,从而再以平均相似度为参照,计算得每个相似度到平均相似度的相似距离,并比较所述相似距离,以得到最大相似距离作为阈值,作为未知类型设备样本判断其类型的主要依据,落入所述最大相似距离内的空间距离,可判定该未知类型的样本与样本集类型相同,未落入所述最大相似距离内的空间距离,可判定该未知类型的样本与样本集类型不同;还包括未正确识别的样本,指的是设定相似度值大于样本集内设定的最小相似度,导致判定不精确,此时,需要通过人为干预的方式,设定未正确识别的样本类型与样本集内已知设备的类型相同,从而将其加入到样本集内,建立新的样本集,并重新计算中心点样本,以实现往复循环的自动分类,直至自动分类结束。所述基于指纹相似度的设备分类方法可有效解决因应用层协议指纹更新导致的指纹识别失败的问题,提高了设备分类的效率和准确性。
一个优选方案中,步骤1中,所述指纹信息的平均相似度和中心点样本指纹集的具体方法主要包括以下步骤:
步骤2.1、通过多个已知的同一类型的设备建立样本集N,提取所述样本集N内每个设备对应的指纹信息。
步骤2.2、通过计算所述样本集N内每个设备指纹信息对应属性的相似度,取所述相似度的平均值作为平均相似度。
步骤2.3、获取所述相似度中与所述平均值接近的多个相似度作为所述中心点样本指纹集。
在上述方案中,对已知的属于某类型的N个设备提取相关的n个指纹信息,计算样本集N的n个属性的平均相似度,保存n个属性相似度的平均值和与平均值最接近的相似度对应的k个指纹,做为平均相似值和中心点样本指纹,计算方法依据公式3:
公式3
其中,x(i,j)中样本i—特征最长匹配字符数;
样本j—指特征字符串长度。
一个优选方案中,步骤2中,获取所述相似度的具体方法主要包括以下步骤:
步骤3.1、获取所述样本集内设备对应的多个维度信息,计算与所述中心点样本指纹集的相似度。
步骤3.2、对所述样本集内处所述中心点样本之外的所述设备重复步骤3.1,直至得到除所述中心点样本之外的所有的每个所述设备的相似度。
在上述方案中,通过取每个设备对应的多个维度信息,并以数组的方式呈现,与中心点样本指纹集进行相似度的计算。
一个优选方案中,步骤2中,获取所述相似距离的计算方法依据公式1:
公式1
其中,X(i)为样本对应的多个维度信息与所述中心点样本指纹集的相似度;
K(i)为一类型设备的k个指纹与该类型设备中心点样本指纹集的所述平均相似度;
D为样本集N内除所述中心点样本之外的所述样本与所述中心点样本的最大相似距离。
一个优选方案中,步骤3中所述空间距离的计算方法依据公式2:
公式2
其中,A(i)为未知类型的样本集A中样本对应的多个维度信息与所述中心点样本指纹集的相似度;d为所述空间距离。
在上述方案中,样本集A为未知类型,通过空间距离以判定样本集A的类型。
一个优选方案中,所述未正确识别的样本加入所述样本集的前提是,所述未正确识别的样本类型设定为与所述样本集内样本类型相同。
在上述方案中,通过人为干预的方式,设定未正确识别的样本的类型,以便进入下一自动分类的循环,将其加入样本集N内,重新建立新的样本集,以进行自动分类循环。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (6)

1.一种基于指纹相似度的设备分类方法,其中,主要包括以下步骤:
步骤1、通过建立已知的同一类型设备的样本集,并提取所述样本集对应的指纹信息,以得到所述指纹信息的平均相似度和中心点样本指纹集;
步骤2、通过获取所述样本集内的每个设备与步骤1所得中心点样本指纹集的相似度,计算每个已知类型设备指纹信息所述相似度到所述中心点样本指纹集的相似距离,并确定最大相似距离;
步骤3、通过计算未知类型设备集内每个样本与所述中心点样本指纹集所在的中心点样本的空间距离,与所述最大相似距离进行比较,若大于所述最大相似距离,则所述样本属于所述中心点样本集所在的样本类型,否则,所述样本不属于所述样本类型,若出现未正确识别的样本,则进入步骤4;
步骤4、通过将未正确识别的样本重新加入所述样本集,以重新计算所述中心点样本,重复步骤1-3,以完成自动分类。
2.如权利要求1所述基于指纹相似度的设备分类方法,其中,步骤1中,所述指纹信息的平均相似度和中心点样本指纹集的具体方法主要包括以下步骤:
步骤2.1、通过多个已知的同一类型的设备建立样本集N,提取所述样本集N内每个设备对应的指纹信息;
步骤2.2、通过计算所述样本集N内每个设备指纹信息对应属性的相似度,取所述相似度的平均值作为平均相似度;
步骤2.3、获取所述相似度中与所述平均值接近的多个相似度作为所述中心点样本指纹集。
3.如权利要求1所述基于指纹相似度的设备分类方法,其中,步骤2中,获取所述相似度的具体方法主要包括以下步骤:
步骤3.1、获取所述样本集内设备对应的多个维度信息,计算与所述中心点样本指纹集的相似度;
步骤3.2、对所述样本集内处所述中心点样本之外的所述设备重复步骤3.1,直至得到除所述中心点样本之外的所有的每个所述设备的相似度。
4.如权利要求2所述基于指纹相似度的设备分类方法,其中,步骤2中,获取所述相似距离的计算方法依据公式1:
公式1
其中,X(i)为样本对应的多个维度信息与所述中心点样本指纹集的相似度;
K(i)为一类型设备的k个指纹与该类型设备中心点样本指纹集的所述平均相似度;
D为样本集N内除所述中心点样本之外的所述样本与所述中心点样本的最
大相似距离。
5.如权利要求4所述基于指纹相似度的设备分类方法,其中,步骤3中所述空间距离的计算方法依据公式2:
公式2
其中,A(i)为未知类型的样本集A中样本对应的多个维度信息与所述中心点样本指纹集的相似度;d为所述空间距离。
6.如权利要求1所述基于指纹相似度的设备分类方法,其中,所述未正确识别的样本加入所述样本集的前提是,所述未正确识别的样本类型设定为与所述样本集内样本类型相同。
CN201910735429.8A 2019-08-09 2019-08-09 基于指纹相似度的设备分类方法 Active CN110458094B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910735429.8A CN110458094B (zh) 2019-08-09 2019-08-09 基于指纹相似度的设备分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910735429.8A CN110458094B (zh) 2019-08-09 2019-08-09 基于指纹相似度的设备分类方法

Publications (2)

Publication Number Publication Date
CN110458094A true CN110458094A (zh) 2019-11-15
CN110458094B CN110458094B (zh) 2020-12-18

Family

ID=68485721

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910735429.8A Active CN110458094B (zh) 2019-08-09 2019-08-09 基于指纹相似度的设备分类方法

Country Status (1)

Country Link
CN (1) CN110458094B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052241A (zh) * 2020-08-27 2020-12-08 安徽聚戎科技信息咨询有限公司 一种大数据存储用数据分类方法
CN112685799A (zh) * 2020-12-29 2021-04-20 五八有限公司 设备指纹生成方法、装置、电子设备和计算机可读介质
CN113468914A (zh) * 2020-03-30 2021-10-01 杭州海康威视数字技术股份有限公司 一种商品纯净度的确定方法、装置及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590715B1 (en) * 2003-03-03 2009-09-15 Emc Corporation Method and system for automatic classification of applications and services by packet inspection
CN105024993A (zh) * 2015-05-25 2015-11-04 上海南邮实业有限公司 一种基于向量运算的协议比对方法
CN107392121A (zh) * 2017-07-06 2017-11-24 同济大学 一种基于指纹识别的自适应设备识别方法及系统
CN107526058A (zh) * 2017-09-22 2017-12-29 中国联合网络通信集团有限公司 室内定位方法、装置及系统
CN107679575A (zh) * 2017-10-10 2018-02-09 小花互联网金融服务(深圳)有限公司 一种基于用户的实时设备指纹获取装置
US20190180057A1 (en) * 2014-07-21 2019-06-13 Servicenow, Inc. Fingerprint-based configuration typing and classification

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590715B1 (en) * 2003-03-03 2009-09-15 Emc Corporation Method and system for automatic classification of applications and services by packet inspection
US20190180057A1 (en) * 2014-07-21 2019-06-13 Servicenow, Inc. Fingerprint-based configuration typing and classification
CN105024993A (zh) * 2015-05-25 2015-11-04 上海南邮实业有限公司 一种基于向量运算的协议比对方法
CN107392121A (zh) * 2017-07-06 2017-11-24 同济大学 一种基于指纹识别的自适应设备识别方法及系统
CN107526058A (zh) * 2017-09-22 2017-12-29 中国联合网络通信集团有限公司 室内定位方法、装置及系统
CN107679575A (zh) * 2017-10-10 2018-02-09 小花互联网金融服务(深圳)有限公司 一种基于用户的实时设备指纹获取装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468914A (zh) * 2020-03-30 2021-10-01 杭州海康威视数字技术股份有限公司 一种商品纯净度的确定方法、装置及设备
CN113468914B (zh) * 2020-03-30 2023-08-29 杭州海康威视数字技术股份有限公司 一种商品纯净度的确定方法、装置及设备
CN112052241A (zh) * 2020-08-27 2020-12-08 安徽聚戎科技信息咨询有限公司 一种大数据存储用数据分类方法
CN112685799A (zh) * 2020-12-29 2021-04-20 五八有限公司 设备指纹生成方法、装置、电子设备和计算机可读介质
CN112685799B (zh) * 2020-12-29 2022-11-29 五八有限公司 设备指纹生成方法、装置、电子设备和计算机可读介质

Also Published As

Publication number Publication date
CN110458094B (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
CN102945366B (zh) 一种人脸识别的方法及装置
CN104537336B (zh) 一种具备自学习功能的人脸识别方法和系统
CN103714281B (zh) 一种基于心电信号的身份识别方法
CN110458094A (zh) 基于指纹相似度的设备分类方法
CN109522853B (zh) 面向监控视频的人脸检测与搜索方法
CN107392082B (zh) 一种基于深度学习的小面积指纹比对方法
CN109784270A (zh) 一种提升人脸图片识别完整性的处理方法
CN103778409A (zh) 基于人脸特征数据挖掘的人脸识别方法与装置
CN106548164A (zh) 人脸图像与移动设备的关联性识别方法
CN111126240B (zh) 一种三通道特征融合人脸识别方法
CN102682309A (zh) 一种基于模板学习的人脸注册方法及装置
CN109145817A (zh) 一种人脸活体检测识别方法
Alberink et al. Performance of the FearID earprint identification system
CN110084149A (zh) 一种基于难样本四元组动态边界损失函数的人脸验证方法
US20140254892A1 (en) Face recognition apparatus, system and method for managing users based on user grouping
CN110222708A (zh) 一种基于集成决策树的跌倒检测方法和系统
CN111046886A (zh) 号码牌自动识别方法、装置、设备及计算机可读存储介质
CN107292228A (zh) 一种加快人脸识别搜索速度的方法
CN109829071A (zh) 人脸图像搜索方法、服务器、计算机设备及存储介质
CN102637255A (zh) 用于处理图像中包含的面部的方法和设备
CN105320948A (zh) 一种基于图像的性别识别方法、装置及系统
CN111797260A (zh) 基于图像识别的商标检索方法及系统
CN110866547B (zh) 基于多特征和随机森林的中药饮片自动分类系统及方法
CN111062345B (zh) 静脉识别模型的训练方法、装置和静脉图像识别装置
Li et al. A fingerprint indexing scheme with robustness against sample translation and rotation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant