CN108491715A - 终端指纹库的生成方法、装置和服务器 - Google Patents

终端指纹库的生成方法、装置和服务器 Download PDF

Info

Publication number
CN108491715A
CN108491715A CN201810088679.2A CN201810088679A CN108491715A CN 108491715 A CN108491715 A CN 108491715A CN 201810088679 A CN201810088679 A CN 201810088679A CN 108491715 A CN108491715 A CN 108491715A
Authority
CN
China
Prior art keywords
picture
terminal
fingerprint
information
index value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810088679.2A
Other languages
English (en)
Other versions
CN108491715B (zh
Inventor
郭相彬
漆昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
New H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Technologies Co Ltd filed Critical New H3C Technologies Co Ltd
Priority to CN201810088679.2A priority Critical patent/CN108491715B/zh
Publication of CN108491715A publication Critical patent/CN108491715A/zh
Application granted granted Critical
Publication of CN108491715B publication Critical patent/CN108491715B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/45Structures or tools for the administration of authentication

Abstract

本公开提供了一种终端指纹库的生成方法、装置和服务器;其中,该方法包括:从目标对象获取终端的常规指纹信息;常规指纹信息包括:文本指纹信息和/或协议栈指纹信息;根据常规指纹信息确定终端的身份信息;如果目标对象包含有表明终端身份的图片,获取图片的索引值;在图片指纹库中查找索引值是否存在匹配表项;如果该索引值不存在匹配表项,将终端的身份信息与索引值绑定为终端的图片指纹,并将图片指纹添加至图片指纹库。本公开通过设置图片指纹,可以在终端文本类资源发生更新变动,或者变更文本语言时,通过图片识别终端设备,保证指纹库的稳定性和实用性,进而提升终端识别的准确性。

Description

终端指纹库的生成方法、装置和服务器
技术领域
本公开涉及终端管理技术领域,尤其是涉及一种终端指纹库的生成方法、装置和服务器。
背景技术
所谓终端指纹通常包括终端的设备类型、操作系统类型和制造商信息等身份信息。就好像每一个人都会拥有一个独特的指纹一样,每一种终端也会具备自己独特的特性。而这些独特的特性,会在终端设备同外界通讯的行为中体现出来。通过跟踪终端通信行为,分析其特性,从而判断终端的身份信息,该终端的身份信息即可视为该终端的指纹。
网管服务器在进行终端管理时,通常从终端的WEB(World Wide Web,全球广域网)管理页面的文本类资源中查找该终端的身份信息(例如:终端的型号或终端使用的操作系统等信息),将这些身份信息与预先建立的指纹库进行匹配,从而识别该终端,进而对终端进行合理的管理或为终端提供相应的服务等。
而WEB管理页面中的文本类资源容易频繁更改,例如根据管理升级的需要,WEB管理页面会增加或删除某些内容,导致其文本类资源发生变动;或者因为使用需要,中文形式的WEB管理页面可能会转换为英文形式,也会发生文本类资源变动,因此,单纯依赖文本类资源进行终端识别的方式常常失效,无法根据文本资源识别出终端的身份信息,识别方式稳定性较差。
发明内容
有鉴于此,本公开的目的在于提供一种终端指纹库的生成方法、装置和服务器,以提高指纹库的稳定性,从而提高终端识别的准确性。
为了实现上述目的,本公开采用的技术方案如下:
第一方面,本公开提供了一种终端指纹库的生成方法,包括:从目标对象获取终端的常规指纹信息;其中,常规指纹信息包括:文本指纹信息和/或协议栈指纹信息;根据常规指纹信息确定终端的身份信息;如果目标对象包含有表明终端身份的图片,获取图片的索引值;在图片指纹库中查找索引值是否存在匹配表项;如果该索引值不存在匹配表项,将终端的身份信息与索引值绑定为终端的图片指纹,并将图片指纹添加至图片指纹库。
第二方面,本公开提供了一种终端指纹库的生成装置,包括:常规指纹信息获取模块,用于从目标对象获取终端的常规指纹信息;其中,常规指纹信息包括:文本指纹信息和/或协议栈指纹信息;身份信息确定模块,用于根据常规指纹信息确定终端的身份信息;索引值获取模块,用于如果目标对象包含有表明终端身份的图片,获取图片的索引值;查找模块,用于在图片指纹库中查找索引值是否存在匹配表项;绑定模块,用于如果索引值不存在匹配表项,将终端的身份信息与索引值绑定为终端的图片指纹,并将图片指纹添加至图片指纹库。
第三方面,本公开提供了一种服务器,包括存储器和处理器,其中,存储器用于存储一条或多条计算机指令,一条或多条计算机指令被处理器执行,以实现上述方法。
第四方面,本公开提供了一种机器可读存储介质,该机器可读存储介质存储有机器可执行指令,机器可执行指令在被处理器调用和执行时,机器可执行指令促使处理器实现上述方法。
上述终端指纹库的生成方法、装置、服务器和机器可读存储介质,能够在根据常规指纹信息确定终端的身份信息后,将表明终端身份的图片与该身份信息绑定为终端的图片指纹,即在常规指纹信息的基础上,又增加了图片指纹这一维度信息;由于终端的图片信息更新频率较低,图片指纹的信息也较为稳定,设置图片指纹可以在终端文本类资源发生更新变动,或者变更文本语言时,通过图片识别终端设备,保证指纹库的稳定性和实用性,进而提升了终端识别的准确性。
本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施方式,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施方式提供的一种终端指纹库的生成方法的流程图;
图2为本公开实施方式提供的另一种终端指纹库的生成方法的流程图;
图3为本公开实施方式提供的一种识别终端的方法的流程图;
图4为本公开实施方式提供的另一种识别终端的方法的流程图
图5为本公开实施方式提供的一种终端指纹库的生成装置的结构示意图;
图6为本公开实施方式提供的一种服务器的结构示意图。
具体实施方式
为使本公开实施方式的目的、技术方案和优点更加清楚,下面将结合附图对本公开的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本公开一部分实施方式,而不是全部的实施方式。基于本公开中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本公开保护的范围。
网络中诸如交换机、路由器、摄像头、打印机等终端,通常通过HTTP(HyperTextTransfer Protocol,超文本传输协议)服务与服务器连接,服务器可以远程对这些终端进行管理,例如服务器在接收到管理员输入的网段后,对该网段内的终端的WEB管理页面进行监控,从WEB管理页面获取终端的相关信息(如终端的厂商、型号等),根据这些信息制定管理策略。当然,服务器也可以通过其它途径获取终端的相关信息,例如提供HTTP协议之外的其它能够传输图片的协议获取或者通过第三方设备获取等。
服务器在访问终端的WEB管理页面时,可以采用NMAP(Network Mapper,网络映射器)获取WEB管理页面中的文本类资源,即TEXT文本类型的数据,使用预先建立的指纹库中的正则表达式对文本类资源进行分析,识别出终端,例如终端的厂商、产品、型号等。
上述正则表达式又称规则表达式,是计算机科学的一个概念,正则表达式是对字符串(包括普通字符(例如,a到z之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式,模式描述在搜索文本时要匹配的一个或多个字符串。
但是,WEB管理页面中的文本类资源容易频繁更改,例如根据管理升级的需要,WEB管理页面会增加或删除某些内容,导致其文本类资源发生变动;或者因为使用需要,中文形式的WEB管理页面可能会转换为英文形式,也会发生文本类资源变动;因此,单纯依赖文本类资源进行终端识别的方式常常失效,无法根据文本资源识别出终端的身份信息,识别方式稳定性较差。
为了弥补上述不足,从WEB管理页面挖掘信息时,除了考虑TEXT类数据,本实施方式还可以考虑其它类型资源,如IMAGE(图片类资源)、AUDIO(音频类资源)、VIDEO(视频类资源)等资源。考虑到IMAGE类数据出现在WEB管理页面的概率大于AUDIO、VIDEO等资源,另一方面WEB管理页面通常会包含表明终端身份的图片,而图片除了包括图片自身的数据(例如:图片的图形或像素数据等)之外,通常还包括一些附加数据(例如:图片的生成时间、图片来源哪种型号的终端、作者等),不同的终端,表明终端身份的图片不同,以终端的设备类型为例,表明设备类型的logo图片可以标识出该终端属于哪种类型。通过对图片的数据进行挖掘分析,可以确定终端厂商或终端的型号等重要信息。
因此本实施方式采用常规指纹信息和图片指纹相结合的方式进行终端识别。基于此,本公开实施方式提供了一种终端指纹库的生成方法、装置和服务器;该技术可以应用于服务器,该服务器用于对交换机、路由器、摄像头、打印机等终端进行识别和管理等;参见图1所示的一种终端指纹库的生成方法的流程图;该方法包括如下步骤:
步骤S102,从目标对象获取终端的常规指纹信息;其中,该常规指纹信息包括:文本指纹信息和/或协议栈指纹信息。
如果终端开启HTTP服务,服务器可以通过向终端发送常规指纹信息获取请求的方式,从终端的存储区获取常规指纹信息,服务器也可以在检测到终端启动WEB管理页面时,从该WEB管理页中提取常规指纹信息,即上述目标对象既可以为终端的存储区,也可以为终端的WEB管理页。
上述常规指纹信息可以保存于常规指纹库,该常规指纹库中可以包括根据文本指纹信息建立的文本指纹库和/或根据协议栈信息建立的协议栈指纹库,其中,这里的“和/或”指包括二者中的一个,或者二者同时包括。
该文本指纹信息即使用预先建立的文本指纹库中的正则表达式对终端的文本类资源进行分析得到的厂商、产品、型号等信息。终端设备的厂家或服务提供商在编写终端对应的TCP(Transmission Control Protocol,传输控制协议)/IP(Internet Protocol,网络之间互连的协议)协议栈时,通常会做出一些个性化的解释,这些解释即为终端的协议栈指纹;该协议栈指纹信息可以包括ACK(Acknowledgement,确认字符)序号、TOS(Type OfService,服务类型)、ICMP(Internet Control Message Protocol,控制报文协议)地址屏蔽请求等,这些协议栈指纹信息可以保存于协议栈指纹库中,当从终端的协议报文或者终端的WEB管理页面中挖掘出协议栈相关信息时,使用协议栈指纹库。
步骤S104,根据该常规指纹信息确定终端的身份信息。
上述终端的身份信息可以为厂商、产品信息、型号信息中的任意一个或多个,有时还可以包含图片的URL(统一资源定位符,Uniform Resource Locator)信息。这些信息可以手动配置,也可以通过机器学习的方式自动生成。
步骤S106,如果上述目标对象包含有表明终端身份的图片,获取图片的索引值。
该图片对应的索引值可以为图片本身或基于图片得到的数值。图片本身作为索引值的方式实现简单,但是图片本身数据量相对较大,可能会导致后续查找和存储该图片指纹的开销大。基于图片得到的数值作为索引值的方式中,可以对该图片的数据进行运算生成摘要值、特征向量等数值,将该值作为图片的索引值。摘要值、特征向量等可以通过图片本身数据、以及图片的附加数据计算获得,该值通常与图片一一对应。这种数值形式的索引值数据量较小,可以在保证图片指纹准确性的同时,降低查找、存储等开销,便于终端的快速识别。
步骤S108,在图片指纹库中查找该索引值是否存在匹配表项。
步骤S110,如果该索引值不存在匹配表项,将终端的身份信息与索引值绑定为终端的图片指纹,并将图片指纹添加至图片指纹库。
例如,对于终端A,常规指纹库的识别结果为:厂商:x1,型号信息:t1,产品信息:p1;而对来源于该终端A的图片计算索引值,通过该索引值在当前的图片指纹库中查询的结果为空值,则将上述“厂商:x1,型号信息:t1,产品信息:p1”,添加至图片指纹库中,具体添加在与终端A的图片计算出的索引值对应的位置。这样,生成了终端的图片指纹后,即使该终端的文本类资源发生变更,或者变换语言(例如,由中文版本变换成英文版本),应用图片指纹依然可以识别终端的身份。
上述终端指纹库的生成方法,能够在根据常规指纹信息确定终端的身份信息后,将表明终端身份的图片与该身份信息绑定为终端的图片指纹,即在常规指纹信息的基础上,又增加了图片指纹这一维度信息;由于终端的图片信息更新频率较低,图片指纹的信息也较为稳定,设置图片指纹可以在终端文本类资源发生更新变动,或者变更文本语言时,通过图片识别终端设备,保证指纹库的稳定性和实用性,进而提升了终端识别的准确性。
本公开实施方式还提供了另一种终端指纹库的生成方法,该方法以目标对象为终端的Web管理页面,且该Web管理页面中包含有表明终端身份的图片为例进行说明;如图2所示,该方法包括如下步骤:
步骤S202,从Web管理页面获取终端的常规指纹信息,其中,该常规指纹信息包括:文本指纹信息和/或协议栈指纹信息。
步骤S204,根据该常规指纹信息确定终端的身份信息。
上述文本指纹信息和协议栈指纹信息可以分别用于查找文本指纹库和协议栈指纹库,将查找结果作为各自的识别结果保存。实际使用时,可以仅采用文本指纹信息或协议栈指纹信息中的任何一个,也可以二者同时使用。如果二者同时使用,可以对文本指纹信息和协议栈指纹信息各自的识别结果进行合并处理,合并处理后的识别结果统一作为常规指纹信息的识别结果。
例如,对于终端C,从文本指纹信息中查询到“厂商:x3”,而型号信息和产品信息为空值,从协议栈指纹信息中查询到“型号信息:t3,产品信息:p3”;则可以将这些信息进行综合处理,得到最终的身份信息“厂商:x3,型号信息:t3,产品信息:p3”。
步骤S206,将Web管理页面中包含第一预设关键字的图片作为表明终端身份的图片;或者,从Web管理页面中去除包含第二预设关键字的图片,将剩余的图片作为表明终端身份的图片。
Web管理页面中包含有大量的图片,根据各个图片的用途,Web管理页面的网页代码中会对每个图片设置关键字,依据该关键字对图片进行命名;在这些大量的图片中,可能仅有一部分图片可以表明终端身份,为了识别出这些图片,其中一种方式中,可以将Web管理页面中包含第一预设关键字的图片作为表明终端身份的图片;该第一预设关键字可以为logo(商标)、vendor(厂商)或者copyright(版权)等;包含有第一预设关键字的图片通常带有该终端设备的身份信息,因此,可以作为表明终端身份的图片。
在另一种实施方式中,还可以从Web管理页面中去除包含第二预设关键字的图片,将剩余的图片作为表明终端身份的图片;该第二预设关键字可以为button(按钮)、background(背景)等。包含有第二预设关键字的图片通常为各终端Web管理页面通用图片,不具有该终端设备的身份信息,通过去除包含第二预设关键字的图片,可以提高图片指纹的可靠性以及终端识别效率。
步骤S208,对上述图片的图片数据进行运算,得到图片的摘要值;将摘要值作为图片的索引值。该摘要值可以为MD5(Message Digest Algorithm,消息摘要算法)值,也可以为其他密码算法的消息摘要值。
步骤S210,在图片指纹库中查找索引值是否存在匹配表项;如果是,执行步骤S212;如果否,执行步骤S214。
步骤S212,综合匹配表项中终端的身份信息,以及根据常规指纹信息确定的终端的身份信息,得出终端的识别结果。
用户可以预先选择识别终端的指纹信息类型,根据指纹信息类型加载相应的指纹库、以及对应的探测规则,该探测规则可以通过NMAP设置;加载完毕后,向终端发送探测报文,以获取指纹信息;例如,采用三种指纹信息进行识别时,NMAP需要同时获取该终端的表明终端身份的图片、文本指纹信息和协议栈指纹信息,进而分别进行处理,得到相应的身份信息,最后综合这些身份信息,获得最终的识别结果。
综合这些身份信息的过程相当于将各种方式得到的识别结果进行合并处理,合并过程中,重合的信息保留一份,不重合的都保留。如果同是终端的设备类型有两个不同的识别结果,可以均保留,供用户自行分析该终端的设备类型应该是哪个。综合处理过程具体包括:如果图片指纹库中得到终端的身份信息,与常规指纹信息相同,则将其中任一种作为最终的识别结果;如果图片指纹库中没有该终端的身份信息,而常规指纹信息有,则将该常规指纹信息作为最终的识别结果;如果图片指纹库中可以得到该终端的身份信息,而常规指纹信息没有,则将图片指纹库中可以得到的身份信息作为最终的识别结果;如果图片指纹库中与常规指纹信息中均没有该终端的身份信息,则可以返回识别失败的信息,以使用户知晓。
步骤S214,根据常规指纹信息确定的终端的身份信息,得出终端的识别结果;
步骤S216,将终端的身份信息与索引值绑定为终端的图片指纹,并将图片指纹添加至图片指纹库。
上述步骤S214和步骤S216可以按顺序执行,或同时执行,也可以先执行步骤S216,再执行步骤S214。
如果上述目标对象包含有多个表明终端身份的图片(即图片个数大于1),且至少有一个图片的索引值在图片指纹库中存在匹配表项,根据匹配表项中终端的身份信息为没有匹配表项的其余图片生成图片指纹,将其余图片的图片指纹存储于图片指纹库。例如,如果从同一个WEB管理页中提取的表明终端身份的图片为三个,分别为图片1、图片2和图片3,其中,图片1和图片2在图片指纹库中均存在匹配表项,而图片3没有匹配表项,此时,可以将图片1或图片2的匹配表项中的终端身份信息与图片3的索引值进行绑定,得到该图片3的图片指纹,将该图片指纹存储于图片指纹库中。
具体举例:对于来源于终端B的图片1和图片2,对图片1计算索引值,通过该索引值在当前的图片指纹库中查询的结果为“厂商:x2,型号信息:t2,产品信息:p2”;对图片2计算索引值,通过该索引值在当前的图片指纹库中查询的结果为空值;由于图片1和图片2来源于同一设备B,则将上述“厂商:x2,型号信息:t2,产品信息:p2”,添加至图片指纹库中,图片2的索引值对应的位置。
上述针对同一终端建立多条图片指纹,即使终端的图片资源发生更新,只要存在其中一个图片没有更新,即可根据该图片进行识别,进而再根据该图片,对更新后的图片也生成指纹信息。
本实施方式中结合了常规指纹信息的识别结果生成图片指纹库,如果后续Web管理页面中的文本指纹信息或协议栈指纹信息发生变化,导致无法通过文本指纹信息或协议栈指纹信息得到终端的身份信息,而此时如果Web管理页面中表明终端身份的图片未发生变化,则还可以通过该图片和图片指纹库得到终端的身份信息,保证了终端识别的稳定性和可靠性。
下述表1为图片指纹库的一种实现形式;其中,索引值为图片的MD5值。
表1
该实现形式的图片指纹库中,图片的MD5值是根据图片本身的数据和附加数据生成的,该附加数据包括图片的生成时间、来源(例如,拍摄终端的型号、photoshop生成)、作者等;图片指纹库的这种实现形式逻辑简单且易于实现,同时也便于扩展到任何类型的HTTP资源。
图片指纹库还可以采用另外一种实现形式,即图片指纹库包括多个子指纹库,每个子指纹库中保存同种图片格式(例如,一个子指纹库中保存png格式的图片、另一个子指纹库中保存jpg格式的图片)所对应的图片指纹,图片的MD5值仅是针对包含图片本身的数据生成的,计算MD5值时不再引入图片的附加数据。这种计算MD5值的过程中,需要分离图片的附加数据和图片本身的数据,该分离过程的开销可能较大,后续使用该图片指纹过程中也需要进行上述数据的分离,相比于表1对应的图片指纹库,这种实现形式的指纹库的计算量较大,实际应用可以根据服务器的性能和精度要求选择指纹库的具体形式。
上述方法中,从Web管理页面中提取表明终端身份的图片,将图片的摘要值与常规指纹信息中对应终端的身份信息绑定,得到该终端的图片指纹,并存储于图片指纹库中;通过该方式,服务器可以获得终端的图片指纹,丰富了终端的指纹库的指纹类型,使指纹库信息更加全面,从而可以提高后续终端识别的精确度;同时,由于终端的图片信息更新频率较低,图片指纹的信息也较为稳定,不必频繁更新指纹库,降低了指纹库的维护成本。
同时,上述方法通过常规指纹信息建立终端的图片指纹库,可以避免人工建立图片指纹库所需的繁琐操作,导致浪费大量人力成本,从而降低了指纹库的建立成本,提高了建库效率。
对应于上述终端指纹库的生成方法,本发明实施方式还提供了一种识别终端的方法;如图3所示,该方法包括如下步骤:
步骤S302,获取表明终端身份的图片;例如,服务器需要识别终端D时,通过上述可知,可以获取表明该终端身份的图片,这些图片通常包含有终端D的厂商logo、产品信息、型号信息等信息。
步骤S304,获取图片对应的索引值。
其中,该图片对应的索引值可以为图片本身,也可以为根据该图片的数据生成的摘要值、特征向量等数值形式的索引值。
步骤S306,根据索引值查找图片指纹库,获取终端的身份信息,其中,图片指纹库包括索引值与终端的身份信息之间的对应关系。
上述识别终端的方法,获取表明终端身份的图片,进一步的,根据终端身份的图片计算索引值,再根据该图片对应的索引值查找图片指纹库,若存在与索引值匹配的表项,则得到终端的身份信息。该方式丰富了用于识别终端的指纹类型,提高了终端识别的精确度。
本公开还提供了另一种终端指纹的生成方法,该方法中,根据常规指纹信息和图片指纹的综合结果识别终端,同时根据常规指纹信息更新图片指纹库,以进一步提高终端识别的精确度,使指纹库更加全面、准确。
如图4所示,该方法包括如下步骤:
步骤S402,获取终端的Web管理页面,从Web管理页面中提取表明终端身份的图片。
步骤S404,从Web管理页面中提取终端的常规指纹信息,该常规指纹信息包括:文本指纹信息和/或协议栈指纹信息。
步骤S405,获取常规指纹信息对应的识别结果。
步骤S406,获取图片对应的索引值;根据索引值查找预存的图片指纹库。
步骤S408,判断该图片指纹库是否有该索引值对应的匹配表项;如果是,执行步骤S410;如果否,执行步骤S414。
步骤S410,根据查询结果得到终端的身份信息。
步骤S412,综合图片指纹库中得到终端的身份信息,以及常规指纹信息对应的识别结果,得出终端的识别结果。
步骤S414,将常规指纹信息对应的识别结果作为索引值对应的终端的身份信息。
步骤S416,将终端的身份信息与索引值绑定为终端的图片指纹。
步骤S418,将终端的图片指纹存储于图片指纹库。
如果经查询后,该图片指纹库中没有该索引值对应的匹配表项,服务器可以通过上述步骤S414-S418对图片指纹库进行更新,以进一步完善该图片指纹库。
对应于上述方法实施方式,参见图5所示的一种终端指纹库的生成装置的结构示意图;该装置包括:
常规指纹信息获取模块50,用于从目标对象获取终端的常规指纹信息;其中,常规指纹信息包括:文本指纹信息和/或协议栈指纹信息;
身份信息确定模块51,用于根据常规指纹信息确定终端的身份信息;
索引值获取模块52,用于如果目标对象包含有表明终端身份的图片,获取图片的索引值;
查找模块53,用于在图片指纹库中查找索引值是否存在匹配表项;
绑定模块54,用于如果索引值不存在匹配表项,将终端的身份信息与索引值绑定为终端的图片指纹,并将图片指纹添加至图片指纹库。
上述目标对象为终端的Web管理页面;上述装置还包括:图片获取模块,用于将Web管理页面中包含第一预设关键字的图片作为表明终端身份的图片;或者,从Web管理页面中去除包含第二预设关键字的图片,将剩余的图片作为表明终端身份的图片。
上述装置还包括:图片指纹生成模块,用于如果目标对象包含有多个表明终端身份的图片,且至少有一个图片的索引值在图片指纹库中存在匹配表项,根据匹配表项中终端的身份信息为没有匹配表项的其余图片生成图片指纹,将其余图片的图片指纹存储于图片指纹库。
上述索引值获取模块,还用于:对图片的图片数据进行运算,得到图片的摘要值;将摘要值作为图片的索引值。
上述装置还包括:识别结果生成模块,用于如果在图片指纹库中查找到索引值的匹配表项,综合匹配表项中终端的身份信息,以及根据常规指纹信息确定的终端的身份信息,得出终端的识别结果。
上述终端指纹库的生成装置,能够在根据常规指纹信息确定终端的身份信息后,将表明终端身份的图片与该身份信息绑定为终端的图片指纹,即在常规指纹信息的基础上,又增加了图片指纹这一维度信息;由于终端的图片信息更新频率较低,图片指纹的信息也较为稳定,设置图片指纹可以在终端文本类资源发生更新变动,或者变更文本语言时,通过图片识别终端设备,保证指纹库的稳定性和实用性,进而提升了终端识别的准确性。
本实施方式提供了一种与上述方法实施方式相对应的一种服务器。图6为该服务器的结构示意图,如图6所示,该设备包括存储器100和处理器101;其中,存储器100用于存储一条或多条计算机指令,一条或多条计算机指令被处理器执行,以实现上述终端指纹库的生成方法,该方法可以包括以上方法中的一种或多种。
进一步,图6所示的服务器还包括总线102和通信接口103,处理器101、通信接口103和存储器100通过总线102连接。
其中,存储器100可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口103(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线102可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器101可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器101可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本公开实施方式中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本公开实施方式所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器100,处理器101读取存储器100中的信息,结合其硬件完成前述实施方式的方法的步骤。
本发明实施方式还提供了一种机器可读存储介质,该机器可读存储介质存储有机器可执行指令,该机器可执行指令在被处理器调用和执行时,机器可执行指令促使处理器实现上述终端指纹库的生成方法,具体实现可参见方法实施方式,在此不再赘述。
本发明实施方式所提供的服务器,其实现原理及产生的技术效果和前述方法实施方式相同,为简要描述,装置实施方式部分未提及之处,可参考前述方法实施方式中相应内容。
在本申请所提供的几个实施方式中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施方式仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施方式的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施方式中的各功能模块或单元可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施方式,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施方式对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施方式所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施方式技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

Claims (11)

1.一种终端指纹库的生成方法,其特征在于,包括:
从目标对象获取终端的常规指纹信息;其中,所述常规指纹信息包括:文本指纹信息和/或协议栈指纹信息;
根据所述常规指纹信息确定所述终端的身份信息;
如果所述目标对象包含有表明终端身份的图片,获取所述图片的索引值;
在图片指纹库中查找所述索引值是否存在匹配表项;
如果所述索引值不存在匹配表项,将所述终端的身份信息与所述索引值绑定为所述终端的图片指纹,并将所述图片指纹添加至所述图片指纹库。
2.根据权利要求1所述的方法,其特征在于,所述目标对象为终端的Web管理页面;所述方法还包括:将所述Web管理页面中包含第一预设关键字的图片作为表明终端身份的图片;或者,
从所述Web管理页面中去除包含第二预设关键字的图片,将剩余的图片作为表明终端身份的图片。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述目标对象包含有多个表明终端身份的图片,且至少有一个图片的索引值在所述图片指纹库中存在匹配表项,根据所述匹配表项中所述终端的身份信息为没有匹配表项的其余图片生成图片指纹,将所述其余图片的图片指纹存储于所述图片指纹库。
4.根据权利要求1所述的方法,其特征在于,所述获取所述图片的索引值的步骤,包括:
对所述图片的图片数据进行运算,得到所述图片的摘要值;
将所述摘要值作为所述图片的索引值。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:如果在所述图片指纹库中查找到所述索引值的匹配表项,综合所述匹配表项中所述终端的身份信息,以及根据所述常规指纹信息确定的所述终端的身份信息,得出所述终端的识别结果。
6.一种终端指纹库的生成装置,其特征在于,包括:
常规指纹信息获取模块,用于从目标对象获取终端的常规指纹信息;其中,所述常规指纹信息包括:文本指纹信息和/或协议栈指纹信息;
身份信息确定模块,用于根据所述常规指纹信息确定所述终端的身份信息;
索引值获取模块,用于如果所述目标对象包含有表明终端身份的图片,获取所述图片的索引值;
查找模块,用于在图片指纹库中查找所述索引值是否存在匹配表项;
绑定模块,用于如果所述索引值不存在匹配表项,将所述终端的身份信息与所述索引值绑定为所述终端的图片指纹,并将所述图片指纹添加至所述图片指纹库。
7.根据权利要求6所述的装置,其特征在于,所述目标对象为终端的Web管理页面;所述装置还包括:图片获取模块,用于将所述Web管理页面中包含第一预设关键字的图片作为表明终端身份的图片;或者,
从所述Web管理页面中去除包含第二预设关键字的图片,将剩余的图片作为表明终端身份的图片。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:图片指纹生成模块,用于如果所述目标对象包含有多个表明终端身份的图片,且至少有一个图片的索引值在所述图片指纹库中存在匹配表项,根据所述匹配表项中所述终端的身份信息为没有匹配表项的其余图片生成图片指纹,将所述其余图片的图片指纹存储于所述图片指纹库。
9.根据权利要求6所述的装置,其特征在于,所述索引值获取模块,还用于:
对所述图片的图片数据进行运算,得到所述图片的摘要值;
将所述摘要值作为所述图片的索引值。
10.根据权利要求6-9任一项所述的装置,其特征在于,所述装置还包括:识别结果生成模块,用于如果在所述图片指纹库中查找到所述索引值的匹配表项,综合所述匹配表项中所述终端的身份信息,以及根据所述常规指纹信息确定的所述终端的身份信息,得出所述终端的识别结果。
11.一种服务器,其特征在于,包括存储器和处理器,其中,所述存储器用于存储一条或多条计算机指令,所述一条或多条计算机指令被所述处理器执行,以实现权利要求1至5任一项所述的方法。
CN201810088679.2A 2018-01-29 2018-01-29 终端指纹库的生成方法、装置和服务器 Active CN108491715B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810088679.2A CN108491715B (zh) 2018-01-29 2018-01-29 终端指纹库的生成方法、装置和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810088679.2A CN108491715B (zh) 2018-01-29 2018-01-29 终端指纹库的生成方法、装置和服务器

Publications (2)

Publication Number Publication Date
CN108491715A true CN108491715A (zh) 2018-09-04
CN108491715B CN108491715B (zh) 2020-12-08

Family

ID=63343862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810088679.2A Active CN108491715B (zh) 2018-01-29 2018-01-29 终端指纹库的生成方法、装置和服务器

Country Status (1)

Country Link
CN (1) CN108491715B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109802972A (zh) * 2019-03-13 2019-05-24 唐萍 一种局域网联网智能设备检测系统
CN109889487A (zh) * 2018-12-29 2019-06-14 北京奇安信科技有限公司 外部设备接入终端的处理方法及装置
CN110162959A (zh) * 2019-05-31 2019-08-23 北京顶象技术有限公司 基于设备指纹的数据处理方法及装置
CN111538925A (zh) * 2020-04-09 2020-08-14 支付宝(杭州)信息技术有限公司 统一资源定位符url指纹特征的提取方法及装置
CN113472813A (zh) * 2021-09-02 2021-10-01 浙江齐安信息科技有限公司 一种安防资产识别方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103929644A (zh) * 2014-04-01 2014-07-16 Tcl集团股份有限公司 一种视频指纹库建立、视频指纹识别方法及装置
US20160294876A1 (en) * 2015-04-06 2016-10-06 Lawlitt Life Solutions, LLC Unique graphic identifier
CN107292154A (zh) * 2017-06-09 2017-10-24 北京奇安信科技有限公司 一种终端特征识别方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103929644A (zh) * 2014-04-01 2014-07-16 Tcl集团股份有限公司 一种视频指纹库建立、视频指纹识别方法及装置
US20160294876A1 (en) * 2015-04-06 2016-10-06 Lawlitt Life Solutions, LLC Unique graphic identifier
CN107292154A (zh) * 2017-06-09 2017-10-24 北京奇安信科技有限公司 一种终端特征识别方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109889487A (zh) * 2018-12-29 2019-06-14 北京奇安信科技有限公司 外部设备接入终端的处理方法及装置
CN109802972A (zh) * 2019-03-13 2019-05-24 唐萍 一种局域网联网智能设备检测系统
CN110162959A (zh) * 2019-05-31 2019-08-23 北京顶象技术有限公司 基于设备指纹的数据处理方法及装置
CN111538925A (zh) * 2020-04-09 2020-08-14 支付宝(杭州)信息技术有限公司 统一资源定位符url指纹特征的提取方法及装置
CN111538925B (zh) * 2020-04-09 2023-05-02 支付宝(中国)网络技术有限公司 统一资源定位符url指纹特征的提取方法及装置
CN113472813A (zh) * 2021-09-02 2021-10-01 浙江齐安信息科技有限公司 一种安防资产识别方法及系统

Also Published As

Publication number Publication date
CN108491715B (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
CN108491715A (zh) 终端指纹库的生成方法、装置和服务器
US10050986B2 (en) Systems and methods for traffic classification
US9280561B2 (en) Automatic learning of logos for visual recognition
US20090049062A1 (en) Method for Organizing Structurally Similar Web Pages from a Web Site
CN105721629B (zh) 用户标识匹配方法和装置
CN108399180B (zh) 一种知识图谱构建方法、装置及服务器
CN111897962B (zh) 一种物联网资产标记方法及装置
EP2291812A2 (en) Forum web page clustering based on repetitive regions
CN111310074B (zh) 兴趣点的标签优化方法、装置、电子设备和计算机可读介质
CN110007906B (zh) 脚本文件的处理方法、装置和服务器
CN109104421B (zh) 一种网站内容篡改检测方法、装置、设备及可读存储介质
CN110515896B (zh) 模型资源管理方法、模型文件制作方法、装置和系统
JP2008090403A (ja) 文書検索装置、文書検索方法および文書検索プログラム
CN109145110A (zh) 基于标签的信息分类处理、标签查询方法和装置
WO2014029318A1 (en) Method and apparatus for identifying webpage type
TW202016758A (zh) 知識圖譜產生裝置、方法及其電腦程式產品
KR102133950B1 (ko) 지오로케이트된 이미지를 이용한 사업체 앵커링
CN109753517A (zh) 一种信息查询的方法、装置、计算机存储介质及终端
US20090204889A1 (en) Adaptive sampling of web pages for extraction
CN110209780A (zh) 一种问题模板生成方法、装置、服务器及存储介质
US20220109692A1 (en) Automatic generation of deceptive api endpoints
CN106547764A (zh) 网页数据去重的方法及装置
CN110413861B (zh) 基于网络爬虫的链接提取方法、装置、设备及存储介质
CN107862016A (zh) 一种专题页面的配置方法
CN111752922A (zh) 一种建立知识数据库、实现知识查询的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant