CN116304901B - 一种网页服务器指纹识别方法、装置、设备和存储介质 - Google Patents
一种网页服务器指纹识别方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN116304901B CN116304901B CN202310125944.0A CN202310125944A CN116304901B CN 116304901 B CN116304901 B CN 116304901B CN 202310125944 A CN202310125944 A CN 202310125944A CN 116304901 B CN116304901 B CN 116304901B
- Authority
- CN
- China
- Prior art keywords
- response
- web server
- fingerprint
- features
- key features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000004044 response Effects 0.000 claims abstract description 119
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 238000012512 characterization method Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/22—Parsing or analysis of headers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Information Transfer Between Computers (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明提供了一种网页服务器指纹识别方法、装置、设备和存储介质,所述方法包括:收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果。本发明能够降低网页服务器指纹特征的冗余性和人工成本,增强了网页服务器指纹特征的维护性,降低网页服务器指纹匹配时的计算复杂程度以及在网页服务器指纹识别匹配阶段所用的时间,提高网页服务器指纹匹配的效率。
Description
技术领域
本发明涉及网页服务器指纹识别技术领域,具体涉及一种网页服务器指纹识别方法、装置设备和存储介质。
背景技术
Web Server中文名称叫网页服务器或Web服务器,它的主要功能是提供网上信息浏览服务。网页服务器指纹识别的目的是识别网站背后依赖的网页服务器,进而对网站可能隐藏的漏洞风险及时进行预防和修复。网页服务器指纹识别的过程可以分为指纹的采集和分类两个子过程。在收集指纹时,必须捕获指纹中显示的对象的所有关键特征,否则可能会出现指纹匹配不正确的情况,因为细微的差异很容易被误认,而捕获更多细节和特征有助于网页服务器分类。传统网页服务器指纹识别方法严重依赖人工构造的规则库进行指纹规则匹配,即未知指纹与存储的已知指纹数据库的比较,选择与之最匹配的指纹作为网站的网页服务器指纹。当指纹库存在大量规则时由于指纹匹配的时间复杂随指纹规则数量线性增长,分类时间也会不断增加,反之,由于相关指纹规则不存在可能导致大量的误报。因此传统网页服务器指纹识别存在严重依赖人工指纹库,导致整理和维护指纹规则的成本太大以及网页服务器指纹识别的时间线性增加的问题。
发明内容
鉴于上述问题,本发明实施例提供一种网页服务器指纹识别方法、装置设备和存储介质,解决现有的技术问题。
为解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供一种网页服务器指纹识别方法,所述方法包括:
收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;
利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果。
一实施例中,所述收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征包括:
构建不同的HTTP请求包;
收集目标网页服务器对不同的HTTP请求包返回的响应头和响应体信息;
提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征;
利用自编码器对量化特征进行表征学习,得到关键特征。
一实施例中,所述不同的HTTP请求包的构建方法包括:
通过HEAD/Http/1.0发送基本的Http请求;
通过DELETE/Http/1.0发送不被允许的Delete请求;
通过GET/Http/3.0发送非法版本的Http协议请求;
通过GET/JUNK/1.0发送不正确规格的Http协议请求;
通过HEAD/Http/1.0发送404请求。
一实施例中,所述提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征包括:
统计不同HTTP请求包目标网页服务器返回的响应体信息中关键词的比例,选择与网页服务器类别相关的关键词,得到响应体特征;
统计不同HTTP请求包目标网页服务器返回的响应头信息包含的字段,排除与网页服务器类别不相关的字段,得到响应头特征;
将响应体特征与响应头特征拼接,得到字段特征;
统计响应信息中响应体特征、响应头特征和字段特征的出现频次作为特征的权重值,得到量化特征。
一实施例中,所述利用自编码器对量化特征进行表征学习,得到关键特征包括:
利用编码器对量化特征进行表征学习,获取压缩后的潜在空间指纹表征向量;
利用解码器重构来自编码器的潜在空间指纹表征向量,得到关键特征。
一实施例中,所述编码器和解码器均采用六层的前馈神经网络。
一实施例中,所述利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果包括:
统计关键特征在已知网页服务器邻近特征空间范围内网页服务器类别的数量;
选择网页服务器类别数量最多的类别作为目标网页服务器的类别,完成目标网页服务指纹识别。
第二方面,本发明提供一种网页服务器指纹识别装置,所述装置包括:
特征提取模块:用于收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;
指纹识别模块:用于利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果。
一实施例中,特征提取模块包括:
构建不同的HTTP请求包;
收集目标网页服务器对不同的HTTP请求包返回的响应头和响应体信息;
提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征;
利用自编码器对量化特征进行表征学习,得到关键特征。
一实施例中,所述特征提取模块中不同的HTTP请求包的构建方法包括:
通过HEAD/Http/1.0发送基本的Http请求;
通过DELETE/Http/1.0发送不被允许的Delete请求;
通过GET/Http/3.0发送非法版本的Http协议请求;
通过GET/JUNK/1.0发送不正确规格的Http协议请求;
通过HEAD/Http/1.0发送404请求。
一实施例中,所述特征提取模块中提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征包括:
统计不同HTTP请求包目标网页服务器返回的响应体信息中关键词的比例,选择与网页服务器类别相关的关键词,得到响应体特征;
统计不同HTTP请求包目标网页服务器返回的响应头信息包含的字段,排除与网页服务器类别不相关的字段,得到响应头特征;
将响应体特征与响应头特征拼接,得到字段特征;
统计响应信息中响应体特征、响应头特征和字段特征的出现频次作为特征的权重值,得到量化特征。
一实施例中,所述特征提取模块中利用自编码器对量化特征进行表征学习,得到关键特征包括:
利用编码器对量化特征进行表征学习,获取压缩后的潜在空间指纹表征向量;
利用解码器重构来自编码器的潜在空间指纹表征向量,得到关键特征。
一实施例中,所述特征提取模块中编码器和解码器均采用六层的前馈神经网络。
一实施例中,所述指纹识别模块包括:
统计关键特征在已知网页服务器邻近特征空间范围内网页服务器类别的数量;
选择网页服务器类别数量最多的类别作为目标网页服务器的类别,完成目标网页服务指纹识别。
第三方面,本发明提供一种电子设备,包括:
处理器、存储器、与网关通信的接口;
存储器用于存储程序和数据,所述处理器调用存储器存储的程序,以执行第一方面提供的一种网页服务器指纹识别方法。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质包括程序,所述程序在被处理器执行时用于执行第一方面任一项提供的一种网页服务器指纹识别方法。
从上述描述可知,本发明通过收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;之后利用KNN算法基于关键特征识别目标网页服务器的类别,即可得到目标网页服务器指纹的识别结果。其能够降低网页服务器指纹特征的冗余性和人工成本,增强了网页服务器指纹特征的维护性,降低网页服务器指纹匹配时的计算复杂程度以及在网页服务器指纹识别匹配阶段所用的时间,提高网页服务器指纹匹配的效率。
附图说明
图1所示为本发明一实施例提供的网页服务器指纹识别方法的流程示意图;
图2所示为本发明一实施例提供的网页服务器指纹识别装置的结构示意图;
图3所示为本发明一实施例提供电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明白,以下结合附图及具体实施方式对本发明作进一步说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的一种网页服务器指纹识别方法的具体实施方式,如图1所示,该方法具体如下步骤包括:
第一方面,本发明提供一种网页服务器指纹识别方法,该方法包括:
S110:收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征。
具体地,不同网站背后的技术栈千差万别,例如后端框架、前端框架、waf、cdn等等,特定的网页服务器针对相同的HTTP请求包,由于其他技术栈的不同其响应信息也可能存在较大差异,另外不同的网页服务器针对相同的HTTP请求包包,其部分响应信息也会可能相同。因此可构建构建不同的HTTP请求包,测试得到不同的相应信息,使得响应信息能够全方位的体现网页服务器的特征。
更为具体地,HTTP请求包可以通过下述方式构建:
1.通过HEAD/Http/1.0发送基本的Http请求。
2.通过DELETE/Http/1.0发送不被允许的Delete请求。
3.通过GET/Http/3.0发送非法版本的Http协议请求。
4.通过GET/JUNK/1.0发送不正确规格的Http协议请求。
5.通过HEAD/Http/1.0发送404请求。
通过以上请求包的发送,目标网页服务器均会返回相应信息。其中相应信息包括响应头和响应体信息。响应头用于指示客户端如何处理响应体,告诉浏览器响应的类型、字符编码和字节大小等信息。响应体跟在响应头之后就是Web服务器发送到客户端的实际内容,此外响应体还可以是诸如Word、Excel或PDF等其他类型的文档,具体是哪种文档类型由Content-Type指定的MIME类型决定。因此通过向目标服务器发送不同的HTTP请求即可收集到目标网页服务器对不同的HTTP请求包返回的响应头和响应体信息。
为了统一模型的输入,可以提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征。
其特征量化的具体步骤如下:
首先,统计不同HTTP请求包目标网页服务器返回的响应体信息中关键词的比例,选择与网页服务器类别相关的关键词,得到响应体特征;
其次,统计不同HTTP请求包目标网页服务器返回的响应头信息包含的字段,排除与网页服务器类别不相关的字段,得到响应头特征;
然后,将响应体特征与响应头特征拼接,得到字段特征;
最后,统计响应信息中响应体特征、响应头特征和字段特征的出现频次作为特征的权重值,得到量化特征。
在此步骤中,量化特征可以通过TF-IDF方法获取,对采集的相应信息进行统一量化,可以排除与网页服务器指纹识别不相关的信息,降低网页服务器指纹特征的冗余性,降低网页服务器指纹识别匹配阶段所用的时间,增强网页服务器指纹特征的维护性。
基于量化后的特征数据可以通过学习网页服务器的表征向量,进而区分目前服务器与其它网页服务器的差异,可以利用自编码器对量化特征进行表征学习,得到关键特征。
具体地,可以利用编码器对量化特征进行表征学习,获取压缩后的潜在空间指纹表征向量;
利用解码器重构来自编码器的潜在空间指纹表征向量,得到关键特征。
在上述过程中,基于自编码器可以从量化特征中进行无监督学习,在最小损失信息的情况下,将原始输入学习压缩到较低维度上,其目标函数为平均绝对误差损失。自编码器生成了较低维度网页服务器指纹特征表示,减小了训练难度和人工标注数据量。另外需要说明的是:编码器和解码器均采用六层的前馈神经网络,因此编码器和解码器均具有一个输入层、一个输出层和四个隐藏层,通过四个隐藏层可以网页服务器潜在的空间信息,增大感受域,使得到的关键特征包含的特征更加丰富具体,有利于提高网页服务器指纹识别的准确度。
S120:利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果。
具体地,首先需要统计关键特征在已知网页服务器邻近特征空间范围内网页服务器类别的数量;
之后选择网页服务器类别数量最多的类别作为目标网页服务器的类别,完成目标网页服务指纹识别。
在此步骤中,提供了基于KNN算法解决最终的网页服务器指纹识别,将已知网页服务器类别作为训练数据集,将目标网页服务器的类别作为输入实例,通过统计输入实例特征空间范围内不同网页服务器类别的数量,将网页服务器类别数量最多的类别作为目标网页服务器的类别,从而完成网页服务器指纹的识别。
综上所述,本发明实施能够降低网页服务器指纹特征的冗余性和人工成本,增强了网页服务器指纹特征的维护性,降低网页服务器指纹匹配时的计算复杂程度以及在网页服务器指纹识别匹配阶段所用的时间,提高网页服务器指纹匹配的效率。
基于同一发明构思,本申请实施例还提供了一种网页服务器指纹识别装置,可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于装置解决问题的原理与方法相似,因此装置的实施可以参见方法实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本发明提供的一种网页服务器指纹识别装置,如图2所示。在图2中该装置包括:
特征提取模块210:用于收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;
指纹识别模块220:用于利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果。
在本发明一实施例中,特征提取模块210包括:
构建不同的HTTP请求包;
收集目标网页服务器对不同的HTTP请求包返回的响应头和响应体信息;
提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征;
利用自编码器对量化特征进行表征学习,得到关键特征。
在本发明一实施例中,特征提取模块210中不同的HTTP请求包的构建方法包括:
通过HEAD/Http/1.0发送基本的Http请求;
通过DELETE/Http/1.0发送不被允许的Delete请求;
通过GET/Http/3.0发送非法版本的Http协议请求;
通过GET/JUNK/1.0发送不正确规格的Http协议请求;
通过HEAD/Http/1.0发送404请求。
在本发明一实施例中,特征提取模块210中提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征包括:
统计不同HTTP请求包目标网页服务器返回的响应体信息中关键词的比例,选择与网页服务器类别相关的关键词,得到响应体特征;
统计不同HTTP请求包目标网页服务器返回的响应头信息包含的字段,排除与网页服务器类别不相关的字段,得到响应头特征;
将响应体特征与响应头特征拼接,得到字段特征;
统计响应信息中响应体特征、响应头特征和字段特征的出现频次作为特征的权重值,得到量化特征。
在本发明一实施例中,特征提取模块210中利用自编码器对量化特征进行表征学习,得到关键特征包括:
利用编码器对量化特征进行表征学习,获取压缩后的潜在空间指纹表征向量;
利用解码器重构来自编码器的潜在空间指纹表征向量,得到关键特征。
在本发明一实施例中,特征提取模块中编码器和解码器均采用六层的前馈神经网络。
在本发明一实施例中,指纹识别模块220包括:
统计关键特征在已知网页服务器邻近特征空间范围内网页服务器类别的数量;
选择网页服务器类别数量最多的类别作为目标网页服务器的类别,完成目标网页服务指纹识别。
本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种电子设备的具体实施方式,参见图3,电子设备300具体包括如下内容:
处理器310、存储器320、通信单元330和总线340;
其中,处理器310、存储器320、通信单元330通过总线340完成相互间的通信;通信单元330用于实现服务器端设备以及终端设备等相关设备之间的信息传输。
处理器310用于调用存储器320中的计算机程序,处理器执行计算机程序时实现上述实施例中的方法中的全部步骤。
本领域普通技术人员应理解:存储器可以是,但不限于,随机存取存储器(RandomAccess Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(Programmable Read-OnlyMemory,简称:PROM),可擦除只读存储器(ErasableProgrammable Read-Only Memory,简称:EPROM),电可擦除只读存储器(ElectricErasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。进一步地,上述存储器内的软件程序以及模块还可包括操作系统,其可包括各种用于管理系统任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通信,从而提供其他软件组件的运行环境。
处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、网络处理器(NetworkProcessor,简称:NP)等。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质包括程序,所述程序在被处理器执行时用于执行前述任一方法实施例提供的方法。
本领域普通技术人员应理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质,具体的介质类别本申请不做限制。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (8)
1.一种网页服务器指纹识别方法,其特征在于,所述方法包括:
收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;
利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果;
所述收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征包括:
构建不同的HTTP请求包;
收集目标网页服务器对不同的HTTP请求包返回的响应头和响应体信息;
提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征;
利用自编码器对量化特征进行表征学习,得到关键特征;
所述提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征包括:
统计不同HTTP请求包目标网页服务器返回的响应体信息中关键词的比例,选择与网页服务器类别相关的关键词,得到响应体特征;
统计不同HTTP请求包目标网页服务器返回的响应头信息包含的字段,排除与网页服务器类别不相关的字段,得到响应头特征;
将响应体特征与响应头特征拼接,得到字段特征;
统计响应信息中响应体特征、响应头特征和字段特征的出现频次作为特征的权重值,得到量化特征。
2.如权利要求1所述的一种网页服务器指纹识别方法,其特征在于,所述不同的HTTP请求包的构建方法包括:
通过HEAD/Http/1.0发送基本的Http请求;
通过DELETE/Http/1.0发送不被允许的Delete请求;
通过GET/Http/3.0发送非法版本的Http协议请求;
通过GET/JUNK/1.0发送不正确规格的Http协议请求;
通过HEAD/Http/1.0发送404请求。
3.如权利要求2所述的一种网页服务器指纹识别方法,其特征在于,所述利用自编码器对量化特征进行表征学习,得到关键特征包括:
利用编码器对量化特征进行表征学习,获取压缩后的潜在空间指纹表征向量;
利用解码器重构来自编码器的潜在空间指纹表征向量,得到关键特征。
4.如权利要求3所述的一种网页服务器指纹识别方法,其特征在于,所述编码器和解码器均采用六层的前馈神经网络。
5.如权利要求1所述的一种网页服务器指纹识别方法,其特征在于,所述利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果包括:
统计关键特征在已知网页服务器邻近特征空间范围内网页服务器类别的数量;
选择网页服务器类别数量最多的类别作为目标网页服务器的类别,完成目标网页服务指纹识别。
6.一种网页服务器指纹识别装置,其特征在于,所述装置包括:
特征提取模块:用于收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;
指纹识别模块:用于利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果;
特征提取模块包括:
构建不同的HTTP请求包;
收集目标网页服务器对不同的HTTP请求包返回的响应头和响应体信息;
提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征;
利用自编码器对量化特征进行表征学习,得到关键特征;
所述特征提取模块中提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征包括:
统计不同HTTP请求包目标网页服务器返回的响应体信息中关键词的比例,选择与网页服务器类别相关的关键词,得到响应体特征;
统计不同HTTP请求包目标网页服务器返回的响应头信息包含的字段,排除与网页服务器类别不相关的字段,得到响应头特征;
将响应体特征与响应头特征拼接,得到字段特征;
统计响应信息中响应体特征、响应头特征和字段特征的出现频次作为特征的权重值,得到量化特征。
7.一种电子设备,其特征在于,包括:
处理器、存储器、与网关通信的接口;
存储器用于存储程序和数据,所述处理器调用存储器存储的程序,以执行权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括程序,所述程序在被处理器执行时用于执行权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310125944.0A CN116304901B (zh) | 2023-02-01 | 2023-02-01 | 一种网页服务器指纹识别方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310125944.0A CN116304901B (zh) | 2023-02-01 | 2023-02-01 | 一种网页服务器指纹识别方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116304901A CN116304901A (zh) | 2023-06-23 |
CN116304901B true CN116304901B (zh) | 2024-01-30 |
Family
ID=86812322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310125944.0A Active CN116304901B (zh) | 2023-02-01 | 2023-02-01 | 一种网页服务器指纹识别方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116304901B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110166522A (zh) * | 2019-04-01 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 服务器识别方法、装置、可读存储介质和计算机设备 |
CN112989256A (zh) * | 2021-05-08 | 2021-06-18 | 北京华云安信息技术有限公司 | 识别响应信息中web指纹的方法和装置 |
US20210258791A1 (en) * | 2020-02-13 | 2021-08-19 | Samsung Eletrônica da Amazônia Ltda. | Method for http-based access point fingerprint and classification using machine learning |
CN113297525A (zh) * | 2021-06-17 | 2021-08-24 | 恒安嘉新(北京)科技股份公司 | 网页分类方法、装置、电子设备、及存储介质 |
CN114528457A (zh) * | 2021-12-31 | 2022-05-24 | 北京邮电大学 | Web指纹检测方法及相关设备 |
CN114661975A (zh) * | 2022-03-29 | 2022-06-24 | 杭州安恒信息技术股份有限公司 | 一种web首页指纹特征的提取方法、装置及介质 |
-
2023
- 2023-02-01 CN CN202310125944.0A patent/CN116304901B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110166522A (zh) * | 2019-04-01 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 服务器识别方法、装置、可读存储介质和计算机设备 |
US20210258791A1 (en) * | 2020-02-13 | 2021-08-19 | Samsung Eletrônica da Amazônia Ltda. | Method for http-based access point fingerprint and classification using machine learning |
CN112989256A (zh) * | 2021-05-08 | 2021-06-18 | 北京华云安信息技术有限公司 | 识别响应信息中web指纹的方法和装置 |
CN113297525A (zh) * | 2021-06-17 | 2021-08-24 | 恒安嘉新(北京)科技股份公司 | 网页分类方法、装置、电子设备、及存储介质 |
CN114528457A (zh) * | 2021-12-31 | 2022-05-24 | 北京邮电大学 | Web指纹检测方法及相关设备 |
CN114661975A (zh) * | 2022-03-29 | 2022-06-24 | 杭州安恒信息技术股份有限公司 | 一种web首页指纹特征的提取方法、装置及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116304901A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111585955B (zh) | 一种http请求异常检测方法及系统 | |
CN111327608B (zh) | 基于级联深度神经网络的应用层恶意请求检测方法及系统 | |
CN111600919B (zh) | 智能网络应用防护系统模型的构建方法和装置 | |
CN111818198B (zh) | 域名检测方法、域名检测装置和设备以及介质 | |
CN109784015B (zh) | 一种身份鉴别方法及装置 | |
CN110163242B (zh) | 风险识别方法、装置及服务器 | |
CN112839014B (zh) | 建立识别异常访问者模型的方法、系统、设备及介质 | |
CN113628059A (zh) | 一种基于多层图注意力网络的关联用户识别方法及装置 | |
CN109871749A (zh) | 一种基于深度哈希的行人重识别方法和装置、计算机系统 | |
CN117609479B (zh) | 一种模型处理方法、装置、设备、介质及产品 | |
CN114492576A (zh) | 一种异常用户检测方法、系统、存储介质及电子设备 | |
CN116304901B (zh) | 一种网页服务器指纹识别方法、装置、设备和存储介质 | |
CN115314268B (zh) | 基于流量指纹和行为的恶意加密流量检测方法和系统 | |
CN116599743A (zh) | 4a异常绕行检测方法、装置、电子设备及存储介质 | |
CN113704566B (zh) | 识别号主体识别方法、存储介质和电子设备 | |
CN114528908A (zh) | 网络请求数据分类模型训练方法、分类方法及存储介质 | |
CN115393100A (zh) | 资源推荐方法及装置 | |
CN113343235B (zh) | 基于Transformer的应用层恶意有效负载检测方法、系统、设备及介质 | |
CN115146191A (zh) | 基于ai进行视频监控资产识别的方法、装置及电子设备 | |
CN114490246A (zh) | 一种监控方法、装置、电子设备以及存储介质 | |
CN111611981A (zh) | 信息识别方法和装置及信息识别神经网络训练方法和装置 | |
CN113468540A (zh) | 基于网络安全大数据的安全画像处理方法及网络安全系统 | |
CN110909798A (zh) | 一种多算法智能研判方法、系统及服务器 | |
CN116383029B (zh) | 一种基于小程序的用户行为标签生成方法和装置 | |
CN112699101B (zh) | 基于存储与处理的服务器系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |