CN115242500B - 检测目标网站的方法及装置、非易失性存储介质、处理器 - Google Patents
检测目标网站的方法及装置、非易失性存储介质、处理器 Download PDFInfo
- Publication number
- CN115242500B CN115242500B CN202210860803.9A CN202210860803A CN115242500B CN 115242500 B CN115242500 B CN 115242500B CN 202210860803 A CN202210860803 A CN 202210860803A CN 115242500 B CN115242500 B CN 115242500B
- Authority
- CN
- China
- Prior art keywords
- data
- port
- port data
- type
- website
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012545 processing Methods 0.000 claims abstract description 37
- 230000006870 function Effects 0.000 claims description 12
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000007726 management method Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 11
- 238000007405 data analysis Methods 0.000 description 9
- 238000012795 verification Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000002354 daily effect Effects 0.000 description 4
- 230000003203 everyday effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
- H04L63/1425—Traffic logging, e.g. anomaly detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
Abstract
本申请公开了一种检测目标网站的方法及装置、非易失性存储介质、处理器。其中,该方法包括:获取第一类数据,其中,第一类数据为存储在信息备案管理系统中的网际互连协议端口数据,且允许被多个用户同时访问;对第一类数据进行处理,得到第二类数据;将第二类数据与目标网站的端口数据进行对比,得到对比结果;如果对比结果指示目标网站的端口数据不属于第二类数据,确定由端口数据创建的网站为目标网站。本申请解决了由于缺少相关技术造成的无法检测到用网际互连协议端口数据开办的未备案网站的技术问题。
Description
技术领域
本申请涉及数据安全领域,具体而言,涉及一种检测目标网站的方法及装置、非易失性存储介质、处理器。
背景技术
现有技术中缺少利用网际互联协议确定未备案网站的技术。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种检测目标网站的方法及装置、非易失性存储介质、处理器,以至少解决由于缺少相关技术造成的无法检测到用网际互连协议端口数据开办的未备案网站的技术问题。
根据本申请实施例的一个方面,提供了一种检测目标网站的方法,包括:获取第一类数据,其中,第一类数据为存储在信息备案管理系统中的网际互连协议端口数据,且允许被多个用户同时访问;对第一类数据进行处理,得到第二类数据;将第二类数据与目标网站的端口数据进行对比,得到对比结果;如果对比结果指示目标网站的端口数据不属于第二类数据,确定由端口数据创建的网站为目标网站。
可选地,获取第一类数据,包括:获取第一端口数据,并将第一端口数据中允许被访问且指定了功能的端口数据删除,得到第二端口数据,其中,第一端口数据为被访问频率高于预设值的,通用的端口数据,第二端口数据为存储在信息备案管理系统中的网际互连协议端口数据;获取第三端口数据,并与第二端口数据进行对比,将第二端口数据和同时属于第二端口数据和第三端口数据的端口数据,确定为第一类数据。
可选地,获取第一类数据,还包括:如果第一端口数据中不允许被访问且指定功能的端口数据属于第四端口数据,确定不允许被访问且指定功能的端口数据为第一类数据,其中,第四端口数据为被访问频率低于预设值的通用端口数据。
可选地,对第一类数据进行处理,包括:确定第一类数据中各个数据对应的第一预设值,其中,第一预设值为各个数据的信任度的数值;在预设时刻获取第三端口数据,并与第一类数据进行对比,得到第二对比结果;如果第二对比结果指示第一类数据不属于第三端口数据,将第一预设值减少第二预设值,得到第三预设值;将第一类数据中第三预设值小于第四预设值的数据删除,其中,第四预设值为信任度的最小数值。
可选地,对第一类数据进行处理,还包括:将第一类数据中服务商为本地服务商且执行目标任务的数据删除;将第一类数据中服务商为异地服务商的数据删除。
可选地,对第一类数据进行处理,得到第二类数据,包括:确定第一类数据中的各个数据对应的第一预设数量的任务,其中,任务为处理各个数据的方法;确定线程池,其中,线程池用于存储第二预设数量的任务,第二预设数量大于第一预设数量;同时执行第一预设数量的任务,得到第一预设数量的执行结果;如果执行第一预设数量的任务的执行结果中至少有一个与预设结果相同,确定与任务对应的第一类数据属于第二类数据。
可选地,将第二类数据与目标网站的端口数据进行对比之后,包括:将对比结果发送至终端设备,同时向终端设备发送提示消息,其中,提示消息为提示查看对比结果的消息。
根据本申请实施例的另一方面,还提供了一种检测目标网站的装置,包括:获取模块,用于获取第一类数据,其中,第一类数据为存储在信息备案管理系统中的网际互连协议端口数据,且允许被多个用户同时访问;处理模块,用于对第一类数据进行处理,得到第二类数据;对比模块,用于将第二类数据与目标网站的端口数据进行对比,得到对比结果;确定模块,用于在对比结果指示目标网站的端口数据不属于第二类数据的情况下,确定由端口数据创建的网站为目标网站。
根据本申请实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行以上检测目标网站的方法。
根据本申请实施例的另一方面,还提供了一种处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行以上检测目标网站的方法。
在本申请实施例中,采用获取第一类数据,其中,第一类数据为存储在信息备案管理系统中的网际互连协议端口数据,且允许被多个用户同时访问;对第一类数据进行处理,得到第二类数据;将第二类数据与目标网站的端口数据进行对比,得到对比结果;如果对比结果指示目标网站的端口数据不属于第二类数据,确定由端口数据创建的网站为目标网站的方式,通过获取现有的存储在信息备案管理系统中的网际互连协议端口数据,处理上述获取的数据,并将处理后的数据与目标网站的端口数据进行对比,达到了检测出目标网站的目的,从而实现了利用网际互连协议端口数据检测出目标网站的技术效果,进而解决了由于缺少相关技术造成的无法检测到用网际互连协议端口数据开办的未备案网站技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种检测目标网站的方法的流程图;
图2是根据本申请实施例的一种检测目标网站的装置的结构图;
图3是根据本申请实施例的一种检测利用IP开办未备案网站的系统的示意图;
图4是根据本申请实施例的一种检测利用IP开办未备案网站的系统的工作流程图;
图5是根据本申请实施例的一种更新信任度数据的流程图;
图6是根据本申请实施例的一种获取活跃IP数据的流程图;
图7是根据本申请实施例的一种数据分析及处置的流程图;
图8是根据本申请实施例的一种对利用IP开办网站数据进行验证的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例,提供了一种检测目标网站的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的检测目标网站的方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取第一类数据,其中,第一类数据为存储在信息备案管理系统中的网际互连协议端口数据,且允许被多个用户同时访问。
获取由已经在信息备案管理系统中备案的,活跃度高(即在同一时间内被多个用户同时访问)的网际互联协议(Internet Protocal,IP)数据经过处理得到的第一类数据。
步骤S104,对第一类数据进行处理,得到第二类数据。
同时更新第一类数据中的各个数据和第一类数据中各个数据的信任度,并对由第一类数据创建的网站进行验证,通过上述过程对第一类数据进行处理,得到由处理后的第一类数据构成的第二类数据。
步骤S106,将第二类数据与目标网站的端口数据进行对比,得到对比结果。
获取待检测的端口数据,并与第二类数据进行对比,得到不在第二类数据中的端口数据,并对上述不在第二类数据中的端口数据进行检测,得到对比结果。
步骤S108,如果对比结果指示目标网站的端口数据不属于第二类数据,确定由端口数据创建的网站为目标网站。
根据对比结果可以达到利用网际互联协议数据检测未备案网站(即目标网站)的目的。
通过上述步骤,提供了一种检测目标网站的方法,通过向信息备案管理系统采集活跃的网际互联协议(IP)数据、对采集到的数据进行数据去重,进行IP地址判断、数据筛选,数据分析等操作得到已备案的IP数据,并利用已备案的IP数据生成初步的数据信任度表,根据数据处理过程进行数据信任度的不断迭代更新,数据分析迭代每日的备案IP、信任度分析不断迭代自身数据的信任度;数据处理:对采集到的的有效IP数据信任度分析、对不在信任度表里的数据端口扫描、根据情况进行数据信任度的更新,最后形成利用IP开办未备案网站列表,在进行网站超文本传输协议(Hyper Text Transfer Protocol,HTTP)和超文本传输安全协议(Hyper Text Transfer Protocol over SecureSocket Layer,HTTPS)的验证,最终获取一个利用IP开办的未备案网站列表,可以实现检测未备案网站的技术效果。
根据本申请一个可选的实施例,获取第一类数据,包括:获取第一端口数据,并将第一端口数据中允许被访问且指定了功能的端口数据删除,得到第二端口数据,其中,第一端口数据为被访问频率高于预设值的,通用的端口数据,第二端口数据为存储在信息备案管理系统中的网际互连协议端口数据;获取第三端口数据,并与第二端口数据进行对比,将第二端口数据和同时属于第二端口数据和第三端口数据的端口数据,确定为第一类数据。
在系统运行前,首先通过社会工程学收集到常见使用的端口数据(即第一端口数据),排除掉开放状态的80端口,8080端口和443端口的端口数据(即允许被访问的端口数据),其中,80端口是HTTP协议的默认端口,其指定为HTTP开放;8080端口被用于万维网代理服务,可以实现网页浏览,443端口是网页浏览端口,其用于提供安全的上网协议(HTTPS协议);由于上述三个端口的IP数据已被定义用于特定的服务,因此,在对获取到的常见使用的端口数据进行筛选时将其删除,剩余的端口数据即为第二端口数据。
系统每日运行时,从当日的信息备案管理系统获取已备案的IP数据(即第三数据—)与上述的第二端口数据对比,其中,上述对比是通过对当日的信息备案管理系统获取已备案的IP数据和第二端口数据做集合差集运算,再对运算结果进行判断实现的,根据运算的结果,将运算结果指示的数据中同时属于第二端口数据和从当日的信息备案管理系统获取已备案的IP数据(即第三端口数据)的数据确定为第一类数据。
根据本申请另一个可选的实施例,获取第一类数据还包括:如果第一端口数据中不允许被访问且指定功能的端口数据属于第四端口数据,确定不允许被访问且指定功能的端口数据为第一类数据,其中,第四端口数据为被访问频率低于预设值的通用端口数据。
在本实施例中,对于未开放状态的80端口,8080端口和443端口的端口数据(即第一端口数据中不允许被访问且指定了功能的端口数据),判断未开放的端口是否存在于系统的非网站常用端口端口数据(即第四端口数据)表里,如果存在,则将其确定为第一类数据,并确定上述数据的信任度。
根据本申请再一个可选的实施例,对第一类数据进行处理,包括以下步骤:确定第一类数据中各个数据对应的第一预设值,其中,第一预设值为各个数据的信任度的数值;在预设时刻获取第三端口数据,并与第一类数据进行对比,得到第二对比结果;如果第二对比结果指示第一类数据不属于第三端口数据,将第一预设值减少第二预设值,得到第三预设值;将第一类数据中第三预设值小于第四预设值的数据删除,其中,第四预设值为信任度的最小数值。
上述第一类数据均为已在信息备案管理系统中备案的数据,在确定上述第一类数据后,还需要确定第一类数据中各个数据的信任度,其中,信任度用于指示第一类数据中各个数据的备案情况。确定各个数据信任度的初始值(即第一预设值)和最小值(即第四预设值)。系统每日运行时,对第一类数据进行更新,获取当日的信息备案管理系统获取已备案的IP数据(即第三端口数据),通过集合差集运算对第一类数据和第三端口数据进行处理;对于第一类数据中的任一数据,如果既属于当日的信息备案管理系统中已备案的IP数据,又属于上述第一类数据,则其信任度保持初始值(即第一预设值)不变,比如可以将初始值设置为一百;,如果只属于当日的信息备案管理系统中已备案的IP数据,将其添加到第一类数据中,并确定其信任度的初始值,如设置为一百;如果不属于当日的信息备案管理系统中已备案的IP数据,将该数据删除。
需要说明的是,系统每日运行时,对获取新的一端口数据,并将第一端口数据中已备案的数据确定为第一类数据,对于第一类数据,对其进行上述操作;而对第一类数据中未备案的数据,也需要确定其信任度的初始值(即第一预设值),比如可以确定为一百;并在每次运行时将其信任度从初始值减少预设值(即第二预设值)比如可以减一,其信任度从初始值减少预设值的结果并将小于信任度的最小值(即第四预设值),将其删除;比如最小值设置为六十,则将信任度的数值小于六十的数据删除。
根据本申请一些可选的实施例,对第一类数据进行处理还包括:将第一类数据中服务商为本地服务商且执行目标任务的数据删除;将第一类数据中服务商为异地服务商的数据删除。
在本申请一些可选的实施例中,将第一类数据中不是本地接入商(即异地服务商)的IP数据删除;将虽然是本地接入商(即本地服务商)的IP数据,但属于已分配给增值业务服务商了的IP删除。此外,将属于本地接入商的IP切未分配给增值业务服务商了的IP进行去重后,放入活跃IP数据(即访问频率高于预设值且通用的数据)表里。
根据本申请一个可选的实施例,对第一类数据进行处理,得到第二类数据,包括:确定第一类数据中的各个数据对应的第一预设数量的任务,其中,任务为处理各个数据的方法;确定线程池,其中,线程池用于存储第二预设数量的任务,第二预设数量大于第一预设数量;同时执行第一预设数量的任务,得到第一预设数量的执行结果;如果执行第一预设数量的任务的执行结果中至少有一个与预设结果相同,确定与任务对应的第一类数据属于第二类数据。
根据本申请提供了一个优选的实施例,定义一个通道,用于主线程接受高并发每个任务的结果,并定义一个任务方法,方法包含HTTPS和HTTP访问验证及结果输出通道;制作一个线程(或协程)池,指定并发数,并把上一步定义的方法指定为高并发运行的方法;对利用IP开办网站的数据列表里的数据进行遍历,每条数据生成相应个数的任务方法(即第一预设数量的任务),在本实施例中,对每条数据生成6个任务方法,并放入线程(或协程)池里;启动线程(或协程)池,主线程开始从通道读取数据;对读到的结果(即执行结果)进行判断,对于每个任务的6个结果,只要一个验证通过,则判断此IP属于真实的开办网站了(即将其确定为第二类数据),予以保留,如果每个任务的六个结果均验失败,则从利用IP开办网站的数据列表里删除。
还需要说明的是,上述优选的实施例提供的方法也可以用于对第一类数据进行处理,是利用该方法对第一类数据进行处理,定义一个通道,用于主线程接受高并发每个任务的结果,并定义一个任务方法,方法包含任务参数(IP+端口号),及结果输出通道;制作一个线程(或协程)池,指定并发数,并把上一步定义的方法指定为高并发运行的方法;对活跃IP数据表里的数据遍历,每条数据生成65535个任务方法,并放入线程(或协程)池里;启动线程(或协程)池里,主线程开始从通道读取数据;对读到的结果进行判断,对发现开放80、8080、443端口的数据,加入到发现的利用IP开办网站的数据列表里,对于未开放80、8080、443端口的数据,进一步处理;对于未开放80、8080、443端口的数据,判断开放的端口是否存在于系统的非网站常用端口端口数据表里,如果存在,则把此数据加到系统的信任度数据表里。
根据本申请又一个可选的实施例,将第二类数据与目标网站的端口数据进行对比之后,包括:将对比结果发送至终端设备,同时向终端设备发送提示消息,其中,提示消息为提示查看对比结果的消息。
根据本实施例,在对目标网站进行检测时,将通过上述步骤获得的已验证筛选过的利用IP开办网站的数据列表中的ip的数据(即第二类数据)制作成文件,如excel文件,并发送给管理员(即终端设备)处置,同时在管理页面进行提醒,管理员通过对比目标网站的ip与上述文件中的ip,将由不属于上述文件中的ip创建的网站确定为未备案网站。
上述在管理页面进行提醒时,可以采用以下优选的方法:管理人员进行处理时,如果超出处理时间有待于加急处理,在前端显示红色三角警示号,引起管理人员注意,并且,点入红色三角警示号,能够看到加急处理的网站名单,需要优先处理此文件名单,可以避免遗漏处理利用IP开办的未备案网站。
图2为根据本申请实施例提供的一种检测目标网站的装置结构图,如图2所示,该装置包括:
获取模块20,用于获取第一类数据,其中,第一类数据为存储在信息备案管理系统中的网际互连协议端口数据,且允许被多个用户同时访问;
处理模块22,用于对第一类数据进行处理,得到第二类数据;
对比模块24,用于将第二类数据与目标网站的端口数据进行对比,得到对比结果;
确定模块26,用于在对比结果指示目标网站的端口数据不属于第二类数据的情况下,确定由端口数据创建的网站为目标网站。
根据本实施例提供了一种具体的实施方法,将该方法应用于如图3所示的检测利用IP开办未备案网站的系统,图3为该系统的示意图,如图3所示,上述系统包括信安数据接入模块,数据分析模块,数据库模块和数据处理模块;其中,信安数据接入模块包括活跃IP提取模块,提取有效数据模块和数据去充模块;数据分析模块,包括信任度数据更新模块,数据分析模块,信任度分析模块和数据队列模块;数据库模块包括信任度数据模块和常见非网站端口模块;数据处理模中包含端口扫描,数据信任度打分更新及存储模块,活跃性验证模块,利用IP开办未备案网站数据生成模块,发送邮件模块,页面提示模块。图3所示为检测利用IP开办未备案网站的系统的工作示意图,如图3所示上述系统在运行时与信安系统和运营商备案系统进行交互。
图4所示为上述系统运行时的流程图,如图4所示,上述系统在运行时执行以下步骤:步骤一:初次通过备案系统获得已备案的IP数据,并生成初级的信任度表,通过社会工程学获取常见非开办网站的端口数据,形成常见非网站端口数据表;并利用每次迭代更新信任度表;步骤二:每日通过高并发文件读取方式获取活跃IP数据,并进行数据筛选;步骤三:通过每日循环迭代的数据分析迭代更新信任度表,并得到初步利用IP开办未备案网站的数据;步骤四:通过活动性验证得出真实的利用IP开办未备案网站的数据,并通过邮件发送给管理员处置。
图5为步骤一中信任度数据更新的流程图,如图5所示,流程开始,从数据库提取信任度表形成信任度字典,同时从数据库提取常见非网站端口数据形成集合;信任度数据表状态为未备案的字段信任度减一,同时把信任度低于60的数删除;从备案系统提取已备案IP集合,把信任度字典里字段为已备案的IP提取形成集合,做两个集合的差集,读取差集数据,如果为得到数据,结束该流程,如果读到数据,判断读到的数据是否在已备案数据里,如果在已备案数据里,在信任度字段插入这条数据,备案状态赋值“已备案”,信任度100,同时更新数据库,如果不在已备案数据里,删除信任度字典这条数据,同时更新数据库。
图6为步骤二中获取活跃IP数据的流程图,如图6所示,流程开始,生成空的活跃IP数据集合,读取活跃日志数据,判断是否是本地接入商IP,如果不是本地接入商IP,判断是否已存在在活跃IP数据集合里,如果判断结果为否,执行加入到活跃IP数据集合;如果判断结果为是,判断是否还有活跃IP数据,如果还存在活跃IP数据,重新执行步骤二,如果不存在活跃IP数据,结束步骤二。
图7为步骤三对数据分析及处置的流程图,如图7所示,流程开始,取清洗后的活跃IP数据判断是否读到数据,未读到则启动并发端口进行扫描,将每个IP的扫描结果放入通道CH中,主线程从通道CH读取数据并判断是否读到,为读到则结束程序,读到则判断是否开放80/8080/443端口,未开放则判断是否开放非网站常用端口,未开放则主线程重新从通道CH读取数据,开放则在信任度字段插入这条数据,备案状态赋值“未备案”,信任度90,同时更新数据库,并从主线程从通道CH读取数据处执行程序。如果开放80/8080/443端口,则加入发现的利用IP开办网站的列表。
图8是步骤四中的对利用IP开办网站数据验证的流程图,如图8所示,把发现的利用IP开办网站的列表加入并发任务列表,启动高并发http及https的80/8080/443端口访问,每个IP的验证结果放入通道CH中,从主线程读取通道CH数据,判断是否读到数据,未读到则把利用IP开办网站的列表生成excel文件删除,发送邮件给管理员并结束流程。读到则判断是否开办网站,未开办则把词条IP数据从利用IP开办网站的列表删除,并重新执行从主线程读取通道CH数据的流程,开办则直接重新执行从主线程读取通道CH数据的流程。
系统运行时向信安系统采集活跃IP数据、数据去重,进行IP地址判断、数据筛选,得到有效数据提取;利用已备案的IP数据生成初步的数据信任度表,根据数据处理过程进行数据信任度的不断迭代更新,数据分析迭代每日的备案IP、信任度分析不断迭代自身数据的信任度;对采集到的的有效IP数据信任度分析、对不在信任度表里的数据端口扫描、根据情况进行数据信任度的更新,最后形成利用IP开办未备案网站列表,在进行网站HTTP和HTTPS的验证,最终获取一个利用IP开办未备案网站列表。基于信安系统,活跃IP数据检测利用IP开办未备案网站的方法,它提供了一种高效检测利用IP开办未备案网站的方法,解决了利用IP开办未备案网站难以发现的问题。只要是网站总会产生访问,至少会有开发者的测试访问,而且只要访问必然会经过信安系统,就会有访问IP日志留存下来。因此信安系统的日志数据是最全面的,包含所有本地接入网站的访问记录,我们每天提取信安系统的活跃IP数据,根据信任度进行分析,大量节省需要处理的数据量,在用一定的方法清洗,不断迭代更新信任度表,使得的信任度表可靠请极高,最后对低信任度的数据再进行端口扫描、验证就能检测到利用IP开办的未备案网站。
根据本申请实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备以上检测目标网站的方法。
上述非易失性存储介质用于存储执行以下功能的程序:获取第一类数据,其中,第一类数据为存储在信息备案管理系统中的网际互连协议端口数据,且允许被多个用户同时访问;对第一类数据进行处理,得到第二类数据;将第二类数据与目标网站的端口数据进行对比,得到对比结果;如果对比结果指示目标网站的端口数据不属于第二类数据,确定由端口数据创建的网站为目标网站。
根据本申请实施例的另一方面,还提供了一种处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行以上检测目标网站的方法。
上述处理器用于运行执行以下功能的程序:获取第一类数据,其中,第一类数据为存储在信息备案管理系统中的网际互连协议端口数据,且允许被多个用户同时访问;对第一类数据进行处理,得到第二类数据;将第二类数据与目标网站的端口数据进行对比,得到对比结果;如果对比结果指示目标网站的端口数据不属于第二类数据,确定由端口数据创建的网站为目标网站。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (8)
1.一种检测目标网站的方法,其特征在于,包括:
获取第一类数据,其中,所述第一类数据为存储在信息备案管理系统中的网际互连协议端口数据,且允许被多个用户同时访问,获取第一类数据,包括:获取第一端口数据,并将所述第一端口数据中允许被访问且指定了功能的端口数据删除,得到第二端口数据,其中,所述第一端口数据为被访问频率高于预设值的,通用的端口数据,所述第二端口数据为存储在信息备案管理系统中的网际互连协议端口数据;获取第三端口数据,并与第二端口数据进行对比,将同时属于所述第二端口数据和所述第三端口数据的端口数据,确定为所述第一类数据,其中,所述第三端口数据为所述信息备案管理系统中已备案的网际互连协议端口数据;
对所述第一类数据进行处理,得到第二类数据;
将所述第二类数据与目标网站的端口数据进行对比,得到对比结果;
如果所述对比结果指示所述目标网站的端口数据不属于所述第二类数据,确定由所述端口数据创建的网站为所述目标网站。
2.根据权利要求1所述的方法,其特征在于,对所述第一类数据进行处理,包括:
确定所述第一类数据中各个数据对应的第一预设值,其中,所述第一预设值为所述各个数据的信任度的数值;
在预设时刻获取所述第三端口数据,并与所述第一类数据进行对比,得到第二对比结果;
如果所述第二对比结果指示所述第一类数据不属于所述第三端口数据,将所述第一预设值减少第二预设值,得到第三预设值;
将所述第一类数据中第三预设值小于第四预设值的数据删除,其中,所述第四预设值为所述信任度的最小数值。
3.根据权利要求1所述的方法,其特征在于,对所述第一类数据进行处理,还包括:
将所述第一类数据中服务商为本地服务商且执行目标任务的数据删除;
将所述第一类数据中服务商为异地服务商的数据删除。
4.根据权利要求1所述的方法,其特征在于,对所述第一类数据进行处理,得到第二类数据,包括:
确定所述第一类数据中的各个数据对应的第一预设数量的任务,其中,所述任务为处理所述各个数据的方法;
确定线程池,其中,所述线程池用于存储第二预设数量的所述任务,所述第二预设数量大于所述第一预设数量;
同时执行所述第一预设数量的任务,得到所述第一预设数量的执行结果;
如果执行所述第一预设数量的任务的执行结果中至少有一个与预设结果相同,确定与所述任务对应的第一类数据属于所述第二类数据。
5.根据权利要求1所述的方法,其特征在于,将所述第二类数据与目标网站的端口数据进行对比之后,包括:
将所述对比结果发送至终端设备,同时向所述终端设备发送提示消息,其中,所述提示消息为提示查看所述对比结果的消息。
6.一种检测目标网站的装置,其特征在于,包括:
获取模块,用于获取第一类数据,其中,所述第一类数据为存储在信息备案管理系统中的网际互连协议端口数据,且允许被多个用户同时访问,获取第一类数据,包括:获取第一端口数据,并将所述第一端口数据中允许被访问且指定了功能的端口数据删除,得到第二端口数据,其中,所述第一端口数据为被访问频率高于预设值的,通用的端口数据,所述第二端口数据为存储在信息备案管理系统中的网际互连协议端口数据;获取第三端口数据,并与第二端口数据进行对比,将同时属于所述第二端口数据和所述第三端口数据的端口数据,确定为所述第一类数据,其中,所述第三端口数据为所述信息备案管理系统中已备案的网际互连协议端口数据;
处理模块,用于对所述第一类数据进行处理,得到第二类数据;
对比模块,用于将所述第二类数据与目标网站的端口数据进行对比,得到对比结果;
确定模块,用于在所述对比结果指示所述目标网站的端口数据不属于所述第二类数据的情况下,确定由所述端口数据创建的网站为所述目标网站。
7.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至5中任意一项所述的检测目标网站的方法。
8.一种用于检测目标网站的装置,其包括处理器,其特征在于,所述处理器用于运行存储在存储器中的程序,其中,所述程序运行时执行权利要求1至5中任意一项所述的检测目标网站的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210860803.9A CN115242500B (zh) | 2022-07-21 | 2022-07-21 | 检测目标网站的方法及装置、非易失性存储介质、处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210860803.9A CN115242500B (zh) | 2022-07-21 | 2022-07-21 | 检测目标网站的方法及装置、非易失性存储介质、处理器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115242500A CN115242500A (zh) | 2022-10-25 |
CN115242500B true CN115242500B (zh) | 2024-05-10 |
Family
ID=83674711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210860803.9A Active CN115242500B (zh) | 2022-07-21 | 2022-07-21 | 检测目标网站的方法及装置、非易失性存储介质、处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115242500B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102882716A (zh) * | 2012-09-25 | 2013-01-16 | 杭州安恒信息技术有限公司 | 工信部备案检测方法及系统 |
CN105763664A (zh) * | 2015-07-30 | 2016-07-13 | 佛山市诚科网络科技有限公司 | 一种未办理备案网站的探寻方法及系统 |
CN109040333A (zh) * | 2018-07-10 | 2018-12-18 | 厦门秦淮科技有限公司 | 一种域名备案管理系统 |
CN111786960A (zh) * | 2020-06-10 | 2020-10-16 | 中国移动通信集团黑龙江有限公司 | 网站备案情况核查的方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160125421A1 (en) * | 2014-10-29 | 2016-05-05 | Hartford Fire Insurance Company | System for license data analysis and processing |
-
2022
- 2022-07-21 CN CN202210860803.9A patent/CN115242500B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102882716A (zh) * | 2012-09-25 | 2013-01-16 | 杭州安恒信息技术有限公司 | 工信部备案检测方法及系统 |
CN105763664A (zh) * | 2015-07-30 | 2016-07-13 | 佛山市诚科网络科技有限公司 | 一种未办理备案网站的探寻方法及系统 |
CN109040333A (zh) * | 2018-07-10 | 2018-12-18 | 厦门秦淮科技有限公司 | 一种域名备案管理系统 |
CN111786960A (zh) * | 2020-06-10 | 2020-10-16 | 中国移动通信集团黑龙江有限公司 | 网站备案情况核查的方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
上海电信基于大数据的非法域名接入自动发现平台研发;黄少琪;电信技术(第05期);第86-88页 * |
黄少琪.上海电信基于大数据的非法域名接入自动发现平台研发.电信技术.2018,(第05期),第86-88页. * |
Also Published As
Publication number | Publication date |
---|---|
CN115242500A (zh) | 2022-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180075138A1 (en) | Electronic document management using classification taxonomy | |
CN110569214B (zh) | 用于日志文件的索引构建方法、装置及电子设备 | |
US20070106692A1 (en) | System and method for recording and replaying a session with a web server without recreating the actual session | |
US8108234B2 (en) | System and method for deriving business processes | |
US10642870B2 (en) | Data processing systems and methods for automatically detecting and documenting privacy-related aspects of computer software | |
CN110798445B (zh) | 公共网关接口测试方法、装置、计算机设备及存储介质 | |
US7840523B2 (en) | Method and system for time-sliced aggregation of data that monitors user interactions with a web page | |
WO2016007178A1 (en) | System and method for providing contextual analytics data | |
CN114422564A (zh) | 访问数据审计溯源方法、装置、计算机设备及存储介质 | |
CN110019542B (zh) | 企业关系的生成、生成组织成员数据库及识别同名成员 | |
CN115242500B (zh) | 检测目标网站的方法及装置、非易失性存储介质、处理器 | |
CN110502529B (zh) | 数据处理方法、装置、服务器及存储介质 | |
CN110569295B (zh) | 通过定位关键词提高文档预警的方法 | |
CN111737203A (zh) | 数据库历史日志回溯方法、装置、系统、设备及存储介质 | |
CN116204540A (zh) | 操作日志记录方法、装置、设备及存储介质 | |
US10353792B2 (en) | Data layering in a network management system | |
CN111563123B (zh) | 一种hive仓库元数据实时同步方法 | |
CN114765599A (zh) | 子域名采集方法、装置 | |
US8719263B1 (en) | Selective persistence of metadata in information management | |
JP7052370B2 (ja) | 評価プログラム、評価方法及び情報処理装置 | |
US8775528B2 (en) | Computer readable recording medium storing linking keyword automatically extracting program, linking keyword automatically extracting method and apparatus | |
JP2012088857A (ja) | ログ情報収集システム、ログ情報収集方法、及びログ情報収集プログラム | |
CN112347066A (zh) | 日志处理方法、装置及服务器和计算机可读存储介质 | |
Kahvedžić | Digital forensics and the DSAR effect | |
CN113051329B (zh) | 基于接口的数据采集方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |