CN114928484A - 蜜罐生成方法、装置、电子设备及存储介质 - Google Patents

蜜罐生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114928484A
CN114928484A CN202210527188.XA CN202210527188A CN114928484A CN 114928484 A CN114928484 A CN 114928484A CN 202210527188 A CN202210527188 A CN 202210527188A CN 114928484 A CN114928484 A CN 114928484A
Authority
CN
China
Prior art keywords
page
request information
page request
information
response information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210527188.XA
Other languages
English (en)
Inventor
曾伟明
徐钟豪
谢忱
刘伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Douxiang Information Technology Co ltd
Original Assignee
Shanghai Douxiang Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Douxiang Information Technology Co ltd filed Critical Shanghai Douxiang Information Technology Co ltd
Priority to CN202210527188.XA priority Critical patent/CN114928484A/zh
Publication of CN114928484A publication Critical patent/CN114928484A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1491Countermeasures against malicious traffic using deception as countermeasure, e.g. honeypots, honeynets, decoys or entrapment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1483Countermeasures against malicious traffic service impersonation, e.g. phishing, pharming or web spoofing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请提供一种蜜罐生成方法、装置、电子设备及存储介质,可以根据获取到的各页面请求信息和对应的页面响应信息自动化生成服务函数,该服务函数用于在执行时,返回与该服务函数绑定的页面请求信息对应的页面响应信息,并基于各服务函数生成与待仿制站点对应的蜜罐,通过自动化仿制站点,实现了自动化构建蜜罐,提升了蜜罐生成的效率;另外,由于蜜罐是基于针对待仿制站点的页面请求信息以及与各页面请求信息分别对应的页面响应信息生成的,因此生成的蜜罐可以模仿待仿制站点的响应,提升了蜜罐的伪装性。

Description

蜜罐生成方法、装置、电子设备及存储介质
技术领域
本申请涉及网络安全技术领域,具体而言,涉及一种蜜罐生成方法、装置、电子设备及存储介质。
背景技术
蜜罐技术本质上是一种对攻击方进行欺骗的技术。通过布置一些作为诱饵的主机、网络服务或者信息,诱使攻击方对它们实施攻击,从而可以对攻击行为进行捕获和分析,了解攻击方所使用的工具与方法,推测攻击意图和动机,能够让防御方清晰地了解他们所面对的安全威胁,并通过技术和管理手段来增强实际系统的安全防护能力。为了提升蜜罐的伪装性并让蜜罐更加贴近真实业务,可以仿制业务相关的站点来构建蜜罐。因此,亟需一种蜜罐生成方案,使生成的蜜罐可以模仿业务相关站点,以提升蜜罐的伪装性。
发明内容
本申请实施例的目的在于提供一种蜜罐生成方法、装置、电子设备及存储介质,以解决上述技术问题。
本申请实施例提供一种蜜罐生成方法,所述方法包括:
获取待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息;
根据各所述页面请求信息以及对应的各所述页面响应信息生成与各所述页面请求信息分别绑定的服务函数;所述服务函数用于在执行时,返回与所述服务函数绑定的所述页面请求信息对应的页面响应信息;
基于各所述页面请求信息和对应的各所述服务函数生成与所述待仿制站点对应的蜜罐。
在上述实现过程中,可以根据获取到的各页面请求信息和对应的页面响应信息自动化生成服务函数,该服务函数用于在执行时,返回与该服务函数绑定的页面请求信息对应的页面响应信息,并基于各服务函数生成与待仿制站点对应的蜜罐,通过自动化仿制站点,实现了自动化构建蜜罐,提升了蜜罐生成的效率;另外,由于蜜罐是基于针对待仿制站点的页面请求信息以及与各页面请求信息分别对应的页面响应信息生成的,因此生成的蜜罐可以模仿待仿制站点的响应,提升了蜜罐的伪装性。
进一步地,所述待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息为:根据所述待仿制站点的第一URL地址,对所述待仿制站点进行页面爬虫得到的信息。
在上述实现过程中,通过爬虫技术自动化获取待仿制站点的页面请求信息和对应的页面响应信息,提升了蜜罐生成的自动化程度,进而提升了蜜罐生成的效率。
进一步地,所述根据所述待仿制站点的第一URL地址,对所述待仿制站点进行页面爬虫,包括:
生成用于打开所述第一URL地址的页面请求信息发送给服务器;
存储所述页面请求信息和所述服务器针对所述页面请求信息返回的页面响应信息,并从所述页面响应信息中提取目标页面元素数据;
根据所述目标页面元素数据进行下一步动态爬虫操作,并在进行下一步动态爬虫操作的过程中,将爬取到的页面请求信息和对应的页面响应信息进行关联存储。
在上述实现过程中,自动化生成用于打开第一URL地址的页面请求信息,所以可以模拟人工打开待仿制站点,进一步地提升了蜜罐生成过程的自动化程度。
进一步地,所述目标页面元素数据包括页面链接元素数据和页面按钮元素数据中的至少一种;所述根据所述目标页面元素数据进行下一步动态爬虫操作,并在进行下一步动态爬虫操作的过程中,将爬取到的页面请求信息和对应的页面响应信息进行关联存储,包括:
在所述目标页面元素数据包括页面链接元素数据时,从所述页面链接元素数据中提取第二URL地址,生成用于打开所述第二URL地址的页面请求信息并发送给所述服务器,存储该页面请求信息以及所述服务器根据该页面请求信息返回的页面响应信息;
在所述目标页面元素数据包括页面按钮元素数据时,生成用于触发对应的页面按钮元素的页面请求信息发送给所述服务器,存储该页面请求信息以及所述服务器根据该页面请求信息返回的页面响应信息。
在上述实现过程中,通过生成打开第二URL地址的页面请求信息,或生成触发页面按钮元素的页面请求信息进行页面爬虫,可以自动化克隆待仿制站点的访问触发请求,并通过建立页面请求信息和页面响应信息之间的对应关系还原待仿制站点,使得重构完成的蜜罐具备待仿制站点的页面,且能复刻待仿制站点上的交互过程,具有高仿真性。
进一步地,所述获取待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息,包括:
从数据库中提取待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息;所述数据库中存储有对所述待仿制站点进行页面爬虫得到的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息;
对提取到的所述页面请求信息以及与各所述页面请求信息分别对应的页面响应信息去重。
在上述实现过程中,先对页面请求信息和页面响应信息进行去重处理,然后根据去重后剩余的页面请求信息和对应的页面响应信息生成对应的服务函数,可以避免针对同一页面请求信息生成多个重复的服务函数,可以提升蜜罐生成效率,还可以减少对计算资源的占用需求。
进一步地,所述根据各所述页面请求信息以及对应的各所述页面响应信息生成与各所述页面请求信息分别绑定的服务函数;所述服务函数用于在执行时,返回与所述服务函数绑定的所述页面请求信息对应的页面响应信息,包括:
在接收到对某一所述页面响应信息的修改指令时,对所述页面响应信息进行修改;
根据修改后的页面响应信息以及对应的所述页面请求信息生成对应的与所述页面请求信息绑定的服务函数;所述服务函数用于在执行时,返回与所述服务函数绑定的所述页面请求信息对应的所述修改后的页面响应信息。
在上述实现过程中,可以对页面响应信息进行修改,达到自定义蜜罐数据的效果。
进一步地,所述基于各所述页面请求信息和对应的各所述服务函数生成与所述待仿制站点对应的蜜罐,包括:
基于各所述页面请求信息和对应的各所述服务函数生成与所述待仿制站点对应的蜜罐镜像;
将所述蜜罐镜像上传至目标地址中得到可供访问者访问的蜜罐。
在上述实现过程中,可以将蜜罐镜像上传至目标地址,以供访问者访问。
本申请实施例还提供了一种蜜罐生成装置,包括:
获取模块,用于获取待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息;
第一生成模块,用于根据各所述页面请求信息以及对应的各所述页面响应信息生成与各所述页面请求信息分别绑定的服务函数;所述服务函数用于在执行时,返回与绑定的所述页面请求信息对应的页面响应信息;
第二生成模块,用于基于各所述服务函数生成与所述待仿制站点对应的蜜罐。
本申请实施例还提供了一种电子设备,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序,以实现上述任意一种方法。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被至少一个处理器执行时,以实现上述任意一种方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例一中蜜罐生成方法的流程示意图;
图2为本申请实施例一中对待仿制站点进行页面爬虫的流程示意图;
图3为本申请实施例二中对待仿制站点进行页面爬虫的流程示意图;
图4为本申请实施例二中蜜罐生成方法的流程示意图;
图5为本申请实施例三中蜜罐生成装置的结构示意图;
图6为本申请实施例四中电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明实施例中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
在本发明的描述中,需要理解的是,步骤前的数字标号并不表示执行步骤的前后顺序,仅用于方便描述本发明及区别每一步骤,因此不能理解为对本发明的限制。
下面将提供多个实施例,来具体介绍蜜罐生成方法、装置、电子设备及存储介质。
实施例一:
为了提升蜜罐的伪装性并让蜜罐更加贴近真实业务,本申请实施例提供一种蜜罐生成方法,本申请实施例提供的蜜罐生成方法可以应用在电子设备中,该电子设备可以是服务器,比如可以是云端服务器、网络服务器、数据库服务器等。该电子设备也可以是终端,比如可以是个人电脑、笔记本电脑、平板电脑、手机等。
请参见图1所示,本申请实施例提供的蜜罐生成方法可以包括如下步骤:
S11:获取待仿制站点的页面请求信息以及与各页面请求信息分别对应的页面响应信息。
S12:根据各页面请求信息以及对应的各页面响应信息生成与各页面请求信息分别绑定的服务函数;服务函数用于在执行时,返回与该服务函数绑定的页面请求信息对应的页面响应信息。
S13:基于各页面请求信息和对应的各服务函数生成与待仿制站点对应的蜜罐。
为了更好的进行理解,下面对上述步骤进行详细的阐述。
步骤S11中的待仿制站点可以为动态页面站点。当然,在其他的实施例中,待仿制站点也可以为静态页面站点。实际应用中可以根据对蜜罐的需求灵活选取待仿制站点。
可以理解的是,可以对待仿制站点进行监测,在监测到针对该待仿制站点的页面请求信息时,就保存该页面请求信息,并对应保存待仿制站点根据该页面请求信息生成的页面响应信息,具体的,可以将页面请求信息和对应的页面响应信息关联保存至数据库中。
示例性的,可以对待仿制站点在实际应用场景中的请求响应进行监测,也即监测到的页面请求信息可以是客户端发送的,用户可以通过客户端向该待仿制站点发送页面请求信息。
示例性的,本申请实施例中的页面请求信息以及与各页面请求信息分别对应的页面响应信息也可以是根据待仿制站点的第一URL地址,对待仿制站点进行页面爬虫得到的信息。该页面请求信息可以是在对待仿制站点进行页面爬虫时,由执行页面爬虫的爬虫服务器或者其他电子设备自动生成的。
爬虫服务器在得到待仿制站点的页面请求信息以及与各页面请求信息分别对应的页面响应信息后,可以将该信息发送给执行蜜罐生成方法的电子设备。当然了,爬虫服务器在对待仿制站点进行页面爬虫得到页面请求信息以及与各页面请求信息分别对应的页面响应信息后,也可以直接由该爬虫服务器执行上述步骤S12和步骤S13。
下面对爬取待仿制站点的信息的过程进行详细的介绍。
第一URL地址是爬虫操作的起始URL地址。为了复刻待仿制站点,可以爬取以第一URL地址为根页面的所有页面的信息,并将爬取到的信息存入数据库。
应当说明的是,爬虫服务器除了需要根据第一URL地址爬取各页面的页面请求信息以及对应的页面响应信息之外,还可以爬取页面中的所有元素资源信息,基于爬取到的信息生成蜜罐,以使蜜罐可以呈现与待仿制站点相同的页面。
请参见图2所示,对待仿制站点进行页面爬虫可以包括如下步骤:
S21:生成用于打开第一URL地址的页面请求信息发送给服务器。
S22:存储页面请求信息和服务器针对该页面请求信息返回的页面响应信息,并从页面响应信息中提取目标页面元素数据。
S23:根据目标页面元素数据进行下一步动态爬虫操作,并在进行下一步动态爬虫操作的过程中,将爬取到的页面请求信息和对应的页面响应信息进行关联存储。
本申请实施例中的目标页面元素数据包括页面链接元素数据和页面按钮元素数据中的至少一种,本申请实施例对此不进行限制。
对于步骤S22,在目标页面元素数据包括页面链接元素数据时,可以从页面链接元素数据中提取第二URL地址,生成用于打开第二URL地址的页面请求信息并发送给服务器,存储该页面请求信息以及服务器根据该页面请求信息返回的页面响应信息。在目标页面元素数据包括页面按钮元素数据时,可以生成用于触发对应的页面按钮元素的页面请求信息发送给服务器,存储该页面请求信息以及服务器根据该页面请求信息返回的页面响应信息。
本申请实施例中,可以基于无头浏览器生成用于打开第一URL地址或第二URL地址的页面请求信息发送给服务器,该无头浏览器也可以生成用于触发对应的页面按钮元素的页面请求信息。
可以理解的是,对于步骤S23中爬取到的页面响应信息,若该页面响应信息中包含下一层级页面的页面链接元素数据,可以从下一层级页面的页面链接元素数据中提取出URL地址,生成用于打开该URL地址的页面请求信息并发送给服务器,存储该页面请求信息以及服务器根据该页面请求信息返回的页面响应信息;若该页面响应信息中包含下一层级页面的页面按钮元素数据时,可以生成用于触发下一层级页面中对应的页面按钮元素的页面请求信息发送给服务器,存储该页面请求信息以及服务器根据该页面请求信息返回的页面响应信息。
本申请实施例中通过动态爬虫可以完全克隆与待仿制站点相关的页面,并且可以通过模拟人工打开服务器访问页面,执行点击页面按钮等操作,并保存页面加载中触发的页面响应信息,可以对页面进行完全渲染,通过服务函数可以完全模拟待仿制站点的交互请求和对应的响应。
可以理解的是,本申请实施例中可以预设爬虫终止条件,当满足该爬虫终止条件时,停止爬虫。爬虫终止条件可以是爬取的URL数达到预设数量阈值。可以理解的是,当满足爬虫终止条件时,后续更深层页面可以不再进行爬取。
应当说明的是,页面爬虫过程中可能会爬取到重复数据,所以可以在步骤S12之前,去除页面请求信息中重复的页面请求信息,并去除对应的页面响应信息中重复的页面响应信息。可以避免针对同一页面请求信息生成多个重复的服务函数,可以提升蜜罐生成效率,还可以减少对计算资源的占用需求。
示例性的,在上述步骤S11中,可以从数据库中提取待仿制站点的页面请求信息以及与各页面请求信息分别对应的页面响应信息;数据库中存储有对待仿制站点进行页面爬虫得到的页面请求信息以及与各页面请求信息分别对应的页面响应信息;然后对提取到的页面请求信息以及与各页面请求信息分别对应的页面响应信息去重。这样,在步骤S12中,就可以根据去重后的页面请求信息和对应的页面响应信息生成对应的服务函数。
在上述步骤S12中,当接收到对某一页面响应信息的修改指令时,可以对页面响应信息进行修改,然后根据修改后的页面响应信息以及对应的页面请求信息生成对应的与页面请求信息绑定的服务函数;该服务函数用于在执行时,返回与该服务函数绑定的页面请求信息对应的修改后的页面响应信息。
本申请实施例中对页面响应信息进行修改,包括但不限于以下修改方式中的至少一种:
方式一:对页面响应信息中的HTML静态源码数据进行修改。
方式二:对页面响应信息中的图片数据进行修改。
方式三:对页面响应信息中的响应代码数据进行修改。
方式三中的数据主要是指的除HTML数据类型以外的数据,比如可以是JSON、XML类型的数据。
可以理解的是,在步骤S13中,可以基于各服务函数生成与待仿制站点对应的蜜罐镜像,然后将蜜罐镜像上传至目标地址中得到可供访问者访问的蜜罐。
在上述步骤S12中,通过获取到的各页面请求信息、对应的页面响应信息自动化重构生成对应的服务函数,无需开发人员针对每一页面请求信息编写对应的函数代码,可以提升蜜罐构建的效率。
实施例二:
为了更好的进行理解,本申请实施例结合具体的示例对蜜罐生成方法进行介绍。
为了对待仿制站点进行页面爬虫,获取待仿制站点的页面请求信息和对应的页面响应信息,首先可以对页面爬虫服务器进行配置,具体的,可以配置以下信息:
(1)待仿制站点的第一URL地址,该地址为爬虫的起始地址。
(2)待仿制站点登录页面的地址,页面登录元素的元素选择器地址,元素选择器可以是CSS-selector或者Xpath等选择器,包含登录页面的账户输入框的页面静态元素地址,密码输入框的页面静态元素地址,登录按钮的页面静态元素地址。
(3)登录成功后的登录凭证信息。在对爬虫服务器进行配置之前,可以使用凭证信息登录待仿制站点,然后记录登录成功后的Token,或者Cookie形式的凭证信息。在对爬虫服务器进行配置时,将该Token或者Cookie形式的凭证信息作为登陆凭证信息配置在爬虫服务器中。该登陆凭证信息用于在模仿人工触发待仿制站点进行爬虫时,可以将该登陆凭证信息携带在页面请求信息中。
(4)爬虫终止条件,可以设置目标URL数量,当爬取的URL数量达到该目标URL数量时,停止爬虫。
在完成对爬虫服务器的配置后,可以启动爬虫服务器对待仿制站点进行页面爬取操作,爬虫流程请参见图3所示,可以包括如下步骤:
S31:控制并启动无头浏览器。
本申请实施例中可以基于Puppeteer提供的API接口实现对无头浏览器的控制,无头浏览器可以模拟人工的按钮点击,站点打开操作。
S32:打开一个URL地址对应的页面。
步骤S32中可以打开爬虫服务器中预先配置的第一URL地址对应的页面。
S33:异步监听页面中的请求响应事件,当监听到页面触发请求响应事件时,将当前请求的URL地址存入预设的URL地址池中,并将页面请求信息和对应的页面响应信息进行关联存储。
存储的页面请求信息可以包括如下字段中的至少一种:
请求URL、请求方法、请求头、请求资源类型以及请求数据。
请求资源类型为请求发起的类型,比如可以是图片资源,html资源等。
请求数据可以是请求body中的数据。
存储的页面响应信息可以包括如下字段中的至少一种:
响应头、响应页面数据。
S34:从页面响应信息中提取页面链接元素数据和页面按钮元素数据。
S35:从页面链接元素数据中提取第二URL地址,转至S32。
应当说明的是,步骤S35转至S32时,应当打开第二URL地址对应的页面。
S36:生成用于触发对应的页面按钮元素的页面请求信息发送给服务器,并存储该页面请求信息以及服务器根据该页面请求信息返回的页面响应信息。
应当说明的是,生成的页面请求信息中可以携带登录凭证信息,以证明身份。本申请实施例中,还可以不携带登陆凭证信息访问待仿制站点的登陆页面,保存用于加载登陆页面的页面请求信息和对应的页面响应信息,根据用于加载登陆页面的页面请求信息和对应的页面响应信息生成蜜罐,使蜜罐可以复刻该登陆页面。
S37:判断爬取的URL数量是否达到预设的目标URL数量,如是,转至S38,否,转至S32。
S38:结束爬虫。
爬虫服务器根据爬虫操作得到待仿制站点的页面请求信息以及与各页面请求信息分别对应的页面响应信息之后,可以将该信息存储在数据库中,或者也可以直接将该信息发送给电子设备,以供该电子设备生成蜜罐,本申请实施例以爬虫服务器将爬取到的信息存入数据库为例进行说明。
请参见图4所示,电子设备生成蜜罐的流程如下:
S41:提取数据库中存储的页面请求信息和对应的页面响应信息。
S42:对页面请求信息和对应的页面响应信息去重。
本申请实施例中可以根据哈希方式进行去重,具体的,可以根据页面请求信息中的请求URL、请求方法和请求数据生成hash字符串,根据该hash字符串去重,若两个页面请求信息对应的hash字符串相同,说明这两个页面请求信息相同,所以,针对hash字符串相同的页面请求信息,删除重复的页面请求信息以及对应重复的页面响应信息。
本申请实施例中,可以将去重后的页面请求信息以文件格式存储起来,同时将去重后的页面响应信息以文件格式对应存储起来,以便于后续调用生成服务函数。
S43:根据去重后的页面请求信息和对应的页面响应信息生成与页面请求信息绑定的服务函数。
该服务函数用于在执行时,返回与该服务函数绑定的页面请求信息对应的页面响应信息。
可以理解的是,页面请求信息中通常包含多种请求信息,步骤S43中可以将页面请求信息中的请求URL、请求方法和请求头组成请求URI,然后使用Fllask等WEB框架,针对每一请求URI,生成对应的服务函数,并将该服务函数与对应的URI绑定,这样,蜜罐在接收到访问者发送的包含请求URI的页面请求信息时,可以触发执行对应的服务函数,从而可以向访问者返回对应的页面响应信息。
S44:获取待仿制站点的登陆页面信息。
本申请实施例中可以根据待仿制站点登陆页面的地址提取对应的登陆页面中的登录页面信息,可以根据爬虫配置项中登录配置项的登录元素信息,插入目标代码,目标代码用于逻辑监听用户在页面中执行账户密码填充和登录之后,后台判断账户密码是否为蜜罐预设密码,正确的话,则将其跳转到登录成功后的页面,登录失败,则弹出登录失败的弹窗。
S45:基于登陆页面信息、页面请求信息和对应的服务函数生成蜜罐。
应当说明的是,本申请实施例在生成蜜罐的过程中,可以对生成蜜罐的页面响应信息进行修改,具体的,可以通过前端提供信息修改模块,并可以向前端呈现服务函数的具体内容。
可以呈现爬虫得到的所有URL地址,并可以按照数据类型分为HTML类型,IMAGE类型,JSON类型,XML类型和其它类型。
可以呈现与服务函数绑定的页面请求信息,可以以原始的页面请求信息形式进行呈现,包含请求URL、请求方法、请求头、请求资源类型以及请求数据。
可以呈现服务函数中的页面响应信息,并提供对应的修改模块以供用户对页面响应信息进行修改。
针对页面响应信息,根据请求的不同类型提供多种呈现方式:
HTML类型,前端通过iframe标签来嵌入页面响应信息进行预览,可以编辑HTML静态源码。
IMAGE类型,前端通过img标签来嵌入页面响应信息进行预览,可以通过上传图片进行替换。
JSON,XML,和其它类型的响应数据,可以直接呈现对应的响应代码,并可以直接编辑对应的响应代码。
在对页面响应信息进行修改之后,可以重新存储修改后的页面响应信息,后续可以基于步骤S43重新生成与待仿制站点相似的蜜罐镜像,然后将蜜罐镜像包装为站点或者容器化,打包后的站点为最终的动态克隆蜜罐。
实施例三:
本申请实施例提供一种蜜罐生成装置,请参见图5所示,包括:
获取模块501,用于获取待仿制站点的页面请求信息以及与各页面请求信息分别对应的页面响应信息;
第一生成模块502,用于根据各页面请求信息以及对应的各页面响应信息生成与各页面请求信息分别绑定的服务函数;服务函数用于在执行时,返回与该服务函数绑定的页面请求信息对应的页面响应信息;
第二生成模块503,用于基于各页面请求信息和对应的各服务函数生成与待仿制站点对应的蜜罐。
在示例性的实施例中,待仿制站点的页面请求信息以及与各页面请求信息分别对应的页面响应信息为:根据待仿制站点的第一URL地址,对待仿制站点进行页面爬虫得到的信息。
在示例性的实施例中,该装置还包括爬虫模块,用于生成用于打开所述第一URL地址的页面请求信息发送给服务器;存储所述页面请求信息和所述服务器针对所述页面请求信息返回的页面响应信息,并从所述页面响应信息中提取目标页面元素数据;根据所述目标页面元素数据进行下一步动态爬虫操作,并在进行下一步动态爬虫操作的过程中,将爬取到的页面请求信息和对应的页面响应信息进行关联存储。
在示例性的实施例中,所述目标页面元素数据包括页面链接元素数据和页面按钮元素数据中的至少一种;爬虫模块还用于在所述目标页面元素数据包括页面链接元素数据时,从所述页面链接元素数据中提取第二URL地址,生成用于打开所述第二URL地址的页面请求信息并发送给所述服务器,存储该页面请求信息以及所述服务器根据该页面请求信息返回的页面响应信息;在所述目标页面元素数据包括页面按钮元素数据时,生成用于触发对应的页面按钮元素的页面请求信息发送给所述服务器,存储该页面请求信息以及所述服务器根据该页面请求信息返回的页面响应信息。
在示例性的实施例中,获取模块501用于从数据库中提取待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息;所述数据库中存储有对所述待仿制站点进行页面爬虫得到的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息;对提取到的所述页面请求信息以及与各所述页面请求信息分别对应的页面响应信息去重。
在示例性的实施例中,第一生成模块502还用于在接收到对某一所述页面响应信息的修改指令时,对所述页面响应信息进行修改;根据修改后的页面响应信息以及对应的所述页面请求信息生成对应的与所述页面请求信息绑定的服务函数;所述服务函数用于在执行时,返回与该服务函数绑定的所述页面请求信息对应的所述修改后的页面响应信息。
在示例性的实施例中,第一生成模块502还用于对所述页面响应信息中的HTML静态源码数据进行修改;或对所述页面响应信息中的图片数据进行修改;或对所述页面响应信息中的响应代码数据进行修改。
在示例性的实施例中,第二生成模块503用于基于各页面请求信息和对应的各服务函数生成与待仿制站点对应的蜜罐镜像;将蜜罐镜像上传至目标地址中得到可供访问者访问的蜜罐。
需要理解的是,出于描述简洁的考量,部分实施例一中描述过的内容在本实施例中不再赘述。
实施例四:
基于同一发明构思,本申请实施例提供一种电子设备,请参见图6所示,包括处理器601和存储器602,所述存储器602中存储有计算机程序,所述处理器601执行所述计算机程序,以实现上述实施例一中方法的步骤,在此不再赘述。
可以理解,图6所示的结构仅为示意,设备还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。
处理器601可以是一种集成电路芯片,具有信号处理能力。上述处理器601可以是通用处理器,包括中央处理器(CPU)、网络处理器(NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。
存储器602可以包括但不限于随机存取存储器(RAM),只读存储器(ROM),可编程只读存储器(PROM),可擦除只读存储器(EPROM),电可擦除只读存储器(EEPROM)等。
本实施例还提供了一种计算机可读存储介质,如软盘、光盘、硬盘、闪存、U盘、安全数码(SD)卡、多媒体(MMC)卡等,在该计算机可读存储介质中存储有实现上述各个步骤的一个或者多个程序,这一个或者多个程序可被一个或者多个处理器执行,以实现上述各实施例中方法的各步骤,在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种蜜罐生成方法,其特征在于,所述方法包括:
获取待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息;
根据各所述页面请求信息以及对应的各所述页面响应信息生成与各所述页面请求信息分别绑定的服务函数;所述服务函数用于在执行时,返回与所述服务函数绑定的所述页面请求信息对应的页面响应信息;
基于各所述页面请求信息和对应的各所述服务函数生成与所述待仿制站点对应的蜜罐。
2.如权利要求1所述的蜜罐生成方法,其特征在于,所述待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息为:根据所述待仿制站点的第一URL地址,对所述待仿制站点进行页面爬虫得到的信息。
3.如权利要求2所述的蜜罐生成方法,其特征在于,所述根据所述待仿制站点的第一URL地址,对所述待仿制站点进行页面爬虫,包括:
生成用于打开所述第一URL地址的页面请求信息发送给服务器;
存储所述页面请求信息和所述服务器针对所述页面请求信息返回的页面响应信息,并从所述页面响应信息中提取目标页面元素数据;
根据所述目标页面元素数据进行下一步动态爬虫操作,并在进行下一步动态爬虫操作的过程中,将爬取到的页面请求信息和对应的页面响应信息进行关联存储。
4.如权利要求3所述的蜜罐生成方法,其特征在于,所述目标页面元素数据包括页面链接元素数据和页面按钮元素数据中的至少一种;所述根据所述目标页面元素数据进行下一步动态爬虫操作,并在进行下一步动态爬虫操作的过程中,将爬取到的页面请求信息和对应的页面响应信息进行关联存储,包括:
在所述目标页面元素数据包括页面链接元素数据时,从所述页面链接元素数据中提取第二URL地址,生成用于打开所述第二URL地址的页面请求信息并发送给所述服务器,存储该页面请求信息以及所述服务器根据该页面请求信息返回的页面响应信息;
在所述目标页面元素数据包括页面按钮元素数据时,生成用于触发对应的页面按钮元素的页面请求信息发送给所述服务器,存储该页面请求信息以及所述服务器根据该页面请求信息返回的页面响应信息。
5.如权利要求2所述的蜜罐生成方法,其特征在于,所述获取待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息,包括:
从数据库中提取待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息;所述数据库中存储有对所述待仿制站点进行页面爬虫得到的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息;
对提取到的所述页面请求信息以及与各所述页面请求信息分别对应的页面响应信息去重。
6.如权利要求1-5任一项所述的蜜罐生成方法,其特征在于,所述根据各所述页面请求信息以及对应的各所述页面响应信息生成与各所述页面请求信息分别绑定的服务函数;所述服务函数用于在执行时,返回与所述服务函数绑定的所述页面请求信息对应的页面响应信息,包括:
在接收到对某一所述页面响应信息的修改指令时,对所述页面响应信息进行修改;
根据修改后的页面响应信息以及对应的所述页面请求信息生成对应的与所述页面请求信息绑定的服务函数;所述服务函数用于在执行时,返回与所述服务函数绑定的所述页面请求信息对应的所述修改后的页面响应信息。
7.如权利要求1-5任一项所述的蜜罐生成方法,其特征在于,所述基于各所述页面请求信息和对应的各所述服务函数生成与所述待仿制站点对应的蜜罐,包括:
基于各所述页面请求信息和对应的各所述服务函数生成与所述待仿制站点对应的蜜罐镜像;
将所述蜜罐镜像上传至目标地址中得到可供访问者访问的蜜罐。
8.一种蜜罐生成装置,其特征在于,包括:
获取模块,用于获取待仿制站点的页面请求信息以及与各所述页面请求信息分别对应的页面响应信息;
第一生成模块,用于根据各所述页面请求信息以及对应的各所述页面响应信息生成与各所述页面请求信息分别绑定的服务函数;所述服务函数用于在执行时,返回与所述服务函数绑定的所述页面请求信息对应的页面响应信息;
第二生成模块,用于基于各所述页面请求信息和对应的各所述服务函数生成与所述待仿制站点对应的蜜罐。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序,以实现如权利要求1-7中任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被至少一个处理器执行时,以实现如权利要求1-7中任意一项所述的方法。
CN202210527188.XA 2022-05-16 2022-05-16 蜜罐生成方法、装置、电子设备及存储介质 Pending CN114928484A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210527188.XA CN114928484A (zh) 2022-05-16 2022-05-16 蜜罐生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210527188.XA CN114928484A (zh) 2022-05-16 2022-05-16 蜜罐生成方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114928484A true CN114928484A (zh) 2022-08-19

Family

ID=82808510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210527188.XA Pending CN114928484A (zh) 2022-05-16 2022-05-16 蜜罐生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114928484A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115632885A (zh) * 2022-12-21 2023-01-20 北京微步在线科技有限公司 蜜罐制作方法、装置、电子设备及可读存储介质
CN117596087A (zh) * 2024-01-19 2024-02-23 深圳市安络科技有限公司 一种服务模拟方法、装置、计算机设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120070019A (ko) * 2010-12-21 2012-06-29 한국인터넷진흥원 하이브리드 인터액션 클라이언트 허니팟 시스템 및 그 운용방법
US20150370901A1 (en) * 2014-06-19 2015-12-24 Quixey, Inc. Techniques for focused crawling
CN107609150A (zh) * 2017-08-28 2018-01-19 湖北省楚天云有限公司 一种基于页面元素选取的交互式网络爬虫创建方法及系统
CN108846286A (zh) * 2018-06-21 2018-11-20 腾讯科技(深圳)有限公司 跨站脚本漏洞检测方法及装置
US20190020683A1 (en) * 2017-07-17 2019-01-17 Sap Se Automatic generation of low-interaction honeypots
CN112800309A (zh) * 2021-01-30 2021-05-14 上海应用技术大学 基于http代理的爬虫系统及其实现方法
CN114024728A (zh) * 2021-10-28 2022-02-08 杭州默安科技有限公司 一种蜜罐搭建方法以及应用方法
CN114095234A (zh) * 2021-11-17 2022-02-25 北京知道创宇信息技术股份有限公司 蜜罐生成方法、装置、服务器和计算机可读存储介质
CN114124414A (zh) * 2020-08-11 2022-03-01 奇安信科技集团股份有限公司 蜜罐服务的生成方法、装置和攻击行为数据的捕获方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120070019A (ko) * 2010-12-21 2012-06-29 한국인터넷진흥원 하이브리드 인터액션 클라이언트 허니팟 시스템 및 그 운용방법
US20150370901A1 (en) * 2014-06-19 2015-12-24 Quixey, Inc. Techniques for focused crawling
US20190020683A1 (en) * 2017-07-17 2019-01-17 Sap Se Automatic generation of low-interaction honeypots
CN107609150A (zh) * 2017-08-28 2018-01-19 湖北省楚天云有限公司 一种基于页面元素选取的交互式网络爬虫创建方法及系统
CN108846286A (zh) * 2018-06-21 2018-11-20 腾讯科技(深圳)有限公司 跨站脚本漏洞检测方法及装置
CN114124414A (zh) * 2020-08-11 2022-03-01 奇安信科技集团股份有限公司 蜜罐服务的生成方法、装置和攻击行为数据的捕获方法
CN112800309A (zh) * 2021-01-30 2021-05-14 上海应用技术大学 基于http代理的爬虫系统及其实现方法
CN114024728A (zh) * 2021-10-28 2022-02-08 杭州默安科技有限公司 一种蜜罐搭建方法以及应用方法
CN114095234A (zh) * 2021-11-17 2022-02-25 北京知道创宇信息技术股份有限公司 蜜罐生成方法、装置、服务器和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
许云峰、徐华、张妍、王杨君、马瑞: "《大数据技术及行业应用》", vol. 1, 北京邮电大学出版社, pages: 152 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115632885A (zh) * 2022-12-21 2023-01-20 北京微步在线科技有限公司 蜜罐制作方法、装置、电子设备及可读存储介质
CN115632885B (zh) * 2022-12-21 2023-04-21 北京微步在线科技有限公司 蜜罐制作方法、装置、电子设备及可读存储介质
CN117596087A (zh) * 2024-01-19 2024-02-23 深圳市安络科技有限公司 一种服务模拟方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN106302337B (zh) 漏洞检测方法和装置
CN113037777B (zh) 蜜罐诱饵的分配方法及装置、存储介质、电子设备
CN114928484A (zh) 蜜罐生成方法、装置、电子设备及存储介质
CN113645253B (zh) 一种攻击信息获取方法、装置、设备及存储介质
CN114095234B (zh) 蜜罐生成方法、装置、服务器和计算机可读存储介质
CN105306473A (zh) 一种防止注入攻击的方法、客户端、服务器和系统
WO2017219733A1 (zh) 请求的响应方法及装置
US11405403B2 (en) Method and device, and server and terminal for processing network resource access
CN113098835A (zh) 基于区块链的蜜罐实现方法、蜜罐客户端和蜜罐系统
CN113469866A (zh) 数据处理方法、装置和服务器
CN111539775A (zh) 应用程序的管理方法及设备
CN106878345A (zh) 一种篡改防护的方法及装置
CN115225707A (zh) 资源访问方法及装置
CA3148146A1 (en) Techniques for incentivized intrusion detection system
WO2017215650A1 (zh) 微端的自动登录方法、装置、程序及介质
CN112579958B (zh) 网页转换方法、装置、计算机设备及可读存储介质
CN110806913A (zh) 网页截图方法、装置及设备
CN114285626A (zh) 一种蜜罐攻击链构建方法及蜜罐系统
CN112528181B (zh) 二维码管理方法、装置、计算机设备及可读存储介质
CN114124414B (zh) 蜜罐服务的生成方法和装置,攻击行为数据的捕获方法,计算机设备,存储介质
CN104346460A (zh) 进行文件下载的方法、装置及浏览器客户端
CN114567472A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN114553529A (zh) 一种数据处理方法、装置、网络设备及存储介质
CN109491647A (zh) 一种基于编程语言的在线预防攻击方法及电子设备
CN112817816B (zh) 埋点处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination