CN113886829A - 一种失陷主机检测方法、装置、电子设备及存储介质 - Google Patents

一种失陷主机检测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113886829A
CN113886829A CN202111487998.9A CN202111487998A CN113886829A CN 113886829 A CN113886829 A CN 113886829A CN 202111487998 A CN202111487998 A CN 202111487998A CN 113886829 A CN113886829 A CN 113886829A
Authority
CN
China
Prior art keywords
host
portrait
detection
data
static
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111487998.9A
Other languages
English (en)
Other versions
CN113886829B (zh
Inventor
周公延
陈杰
黄雅芳
童兆丰
薛锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ThreatBook Technology Co Ltd
Original Assignee
Beijing ThreatBook Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ThreatBook Technology Co Ltd filed Critical Beijing ThreatBook Technology Co Ltd
Priority to CN202111487998.9A priority Critical patent/CN113886829B/zh
Publication of CN113886829A publication Critical patent/CN113886829A/zh
Application granted granted Critical
Publication of CN113886829B publication Critical patent/CN113886829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • G06F21/566Dynamic detection, i.e. detection performed at run-time, e.g. emulation, suspicious activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Geometry (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Virology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供一种失陷主机检测方法、装置、电子设备及存储介质,其中,该方法包括:获取检测数据;根据检测数据构建主机静态画像,及根据检测数据构建主机动态画像;对主机静态画像和主机动态画像进行预处理,得到预处理后的主机静态画像和预处理后的主机动态画像;根据预处理后的主机静态画像和预处理后的主机动态画像获得样本训练数据集和样本测试数据集;将样本训练数据集输入机器学习模型进行训练,得到失陷检测模型;将样本测试数据集输入失陷检测模型中,得到检测结果。实施本申请实施例,失陷主机的检测效率,可以有效的识别未知威胁,并减少资源的耗费。

Description

一种失陷主机检测方法、装置、电子设备及存储介质
技术领域
本申请涉及网络安全技术领域,具体而言,涉及一种失陷主机检测方法、装置、电子设备及计算机可读存储介质。
背景技术
随着大数据和人工智能技术的快速发展,网络攻击呈现出数量多、速度快、持续时间长等特性,为企业安全带来了巨大的挑战。失陷主机检测是企业应对威胁的有效检测手段之一,基于失陷主机检测构建主动防御体系的安全防护体系是下一代安全防护产品的核心要务,主机画像技术可以融合多元异构网络安全数据,采用数据挖掘技术进行数据分析、构建行为基准,融合机器学习方法进行风险评估,从更高层次全面、准确、动态的反映网络中发生的攻防行为。
基于行为的检测方法在特定攻击场景下可以有效的识别威胁,但仍然存在如下缺陷。例如,仅以主机上的日志作为检测数据源,数据来源单一,不能全面刻画主机行为;检测引擎需要制定大量的检测规则,只能检测已知的攻击行为,无法检测未知威胁 ,使企业安全防护处于被动状态;主机安全情况大量依赖人工分析,缺乏有效的主机失陷情况指标,由于告警日志误报和大数据量的原因,导致人工分析效率低下且耗费资源。
发明内容
本申请实施例的目的在于提供一种失陷主机检测方法、装置、电子设备及计算机可读存储介质,提高了失陷主机的检测效率,可以有效地识别未知威胁,并减少资源的耗费。
第一方面,本申请实施例提供了一种失陷主机检测方法,所述方法包括:
获取检测数据;
根据所述检测数据构建主机静态画像,及根据所述检测数据构建主机动态画像;
对所述主机静态画像和所述主机动态画像进行预处理,得到预处理后的主机静态画像和预处理后的主机动态画像;
根据所述预处理后的主机静态画像和所述预处理后的主机动态画像获得样本训练数据集和样本测试数据集;
将所述样本训练数据集输入机器学习模型进行训练,得到失陷检测模型;
将所述样本测试数据集输入所述失陷检测模型中,得到检测结果。
在上述实现过程中,通过多种检测数据的采集、融合,采用机器学习模型,基于主机画像实现了动态、准确的主机失陷检测,并且实现了自动化的主机失陷检测,提高了失陷主机的检测效率,可以有效的识别未知威胁,极大地降低了安全维护成本,并减少资源的耗费,有效地提升了企业的主动防御能力。
进一步地,所述根据所述检测数据构建主机静态画像的步骤,包括:
获取所述检测数据中的主机基础信息和资产数据;
根据所述主机基础信息和资产数据构建所述主机静态画像。
在上述实现过程中,主机静态画像根据主机基础信息和资产数据进行构建,可以反映出主机的基础信息、资产数据和静态行为等,并辅助主机进行失陷检测。
进一步地,所述根据所述检测数据构建主机动态画像的步骤,包括:
利用ATT&CK技术(AdversarialTactics Techniques and Common Knowledge,对抗性策略、技术和通用知识)根据所述检测数据中的日志数据建立主机行为模型;
根据所述检测数据中的威胁情报信息和所述主机行为模型获得主机动态画像;
并对所述主机动态画像中的异常行为进行标记,获得异常行为数据。
在上述实现过程中,利用ATT&CK技术根据日志数据建立主机行为模型,一方面,可以将日志数据反映的主机行为中,另一方面,使用统计学习方法标记异常行为,结合威胁情报信息和主机行为模型得到主机动态画像,可以反映出主机的动态特性。
进一步地,所述根据所述预处理后的主机静态画像和所述预处理后的主机动态画像获得样本训练数据集和样本测试数据集的步骤,包括:
提取所述预处理后的主机静态画像中的静态画像特征;
提取所述预处理后的主机动态画像中的动态画像特征;
根据所述静态画像特征、所述动态画像特征和所述异常行为数据获得样本训练数据集和样本测试数据集。
在上述实现过程中,结合静态画像特征、动态画像特征和异常行为数据得到的样本训练数据集和样本测试数据集,可以多方位的反映出主机的静态行为和动态行为,为全面检测主机失陷提供数据基础。
进一步地,所述根据所述静态画像特征、所述动态画像特征和所述异常行为数据获得样本训练数据集和样本测试数据集的步骤,包括:
根据所述静态画像特征、所述动态画像特征和所述异常行为数据获得失陷检测样本数据;
将所述失陷检测样本数据分为样本测试数据集和样本训练数据集。
在上述实现过程中,样本测试数据集可以帮助构建符合主机失陷检测特性的失陷检测模型,使得模型对失陷主机的准确率更高,效率也更高。
进一步地,所述对所述主机静态画像和所述主机动态画像进行预处理,得到预处理后的主机静态画像和预处理后的主机动态画像的步骤,包括:
对所述主机静态画像和所述主机动态画像分别进行连续值离散化处理、缺失值处理和文本数据向量化处理,得到预处理后的主机静态画像和预处理后的主机动态画像。
在上述实现过程中,对主机静态画像和主机动态画像分别进行预处理,可以过滤掉主机静态画像和主机动态画像中不合格的、异常的数据,使得主机静态画像和主机动态画像可以更准确的反映主机画像。
进一步地,所述将所述样本测试数据集输入所述失陷检测模型中,得到检测结果的步骤之后,还包括:
根据所述检测结果更新所述失陷检测模型中的模型参数。
在上述实现过程中,更新模型参数可以使得失陷检测模型保持对失陷主机检测的适应性和实时性,避免检测数据发生改变导致失陷检测模型无法准确检测失陷主机。
第二方面,本申请实施例还提供了一种失陷主机检测装置,所述装置包括:
获取模块,用于获取检测数据;
构建模块,用于根据所述检测数据构建主机静态画像,及根据所述检测数据构建主机动态画像;
预处理模块,用于对所述主机静态画像和所述主机动态画像进行预处理,得到预处理后的主机静态画像和预处理后的主机动态画像;
数据集获得模块,用于根据所述预处理后的主机静态画像和所述预处理后的主机动态画像获得样本训练数据集和样本测试数据集;
模型训练模块,用于将所述样本训练数据集输入机器学习模型进行训练,得到失陷检测模型;
检测模块,用于将所述样本测试数据集输入所述失陷检测模型中,得到检测结果。
第三方面,本申请实施例提供的一种电子设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述的方法的步骤。
第四方面,本申请实施例提供的一种计算机可读存储介质,所述存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行如第一方面任一项所述的方法。
第五方面,本申请实施例提供的一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行如第一方面任一项所述的方法。
本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
并可依照说明书的内容予以实施,以下以本申请的较佳实施例并配合附图详细说明如后。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的失陷主机检测方法的流程示意图;
图2为本申请实施例提供的失陷主机检测装置的结构组成示意图;
图3为本申请实施例提供的电子设备的结构组成示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合附图和实施例,对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
实施例一
图1是本申请实施例提供的失陷主机检测方法的流程示意图,如图1所示,该方法包括:
S1,获取检测数据;
S2,根据检测数据构建主机静态画像,及根据检测数据构建主机动态画像;
S3,对主机静态画像和主机动态画像进行预处理,得到预处理后的主机静态画像和预处理后的主机动态画像;
S4,根据预处理后的主机静态画像和预处理后的主机动态画像获得样本训练数据集和样本测试数据集;
S5,将样本训练数据集输入机器学习模型进行训练,得到失陷检测模型;
S6,将样本测试数据集输入失陷检测模型中,得到检测结果。
以本实施例为例,通过多种检测数据的采集、融合,采用机器学习模型,基于主机画像实现了动态、准确的主机失陷检测,并且利用机器学习算法实现了自动化的主机失陷检测,极大的降低了安全维护成本,有效的提升了企业的主动防御能力。
在S1中,获取检测数据。
检测数据主要包括主机基础信息(如内存、内核版本等)、资产数据(如系统账号、开放端口、数据库等)、威胁情报信息(使用云API获取威胁情报数据源)、行为日志数据(如登录日志、进程行为日志、文件日志、网络日志等)、网络流量数据(网络协议、对应协议的基础字段、流量数据)等。
可选地,在获取到检测数据之后,还对检测数据进行存储,将采集到的检测数据,按照结构化数据、非结构化数据分别在大数据平台进行存储。可以更好的适应失陷主机检测的要求,并且提高失陷主机检测的准确率。
在S2中,根据检测数据构建主机静态画像,及根据检测数据构建主机动态画像,包括:
获取检测数据中的主机基础信息和资产数据;
根据主机基础信息和资产数据构建主机静态画像。
以本实施例为例,主机静态画像主机基础信息和资产数据进行构建,可以反映出主机的基础信息、资产数据和静态行为等,并辅助主机进行失陷检测。
进一步地,根据检测数据构建主机动态画像的步骤,包括:
利用ATT&CK技术根据检测数据中的日志数据建立主机行为模型;
根据检测数据中的威胁情报信息和主机行为模型获得主机动态画像;
并对主机动态画像中的异常行为进行标记,获得异常行为数据。
以本实施例为例,利用ATT&CK技术根据日志数据建立主机行为模型,一方面,可以将日志数据反映的主机行为中,另一方面,使用统计学习方法标记异常行为,结合威胁情报信息和主机行为模型得到主机动态画像,可以反映出主机的动态特性。
ATT&CK是由MITRE提出的一套反应各个攻击生命周期攻击行为的模型和知识库,对更具观测性的攻击者行为,构建了一套更细粒度、更易共享的知识模型和框架,并通过不断积累,形成一套由政府、公共服务企业、私营企业和学术机构共同参与和维护的网络攻击者行为知识库,以指导用户采取针对性的检测、防御和响应工作。
示例性地,使用统计学习方法分析日志建立主机行为模型,并标记异常行为,结合威胁情报信息和行为模型得到主机动态特性,其中包括主机进程数、主机资源异常使用、主机异常网络连接、主机异常进程等行为。
在S3中,根据预处理后的主机静态画像和预处理后的主机动态画像获得样本训练数据集和样本测试数据集,包括:
提取预处理后的主机静态画像中的静态画像特征;
提取预处理后的主机动态画像中的动态画像特征;
根据静态画像特征、动态画像特征和异常行为数据获得样本训练数据集和样本测试数据集。
进一步地,对主机静态画像和主机动态画像进行预处理,得到预处理后的主机静态画像和预处理后的主机动态画像的步骤,包括:
对主机静态画像和主机动态画像分别进行连续值离散化处理、缺失值处理和文本数据向量化处理,得到预处理后的主机静态画像和预处理后的主机动态画像。
在上述实现过程中,对主机静态画像和主机动态画像分别进行预处理,可以过滤掉主机静态画像和主机动态画像中不合格的、异常的数据,使得主机静态画像和主机动态画像可以更准确的反映主机画像。结合静态画像特征、动态画像特征和异常行为数据得到的样本训练数据集和样本测试数据集,可以多方位的反映出主机的静态行为和动态行为,为全面检测主机失陷提供数据基础。
在S4中,根据静态画像特征、动态画像特征和异常行为数据获得样本训练数据集和样本测试数据集,包括:
根据静态画像特征、动态画像特征和异常行为数据获得失陷检测样本数据;
将失陷检测样本数据分为样本测试数据集和样本训练数据集。
在上述实现过程中,样本测试数据集可以帮助构建符合主机失陷检测特性的失陷检测模型,使得模型对失陷主机的准确率更高,效率也更高。
在S5中,将样本训练数据集输入机器学习模型进行训练,得到失陷检测模型。
示例性地,使用机器学习算法训练失陷检测模型,使用网格搜索或启发式算法自动选择最优模型参数。并将失陷检测模型部署到服务端,输出检测结果。
在S6中,将样本测试数据集输入失陷检测模型中,得到检测结果。
检测结果中包含主机失陷指标,主机失陷指标中的使用误报率、准确率可以作为失陷检测模型的性能评估指标。
进一步地,将样本测试数据集输入失陷检测模型中,得到检测结果的步骤之后,还包括:
根据检测结果更新失陷检测模型中的模型参数。
在上述实现过程中,根据检测结果和新的样本测试数据集对失陷检测模型进行训练,得到新的失陷检测模型,获取新的失陷检测模型中的模型参数,根据新的模型参数可以对新的失陷检测模型的性能进行评估,因此,更新模型参数可以使得失陷检测模型保持对失陷主机检测的适应性和实时性,避免检测数据发生改变导致失陷检测模型无法准确检测失陷主机。
示例性地,通过两台客户端C1、C2,两台服务器S1、S2,并且以客户端C1作为攻击方,客户端C2、服务器S1、S2作为目标网络机组,依次执行如下操作:
1.攻击者客户端C1向目标网络发送恶意邮件,建立逆向TCP(TransmissionControl Protocol,传输控制协议)连接,客户端C2打开恶意邮件后被入侵;
2.客户端C1上传nmap(Network Mapper,一种网络扫描和嗅探工具包)到客户端C2;
3.客户端C2扫描nmap系统子网;
4.识别到服务器S1运行Mysql(关系型数据库管理系统)作为后台数据库并且开放了80端口;
5.利用SQL(Structured Query Language,结构化查询语言)注入入侵目标服务器。
在申请实施例中,通过多种检测数据的采集、融合,采用机器学习模型,基于主机画像实现了动态、准确的主机失陷检测,并且利用机器学习算法实现了自动化的主机失陷检测,极大的降低了安全维护成本,有效的提升了企业的主动防御能力。
实施例二
为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供一种失陷主机检测装置,如图2所示,该装置包括:
获取模块1,用于获取检测数据;
构建模块2,用于根据检测数据构建主机静态画像,及根据检测数据构建主机动态画像;
预处理模块3,用于对主机静态画像和主机动态画像进行预处理,得到预处理后的主机静态画像和预处理后的主机动态画像;
数据集获得模块4,用于根据预处理后的主机静态画像和预处理后的主机动态画像获得样本训练数据集和样本测试数据集;
模型训练模块5,用于将样本训练数据集输入机器学习模型进行训练,得到失陷检测模型;
检测模块6,用于将样本测试数据集输入失陷检测模型中,得到检测结果。
进一步地,构建模块2还用于:
获取检测数据中的主机基础信息和资产数据;
根据主机基础信息和资产数据构建主机静态画像;
利用ATT&CK技术根据检测数据中的日志数据建立主机行为模型;
根据检测数据中的威胁情报信息和主机行为模型获得主机动态画像;
并对主机动态画像中的异常行为进行标记,获得异常行为数据。
进一步地,预处理模块3还用于:
对主机静态画像和主机动态画像分别进行连续值离散化处理、缺失值处理和文本数据向量化处理,得到预处理后的主机静态画像和预处理后的主机动态画像。
进一步地,数据集获得模块4还用于:
提取预处理后的主机静态画像中的静态画像特征;
提取预处理后的主机动态画像中的动态画像特征;
根据静态画像特征、动态画像特征和异常行为数据获得样本训练数据集和样本测试数据集;
根据静态画像特征、动态画像特征和异常行为数据获得失陷检测样本数据;
将失陷检测样本数据分为样本测试数据集和样本训练数据集。
可选地,该装置还包括更新模块,用于根据检测结果更新失陷检测模型中的模型参数。
上述的失陷主机检测装置可实施上述实施例一的方法。上述实施例一中的可选项也适用于本实施例,这里不再详述。
本申请实施例的其余内容可参照上述实施例一的内容,在本实施例中,不再进行赘述。
实施例三
本申请实施例提供一种电子设备,包括存储器及处理器,该存储器用于存储计算机程序,该处理器运行计算机程序以使电子设备执行实施例一的失陷主机检测方法。
可选地,上述电子设备可以是服务器。
请参见图3,图3为本申请实施例提供的电子设备的结构组成示意图。该电子设备可以包括处理器31、通信接口32、存储器33和至少一个通信总线34。其中,通信总线34用于实现这些组件直接的连接通信。其中,本申请实施例中设备的通信接口32用于与其他节点设备进行信令或数据的通信。处理器31可以是一种集成电路芯片,具有信号的处理能力。
上述的处理器31可以是通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器31也可以是任何常规的处理器等。
存储器33可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。存储器33中存储有计算机可读取指令,当计算机可读取指令由所述处理器31执行时,设备可以执行上述图1方法实施例涉及的各个步骤。
可选地,电子设备还可以包括存储控制器、输入输出单元。存储器33、存储控制器、处理器31、外设接口、输入输出单元各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通信总线34实现电性连接。处理器31用于执行存储器33中存储的可执行模块,例如设备包括的软件功能模块或计算机程序。
输入输出单元用于提供给用户创建任务以及为该任务创建启动可选时段或预设执行时间以实现用户与服务器的交互。输入输出单元可以是,但不限于,鼠标和键盘等。
可以理解,图3所示的结构仅为示意,电子设备还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。
另外,本申请实施例还提供一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理器执行时实现实施例一的失陷主机检测方法。
本申请实施例还提供一种计算机程序产品,该计算机程序产品在计算机上运行时,使得计算机执行方法实施例所述的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种失陷主机检测方法,其特征在于,所述方法包括:
获取检测数据;
根据所述检测数据构建主机静态画像,及根据所述检测数据构建主机动态画像;
对所述主机静态画像和所述主机动态画像进行预处理,得到预处理后的主机静态画像和预处理后的主机动态画像;
根据所述预处理后的主机静态画像和所述预处理后的主机动态画像获得样本训练数据集和样本测试数据集;
将所述样本训练数据集输入机器学习模型进行训练,得到失陷检测模型;
将所述样本测试数据集输入所述失陷检测模型中,得到检测结果。
2.根据权利要求1所述的失陷主机检测方法,其特征在于,所述根据所述检测数据构建主机静态画像的步骤,包括:
获取所述检测数据中的主机基础信息和资产数据;
根据所述主机基础信息和资产数据构建所述主机静态画像。
3.根据权利要求1所述的失陷主机检测方法,其特征在于,所述根据所述检测数据构建主机动态画像的步骤,包括:
利用ATT&CK技术根据所述检测数据中的日志数据建立主机行为模型;
根据所述检测数据中的威胁情报信息和所述主机行为模型获得主机动态画像;
并对所述主机动态画像中的异常行为进行标记,获得异常行为数据。
4.根据权利要求3所述的失陷主机检测方法,其特征在于,所述根据所述预处理后的主机静态画像和所述预处理后的主机动态画像获得样本训练数据集和样本测试数据集的步骤,包括:
提取所述预处理后的主机静态画像中的静态画像特征;
提取所述预处理后的主机动态画像中的动态画像特征;
根据所述静态画像特征、所述动态画像特征和所述异常行为数据获得样本训练数据集和样本测试数据集。
5.根据权利要求4所述的失陷主机检测方法,其特征在于,所述根据所述静态画像特征、所述动态画像特征和所述异常行为数据获得样本训练数据集和样本测试数据集的步骤,包括:
根据所述静态画像特征、所述动态画像特征和所述异常行为数据获得失陷检测样本数据;
将所述失陷检测样本数据分为样本测试数据集和样本训练数据集。
6.根据权利要求1所述的失陷主机检测方法,其特征在于,所述对所述主机静态画像和所述主机动态画像进行预处理,得到预处理后的主机静态画像和预处理后的主机动态画像的步骤,包括:
对所述主机静态画像和所述主机动态画像分别进行连续值离散化处理、缺失值处理和文本数据向量化处理,得到预处理后的主机静态画像和预处理后的主机动态画像。
7.根据权利要求1所述的失陷主机检测方法,其特征在于,在所述将所述样本测试数据集输入所述失陷检测模型中,得到检测结果的步骤之后,还包括:
根据所述检测结果更新所述失陷检测模型中的模型参数。
8.一种失陷主机检测装置,其特征在于,所述装置包括:
获取模块,用于获取检测数据;
构建模块,用于根据所述检测数据构建主机静态画像,及根据所述检测数据构建主机动态画像;
预处理模块,用于对所述主机静态画像和所述主机动态画像进行预处理,得到预处理后的主机静态画像和预处理后的主机动态画像;
数据集获得模块,用于根据所述预处理后的主机静态画像和所述预处理后的主机动态画像获得样本训练数据集和样本测试数据集;
模型训练模块,用于将所述样本训练数据集输入机器学习模型进行训练,得到失陷检测模型;
检测模块,用于将所述样本测试数据集输入所述失陷检测模型中,得到检测结果。
9.一种电子设备,其特征在于,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行根据权利要求1至7中任一项所述的失陷主机检测方法。
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的失陷主机检测方法。
CN202111487998.9A 2021-12-08 2021-12-08 一种失陷主机检测方法、装置、电子设备及存储介质 Active CN113886829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111487998.9A CN113886829B (zh) 2021-12-08 2021-12-08 一种失陷主机检测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111487998.9A CN113886829B (zh) 2021-12-08 2021-12-08 一种失陷主机检测方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113886829A true CN113886829A (zh) 2022-01-04
CN113886829B CN113886829B (zh) 2022-03-18

Family

ID=79016528

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111487998.9A Active CN113886829B (zh) 2021-12-08 2021-12-08 一种失陷主机检测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113886829B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115146263A (zh) * 2022-09-05 2022-10-04 北京微步在线科技有限公司 用户账号的失陷检测方法、装置、电子设备及存储介质
CN115225413A (zh) * 2022-09-20 2022-10-21 北京微步在线科技有限公司 一种失陷指标的提取方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160191465A1 (en) * 2014-09-14 2016-06-30 Sophos Limited Firewall techniques for colored objects on endpoints
CN105915532A (zh) * 2016-05-23 2016-08-31 北京网康科技有限公司 一种失陷主机的识别方法及装置
US20190215697A1 (en) * 2017-12-18 2019-07-11 Korea University Research And Business Foundation Apparatus and method for managing risk of malware behavior in mobile operating system and recording medium for perform the method
CN111245787A (zh) * 2019-12-31 2020-06-05 西安交大捷普网络科技有限公司 一种失陷设备识别与设备失陷度评估的方法、装置
CN111885033A (zh) * 2020-07-14 2020-11-03 南京聚铭网络科技有限公司 基于多源安全检测框架的机器学习场景检测方法及系统
CN112818131A (zh) * 2021-02-01 2021-05-18 亚信科技(成都)有限公司 一种威胁情报的图谱构建方法、系统及存储介质
CN112966264A (zh) * 2021-02-28 2021-06-15 新华三信息安全技术有限公司 Xss攻击检测方法、装置、设备及机器可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160191465A1 (en) * 2014-09-14 2016-06-30 Sophos Limited Firewall techniques for colored objects on endpoints
CN105915532A (zh) * 2016-05-23 2016-08-31 北京网康科技有限公司 一种失陷主机的识别方法及装置
US20190215697A1 (en) * 2017-12-18 2019-07-11 Korea University Research And Business Foundation Apparatus and method for managing risk of malware behavior in mobile operating system and recording medium for perform the method
CN111245787A (zh) * 2019-12-31 2020-06-05 西安交大捷普网络科技有限公司 一种失陷设备识别与设备失陷度评估的方法、装置
CN111885033A (zh) * 2020-07-14 2020-11-03 南京聚铭网络科技有限公司 基于多源安全检测框架的机器学习场景检测方法及系统
CN112818131A (zh) * 2021-02-01 2021-05-18 亚信科技(成都)有限公司 一种威胁情报的图谱构建方法、系统及存储介质
CN112966264A (zh) * 2021-02-28 2021-06-15 新华三信息安全技术有限公司 Xss攻击检测方法、装置、设备及机器可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PENG ZHOU ET AL: "Detecting multi-stage attacks using sequence-to-sequence model", 《COMPUTER &SECURITY》 *
司德睿 等: "一种基于机器学习的安全威胁分析系统", 《信息技术与网络安全》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115146263A (zh) * 2022-09-05 2022-10-04 北京微步在线科技有限公司 用户账号的失陷检测方法、装置、电子设备及存储介质
CN115225413A (zh) * 2022-09-20 2022-10-21 北京微步在线科技有限公司 一种失陷指标的提取方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113886829B (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
CN108471429B (zh) 一种网络攻击告警方法及系统
CN110399925B (zh) 账号的风险识别方法、装置及存储介质
CN108092962B (zh) 一种恶意url检测方法及装置
CN108683687B (zh) 一种网络攻击识别方法及系统
CN108881263B (zh) 一种网络攻击结果检测方法及系统
EP2691848B1 (en) Determining machine behavior
CN108833186B (zh) 一种网络攻击预测方法及装置
CN112131882A (zh) 一种多源异构网络安全知识图谱构建方法及装置
Cao et al. Machine learning to detect anomalies in web log analysis
CN113886829B (zh) 一种失陷主机检测方法、装置、电子设备及存储介质
US20080148398A1 (en) System and Method for Definition and Automated Analysis of Computer Security Threat Models
US10944791B2 (en) Increasing security of network resources utilizing virtual honeypots
CN111104579A (zh) 一种公网资产的识别方法、装置及存储介质
CN112003838A (zh) 网络威胁的检测方法、装置、电子装置和存储介质
US20210406368A1 (en) Deep learning-based analysis of signals for threat detection
CN112131571B (zh) 威胁溯源方法及相关设备
CN114024773B (zh) 一种webshell文件检测方法及系统
CN112714118A (zh) 网络流量检测方法和装置
CN115146263B (zh) 用户账号的失陷检测方法、装置、电子设备及存储介质
CN114363002B (zh) 一种网络攻击关系图的生成方法及装置
Gilmary et al. Discovering social bots on Twitter: a thematic review
CN114205146B (zh) 一种多源异构安全日志的处理方法及装置
CN113238971A (zh) 基于状态机的自动化渗透测试系统及方法
CN113378172B (zh) 用于识别敏感网页的方法、装置、计算机系统和介质
Stahl et al. Intelligence Techniques in Computer Security and Forensics: at the boundaries of ethics and law

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant