CN116527411B

CN116527411B - 数据安全智能防护模型构建方法、装置及协作平台

Info

Publication number: CN116527411B
Application number: CN202310814826.0A
Authority: CN
Inventors: 刘维炜
Original assignee: Anling Technology Hangzhou Co ltd
Current assignee: Anling Technology Hangzhou Co ltd
Priority date: 2023-07-05
Filing date: 2023-07-05
Publication date: 2023-09-22
Anticipated expiration: 2043-07-05
Also published as: CN116527411A

Abstract

本发明提供一种数据安全智能防护模型构建方法、装置及协作平台，通过确定当前数据安全防护任务，基于当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及样本数据集中样本数据的数据描述信息后，基于模型结构信息构建当前数据安全防护任务对应的安全防护初始模型，并基于样本数据集中样本数据及其数据描述信息对安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型，随后基于数据集中样本数据及其数据描述信息对安全防护优化模型进行训练，得到当前数据安全防护任务对应的已训练的安全防护优化模型，提升了该方法的可扩展性，且模型的调整优化训练等过程可以根据模型性能自主调节，安全防护能力得到了提升。

Description

数据安全智能防护模型构建方法、装置及协作平台

技术领域

本发明涉及信息安全技术领域，尤其涉及一种数据安全智能防护模型构建方法、装置及协作平台。

背景技术

网络安全、数据隐私泄漏等数据安全问题已经成为当前互联网时代存在的重要问题之一。对此，许多针对性的安全防护方案已经提出，如异常检测、威胁情报模型、行为分析技术等。随着人工智能技术的迅猛发展，上述安全防护方案转向了深度学习领域，以利用深度学习技术强大的自学习能力进行自主地安全模式分析和识别等。然而，深度学习技术中众多模型的选择、大规模的训练等使得目前建立在深度学习基础上的安全防护方案仅能针对某一特定任务场景，例如异常检测，且即使仅针对特定场景进行模型构建和训练，其模型性能也受限于模型构建者个人的经验（例如模型架构的选定、超参数的设置等），无法有效解决当前数据安全领域复杂多变的问题。

发明内容

本发明提供一种数据安全智能防护模型构建方法、装置及协作平台，用以解决现有技术中安全防护方案局限性较强、模型性能受限等缺陷。

本发明提供一种数据安全智能防护模型构建方法，包括：

确定当前数据安全防护任务；其中，所述数据安全防护任务为异常检测任务、威胁情报分析任务、行为分析任务或攻击响应任务；

基于所述当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及所述样本数据集中样本数据的数据描述信息；其中，所述样本数据集包括网络行为产生的日志数据和/或流量数据；所述数据描述信息包括所述样本数据的标签以及输入输出格式；

基于所述模型结构信息构建所述当前数据安全防护任务对应的安全防护初始模型，并基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型；

基于所述数据集中样本数据及其数据描述信息对所述安全防护优化模型进行训练，得到所述当前数据安全防护任务对应的已训练的安全防护优化模型。

根据本发明提供的一种数据安全智能防护模型构建方法，所述基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型，具体包括：

在预设模型架构和预设模型超参数基础上，基于所述样本数据集中样本数据及其数据描述信息，得到所述安全防护初始模型针对各个样本数据的预测结果，并生成所述安全防护初始模型的评估结果，再基于所述安全防护初始模型的评估结果对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型；

所述模型架构包括模型深度和模型宽度，所述模型超参数包括学习率、隐含层数量、每层神经元数量；所述评估结果包括基于所述安全防护初始模型每次预测的预测结果和标签计算得到的模型损失值、精度、召回率、F1分数和AUC中的一种或多种。

根据本发明提供的一种数据安全智能防护模型构建方法，所述在预设模型架构和预设模型超参数基础上，基于所述样本数据集中样本数据及其数据描述信息，得到所述安全防护初始模型针对各个样本数据的预测结果，并生成所述安全防护初始模型的评估结果，再基于所述安全防护初始模型的评估结果对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型，具体包括：

在预设模型架构和预设模型超参数基础上，基于所述样本数据集中第一样本数据及其数据描述信息，得到所述安全防护初始模型针对各个第一样本数据的预测结果，并生成所述安全防护初始模型的第一评估结果，再基于所述安全防护初始模型的第一评估结果对所述安全防护初始模型的模型架构进行调整，得到优化模型架构；

在所述优化模型架构和所述预设模型超参数基础上，基于所述样本数据集中第二样本数据及其数据描述信息，得到所述安全防护初始模型针对各个第二样本数据的预测结果，并生成所述安全防护初始模型的第二评估结果，再基于所述安全防护初始模型的第二评估结果对所述安全防护初始模型的模型超参数进行调整，得到安全防护优化模型。

根据本发明提供的一种数据安全智能防护模型构建方法，所述基于所述安全防护初始模型的第二评估结果对所述安全防护初始模型的模型超参数进行调整，得到安全防护优化模型，具体包括：

基于网格搜索或贝叶斯优化方法，根据所述安全防护初始模型的第二评估结果对所述安全防护初始模型的模型超参数进行调整，得到安全防护优化模型。

根据本发明提供的一种数据安全智能防护模型构建方法，所述模型结构信息包含多类模型结构对应的结构描述信息，基于所述模型结构信息构建得到的当前数据安全防护任务对应的安全防护初始模型及其对应的安全防护优化模型有多个；

所述基于所述数据集中样本数据及其数据描述信息对所述安全防护优化模型进行训练，得到所述当前数据安全防护任务对应的已训练的安全防护优化模型，之后还包括：

对多个已训练的安全防护优化模型进行模型融合，得到所述当前数据安全防护任务对应的集成防护模型。

根据本发明提供的一种数据安全智能防护模型构建方法，所述基于所述当前数据安全防护任务，获取对应的样本数据集，具体包括：

基于所述当前数据安全防护任务，获取对应的原始数据集；

对所述原始数据集中的原始数据进行去噪处理后转换为预设标准格式的预处理数据，并对所述预设标准格式的预处理数据进行向量化和标签化，得到所述当前数据安全防护任务对应的样本数据集。

根据本发明提供的一种数据安全智能防护模型构建方法，所述当前数据安全防护任务对应的模型结构信息是基于模型安全性和模型执行效率选择得到的。

本发明还提供一种数据安全智能防护模型构建装置，包括：

任务确定单元，用于确定当前数据安全防护任务；其中，所述数据安全防护任务为异常检测任务、威胁情报分析任务、行为分析任务或攻击响应任务；

数据获取单元，用于基于所述当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及所述样本数据集中样本数据的数据描述信息；其中，所述样本数据集包括网络行为产生的日志数据和/或流量数据；所述数据描述信息包括所述样本数据的标签以及输入输出格式；

模型调优单元，用于基于所述模型结构信息构建所述当前数据安全防护任务对应的安全防护初始模型，并基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型；

模型训练单元，用于基于所述数据集中样本数据及其数据描述信息对所述安全防护优化模型进行训练，得到所述当前数据安全防护任务对应的已训练的安全防护优化模型。

本发明还提供一种数据安全智能防护模型协作平台，包括：

异常检测模型，用于对相应的模型输入数据进行数据异常检测，得到相应的模型输入数据的异常检测结果；其中，所述异常检测结果用于指示相应模型输入数据是否异常或者异常的可能性；

威胁情报分析模型，用于对相应的模型输入数据进行风险识别，得到所述相应的模型输入数据的风险识别结果；其中，所述风险识别结果用于指示相应模型输入数据造成风险的严重程度；

行为分析模型，用于对相应的模型输入数据进行行为异常识别，得到所述相应的模型输入数据的行为识别结果；其中，所述行为识别结果用于指示相应模型输入数据对应的网络行为是否异常或者异常的可能性；

攻击响应模型，用于对相应的模型输入数据进行攻击识别，得到所述相应的模型输入数据的攻击识别结果；其中，所述攻击识别结果用于指示相应模型输入数据对应的网络行为的攻击类型和攻击等级，或者针对相应模型输入数据对应的网络行为的响应策略；

其中，所述异常检测模型、所述威胁情报分析模型、所述行为分析模型和所述攻击响应模型是基于如上述任一种所述数据安全智能防护模型构建方法构建得到的。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述数据安全智能防护模型构建方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述数据安全智能防护模型构建方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述数据安全智能防护模型构建方法。

本发明提供的数据安全智能防护模型构建方法、装置及协作平台，通过确定当前数据安全防护任务，基于当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及样本数据集中样本数据的数据描述信息后，基于模型结构信息构建当前数据安全防护任务对应的安全防护初始模型，并基于样本数据集中样本数据及其数据描述信息对安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型，随后基于数据集中样本数据及其数据描述信息对安全防护优化模型进行训练，得到当前数据安全防护任务对应的已训练的安全防护优化模型，提升了数据安全智能防护模型构建方法的可扩展性，使得该方法可以应用于目前普遍的各类数据安全防护任务，且模型的调整优化训练等过程可以根据模型性能自主调节，使得模型性能不再受限于模型构建者的主观经验，安全防护能力得到了提升。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的数据安全智能防护模型构建方法的流程示意图；

图2是本发明提供的数据安全智能防护模型构建装置的结构示意图；

图3为本发明提供的数据安全智能防护模型协作平台的结构示意图；

图4是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本发明提供的数据安全智能防护模型构建方法的流程示意图，如图1所示，该方法包括：

步骤110，确定当前数据安全防护任务；其中，所述数据安全防护任务为异常检测任务、威胁情报分析任务、行为分析任务或攻击响应任务；

步骤120，基于所述当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及所述样本数据集中样本数据的数据描述信息；其中，所述样本数据集包括网络行为产生的日志数据和/或流量数据；所述数据描述信息包括所述样本数据的标签以及输入输出格式；

步骤130，基于所述模型结构信息构建所述当前数据安全防护任务对应的安全防护初始模型，并基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型；

步骤140，基于所述数据集中样本数据及其数据描述信息对所述安全防护优化模型进行训练，得到所述当前数据安全防护任务对应的已训练的安全防护优化模型。

具体地，为了提升数据安全智能防护模型构建方法的可扩展性，使得该方法可以应用于目前普遍的各类数据安全防护任务，例如异常检测任务（即数据异常检测）、威胁情报分析任务（即网络事件的安全风险识别）、行为分析任务（即用户网络行为的异常识别）和攻击响应任务（即网络攻击的攻击类型、攻击等级等信息的识别）等，可以首先确定当前待构建防护模型的特定数据安全防护任务。其中，每种数据安全防护任务在正式构建防护模型之前，可以由模型构建者根据各类任务场景下的分析数据、希望的输出结果以及特定任务场景下对于模型性能的特殊需求（例如模型安全性的需求以及模型执行效率的需求）为每种数据安全防护任务关联其对应的样本数据集和模型结构信息，用于相应数据安全防护任务对应的防护模型的构建。同时，生成样本数据集中样本数据的数据描述信息，其中数据描述信息包括样本数据的标签（标签的设置与相应数据安全防护任务相关，例如异常检测任务下标签可以设置为“异常”或“正常”，威胁情报分析任务下标签可以设置为相应数据中存在安全风险的风险程度或风险信息等）以及输入输出格式（即样本数据的格式以及希望模型输出的数据格式，例如文本格式、图像格式或时间序列格式等）。

其中，样本数据集包括网络行为产生的日志数据和/或流量数据，具体采用何种类型的数据构建样本数据集可以根据具体的数据安全防护任务确定，本发明实施例对此不作具体限定。当样本数据集中包含多种类型的数据时，在模型训练时，将会将同一网络行为对应的各类样本数据进行拼接以输入至模型中进行预测。在从各种渠道获取到相应类型的原始数据后构建各个数据安全防护任务对应的原始数据集。当需要构建特定数据安全防护任务对应的防护模型时，可以基于当前数据安全防护任务，获取对应的原始数据集，对原始数据集中的原始数据进行去噪处理后转换为预设标准格式的预处理数据，并对预设标准格式的预处理数据进行向量化和标签化（即将预设标准格式的预处理数据转换为向量形式，并为其设置标签），得到当前数据安全防护任务对应的样本数据集。

此外，在设定模型结构信息时，可以基于模型安全性和模型执行效率进行模型类型的选择。其中，考虑到模型在不受攻击的情况下应该保证具有比较高的预测性能，但是有可能会对模型进行恶意攻击以绕过安全措施，因此模型的安全性可以作为评估指标之一，另外在数据安全防护场景下，选择的模型应该具备足以在不同的执行环境下快速、准确地执行的性能，因此模型执行效率也可以作为评估指标。

具体而言，对于异常检测任务，可以采用混合伪造的方式模拟数据泄露、攻击与欺骗等异常行为并获取相应行为下的样本数据。其中，样本数据可以是各类网络行为下产生的日志数据，其标签可以为“异常”或“正常”，或者为异常度分数；其模型结构信息可以为GPT模型、自编码器、生成对抗网络等模型的结构描述信息。对于威胁情报分析任务，其样本数据可以是各类攻击行为下产生的日志数据，其标签可以为该行为造成安全风险的严重程度；其模型结构信息可以为BERT、GPT等语言模型，或者Deep Graph Infomax等网络嵌入模型的结构描述信息。对于行为分析任务，其样本数据可以是各类网络行为下产生的日志数据和流量数据，其标签可以为“异常”或“正常”，或者该行为为异常行为的概率；其模型结构信息可以为LSTM、GRU等RNN模型，或者变分自编码器等模型的结构描述信息。对于攻击响应任务，其样本数据可以是各类攻击行为下产生的日志数据和流量数据，其标签可以为攻击类型和攻击等级，或者该攻击行为的相应策略（例如网络切断等）；其模型结构信息可以为卷积神经网络、循环神经网络或GPT等模型的结构描述信息。

在一些实施例中，为了便于自动识别模型构建者提供的样本数据集和模型结构信息等，可以将数据集相关信息以固定模板的形式进行组装得到数据信息卡，将模型结构信息以固定模板的形式进行组装得到模板信息卡，在此之外还可以将模型构建者设定的模型评估标准等附加条件以固定模板的形式进行组装得到评价信息卡。其中，数据信息卡中可以包括样本数据集的地址、标签空间等，根据该地址可以获取样本数据集的样本数据及其数据描述信息；模板信息卡中可以包括模型结构信息；评价信息卡中可以包括模型的评估标准，例如各种模型性能评价指标，如AUC、F1分数、召回率等。

需要说明的是，为了避免模型性能过多受限于模型构建者预先设定的模型结构信息，因此在关联模型结构信息时，模型结构信息中仅提供了基础模型名称（例如异常检测任务下模型结构信息可以为生成对抗网络）以及基础模型的模型描述信息（例如基础模型中的核心模块及其连接关系，例如卷积层、激活层、池化层及其连接关系）等基础的结构描述信息。而关于模型深度（例如网络层的层数）以及模型宽度（例如模型输入输出数据的向量维度）等模型架构的具体设置，不会在模型结构信息中具体限定，以使得在后续的模型调整优化过程中对模型的不同变体进行一一测试，寻求性能最佳的模型结构。

因此，为了构建安全防护初始模型并对其进行调整和优化，可以将上述格式固定的数据信息卡、模板信息卡和评价信息卡以固定顺序和固定表达方式组装为一个prompt（文本形式），并将该prompt输入至一个预训练的大模型（Large Language Model，LLM，例如GPT模型、LLaMA模型和PaLM模型等）中，使该大模型对该prompt进行文本语义分析。其中，可以利用大模型强大的自然语言处理能力以及领域知识的运用能力，将上述prompt输入至大模型之后，大模型可以基于prompt中包含的数据集的信息以及基础的模型结构信息，利用自身的领域知识进行分析，从而获得大模型输出的模型结构的推荐参数（例如模型架构的推荐参数），并将其作为预设模型架构与模型结构信息共同作为安全防护初始模型的构建依据，从而构建得到相应的安全防护初始模型。与此同时，还可以请求大模型输出模型超参数（例如学习率、隐含层数量、每层神经元数量等）的推荐参数，以用于后续的模型调整优化过程。

随后，基于样本数据集中样本数据及其数据描述信息对安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型。通过尝试不同的模型架构和模型超参数，并利用样本数据集中样本数据及其数据描述信息对相应模型架构和模型超参数条件下的安全防护初始模型进行测试，以寻求模型性能最佳的模型架构和模型超参数。

在一些实施例中，在预设模型架构和预设模型超参数（两者可以为上述大模型输出的模型架构和模型超参数的推荐参数）基础上，基于样本数据集中样本数据及其数据描述信息对安全防护初始模型进行训练，并获取每轮训练过程中安全防护初始模型针对各个样本数据的预测结果，生成安全防护初始模型的评估结果。其中，评估结果包括基于安全防护初始模型每次针对样本数据进行预测的预测结果和相应样本数据的标签计算得到的模型损失值、精度、召回率、F1分数和AUC中的一种或多种。可见，安全防护模型的评估结果指示了在特定模型架构和模型超参数条件下模型的性能高低。其中，用于计算模型损失值的模型损失函数可以为交叉熵损失、Focal损失等损失函数，而具体选择何种损失函数可以根据数据安全防护任务确定，本发明实施例对此不作具体限定。随后，基于安全防护初始模型的评估结果对安全防护初始模型的模型架构和模型超参数进行调整，并重复上述模型评估-模型调整的流程，最终得到安全防护优化模型。

在另一些实施例中，可以在预设模型架构和预设模型超参数基础上，基于样本数据集中第一样本数据（可以对数据集进行任意划分得到第一样本数据和后文的第二样本数据）及其数据描述信息进行训练，并获取每轮训练过程中安全防护初始模型针对各个第一样本数据的预测结果，生成安全防护初始模型的第一评估结果，再基于安全防护初始模型的第一评估结果对安全防护初始模型的模型架构进行调整，并重复上述模型评估-模型架构调整的流程，最终得到优化模型架构。需要说明的是，第一评估结果以及后文的第二评估结果与上文中的评估结果的计算方式相同，在此不再赘述。其中，模型深度越深，模型学习任务的能力就越强，但是模型过深会影响模型的性能；模型宽度会影响模型的参数规模和学习能力，一般地，宽度越大、参数规模越大，模型的拟合能力也会越好，但是过大的模型宽度也会导致模型过拟合、训练速度过慢等问题。另外，模型深度和模型宽度对模型性能的影响并不是独立的，它们之间存在一定的协同作用。因此，可以对模型深度和模型宽度进行各种组合，并在模型架构调整过程中尝试各种组合形式，以获得最佳模型性能下模型深度和模型宽度的具体取值。

然后，在优化模型架构和预设模型超参数基础上，基于样本数据集中第二样本数据及其数据描述信息进行训练，并获取每轮训练过程中安全防护初始模型针对各个第二样本数据的预测结果，并生成安全防护初始模型的第二评估结果，再基于安全防护初始模型的第二评估结果对安全防护初始模型的模型超参数进行调整，并重复上述模型评估-模型超参数调整的流程，最终得到安全防护优化模型。在调整模型超参数时，可以基于网格搜索或贝叶斯优化方法，根据安全防护初始模型的第二评估结果对安全防护初始模型的模型超参数进行调整，得到安全防护优化模型。其中，贝叶斯优化方法更加高效，其可以通过根据模型性能（即上述第二评估结果）来调整模型超参数，并对未探索的参数生成采样来提高模型超参数调优的效率。

得到模型架构和模型超参数确定的安全防护优化模型后，可以基于样本数据集中样本数据及其数据描述信息对安全防护优化模型进行训练，得到当前数据安全防护任务对应的已训练的安全防护优化模型。其中，在安全防护优化模型的训练过程中，可以采用交叉验证或其他评估方法，例如训练集和测试集的分割，以评估模型的性能和稳定性，得到性能优越且稳定的已训练模型。

在一些实施例中，为了提升特定数据安全防护任务下防护模型的准确性和稳定性，可以在设置模型结构信息时关联多类模型结构对应的结构描述信息（例如基础模型名称以及基础模型的模型描述信息，如基础模型中的核心模块及其连接关系等），例如异常检测任务下可以设置自编码器和生成对抗网络等多类模型结构对应的结构描述信息作为该任务的模型结构信息。因此，基于该模型结构信息构建得到的当前数据安全防护任务对应的安全防护初始模型及其对应的安全防护优化模型有多个，具体而言，安全防护初始模型及其对应的安全防护优化模型的数量与模型结构信息中包含的模型结构种类数量一致。针对不同的安全防护初始模型可以采用上述实施例中给出的调整优化方法分别得到其对应的安全防护优化模型，并对各个安全防护优化模型分别进行训练。

在基于样本数据集中样本数据及其数据描述信息分别对各个安全防护优化模型进行训练，得到相应的已训练的安全防护优化模型之后，可以对多个已训练的安全防护优化模型进行模型融合，得到当前数据安全防护任务对应的集成防护模型，以产生具有更稳定、更准确预测、更耐得住攻击性数据的输出。

综上所述，本发明实施例提供的方法，通过确定当前数据安全防护任务，基于当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及样本数据集中样本数据的数据描述信息后，基于模型结构信息构建当前数据安全防护任务对应的安全防护初始模型，并基于样本数据集中样本数据及其数据描述信息对安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型，随后基于样本数据集中样本数据及其数据描述信息对安全防护优化模型进行训练，得到当前数据安全防护任务对应的已训练的安全防护优化模型，提升了数据安全智能防护模型构建方法的可扩展性，使得该方法可以应用于目前普遍的各类数据安全防护任务，且模型的调整优化训练等过程可以根据模型性能自主调节，使得模型性能不再受限于模型构建者的主观经验，安全防护能力得到了提升。

基于上述实施例，还可以利用上述数据安全智能防护模型构建方法结合强化学习技术来模拟网络攻击场景并训练安全应对策略，可以基于以下步骤进行：

1)确定模拟环境：确定网络攻击场景的模拟环境，包括攻击和防御两个方面，其中攻击方面可以采用数据集进行攻击模拟，防御方面则通过模拟防御策略进行实验。

2)数据集准备：针对模拟环境，准备合适的样本数据集，包括攻击和防御的数据集，以及用于训练的奖励数据等。

3)模型选择和训练模式设定：可以选择深度Q网络构建模型结构信息并选定策略梯度作为训练算法。

4)模型训练：在确定好的环境下，利用上述实施例给出的方式进行模型架构和模型超参数的调整，并对调整后的模型进行训练。

5)模型预测：在模拟环境中使用训练好的模型进行预测，自动化分析攻击和防御情况，同时记录策略的执行情况。

6)模型优化：分析模型预测结果，并根据奖励机制对模型进行优化和调整，以提高模型的鲁棒性和应对能力。

7)应用场景：将训练好的模型应用于实际攻击场景中，用于指导实际安全应对活动，提高攻击应对效率和正确性。

通过上述方式能够模拟网络攻击场景，并根据得到的结果，训练安全应对策略，提高攻击应对效率和正确性。同时，这种模拟方法还能够有效地降低实际攻击的风险，并提供对应的实验分析依据，为数据安全领域提供全方位、高效、精准的攻击应对支持。

下面对本发明提供的数据安全智能防护模型构建装置进行描述，下文描述的数据安全智能防护模型构建装置与上文描述的数据安全智能防护模型构建方法可相互对应参照。

基于上述任一实施例，图2是本发明提供的数据安全智能防护模型构建装置的结构示意图，如图2所示，该装置包括：

任务确定单元210，用于确定当前数据安全防护任务；其中，所述数据安全防护任务为异常检测任务、威胁情报分析任务、行为分析任务或攻击响应任务；

数据获取单元220，用于基于所述当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及所述样本数据集中样本数据的数据描述信息；其中，所述样本数据集包括网络行为产生的日志数据和/或流量数据；所述数据描述信息包括所述样本数据的标签以及输入输出格式；

模型调优单元230，用于基于所述模型结构信息构建所述当前数据安全防护任务对应的安全防护初始模型，并基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型；

模型训练单元240，用于基于所述数据集中样本数据及其数据描述信息对所述安全防护优化模型进行训练，得到所述当前数据安全防护任务对应的已训练的安全防护优化模型。

本发明实施例提供的装置，通过确定当前数据安全防护任务，基于当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及样本数据集中样本数据的数据描述信息后，基于模型结构信息构建当前数据安全防护任务对应的安全防护初始模型，并基于样本数据集中样本数据及其数据描述信息对安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型，随后基于数据集中样本数据及其数据描述信息对安全防护优化模型进行训练，得到当前数据安全防护任务对应的已训练的安全防护优化模型，提升了数据安全智能防护模型构建方法的可扩展性，使得该方法可以应用于目前普遍的各类数据安全防护任务，且模型的调整优化训练等过程可以根据模型性能自主调节，使得模型性能不再受限于模型构建者的主观经验，安全防护能力得到了提升。

基于上述任一实施例，所述基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型，具体包括：

基于上述任一实施例，所述在预设模型架构和预设模型超参数基础上，基于所述样本数据集中样本数据及其数据描述信息，得到所述安全防护初始模型针对各个样本数据的预测结果，并生成所述安全防护初始模型的评估结果，再基于所述安全防护初始模型的评估结果对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型，具体包括：

基于上述任一实施例，所述基于所述安全防护初始模型的第二评估结果对所述安全防护初始模型的模型超参数进行调整，得到安全防护优化模型，具体包括：

基于上述任一实施例，所述模型结构信息包含多类模型结构对应的结构描述信息，基于所述模型结构信息构建得到的当前数据安全防护任务对应的安全防护初始模型及其对应的安全防护优化模型有多个；

基于上述任一实施例，所述基于所述当前数据安全防护任务，获取对应的样本数据集，具体包括：

基于所述当前数据安全防护任务，获取对应的原始数据集；

基于上述任一实施例，所述当前数据安全防护任务对应的模型结构信息是基于模型安全性和模型执行效率选择得到的。

基于上述任一实施例，图3为本发明提供的数据安全智能防护模型协作平台的结构示意图，如图3所示，该平台包括：

异常检测模型310，用于对相应的模型输入数据进行数据异常检测，得到相应的模型输入数据的异常检测结果；其中，所述异常检测结果用于指示相应模型输入数据是否异常或者异常的可能性；

威胁情报分析模型320，用于对相应的模型输入数据进行风险识别，得到所述相应的模型输入数据的风险识别结果；其中，所述风险识别结果用于指示相应模型输入数据造成风险的严重程度；

行为分析模型330，用于对相应的模型输入数据进行行为异常识别，得到所述相应的模型输入数据的行为识别结果；其中，所述行为识别结果用于指示相应模型输入数据对应的网络行为是否异常或者异常的可能性；

攻击响应模型340，用于对相应的模型输入数据进行攻击识别，得到所述相应的模型输入数据的攻击识别结果；其中，所述攻击识别结果用于指示相应模型输入数据对应的网络行为的攻击类型和攻击等级，或者针对相应模型输入数据对应的网络行为的响应策略；

其中，所述异常检测模型、所述威胁情报分析模型、所述行为分析模型和所述攻击响应模型是基于如上述任一实施例提供的数据安全智能防护模型构建方法构建得到的。

具体地，当数据安全智能防护模型协作平台接收到当前的待分析数据时，可以根据该待分析数据的类型将其自动分配至能够处理该数据的模型中进行处理，从而实现自主且全面的数据安全防护。例如，当待分析数据为未知网络行为产生的日志数据时，可以将其自动分配至异常检测模型作为该模型的模型输入数据进行处理；当待分析数据为攻击行为产生的日志数据时，可以将其自动分配至威胁情报分析模型作为该模型的模型输入数据进行处理；当待分析数据为未知网络行为产生的日志数据和流量数据时，可以将其自动分配至行为分析模型作为该模型的模型输入数据进行处理；当待分析数据为攻击行为产生的日志数据和流量数据时，可以将其自动分配至攻击响应模型作为该模型的模型输入数据进行处理。可见，当未知网络行为对应的待分析数据经由异常检测模型或行为分析模型处理得到其是否为攻击行为后，可以继续将该待分析数据输入至威胁情报分析模型或攻击响应模型进行后续处理，从而得到更加全面的数据安全分析结果。

图4是本发明提供的电子设备的结构示意图，如图4所示，该电子设备可以包括：处理器(processor)410、存储器(memory)420、通信接口(Communications Interface)430和通信总线440，其中，处理器410，存储器420，通信接口430通过通信总线440完成相互间的通信。处理器410可以调用存储器420中的逻辑指令，以执行数据安全智能防护模型构建方法，该方法包括：确定当前数据安全防护任务；其中，所述数据安全防护任务为异常检测任务、威胁情报分析任务、行为分析任务或攻击响应任务；基于所述当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及所述样本数据集中样本数据的数据描述信息；其中，所述样本数据集包括网络行为产生的日志数据和/或流量数据；所述数据描述信息包括所述样本数据的标签以及输入输出格式；基于所述模型结构信息构建所述当前数据安全防护任务对应的安全防护初始模型，并基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型；基于所述数据集中样本数据及其数据描述信息对所述安全防护优化模型进行训练，得到所述当前数据安全防护任务对应的已训练的安全防护优化模型。

此外，上述的存储器420中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的数据安全智能防护模型构建方法，该方法包括：确定当前数据安全防护任务；其中，所述数据安全防护任务为异常检测任务、威胁情报分析任务、行为分析任务或攻击响应任务；基于所述当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及所述样本数据集中样本数据的数据描述信息；其中，所述样本数据集包括网络行为产生的日志数据和/或流量数据；所述数据描述信息包括所述样本数据的标签以及输入输出格式；基于所述模型结构信息构建所述当前数据安全防护任务对应的安全防护初始模型，并基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型；基于所述数据集中样本数据及其数据描述信息对所述安全防护优化模型进行训练，得到所述当前数据安全防护任务对应的已训练的安全防护优化模型。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各提供的数据安全智能防护模型构建方法，该方法包括：确定当前数据安全防护任务；其中，所述数据安全防护任务为异常检测任务、威胁情报分析任务、行为分析任务或攻击响应任务；基于所述当前数据安全防护任务，获取对应的样本数据集和模型结构信息，以及所述样本数据集中样本数据的数据描述信息；其中，所述样本数据集包括网络行为产生的日志数据和/或流量数据；所述数据描述信息包括所述样本数据的标签以及输入输出格式；基于所述模型结构信息构建所述当前数据安全防护任务对应的安全防护初始模型，并基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型；基于所述数据集中样本数据及其数据描述信息对所述安全防护优化模型进行训练，得到所述当前数据安全防护任务对应的已训练的安全防护优化模型。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种数据安全智能防护模型构建方法，其特征在于，包括：

基于所述模型结构信息构建所述当前数据安全防护任务对应的安全防护初始模型，并基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型；其中，所述模型结构信息中提供了基础模型名称以及基础模型的模型描述信息；所述模型架构包括模型深度以及模型宽度；

基于所述样本数据集中样本数据及其数据描述信息对所述安全防护优化模型进行训练，得到所述当前数据安全防护任务对应的已训练的安全防护优化模型；

所述基于所述模型结构信息构建所述当前数据安全防护任务对应的安全防护初始模型，具体包括：

将数据信息卡、模板信息卡和评价信息卡以固定顺序和固定表达方式组装为一个prompt，并将该 prompt 输入至一个预训练的大模型中，使该大模型对该 prompt 进行文本语义分析；所述数据信息卡中包括样本数据集的地址、标签空间；所述模板信息卡中包括模型结构信息；所述评价信息卡中包括模型的评估标准；

大模型基于 prompt 中包含的样本数据集的信息以及模型结构信息，利用自身的领域知识进行分析，获得大模型输出的模型架构的推荐参数，并将其作为预设模型架构与模型结构信息共同作为安全防护初始模型的构建依据，从而构建得到相应的安全防护初始模型；并且，获得大模型输出的模型超参数的推荐参数，以用于后续的模型调整优化过程。

2.根据权利要求1所述的数据安全智能防护模型构建方法，其特征在于，所述基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型，具体包括：

3.根据权利要求2所述的数据安全智能防护模型构建方法，其特征在于，所述在预设模型架构和预设模型超参数基础上，基于所述样本数据集中样本数据及其数据描述信息，得到所述安全防护初始模型针对各个样本数据的预测结果，并生成所述安全防护初始模型的评估结果，再基于所述安全防护初始模型的评估结果对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型，具体包括：

4.根据权利要求3所述的数据安全智能防护模型构建方法，其特征在于，所述基于所述安全防护初始模型的第二评估结果对所述安全防护初始模型的模型超参数进行调整，得到安全防护优化模型，具体包括：

5.根据权利要求1所述的数据安全智能防护模型构建方法，其特征在于，所述模型结构信息包含多类模型结构对应的结构描述信息，基于所述模型结构信息构建得到的当前数据安全防护任务对应的安全防护初始模型及其对应的安全防护优化模型有多个；

6.根据权利要求1所述的数据安全智能防护模型构建方法，其特征在于，所述基于所述当前数据安全防护任务，获取对应的样本数据集，具体包括：

基于所述当前数据安全防护任务，获取对应的原始数据集；

7.根据权利要求1所述的数据安全智能防护模型构建方法，其特征在于，所述当前数据安全防护任务对应的模型结构信息是基于模型安全性和模型执行效率选择得到的。

8.一种数据安全智能防护模型构建装置，其特征在于，包括：

模型调优单元，用于基于所述模型结构信息构建所述当前数据安全防护任务对应的安全防护初始模型，并基于所述样本数据集中样本数据及其数据描述信息对所述安全防护初始模型的模型架构和模型超参数进行调整，得到安全防护优化模型；其中，所述模型结构信息中提供了基础模型名称以及基础模型的模型描述信息；所述模型架构包括模型深度以及模型宽度；

模型训练单元，用于基于所述样本数据集中样本数据及其数据描述信息对所述安全防护优化模型进行训练，得到所述当前数据安全防护任务对应的已训练的安全防护优化模型；

9.一种数据安全智能防护模型协作平台，其特征在于，包括：

其中，所述异常检测模型、所述威胁情报分析模型、所述行为分析模型和所述攻击响应模型是基于如权利要求1至7任一项所述数据安全智能防护模型构建方法构建得到的。

10.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述数据安全智能防护模型构建方法。