CN111860552B

CN111860552B - 基于核自编码器的模型训练方法、装置及存储介质

Info

Publication number: CN111860552B
Application number: CN201910348033.8A
Authority: CN
Inventors: 龙春; 肖喜生; 魏金侠; 赵静; 杨帆
Original assignee: Computer Network Information Center of CAS
Current assignee: Computer Network Information Center of CAS
Priority date: 2019-04-28
Filing date: 2019-04-28
Publication date: 2024-10-15
Anticipated expiration: 2039-04-28
Also published as: CN111860552A

Abstract

本发明实施例公开了一种核自编码器的模型训练方法、装置及存储介质，涉及网络安全领域。本发明的方法包括：通过核自编码器的编码模块，基于核PCA对样本特征进行降维处理，得到样本数据对应的隐层数据，并将所述隐层数据作为分类器的输入数据；通过核自编码器的解码模块，基于核回归处理得到所述样本的解码数据，并将所述解码数据作为所述分类器的输出数据；基于所述输入数据和所述输出数据，构建所述分类器的损失函数；根据所述损失函数，对所述分类器进行训练。本发明能够降低对数据特征的降维复杂度。

Description

基于核自编码器的模型训练方法、装置及存储介质

技术领域

本发明涉及网络安全领域，尤其涉及一种基于核自编码器的模型训练方法、装置及存储介质。

背景技术

随着计算机网络技术的迅速发展，网络技术在各个领域都得到了广泛的应用。计算机网络在给人们提供便利、带来效益的同时，网络攻击也对信息安全提出了很大的挑战。

为了防护网络攻击，可以通过入侵检测模型对网络流进行入侵预测。在模型训练过程中，样本数据原本的特征维度过高将导致计算复杂度大大增加，故而需要对样本特征进行降维处理。目前对样本特征进行降维处理的过程，直接将特征子集输入分类器，并根据分类器的性能对样本数据进行选择降维，这样的方式导致数据特征降维时的计算复杂度较高，进一步导致模型训练复杂度较高。

发明内容

本发明的实施例提供一种基于核自编码器的模型训练方法、装置及存储介质，能够降低对数据特征的降维复杂度。

为达到上述目的，本发明的实施例采用如下技术方案：

第一方面，本发明的实施例提供一种基于核自编码器的模型训练方法，包括：

通过核自编码器的编码模块，基于核PCA对样本特征进行降维处理，得到样本数据对应的隐层数据，并将所述隐层数据作为分类器的输入数据；

通过核自编码器的解码模块，基于核回归处理得到所述样本的解码数据，并将所述解码数据作为所述分类器的输出数据；

基于所述输入数据和所述输出数据，构建所述分类器的损失函数；

根据所述损失函数，对所述分类器进行训练。

结合第一方面，在第一方面的第一种可能的实现方式中，所述基于所述输入数据和所述输出数据，构建所述分类器的损失函数，包括：

计算所述输入数据和所述输出数据之间的差值；

将所述差值的模值，与正则化项相加，得到所述分类器的损失函数。

结合第一方面，或者第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，其特征在于，所述根据所述损失函数，对所述分类器进行训练，包括：

基于正则化结构风险最小化策略，将所述损失函数的值取最小值，对所述分类器进行训练。

结合第一方面，在第一方面的第三种可能的实现方式中，所述方法还包括：

当样本特征维度大于80维时，基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的三分之一；或，

当样本特征维度小于或等于80维时，基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的二分之一。

结合第一方面，在第一方面的第四种可能的实现方式中，所述分类器用于进行网络入侵检测，所述方法还包括：

将网络流量输入所述分类器，进行网络安全入侵检测；

响应于检测到存在入侵风险，截断当前网络流量并启动相应的入侵修复方案。

第二方面，本发明的实施例提供一种基于核自编码器的模型训练装置，包括：

编码模块，用于通过核自编码器的编码模块，基于核PCA对样本特征进行降维处理，得到样本数据对应的隐层数据，并将所述隐层数据作为分类器的输入数据；

解码模块，用于通过核自编码器的解码模块，基于核回归处理得到所述样本的解码数据，并将所述解码数据作为所述分类器的输出数据；

构建模块，用于基于所述输入数据和所述输出数据，构建所述分类器的损失函数；

训练模块，用于根据所述损失函数，对所述分类器进行训练。

结合第二方面，在第二方面的第一种可能的实现方式中，

所述构建模块，还用于计算所述输入数据和所述输出数据之间的差值；并将所述差值的模值，与正则化项相加，得到所述分类器的损失函数。

结合第二方面，或者的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，

所述训练模块，还用于基于正则化结构风险最小化策略，将所述损失函数的值取最小值，对所述分类器进行训练。

结合第二方面，在第二方面的第三种可能的实现方式中，

所述编码模块，还用于当样本特征维度大于80维时，基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的三分之一；或，当样本特征维度小于或等于80维时，基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的二分之一。

结合第二方面，在第二方面的第四种可能的实现方式中，所述装置还包括：

所述训练模块训练的所述分类器用于进行网络入侵检测；

检测模块，用于将网络流量输入所述分类器，进行网络安全入侵检测；并且，响应于检测到存在入侵风险，截断当前网络流量并启动相应的入侵修复方案。

第三方面，本发明的实施例提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现第一方面提供的方法的步骤。

本发明实施例提供的基于核自编码器的模型训练方法、装置及存储介质，通过核自编码器的编码模块，基于核PCA对样本特征进行降维处理，得到样本数据对应的隐层数据，并将所述隐层数据作为分类器的输入数据；通过核自编码器的解码模块，基于核回归处理得到所述样本的解码数据，并将所述解码数据作为所述分类器的输出数据；基于所述输入数据和所述输出数据，构建所述分类器的损失函数；根据所述损失函数，对所述分类器进行训练。能够引入核方法，通过构建的核自编码器对数据特征进行降维处理，这样可以避免对高维特征的降维需求而导致对分类器进行多次训练的情况，可以降低对数据特征的降维复杂度，进一步可以降低模型训练的复杂度；同时，该降维方式考虑到特征之间的线性联系及非线性联系，因此降维后的数据特征能够更好地表达数据的原始特征。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例的基于核自编码器的模型训练方法的流程示意图；

图2是本发明实施例的基于核自编码器的模型训练方法的另一流程示意图；

图3是本发明实施例的基于核自编码器的模型训练装置结构示意图；

图4是本发明实施例的基于核自编码器的模型训练装置的另一结构示意图；

图5是本发明实施例的基于核自编码器的模型训练装置500的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明一实施例提供一种基于核自编码器的模型训练方法，如图1所示，所述方法包括：

101、通过核自编码器的编码模块，基于核PCA对样本特征进行降维处理，得到样本数据对应的隐层数据，并将所述隐层数据作为分类器的输入数据。

对于本发明实施例，在核自编码器中通过核PCA(Principal ComponentAnalysis，主成分分析法)实现对样本的高维特征的降维处理，可以避免通过样本数据原始的高维特征对模型进行训练时导致的计算复杂度过高的问题，即可以降低模型训练的复杂度。

在本发明实施例中，自编码器是一种能够通过无监督学习，学习到输入数据高效表示的人工神经网络。输入数据的这一高效表示称为编码，编码后的维度一般远小于输入数据本身的特征维度，故而在本发明实施例中通过自编码器用于对高维特征进行降维处理。

102、通过核自编码器的解码模块，基于核回归处理得到所述样本的解码数据，并将所述解码数据作为所述分类器的输出数据。

103、基于所述输入数据和所述输出数据，构建所述分类器的损失函数。

其中，损失函数是指将随机事件或者随机事件有关的随机变量的取值，映射为非负实数，来表示随机事件的风险或损失的函数。在本发明实施例中，分类器的损失函数用于表征通过分类器进行分类预测时，对流量数据进行分类预测的结果错误的风险情况。

104、根据所述损失函数，对所述分类器进行训练。

其中，通过将损失函数最小化的思路，对分类器进行训练，以尽量降低分类器对数据流量进行分类预测时结果错误的概率，即尽量提高分类器的分类预测结果准确性。

对于本发明实施例，通过在自编码器的编码阶段和解码阶段引入核方法构造核自编码器，来实现对高维特征的降维处理；同时采用正则化的结构风险最小化策略，即构建的分类模型的损失函数最小的方法，对分类模型进行训练，可以避免对分类模型的多次训练，从而可以降低对模型训练的复杂度。

与现有技术相比，本发明实施例能够引入核方法，通过构建的核自编码器对数据特征进行降维处理，这样可以避免对高维特征的降维需求而导致对分类器进行多次训练的情况，可以降低对数据特征的降维复杂度，进一步可以降低模型训练的复杂度；同时，该降维方式考虑到特征之间的线性联系及非线性联系，因此降维后的数据特征能够更好地表达数据的原始特征。

本发明又一实施例提供一种基于核自编码器的模型训练方法，如图2所示，所述方法包括：

201、通过核自编码器的编码模块，基于核PCA对样本特征进行降维处理，得到样本数据对应的隐层数据，并将所述隐层数据作为分类器的输入数据。

可选地，当样本特征维度大于80维时，基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的三分之一；或，当样本特征维度小于或等于80维时，基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的二分之一。

例如，当样本原始的特征维度为90维时，基于核自编码器的核PCA对样本进行降维处理后的特征维度小于30维；当样本原始的特征维度为50维时，基于核自编码器的核PCA对样本进行降维处理后的特征维度小于25维。

对于本发明实施例，上述维度分界点及降维后的维度数量占比可以由用户实时根据网络情况进行设置，也可以根据历史数据预先进行设置，本发明实施例不做限制。需要说明的是，上述维度分界点及降维后的维度数量占比不限于上述取值，任意取值均在本发明实施例的保护范围内。

譬如，可替换地，当样本特征维度大于58维时，基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的二分之一；或，当样本特征维度小于或等于58维时，基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的三分之二。

202、通过核自编码器的解码模块，基于核回归处理得到所述样本的解码数据，并将所述解码数据作为所述分类器的输出数据。

203、基于所述输入数据和所述输出数据，构建所述分类器的损失函数。

对于本发明实施例，步骤203具体可以为：计算所述输入数据和所述输出数据之间的差值；将所述差值的模值，与正则化项相加，得到所述分类器的损失函数。

对于本发明实施例，上述基于输入数据和输出数据构建损失函数的方法为本发明实施例的一种实现方法，其他基于步骤201所得到的输入数据和基于步骤202所得到的输出数据构建分类器的损失函数的方法均在本发明实施例的保护范围内。

204、基于正则化结构风险最小化策略，将所述损失函数的值取最小值，对所述分类器进行训练。

205、将网络流量输入所述分类器，进行网络安全入侵检测。

对于本发明实施例，上述训练方法得到的分类器可以用作网络安全入侵检测，即可以将该分类器作为入侵检测系统(IDS)的网络模型，通过该网络模型可以对网络流量中潜在的入侵攻击进行实时预测。

206、响应于检测到存在入侵风险，截断当前网络流量并启动相应的入侵修复方案。

本发明又一实施例提供一种基于核自编码器的模型训练装置，如图3所示，所述装置包括：

编码模块31，用于通过核自编码器的编码模块，基于核PCA对样本特征进行降维处理，得到样本数据对应的隐层数据，并将所述隐层数据作为分类器的输入数据；

解码模块32，用于通过核自编码器的解码模块，基于核回归处理得到所述样本的解码数据，并将所述解码数据作为所述分类器的输出数据；

构建模块33，用于基于所述输入数据和所述输出数据，构建所述分类器的损失函数；

训练模块34，用于根据所述损失函数，对所述分类器进行训练。

所述构建模块33，还用于计算所述输入数据和所述输出数据之间的差值；并将所述差值的模值，与正则化项相加，得到所述分类器的损失函数。

所述训练模块34，还用于基于正则化结构风险最小化策略，将所述损失函数的值取最小值，对所述分类器进行训练。

所述编码模块31，还用于当样本特征维度大于80维时，基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的三分之一；或，当样本特征维度小于或等于80维时，基于核PCA对样本特征进行降维处理后的特征维度小于原特征维度的二分之一。

进一步的，如图4所示，所述装置还可以包括：

所述训练模块34训练的所述分类器用于进行网络入侵检测；

检测模块41，用于将网络流量输入所述分类器，进行网络安全入侵检测；并且，响应于检测到存在入侵风险，截断当前网络流量并启动相应的入侵修复方案。

本发明实施例还提供另一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中的存储器中所包含的计算机可读存储介质；也可以是单独存在，未装配入终端中的计算机可读存储介质。所述计算机可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序被一个或者一个以上的处理器用来执行图1、图2所示实施例提供的基于核自编码器的模型训练方法。

本发明实施例提供的基于核自编码器的模型训练装置可以实现上述提供的方法实施例，具体功能实现请参见方法实施例中的说明，在此不再赘述。本发明实施例提供的基于核自编码器的模型训练方法、装置及存储介质可以适用于对网络安全进行入侵检测，但不仅限于此。

如图5所示，基于核自编码器的模型训练装置500可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，个人数字助理等。

参照图5，基于核自编码器的模型训练装置500可以包括以下一个或多个组件：处理组件502，存储器504，电源组件506，多媒体组件508，音频组件510，输入/输出(I/O)的接口512，传感器组件514，以及通信组件516。

处理组件502通常控制无人机控制装置500的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令。

此外，处理组件502可以包括一个或多个模块，便于处理组件502和其他组件之间的交互。例如，处理组件502可以包括多媒体模块，以方便多媒体组件508和处理组件502之间的交互。

存储器504被配置为存储各种类型的数据以支持在无人机控制装置500的操作。这些数据的示例包括用于在无人机控制装置500上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件506为无人机控制装置500的各种组件提供电力。电源组件506可以包括电源管理系统，一个或多个电源，及其他与为无人机控制装置500生成、管理和分配电力相关联的组件。

多媒体组件508包括在所述无人机控制装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件508包括一个前置摄像头和/或后置摄像头。当无人机控制装置500处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件510被配置为输出和/或输入音频信号。例如，音频组件510包括一个麦克风(MIC)，当无人机控制装置500处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中，音频组件510还包括一个扬声器，用于输出音频信号。

I/O接口512为处理组件502和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件514包括一个或多个传感器，用于为无人机控制装置500提供各个方面的状态评估。例如，传感器组件514可以检测到无人机控制装置500的打开/关闭状态，组件的相对定位，例如所述组件为无人机控制装置500的显示器和小键盘，传感器组件514还可以检测无人机控制装置500或无人机控制装置500一个组件的位置改变，用户与无人机控制装置500接触的存在或不存在，无人机控制装置500方位或加速/减速和无人机控制装置500的温度变化。传感器组件514可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件514还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件516被配置为便于无人机控制装置500和其他设备之间有线或无线方式的通信。无人机控制装置500可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件516还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，无人机控制装置500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于设备实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于核自编码器的模型训练方法，其特征在于，包括：

通过核自编码器的编码模块，基于核PCA对样本特征进行降维处理，得到样本数据对应的隐层数据，并将所述隐层数据作为分类器的输入数据；当样本特征的维度大于80维时，基于所述核PCA对样本特征进行降维处理后的特征维度小于原样本特征维度的三分之一；或，当样本特征的维度小于或等于80维时，基于所述核PCA对样本特征进行降维处理后的特征维度小于原特征维度的二分之一；

根据所述损失函数，对所述分类器进行无监督训练：

将网络流量输入所述分类器，进行网络安全入侵检测；

2.根据权利要求1所述的基于核自编码器的模型训练方法，其特征在于，所述基于所述输入数据和所述输出数据，构建所述分类器的损失函数，包括：

计算所述输入数据和所述输出数据之间的差值；

3.根据权利要求1或2所述的基于核自编码器的模型训练方法，其特征在于，所述根据所述损失函数，对所述分类器进行训练，包括：

4.根据权利要求1所述的基于核自编码器的模型训练方法，其特征在于，所述方法还包括：

5.一种基于核自编码器的模型训练装置，其特征在于，包括：

编码模块，用于通过核自编码器的编码模块，基于核PCA对样本特征进行降维处理，得到样本数据对应的隐层数据，并将所述隐层数据作为分类器的输入数据；当样本特征的维度大于80维时，基于所述核PCA对样本特征进行降维处理后的特征维度小于原样本特征维度的三分之一；或，当样本特征的维度小于或等于80维时，基于所述核PCA对样本特征进行降维处理后的特征维度小于原特征维度的二分之一；

训练模块，用于根据所述损失函数，对所述分类器进行无监督训练；

所述训练模块训练的所述分类器用于进行网络入侵检测；

6.根据权利要求5所述的基于核自编码器的模型训练装置，其特征在于，

7.根据权利要求5或6所述的基于核自编码器的模型训练装置，其特征在于，

8.根据权利要求5所述的基于核自编码器的模型训练装置，其特征在于，

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1-4任一项所述方法的步骤。