CN110414667A - 网络检测模型的训练方法、装置、计算机设备和存储介质 - Google Patents

网络检测模型的训练方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110414667A
CN110414667A CN201910521200.4A CN201910521200A CN110414667A CN 110414667 A CN110414667 A CN 110414667A CN 201910521200 A CN201910521200 A CN 201910521200A CN 110414667 A CN110414667 A CN 110414667A
Authority
CN
China
Prior art keywords
hyper parameter
detection model
trained
network detection
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910521200.4A
Other languages
English (en)
Inventor
陈闽川
马骏
王少军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910521200.4A priority Critical patent/CN110414667A/zh
Publication of CN110414667A publication Critical patent/CN110414667A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Physiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种网络检测模型的训练方法,涉及安全检测技术领域,所述方法包括:当接收到输入的超参数时,基于差分演化算法对所述超参数进行预处理;当判断进行预处理所得到的超参数满足预置条件时,将所述进行预处理所得到的超参数作为待训练网络检测模型进行训练的初始数据;当接收到输入的参考网络连接信息时,基于所述进行预处理所得到的超参数以及所述参考网络连接信息对所述待训练网络检测模型进行训练,得到完成训练的网络检测模型。本发明还提供一种网络检测模型的训练装置、计算机设备和存储介质。实现在对网络检测模型进行训练时,通过差分演化算分对超参数进行预处理,提高模型训练的速度,缩短了整体模型训练的时间。

Description

网络检测模型的训练方法、装置、计算机设备和存储介质
技术领域
本发明涉及安全检测的专家系统技术领域,尤其涉及一种网络检测模型的训练方法、网络检测模型的训练装置、计算机设备和存储有计算机可读指令的存储介质。
背景技术
随着信息时代的来临,网络和通信技术飞速发展,网络安全问题日益突出。入侵检测技术作为网络与信息安全领域的一项重要技术,而与之对应的入侵检测系统通过拦截存在安全隐患的网络连接,在一定程度上保证网络的安全。
传统入侵检测系统对于复杂多样的新型攻击方式难以应付,由于人工神经网络具有较为强大的自适应、自学习和非线性映射能力,非常适合于变化无常的网络入侵检测环境。但是,传统的神经网络系统(如仅仅神经网络(back propagation,BP))由于其初始值阈值是随机初始化的,因此在实际对网络检测模型进行训练时,由于初始输入的超参数时随机的,因此会使得训练速度较慢且训练时间过长。
发明内容
基于此,有必要针对现行网络检测模型的训练方法的弊端,提供一种网络检测模型的训练方法、装置、计算机设备和存储介质,用于在对网络检测模型进行训练时,通过差分演化算分对超参数进行预处理,使得进行模型训练时所输入的超参数更加贴近最优解,使得在继续模型进一步训练时,训练时间缩短以及训练速度更快。
为实现上述目的,本发明提供的一种网络检测模型的训练方法,所述网络检测模型的训练方法包括:
当接收到输入的超参数时,基于差分演化算法对所述超参数进行预处理;
当判断进行预处理所得到的超参数满足预置条件时,将所述进行预处理所得到的超参数作为待训练网络检测模型进行训练的初始数据;
当接收到输入的参考网络连接信息时,基于所述进行预处理所得到的超参数以及所述参考网络连接信息对所述待训练网络检测模型进行训练,得到完成训练的网络检测模型。
可选的,所述当接收到所输入的超参数时,基于差分演化算法对所述超参数进行预处理,包括:
当接收到输入的超参数时,对所述输入的超参数进行初始化得到对应的第一超参数;
基于预置的适应度函数计算所述第一超参数对应的第一适应值。
可选的,所述基于预置的适应度函数计算所述第一超参数对应的第一适应值,之后还包括:
当判断所述第一适应值小于或者等于预设阈值时,确定所述第一超参数满足所述预置条件;
当判断所述第一适应值大于所述预设阈值时,确定所述第一超参数不满足所述预置条件。
可选的,所述当判断所述第一适应值大于所述预设阈值时,确定所述第一超参数不满足所述预置条件之后,所述方法还包括:
按照预置超参数突变规则对所述第一超参数进行处理,得到进行处理之后的目标超参数;
基于所述预置的适应度函数计算得到所述目标超参数对应的目标适应值;
基于所述目标适应值判断所述目标超参数是否可以作为所述待训练网络检测模型进行训练的初始数据。
可选的,所述按照预置超参数超参数突变规则对所述第一超参数进行处理,得到进行处理之后的目标超参数,包括:
对所述第一超参数进行差分变异,得到所述第一超参数对应的变异体;
根据所述变异体进行交叉处理,得到对应的第二超参数;
按照所述适应度函数计算得到所述第二超参数对应的第二适应值;
当所述第二适应值小于所述第一适应值时,将所述第二超参数设置为目标超参数。
可选的,所述基于所述目标适应值判断所述目标超参数是否可以作为所述待训练网络检测模型进行训练的初始数据,包括:
当确定所述目标适应值小于或者等于所述预设阈值时,确定所述目标超参数将作为待训练网络检测模型进行训练的初始数据;
当确定所述目标适应值大于所述预设阈值时,确定所述目标超参数不作为待训练网络检测模型进行训练的初始数据。
可选的,所述方法还包括:
当判断所述第二适应值大于或者等于所述第一适应值时,将再次按照所述预置超参数突变规则对所述第一超参数进行处理;或,
当判断所述目标适应值大于所述预设阈值时,将再次按照所述预置超参数突变规则对所述目标超参数进行变异处理。
此外,为实现上述目的,本发明还提供一种网络检测模型的训练装置,所述网络检测模型的训练装置包括:
参数处理模块,用于当接收到输入的超参数时,基于差分演化算法对所述超参数进行预处理;
第一判断模块,用于当判断进行预处理所得到的超参数满足预置条件时,将所述进行预处理所得到的超参数作为待训练网络检测模型进行训练的初始数据;
模型训练模块,用于当接收到输入的参考网络连接信息时,基于所述进行预处理所得到的超参数以及所述参考网络连接信息对所述待训练网络检测模型进行训练,得到完成训练的网络检测模型。
可选的,所述参数处理模块具体用于:
当接收到输入的超参数时,对所述输入的超参数进行初始化得到对应的第一超参数;
基于预置的适应度函数计算所述第一超参数对应的第一适应值。
可选的,所述网络检测模型的训练装置具体还包括:
判断确定模块,用于当判断所述第一适应值小于或者等于预设阈值时,确定所述第一超参数满足所述预置条件;以及当判断所述第一适应值大于所述预设阈值时,确定所述第一超参数不满足所述预置条件。
可选的,所述网络检测模型的训练装置具体还包括:
突变处理模块,用于按照预置超参数突变规则对所述第一超参数进行处理,得到进行处理之后的目标超参数;
数据计算模块,用于基于所述预置的适应度函数计算得到所述目标超参数对应的目标适应值;
第二判断模块,用于基于所述目标适应值判断所述目标超参数是否可以作为所述待训练网络检测模型进行训练的初始数据。
可选的,所述突变处理模块具体用于:
对所述第一超参数进行差分变异,得到所述第一超参数对应的变异体;
根据所述变异体进行交叉处理,得到对应的第二超参数;
按照所述适应度函数计算得到所述第二超参数对应的第二适应值;
当所述第二适应值小于所述第一适应值时,将所述第二超参数设置为目标超参数。
可选的,所述第二判断模块具体还用于:
当确定所述目标适应值小于或者等于所述预设阈值时,确定所述目标超参数将作为待训练网络检测模型进行训练的初始数据;
当确定所述目标适应值大于所述预设阈值时,确定所述目标超参数不作为待训练网络检测模型进行训练的初始数据。
可选的,所述突变处理模块具体还用于:
当判断所述第二适应值大于或者等于所述第一适应值时,将再次按照所述预置超参数突变规则对所述第一超参数进行处理;或,
当判断所述目标适应值大于所述预设阈值时,将再次按照所述预置超参数突变规则对所述目标超参数进行变异处理。
此外,为实现上述目的,本发明还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述网络检测模型的训练方法的步骤。
此外,为实现上述目的,本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述网络检测模型的训练方法的步骤。
上述网络检测模型的训练方法、装置、计算机设备和存储介质,在对待训练网络检测模型进行训练时,首先会接收所输入的超参数,并对所接收到的超参数基于差分演化算法进行处理,得到进行预处理所得到的超参数,然后对进行预处理所得到的超参数进行条件判断,在确定进行预处理所得到的超参数满足预置条件时,将进行预处理所得到的超参数作为待训练网络检测模型进行训练的初始数据,最后在接收到参考网络连接信息时,根据进行预处理所得到的超参数以及参考网路连接信息对待训练网络模型进行训练,以得到最终的网络检测模型。实现了通过差分演化算分对超参数进行预处理,使得进行模型训练时所输入的超参数更加贴近最优解,使得在继续模型训练时,训练时间缩短以及训练速度更快。
附图说明
图1为一个实施例中网络检测模型的训练方法的流程示意图;
图2为一个实施例中对超参数进行预处理得到第一超参数的步骤的流程示意图;
图3为一个实施例中对第一超参数进行处理的步骤的流程示意图;
图4为一个实施例中得到目标超参数的步骤的流程示意图;
图5为一个实施例中网络检测模型的训练装置的结构框图;
图6为另一个实施例中网络检测模型的训练装置的结构框图;
图7为又一个实施例中网络检测模型的训练装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
参照图1,图1为一个实施例中网络检测模型的训练方法的流程示意图。
在一实施例中,该网络检测模型的训练方法包括:
步骤S10,当接收到输入的超参数时,基于差分演化算法对超参数进行预处理。
其中,超参数是在机器学习过程中预先进行设置的参数,而不是通过机器训练而得到的参数数据。
在进行模型训练的过程中,当训练装置接收到所输入的超参数时,将会根据差分演化算法对所接收到的超参数进行预处理,得到进行预处理之后的超参数。在对网络入侵检测模型进行训练时,工作人员会根据实际的需求输入对应的超参数,其中超参数包括有种群规模、交叉概率以及缩放因子等,通过差分演化算法进行预处理,可以使得超参数进行相应的自适应调节,使得超参数可以更加符合模型训练的需求。
在实际预处理过程中,对超参数进行预处理时,包括有初始化以及变异过程,根据预先设置的处理逻辑进行预处理。在进行预处理时,在所输入的超参数满足一定的条件时,不需要进行变异处理,而是直接可以作为进行模型训练的数据输入,但是在实际应用中,进行初始化所得到的超参数通常还是通过变异处理,才会使得超参数满足进行下一步操作的条件,也就是可以作为模型训练的输入参数。
步骤S20,当判断进行预处理所得到的超参数满足预置条件时,将进行预处理所得到的超参数作为待训练网络检测模型进行训练的数据。
其中,预置条件的设定是为了使得超参数进行预处理之后更加贴近符合所需要的状态,待训练网络检测模型是用于对所连接的网络是否为入侵网络进行判断的模型,同时还可以对其他的异常状态的网络进行判断。具体地,待训练网络检测模型为一种人工神经网络模型,人工神经网络是一种模拟人脑结构及其功能的信息处理系统。
当训练装置对所接收到的超参数进行预处理之后得到对应的超参数时,将会对进行预处理所得到的超参数进行条件判断,当确定进行预处理所得到的超参数满足预置条件时,将会将进行预处理所得到的超参数作为待训练网络检测模型进行训练的初始数据。
在实际应用中,在基于差分演化算法对所接收到的超参数进行预处理之后,进行预处理所得到的超参数会更加符合最后的输出需求,但是需要对进行预处理所得到的超参数是否可以作为待训练网络检测模型的初始数据进行判断。在本实施例中,判断进行预处理所得到的超参数是否满足预置条件的方式为:获取进行预处理所得到的超参数所对应的适应值,然后将所得到的适应值与预设的适应阈值进行比较,以确定是否可以作为待训练网络检测模型的初始数据。
步骤S30,当接收到输入的参考网络连接信息时,基于进行预处理所得到的超参数以及参考网络连接信息对待训练网络检测模型进行训练,得到完成训练的网络检测模型。
其中,参考网络连接信息是正常网络的相关信息,通过模型进行训练确定正常网络的相关特征信息,进而在进行网络检测时可以准确判断是否为入侵网络,并对入侵网络进行拦截阻止。
在训练装置确定了对待训练网络检测模型进行训练的初始数据之后,将会接收所输入的参考网络连接信息,然后根据进行预处理所得到的超参数以及所接收到的参考网络连接信息对待训练网络检测模型进行训练,以在训练完成时得到对应的网络检测模型。在实际应用中,在基于差分演化算法对超参数进行预处理之后,即使进行预处理所得到的超参数满足预置条件,也只是比较接近所需要的数值,因此在完成时预处理之后,还将接收所输入的参考网络连接信息,以根据所接收到的参考网络连接信息以及进行预处理所得到的超参数对待训练网络检测模型进行微调,进而得到训练完成的网络检测模型。
在进行预处理训练得到作为模型训练的初始数据之后,将会接收用户所输入的参考网络连接信息,然后将预处理得到的初始数据和接收到的参考网络连接信息作为待训练网检测模型的输入,以完成对待训练网络检测模型的训练。具体地,以待训练网络检测模型由BP(Back Propagation)神经网络所构成为例,BP神经网络是具有三层或三层以上的阶层型神经网络,由输入层、隐含层和输出层构成,相邻层之间的神经元全互连,同一层内的神经元无连接。训练思想:从后向前(反向)逐层传播输出层的误差,以简接算出隐层误差。具体分为两个阶段:正向传播过程,输入信息从输入层经隐层逐层计算各单元的输出值;反向传播过程,输出误差逐层向前算出隐层各单元的误差,并用此误差修正前层权值。在本实施例中,输入的数据包括有进行预处理得到的超数据和所输入的参考网络连接信息,利用所输入的初始数据进行计算,得到输入的数据。在实际模型训练中,并不是一次计算输出的数据即可满足模型训练的标准,通常是在检测到待训练网络检测模型收敛时确定训练完成得到最终训练好的网络检测模型,其中收敛条件可以时训练达到一定的次数,或者训练达到一定的时常,再或者某一特定参数满足特定需求如一参数训练得到的数值与对应的预设阈值满足一定的关系,如大小关系。
另外,在进行实际的训练时,主要的训练过程包括有:权值初始化,即训练初始数据的获取;参考网络连接信息的输入;各层计算输出;各层的反传误差;按权值修正公式修正各层的权值和阈值;按新权值进行再计算,以得到输出数据。在所输出的数据满足一定条件,或者达到最大学习次数或训练时常达到预设训练时常时确定学习完成,即训练完成。
在本实施例中,在对待训练网络检测模型进行训练时,首先会接收所输入的超参数,并对所接收到的超参数基于差分演化算法进行处理,得到进行预处理所得到的超参数,然后对进行预处理所得到的超参数进行条件判断,在确定进行预处理所得到的超参数满足预置条件时,将进行预处理所得到的超参数作为待训练网络检测模型进行训练的初始数据,最后在接收到参考网络连接信息时,根据进行预处理所得到的超参数以及参考网路连接信息对待训练网络模型进行训练,以得到最终的网络检测模型。实现了通过差分演化算分对超参数进行预处理,使得进行模型训练时所输入的超参数更加贴近最优解,使得在继续模型训练时,训练时间缩短以及训练速度更快。
进一步地,参照图2,图2为一个实施例中对超参数进行预处理得到第一超参数的步骤的流程示意图。
步骤S10,当接收到所输入的超参数时,基于差分演化算法对超参数进行预处理,包括:
步骤S11,当接收到输入的超参数时,对输入的超参数进行初始化得到对应的第一超参数;
步骤S12,基于预置的适应度函数计算第一超参数对应的第一适应值。
其中,第一超参数对超参数的命名,是对所接收到的超参数进行初始化处理之后的超参数的命名,用于与前置超参数进行区别。差分演化算法于1997年在遗传算法等进化思想的基础上提出的,本质是一种多目标(连续变量)优化算法,用于求解多维空间中整体最优解。其基本思想即是来源于遗传算法,模拟遗传算法中的杂交、变异、复制来计算。
训练装置在接收到所输入的超参数时,将会根据差分演化算法对所接收到的超参数进行预处理,而实际的预处理过程包括有初始化处理过程以及变异处理过程,在本实施例中,在接收到所输入的超参数之后,首先会对所接收到的超参数进行初始化处理,得到对应的第一超参数,然后按照预置的适应度函数对第一超参数所对应的第一适应值进行计算,以根据所得到的第一适应值判断第一超参数是否可以作为待训练网络检测模型进行训练的数据输入。
在实际进行初始化处理过程中,根据预先设置的数据初始化方式对所接收到的超参数进行处理。假定超参数中包括有种群规模N、交叉概率cr以及缩放因子F,其中每个种群有D维向量组成,在进行初始化时,是进行种群初始化,具体地初始化方式为:
其中,Xi(0)是第i个个体,j表示第j维。
其中,分别为第j维的下界和上界,rand(0,1)表示在区间[0,1]上的随机数。对于种群规模N来说,一般介于5*D与10*D之间,但不能小于4*D。
在对所接收到的超参数进行初始化得对应的第一超参数之后,将会按照预置的适应度函数进行计算,得到第一超参数对应的第一适应值,其中适应度函数可以但不限于为Griewank函数、Rastrigin函数、Schaffer函数、Ackley函数以及Rosenbrock函数。在得到的第一适应值之后,将会将第一适应值与预设阈值进行比较来判断是否需要对所得到的第一超参数进行变异处理,也就是确定所得到的第一超参数是否满足预置条件。其中,当第一适应值小于或者等于预设阈值时,确定第一超参数满足预置条件,即不需要对第一超参数进行变异处理;当第一适应值大于预设阈值时,确定第一超参数不满足所述预置条件,即需要对第一超参数进行变异处理。
进一步地,参照图3,图3为一个实施例中对第一超参数进行处理的步骤的流程示意图。
具体地,步骤S12,基于预置的适应度函数计算第一超参数对应的第一适应值,之后还包括:
步骤S40,按照预置超参数突变规则对第一超参数进行处理,得到进行处理之后的第二超参数;
步骤S50,基于预置的适应度函数计算得到目标超参数对应的目标适应值;
步骤S60,基于目标适应值判断目标超参数是否可以作为待训练网络检测模型进行训练的初始数据。
训练装置在确定第一超参数不满足预置条件,也就是确定第一超参数对应的第一适应值大于预设阈值时,确定第一超参数不满足预置条件,此时将会按照预置的超参数突变规则对所得到的第一超参数进行处理,以得到对应的目标超参数,然后按照预先所使用的适应度函数计算目标超参数对应的目标适应值,进而根据所得到的目标适应值判断目标超参数是否可以作为待训练网络判断模型进行训练的初始数据。
在实际应用中,在第一超参数不满足预置条件时,说明第一超参数不可以作为待训练网络模型进行训练的初始数据,因此需要对第一超参数进行处理。此时在对第一超参数进行处理时,按照差分演化算法对应的处理方式进行处理,具体的处理过程包括有变异操作、交叉操作、选择操作、更新操作以及替换更新操作等,通过对第一超参数进行如上所述的操作,得到处理之后的第二超参数。
在得到进行处理之后的目标超参数时,通过计算得到目标超参数对应的目标适应值,然后利用目标适应值判断目标超参数是否可以作为待训练网络检测模型进行训练的初始数据。在实际判断过程中,通过目标适应值与第一适应值以及预设阈值之间的关系判断目标超参数是否可以作为待训练网络检测模型进行训练的初始数据。当目标超参数可以作为待训练网络检测模型进行训练的初始数据时,首先需要目标适应值小于第一适应值,然后就是目标适应值小于或者等于预设阈值。
需要说明的是,在确定目标超参数不满足预置条件,也就是目标超参数不可以作为待训练网络检测模型进行训练的初始数据时,将会再次按照预置超参数超参数突变规则对目标超参数进行处理,至最终所得到的超参数可以作为待训练网络检测模型进行训练的初始数据。
进一步地,参照图4,图4为一个实施例中得到目标超参数的步骤的流程示意图。
具体地,步骤S40,按照预置超参数超参数突变规则对第一超参数进行处理,得到进行处理之后的目标超参数,包括:
步骤S41,对第一超参数进行差分变异,得到第一超参数对应的变异体;
步骤S42,根据变异体进行交叉处理,得到对应的第二超参数;
步骤S43,按照适应度函数计算得到第二超参数对应的第二适应值;
步骤S44,当第二适应值小于第一适应值时,将第二超参数设置为目标超参数。
其中,变异体为超参数的一种表现形式。
训练装置在确定所得到的第一超参数不满足预置条件时,将会对第一超参数进行处理,具体地,训练装置首先对第一超参数进行差分变异,得到对应的变异体,然后对所得到的变异体进行交叉处理,得到对应的第二超参数,进而按照预置的适应度函数计算第二超参数对应的第二适应值,最后根据第一适应值与第二适应值的大小关系确定对应的目标超参数,其中,当第二适应值小于第一适应值时,将所得到的第二超参数设置为目标超参数,当第二适应值大于或者等于第一适应值时,将第一超参数设置为目标超参数,由于第一超参数本身就不满足预置条件,因此在目标超参数为第一超参数时,将需要再次按照预置超参数超参数突变规则对第一超参数进行处理。
在实际应用中,在第一超参数不满足预置条件时,首先会对第一超参数按照相应的差分变异策略进行差分变异,其中所使用的差分变异策略包括但不限于“差分/随机/1”、“差分/最佳/1”以及“差分/随机/2”三种进化策略,在根据进化策略得到变异体之后,对所得到的变异体进行交叉处理,得到最终的变异体,即为对应的第二超参数。
基于上述初始化步骤之后,具体地差分变异过程如下:
在第g次迭代(差分变异)中,从超参数中随机选择3个个体Xp1(g),Xp2(g),Xp3(g),且p1≠p2≠p3≠i,生成的变异向量为:
Hi(g)=Xp1(g)+F·(Xp2(g)-Xp3(g));
其中Δp2,p3(g)=Xp2(g)-Xp3(g)是差分向量,F是缩放因子,对于缩放因子F,一般是在[0,2]之间选择,通常取0.5。
参数F的自适应调整:将变异算子中随机选择的三个个体进行从优到劣的排序,得到Xb,Xm,Xw对应适应度fb,fm,fw,变异算子改为:
Vi=Xb+Fi(Xm-Xw);
同时,F的取值根据生成差分向量的两个个体自适应变化:
其中,Fl=0.1,Fu=0.9;
三种进化策略(差分/随机/1:DE/rand/1、差分/最佳/1:DE/best/1、差分/随机/2:DE/rand/2)对应的变异策略如下:
DE/rand/1:Vi(g)=Xp1(g)+F·(Xp2(g)-Xp3(g));
DE/best/1:Vi(g)=Xbest(g)+F·(Xp1(g)-Xp3(g));
DE/rand/2:Vi(g)=Xp1(g)+F·(Xp2(g)-Xp3(g))+F·(Xp4(g)-Xp5(g));
具体地交叉操作如下:
其中,cr∈[0,1]为交叉概率。
且,参数cr的自适应调整:
其中fi是个体Xi的适应度,fmin与fmax分别是当前超参数中最差和最优个体的适应度,是当前超参数适应度平均值,crl和cru分别是cr的下限与上限,一般crl=0.1,cru=0.6。
在得到第二超参数之后,将会按照预置的适应度函数计算第二超参数对应的第二适应值,进而将第二适应值与第一适应值进行对比,确定当前优胜的变异体,也就是超参数。在变异进化之后,将计算6个状态指示器,包括有打分平均值持续下降、打分平均值下降停滞、超参数数量停留在上限、超参数数量停留在下限、超参数标准差持续下降和超参数标准差下降停滞,以表示超参数对应的状态。
本发明进一步提供一种网络检测模型的训练装置。
参照图5,图5为一个实施例中网络检测模型的训练装置的结构框图。
在一实施例中,该网络检测模型的训练装置50包括参数处理模块51、条件判断模块52以及模型训练模块53。
参数处理模块51,用于当接收到输入的超参数时,基于差分演化算法对超参数进行预处理;
第一判断模块52,用于当判断进行预处理所得到的超参数满足预置条件时,将进行预处理所得到的超参数作为待训练网络检测模型进行训练的初始数据;
模型训练模块53,用于当接收到输入的参考网络连接信息时,基于进行预处理所得到的超参数以及参考网络连接信息对待训练网络检测模型进行训练,得到完成训练的网络检测模型。
在一个实施例中,所述参数处理模块51具体还用于:
当接收到输入的超参数时,对输入的超参数进行初始化得到对应的第一超参数;
基于预置的适应度函数计算第一超参数对应的第一适应值。
在一个实施例中,参照图6,图6为另一个实施例中网络检测模型的训练装置的结构框图,所述网络检测模型的训练装置具体还包括:
判断确定模块54,用于当判断第一适应值小于或者等于预设阈值时,确定第一超参数满足预置条件;以及当判断第一适应值大于预设阈值时,确定第一超参数不满足预置条件。
在一个实施例中,参照图7,图7为又一个实施例中网络检测模型的训练装置的结构框图,所述网络检测模型的训练装置具体还包括:
突变处理模块55,用于按照预置超参数突变规则对第一超参数进行处理,得到进行处理之后的目标超参数;
数据计算模块56,用于基于预置的适应度函数计算得到目标超参数对应的目标适应值;
第二判断模块57,用于基于目标适应值判断目标超参数是否可以作为待训练网络检测模型进行训练的初始数据。
在一个实施例中,所述突变处理模块55具体还用于:
对第一超参数进行差分变异,得到第一超参数对应的变异体;
根据变异体进行交叉处理,得到对应的第二超参数;
按照适应度函数计算得到第二超参数对应的第二适应值;
当第二适应值小于第一适应值时,将第二超参数设置为目标超参数。
在一个实施例中,所述第二判断模块57具体还用于:
当确定目标适应值小于或者等于预设阈值时,确定目标超参数将作为待训练网络检测模型进行训练的初始数据;
当确定目标适应值大于预设阈值时,确定目标超参数不作为待训练网络检测模型进行训练的初始数据。
在一个实施例中,所述突变处理模块55具体还用于:
当判断第二适应值大于或者等于第一适应值时,将再次按照预置超参数突变规则对第一超参数进行处理;或,
当判断目标适应值大于预设阈值时,将再次按照预置超参数突变规则对目标超参数进行变异处理。
在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行所述计算机程序时实现以下步骤:
当接收到输入的超参数时,基于差分演化算法对超参数进行预处理;
当判断进行预处理所得到的超参数满足预置条件时,将进行预处理所得到的超参数作为待训练网络检测模型进行训练的初始数据;
当接收到输入的参考网络连接信息时,基于进行预处理所得到的超参数以及参考网络连接信息对待训练网络检测模型进行训练,得到完成训练的网络检测模型。
在一个实施例中,所述处理器执行所述计算机程序时还实现以下步骤:
当接收到输入的超参数时,对输入的超参数进行初始化得到对应的第一超参数;
基于预置的适应度函数计算第一超参数对应的第一适应值。
在一个实施例中,所述处理器执行所述计算机程序时还实现以下步骤:
当判断第一适应值小于或者等于预设阈值时,确定第一超参数满足预置条件;
当判断第一适应值大于预设阈值时,确定第一超参数不满足预置条件。
在一个实施例中,所述处理器执行所述计算机程序时还实现以下步骤:
按照预置超参数突变规则对第一超参数进行处理,得到进行处理之后的目标超参数;
基于预置的适应度函数计算得到目标超参数对应的目标适应值;
基于目标适应值判断目标超参数是否可以作为待训练网络检测模型进行训练的初始数据。
在一个实施例中,所述处理器执行所述计算机程序时还实现以下步骤:
对第一超参数进行差分变异,得到第一超参数对应的变异体;
根据变异体进行交叉处理,得到对应的第二超参数;
按照适应度函数计算得到第二超参数对应的第二适应值;
当第二适应值小于第一适应值时,将第二超参数设置为目标超参数。
在一个实施例中,所述处理器执行所述计算机程序时还实现以下步骤:
当确定目标适应值小于或者等于预设阈值时,确定目标超参数将作为待训练网络检测模型进行训练的初始数据;
当确定目标适应值大于预设阈值时,确定目标超参数不作为待训练网络检测模型进行训练的初始数据。
在一个实施例中,所述处理器执行所述计算机程序时还实现以下步骤:
当判断第二适应值大于或者等于第一适应值时,将再次按照预置超参数突变规则对第一超参数进行处理;或,
当判断目标适应值大于预设阈值时,将再次按照预置超参数突变规则对目标超参数进行变异处理。
在一个实施例中,提出了一种存储有计算机可读指令的存储介质,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:
当接收到输入的超参数时,基于差分演化算法对超参数进行预处理;
当判断进行预处理所得到的超参数满足预置条件时,将进行预处理所得到的超参数作为待训练网络检测模型进行训练的初始数据;
当接收到输入的参考网络连接信息时,基于进行预处理所得到的超参数以及参考网络连接信息对待训练网络检测模型进行训练,得到完成训练的网络检测模型。
在一个实施例中,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器还执行以下步骤:
当接收到输入的超参数时,对超参数进行初始化得到对应的第一超参数;
基于预置的适应度函数计算第一超参数对应的第一适应值。
在一个实施例中,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器还执行以下步骤:
当判断第一适应值小于或者等于预设阈值时,确定第一超参数满足预置条件;
当判断第一适应值大于预设阈值时,确定第一超参数不满足预置条件。
在一个实施例中,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器还执行以下步骤:
按照预置超参数突变规则对第一超参数进行处理,得到进行处理之后的目标超参数;
基于预置的适应度函数计算得到目标超参数对应的目标适应值;
基于目标适应值判断目标超参数是否可以作为待训练网络检测模型进行训练的初始数据。
在一个实施例中,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器还执行以下步骤:
对第一超参数进行差分变异,得到第一超参数对应的变异体;
根据变异体进行交叉处理,得到对应的第二超参数;
按照适应度函数计算得到第二超参数对应的第二适应值;
当第二适应值小于第一适应值时,将第二超参数设置为目标超参数。
在一个实施例中,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器还执行以下步骤:
当确定目标适应值小于或者等于预设阈值时,确定目标超参数将作为待训练网络检测模型进行训练的初始数据;
当确定目标适应值大于预设阈值时,确定目标超参数不作为待训练网络检测模型进行训练的初始数据。
在一个实施例中,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器还执行以下步骤:
当判断第二适应值大于或者等于第一适应值时,将再次按照预置超参数突变规则对第一超参数进行处理;或,
当判断目标适应值大于预设阈值时,将再次按照预置超参数突变规则对目标超参数进行变异处理。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本发明的保护之内。

Claims (10)

1.一种网络检测模型的训练方法,其特征在于,所述方法包括:
当接收到输入的超参数时,基于差分演化算法对所述超参数进行预处理;
当判断进行预处理所得到的超参数满足预置条件时,将所述进行预处理所得到的超参数作为待训练网络检测模型进行训练的初始数据;
当接收到输入的参考网络连接信息时,基于所述进行预处理所得到的超参数以及所述参考网络连接信息对所述待训练网络检测模型进行训练,得到完成训练的网络检测模型。
2.根据权利要求1所述的网络检测模型的训练方法,其特征在于,所述当接收到所输入的超参数时,基于差分演化算法对所述超参数进行预处理,包括:
当接收到输入的超参数时,对所述输入的超参数进行初始化得到对应的第一超参数;
基于预置的适应度函数计算所述第一超参数对应的第一适应值。
3.根据权利要求2所述的网络检测模型的训练方法,其特征在于,所述基于预置的适应度函数计算所述第一超参数对应的第一适应值,之后还包括:
当判断所述第一适应值小于或者等于预设阈值时,确定所述第一超参数满足所述预置条件;
当判断所述第一适应值大于所述预设阈值时,确定所述第一超参数不满足所述预置条件。
4.根据权利要求3所述的网络检测模型的训练方法,其特征在于,所述当判断所述第一适应值大于所述预设阈值时,确定所述第一超参数不满足所述预置条件之后,所述方法还包括:
按照预置超参数突变规则对所述第一超参数进行处理,得到进行处理之后的目标超参数;
基于所述预置的适应度函数计算得到所述目标超参数对应的目标适应值;
基于所述目标适应值判断所述目标超参数是否可以作为所述待训练网络检测模型进行训练的初始数据。
5.根据权利要求4所述的网络检测模型的训练方法,其特征在于,所述按照预置超参数突变规则对所述第一超参数进行处理,得到进行处理之后的目标超参数,包括:
对所述第一超参数进行差分变异,得到所述第一超参数对应的变异体;
根据所述变异体进行交叉处理,得到对应的第二超参数;
按照所述适应度函数计算得到所述第二超参数对应的第二适应值;
当所述第二适应值小于所述第一适应值时,将所述第二超参数设置为目标超参数。
6.根据权利要求5所述的网络检测模型的训练方法,其特征在于,所述基于所述目标适应值判断所述目标超参数是否可以作为所述待训练网络检测模型进行训练的初始数据,包括:
当确定所述目标适应值小于或者等于所述预设阈值时,确定所述目标超参数将作为待训练网络检测模型进行训练的初始数据;
当确定所述目标适应值大于所述预设阈值时,确定所述目标超参数不作为待训练网络检测模型进行训练的初始数据。
7.根据权利要求6所述的网络检测模型的训练方法,其特征在于,所述方法还包括:
当判断所述第二适应值大于或者等于所述第一适应值时,将再次按照所述预置超参数突变规则对所述第一超参数进行处理;或,
当判断所述目标适应值大于所述预设阈值时,将再次按照所述预置超参数突变规则对所述目标超参数进行变异处理。
8.一种网络检测模型的训练装置,其特征在于,所述装置包括:
参数处理模块,用于当接收到所输入的超参数时,基于差分演化算法对所述超参数进行预处理;
条件判断模块,用于当判断进行预处理所得到的超参数满足预置条件时,将所述所得到的超参数作为待训练网络检测模型进行训练的初始数据;
模型训练模块,用于当接收到输入的参考网络连接信息时,基于所述所得到的超参数以及所述参考网络连接对所述待训练网络检测模型进行训练,得到完成训练的网络检测模型。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述网络检测模型的训练方法的步骤。
10.一种存储有计算机可读指令的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项所述网络检测模型的训练方法的步骤。
CN201910521200.4A 2019-06-17 2019-06-17 网络检测模型的训练方法、装置、计算机设备和存储介质 Pending CN110414667A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910521200.4A CN110414667A (zh) 2019-06-17 2019-06-17 网络检测模型的训练方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910521200.4A CN110414667A (zh) 2019-06-17 2019-06-17 网络检测模型的训练方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN110414667A true CN110414667A (zh) 2019-11-05

Family

ID=68359215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910521200.4A Pending CN110414667A (zh) 2019-06-17 2019-06-17 网络检测模型的训练方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110414667A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257561A (zh) * 2020-10-20 2021-01-22 广州云从凯风科技有限公司 一种人脸活体检测方法、装置、机器可读介质及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170293687A1 (en) * 2016-04-12 2017-10-12 Abbyy Infopoisk Llc Evaluating text classifier parameters based on semantic features
CN108563556A (zh) * 2018-01-10 2018-09-21 江苏工程职业技术学院 基于差分演化算法的软件缺陷预测优化方法
CN108805268A (zh) * 2018-06-08 2018-11-13 中国科学技术大学 基于进化算法的深度强化学习策略网络训练方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170293687A1 (en) * 2016-04-12 2017-10-12 Abbyy Infopoisk Llc Evaluating text classifier parameters based on semantic features
CN108563556A (zh) * 2018-01-10 2018-09-21 江苏工程职业技术学院 基于差分演化算法的软件缺陷预测优化方法
CN108805268A (zh) * 2018-06-08 2018-11-13 中国科学技术大学 基于进化算法的深度强化学习策略网络训练方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
侯杰: "基于差分进化与深度学习的入侵检测研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 06, pages 139 - 134 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257561A (zh) * 2020-10-20 2021-01-22 广州云从凯风科技有限公司 一种人脸活体检测方法、装置、机器可读介质及设备

Similar Documents

Publication Publication Date Title
Rana et al. Application of multi layer (perceptron) artificial neural network in the diagnosis system: a systematic review
US4912655A (en) Adjusting neural networks
CN103699440B (zh) 一种云计算平台系统为任务分配资源的方法和装置
US4914603A (en) Training neural networks
CN108408855B (zh) 一种用于废水处理的在线加药控制方法及系统
US4912649A (en) Accelerating learning in neural networks
CN103853786B (zh) 数据库参数的优化方法与系统
WO2019005611A1 (en) SELECTIVE APPRENTICESHIP FOR ERROR DECORRELATION
CN107169610A (zh) 水产养殖溶解氧预测方法及装置
CN109508789A (zh) 预测手牌的方法、存储介质、处理器以及设备
CN109447354A (zh) 一种基于ga-bp神经网络的智能配钞方法及装置
US4912654A (en) Neural networks learning method
TW201426576A (zh) 用於設計湧現式多層尖峰網路的方法和裝置
US4912652A (en) Fast neural network training
CN111724370B (zh) 基于不确定性和概率的多任务图像质量评估方法及系统
CN108446534A (zh) 选择神经网络超参数的方法、装置和计算机可读存储介质
CN111142060B (zh) 一种基于改进的bp神经网络的自适应阈值调整诊断方法
CN109919229A (zh) 基于人工蜂群和神经网络的监测有害气体预测方法及系统
CN105447566B (zh) 训练装置、训练方法以及检测装置
CN114757351A (zh) 一种深度强化学习模型对抗攻击的防御方法
CN110414667A (zh) 网络检测模型的训练方法、装置、计算机设备和存储介质
US4912651A (en) Speeding learning in neural networks
US20230094323A1 (en) System and method for optimizing general purpose biological network for drug response prediction using meta-reinforcement learning agent
CN114330754A (zh) 一种策略模型训练方法、装置及设备
CN115695025A (zh) 网络安全态势预测模型的训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination