CN112348202B

CN112348202B - 一种机器学习中规则模型的建立方法

Info

Publication number: CN112348202B
Application number: CN202110005459.0A
Authority: CN
Inventors: 傅涛; 王力
Original assignee: Bozhi Safety Technology Co ltd
Current assignee: Bozhi Safety Technology Co ltd
Priority date: 2021-01-05
Filing date: 2021-01-05
Publication date: 2021-03-30
Anticipated expiration: 2041-01-05
Also published as: CN112348202A

Abstract

本发明公开了一种机器学习中规则模型的建立方法，属于工控网络安全技术领域，能够解决现有协议操作指令检测规则自动化分类配置时，配置难度较大，效率较低，且容易出错的问题。所述建立方法包括：对第一工控协议通讯行为样本进行解析，提取第一协议样本；将第一协议样本输入机器学习模块中进行训练，确定通讯正常库；对第二工控协议通讯行为样本进行解析，提取第二协议样本；将第二协议样本输入机器学习模块中进行训练；获取第二协议样本的权重，并根据第二协议样本的权重更新通讯正常库和建立通讯异常库。本发明用于规则模型的建立。

Description

一种机器学习中规则模型的建立方法

技术领域

本发明涉及一种机器学习中规则模型的建立方法，属于工控网络安全技术领域。

背景技术

随着工业控制网络和互联网络不断的融合，工业控制系统正朝着数字化、网络化、智能化的方向发展，越来越多的工控系统及相关设备与外部公共网络连接，工业互连已成为不可避免的趋势，高度网络化、开放协议和通用组件互联，带来了更多的攻击路径和攻击方式，网络空间的安全问题直接延伸到工业控制系统中，工控系统面临更加复杂的信息安全威胁，自动识别异常工控行为成为了亟待解决的问题。

传统审计系统需要人工对协议进行检测规则配置，系统获取流量数据，并解析工控行为报文，根据检测规则判断该工控行为是否为异常操作行为。检测规则配置，需要运维人员对协议以及业务非常了解，随着工控设备使用协议越来越多，协议指令也越来越复杂，人工配置协议检测规则难度变大，且配置过程中容易配置错误；并且现有的机器学习模型不完善，只能学习到行为，不能对协议操作指令检测规则进行自动化分类配置，从而需要人为分类配置，导致配置难度较大，效率较低，且容易出错。

发明内容

本发明提供了一种机器学习中规则模型的建立方法，能够解决现有协议操作指令检测规则自动化分类配置时，配置难度较大，效率较低，且容易出错的问题。

本发明提供了一种机器学习中规则模型的建立方法，所述建立方法包括：对第一工控协议通讯行为样本进行解析，提取第一协议样本；将所述第一协议样本输入机器学习模块中进行训练，确定通讯正常库；对第二工控协议通讯行为样本进行解析，提取第二协议样本；将所述第二协议样本输入机器学习模块中进行训练；获取所述第二协议样本的权重，并根据所述第二协议样本的权重更新通讯正常库和建立通讯异常库。

可选的，所述将所述第一协议样本输入机器学习模块中进行训练，确定通讯正常库，具体为：将所述第一协议样本的权重标记为1，并将所述第一协议样本添加至通讯正常库中。

可选的，所述获取所述第二协议样本的权重，并根据所述第二协议样本的权重更新通讯正常库和建立通讯异常库，具体包括：若所述第二协议样本存在于所述通讯正常库中，且其权重不为1，则更新所有权重不为1的第二协议样本的权重；并根据更新后所述第二协议样本的权重将所述第二协议样本添加至所述通讯正常库中或所述通讯异常库中；若所述第二协议样本不存在于所述通讯正常库中，则将所述第二协议样本的权重设置为预设权重，更新所有权重不为1的第二协议样本的权重，并将所述第二协议样本转入通讯异常库中；其中，所述预设权重小于0.5。

可选的，所述预设权重为0.1。

可选的，所述根据更新后所述第二协议样本的权重将所述第二协议样本添加至所述通讯正常库中或所述通讯异常库中，具体包括：若更新后的第二协议样本的权重小于阈值权重，则将所述第二协议样本转入所述通讯异常库中；并且，若所述第二协议样本存在于所述通讯正常库中，将其从所述通讯正常库中删除；若更新后的第二协议样本的权重大于或等于所述阈值权重，则将所述第二协议样本添加至所述通讯正常库中；并且，若所述第二协议样本存在于所述通讯异常库中，将其从所述通讯异常库中删除。

可选的，所述阈值权重为0.5。

可选的，所述更新所有权重不为1的第二协议样本的权重具体为：采用信息量权重法重新计算所有权重不为1的第二协议样本的权重。

可选的，所述对第一工控协议通讯行为样本进行解析，提取出第一协议样本具体包括：对第一工控协议通讯行为样本的工控协议通讯报文进行解析，并提取出源IP、目的IP、协议名称、协议控制命令、协议控制点位和协议控制值；将所述源IP、所述目的IP、所述协议名称、所述协议控制命令、所述协议控制点位和所述协议控制值打包构成第一协议样本。

可选的，所述对第二工控协议通讯行为样本进行解析，提取出第二协议样本具体包括：对第二工控协议通讯行为样本的工控协议通讯报文进行解析，并提取出源IP、目的IP、协议名称、协议控制命令、协议控制点位和协议控制值；将所述源IP、所述目的IP、所述协议名称、所述协议控制命令、所述协议控制点位和所述协议控制值打包构成第二协议样本。

本发明能产生的有益效果包括：

本发明提供的机器学习中规则模型的建立方法，根据该方法建立的协议指令规则模型能够自动生成工控异常行为协议指令检测规则，根据协议指令检测规则对工控行为进行自动探测，识别出异常工控行为。由于可以为工控网络协议审计提供自动生成协议指令级规则，不需人工配置协议指令级规则，达到协议指令级规则的精准性以及自动化配置特征，大幅度降低人工配置工作，提升工作效率，使得审计系统达到更高的易用性。

附图说明

图1为本发明实施例提供的机器学习中规则模型的建立方法流程图。

具体实施方式

下面结合实施例详述本发明，但本发明并不局限于这些实施例。

本发明实施例提供了一种机器学习中规则模型的建立方法，如图1所示，所述建立方法包括：

步骤101、对第一工控协议通讯行为样本进行解析，提取第一协议样本。

具体的，可以对第一工控协议通讯行为样本的工控协议通讯报文进行解析，并提取出源IP、目的IP、协议名称、协议控制命令、协议控制点位和协议控制值；然后将源IP、目的IP、协议名称、协议控制命令、协议控制点位和协议控制值打包构成第一协议样本。

步骤102、将第一协议样本输入机器学习模块中进行训练，确定通讯正常库。

具体为：将第一协议样本的权重标记为1，并将第一协议样本添加至通讯正常库中。

步骤103、对第二工控协议通讯行为样本进行解析，提取第二协议样本。

具体的，可以对第二工控协议通讯行为样本的工控协议通讯报文进行解析，并提取出源IP、目的IP、协议名称、协议控制命令、协议控制点位和协议控制值；然后将源IP、目的IP、协议名称、协议控制命令、协议控制点位和协议控制值打包构成第二协议样本。

步骤104、将第二协议样本输入机器学习模块中进行训练。

步骤105、获取第二协议样本的权重，并根据第二协议样本的权重更新通讯正常库和建立通讯异常库。

具体的：

1）若第二协议样本存在于通讯正常库中，且其权重为1，则放弃掉该第二协议样本，因为该条数据之前已添加到机器学习模块中了。

2）若第二协议样本存在于通讯正常库中，且其权重不为1，则更新所有权重不为1的第二协议样本的权重；并根据更新后第二协议样本的权重将第二协议样本添加至通讯正常库中或通讯异常库中。

其中，根据更新后第二协议样本的权重将第二协议样本添加至通讯正常库中或通讯异常库中，具体包括：

若更新后的第二协议样本的权重小于阈值权重，则将第二协议样本转入通讯异常库中；并且，若第二协议样本存在于通讯正常库中，将其从通讯正常库中删除；

若更新后的第二协议样本的权重大于或等于阈值权重，则将第二协议样本添加至通讯正常库中；并且，若第二协议样本存在于通讯异常库中，将其从通讯异常库中删除。其中，阈值权重一般可以设置为0.5。

3）若第二协议样本不存在于通讯正常库中，则将第二协议样本的权重设置为预设权重，更新所有权重不为1的第二协议样本的权重，并将第二协议样本转入通讯异常库中；其中，预设权重小于0.5。在实际应用中，预设权重可以设置为0.1。

在本发明实施例中，计算第二协议样本的权重的方法可以有多种，本发明实施例对此不做限定。在实际应用中，可以采用信息量权重法重新计算所有权重不为1的第二协议样本的权重。示例的，也可以采用简化版的朴素贝叶斯分类方法来计算所有权重不为1的第二协议样本的权重。

以上所述，仅是本申请的几个实施例，并非对本申请做任何形式的限制，虽然本申请以较佳实施例揭示如上，然而并非用以限制本申请，任何熟悉本专业的技术人员，在不脱离本申请技术方案的范围内，利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例，均属于技术方案范围内。

Claims

1.一种机器学习中规则模型的建立方法，其特征在于，所述建立方法包括：

对第一工控协议通讯行为样本进行解析，提取第一协议样本；

将所述第一协议样本输入机器学习模块中进行训练，确定通讯正常库；

对第二工控协议通讯行为样本进行解析，提取第二协议样本；

将所述第二协议样本输入所述机器学习模块中进行训练；

获取所述第二协议样本的权重，并根据所述第二协议样本的权重更新通讯正常库和建立通讯异常库；

所述将所述第一协议样本输入机器学习模块中进行训练，确定通讯正常库，具体为：

将所述第一协议样本的权重标记为1，并将所述第一协议样本添加至通讯正常库中；

所述获取所述第二协议样本的权重，并根据所述第二协议样本的权重更新通讯正常库和建立通讯异常库，具体包括：

若所述第二协议样本存在于所述通讯正常库中，且其权重不为1，则更新所有权重不为1的第二协议样本的权重；并根据更新后所述第二协议样本的权重将所述第二协议样本添加至所述通讯正常库中或所述通讯异常库中；

若所述第二协议样本不存在于所述通讯正常库中，则将所述第二协议样本的权重设置为预设权重，更新所有权重不为1的第二协议样本的权重，并将所述第二协议样本转入通讯异常库中；其中，所述预设权重小于0.5。

2.根据权利要求1所述的建立方法，其特征在于，所述预设权重为0.1。

3.根据权利要求1所述的建立方法，其特征在于，所述根据更新后所述第二协议样本的权重将所述第二协议样本添加至所述通讯正常库中或所述通讯异常库中，具体包括：

若更新后的第二协议样本的权重小于阈值权重，则将所述第二协议样本转入所述通讯异常库中；并且，若所述第二协议样本存在于所述通讯正常库中，将其从所述通讯正常库中删除；

若更新后的第二协议样本的权重大于或等于所述阈值权重，则将所述第二协议样本添加至所述通讯正常库中；并且，若所述第二协议样本存在于所述通讯异常库中，将其从所述通讯异常库中删除。

4.根据权利要求3所述的建立方法，其特征在于，所述阈值权重为0.5。

5.根据权利要求1所述的建立方法，其特征在于，所述更新所有权重不为1的第二协议样本的权重具体为：

采用信息量权重法重新计算所有权重不为1的第二协议样本的权重。

6.根据权利要求1所述的建立方法，其特征在于，所述对第一工控协议通讯行为样本进行解析，提取出第一协议样本具体包括：

对第一工控协议通讯行为样本的工控协议通讯报文进行解析，并提取出源IP、目的IP、协议名称、协议控制命令、协议控制点位和协议控制值；

将所述源IP、所述目的IP、所述协议名称、所述协议控制命令、所述协议控制点位和所述协议控制值打包构成第一协议样本。

7.根据权利要求1所述的建立方法，其特征在于，所述对第二工控协议通讯行为样本进行解析，提取出第二协议样本具体包括：

对第二工控协议通讯行为样本的工控协议通讯报文进行解析，并提取出源IP、目的IP、协议名称、协议控制命令、协议控制点位和协议控制值；

将所述源IP、所述目的IP、所述协议名称、所述协议控制命令、所述协议控制点位和所述协议控制值打包构成第二协议样本。