JP6932270B2

JP6932270B2 - 敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法

Info

Publication number: JP6932270B2
Application number: JP2020540726A
Authority: JP
Inventors: ▲鵬▼ 程; ▲陽▼ 何; ▲積▼明 ▲陳▼; 文海王; ▲優▼▲賢▼ ▲孫▼
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2019-01-07
Filing date: 2019-08-18
Publication date: 2021-09-08
Anticipated expiration: 2039-08-18
Also published as: CN109902709A; US20210319113A1; WO2020143227A1; JP2021513143A; CN109902709B

Description

本発明は、工業制御システムのセキュリティの分野に属し、敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法に関する。

頻繁に発生する工業制御システムセキュリティインシデントは、世界中の国々から大きな注目を集めている。工業制御のセキュリティ問題に積極的に対応するために、規範や規格の策定、侵入検出の導入など、さまざまな対応策が打ち出されている。工業制御システムにおいて、ネットワークベースの侵入検出器が非常に典型的であり、よく見かけるものである。アプリケーションネットワーク(ＩＴ)と制御ネットワーク(ＯＴ)の間にネットワーク異常検出デバイスを配置することにより、工業制御システムの安全性を大幅に向上させることができる。現在、機械学習に基づく異常検出アルゴリズムは、ネットワークの異常なトラフィックの識別においてより優れたパフォーマンスを実現できる。これらの機械学習技術は、大量の工業制御システムの履歴データから固有の動作パターンを見つけて、異常検出システムを構築できる。

一方で、従来の機械学習アルゴリズムに基づく工業制御システム侵入検出器では、脆弱な箇所が存在する。機械学習モデルは、実際の応用時には、攻撃者が意図的に生成した敵対的サンプルによって扱われやすい。攻撃者は、試験例に対して微小な変更を加えることで、アルゴリズムモデルに正常な出力と全く異なる結果を生成させることができる。モデルに誤った予測結果を生成させるサンプルは、敵対的サンプルと呼ばれる。機械学習に対して敵対的な攻撃を能動的に設計して生成する研究は、敵対的機械学習研究と呼ばれる。このような敵対的攻撃は、機械学習を使用するシステム、特に工業制御などのセキュリティに対する要求が高いシステムに潜在的なセキュリティ脅威をもたらす。

機械学習アルゴリズムに基づく工業制御システム入侵検出システムでは、攻撃者の意図的な敵対的攻撃を受けると、本来識別可能な悪意あるトラフィックを正常に識別できなくなる。これは、工業制御システムに大きなセキュリティリスクをもたらす。現在、既存の工業制御セキュリティ侵入検出の研究では、敵対的学習部分に関する研究が乏しく、攻撃者を真似して工業制御機械学習検出アルゴリズムに対する敵対的サンプルを能動的に生成することは、非常に有意義である。したがって、工業制御システムの安全を保障し、事故の発生を防止するために、工業制御侵入検出システムに対して敵対的機械学習研究を行い、検出器を迂回して隠蔽的な攻撃を完了できる敵対的サンプルを自発的に生成する必要がある。

本発明の目的は、現在の工業制御システムの安全性の欠如及び不足に対して、敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法を提供することにある。
本発明の目的は、以下の技術案により実現される。敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法であって、以下のステップを含む。
（１）敵対的サンプルジェネレータは、工業制御システム通信データをスニッフィングし、工業制御侵入検出システムに用いられるトレーニングデータと同じ分布の通信データを取得し、通信データに種別ラベルをマーキングし、種別は、異常と正常を含み、ここで、異常通信データは、元の攻撃サンプルとする。工業制御侵入検出システムは、既存の機械学習方法に基づく工業制御侵入検出システムである。
（２）工業制御システム通信データに対してプロトコル解析作業を行い、その中の、通信データの送信元ＩＰアドレス(ＳＩＰ)、送信元ポート番号(ＳＰ)、宛先ＩＰアドレス(ＤＩＰ)、宛先ポート番号(ＤＰ)、パケット間隔時間(Ｔｉｍｅｄｅｌｔａ)、パケット送信時間(Ｔｉｍｅ)、パケット機能コード(Ｆｕｎｃｔｉｏｎｃｏｄｅ)などを含む有効な特徴を識別及び抽出する。
（３）ステップ（２）で抽出された有効な特徴から機械学習分類器を構築し、ラベル付きの工業制御システム通信データを用いて機械学習分類器をトレーニングし、トレーニングされた、正常又は異常通信データを識別するための分類器を得る。
（４）ステップ（３）で構築された分類器を用いて、工業制御侵入検出システムの敵対的学習問題を以下の最適化問題に変換し、最適化問題を解くことで最終的な敵対的サンプルが得られる。

ここで、

は、敵対的サンプル

が異常サンプルであると判定される可能性であり、分類器により計算して得られるものであり、

は、敵対的サンプルと元の攻撃サンプルとの距離であり、

は、工業制御システムが許容する最大ユークリッド距離を示し、即ち、当該距離を超えると、敵対的サンプルが悪意効果を有しないものとする。
(５)ステップ（４)で生成された敵対的サンプルを実際の工業制御システムにおいてテストし、工業制御侵入検出システムを迂回して攻撃効果を維持すれば有効な敵対的サンプルとみなし、そうでなければ、当該敵対的サンプルを破棄する。

さらに、前記ステップ（１）では、敵対的サンプルジェネレータは、ブラックボックス攻撃者である必要があり、工業制御侵入検出システム（検出側）と全く同じデータを直接に取得することができない。

さらに、前記ステップ（２)では、異なる工業制御システム通信プロトコルについて、異なる有効な特徴を抽出可能であり、一般的に使用される工業制御システム通信プロトコルは、Ｍｏｄｂｕｓ、ＰＲＯＦＩＢＵＳ、ＤＮＰ３、ＢＡＣｎｅｔ、ＳｉｅｍｅｎｓＳ７などを含み、ここで各通信プロトコルは、対応するフォーマット及び応用シナリオを有し、具体的なシナリオに応じて、異なる通信プロトコルを解析して有効な特徴集合を得ることができる。

さらに、前記ステップ（３)では、敵対的サンプルジェネレータのトレーニングに用いられる分類器は、工業制御侵入検出システム、即ち検出側と異なる分類器であることが可能であり、敵対的サンプルジェネレータが生成する分類器は、敵対的学習のローカル代替モデルと呼ぶことが可能であり、その原理は、敵対的学習攻撃の遷移可能性である。

さらに、前記ステップ（４)では、具体的な最適化問題の解き方は、勾配降下法、ニュートン法、ＣＯＢＹＬＡ（ｆｏｒＣｏｎｓｔｒａｉｎｅｄＯｐｔｉｍｉｚａｔｉｏｎＢＹＬｉｎｅａｒＡｐｐｒｏｘｉｍａｔｉｏｎｓ)方法などを含む。

さらに、前記ステップ（４)では、距離の表現方法は、１-ノルム距離、２-ノルム距離、及び無限ノルム距離を含む。

さらに、前記ステップ（４)では、機械学習分類器は、ニューラルネットワークを採用し、その確率計算方法は以下の通りである：

ここで、

は、予測確率であり、

は、サンプル

の

個目の特徴であり、

は、サンプル

に対応するラベル

であり、

は、ニューラルネットワークパラメータであり、

は、ラベル

に対応するニューラルネットワークパラメータであり、

はラベルの総数であり、
工業制御侵入検出システムの敵対的学習問題を以下の最適化問題に変換する。

さらに、前記ステップ（４)では、特定の制御シナリオについて、変数に対する特別な制約を最適化問題に追加する必要があり、例えば、あるシナリオのパケット機能コードが特定されたものであると、敵対的サンプルは、その次元で変更できない。すなわち、当該方法が応用される際に、生成された敵対的サンプルが悪意ある攻撃効果を効果的に完了することを保証するために、ジェネレータは、特定のシナリオに応じて特定の次元の変数に対して最適化問題を設計するときに異なる制約条件を追加する必要がある。

本発明の有益な効果は、以下の通りである。
敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法によれば、工業制御システムの安全性を向上させることができる。従来の敵対的学習研究の分野を機械視覚、音声等から工業制御の分野に拡張することによって、機械学習に基づく工業制御侵入検出システム安全性能を向上させ、悪意あるサンプルによる攻撃を防止することが可能となる。

本発明に係る方法が実現されるブロック図である。本発明に係る方法のシミュレーション結果図である。

本発明は、図面および特定の実施形態を参照して、以下でさらに詳細に説明する。

本発明に提供される敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法は、図１に示されるように、以下のステップを含む。

（１）敵対的サンプルジェネレータは、工業制御システム通信データをスニッフィングし、工業制御侵入検出システムに用いられるトレーニングデータと同じ分布の通信データを取得し、通信データに種別ラベルをマーキングし、種別は、異常と正常とを含み、ここで、異常通信データは、元の攻撃サンプルとする。工業制御侵入検出システムは、既存の機械学習方法に基づく工業制御侵入検出システムである。

ここで、敵対的サンプルジェネレータは、ブラックボックス攻撃者である必要があり、工業制御侵入検出システム（検出側）と全く同じデータを直接に取得することができない。

（２）工業制御システム通信データに対してプロトコル解析作業を行い、その中の、通信データの送信元ＩＰアドレス(ＳＩＰ)、送信元ポート番号(ＳＰ)、宛先ＩＰアドレス(ＤＩＰ)、宛先ポート番号(ＤＰ)、パケット間隔時間(Ｔｉｍｅｄｅｌｔａ)、パケット送信時間(Ｔｉｍｅ)、パケット機能コード(Ｆｕｎｃｔｉｏｎｃｏｄｅ)などを含む有効な特徴を識別及び抽出する。

異なる工業制御システム通信プロトコルについて、異なる有効な特徴を抽出可能である。一般的に使用される工業制御システム通信プロトコルは、Ｍｏｄｂｕｓ、ＰＲＯＦＩＢＵＳ、ＤＮＰ３、ＢＡＣｎｅｔ、ＳｉｅｍｅｎｓＳ７などを含む。ここで各通信プロトコルは、対応するフォーマット及び応用シナリオを有し、具体的なシナリオに応じて、異なる通信プロトコルを解析して有効な特徴集合を得ることができる。

（３）ステップ（２)で抽出された有効な特徴から機械学習分類器を構築し、ラベル付きの工業制御システム通信データを用いて機械学習分類器をトレーニングし、トレーニングされた、正常又は異常通信データを識別するための分類器が得られる。

敵対的サンプルジェネレータのトレーニングに用いられる分類器は、工業制御侵入検出システム、即ち検出側と異なる分類器であることが可能であり、敵対的サンプルジェネレータが生成する分類器は、敵対的学習のローカル代替モデルと呼ぶことが可能であり、その原理は、敵対的学習攻撃の遷移可能性である。

（４）ステップ（３)で構築された分類器を用いて、工業制御侵入検出システムの敵対的学習問題を以下の最適化問題に変換し、最適化問題を解くことで最終的な敵対的サンプルが得られる。

ここで、

は、敵対的サンプル

は、敵対的サンプルと元の攻撃サンプルとの距離であり、

は、工業制御システムが許容する最大ユークリッド距離を示し、即ち、当該距離を超えると、敵対的サンプルが悪意効果を有しないとする。

具体的な最適化問題の解き方は、勾配降下法、ニュートン法、ＣＯＢＹＬＡ（ｆｏｒＣｏｎｓｔｒａｉｎｅｄＯｐｔｉｍｉｚａｔｉｏｎＢＹＬｉｎｅａｒＡｐｐｒｏｘｉｍａｔｉｏｎｓ)方法などを含むことができる。距離の表現方法は、１-ノルム距離、２-ノルム距離、及び無限ノルム距離を採用することができる。

特定の制御シナリオについて、変数に対する特別な制約を最適化問題に追加する必要があり、例えば、あるシナリオのパケット機能コードが特定されたものであると、敵対的サンプルは、その次元で変更できない。すなわち、当該方法が応用される際に、生成された敵対的サンプルが悪意ある攻撃効果を効果的に完了することを保証するために、ジェネレータは、特定のシナリオに応じて特定の次元の変数に対して最適化問題を設計するときに異なる制約条件を追加する必要がある。

機械学習分類器は、ニューラルネットワークを採用し、その確率計算方法は以下の通りである。

ここで、

は、予測確率であり、

は、サンプル

の

個目の特徴であり、

は、サンプル

の対応するラベル

であり、

は、ニューラルネットワークパラメータであり、

は、ラベル

の対応するニューラルネットワークパラメータであり、

はラベルの総数である。
このとき、工業制御侵入検出システムの敵対的学習問題を以下の最適化問題に変換する。

（５）ステップ（４)で生成された敵対的サンプルを実際の工業制御システムにおいてテストし、工業制御侵入検出システムを迂回して攻撃効果を維持すれば有効な敵対的サンプルとみなし、そうでなければ、当該敵対的サンプルを破棄する。

以下、１つの具体的な応用シナリオを例にして、工業制御侵入検出システム敵対的サンプルを生成する過程は、以下の通りである。

１．スニッフィングして、既存の機械学習アルゴリズムに基づく工業制御システム侵入検出器に用いられる通信データを得る。
初期攻撃サンプルは、注入攻撃と、機能コード攻撃と、盗聴攻撃とを含む。

２．例えばシーメンスＳ７ｃｏｍｍプロトコルなどのプロトコル解析を行い、送信元ＩＰ、宛先ＩＰ、ポート番号、機能コード、サブ機能コード、パケット間隔時間などの特徴を得る。

３．多層パーセプトロンを使用して基本的なニューラルネットワークアルゴリズムを生成するなど、替代分類器をローカルで生成する。

４．当該ニューラルネットワークに基づいて最適化問題を解くように設計して、例えば、機能コードの固定選択値などの具体的な応用シナリオの使用制約を追加し、その他のネットワーク特徴が離散正整数値などである。

ＣＯＢＹＬＡ方法を用いて計算して敵対的サンプルが得られ、工業制御システムの安全テストプラットフォームにおいてその敵対的効果をテストし、３種の攻撃サンプルの攻撃成功率は、図２に示されるとおりである。図２からわかるように、本発明に係る方法は、盗聴攻撃に対する攻撃成功率は１００％に達し、機能コード攻撃に対する攻撃成功率は８０％に達し、注入攻撃では、実際の攻撃が複雑であるため、元の攻撃サンプルと敵対的サンプルへの変換が完了し難しいが、その攻撃成功率は依然として２０％に達することができる。

上述した実施例は、本発明を説明するためのものであり、本発明を限定するものではなく、本発明の趣旨および特許請求の範囲内において、本発明に加えられるあらゆる改変や変更は、本発明の保護範囲に含まれる。

Claims

敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法であって、
ステップ(１)であって、敵対的サンプルジェネレータは、工業制御システムの通信データをスニッフィングし、工業制御侵入検出システムに用いられるトレーニングデータと同じ分布の通信データを取得し、通信データに種別ラベルをマーキングし、そのうちの異常通信データを元の攻撃サンプルとするステップと、
ステップ(２)であって、工業制御システム通信データに対してプロトコル解析作業を行い、その中の、通信データの送信元ＩＰアドレス(ＳＩＰ)、送信元ポート番号(ＳＰ)、宛先ＩＰアドレス(ＤＩＰ)、宛先ポート番号(ＤＰ)、パケット間隔時間(Ｔｉｍｅｄｅｌｔａ)、パケット送信時間(Ｔｉｍｅ)、パケット機能コード(Ｆｕｎｃｔｉｏｎｃｏｄｅ)を含む有効な特徴を識別して抽出するステップと、
ステップ(３)であって、ステップ（２)で抽出された有効な特徴に基づいて機械学習分類器を構築し、ラベル付きの工業制御システム通信データを用いて機械学習分類器をトレーニングし、トレーニングされた、正常又は異常通信データを識別するための分類器を得るステップと、
ステップ(４)であって、ステップ（３)で構築された分類器を用いて、工業制御侵入検出システムの敵対的学習問題を以下の最適化問題に変換し、最適化問題を解いて最終的な敵対的サンプルが得られ、

ここで、

は、敵対的サンプル

が異常サンプルであると判定される可能性であり、分類器により計算されて得られるものであり、

は、敵対的サンプルと元の攻撃サンプルとの距離であり、

は、工業制御システムが許容する最大ユークリッド距離を示し、即ち、当該距離を超えると、敵対的サンプルが悪意効果を有しないものとするステップと、
ステップ(５)であって、ステップ（４)で生成された敵対的サンプルを実際の工業制御システムにおいてテストし、工業制御侵入検出システムを迂回して攻撃効果を維持すれば有効な敵対的サンプルとみなし、そうでなければ、当該敵対的サンプルを破棄するステップと、を含む、
ことを特徴とする敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法。
前記ステップ（１)では、敵対的サンプルジェネレータは、ブラックボックス攻撃者である必要があり、工業制御侵入検出システム（検出側）と全く同じデータを直接に取得することができない、
ことを特徴とする請求項１に記載の敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法。
前記ステップ（２)では、異なる工業制御システム通信プロトコルについて、異なる有効な特徴を抽出可能であり、一般的に使用される工業制御システム通信プロトコルは、Ｍｏｄｂｕｓ、ＰＲＯＦＩＢＵＳ、ＤＮＰ３、ＢＡＣｎｅｔ、ＳｉｅｍｅｎｓＳ７などを含み、
ここで、各通信プロトコルは、対応するフォーマット及び応用シナリオを有し、具体的なシナリオに従って、異なる通信プロトコルを解析し、有効な特徴集合を得ることができる
ことを特徴とする請求項１に記載の敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法。
前記ステップ（３)では、敵対的サンプルジェネレータのトレーニングに用いられる分類器は、工業制御侵入検出システムとは異なる分類器であることが可能であり、敵対的サンプルジェネレータによって生成される分類器は、敵対的学習のローカル代替モデルと呼ぶことが可能であり、その原理は、敵対的学習攻撃の遷移可能性である、
ことを特徴とする請求項１に記載の敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法。
前記ステップ（４)では、具体的な最適化問題の解き方は、勾配降下法、ニュートン法、ＣＯＢＹＬＡ（ｆｏｒＣｏｎｓｔｒａｉｎｅｄＯｐｔｉｍｉｚａｔｉｏｎＢＹＬｉｎｅａｒＡｐｐｒｏｘｉｍａｔｉｏｎｓ)方法などを含む、
ことを特徴とする請求項１に記載の敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法。
前記ステップ（４)では、距離の表現方法は、１-ノルム距離と、２-ノルム距離と、無限ノルム距離とを含む、
ことを特徴とする請求項１に記載の敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法。
前記ステップ（４)では、機械学習分類器は、ニューラルネットワークを採用し、その確率計算方法は、以下の通りであり、

ここで、

は、予測確率であり、

は、サンプル

の

個目の特徴であり、

は、サンプル

に対応するラベル

であり、

は、ニューラルネットワークパラメータであり、

は、ラベル

に対応するニューラルネットワークパラメータであり、

はラベルの総数であり、
工業制御侵入検出システムの敵対的学習問題を以下の最適化問題に変換する

ことを特徴とする請求項１に記載の敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法
前記ステップ（４)では、特定の制御シナリオについて、変数に対する特別な制約を最適化問題に追加する必要があり、即ち、当該方法が応用される際に、生成された敵対的サンプルが悪意ある攻撃効果を効果的に完了することを保証するために、ジェネレータは、特定のシナリオに応じて特定の次元の変数に対して最適化問題を設計するときに異なる制約条件を追加する必要がある、
ことを特徴とする請求項１に記載の敵対的学習に基づく工業制御システムの悪意あるサンプルの生成方法。