JP7473246B2

JP7473246B2 - 攻撃情報処理装置、攻撃情報処理方法及び攻撃情報処理プログラム

Info

Publication number: JP7473246B2
Application number: JP2022541900A
Authority: JP
Inventors: 真樹井ノ口; 智彦柳生; アサフシャブタイ; ユバルエロビッチ; ロンビットン; ホダヤビンヤミニ
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2020-01-17
Filing date: 2020-01-17
Publication date: 2024-04-23
Anticipated expiration: 2040-01-17
Also published as: US20230040982A1; JP2023509748A; WO2021144954A1

Description

本開示は、攻撃情報処理装置、攻撃情報処理方法及び攻撃情報処理プログラムを格納する非一時的なコンピュータ可読媒体に関する。

近年、コンピュータシステムの脆弱性を攻撃するサイバー攻撃が著しく増加しているため、サイバーセキュリティへの脅威が高まっている。そのため、毎年、さらには、毎日、新たに発見される脆弱性に関連する攻撃情報に対応することが望まれている。

例えば、関連する技術として、非特許文献１が知られている。非特許文献１は、脆弱性情報データベースであるＮＶＤ（National Vulnerability Database）から抽出された情報に基づいて攻撃グラフを生成する技術を開示している。非特許文献１では、キーワードマッチングおよび／または機械学習を用いて、ＮＶＤから攻撃条件が抽出されている。

M.Ugur Aksu, Kemal Bicakci, M.Hadi Dilek, A.Murat Ozbayoglu, and E.Islam Tatli, "Automated Generation of Attack Graphs Using NVD", The Eighth ACM Conference on Data and Application Security and Privacy (CODASPY '18), 2018, P.135-142

非特許文献１に開示された技術などの関連する技術では、キーワードマッチングおよび／または機械学習を用いて、一般に公開されている攻撃情報から攻撃条件が抽出される。しかしながら、関連する技術で抽出するように情報を抽出した場合、攻撃条件を含む攻撃ナレッジを得ることが困難な場合があるという問題がある。

本開示の一つの目的は、このような課題に鑑み、より正確な攻撃ナレッジを得ることが可能な攻撃情報処理装置、攻撃情報処理方法及び攻撃情報処理プログラムを格納する非一時的なコンピュータ可読媒体を提供することである。

本開示に係る攻撃情報処理装置は、サイバー攻撃の記述を含む第１及び第２の攻撃情報から、前記サイバー攻撃の条件を示す第１及び第２の攻撃ナレッジを抽出する抽出部と、前記第１及び第２の攻撃情報の類似性を判断する判断部と、前記判断された類似性に基づいて、前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完する補完部と、を備える。

本開示に係る攻撃情報処理装置は、サイバー攻撃の記述を含む複数の攻撃情報から、前記サイバー攻撃の条件を示す複数の攻撃ナレッジを抽出する抽出手段と、前記複数の攻撃情報と前記複数の攻撃ナレッジとの関係を学習した学習モデルを生成する学習手段と、前記学習モデルを用いて、入力された攻撃情報から抽出される攻撃ナレッジを、前記入力された攻撃情報に類似する攻撃情報に基づいて、補完する補完手段と、を備える。

本開示に係る攻撃情報処理方法は、サイバー攻撃の記述を含む第１及び第２の攻撃情報から、前記サイバー攻撃の条件を示す第１及び第２の攻撃ナレッジを抽出し、前記第１及び第２の攻撃情報の類似性を判断し、前記判断された類似性に基づいて、前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完することを含む。

本開示に係る攻撃情報処理プログラムが格納された非一時的なコンピュータ可読媒体は、サイバー攻撃の記述を含む第１及び第２の攻撃情報から、前記サイバー攻撃の条件を示す第１及び第２の攻撃ナレッジを抽出し、前記第１及び第２の攻撃情報の類似性を判断し、前記判断された類似性に基づいて、前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完する処理をコンピュータに実行させるための攻撃情報処理プログラムが格納された非一時的なコンピュータ可読媒体である。

本開示によれば、より正確な攻撃ナレッジを得ることが可能な攻撃情報処理装置、攻撃情報処理方法及び攻撃情報処理プログラムを格納する非一時的なコンピュータ可読媒体を提供することができる。

図１は、実施の形態で使用される攻撃情報の例を示している。図２は、関連する攻撃ナレッジ生成方法を示している。図３は、実施の形態に係る攻撃情報処理装置の概要を示す構成図である。図４は、実施の形態に係る攻撃ナレッジ生成方法の概要を示している。図５は、実施の形態１に係る攻撃情報処理システムの構成例を示す構成図である。図６は、実施の形態１に係る情報抽出部の構成例を示す構成図である。図７は、実施の形態１に係る類似性判断部の構成例を示す構成図である。図８は、実施の形態１に係る攻撃情報処理システムによって実行される動作例を示すフローチャートである。図９は、実施の形態１に係る情報抽出処理の例を示すフローチャートである。図１０は、実施の形態１に係る類似性判断処理の例を示すフローチャートである。図１１は、実施の形態１に係る情報補完処理の例を示すフローチャートである。図１２は、実施の形態１に係る攻撃ナレッジ生成規則の具体例を示している。図１３は、実施の形態１に係る類似性判断基準の具体例を示している。図１４は、実施の形態１に係る情報補完処理の具体例を示している。図１５は、実施の形態１に係る情報補完処理の具体例を示している。図１６は、実施の形態２に係る攻撃情報処理システムの構成例を示す構成図である。図１７は、実施の形態２に係る攻撃情報処理システムによって実行される動作例を示している。図１８は、実施の形態３に係る攻撃情報処理システムの構成例を示す構成図である。図１９は、実施の形態３に係る攻撃情報処理システムによって実行される動作例を示している。図２０は、実施の形態４係る攻撃情報処理システムの構成例を示す構成図である。図２１は、実施の形態４に係る攻撃情報処理システムによって実行される動作例を示している。図２２は、実施の形態に係るコンピュータのハードウェア構成の概要を示す構成図である。

以下、図面を参照して本開示に係る実施の形態を説明する。各図面において、同一の要素には同一の符号が付されており、必要に応じて重複説明は省略される。

（実施の形態に至る検討）
まず、実施の形態で使用される攻撃情報について説明する。攻撃情報の代表的な例は、脆弱性情報である。脆弱性情報は、例えば、ＣＶＥ（Common Vulnerabilities and Exposures）である。ＣＶＥには、ＣＶＥ－ＩＤが割り当てられ、ＣＶＥ－ＩＤごとにＮＶＤなどのインターネット上の脆弱性情報データベースで公開されている。

図１は、脆弱性情報データベースで公開されている攻撃情報（脆弱性情報）の具体例を示している。図１に示すように、攻撃情報には、それぞれの攻撃情報に割り当てられた“ＣＶＥ－ＩＤ”、それぞれの攻撃情報について記述された“Ｄｅｓｃｒｉｐｔｉｏｎ”、それぞれの攻撃情報の参考情報を示す“Ｒｅｆｅｒｅｎｃｅｓ”等が含まれる。このように、攻撃情報の具体的な内容は、“Ｄｅｓｃｒｉｐｔｉｏｎ”に自然言語で記述されており、構造化されていない。このため、攻撃情報を処理しない限り、攻撃情報をコンピュータシステムに取り込んでセキュリティ対策等に利用することができない。

そこで、発明者らは、自然言語で記述された攻撃情報から、コンピュータシステムで使用可能な攻撃ナレッジを生成する方法を検討した。攻撃ナレッジとは、攻撃の条件を示す情報であり、攻撃の前提条件、すなわち攻撃の事前条件と、攻撃結果、すなわち攻撃の事後条件とを含む情報である。

関連する技術では、キーワードマッチングおよび／または機械学習を用いることで、攻撃情報から攻撃ナレッジが生成される。しかしながら、図１に示すように、一般に公開されている攻撃情報（情報源）は、詳細に記述されていないことが多い。そのため、発明者らは、関連する技術では、図２に示すように、一般に公開されている攻撃情報から攻撃ナレッジを単純に抽出すると、正確な攻撃ナレッジを得ることができないという課題を見出した。例えば、図２の例では、攻撃情報に“Ｓｏｆｔｗａｒｅ”と“Ｃｏｎｆｉｇ”という用語が含まれるため、攻撃ナレッジとして、正しい条件“Ｓｏｆｔｗａｒｅ”と“Ｃｏｎｆｉｇ”を得ることができる。しかし、“ＯｐｅｎＰｏｒｔ”と“Ｌｉｂｒａｒｙ”という用語が攻撃情報に含まれていないため、正しい条件を得ることができない。

そこで、以下に示す実施の形態では、攻撃情報が詳細に記述されていない場合でも、より正確な攻撃ナレッジを得ることを可能とする。

（実施の形態の概要）
図３は、実施の形態に係る攻撃情報処理装置１０の概要を示している。図３に示すように、攻撃情報処理装置１０は、抽出部１１、判断部１２、補完部１３を備える。

抽出部１１は、サイバー攻撃の記述を含む第１及び第２の攻撃情報から、サイバー攻撃の条件を示す第１及び第２の攻撃ナレッジを抽出する。例えば、第１の攻撃情報は分析対象の攻撃情報（新しい攻撃情報）であり、第２の攻撃情報は所定の攻撃情報（可能な限りすべての既知の攻撃情報）に含まれる。判断部１２は、第１及び第２の攻撃情報の類似性を判断する。補完部１３は、判断部１２により判断された類似性に基づいて、第１及び第２の攻撃ナレッジの一方を、他方の攻撃ナレッジで補完する。

このように、実施の形態では、攻撃ナレッジは、複数の攻撃情報から抽出され、抽出された攻撃ナレッジは、複数の攻撃情報の類似性に基づいて補完される。例えば、図４に示すように、第１の攻撃情報と第２の攻撃情報は互いに類似しており、第１の攻撃情報に“Ｐｏｒｔ”と“Ｌｉｂｒａｒｙ”という用語が含まれ、第２の攻撃情報に“Ｐｏｒｔ”と“Ｌｉｂｒａｒｙ”という用語が含まれないとする。この場合、第２の攻撃ナレッジは、第１の攻撃ナレッジで得られた（第１の攻撃情報から取得された）条件“ＯｐｅｎＰｏｒｔ”と“Ｌｉｂｒａｒｙ”により補完される。このように、複数の攻撃情報（情報源）を組み合わせることにより、欠けている情報を補完する（すなわち埋める）ことができ、より正確な攻撃ナレッジを得ることができる。

（実施の形態１）
以下、図面を参照して実施の形態１を説明する。図５は、本実施の形態に係る攻撃情報処理システム１の構成例を示している。本実施の形態に係る攻撃情報処理システム１は、公開されている複数の攻撃情報から複数の攻撃ナレッジを生成するシステムである。

図５に示すように、攻撃情報処理システム（または攻撃情報処理装置）１は、攻撃ナレッジ生成装置１００、攻撃情報ＤＢ（データベース）２００、および攻撃ナレッジＤＢ３００を備えている。攻撃情報ＤＢ２００と攻撃ナレッジＤＢ３００は、攻撃ナレッジ生成装置１００にインターネット等のネットワークを介して接続されていてもよいし、攻撃ナレッジ生成装置１００に直接接続されていてもよい。あるいは、攻撃ナレッジ生成装置１００、攻撃情報ＤＢ２００、攻撃ナレッジＤＢ３００を含む装置を使用してもよい。

攻撃情報ＤＢ２００は、脆弱性情報など、一般に公開されている攻撃情報を記憶するデータベースである。攻撃情報ＤＢ２００は、ＣＶＥやＮＶＤ、ＪＶＮ（Japan Vulnerability Notes）などのように公の組織によって公開されるデータベース、または、セキュリティベンダーやその他のベンダーによって公開されるデータベースである。また、攻撃情報ＤＢ２００は、複数の攻撃情報を公開していれば、データベースに限らず、例えばブログでもよい。

攻撃情報は、自然言語で記述された文章を含む攻撃関連情報である。例えば、攻撃情報は、図１で示したようなコンピュータシステムの脆弱性を記述した脆弱性情報である。攻撃情報は、脆弱性情報に限らず、サイバー攻撃に関連するその他の種類の情報でもよい。例えば、攻撃情報は、脆弱性があるとは認識されていないが、攻撃されるリスクのあるプロトコルの仕様等でもよい。

攻撃ナレッジＤＢ３００は、攻撃ナレッジ生成装置１００によって生成された攻撃ナレッジを記憶する記憶装置である。攻撃ナレッジは、攻撃情報ＤＢ２００に記憶された攻撃情報に対応しており、上記のように前提条件と攻撃結果を含んでいる。例えば、前提条件は、使用されているポート、使用されているソフトウェア・ライブラリ等である。さらに、攻撃結果は、コード実行、特権昇格、ファイルアクセス等である。

攻撃ナレッジ生成装置１００は、攻撃情報取得部１１０、情報抽出部１２０、類似性判断部１３０、補完情報生成部１４０、および記憶部１５０を備えている。なお、攻撃ナレッジ生成装置１００は、後述の動作が可能であれば、その他の構成でもよい。

攻撃情報取得部１１０は、攻撃情報ＤＢ２００から複数の攻撃情報を取得する。例えば、攻撃情報取得部１１０は、インターネットを介して、ＮＶＤなどのデータベースにアクセスし、データベースに登録されている攻撃情報を取得する。

情報抽出部１２０は、攻撃情報取得部１１０によって取得された攻撃情報に基づいて攻撃ナレッジを生成する。情報抽出部１２０は、攻撃情報から、自然言語で記述された文章を含む情報を抽出し、それにより、あらかじめ決められた形式で攻撃ナレッジを生成する。情報抽出部１２０は、生成された攻撃ナレッジを攻撃ナレッジＤＢ３００に格納する。

類似性判断部１３０は、複数の攻撃情報の類似性を判断する。類似性判断部１３０は、攻撃情報取得部１１０によって取得された攻撃情報を用いて類似性を判断してもよいし、情報抽出部１２０によって抽出された情報を用いて類似性を判断してもよい。類似性判断部１３０は、一つの判断基準に基づいて類似性を判断してもよいし、複数の判断基準を組み合わせることによって類似性を判断してもよい。

補完情報生成部１４０は、類似する攻撃情報の攻撃ナレッジに基づいて、攻撃ナレッジを補完する。補完情報生成部１４０は、複数の攻撃情報が類似すると判断された場合、類似する攻撃情報の攻撃ナレッジの情報を用いることによって（すなわち、他の攻撃情報の攻撃ナレッジを用いることによって）、それぞれの攻撃ナレッジを補完する。補完情報生成部１４０は、攻撃ナレッジＤＢ３００に格納されている攻撃ナレッジを類似性（類似度）にしたがって、補完し更新する。

記憶部１５０は、攻撃ナレッジ生成装置１００によって実行される動作（処理）に必要な情報を記憶する。例えば、記憶部１５０は、フラッシュメモリなどの不揮発性メモリやハードディスク装置等でもよい。例えば、記憶部１５０は、取得した攻撃情報や、情報抽出の処理に必要な学習モデル等を記憶する。なお、必要に応じて学習モデル等を外部から取得してもよい。

図６は、情報抽出部１２０の構成例を示している。図６に示すように、例えば、情報抽出部１２０は、表現（Representation）部１２１、抽出（Extraction）部１２２、および導出（Derivation）部１２３を備えている。表現部１２１は、入力される攻撃情報に含まれる各単語の分散表現ベクトルを取得する分散表現ベクトル生成部である。抽出部１２２は、分散表現ベクトルの系列に変換された攻撃情報における各単語にラベルを付けるラベル付与部である。導出部１２３は、付与されたラベルに基づいて、あらかじめ決められた規則に従って攻撃ナレッジを生成する攻撃ナレッジ生成部である。

図７は、類似性判断部１３０の構成例を示している。図７に示すように、例えば、類似性判断部１３０は、特定部１３１、判断部１３２を備えている。特定部１３１は、類似性を判断するための判断基準を特定する。判断部１３２は、特定された判断基準にしたがって、複数の攻撃情報の類似性（類似度）を判断する。

次に、本実施の形態に係る攻撃情報処理システム１によって実行される動作について説明する。図８は、本実施の形態に係る攻撃情報処理システム１において、攻撃情報の取得から、補完された攻撃ナレッジの生成までの流れを示している。図９は、図８に示される情報抽出処理（Ｓ１０２）の流れを示し、図１０は、図８に示される類似性判断処理（Ｓ１０３）の流れを示している。また、図１１は、図８に示される情報補完処理（Ｓ１０５）の流れを示している。

図８に示すように、まず、攻撃ナレッジ生成装置１００は、攻撃情報を取得し（Ｓ１０１）、取得した攻撃情報から情報を抽出する（Ｓ１０２）。攻撃情報取得部１１０が、攻撃情報ＤＢ２００から複数の攻撃情報を取得すると、情報抽出部１２０は、取得された複数の攻撃情報から情報を抽出し、抽出した情報から複数の攻撃ナレッジを生成する。

情報抽出処理（Ｓ１０２）では、図９に示すように、表現部１２１は、データ表現（Data Representation）処理を行う（Ｓ１１１）。表現部１２１は、取得された攻撃情報に含まれる文章を単語（形態素）に分割し、分割した各単語の分散表現ベクトルを取得する。分散表現ベクトルは、Word2Vec（skip-gram, CBoW（Countinuous Bag-of-Words））などの分散表現ツールを使用することにより取得できる。なお、一つの分散表現ベクトルを取得する単位（形態素）は一つの単語でもよいし、複数の単語から構成されてもよい。例えば、“Denial of service（サービスの拒否）”など複数の単語からなる一般的に使用されるフレーズを一つの単語とみなして、そのようなフレーズから一つの分散表現ベクトルを取得してもよい。表現部１２１は、例えば、事前に複数の攻撃情報における分散表現を学習した学習モデルを生成し、生成された学習モデルを記憶部１５０に格納する。そして、表現部１２１は、格納された分散表現学習モデルを使用することにより、入力される攻撃情報における分散表現ベクトルを取得する。

次に、抽出部１２２は、エンティティ抽出（Entity Extraction）処理を行う（Ｓ１１２）。抽出部１２２は、分散表現ベクトルが取得された攻撃情報における各単語に対し、攻撃ナレッジに関連するラベルを付与する。ラベルは、攻撃ナレッジの条件に対応している。例えば、ラベルは、ソフトウェア、バージョン、ＯＳ、プロトコル、ポート、攻撃手段、攻撃結果、攻撃ベクトル、認証、権限、セキュリティ機構等に対応する。なお、一つの単語に複数のラベルを付与してもよい。抽出部１２２は、例えば、事前に単語のラベルを示す教師データを学習した学習モデルを生成し、学習モデルを記憶部１５０に格納する。そして、抽出部１２２は、格納されたラベル学習モデルを使用することにより、分散表現ベクトルが取得された単語にラベルを付与する。

次に、導出部１２３は、インサイト導出（Insights Derivation）処理を行う（Ｓ１１３）。導出部１２３は、付与されたラベルに基づいて、ラベルを攻撃ナレッジの条件に関連付ける規則に従って攻撃ナレッジを生成する。図１２は、ラベルから攻撃ナレッジを生成するための規則の例を示している。図１２に示すような変換規則をあらかじめ記憶部１５０に記憶しておき、記憶された変換規則を用いて攻撃ナレッジが生成される。図１２に示すように、例えば、変換規則では、各ラベルに、攻撃ナレッジの条件のタイプと条件の詳細が関連付けられている。条件のタイプは、前提条件（pre-condition）または攻撃結果（post-condition）を示す。

規則１は、単語のラベルが“ソフトウェア”である場合の規則の例である。規則１にしたがうと、例えば、導出部１２３は、単語“ブラウザＡ”にラベル“ソフトウェア”が付与されている場合、条件｛pre-condition,“ブラウザＡ”がインストールされている｝を攻撃ナレッジに組み込む。

規則２は、単語のラベルが“ポート”である場合の規則の例である。規則２にしたがうと、例えば、導出部１２３は、単語“ポート１２０”にラベル“ポート”が付与されている場合、条件{pre-condition,“ポート１２０”が開いている}を攻撃ナレッジに組み込む。

規則３は、単語のラベルが“攻撃結果”である場合の規則の例である。規則３にしたがうと、例えば、導出部１２３は、単語“コード実行”にラベル“攻撃結果”が付与されている場合、攻撃ナレッジに条件{post-condition,“コード実行”が可能となる}を攻撃ナレッジに組み込む。

次に、攻撃ナレッジ生成装置１００は、攻撃情報の類似性を判断する（Ｓ１０３）。上記のように、情報抽出部１２０が、攻撃情報に基づいて攻撃ナレッジを生成すると、類似性判断部１３０は、攻撃情報を補完可能か否か判断するため、攻撃情報の類似性を判断する。なお、類似性は、攻撃情報に基づいて判断してもよいし、情報抽出処理によって得られた情報に基づいて判断してもよいため、類似性判断処理は、情報抽出処理の後に行ってもよいし、情報抽出処理と同時に行ってもよい。

類似性判断処理（Ｓ１０３）では、図１０に示すように、特定部１３１は、類似性を判断するための判断基準を特定し（Ｓ１２１）、判断部１３２は、その特定された判断基準にしたがって、複数の攻撃情報の類似性を判断する。なお、類似性判断処理では、複数の攻撃情報が互いに類似しているか否かを判断してもよいし、複数の攻撃情報の類似度を判断してもよい。

図１３は、複数の攻撃情報の類似性を判断するための判断基準の例を示している。図１３に示すような判断基準をあらかじめ記憶部１５０に記憶しておき、記憶された判断基準を用いて類似性を判断する。例えば、特定部１３１は、図１３に示すような判断要素と判断条件を含む判断基準のうち少なくとも一つを選択する。さらに、判断部１３２は、選択された判断基準に従って類似性を判断する。複数の判断基準は、判断処理のためにＡＮＤ条件を使用して組み合わせてもよいし、判断処理のためにＯＲ条件を使用して組み合わせてもよい。

基準１は、攻撃情報の対象コンポーネントが類似性を判断するための要素として使用される判断基準の例である。コンポーネントの情報は、攻撃情報に含まれる情報から直接取得してもよいし、情報抽出部１２０によって抽出された情報（ラベル付けされた単語や生成された攻撃ナレッジ）から取得してもよい。例えば、コンポーネントは、ソフトウェア、ミドルウェア、ハードウェア等でもよい。なお、コンポーネントは、判断要素の単位の一例である。すなわち、判断要素の単位は、コンポーネントに限らず、モジュール、ライブラリ等でもよい。基準１にしたがうと、例えば、判断部１３２は、複数の攻撃情報から得られる脆弱性のあるコンポーネントが互いに同一であれば、複数の攻撃情報が互いに類似すると判断する。なお、コンポーネントは互いに同一である必要はない。すなわち、判断部１３２は、コンポーネントが互いに関連している場合に、攻撃情報が互いに類似すると判断してもよい。

基準２は、情報抽出部１２０から出力された攻撃ナレッジが類似性を判断するための要素として使用される判断基準の例である。判断部１３２は、攻撃ナレッジの一つに含まれる前提条件及び攻撃結果が、他の攻撃ナレッジに含まれるものと同一であるか否かを判断する。基準２にしたがうと、例えば、判断部１３２は、情報抽出部１２０によって生成された複数の攻撃ナレッジに含まれる全ての前提条件及び攻撃結果の数に対し、同じ前提条件及び攻撃結果の数の割合が所定の閾値以上の場合、複数の攻撃情報は互いに類似すると判断する。

基準３は、攻撃情報に含まれる文章の類似度を判断要素として使用する判断基準の例である。すなわち、攻撃情報の“Ｄｅｓｃｒｉｐｔｉｏｎ”の記述に基づいて類似性を判断する。例えば、攻撃情報の文章に含まれる特定の単語の出現頻度や出現順序、その統計情報などの特徴量を類似度として使用する。そして、類似度と所定の閾値との比較結果に基づいて類似性を判断する。基準３にしたがうと、例えば、判断部１３２は、複数の攻撃情報の“Ｄｅｓｃｒｉｐｔｉｏｎ”に記述された文章の特徴量を算出する。そして、判断部１３２は、算出された類似度が所定の閾値以上である場合、複数の攻撃情報は互いに類似すると判断する。

基準４は、攻撃情報における文章のクラスタリング結果を判断要素として使用する判断基準の例である。例えば、基準３と同様に、攻撃情報の文章に含まれる特定の単語の出現頻度や出現順序、その統計情報などを特徴量として使用する。そして、特徴量に基づいてクラスタリングを行う。このクラスタリングの結果を類似度として使用する。基準４にしたがうと、例えば、判断部１３２は、複数の攻撃情報の“Ｄｅｓｃｒｉｐｔｉｏｎ”に記述された文章の特徴量を算出し、算出された特徴量に基づいてクラスタリングを行う。そして、判断部１３２は、複数の攻撃情報が同じクラスタに分類された場合、複数の攻撃情報は互いに類似すると判断する。

基準５は、情報抽出部１２０によって抽出された攻撃情報における単語の分散表現ベクトルを判断要素として使用する判断基準の例である。単語の分散表現ベクトルが近い（または類似している）場合、単語が互いに類似していると考えられる。このため、分散表現ベクトルの差に基づいて類似性を判断する。基準５にしたがうと、例えば、判断部１３２は、情報抽出部１２０によりラベル付けされた複数の攻撃情報における文章中の要素（単語）ごとに、その要素の分散表現ベクトルの差を決定する。これらの要素の分散表現ベクトルの差の平均値または重み付き平均値を類似度として使用する。そして、判断部１３２は、この類似度が所定の閾値以下である場合、複数の攻撃情報は互いに類似すると判断する。

基準６は、対象の攻撃情報の文章中で参照されている、または対象の攻撃情報を参照している別の攻撃情報を判断要素として使用する判断基準の例である。すなわち、攻撃情報に含まれる参照情報に基づいて類似性を判断する。例えば、攻撃情報の文章から抽出される攻撃情報の識別子に基づいて類似性を判断する。例えば、攻撃情報がＣＶＥの場合、その識別子はＣＶＥ－ＩＤである。基準６にしたがうと、例えば、判断部１３２は、複数の攻撃情報の“Ｄｅｓｃｒｉｐｔｉｏｎ”内で参照されている識別子を取得する。そして、判断部１３２は、取得した識別子が互いに同じ場合、複数の攻撃情報は類似していると判断する。なお、攻撃情報で参照されている情報は、攻撃情報の“Ｄｅｓｃｒｉｐｔｉｏｎ”内で参照されている情報に限らず、攻撃情報の“Ｒｅｆｅｒｅｎｃｅｓ”内で参照されている情報でもよい。また、攻撃情報にＣＶＥ互換情報や脆弱性分類情報等がある場合、それらを参照してもよい。

基準７は、攻撃情報の識別子を判断要素とする判断基準の例である。すなわち、攻撃情報に含まれる、攻撃情報の識別情報に基づいて類似性を判断する。別の情報源が同じ攻撃情報について公開する場合がある。このため、攻撃情報の識別子に基づいて類似性を判断する。基準６と同様に、例えば、攻撃情報がＣＶＥの場合、識別子はＣＶＥ－ＩＤである。基準７にしたがうと、例えば、判断部１３２は、複数の攻撃情報の“ＣＶＥ－ＩＤ”に記述されたＣＶＥ－ＩＤを取得する。そして、判断部１３２は、ＣＶＥ－ＩＤが同じ場合、複数の攻撃情報は類似すると判断する。

次に、攻撃ナレッジ生成装置１００は、類似性があるか否か判断する（Ｓ１０４）。そして、複数の攻撃情報に類似性がある場合、攻撃ナレッジ生成装置１００は、攻撃ナレッジの情報を補完する（Ｓ１０５）。上記のように、類似性判断部１３０により複数の攻撃情報が互いに類似していると判断された場合、補完情報生成部１４０は、それらに含まれる情報を用いて、攻撃情報の前提条件及び攻撃結果を補完する。

なお、類似性の有無を判断した結果、類似性がある場合に情報を補完してもよいし、類似度に応じて情報を補完してもよい。例えば、所定の閾値よりも高い類似度を有する攻撃情報のみを用いることによって情報を補完してもよい。閾値を下げることによって、攻撃ナレッジの条件の数を増やすことができる。逆に、閾値を上げることによって、攻撃ナレッジの条件を絞り込むことができる。この閾値は、保護すべき資産および／またはそのリスクに応じて定義してもよい。

情報補完処理（Ｓ１０５）では、図１１に示すように、補完情報生成部１４０は、補完される情報の間に競合（Conflict）があるか否かを判断する（Ｓ１３１）。攻撃ナレッジに元から（オリジナルに）含まれていた条件とその攻撃ナレッジに追加する条件とが、攻撃の条件として互いに共存できない場合、競合が有ると判断する。すなわち、両方の条件が存在するためにＡＮＤ条件が成立しない場合、競合がある。例えば、コンポーネントがオペレーティングシステムＡであるという条件と、コンポーネントがオペレーティングシステムＢであるという条件は、同時に成立しないため、競合があると判断する。

補完する情報に競合がない場合、補完情報生成部１４０は、複数の攻撃ナレッジの情報を互いに補完する（Ｓ１３２）。例えば、図１４に示すように、攻撃情報ＡｉとＡｊが互いに類似すると判断された場合、補完情報生成部１４０は、攻撃情報Ａｉに含まれる一部の情報を使って攻撃ナレッジＡｊを補完し、攻撃情報Ａｊに含まれる一部の情報を使って攻撃ナレッジＡｉを補完する。

この例では、攻撃情報Ａｉの攻撃ナレッジに前提条件または攻撃結果として“ｗｗｗ”及び“ｖｖｖ”が含まれ、攻撃情報Ａｊの攻撃ナレッジに前提条件または攻撃結果として“ｙｙｙ”及び“ｚｚｚ”が含まれている。そして、攻撃情報Ａｉの攻撃ナレッジに、攻撃情報Ａｊの攻撃ナレッジに含まれる“ｙｙｙ”及び“ｚｚｚ”を追加し、攻撃情報Ａｊの攻撃ナレッジに、攻撃情報Ａｉの攻撃ナレッジに含まれる“ｗｗｗ”及び“ｖｖｖ”を追加する。

一方、補完する情報に競合がある場合、補完情報生成部１４０は、補完される攻撃ナレッジに元から（オリジナルに）含まれていた情報を優先させながら、情報を補完する（Ｓ１３３）。例えば、図１５に示すように、攻撃情報ＡｉとＡｊが互いに類似しており、攻撃情報ＡｉとＡｊの一部が互いに競合していると判断された場合、補完情報生成部１４０は、競合する情報は追加しない。すなわち、補完情報生成部１４０は、競合する情報以外の情報を使って攻撃情報を補完する。

この例では、攻撃情報Ａｉの攻撃ナレッジに前提条件または攻撃結果として“ｗｗｗ１”及び“ｖｖｖ”が含まれ、攻撃情報Ａｊの攻撃ナレッジに前提条件または攻撃結果として“ｗｗｗ２”及び“ｚｚｚ”が含まれている。このとき、“ｗｗｗ１”と“ｗｗｗ２”に競合があるとする。そして、攻撃情報Ａｉの攻撃ナレッジに対し、攻撃情報Ａｊの攻撃ナレッジに含まれる条件のうち、競合がある“ｗｗｗ２”は追加しない。すなわち、攻撃情報Ａｉの攻撃ナレッジに対し、競合がない“ｚｚｚ”のみを追加する。また、攻撃情報Ａｊの攻撃ナレッジに対し、攻撃情報Ａｉの攻撃ナレッジに含まれる条件のうち、競合がある“ｗｗｗ１”は追加しない。すなわち、攻撃情報Ａｊの攻撃ナレッジに対し、競合がない“ｖｖｖ”のみを追加する。

以上のように、本実施の形態では、脆弱性情報などの一般に公開されている攻撃情報から前提条件及び攻撃結果を含む攻撃ナレッジを生成し、類似している攻撃情報を用いて、生成された攻撃ナレッジを補完する。このように、攻撃情報が詳細に記述されていない場合でも、他の攻撃情報に含まれる条件を用いることにより攻撃ナレッジを補完することで、より正確な攻撃ナレッジを生成することができる。

（実施の形態２）
次に、図面を参照して実施の形態２を説明する。図１６は、本実施の形態に係る攻撃情報処理システム２の構成例を示している。図１６に示すように、攻撃情報処理システム２は、実施の形態１の場合と同様、攻撃ナレッジ生成装置１００、攻撃情報ＤＢ２００、および攻撃ナレッジＤＢ３００を備えている。

攻撃ナレッジ生成装置１００は、実施の形態１の構成と比べて、さらに訓練部１６０を備え、類似性判断部１３０及び補完情報生成部１４０の代わりに、類似性判断及び補完情報生成部１７０を備えている。

訓練部１６０は、攻撃情報と情報抽出部１２０によって生成された攻撃ナレッジを学習（訓練）する学習部である。類似性判断及び補完情報生成部１７０は、訓練部１６０によって訓練された学習モデルを使用することにより、類似性判断部１３０及び補完情報生成部１４０と同様の機能を実現する。

図１７は、本実施の形態に係る攻撃情報処理システム２によって実行される動作の流れを示している。図１７に示すように、情報抽出部１２０は、実施の形態１と同様に、攻撃情報から攻撃ナレッジを生成する（Ｓ２０１）。次に、訓練部１６０は、攻撃情報と情報抽出部１２０によって生成された攻撃ナレッジを学習し、それによって学習モデルを生成する（Ｓ２０２）。次に、類似性判断及び補完情報生成部１７０は、訓練部１６０によって訓練された学習モデルを使用して、類似度を判定し、補完情報を生成する（Ｓ２０３）。類似性判断及び補完情報生成部１７０は、学習モデルを用いて入力された攻撃情報から攻撃ナレッジを抽出し、抽出された攻撃ナレッジをその入力された攻撃情報に類似する攻撃情報に基づいて補完する。類似性の判断方法や情報の補完方法は、実施の形態１と同様である。

本実施の形態では、学習モデルは、攻撃情報と情報抽出部からの出力を使って補完された攻撃ナレッジを直接的に出力するように学習する。例えば、生成される攻撃ナレッジごと（攻撃条件ごとなど）に別々の学習モデルを生成する。これにより、類似度判定と補完情報生成を同時に実現することができる。

（実施の形態３）
次に、図面を参照して実施の形態３を説明する。図１８は、本実施の形態に係る攻撃情報処理システム３の構成例を示している。図１８に示すように、攻撃情報処理システム３は、実施の形態１及び２の場合と同様、攻撃ナレッジ生成装置１００、攻撃情報ＤＢ２００、および攻撃ナレッジＤＢ３００を備え、さらに、攻撃実験装置４００を備えている。

攻撃実験装置４００は、攻撃実験部４０１及び情報補正部４０２を備えている。攻撃実験部４０１は、攻撃ナレッジ生成装置１００によって生成された攻撃ナレッジを用いて攻撃実験を行う。情報補正部４０２は、攻撃実験部４０１による攻撃の結果に基づいて攻撃ナレッジを補正する。

図１９は、本実施の形態に係る攻撃情報処理システム３によって実行される動作の流れを示している。図１９に示すように、攻撃ナレッジ生成装置１００は、実施の形態１及び２と同様、攻撃情報から攻撃ナレッジを抽出し、攻撃情報の類似性を判断し、攻撃情報の類似性に基づいて攻撃ナレッジを補完する（Ｓ３０１）。

次に、攻撃実験部４０１は、攻撃ナレッジ生成装置１００によって生成された攻撃ナレッジを用いて攻撃実験を行う（Ｓ３０２）。攻撃実験部４０１は、補完された攻撃ナレッジに含まれる条件に基づいて攻撃環境を構築する。さらに、攻撃実験部４０１は、攻撃ナレッジに含まれる条件からその攻撃環境において実際に攻撃できるか否かを観察し、また攻撃の結果を観察する。

次に、情報補正部４０２は、攻撃実験部４０１による攻撃の結果に基づいて攻撃ナレッジを補正する（Ｓ３０３）。情報補正部４０２は、観察された情報に基づいて攻撃ナレッジを補正する。例えば、攻撃実験が失敗した場合、攻撃ナレッジに含まれる一部の条件を補正し、補正された攻撃ナレッジを用いてさらに攻撃実験を行う。これらの処理は、攻撃実験が成功するまで繰り返される。

本実施の形態では、実施の形態１及び２の構成に加えて、補完された攻撃ナレッジを用いることにより攻撃実験を行う。そうすることにより、攻撃ナレッジの生成精度をさらに向上することができる。

（実施の形態４）
次に、図面を参照して実施の形態４を説明する。図２０は、本実施の形態に係る攻撃情報処理システム４の構成例を示している。図２０に示すように、攻撃情報処理システム４は、実施の形態３の場合と同様、攻撃ナレッジ生成装置１００、攻撃情報ＤＢ２００、攻撃ナレッジＤＢ３００、および攻撃実験装置４００を備え、さらに、学習装置５００を備えている。学習装置５００は、攻撃実験装置４００によって補正された攻撃ナレッジを学習する。学習モデルは、情報抽出部１２０によって実行される情報抽出処理、類似性判断部１３０によって実行される類似性判断処理、補完情報生成部１４０によって実行される情報補完処理において、使用される。

図２１は、本実施の形態に係る攻撃情報処理システム４によって実行される動作の流れを示している。図２１に示すように、攻撃ナレッジ生成装置１００は、実施の形態１及び２と同様、攻撃情報から攻撃ナレッジを抽出し、攻撃情報の類似性を判断し、攻撃情報の類似性に基づいて攻撃ナレッジを補完する（Ｓ４０１）。次に、攻撃実験装置４００は、実施の形態３と同様、攻撃実験を行い（Ｓ４０２）、攻撃実験の結果に基づいて攻撃ナレッジを補正する（Ｓ４０３）。

次に、学習装置５００は、攻撃実験装置４００によって補正された攻撃ナレッジを学習し、それによって学習モデルを生成する（Ｓ４０４）。その後、生成された学習モデルを用いて、攻撃ナレッジ生成装置１００は、情報を抽出し、類似性を判断し、補完情報を生成する。学習モデルは、情報抽出処理、類似性判断処理、補完情報生成処理の一部または全てにおいて、使用される。

本実施の形態では、攻撃実験の結果を情報抽出部および／または類似性判断部にフィードバックすることにより、攻撃ナレッジの生成精度をさらに向上することができる。

なお、上述の実施形態における各構成は、ソフトウェア、ハードウェア、またはそれらの両方によって構成されてもよい。さたに、各構成は、１つのハードウェアデバイスまたは１つのソフトウェアプログラムから構成されてもよいし、複数のハードウェアデバイス又はソフトウェアプログラムから構成されてもよい。図２２に示すように、各装置及び各機能（各処理）は、ＣＰＵ（Central Processing Unit）等のプロセッサ２１、及びメモリ２２、すなわち記憶装置を有するコンピュータ２０によって実現されてもよい。例えば、メモリ２２に実施形態における方法を行うためのプログラム（攻撃情報処理プログラム）を格納し、各機能を、メモリ２２に格納されたプログラムをプロセッサ２１で実行することにより実現してもよい。

プログラムは、任意のタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータに格納及び供給することができる。非一時的なコンピュータ可読媒体は、任意のタイプの実体のある記録媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記憶媒体（例えばフロッピーディスク、磁気テープ、ハードディスクドライブ）、光磁気記憶媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（compact disc read only memory）、ＣＤ－Ｒ(compact disc recordable)、ＣＤ－Ｒ／Ｗ(compact disc rewritable)、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（random access memory））を含む。また、プログラムは、任意のタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、有線通信路（例えば電線、光ファイバ）又は無線通信路を介して、プログラムをコンピュータに供給できる。

なお、本開示は上記実施の形態に限られたものではなく、本開示のスコープ及び趣旨から逸脱することなく必要に応じて変更することが可能である。

実施の形態を参照して、本開示を上記で説明したが、本開示は上記実施の形態に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。

上記開示された実施形態の全部又は一部は、以下の付記のようにも記載されうるが、以下には限られない。
（付記１）
サイバー攻撃の記述を含む第１及び第２の攻撃情報から、前記サイバー攻撃の条件を示す第１及び第２の攻撃ナレッジを抽出するように構成された抽出部と、
前記第１及び第２の攻撃情報の類似性を判断するように構成された判断部と、
前記判断された類似性に基づいて、前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完するように構成された補完部と、
を備える、攻撃情報処理装置。
（付記２）
前記第１及び第２の攻撃情報のそれぞれは、コンピュータシステムの脆弱性が記述された脆弱性情報である、
付記１に記載の攻撃情報処理装置。
（付記３）
前記第１及び第２の攻撃ナレッジのそれぞれは、前記サイバー攻撃の前提条件及び結果を含む、
付記１または２に記載の攻撃情報処理装置。
（付記４）
前記抽出部は、前記第１及び第２の攻撃情報の文章を分割することによって得られた形態素の分散表現ベクトルを取得し、前記取得した分散表現ベクトルに基づいて前記第１及び第２の攻撃ナレッジを抽出する、
付記１乃至３のいずれか一項に記載の攻撃情報処理装置。
（付記５）
前記形態素は、一つの単語または複数の単語から構成される、
付記４に記載の攻撃情報処理装置。
（付記６）
前記抽出部は、前記分散表現ベクトルを取得した形態素に対し、前記第１及び第２の攻撃ナレッジに関連するラベルを付与し、前記付与されたラベルに基づいて、前記第１及び第２の攻撃ナレッジを抽出する、
付記４または５に記載の攻撃情報処理装置。
（付記７）
前記抽出部は、前記ラベルと前記攻撃ナレッジにおける条件との対応関係に基づいて、前記第１及び第２の攻撃ナレッジを抽出する、
付記６に記載の攻撃情報処理装置。
（付記８）
前記判断部は、前記ラベルが付与された形態素ごとの分散表現ベクトルの差に基づいて、前記類似性を判断する、
付記６または７に記載の攻撃情報処理装置。
（付記９）
前記判断部は、前記分散表現ベクトルの差の平均値または重み付き平均値に基づいて、前記類似性を判断する、
付記８に記載の攻撃情報処理装置。
（付記１０）
前記判断部は、前記第１及び第２の攻撃情報に含まれるコンポーネントの情報に基づいて前記類似性を判断する、
付記１乃至９のいずれか一項に記載の攻撃情報処理装置。
（付記１１）
前記判断部は、前記第１及び第２の攻撃情報のＤｅｓｃｒｉｐｔｉｏｎに含まれる記述に基づいて前記類似性を判断する、
付記１乃至１０のいずれか一項に記載の攻撃情報処理装置。
（付記１２）
前記判断部は、前記第１及び第２の攻撃情報に含まれる参照情報に基づいて前記類似性を判断する、
付記１乃至１１のいずれか一項に記載の攻撃情報処理装置。
（付記１３）
前記判断部は、前記第１及び第２の攻撃情報に含まれる攻撃情報の識別情報に基づいて前記類似性を判断する、
付記１乃至１２のいずれか一項に記載の攻撃情報処理装置。
（付記１４）
前記判断部は、前記第１及び第２の攻撃情報の文章の類似度に基づいて前記類似性を判断する、
付記１乃至１３のいずれか一項に記載の攻撃情報処理装置。
（付記１５）
前記類似度は、前記第１及び第２の攻撃情報における特定の単語の出現頻度、特定の単語の出現順序、またはそれらの統計情報を含む特徴量に基づいた類似度である、
付記１４に記載の攻撃情報処理装置。
（付記１６）
前記類似度は、前記特徴量のクラスタリングの結果の類似度である、
付記１５に記載の攻撃情報処理装置。
（付記１７）
前記判断部は、前記類似度と所定値との比較結果に基づいて、前記類似性を判断する、
付記１４乃至１６のいずれか一項に記載の攻撃情報処理装置。
（付記１８）
前記判断部は、前記抽出された攻撃ナレッジに基づいて前記類似性を判断する、
付記１乃至１７のいずれか一項に記載の攻撃情報処理装置。
（付記１９）
前記判断部は、前記第１及び第２の攻撃ナレッジに含まれる条件が互いに一致する割合に基づいて、前記類似性を判断する、
付記１８に記載の攻撃情報処理装置。
（付記２０）
前記第１及び第２の攻撃情報が互いに類似していると判断された場合、前記補完部は、前記第１の攻撃ナレッジを補完する、
付記１乃至１９のいずれか一項に記載の攻撃情報処理装置。
（付記２１）
前記補完部は、前記第１及び第２の攻撃情報の類似度に応じて、前記第１の攻撃ナレッジを補完する、
付記１乃至１９のいずれか一項に記載の攻撃情報処理装置。
（付記２２）
前記第１の攻撃ナレッジに含まれる条件が前記第２の攻撃ナレッジに含まれる条件と競合する場合、前記補完部は、補完される前記第１の攻撃ナレッジに元から含まれていた条件を優先させながら、前記第１の攻撃ナレッジを補完する、
付記１乃至２１のいずれか一項に記載の攻撃情報処理装置。
（付記２３）
前記第１の攻撃情報は、分析対象の攻撃情報であり、前記第２の攻撃情報は、所定の攻撃情報に含まれる、
付記１乃至２２のいずれか一項に記載の攻撃情報処理装置。
（付記２４）
サイバー攻撃の記述を含む複数の攻撃情報から、前記サイバー攻撃の条件を示す複数の攻撃ナレッジを抽出するように構成された抽出部と、
前記複数の攻撃情報と前記複数の攻撃ナレッジとの関係を学習した学習モデルを生成するように構成された学習部と、
前記学習モデルを用いて、入力された攻撃情報から抽出される攻撃ナレッジを、前記入力された攻撃情報に類似する攻撃情報に基づいて、補完するように構成された補完部と、
を備える、攻撃情報処理装置。
（付記２５）
前記補完された攻撃ナレッジに含まれる条件に基づいて実験環境を構築し、前記実験環境において前記サイバー攻撃の実験を行うように構成された攻撃実験部と、
前記実験の結果に基づいて補完された攻撃ナレッジを補正するように構成された補正部と、をさらに備える、
付記１乃至２３のいずれか一項に記載の攻撃情報処理装置。
（付記２６）
前記抽出部、前記判断部、または前記補完部により、前記実験の結果に基づいて使用される学習モデルを生成するように構成された学習部をさらに備える、
付記２５に記載の攻撃情報処理装置。
（付記２７）
サイバー攻撃の記述を含む第１及び第２の攻撃情報から、前記サイバー攻撃の条件を示す第１及び第２の攻撃ナレッジを抽出し、
前記第１及び第２の攻撃情報の類似性を判断し、
前記判断された類似性に基づいて、前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完する、
攻撃情報処理方法。
（付記２８）
前記第１及び第２の攻撃情報のそれぞれは、コンピュータシステムの脆弱性が記述された脆弱性情報である、
付記２７に記載の攻撃情報処理方法。
（付記２９）
サイバー攻撃の記述を含む第１及び第２の攻撃情報から、前記サイバー攻撃の条件を示す第１及び第２の攻撃ナレッジを抽出し、
前記第１及び第２の攻撃情報の類似性を判断し、
前記判断された類似性に基づいて、前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完する、
処理をコンピュータに実行させるための攻撃情報処理プログラム。
（付記３０）
前記第１及び第２の攻撃情報のそれぞれは、コンピュータシステムの脆弱性が記述された脆弱性情報である、
付記２９に記載の攻撃情報処理プログラム。

１～４攻撃情報処理システム
１０攻撃情報処理装置
１１抽出部
１２判断部
１３補完部
２０コンピュータ
２１プロセッサ
２２メモリ
１００攻撃ナレッジ生成装置
１１０攻撃情報取得部
１２０情報抽出部
１２１表現部
１２２抽出部
１２３導出部
１３０類似性判断部
１３１特定部
１３２判断部
１４０補完情報生成部
１５０記憶部
１６０訓練部
１７０類似性判断及び補完情報生成部
２００攻撃情報ＤＢ
３００攻撃ナレッジＤＢ
４００攻撃実験装置
４０１攻撃実験部
４０２情報補正部
５００学習装置

Claims

サイバー攻撃の記述を含む第１及び第２の攻撃情報から、前記サイバー攻撃の条件を示す第１及び第２の攻撃ナレッジを抽出する抽出手段と、
前記第１及び第２の攻撃情報の類似性を判断する判断手段と、
前記判断された類似性に基づいて、前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完する補完手段と、
を備え、
前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完することは、前記第２の攻撃ナレッジに含まれる一部の情報を前記第１の攻撃ナレッジに追加することである、
攻撃情報処理装置。
前記第１及び第２の攻撃情報のそれぞれは、コンピュータシステムの脆弱性が記述された脆弱性情報である、
請求項１に記載の攻撃情報処理装置。
前記第１及び第２の攻撃ナレッジのそれぞれは、前記サイバー攻撃の前提条件及び結果を含む、
請求項１または２に記載の攻撃情報処理装置。
前記抽出手段は、前記第１及び第２の攻撃情報の文章を分割することによって得られた形態素の分散表現ベクトルを取得し、前記取得した分散表現ベクトルに基づいて前記第１及び第２の攻撃ナレッジを抽出する、
請求項１乃至３のいずれか一項に記載の攻撃情報処理装置。
前記形態素は、一つの単語または複数の単語から構成される、
請求項４に記載の攻撃情報処理装置。
前記抽出手段は、前記分散表現ベクトルを取得した形態素に対し、前記第１及び第２の攻撃ナレッジに関連するラベルを付与し、前記付与されたラベルに基づいて、前記第１及び第２の攻撃ナレッジを抽出する、
請求項４または５に記載の攻撃情報処理装置。
前記抽出手段は、前記ラベルと前記攻撃ナレッジにおける条件との対応関係に基づいて、前記第１及び第２の攻撃ナレッジを抽出する、
請求項６に記載の攻撃情報処理装置。
前記判断手段は、前記ラベルが付与された形態素ごとの分散表現ベクトルの差に基づいて、前記類似性を判断する、
請求項６または７に記載の攻撃情報処理装置。
前記判断手段は、前記分散表現ベクトルの差の平均値または重み付き平均値に基づいて、前記類似性を判断する、
請求項８に記載の攻撃情報処理装置。
前記判断手段は、前記第１及び第２の攻撃情報に含まれるコンポーネントの情報に基づいて前記類似性を判断する、
請求項１乃至９のいずれか一項に記載の攻撃情報処理装置。
前記判断手段は、前記第１及び第２の攻撃情報のＤｅｓｃｒｉｐｔｉｏｎに含まれる記述に基づいて前記類似性を判断する、
請求項１乃至１０のいずれか一項に記載の攻撃情報処理装置。
前記判断手段は、前記第１及び第２の攻撃情報に含まれる参照情報に基づいて前記類似性を判断する、
請求項１乃至１１のいずれか一項に記載の攻撃情報処理装置。
前記判断手段は、前記第１及び第２の攻撃情報に含まれる攻撃情報の識別情報に基づいて前記類似性を判断する、
請求項１乃至１２のいずれか一項に記載の攻撃情報処理装置。
前記判断手段は、前記第１及び第２の攻撃情報の文章の類似度に基づいて前記類似性を判断する、
請求項１乃至１３のいずれか一項に記載の攻撃情報処理装置。
前記類似度は、前記第１及び第２の攻撃情報における特定の単語の出現頻度、特定の単語の出現順序、またはそれらの統計情報を含む特徴量に基づいた類似度である、
請求項１４に記載の攻撃情報処理装置。
前記類似度は、前記特徴量のクラスタリングの結果の類似度である、
請求項１５に記載の攻撃情報処理装置。
前記判断手段は、前記類似度と所定値との比較結果に基づいて、前記類似性を判断する、
請求項１４乃至１６のいずれか一項に記載の攻撃情報処理装置。
前記判断手段は、前記抽出された攻撃ナレッジに基づいて前記類似性を判断する、
請求項１乃至１７のいずれか一項に記載の攻撃情報処理装置。
前記判断手段は、前記第１及び第２の攻撃ナレッジに含まれる条件が互いに一致する割合に基づいて、前記類似性を判断する、
請求項１８に記載の攻撃情報処理装置。
前記第１及び第２の攻撃情報が互いに類似していると判断された場合、前記補完手段は、前記第１の攻撃ナレッジを補完する、
請求項１乃至１９のいずれか一項に記載の攻撃情報処理装置。
前記補完手段は、前記第１及び第２の攻撃情報の類似度に応じて、前記第１の攻撃ナレッジを補完する、
請求項１乃至１９のいずれか一項に記載の攻撃情報処理装置。
前記第１の攻撃ナレッジに含まれる条件が前記第２の攻撃ナレッジに含まれる条件と競合する場合、前記補完手段は、補完される前記第１の攻撃ナレッジに元から含まれていた条件を優先させながら、前記第１の攻撃ナレッジを補完する、
請求項１乃至２１のいずれか一項に記載の攻撃情報処理装置。
前記第１の攻撃情報は、分析対象の攻撃情報であり、前記第２の攻撃情報は、所定の攻撃情報に含まれる、
請求項１乃至２２のいずれか一項に記載の攻撃情報処理装置。
サイバー攻撃の記述を含む複数の攻撃情報から、前記サイバー攻撃の条件を示す複数の攻撃ナレッジを抽出する抽出手段と、
前記複数の攻撃情報と前記複数の攻撃ナレッジとの関係を学習した学習モデルを生成する学習手段と、
前記学習モデルを用いて、入力された攻撃情報から抽出される攻撃ナレッジを、前記入力された攻撃情報に類似する攻撃情報に基づいて、補完する補完手段と、
を備える、攻撃情報処理装置。
前記補完された攻撃ナレッジに含まれる条件に基づいて実験環境を構築し、前記実験環境において前記サイバー攻撃の実験を行う攻撃実験手段と、
前記実験の結果に基づいて補完された攻撃ナレッジを補正する補正手段と、をさらに備える、
請求項１乃至２３のいずれか一項に記載の攻撃情報処理装置。
前記抽出手段、前記判断手段、または前記補完手段により、前記実験の結果に基づいて使用される学習モデルを生成する学習手段をさらに備える、
請求項２５に記載の攻撃情報処理装置。
サイバー攻撃の記述を含む第１及び第２の攻撃情報から、前記サイバー攻撃の条件を示す第１及び第２の攻撃ナレッジを抽出し、
前記第１及び第２の攻撃情報の類似性を判断し、
前記判断された類似性に基づいて、前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完し、
前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完することは、前記第２の攻撃ナレッジに含まれる一部の情報を前記第１の攻撃ナレッジに追加することである、
攻撃情報処理方法。
前記第１及び第２の攻撃情報のそれぞれは、コンピュータシステムの脆弱性が記述された脆弱性情報である、
請求項２７に記載の攻撃情報処理方法。
サイバー攻撃の記述を含む第１及び第２の攻撃情報から、前記サイバー攻撃の条件を示す第１及び第２の攻撃ナレッジを抽出し、
前記第１及び第２の攻撃情報の類似性を判断し、
前記判断された類似性に基づいて、前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完し、
前記第１の攻撃ナレッジを前記第２の攻撃ナレッジで補完することは、前記第２の攻撃ナレッジに含まれる一部の情報を前記第１の攻撃ナレッジに追加することである、
処理をコンピュータに実行させるための攻撃情報処理プログラム。