JP7143672B2 - 誤り判定装置、誤り判定方法、及びプログラム - Google Patents
誤り判定装置、誤り判定方法、及びプログラム Download PDFInfo
- Publication number
- JP7143672B2 JP7143672B2 JP2018147838A JP2018147838A JP7143672B2 JP 7143672 B2 JP7143672 B2 JP 7143672B2 JP 2018147838 A JP2018147838 A JP 2018147838A JP 2018147838 A JP2018147838 A JP 2018147838A JP 7143672 B2 JP7143672 B2 JP 7143672B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- unit
- data
- estimation process
- error determination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
前記分類推定過程観測部により生成された前記特徴ベクトルと、前記分類推定部から出力された分類結果とを入力し、前記特徴ベクトルの特定の値が閾値を超えているかどうかにより、又は、教師あり学習で学習されたモデルへの前記特徴ベクトルの入力に対する出力により、前記分類結果の正誤を判定する誤り判定部とを備え、
前記分類推定部がニューラルネットワークにより構成される場合において、前記推定過程のデータは当該ニューラルネットワークにおける中間層のノードの出力データを含み、前記分類推定部が決定木により構成される場合において、前記推定過程のデータは当該決定木における決定のルートの情報を含む
ことを特徴とする誤り判定装置が提供される。
図1は、本発明の実施の形態における分類装置100の機能構成図を示す。図1に示すように、分類装置100は、分類推定部110、及びセルフリジェクト部120を有する。セルフリジェクト部120は、分類推定過程観測部121、及び誤り判定部122を有する。
まず、分類対象データが分類推定部110に入力される。分類対象データは、本システムを使用して何かしらの分類を行いたいデータであり、例えば脅威情報が該当する。
上述した分類装置100(セルフリジェクト装置、誤り判定装置も同様)は、例えば、コンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。
分類推定過程観測部121は、分類推定部110が分類対象データの分類を推定する際の計算過程を観測して特徴ベクトルを構成する。分類推定過程観測部121の観測対象となる分類対象データの分類を推定する際の計算過程の具体例を、ニューラルネットワーク、決定木、ランダムフォレストを用いて説明する。
誤り判定部122は、分類推定部110から推定した分類を受け取るととともに、分類推定過程観測部121から、推定過程の観測データの特徴ベクトルを受け取り、その観測データに基づいて、分類推定部110が推定した分類が「正しい」ものか「誤り」であるかを判断する。「正しい」場合は分類推定部110が推定した分類をそのまま分類結果とするが、「誤り」の場合は「不明」を分類結果とする。
図6は、機械学習による誤り判定部122の作成方法の手順を示すフローチャートである。以下、図6に示すS1(ステップ1)~S4(ステップ4)の手順に沿って、各ステップを説明する。
ステップ1では、学習用分類対象データリスト(A)とその正解分類リスト(B)を用意する。分類推定部110を機械学習でチューニングしている場合、その学習データも流用してよい。学習用分類対象データリスト(A)とその正解分類リスト(B)は両方とも人手で用意する必要がある。
ステップ2では、図8に示すとおり、分類推定部110に分類対象データリスト(A)の各要素を入力する。分類推定過程観測部121は、前述した方法で推定過程の特徴ベクトルを生成し、学習部が、そのリストである推定過程特徴ベクトルリスト(C)を取得する。それと同時に学習部は、分類推定部110から分類結果リスト(D)を取得する。
ステップ3では、図9に示すように、学習部が、正解分類リスト(B)と分類結果リスト(D)を比較し、自動分類の正誤を表した学習用正誤リスト(E)を取得する。図9の例では、正解分類リスト(B)に記載のように、一番目の分類の正解が分類Oであるのに対し、分類結果では、一番目の分類が分類Pとなった。よって、一番目の分類は誤りとなり、学習用正誤リスト(E)の一番目の要素は1(誤り)になる。2番目と3番目は正しいので、学習用正誤リスト(E)は<1 0 0>となる。
ステップ4では、図10に示すように、学習部は、推定過程特徴ベクトルリスト(C)を例えばニューラルネットワーク(あるいはSVM)の入力とし、学習用正誤リスト(E)を当該ニューラルネットワーク(あるいはSVM)の正解の出力として、機械学習を行う。これによりパラメータチューニングのなされたニューラルネットワーク(あるいはSVM)が、誤り判定部122として得られる。
以上、説明したように、本実施の形態に係る技術によれば、分類推定部110の分類時の推定過程を観測し、観測データに基づいて誤り判定を行うので、精度の高い判定を行なうことができる。
以上、説明したように、本実施の形態によれば、分類対象データの分類を推定する分類推定部から推定過程のデータを取得し、当該データに基づいて特徴ベクトルを生成する分類推定過程観測部と、前記分類推定過程観測部により生成された前記特徴ベクトルと、前記分類推定部から出力された分類結果とを入力し、前記特徴ベクトルと、前記分類結果とに基づいて、当該分類結果の正誤を判定する誤り判定部とを備えることを特徴とする誤り判定装置が提供される。
110 分類推定部
120 セルフリジェクト部
121 分類推定過程観測部
122 誤り判定部
150 ドライブ装置
151 記録媒体
152 補助記憶装置
153 メモリ装置
154 CPU
155 インターフェース装置
156 表示装置
157 入力装置
Claims (5)
- 分類対象データの分類を推定する分類推定部から推定過程のデータを取得し、当該データに基づいて特徴ベクトルを生成する分類推定過程観測部と、
前記分類推定過程観測部により生成された前記特徴ベクトルと、前記分類推定部から出力された分類結果とを入力し、前記特徴ベクトルの特定の値が閾値を超えているかどうかにより、又は、教師あり学習で学習されたモデルへの前記特徴ベクトルの入力に対する出力により、前記分類結果の正誤を判定する誤り判定部とを備え、
前記分類推定部がニューラルネットワークにより構成される場合において、前記推定過程のデータは当該ニューラルネットワークにおける中間層のノードの出力データを含み、前記分類推定部が決定木により構成される場合において、前記推定過程のデータは当該決定木における決定のルートの情報を含む
ことを特徴とする誤り判定装置。 - 前記誤り判定部は、前記分類結果を正しいと判定した場合に、前記分類推定部による分類結果を出力し、前記分類結果を誤りであると判定した場合に、分類は不明であることを示す情報を出力する
ことを特徴とする請求項1に記載の誤り判定装置。 - 前記誤り判定部は、前記分類推定過程観測部により生成される特徴ベクトルに基づいて、機械学習により生成された機能部である
ことを特徴とする請求項1又は2に記載の誤り判定装置。 - コンピュータが実行する誤り判定方法であって、
分類対象データの分類を推定する分類推定部から推定過程のデータを取得し、当該データに基づいて特徴ベクトルを生成する分類推定過程観測ステップと、
前記分類推定過程観測ステップにより生成された前記特徴ベクトルと、前記分類推定部から出力された分類結果とを入力し、前記特徴ベクトルの特定の値が閾値を超えているかどうかにより、又は、教師あり学習で学習されたモデルへの前記特徴ベクトルの入力に対する出力により、前記分類結果の正誤を判定する誤り判定ステップとを備え、
前記分類推定部がニューラルネットワークにより構成される場合において、前記推定過程のデータは当該ニューラルネットワークにおける中間層のノードの出力データを含み、前記分類推定部が決定木により構成される場合において、前記推定過程のデータは当該決定木における決定のルートの情報を含む
ことを特徴とする誤り判定方法。 - コンピュータを、請求項1ないし3のうちいずれか1項に記載の誤り判定装置における分類推定過程観測部及び誤り判定部として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018147838A JP7143672B2 (ja) | 2018-08-06 | 2018-08-06 | 誤り判定装置、誤り判定方法、及びプログラム |
US17/265,867 US20210201087A1 (en) | 2018-08-06 | 2019-08-05 | Error judgment apparatus, error judgment method and program |
PCT/JP2019/030729 WO2020031960A1 (ja) | 2018-08-06 | 2019-08-05 | 誤り判定装置、誤り判定方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018147838A JP7143672B2 (ja) | 2018-08-06 | 2018-08-06 | 誤り判定装置、誤り判定方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020024513A JP2020024513A (ja) | 2020-02-13 |
JP7143672B2 true JP7143672B2 (ja) | 2022-09-29 |
Family
ID=69415527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018147838A Active JP7143672B2 (ja) | 2018-08-06 | 2018-08-06 | 誤り判定装置、誤り判定方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210201087A1 (ja) |
JP (1) | JP7143672B2 (ja) |
WO (1) | WO2020031960A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11934427B2 (en) * | 2020-01-14 | 2024-03-19 | Nippon Telegraph And Telephone Corporation | Data classification apparatus, data classification method and program |
WO2022219787A1 (ja) * | 2021-04-15 | 2022-10-20 | 日本電信電話株式会社 | ラベル付与装置、ラベル付与方法及びプログラム |
JP7544259B2 (ja) | 2021-04-15 | 2024-09-03 | 日本電信電話株式会社 | ラベル付与装置、ラベル付与方法及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009078096A1 (ja) | 2007-12-18 | 2009-06-25 | Fujitsu Limited | 二クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび二クラス分類予測モデルの作成装置 |
JP2013077194A (ja) | 2011-09-30 | 2013-04-25 | Hiroshi Sugimura | 知識を活用する情報システム装置 |
JP2014102555A (ja) | 2012-11-16 | 2014-06-05 | Ntt Docomo Inc | 判別ルール生成装置及び判別ルール生成方法 |
JP2016192007A (ja) | 2015-03-31 | 2016-11-10 | 日本電気株式会社 | 機械学習装置、機械学習方法、および機械学習プログラム |
-
2018
- 2018-08-06 JP JP2018147838A patent/JP7143672B2/ja active Active
-
2019
- 2019-08-05 US US17/265,867 patent/US20210201087A1/en active Pending
- 2019-08-05 WO PCT/JP2019/030729 patent/WO2020031960A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009078096A1 (ja) | 2007-12-18 | 2009-06-25 | Fujitsu Limited | 二クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび二クラス分類予測モデルの作成装置 |
JP2013077194A (ja) | 2011-09-30 | 2013-04-25 | Hiroshi Sugimura | 知識を活用する情報システム装置 |
JP2014102555A (ja) | 2012-11-16 | 2014-06-05 | Ntt Docomo Inc | 判別ルール生成装置及び判別ルール生成方法 |
JP2016192007A (ja) | 2015-03-31 | 2016-11-10 | 日本電気株式会社 | 機械学習装置、機械学習方法、および機械学習プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20210201087A1 (en) | 2021-07-01 |
JP2020024513A (ja) | 2020-02-13 |
WO2020031960A1 (ja) | 2020-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Choudhury et al. | Comparative analysis of machine learning algorithms along with classifiers for network intrusion detection | |
EP3490223B1 (en) | System and method for simulating and foiling attacks on a vehicle on-board network | |
JP7143672B2 (ja) | 誤り判定装置、誤り判定方法、及びプログラム | |
CN106415507A (zh) | 日志分析装置、攻击检测装置、攻击检测方法以及程序 | |
JP6835703B2 (ja) | サイバー攻撃検知システム、特徴量選定システム、サイバー攻撃検知方法、及びプログラム | |
KR102088509B1 (ko) | 컴퓨터 시스템의 이상 행위 탐지 방법 및 장치 | |
JP7211196B2 (ja) | 誤り判定装置、誤り判定方法、及びプログラム | |
Masarat et al. | A novel framework, based on fuzzy ensemble of classifiers for intrusion detection systems | |
KR20160119678A (ko) | 기계 학습을 이용한 웹 공격 탐지방법 및 장치 | |
Yassin et al. | Signature-Based Anomaly intrusion detection using Integrated data mining classifiers | |
US20180285128A1 (en) | Automated user interface analysis | |
Obaid et al. | An adaptive approach for internet phishing detection based on log data | |
CN113221109A (zh) | 一种基于生成对抗网络的恶意文件智能分析方法 | |
Mohasseb et al. | Predicting cybersecurity incidents using machine learning algorithms: A case study of Korean SMEs | |
Mohammadi et al. | An efficient hybrid self-learning intrusion detection system based on neural networks | |
Kholidy et al. | Enhancing Security in 5G Networks: A Hybrid Machine Learning Approach for Attack Classification | |
AL-Behadili | Decision tree for multiclass classification of firewall access | |
Lu et al. | Ranking attack graphs with graph neural networks | |
Wang et al. | Generation and analysis of attack graphs | |
Holsopple et al. | Mission impact assessment for cyber warfare | |
JP2021060872A (ja) | 生成方法、生成プログラム、および情報処理装置 | |
Kordestani et al. | An entice resistant automatic phishing detection | |
JP7120043B2 (ja) | グラフ要約装置、グラフ要約方法及びプログラム | |
Datta et al. | An automated malicious host recognition model in cloud forensics | |
WO2022259313A1 (ja) | 誤り判定装置、誤り判定方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220829 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7143672 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |