JP7424474B2 - 学習装置、異常検知装置、学習方法及び異常検知方法 - Google Patents
学習装置、異常検知装置、学習方法及び異常検知方法 Download PDFInfo
- Publication number
- JP7424474B2 JP7424474B2 JP2022516488A JP2022516488A JP7424474B2 JP 7424474 B2 JP7424474 B2 JP 7424474B2 JP 2022516488 A JP2022516488 A JP 2022516488A JP 2022516488 A JP2022516488 A JP 2022516488A JP 7424474 B2 JP7424474 B2 JP 7424474B2
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- data
- value
- unit
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 102
- 238000000034 method Methods 0.000 title claims description 33
- 239000013598 vector Substances 0.000 claims description 66
- 230000005856 abnormality Effects 0.000 claims description 63
- 238000004364 calculation method Methods 0.000 claims description 27
- 238000013136 deep learning model Methods 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 description 17
- 238000010801 machine learning Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000007547 defect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000008707 rearrangement Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000001502 supplementing effect Effects 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Testing And Monitoring For Control Systems (AREA)
Description
まず、学習フェーズにおける異常検知装置10につい説明する。
学習フェーズにおける異常検知装置10の機能構成について、図1を参照しながら説明する。図1は、学習フェーズにおける異常検知装置10の機能構成の一例を示す図である。
次に、演算部102による計算の詳細と、エンコード部111及びデコード部112を実現する機械学習モデルの詳細とについて説明する。
以降では、エンコード部111及びデコード部112を実現する機械学習モデルの実施例1について説明する。
エンコード部111は、Ymを入力として、レコードmの特徴
ここで、上記の式(1)に示すモデルでは、Ym及びZmはその要素の行ベクトルを縦に並べた行列として扱われている。rFF(・)は各行をそれぞれ独立に変形させるニューラルネットワーク(Row-wise Neural Network)、α及びβは定数である。また、pool(・)はsumやmean、max等の要素の順番(この場合では行列の行ベクトルの順番)によらない1行ベクトルを出力する関数である。
デコード部112は、エンコード部111で抽出(生成)された特徴Zmから、レコードmの各属性値(つまり、レコードmの、欠損していない属性の属性値)を復元するために、欠損していない属性の属性情報
以降では、エンコード部111及びデコード部112を実現する機械学習モデルの実施例2について説明する。実施例2では、アテンション機構を使用したモデル(集合に対する深層学習モデル)によりエンコード部111及びデコード部112を実現する場合について説明する。
エンコード部111は、まず、上述したように、属性情報の埋め込みベクトル{w1,・・・,wN}を用いてYmを構成する。その後、エンコード部111は、SAB(・)又はMAB(・)を繰り返し用いることで、レコードmの特徴Zmを構成する。SAB(・)とMAB(・)の使用順序及び使用回数は任意の順序及び任意の回数でよく、特に限定されない。
デコード部112は、まず、デコード用の埋め込みベクトルsiの集合Smを用いて、S'm=MAB(Sm,Zm)を計算する。その後、デコード部112は、SAB(・)を繰り返し用いて、最後に各行を1次元にするニューラルネットワークrFF(・)を作用させることで、最終的に^xmを得る。SAB(・)の仕様回数は任意の回数でよく、特に限定されない。
エンコード部111及びデコード部112を実現する機械学習モデルとして実施例1で説明した機械学習モデルを用いる場合、学習対象のモデルパラメータは、埋め込みベクトル{w1,・・・,wN}、デコード用の埋め込みベクトル{s1,・・・,sN}、並びにrFF(・)で表されるニューラルネットワークの重み及びバイアスである。
次に、学習対象のモデルパラメータを学習するための学習処理について、図2を参照しながら説明する。図2は、本実施形態に係る学習処理の流れの一例を示すフローチャートである。
次に、異常検知フェーズにおける異常検知装置10について説明する。
異常検知フェーズにおける異常検知装置10の機能構成について、図3を参照しながら説明する。図3は、異常検知フェーズにおける異常検知装置10の機能構成の一例を示す図である。
次に、異常検知を行うための異常検知処理について、図4を参照しながら説明する。図4は、本実施形態に係る異常検知処理の流れの一例を示すフローチャートである。なお、複数の検知対象データが存在する場合には、各検知対象データに対して異常検知処理を行えばよい。
次に、本実施形態に係る異常検知装置10による異常検知手法の評価について説明する。
最後に、本実施形態に係る異常検知装置10のハードウェア構成について、図5を参照しながら説明する。図5は、本実施形態に係る異常検知装置10のハードウェア構成の一例を示す図である。
101 入力部
102 演算部
103 学習部
104 記憶部
105 異常検知部
106 出力部
111 エンコード部
112 デコード部
201 入力装置
202 表示装置
203 外部I/F
203a 記録媒体
204 通信I/F
205 プロセッサ
206 メモリ装置
207 バス
Claims (6)
- 欠損していない属性の値を表す属性値と前記欠損していない属性のインデックスを表す第1の属性情報との組で構成される集合を表すデータのデータセットを入力する入力部と、
前記属性のインデックスを表す第2の属性情報が埋め込まれた埋め込みベクトルが含まれるパラメータを用いて、前記属性値と前記埋め込みベクトルとを組み合わせたベクトルの集合から、前記属性値に対応する予測値を算出する演算部と、
前記属性値と、前記属性値に対応する予測値との差を最小化するように、所定の最適化手法により前記パラメータを更新する学習部と、
を有し、
前記演算部には、
前記組み合わせたベクトルの集合を入力として、前記データの特徴を表す特徴ベクトルの集合を生成するエンコード部と、
前記特徴ベクトルの集合を入力として、前記属性値を復元した予測値の集合を生成するデコード部と、が含まれる、ことを特徴とする学習装置。 - 前記エンコード部及び前記デコード部は、それぞれ、集合に対する深層学習モデルで実現され、
前記パラメータは、前記集合に対する深層学習モデルのパラメータである、ことを特徴とする請求項1に記載の学習装置。 - 前記集合に対する深層学習モデルは、属性間の関係性を学習可能なアテンション機構を用いたモデルである、ことを特徴とする請求項2に記載の学習装置。
- 欠損していない属性の値を表す属性値と前記欠損していない属性のインデックスを表す第1の属性情報との組で構成される集合を表すデータを入力する入力部と、
集合に対する深層学習モデルの学習済みパラメータであって、前記属性のインデックスを表す第2の属性情報が埋め込まれた埋め込みベクトルが含まれるパラメータを用いて、前記属性値と前記埋め込みベクトルとを組み合わせたベクトルの集合から、前記属性値に対応する予測値を算出する演算部と、
前記属性値と、前記属性値に対応する予測値との差を用いて、前記データの異常度を算出する異常度算出部と、
前記異常度が所定の閾値を超えているか否かにより、前記データが異常データ又は正常データのいずれであるかを判定する判定部と、
を有し、
前記演算部には、
前記組み合わせたベクトルの集合を入力として、前記データの特徴を表す特徴ベクトルを生成するエンコード部と、
前記特徴ベクトルを入力として、前記属性値を復元した予測値の集合を生成するデコード部と、が含まれる、ことを特徴とする異常検知装置。 - 欠損していない属性の値を表す属性値と前記欠損していない属性のインデックスを表す第1の属性情報との組で構成される集合を表すデータのデータセットを入力する入力手順と、
前記属性のインデックスを表す第2の属性情報が埋め込まれた埋め込みベクトルが含まれるパラメータを用いて、前記属性値と前記埋め込みベクトルとを組み合わせたベクトルの集合から、前記属性値に対応する予測値を算出する演算手順と、
前記属性値と、前記属性値に対応する予測値との差を最小化するように、所定の最適化手法により前記パラメータを更新する学習手順と、
をコンピュータが実行し、
前記演算手順には、
前記組み合わせたベクトルの集合を入力として、前記データの特徴を表す特徴ベクトルの集合を生成するエンコード手順と、
前記特徴ベクトルの集合を入力として、前記属性値を復元した予測値の集合を生成するデコード手順と、が含まれる、ことを特徴とする学習方法。 - 欠損していない属性の値を表す属性値と前記欠損していない属性のインデックスを表す第1の属性情報との組で構成される集合を表すデータを入力する入力手順と、
集合に対する深層学習モデルの学習済みパラメータであって、前記属性のインデックスを表す第2の属性情報が埋め込まれた埋め込みベクトルが含まれるパラメータを用いて、前記属性値と前記埋め込みベクトルとを組み合わせたベクトルの集合から、前記属性値に対応する予測値を算出する演算手順と、
前記属性値と、前記属性値に対応する予測値との差を用いて、前記データの異常度を算出する異常度算出手順と、
前記異常度が所定の閾値を超えているか否かにより、前記データが異常データ又は正常データのいずれであるかを判定する判定手順と、
をコンピュータが実行し、
前記演算手順には、
前記組み合わせたベクトルの集合を入力として、前記データの特徴を表す特徴ベクトルを生成するエンコード手順と、
前記特徴ベクトルを入力として、前記属性値を復元した予測値の集合を生成するデコード手順と、が含まれる、ことを特徴とする異常検知方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/017062 WO2021214833A1 (ja) | 2020-04-20 | 2020-04-20 | 学習装置、異常検知装置、学習方法及び異常検知方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021214833A1 JPWO2021214833A1 (ja) | 2021-10-28 |
JP7424474B2 true JP7424474B2 (ja) | 2024-01-30 |
Family
ID=78270446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022516488A Active JP7424474B2 (ja) | 2020-04-20 | 2020-04-20 | 学習装置、異常検知装置、学習方法及び異常検知方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7424474B2 (ja) |
WO (1) | WO2021214833A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114419035B (zh) * | 2022-03-25 | 2022-06-17 | 北京百度网讯科技有限公司 | 产品识别方法、模型训练方法、装置和电子设备 |
CN116993433A (zh) * | 2023-07-14 | 2023-11-03 | 重庆邮电大学 | 一种基于大数据的互联网电商异常用户检测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201511887D0 (en) * | 2015-07-07 | 2015-08-19 | Touchtype Ltd | Improved artificial neural network for language modelling and prediction |
US10848508B2 (en) * | 2016-09-07 | 2020-11-24 | Patternex, Inc. | Method and system for generating synthetic feature vectors from real, labelled feature vectors in artificial intelligence training of a big data machine to defend |
US20180203921A1 (en) * | 2017-01-17 | 2018-07-19 | Xerox Corporation | Semantic search in document review on a tangible user interface |
-
2020
- 2020-04-20 JP JP2022516488A patent/JP7424474B2/ja active Active
- 2020-04-20 WO PCT/JP2020/017062 patent/WO2021214833A1/ja active Application Filing
Non-Patent Citations (1)
Title |
---|
MISHRA, Ashish et al.,A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders,arXiv [online],2018年01月27日,[検索日 2020.09.30],インターネット <URL: https://arxiv.org/pdf/1709.00663v2> |
Also Published As
Publication number | Publication date |
---|---|
WO2021214833A1 (ja) | 2021-10-28 |
JPWO2021214833A1 (ja) | 2021-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7169369B2 (ja) | 機械学習アルゴリズムのためのデータを生成する方法、システム | |
US11080475B2 (en) | Predicting spreadsheet properties | |
CN109063055B (zh) | 同源二进制文件检索方法和装置 | |
JP6334431B2 (ja) | データ分析装置、データ分析方法、およびデータ分析プログラム | |
JP7424474B2 (ja) | 学習装置、異常検知装置、学習方法及び異常検知方法 | |
Lengerich et al. | Purifying interaction effects with the functional anova: An efficient algorithm for recovering identifiable additive models | |
CN111144548A (zh) | 抽油机井工况的识别方法及装置 | |
Liang et al. | An end-to-end model for android malware detection | |
CN113853614A (zh) | 在量子特征空间中使用量子相似性矩阵的无监督聚类 | |
JP2018147280A (ja) | データ分析装置及びデータ分析方法 | |
CN114127747A (zh) | 用于分布外检测的似然比 | |
WO2020255414A1 (ja) | 学習支援装置、学習支援方法、及びコンピュータ読み取り可能な記録媒体 | |
KR102153161B1 (ko) | 확률 그래프 기반의 서열 데이터 연관성 학습 방법 및 시스템 | |
US20230273771A1 (en) | Secret decision tree test apparatus, secret decision tree test system, secret decision tree test method, and program | |
Hu et al. | Cb-gan: Generate sensitive data with a convolutional bidirectional generative adversarial networks | |
JP6831307B2 (ja) | 解算出装置、解算出方法及び解算出プログラム | |
JP7347528B2 (ja) | 情報処理プログラム、情報処理方法及び情報処理装置 | |
Makandar et al. | An approach to analysis of malware using supervised learning classification | |
JPWO2020158266A1 (ja) | 評価装置、評価方法及びプログラム | |
JP7420148B2 (ja) | 学習装置、学習方法及びプログラム | |
JP7452247B2 (ja) | 変換プログラム、変換方法および情報処理装置 | |
JP2018151913A (ja) | 情報処理システム、情報処理方法、及びプログラム | |
US20230376790A1 (en) | Secret decision tree learning apparatus, secret decision tree learning system, secret decision tree learning method, and program | |
Cardona-Escobar et al. | A methodology for the prediction of Embryophyta protein functions using mismatch kernels | |
US20220199204A1 (en) | Iterative state detection for molecular dynamics data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231023 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7424474 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |