JP7349404B2 - 判定装置、判定方法及び判定プログラム - Google Patents
判定装置、判定方法及び判定プログラム Download PDFInfo
- Publication number
- JP7349404B2 JP7349404B2 JP2020077995A JP2020077995A JP7349404B2 JP 7349404 B2 JP7349404 B2 JP 7349404B2 JP 2020077995 A JP2020077995 A JP 2020077995A JP 2020077995 A JP2020077995 A JP 2020077995A JP 7349404 B2 JP7349404 B2 JP 7349404B2
- Authority
- JP
- Japan
- Prior art keywords
- systems
- data
- input data
- distances
- determination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
ところが、これらのAIシステムは、分析対象である入力データの変化に敏感なため、人が認識しない僅かな変化を加えた敵対的テキストを用いて、テキストの意味を保持したまま、高い確率でAIシステムに誤判定させる攻撃が存在する。そこで、このような攻撃を検知するために、例えば、非特許文献1~3のように、オリジナルのテキストと、敵対的テキストとを識別する手法が提案されている。
図1は、本実施形態における判定装置1の機能構成を示す図である。
判定装置1は、サーバ又はパーソナルコンピュータ等の情報処理装置(コンピュータ)であり、制御部10及び記憶部20の他、各種データの入出力デバイス及び通信デバイス等を備える。
制御部10は、これらの機能部により、入力データが敵対的データであるか否かを判定すると共に、攻撃対象のシステムを識別する。
本実施形態では、入力データは、一例としてテキストデータであるとするが、これには限られず、例えば、静止画、動画、音声等であってもよい。
ここでは、攻撃対象の候補である複数のシステムとして、LSTM(Long short-term memory)、Bi-LSTM(Bidirectional LSTM)、CNN(Convolutional Neural Network)を採用している。なお、対象のシステムは、これらには限られず、他のシステムが追加又は置換されてもよい。
この場合、オリジナルのテキストt1に対しては、いずれのシステムにおいても高い確率で「Positive」という推定値が得られている。
一方、他のシステムにおいて「Positive」の確率に大きな変化はない。
この場合、オリジナルのテキストt2に対しては、いずれのシステムにおいても高い確率で「Film」という推定値が得られている。
一方、他のシステムにおいて「Film」の確率に大きな変化はない。
この場合、オリジナルのテキストt3に対しては、いずれのシステムにおいても高い確率で「Entailment」という推定値が得られている。
一方、他のシステムにおいて「Entailment」の確率に大きな変化はない。
この場合、オリジナルのテキストt4に対しては、いずれのシステムにおいても高い確率で「John Elway」という推定値が得られている。
一方、他のシステムにおいて「John Elway」の確率に大きな変化はない。
解析結果取得部11は、新たなテキストデータに対して、この同一の推定値を、例えば、複数のシステムによる推定結果の多数決により決定してもよい。
ここで、確率の距離は、例えば、マンハッタン距離、すなわち確率の差の絶対値であってよい。
オリジナルのテキストt1,t2,t3では、確率の距離が全て低く、例えば、数%から数十%程度となっている。
一方、敵対的テキストt’1,t’2,t’3,t’4では、いずれか一つのシステムに関係する距離がオリジナルの場合と比べて非常に大きくなっている。例えば、t’1の場合、|p1-p2|が8.0%から61.7%に、|p1-p3|が6.5%から62.0%に大きく上昇し、LSTMとは無関係の|p2-p3|は0.3%と小さいままである。
学習手法は限定されず、例えば、ロジスティック回帰、サポートベクタマシン、多層パーセプトロン等の線形分類器が採用されてよい。また、複数の手法により生成された複数の分類器について、k(例えば、10)分割交差検証等により評価し、分類精度又はF値、あるいはそのバランスが最も優れている分類器が採用されてもよい。
このとき、識別部15は、複数のシステムのうち、他のシステムとの間での確率の距離の平均値が最大となるシステムを、最も類似度の低いシステムとしてよい。
あるいは、識別部15は、複数のシステムのうち、同一の推定値に対する確率が最も低いシステムを、最も類似度の低いシステムとしてもよい。
この例では、確率の距離の平均値が最大となるシステムが攻撃対象として識別されている。
例えば、敵対的テキストt’1の場合、LSTMでの確率と他のシステムでの確率との距離は、61.7%及び62.0%なので、平均値61.9%が得られる。同様に、Bi-LSTMでは平均値31.0%が、CNNでは平均値31.2%が得られる。したがって、識別部15は、平均値が最大(61.9%)となるLSTMを、攻撃対象のシステムとして識別する。
一般に、敵対的データは、特定のシステムを対象として誤判定を引き起こすため、他のシステムとの間で解析結果に乖離が生じる。この状態を特徴量とすることで、判定装置1は、オリジナルデータか敵対的データかの区分をラベルとした訓練データを用いた機械学習により、敵対的データを判別可能な分類器を生成できる。
したがって、判定装置1は、複数のシステムのいずれかを攻撃対象とする訓練データを一様に用いることで、適切な分類器を生成でき、新たな入力に対して、様々な敵対的データを汎用的に判定できる。
これにより、特徴量が正解に基づく訓練データと整合するため、精度良く敵対的データを判定できる。
したがって、判定装置1は、敵対的データと判定した入力による攻撃対象を特定でき、これにより、対象のシステムに対して、適切な対策を施すことが可能となる。
また、判定装置1は、複数のシステムのうち、同一の推定値に対する確率が最も低いシステムを、最も類似度の低いシステムとすることで、攻撃対象のシステムを容易に識別できる。
10 制御部
11 解析結果取得部
12 距離算出部
13 学習部
14 判定部
15 識別部
20 記憶部
Claims (8)
- 入力データを解析する複数のシステムそれぞれから、共通する複数の推定値及び当該複数の推定値それぞれの確率の組を取得する解析結果取得部と、
同一の入力データについて、共通の一つの推定値に対する前記複数のシステム間の前記確率の距離の組を算出する距離算出部と、
前記距離の組を特徴量として、敵対的データか否かを示すラベルが予め付与された入力データを学習し、分類器を生成する学習部と、
生成された前記分類器に新たな入力データを入力して、当該新たな入力データが敵対的データか否かを判定する判定部と、を備える判定装置。 - 前記解析結果取得部は、前記複数のシステムによる推定結果の多数決により前記一つの推定値を決定する請求項1に記載の判定装置。
- 前記判定部により前記新たな入力データが敵対的データと判定された場合に、前記距離の組に基づいて、前記複数のシステムのうち他のシステムに対する類似度が最も低いシステムを、攻撃対象として識別する識別部を備える請求項1又は請求項2に記載の判定装置。
- 前記識別部は、前記複数のシステムのうち、他のシステムとの間の前記距離の平均値が最大となるシステムを、前記他のシステムに対する類似度が最も低いシステムとする請求項3に記載の判定装置。
- 前記識別部は、前記複数のシステムのうち、前記一つの推定値に対する前記確率が最も低いシステムを、前記他のシステムに対する類似度が最も低いシステムとする請求項3に記載の判定装置。
- 前記入力データは、テキストデータである請求項1から請求項5のいずれかに記載の判定装置。
- 入力データを解析する複数のシステムそれぞれから、共通する複数の推定値及び当該複数の推定値それぞれの確率の組を取得する解析結果取得ステップと、
同一の入力データについて、共通の一つの推定値に対する前記複数のシステム間の前記確率の距離の組を算出する距離算出ステップと、
前記距離の組を特徴量として、敵対的データか否かを示すラベルが予め付与された入力データを学習し、分類器を生成する学習ステップと、
生成された前記分類器に新たな入力データを入力して、当該新たな入力データが敵対的データか否かを判定する判定ステップと、をコンピュータが実行する判定方法。 - 請求項1から請求項6のいずれかに記載の判定装置としてコンピュータを機能させるための判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020077995A JP7349404B2 (ja) | 2020-04-27 | 2020-04-27 | 判定装置、判定方法及び判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020077995A JP7349404B2 (ja) | 2020-04-27 | 2020-04-27 | 判定装置、判定方法及び判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021174276A JP2021174276A (ja) | 2021-11-01 |
JP7349404B2 true JP7349404B2 (ja) | 2023-09-22 |
Family
ID=78279680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020077995A Active JP7349404B2 (ja) | 2020-04-27 | 2020-04-27 | 判定装置、判定方法及び判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7349404B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102662589B1 (ko) * | 2022-03-25 | 2024-05-03 | 국방과학연구소 | 공격 예측 모델 훈련 방법 및 이를 위한 장치 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019077440A1 (en) | 2017-10-18 | 2019-04-25 | International Business Machines Corporation | VIRTUAL COGNITIVE DETECTOR |
-
2020
- 2020-04-27 JP JP2020077995A patent/JP7349404B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019077440A1 (en) | 2017-10-18 | 2019-04-25 | International Business Machines Corporation | VIRTUAL COGNITIVE DETECTOR |
Non-Patent Citations (2)
Title |
---|
坂本岳史 ほか,"ニューラル機械翻訳システムに対する敵対的攻撃",電子情報通信学会技術研究報告,一般社団法人電子情報通信学会,2020年02月,第119巻, 第437号,pp. 125-130,ISSN 2432-6380 |
小高知宏 ほか,"3.2.4 アンサンブル学習",基礎から学ぶ人工知能の教科書,第1版,株式会社オーム社,2019年,pp. 68-69,ISBN 978-4-274-22426-3 |
Also Published As
Publication number | Publication date |
---|---|
JP2021174276A (ja) | 2021-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10958784B1 (en) | Performing a custom action during call screening based on a purpose of a voice call | |
US11816080B2 (en) | Severity computation of anomalies in information technology operations | |
EP3882814A1 (en) | Utilizing machine learning models, position-based extraction, and automated data labeling to process image-based documents | |
González et al. | Validation methods for plankton image classification systems | |
JP5241379B2 (ja) | 対話システムにおける統計的分類のための最適な選択戦略の方法及びシステム | |
US11501161B2 (en) | Method to explain factors influencing AI predictions with deep neural networks | |
CN111523119B (zh) | 漏洞检测的方法和装置、电子设备及计算机可读存储介质 | |
JP6765911B2 (ja) | 分類装置、分類方法およびプログラム | |
CN110310114B (zh) | 对象分类方法、装置、服务器及存储介质 | |
US20190311258A1 (en) | Data dependent model initialization | |
US11954202B2 (en) | Deep learning based detection of malicious shell scripts | |
JP2010537321A (ja) | 統計的分類のための最適な選択方略の方法及びシステム | |
US11983105B2 (en) | Systems and methods for generating and executing a test case plan for a software product | |
KR102074909B1 (ko) | 소프트웨어 취약점 분류 장치 및 방법 | |
KR20190115319A (ko) | 문장을 복수의 클래스들로 분류하는 모바일 장치 및 방법 | |
CN109685104B (zh) | 一种识别模型的确定方法和装置 | |
JP2020512651A (ja) | 検索方法、装置及び非一時的コンピュータ読取可能記憶媒体 | |
US20220253725A1 (en) | Machine learning model for entity resolution | |
JP6004015B2 (ja) | 学習方法、情報処理装置および学習プログラム | |
Escobar et al. | Process-monitoring-for-quality—a model selection criterion for support vector machine | |
US20220327394A1 (en) | Learning support apparatus, learning support methods, and computer-readable recording medium | |
JP7349404B2 (ja) | 判定装置、判定方法及び判定プログラム | |
JP2020135689A (ja) | モデル学習システム、意図解釈システム、モデル学習方法およびモデル学習用プログラム | |
JP2023145767A (ja) | 語彙抽出支援システムおよび語彙抽出支援方法 | |
JP2010272004A (ja) | 判別装置及び判別方法、並びにコンピューター・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220607 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230911 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7349404 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |