JP2021072057A - 情報処理装置および情報処理方法 - Google Patents
情報処理装置および情報処理方法 Download PDFInfo
- Publication number
- JP2021072057A JP2021072057A JP2019200187A JP2019200187A JP2021072057A JP 2021072057 A JP2021072057 A JP 2021072057A JP 2019200187 A JP2019200187 A JP 2019200187A JP 2019200187 A JP2019200187 A JP 2019200187A JP 2021072057 A JP2021072057 A JP 2021072057A
- Authority
- JP
- Japan
- Prior art keywords
- value
- weight value
- information processing
- teacher data
- ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 92
- 238000003672 processing method Methods 0.000 title claims description 28
- 238000000034 method Methods 0.000 claims abstract description 32
- 230000008569 process Effects 0.000 claims abstract description 27
- 238000012937 correction Methods 0.000 claims abstract description 26
- 230000007423 decrease Effects 0.000 claims description 24
- 230000003247 decreasing effect Effects 0.000 claims description 21
- 230000003321 amplification Effects 0.000 abstract description 3
- 238000003199 nucleic acid amplification method Methods 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
【課題】不正取引の予測モデルにおける予測精度を効率的に改善可能とする。【解決手段】情報処理装置100において、不正取引に関する教師データを保持する記憶装置101と、不正取引を検知する予測モデルに、前記教師データを入力することで予測スコアを取得する処理、前記教師データの正解値と前記予測スコアとの誤差を算定する処理、前記教師データのうち当該予測スコアが所定の閾値以下となる教師データを特定し、当該教師データに関する前記誤差に、所定アルゴリズムで決定した重み値を乗じて増幅させ、補正誤差を算定する処理、及び前記誤差および前記補正誤差を教師信号として、前記予測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、を実行する演算装置104を含む構成とする。【選択図】図2
Description
本発明は、情報処理装置および情報処理方法に関するものであり、具体的には、不正取引の予測モデルにおける予測精度を効率的に改善可能とする技術に関する。
いわゆるフィンテックの進化と共に、金融取引の大幅な自動化、高速化が可能となってきた。そのため、金融機関において取り扱う取引のトランザクションも、従来と比べて増大傾向にある。一方で、巧妙化した不正取引も後を絶たず、その検知の重要性は高まるばかりである。
こうした不正取引の検知業務では、例えば、母集団となる膨大な取引履歴に対して所定のルールベースを適用し、疑義ある取引の自動抽出を行う。また、ここで自動抽出した取引群を新たな母集団とした、知見ある者による数次に亘る調査を経て、最終的に不正取引を特定している。
ここで、上述の従来手法のうち人間による調査手順については、人工知能による自動判断に置換し、全体として業務効率を高める動きがある。例えば、顧客勘定に関する取引の不正を検出するためのコンピュータで実施される処理が、過去取引データから予測モデルを開発するステップ、前記予測モデルをコンピュータに関連する媒体に記憶するステップ、現在取引データを得るステップ、顧客データを得るステップ、及び、記憶された予測モデルに対して前記現在取引データと前記顧客データを適用することに応答して、不正の可能性を示す信号を生成するステップを含む不正検出手法(特許文献1参照)などが提案されている。
上述のように、不正取引の検知に人工知能を用いることで、表面上、業務効率は改善されやすくなる。ところが、本来は不正取引である取引であっても、その判定スコアが閾値を下回っていれば正常な取引として見逃すケースが存在する。
不正取引を正常な取引として見逃すことは、その数や頻度が少ないとしても重大な結果を招来しうる。そのため、人手による再調査を、対象母集団の広範囲に亘って行うこととなる。つまり、結果として業務効率がかえって低下しかねないと言える。
そこで本発明の目的は、不正取引の予測モデルにおける予測精度を効率的に改善可能とする技術を提供することにある。
そこで本発明の目的は、不正取引の予測モデルにおける予測精度を効率的に改善可能とする技術を提供することにある。
上記課題を解決する本発明の情報処理装置は、不正取引に関する教師データを保持する記憶装置と、不正取引を検知する予測モデルに、前記教師データを入力することで予測スコアを取得する処理、前記教師データの正解値と前記予測スコアとの誤差を算定する処理、前記教師データのうち当該予測スコアが所定の閾値以下となる教師データを特定し、当該教師データに関する前記誤差に、所定アルゴリズムで決定した重み値を乗じて増幅させ、補正誤差を算定する処理、及び前記誤差および前記補正誤差を教師信号として、前記予
測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、を実行する演算装置と、を含むことを特徴とする。
測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、を実行する演算装置と、を含むことを特徴とする。
また、本発明の情報処理方法は、情報処理装置が、不正取引に関する教師データを保持して、不正取引を検知する予測モデルに、前記教師データを入力することで予測スコアを取得する処理、前記教師データの正解値と前記予測スコアとの誤差を算定する処理、前記教師データのうち当該予測スコアが所定の閾値以下となる教師データを特定し、当該教師データに関する前記誤差に、所定アルゴリズムで決定した重み値を乗じて増幅させ、補正誤差を算定する処理、及び前記誤差および前記補正誤差を教師信号として、前記予測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、を実行することを特徴とする。
本発明によれば、不正取引の予測モデルにおける予測精度を効率的に改善可能となる。
−−−ネットワーク構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の情報処理装置100を含むネットワーク構成図である。図1に示す情報処理装置100は、不正取引の予測モデルにおける予測精度を効率的に改善可能とするコンピュータ装置である。
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の情報処理装置100を含むネットワーク構成図である。図1に示す情報処理装置100は、不正取引の予測モデルにおける予測精度を効率的に改善可能とするコンピュータ装置である。
本実施形態の情報処理装置100は、インターネットやLAN(Local Area
Network)などの適宜なネットワーク1を介して、ユーザ端末200、及び金融機関システム300と通信可能に接続されている。これらネットワーク1を介して接続されている機器類を情報処理システム10とする。この情報処理システム10を構成する書く機器が協働し、本実施形態の情報処理方法を実行するとしてもよい。
Network)などの適宜なネットワーク1を介して、ユーザ端末200、及び金融機関システム300と通信可能に接続されている。これらネットワーク1を介して接続されている機器類を情報処理システム10とする。この情報処理システム10を構成する書く機器が協働し、本実施形態の情報処理方法を実行するとしてもよい。
なお、図1で示すネットワーク構成は一例であって、情報処理装置100が、ユーザ端末200や金融機関システム300とは異なる他の機器類と接続されているケースや、或いは、情報処理装置100がスタンドアロンマシンとして稼働するケースなど、運用形態によって適宜な構成を想定しうる。
上述のうち、情報処理装置100は、金融機関か、或いは当該金融機関に不正取引の検知ソリューションを提供するベンダーが運用する、サーバ等の情報処理装置を想定できる。
また、ユーザ端末200は、金融機関の担当者か、或いは上述のベンダーの担当者が操作するPCやタブレット端末など一般的なクライアント端末を想定できる。ユーザ端末200は、例えば、情報処理装置100での処理結果の出力先となりうる。
金融機関システム300は、上述の金融機関が運用するシステムであり、当該金融機関における顧客らが行った金融取引の履歴や市場情報といった情報を管理している。この金融機関システム300は、金融機関において従来から運用されているシステムを想定できる。
−−−ハードウェア構成−−−
また、情報処理装置100のハードウェア構成は、図2に示す以下の如くとなる。すなわち情報処理装置100は、記憶装置101、メモリ103、演算装置104、入力装置105、出力装置106、および通信装置107を備えている。
また、情報処理装置100のハードウェア構成は、図2に示す以下の如くとなる。すなわち情報処理装置100は、記憶装置101、メモリ103、演算装置104、入力装置105、出力装置106、および通信装置107を備えている。
このうち記憶装置101は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。また、メモリ103は、RAMなど揮発性記憶素子で構成される。
また、演算装置104は、記憶装置101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUである。
この演算装置104は、金融機関システム300から取得した取引履歴DB325、疑義ラベルDB326、及び市場情報DB327といった学習用データを、プログラム102における学習器110に入力して機械学習を行い、取引履歴や市場情報を入力値とした場合に、対応する疑義ラベルが示す正常取引または不正取引を出力値とする予測モデル111を生成する。また、この予測モデル111に、本実施形態の情報処理方法を適用して誤差逆伝播学習を促進させることで、その予測精度が向上することとなる。
また、入力装置105は、ユーザからのキー入力や音声入力を受け付ける、キーボードやマウス、マイクなどの適宜な装置である。
また、出力装置106は、演算装置104での処理データの表示を行うディスプレイ、スピーカー等の適宜な装置である。
また、通信装置107は、ネットワーク1と接続して、ユーザ端末200や金融機関システム300など他装置との通信処理を担うネットワークインターフェイスカードである。
なお、上述の入力装置105、及び出力装置106は、必要に応じて備えるべきものであり、データ入出力の全てが通信装置107を介して外部装置(ユーザ端末200や金融機関システム300)と行われる形態の場合、不要である。
また、記憶装置101内には、本実施形態の情報処理装置として必要な機能を実装する為のプログラム102に加えて、教師データDB125、予測スコアテーブル126、通
常誤差テーブル127、及び補正誤差テーブル128が少なくとも記憶されている。これらデータベースやテーブルの詳細については後述する。
常誤差テーブル127、及び補正誤差テーブル128が少なくとも記憶されている。これらデータベースやテーブルの詳細については後述する。
また、本実施形態における金融機関システム300のハードウェア構成は、図3に示す以下の如くとなる。すなわち金融機関システム300は、記憶装置301、メモリ303、演算装置304、および通信装置305を備えている。
このうち記憶装置301は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
また、メモリ303は、RAMなど揮発性記憶素子で構成される。
また、メモリ303は、RAMなど揮発性記憶素子で構成される。
また、演算装置304は、記憶装置301に保持されるプログラム302をメモリ303に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUである。
また、通信装置307は、ネットワーク1と接続して、情報処理装置100など他装置との通信処理を担うネットワークインターフェイスカードである。なお、本実施形態の金融機関システム300において、入力装置及び出力装置を必要に応じて備えるとしてもよい。
また、記憶装置101内には、本実施形態の金融機関システム300として必要な機能を実装する為のプログラム302に加えて、取引履歴DB325、疑義ラベルDB326、及び市場情報DB327が少なくとも記憶されている。これらデータベースの詳細については後述する。
−−−データ構造例−−−
続いて、本実施形態の情報処理装置100が用いるテーブル類について説明する。図4に、本実施形態における教師データDB125の一例を示す。教師データDB125は、上述の金融機関での金融取引に関して、例えば、知見ある者が十分に吟味、確認した正常取引と不正取引の判定結果の正解を蓄積したテーブルである。
続いて、本実施形態の情報処理装置100が用いるテーブル類について説明する。図4に、本実施形態における教師データDB125の一例を示す。教師データDB125は、上述の金融機関での金融取引に関して、例えば、知見ある者が十分に吟味、確認した正常取引と不正取引の判定結果の正解を蓄積したテーブルである。
そのデータ構造は、例えば、教師データの識別情報をキーとして、取引属性、及び正解値といったデータから成るレコードの集合体である。このうち取引属性は、例えば、取引の対象、内容、顧客、といった項目に関する情報である。また、正解値は、正常取引の場合は「0」、不正取引の場合は「1」といった値である。
また、図5に、本実施形態における予測スコアテーブル126の一例を示す。予測スコアテーブル126は、上述の教師データDB125の教師データを、予測モデル111に入力して得た予測スコアを蓄積したテーブルである。
そのデータ構造は、例えば、教師データの識別情報をキーとして、取引属性、及び予測スコアといったデータから成るレコードの集合体である。このうち取引属性は、例えば、取引の対象、内容、顧客、といった項目に関する情報である。
また、予測スコアの値は、図6の概念例で示すように、「0」から所定の閾値(図の例では0.2)までの範囲の値が「正常取引」、閾値から「1」までの範囲の値が「不正取引」に対応するものとなっている。ただし、こうした値の大きさや範囲は一例であって、これに限定しない。
上述の予測モデル111に対し、処理対象となる所定数の教師データや取引履歴を与え
て得られた予測スコアの分布例を、図7に例示する。ここで予測モデル111に与えた教師データらは、その殆どが、正常取引と不正取引とで正しく分類されることになるが、不正取引のうち、その予測スコアが閾値以下、すなわち正常取引と判定されてしまう見逃し対象701が生じることがある。
て得られた予測スコアの分布例を、図7に例示する。ここで予測モデル111に与えた教師データらは、その殆どが、正常取引と不正取引とで正しく分類されることになるが、不正取引のうち、その予測スコアが閾値以下、すなわち正常取引と判定されてしまう見逃し対象701が生じることがある。
正常取引が不正取引と判定されてしまっても、それを最終的に検証するまでの手間はかかるものの、不正取引の見逃しにつながることは無い。一方、不正取引が正常取引と判定され見逃されてしまうと、当該金融機関の重大な信用問題等に発展する恐れもあり、絶対に回避したい事案である。
つまり、図8に示すように、実績(事実を正しく示した結果)と、予測モデル111による予測結果との関係において、正常取引の判定に関して結果が一致することは多いほどよく、正常取引を不正取引と判定する状況は少ないほどよい。一方、不正取引を正常取引と判定して見逃してしまう状況は皆無であることが絶対条件である。また、不正取引を不正取引と判定することに関しては、完全に一致することが条件となる。
続いて、図9に本実施形態の通常誤差テーブル127のデータ構成例を示す。本実施形態の通常誤差テーブル127は、上述の予測スコアテーブル126が示す各教師データに関する予測スコアのうち、当該教師データの正解値が示す正常取引/不正取引と、予測結果が異なるもの(例:不正取引と判定する閾値“0.2”よりも予測スコアが小さいもので、図9の例では、正解値が「1」である「No.4」の教師データに関する予測スコア
「0.15」)に関して、当該教師データの正解値(この例では「1」)との差異を通常誤差として算定した結果を蓄積したテーブルである。
「0.15」)に関して、当該教師データの正解値(この例では「1」)との差異を通常誤差として算定した結果を蓄積したテーブルである。
そのデータ構造は、例えば、予測スコアに紐付く教師データの識別情報をキーとして、当該予測スコアに関して得た通常誤差の値といったデータから成るレコードの集合体である。この通常誤差は、各教師データの予測スコアのうち、上述のように、所定の閾値を下回るもののみ、について得る。
また、図10に本実施形態の補正誤差テーブル128のデータ構成例を示す。本実施形態の補正誤差テーブル128は、上述の通常誤差テーブル127における各値のうち、上述の通常誤差を算定してもの(上述の例では、「No.4」の教師データに関する通常誤
差「0.85」)に関して、所定アルゴリズムで決定した重み値を乗じて増幅させたものを補正誤差として算定した結果を蓄積したテーブルである。
差「0.85」)に関して、所定アルゴリズムで決定した重み値を乗じて増幅させたものを補正誤差として算定した結果を蓄積したテーブルである。
そのデータ構造は、例えば、通常誤差に紐付く教師データの識別情報をキーとして、当該通常誤差に関して得た補正誤差の値といったデータから成るレコードの集合体である。この補正誤差は、各教師データのうち、上述のように通常誤差を算定したもののみ、について得る。
また、図11に本実施形態の取引履歴DB325のデータ構成例を示す。本実施形態の取引履歴DB325は、金融機関において処理された金融取引の履歴を蓄積したデータベースである。
そのデータ構造は、例えば、取引案件の識別情報をキーとして、当該取引の実行日時、対象、内容、及び顧客、といったデータから成るレコードの集合体である。このうち取引の対象は、例えば、入金、出金、株式売買、外為、外国送金、といった項目に関する情報である。また、取引の内容は、取引の金額や数量に関する値である。また、顧客は、当該取引の主体となった顧客の情報となる。いずれにしても、従来から金融機関で管理されている情報となる。
また、図12に本実施形態の疑義ラベルDB326のデータ構成例を示す。本実施形態の疑義ラベルDB326は、上述の取引履歴DB325の各金融取引に関して、当該金融機関にて不正取引の疑いあり、として特定したものに所定の識別子を付与して管理するデータベースである。
そのデータ構造は、例えば、取引案件の識別情報をキーとして、当該取引のうち不正取引の疑いありとされたものに関して付与される識別子(例えば、「1」)から成るレコードの集合体である。勿論、正常取引と判定したものに所定の識別子を付与するとしてもよい。
また、図13に本実施形態の市場情報DB327のデータ構成例を示す。本実施形態の市場情報DB327は、上述の取引履歴DB325の各金融取引の実行時における、市場情報を蓄積したデータベースである。こうした金融取引と市場情報とを合わせて踏まえることで、特定の市場状況下での或る金融取引は、意図的な市場操作につながるもの、といった取引の違法性を判定する示唆を得られる可能性がある。
そのデータ構造は、例えば、日時をキーとして、当該日時における市場情報といったデータから成るレコードの集合体である。市場情報としては、金利、株価、外国為替、金融当局の政策発表、など種々の情報を含みうる。
−−−フロー例−−−
以下、本実施形態における情報処理方法の実際手順について図に基づき説明する。以下で説明する情報処理方法に対応する各種動作は、情報処理装置100がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
以下、本実施形態における情報処理方法の実際手順について図に基づき説明する。以下で説明する情報処理方法に対応する各種動作は、情報処理装置100がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
図14は、本実施形態における情報処理方法のフロー例を示す図であり、図15は、本実施形態における情報処理方法を模式的に示す概念図である。
なお、このフローの開始に先立ち、情報処理装置100は、金融機関システム300から取引履歴DB325、疑義ラベルDB326、及び市場情報DB327といった学習用データを取得し、これを学習器110に入力することで予測モデル111を生成済みであるとする。
また、同様に、情報処理装置100は、取引履歴DB325及び疑義ラベルDB326とを踏まえて、取引履歴のうち疑義ラベルが「1」つまり、不正取引の疑いありとされたものに「1」、それ以外の取引を正常取引として「0」をそれぞれ付与し、教師データDB125を生成しているものとする。
まず、情報処理装置100は、予測モデル111に、上述の教師データDB125で保持する各レコードすなわち教師データを入力することで予測スコアを算定する(s10)。この算定の結果、予測スコアテーブル126が生成されることとなる。
続いて、情報処理装置100は、上述のs10で使用した教師データの正解値と、s10で得た予測スコアとの誤差すなわち通常誤差を算定する(s11)。例えば、図4、5の各例を踏まえるならば、「No.1」の教師データに関して得た予測スコア「0.01
」は、正解値「0」との誤差が「0.01」、「No.2」の教師データに関して得た予
測スコア「0.05」は、正解値「0」との誤差が「0.05」、「No.3」の教師デ
ータに関して得た予測スコア「0.11」は、正解値「0」との誤差が「0.11」、「
No.4」の教師データに関して得た予測スコア「0.15」は、正解値「1」との誤差
が「0.85」、などと算定される。こうして通常誤差を算定することで、通常誤差テーブル127が生成されることとなる。
」は、正解値「0」との誤差が「0.01」、「No.2」の教師データに関して得た予
測スコア「0.05」は、正解値「0」との誤差が「0.05」、「No.3」の教師デ
ータに関して得た予測スコア「0.11」は、正解値「0」との誤差が「0.11」、「
No.4」の教師データに関して得た予測スコア「0.15」は、正解値「1」との誤差
が「0.85」、などと算定される。こうして通常誤差を算定することで、通常誤差テーブル127が生成されることとなる。
また、情報処理装置100は、s10で得た予測スコアとs11で得た通常誤差とに基づき、教師データのうち正解値が不正取引を示すもので(s12:Yes)、かつ、当該教師データに関してs10で得た予測スコアが所定の閾値(例えば、0.2)以下となるものを判定する(s14:Yes)。
上述の判定の結果、不正取引ではない正常取引(s12:No)か、または予測スコアが閾値未満であるもの(s14:No)、について、情報処理装置100は、s11で得た通常誤差を用いて損失関数Lを重みwで偏微分する(s13)。
この損失関数Lは、誤差(通常誤差または補正誤差)を目的変数、補正誤差の値を説明変数x、その重みをw、とした関数を想定できる。損失関数Lに関して、重みwで偏微分した結果を、当該重みから減算した式は、損失関数Lの線分における或る重みでの傾きであり、偏微分した結果が負であれば、当該重みwを増やすことで損失すなわち誤差は小さくなる。また、偏微分した結果が正であれば、当該重みwを減らすことで損失すなわち誤差は小さくなる。
上述のようにwの増減を行うことで、損失すなわち誤差が最小となるwを探索することが可能となる。こうした概念自体は、誤差逆伝播学習に再急降下法を適用した場合に一般的な手法であり、詳細については省略する。
一方、上述の判定の結果、不正取引であり(s12:Yes)、かつ予測スコアが閾値を上回るもの(s14:Yes)、について、情報処理装置100は、s11において当該教師データの予測スコアに関して得ている通常誤差(例:No.4の教師データの予測
スコア「0.15」に関して居ている「0.85」)に、所定アルゴリズムで決定した重み値(例えば、「4」)を乗じて増幅させ、補正誤差を算定する(s15)。
スコア「0.15」に関して居ている「0.85」)に、所定アルゴリズムで決定した重み値(例えば、「4」)を乗じて増幅させ、補正誤差を算定する(s15)。
この場合、上述のNo.4の教師データに関する通常誤差は、本来ならば不正取引と判
定されるべきところを正常取引と判定されてしまう原因となっているものであり、ここの誤差を増幅して誤差逆伝播学習を行うことで、予測モデル111を改善することにつながる。
続いて、情報処理装置100は、増幅補正した補正誤差を含む補正誤差テーブル128を踏まえて、損失関数Lを重みwで偏微分する(s16)。
定されるべきところを正常取引と判定されてしまう原因となっているものであり、ここの誤差を増幅して誤差逆伝播学習を行うことで、予測モデル111を改善することにつながる。
続いて、情報処理装置100は、増幅補正した補正誤差を含む補正誤差テーブル128を踏まえて、損失関数Lを重みwで偏微分する(s16)。
また、情報処理装置100は、通常誤差及び(増幅補正を適宜行った)補正誤差に関して行った偏微分に基づいて誤差逆伝播学習(バックプロパゲーション)を実行し、予測モデル111の更新を実行し(s17)、処理を終了する。
上述のように補正誤差を増幅して偏微分(s16)すれば、その絶対値は大きくなり、誤差逆伝播学習によりwは更新されることとなる。
なお、図14のフローのうちs14において、通常誤差に乗じる重み値は、例えば、図16のフローに基づくアルゴリズムで決定すると好適である。この場合、情報処理装置100は、まず、予測スコアが閾値以下となる教師データに関して、当該教師データに関する予測スコアと閾値との差異を算定する(s20)。
続いて、情報処理装置100は、s20で得た差異の大きさを判定する(s21)。こ
のステップでは、例えば、差異が閾値の何%にあたるかを判定することとする。一例としては、差異が閾値の100〜99%、98〜75%、76〜50%、51〜25%、26〜1%、といった範囲のいずれに該当するか判定する。
のステップでは、例えば、差異が閾値の何%にあたるかを判定することとする。一例としては、差異が閾値の100〜99%、98〜75%、76〜50%、51〜25%、26〜1%、といった範囲のいずれに該当するか判定する。
続いて、情報処理装置100は、s21の判定の結果を踏まえ、差異が大きいほど重み値のデフォルト値を所定割合で増加させる一方、差異が小さいほど重み値のデフォルト値を所定割合で減少させる(s22)。
例えば、上述のデフォルト値を「5」、差異が閾値「0.2」の99%(すなわち差異は0.198)の場合、重み値を5×0.25=1.25と算定する。また、差異が閾値の75%(すなわち差異は0.15)の場合、重み値はデフォルト値「5」のままとする。
また、差異が閾値の50%(すなわち差異は0.1)の場合、重み値は5×1.25=6.25と算定する。また、差異が閾値の25%(すなわち差異は0.05)の場合、重み値は、5×2.5=12.5と算定する。また、差異が閾値の1%(すなわち差異は0.002)の場合、重み値は、5×4=20、と算定する。
なお、本実施形態では、重み値のデフォルト値を5とし、増幅補正した重み値の最小値を1、最大値を20としている。
続いて、情報処理装置100は、教師データのうち、予測スコアが閾値以下となる教師データの割合を算定する(s23)。
また、情報処理装置100は、s23で得た割合の大きさを判定する(s24)。ここでは、例えば、予測スコアが閾値0.2を下回った教師データの割合が、10%以上、10%未満5%以上、5%未満1%以上、1%未満0%以上、といった区分で判定を行う。
続いて、情報処理装置100は、s22までで増幅補正している重み値に対し、s24の判定結果を踏まえて増加又は減少の処理を行う(s25)。この場合、上述の割合が10%以上の場合、それまでの重み値を1.5倍し、10%未満5%以上の場合は増減無し、5%未満1%以上の場合は0.8倍する、といった処理を行う。
このように、情報処理装置100は、重み値のデフォルト値を、所定の割合で増加又は減少させる際、s21、s22における差異に基づく増加又は減少の程度を主、s23〜s25における割合に基づく増加又は減少の程度を従として、重み値のデフォルト値を増大又は減少させ、重み値を決定するとすれば、予測モデル111に関する誤差逆伝播学習における実効性の観点で好適である。
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
こうした本実施形態によれば、不正取引の予測モデルにおける予測精度を効率的に改善可能となる。
こうした本実施形態によれば、不正取引の予測モデルにおける予測精度を効率的に改善可能となる。
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の情報処理装置において、前記演算装置は、前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定し、前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、ことを特徴とする。
これによれば、不正取引の見逃し対象となった教師データに関して、予測モデルにおいて対応する中間層の重みに特にフォーカスし、誤差逆伝播学習を促進しやすくなる。ひいては、不正取引の予測モデルにおける予測精度をさらに効率的に改善可能となる。
また、本実施形態の情報処理装置において、前記演算装置は、前記重み値の決定に際し、前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定し、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、としてもよい。
これによれば、不正取引見逃しの発生割合の高さを踏まえて、予測モデルの誤差逆伝播学習を促進しやすくなる。ひいては、不正取引の予測モデルにおける予測精度をさらに効率的に改善可能となる。
また、本実施形態の情報処理装置において、前記演算装置は、前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定する処理、及び前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定する処理をさらに実行し、前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、としてもよい。
これによれば、予測モデルの精度改善すなわち誤差逆伝播学習を、複数の観点から促進することが可能となる。ひいては、不正取引の予測モデルにおける予測精度をさらに効率的に改善可能となる。
また、本実施形態の情報処理装置において、前記演算装置は、前記デフォルト値を増加又は減少させる際、前記差異に基づく増加又は減少の程度を主、前記割合に基づく増加又は減少の程度を従として、前記重み値のデフォルト値を増大又は減少させ、重み値を決定するものである、としてもよい。
これによれば、予測モデルの精度改善すなわち誤差逆伝播学習への影響の与えやすさに応じて、重み値の取り扱いを動的に制御することが可能となる。ひいては、不正取引の予測モデルにおける予測精度をさらに効率的に改善可能となる。
また、本実施形態の情報処理装置において、前記演算装置は、前記重み値のデフォルト値を5とし、前記重み値の最小値を1、最大値を20として、前記デフォルト値を増加又は減少させるものである、としてもよい。
これによれば、予測モデルの精度改善すなわち誤差逆伝播学習への影響の与えやすさに応じて、重み値の取り扱いを動的に制御する際、その範囲を特に有為な範囲に限定して効率的に行うことが可能となる。ひいては、不正取引の予測モデルにおける予測精度をさらに効率的に改善可能となる。
また、本実施形態の情報処理方法において、前記情報処理装置が、前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定し、前記差異が所定基準より大きいほど前記
重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、としてもよい。
重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、としてもよい。
また、本実施形態の情報処理方法において、前記情報処理装置が、前記重み値の決定に際し、前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定し、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、としてもよい。
また、本実施形態の情報処理方法において、前記情報処理装置が、前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定する処理、及び前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定する処理をさらに実行し、前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、としてもよい。
また、本実施形態の情報処理方法において、前記情報処理装置が、前記デフォルト値を増加又は減少させる際、前記差異に基づく増加又は減少の程度を主、前記割合に基づく増加又は減少の程度を従として、前記重み値のデフォルト値を増大又は減少させ、重み値を決定する、としてもよい。
また、本実施形態の情報処理方法において、前記情報処理装置が、前記重み値のデフォルト値を5とし、前記重み値の最小値を1、最大値を20として、前記デフォルト値を増加又は減少させる、としてもよい。
1 ネットワーク
10 情報処理システム
100 情報処理装置
101 記憶装置
102 プログラム
103 メモリ
104 演算装置
105 入力装置
106 出力装置
107 通信装置
110 学習器
111 予測モデル
125 教師データDB
126 予測スコアテーブル
127 通常誤差テーブル
128 補正誤差テーブル
200 ユーザ端末
300 金融機関システム
325 取引履歴DB
326 疑義ラベルDB
327 市場情報DB
10 情報処理システム
100 情報処理装置
101 記憶装置
102 プログラム
103 メモリ
104 演算装置
105 入力装置
106 出力装置
107 通信装置
110 学習器
111 予測モデル
125 教師データDB
126 予測スコアテーブル
127 通常誤差テーブル
128 補正誤差テーブル
200 ユーザ端末
300 金融機関システム
325 取引履歴DB
326 疑義ラベルDB
327 市場情報DB
Claims (12)
- 不正取引に関する教師データを保持する記憶装置と、
不正取引を検知する予測モデルに、前記教師データを入力することで予測スコアを取得する処理、前記教師データの正解値と前記予測スコアとの誤差を算定する処理、前記教師データのうち当該予測スコアが所定の閾値以下となる教師データを特定し、当該教師データに関する前記誤差に、所定アルゴリズムで決定した重み値を乗じて増幅させ、補正誤差を算定する処理、及び前記誤差および前記補正誤差を教師信号として、前記予測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、を実行する演算装置と、
を含むことを特徴とする情報処理装置。 - 前記演算装置は、
前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定し、前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記演算装置は、
前記重み値の決定に際し、前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定し、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記演算装置は、
前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定する処理、及び前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定する処理をさらに実行し、
前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、
ことを特徴とする請求項1に記載の情報処理装置。 - 前記演算装置は、
前記デフォルト値を増加又は減少させる際、前記差異に基づく増加又は減少の程度を主、前記割合に基づく増加又は減少の程度を従として、前記重み値のデフォルト値を増大又は減少させ、重み値を決定するものである、
ことを特徴とする請求項4に記載の情報処理装置。 - 前記演算装置は、
前記重み値のデフォルト値を5とし、前記重み値の最小値を1、最大値を20として、前記デフォルト値を増加又は減少させるものである、
ことを特徴とする請求項5に記載の情報処理装置。 - 情報処理装置が、
不正取引に関する教師データを保持して、
不正取引を検知する予測モデルに、前記教師データを入力することで予測スコアを取得する処理、前記教師データの正解値と前記予測スコアとの誤差を算定する処理、前記教師データのうち当該予測スコアが所定の閾値以下となる教師データを特定し、当該教師データに関する前記誤差に、所定アルゴリズムで決定した重み値を乗じて増幅させ、補正誤差を算定する処理、及び前記誤差および前記補正誤差を教師信号として、前記予測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、
を実行することを特徴とする情報処理方法。 - 前記情報処理装置が、
前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定し、前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、
ことを特徴とする請求項7に記載の情報処理方法。 - 前記情報処理装置が、
前記重み値の決定に際し、前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定し、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、
ことを特徴とする請求項7に記載の情報処理方法。 - 前記情報処理装置が、
前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定する処理、及び前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定する処理をさらに実行し、
前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、
ことを特徴とする請求項7に記載の情報処理方法。 - 前記情報処理装置が、
前記デフォルト値を増加又は減少させる際、前記差異に基づく増加又は減少の程度を主、前記割合に基づく増加又は減少の程度を従として、前記重み値のデフォルト値を増大又は減少させ、重み値を決定する、
ことを特徴とする請求項10に記載の情報処理方法。 - 前記情報処理装置が、
前記重み値のデフォルト値を5とし、前記重み値の最小値を1、最大値を20として、前記デフォルト値を増加又は減少させる、
ことを特徴とする請求項11に記載の情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019200187A JP2021072057A (ja) | 2019-11-01 | 2019-11-01 | 情報処理装置および情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019200187A JP2021072057A (ja) | 2019-11-01 | 2019-11-01 | 情報処理装置および情報処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021072057A true JP2021072057A (ja) | 2021-05-06 |
Family
ID=75713278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019200187A Pending JP2021072057A (ja) | 2019-11-01 | 2019-11-01 | 情報処理装置および情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021072057A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113435798A (zh) * | 2021-08-26 | 2021-09-24 | 北京交研智慧科技有限公司 | 执法培训方法、设备及可读存储介质 |
WO2023100846A1 (ja) * | 2021-12-01 | 2023-06-08 | 日本電気株式会社 | 口座監視装置、口座監視方法、及び非一時的なコンピュータ可読記録媒体 |
WO2023175903A1 (ja) * | 2022-03-18 | 2023-09-21 | 日本電気株式会社 | 監視システム、モデル生成装置、モデル生成方法および記録媒体 |
-
2019
- 2019-11-01 JP JP2019200187A patent/JP2021072057A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113435798A (zh) * | 2021-08-26 | 2021-09-24 | 北京交研智慧科技有限公司 | 执法培训方法、设备及可读存储介质 |
WO2023100846A1 (ja) * | 2021-12-01 | 2023-06-08 | 日本電気株式会社 | 口座監視装置、口座監視方法、及び非一時的なコンピュータ可読記録媒体 |
WO2023175903A1 (ja) * | 2022-03-18 | 2023-09-21 | 日本電気株式会社 | 監視システム、モデル生成装置、モデル生成方法および記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11599884B2 (en) | Identification of behavioral pattern of simulated transaction data | |
CN111192131A (zh) | 金融风险预测方法、装置和电子设备 | |
JP2021072057A (ja) | 情報処理装置および情報処理方法 | |
JP7472496B2 (ja) | モデル生成装置、モデル生成方法、及び、記録媒体 | |
CN112541817A (zh) | 一种个人消费贷款潜在客户的营销响应处理方法及系统 | |
Chang et al. | Establishing decision tree-based short-term default credit risk assessment models | |
CN108537397A (zh) | 一种互联网征信评估方法和系统 | |
US20240013919A1 (en) | Supervised machine learning-based modeling of sensitivities to potential disruptions | |
US20190392295A1 (en) | Information processing device, method, and program that use deep learning | |
US11556734B2 (en) | System and method for unsupervised abstraction of sensitive data for realistic modeling | |
US11461793B2 (en) | Identification of behavioral pattern of simulated transaction data | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
CN112734566B (zh) | 授信额度获取方法、装置及计算机设备 | |
US11475468B2 (en) | System and method for unsupervised abstraction of sensitive data for detection model sharing across entities | |
JP7153613B2 (ja) | 顧客管理システム、及び顧客管理方法 | |
US20210133586A1 (en) | System and method for unsupervised abstraction of sensitive data for realistic modeling | |
US20210133488A1 (en) | System and method for unsupervised abstraction of sensitive data for consortium sharing | |
JP7345032B1 (ja) | 与信審査装置、方法及びプログラム | |
CN111382909A (zh) | 基于生存分析模型扩展坏样本的拒绝推断方法及相关设备 | |
US11494835B2 (en) | Intelligent agent to simulate financial transactions | |
US11842357B2 (en) | Intelligent agent to simulate customer data | |
US11676218B2 (en) | Intelligent agent to simulate customer data | |
JP7549423B2 (ja) | コンソーシアム共有のための機密データの教師なし抽象化のためのシステム及び方法 | |
US20210133751A1 (en) | Intelligent agent to simulate financial transactions | |
CN113743641B (zh) | 一种物品识别方法和装置 |