JP2021072057A

JP2021072057A - 情報処理装置および情報処理方法

Info

Publication number: JP2021072057A
Application number: JP2019200187A
Authority: JP
Inventors: 太郎山根; Taro Yamane; 小林　祐介; Yusuke Kobayashi; 祐介小林; 琢矢辻; Takuya Tsuji
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2019-11-01
Filing date: 2019-11-01
Publication date: 2021-05-06

Abstract

【課題】不正取引の予測モデルにおける予測精度を効率的に改善可能とする。【解決手段】情報処理装置１００において、不正取引に関する教師データを保持する記憶装置１０１と、不正取引を検知する予測モデルに、前記教師データを入力することで予測スコアを取得する処理、前記教師データの正解値と前記予測スコアとの誤差を算定する処理、前記教師データのうち当該予測スコアが所定の閾値以下となる教師データを特定し、当該教師データに関する前記誤差に、所定アルゴリズムで決定した重み値を乗じて増幅させ、補正誤差を算定する処理、及び前記誤差および前記補正誤差を教師信号として、前記予測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、を実行する演算装置１０４を含む構成とする。【選択図】図２

Description

本発明は、情報処理装置および情報処理方法に関するものであり、具体的には、不正取引の予測モデルにおける予測精度を効率的に改善可能とする技術に関する。

いわゆるフィンテックの進化と共に、金融取引の大幅な自動化、高速化が可能となってきた。そのため、金融機関において取り扱う取引のトランザクションも、従来と比べて増大傾向にある。一方で、巧妙化した不正取引も後を絶たず、その検知の重要性は高まるばかりである。

こうした不正取引の検知業務では、例えば、母集団となる膨大な取引履歴に対して所定のルールベースを適用し、疑義ある取引の自動抽出を行う。また、ここで自動抽出した取引群を新たな母集団とした、知見ある者による数次に亘る調査を経て、最終的に不正取引を特定している。

ここで、上述の従来手法のうち人間による調査手順については、人工知能による自動判断に置換し、全体として業務効率を高める動きがある。例えば、顧客勘定に関する取引の不正を検出するためのコンピュータで実施される処理が、過去取引データから予測モデルを開発するステップ、前記予測モデルをコンピュータに関連する媒体に記憶するステップ、現在取引データを得るステップ、顧客データを得るステップ、及び、記憶された予測モデルに対して前記現在取引データと前記顧客データを適用することに応答して、不正の可能性を示す信号を生成するステップを含む不正検出手法（特許文献１参照）などが提案されている。

特表平８−５０４２８４号公報

上述のように、不正取引の検知に人工知能を用いることで、表面上、業務効率は改善されやすくなる。ところが、本来は不正取引である取引であっても、その判定スコアが閾値を下回っていれば正常な取引として見逃すケースが存在する。

不正取引を正常な取引として見逃すことは、その数や頻度が少ないとしても重大な結果を招来しうる。そのため、人手による再調査を、対象母集団の広範囲に亘って行うこととなる。つまり、結果として業務効率がかえって低下しかねないと言える。
そこで本発明の目的は、不正取引の予測モデルにおける予測精度を効率的に改善可能とする技術を提供することにある。

上記課題を解決する本発明の情報処理装置は、不正取引に関する教師データを保持する記憶装置と、不正取引を検知する予測モデルに、前記教師データを入力することで予測スコアを取得する処理、前記教師データの正解値と前記予測スコアとの誤差を算定する処理、前記教師データのうち当該予測スコアが所定の閾値以下となる教師データを特定し、当該教師データに関する前記誤差に、所定アルゴリズムで決定した重み値を乗じて増幅させ、補正誤差を算定する処理、及び前記誤差および前記補正誤差を教師信号として、前記予
測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、を実行する演算装置と、を含むことを特徴とする。

また、本発明の情報処理方法は、情報処理装置が、不正取引に関する教師データを保持して、不正取引を検知する予測モデルに、前記教師データを入力することで予測スコアを取得する処理、前記教師データの正解値と前記予測スコアとの誤差を算定する処理、前記教師データのうち当該予測スコアが所定の閾値以下となる教師データを特定し、当該教師データに関する前記誤差に、所定アルゴリズムで決定した重み値を乗じて増幅させ、補正誤差を算定する処理、及び前記誤差および前記補正誤差を教師信号として、前記予測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、を実行することを特徴とする。

本発明によれば、不正取引の予測モデルにおける予測精度を効率的に改善可能となる。

本実施形態の情報処理装置を含むネットワーク構成図である。本実施形態における情報処理装置のハードウェア構成例を示す図である。本実施形態の金融機関システムのハードウェア構成例を示す図である。本実施形態の教師データＤＢのデータ構成例を示す図である。本実施形態の予測スコアテーブルのデータ構成例を示す図である。本実施形態の予測スコアの概念を示す図である。本実施形態の予測スコアの分布例を示す図である。本実施形態の不正取引検知の良否条件を示す図である。本実施形態の通常誤差テーブルのデータ構成例を示す図である。本実施形態の補正誤差テーブルのデータ構成例を示す図である。本実施形態の取引履歴ＤＢのデータ構成例を示す図である。本実施形態の疑義ラベルＤＢのデータ構成例を示す図である。本実施形態の市場情報ＤＢのデータ構成例を示す図である。本実施形態における情報処理方法のフロー例を示す図である。本実施形態における情報処理方法の概念例を示す図である。本実施形態における情報処理方法のフロー例を示す図である。

−−−ネットワーク構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図１は、本実施形態の情報処理装置１００を含むネットワーク構成図である。図１に示す情報処理装置１００は、不正取引の予測モデルにおける予測精度を効率的に改善可能とするコンピュータ装置である。

本実施形態の情報処理装置１００は、インターネットやＬＡＮ（ＬｏｃａｌＡｒｅａ
Ｎｅｔｗｏｒｋ）などの適宜なネットワーク１を介して、ユーザ端末２００、及び金融機関システム３００と通信可能に接続されている。これらネットワーク１を介して接続されている機器類を情報処理システム１０とする。この情報処理システム１０を構成する書く機器が協働し、本実施形態の情報処理方法を実行するとしてもよい。

なお、図１で示すネットワーク構成は一例であって、情報処理装置１００が、ユーザ端末２００や金融機関システム３００とは異なる他の機器類と接続されているケースや、或いは、情報処理装置１００がスタンドアロンマシンとして稼働するケースなど、運用形態によって適宜な構成を想定しうる。

上述のうち、情報処理装置１００は、金融機関か、或いは当該金融機関に不正取引の検知ソリューションを提供するベンダーが運用する、サーバ等の情報処理装置を想定できる。

また、ユーザ端末２００は、金融機関の担当者か、或いは上述のベンダーの担当者が操作するＰＣやタブレット端末など一般的なクライアント端末を想定できる。ユーザ端末２００は、例えば、情報処理装置１００での処理結果の出力先となりうる。

金融機関システム３００は、上述の金融機関が運用するシステムであり、当該金融機関における顧客らが行った金融取引の履歴や市場情報といった情報を管理している。この金融機関システム３００は、金融機関において従来から運用されているシステムを想定できる。

−−−ハードウェア構成−−−
また、情報処理装置１００のハードウェア構成は、図２に示す以下の如くとなる。すなわち情報処理装置１００は、記憶装置１０１、メモリ１０３、演算装置１０４、入力装置１０５、出力装置１０６、および通信装置１０７を備えている。

このうち記憶装置１０１は、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。また、メモリ１０３は、ＲＡＭなど揮発性記憶素子で構成される。

また、演算装置１０４は、記憶装置１０１に保持されるプログラム１０２をメモリ１０３に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうＣＰＵである。

この演算装置１０４は、金融機関システム３００から取得した取引履歴ＤＢ３２５、疑義ラベルＤＢ３２６、及び市場情報ＤＢ３２７といった学習用データを、プログラム１０２における学習器１１０に入力して機械学習を行い、取引履歴や市場情報を入力値とした場合に、対応する疑義ラベルが示す正常取引または不正取引を出力値とする予測モデル１１１を生成する。また、この予測モデル１１１に、本実施形態の情報処理方法を適用して誤差逆伝播学習を促進させることで、その予測精度が向上することとなる。

また、入力装置１０５は、ユーザからのキー入力や音声入力を受け付ける、キーボードやマウス、マイクなどの適宜な装置である。

また、出力装置１０６は、演算装置１０４での処理データの表示を行うディスプレイ、スピーカー等の適宜な装置である。

また、通信装置１０７は、ネットワーク１と接続して、ユーザ端末２００や金融機関システム３００など他装置との通信処理を担うネットワークインターフェイスカードである。

なお、上述の入力装置１０５、及び出力装置１０６は、必要に応じて備えるべきものであり、データ入出力の全てが通信装置１０７を介して外部装置（ユーザ端末２００や金融機関システム３００）と行われる形態の場合、不要である。

また、記憶装置１０１内には、本実施形態の情報処理装置として必要な機能を実装する為のプログラム１０２に加えて、教師データＤＢ１２５、予測スコアテーブル１２６、通
常誤差テーブル１２７、及び補正誤差テーブル１２８が少なくとも記憶されている。これらデータベースやテーブルの詳細については後述する。

また、本実施形態における金融機関システム３００のハードウェア構成は、図３に示す以下の如くとなる。すなわち金融機関システム３００は、記憶装置３０１、メモリ３０３、演算装置３０４、および通信装置３０５を備えている。

このうち記憶装置３０１は、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
また、メモリ３０３は、ＲＡＭなど揮発性記憶素子で構成される。

また、演算装置３０４は、記憶装置３０１に保持されるプログラム３０２をメモリ３０３に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうＣＰＵである。

また、通信装置３０７は、ネットワーク１と接続して、情報処理装置１００など他装置との通信処理を担うネットワークインターフェイスカードである。なお、本実施形態の金融機関システム３００において、入力装置及び出力装置を必要に応じて備えるとしてもよい。

また、記憶装置１０１内には、本実施形態の金融機関システム３００として必要な機能を実装する為のプログラム３０２に加えて、取引履歴ＤＢ３２５、疑義ラベルＤＢ３２６、及び市場情報ＤＢ３２７が少なくとも記憶されている。これらデータベースの詳細については後述する。

−−−データ構造例−−−
続いて、本実施形態の情報処理装置１００が用いるテーブル類について説明する。図４に、本実施形態における教師データＤＢ１２５の一例を示す。教師データＤＢ１２５は、上述の金融機関での金融取引に関して、例えば、知見ある者が十分に吟味、確認した正常取引と不正取引の判定結果の正解を蓄積したテーブルである。

そのデータ構造は、例えば、教師データの識別情報をキーとして、取引属性、及び正解値といったデータから成るレコードの集合体である。このうち取引属性は、例えば、取引の対象、内容、顧客、といった項目に関する情報である。また、正解値は、正常取引の場合は「０」、不正取引の場合は「１」といった値である。

また、図５に、本実施形態における予測スコアテーブル１２６の一例を示す。予測スコアテーブル１２６は、上述の教師データＤＢ１２５の教師データを、予測モデル１１１に入力して得た予測スコアを蓄積したテーブルである。

そのデータ構造は、例えば、教師データの識別情報をキーとして、取引属性、及び予測スコアといったデータから成るレコードの集合体である。このうち取引属性は、例えば、取引の対象、内容、顧客、といった項目に関する情報である。

また、予測スコアの値は、図６の概念例で示すように、「０」から所定の閾値（図の例では０．２）までの範囲の値が「正常取引」、閾値から「１」までの範囲の値が「不正取引」に対応するものとなっている。ただし、こうした値の大きさや範囲は一例であって、これに限定しない。

上述の予測モデル１１１に対し、処理対象となる所定数の教師データや取引履歴を与え
て得られた予測スコアの分布例を、図７に例示する。ここで予測モデル１１１に与えた教師データらは、その殆どが、正常取引と不正取引とで正しく分類されることになるが、不正取引のうち、その予測スコアが閾値以下、すなわち正常取引と判定されてしまう見逃し対象７０１が生じることがある。

正常取引が不正取引と判定されてしまっても、それを最終的に検証するまでの手間はかかるものの、不正取引の見逃しにつながることは無い。一方、不正取引が正常取引と判定され見逃されてしまうと、当該金融機関の重大な信用問題等に発展する恐れもあり、絶対に回避したい事案である。

つまり、図８に示すように、実績（事実を正しく示した結果）と、予測モデル１１１による予測結果との関係において、正常取引の判定に関して結果が一致することは多いほどよく、正常取引を不正取引と判定する状況は少ないほどよい。一方、不正取引を正常取引と判定して見逃してしまう状況は皆無であることが絶対条件である。また、不正取引を不正取引と判定することに関しては、完全に一致することが条件となる。

続いて、図９に本実施形態の通常誤差テーブル１２７のデータ構成例を示す。本実施形態の通常誤差テーブル１２７は、上述の予測スコアテーブル１２６が示す各教師データに関する予測スコアのうち、当該教師データの正解値が示す正常取引／不正取引と、予測結果が異なるもの（例：不正取引と判定する閾値“０．２”よりも予測スコアが小さいもので、図９の例では、正解値が「１」である「Ｎｏ.４」の教師データに関する予測スコア
「０．１５」）に関して、当該教師データの正解値（この例では「１」）との差異を通常誤差として算定した結果を蓄積したテーブルである。

そのデータ構造は、例えば、予測スコアに紐付く教師データの識別情報をキーとして、当該予測スコアに関して得た通常誤差の値といったデータから成るレコードの集合体である。この通常誤差は、各教師データの予測スコアのうち、上述のように、所定の閾値を下回るもののみ、について得る。

また、図１０に本実施形態の補正誤差テーブル１２８のデータ構成例を示す。本実施形態の補正誤差テーブル１２８は、上述の通常誤差テーブル１２７における各値のうち、上述の通常誤差を算定してもの（上述の例では、「Ｎｏ.４」の教師データに関する通常誤
差「０．８５」）に関して、所定アルゴリズムで決定した重み値を乗じて増幅させたものを補正誤差として算定した結果を蓄積したテーブルである。

そのデータ構造は、例えば、通常誤差に紐付く教師データの識別情報をキーとして、当該通常誤差に関して得た補正誤差の値といったデータから成るレコードの集合体である。この補正誤差は、各教師データのうち、上述のように通常誤差を算定したもののみ、について得る。

また、図１１に本実施形態の取引履歴ＤＢ３２５のデータ構成例を示す。本実施形態の取引履歴ＤＢ３２５は、金融機関において処理された金融取引の履歴を蓄積したデータベースである。

そのデータ構造は、例えば、取引案件の識別情報をキーとして、当該取引の実行日時、対象、内容、及び顧客、といったデータから成るレコードの集合体である。このうち取引の対象は、例えば、入金、出金、株式売買、外為、外国送金、といった項目に関する情報である。また、取引の内容は、取引の金額や数量に関する値である。また、顧客は、当該取引の主体となった顧客の情報となる。いずれにしても、従来から金融機関で管理されている情報となる。

また、図１２に本実施形態の疑義ラベルＤＢ３２６のデータ構成例を示す。本実施形態の疑義ラベルＤＢ３２６は、上述の取引履歴ＤＢ３２５の各金融取引に関して、当該金融機関にて不正取引の疑いあり、として特定したものに所定の識別子を付与して管理するデータベースである。

そのデータ構造は、例えば、取引案件の識別情報をキーとして、当該取引のうち不正取引の疑いありとされたものに関して付与される識別子（例えば、「１」）から成るレコードの集合体である。勿論、正常取引と判定したものに所定の識別子を付与するとしてもよい。

また、図１３に本実施形態の市場情報ＤＢ３２７のデータ構成例を示す。本実施形態の市場情報ＤＢ３２７は、上述の取引履歴ＤＢ３２５の各金融取引の実行時における、市場情報を蓄積したデータベースである。こうした金融取引と市場情報とを合わせて踏まえることで、特定の市場状況下での或る金融取引は、意図的な市場操作につながるもの、といった取引の違法性を判定する示唆を得られる可能性がある。

そのデータ構造は、例えば、日時をキーとして、当該日時における市場情報といったデータから成るレコードの集合体である。市場情報としては、金利、株価、外国為替、金融当局の政策発表、など種々の情報を含みうる。

−−−フロー例−−−
以下、本実施形態における情報処理方法の実際手順について図に基づき説明する。以下で説明する情報処理方法に対応する各種動作は、情報処理装置１００がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。

図１４は、本実施形態における情報処理方法のフロー例を示す図であり、図１５は、本実施形態における情報処理方法を模式的に示す概念図である。

なお、このフローの開始に先立ち、情報処理装置１００は、金融機関システム３００から取引履歴ＤＢ３２５、疑義ラベルＤＢ３２６、及び市場情報ＤＢ３２７といった学習用データを取得し、これを学習器１１０に入力することで予測モデル１１１を生成済みであるとする。

また、同様に、情報処理装置１００は、取引履歴ＤＢ３２５及び疑義ラベルＤＢ３２６とを踏まえて、取引履歴のうち疑義ラベルが「１」つまり、不正取引の疑いありとされたものに「１」、それ以外の取引を正常取引として「０」をそれぞれ付与し、教師データＤＢ１２５を生成しているものとする。

まず、情報処理装置１００は、予測モデル１１１に、上述の教師データＤＢ１２５で保持する各レコードすなわち教師データを入力することで予測スコアを算定する（ｓ１０）。この算定の結果、予測スコアテーブル１２６が生成されることとなる。

続いて、情報処理装置１００は、上述のｓ１０で使用した教師データの正解値と、ｓ１０で得た予測スコアとの誤差すなわち通常誤差を算定する（ｓ１１）。例えば、図４、５の各例を踏まえるならば、「Ｎｏ.１」の教師データに関して得た予測スコア「０．０１
」は、正解値「０」との誤差が「０．０１」、「Ｎｏ.２」の教師データに関して得た予
測スコア「０．０５」は、正解値「０」との誤差が「０．０５」、「Ｎｏ.３」の教師デ
ータに関して得た予測スコア「０．１１」は、正解値「０」との誤差が「０．１１」、「
Ｎｏ.４」の教師データに関して得た予測スコア「０．１５」は、正解値「１」との誤差
が「０．８５」、などと算定される。こうして通常誤差を算定することで、通常誤差テーブル１２７が生成されることとなる。

また、情報処理装置１００は、ｓ１０で得た予測スコアとｓ１１で得た通常誤差とに基づき、教師データのうち正解値が不正取引を示すもので（ｓ１２：Ｙｅｓ）、かつ、当該教師データに関してｓ１０で得た予測スコアが所定の閾値（例えば、０．２）以下となるものを判定する（ｓ１４：Ｙｅｓ）。

上述の判定の結果、不正取引ではない正常取引（ｓ１２：Ｎｏ）か、または予測スコアが閾値未満であるもの（ｓ１４：Ｎｏ）、について、情報処理装置１００は、ｓ１１で得た通常誤差を用いて損失関数Ｌを重みｗで偏微分する（ｓ１３）。

この損失関数Ｌは、誤差（通常誤差または補正誤差）を目的変数、補正誤差の値を説明変数ｘ、その重みをｗ、とした関数を想定できる。損失関数Ｌに関して、重みｗで偏微分した結果を、当該重みから減算した式は、損失関数Ｌの線分における或る重みでの傾きであり、偏微分した結果が負であれば、当該重みｗを増やすことで損失すなわち誤差は小さくなる。また、偏微分した結果が正であれば、当該重みｗを減らすことで損失すなわち誤差は小さくなる。

上述のようにｗの増減を行うことで、損失すなわち誤差が最小となるｗを探索することが可能となる。こうした概念自体は、誤差逆伝播学習に再急降下法を適用した場合に一般的な手法であり、詳細については省略する。

一方、上述の判定の結果、不正取引であり（ｓ１２：Ｙｅｓ）、かつ予測スコアが閾値を上回るもの（ｓ１４：Ｙｅｓ）、について、情報処理装置１００は、ｓ１１において当該教師データの予測スコアに関して得ている通常誤差（例：Ｎｏ.４の教師データの予測
スコア「０．１５」に関して居ている「０．８５」）に、所定アルゴリズムで決定した重み値（例えば、「４」）を乗じて増幅させ、補正誤差を算定する（ｓ１５）。

この場合、上述のＮｏ.４の教師データに関する通常誤差は、本来ならば不正取引と判
定されるべきところを正常取引と判定されてしまう原因となっているものであり、ここの誤差を増幅して誤差逆伝播学習を行うことで、予測モデル１１１を改善することにつながる。
続いて、情報処理装置１００は、増幅補正した補正誤差を含む補正誤差テーブル１２８を踏まえて、損失関数Ｌを重みｗで偏微分する（ｓ１６）。

また、情報処理装置１００は、通常誤差及び（増幅補正を適宜行った）補正誤差に関して行った偏微分に基づいて誤差逆伝播学習（バックプロパゲーション）を実行し、予測モデル１１１の更新を実行し（ｓ１７）、処理を終了する。

上述のように補正誤差を増幅して偏微分（ｓ１６）すれば、その絶対値は大きくなり、誤差逆伝播学習によりｗは更新されることとなる。

なお、図１４のフローのうちｓ１４において、通常誤差に乗じる重み値は、例えば、図１６のフローに基づくアルゴリズムで決定すると好適である。この場合、情報処理装置１００は、まず、予測スコアが閾値以下となる教師データに関して、当該教師データに関する予測スコアと閾値との差異を算定する（ｓ２０）。

続いて、情報処理装置１００は、ｓ２０で得た差異の大きさを判定する（ｓ２１）。こ
のステップでは、例えば、差異が閾値の何％にあたるかを判定することとする。一例としては、差異が閾値の１００〜９９％、９８〜７５％、７６〜５０％、５１〜２５％、２６〜１％、といった範囲のいずれに該当するか判定する。

続いて、情報処理装置１００は、ｓ２１の判定の結果を踏まえ、差異が大きいほど重み値のデフォルト値を所定割合で増加させる一方、差異が小さいほど重み値のデフォルト値を所定割合で減少させる（ｓ２２）。

例えば、上述のデフォルト値を「５」、差異が閾値「０．２」の９９％（すなわち差異は０．１９８）の場合、重み値を５×０．２５＝１．２５と算定する。また、差異が閾値の７５％（すなわち差異は０．１５）の場合、重み値はデフォルト値「５」のままとする。

また、差異が閾値の５０％（すなわち差異は０．１）の場合、重み値は５×１．２５＝６．２５と算定する。また、差異が閾値の２５％（すなわち差異は０．０５）の場合、重み値は、５×２．５＝１２．５と算定する。また、差異が閾値の１％（すなわち差異は０．００２）の場合、重み値は、５×４＝２０、と算定する。

なお、本実施形態では、重み値のデフォルト値を５とし、増幅補正した重み値の最小値を１、最大値を２０としている。

続いて、情報処理装置１００は、教師データのうち、予測スコアが閾値以下となる教師データの割合を算定する（ｓ２３）。

また、情報処理装置１００は、ｓ２３で得た割合の大きさを判定する（ｓ２４）。ここでは、例えば、予測スコアが閾値０．２を下回った教師データの割合が、１０％以上、１０％未満５％以上、５％未満１％以上、１％未満０％以上、といった区分で判定を行う。

続いて、情報処理装置１００は、ｓ２２までで増幅補正している重み値に対し、ｓ２４の判定結果を踏まえて増加又は減少の処理を行う（ｓ２５）。この場合、上述の割合が１０％以上の場合、それまでの重み値を１．５倍し、１０％未満５％以上の場合は増減無し、５％未満１％以上の場合は０．８倍する、といった処理を行う。

このように、情報処理装置１００は、重み値のデフォルト値を、所定の割合で増加又は減少させる際、ｓ２１、ｓ２２における差異に基づく増加又は減少の程度を主、ｓ２３〜ｓ２５における割合に基づく増加又は減少の程度を従として、重み値のデフォルト値を増大又は減少させ、重み値を決定するとすれば、予測モデル１１１に関する誤差逆伝播学習における実効性の観点で好適である。

以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
こうした本実施形態によれば、不正取引の予測モデルにおける予測精度を効率的に改善可能となる。

本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の情報処理装置において、前記演算装置は、前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定し、前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、ことを特徴とする。

これによれば、不正取引の見逃し対象となった教師データに関して、予測モデルにおいて対応する中間層の重みに特にフォーカスし、誤差逆伝播学習を促進しやすくなる。ひいては、不正取引の予測モデルにおける予測精度をさらに効率的に改善可能となる。

また、本実施形態の情報処理装置において、前記演算装置は、前記重み値の決定に際し、前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定し、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、としてもよい。

これによれば、不正取引見逃しの発生割合の高さを踏まえて、予測モデルの誤差逆伝播学習を促進しやすくなる。ひいては、不正取引の予測モデルにおける予測精度をさらに効率的に改善可能となる。

また、本実施形態の情報処理装置において、前記演算装置は、前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定する処理、及び前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定する処理をさらに実行し、前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、としてもよい。

これによれば、予測モデルの精度改善すなわち誤差逆伝播学習を、複数の観点から促進することが可能となる。ひいては、不正取引の予測モデルにおける予測精度をさらに効率的に改善可能となる。

また、本実施形態の情報処理装置において、前記演算装置は、前記デフォルト値を増加又は減少させる際、前記差異に基づく増加又は減少の程度を主、前記割合に基づく増加又は減少の程度を従として、前記重み値のデフォルト値を増大又は減少させ、重み値を決定するものである、としてもよい。

これによれば、予測モデルの精度改善すなわち誤差逆伝播学習への影響の与えやすさに応じて、重み値の取り扱いを動的に制御することが可能となる。ひいては、不正取引の予測モデルにおける予測精度をさらに効率的に改善可能となる。

また、本実施形態の情報処理装置において、前記演算装置は、前記重み値のデフォルト値を５とし、前記重み値の最小値を１、最大値を２０として、前記デフォルト値を増加又は減少させるものである、としてもよい。

これによれば、予測モデルの精度改善すなわち誤差逆伝播学習への影響の与えやすさに応じて、重み値の取り扱いを動的に制御する際、その範囲を特に有為な範囲に限定して効率的に行うことが可能となる。ひいては、不正取引の予測モデルにおける予測精度をさらに効率的に改善可能となる。

また、本実施形態の情報処理方法において、前記情報処理装置が、前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定し、前記差異が所定基準より大きいほど前記
重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、としてもよい。

また、本実施形態の情報処理方法において、前記情報処理装置が、前記重み値の決定に際し、前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定し、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、としてもよい。

また、本実施形態の情報処理方法において、前記情報処理装置が、前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定する処理、及び前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定する処理をさらに実行し、前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、としてもよい。

また、本実施形態の情報処理方法において、前記情報処理装置が、前記デフォルト値を増加又は減少させる際、前記差異に基づく増加又は減少の程度を主、前記割合に基づく増加又は減少の程度を従として、前記重み値のデフォルト値を増大又は減少させ、重み値を決定する、としてもよい。

また、本実施形態の情報処理方法において、前記情報処理装置が、前記重み値のデフォルト値を５とし、前記重み値の最小値を１、最大値を２０として、前記デフォルト値を増加又は減少させる、としてもよい。

１ネットワーク
１０情報処理システム
１００情報処理装置
１０１記憶装置
１０２プログラム
１０３メモリ
１０４演算装置
１０５入力装置
１０６出力装置
１０７通信装置
１１０学習器
１１１予測モデル
１２５教師データＤＢ
１２６予測スコアテーブル
１２７通常誤差テーブル
１２８補正誤差テーブル
２００ユーザ端末
３００金融機関システム
３２５取引履歴ＤＢ
３２６疑義ラベルＤＢ
３２７市場情報ＤＢ

Claims

不正取引に関する教師データを保持する記憶装置と、
不正取引を検知する予測モデルに、前記教師データを入力することで予測スコアを取得する処理、前記教師データの正解値と前記予測スコアとの誤差を算定する処理、前記教師データのうち当該予測スコアが所定の閾値以下となる教師データを特定し、当該教師データに関する前記誤差に、所定アルゴリズムで決定した重み値を乗じて増幅させ、補正誤差を算定する処理、及び前記誤差および前記補正誤差を教師信号として、前記予測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、を実行する演算装置と、
を含むことを特徴とする情報処理装置。
前記演算装置は、
前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定し、前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、
ことを特徴とする請求項１に記載の情報処理装置。
前記演算装置は、
前記重み値の決定に際し、前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定し、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、
ことを特徴とする請求項１に記載の情報処理装置。
前記演算装置は、
前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定する処理、及び前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定する処理をさらに実行し、
前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定するものである、
ことを特徴とする請求項１に記載の情報処理装置。
前記演算装置は、
前記デフォルト値を増加又は減少させる際、前記差異に基づく増加又は減少の程度を主、前記割合に基づく増加又は減少の程度を従として、前記重み値のデフォルト値を増大又は減少させ、重み値を決定するものである、
ことを特徴とする請求項４に記載の情報処理装置。
前記演算装置は、
前記重み値のデフォルト値を５とし、前記重み値の最小値を１、最大値を２０として、前記デフォルト値を増加又は減少させるものである、
ことを特徴とする請求項５に記載の情報処理装置。
情報処理装置が、
不正取引に関する教師データを保持して、
不正取引を検知する予測モデルに、前記教師データを入力することで予測スコアを取得する処理、前記教師データの正解値と前記予測スコアとの誤差を算定する処理、前記教師データのうち当該予測スコアが所定の閾値以下となる教師データを特定し、当該教師データに関する前記誤差に、所定アルゴリズムで決定した重み値を乗じて増幅させ、補正誤差を算定する処理、及び前記誤差および前記補正誤差を教師信号として、前記予測モデルに関する誤差逆伝播学習を実行し、前記予測モデルを更新する処理、
を実行することを特徴とする情報処理方法。
前記情報処理装置が、
前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定し、前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、
ことを特徴とする請求項７に記載の情報処理方法。
前記情報処理装置が、
前記重み値の決定に際し、前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定し、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、
ことを特徴とする請求項７に記載の情報処理方法。
前記情報処理装置が、
前記重み値の決定に際し、前記予測スコアが前記閾値以下となる教師データに関して、当該教師データに関する前記予測スコアと前記閾値との差異を算定する処理、及び前記教師データのうち、前記予測スコアが前記閾値以下となる教師データの割合を算定する処理をさらに実行し、
前記差異が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記差異が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、前記割合が所定基準より大きいほど前記重み値のデフォルト値を所定割合で増加させ、前記割合が所定基準より小さいほど前記重み値のデフォルト値を所定割合で減少させ、重み値を決定する、
ことを特徴とする請求項７に記載の情報処理方法。
前記情報処理装置が、
前記デフォルト値を増加又は減少させる際、前記差異に基づく増加又は減少の程度を主、前記割合に基づく増加又は減少の程度を従として、前記重み値のデフォルト値を増大又は減少させ、重み値を決定する、
ことを特徴とする請求項１０に記載の情報処理方法。
前記情報処理装置が、
前記重み値のデフォルト値を５とし、前記重み値の最小値を１、最大値を２０として、前記デフォルト値を増加又は減少させる、
ことを特徴とする請求項１１に記載の情報処理方法。