JP7299403B1 - 評価システム、及び評価プログラム - Google Patents

評価システム、及び評価プログラム Download PDF

Info

Publication number
JP7299403B1
JP7299403B1 JP2022181504A JP2022181504A JP7299403B1 JP 7299403 B1 JP7299403 B1 JP 7299403B1 JP 2022181504 A JP2022181504 A JP 2022181504A JP 2022181504 A JP2022181504 A JP 2022181504A JP 7299403 B1 JP7299403 B1 JP 7299403B1
Authority
JP
Japan
Prior art keywords
transaction
related information
information
financial
fraudulent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022181504A
Other languages
English (en)
Other versions
JP2024070881A (ja
Inventor
樺 田中
美帆子 野間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SCSK Corp
Original Assignee
SCSK Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SCSK Corp filed Critical SCSK Corp
Priority to JP2022181504A priority Critical patent/JP7299403B1/ja
Application granted granted Critical
Publication of JP7299403B1 publication Critical patent/JP7299403B1/ja
Publication of JP2024070881A publication Critical patent/JP2024070881A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

【課題】検出ルールを評価することが可能となる評価システム及び評価プログラムを提供すること。【解決手段】金融取引において不正取引を検出するための複数の検出ルールを含む検出ルール群を評価するための情報処理システム100であって、検出ルール群を評価するための取引関連情報であって、金融取引を示す取引関連情報を取得する取得部331と、取得部331が取得した取引関連情報と、検出ルール群とに基づいて、検出ルール群についての再現率関連情報を特定する特定部333と、を備え、再現率関連情報は、検出ルール群における不正取引の検出についての再現率と、取得部331が取得した取引関連情報が示す金融取引が不正取引である可能性と、に基づく情報である。【選択図】図1

Description

本発明は、評価システム、及び評価プログラムに関する。
従来、不正取引を検出する技術が知られていた(例えば、特許文献1)。
特開2016-015000号公報
ところで、不正取引検出用の検出ルール群(つまり、複数の検出ルール)を用いて、不正取引を検出する技術が提案されていた。この技術において、検出ルール群を評価する技術が要望されていた。
本発明は、上記に鑑みてなされたものであって、検出ルールを評価することが可能となる評価システム及び評価プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、請求項1に記載の評価システムは、金融取引において不正取引を検出するための複数の検出ルールを含む検出ルール群を評価するための評価システムであって、前記検出ルール群を評価するための取引関連情報であって、前記金融取引を示す前記取引関連情報を取得する取得手段と、前記取得手段が取得した前記取引関連情報と、前記検出ルール群とに基づいて、前記検出ルール群についての再現率関連情報を特定する特定手段と、を備え、前記特定手段は、前記取得手段が取得した前記取引関連情報が示す前記金融取引において、前記検出ルール群を用いて前記不正取引を検出する不正検出処理を行い、前記不正検出処理の処理結果に基づいて、前記再現率関連情報を特定し、前記再現率関連情報は、前記検出ルール群を評価する指標となる情報であり、前記再現率関連情報は、前記検出ルール群における前記不正取引の検出についての再現率と、前記取得手段が取得した前記取引関連情報が示す前記金融取引が前記不正取引である可能性とに基づく情報であり、前記取引関連情報は、複数の前記金融取引を示しており、前記特定手段は、所定の演算式に基づいて、前記再現率関連情報を特定し、前記所定の演算式は、次の数式であり、
Figure 0007299403000002
上記数式において、Rは、前記再現率関連情報を示しており、Sは、前記取引関連情報が示す複数の前記金融取引の集合を示しており、Tは、前記取引関連情報が示す複数の前記金融取引の内の、前記検出ルール群によって前記不正取引と検出された前記金融取引の集合を示しており、Pは、前記再現率関連情報への影響の減衰率を示す所定の数値であって、0よりも大きく1よりも小さい前記所定の数値を示しており、iは、前記取引関連情報が示す複数の前記金融取引各々を特定する変数を示しており、day(i)は、基準日から、前記取引関連情報が示す複数の前記金融取引の内のiが示す前記金融取引が行われた日までの日数を示しており、前記基準日は、前記取引関連情報が示す複数の前記金融取引の内の前記不正取引が発生したものと定められた日である。
請求項に記載の評価システムは、請求項に記載の評価システムにおいて、前記特定手段は、前記金融取引を管理する金融機関によって前記不正取引が発生したものと定められた日を前記基準日として、前記再現率関連情報を特定する。
請求項に記載の評価システムは、請求項に記載の評価システムにおいて、前記減衰率の候補となる複数の候補数値であって、0よりも大きく1よりも小さい前記複数の候補数値と、前記不正取引が行われた金融口座における前記不正取引が行われた取引日以前の連続する複数の日各々に行われた前記金融取引における前記不正取引の回数と真正取引の回数を示す回数情報とに基づいて、前記減衰率を決定する減衰率決定手段、を備え、前記特定手段は、前記減衰率決定手段が決定した前記減衰率に基づいて、前記再現率関連情報を特定し、前記減衰率決定手段は、前記複数の候補数値各々に基づいて定まる不正推定確率であって、前記金融取引が前記不正取引であることを示す確率と推定される前記不正推定確率を、前記複数の候補数値各々及び前記回数情報における前記複数の日各々に関して特定する第1処理と、前記回数情報に基づいて定まる基準不正推定確率であって、前記不正推定確率と比較される前記基準不正推定確率を、前記回数情報における前記複数の日各々に関して特定する第2処理と、前記第1処理で特定した前記不正推定確率と、前記第2処理で特定した前記基準不正推定確率とを比較し、比較結果に基づいて、前記複数の候補数値から1個の候補数値を選択し、選択した前記1個の候補数値を前記減衰率と決定する第3処理と、を行い、前記不正推定確率は、前記複数の候補数値各々のj乗に対応する演算の演算結果であり、jは、前記不正取引が行われた取引日から前記複数の日各々までの日数を示す数値であり、前記基準不正推定確率は、前記回数情報における前記複数の日各々における、前記回数情報が示す前記不正取引の回数の割合を示す数値である。
請求項に記載の評価システムは、請求項1に記載の評価システムにおいて、前記特定手段が特定した前記再現率関連情報に基づいて、前記不正取引を検出するための金融不正取引検出システムにおいて前記検出ルール群を用いるか否かを判定する判定手段、を備える。
請求項に記載の評価プログラムは、金融取引において不正取引を検出するための複数の検出ルールを含む検出ルール群を評価するための評価プログラムであって、コンピュータを、前記検出ルール群を評価するための取引関連情報であって、前記金融取引を示す前記取引関連情報を取得する取得手段と、前記取得手段が取得した前記取引関連情報と、前記検出ルール群とに基づいて、前記検出ルール群についての再現率関連情報を特定する特定手段と、として機能させ前記特定手段は、前記取得手段が取得した前記取引関連情報が示す前記金融取引において、前記検出ルール群を用いて前記不正取引を検出する不正検出処理を行い、前記不正検出処理の処理結果に基づいて、前記再現率関連情報を特定し、前記再現率関連情報は、前記検出ルール群を評価する指標となる情報であり、前記再現率関連情報は、前記検出ルール群における前記不正取引の検出についての再現率と、前記取得手段が取得した前記取引関連情報が示す前記金融取引が前記不正取引である可能性とに基づく情報であり、前記取引関連情報は、複数の前記金融取引を示しており、前記特定手段は、所定の演算式に基づいて、前記再現率関連情報を特定し、前記所定の演算式は、次の数式であり、
Figure 0007299403000003
上記数式において、Rは、前記再現率関連情報を示しており、Sは、前記取引関連情報が示す複数の前記金融取引の集合を示しており、Tは、前記取引関連情報が示す複数の前記金融取引の内の、前記検出ルール群によって前記不正取引と検出された前記金融取引の集合を示しており、Pは、前記再現率関連情報への影響の減衰率を示す所定の数値であって、0よりも大きく1よりも小さい前記所定の数値を示しており、iは、前記取引関連情報が示す複数の前記金融取引各々を特定する変数を示しており、day(i)は、基準日から、前記取引関連情報が示す複数の前記金融取引の内のiが示す前記金融取引が行われた日までの日数を示しており、前記基準日は、前記取引関連情報が示す複数の前記金融取引の内の前記不正取引が発生したものと定められた日である。
請求項1に記載の評価システム、及び請求項に記載の評価プログラムによれば、検出ルール群を評価する指標となる情報である再現率関連情報を特定することにより、例えば、検出ルール群を評価することが可能となる。また、再現率関連情報は、検出ルール群における不正取引の検出についての再現率と、取引関連情報が示す金融取引が不正取引である可能性とに基づく情報であることにより、例えば、検出ルール群を適切に評価することが可能となる。
また、所定の演算式に基づいて再現率関連情報を特定することにより、例えば、再現率関連情報を客観的に特定することができるので、検出ルール群を適切に評価することが可能となる。また、例えば、基準日から、取引関連情報が示す複数の金融取引が行われた日までの日数を反映して、再現率関連情報を特定することができるので、不正取引に関する実体(例えば、不正取引(詐欺取引等を含む不正取引)があった日以前の金融取引に関しては、当該不正取引があった日に近い日の取引は不正取引である確率が比較的高く、取引日が古くなるほど不正取引である確率が低くなる実体)を考慮して、適切に再現率関連情報を特定することができ、検出ルール群を適切に評価することが可能となる。
請求項に記載の評価システムによれば、金融取引を管理する金融機関によって不正取引が発生したものと定められた日を基準日として、再現率関連情報を特定することにより、例えば、不正取引の実体を考慮して再現率関連情報を特定することができ、検出ルール群を適切に評価することが可能となる。
請求項に記載の評価システムによれば、第1処理~第3処理を行うことにより、例えば、不正取引の実体に沿って適切な減衰率を決定することが可能となる。
請求項に記載の評価システムによれば、再現率関連情報に基づいて、不正取引を検出するための金融不正取引検出システムにおいて検出ルール群を用いるか否かを判定することにより、例えば、適切な検出ルール群を金融不正取引検出システムにおいて用いることが可能となる。
本発明の実施の形態に係る情報処理システムのブロック図である。 ルール特定情報を例示した図である。 第1取引情報を例示した図である。 第2取引情報を例示した図である。 不正関連情報を例示した図である。 ルール適用処理のフローチャートである。 ルール生成処理のフローチャートである。 処理の説明図である。 処理の説明図である。 信頼度込み適合率の説明図である。 処理の説明図である。 類似度の説明図である。 不正確率込み再現率の説明図である。 処理の説明図である。 不正確率込み再現率の演算例の説明図である。 グループ情報を例示した図である。 グループの説明図である。 閾値決定処理のフローチャートである。 処理の説明図である。 処理の説明図である。 グループ間の相違度を示す演算式を例示した図である。 回数情報を例示した図である。 減衰率決定処理のフローチャートである。 処理の説明図である。 処理の説明図である。
以下、本発明に係る評価システム、及び評価プログラムの実施の形態について図面を参照しつつ詳細に説明する。ただし、実施の形態によって本発明が限定されるものではない。ここでは、基本的概念、及び用語を説明した後に、具体的な実施の形態について説明する。
(基本的概念)
まず、基本的概念について説明する。本発明に係る評価システムは、金融取引において不正取引を検出するための複数の検出ルールを含む検出ルール群を評価するためのシステムである。
「金融取引」とは、金融に関する取引を示す概念であり、具体的には、コンピュータを用いて行う取引を示す概念である。金融取引とは、例えば、所定の店舗に設置されたATM(現金自動預払機)を用いて行う取引、いわゆるインターネットバンキング機能を含むネットワークを介して取引する機能を用いて行う取引等を含む概念であり、一例としては、貨幣に関する預入、引き出し、又は振込等を含む概念である。また、金融取引とは、例えば、貨幣に関する取引に加えて、株又は先物等の貨幣以外の金融商品に関する取引を含むものと解釈してもよい。この「金融取引」は、例えば、基本的には真正取引が行われるが、不正取引が行われることも想定される。
「不正取引」とは、金融取引における不正な取引であり、例えば、取引者の本来の意図に沿わない取引等を含む概念であり、一例としては、詐欺(振り込め詐欺を含む)やヤミ金融等の犯罪行為に関連する取引を含む概念である。なお、不正取引とは、一例としては、違法な取引を示すものと解釈してもよい。
「真正取引」とは、金融取引における真正(正当)な取引であり、例えば、取引者の本来の意図に沿った取引等を含む概念であり、一例としては、犯罪行為に関連しない取引等を含む概念である。なお、真正取引とは、一例としては、適法(又は合法)な取引を示すものと解釈してもよい。
「検出ルール群」とは、不正取引を検出するための複数の検出ルールの集まりであり、例えば、複数の第1検出ルールを含む第1検出ルール群に基づいて生成された、複数の第2検出ルールを含む第2検出ルール群を示す概念である。
「第1検出ルール」及び「第2検出ルール」の両方は、例えば、不正取引を検出することを目的として定められている検出ルールであり、「第1検出ルール」は、第2検出ルールを生成する基となる検出ルールを示しており、「第2検出ルール」は、第1検出ルールに基づいて生成された(又は生成される)検出ルールを示している。つまり、ここで用いられる「第1」及び「第2」については、生成の基となる検出ルールを示すか、あるいは、生成された(又は生成される)対象を示すかの相対的な説明の便宜上の表現であるものと解釈してもよい。なお、他の「第1」及び「第2」の用語も説明の便宜上の表現であるものと解釈してもよい。
そして、以下に示す実施の形態では、例えば、「不正取引」が詐欺(一例としては、振り込め詐欺)である犯罪行為に関連する取引である場合について例示して説明する。
(構成)
まず、本実施の形態に係る情報システムについて説明する。図1は、本発明の実施の形態に係る情報処理システムのブロック図である。
情報処理システム100は、評価システムであり、例えば、取引端末装置1、管理端末装置2、及びサーバ装置3を備える。
(構成-取引端末装置)
図1の取引端末装置1は、金融機関側の装置(コンピュータを含む)であり、例えば、金融取引を行うためのコンピュータであり、一例としては、不図示のコンビニエンスストア等又は他の設置場所に設置されているATM、又は取引者が用いる端末(パーソナルコンピュータ、タブレット端末、又はスマートフォン等)との間で通信可能となっており金融取引に関する情報処理を行う装置である。
(構成-管理端末装置)
図1の管理端末装置2は、金融取引を管理する装置(例えば、記録部及び制御部を有するコンピュータを含む装置)であり、例えば、取引端末装置1によって処理された金融取引を管理する装置であり、一例としては、当該金融取引における不正取引の検出等を行う装置である。つまり、例えば、管理端末装置2は、不正取引を検出するための「金融不正取引検出システム」に対応するものと解釈してもよい。
なお、ここで説明した取引端末装置1及び管理端末装置2は一例であり、任意に変更してもよく、例えば、取引端末装置1及び管理端末装置2を統合したり、あるいは、既存の金融機関に設けられている公知のシステムの構成を適用したりしてもよい。また、取引端末装置1及び管理端末装置2の一部の機能又は全部の機能を、後述するサーバ装置3に組み込んでもよい。
(構成-サーバ装置)
サーバ装置3は、例えば、通信部31、記録部32、及び制御部33を備える。
(構成-サーバ装置-通信部)
図1の通信部31は、外部装置(例えば、管理端末装置2又は不図示の他の装置)との間で通信するための通信手段である。この通信部31の具体的な種類や構成は任意であるが、例えば、公知の通信回路等を用いて構成することができる。
(構成-サーバ装置-記録部)
図1の記録部32は、サーバ装置3の動作に必要なプログラム及び各種のデータを記録する記録手段(格納手段)であり、例えば、外部記録装置としてのハードディスク又はフラッシュメモリ(図示省略)を用いて構成されている(他の装置の記録部も同様とする)。ただし、ハードディスク又はフラッシュメモリに代えてあるいはハードディスク又はフラッシュメモリと共に、磁気ディスクの如き磁気的記録媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる(他の装置の記録部も同様とする)。
記録部32は、例えば、ルール特定情報DB321、第1取引情報DB322、第2取引情報DB323、及び不正関連情報DB324を備える。
(構成-サーバ装置-記録部-ルール特定情報DB)
図1のルール特定情報DB321は、ルール特定情報を格納するルール特定情報格納手段である。「ルール特定情報」は、不正取引を検出するためのルールである検出ルールを特定する情報である。図2は、ルール特定情報を例示した図である。なお、図2においては、説明の便宜上、一部の情報の図示を省略し、「…」と図示している(他の図も同様)。「ルール特定情報」は、例えば、図2に示す各項目の情報が相互に関連付けられている。
図2の項目「ルールID」の情報は、検出ルールを一意に識別するためのルール識別情報(以下、識別情報を「ID」と称する)である(図2では、「IDr1」等)。図2の項目「ルール名情報」は、検出ルールの名称を示すルール名情報である(図2では、便宜上の記載であり、「r1」等)。なお、各情報を例示した各図においては、図2の「r1」と同様に、適宜便宜上の情報を例示して説明する。
図2の項目「条件情報」の情報は、不正取引を検出するための条件を示す条件情報である。本実施の形態では、例えば、各検出ルールに対して不正取引を検出するための条件が1個以上定められており、取引者によって行われた金融取引が各検出ルール内の全ての条件に合致した場合に、当該検出ルールで不正取引を判定して検出するように構成されている場合について説明する。
この条件情報については、金融取引に関連する項目に関する条件を示す情報が用いられる。「金融取引に関連する項目」は、図1の管理端末装置2等にて金融取引に関して特定可能な多数の項目の内の少なくとも何れかの項目を示す概念である。図2では、金融取引が行われた経路の種類に関する項目である「経路種別」、金融取引が行われた時間帯に関する項目である「利用時間帯」、金融取引での取引金額に関する項目である「取引金額」、及び金融取引において同一口座で前月度に取引が行われた否かに関する項目である「前月度取引」等が例示されている。
図2の条件情報としては、例えば、金融取引が行われた経路の種類がコンビニエンスストアに設置されたATM等の端末を介する経路に対応する種類であることを示す「経路種別=コンビニ」、金融取引が行われた時間帯が夜中の時間帯(例えば、午前0時~午前4時の時間帯等)であることを示す「利用時間帯=夜中」、及び取引金額が10万円以上であることを示す「取引金額>=100,000」等が例示されている。
そして、例えば図2の「IDr1」に関連付けられている情報については、「IDr1」が識別する検出ルールの名称が「r1」であること、及び、当該検出ルールに含まれている条件が「経路種別=コンビニ」、「利用時間帯=夜中」、及び「取引金額>=100,000」が示す3個の条件であることが示されている。すなわち、この「r1」の検出ルールを適用した場合、この3個の条件全てに合致する金融取引が不正取引と検出されることになる。なお、不正取引を検出する具体的な処理については後述する。
なお、このような図2のルール特定情報の具体的な格納手法は任意であるが、例えば、本実施の形態では、このルール特定情報が示す複数の検出ルールを含む検出ルール群に基づいて、新たな複数の検出ルールを含む検出ルール群を生成することとし、金融機関で現在利用されている複数の検出ルール(つまり、例えば、図1の管理端末装置2に格納されて実装されている複数の検出ルール)を示す情報をサーバ装置3に入力し、入力された情報が示す複数の検出ルールを示す情報をルール特定情報として格納してもよい。あるいは、例えば、上述の複数の検出ルールに加えて、新たに管理者が自己の経験等に基づいて生成した検出ルール、あるいは、前述の項目及び項目に対応する情報をランダムに組み合わせて新たに生成された検出ルール等を示す情報も、ルール特定情報として格納してもよい。
(構成-サーバ装置-記録部-第1取引情報DB)
図1の第1取引情報DB322は、第1取引情報を格納する第1取引情報格納手段である。「第1取引情報」とは、複数の検出ルールを評価するための取引関連情報であって、例えば、過去に行われた金融取引を示す情報である。図3は、第1取引情報を例示した図である。「第1取引情報」は、例えば、図3に示す各項目の情報が相互に関連付けられている。
図3の項目「取引ID」の情報は、金融取引を一意に識別する取引IDである(図3では、「IDd0001」等)。図3の項目「取引日時情報」の情報は、金融取引が行われた日時を示す取引日時情報である(図3では、2022年1月1日の09時00分を示す「2022/1/1 0900」等)。図3の項目「取引金額情報」の情報は、取引金額を示す取引金額情報である(図3では、5000円を示す「5000」等)。図3の項目「口座番号情報」の情報は、金融取引が行われた口座を特定する口座番号を示す口座番号情報である(図3では、「N1」等)。図3の項目「経路種別情報」の情報は、金融取引が行われた経路の種類を示す経路種別情報である(図3では、スマートフォン又はタブレット端末等の携帯端末を介する経路に対応する種類を示す「モバイル」、及び、コンビニエンスストアに設置されたATM等の端末を介する経路に対応する種類を示す「コンビニ」等)。
そして、例えば図3の最上段の情報については、「IDd0001」が識別する金融取引が2022年1月1日の09時00分に行われたことが示されており、また、当該金融取引で取引された金額が5000円であることが示されており、また、当該金融取引が行われた口座の口座番号が「N1」であることが示されており、また、当該金融取引がスマートフォン又はタブレット端末等の携帯端末を介して行われたこと等が示されている。
なお、このような図3の第1取引情報の具体的な格納手法は任意であるが、例えば、金融機関が、実際に行われた金融取引に関して図3の各項目に対応する情報を記録していることとし、当該記録されている情報を管理者が金融機関側から所定の方法(例えば、メモリスティック等の記録媒体を介して取得する手法、あるいは、通信ネットワークを介して取得する手法等)で取得し、取得した情報をサーバ装置3に入力することにより、前述の金融機関にて実際に行われた金融取引に関する情報を、図3の第1取引情報として格納してもよい。あるいは、その他の手法でサーバ装置3に情報を入力し、当該入力された情報に基づいて格納することとしてもよい。
ここでは、例えば、金融機関の管理端末装置2(図1)が、実際に行われた金融取引に関して図3の各項目に対応する情報を記録していることとし、当該記録されている情報の内の一部の情報を管理者が金融機関側から取得してサーバ装置3に入力することにより、図3に例示されている情報を格納することとしてもよい。あるいは、例えば、所定のタイミング(例えば、2~3カ月に1回のタイミング等)に、金融機関の管理端末装置2が、サーバ装置3に前述の情報を送信することとし、当該送信された情報に基づいて格納することとしてもよい。又は、その他の手法で格納することとしてもよい。
(構成-サーバ装置-記録部-第2取引情報DB)
図1の第2取引情報DB323は、第2取引情報を格納する第2取引情報格納手段である。「第2取引情報」とは、検出ルール群を評価するための取引関連情報であって、例えば、過去に行われた金融取引を示す情報である。図4は、第2取引情報を例示した図である。「第2取引情報」は、例えば、図4に示す各項目の情報が相互に関連付けられている。
図4の第2取引情報の構成は、図3の第1取引情報の構成と共通であることする。図4の第2取引情報における各項目の情報は、図3の第1取引情報における同一名称の項目の情報と同様である。
本実施の形態では、第1取引情報及び第2取引情報に分けて説明したが、これらについては統合して「取引情報」として格納して、当該取引情報の一部の情報を第1取引情報として用い、他の一部の情報を第2取引情報として用いてもよい。
なお、このような図4の第2取引情報の具体的な格納手法は任意であるが、例えば、図3の第1取引情報と同様にして格納されることとする。
(構成-サーバ装置-記録部-不正関連情報DB)
図1の不正関連情報DB324は、不正関連情報を格納する不正関連情報格納手段である。「不正関連情報」とは、不正取引に関連する情報であり、具体的には、不正取引を特定するための情報である。図5は、不正関連情報を例示した図である。「不正関連情報」は、例えば、図5に示す各項目の情報が相互に関連付けられている。
図5の項目「口座番号情報」の情報は、図3及び図4の同一名称の項目の情報と同様である(図5では、「N1」等)。図5の項目「不正取引日情報」の情報は、不正取引が行われたものとされる日(詳細には、金融取引を管理する金融機関によって、不正取引が発生したものと定められた日)である不正取引日を示す不正取引日情報である(図5では、2022年1月10日を示す「2022/1/10」等)。
そして、例えば図5の「N1」に関連付けられている情報については、口座番号が「N1」の口座の不正取引日が2022年1月10日であることが示されている。また、例えば図5の「N11」に関連付けられている情報については、口座番号が「N11」の口座の不正取引日が2022年1月4日及び2022年1月6日であることが示されている。
なお、このような図5の不正関連情報の具体的な格納手法は任意であるが、例えば、金融機関が、実際の金融取引を監視して、監視されている金融取引に関して、任意の手法(例えば、口座所有者からの不正取引があった旨の連絡(口座番号及び不正取引日の伝達を含む連絡)に基づいて判断する手法等)に基づいて不正取引であるものと判断した場合に、金融機関が当該連絡を受けた不正取引日(つまり、連絡にて伝達された不正取引日)を不正取引が発生した日として定め、不正取引が発生した口座の口座番号及び不正取引日(つまり、口座所有者から連絡にて伝達された口座番号及び不正取引日)を所定の機関(警察又は金融庁等)に対して届け出た上で、当該口座番号及び不正取引日を記録して保存する運用になっていることとする。そして、サーバ装置3の管理者が、この記録及び保存された口座番号及び不正取引日を示す情報を、金融機関側から取得し、取得した情報をサーバ装置3に入力することにより、前述の金融機関での実際の金融取引における不正取引が行われた口座の口座番号と不正取引日に関する情報を、図5の不正関連情報として格納してもよい。
(構成-サーバ装置-制御部)
図1の制御部33は、サーバ装置3を制御する制御手段であり、具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである(他の装置の制御部も同様とする)。特に、実施の形態に係るプログラムは、任意の記録媒体又はネットワークを介してサーバ装置3にインストールされることで、制御部33の各部を実質的に構成する。
この制御部33は、機能概念的に、例えば、取得部331、生成部332、特定部333、及び判定部334を備える。
===取得部===
取得部331は、例えば、複数の第1検出ルールを評価するための取引関連情報(本実施の形態では、例えば、図3の第1取引情報)であって、金融取引を示す取引関連情報を取得する取得手段である。また、取得部331は、例えば、検出ルール群を評価するための取引関連情報(本実施の形態では、例えば、図4の第2取引情報)であって、金融取引を示す取引関連情報を取得する手段である。
===生成部===
生成部332は、例えば、取得手段が取得した取引関連情報(本実施の形態では、例えば、図3の第1取引情報)と、第1検出ルール群情報とに基づいて、第2検出ルール群情報を生成する生成手段である。生成部332は、例えば、取得手段が取得した取引関連情報(本実施の形態では、例えば、図3の第1取引情報)が示す金融取引において、第1検出ルール群情報が示す第1検出ルール群に含まれる複数の第1検出ルールを用いて不正取引を検出する不正検出処理を行い、不正検出処理の処理結果に基づいて、複数の第1検出ルール各々についての適合率関連情報を特定し、特定した適合率関連情報に基づいて、第2検出ルール群情報を生成する。なお、「適合率関連情報」については後述する。
===特定部===
特定部333は、例えば、取得手段が取得した取引関連情報(本実施の形態では、例えば、図4の第2取引情報)と、検出ルール群とに基づいて、検出ルール群についての再現率関連情報を特定する特定手段である。特定部333は、例えば、取得手段が取得した取引関連情報(本実施の形態では、例えば、図4の第2取引情報)が示す金融取引において、検出ルール群を用いて不正取引を検出する不正検出処理を行い、不正検出処理の処理結果に基づいて、再現率関連情報を特定する。なお、「再現率関連情報」については後述する。
===判定部===
判定部334は、例えば、特定手段が特定した再現率関連情報に基づいて、不正取引を検出するための金融不正取引検出システムにおいて検出ルール群を用いるか否かを判定する判定手段である。なお、このような制御部33の各部によって行われる処理については、後述する。
(処理)
次に、このように構成される情報処理システム100によって行われる処理として、例えば、金融機関側不正検出処理、及びルール適用処理について説明する。
(処理-金融機関側不正検出処理)
まず、金融機関側不正検出処理について説明する。金融機関側不正検出処理は、不正取引を検出する処理であり、例えば、図1の管理端末装置2によって繰り返し実行される処理である。なお、この金融機関側不正検出処理は公知の処理と同様な処理を適用することができるので、概要のみ説明する。
例えば、図1の管理端末装置2の記録部に、図2のルール特定情報が示す複数の検出ルール(「IDr1」~「IDr5」の検出ルール等)を含む検出ルール群を示す情報が格納されていることする。また、例えば、実際の金融取引が行われた場合に、図1の各取引端末装置1が、当該金融取引の内容を示す実行金融取引情報(例えば、図3及び図4の各項目の情報を含む情報)を管理端末装置2に送信し、管理端末装置2側で当該実行金融取引情報に基づいて、実際に行われた金融取引の内容を把握可能となっているものとする。
そして、金融取引が行われた場合、管理端末装置2の制御部は、取引端末装置1からの実行金融情報を受信し、記録部に記録されている情報が示す検出ルール群に含まれる複数の検出ルール各々に基づいて、前述の受信した実行金融情報が示す金融取引が、不正取引であるか否かを判定して検出する。具体的には、何れかの検出ルールにて不正取引であるものと判定して検出した金融取引については、不正取引であるものと判定して検出する。
例えば、受信した実行金融情報が示す金融取引の取引金額が80000円である場合、当該金融取引は、図2の「IDr1」の検出ルールの3個の条件の内の少なくとも「取引金額>=100,000」には該当しないので、不正取引であるものとは判定せず、当該検出ルールでは不正取引と検出しない。一方で、当該金融取引が、図2の「IDr2」の検出ルールの3個の条件に全て合致する場合、不正取引であるものと判定した上で、不正取引として検出する。そして、当該金融取引については、図2の「IDr1」の検出ルールでは不正取引として検出しなかったものの、少なくとも図2の「IDr2」の検出ルールにて不正取引として検出したので、不正取引として検出することになる。
この後の処理は任意であるが、例えば、管理端末装置2の制御部は、不正取引を検出した金融取引を示す情報を記録部に記録したり、あるいは、管理者等に通知したりしてもよい。
(処理-ルール適用処理)
次に、ルール適用処理について説明する。図6は、ルール適用処理のフローチャートである(以下では、各ステップを「S」と称する)。ルール適用処理は、複数の検出ルールを生成して、生成した複数の検出ルールを管理端末装置2に適用する処理であり、例えば、サーバ装置3によって実行される処理である。
このルール適用処理を実行するタイミングは任意であるが、例えば、管理者が当該処理を実行するための所定操作を行った場合に、実行を開始することとし、実行が開始されたところから説明する。
なお、「生成した複数の検出ルールを管理端末装置2に適用する」とは、生成した複数の検出ルールを管理端末装置2に利用させることに対応する概念であり、例えば、生成した複数の検出ルールを示す情報(つまり、複数の検出ルールを含む検出ルール群を示す情報)を、管理端末装置2の記録部に記録する処理を含む概念であるものと解釈してもよい。
ここでは、例えば、図1の金融機関で現在利用されている複数の検出ルール、及び、前述のランダムに組み合わせて新たに生成された検出ルールを示す情報が、図2のルール特定情報として格納されており、また、図3~図5に例示された各情報等が格納されている場合について例示して説明する。また、「検出ルール」を単に「ルール」とも称する。
なお、バリエーションとしては、図1では不図示の他の金融機関で現在利用されている、あるいは、図1の金融機関又は当該他の金融機関で過去に利用されていた、複数の検出ルール等を示す情報が図2のルール特定情報として格納されていることとし、当該情報を用いて以下の各処理を行うように構成してもよい。
===SA1===
図6のSA1において制御部33は、ルール生成処理を行う。図7は、ルール生成処理のフローチャートであり、図8及び図9は、処理の説明図である。ルール生成処理とは、複数の検出ルールを生成する処理であり、例えば、いわゆる遺伝的アルゴリズムに対応する処理を含む処理である。ここでは、以下で用いられる用語である「現世代」、「次世代」、及び「世代交代」について説明した後に、処理内容について説明する。
「現世代」及び「次世代」とは、情報処理に関する用語であり、例えば、処理対象になり得るルールのまとまり(グループ)を示す概念である。「現世代」及び「次世代」は、例えば、図8に示すように相互に異なるまとまりを示す概念である。
そして、現世代に属するルール(又は現世代のルール)とは、例えば、図8の(a)~(d)に示すように、現世代のまとまりに属するルールを示す概念である。また、次世代に属するルール(又は次世代のルール)とは、例えば、図8の(e)~(f)に示すように、次世代のまとまりに属するルールを示す概念である。
「世代交代」とは、次世代の内容を現世代に反映することを示す概念であり、例えば、図8の(f)及び(d)に示すように、次世代に属するルールを、現世代に属するルールとして置き換える処理を示す概念である。詳細には、例えば、現在の現世代のルール(例えば、図8の(c))を消去した上で、現在の次世代のルール(例えば、図8の(f))を現世代のルールに変更し、この後に、当該次世代のルールを消去することにより、図8の(f)の次世代のルールと同じルールが属する現世代を生成することを示す概念である。
そして、図7のルール生成処理においては、概略的には、現世代のルールに基づいて次世代のルールを生成した後に世代交代を行う処理を繰り返し行うことにより、複数のルールを生成する。以下では、当該ルール生成処理の詳細について説明する。
===SB1===
図7のSB1において制御部33は、現世代に属するルール毎に信頼度込み適合率を特定する。ここでは、信頼度込み適合率について説明した後に、処理内容について説明する。
==信頼度込み適合率==
図10は、信頼度込み適合率の説明図である。「信頼度込み適合率」とは、ルールを評価する指標となる適合率関連情報であり、例えば、ルールにおける不正取引の検出についての適合率と、当該適合率の信頼度とに基づく情報である。信頼度込み適合率とは、例えば、指標としての信頼性の度合いである信頼度を反映した適合率を示す概念であるものと解釈することもできる。
==信頼度込み適合率(適合率)==
「適合率」とは、精度を評価する公知の指標であり、本実施の形態では例えば、図10の(a)に示す演算式の演算結果に対応する指標である。
図10の「不正取引の検出数」とは、図2の「IDr1」のルール(つまり、不正取引を検出するための検出ルール)等の対象となるルールを用いて検出した不正取引の個数を示しており、また、「真正取引の検出数」とは、対象のルールを用いて検出した真正取引の個数を示している。また、「検出総数」とは、対象のルールを用いて検出した金融取引の総数を示しており、「不正取引の検出数」と「真正取引の検出数」との和に対応する概念を示している。
そして、「検出総数」については、ルール(不正取引を検出するための検出ルール)がヒットした(検出した)全回数を示すものと解釈することもでき、また、「不正取引の検出数」については、ルールがヒットした正解回数を示すものと解釈することができ、また、「真正取引の検出数」については、ルールがヒットした不正解回数を示すものと解釈することもできる。なお、ここでの解釈は、各ルールが不正取引を検出するように構成されているので、不正取引を検出した場合には「正解」であり、不正取引では無く真正取引を検出した場合は「不正解」であるものと解釈できる点に基づいている。
この適合率については、ルールの精度を評価するための指標として利用できる一方で、例えば、検出総数が比較的少ない場合に、ルールによる偶然の検出による当該適合率への影響が比較的大きくなる可能性があり、算出された適合率の値が、ルールの真の精度を示す真の適合率(「本当の適合率」とも称する)の値から比較的大きく離れてしまう可能性があった。そして、この適合率については、このような可能性が反映されておらず、適合率として算出された値の信頼度が不明であり、信頼度が反映されていない点が評価指標としての課題となっていた。
==信頼度込み適合率(内容)==
これに対して、本実施の形態で用いる信頼度込み適合率については、信頼度にも基づいているために、適合率の課題を解決可能な指標となっている。信頼度込み適合率は、適合率と信頼度とに基づく限りにおいて任意であるが、例えば、図10の(b)の演算式の演算結果に対応する数値を信頼度込み適合率として用いる場合について説明する。
図10の(b)の「lower」とは、適合率の95%信頼区間の下限値を示しており、また、「upper」とは、適合率の95%信頼区間の上限値を示している。
==信頼度込み適合率(95%信頼区間)==
「適合率の95%信頼区間」とは、統計学上の概念であり、例えば、ルールの本当の適合率が含まれることがかなり確信できる数値範囲を示す概念である。そして、本実施の形態では、「適合率の95%信頼区間」とは、例えば、100個のルールの内の95個のルールの本当の適合率が属する数値範囲を示すものと解釈することができる。
例えば、検出総数が100(つまり、ヒットした全回数が100回)であり、且つ、不正取引の検出数が30(つまり、ヒットした正解回数が30回)である場合の適合率の95%信頼区間が、0.21241(下限値)~0.39981(上限値)(数値は説明の便宜上の値)となる場合について説明する。
この場合、検出総数が100(つまり、ヒットした全回数が100回)となり、且つ、不正取引の検出数が30(つまり、ヒットした正解回数が30回)となるルールが100個存在する場合、この100個のルールの中の95個のルールの本当の適合率が、95%信頼区間の下限値以上且つ上限値以下の範囲である0.21241~0.39981内に入るものと想定される。
なお、この「適合率の95%信頼区間」については、例えば、検出総数が増加するに従って、数値範囲が狭まって、下限値及び上限値の相互間の数値がより近い値になる。
「適合率の95%信頼区間」を演算する手法は任意であり公知の手法を適用することができるが、例えば、二項分布に関する手法を適用してもよいし、バリエーションとしては、正規分布に関する手法を適用してもよいが、本実施の形態では、「Clopper-Pearson interval」に関する公知の演算を行うものとする。
具体的には、図10の(c)の演算式における左辺の式(「θ」の左側の(c-1)の演算式)の演算結果を、適合率の95%信頼区間の下限値とし、また、図10の(c)の演算式における右辺の式(「θ」の右側の(c-2)の演算式)の演算結果を、適合率の95%信頼区間の上限値とする場合について説明する。
なお、この図10の(c)の演算式において、各変数及び関数については、図10に図示の通りであるが、例えば、「n」は検出総数を示しており、また、「x」は、不正取引の検出総数を示しており、また、「α」は所定の数値であり、「1-95%」(「95%」は95%信頼区間における「95%」に対応)に対応する「0.05」を示しており、また、「B」はベータ分布の累積分布関数の逆関数を示している。なお、「θ」は本当の適合率を示しており、未知である。
==信頼度込み適合率(バリエーション)==
なお、ここで示した図10の(c)の演算式は例示であり、バリエーションとしては、他の公知の演算式を用いて上限値及び下限値を用いてもよい。また、ここでは、図10の(b)の演算式の「lower」及び「upper」として、適合率の95%信頼区間の下限値及び上限値を用いるものと説明したが、バリエーションとしては、他の信頼区間の下限値及び上限値を用いてもよく、例えば、90%信頼区間又は98%信頼区間の下限値及び上限値等を用いるように変更してもよい。
また、バリエーションとしては、図10の(b)の演算式を任意に変更してもよく、例えば、信頼区間の下限値及び上限値の相加平均(算術平均)、相乗平均(幾何平均)、又は、一般平均(二乗平均平方根)を、信頼度込み適合率として求める演算式に変更してもよい(後述のルール類似度も同様とする)。
==SB1の処理==
図11は、処理の説明図である。図7のSB1の処理は任意であるが、例えば、図7のルール生成処理の開始直後(つまり、初回実行時)のSB1では、図2のルール特定情報が示すルールを現世代として、また、SB5の世代交代後(つまり、繰り返し実行時)のSB1では、世代交代されたルールを現世代として、以下の第1ステップ~第5ステップの処理を行う。なお、以下の第1ステップ~第5ステップについては、図8の(a)に示すように、現世代の全てのルール各々に対して行う。
ここでは、例えば、図11の上段の左側に示すように、現世代にルールIDが「IDr803」のルール等(図2では不図示)が含まれている場合を例示して説明する。
=第1ステップ=
第1ステップにおいて、取得部331は、図3の第1取引情報(取引関連情報)を取得する。ここでは、例えば、図3の「IDd0001」に関連付けられた情報を含む各金融取引を示す情報を取得する。
=第2ステップ=
第2ステップにおいて、生成部332は、第1ステップで取得部331が取得した第1取引情報が示す金融取引において、現世代のルールの内の1個の処理対象になっているルールを用いて不正取引を検出する処理(不正検出処理)を行う。具体的には、第1取引情報が示す金融取引が、処理対象のルールに定められている条件(図2の条件情報が示す条件)全てに該当する場合に、当該金融取引を不正取引と判定して不正取引として検出し、一方、第1取引情報が示す金融取引が、処理対象のルールに定められている条件全てに該当するわけではない場合(つまり、何れかの条件に非該当の場合)に、当該金融取引を不正取引ではないものと判定して不正取引としての検出は行わない。
ここでは、例えば、図11の上段の左側に示す「IDr803」のルールが処理対象のルールである場合、第1取引情報が示す各金融取引の内の、「IDr803」のルールに定められている条件全てに該当する金融取引を、不正取引として検出する。なお、第1取引情報が示す各金融取引の内の、「IDr803」のルールに定められている条件全てに該当するわけではない金融取引(つまり、何れかの条件に非該当の金融取引)については、不正取引としての検出は行わないことになる。
=第3ステップ=
第3ステップにおいて、生成部332は、第2ステップで検出した金融取引の総数(つまり、処理対象のルールを用いて不正取引として検出した金融取引の総数)を特定する。ここでは、例えば、第2ステップで「IDr803」のルールを用いて100個の金融取引を不正取引として検出した場合、「100」を特定する。
=第4ステップ=
第4ステップにおいて、生成部332は、第2ステップで処理対象のルールにて検出された金融取引の内の、不正取引の検出数を特定する。
なお、不正取引の検出数を特定するためには、処理対象のルールを用いて検出した金融取引が不正取引であったか真正取引であったかを特定する必要があるが、本実施の形態では、図5の不正関連情報を用いて当該特定を行う。例えば、サーバ装置3側においては、図3の第1取引情報が示す各金融取引が不正取引か否を示す個別の情報については格納されていないので、不正取引日が記録されている口座に関する全ての金融取引(不正取引日以外の金融取引も含む)については、不正取引であり、また、不正取引日が記録されている口座に関する全ての金融取引については、真正取引であるものとみなして処理する(後述する図4の第2取引情報に関する処理も同様とする)。
第2ステップで検出した不正取引の検出数を特定する処理について具体的には、まず、図5の不正関連情報を参照して、不正取引日情報が記録されている口座番号情報を特定し、第1ステップで取得した図3の第1取引情報が示す各金融取引に関して、前述の特定した口座番号情報が示す口座に関する金融取引について不正取引であることを示すフラグ情報である「1」を付し、また、この「1」が付された金融取引以外の金融取引について真正取引であることを示すフラグ情報である「0」を付す。
ここでは、例えば、図5の不正関連情報を参照して、不正取引日情報が記録されている口座番号情報である「N1」等を特定し、第1ステップで取得した図3の第1取引情報が示す各金融取引に関して、口座番号情報として「N1」が関連付けられている「IDd0001」~「IDd0003」の金融取引について「1」(不正取引であることを示すフラグ情報)を付し、また、図5の不正関連情報に格納されていない口座番号情報である「N2」が関連付けられている図3の「IDd0101」の金融取引について「0」(真正取引であることを示すフラグ情報)を付す。
次に、第2ステップで検出した金融取引が「1」のフラグ情報が付されている金融取引である場合、「正解」であるので不正取引を正しく検出したものと判断し、また、第2ステップで検出した金融取引が「0」のフラグ情報が付されている金融取引である場合、「不正解」であるので真正取引を誤って検出したものと判断することができるので、第2ステップで検出した金融取引の内の「1」のフラグ情報が付されている金融取引の個数を、第2ステップで処理対象のルールにて検出された金融取引の内の、不正取引の検出数として特定する。
ここでは、例えば、第2ステップで「IDd0001」~「IDd0003」の金融取引(フラグ情報=「1」)を検出した場合、不正取引を正しく検出したものと判断できるので、当該金融取引の個数を、不正取引の検出数に含めて処理し、一方、第2ステップで「IDd0101」の金融取引(フラグ情報=「0」)を検出した場合、真正取引を誤って検出したものと判断できるので、当該金融取引の個数を、不正取引の検出数に含めないで処理することになる。そして、第2ステップで「IDr803」のルールを用いて、フラグ情報=「1」の金融取引を30個検出した場合、「30」を特定する。
=第5ステップ=
第5ステップでは、生成部332は、第3ステップ及び第4ステップの処理結果に基づいて、図10の(b)及び(c)の演算式を利用して、処理対象のルールに関する信頼度込み適合率を特定する。
ここでは、例えば、図10の(c-1)及び(c-2)の演算式において、第3ステップで特定した金融取引の総数である「100」を検出総数である「n」に代入し、また、第4ステップで特定した不正取引の検出数である「30」を「x」に代入して演算し、(c-1)の演算式の演算結果である「Vlow」(便宜上の記載であり実際には数値)を、「IDr803」のルールの適合率の95%信頼区間の下限値として特定し、また、(c-2)の演算式の演算結果である「Vup」(便宜上の記載であり実際には数値)を、「IDr803」のルールの適合率の95%信頼区間の上限値として特定する。
次に、これらの特定した「Vlow」及び「Vup」を図10の(b)の演算式に代入して、演算し、演算結果を「IDr803」のルールの信頼度込み適合率として特定する。
そして、これらの各ステップを、現世代の全てのルール各々に関して行うことにより、例えば、図11の上段の右側に示すように、「IDr803」のルール及び「IDr801」のルール等の信頼度込み適合率として、例えば、0.370、0.344(各数値は説明の便宜上の値である)等を特定する。
===SB2===
図7のSB2において制御部33は、現世代のルールを、SB1で特定した信頼度込み適合率及び類似度(ルール類似度)に基づいてグループ化する。ここでは、ルール類似度について説明した後に、処理内容について説明する。
==ルール類似度==
図12は、類似度の説明図である。なお、図12における「ルールA」及び「ルールB」は、相互間の類似度が求められる対象となる2個のルールを示している。「ルール類似度」とは、類似度情報であり、具体的には、2個のルールが相互に類似している度合いである類似度を示す概念である。ルール類似度の具体的な内容は任意であるが、例えば、図12の(a)の演算式の演算結果に対応する数値をルール類似度として用いる場合について説明する。
図12の「項目ベース類似度」とは、2個のルール各々に定められている条件の項目(例えば、図2の条件情報における「経路種別」、「利用時間帯」等)に基づいて定められる、2個のルール相互間の類似度を示す概念であり、例えば、図12の(b)の演算式によって求められる数値である。
図2の「IDr1」のルール及び「IDr2」のルールについては、「IDr1」のルールの条件の項目数が3個であり、「IDr2」のルールの条件の項目数が3個であり、共通する条件の項目数が「経路種別」の1個であるので、これらのルールの項目ベース類似度は、「2×1/(3+3)」の演算結果の数値となる。
図12の「取引ベース類似度」とは、2個のルール各々を用いて検出した金融取引に基づいて定められる、2個のルール相互間の類似度を示す概念であり、例えば、図12の(c)の演算式によって求められる数値である。
図2の「IDr1」のルール及び「IDr2」のルールについては、図7のSB1の第2ステップの「不正検出処理」において、「IDr1」のルールにて検出した金融取引が1000個であり、「IDr2」のルールにて検出した金融取引が500個であり、「IDr1」のルール及び「IDr2」のルールの両方にて共通して検出した金融取引が300個である場合、これらのルールの取引ベース類似度は、「2×300/(1000+500)」の演算結果の数値となる。
そして、これらの項目ベース類似度及び取引ベース類似度の各数値を図12の(a)の演算式に代入して演算した演算結果が、「IDr1」のルール及び「IDr2」のルールの相互間のルール類似度となる。そして、このルール類似度に関しては、数値が大きくなるにしたがって、2個のルールの相互間の類似性の度合いが高くなる(つまり、より類似することになる)ものとして、以下の処理を行う。
==SB2の処理==
SB2では、以下の第1ステップ~第4ステップの処理を行う。例えば、SB1で特定した信頼度込み適合率の数値が大きい程精度が高いルールであるものとして、当該信頼度込み適合率に着目しつつ類似度が高いルール同士がグループ化されるように以下の処理を行う。
=第1ステップ=
第1ステップにおいて、生成部332は、SB1で特定した信頼度込み適合率に着目して、現世代のルールの中で、当該信頼度込み適合率の数値が最も大きなルールをトップルールとして特定する。なお、数値が最も大きなルールが複数存在する場合、所定の手法(例えば、ランダムに1個を選択する手法、あるいは、条件の項目数がより多い1個を選択する手法等)で1個のルールを選択して特定することとする。
ここでは、例えば、図11の上段の右側に示すように、例えば、「IDr803」のルールの信頼度込み適合率が最大値である「0.370」である場合、「IDr803」のルールをトップルールとして特定する。
次に、前述の特定したトップルールと現世代の他のルール(トップルール以外のルール)各々との相互間におけるルール類似度を特定する。具体的には、各ルールに定められている条件の項目、及び、図7のSB1の第2ステップにおける「不正検出処理」の処理結果に基づいて、図12の(b)及び(c)の演算式に示される各項目数又は各取引数を代入して演算することにより、項目ベース類似度及び取引ベース類似度を演算し、演算結果を図12の(a)の演算式に代入して演算し、演算結果をトップルールと他のルール各々との相互間におけるルール類似度として特定する。
ここでは、例えば、図11の中段に示されるように、トップルールである「IDr803」のルールと他のルールである「IDr801」ルールとの相互間のルール類似度である「0.72」、トップルールである「IDr803」のルールと他のルールである「IDr815」ルールとの相互間のルール類似度である「0.55」等を特定する。
=第2ステップ=
第2ステップにおいて、生成部332は、第1ステップで特定したルール類似度がグループ化用閾値以上となる他のルールを特定し、特定した他のルールとトップルールとを含むグループを生成することにより、当該他のルールとトップグループとを相互に同一のグループにグループ化する。
「グループ化用閾値」とは、ルールをグループ化するために用いられる閾値であり、例えば、ルール類似度と比較される数値情報である。このグループ化用閾値については、本実施の形態では、管理者等によって予め定められて入力された情報を用いる場合について説明する。なお、後述する変形例において、サーバ装置3がグループ化用閾値を決定して当該決定した情報を用いる場合について説明する。
ここでは、例えば、グループ化用閾値が「0.6」であるものとして説明する。この場合、図11の中段に示すように、「IDr801」のルールのルール類似度がグループ化用閾値である「0.6」以上となっており、「IDr815」のルール及び「IDr892」のルール類似度は「0.6」未満となっているので、図11の下段の右側に示されるように、トップグループである「IDr803」のルールと「0.6」(グループ化用閾値)以上のルール類似度である他のグループである「IDr801」等を相互に同一のグループにグループ化する。
なお、「0.6」以上のルール類似度となる他のルールが存在しないことも想定されるが、この場合、トップグループのみ含む1個のグループとしてグループ化する。
=第3ステップ=
第3ステップにおいて、生成部332は、第2ステップしてグループ化したルールを、既にグループ化されているので、グループ化の処理の対象から外して、グループ化の処理の対象のルールが無くなるまで(つまり、全てのルールがグループ化されるまで)、第1ステップ及び第2ステップの処理を繰り返し行った上で、第4ステップに移行する。
なお、2回目以降の第1ステップにおいては、既にグループ化されたルールは処理の対象から外されるので、現世代のルールの内のグループ化の処理の対象とされているルール(つまり、未だグループ化されていないルール)の中で、前述の各処理を行う。また、グループ化の処理の対象に1個のみのルールが残ることも想定されるが、この場合、当該ルールのみを含む1個のグループとしてグループ化する。
=第4ステップ=
第4ステップにおいて、第1ステップ~第3ステップの処理によりグループ化された各グループに関して、属するルールが1個のみのグループを特定し、特定したグループを1個のグループ(特定したグループに属する各ルールを含む1個のグループ)として統合する。
上述の処理を実行することにより、例えば、図8の(a)に示される現世代の各ルールが、図8の(b)に示すようにグループ化されることになる。
===SB3===
図7のSB3において生成部332は、現世代のルールを、次世代にコピーする(複製する)。具体的には任意であるが、例えば、図8の(b)に示すようにSB2においてルールがグループ化されており、この各グループについては、相互間のルール類似度がグループ化用閾値以上となっており比較的類似性の度合いが高いルールが同一グループ内に含まれている点に着目して以下の処理を行う。
詳細には、不正取引をより確実に検出するあらゆるタイプのルールを生成する観点から、相互に類似性の度合いが比較的高いルールが多数まとまって次世代にコピーされることを防止するために、各グループに含まれるルールのSB1で特定した信頼度込み適合率に着目して、各グループにおいて当該信頼度込み適合率の数値がより大きいものから順に、各グループに属するルールの全個数の所定割合(予め定められている割合であり、例えば、2割等)分だけ特定し、特定したルールを次世代にコピーする。
ここでは、例えば、図8の(b)において、グループAに50個のルールが含まれており、グループB及びグループCに30個ずつのルールが含まれている場合、グループAの各ルールの内の、SB1で特定した信頼度込み適合率が最大のルールから10番目のルールまでの10個(所定割合である2割に対応する50個×0.2=10個)のルールを特定し、また、グループBの各ルールの内の、SB1で特定した信頼度込み適合率が最大のルールから6番目のルールまでの6個(所定割合である2割に対応する30個×0.2=6個)のルールを特定し、また、グループCについても同様に6個のルールを特定し、特定したこれらのグループAの10個のルール、グループBの6個のルール、及びグループCの6個のルールを次世代へコピーする。
なお、このように、現世代のルールを次世代にコピーすることも、ルールを生成することに対応する概念であるものと解釈してもよい。
===SB4===
図7のSB4において生成部332は、現世代のルール及び遺伝的アルゴリズムの概念に基づいて、適宜新たなルールを生成等した上で、次世代にコピーする。具体的には、所定の確率で以下の第1処理~第3処理の何れかを行う。なお、ここでの処理は、公知の処理を適用できるので、概要のみ説明する。
==第1処理==
第1処理は、遺伝的アルゴリズムの一点交叉に対応する処理である。第1処理に関して生成部332は、前述のグループに関わらず、現世代からランダムに2個のルールを選択し、選択した2個のルール各々に定められている条件に関して、交叉位置をランダムに選択し、選択した交叉位置に対応する条件を2個のルール相互間で交換することにより、新たな2個のルールを生成して、生成した2個のルールを次世代にコピーする。
なお、交叉位置とは、各ルールの相互に交換する条件を定めるための概念であり、例えば、図2の「IDr1」のルールのように、条件が3個設けられている場合、図面の上から2番目及び3番目の条件を定める交叉位置を選択した場合、この2番目及び3番目の条件が交換対象となる。
また、この処理で相互に不整合となる条件(例えば、「経路種別=コンビニ」及び「経路種別=モバイル」)が1個の新たなルールに含まれる可能性もあるが、この場合、不整合となる条件をランダムに選択して消去してもよいし、あるいは、不整合が無くなるまで処理をやり直してもよい。
また、ここで新たに生成したルールと同じルールが次世代に既にコピーされ存在している場合も想定されるが、この場合は、新たに生成したルールについては次世代にコピーせずに再度処理を行って新たなルールを生成したり、何等の処理も行わずにSB4を終了したりしてもよい(第2処理及び第3処理も同様とする)。
なお、ここでは、「前述のグループに関わらず、現世代からランダムに2個のルールを選択し」と説明したが、バリエーションとしては、相互に異なるグループから1個ずつ合計2個のルールを選択して、上述の各処理を行うように構成してもよい。
==第2処理==
第2処理は、遺伝的アルゴリズムの突然変異に対応する処理である。第2処理に関して生成部332は、前述のグループに関わらず、現世代からランダムに1個のルールを選択し、選択した1個のルールに関して、所定の確率で条件削除、条件追加、又は条件変更の何れかの処理を行うことにより、新たな1個のルールを生成して、生成した1個のルールを次世代にコピーする。
条件削除については、例えば、前述の選択した1個のルールに定められている条件の内の任意の個数(条件が最終的に0にならないランダムな個数)の条件をランダムに選択して、選択した条件を削除する。
条件追加については、例えば、条件の項目(図2の「経路種別」等)及び当該項目に対応する情報(図2の「コンビニ」等)をランダムに決定し、前述の選択した1個のルールに対して、当該決定結果に対応する条件を追加する。
条件変更については、例えば、前述の選択した1個のルールに定められている条件の内の1個の条件をランダムに選択し、選択した条件の項目に対応する情報(図2の「コンビニ」、「夜中」等)をランダムに変更したり、あるいは、当該条件の比較演算子である「>=」等をランダムに変更したりする。
==第3処理==
第3処理は、そのままコピーする処理である。第3処理に関して生成部332は、前述のグループに関わらず、現世代からランダムに1個のルールを選択し、選択した1個のルールをそのまま次世代にコピーする。
このように処理することにより、例えば、図8の(c)に示す現世代のルールに基づいて、図8の(f)に示す次世代のルールが更にコピーされることになる。
そして、次世代のルールの個数が所定の個数(管理者等によって予め定めれた個数)以上となるまで、図7のSB4を繰り返し実行する。なお、ここでの繰り返し条件は任意であり、例えば、繰り返し回数が所定回数となるまでSB4を繰り返し実行するように構成してもよいし、あるいは、これ条件の論理和又は論理積に対応する条件を、繰り返し処理を行う条件として用いてもよい。
また、バリエーションとしては、第2処理及び第3処理について繰り返し実行される場合、グループを考慮して処理してもよく、例えば、第2処理及び第3処理に関しては、全てのグループのルールが選択されるまで、前に選択されたルールが属するグループ以外のグループのルールを選択するように構成してもよい。
===SB5===
図7のSB5において生成部332は、世代交代を行う。具体的には任意であるが、例えば、現世代のルールを消去した上で、次世代のルールを現世代にコピーし、この後、次世代のルールを消去する。このように処理することにより、例えば、図8の(f)に示す次世代のルールが、図8の(d)に示す現世代にコピーされることにより、現世代のルールは次世代のルールによって置き換えられて、世代交代が行われることになる。
そして、世代交代が所定回数(管理者等によって予め定められた回数であり、例えば、500回等)行われるまで、図7のSB1~SB5の処理を繰り返し行う。
===SB6===
図7のSB6において生成部332は、世代交代が所定回数行われた後の現世代(つまり、最新の世代)のルールに基づいて、新たなルールを生成する。
具体的な処理は任意であるが、例えば、SB1と同様にして、現世代に属するルール毎に信頼度込み適合率を特定し、次に、SB2と同様にして、現世代のルールをグループ化する。ここでは、例えば、図9の「現世代」の欄に示すように、各ルールがグループE~グループG等にグループ化される。
次に、SB3と基本的には同様にして、前述のグループ化された各グループにおいて、各グループに含まれるルールの前述の特定した信頼度込み適合率に着目して、各グループにおいて当該信頼度込み適合率の数値がより大きいものから順に、各グループに属するルールの総個数の所定割合(予め定められている割合であり、例えば、2割~4割等)分だけ特定し、特定したルールを新たに生成されたルールとする。なお、ここでは、例えば、図9の「最終結果」の欄に示すように、グループE~グループG等から所定割合に対応する個数分だけ特定し、この特定したルールを新たに生成されたルールとする。なお、ここでの所定割合は、SB3での所定割合と同じ値としてもよいし、異なる値としてもよい。これにて、ルール生成処理をリターンする。
===SA2===
図6のSA2において制御部33は、SA1で生成した複数のルール(つまり、ルール群)に関する不正確率込み再現率を特定する。ここでは、不正確率込み再現率について説明した後に、処理内容について説明する。
==不正確率込み再現率==
図13は、不正確率込み再現率の説明図である。「不正確率込み再現率」とは、ルールを評価する指標となる再現率関連情報であり、例えば、ルールにおける不正取引の検出についての再現率と、ルールを評価するために用いられる第2取引情報が示す金融取引が不正取引である可能性(不正取引である確率)とに基づく情報である。不正確率込み再現率とは、例えば、ルールを評価するために用いられる第2取引情報が示す金融取引が不正取引である可能性(不正取引である確率)を反映した再現率を示す概念であるものと解釈することもできる。
==不正確率込み再現率(再現率)==
「再現率」とは、網羅性を評価する公知の指標であり、本実施の形態では例えば、図13の(a)に示す演算式の演算結果に対応する指標である。
図13の「不正取引の総数」とは、図2の「IDr1」のルール(つまり、不正取引を検出するための検出ルール)等の対象となるルールを用いて検出する対象とされた不正取引の総数を示している。また、「不正取引の検出数」とは、図10にて説明した通りである。
この再現率については、ルールの網羅性を評価するための指標として利用できる一方で、例えば、図13の(a)の演算式の分母が「不正取引の総数」となっている通り、ルールを用いて検出する対象とされた金融取引各々が不正取引であるか真正取引であるかを個別に把握可能な状況を前提にした指標であるとも言える。
一方で、図7のSB1の第4ステップで説明した通り、本実施の形態では、図4の第2取引情報(図3の第1取引情報と同様な構成の情報)が示す各金融取引が不正取引か否を示す個別の情報については格納されていないので、不正取引日が記録されている口座(つまり、図5の不正関連情報に口座番号情報が記録されている口座)に関する全ての金融取引(不正取引日以外の金融取引も含む)については、不正取引であり、また、不正取引日が記録されていない口座(つまり、図5の不正関連情報に口座番号情報が記録されていない口座)に関する全ての金融取引については、真正取引であるものとみなして処理することとしている。
このため、例えば、本実施の形態においては、不正取引日が記録されている口座に関する全ての金融取引は、実際には真正取引である可能性が極めて高い金融取引も含めて一律に不正取引として取り扱うことになり、この場合、網羅性が極めて高いルール群を用いて不正取引の検出を行った場合、前述の真正取引である可能性が極めて高い金融取引については、検出されずに、図13の(a)の演算式の分子である「不正取引の検出数」にはカウントされない一方、一律に不正取引として取り扱われてしまうために、図13の(a)の演算式の分母の「不正取引の件数」にはカウントされてしまい、ルール群の真の網羅性を示す真の再現率(「本当の再現率」とも称する)の値から比較的大きく離れてしまう可能性があった。すなわち、この再現率については、本実施の形態のように、不正取引又は真正取引とみなして処理する前述の取り扱いを前提とした場合、ルール群の網羅性を適切に反映できない可能性が生じる点が評価指標として課題となっていた。
==不正確率込み再現率(内容)==
これに対して、本実施の形態で用いる不正確率込み再現率については、第2取引情報が示す金融取引が不正取引である可能性(不正取引である確率)を反映しているために、再現率の課題を解決可能な指標となっている。不正確率込み再現率は、再現率の概念に不正取引である確率の概念を付加する限りにおいて任意であるが、例えば、図13の(b)の演算式の演算結果に対応する数値を不正確率込み再現率として用いる場合について説明する。
図13の(b)の「S」とは、第2取引情報(図4)が示す複数の金融取引の集合(詳細には、第2取引情報が示す複数の金融取引の内の不正取引とみなされる金融取引の集合であり、図5の不正関連情報に口座番号情報が記録されている口座に関する金融取引の集合)を示しており、また、「T」とは、第2取引情報が示す複数の金融取引の内の、検出ルール群によって検出された金融取引の集合(詳細には、第2取引情報が示す複数の金融取引の内の不正取引とみなされる金融取引の内の、検出ルール群によって検出された金融取引の集合)を示している。「P」とは、不正確率込み再現率への影響の減衰率を示す所定の数値である。この「P」については、例えば、指数である後述の「day(i)」の数値が大きくなるほど演算値が小さくなり減衰される所定の数値として、0よりも大きく且つ1よりも小さい数値が用いられる。「i」とは、第2取引情報が示す複数の金融取引各々を特定する変数(詳細には、第2取引情報が示す複数の金融取引の内の不正取引とみなされる金融取引各々を特定する変数)である。「day(i)」とは、基本的には、基準日から、第2取引情報が示す金融取引の内のiが示す金融取引が行われた日までの日数を示す。
「基準日」とは、「day(i)」を特定する基準となる日であり、第2取引情報が示す複数の金融取引の内の不正取引が発生したものと定められた日であり、具体的には、口座単位で定められる日である。「基準日」とは、例えば、金融取引を管理する金融機関によって不正取引が発生したものと定められた日であり、本実施の形態では、図5の不正取引日情報が示す日を示すものとして説明する。
金融取引における不正取引(詐欺取引等を含む不正取引)があった日以前の金融取引に関しては、当該不正取引があった日に近い日の取引は不正取引である確率(可能性)が比較的高く、取引日が古くなるほど(つまり、不正取引があった日から離れるほど)不正取引である確率(可能性)が低くなる実体が想定される。そして、図13の(b)の演算式においては、「P」が0よりも大きく且つ1よりも小さい数値であるために、「day(i)」の数値が大きくなるほど(つまり、基準日から過去に離れるほど)「P」及び「day(i)」の部分の演算値が小さくなり、不正確率込み再現率の演算値に対する影響が減衰されることになる。すなわち、基準日に比較的近い基準日以前の金融取引(つまり、不正取引である確率が比較的高い金融取引)に関する演算結果を、不正確率込み再現率に対して比較的大きく反映させることができるので、本実施の形態の前述の前提において、上記の実体に則して網羅性を表すことが可能となる。
==不正確率込み再現率(バリエーション)==
なお、ここで示した図13の(b)の演算式は例示であり、バリエーションとしては、例えば、任意の係数を分母又は分子に掛け合わせてもよい。また、「基準日」については、バリエーションとしては、例えば、金融機関側で不正取引を任意の手法で常時監視し、不正取引を当日中に判断できる場合において、不正取引があった日より後の日に当該不正取引が行われた口座での取引が停止される運用となっている場合、不正取引があった口座の最終取引日を「基準日」としてもよい。
==SA2の処理==
図6のSA2の処理は任意であるが、例えば、以下の第1ステップ~第5ステップの処理を行う。
=第1ステップ=
第1ステップにおいて、取得部331は、図4の第2取引情報(取引関連情報)を取得する。ここでは、例えば、図4の「IDd9001」に関連付けられた情報を含む各金融取引を示す情報を取得する。
=第2ステップ=
第2ステップにおいて、特定部333は、第1ステップで取得部331が取得した第2取引情報が示す金融取引において、不正取引であるものとみなす金融取引を選択する。
具体的には、まず、図5の不正関連情報を参照して、不正取引日情報が記録されている口座番号情報を特定し、第1ステップで取得した図4の第2取引情報が示す各金融取引に関して、前述の特定した口座番号情報が示す口座に関する金融取引について不正取引であることを示すフラグ情報である「1」を付し、また、この「1」が付された金融取引以外の金融取引について真正取引であることを示すフラグ情報である「0」を付す。
図14は、処理の説明図である。なお、図14においては、図4の第2取引情報が示す各情報において、フラグ情報、遡る日数(後述)、及び不正検出(後述)を例示した図である。ここでは、例えば、図5の不正関連情報を参照して、不正取引日情報が記録されている口座番号情報である「N11」、「N13」等を特定し、第1ステップで取得した図4の第2取引情報が示す各金融取引に関して、口座番号情報として「N11」、「N13」等が関連付けられている「IDd9001」~「IDd9007」、「IDd9021」~「IDd0922」等の金融取引について「1」(不正取引であることを示すフラグ情報)(図14の「フラグ情報」の欄参照)を付し、また、図5の不正関連情報に格納されていない口座番号情報である「N12」が関連付けられている図4の「IDd9011」等の金融取引について「0」(真正取引であることを示すフラグ情報)(図14の「フラグ情報」の欄参照)を付す。
次に、第1ステップで取得部331が取得した第2取引情報が示す金融取引の内の、「1」(不正取引であることを示すフラグ情報)が付されている金融取引を、不正取引であるものとみなす金融取引として選択する。
ここでは、例えば、図4の「IDd9001」~「IDd9007」、「IDd9021」~「IDd0922」等を選択する。そして、ここで選択した金融取引に関して以下の処理を行う。
=第3ステップ=
第3ステップにおいて、特定部333は、第2ステップで選択した金融取引各々について、図13の(b)の演算式の「day(i)」に対応する日数(以下、「遡る日数」とも称する)を特定する。
具体的には、まず、図4の第2取引情報の取引日時情報に着目して、第2ステップで選択した金融取引(つまり、不正取引とみなす金融取引)各々に関して、各口座の各金融取引の取引日から各金融取引日以降の各口座の直近の不正取引日(図5の不正関連情報における不正取引日情報が示す日)までの日数を、遡る日数として特定する。
ここでは、例えば、「N11」の口座については、不正取引日(つまり、基準日)が「2022/1/4」及び「2022/1/6」(図5参照)であるので、図14の「遡る日数」の欄に例示されているように、「IDd9001」の金融取引の取引日である「2022/1/1」から直近の不正取引日である「2022/1/4」までの日数(つまり、各日付の差分となる日数)は3日であるので、遡る日数として「3」を特定する。「IDd9002」~「IDd9006」も同様にして、図14の「遡る日数」の欄に例示されている日数を特定する。
なお、「IDd9007」の金融取引については、当該金融取引の取引日である「2022/1/10」以降に不正取引日は存在しないが、このような場合、当該金融取引については前述の第2ステップで一律に不正取引とみなしたが、実際には真正取引である可能性が極めて高いことを考慮して、当該「IDd9007」の金融取引に関する情報が、図13の(b)の不正確率込み再現率への影響を除去するために、遡る日数として無限大を特定する。なお、本実施の形態では、例えば、「P」の無限大乗の演算については、演算結果を「0」とする。
ここでは、以降に不正取引日が存在しない金融取引については、遡る日数を無限大とすることにより、不正確率込み再現率への影響を除去する場合について説明したが、このような金融取引の影響を除去できる限りにおいて他の手法を用いてもよく、例えば、当該金融取引については以降の各ステップでの処理対象から除去する手法を用いてもよい。
また、例えば、「N13」の口座については、図14に示すように、「IDd9021」及び「IDd9022」の金融取引の遡る日数として、「1」及び「0」を特定する。
=第4ステップ=
第4ステップにおいて、特定部333は、第2ステップで選択した金融取引(つまり、図4の第2取引情報が示す金融取引の内の不正取引とみなす金融取引)において、図6のSA1で生成した複数のルールを含むルール群(例えば、図9の「最終結果」の欄に示されるルールを含むルール群)を用いて不正取引を検出する処理(不正検出処理)を行う。概略的には、前述の「金融機関側不正検出処理」と同様な処理を行う。
具体的には、ルール群に含まれる複数のルール各々を用いて、図7のSB1の「第2ステップ」の「不正検出処理」と同様にして、第2ステップで選択した金融取引において、不正取引を検出する処理を行い、当該複数のルールの内の何れか1個以上のルールにて不正取引を検出した場合、当該ルール群(つまり、図6のSA1で生成した複数のルール全体)を用いて、不正取引を検出したことになる。一方、複数のルール全てにて不正取引を検出しない場合、当該ルール群(つまり、図6のSA1で生成した複数のルール全体)を用いて、不正取引を検出しないことになる。
ここでは、例えば、SA1で生成した複数のルールを含むルール群を用いて、図14の「不正検出」の欄に「〇」が付されている金融取引を不正取引として検出したものとして以下説明する。なお、当該欄に「×」が付されている金融取引については、不正取引とは検出しなかったものとする。
=第5ステップ=
第5ステップにおいて、特定部333は、第3ステップ及び第4ステップの処理結果に基づいて、図13の(b)の演算式を利用して、SA1で生成した複数のルールを含むルール群に関する不正確率込み再現率を特定する。ここでは、例えば、図13の(b)の演算式の「P」として、例えば、「0.9」が定められている場合について説明する。
図15は、不正確率込み再現率の演算例の説明図である。ここでは、例えば、図15の(b)の演算式の分母に関しては、第2ステップで選択した全ての金融取引(つまり、不正取引であるものとみなす金融取引)に関して、第3ステップで特定した遡る日数に対応する数値を「day(i)」に代入することにより、図15の分母の演算例の通り演算する。例えば、図14に示す「IDd9001」の金融取引に関しては、遡る日数として「3」を特定したので、「P」である「0.9」の3乗の演算を行い、他の金融取引に関しても、同様にして、図15に示すように演算を行う。
また、例えば、図15の(b)の演算式の分子に関しては、第2ステップで選択した金融取引(つまり、不正取引であるものとみなす金融取引)の内の、第4ステップで複数のルールを含むルール群を用いて不正取引として検出した金融取引に関して、第3ステップで特定した遡る日数に対応する数値を「day(i)」に代入することにより、図15の分子の演算例の通り演算する。例えば、図14に示す「IDd9001」及び「IDd9002」等については、第4ステップで不正取引としては検出していないので、分子にはこれら対応する数式が反映されておらず、図14の「不正検出」の欄に「〇」が付されている「IDd9003」等の取引に関して分子に反映して図15に示すように演算を行う。
そして、例えば、図15の演算例の演算結果を、SA1で生成した複数のルールを含むルール群に関する不正確率込み再現率として特定する。
===SA3===
図6のSA3において判定部334は、図1の管理端末装置2において、SA1で生成した複数のルールを含むルール群を用いるか否かを判定する。つまり、SA1で生成した複数のルールを含むルール群を適用するか否かを判定する。なお、ここでの判定基準は任意であり、例えば、SA2で特定した不正確率込み再現率を用いて判定する基準を用いてもよいし、あるいは、他の情報を用いて判定する基準を用いてもよいが、ここでは、例えば、不正確率込み再現率を用いる場合について説明し、後述する変形例において、他の情報も用いる場合について説明する。
具体的には任意であるが、例えば、図1の金融機関で現在利用されている複数の検出ルールを含む検出ルール群(以下、「使用中ルール群」)に関して、SA2の処理と同様な処理を行って、不正確率込み再現率を特定する。次に、当該特定した使用中ルール群の不正確率込み再現率と、SA2で特定したSA1で生成したルール群に関する不正確率込み再現率とを相互に比較し、比較結果に基づいて判定する。
不正確率込み再現率の数値が大きい程網羅性が良く、より好ましいルール群であることを考慮して、SA1で生成したルール群の不正確率込み再現率が、使用中ルール群の不正確率込み再現率よりも所定値(例えば、0.01等)以上大きい場合に、SA1で生成した複数のルールを含むルール群を用いるものと判定し(つまり、適用するものと判定し)(SA3のYES)、SA4に移行する。一方、SA1で生成したルール群の不正確率込み再現率が、使用中ルール群の不正確率込み再現率よりも所定値(例えば、0.01等)以上大きいわけではない場合(つまり、SA1で生成したルール群の不正確率込み再現率が使用中ルール群の不正確率込み再現率以下である場合、あるいは、SA1で生成したルール群の不正確率込み再現率が使用中ルール群の不正確率込み再現率よりも大きいもののこれらの再現率の差分が0.01未満である場合)に、SA1で生成した複数のルールを含むルール群を用いないものと判定し(つまり、適用しないものと判定し)(SA3のNO)、処理を終了する。
なお、「SA3のNO」の後に処理を終了する場合、例えば、SA1で生成した複数のルールを含むルール群を示す情報、及び、使用中ルール群の不正確率込み再現率を示す情報等の各種情報を、金融機関側のユーザの端末装置(不図示であり、パーソナルコンピュータ等)に送信して出力してもよいし、あるいは、他の任意のユーザ側に送信して出力してもよいし、又は、サーバ装置3の記録部32に記録してもよい。
なお、バリエーションとしては、SA2で特定した不正確率込み再現率と、所定値(ルール群を用いるか否かを判定するための閾値)とを相互に比較し、比較結果に基づいて判定するように構成してもよい。
===SA4===
図6のSA4において制御部33は、SA1で生成した複数のルールを含むルール群が図1の管理端末装置2で用いられるように、SA1で生成した複数のルールを含むルール群を示す情報を、図1の管理端末装置2に送信することにより、図1の管理端末装置2の記録部に記録する。この後、管理端末装置2は、当該記録部に新たに記録された情報が示すルール群を用いて、金融機関側不正検出処理を実行する。なお、ここでは、例えば、金融機関側の担当者が、管理端末装置2に記録された情報が示すルール群について確認した上で適用するための操作を行った後に、管理端末装置2が当該ルール群を用いて金融機関側不正検出処理を行うこととしてもよいし、あるいは、自動的に適用されるように構成してもよい。このようにして、新たにSA1で生成されたルール群が、管理端末装置2に適用されることになる。これにて、ルール適用処理の説明を終了する。
(実施の形態の効果)
このように本実施の形態によれば、検出ルール群を評価する指標となる情報である再現率関連情報を特定することにより、例えば、検出ルール群を評価することが可能となる。また、再現率関連情報は、検出ルール群における不正取引の検出についての再現率と、取引関連情報が示す金融取引が不正取引である可能性とに基づく情報であることにより、例えば、検出ルール群を適切に評価することが可能となる。
また、所定の演算式に基づいて再現率関連情報を特定することにより、例えば、再現率関連情報を客観的に特定することができるので、検出ルール群を適切に評価することが可能となる。また、例えば、基準日から、取引関連情報が示す複数の金融取引が行われた日までの日数を反映して、再現率関連情報を特定することができるので、不正取引に関する実体(例えば、不正取引(詐欺取引等を含む不正取引)があった日以前の金融取引に関しては、当該不正取引があった日に近い日の取引は不正取引である確率が比較的高く、取引日が古くなるほど不正取引である確率が低くなる実体)を考慮して、適切に再現率関連情報を特定することができ、検出ルール群を適切に評価することが可能となる。
また、金融取引を管理する金融機関によって不正取引が発生したものと定められた日を基準日として、再現率関連情報を特定することにより、例えば、不正取引の実体を考慮して再現率関連情報を特定することができ、検出ルール群を適切に評価することが可能となる。
また、再現率関連情報に基づいて、不正取引を検出するための金融不正取引検出システム(管理端末装置2)において検出ルール群を用いるか否かを判定することにより、例えば、適切な検出ルール群を金融不正取引検出システムにおいて用いることが可能となる。
〔実施の形態に対する変形例〕
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した本発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
(解決しようとする課題や発明の効果について)
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏したりすることがある。
(分散や統合について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散や統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散又は統合して構成できる。また、本出願における「装置」とは、単一の装置によって構成されたものに限定されず、複数の装置によって構成されたものを含む。
(形状、数値、構造、時系列について)
実施の形態や図面において例示した構成要素に関して、形状、数値、又は複数の構成要素の構造若しくは時系列の相互関係については、本発明の技術的思想の範囲内において、任意に改変及び改良することができる。
(グループ化用閾値について)
また、上記実施の形態で説明したグループ化用閾値を、サーバ装置3側で決定するように構成してもよい。具体的な実装手法は任意であるが、例えば、図1の記録部32にグループ情報が格納されており、また、制御部33に閾値決定部が設けられていることとする。
図16は、グループ情報を例示した図であり、図17は、グループの説明図である。例えば、図1の管理端末装置2で用いられる複数のルールについては、金融機関側で任意の目的(例えば、不正取引の種類に応じて用いるルールを定める目的、あるいは、時期に応じて用いるルールを定める目的、あるいは、金融機関側での検出結果に関する分析を容易化する目的等)でルールをグループに分けて用いる場合があり、この場合について説明する。
(グループ化用閾値について-グループ情報)
図1の記録部32に格納されている「グループ情報」(不図示)とは、現世代のルール(図2のルール特定情報が示す複数のルール又は世代交代されて現世代となったルール)をグループ化するためのグループ化基準情報であり、グループ化用閾値を決定するために用いられる情報である。「グループ情報」は、例えば、金融機関で分けられて用いられているルールの前述のグループ(例えば、図17のグループ)を示す情報であり、一例としては、図16に示す各項目の情報が相互に関連付けられている。そして、グループ情報については、金融機関側から取得した情報に基づいて格納されていることとする。
図16の項目「グループID」は、グループを一意に識別するグループIDである(図16では、図17の第1グループを識別する「IDg0001」及び第2グループを識別する「IDg0002」)。図16の項目「グループ名情報」は、グループの名称を示すグループ名情報である(図16では、「g1」及び「g2」)。図17の項目「ルールID」は、各グループに属するルールを識別するルールIDである(図16では、「IDr1」等)。
そして、図16の1段目の情報については、図17の上段に示す「IDg0001」が示す第1グループの名称が「g1」であり、当該グループに「IDr1」及び「IDr2」のルールが属することが示されている。また、図16の2段目の情報については、図17の下段に示す「IDg0002」が示す第2グループの名称が「g2」であり、当該グループに「IDr3」~「IDr5」のルールが属することが示されている。
(グループ化用閾値について-閾値決定部)
図1の制御部33に機能概念的に含まれる閾値決定部(不図示)は、複数の検出ルールを複数のグループにグループ化するためのグループ化基準情報に基づいて、複数の検出ルールを複数のグループにグループ化するためのグループ化用閾値(閾値)であって、類似度情報が示す類似度と比較される閾値を決定する閾値決定手段である。
(グループ化用閾値について-閾値決定処理)
図18は、閾値決定処理のフローチャートであり、図19及び図20は、処理の説明図である。閾値決定処理は、グループ化用閾値を決定するための処理であり、例えば、制御部33の閾値決定部によって実行される処理である。
===SC1===
図18のSC1において閾値決定部は、複数の候補閾値を特定する。「候補閾値」とは、グループ化用閾値の候補となる情報(数値)である。ここは、例えば、管理者等によって設定された刻み幅である「0.1」刻みで「0」より大きく且つ「1」よりも小さい数値を特定することとし、「0.1」、「0.2」、「0.3」等を特定する。
===SC2===
図18のSC2において閾値決定部は、SC1で特定した候補閾値の内の、未だ選択されていない候補閾値を1個選択する。ここでは、例えば、「0.1」を選択する。
===SC3===
図18のSC3において閾値決定部は、SC2で選択した候補閾値に基づいて、図16のグループ情報のルールIDが示すルールをグループ化する。具体的には、SC2で選択した候補閾値を、グループ化用閾値とみなして、図7のSB1及びSB2の処理と同様な処理を行うことにより、図7のルール生成処理でのグループ化と同様な手法で、図16のルールIDが示すルールをグループ化する。
ここでは、例えば、図17に示す各グループに属する「IDr1」~「IDr5」のルールを、図19に示すように、第1グループ~第3グループの3個のグループにグループ化する。
なお、図17の複数のグループ(つまり、図16のグループ情報が示すグループ)については、ユーザ(金融機関)側で定められているグループである観点から、「ユーザグループ群」とも称する。また、図19の複数のグループについては、サーバ装置3によって、図7のSB1及びSB2の処理と同様な処理を行うことにグループ化されたグループである観点から、「算出グループ群」とも称する。
そして、各ルールについては、図20の(a)に示すように、各グループ群の各グループに属することになる。
===SC4===
図18のSC4において閾値決定部は、ユーザグループ群と算出グループ群との相互間の相違度(相違している度合いであり、数値が大きい程相違している度合いが大きいことを示す数値情報)を特定する。具体的には、以下の第1ステップ~第3ステップの処理を行う。
=第1ステップ=
第1ステップにおいて、各グループ群に属するグループ間の相違度を特定する。図21は、グループ間の相違度を示す演算式を例示した図である。具体的には、図21のx+y-2×zの演算式による演算を行うことにより、各グループ群各々に属するグループ相互間の相違度を特定する。なお、演算式の変数である「x」、「y」、「z」の意味は、図示の通りである。
ここでは、例えば、図17のユーザグループ群の第1グループと、図19の算出グループ群の第1グループについては、ユーザグループ群の第1グループに2個のルールが含まれており、算出グループ群の第1グループにも2個のルールが含まれているので、「x」及び「y」として「2」を代入し、「IDr1」のルールが共通となっているので「z」として「1」を代入することにより、「2+2-2×1」の演算結果である「2」を、これらのグループの相互間の相違度として特定する。なお、他のグループに関する相違度については、図20の(b)に示す通り特定する。
=第2ステップ=
第2ステップにおいて、第1ステップの処理結果に基づいて、各グループの他のグループ群に対する変化度(他のグループ群のグループとの相違度の内の最小値)を特定する。
ここでは、例えば、図20の(b)のユーザグループ群の第1グループの他のグループ群のグループとの間の相違度は、2(第1グループとの相違度)、2(第2グループとの相違度)、3(第3グループとの相違度)であるので、これらの内の最小値である「2」を、ユーザグループ群の第1グループの変化度として特定する。同様にして、図10の(c)及び(d)に示すように、各変化度を特定する。
=第3ステップ=
第3ステップにおいて、第2ステップの処理結果に基づいて、ユーザグループ群と算出グループ群との相互間の相違度を特定する。具体的には、第2ステップで特定した変化度の総和(合計)を各グループ群内で求め、「(ユーザグループ群の変化度の合計値+算出グループ群の変化度の合計値)÷2」の演算を行い、演算結果を、各グループ群の相互間の相違度として特定する。
ここでは、例えば、図20の(c)及び(d)に示すように、ユーザグループ群の変化度の合計値が「4」となり、算出グループ群の変化度の合計値が「6」となるので、「(4+6)÷2」の演算を行い、演算結果である「5」(図20の(e))を、各グループ群の相互間の相違度として特定する。
この後、図18のSC1で特定した全ての候補閾値が選択されて、各候補閾値が選択された場合の、各グループ群の相互間の相違度を特定するまで、SC2~SC4を繰り返し実行する。
===SC5===
図18のSC5において閾値決定部は、繰り返し行われるSC4で特定された、各候補閾値に関する各グループ群の相互間の相違度に基づいて、グループ化用閾値を決定する。具体的には、特定された各グループ群の相互間の相違度の内の、最小値となる当該相違度を特定した際に選択されていた候補閾値を、グループ化用閾値として決定する。
ここでは、例えば、候補閾値が「0.5」である場合の、各グループ群の相互間の相違度が最小値である場合、当該候補閾値である「0.5」をグループ化用閾値として決定する。
そして、このようにして決定したグループ化用閾値である「0.5」を用いて、実施の形態で説明した各処理を行うこととする。このように処理することにより、例えば、図17のユーザグループ群の意図(金融機関側の意図)に沿ってグループ化可能なグループ化用閾値を用いて処理を行うことができるので、ユーザ(金融機関)側の利用実体に沿って新たなルールを生成することが可能となる。これにて、閾値決定処理の説明を終了する。
このように構成することにより、グループ化基準情報に基づいて閾値(グループ化用閾値)を決定することにより、例えば、グループ化に関するユーザの意図を閾値に反映させることができるので、ユーザの意図に沿ってグループ化することが可能な閾値を決定することが可能となる。
(減衰率について)
また、上記実施の形態で説明した減衰率(図13の(b)の「P」)を、サーバ装置3側で決定するように構成してもよい。具体的な実装手法は任意であるが、例えば、図1の記録部32に回数情報が格納されており、また、制御部33に減衰率決定部が設けられていることとする。
(減衰率について-回数情報)
図22は、回数情報を例示した図である。図1の記録部に格納されている「回数情報」(不図示)とは、不正取引が行われた口座(金融口座)における不正取引が行われた取引日以前の連続する複数の日各々に行われた金融取引における不正取引の回数と真正取引の回数を示す情報であり、例えば、図22に示す各項目の情報が相互に関連付けられている。
図22の項目「口座番号情報」の情報は、図3の同一名称の情報と同様である。図22の項目「取引種別」の情報は、不正取引又は真正取引を示す情報である(図22では、不正取引を示す「不正」及び真正取引であることを示す「真正」)。
項目「日数」の情報は、各日各々における、項目「口座番号情報」及び項目「取引種別」が示す各口座番号の口座における各種別の金融取引の回数を日毎に示す情報である。項目「日数」の欄の直下の「0」~「14」については、連続した日を示しており、例えば、「0」は不正取引が行われた日を示しており、「1」~「14」については、当該「0」の日の1日前~14日前の日各々を示している。すなわち、例えば、「0」が3月30日である場合、「1」は3月29日を示し、「2」は3月28日を示すことになる。
そして、例えば、この回数情報における項目「口座番号情報」=「N901」の項目「取引種別」=「不正」に関連付けられている項目「日数」=「0」の欄の「2」については、不正取引が2回行われたことが示されており、「日数」=「1」の欄の「2」については、前日にも不正取引が2回行われたことが示されている。
また、例えば、項目「口座番号情報」=「N901」の項目「取引種別」=「真正」に関連付けられている項目「日数」=「0」の欄の「0」については、真正取引が0回行われた(つまり、真正取引が行われなかった)ことが示されており、「日数」=「1」の欄の「1」については、前日に真正取引が1回行われたことが示されている。
すなわち、例えば、項目「口座番号情報」=「N901」に関連付けられている項目「日数」=「0」が示す日には、不正取引が2回行われ、真正取引が行わなかったことが示されており、また、項目「日数」=「1」が示す日(つまり、前日)には、不正取引が2回行われ、真正取引が1回行われたことが示されている。
そして、この回数情報の格納手法は任意であるが、例えば、金融機関側で不正取引と判断した場合に、口座所有者の協力の下で過去の連続する所定期間(例えば、2週間~3週間程度等)の金融取引について、個別に不正取引であったか真正取引であったか口座所有者に確認し、この確認結果に基づいて図22の回数情報を生成し、生成された当該回数情報をサーバ装置3に入力することに格納されることとしてもよい。
(減衰率について-減衰率決定部)
図1の制御部33に機能概念的に設けられる減衰率決定部は、減衰率の候補となる複数の候補数値であって、0よりも大きく1よりも小さい複数の候補数値と、不正取引が行われた金融口座における不正取引が行われた取引日以前の連続する複数の日各々に行われた金融取引における不正取引の回数と真正取引の回数を示す回数情報とに基づいて、減衰率を決定する減衰率決定手段である。減衰率決定部は、例えば、第1処理、第2処理、及び第3処理を行う。
「第1処理」とは、例えば、複数の候補数値各々に基づいて定まる不正推定確率であって、金融取引が不正取引であることを示す確率と推定される不正推定確率を、複数の候補数値各々及び回数情報における複数の日各々に関して特定する処理である。
「第2処理」とは、例えば、回数情報に基づいて定まる基準不正推定確率であって、不正推定確率と比較される基準不正推定確率を、回数情報における複数の日各々に関して特定する処理である。
「第3処理」とは、例えば、第1処理で特定した不正推定確率と、第2処理で特定した基準不正推定確率とを比較し、比較結果に基づいて、複数の候補数値から1個の候補数値を選択し、選択した1個の候補数値を減衰率と決定する処理である。
(減衰率について-減衰率決定処理)
図23は、減衰率決定処理のフローチャートであり、図24及び図25は、処理の説明図である。減衰率決定処理は、減衰率を決定するための処理であり、例えば、制御部33の減衰率決定部によって実行される処理である。
===SD1===
図23のSD1において減衰率決定部は、複数の候補数値を特定する。「候補数値」とは、減衰率の候補となる情報であり、0よりも大きく且つ1よりも小さい数値である。ここは、例えば、管理者等によって設定された刻み幅である「0.02」刻みでユーザによって設定された範囲である「0.7」から「0.98」までの数値を特定する。
===SD2===
図23のSD2において減衰率決定部は、図22の各回数情報の項目「日数」の情報が示す各日各々に関して、不正割合を特定する。「不正割合」とは、回数情報に基づいて定まる情報であって、後述する不正推定確率と比較される情報であり、例えば、各日における金融取引の回数における、不正取引が行われた回数の割合を示す概念である。なお、この不正割合が「基準不正推定確率」に対応するものと解釈してもよい。
具体的には、図22の回数情報の各日の情報に基づいて、図24に示すように、各日において、不正取引の回数、真正取引の回数、及び金融取引の総回数を特定し、「不正取引の回数÷金融取引の総回数」の演算を行い、演算結果を不正割合として特定する。ここでは、例えば、図24の「不正割合」の欄に示すように、「0.667」、「0.625」等を、不正割合として特定する。
===SD3===
図23のSD3において減衰率決定部は、図22の回数情報の項目「日数」の情報が示す各日各々に関して、不正推定確率を特定する。「不正推定確率」とは、複数の候補数値各々に基づいて定まる情報であって、金融取引が不正取引であることを示す確率と推定される確率を示す情報である。
本実施の形態では、例えば、金融取引における不正取引があった日以前の金融取引に関しては、当該不正取引があった日に近い日の取引は不正取引である確率が比較的高く、取引日が古くなるほど不正取引である確率が低くなる実体を考慮して、以下の処理を行う。
処理について具体的には、SD1で特定した候補数値各々に対して、図22の回数情報の項目「日数」が示す日に対応する回数だけ候補数値を掛け合わせて累乗する演算を行い、演算結果を、各候補数値に関して項目「日数」が示す日各々についての不正推定確率として特定する。
ここでは、例えば、図25に示すように、SD1で特定した候補数値である「0.7」に関しては、項目「日数」=「0」について、「0.7」の0乗の演算を行い、演算結果である「1」を不正推定確率として特定し、項目「日数」=「1」及び「2」等について、同様にして、「0.7」の1乗の演算及び「0.7」の2乗等の演算(つまり、0.7×0.7の演算)を行うことにより、演算結果である「0.7」及び「0.49」等を不正推定確率として特定する。そして、SD1で特定した他の候補数値である「0.72」等も同様にして演算することにより、図25に示す各数値を不正推定確率として特定する。
===SD4===
図23のSD4において減衰率決定部は、減衰率を決定する。具体的には、SD2で特定した各日の不正割合を基準にして、SD3で特定した各日の不正推定確率に基づいて決定する。詳細には、SD2で特定した各日の不正割合と、SD3で特定した各日の不正推定確率とをSD1で特定した候補数値毎に比較し、比較結果に基づいて決定する。例えば、SD2で特定した各日の不正割合に対して、誤差が最も小さくなる各日の不正推定確率を特定するために用いられた候補数値を特定し、特定した候補数値を、減衰率として決定する。
ここでは、例えば、不正割合のセット(図24の「不正割合」の欄に図示されている各日の不正割合である「0.667」及び「0.625」等のセット)に対する、「候補数値」=「0.7」の不正推定確率のセット(図25の「候補数値」=「0.7」の不正推定確率である「1」、「0.7」、及び「0.49」等)の誤差、不正割合のセットの誤差に対する、「候補数値」=「0.72」の不正推定確率のセット(図25の「候補数値」=「0.72」の不正推定確率である「1」、「0.72」、及び「0.5184」等のセット)の誤差、及び不正割合のセットの誤差に対する、「候補数値」=「0.74」~「0.98」各々の不正推定確率のセットの各誤差の中で、最小誤差となる不正推定確率のセットとして「候補数値」=「0.76」の不正推定確率のセットを特定した場合、当該不正推定確率のセットを特定するために用いられた候補数値である「0.76」を特定し、「0.76」を減衰率に決定する。
なお、ここでの誤差については、例えば、平均二乗誤差(MSE)を用いてもよいし、他の任意の誤差を用いてもよい。
そして、このようにして決定した減衰率である「0.76」を用いて、実施の形態で説明した各処理を行うこととする。このように処理することにより、例えば、図22に示す取引の実体に即して処理を行うことが可能となる。
なお、SD2~SD4各々が、減衰率決定手段が実行する「第2処理」、「第1処理」、及び「第3処理」各々に対応するものと解釈してもよい。そして、このように、第1処理~第3処理を行うことにより、例えば、不正取引の実体に沿って適切な減衰率を決定することが可能となる。これにて、減衰率決定処理の説明を終了する。
(ルール群を用いるか否かを判定について)
また、上記実施の形態では、図6のSA3において、不正確率込み再現率のみを用いて判定する場合について説明したが、これに限らない。
例えば、図6のSA1で生成した複数のルールを含むルール群全体について信頼度込み適合率を特定し、特定した適合率を用いて判定してもよい。このルール群全体について信頼度込み適合率を特定する処理については、図7のSB1において各ルールについて信頼度込み適合率を特定した処理と同様な処理を用いることができる。
また、例えば、図6のSA1で生成した複数のルールに関して、金融機関側又は他の者を含むユーザが、自己が用いることを想定してグループ化し、このグループ化されたグループをユーザグループ群とした上で、図18のSC4で説明した処理と同様な処理を行うことにより、この図6のSA1で生成した複数のルールに関して、各グループ群の相違度を特定し、特定した相違度を用いて判定してもよい。
ここでは、例えば、「使用中ルール群の不正確率込み再現率に対するSA1で生成したルール群の不正確率込み再現率の変化>=0.01」であり、且つ、「使用中ルール群の信頼度込み適合率に対するSA1で生成したルール群の信頼度込み適合率の変化>=0.01」であり、且つ、「各グループ群の相違度が20以上」である場合に、SA1で生成した複数のルールを含むルール群を用いるものと判定し(図6のSA3の「YES」)、これ以外の場合に、SA1で生成した複数のルールを含むルール群を用いないものと判定する(図6のSA3の「NO」)ように構成してもよい。
(金融機関について)
また、図1に図示されている金融機関については、複数の金融機関の総称を示しているものと解釈してもよいし、あるいは、特定の1個の金融機関を示すものと解釈してもよい。
(第2取引情報について)
また、図4の第2取引情報としては、例えば、図14のフラグ情報が「1」となる情報(つまり、不正取引とみなされる金融取引を示す情報)のみが記録されていることとしてもよい。この場合、図6のSA2の「第2ステップ」(つまり、不正取引であるものとみなす金融取引を選択する所為)を省略して、「第1ステップ」で取得部331が取得した情報に基づいて、「第3ステップ」~「第5ステップ」を実行するように構成してもよい。
(ルール生成処理について)
また、図7のルール生成処理の構成を任意に変更してもよい。例えば、各ステップの繰り返し回数を変更してもよいし、あるいは、繰り返しを行わずにSB1~SB6を1回行ってルールを生成するように構成してもよい。あるいは、例えば、SB1の処理の代わりに又は当該処理に加えて、ルール毎の不正確率込み再現率を特定した上で、当該不正確率込み再現率を用いてSB2以降の処理を行うように構成してもよい。
(ルール群の評価について)
また、上記実施の形態では、図6のルール適用処理のSA2において、ルール群の不正確率込み再現率を特定する場合について説明したがこれに限らず、ルール適用処理から離れて任意のタイミングでルール群の不正確率込み再現率を特定する処理を行うように構成してもよい。例えば、金融機関で現在用いているルール群を評価するために、当該現在のルール群の不正確率込み再現率を特定するように構成してもよいし、あるいは、過去に金融機関で用いていたルール群を評価するために、当該過去のルール群の不正確率込み再現率を特定するように構成してもよい。
(用語の解釈について-ルール群)
また、「ルール群」という用語は、ルールのあつまりを示す概念であり、例えば、複数のルールのあつまりを示しており、すなわち、複数のルールを示しているものと解釈してもよい。
(用語の解釈について-第1検出ルール)
また、例えば、図7のルール生成処理では、図2のルール特定情報が示すルールに基づいて、新たなルールを生成しているので、当該ルール特定情報が示すルールが「第1検出ルール」に対応し、当該ルールの集まりが「第1検出ルール群」に対応するものと解釈してもよい。また、例えば、図7の各ステップは、繰り返し実行されるので、この繰り返し実行される際に処理の対象となる現世代のルール(図8の(a)~(d)参照)(つまり、ルール生成処理の処理途中で現世代として処理されるルール)が「第1検出ルール」に対応し、当該ルールの集まりが「第1検出ルール群」に対応するものと解釈してもよい。
(用語の解釈について-第2検出ルール)
また、例えば、図6のSA1で最終的に生成されるルールが「第2検出ルール」に対応し、当該ルールの集まりが「第2検出ルール群」に対応するものと解釈してもよい。また、例えば、図7のSB3及びS4で次世代にルールをコピーする処理が、ルールを生成する処理に対応するものと解釈し、繰り返し実行されるルール生成処理中にコピーされた次世代のルール(図8の(e)~(f)参照)(つまり、ルール生成処理の処理途中でコピーされて生成されたルール)が「第2検出ルール」に対応し、当該ルールの集まりが「第2検出ルール群」に対応するものと解釈してもよい。
(用語の解釈について-評価システム)
また、上記実施の形態では、図1の情報処理システム100が「評価システム」に対応するものと説明したが、情報処理システム100に含まれる要素であるサーバ装置3が「評価システム」に対応するものと解釈してもよい。また、情報処理システム100又はサーバ装置3は、検出ルール群を生成しているので、「生成システム」に対応するものと解釈してもよい。また、バリエーションとしては、例えば、評価システムは、評価指標として不正確率込み再現率の代わり又は当該不正確率込み再現率と共に、信頼度込み適合率を用いて検出ルール群(第1検出ルール群又は第2検出ルール群)を評価することとしてもよい。
(組み合わせについて)
また、上記実施の形態の特徴と、変形例の特徴を任意に組み合わせてもよい。
(付記)
付記1の評価システムは、金融取引において不正取引を検出するための複数の検出ルールを含む検出ルール群を評価するための評価システムであって、前記検出ルール群を評価するための取引関連情報であって、前記金融取引を示す前記取引関連情報を取得する取得手段と、前記取得手段が取得した前記取引関連情報と、前記検出ルール群とに基づいて、前記検出ルール群についての再現率関連情報を特定する特定手段と、を備え、前記特定手段は、前記取得手段が取得した前記取引関連情報が示す前記金融取引において、前記検出ルール群を用いて前記不正取引を検出する不正検出処理を行い、前記不正検出処理の処理結果に基づいて、前記再現率関連情報を特定し、前記再現率関連情報は、前記検出ルール群を評価する指標となる情報であり、前記再現率関連情報は、前記検出ルール群における前記不正取引の検出についての再現率と、前記取得手段が取得した前記取引関連情報が示す前記金融取引が前記不正取引である可能性とに基づく情報である。
付記2の評価システムは、付記1に記載の評価システムにおいて、前記取引関連情報は、複数の前記金融取引を示しており、前記特定手段は、所定の演算式に基づいて、前記再現率関連情報を特定し、前記所定の演算式は、次の数式であり、
Figure 0007299403000004
上記数式において、Rは、前記再現率関連情報を示しており、Sは、前記取引関連情報が示す複数の前記金融取引の集合を示しており、Tは、前記取引関連情報が示す複数の前記金融取引の内の、前記検出ルール群によって前記不正取引と検出された前記金融取引の集合を示しており、Pは、前記再現率関連情報への影響の減衰率を示す所定の数値であって、0よりも大きく1よりも小さい前記所定の数値を示しており、iは、前記取引関連情報が示す複数の前記金融取引各々を特定する変数を示しており、day(i)は、基準日から、前記取引関連情報が示す複数の前記金融取引の内のiが示す前記金融取引が行われた日までの日数を示しており、前記基準日は、前記取引関連情報が示す複数の前記金融取引の内の前記不正取引が発生したものと定められた日である。
付記3の評価システムは、付記2に記載の評価システムにおいて、前記特定手段は、前記金融取引を管理する金融機関によって前記不正取引が発生したものと定められた日を前記基準日として、前記再現率関連情報を特定する。
付記4の評価システムは、付記2に記載の評価システムにおいて、前記減衰率の候補となる複数の候補数値であって、0よりも大きく1よりも小さい前記複数の候補数値と、前記不正取引が行われた金融口座における前記不正取引が行われた取引日以前の連続する複数の日各々に行われた前記金融取引における前記不正取引の回数と真正取引の回数を示す回数情報とに基づいて、前記減衰率を決定する減衰率決定手段、を備え、前記特定手段は、前記減衰率決定手段が決定した前記減衰率に基づいて、前記再現率関連情報を特定し、前記減衰率決定手段は、前記複数の候補数値各々に基づいて定まる不正推定確率であって、前記金融取引が前記不正取引であることを示す確率と推定される前記不正推定確率を、前記複数の候補数値各々及び前記回数情報における前記複数の日各々に関して特定する第1処理と、前記回数情報に基づいて定まる基準不正推定確率であって、前記不正推定確率と比較される前記基準不正推定確率を、前記回数情報における前記複数の日各々に関して特定する第2処理と、前記第1処理で特定した前記不正推定確率と、前記第2処理で特定した前記基準不正推定確率とを比較し、比較結果に基づいて、前記複数の候補数値から1個の候補数値を選択し、選択した前記1個の候補数値を前記減衰率と決定する第3処理と、を行い、前記不正推定確率は、前記複数の候補数値各々のj乗に対応する演算の演算結果であり、jは、前記不正取引が行われた取引日から前記複数の日各々までの日数を示す数値であり、前記基準不正推定確率は、前記回数情報における前記複数の日各々における、前記回数情報が示す前記不正取引の回数の割合を示す数値である。
付記5の評価システムは、付記1に記載の評価システムにおいて、前記特定手段が特定した前記再現率関連情報に基づいて、前記不正取引を検出するための金融不正取引検出システムにおいて前記検出ルール群を用いるか否かを判定する判定手段、を備える。
付記6の評価プログラムは、金融取引において不正取引を検出するための複数の検出ルールを含む検出ルール群を評価するための評価プログラムであって、コンピュータを、前記検出ルール群を評価するための取引関連情報であって、前記金融取引を示す前記取引関連情報を取得する取得手段と、前記取得手段が取得した前記取引関連情報と、前記検出ルール群とに基づいて、前記検出ルール群についての再現率関連情報を特定する特定手段と、として機能させ前記特定手段は、前記取得手段が取得した前記取引関連情報が示す前記金融取引において、前記検出ルール群を用いて前記不正取引を検出する不正検出処理を行い、前記不正検出処理の処理結果に基づいて、前記再現率関連情報を特定し、前記再現率関連情報は、前記検出ルール群を評価する指標となる情報であり、前記再現率関連情報は、前記検出ルール群における前記不正取引の検出についての再現率と、前記取得手段が取得した前記取引関連情報が示す前記金融取引が前記不正取引である可能性とに基づく情報である。
(付記の効果)
付記1に記載の評価システム、及び付記6に記載の評価プログラムによれば、検出ルール群を評価する指標となる情報である再現率関連情報を特定することにより、例えば、検出ルール群を評価することが可能となる。また、再現率関連情報は、検出ルール群における不正取引の検出についての再現率と、取引関連情報が示す金融取引が不正取引である可能性とに基づく情報であることにより、例えば、検出ルール群を適切に評価することが可能となる。
付記2に記載の評価システムによれば、所定の演算式に基づいて再現率関連情報を特定することにより、例えば、再現率関連情報を客観的に特定することができるので、検出ルール群を適切に評価することが可能となる。また、例えば、基準日から、取引関連情報が示す複数の金融取引が行われた日までの日数を反映して、再現率関連情報を特定することができるので、不正取引に関する実体(例えば、不正取引(詐欺取引等を含む不正取引)があった日以前の金融取引に関しては、当該不正取引があった日に近い日の取引は不正取引である確率が比較的高く、取引日が古くなるほど不正取引である確率が低くなる実体)を考慮して、適切に再現率関連情報を特定することができ、検出ルール群を適切に評価することが可能となる。
付記3に記載の評価システムによれば、金融取引を管理する金融機関によって不正取引が発生したものと定められた日を基準日として、再現率関連情報を特定することにより、例えば、不正取引の実体を考慮して再現率関連情報を特定することができ、検出ルール群を適切に評価することが可能となる。
付記4に記載の評価システムによれば、第1処理~第3処理を行うことにより、例えば、不正取引の実体に沿って適切な減衰率を決定することが可能となる。
付記5に記載の評価システムによれば、再現率関連情報に基づいて、不正取引を検出するための金融不正取引検出システムにおいて検出ルール群を用いるか否かを判定することにより、例えば、適切な検出ルール群を金融不正取引検出システムにおいて用いることが可能となる。
1 取引端末装置
2 管理端末装置
3 サーバ装置
31 通信部
32 記録部
33 制御部
100 情報処理システム
321 ルール特定情報DB
322 第1取引情報DB
323 第2取引情報DB
324 不正関連情報DB
331 取得部
332 生成部
333 特定部
334 判定部

Claims (5)

  1. 金融取引において不正取引を検出するための複数の検出ルールを含む検出ルール群を評価するための評価システムであって、
    前記検出ルール群を評価するための取引関連情報であって、前記金融取引を示す前記取引関連情報を取得する取得手段と、
    前記取得手段が取得した前記取引関連情報と、前記検出ルール群とに基づいて、前記検出ルール群についての再現率関連情報を特定する特定手段と、を備え、
    前記特定手段は、
    前記取得手段が取得した前記取引関連情報が示す前記金融取引において、前記検出ルール群を用いて前記不正取引を検出する不正検出処理を行い、
    前記不正検出処理の処理結果に基づいて、前記再現率関連情報を特定し、
    前記再現率関連情報は、前記検出ルール群を評価する指標となる情報であり、
    前記再現率関連情報は、前記検出ルール群における前記不正取引の検出についての再現率と、前記取得手段が取得した前記取引関連情報が示す前記金融取引が前記不正取引である可能性とに基づく情報であり、
    前記取引関連情報は、複数の前記金融取引を示しており、
    前記特定手段は、所定の演算式に基づいて、前記再現率関連情報を特定し、
    前記所定の演算式は、次の数式であり、
    Figure 0007299403000005
    上記数式において、
    Rは、前記再現率関連情報を示しており、
    Sは、前記取引関連情報が示す複数の前記金融取引の集合を示しており、
    Tは、前記取引関連情報が示す複数の前記金融取引の内の、前記検出ルール群によって前記不正取引と検出された前記金融取引の集合を示しており、
    Pは、前記再現率関連情報への影響の減衰率を示す所定の数値であって、0よりも大きく1よりも小さい前記所定の数値を示しており、
    iは、前記取引関連情報が示す複数の前記金融取引各々を特定する変数を示しており、
    day(i)は、基準日から、前記取引関連情報が示す複数の前記金融取引の内のiが示す前記金融取引が行われた日までの日数を示しており、
    前記基準日は、前記取引関連情報が示す複数の前記金融取引の内の前記不正取引が発生したものと定められた日である、
    評価システム。
  2. 前記特定手段は、前記金融取引を管理する金融機関によって前記不正取引が発生したものと定められた日を前記基準日として、前記再現率関連情報を特定する、
    請求項に記載の評価システム。
  3. 前記減衰率の候補となる複数の候補数値であって、0よりも大きく1よりも小さい前記複数の候補数値と、前記不正取引が行われた金融口座における前記不正取引が行われた取引日以前の連続する複数の日各々に行われた前記金融取引における前記不正取引の回数と真正取引の回数を示す回数情報とに基づいて、前記減衰率を決定する減衰率決定手段、を備え、
    前記特定手段は、前記減衰率決定手段が決定した前記減衰率に基づいて、前記再現率関連情報を特定し、
    前記減衰率決定手段は、
    前記複数の候補数値各々に基づいて定まる不正推定確率であって、前記金融取引が前記不正取引であることを示す確率と推定される前記不正推定確率を、前記複数の候補数値各々及び前記回数情報における前記複数の日各々に関して特定する第1処理と、
    前記回数情報に基づいて定まる基準不正推定確率であって、前記不正推定確率と比較される前記基準不正推定確率を、前記回数情報における前記複数の日各々に関して特定する第2処理と、
    前記第1処理で特定した前記不正推定確率と、前記第2処理で特定した前記基準不正推定確率とを比較し、比較結果に基づいて、前記複数の候補数値から1個の候補数値を選択し、選択した前記1個の候補数値を前記減衰率と決定する第3処理と、を行い、
    前記不正推定確率は、前記複数の候補数値各々のj乗に対応する演算の演算結果であり、
    jは、前記不正取引が行われた取引日から前記複数の日各々までの日数を示す数値であり、
    前記基準不正推定確率は、前記回数情報における前記複数の日各々における、前記回数情報が示す前記不正取引の回数の割合を示す数値である、
    請求項に記載の評価システム。
  4. 前記特定手段が特定した前記再現率関連情報に基づいて、前記不正取引を検出するための金融不正取引検出システムにおいて前記検出ルール群を用いるか否かを判定する判定手段、を備える、
    請求項1に記載の評価システム。
  5. 金融取引において不正取引を検出するための複数の検出ルールを含む検出ルール群を評価するための評価プログラムであって、
    コンピュータを、
    前記検出ルール群を評価するための取引関連情報であって、前記金融取引を示す前記取引関連情報を取得する取得手段と、
    前記取得手段が取得した前記取引関連情報と、前記検出ルール群とに基づいて、前記検出ルール群についての再現率関連情報を特定する特定手段と、として機能させ、
    前記特定手段は、
    前記取得手段が取得した前記取引関連情報が示す前記金融取引において、前記検出ルール群を用いて前記不正取引を検出する不正検出処理を行い、
    前記不正検出処理の処理結果に基づいて、前記再現率関連情報を特定し、
    前記再現率関連情報は、前記検出ルール群を評価する指標となる情報であり、
    前記再現率関連情報は、前記検出ルール群における前記不正取引の検出についての再現率と、前記取得手段が取得した前記取引関連情報が示す前記金融取引が前記不正取引である可能性とに基づく情報であり、
    前記取引関連情報は、複数の前記金融取引を示しており、
    前記特定手段は、所定の演算式に基づいて、前記再現率関連情報を特定し、
    前記所定の演算式は、次の数式であり、
    Figure 0007299403000006
    上記数式において、
    Rは、前記再現率関連情報を示しており、
    Sは、前記取引関連情報が示す複数の前記金融取引の集合を示しており、
    Tは、前記取引関連情報が示す複数の前記金融取引の内の、前記検出ルール群によって前記不正取引と検出された前記金融取引の集合を示しており、
    Pは、前記再現率関連情報への影響の減衰率を示す所定の数値であって、0よりも大きく1よりも小さい前記所定の数値を示しており、
    iは、前記取引関連情報が示す複数の前記金融取引各々を特定する変数を示しており、
    day(i)は、基準日から、前記取引関連情報が示す複数の前記金融取引の内のiが示す前記金融取引が行われた日までの日数を示しており、
    前記基準日は、前記取引関連情報が示す複数の前記金融取引の内の前記不正取引が発生したものと定められた日である、
    評価プログラム。
JP2022181504A 2022-11-14 2022-11-14 評価システム、及び評価プログラム Active JP7299403B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022181504A JP7299403B1 (ja) 2022-11-14 2022-11-14 評価システム、及び評価プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022181504A JP7299403B1 (ja) 2022-11-14 2022-11-14 評価システム、及び評価プログラム

Publications (2)

Publication Number Publication Date
JP7299403B1 true JP7299403B1 (ja) 2023-06-27
JP2024070881A JP2024070881A (ja) 2024-05-24

Family

ID=86900560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022181504A Active JP7299403B1 (ja) 2022-11-14 2022-11-14 評価システム、及び評価プログラム

Country Status (1)

Country Link
JP (1) JP7299403B1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040847A (ja) * 2006-08-08 2008-02-21 Hitachi Ltd ルール評価システム
US20120101930A1 (en) * 2010-10-21 2012-04-26 Caiwei Li Software and Methods for Risk and Fraud Mitigation
CN110603558A (zh) * 2017-04-21 2019-12-20 源讯公司 用于管理金融交易系统中的欺诈检测的系统和方法
US20200334679A1 (en) * 2019-04-19 2020-10-22 Paypal, Inc. Tuning fraud-detection rules using machine learning
US20210142329A1 (en) * 2019-11-12 2021-05-13 Feedzai - Consultadoria e Inovação Tecnólogica, S.A. Automated rules management system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040847A (ja) * 2006-08-08 2008-02-21 Hitachi Ltd ルール評価システム
US20120101930A1 (en) * 2010-10-21 2012-04-26 Caiwei Li Software and Methods for Risk and Fraud Mitigation
CN110603558A (zh) * 2017-04-21 2019-12-20 源讯公司 用于管理金融交易系统中的欺诈检测的系统和方法
US20200334679A1 (en) * 2019-04-19 2020-10-22 Paypal, Inc. Tuning fraud-detection rules using machine learning
US20210142329A1 (en) * 2019-11-12 2021-05-13 Feedzai - Consultadoria e Inovação Tecnólogica, S.A. Automated rules management system

Similar Documents

Publication Publication Date Title
US20180365696A1 (en) Financial fraud detection using user group behavior analysis
US7945515B2 (en) Mass compromise/point of compromise analytic detection and compromised card portfolio management system
CN108491474A (zh) 一种数据分类方法、装置、设备及计算机可读存储介质
KR101706136B1 (ko) 이상 패턴 분석 방법, 이를 수행하는 이상 패턴 분석 장치 및 이를 저장하는 기록매체
CN110060053B (zh) 一种识别方法、设备及计算机可读介质
WO2009010950A1 (en) System and method for predicting a measure of anomalousness and similarity of records in relation to a set of reference records
JP2004334526A (ja) 不正判定のスコア値算出プログラム、不正判定のスコア値算出方法、及びクレジットカードの不正判定スコア値算出システム
US11853110B2 (en) Auto-tuning of rule weights in profiles
Bakhach et al. TSFDC: A trading strategy based on forecasting directional change
EP3613003A1 (fr) Système et procédé pour gérer la détection de fraudes dans un système de transactions financières
WO2023009590A1 (en) Authenticating based on user behavioral transaction patterns
CN110728301A (zh) 一种个人用户的信用评分方法、装置、终端及存储介质
Rajwani et al. Regression analysis for ATM cash flow prediction
KR20180059203A (ko) 지불 거절 사기 사용자의 예측 방법 및 프로그램
JP7299403B1 (ja) 評価システム、及び評価プログラム
JP7277661B1 (ja) 生成システム、及び生成プログラム
KR102199587B1 (ko) 암호화폐 거래 분석 방법 및 장치
JP2024070881A (ja) 評価システム、及び評価プログラム
JP2024070880A (ja) 生成システム、及び生成プログラム
CN115496501A (zh) 交易金额核验方法及装置
KR102178253B1 (ko) 사기 관리 시스템 및 방법
Siregar et al. Classification data for direct marketing using deep learning
Kang Fraud Detection in Mobile Money Transactions Using Machine Learning
US11270230B1 (en) Self learning machine learning transaction scores adjustment via normalization thereof
US11544715B2 (en) Self learning machine learning transaction scores adjustment via normalization thereof accounting for underlying transaction score bases

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221115

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230615

R150 Certificate of patent or registration of utility model

Ref document number: 7299403

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150