JP7316984B2 - Information processing system and information processing method - Google Patents
Information processing system and information processing method Download PDFInfo
- Publication number
- JP7316984B2 JP7316984B2 JP2020149694A JP2020149694A JP7316984B2 JP 7316984 B2 JP7316984 B2 JP 7316984B2 JP 2020149694 A JP2020149694 A JP 2020149694A JP 2020149694 A JP2020149694 A JP 2020149694A JP 7316984 B2 JP7316984 B2 JP 7316984B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- information processing
- transaction
- feature amount
- identification information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 189
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000000034 method Methods 0.000 claims description 130
- 230000008569 process Effects 0.000 claims description 111
- 230000004044 response Effects 0.000 claims description 29
- 238000007619 statistical method Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 description 39
- 230000007774 longterm Effects 0.000 description 26
- 238000009795 derivation Methods 0.000 description 21
- 239000000523 sample Substances 0.000 description 16
- 230000000694 effects Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Description
本発明は、情報処理システムおよび情報処理方法に関し、特に取引の不正の判定に関する処理を実行する情報処理システムおよび情報処理方法に用いて好適なものである。 The present invention relates to an information processing system and an information processing method, and is particularly suitable for use in an information processing system and an information processing method for executing processing related to determination of fraudulent transactions.
従来、クレジットカードの不正使用の判定等、何らかの取引の不正について判定することが広く行われており、当該判定に関する様々な技術が提案されている。なお、取引とは、クレジットカードの使用に限られず、例えばデビットカードやプリペイドカードの使用等、取引にあたってその取引が不正でないかどうかを判定することが求められるものを広く指し示している。このような中、特許文献1では、取引の一種であるクレジットカードの使用についての不正の判定に関して、モデルを使用して不正検出を行うシステムが提案されている。なおモデルとは、線形アルゴリズムや決定木アルゴリズム、ディープラーニング等、既知の機械学習手法(いわゆるAI)と同等である。この種のシステムでは一般に、クレジットカードが使用されると、使用に応じて発生する発生値(利用額や利用時刻等)を利用して複数種類の特徴量が導出され、導出された各特徴量がモデルに入力され、モデルが出力した情報を利用して不正か否かの判定が行われる。 2. Description of the Related Art Conventionally, determination of fraudulent transactions such as determination of fraudulent use of credit cards has been widely performed, and various techniques related to such determination have been proposed. Transactions are not limited to the use of credit cards, and broadly refer to transactions such as the use of debit cards and prepaid cards, for which it is required to determine whether or not the transaction is fraudulent. Under such circumstances, Patent Literature 1 proposes a system for detecting fraud using a model for judging fraud in the use of a credit card, which is a type of transaction. A model is equivalent to a known machine learning method (so-called AI) such as a linear algorithm, a decision tree algorithm, or deep learning. Generally, in this type of system, when a credit card is used, multiple types of feature values are derived using generated values (amount used, time of use, etc.) generated according to use, and each derived feature value is input to the model, and the information output by the model is used to determine whether or not it is fraudulent.
一般にモデルに入力される特徴量には、現時点から遡って所定の期間に発生した発生値を用いて統計学的手法により求められるものが含められる。例えば現時点から遡って1日、1週間、1ヶ月といった単位で発生した利用額の平均値や標準偏差が特徴量とされる。これは以下の理由による。取引がクレジットカードの使用である場合を例として説明すると、クレジットカードの不正使用の判定は、基本的には、通常と異なる異常な態様でクレジットカードが使用されていないかどうかという観点で行われるが、このような特徴量を用いることにより、モデルの出力値を、今回の発生値が統計学的な外れ値に該当する可能性を反映した値とすることができ、上記観点を考慮した判定が可能となるからである。 Generally, the feature values input to the model include those obtained by a statistical method using occurrence values occurring in a predetermined period going back from the present time. For example, the feature amount is the average value or standard deviation of the amount of usage generated in units of one day, one week, one month, etc. from the current time point. This is for the following reasons. Taking a case where the transaction is the use of a credit card as an example, the determination of unauthorized use of the credit card is basically made from the viewpoint of whether the credit card is being used in an unusual manner. However, by using such a feature value, the output value of the model can be a value that reflects the possibility that the current occurrence value corresponds to a statistical outlier, and the judgment considering the above viewpoint This is because
ここでモデルに関しては、短い期間に発生した発生値を用いて導出される特徴量だけでなく、長い期間に発生した発生値を用いて導出される特徴量もモデルの入力とする方が、モデルの出力の精度の向上を期待できる。例えば、現時点から遡って1日、1週間および1ヶ月という単位の発生値に係る特徴量だけでなく、1年という単位の発生値に係る特徴量を含めた方がモデルの出力値の精度の向上を期待でき、更にこれに加え、2年という単位の発生値に係る特徴量を含めた方がモデルの出力値の精度の向上を期待できる。これは、モデルの出力を、短期間だけではなく長期間も含めた様々な期間における取引の態様を反映した値とすることが可能となるからである。 Here, regarding the model, it is better to input not only the feature values derived using the occurrence values that occurred in a short period of time, but also the feature values derived using the occurrence values that occurred in a long period of time. can be expected to improve the accuracy of the output of For example, it is better to include feature values related to occurrence values in units of one year, in addition to feature values related to occurrence values in units of one day, one week, and one month going back from the present time. In addition to this, it is expected that the accuracy of the output value of the model will be improved by including the feature amount related to the occurrence value in units of two years. This is because the output of the model can be a value that reflects the mode of trading in various periods including not only the short term but also the long term.
そして従来、ある期間に係る特徴量をモデルの入力とする場合、その期間に発生した発生値の全てを累積的にデータベースに登録しておき、特徴量を導出するタイミングで、システムがデータベースからその期間における発生値を読み出し、読み出した発生値に基づいて特徴量を導出するようにしていた。このため、モデルの出力の精度を向上させるために、長い期間に係る特徴量をモデルの入力の1つにしようとすると、以下の問題が生じていた。 Conventionally, when a feature value related to a certain period is used as an input for a model, all occurrence values that occurred during that period are cumulatively registered in a database, and at the timing of deriving the feature value, the system extracts that value from the database. The occurrence value in the period is read, and the feature amount is derived based on the read occurrence value. For this reason, when attempting to use feature amounts related to a long period of time as one of the inputs of the model in order to improve the accuracy of the output of the model, the following problems have arisen.
すなわち、基本的には期間が長ければ長いほど発生する発生値が多くなる。このため、長い期間に係る特徴量をモデルの入力の1つにしようとすると、特徴量を導出するために必要な発生値の個数が多大になり、特徴量を導出するにあたって、多大な個数の発生値をデータベースから読み出すと共に、読み出した全ての発生値を要素として使用して特徴量を導出する必要が生じ、特徴量を導出するときの一連の処理に要する時間が長時間化してしまうという問題があった。 That is, basically, the longer the period, the more generated values are generated. For this reason, if one tries to use feature values related to a long period of time as one of the inputs of the model, the number of generated values required to derive the feature values becomes large. In addition to reading the generated values from the database, it becomes necessary to derive the feature value using all the read generated values as elements. was there.
本発明は、このような問題を解決するために成されたものであり、特徴量の導出に要する時間の長時間化を抑制しつつ、モデルの出力の精度を向上させることを目的とする。 SUMMARY OF THE INVENTION The present invention has been made to solve such problems, and it is an object of the present invention to improve the accuracy of the output of a model while suppressing the lengthening of the time required for deriving feature values.
上記した課題を解決するために、本発明では、モデルに入力される特徴量として、現時点から遡って所定の期間に発生した発生値のそれぞれを用いて統計学的手法により導出可能な対応特徴量を含めており、取引に応じて対応特徴量を導出する際、過去に発生した発生値の群を対象として事前に統計学的手法により導出され、記憶部に記憶された特徴量を、その群に属する個々の発生値に代えて用いて対応特徴量を導出するようにしている。 In order to solve the above-described problems, in the present invention, as a feature value to be input to the model, a corresponding feature value that can be derived by a statistical method using each occurrence value that occurred in a predetermined period going back from the present time When deriving the corresponding feature amount according to the transaction, the feature amount that was derived in advance by a statistical method for the group of occurrence values that occurred in the past and was stored in the storage unit is used as the group is used in place of the individual occurrence values belonging to , to derive the corresponding feature quantity.
上記のように構成した本発明によれば、本来、現時点から遡って所定の期間に発生した発生値のそれぞれを用いて統計学的手法により導出される対応特徴量の導出に際し、現時点から遡って所定の期間に発生した全ての発生値が読み出され、これらを処理対象として導出されるのではなく、以下の処理が行われる。すなわち事前に、過去に発生した発生値の群を対象として統計学的手法により統計量が導出され、記憶される。そして対応特徴量は、その群に属する個々の発生値に代えて、その群について事前に記憶された統計量が用いられて導出される。 According to the present invention configured as described above, when deriving the corresponding feature amount derived by a statistical method using each occurrence value occurring in a predetermined period retroactively from the present time, Instead of reading out all the generated values generated in a predetermined period and deriving them as objects to be processed, the following processing is performed. That is, a statistic is derived and stored in advance by a statistical method for a group of generated values that occurred in the past. Corresponding features are then derived using pre-stored statistics for the group instead of the individual occurrence values belonging to the group.
このため、対応特徴量を導出する際に、個々の発生値を把握し、全ての発生値を要素として使用して対応特徴量を導出する必要がなく、発生値の群毎の統計量を把握し、これを要素として使用すれば足り、対応特徴量の導出に際して把握すべき要素の個数が減少すると共に、実際の計算に利用する要素の個数が減少し、特徴量の導出に要する時間の長時間化を抑制できる。更には特徴量の導出に要する時間の長時間化を抑制しつつ、より長い期間に発生した発生値を用いた対応特徴量をモデルの入力とすることが可能となり、このようにすることによってモデルの出力の精度を向上できる。 Therefore, when deriving the corresponding feature value, it is not necessary to grasp the individual occurrence values and derive the corresponding feature value using all the occurrence values as elements. However, it is sufficient to use these as elements, and the number of elements to be grasped when deriving the corresponding feature amount is reduced, and the number of elements to be used for actual calculation is reduced, and the time required for deriving the feature amount is lengthened. Time can be suppressed. Furthermore, it is possible to input the corresponding feature values using the generated values generated over a longer period of time to the model while suppressing the lengthening of the time required to derive the feature values. can improve the accuracy of the output of
以下、本発明の一実施形態を図面に基づいて説明する。図1は、本実施形態に係る不正使用判定システム1の構成例を示すネットワーク図である。図1で示すように、本実施形態に係る不正使用判定システム1は、情報処理サーバ2(特許請求の範囲の「情報処理システム」に相当)と、複数のクライアント装置3とを含んで構成されている。情報処理サーバ2と複数のクライアント装置3のそれぞれとは、インターネット、電話網、その他の通信網を含んで構成されたネットワーク4を介して通信可能に接続されている。 An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a network diagram showing a configuration example of an unauthorized use determination system 1 according to this embodiment. As shown in FIG. 1, an unauthorized use determination system 1 according to the present embodiment includes an information processing server 2 (corresponding to an "information processing system" in the claims) and a plurality of client devices 3. ing. The information processing server 2 and each of the plurality of client devices 3 are communicably connected via a network 4 including the Internet, a telephone network, and other communication networks.
不正使用判定システム1は、クレジットカードが使用されたときに、そのクレジットカードの使用が不正使用か否かの判定を行う機能を少なくとも有するシステムである。そしてクライアント装置3とは、クレジットカードの使用があったときに、リクエストデータ(いわゆるオーソリデータ。内容の詳細は後述)を情報処理サーバ2に送信する装置の総称であり、例えば実店舗のレジに設けられた専用の決済端末や、駅券売機等の専用機で行われる決済に関する処理を実行するサーバ装置、ECサイトの決済に関する処理を実行するサーバ装置等がクライアント装置3として機能する。 The unauthorized use judgment system 1 is a system having at least a function of judging whether or not the use of the credit card is unauthorized use when the credit card is used. The client device 3 is a general term for devices that transmit request data (so-called authorization data; the details will be described later) to the information processing server 2 when a credit card is used. A dedicated payment terminal provided, a server device that executes processing related to payment performed by a dedicated machine such as a station ticket vending machine, a server device that executes processing related to payment of an EC site, and the like function as the client device 3 .
以下の説明において、クレジットカードを使用する者を「ユーザ」という。また、クレジットカードが使用されることを単に「取引」ということがあり、特に情報処理サーバ2が処理対象としているリクエストデータが送信されるきっかけとなった取引のことを「今回取引」という場合がある。また、クレジットカードの不正使用を単に「不正使用」という場合がある。また、クレジットカードが使用され、これに応じてリクエストデータが送信されたことを単に「リクエストデータが発生した」のように表現する場合がある。 In the following description, a person who uses a credit card is referred to as a "user". In addition, the use of a credit card may be simply referred to as a "transaction", and in particular, the transaction that triggered the transmission of request data to be processed by the information processing server 2 may be referred to as a "current transaction". be. Also, the unauthorized use of a credit card may be simply referred to as "unauthorized use". Also, the use of a credit card and the transmission of request data in response to this may simply be expressed as "request data is generated".
なお、クレジットカードの不正使用とは、クレジットカードが悪意を持って不正に使用されることのみを意味するのではく、悪意/善意は関係なく禁止された方法で使用されたり、想定していない方法で使用されたりすることを含む。また本実施形態では、不正の判定が行われる対象の取引を「クレジットカードの使用」としている。しかしながら、これはあくまで一例であり、不正の判定が行われる対象として他の取引を含めてもよいことは勿論である。取引は、例えば、信用を利用した他の決済手段の試行(カード型のクレジットカードの使用を必ずしも伴わなくてもよい)であってもよく、デビットカードやプリペイドカード等の使用であってもよい。 Please note that unauthorized use of a credit card does not only mean that a credit card is used fraudulently with malicious intent. Including being used in a method. Further, in the present embodiment, "use of credit card" is defined as a transaction to be determined as fraudulent. However, this is only an example, and it goes without saying that other transactions may be included as targets for which fraud determination is performed. The transaction may be, for example, a trial of other payment means using credit (not necessarily involving the use of a card-type credit card), or the use of a debit card, prepaid card, etc. .
図2は、情報処理サーバ2の機能構成例を示すブロック図である。図2で示すように、情報処理サーバ2は、機能構成として、通信部10および情報処理部11を備えている。上記各機能ブロック10、11は、ハードウェア、DSP(Digital Signal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック10、11は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記録媒体に記憶されたプログラムが動作することによって実現される。通信部10は、所定の通信規格に従って、ネットワーク4と接続する装置と通信する。また、情報処理サーバ2は、記憶手段として、記憶部12を備えている。 FIG. 2 is a block diagram showing a functional configuration example of the information processing server 2. As shown in FIG. As shown in FIG. 2, the information processing server 2 includes a communication section 10 and an information processing section 11 as functional configurations. Each of the functional blocks 10 and 11 can be configured by hardware, DSP (Digital Signal Processor), or software. For example, when configured by software, each of the functional blocks 10 and 11 is actually configured with a computer CPU, RAM, ROM, etc., and a program stored in a recording medium such as RAM, ROM, hard disk, or semiconductor memory. is realized by the operation of The communication unit 10 communicates with devices connected to the network 4 according to a predetermined communication standard. The information processing server 2 also includes a storage unit 12 as storage means.
なお図1、2では、情報処理サーバ2を1つのブロックにより表しているが、これは情報処理サーバ2が単一のサーバ装置により構成されることを意味するものではない。情報処理サーバ2は、複数の装置により構成されてもよく、所定のシステムの一部であってもよい。例えば、情報処理サーバ2は、複数のサーバ装置が連携して構成されてもよい。この場合、複数のサーバ装置が連携して特許請求の範囲の「情報処理システム」として機能する。 Although the information processing server 2 is represented by one block in FIGS. 1 and 2, this does not mean that the information processing server 2 is composed of a single server device. The information processing server 2 may be composed of a plurality of devices, or may be part of a predetermined system. For example, the information processing server 2 may be configured by a plurality of server devices working together. In this case, a plurality of server devices cooperate to function as an "information processing system" in the scope of claims.
情報処理サーバ2は、ユーザによりクレジットカードの使用があったときにクライアント装置3からの要求(リクエストデータの送信)に応じて、不正使用の判定に関する処理を実行する。以下、ユーザによりクレジットカードが使用された場合のクライアント装置3および情報処理サーバ2の処理について詳述する。 The information processing server 2 executes processing related to determination of unauthorized use in response to a request (transmission of request data) from the client device 3 when the user uses the credit card. The processing of the client device 3 and the information processing server 2 when the credit card is used by the user will be described in detail below.
店舗やECサイト等でユーザによりクレジットカードが使用されると、対応するクライアント装置3は、リクエストデータを生成して、情報処理サーバ2に送信し、不正使用の判定を要求する。後に明らかとなる通り、情報処理サーバ2は、リクエストデータに基づいて不正使用か否かを判定し、不正使用と判定した場合にはその旨の、不正使用ではないと判定した場合にはその旨のレスポンスデータを応答する。本実施形態では、クライアント装置3がリクエストデータを送信してから、レスポンスデータを受け取るまでの時間を「レスポンス時間」と定義する。レスポンス時間は、ユーザの待ち時間に影響する。従って、レスポンス時間はできるだけ短いことが求められる。後に明らかとなる通り、本実施形態では、レスポンス時間の短縮化と不正使用の判定の精度の向上との双方を実現している。 When a user uses a credit card at a store, an EC site, or the like, the corresponding client device 3 generates request data, transmits the request data to the information processing server 2, and requests determination of unauthorized use. As will become clear later, the information processing server 2 judges whether or not the request data is unauthorized use, and if it is judged to be unauthorized use, to that effect, and if it is judged not to be unauthorized use, to that effect. response data. In this embodiment, the time from when the client device 3 transmits request data to when it receives response data is defined as “response time”. Response time affects user latency. Therefore, it is required that the response time be as short as possible. As will become apparent later, this embodiment achieves both a reduction in response time and an improvement in the accuracy of unauthorized use determination.
リクエストデータには、情報処理サーバ2が不正使用の判定に関する処理を実行するにあたって必要な情報が含まれている。本実施形態では、リクエストデータに係る項目として少なくとも以下の項目が存在しており、リクエストデータには、各項目の項目値が含まれている。すなわち本実施形態では、クレジットカードに係る項目として、クレジットカード番号、ユーザID、発生日時および利用額が少なくとも存在する。 The request data includes information necessary for the information processing server 2 to execute processing related to determination of unauthorized use. In this embodiment, at least the following items exist as items related to request data, and the request data includes item values of each item. That is, in this embodiment, credit card number, user ID, date and time of occurrence, and usage amount are at least included as items related to the credit card.
クレジットカード番号は、クレジットカードに一意に付与された番号である。以下、クレジットカード番号の項目値を「クレカ番号値」という。ユーザIDは、ユーザを識別する識別情報である。以下、ユーザIDの項目値を「ユーザID値」という。ここでユーザID値を取得できる状態で決済が行われることがある。例えば、ユーザIDを利用したログインを必要とするサービス(電子モールやインターネットオークション等)において決済が行われる場合や、ユーザIDが付与された会員のみが利用できるサービスにおいて決済が行われる場合等である。このようにユーザID値を取得できる状態で決済が行われる場合に、リクエストデータにユーザID値が含められる。 A credit card number is a number uniquely assigned to a credit card. The item value of the credit card number is hereinafter referred to as "credit card number value". A user ID is identification information that identifies a user. Hereinafter, the item value of the user ID will be referred to as "user ID value". In some cases, the payment is made in a state where the user ID value can be obtained. For example, when making payments for services that require login using user IDs (electronic malls, internet auctions, etc.), or when making payments for services that can only be used by members with user IDs. . When payment is made in such a state that the user ID value can be acquired, the user ID value is included in the request data.
発生日時は、クレジットカードが使用された日時(リクエストデータの生成、送信が行われた日時と言い換えてもよい。日時は、日付+時刻を意味する)である。以下、発生日時の項目値を「発生日時値」という。利用額とは、クレジットカードを使用して支払われる代金のことである。以下、利用額の項目値を「利用額値」という。 The date and time of occurrence is the date and time when the credit card was used (it can be paraphrased as the date and time when the request data was generated and transmitted. The date and time means date + time). Hereinafter, the item value of the date and time of occurrence will be referred to as "date and time of occurrence value". A usage amount is a price paid using a credit card. Hereinafter, the item value of the usage amount will be referred to as the “usage amount value”.
なお、発生日時値および利用額値は、特許請求の範囲の「発生値」に相当する。発生値は、クレジットカードの使用に応じて発生する値であればよく、本実施形態で例示するものに限られない。またクレジットカード番号およびユーザIDが特許請求の範囲の「個別識別情報」に相当し、特に、クレジットカード番号は取引に媒体が用いられる場合における媒体自体を識別する個別識別情報に、ユーザIDは取引の実行者を識別する個別識別情報に相当する。本実施形態で例示する項目は、説明の単純化のために抜粋した一部であり、当然、例示した項目以外の項目が存在してもよい。例えば、個別識別情報に関し、ユーザの端末を利用して取引が行われる場合に(ユーザの端末のブラウザを利用したオンライン決済を想定)、その端末を識別するための何らかの情報(アクセス元のIPアドレスや、端末固有の端末ID(MACアドレスでもよい))が含まれてもよく、取引が行われた地域を示す情報が含まれてもよい。ユーザが取引に利用した端末を識別する情報や、取引が行われた地域を示す情報が含まれる場合、これらの情報は、特許請求の範囲の「取引が行われた環境を識別する個別識別情報」に相当する。 Note that the date and time of occurrence value and the usage amount value correspond to the "occurrence value" in the scope of claims. The generated value may be a value that is generated according to the use of the credit card, and is not limited to the values exemplified in this embodiment. In addition, the credit card number and user ID correspond to "individual identification information" in the scope of claims. It corresponds to individual identification information that identifies the executor of The items exemplified in the present embodiment are only a part extracted for the sake of simplification of explanation, and of course, items other than the exemplified items may exist. For example, with regard to individual identification information, when transactions are conducted using a user's terminal (assuming online payment using a browser on the user's terminal), some information for identifying the terminal (IP address of the access source , a terminal ID unique to the terminal (which may be a MAC address)), and information indicating the region where the transaction was made may be included. If information identifying the terminal used by the user for transactions or information indicating the area in which the transaction took place is included, such information shall be deemed to be "individual identification information for identifying the environment in which the transaction took place" in the scope of claims. Equivalent to
情報処理サーバ2の情報処理部11は、通信部10を介してリクエストデータを受信する。情報処理部11は、リクエストデータの受信に応じて、第1判定処理、特徴量導出処理、第2判定処理、第3判定処理およびデータ更新処理を順番に実行する(ただし、後に明らかとなる通り、第1判定処理、第2判定処理および第3判定処理の何れかにおいて情報処理部11により不正使用と判定された場合には、後続する処理は実行されない)。以下、各処理を順番に説明する。 The information processing section 11 of the information processing server 2 receives the request data via the communication section 10 . In response to receiving the request data, the information processing unit 11 sequentially executes the first determination process, the feature value derivation process, the second determination process, the third determination process, and the data update process (however, as will become clear later, , the subsequent processing is not executed if the information processing unit 11 determines that the unauthorized use is made in any one of the first determination processing, the second determination processing, and the third determination processing. Each process will be described in order below.
以下の説明では、情報処理サーバ2が受信し、処理対象とするリクエストデータを特に「今回リクエストデータ」という。説明の便宜のため、今回リクエストデータには、有効なユーザID値が含まれているものとする(つまり、ユーザID値がヌル値ではないものとする)。また、今回リクエストデータのクレカ番号値を「今回クレカ番号値」といい、ユーザID値を「今回ユーザID値」といい、発生日時値を「今回発生日時値」といい、利用額値を「今回利用額値」という。また、今回リクエストデータを受信した時点が属する日(day)を「本日」といい、本日の1日前を「前日」という。 In the following description, the request data received by the information processing server 2 to be processed is particularly referred to as "current request data". For convenience of explanation, it is assumed that the current request data includes a valid user ID value (that is, the user ID value is not null). In addition, the credit card number value of the current request data is called "current credit card number value", the user ID value is called "current user ID value", the occurrence date and time value is called "current occurrence date and time value", and the usage amount value is called " The amount used this time". Also, the day to which the request data is received this time is called "today", and the day before today is called "the day before".
<第1判定処理>
第1判定処理は、特徴量(後述)を導出することなく、今回リクエストデータに含まれる情報を利用することによって不正使用か否かの判定を行う処理である。第1判定処理は、不正使用の判定にあたって、特徴量を導出するまでもなく、また、不正判定用モデル(後述)を使用するまでもなく、今回リクエストデータに含まれる情報から明らかに不正使用とみなせるものについて、不正使用と判定することを目的として行われる。
<First determination process>
The first determination process is a process of determining whether or not the use is unauthorized by using information included in the current request data without deriving a feature amount (described later). In the first judgment process, when judging unauthorized use, it is clear from the information contained in the request data that unauthorized use is made without deriving a feature amount or using a model for unauthorized judgment (described later). This is done for the purpose of judging that what can be regarded as unauthorized use.
第1判定処理において情報処理部11は、例えば以下の処理を実行する。すなわち、不正使用と判定すべきクレカ番号値や、ユーザID値、その他の項目値が記録されたリスト(いわゆるブラックリスト)が事前に用意される。そして情報処理部11は、今回リクエストデータに、当該リストに記録された項目値が1つでも含まれている場合には、不正使用と判定する。また例えば、情報処理部11は、今回リクエストデータにクレジットカードの使用が行われた地域を示す情報が含まれている場合において、当該情報に基づいてクレジットカードが使用された地域を特定し、クレジットカードが禁止された地域で使用されている場合には、クレジットカードの使用を不正使用と判定する。これによれば、ユーザが属する国以外の国(ユーザにとっての外国)においてクレジットカードが使用されることを禁止している場合において、外国でクレジットカードが使用された場合に、不正使用と判定できる。なお第1判定処理において、情報処理部11に使用された情報のうち、発生値以外の情報は、特許請求の範囲の「付随情報」に相当する。 In the first determination process, the information processing section 11 performs, for example, the following processes. That is, a list (a so-called black list) is prepared in advance in which credit card number values, user ID values, and other item values to be determined as unauthorized use are recorded. Then, the information processing unit 11 determines that the current request data contains at least one item value recorded in the list as unauthorized use. Further, for example, if the current request data contains information indicating the area where the credit card was used, the information processing unit 11 identifies the area where the credit card was used based on the information, If the card is used in a prohibited area, the use of the credit card is determined as unauthorized use. According to this, when the use of a credit card in a country other than the country to which the user belongs (a foreign country for the user) is prohibited, it is possible to determine that the credit card is used in a foreign country as being illegally used. . Of the information used by the information processing section 11 in the first determination process, information other than the generated value corresponds to "accompanying information" in the scope of claims.
第1判定処理において不正使用と判定した場合、情報処理部11は、不正使用と判定したことを示すレスポンスデータをクライアント装置3に送信する。この場合、情報処理部11は、特徴量導出処理を実行することなく、処理を終了する。レスポンスデータを受信したクライアント装置3は、対応する処理を実行する。例えば、クライアント装置3が実店舗のレジに設けられた専用の決済端末である場合に、クライアント装置3は、所定のディスプレイに不正使用の可能性がある旨の情報を表示して、そのことをレジ担当者に伝える。また例えば、クライアント装置3がECサイトのサーバである場合に、クライアント装置3は、他の機器と連携して、ユーザへの通知を適切に行った上でクレジットカードによる決済をキャンセルする。 If the first determination process determines unauthorized use, the information processing section 11 transmits response data indicating that the unauthorized use has been determined to the client device 3 . In this case, the information processing section 11 terminates the process without executing the feature quantity derivation process. The client device 3 that has received the response data executes corresponding processing. For example, if the client device 3 is a dedicated payment terminal installed at a cash register in a physical store, the client device 3 displays information to the effect that there is a possibility of unauthorized use on a predetermined display to notify the user of the possibility. Tell the cashier. Further, for example, when the client device 3 is a server of an EC site, the client device 3 cancels payment by credit card after appropriately notifying the user in cooperation with other devices.
一方、第1処理において不正使用ではないと判定した場合、情報処理部11は、特徴量導出処理を実行する。 On the other hand, when it is determined in the first process that the use is not unauthorized, the information processing section 11 executes the feature value derivation process.
<特徴量導出処理>
特徴量導出処理は、不正判定用モデルに入力する特徴量を導出する処理である。ただし後に明らかとなる通り、特徴量導出処理で導出された特徴量は、不正判定用モデルへの入力に先立って、第2判定処理で使用される。不正判定用モデルとは、機械学習されるモデルであって、複数の特徴量を入力し、不正判定用スコアを出力するモデルである。不正判定用スコアとは、不正使用の可能性の高さが高いほど値が大きくなるスコア(数値)である。不正判定用スコアは、不正使用か否かの判定に用いられるものであり、後述するように、情報処理部11は、閾値と不正判定用スコアとを比較して、不正使用か否かの判定を行う。
<Feature value derivation processing>
The feature value derivation process is a process of deriving a feature value to be input to the fraud determination model. However, as will become clear later, the feature amount derived in the feature amount deriving process is used in the second determination process prior to being input to the fraud determination model. The fraud determination model is a machine-learned model that inputs a plurality of feature values and outputs a fraud determination score. The fraud determination score is a score (numerical value) that increases as the likelihood of fraudulent use increases. The fraud determination score is used to determine whether or not it is fraudulent use. As will be described later, the information processing unit 11 compares the threshold value with the fraud determination score to determine whether or not it is fraudulent use. I do.
図3は、本実施形態で導出される特徴量の種類(抜粋した一部)を示す表である。図3の表において、対象期間とは、現時点から遡った一定期間(所定の期間)を意味する。本実施形態では、対象期間の種類として、「5分」、「30分」、「1時間」、「6時間」、「1日」、「1週間」、「1ヶ月」、「半年」、「1年」および「2年」が用意されている。例えば、対象期間「5分」とは、現時点から遡って「5分」の期間(別の言い方をすれば「直近5分間」)を意味する。図3の表において、個別識別情報の種類として、上述したクレジットカード番号<項目>およびユーザID<項目>が定義されている。 FIG. 3 is a table showing types (partially extracted) of feature amounts derived in this embodiment. In the table of FIG. 3, the target period means a certain period (predetermined period) going back from the present time. In this embodiment, the types of target periods are "5 minutes", "30 minutes", "1 hour", "6 hours", "1 day", "1 week", "1 month", "6 months", "1 year" and "2 years" are prepared. For example, a target period of "5 minutes" means a period of "5 minutes" going back from the current time (in other words, "last 5 minutes"). In the table of FIG. 3, the above-described credit card number <item> and user ID <item> are defined as the types of individual identification information.
図3の表で示すように、本実施形態では、対象期間の種類と個別識別情報の種類との組み合わせ毎に利用額平均値および利用額標準偏差値という2種類の特徴量が定義されている。ある対象期間の種類(例えば「5分」)と、クレジットカード番号との組み合わせに対応する利用額平均値とは、その対象期間において、今回クレカ番号値のクレジットカードが使用された取引のそれぞれの利用額値の平均を意味する。従って対象期間に3回、今回クレカ番号値のクレジットカードを使用した取引が行われていれば、3回の取引のそれぞれの利用額値の平均が、その種類の対象期間とクレジットカード番号との組み合わせに対応する利用額平均値である。 As shown in the table of FIG. 3, in the present embodiment, two types of feature amounts are defined for each combination of the type of target period and the type of individual identification information: average usage amount and standard deviation usage amount. . The average usage amount corresponding to a combination of a certain target period type (for example, "5 minutes") and a credit card number is the number of transactions in which the credit card with the credit card number value was used this time during the target period. Means the average spend value. Therefore, if a transaction using a credit card with a credit card number value this time has been made three times during the target period, the average of the usage amount value for each of the three transactions will be the same for that type of target period and credit card number This is the average usage amount corresponding to the combination.
また、ある対象期間の種類とユーザIDとの組み合わせに対応する利用額平均値とは、その対象期間において、今回ユーザID値のユーザが行った取引のそれぞれの利用額値の平均を意味する。従って対象期間に3回、今回ユーザID値のユーザにより取引が行われていれば、3回の取引のそれぞれの利用額値の平均が、その種類の対象期間とユーザIDとの組み合わせに対応する利用額平均値である。 Also, the average usage amount value corresponding to a combination of a certain target period type and user ID means the average usage amount value of each transaction performed by the user of the current user ID value in the target period. Therefore, if the user with the current user ID value makes a transaction three times during the target period, the average of the usage amount value for each of the three transactions corresponds to the combination of that type of target period and user ID. This is the average usage amount.
なお、ある一人のユーザについて、共通する対象期間のクレジットカード番号に係る利用額平均値と、ユーザIDに係る利用額平均値とは必ずしも同じ値にならない。例えば、あるユーザが複数種類のクレジットカードを所持しており、対象期間内に1つのユーザID値を用いて、異なる複数種類のクレジットカードを使用して買い物をした場合に、そのユーザについてのクレジットカード番号に係る利用額平均値と、そのユーザについてのユーザIDに係る利用額平均値とは異なる値になる。現状、一人の人間が異なる複数種類のクレジットカードを所持し、各種類のクレジットカードを使い分けることはごく一般に行われている。 For one user, the average usage amount related to the credit card number and the average usage amount related to the user ID in the common target period are not necessarily the same value. For example, if a certain user has multiple types of credit cards and uses one user ID value to make purchases using multiple different types of credit cards within the target period, credit The average usage amount related to the card number and the average usage amount related to the user ID of the user are different values. At present, it is very common for one person to have a plurality of different types of credit cards and to use each type of credit card properly.
また、ある対象期間の種類とクレジットカード番号との組み合わせに対応する利用額標準偏差値とは、その対象期間において、今回クレカ番号値のクレジットカードが使用された取引のそれぞれの利用額値の標準偏差を意味する。また、ある種類の対象期間とユーザIDとの組み合わせに対応する利用額標準偏差値とは、その対象期間において、今回ユーザID値のユーザが行った取引のそれぞれの利用額値の標準偏差を意味する。 In addition, the usage amount standard deviation value corresponding to the combination of the type of the target period and the credit card number is the standard of each usage amount value of the transaction in which the credit card with the credit card number value was used this time during the target period means deviation. Further, the usage amount standard deviation value corresponding to a combination of a certain type of target period and user ID means the standard deviation of each usage amount value of transactions made by the user of the user ID value this time in the target period. do.
以下の説明では、図3で示すように、対象期間の種類のうち「5分」、「30分」、「1時間」および「6時間」を特に「短期間種類」といい、短期間種類に係る対象期間を「短期間種類対象期間」という。更に個別識別情報の種類にかかわらず短期間種類に対応する特徴量を「個別特徴量」という。また、対象期間の種類のうち「1日」、「1週間」、「1ヶ月」、「半年」、「1年」および「2年」を特に「長期間種類」といい、長期間種類に係る対象期間を「長期間種類対象期間」という。更に個別識別情報の種類にかかわらず長期間種類に対応する特徴量を「対応特徴量」という。なお、本実施形態では、短期間種類対象期間と長期間種類対象期間との境目を「6時間」と「1日」との間としているが、これはあくまで一例であり、他の位置を境目としてもよいことは勿論である。また、例示した対象期間の種類はあくまで一例であり、例えば、「12時間」や、「2週間」、「1年半」といった期間を対象期間に含めてもよい。なお後に明らかとなる通り、本実施形態では、独自の処理が行われることにより、レスポンス時間の長時間化を抑制しつつ、「2年」やそれ以上の長い期間を対象期間に含めることが可能である。 In the following description, as shown in FIG. 3, "5 minutes", "30 minutes", "1 hour" and "6 hours" among the types of target periods are particularly referred to as "short-term types". The period covered by this is referred to as the "short-term type covered period." Further, regardless of the type of individual identification information, the feature amount corresponding to the short-term type is called "individual feature amount". In addition, among the types of target period, "one day", "one week", "one month", "half a year", "one year" and "two years" are particularly referred to as "long-term types". Such a target period is referred to as a "long-term type target period". Furthermore, regardless of the type of individual identification information, a feature amount corresponding to a long-term type is called a "corresponding feature amount". In the present embodiment, the boundary between the short-term type target period and the long-term type target period is between "6 hours" and "1 day", but this is only an example, and another position is set as the boundary. It goes without saying that Also, the types of the exemplified target period are merely examples, and for example, periods such as "12 hours", "two weeks", and "one and a half years" may be included in the target period. As will become clear later, in this embodiment, by performing unique processing, it is possible to include a long period of "2 years" or more in the target period while suppressing the lengthening of the response time. is.
本実施形態では、特徴量の種類として、少なくとも図3で例示した特徴量の種類が存在する中、記憶部12には以下の態様で基本データ14およびスタッツデータ15が記憶される。図4は、基本データ14およびスタッツデータ15が記憶部12に記憶された様子を説明に適した態様で模式的に示す図である。図4で示すように本実施形態では、個別識別情報の種類のそれぞれについて、個別識別情報の値毎の基本データ14が存在する。 In this embodiment, while at least the types of feature amounts illustrated in FIG. 3 are present as types of feature amounts, the storage unit 12 stores basic data 14 and stats data 15 in the following manner. FIG. 4 is a diagram schematically showing how the basic data 14 and the stats data 15 are stored in the storage section 12 in a manner suitable for explanation. As shown in FIG. 4, in this embodiment, there is basic data 14 for each value of individual identification information for each type of individual identification information.
具体的には、図4で示すように、記憶部12には、クレジットカード番号について、クレカ番号値毎に基本データ14が記憶されている。以下、クレジットカード番号に対応する基本データ14のそれぞれを「クレカ番号基本データ14C」という。あるクレカ番号値に対応するクレカ番号基本データ14Cは、現時点から遡って少なくとも6時間の期間において発生した、そのクレカ番号値を含むリクエストデータが累積的に記録されたデータである。つまり、あるクレカ番号値に対応するクレカ番号基本データ14Cには、現時点から遡って少なくとも6時間の期間において、そのクレカ番号値のクレジットカードの使用に応じてクライアント装置3から送信されたリクエストデータが累積的に記録されている。ただし、後に明らかとなる通り、厳密には、全てのリクエストデータがクレカ番号基本データ14Cに記録される対象となるのではなく、不正使用と判定されなかった取引に係るリクエストデータが対象となる。 Specifically, as shown in FIG. 4, the storage unit 12 stores basic data 14 for each credit card number value for credit card numbers. Each of the basic data 14 corresponding to the credit card number is hereinafter referred to as "credit card number basic data 14C". The credit card number basic data 14C corresponding to a certain credit card number value is data in which request data including the credit card number value generated in a period of at least 6 hours going back from the present time is cumulatively recorded. That is, in the credit card number basic data 14C corresponding to a certain credit card number value, the request data transmitted from the client device 3 in accordance with the use of the credit card with that credit card number value during a period of at least 6 hours going back from the present time. Recorded cumulatively. However, as will become clear later, strictly speaking, not all request data is recorded in the credit card number basic data 14C, but only request data related to transactions that have not been determined to be fraudulent use.
あるクレカ番号値を含む今回リクエストデータが2020年1月15日の「13:00」に発生したとする。この場合において、1月15日の「07:00」(現時点から6時間前)の時点から、今回リクエストデータを情報処理サーバ2が「13:00」に受信するまでに、同じ値のクレカ番号値を含むリクエストデータを3回、情報処理サーバ2が受信している場合には、そのクレカ番号値に係るクレカ番号基本データ14Cには過去3回分のリクエストデータが少なくとも記録されている。 Assume that this time request data including a certain credit card number value occurred at "13:00" on January 15, 2020. In this case, from "07:00" on January 15 (6 hours before the current time) until the information processing server 2 receives the request data this time at "13:00", the credit card number with the same value When the information processing server 2 has received the request data including the value three times, at least the past three requests are recorded in the credit card number basic data 14C related to the credit card number value.
図4で示すように、記憶部12には、クレカ番号基本データ14Cとは別に、ユーザIDについて、ユーザID値毎に基本データ14が記憶されている。以下、ユーザIDに対応する基本データ14のそれぞれを「ユーザID基本データ14U」という。あるユーザID値に対応するユーザID基本データ14Uは、現時点から遡って少なくとも6時間の期間において発生した、そのユーザID値を含むリクエストデータが累積的に記録されたデータである。ただし、後に明らかとなる通り、厳密には、全てのリクエストデータがユーザID基本データ14Uに記録される対象となるのではなく、不正使用と判定されなかった取引に係るリクエストデータが対象となる。 As shown in FIG. 4, in addition to credit card number basic data 14C, the storage unit 12 stores basic data 14 for user IDs for each user ID value. Each of the basic data 14 corresponding to the user ID is hereinafter referred to as "user ID basic data 14U". The user ID basic data 14U corresponding to a certain user ID value is data in which request data including that user ID value generated in a period of at least 6 hours going back from the present time is cumulatively recorded. However, as will become apparent later, strictly speaking, not all request data is recorded in the user ID basic data 14U, but only request data related to transactions that have not been determined to be unauthorized use.
ここで、ある1つのリクエストデータは、何れかのクレカ番号基本データ14Cに記録されると共に、何れかのユーザID基本データ14Uに記録される。例えば、クレジットカードの使用に応じて、クレカ番号値:X、および、ユーザID値:Yを含むリクエストデータが情報処理サーバ2に入力されたとする。この場合、このリクエストデータは、クレカ番号値:Xに係るクレカ番号基本データ14Cに記録されると共に、ユーザID値:Yに係るユーザID基本データ14Uにも記録される。この結果、共通するリクエストデータが、クレカ番号値:Xに係るクレカ番号基本データ14C、および、ユーザID値:Yに係るユーザID基本データ14Uに重複して記録された状態となる。なお、本実施形態では、基本データ14にリクエストデータがそのまま記録されていることとしているが、これは説明の便宜のためであり、当然データベースとしての基本データ14にレコードとしてリクエストデータを登録するための加工はなされてもよい。 Here, one request data is recorded in some credit card number basic data 14C and recorded in some user ID basic data 14U. For example, it is assumed that request data including credit card number value: X and user ID value: Y is input to the information processing server 2 according to the use of a credit card. In this case, this request data is recorded in the credit card number basic data 14C associated with the credit card number value X, and is also recorded in the user ID basic data 14U associated with the user ID value Y. As a result, the common request data is redundantly recorded in the credit card number basic data 14C related to the credit card number value X and the user ID basic data 14U related to the user ID value Y. In the present embodiment, the request data is recorded as it is in the basic data 14, but this is for the sake of convenience of explanation. processing may be performed.
図4で示すように本実施形態では、個別識別情報の種類のそれぞれについて、個別識別情報の値毎にスタッツデータ15が存在する。以下、クレジットカード番号に対応するスタッツデータ15を「クレカ番号スタッツデータ15C」といい、ユーザIDに対応するスタッツデータを「ユーザIDスタッツデータ15U」という。 As shown in FIG. 4, in this embodiment, there is stats data 15 for each value of individual identification information for each type of individual identification information. Hereinafter, the stats data 15 corresponding to the credit card number will be referred to as "credit card number stats data 15C", and the stats data corresponding to the user ID will be referred to as "user ID stats data 15U".
図5は、クレカ番号スタッツデータ15Cの内容を模式的に示す図である。図5で示すように、クレカ番号スタッツデータ15Cは、1つ以上のスタッツレコード16により構成される。スタッツレコード16は、「00:00」を起点として24時間という意味の「1日」を単位期間として存在し、対応日付値、単位期間平均値、単位期間標準偏差値および取引回数を有している。 FIG. 5 is a diagram schematically showing the contents of the credit card number stats data 15C. As shown in FIG. 5, credit card number stats data 15C is composed of one or more stats records 16 . The stats record 16 has a unit period of "1 day" meaning 24 hours starting from "00:00", and has a corresponding date value, unit period average value, unit period standard deviation value and number of transactions. there is
対応日付値は、スタッツレコードが対応する日を年月日により表す情報である。 The corresponding date value is information representing the date to which the stats record corresponds by year, month, and day.
ある対応日付値に対応する、あるクレカ番号値に係るスタッツレコード16の単位期間平均値とは、その対応日付値が示す1日において、そのクレカ番号値のクレジットカードが使用されて行われた取引のそれぞれの利用額値を平均した値を意味する。例えば、対応日付値が「2020年1月15日」である、クレカ番号値:Xに係るスタッツレコード16の単位期間平均値は、2020年1月15日において、クレカ番号値:Xのクレジットカードが使用されて行われた取引のそれぞれ(3回取引が行われていれば、3回の取引のそれぞれ)の利用額値を平均した値である。また、ある対応日付値に対応する、あるクレカ番号値に係るスタッツレコード16の単位期間標準偏差値とは、その対応日付値が示す1日において、そのクレカ番号値のクレジットカードが使用されて行われた取引のそれぞれの利用額値の標準偏差を意味する。 The unit period average value of the stats record 16 related to a certain credit card number value corresponding to a certain corresponding date value is the transaction performed using the credit card of that credit card number value on the day indicated by the corresponding date value mean the average value of each usage amount value. For example, the unit period average value of the stats record 16 related to the credit card number value: X whose corresponding date value is “January 15, 2020” is the credit card number value of X on January 15, 2020. is the average value of the amount used for each of the transactions (each of the three transactions, if three transactions have been made) performed using . In addition, the unit period standard deviation value of the stats record 16 related to a certain credit card number value corresponding to a certain corresponding date value is the number of credit cards with that credit card number value used on one day indicated by that corresponding date value. means the standard deviation of the respective utilization values of the trades made.
また、ある対応日付値に対応する、あるクレカ番号値に係るスタッツレコード16の取引回数とは、その対応日付値が示す1日において、そのクレカ番号値のクレジットカードが使用されて行われた取引の回数を意味する。上述した単位期間平均値および単位期間標準偏差は、取引回数分の取引の利用額値に基づいて導出された統計値ということになる。単位期間平均値および単位期間標準偏差値はそれぞれ、特許請求の範囲の「単位統計量」に相当する。 Also, the number of transactions in the stats record 16 related to a certain credit card number value corresponding to a certain corresponding date value is the number of transactions made using the credit card of that credit card number value on the day indicated by the corresponding date value. means the number of times The unit period average value and the unit period standard deviation described above are statistical values derived based on the usage amount values of transactions for the number of transactions. Each of the unit period average value and the unit period standard deviation value corresponds to the "unit statistic" in the claims.
クレカ番号スタッツデータ15Cには、最大で、本日から730日遡った期間(本日も含む)に属する単位期間(本実施形態では1日)についてのスタッツレコード16が登録される。また、あるクレカ番号値に係るクレカ番号スタッツデータ15Cには、そのクレカ番号値に係るクレジットカードが使用された日のそれぞれに対応するスタッツレコード16が登録される。従って、あるクレカ番号値に係るクレカ番号スタッツデータ15Cについて、本日が2020年8月1日であり、過去730日において、そのクレカ番号値に係るクレジットカードが2020年5月1日、6月1日、7月1日の3つの日(day)において使用されていたとしたら、そのクレカ番号スタッツデータ15Cには、2020年5月1日に対応するスタッツレコード16、6月1日に対応するスタッツレコード16および7月1日に対応するスタッツレコード16の3つのスタッツレコード16が登録される。また、過去730日において、毎日、クレカ番号値に係るクレジットカードが使用されていたとしたら、そのクレカ番号スタッツデータ15Cには、730日分のスタッツレコード16が登録される。 The credit card number stats data 15C registers stats records 16 for a unit period (1 day in this embodiment) belonging to a period 730 days before today (including today) at maximum. Also, in the credit card number stats data 15C related to a certain credit card number value, stats records 16 corresponding to each day on which the credit card related to that credit card number value was used are registered. Therefore, for the credit card number stats data 15C related to a certain credit card number value, today is August 1, 2020, and in the past 730 days, the credit card related to the credit card number value is May 1, 2020, June 1, 2020 If the credit card number stats data 15C was used on three days (days), July 1, 2020, the stat record 16 corresponding to May 1, 2020, and the stats corresponding to June 1, 2020 Three stat records 16 are registered, record 16 and stat record 16 corresponding to July 1st. Also, if the credit card associated with the credit card number value has been used every day in the past 730 days, stats records 16 for 730 days are registered in the credit card number stats data 15C.
また、ある1日において、あるクレカ番号値に係るクレジットカードが複数回(例えば50回)、使用されたとしても、その1日に対応するスタッツレコード16は1件である。これは、1件のスタッツレコードは、対応する1日おける1回以上のクレジットカードの使用が集約されたデータだからである。このため、1つのクレカ番号スタッツデータ15Cに登録されるスタッツレコード16の件数の最大値は730件である。なお、730日というのは、対象期間の種類のうち最長の期間である「2年間」に対応させたものである。 Also, even if a credit card associated with a certain credit card number value is used multiple times (for example, 50 times) in a certain day, there is only one stats record 16 corresponding to that day. This is because one stat record is aggregated data for one or more credit card uses during the corresponding day. Therefore, the maximum number of stats records 16 registered in one credit card number stats data 15C is 730. It should be noted that 730 days corresponds to "two years" which is the longest period among the types of target periods.
ユーザIDスタッツデータ15Uは、クレカ番号スタッツデータ15Cと同様、1つ以上のスタッツレコード16により構成され、各スタッツレコード16は、対応日付値、単位期間合計値、単位期間平均値および取引回数を備えている。ある対応日付値に対応する、あるユーザID値に係るスタッツレコード16の単位期間平均値とは、その対応日付値が示す1日においてそのユーザID値のユーザが行った取引のそれぞれの利用額値を平均した値であり、単位期間標準偏差値とは各利用額値の標準偏差であり、取引回数とは取引の回数である。 The user ID stats data 15U, like the credit card number stats data 15C, is composed of one or more stats records 16, and each stats record 16 includes a corresponding date value, a unit period total value, a unit period average value, and the number of transactions. ing. The unit period average value of the stats record 16 related to a certain user ID value corresponding to a certain corresponding date value is the usage amount value of each transaction made by the user of that user ID value on the day indicated by that corresponding date value. , the unit period standard deviation value is the standard deviation of each usage amount value, and the number of transactions is the number of transactions.
以上の態様で記憶部12に基本データ14およびスタッツデータ15が記憶される中、情報処理部11は、特徴量導出処理において以下の方法で特徴量を導出する。特徴量の導出に関し、情報処理部11は、短期間種類に対応する個別特徴量と、長期間種類に対応する対応特徴量とを異なる方法で導出する。以下、個別特徴量を導出するときの処理と対応特徴量を導出するときの処理とを順番に説明する。 While the basic data 14 and the stats data 15 are stored in the storage unit 12 in the manner described above, the information processing unit 11 derives feature amounts by the following method in the feature amount derivation process. Regarding the derivation of the feature amount, the information processing section 11 derives the individual feature amount corresponding to the short-term type and the corresponding feature amount corresponding to the long-term type by different methods. Hereinafter, the process for deriving the individual feature amount and the process for deriving the corresponding feature amount will be described in order.
(個別特徴量(短期間種類に対応する特徴量)を導出するときの処理)
個別特徴量の導出に際し、情報処理部11は、記憶部12を参照し、今回リクエストデータに含まれる個別識別情報毎に、個別識別情報の値に対応する基本データ14を特定する。例えば、リクエストデータに含まれるクレカ番号値が「X」、ユーザID値が「Y」であったとすると、情報処理部11は、クレカ番号値:Xに係るクレカ番号基本データ14Cを特定すると共に、ユーザID値:Yに係るユーザID基本データ14Uを特定する。
(Processing when deriving individual feature amount (feature amount corresponding to short-term type))
When deriving the individual feature amount, the information processing section 11 refers to the storage section 12 and specifies the basic data 14 corresponding to the value of the individual identification information for each individual identification information included in the current request data. For example, if the credit card number value included in the request data is "X" and the user ID value is "Y", the information processing unit 11 specifies the credit card number basic data 14C related to the credit card number value: X, User ID value: Specify the user ID basic data 14U related to Y.
次いで情報処理部11は、特定したクレカ番号基本データ14Cと、特定したユーザID基本データ14Uとのそれぞれについて、短期間種類(「5分」、「30分」、「1時間」および「6時間」)毎に対応する期間データを生成する。つまり情報処理部11は、クレカ番号基本データ14Cに基づいて短期間種類毎の期間データを生成すると共に、ユーザID基本データ14Uに基づいて短期間種類毎の期間データを生成する。 Next, the information processing section 11 selects the specified credit card number basic data 14C and the specified user ID basic data 14U for each of the short-term types (“5 minutes”, “30 minutes”, “1 hour” and “6 hours”). ”) to generate corresponding period data. That is, the information processing section 11 generates period data for each short-term type based on the credit card number basic data 14C, and generates period data for each short-term type based on the user ID basic data 14U.
例えば、特定したクレカ番号基本データ14Cに基づいて対象期間:5分に対応する期間データを生成する場合、情報処理部11は、以下の処理を実行する。すなわち、情報処理部11が特定したクレカ番号基本データ14Cには、現時点から遡って6時間の期間を少なくとも含む期間に発生した、今回クレカ番号値を含むリクエストデータが累積的に記録されている。これを踏まえ情報処理部11は、クレカ番号基本データ14Cに記録されたリクエストデータの発生日時値(発生日時の項目値)を参照し、クレカ番号基本データ14Cに記録されたリクエストデータの中から、対象期間:5分に発生したリクエストデータを特定する。なお、対象期間:5分にクレジットカードが使用されていなければ、特定されるリクエストデータは「0個」となる。そして情報処理部11は、特定したリクエストデータの集合からなるデータを期間データとして生成する。生成された期間データには、対象期間:5分に発生した、今回クレカ番号値を含むリクエストデータが累積的に記録されている。 For example, when generating period data corresponding to the target period: 5 minutes based on the identified credit card number basic data 14C, the information processing section 11 executes the following process. That is, in the credit card number basic data 14C specified by the information processing unit 11, the request data including the current credit card number generated during a period including at least a period of 6 hours going back from the present time is cumulatively recorded. Based on this, the information processing unit 11 refers to the date and time of occurrence value of the request data recorded in the basic credit card number data 14C (item value of date and time of occurrence), and out of the request data recorded in the basic credit card number data 14C, Target period: Identify request data that occurred in 5 minutes. If the credit card is not used during the target period: 5 minutes, the specified request data is "0". Then, the information processing section 11 generates data consisting of a set of specified request data as period data. In the generated period data, the request data including the current credit card number value that occurred during the target period: 5 minutes is cumulatively recorded.
以上、対象期間「5分」に係る期間データを生成するときの情報処理部11の処理について説明したが、情報処理部11は、他の短期間種類に係る期間データについても同様の方法で生成する。例えば対象期間が「6時間」の場合には、情報処理部11は、特定したクレカ番号基本データ14Cから直近6時間に発生したリクエストデータを特定し、特定したリクエストデータの集合よりなる期間データを生成する。なお、ある短期間種類に係る期間データには、その短期間種類よりも時間が短い短期間種類に係る期間データに含まれるリクエストデータの全てが含まれている。 The processing of the information processing unit 11 when generating the period data related to the target period “5 minutes” has been described above. do. For example, if the target period is "6 hours", the information processing unit 11 identifies request data generated in the most recent 6 hours from the identified credit card number basic data 14C, and generates period data consisting of a set of identified request data. Generate. Note that the period data related to a certain short-term type includes all of the request data included in the period data related to the short-term type shorter than the short-term type.
情報処理部11は、特定したクレカ番号基本データ14Cに基づいて、短期間種類のそれぞれについての期間データを生成し、更に同様の方法で特定したユーザID基本データ14Uに基づいて、短期間種類のそれぞれについての期間データを生成する。この結果、個別識別情報の種類(クレジットカード番号およびユーザID)と、短期間種類との組み合わせ毎に期間データが生成される。その後、情報処理部11は、期間データに基づいて個別特徴量のそれぞれを導出する。 The information processing unit 11 generates period data for each of the short-term types based on the specified credit card number basic data 14C, and further generates short-term type data based on the user ID basic data 14U specified by the same method. Generate period data for each. As a result, period data is generated for each combination of the type of individual identification information (credit card number and user ID) and the short-term type. After that, the information processing section 11 derives each of the individual feature amounts based on the period data.
ある短期間種類対象期間と、ある個別識別情報の種類との組み合わせに対応する個別特徴量(利用額平均値および利用額標準偏差値)を導出する際、情報処理部11は、当該組み合わせに対応する期間データに基づいて個別特徴量を導出する。例えば、対象期間:5分と個別識別情報:クレジットカード番号との組み合わせに対応する個別特徴量を導出する場合、情報処理部11は、当該組み合わせに対応する期間データに基づいて個別特徴量を導出する。以下、一例として、対象期間:5分と個別識別情報:クレジットカード番号との組み合わせに対応する個別特徴量を導出するときの情報処理部11の処理について説明する。以下の対象期間:5分と個別識別情報:クレジットカード番号との組み合わせに対応する個別特徴量を導出するときの情報処理部11の処理の説明では、当該組み合わせに対応する期間データを「対象期間データ」といい、当該組み合わせに対応する個別特徴量のうち、利用額平均値を「対象利用額平均値」と、利用額標準偏差値を「対象利用額標準偏差値」という。 When deriving an individual feature amount (usage amount average value and usage amount standard deviation value) corresponding to a combination of a certain short-term type target period and a certain type of individual identification information, the information processing unit 11 The individual feature amount is derived based on the period data. For example, when deriving the individual feature amount corresponding to the combination of the target period: 5 minutes and the individual identification information: credit card number, the information processing unit 11 derives the individual feature amount based on the period data corresponding to the combination. do. As an example, the processing of the information processing unit 11 when deriving the individual feature amount corresponding to the combination of the target period: 5 minutes and the individual identification information: credit card number will be described below. In the description of the processing of the information processing unit 11 when deriving the individual feature amount corresponding to the following combination of the target period: 5 minutes and the individual identification information: credit card number, the period data corresponding to the combination is referred to as the "target period data", and among the individual feature values corresponding to the combination, the average usage amount is referred to as the "target usage amount average value" and the usage amount standard deviation value is referred to as the "target usage amount standard deviation value".
対象利用額平均値の導出に際し、情報処理部11は、対象期間データに記録された各リクエストデータを参照する。対象期間データには、今回クレカ番号値を含むリクエストデータであって、現時点から遡って5分以内に発生したリクエストデータが累積的に記録されている。換言すれば、対象期間データには、現時点から遡って5分という期間を外れたリクエストデータについては記録されていない。次いで情報処理部11は、参照した各レコードの利用額値の平均値を導出し、これを対象利用額平均値とする。また対象利用額標準偏差値の導出に際し、情報処理部11は、対象期間データの各レコードを参照し、参照した各レコードの利用額値の標準偏差を算出し、これを対象利用額標準偏差値とする。 When deriving the target usage amount average value, the information processing unit 11 refers to each request data recorded in the target period data. In the target period data, the request data including the credit card number value this time and occurring within five minutes from the present time are cumulatively recorded. In other words, the target period data does not record any request data outside the five-minute period preceding the current time. Next, the information processing section 11 derives the average value of the usage amount values of the respective records referred to, and sets this as the target usage amount average value. Further, when deriving the target usage amount standard deviation value, the information processing unit 11 refers to each record of the target period data, calculates the standard deviation of the usage amount value of each referenced record, and uses it as the target usage amount standard deviation value. and
以上、対象期間:5分と個別識別情報:クレジットカード番号との組み合わせに対応する個別特徴量を導出するときの情報処理部11の処理を説明したが、情報処理部11は、他の組み合わせについての個別特徴量についても、組み合わせに対応する期間データに基づいて同様の方法で導出する。 In the above, the processing of the information processing unit 11 when deriving the individual feature amount corresponding to the combination of the target period: 5 minutes and the individual identification information: credit card number has been described. is also derived in a similar manner based on the period data corresponding to the combination.
(対応特徴量(長期間種類に対応する特徴量)を導出するときの処理)
次に長期間種類(「1日」、「1週間」、「1ヶ月」、「半年」、「1年」および「2年」)に係る特徴量(対応特徴量)を導出する処理について説明する。まず情報処理部11は、記憶部12を参照し、今回リクエストデータに含まれる個別識別情報毎に、個別識別情報の値に対応するスタッツデータ15を特定する。例えば、リクエストデータに含まれるクレカ番号値が「X」、ユーザID値が「Y」であったとすると、情報処理部11は、クレカ番号値:Xに係るクレカ番号スタッツデータ15Cを特定すると共に、ユーザID値:Yに係るユーザIDスタッツデータ15Uを特定する。
(Process for deriving corresponding feature amount (feature amount corresponding to long-term type))
Next, the process of deriving feature values (corresponding feature values) for long-term types (“one day,” “one week,” “one month,” “half a year,” “one year,” and “two years”) will be described. do. First, the information processing section 11 refers to the storage section 12 and specifies the stats data 15 corresponding to the value of the individual identification information for each individual identification information included in the current request data. For example, if the credit card number value included in the request data is "X" and the user ID value is "Y", the information processing unit 11 specifies the credit card number stats data 15C related to the credit card number value: X, User ID value: Specify the user ID stats data 15U related to Y.
そして情報処理部11は、一の種類の個別識別情報に対応する対応特徴量を導出する際、その種類の個別識別情報に対応するスタッツデータ15に基づいて、対応特徴量を導出する。より具体的には情報処理部11は、クレジットカード番号に対応する対応特徴量については、長期間種類にかかわらず特定したクレカ番号スタッツデータ15Cに基づいて対応特徴量を導出し、ユーザIDに対応する対応特徴量については、長期間種類にかかわらず特定したユーザIDスタッツデータ15Uに基づいて対応特徴量を導出する。 Then, when deriving the corresponding feature amount corresponding to one type of individual identification information, the information processing section 11 derives the corresponding feature amount based on the stats data 15 corresponding to the type of individual identification information. More specifically, the information processing unit 11 derives the corresponding feature amount corresponding to the credit card number based on the specified credit card number stats data 15C regardless of the long-term type, and derives the corresponding feature amount corresponding to the user ID. The corresponding feature amount is derived based on the specified user ID stats data 15U regardless of the long-term type.
以下、特定したクレカ番号スタッツデータ15Cに基づいて、長期間種類:1年と個別識別情報:クレジットカード番号との組み合わせに対応する対応特徴量を導出するときの情報処理部11の処理について説明する。以下の説明では、長期間種類:1年と個別識別情報:クレジットカード番号との組み合わせに対応する対応特徴量のうち、利用額平均値を「注目利用額平均値」と、利用額標準偏差値を「注目利用額標準偏差値」という。 The processing of the information processing unit 11 when deriving the corresponding feature amount corresponding to the combination of the long-term type: one year and the individual identification information: credit card number based on the specified credit card number stats data 15C will be described below. . In the following explanation, among the corresponding feature values corresponding to the combination of long-term type: 1 year and individual identification information: credit card number, the average usage amount is the "average average usage amount", and the standard deviation of the usage amount is is referred to as the “notable usage amount standard deviation value”.
上述したように、クレカ番号スタッツデータ15Cには、本日を起点として過去に遡って最大730日分のスタッツレコード16が記録されており、1件のスタッツレコード16には、対応する日に発生したリクエストデータのそれぞれに基づく単位期間平均値および単位期間標準偏差値が含まれている。情報処理部11は、クレカ番号スタッツデータ15Cの各スタッツレコード16の対応日付値を参照し、スタッツレコード16のうち、対象期間(本例では「1年」)に属するスタッツレコード16のそれぞれを特定する。なお長期間種類毎に、本日を起点として遡るべき日数が事前に定められており、本実施形態では、長期間種類:1日は「1日」、長期間種類:1週間は「7日」、長期間種類:1ヶ月は「30日」、長期間種類:半年は「183日」、長期間種類:1年は「365日」、長期間種類:2年は「730日」とされている。本例では、情報処理部11は、スタッツレコード16のうち、対応日付値が本日を起点として365日以内のものを特定する。 As described above, the credit card number stats data 15C records stats records 16 for a maximum of 730 days going back from today, and one stats record 16 contains It contains the unit period mean value and the unit period standard deviation value based on each of the request data. The information processing section 11 refers to the corresponding date value of each stats record 16 in the credit card number stats data 15C, and identifies each of the stats records 16 belonging to the target period ("1 year" in this example). do. For each long-term type, the number of days to go back from today is set in advance. , Long-term type: 1 month is 30 days, Long-term type: Half a year is 183 days, Long-term type: 1 year is 365 days, Long-term type: 2 years is 730 days there is In this example, the information processing section 11 identifies stats records 16 whose corresponding date values are within 365 days from today.
対象期間に属するスタッツレコード16を特定した後、情報処理部11は、注目利用額平均値については、特定したスタッツレコード16のそれぞれに基づいて以下の方法で導出する。すなわち、ある1日のスタッツレコード16に含まれる単位期間平均値は、1回以上の取引回数(サンプル数)の利用額値(サンプル値)の群(グループ)の平均値である。そして、複数のグループについて、各グループの平均値およびサンプル数に基づいて、全てのグループの全てのサンプルの平均値を導出する計算方法が知られている。これを踏まえ、1つ以上のスタッツレコード16の単位期間平均値と取引回数との組を入力とし、全ての利用額値の平均値(=特徴量としての利用額平均値)を出力とするプログラムが事前に用意されている。情報処理部11は、特定したスタッツレコード16のそれぞれの単位期間平均値と取引回数との組をこのプログラムに入力し、当該プログラムが出力する値を注目利用額平均値とする。 After specifying the stats records 16 belonging to the target period, the information processing section 11 derives the noted average usage amount based on each of the specified stats records 16 by the following method. That is, the unit period average value included in the stats record 16 for a certain day is the average value of a group (group) of usage amount values (sample values) of one or more transactions (number of samples). A calculation method is known for deriving the average value of all samples of all groups based on the average value and the number of samples of each group for a plurality of groups. Based on this, a program that takes as input a set of the unit period average value and the number of transactions of one or more stats records 16, and outputs the average value of all usage amounts (= average usage amount as a feature value). are prepared in advance. The information processing section 11 inputs a set of the unit period average value and the number of transactions of each of the specified stats records 16 to this program, and sets the value output by the program as the noted usage amount average value.
ここで複数のグループについて、各グループの平均値およびサンプル数に基づいて、全てのグループの全てのサンプルの平均値を導出する計算の基本的な考え方について説明する。当該平均値は、1つのグループについて、平均値にサンプル数を乗じた値を「グループ合計値」と表現すると、全てのグループについてのグループ合計値を合算し、これを全てのグループのサンプル数を合算した値により除算することによって求められる。すなわち、N個のグループGi(i=1、2・・・N)について、グループGiにおける平均値をAiとし、サンプル数をKiとすると、当該平均値は以下の式で導出可能である。 Here, for a plurality of groups, the basic concept of calculation for deriving the mean value of all samples in all groups based on the mean value and the number of samples in each group will be described. The average value is expressed as "group total value" by multiplying the average value by the number of samples for one group. It is obtained by dividing by the summed value. That is, for N groups Gi (i=1, 2, . . . N), if Ai is the average value in the group Gi and Ki is the number of samples, the average value can be derived by the following formula.
また情報処理部11は、注目標準偏差については、特定したスタッツレコード16のそれぞれに基づいて以下の方法で導出する。すなわち、ある1日のスタッツレコード16に含まれる単位期間標準偏差値は、1回以上の取引回数(サンプル数)の利用額値(サンプル値)の群(グループ)の標準偏差である。そして、複数のグループについて、各グループの標準偏差およびサンプル数に基づいて、全てのグループの全てのサンプルの標準偏差を導出する計算方法が知られている。これを踏まえ、1つ以上のスタッツレコード16の標準偏差と取引回数との組を入力とし、全ての利用額値の標準偏差(=特徴量としての利用額標準偏差値)を出力とするプログラムが事前に用意されている。情報処理部11は、特定したスタッツレコード16のそれぞれの単位期間標準偏差値と取引回数との組をこのプログラムに入力することによって注目利用額標準偏差値を導出する。 The information processing section 11 also derives the standard deviation of interest by the following method based on each of the specified stats records 16 . That is, the unit period standard deviation value included in the stats record 16 for a certain day is the standard deviation of a group of usage amount values (sample values) of one or more transactions (number of samples). A calculation method is known for deriving the standard deviation of all samples of all groups based on the standard deviation of each group and the number of samples for a plurality of groups. Based on this, there is a program that takes as input a pair of the standard deviation of one or more stats records 16 and the number of transactions, and outputs the standard deviation of all usage amounts (= usage amount standard deviation value as a feature value). prepared in advance. The information processing section 11 derives a noteworthy usage amount standard deviation value by inputting a set of each unit period standard deviation value and the number of transactions of the identified stats records 16 to this program.
ここで複数のグループについて、各グループの標準偏差およびサンプル数に基づいて、全てのグループの全てのサンプルの標準偏差を導出する計算の基本的な考え方について説明する。以下の説明では、N個のグループGi(i=1、2・・・N)について、グループGiにおける平均値をAiとし、サンプル数をKiとする。また、あるサンプルの具体的な値を「サンプル値」という。 Here, for a plurality of groups, the basic idea of calculation for deriving the standard deviation of all samples of all groups based on the standard deviation of each group and the number of samples will be described. In the following description, for N groups Gi (i=1, 2, . . . N), let Ai be the average value in the group Gi, and Ki be the number of samples. A specific value of a sample is called a "sample value".
ある一のグループGxの標準偏差をSxとし、分散をDxとすると、Dx=Sx2である。またグループGxの平均をAxとする。このとき、「Dx=<(グループGxに属する各サンプルのサンプル値の二乗)の平均>-Ax2」、つまり、「<(グループGxに属する各サンプルのサンプル値の二乗)の平均>=Dx+Ax2」が成り立つ。全てのグループについて、標準偏差と、標準偏差から導出可能な分散と、平均は既知の値であるため、全てのグループについて、<(グループに属する各サンプルのサンプル値の二乗)の平均>が導出できる。以下、<(グループGiに属する各サンプルのサンプル値の二乗)の平均>をPiとする。 If the standard deviation of one group Gx is Sx and the variance is Dx, then Dx= Sx2 . Let Ax be the average of the group Gx. At this time, “Dx=<average of (the square of the sample value of each sample belonging to group Gx)>−Ax 2 ”, that is, “<average of (the square of the sample value of each sample belonging to group Gx)>=Dx+Ax 2 ” is established. For all groups, the standard deviation, the variance that can be derived from the standard deviation, and the mean are known values, so for all groups, <mean of (the square of the sample value of each sample belonging to the group)> is derived. can. Hereinafter, <average of (the square of the sample value of each sample belonging to group Gi)> is assumed to be Pi.
また、全てのグループについての<(グループに属する各サンプルのサンプル値の二乗)の平均>より、<(全てのグループの全てのサンプルのサンプル値の二乗)の平均>(以下、<総二乗平均>と表現する)が以下の式により導出可能である。 In addition, <average of (the square of the sample value of each sample belonging to the group)> for all groups is replaced by <the average of (the square of the sample value of all samples in all groups)> (hereafter, <total square mean >) can be derived from the following equation.
全てのグループに属する全てのサンプルの分散は、<総二乗平均>から、<(全てのグループの全てのサンプルの平均値)の二乗>を引くことにより求めることができる。(全てのグループの全てのサンプルの平均値)の求め方は、注目利用額平均値の説明において言及した通りである。そして、全てのグループに属する全てのサンプルの標準偏差は、導出した当該分散の平方根をとることにより導出できる。 The variance of all samples belonging to all groups can be obtained by subtracting <square of (mean value of all samples in all groups)> from <total mean square>. (Average value of all samples of all groups) is obtained as described in the description of the average usage amount of interest. The standard deviation of all samples belonging to all groups can then be derived by taking the square root of the derived variance.
以上、長期間種類:1年と個別識別情報:クレジットカード番号との組み合わせに対応する対応特徴量を導出するときの情報処理部11の処理について説明したが、情報処理部11は、他の組み合わせについても同様に、対応するスタッツデータ15から長期間種類に応じたスタッツレコード16(例えば、長期間種類が「1週間」なら、過去7日分のスタッツレコード16。長期間種類が「2年」なら、スタッツデータ15に含まれる全てのスタッツレコード16)を特定し、特定したスタッツレコード16に基づいて対応特徴量を導出する。 The processing of the information processing unit 11 when deriving the corresponding feature amount corresponding to the combination of the long-term type: one year and the individual identification information: credit card number has been described above. Similarly, the stats record 16 corresponding to the long-term type from the corresponding stats data 15 (for example, if the long-term type is "1 week", the stats record 16 for the past 7 days; the long-term type is "2 years"). Then, all the stats records 16 included in the stats data 15 are specified, and the corresponding feature amount is derived based on the specified stats records 16 .
以上、図3で例示した特徴量(個別特徴量および対応特徴量)のみについて、その内容、および、導出するときの方法について説明した。以上の方法で個別特徴量および対応特徴量が導出される意義および効果については後述する。なお本実施形態で例示した特徴量は、情報処理部11の処理の説明に都合がよいものを例示的に抜粋しているに過ぎず、当然、他の種類の特徴量が存在してもよい。例えば、利用額値や、発生日時値そのものも通常、特徴量とされる。また、対象期間毎の取引回数が特徴量に含まれていてもよい。また、利用額その他の発生値について、平均および標準偏差以外の統計学的手法(例えば、合計や加重平均、分散等)を用いて求められた値が特徴量に含まれていてもよい。 In the above, only the feature amount (individual feature amount and corresponding feature amount) exemplified in FIG. 3 has been described and the method for deriving the feature amount. The significance and effect of deriving the individual feature amount and the corresponding feature amount by the above method will be described later. Note that the feature amounts exemplified in the present embodiment are merely exemplified excerpts that are convenient for explaining the processing of the information processing unit 11, and naturally other types of feature amounts may exist. . For example, the usage amount value and the occurrence date and time value itself are also usually used as feature amounts. Moreover, the number of transactions for each target period may be included in the feature quantity. In addition, the feature amount may include a value obtained using a statistical method other than the average and standard deviation (for example, total, weighted average, variance, etc.) for the usage amount and other generated values.
また、統計学的手法により求められた値と、今回リクエストデータに含まれる発生値とを用いて導出される値が特徴量に含まれていてもよい。統計学的手法により求められた値と、今回リクエストデータに含まれる発生値とを用いて導出される値は例えば、対象期間毎に今回利用額値と各対象期間の利用額平均値との差をとることによって求められる値であり、また例えば、対象期間毎に今回利用額値と各対象期間の利用額平均値および標準偏差とに基づいて導出されるZ値である。また例えば、今回ユーザID値のユーザが現時点から遡って一定期間の間に利用したクレジットカードの種類数(=異なるクレジットカード番号値のクレジットカードの個数)を特徴量の1つとしてもよい。またリクエストデータに上述した端末IDが含まれている場合に、同一の端末IDの値について一定期間の間に利用されたクレジットカードの種類数を特徴量の1つとしてもよい。 Also, the feature quantity may include a value derived using a value obtained by a statistical method and an occurrence value included in the current request data. The value derived using the value obtained by the statistical method and the generated value included in the current request data is, for example, the difference between the current usage amount for each target period and the average usage amount for each target period. Also, for example, it is the Z value derived based on the current usage amount value for each target period and the average usage amount value and standard deviation for each target period. Further, for example, the number of types of credit cards (=the number of credit cards with different credit card number values) used by the user with the current user ID value during a certain period of time going back from the present time may be used as one of the feature amounts. Further, when the terminal ID described above is included in the request data, the number of types of credit cards used for the same terminal ID value during a certain period may be used as one of the feature amounts.
情報処理部11は、特徴量導出処理を実行した後、第2判定処理を実行する。 The information processing section 11 executes the second determination process after executing the feature amount derivation process.
<第2判定処理>
第2判定処理とは、特徴量導出処理で導出した特徴量について、不正判定用モデルに入力することなく、特徴量をそのまま用いて不正使用か否かを判定する処理である。第2判定処理の目的は、不正判定用モデルを用いることなく、特徴量の内容から明らかに不正使用と分かるものを選別することにある。
<Second determination process>
The second determination process is a process of determining whether or not the feature amount derived in the feature amount derivation process is fraudulently used by using the feature amount as it is without inputting it to the fraud determination model. The purpose of the second determination process is to select features that are clearly identified as fraudulent use from the contents of the feature values without using the fraud determination model.
第2判定処理において情報処理部11は、例えば以下の処理を実行する。すなわち、例えば情報処理部11は、今回利用額値と、対象期間:2年とクレジットカード番号に対応する利用額平均値との差を算出し、この差が閾値より大きい場合に、不正使用と判定する。この例示した処理によれば、普段の買い物と比較して極めて高額な買い物が行われようとしている場合に、不正使用と判定できる。また例えば、特徴量の種類に、今回ユーザID値のユーザが現時点から遡って一定期間(例えば、30分或いは1時間)の間に利用したクレジットカードの種類数(=異なるクレジットカード番号値のクレジットカードの個数)が含まれている場合に、情報処理部11は、この種類数が閾値より大きいときに、不正使用と判定する。この例示した処理によれば、同じユーザIDのユーザにより短期間の間に異常に多い種類のクレジットカードが使用されている場合に、不正使用と判定できる。また例えば、対象期間毎の取引回数が特徴量に含まれている場合に、情報処理部11は、現時点から遡って一定期間(例えば、5分或いは30分)の間に閾値以上の回数、クレジットカードが使用されているときに、不正使用と判定する。この例示した処理によれば、短期間の間に異常に多い回数、クレジットカードが使用されている場合に、不正使用と判定できる。 In the second determination process, the information processing section 11 performs, for example, the following processes. That is, for example, the information processing unit 11 calculates the difference between the current usage amount value and the average usage amount value corresponding to the target period: 2 years and the credit card number, and if this difference is greater than the threshold, it is deemed to be unauthorized use. judge. According to this exemplified process, it can be determined that the card is used fraudulently when the purchase is going to be extremely expensive compared to the usual purchases. In addition, for example, the type of feature amount may include the number of types of credit cards used by the user with the current user ID value during a certain period of time (for example, 30 minutes or 1 hour) going back from the current time (=credit cards with different credit card number values). number of cards) is included, the information processing section 11 determines that it is an unauthorized use when this number of types is greater than the threshold. According to this exemplified process, when an abnormally large number of types of credit cards are used by a user with the same user ID in a short period of time, it can be determined that the card has been used fraudulently. Further, for example, when the number of transactions for each target period is included in the feature amount, the information processing unit 11 calculates the number of transactions equal to or greater than the threshold for a certain period of time (for example, 5 minutes or 30 minutes) retroactively from the present time. To determine fraudulent use when a card is used. According to this exemplified process, when a credit card is used an abnormally large number of times in a short period of time, it can be determined as unauthorized use.
第2判定処理において不正使用と判定した場合、情報処理部11は、不正使用と判定したことを示すレスポンスデータをクライアント装置3に送信する。この場合、情報処理部11は、第3判定処理を実行することなく、処理を終了する。一方、第2判定処理において不正使用ではないと判定した場合、情報処理部11は、続く第3判定処理を実行する。 If the second determination process determines unauthorized use, the information processing section 11 transmits response data indicating that unauthorized use has been determined to the client device 3 . In this case, the information processing section 11 terminates the process without executing the third determination process. On the other hand, if it is determined in the second determination process that the use is not unauthorized, the information processing section 11 executes the subsequent third determination process.
<第3判定処理>
次に第3判定処理について説明する。第3判定処理は、特許請求の範囲の「モデル利用処理」に相当する。第3判定処理において、情報処理部11は、特徴量導出処理で導出した特徴量のそれぞれを不正判定用モデル(特許請求の範囲の「モデル」に相当)に入力し、不正判定用モデルが出力する不正判定用スコア(特許請求の範囲の「クレジットカードの不正使用の判定に用いる情報」に相当)を得る。なお、不正判定用モデルへの特徴量の入力に際し、特徴量の正規化は適切に実行される。
<Third determination process>
Next, the third determination processing will be explained. The third determination process corresponds to "model use process" in the scope of claims. In the third determination process, the information processing unit 11 inputs each of the feature amounts derived in the feature amount derivation process to the fraud determination model (corresponding to the "model" in the claims), and outputs the fraud determination model. A score for fraud determination (corresponding to "information used to determine fraudulent use of a credit card" in the scope of claims) is obtained. It should be noted that when inputting the feature amount to the fraud determination model, the feature amount is properly normalized.
不正判定用スコアは、予め定められた範囲(例えば「0」~「1000」)内で値をとる数値(スコア)であり、値が大きいほど、不正使用の可能性が高い。不正使用判定モデルは、機械学習により学習される。不正判定用モデルの機械学習はどのような方法で行われてもよく、ニューラルネットワーク(ディープラーニングを含む)、その他の既存の技術の何れをも利用可能である。不正使用判定モデルは単一のモデル(全ての特徴量を入力し、1つの不正判定用モデルを出力する1つのモデル)である必要はなく、複数のモデルの組み合わせであってもよい。 The fraud determination score is a numerical value (score) that takes a value within a predetermined range (for example, "0" to "1000"), and the higher the value, the higher the possibility of fraudulent use. The unauthorized use determination model is learned by machine learning. Any method can be used for machine learning of the fraud determination model, and any of neural networks (including deep learning) and other existing techniques can be used. The fraudulent use judgment model does not have to be a single model (one model that inputs all feature values and outputs one fraud judgment model), and may be a combination of a plurality of models.
不正判定用スコアを取得した後、情報処理部11は、不正判定用スコアが予め定められた閾値以上か否かを判定する。不正判定用スコアが閾値以上の場合、情報処理部11は、今回のクレジットカードの使用が不正使用であると判定し、不正使用と判定したことを示すレスポンスデータをクライアント装置3に送信する。この場合、情報処理部11は、データ更新処理を実行することなく処理を終了する。 After acquiring the fraud determination score, the information processing section 11 determines whether or not the fraud determination score is equal to or greater than a predetermined threshold. If the score for fraud determination is equal to or greater than the threshold, the information processing section 11 determines that the current credit card use is fraudulent, and transmits response data indicating the fraudulent use to the client device 3 . In this case, the information processing section 11 ends the process without executing the data update process.
一方、不正判定用スコアが閾値を下回る場合、情報処理部11は、今回のクレジットカードの使用は不正使用ではないと判定し、不正使用ではないと判定したことを示すレスポンスデータをクライアント装置3に送信する。不正使用ではないと判定したことを示すレスポンスデータを受信したクライアント装置3は、対応する処理を実行する。例えば、クライアント装置3が実店舗のレジに設けられた専用の決済端末である場合に、クライアント装置3は、所定のディスプレイに不正使用の可能性がある旨の情報を表示して、そのことをレジ担当者に伝えると共に、他の装置と連携して決済を続行する。情報処理部11は、第3判定処理において、不正使用ではないと判定した場合、続くデータ更新処理を実行する。 On the other hand, if the score for fraud determination is below the threshold, the information processing unit 11 determines that the current credit card use is not fraudulent use, and sends response data indicating that it is determined that the credit card is not fraudulent use to the client device 3. Send. The client device 3 that has received the response data indicating that it has been determined that the use is not unauthorized executes the corresponding process. For example, if the client device 3 is a dedicated payment terminal installed at a cash register in a physical store, the client device 3 displays information to the effect that there is a possibility of unauthorized use on a predetermined display to notify the user of the possibility. Inform the cashier and continue the payment in cooperation with other devices. When the information processing section 11 determines in the third determination process that the use is not unauthorized, the information processing section 11 executes the subsequent data update process.
<データ更新処理>
次にデータ更新処理について説明する。データ更新処理において、情報処理部11は、今回クレカ番号値に対応するクレカ番号基本データ14Cに今回リクエストデータを追加すると共に、今回ユーザID値に対応するユーザID基本データ14Uに今回リクエストデータを追加する。更に情報処理部11は、今回クレカ番号値に対応するクレカ番号スタッツデータ15Cについて、本日分のスタッツレコード16が既に存在する場合には、今回リクエストデータに基づいてスタッツレコード16の内容を更新し、存在しない場合には、今回リクエストデータに基づいて新たなスタッツレコード16を生成し、クレカ番号スタッツデータ15Cに追加する。同様に情報処理部11は、今回ユーザID値に対応するユーザIDスタッツデータ15Uについて、本日分のスタッツレコード16が既に存在する場合には、今回リクエストデータに基づいてスタッツレコード16の内容を更新し、存在しない場合には、今回リクエストデータに基づいて新たなスタッツレコード16を生成し、ユーザIDスタッツデータ15Uに追加する。
<Data update process>
Next, data update processing will be described. In the data update process, the information processing unit 11 adds the current request data to the credit card number basic data 14C corresponding to the current credit card number value, and adds the current request data to the user ID basic data 14U corresponding to the current user ID value. do. Further, the information processing unit 11 updates the contents of the stats record 16 based on the current request data, if the current day's stats record 16 already exists for the credit card number stat data 15C corresponding to the current credit card number value, If it does not exist, a new stats record 16 is generated based on the current request data and added to the credit card number stats data 15C. Similarly, for the user ID stats data 15U corresponding to the current user ID value, if the current day's stats record 16 already exists, the information processing unit 11 updates the contents of the stats record 16 based on the current request data. If it does not exist, a new stats record 16 is generated based on the current request data and added to the user ID stats data 15U.
スタッツレコード16を更新する場合、情報処理部11は、単位期間平均値に関し、現時点の単位期間平均値と現時点の取引回数と今回利用額値とに基づいて、今回取引を反映した単位期間平均値を新たに導出し、現時点の単位期間平均値を更新する。この結果、単位期間平均値は、今回取引も含む本日中に発生した取引のそれぞれの利用額値の平均値となる。情報処理部11は単位期間標準偏差値についても同様の方法で更新する。また情報処理部11は、取引回数をインクリメントする。また、スタッツレコード16を新たに生成し、追加する場合、情報処理部11は、新たなスタッツレコード16の単位期間平均値を今回利用額値とし、単位期間標準偏差値をゼロとし、取引回数を「1」とし、対応日付値を本日の日付を示す値とする。 When updating the stats record 16, the information processing section 11 updates the unit period average value reflecting the current transaction based on the current unit period average value, the current number of transactions, and the current usage amount value. is newly derived, and the current unit period average value is updated. As a result, the unit period average value is the average value of the usage amounts of the transactions that occurred during the current day, including the current transaction. The information processing section 11 also updates the unit period standard deviation value by the same method. The information processing section 11 also increments the number of transactions. Also, when creating and adding a new stats record 16, the information processing unit 11 sets the unit period average value of the new stats record 16 to the current usage amount value, sets the unit period standard deviation value to zero, and sets the number of transactions to "1", and the corresponding date value is a value indicating today's date.
<その他の処理>
次に、情報処理部11のその他の処理について説明する。情報処理部11は、一日の開始時にバッチ処理として、以下の処理を実行する。すなわち、情報処理部11は、スタッツデータ15のそれぞれにアクセスし、その時点から遡って721日前のスタッツレコード16が存在する場合には、そのレコードを削除する。この他、詳細な説明を省略したが、情報処理部11は、基本データ14にアクセスしたときに、現時点から遡って6時間よりも前のリクエストデータ(=発生日時値が6時間以上前であるリクエストデータ)が存在する場合には、そのリクエストデータを削除する。
<Other processing>
Next, other processes of the information processing section 11 will be described. The information processing section 11 executes the following processes as batch processes at the start of the day. That is, the information processing section 11 accesses each of the stats data 15, and if there is a stats record 16 from 721 days before that point, deletes that record. In addition, although detailed description is omitted, when the information processing unit 11 accesses the basic data 14, request data more than 6 hours before the current time (=the date and time of occurrence is more than 6 hours ago) request data) exists, delete the request data.
以上、情報処理サーバ2の動作について説明した。本実施形態では、短期間種類に係る特徴量(個別特徴量)および長期間種類に係る特徴量(対応特徴量)が上述した方法で導出されるため、以下の効果を奏する。 The operation of the information processing server 2 has been described above. In this embodiment, since the feature amount (individual feature amount) related to the short-term type and the feature amount (corresponding feature amount) related to the long-term type are derived by the above-described method, the following effects are obtained.
ここで従来、特徴量の導出は、基本的には以下の方法で行われていた。すなわち、まず、特徴量の導出に用いられる可能性のある全てのリクエストデータが1つのデータベースにて一元的に管理される。従って、過去2年間のクレジットカードの使用についての利用額値(発生値)の平均値が特徴量に含まれている場合には、過去2年間に発生したリクエストデータの全てが記録されたデータベースが用意される。このため、データベースに登録されたリクエストデータは通常、膨大なものとなる。そして、特徴量を導出する場合、従来のシステムは、特徴量毎に都度、データベースにアクセスして、当該一の特徴量を導出するために必要な情報を保持するリクエストデータを特定し、特定したリクエストデータに基づいて特徴量を導出していた。 Here, conventionally, the derivation of the feature amount was basically performed by the following method. That is, first, all request data that may be used for deriving feature values are centrally managed in one database. Therefore, if the average value of the amount of credit card usage (occurrence value) for the past two years is included in the feature amount, a database that records all the request data that occurred in the past two years is available. be prepared. Therefore, request data registered in the database is usually enormous. Then, when deriving the feature amount, the conventional system accesses the database each time for each feature amount, and specifies request data holding information necessary for deriving the one feature amount. Feature values were derived based on request data.
以上の従来の方法は、以下の点で問題がある。すなわち、本実施形態に係る不正判定用モデルのように、不正使用の判定に関する情報を出力するモデルについては、短い期間に発生した発生値(本実施形態では、利用額が発生値の1つ)を用いて導出される特徴量だけでなく、長い期間に発生した発生値を用いて導出される特徴量もモデルの入力とする方が、モデルの出力の精度の向上を期待できる。これは、モデルの出力を、短期間だけではなく長期間も含めた様々な期間における取引の態様を反映した値とすることが可能となるからである。 The conventional methods described above have the following problems. That is, as in the fraud determination model according to the present embodiment, for a model that outputs information related to the determination of fraudulent use, generated values generated in a short period of time (in this embodiment, the amount used is one of the generated values) It is expected that the accuracy of the output of the model will be improved if the model input includes not only the feature amount derived using the , but also the feature amount derived using the occurrence values that occurred over a long period of time. This is because the output of the model can be a value that reflects the mode of trading in various periods including not only the short term but also the long term.
これを踏まえ、長い期間に係る特徴量を特徴量の種類に含めると、その長い期間に発生したリクエストデータの全てをデータベースに登録する必要が生じ、データベースに登録されるリクエストデータの個数が膨大になる。また期間が長い特徴量ほど、基本的には、特徴量を導出するために必要な発生値(リクエストデータ)の個数が多くなると共に、特徴量を導出する際に使用する発生値が多くなる。このため、特徴量を導出するにあたって、膨大なリクエストデータが登録されたデータベースから、必要なレコードとして多数のレコードを特定すると共に、特定した全てのリクエストデータに基づいて、多数の発生値を使用して特徴量を導出する必要が生じ、特徴量を導出するときの一連の処理に要する時間が長時間化してしまうという問題があった。 Based on this, if the feature amount related to a long period is included in the feature amount type, it will be necessary to register all the request data that occurred in that long period in the database, and the number of request data registered in the database will be enormous. Become. Also, the longer the period of the feature amount, the more the number of generated values (request data) required to derive the feature amount, and the more generated values used when deriving the feature amount. For this reason, when deriving feature values, a large number of records are specified as necessary records from a database in which a huge amount of request data is registered, and a large number of generated values are used based on all the specified request data. Therefore, there is a problem that the time required for a series of processes for deriving the feature amount becomes long.
一方、本実施形態によれば、長期間種類に係る特徴量である対応特徴量の導出に関し、以下の効果を奏する。すなわち、本実施形態では、事前に、個別識別情報の種類のそれぞれについて、個別識別情報の値毎のスタッツデータ15が記憶部12に記憶される。スタッツデータ15に記録されたスタッツレコード16は、単位期間(本実施形態では1日)に発生した発生値(利用額)の群を対象として統計学的手法により導出された統計量(単位期間平均値および単位期間標準偏差)を保持する。ある1日に対応するスタッツレコード16は、その1日にクレジットカードが何回使用されていたとしても、1件であり、スタッツデータ15におけるスタッツレコード16の件数は最大で730個である。 On the other hand, according to the present embodiment, the following effects are obtained regarding the derivation of the corresponding feature amount, which is the feature amount related to the long-term type. That is, in the present embodiment, the storage unit 12 stores in advance the stats data 15 for each value of the individual identification information for each type of individual identification information. The stats record 16 recorded in the stats data 15 is a statistic (unit period average value and unit period standard deviation). The number of stats records 16 corresponding to a certain day is one regardless of how many times the credit card was used on that day, and the maximum number of stats records 16 in the stats data 15 is 730.
そして情報処理部11は、対応特徴量については、スタッツレコード16の統計量(単位期間平均値および単位期間標準偏差)を用いて、対応特徴量を導出する。つまり、情報処理部11は、ある対象期間についての対応特徴量を導出する場合、その対象期間に属する利用額値(発生値)の全てを用いて対応特徴量を導出するのではなく、その対象期間に属する単位期間毎の統計量を用いて対応特徴量を導出する。このため、本実施形態によれば対応特徴量を導出する際に、個々の発生値を把握し、全ての発生値を要素として使用して対応特徴量を導出する必要がなく、発生値の群毎の統計量を把握し、これを要素として使用すれば足り、対応特徴量の導出に際して把握すべき要素の個数が減少すると共に、実際の計算に利用する要素の個数が減少し、特徴量の導出に要する時間の長時間化を抑制できる。より具体的には、情報処理部11は、対応特徴量の導出に際し、最大でも730個のスタッツレコード16が登録されたデータベースから対象期間の種類に応じた必要なスタッツレコード16を特定し、各スタッツレコードの単位統計量(単位期間平均値或いは単位期間標準偏差値)を、対応特徴量を導出するときの要素とすればよく、膨大なレコードが登録されたデータベースから、多数のリクエストデータを特定し、特定した多数のレコードの発生値(利用額値)を、対応特徴量を導出するときの要素とする、といった処理を行う必要がない。 Then, the information processing section 11 uses the statistics (unit period average value and unit period standard deviation) of the stats record 16 to derive the corresponding feature amount. That is, when deriving the corresponding feature amount for a certain target period, the information processing unit 11 does not derive the corresponding feature amount using all the usage amount values (incidence values) belonging to the target period, but rather A corresponding feature amount is derived using a statistic for each unit period belonging to the period. Therefore, according to this embodiment, when deriving the corresponding feature amount, it is not necessary to grasp each occurrence value and derive the corresponding feature amount using all the occurrence values as elements. It is sufficient to grasp the statistics for each and use them as elements, and the number of elements to be grasped when deriving the corresponding feature amount is reduced, and the number of elements to be used for actual calculation is reduced. Lengthening of the time required for derivation can be suppressed. More specifically, when deriving the corresponding feature amount, the information processing unit 11 identifies the necessary stats records 16 according to the type of the target period from a database in which at most 730 stats records 16 are registered. The unit statistic (unit period average or unit period standard deviation) of the stats record can be used as an element when deriving the corresponding feature amount, and a large number of request data can be identified from a database containing a huge number of records. However, there is no need to perform processing such as using occurrence values (usage amount values) of a large number of identified records as factors when deriving the corresponding feature amount.
仮に、単位期間:2年間に係る利用額平均値(特徴量)について、取引毎の発生値を把握し、各発生値に基づいて利用額平均値を求めることとした場合において、過去2年間において、毎日10回、取引が行われている場合、7300個分の発生値を把握し、各発生値を利用して平均利用額を導出する必要がある。一方、本実施形態によれば、このような場合であっても、730件分のスタッツレコード16を利用すれば足り、従来の方法と比較して非常に処理効率が良く、処理に要する時間が短くなる。 For the unit period: 2 years, for the average usage amount (feature value), if we determine the occurrence value for each transaction and calculate the average usage amount based on each occurrence value, in the past 2 years , if 10 transactions are performed every day, it is necessary to grasp 7300 generated values and use each generated value to derive the average usage amount. On the other hand, according to the present embodiment, even in such a case, it is sufficient to use the stats records 16 for 730 cases, and the processing efficiency is very good compared to the conventional method, and the processing takes a long time. Shorten.
更に本実施形態では、長期間種類に係る特徴量である対応特徴量の導出に関し、以下の効果を奏する。すなわち本実施形態では、事前に個別識別情報の種類のそれぞれについて個別識別情報の値毎のスタッツデータ15が用意される。そして、一の種類の個別識別情報の特定の値に対応する対応特徴量の導出に際しては、当該一の種類の個別識別情報の当該特定の値に対応するスタッツデータ15が参照される。このとき参照されるスタッツデータ15は、当該一の種類の個別識別情報の当該特定の値に対応する対応特徴量のうち、最大の対象期間に係る対応特徴量を導出するにあたって必要なスタッツレコード16(すなわち、最大で過去730日分のスタッツレコード16)が過不足なく記録された必要最小限の大きさのデータベースである。本実施形態では、このようなデータベースへのアクセスにより対応特徴量が導出可能であるため、処理効率が良く、対応特徴量の導出に要する時間を短時間化でき、ひいてはレスポンス時間を短くできる。 Furthermore, in this embodiment, the following effects are obtained in deriving the corresponding feature amount, which is the feature amount related to the long-term type. That is, in this embodiment, the stats data 15 for each value of individual identification information is prepared in advance for each type of individual identification information. When deriving the corresponding feature amount corresponding to the specific value of the one type of individual identification information, the stats data 15 corresponding to the specific value of the one type of individual identification information is referred to. The stats data 15 referred to at this time is the stats record 16 necessary for deriving the corresponding feature amount related to the maximum target period among the corresponding feature amounts corresponding to the specific value of the one type of individual identification information. (That is, 16 stats records for the past 730 days at most) are recorded in a minimum size database. In the present embodiment, the corresponding feature amount can be derived by accessing such a database, so the processing efficiency is high, the time required for deriving the corresponding feature amount can be shortened, and the response time can be shortened.
なお、個別識別情報の種類毎に特徴量が存在するという特徴は、本実施形態に特有の特徴ではなく、「不正使用の判定に用いる情報を出力するモデル」に入力する特徴量に一般的な特徴である。すなわち、現状、一人のユーザが複数種類のクレジットカードを所持することはごく普通であり、また、ユーザが様々な環境でクレジットカードを使用することはよく行われている。とすると、不正使用を効果的に検出するためには、クレジットカード単位、ユーザ単位、および、使用環境単位でクレジットカードの利用の実態を反映しつつ不正使用を判定する必要があり、そのためには必然的に、特徴量に、個別識別情報の種類に応じた特徴量を含める必要が生じるからである。 It should be noted that the feature that there is a feature amount for each type of individual identification information is not a feature unique to this embodiment, but a general feature amount to be input to the "model that outputs information used for judging unauthorized use". It is a feature. That is, at present, it is very common for one user to have multiple types of credit cards, and users often use credit cards in various environments. Therefore, in order to effectively detect unauthorized use, it is necessary to judge unauthorized use while reflecting the actual situation of credit card use for each credit card, user, and usage environment. This is because, inevitably, it becomes necessary to include a feature amount according to the type of individual identification information in the feature amount.
更に本実施形態によれば、短期間種類に係る特徴量である個別特徴量の導出に関し、以下の効果を奏する。すなわち、本実施形態では、事前に個別識別情報の種類のそれぞれについて個別識別情報の値毎の基本データ14が用意される。そして、一の種類の個別識別情報の特定の値に対応する個別特徴量(短期間種類に係る特徴量)の導出に際して情報処理部11は、当該一の種類の個別識別情報の当該特定の値に対応する基本データ14を参照する。ここで参照される基本データ14は、当該一の種類の個別識別情報の当該特定の値に対応する個別特徴量を導出するにあたって必要なリクエストデータが過不足なく記録されたデータベースであり、本実施形態ではこのようなデータベースへのアクセスにより個別特徴量が導出可能であるため、処理効率が良く、個別特徴量の導出に要する時間を短時間化でき、ひいてはレスポンス時間を短くできる。 Further, according to the present embodiment, the following effects are obtained regarding the derivation of the individual feature amount, which is the feature amount related to the short-term type. That is, in this embodiment, the basic data 14 for each value of individual identification information is prepared in advance for each type of individual identification information. Then, when deriving the individual feature quantity (feature quantity related to the short-term type) corresponding to the specific value of the one type of individual identification information, the information processing unit 11 calculates the specific value of the one type of individual identification information. refer to the basic data 14 corresponding to . The basic data 14 referred to here is a database in which request data necessary for deriving the individual feature value corresponding to the specific value of the one type of individual identification information is recorded without excess or deficiency. Since the individual feature amount can be derived by accessing the database, the processing efficiency is high, the time required for deriving the individual feature amount can be shortened, and the response time can be shortened.
更に本実施形態では、短期間種類に係る特徴量である個別特徴量の導出に関し、以下の効果を奏する。すなわち、本実施形態では、短期間種類として「5分」、「30分」、「1時間」および「6時間」の複数種類が存在する。また本実施形態では、短期間種類毎に、異なる方法で導出される複数種類の特徴量(利用額平均値および利用額標準偏差)が存在する。そして、ある種類の個別識別情報に係る個別特徴量の導出に際しては、まず、対応する基本データ14から短期間種類毎の期間データが生成される。そして、情報処理部11は、ある短期間種類の個別特徴量を導出する際、その短期間種類に対応する期間データに基づいて個別特徴量を導出する。 Furthermore, in this embodiment, the following effects can be obtained regarding the derivation of the individual feature amount, which is the feature amount related to the short-term type. That is, in this embodiment, there are a plurality of short-term types of "5 minutes," "30 minutes," "1 hour," and "6 hours." In addition, in this embodiment, there are a plurality of types of feature amounts (usage amount average value and usage amount standard deviation) derived by different methods for each short-term type. Then, when deriving the individual feature amount related to a certain type of individual identification information, first, period data for each short-term type is generated from the corresponding basic data 14 . Then, when deriving the individual feature amount of a certain short-term type, the information processing section 11 derives the individual feature amount based on the period data corresponding to the short-term type.
ここで、ある短期間種類に係る期間データは、その短期間種類に係る特徴量を導出するために必要最小限のリクエストデータが記録されたデータベースである。そして個別特徴量の導出に際し、このような必要最小限のリクエストデータが記録されたデータベースが算出されて導出されるため、処理効率が良く、個別特徴量の導出に要する時間を短時間化でき、ひいてはレスポンス時間を短くできる。また、期間データは、短期間種類毎に生成されればよく、特徴量の種類毎に生成される必要はないため、生成すべき期間データの個数も限定的であり、期間データの生成に要する処理負荷は限定的ある。つまり、本実施形態では、短期間種類として複数種類が存在し、短期間種類毎に異なる方法で導出される複数種類の特徴量が存在するという特徴に着目し、短期間種類毎の期間データを生成するという手段を採用することによって、処理効率の向上、処理時間の短時間化が図られている。 Here, the period data related to a certain short-term type is a database in which the minimum required request data for deriving the feature amount related to the short-term type is recorded. When deriving the individual features, a database in which such minimum required request data is recorded is calculated and derived, so that the processing efficiency is good and the time required for deriving the individual features can be shortened. As a result, the response time can be shortened. In addition, the period data need only be generated for each short-term type, and need not be generated for each feature amount type. Processing load is limited. That is, in the present embodiment, there are a plurality of types of short-term types, and a plurality of types of feature amounts derived by different methods for each short-term type are focused, and period data for each short-term type is calculated. By adopting the generating method, the processing efficiency is improved and the processing time is shortened.
また本実施形態では、第1判定処理、特徴量導出処理、第2判定処理、第3判定処理およびデータ更新処理が段階的に実行される。そして、第1判定処理、第2判定処理または第3判定処理で不正使用と判定された場合には、後続の処理が実行されることなくレスポンスデータが応答される。このため、各段階で利用可能な情報に基づいて明らかに不正使用と判定できる場合には、後続する処理が実行されることなく、レスポンスデータの応答がなされることになり、レスポンス時間を低減できる。特に第2判定処理は、クレジットカードの不正使用の判定においては、特徴量自体を利用して有効な不正使用の判定を行うことができるという特徴を利用した特有の処理である。なお、この特徴は、不正使用判定のモデルに入力される特徴量には、通常、過去の使用態様を表す特徴量(平均値や標準偏差、取引回数、一定期間で使用されたクレジットカードの種類数等)が含まれるため、特徴量自体を使って今回の使用態様の異常性を検知することが可能であることに由来する。 Also, in the present embodiment, the first determination process, the feature value derivation process, the second determination process, the third determination process, and the data update process are executed in stages. Then, when the unauthorized use is determined in the first determination process, the second determination process, or the third determination process, the response data is returned without executing the subsequent processes. For this reason, if it can be clearly determined that unauthorized use has occurred based on the information available at each stage, the subsequent processing is not executed, and the response data is returned, thereby reducing the response time. . In particular, the second determination process is a unique process that utilizes the feature that effective determination of unauthorized use can be performed using the feature amount itself in the determination of unauthorized use of a credit card. In addition, this feature usually includes feature values that represent past usage patterns (average value, standard deviation, number of transactions, type of credit card used in a certain period of time, etc.). number, etc.), it is possible to detect an abnormality in the current usage pattern using the feature amount itself.
なお本実施形態では、特徴量導出処理において全ての特徴量を導出していた。これに関し、情報処理部11が以下の処理を実行する構成でもよい。すなわち特徴量導出処理において、まず情報処理部11は、特徴量導出処理において第2判定処理に利用する特徴量のみを導出し、導出した特徴量に基づいて第2判定処理を実行する。情報処理部11は、第2判定処理において不正使用と判定しなかった場合に、特徴量導出処理において導出しなかった残りの特徴量を導出し、第3判定処理を実行する。 Note that in the present embodiment, all feature amounts are derived in the feature amount derivation process. Regarding this, the information processing section 11 may be configured to execute the following processes. That is, in the feature amount derivation process, the information processing section 11 first derives only the feature amount used for the second determination process in the feature amount derivation process, and executes the second determination process based on the derived feature amount. If the second determination process does not determine unauthorized use, the information processing section 11 derives the remaining feature amounts that were not derived in the feature amount derivation process, and executes the third determination process.
次に本実施形態に係る情報処理サーバ2の動作例についてフローチャートを用いて説明する。図6は情報処理サーバ2の動作例を示すフローチャートであり、特に、リクエストデータの受信に応じて実行する処理の概要を示している。 Next, an operation example of the information processing server 2 according to this embodiment will be described using a flowchart. FIG. 6 is a flow chart showing an example of the operation of the information processing server 2, and in particular shows an overview of the process executed in response to reception of request data.
図6で示すように、情報処理サーバ2の情報処理部11は、クライアント装置3からリクエストデータを受信すると、第1判定処理を実行する(ステップSA1)。情報処理部11は、第1判定処理において不正使用と判定した場合には(ステップSA2:YES)、不正使用と判定した旨のレスポンスデータをクライアント装置3に応答し(ステップSA3)、処理を終了する。情報処理部11は、第1判定処理において不正使用と判定しなかった場合(ステップSA2:NO)、特徴量導出処理を実行する(ステップSA4)。 As shown in FIG. 6, when the information processing unit 11 of the information processing server 2 receives the request data from the client device 3, it executes a first determination process (step SA1). When the information processing section 11 determines that the unauthorized use has occurred in the first determination process (step SA2: YES), the information processing section 11 responds to the client device 3 with response data to the effect that the unauthorized use has been determined (step SA3), and ends the process. do. When the information processing section 11 does not determine that the use is unauthorized in the first determination process (step SA2: NO), the information processing section 11 executes the feature value derivation process (step SA4).
次いで情報処理部11は、第2判定処理を実行する(ステップSA5)。情報処理部11は、第2判定処理において不正判定と判定した場合には(ステップSA6:YES)、不正使用と判定した旨のレスポンスデータをクライアント装置3に応答し(ステップSA3)、処理を終了する。情報処理部11は、第2判定処理において不正使用と判定しなかった場合(ステップSA6:NO)、第3判定処理を実行する(ステップSA7)。 Next, the information processing section 11 executes a second determination process (step SA5). When the information processing section 11 determines that the second determination process is unauthorized (step SA6: YES), the information processing section 11 responds to the client device 3 with response data to the effect that it is determined as unauthorized use (step SA3), and ends the process. do. When the information processing section 11 does not determine unauthorized use in the second determination process (step SA6: NO), the information processing section 11 executes the third determination process (step SA7).
情報処理部11は、第3判定処理において不正使用と判定した場合(ステップSA8:YES)、不正使用と判定した旨のレスポンスデータをクライアント装置3に相当する(ステップSA3)。情報処理部11は、第3判定処理において不正使用と判定しなかった場合(ステップSA8:NO)、不正使用と判定しなかった旨のレスポンスデータをクライアント装置3に応答する(ステップSA9)。更に情報処理部11は、データ更新処理を実行し(ステップSA10)、処理を終了する。 When the information processing section 11 determines that the unauthorized use has occurred in the third determination process (step SA8: YES), the information processing section 11 sends the response data to the effect that the unauthorized use has been determined to the client device 3 (step SA3). When the information processing section 11 does not determine unauthorized use in the third determination process (step SA8: NO), the information processing section 11 responds to the client device 3 with response data indicating that unauthorized use has not been determined (step SA9). Further, the information processing section 11 executes data update processing (step SA10), and terminates the processing.
図7は、特徴量導出処理において個別特徴量(短期間種類に対応する特徴量)を導出するときの情報処理サーバ2の動作例を示すフローチャートである。図7で示すように、情報処理サーバ2の情報処理部11は、記憶部12を参照し、今回リクエストデータに含まれる個別識別情報毎に、個別識別情報の値に対応する基本データ14を特定する(ステップSB1)。次いで情報処理部11は、特定したクレカ番号基本データ14Cと、特定したユーザID基本データ14Uとのそれぞれについて、短期間種類(「5分」、「30分」、「1時間」および「6時間」)毎に対応する期間データを生成する(ステップSB2)。次いで、情報処理部11は、期間データに基づいて個別特徴量のそれぞれを導出する(ステップSB3)。 FIG. 7 is a flowchart showing an operation example of the information processing server 2 when deriving individual feature amounts (feature amounts corresponding to short-term types) in the feature amount deriving process. As shown in FIG. 7, the information processing unit 11 of the information processing server 2 refers to the storage unit 12 and specifies basic data 14 corresponding to the value of the individual identification information for each individual identification information included in the current request data. (step SB1). Next, the information processing section 11 selects the specified credit card number basic data 14C and the specified user ID basic data 14U for each of the short-term types (“5 minutes”, “30 minutes”, “1 hour” and “6 hours”). ”), corresponding period data is generated (step SB2). Next, the information processing section 11 derives each of the individual feature amounts based on the period data (step SB3).
図8は、特徴量導出処理において対応特徴量(長期間種類に対応する特徴量)を導出するときの情報処理サーバ2の動作例を示すフローチャートである。図8で示すように、情報処理サーバ2の情報処理部11は、記憶部12を参照し、今回リクエストデータに含まれる個別識別情報毎に、個別識別情報の値に対応するスタッツデータ15を特定する(ステップSC1)。次いで情報処理部11は、特定したスタッツデータ15に基づいて対応特徴量を導出する(ステップSC2)。 FIG. 8 is a flowchart showing an operation example of the information processing server 2 when deriving a corresponding feature amount (a feature amount corresponding to a long-term type) in the feature amount deriving process. As shown in FIG. 8, the information processing unit 11 of the information processing server 2 refers to the storage unit 12 and specifies the stats data 15 corresponding to the value of the individual identification information for each individual identification information included in the current request data. (step SC1). Next, the information processing section 11 derives corresponding feature amounts based on the specified stats data 15 (step SC2).
以上、本発明の一実施形態について説明したが、上記実施形態は、本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。 Although one embodiment of the present invention has been described above, the above-described embodiment merely shows an example of specific implementation of the present invention. It should not be done. Thus, the invention may be embodied in various forms without departing from its spirit or essential characteristics.
例えば、上述した実施形態では、情報処理サーバ2をネットワーク4に接続されたサーバ装置として説明したが、特許請求の範囲の情報処理システムに相当する装置(システム)は、ネットワーク4に接続されたサーバ装置に限られない。例えば、クライアント装置3とローカルエリアネットワークを介して接続されたローカルサーバであってもよく、クライアント装置3とケーブルを介して直接接続された装置(システム)であってもよく、クライアント装置3自体であってもよい。 For example, in the above-described embodiment, the information processing server 2 is described as a server device connected to the network 4, but a device (system) corresponding to the information processing system in the claims is a server connected to the network 4. Not limited to devices. For example, it may be a local server connected to the client device 3 via a local area network, a device (system) directly connected to the client device 3 via a cable, or the client device 3 itself. There may be.
また上記実施形態では、記憶部12を情報処理サーバ2自体が備えている構成であった。しかしながら、記憶部12は、情報処理サーバ2(特許請求の範囲の情報処理システムに相当する装置(システム))が備えている必要はなく、情報処理サーバ2に外部接続された装置が備えていてもよく、情報処理サーバ2とネットワーク4を介して通信可能な他のサーバが備えていてもよい。 Further, in the above-described embodiment, the information processing server 2 itself has the storage unit 12 . However, the storage unit 12 does not need to be provided in the information processing server 2 (device (system) corresponding to the information processing system in the scope of claims). Alternatively, another server that can communicate with the information processing server 2 via the network 4 may be provided.
また上記実施形態では、第3判定処理において情報処理部11が不正使用の判定を行う構成であるが、以下の構成でもよい。すなわち、情報処理部11が、不正判定用モデルを用いて不正判定用スコアを導出した後、不正使用か否かの判定を行うことなく、不正判定用スコアをクライアント装置3に応答し、クライアント装置3側で不正判定用スコアに基づいて不正使用か否かを判定する構成でもよい。 Further, in the above-described embodiment, the information processing section 11 is configured to determine unauthorized use in the third determination process, but the following configuration may be used. That is, after the information processing unit 11 derives the fraud judgment score using the fraud judgment model, the fraud judgment score is returned to the client device 3 without judging whether or not the use is unauthorized. 3 may determine whether or not it is unauthorized use based on the score for fraud determination.
また上記実施形態では、不正判定用モデルは、不正判定用スコアを出力したが、不正判定用モデルの出力は不正判定用スコアに限られない。一例として、不正使用か否かを示す情報を出力するようにしてもよく、上記実施形態とは異なる態様のスコア(例えば、0~1の間で値をとり、不正使用か否かの確率を表す値。また例えば、値が小さいほど、不正使用の可能性が高くなるような値)を出力するようにしてもよい。 In the above embodiment, the fraud determination model outputs the fraud determination score, but the output of the fraud determination model is not limited to the fraud determination score. As an example, information indicating whether or not it is unauthorized use may be output, and a score different from the above embodiment (for example, taking a value between 0 and 1, and calculating the probability of whether or not it is unauthorized use) Also, for example, a value such that the smaller the value, the higher the possibility of unauthorized use) may be output.
また上記実施形態では、短期間種類に係る個別特徴量の導出に際し、情報処理部11は、基本データ14から期間データを生成し、この期間データを利用して導出する構成であったが、期間データを生成することなく、基本データ14を直接利用して個別特徴量を導出する構成でもよい。 Further, in the above-described embodiment, when deriving the individual feature amount related to the short-term type, the information processing unit 11 generates period data from the basic data 14 and uses this period data to derive the period data. The basic data 14 may be directly used to derive the individual feature amount without generating data.
また上記実施形態では、第1判定処理、第2判定処理および第3判定処理の何れかにおいて情報処理部11により不正使用と判定された場合には、後続する処理は実行されない構成としたが、後続する処理を実行する構成としてもよい。この構成の場合、例えば、クライアント装置3に各判定処理の結果を出力するようにすることが可能となる。 Further, in the above embodiment, if the information processing unit 11 determines unauthorized use in any one of the first determination process, the second determination process, and the third determination process, the subsequent process is not executed. It may be configured to execute subsequent processing. In this configuration, for example, it is possible to output the result of each determination process to the client device 3 .
2 情報処理サーバ(情報処理システム)
11 情報処理部
12 記憶部
2 Information processing server (information processing system)
11 information processing unit 12 storage unit
Claims (8)
前記特徴量には、現時点から遡って所定の期間に発生した前記発生値のそれぞれを用いて統計学的手法により導出可能な対応特徴量が含まれ、
前記情報処理部は、取引に応じて前記対応特徴量を導出する際、過去に発生した前記発生値の群を対象として事前に統計学的手法により導出され、記憶部に記憶された統計量を、その群に属する個々の前記発生値に代えて用いて前記対応特徴量を導出する
ことを特徴とする情報処理システム。 An information processing unit that derives one or more types of feature values to be input to a model that outputs information used to determine whether a transaction is fraudulent when a transaction is performed, using generated values that occur according to the transaction. ,
The feature amount includes a corresponding feature amount that can be derived by a statistical method using each of the occurrence values that occurred in a predetermined period going back from the current time,
When deriving the corresponding feature value according to a transaction, the information processing unit uses a statistic derived in advance by a statistical method for the group of generated values that occurred in the past and stored in the storage unit. , and deriving the corresponding feature amount by using instead of the individual generated values belonging to the group.
前記情報処理部は、取引に応じて前記対応特徴量を導出する際、現時点から遡って前記所定の期間に属する前記単位期間のそれぞれの前記単位統計量を前記記憶部から取得し、取得した前記単位統計量のそれぞれに基づいて前記対応特徴量を導出する
ことを特徴とする請求項1に記載の情報処理システム。 The storage unit stores a unit statistic derived by a statistical method using each of the occurrence values generated within the unit period for each unit period in which the past is divided into certain units,
When deriving the corresponding feature amount according to the transaction, the information processing section acquires the unit statistics of each of the unit periods belonging to the predetermined period retroactively from the current time from the storage section, and acquires the acquired 2. The information processing system according to claim 1, wherein the corresponding feature amount is derived based on each unit statistic.
前記対応特徴量には、前記個別識別情報の種類毎に、今回の取引に応じて前記情報処理部に入力された前記個別識別情報の値と同じ値の前記個別識別情報と対応付けて過去に入力された前記発生値を用いて統計学的手法により導出可能な前記対応特徴量が含まれ、
前記記憶部には、前記個別識別情報の種類のそれぞれについて、前記個別識別情報の値毎に、各値の前記個別識別情報と対応付けて前記情報処理部に入力された前記発生値に基づく前記単位統計量が累積的に記録されたスタッツデータが記憶され、
前記情報処理部は、取引に応じてある特定の種類のある特定の値の前記個別識別情報に対応する前記対応特徴量を導出する際、その特定の種類のその特定の値に対応する前記スタッツデータを用いて前記対応特徴量を導出する
ことを特徴とする請求項2に記載の情報処理システム。 When a transaction is carried out, a plurality of types of individual identification information values that identify the medium itself, the transaction executor, or the environment in which the transaction is carried out in the case where the medium is used for the transaction, and the generated value are associated with each other. and output to the information processing unit,
For each type of the individual identification information, the corresponding feature amount is associated with the individual identification information having the same value as the value of the individual identification information input to the information processing unit according to the current transaction, and has been stored in the past. The corresponding feature amount that can be derived by a statistical method using the input occurrence value is included,
In the storage unit, for each type of the individual identification information, for each value of the individual identification information, the Stores stats data in which unit statistics are cumulatively recorded,
When deriving the corresponding feature quantity corresponding to the individual identification information of a specific value of a specific type in accordance with the transaction, the information processing unit determines the statistic corresponding to the specific value of the specific type. 3. The information processing system according to claim 2, wherein the corresponding feature quantity is derived using data.
前記特徴量には、前記個別識別情報の種類毎に、今回の取引に応じて前記情報処理部に入力された前記個別識別情報の値と同じ値の前記個別識別情報と対応付けて、前記対応特徴量に係る前記所定の期間よりも短い一定期間だけ現時点から遡った期間に入力された前記発生値を用いて統計学的手法により導出可能な個別特徴量が含まれ、
前記記憶部には、前記個別識別情報の種類のそれぞれについて、前記個別識別情報の値毎に、各値の前記個別識別情報と対応付けて前記情報処理部に入力された前記発生値が累積的に記録された基本データが記憶され、
前記情報処理部は、取引に応じてある特定の種類のある特定の値の前記個別識別情報に対応する前記個別特徴量を導出する際、その特定の種類のその特定の値に対応する前記基本データを用いて前記個別特徴量を導出する
ことを特徴とする請求項1または2に記載の情報処理システム。 When a transaction is carried out, a plurality of types of individual identification information values that identify the medium itself, the transaction executor, or the environment in which the transaction is carried out in the case where the medium is used for the transaction, and the generated value are associated with each other. and output to the information processing unit,
The characteristic amount includes, for each type of the individual identification information, associated with the individual identification information having the same value as the value of the individual identification information input to the information processing unit according to the current transaction, and An individual feature amount that can be derived by a statistical method using the generated value input during a period preceding the current time by a certain period shorter than the predetermined period related to the feature amount,
In the storage unit, for each type of the individual identification information, the generated value input to the information processing unit in association with the individual identification information of each value is accumulated for each value of the individual identification information. basic data recorded in the
When deriving the individual feature quantity corresponding to the individual identification information of a specific type and a specific value according to a transaction, the information processing unit is configured to obtain the basic value corresponding to the specific value of the specific type. 3. The information processing system according to claim 1, wherein the individual feature amount is derived using data.
現時点から遡った期間として、前記対応特徴量に係る前記所定の期間よりも短い、長さの異なる複数種類の短期間種類対象期間が定められ、
前記特徴量には、前記短期間種類対象期間の種類と前記個別識別情報の種類との組み合わせ毎に、今回の取引に応じて前記情報処理部に入力された前記個別識別情報の値と同じ値の前記個別識別情報と対応付けて、現時点から遡って該当種類の前記短期間種類対象期間に入力された前記発生値に基づいて導出される個別特徴量が存在し、また、1つの種類の前記短期間種類対象期間に対応する前記個別特徴量として、異なる方法で導出される複数種類の前記個別特徴量が存在し、
前記記憶部には、前記個別識別情報の種類のそれぞれについて、前記個別識別情報の値毎に、各値の前記個別識別情報と対応付けて前記情報処理部に入力された前記発生値が累積的に記録された基本データが記憶され、
前記情報処理部は、取引に応じて、前記短期間種類対象期間の種類毎に、ある特定の種類のある特定の値の前記個別識別情報に対応する前記個別特徴量を導出する際、その特定の種類のその特定の値に対応する前記基本データに基づいて、前記短期間種類対象期間の種類毎に、前記短期間種類対象期間内に発生した前記発生値が記録された期間データを生成し、ある種類の前記短期間種類対象期間に対応する前記個別特徴量を導出する場合、その種類の前記短期間種類対象期間に対応する前記期間データを用いて前記個別特徴量を導出する
ことを特徴とする請求項1または2に記載の情報処理システム。 When a transaction is carried out, a plurality of types of individual identification information values that identify the medium itself, the transaction executor, or the environment in which the transaction is carried out in the case where the medium is used for the transaction, and the generated value are associated with each other. and output to the information processing unit,
A plurality of types of short-term type target periods with different lengths, which are shorter than the predetermined period related to the corresponding feature amount and are shorter than the predetermined period related to the corresponding feature amount, are determined as periods going back from the current time point,
The feature value includes the same value as the value of the individual identification information input to the information processing unit according to the current transaction for each combination of the type of the short-term type target period and the type of the individual identification information. In association with the individual identification information of, there is an individual feature amount derived based on the occurrence value input in the short-term type target period of the corresponding type retroactively from the current time, and one type of the As the individual feature amount corresponding to the short-term type target period, there are a plurality of types of the individual feature amount derived by different methods,
In the storage unit, for each type of the individual identification information, the generated value input to the information processing unit in association with the individual identification information of each value is accumulated for each value of the individual identification information. basic data recorded in the
When deriving the individual feature quantity corresponding to the individual identification information of a specific type and a specific value for each type of the short-term type target period according to the transaction, the information processing unit based on the basic data corresponding to the specific value of the type of, for each type of the short-term type target period, period data in which the occurrence value that occurred within the short-term type target period is recorded is generated. , when deriving the individual feature amount corresponding to the short-term type target period of a certain type, the individual feature amount is derived using the period data corresponding to the short-term type target period of that type 3. The information processing system according to claim 1 or 2.
取引に応じて前記発生値および付随情報を取得し、
前記特徴量を導出することなく、前記発生値と前記付随情報との少なくとも一部を用いて、取引が不正か否かを判定する第1判定処理を実行し、
前記第1判定処理で不正でないと判定した場合、前記発生値を利用して前記特徴量を導出し、前記特徴量を前記モデルに入力することなく用いて、取引が不正か否かを判定する第2判定処理を実行し、
前記第2判定処理で不正でないと判定した場合、前記モデルに前記特徴量を入力し、前記モデルが出力した情報を得る第3判定処理を実行する
ことを特徴とする請求項1から5の何れか1項に記載の情報処理システム。 The information processing unit
Acquiring the accrued value and accompanying information in response to a transaction;
executing a first determination process for determining whether or not a transaction is fraudulent, using at least part of the generated value and the accompanying information without deriving the feature amount;
If the first determination process determines that the transaction is not fraudulent, the feature amount is derived using the generated value, and the feature amount is used without being input to the model to determine whether or not the transaction is fraudulent. Execute the second determination process,
6. The method according to any one of claims 1 to 5, characterized in that when it is determined that the second determination process is not fraudulent, the feature amount is input to the model, and a third determination process for obtaining information output by the model is executed. or the information processing system according to item 1.
前記情報処理システムの前記情報処理部が、導出した前記特徴量を前記モデルに入力し出力を得る第2ステップとを含み、
前記特徴量には、現時点から遡って所定の期間に発生した前記発生値のそれぞれを用いて統計学的手法により導出可能な対応特徴量が含まれ、
前記第1ステップにおいて、前記情報処理部は、過去に発生した前記発生値の群を対象として事前に統計学的手法により導出され、記憶部に記憶された統計量を、その群に属する個々の前記発生値に代えて用いて前記対応特徴量を導出する
ことを特徴とする情報処理方法。 The information processing unit of the information processing system uses generated values generated according to the transaction as one or more types of feature values that are input to a model that outputs information used to determine whether the transaction is fraudulent when the transaction is performed. a first step of deriving by
a second step in which the information processing unit of the information processing system inputs the derived feature quantity into the model and obtains an output;
The feature amount includes a corresponding feature amount that can be derived by a statistical method using each of the occurrence values that occurred in a predetermined period going back from the current time,
In the first step, the information processing unit obtains a statistic derived in advance by a statistical method for the group of occurrence values that occurred in the past and stores the statistic in the storage unit, An information processing method, wherein the corresponding feature quantity is derived by using it in place of the generated value.
前記情報処理システムの情報処理部が、前記第1判定処理で不正でないと判定した場合、取引の不正の判定に用いる情報を出力するモデルに入力する1種類以上の特徴量を前記発生値に基づいて導出し、前記特徴量を前記モデルに入力することなく用いて、取引が不正か否かを判定する第2判定処理を実行する第2のステップと、
前記情報処理システムの情報処理部が、前記第2判定処理で不正でないと判定した場合、前記モデルに前記特徴量を入力し、前記モデルが出力した情報を得る第3判定処理を実行する第3のステップとを含み、
前記特徴量には、現時点から遡って所定の期間に発生した前記発生値のそれぞれを用いて統計学的手法により導出可能な対応特徴量が含まれ、
前記第2ステップにおいて、前記情報処理部は、過去に発生した前記発生値の群を対象として事前に統計学的手法により導出され、記憶部に記憶された統計量を、その群に属する個々の前記発生値に代えて用いて前記対応特徴量を導出する
ことを特徴とする情報処理方法。 An information processing unit of an information processing system acquires an accrued value and accompanying information generated in response to a transaction, and determines whether or not the transaction is fraudulent using at least a part of the accrued value and the accompanying information. a first step of executing a 1 determination process;
When the information processing unit of the information processing system determines that the transaction is not fraudulent in the first determination process, one or more types of feature values to be input to a model that outputs information used to determine whether the transaction is fraudulent are determined based on the generated value. a second step of performing a second determination process for determining whether or not a transaction is fraudulent by using the feature amount without inputting it to the model;
When the information processing unit of the information processing system determines that the second determination process is not fraudulent, the feature amount is input to the model, and a third determination process is performed to obtain information output by the model. and
The feature amount includes a corresponding feature amount that can be derived by a statistical method using each of the occurrence values that occurred in a predetermined period going back from the current time,
In the second step, the information processing unit obtains a statistic derived in advance by a statistical method for the group of occurrence values that occurred in the past and stores the statistic in the storage unit, An information processing method, wherein the corresponding feature quantity is derived by using it in place of the generated value.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020149694A JP7316984B2 (en) | 2020-09-07 | 2020-09-07 | Information processing system and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020149694A JP7316984B2 (en) | 2020-09-07 | 2020-09-07 | Information processing system and information processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022044185A JP2022044185A (en) | 2022-03-17 |
JP7316984B2 true JP7316984B2 (en) | 2023-07-28 |
Family
ID=80679055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020149694A Active JP7316984B2 (en) | 2020-09-07 | 2020-09-07 | Information processing system and information processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7316984B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090319287A1 (en) | 2008-06-24 | 2009-12-24 | Ayman Hammad | Authentication segmentation |
CN105574728A (en) | 2014-10-14 | 2016-05-11 | 阿里巴巴集团控股有限公司 | Transaction information tracking method and apparatus |
CN110533531A (en) | 2019-09-05 | 2019-12-03 | 中国工商银行股份有限公司 | Identify method and apparatus, medium and the electronic equipment of abnormal account |
CN111626842A (en) | 2020-04-22 | 2020-09-04 | 北京芯盾时代科技有限公司 | Consumption behavior data analysis method and device |
-
2020
- 2020-09-07 JP JP2020149694A patent/JP7316984B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090319287A1 (en) | 2008-06-24 | 2009-12-24 | Ayman Hammad | Authentication segmentation |
CN105574728A (en) | 2014-10-14 | 2016-05-11 | 阿里巴巴集团控股有限公司 | Transaction information tracking method and apparatus |
CN110533531A (en) | 2019-09-05 | 2019-12-03 | 中国工商银行股份有限公司 | Identify method and apparatus, medium and the electronic equipment of abnormal account |
CN111626842A (en) | 2020-04-22 | 2020-09-04 | 北京芯盾时代科技有限公司 | Consumption behavior data analysis method and device |
Also Published As
Publication number | Publication date |
---|---|
JP2022044185A (en) | 2022-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10423962B2 (en) | Pre-authorization of a transaction using predictive modeling | |
US11107059B2 (en) | Method and system for data security utilizing user behavior and device identification | |
US7574402B2 (en) | System and method for authorizing electronic payment transactions | |
US20130325701A1 (en) | E-currency validation and authorization services platform | |
CN110210846B (en) | Message delay estimation system and method | |
US20140250011A1 (en) | Account type detection for fraud risk | |
US20130117154A1 (en) | Method and System of Evaluating Credibility of Online Trading User | |
CN110060053B (en) | Identification method, equipment and computer readable medium | |
CN112529575B (en) | Risk early warning method, equipment, storage medium and device | |
US20210334686A1 (en) | Systems and methods for short identifier behavioral analytics | |
JP4755911B2 (en) | Scoring system and scoring method for calculating fraud score using credit card | |
US10528924B2 (en) | Self-aware token | |
JP7316984B2 (en) | Information processing system and information processing method | |
CN112150260A (en) | Method, system, equipment and medium for verifying authenticity of business information of manufacturing enterprise | |
US7797229B2 (en) | Credit authorization systems and methods | |
AU2013267037B2 (en) | Frequency-based transaction prediction and processing | |
JP7498346B1 (en) | Information processing device and information processing method | |
JP2021144346A (en) | Monitoring device, monitoring method and computer program | |
KR20200094408A (en) | System and method for payment using reputation information | |
CN110570301A (en) | Risk identification method, device, equipment and medium | |
JP7403621B1 (en) | Information processing device and information processing method | |
WO2017109896A1 (en) | Information processing device, information processing method, and information processing program | |
TW201901553A (en) | Transaction identity warning system and transaction identity warning method | |
EP4006759A1 (en) | Fraud detection system, fraud detection method, and program | |
JP2024094917A (en) | Information processing device and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230529 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230718 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7316984 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |