JP7472496B2 - モデル生成装置、モデル生成方法、及び、記録媒体 - Google Patents
モデル生成装置、モデル生成方法、及び、記録媒体 Download PDFInfo
- Publication number
- JP7472496B2 JP7472496B2 JP2020004309A JP2020004309A JP7472496B2 JP 7472496 B2 JP7472496 B2 JP 7472496B2 JP 2020004309 A JP2020004309 A JP 2020004309A JP 2020004309 A JP2020004309 A JP 2020004309A JP 7472496 B2 JP7472496 B2 JP 7472496B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- model
- learning
- transaction
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 51
- 238000001514 detection method Methods 0.000 claims description 74
- 238000012549 training Methods 0.000 claims description 64
- 238000005070 sampling Methods 0.000 claims description 35
- 238000011156 evaluation Methods 0.000 claims description 34
- 238000012854 evaluation process Methods 0.000 claims description 4
- 238000013500 data storage Methods 0.000 description 30
- 238000012545 processing Methods 0.000 description 6
- 230000015654 memory Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Description
金融機関における取引データから、不正取引を示すデータを正例とし、当該正例以外のデータを負例とする学習データを生成する学習データ生成部と、
前記正例と前記負例を異なる比率で含む学習データを用いて、複数の不正検知モデルを学習するモデル学習部と、
評価データを用いて、学習済みの前記複数の不正検知モデルを評価するモデル評価部と、
を備え、
前記学習データ生成部は、
前記取引データに含まれる負例のデータを取引口座の単位でサンプリングして前記負例の学習データを生成するサンプリング部と、
前記取引データに含まれる前記負例のデータを、取引件数及び取引口座に関する属性情報を用いて、前記取引口座の単位で複数のグループにグループ化するグループ化部と、
を備え、
前記サンプリング部は、前記複数のグループから前記負例のデータを均等にサンプリングする。
コンピュータにより実行されるモデル生成方法であって、
金融機関における取引データから、不正取引を示すデータを正例とし、当該正例以外のデータを負例とする学習データを生成する学習データ生成処理を行い、
前記正例と前記負例を異なる比率で含む学習データを用いて、複数の不正検知モデルを学習するモデル学習処理を行い、
評価データを用いて、学習済みの前記複数の不正検知モデルを評価するモデル評価処理を行い、
前記学習データ生成処理は、
前記取引データに含まれる負例のデータを取引口座の単位でサンプリングして前記負例の学習データを生成するサンプリング処理と、
前記取引データに含まれる前記負例のデータを、取引件数及び取引口座に関する属性情報を用いて、前記取引口座の単位で複数のグループにグループ化するグループ化処理と、
を行い、
前記サンプリング処理は、前記複数のグループから前記負例のデータを均等にサンプリングする。
金融機関における取引データから、不正取引を示すデータを正例とし、当該正例以外のデータを負例とする学習データを生成する学習データ生成処理を行い、
前記正例と前記負例を異なる比率で含む学習データを用いて、複数の不正検知モデルを学習するモデル学習処理を行い、
評価データを用いて、学習済みの前記複数の不正検知モデルを評価するモデル評価処理を行い、
前記学習データ生成処理は、
前記取引データに含まれる負例のデータを取引口座の単位でサンプリングして前記負例の学習データを生成するサンプリング処理と、
前記取引データに含まれる前記負例のデータを、取引件数及び取引口座に関する属性情報を用いて、前記取引口座の単位で複数のグループにグループ化するグループ化処理と、
を行い、
前記サンプリング処理は、前記複数のグループから前記負例のデータを均等にサンプリングする処理をコンピュータに実行させるプログラムを記録する。
[全体構成]
図1は、本発明の実施形態に係るモデル生成装置100の概略構成を示す。モデル生成装置100は、金融機関における取引データに基づいて、不正取引を検知するためのモデル(以下、「不正検知モデル」と呼ぶ。)を生成する。
(ハードウェア構成)
図2は、モデル生成装置100のハードウェア構成を示すブロック図である。図示のように、モデル生成装置100は、インタフェース(I/F)101と、プロセッサ102と、メモリ103と、記録媒体104と、データベース(DB)105と、入力部106と、表示部107と、を備える。
モデル生成装置100は、機能的には、図1に示すように、学習データ生成部10と、学習データ記憶部20と、学習部30と、を備える。学習データ生成部10は、取引データ記憶部5から取得した取引データと、口座情報記憶部6から取得した口座情報とを用いて、不正検知モデルを学習する際に使用する学習データを生成する。学習データ生成部10は、生成した学習データを学習データ記憶部20に記憶する。学習部30は、学習データ記憶部20に記憶された学習データを用いて、不正検知モデルを学習し、学習済みの不正検知モデルを生成する。
図3は、学習データ生成部10の構成を示す。まず、学習データ生成部10は、取引データ記憶部5に記憶されている取引データのうち、不正取引を示す正例のデータをそのまま学習データ記憶部20に保存する。具体的には、学習データ生成部10は、取引データ記憶部5に保存されている全ての不正口座の取引データを学習データ記憶部20に保存する。
次に、学習部30について詳しく説明する。図8は、学習部30の構成を示すブロック図である。学習部30は、学習データ取得部31と、不正取引検出部32と、モデル学習部33と、モデル記憶部34と、不正取引検出部35と、モデル評価部36と、を備える。
金融機関における取引データから、不正取引を示すデータを正例とし、当該正例以外のデータを負例とする学習データを生成する学習データ生成部と、
前記正例と前記負例を異なる比率で含む学習データを用いて、複数の不正検知モデルを学習するモデル学習部と、
評価データを用いて、学習済みの前記複数の不正検知モデルを評価するモデル評価部と、
を備えるモデル生成装置。
前記モデル評価部は、前記複数の不正検知モデルのうち、不正取引を検知する精度が最も高いものを最適な不正検知モデルと判定する付記1に記載のモデル生成装置。
前記正例と前記負例を異なる比率で含む学習データは、前記正例の数が固定数であり、前記負例の数が異なる学習データである付記1又は2に記載のモデル生成装置。
前記学習データ生成部は、前記取引データに含まれる負例のデータを取引口座の単位でサンプリングして前記負例の学習データを生成するサンプリング部を備える付記1に記載のモデル生成装置。
前記サンプリング部は、前記取引口座における所定期間の一連の取引をまとめて1つの負例の学習データとしてサンプリングする付記4に記載のモデル生成装置。
前記学習データ生成部は、前記取引データに含まれる前記負例のデータを、取引件数及び取引口座に関する属性情報を用いて、前記取引口座の単位で複数のグループにグループ化するグループ化部を備え、
前記サンプリング部は、前記複数のグループから前記負例のデータを均等にサンプリングする付記4又は5に記載のモデル生成装置。
前記属性情報は、前記取引口座の残高、前記取引口座の名義人の年齢、前記名義人の国籍、前記名義人の職業、前記名義人の年収、前記名義人が個人であるか法人であるかを示す情報、取引数のうちの少なくとも1つを含む付記6に記載のモデル生成装置。
前記グループ化部は、前記取引件数及び前記属性情報をそれぞれ所定数にクラスタリングすることにより前記複数のグループを生成する付記6又は7に記載のモデル生成装置。
金融機関における取引データから、不正取引を示すデータを正例とし、当該正例以外のデータを負例とする学習データを生成し、
前記正例と前記負例を異なる比率で含む学習データを用いて、複数の不正検知モデルを学習し、
評価データを用いて、学習済みの前記複数の不正検知モデルを評価するモデル生成方法。
金融機関における取引データから、不正取引を示すデータを正例とし、当該正例以外のデータを負例とする学習データを生成し、
前記正例と前記負例を異なる比率で含む学習データを用いて、複数の不正検知モデルを学習し、
評価データを用いて、学習済みの前記複数の不正検知モデルを評価する処理をコンピュータに実行させるプログラムを記録した記録媒体。
6 口座情報記憶部
10 学習データ生成部
11 グループ化部
12 サンプリング部
20 学習データ記憶部
30 学習部
32 不正取引検出部
33 モデル学習部
34 モデル記憶部
36 モデル評価部
Claims (8)
- 金融機関における取引データから、不正取引を示すデータを正例とし、当該正例以外のデータを負例とする学習データを生成する学習データ生成部と、
前記正例と前記負例を異なる比率で含む学習データを用いて、複数の不正検知モデルを学習するモデル学習部と、
評価データを用いて、学習済みの前記複数の不正検知モデルを評価するモデル評価部と、
を備え、
前記学習データ生成部は、
前記取引データに含まれる負例のデータを取引口座の単位でサンプリングして前記負例の学習データを生成するサンプリング部と、
前記取引データに含まれる前記負例のデータを、取引件数及び取引口座に関する属性情報を用いて、前記取引口座の単位で複数のグループにグループ化するグループ化部と、
を備え、
前記サンプリング部は、前記複数のグループから前記負例のデータを均等にサンプリングするモデル生成装置。 - 前記モデル評価部は、前記複数の不正検知モデルのうち、不正取引を検知する精度が最も高いものを最適な不正検知モデルと判定する請求項1に記載のモデル生成装置。
- 前記正例と前記負例を異なる比率で含む学習データは、前記正例の数が固定数であり、前記負例の数が異なる学習データである請求項1又は2に記載のモデル生成装置。
- 前記サンプリング部は、前記取引口座における所定期間の一連の取引をまとめて1つの負例の学習データとしてサンプリングする請求項1に記載のモデル生成装置。
- 前記属性情報は、前記取引口座の残高、前記取引口座の名義人の年齢、前記名義人の国籍、前記名義人の職業、前記名義人の年収、前記名義人が個人であるか法人であるかを示す情報、取引数のうちの少なくとも1つを含む請求項1に記載のモデル生成装置。
- 前記グループ化部は、前記取引件数及び前記属性情報をそれぞれ所定数にクラスタリングすることにより前記複数のグループを生成する請求項1又は5に記載のモデル生成装置。
- コンピュータにより実行されるモデル生成方法であって、
金融機関における取引データから、不正取引を示すデータを正例とし、当該正例以外のデータを負例とする学習データを生成する学習データ生成処理を行い、
前記正例と前記負例を異なる比率で含む学習データを用いて、複数の不正検知モデルを学習するモデル学習処理を行い、
評価データを用いて、学習済みの前記複数の不正検知モデルを評価するモデル評価処理を行い、
前記学習データ生成処理は、
前記取引データに含まれる負例のデータを取引口座の単位でサンプリングして前記負例の学習データを生成するサンプリング処理と、
前記取引データに含まれる前記負例のデータを、取引件数及び取引口座に関する属性情報を用いて、前記取引口座の単位で複数のグループにグループ化するグループ化処理と、
を行い、
前記サンプリング処理は、前記複数のグループから前記負例のデータを均等にサンプリングするモデル生成方法。 - 金融機関における取引データから、不正取引を示すデータを正例とし、当該正例以外のデータを負例とする学習データを生成する学習データ生成処理を行い、
前記正例と前記負例を異なる比率で含む学習データを用いて、複数の不正検知モデルを学習するモデル学習処理を行い、
評価データを用いて、学習済みの前記複数の不正検知モデルを評価するモデル評価処理を行い、
前記学習データ生成処理は、
前記取引データに含まれる負例のデータを取引口座の単位でサンプリングして前記負例の学習データを生成するサンプリング処理と、
前記取引データに含まれる前記負例のデータを、取引件数及び取引口座に関する属性情報を用いて、前記取引口座の単位で複数のグループにグループ化するグループ化処理と、
を行い、
前記サンプリング処理は、前記複数のグループから前記負例のデータを均等にサンプリングする処理をコンピュータに実行させるプログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020004309A JP7472496B2 (ja) | 2020-01-15 | 2020-01-15 | モデル生成装置、モデル生成方法、及び、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020004309A JP7472496B2 (ja) | 2020-01-15 | 2020-01-15 | モデル生成装置、モデル生成方法、及び、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021111261A JP2021111261A (ja) | 2021-08-02 |
JP7472496B2 true JP7472496B2 (ja) | 2024-04-23 |
Family
ID=77060034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020004309A Active JP7472496B2 (ja) | 2020-01-15 | 2020-01-15 | モデル生成装置、モデル生成方法、及び、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7472496B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7373001B2 (ja) | 2022-03-16 | 2023-11-01 | ヤフー株式会社 | 判定システム、判定方法、およびプログラム |
WO2023175903A1 (ja) * | 2022-03-18 | 2023-09-21 | 日本電気株式会社 | 監視システム、モデル生成装置、モデル生成方法および記録媒体 |
WO2023175898A1 (ja) * | 2022-03-18 | 2023-09-21 | 日本電気株式会社 | 監視システム、モデル生成装置、モデル生成方法および記録媒体 |
JP7359910B1 (ja) | 2022-07-06 | 2023-10-11 | PayPay株式会社 | 情報処理装置、情報処理方法、およびプログラム |
KR102637818B1 (ko) * | 2022-11-24 | 2024-02-19 | 엔에이치투자증권 주식회사 | 부정 계좌 예측을 위한 서버 및 그 방법 |
CN117314909B (zh) * | 2023-11-29 | 2024-02-09 | 无棣源通电子科技有限公司 | 基于人工智能的电路板缺陷检测方法、装置、设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109208A (ja) | 2000-09-29 | 2002-04-12 | Acom Co Ltd | 信用リスク管理方法、分析モデル決定方法、分析サーバ及び分析モデル決定装置 |
JP2017091516A (ja) | 2015-11-12 | 2017-05-25 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 不正取引を特定するコンピュータ実装方法、データ処理システムおよびコンピュータ・プログラム |
JP2017102540A (ja) | 2015-11-30 | 2017-06-08 | 日本電信電話株式会社 | 分類装置、方法、及びプログラム |
CN108846405A (zh) | 2018-04-11 | 2018-11-20 | 东莞迪赛软件技术有限公司 | 基于ssgan的不平衡医保数据分类方法 |
CN109598292A (zh) | 2018-11-23 | 2019-04-09 | 华南理工大学 | 一种不同辅助样本正负比例的迁移学习方法 |
WO2019092931A1 (ja) | 2017-11-07 | 2019-05-16 | 日本電気株式会社 | 判別モデル生成装置、判別モデル生成方法および判別モデル生成プログラム |
JP2019101959A (ja) | 2017-12-07 | 2019-06-24 | ヤフー株式会社 | 抽出装置、抽出方法、抽出プログラム及びモデル |
-
2020
- 2020-01-15 JP JP2020004309A patent/JP7472496B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109208A (ja) | 2000-09-29 | 2002-04-12 | Acom Co Ltd | 信用リスク管理方法、分析モデル決定方法、分析サーバ及び分析モデル決定装置 |
JP2017091516A (ja) | 2015-11-12 | 2017-05-25 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 不正取引を特定するコンピュータ実装方法、データ処理システムおよびコンピュータ・プログラム |
JP2017102540A (ja) | 2015-11-30 | 2017-06-08 | 日本電信電話株式会社 | 分類装置、方法、及びプログラム |
WO2019092931A1 (ja) | 2017-11-07 | 2019-05-16 | 日本電気株式会社 | 判別モデル生成装置、判別モデル生成方法および判別モデル生成プログラム |
JP2019101959A (ja) | 2017-12-07 | 2019-06-24 | ヤフー株式会社 | 抽出装置、抽出方法、抽出プログラム及びモデル |
CN108846405A (zh) | 2018-04-11 | 2018-11-20 | 东莞迪赛软件技术有限公司 | 基于ssgan的不平衡医保数据分类方法 |
CN109598292A (zh) | 2018-11-23 | 2019-04-09 | 华南理工大学 | 一种不同辅助样本正负比例的迁移学习方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2021111261A (ja) | 2021-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7472496B2 (ja) | モデル生成装置、モデル生成方法、及び、記録媒体 | |
Wang et al. | Are stablecoins truly diversifiers, hedges, or safe havens against traditional cryptocurrencies as their name suggests? | |
US7720751B2 (en) | System and method of continuous assurance for internal control | |
Mijiyawa | Africa's recent economic growth: What are the contributing factors? | |
CN106997493A (zh) | 基于多维度数据的彩票用户流失预测方法及其系统 | |
CN111539733B (zh) | 基于全中心损失函数的欺诈交易识别方法、系统、装置 | |
CN112541817A (zh) | 一种个人消费贷款潜在客户的营销响应处理方法及系统 | |
CN110084609B (zh) | 一种基于表征学习的交易欺诈行为深度检测方法 | |
Chen | Comparing traditional statistics, decision tree classification and support vector machine techniques for financial bankruptcy prediction | |
JP2021072057A (ja) | 情報処理装置および情報処理方法 | |
Kašćelan et al. | Hybrid support vector machine rule extraction method for discovering the preferences of stock market investors: Evidence from Montenegro | |
Staňková | Threshold moving approach with logit models for bankruptcy prediction | |
CN112419045A (zh) | 基于过采样与随机森林的不平衡信贷用户分类方法 | |
CN113177733B (zh) | 基于卷积神经网络的中小微企业数据建模方法及系统 | |
Kassa et al. | Revisiting the Trade Impact of AGOA: A Synthetic Control Approach | |
Yang et al. | Applying K-means technique and decision tree analysis to predict Taiwan ETF performance | |
CN112767121A (zh) | 一种风险等级数据的处理方法和装置 | |
JP2022154862A (ja) | 情報処理方法、プログラム及び情報処理装置 | |
CN113744042A (zh) | 基于优化Boruta和XGBoost的信贷违约预测方法及系统 | |
CN112001425A (zh) | 一种数据处理方法、装置及计算机可读存储介质 | |
CN111612626A (zh) | 一种债券评估数据预处理方法和装置 | |
Awyong | The Role of Disclosure in DeFi Markets: Evidence from Twitter | |
PRODUCT et al. | ISTANBUL TECHNICAL UNIVERSITY★ GRADUATE SCHOOL | |
WO2022249266A1 (ja) | 不正検知システム、不正検知方法およびプログラム記録媒体 | |
Joshi et al. | Factors affecting Investment Behaviour of Foreign Institutional Investors: Perception of Indian Investors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231031 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240325 |