JP2023159782A - 情報処理装置、情報処理方法、および情報処理プログラム - Google Patents
情報処理装置、情報処理方法、および情報処理プログラム Download PDFInfo
- Publication number
- JP2023159782A JP2023159782A JP2022069703A JP2022069703A JP2023159782A JP 2023159782 A JP2023159782 A JP 2023159782A JP 2022069703 A JP2022069703 A JP 2022069703A JP 2022069703 A JP2022069703 A JP 2022069703A JP 2023159782 A JP2023159782 A JP 2023159782A
- Authority
- JP
- Japan
- Prior art keywords
- data
- attributes
- combination
- user data
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 110
- 238000003672 processing method Methods 0.000 title claims description 10
- 239000000284 extract Substances 0.000 claims abstract description 21
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims description 51
- 238000012545 processing Methods 0.000 abstract description 79
- 238000012937 correction Methods 0.000 description 45
- 230000008569 process Effects 0.000 description 39
- 238000012805 post-processing Methods 0.000 description 34
- 238000009826 distribution Methods 0.000 description 33
- 238000007781 pre-processing Methods 0.000 description 28
- 238000013500 data storage Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 14
- 230000006872 improvement Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 101150083648 Sav1 gene Proteins 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
まず、図1を参照し、実施形態に係る情報処理装置が行う情報処理方法について説明する。図1は、実施形態に係る情報処理装置が行う情報処理方法を説明するための図である。
図2は、実施形態に係る情報処理装置1の構成の一例を示す図である。図2に示すように、情報処理装置1は、通信部10と、記憶部11と、処理部12とを有する。
通信部10は、例えば、NIC(Network Interface Card)などによって実現される。そして、通信部10は、ネットワークと有線または無線で接続され、他の各種装置との間で情報の送受信を行う。
記憶部11は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置によって実現される。また、記憶部11は、利用者データ記憶部20と、加工データ記憶部21と、スコア情報記憶部22とを有する。
利用者データ記憶部20は、各利用者に関する情報である利用者データを記憶する。図3は、実施形態に係る情報処理装置1の利用者データ記憶部20に記憶される利用者データテーブルの一例を示す図である。
加工データ記憶部21は、複数の加工データを含む加工データ群を記憶する。複数の加工データは、複数の利用者データの各々に含まれる複数の属性のデータのうちの少なくとも一部の属性のデータが同一のデータに各々上書きされた複数のデータであり、処理部12によって生成されるデータであり、処理部12によって加工データ記憶部21に記憶される。
スコア情報記憶部22は、利用者データ記憶部20に記憶された複数の利用者データを学習モデルに入力して得られる複数の利用者のスコアの情報を含む加工前スコア情報を記憶する。加工前スコア情報は、処理部12によって生成される情報であり、処理部12によってスコア情報記憶部22に記憶される。
処理部12は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)またはMPU(Micro Processing Unit)などのプロセッサによって、情報処理装置1内部の記憶装置(例えば、記憶部11)に記憶されている各種プログラム(情報処理プログラムの一例)がRAMを作業領域として実行されることにより実現される。また、処理部12は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により一部または全部が実現されてもよい。
取得部30は、通信部10を介して、外部の情報処理装置から利用者データ群を取得し、取得した利用者データ群を利用者データ記憶部20に記憶する。また、取得部30は、利用者データ記憶部20から利用者データ群を取得する。利用者データ記憶部20にデータが記憶される利用者データ群は、第1利用者データ群の一例であり、以下において、第1利用者データ群と記載する場合がある。
表示処理部31は、各種情報を表示部14に表示する。例えば、表示処理部31は、入力部13への操作者による入力操作に応じた情報を表示部14に表示させることができる。
データ判定部32は、取得部30によって取得された利用者データ群に含まれる複数の利用者データにおける属性組み合わせ毎のデータの傾向が予め定められた条件を満たすか否かを判定する。
抽出部33は、データ判定部32による判定結果に基づいて、予め定められた条件を満たさない属性組み合わせである対象組み合わせ属性を対象組み合わせ属性として抽出する。
加工部34は、第1利用者データ群の複数の利用者データの各々に含まれる複数の属性のデータのうちの少なくとも一部の属性のデータが抽出部33によって抽出された対象組み合わせ属性のデータに各々上書きされた複数の加工データを含む加工データ群を生成する。
スコア算出部35は、利用者の複数の属性の情報を含む利用者データを入力とし貸し倒れリスクに関するスコアを出力とする学習モデルを用いて、各利用者のスコアを算出する。
第1取得部36は、スコア情報記憶部22に記憶されている加工前スコア情報をスコア情報記憶部22から取得する。加工前スコア情報は、上述したように、複数の利用者データを学習モデルに入力して得られる複数のスコアの情報を含む。
第2取得部37は、加工後スコア情報をスコア情報記憶部22に記憶されている対象属性組み合わせ毎の加工後スコア情報をスコア情報記憶部22から取得する。加工後スコア情報は、上述したように、加工データ群に含まれる複数の加工データを学習モデルに入力して得られる複数の利用者のスコアの情報を含む。
比較部38は、加工前スコア情報と加工後スコア情報とを対象組み合わせ毎に比較する。例えば、比較部38は、加工前スコア情報に含まれる複数のスコアの分布状態と加工後スコア情報に含まれる複数のスコアの分布状態とを比較する。
要否判定部39は、比較部38による比較結果に基づいて、学習モデルの補正または学習モデルから出力されるスコアの補正が必要か否かを判定する。
補正部40は、要否判定部39によって補正が必要であると判定された場合、補正処理を行う。補正処理は、例えば、学習モデルを補正する処理または学習モデルから出力されるスコアを補正する補正値を算出する処理である。
提供部41は、利用者に対して各種サービスを提供する。提供部41は、サービス提供先の利用者の利用者データを学習モデルに入力し、入力した学習モデルから出力されるスコアに基づいて、利用者に提供するサービスの内容を決定する。
次に、実施形態に係る情報処理装置1の処理部12による情報処理の手順について説明する。図5は、実施形態に係る情報処理装置1の処理部12による情報処理の一例を示すフローチャートである。
データ判定部32は、例えば、属性の組み合わせ毎の利用者データの数と第2データに特定データを含む利用者データの割合Rdとに基づいて、属性組み合わせ毎のデータの傾向が予め定められた条件を満たすか否かを判定することもできる。
上述してきた実施形態に係る情報処理装置1は、例えば図6に示すような構成のコンピュータ80によって実現される。図6は、実施形態に係る情報処理装置1の機能を実現するコンピュータ80の一例を示すハードウェア構成図である。コンピュータ80は、CPU81、RAM82、ROM(Read Only Memory)83、HDD(Hard Disk Drive)84、通信インターフェイス(I/F)85、入出力インターフェイス(I/F)86、およびメディアインターフェイス(I/F)87を有する。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
上述してきたように、実施形態に係る情報処理装置1は、データ判定部32と、抽出部33とを備える。データ判定部32は、複数の属性のデータである第1データと属性以外のデータである第2データとを含む複数の利用者データにおける属性の組み合わせ毎のデータの傾向が予め定められた条件を満たすか否かを判定する。抽出部33は、データ判定部32による判定結果に基づいて、予め定められた条件を満たさない属性の組み合わせを抽出する。これにより、情報処理装置1は、偏った予測や推定などの判定が行われる可能性がある属性組み合わせを抽出することができ、学習モデルを用いた判定精度の向上を支援することができる。
10 通信部
11 記憶部
12 処理部
13 入力部
14 表示部
20 利用者データ記憶部
21 加工データ記憶部
22 スコア情報記憶部
30 取得部
31 表示処理部
32 データ判定部
33 抽出部
34 加工部
35 スコア算出部
36 第1取得部
37 第2取得部
38 比較部
39 要否判定部
40 補正部
41 提供部
Claims (11)
- 複数の属性のデータである第1データと前記属性以外のデータである第2データとを含む複数の利用者データにおける前記属性の組み合わせ毎のデータの傾向が予め定められた条件を満たすか否かを判定するデータ判定部と、
前記データ判定部による判定結果に基づいて、前記予め定められた条件を満たさない前記属性の組み合わせを抽出する抽出部と、を備える
ことを特徴とする情報処理装置。 - 前記データ判定部は、
前記属性の組み合わせ毎の前記利用者データの数に基づいて、前記属性の組み合わせ毎のデータの傾向が前記予め定められた条件を満たすか否かを判定する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記データ判定部は、
複数の前記属性の組み合わせのうち前記複数の利用者データの数が閾値未満である前記属性の組み合わせを、前記予め定められた条件を満たさない前記属性の組み合わせと判定する
ことを特徴とする請求項2に記載の情報処理装置。 - 前記閾値は、
前記属性の組み合わせ毎の前記利用者データの数に基づいて設定される値である
ことを特徴とする請求項3に記載の情報処理装置。 - 前記データ判定部は、
前記属性の組み合わせ毎の前記第2データに特定データが含まれる利用者データの数に基づいて、前記属性の組み合わせ毎のデータの傾向が前記予め定められた条件を満たすか否かを判定する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記データ判定部は、
複数の前記属性の組み合わせのうち前記第2データに前記特定データが含まれる利用者データの割合が設定範囲外である前記属性の組み合わせを、前記予め定められた条件を満たさない前記属性の組み合わせと判定する
ことを特徴とする請求項5に記載の情報処理装置。 - 前記設定範囲は、
前記属性の組み合わせ毎の前記第2データに前記特定データが含まれる利用者データの数に基づいて設定される値である
ことを特徴とする請求項6に記載の情報処理装置。 - 前記データ判定部は、
前記複数の利用者データを含む第1利用者データ群と前記第1利用者データ群よりもデータ数が多い第2利用者データ群との前記属性の組み合わせ毎のデータの傾向に基づいて、前記複数の利用者データにおける前記属性の組み合わせ毎のデータ傾向が予め定められた条件を満たすか否かを判定する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記データ判定部は、
前記第1利用者データ群と前記第2利用者データ群との間の前記属性の組み合わせ毎の前記利用者データの数の割合の比が予め定められた条件を満たさない前記属性の組み合わせを前記予め定められた条件を満たさない前記属性の組み合わせとして判定する
ことを特徴とする請求項8に記載の情報処理装置。 - コンピュータが実行する情報処理方法であって、
複数の属性のデータである第1データと前記属性以外のデータである第2データとを含む複数の利用者データにおける前記属性の組み合わせ毎のデータの傾向が予め定められた条件を満たすか否かを判定するデータ判定工程と、
前記データ判定工程による判定結果に基づいて、前記予め定められた条件を満たさない前記属性の組み合わせを抽出する抽出工程と、を含む
ことを特徴とする情報処理方法。 - 複数の属性のデータである第1データと前記属性以外のデータである第2データとを含む複数の利用者データにおける前記属性の組み合わせ毎のデータの傾向が予め定められた条件を満たすか否かを判定するデータ判定手順と、
前記データ判定手順による判定結果に基づいて、前記予め定められた条件を満たさない前記属性の組み合わせを抽出する抽出手順と、をコンピュータに実行させる
ことを特徴とする情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022069703A JP7410209B2 (ja) | 2022-04-20 | 2022-04-20 | 情報処理装置、情報処理方法、および情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022069703A JP7410209B2 (ja) | 2022-04-20 | 2022-04-20 | 情報処理装置、情報処理方法、および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023159782A true JP2023159782A (ja) | 2023-11-01 |
JP7410209B2 JP7410209B2 (ja) | 2024-01-09 |
Family
ID=88514782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022069703A Active JP7410209B2 (ja) | 2022-04-20 | 2022-04-20 | 情報処理装置、情報処理方法、および情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7410209B2 (ja) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008059433A (ja) * | 2006-09-01 | 2008-03-13 | Fujitsu Ltd | 属性間の部分関係抽出する装置、方法、及びプログラム |
JP2017037577A (ja) * | 2015-08-13 | 2017-02-16 | カルチュア・コンビニエンス・クラブ株式会社 | 装置、方法、および、プログラム |
JP2020184312A (ja) * | 2019-04-26 | 2020-11-12 | 富士通株式会社 | データセットのバイアス視覚化 |
JP2021086558A (ja) * | 2019-11-29 | 2021-06-03 | キヤノンメディカルシステムズ株式会社 | データ選別装置、学習装置及びプログラム |
JP2021111101A (ja) * | 2020-01-09 | 2021-08-02 | Awl株式会社 | 機械学習システム、学習用データセット生成システム、及び機械学習プログラム |
WO2021214845A1 (ja) * | 2020-04-20 | 2021-10-28 | 富士通株式会社 | 調整プログラム、調整方法および情報処理装置 |
US20210406712A1 (en) * | 2020-06-25 | 2021-12-30 | International Business Machines Corporation | Bias Source Identification and De-Biasing of a Dataset |
JP2022500747A (ja) * | 2018-09-10 | 2022-01-04 | グーグル エルエルシーGoogle LLC | 機械学習モデルを使用した、偏りのあるデータの拒否 |
WO2022044064A1 (ja) * | 2020-08-24 | 2022-03-03 | 富士通株式会社 | 機械学習データ生成プログラム、機械学習データ生成方法、機械学習データ生成装置、分類データ生成プログラム、分類データ生成方法および分類データ生成装置 |
JP2022047530A (ja) * | 2020-09-11 | 2022-03-24 | アクタピオ,インコーポレイテッド | 学習装置、学習方法および学習プログラム |
US20220108222A1 (en) * | 2020-10-05 | 2022-04-07 | OneTrust, LLC | Systems and methods for detecting prejudice bias in machine-learning models |
CN114357056A (zh) * | 2020-10-13 | 2022-04-15 | 国际商业机器公司 | 数据集之间的关联的检测 |
-
2022
- 2022-04-20 JP JP2022069703A patent/JP7410209B2/ja active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008059433A (ja) * | 2006-09-01 | 2008-03-13 | Fujitsu Ltd | 属性間の部分関係抽出する装置、方法、及びプログラム |
JP2017037577A (ja) * | 2015-08-13 | 2017-02-16 | カルチュア・コンビニエンス・クラブ株式会社 | 装置、方法、および、プログラム |
JP2022500747A (ja) * | 2018-09-10 | 2022-01-04 | グーグル エルエルシーGoogle LLC | 機械学習モデルを使用した、偏りのあるデータの拒否 |
JP2020184312A (ja) * | 2019-04-26 | 2020-11-12 | 富士通株式会社 | データセットのバイアス視覚化 |
JP2021086558A (ja) * | 2019-11-29 | 2021-06-03 | キヤノンメディカルシステムズ株式会社 | データ選別装置、学習装置及びプログラム |
JP2021111101A (ja) * | 2020-01-09 | 2021-08-02 | Awl株式会社 | 機械学習システム、学習用データセット生成システム、及び機械学習プログラム |
WO2021214845A1 (ja) * | 2020-04-20 | 2021-10-28 | 富士通株式会社 | 調整プログラム、調整方法および情報処理装置 |
US20210406712A1 (en) * | 2020-06-25 | 2021-12-30 | International Business Machines Corporation | Bias Source Identification and De-Biasing of a Dataset |
WO2022044064A1 (ja) * | 2020-08-24 | 2022-03-03 | 富士通株式会社 | 機械学習データ生成プログラム、機械学習データ生成方法、機械学習データ生成装置、分類データ生成プログラム、分類データ生成方法および分類データ生成装置 |
JP2022047530A (ja) * | 2020-09-11 | 2022-03-24 | アクタピオ,インコーポレイテッド | 学習装置、学習方法および学習プログラム |
US20220108222A1 (en) * | 2020-10-05 | 2022-04-07 | OneTrust, LLC | Systems and methods for detecting prejudice bias in machine-learning models |
CN114357056A (zh) * | 2020-10-13 | 2022-04-15 | 国际商业机器公司 | 数据集之间的关联的检测 |
Also Published As
Publication number | Publication date |
---|---|
JP7410209B2 (ja) | 2024-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020048051A1 (zh) | 理财产品推荐方法、服务器及计算机可读存储介质 | |
CN107247786A (zh) | 用于确定相似用户的方法、装置和服务器 | |
WO2019080662A1 (zh) | 信息推荐方法及装置、设备 | |
CN111931055B (zh) | 对象推荐方法、对象推荐装置和电子设备 | |
US20220114624A1 (en) | Digital Content Text Processing and Review Techniques | |
US20170365014A1 (en) | Systems, methods and non-transitory computer readable storage media for tracking and evaluating predictions regarding relationships | |
CN113742492A (zh) | 保险方案生成方法、装置、电子设备及存储介质 | |
JP2019091355A (ja) | 判定装置、判定方法及び判定プログラム | |
CN113327151A (zh) | 商品对象推荐方法、装置、计算机设备及存储介质 | |
CN111582932A (zh) | 场景间信息推送方法、装置、计算机设备及存储介质 | |
CN113407854A (zh) | 一种应用推荐方法、装置、设备及计算机可读存储介质 | |
US10049372B2 (en) | Search and rank organizations | |
JP2019185595A (ja) | 情報処理装置、情報処理方法、情報処理プログラム、判定装置、判定方法及び判定プログラム | |
CN115170244A (zh) | 新产品的冷启动推荐方法、装置、电子设备和介质 | |
CN113554448A (zh) | 一种用户流失预测方法、装置及电子设备 | |
KR20110023750A (ko) | 오브젝트 커스터마이제이션 및 관리 시스템 | |
US9201967B1 (en) | Rule based product classification | |
US20140372090A1 (en) | Incremental response modeling | |
CN109948638B (zh) | 对象匹配方法、装置、设备及计算机可读存储介质 | |
JP7410209B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
JP7401588B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
JP7077185B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
CN110020118B (zh) | 一种计算用户之间相似度的方法及装置 | |
CN113159877B (zh) | 数据处理方法、装置、系统、计算机可读存储介质 | |
CN110264333B (zh) | 一种风险规则确定方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230904 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20231026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7410209 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |