JP7568085B2 - 機械学習プログラム,機械学習方法および機械学習装置 - Google Patents
機械学習プログラム,機械学習方法および機械学習装置 Download PDFInfo
- Publication number
- JP7568085B2 JP7568085B2 JP2023525255A JP2023525255A JP7568085B2 JP 7568085 B2 JP7568085 B2 JP 7568085B2 JP 2023525255 A JP2023525255 A JP 2023525255A JP 2023525255 A JP2023525255 A JP 2023525255A JP 7568085 B2 JP7568085 B2 JP 7568085B2
- Authority
- JP
- Japan
- Prior art keywords
- fairness
- machine learning
- attribute
- data
- calculation unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
ランク学習は、銀行やSNS(Social Networking Service)会社などの多くの企業の意思決定に利用されるようになってきている。
機械学習においては、上記の式(1)で表される損失関数Lossを最小過する最適化問題を解く。
1つの側面では、本発明は、過適合を発生させることなく公平性制約付き最適化を実現できるようにすることを目的とする。
図1は実施形態の一例としての情報処理装置1の機能構成を模式的に示す図である。
ランキングの精度、公平性評価基準は複数存在し、特に公平性評価基準は社会的に複数を考慮する必要性があるものとする。
P(y) ∝ P(y′)×w
ここでw∈[0,1] は、真のラベルy′に対するバイアスである。バイアスはグループごとに異なる。
ペアデータ作成部101が作成したペアデータは、例えば、図7を用いて後述するメモリ12や記憶装置13における所定の記憶領域に記憶される。
重み付き損失関数作成部104は、公平性制約を近似処理せずに用いた重みを含む重み付き損失関数を作成する。
重み付き損失関数作成部104は、図1に示すように、累積公平性評価差計算部105,重み計算部106および重み付き損失関数計算部107を備える。
累積公平性評価差計算部105は、例えば、以下の式(2)~(4)を用いて、グループGiの評価基準値EGiを算出する。
そして、累積公平性評価差計算部105は、以下の式(5)を用いて公平性評価関数の差diffを算出する。公平性評価関数の差diffは、各グループの公平性評価値の差を表す。
公平性評価関数の差diffは、グループGiの評価基準値EGi(第1の順位に基づく第1の属性の公平性を示す第1の評価値)と、グループGjの評価基準値EGj(第1の順位に基づく第2の属性の公平性を示す第2の評価値)との差分である。
また、累積公平性評価差計算部105は、ペアワイズ (Pairwise)な評価基準値であるAUC(Area Under the Curve)を用いて、公平性評価関数の差diffを算出してもよい。
AUCは以下の式で表される。
累積公平性評価差計算部105は、学習率ηを用いた以下の式(7)に示す更新式を用いて累積公平性評価差cijを推定する。
重み計算部106は、グループペア毎に重みを設定する。ペア(i,j)の重みを重みwijと表す。
図3は実施形態の一例としての情報処理装置1におけるスワップ変数を説明するための図である。
<2,6>を交換した場合、変換後のdiff<2,6>は0となり、公平性が理想的になる。
<5,6>を交換した場合、変換後のdiff<5,6>は0.5となり、依然として公平性は達成されない。
ここで、グループペアの順位を入れ替える前後におけるグループ公平性diffの差分をスワップ変数といってもよい。
スワップ変数は交換後の公平性変化率に応じたペアの重要度を表す。そして、重み計算部106は、ペア毎にスワップ変数を計算する。
なお、σ(x)は引数xを[0,1]の範囲に変換する関数であり、変数を確率化する関数である。σ(x)は例えば、以下の式で表される。
重み計算部106は、swapと公平性評価関数の差とが反映された重みを算出する。
重み付き損失関数計算部107は、重み計算部106によって算出された重みwijを用いて、以下の式(10)で表す重み付き損失関数Lossを算出する。
すなわち、重み付き損失関数計算部107は、予測ランキングの誤差(精度損失)を算出し、この誤差に重みを乗算した値を累積することで、重み付き損失関数Lossを計算する。
重み付き損失関数Loss(損失関数)は、訓練のステップ毎に機械学習モデルの出力に応じたデータの順位に基づいて算出される属性を基準とする公平性の値を累積的に処理して得られる累積公平性値を含む。
一方、diffij>0である場合、すなわち、グループGiがグループGjよりも有利な扱いを受けている場合に、cijが減少する。
上述の如く構成された実施形態の一例としての情報処理装置1における処理を、図4に示すフローチャートに従って説明する。
予め、重み付き損失関数作成部104による初期化が実行され、例えば、訓練ステップt = 0,η=10,cij = 0がそれぞれ設定される。
S3において、予測スコア計算部103が、入力データの各例を機械学習モデルに入力して、ラベル{0,1}に対する予測スコアを算出する。
S5において、累積公平性評価差計算部105が、ランキング生成部102によって設定された予測ランキングに基づき累積公平性評価差を算出する。
wij = P (swapij× cij)により重みwijを算出可能であるが、本例においてはシグモイド関数σを用いた例を示す。
重み計算部106は、例えば、シグモイド関数σを用いて以下の式により重みwijを算出する。
wij = σ(swapij× cij)
w12 = σ(0 × 0) = 0.5
w14 = σ{0.3 × (-2.5)} ≒ 0.32
w32 = σ(0.1 × 2.5) ≒ 0.56
w34 = σ(0 × 0) = 0.5
重み付き損失関数計算部107は、上記の式(10)を用いて、重み付き損失関数を計算する。
Loss = 0.5 × 0.59 + 0.32 × 0.37 + 0.56 × 0.85 0.5×0.55
≒1.1
このように、本発明の一実施形態としての情報処理装置1によれば、重み計算部106が、保護グループの正例と非保護グループの負例との順序を入れ替えた場合のスワップ変数を算出し、重み付き損失関数計算部107が、このスワップ変数を重みとして反映させた損失関数を算出する。この際、公平性制約を近似することなく直接用いて重み推定を行なう。
図5は実施形態の一例としての情報処理装置1による公平性評価値を従来手法と比べて示す図である。
図6は実施形態の一例としての情報処理装置1による公平性是正手法を、ペアを考慮しない手法と比べて示す図である。
(D)その他
図7は実施形態の一例としての情報処理装置1のハードウェア構成を例示する図である。
記憶装置13には、OSプログラム,制御プログラムおよび各種データが格納される。制御プログラムには機械学習プログラムが含まれる。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。
10 コンピュータ
11 プロセッサ(制御部)
12 RAM
13 HDD
14 グラフィック処理装置
14a モニタ
15 入力インタフェース
15a キーボード
15b マウス
16 光学ドライブ装置
16a 光ディスク
17 機器接続インタフェース
17a メモリ装置
17b メモリリーダライタ
17c メモリカード
18 ネットワークインタフェース
18a ネットワーク
19 バス
101 ペアデータ作成部
102 ランキング生成部
103 予測スコア計算部
104 重み付き損失関数作成部
105 累積公平性評価差計算部
106 重み計算部
107 重み付き損失関数計算部
108 モデルパラメータ計算部
Claims (6)
- 複数のデータのそれぞれに対する機械学習モデルの出力に応じた前記複数のデータ内の第1の順位を特定し、
前記複数のデータのうち第1の属性の第1のデータと第2の属性の第2のデータとの前記第1の順位における順位を入れ替えた場合の第2の順位の属性を基準とする公平性の値と前記第1の順位の属性を基準とする公平性の値との差分に基づくパラメータを算出し、
前記パラメータを含む損失関数を用いて前記機械学習モデルの訓練を実行する、
処理をコンピュータに実行させることを特徴とする機械学習プログラム。 - 前記第1の順位の属性を基準とする公平性の値は、前記第1の順位に基づく前記第1の属性の公平性を示す第1の評価値と、前記第1の順位に基づく前記第2の属性の公平性を示す第2の評価値との差分である、
ことを特徴とする請求項1に記載の機械学習プログラム。 - 前記損失関数は、前記訓練のステップ毎に前記機械学習モデルの出力に応じたデータの順位に基づいて算出される属性を基準とする公平性の値を累積的に処理して得られる累積公平性値を含む、
ことを特徴とする請求項1または2に記載の機械学習プログラム。 - 前記損失関数は、前記パラメータと前記累積公平性値とを含む重みを精度損失に乗算した重み付き損失関数である、
ことを特徴とする請求項3に記載の機械学習プログラム。 - 複数のデータのそれぞれに対する機械学習モデルの出力に応じた前記複数のデータ内の第1の順位を特定し、
前記複数のデータのうち第1の属性の第1のデータと第2の属性の第2のデータとの前記第1の順位における順位を入れ替えた場合の第2の順位の属性を基準とする公平性の値と前記第1の順位の属性を基準とする公平性の値との差分に基づくパラメータを算出し、
前記パラメータを含む損失関数を用いて前記機械学習モデルの訓練を実行する、
処理をコンピュータが実行することを特徴とする機械学習方法。 - 複数のデータのそれぞれに対する機械学習モデルの出力に応じた前記複数のデータ内の第1の順位を特定し、
前記複数のデータのうち第1の属性の第1のデータと第2の属性の第2のデータとの前記第1の順位における順位を入れ替えた場合の第2の順位の属性を基準とする公平性の値と前記第1の順位の属性を基準とする公平性の値との差分に基づくパラメータを算出し、
前記パラメータを含む損失関数を用いて前記機械学習モデルの訓練を実行する、
処理を実行する制御部を含むことを特徴とする機械学習装置。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2021/021059 WO2022254626A1 (ja) | 2021-06-02 | 2021-06-02 | 機械学習プログラム,機械学習方法および機械学習装置 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPWO2022254626A1 JPWO2022254626A1 (ja) | 2022-12-08 |
| JPWO2022254626A5 JPWO2022254626A5 (ja) | 2024-01-04 |
| JP7568085B2 true JP7568085B2 (ja) | 2024-10-16 |
Family
ID=84322866
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023525255A Active JP7568085B2 (ja) | 2021-06-02 | 2021-06-02 | 機械学習プログラム,機械学習方法および機械学習装置 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US20240086706A1 (ja) |
| EP (1) | EP4350585A4 (ja) |
| JP (1) | JP7568085B2 (ja) |
| WO (1) | WO2022254626A1 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2024166331A1 (ja) * | 2023-02-09 | 2024-08-15 | 富士通株式会社 | 機械学習プログラム、方法、及び装置 |
| WO2024184982A1 (ja) * | 2023-03-03 | 2024-09-12 | 富士通株式会社 | 公平性制御プログラム、公平性制御装置、および公平性制御方法 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021085188A1 (ja) | 2019-10-29 | 2021-05-06 | ソニー株式会社 | バイアス調整装置、情報処理装置、情報処理方法及び情報処理プログラム |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20200293918A1 (en) | 2019-03-15 | 2020-09-17 | Cognitive Scale, Inc. | Augmented Intelligence System Assurance Engine |
| US20220222242A1 (en) | 2019-05-27 | 2022-07-14 | Sony Group Corporation | Artificial intelligence device and program creation method |
-
2021
- 2021-06-02 JP JP2023525255A patent/JP7568085B2/ja active Active
- 2021-06-02 EP EP21944130.0A patent/EP4350585A4/en active Pending
- 2021-06-02 WO PCT/JP2021/021059 patent/WO2022254626A1/ja not_active Ceased
-
2023
- 2023-11-21 US US18/515,847 patent/US20240086706A1/en active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021085188A1 (ja) | 2019-10-29 | 2021-05-06 | ソニー株式会社 | バイアス調整装置、情報処理装置、情報処理方法及び情報処理プログラム |
Non-Patent Citations (1)
| Title |
|---|
| ZEHLIKE, Meike et al.,Reducing disparate exposure in ranking: A learning to rank approach [online],2020年04月20日,pp.2849-2855,[retrieved on 2021.06.23], Retrieved from the Internet: <URL: https://dl.acm.org/doi/pdf/10.1145/3366424.3380048> |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2022254626A1 (ja) | 2022-12-08 |
| US20240086706A1 (en) | 2024-03-14 |
| JPWO2022254626A1 (ja) | 2022-12-08 |
| EP4350585A4 (en) | 2024-07-31 |
| EP4350585A1 (en) | 2024-04-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Tao et al. | Dual focal loss for calibration | |
| Hido et al. | Statistical outlier detection using direct density ratio estimation | |
| Lei et al. | A Decision Support System for market-driven product positioning and design | |
| Dejaeger et al. | Data mining techniques for software effort estimation: a comparative study | |
| Sim et al. | Missing values and optimal selection of an imputation method and classification algorithm to improve the accuracy of ubiquitous computing applications | |
| US10599999B2 (en) | Digital event profile filters based on cost sensitive support vector machine for fraud detection, risk rating or electronic transaction classification | |
| Xia et al. | An attention-based wide and deep CNN with dilated convolutions for detecting electricity theft considering imbalanced data | |
| CN112424784B (zh) | 用于使用神经网络的改进的表标识的系统、方法和计算机可读介质 | |
| Ouf et al. | A proposed hybrid framework to improve the accuracy of customer churn prediction in telecom industry | |
| US10984343B2 (en) | Training and estimation of selection behavior of target | |
| US20220207307A1 (en) | Computer-implemented detection method, non-transitory computer-readable recording medium, and computing system | |
| US20240086706A1 (en) | Storage medium, machine learning method, and machine learning device | |
| Liu et al. | Ensemble learning algorithms based on easyensemble sampling for financial distress prediction | |
| Rath et al. | Modern approach for loan sanctioning in banks using machine learning | |
| CN111325344A (zh) | 评估模型解释工具的方法和装置 | |
| JP7207540B2 (ja) | 学習支援装置、学習支援方法、及びプログラム | |
| US8315956B2 (en) | System and method using hidden information | |
| Al Ali et al. | Enhancing financial distress prediction through integrated Chinese whisper clustering and federated learning | |
| Tang et al. | Software defect prediction ensemble learning algorithm based on 2-step sparrow optimizing extreme learning machine | |
| Tripathi | Practical machine learning cookbook | |
| Ortiz-Villaseñor et al. | K-nearest neighbors regression and applications | |
| Tummalapalli | Machine learning pipeline for automotive propensity models | |
| Zhang et al. | Leveraging local density decision labeling and fuzzy dependency for semi-supervised feature selection | |
| US11645555B2 (en) | Feature selection using Sobolev Independence Criterion | |
| Lin | Dynamic weight-based learning method for data detection in manufacturing |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230928 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230928 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240625 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240826 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240903 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240916 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7568085 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |






