JP2022527536A - 強化学習を通じた公平性の改善 - Google Patents
強化学習を通じた公平性の改善 Download PDFInfo
- Publication number
- JP2022527536A JP2022527536A JP2021558964A JP2021558964A JP2022527536A JP 2022527536 A JP2022527536 A JP 2022527536A JP 2021558964 A JP2021558964 A JP 2021558964A JP 2021558964 A JP2021558964 A JP 2021558964A JP 2022527536 A JP2022527536 A JP 2022527536A
- Authority
- JP
- Japan
- Prior art keywords
- fairness
- mlm
- value
- initial
- provisional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002787 reinforcement Effects 0.000 title claims abstract description 48
- 238000010801 machine learning Methods 0.000 claims abstract description 142
- 230000006870 function Effects 0.000 claims abstract description 78
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 15
- 230000004913 activation Effects 0.000 claims description 10
- 230000009471 action Effects 0.000 claims description 5
- 230000001052 transient effect Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 claims 3
- 238000004364 calculation method Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 31
- 238000010586 diagram Methods 0.000 description 28
- 238000004422 calculation algorithm Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 14
- 239000003795 chemical substances by application Substances 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 9
- 238000013473 artificial intelligence Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000012706 support-vector machine Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 6
- 238000007477 logistic regression Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 6
- 238000005457 optimization Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000001953 sensory effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
*公平性指標が0.1%よりも大きい場合は(-1)、
*公平性指標が0.1%未満である場合は0。
したがって、この例の場合、R=0.8-1=-0.2(10%>0.1%であるため)の報酬がRLネットワークに供給される。
1.教師あり機械学習モデルにおける公平性を改善し、差別的バイアスを低減するためのコンピュータ実施方法であって、
教師あり機械学習モデルを強化学習メタ・モデルにリンクさせるステップと、
教師あり機械学習モデルのハイパーパラメータおよびパラメータのリストを選択するステップと、
複数の相反する目的関数に基づいて報酬関数を計算することによって、強化学習メタ・モデルに関係する強化学習エンジンによって教師あり機械学習モデルのハイパーパラメータおよびパラメータのリストのハイパーパラメータ値およびパラメータ値を調整することによって、教師あり機械学習モデルの少なくとも1つの態様を制御するステップと、
教師あり機械学習モデルの公平性値を改善するために、選択するステップおよび制御するステップを反復的に繰り返すステップとを含む、方法。
2.公平性値が所定の公平性閾値よりも大きく、かつ、性能値が所定の性能閾値よりも大きい場合に、反復を中断するステップも含む、項1に記載の方法。
3.所定数の反復後に、公平性値が所定の公平性閾値よりも小さいか、または、性能値が所定の性能閾値よりも小さい場合、新たな教師あり機械学習モデルを選択するステップも含む、項2に記載の方法。
4.性能値は、速度値、予測品質値、サイクル数を含む群から選択される、項2に記載の方法。
5.Fスコア、再現率および精度または正確度あるいはその両方を使用して予測品質値を決定するステップも含む、項4に記載の方法。
6.公平性値は、アルゴリズム・バイアス、サンプル・バイアス、偏見バイアスまたは測定バイアスに関して決定される、項1ないし5のいずれかに記載の方法。
7.報酬関数は、強化学習サイクルの構成要素である、項1ないし6のいずれかに記載の方法。
8.強化学習サイクルを制御するために強化エージェントを実行するステップも含む、項7に記載の方法。
9.教師あり機械学習モデルは、ニューラル・ネットワーク、ロジスティック回帰モデル、ランダム・フォレスト・モデル、サポート・ベクタ・マシンのモデル、および決定木モデルを含む群から選択される、項1ないし8のいずれかに記載の方法。
10.相反する目的関数は、性能指標、精密性指標または公平性指標を含む群から選択される少なくとも2つを含む、項1ないし9のいずれかに記載の方法。
11.公平性値は、保護される属性の値のみが異なるサンプル・データ間の平均相対差によって決定される、項1ないし10のいずれかに記載の方法。
12.公平性値が所定の性能閾値よりも小さいという判定を受けて、
ハイパーパラメータを変更することであって、ハイパーパラメータは、教師あり機械学習モデルのタイプ、教師あり機械学習モデルの構成、前処理ステップもしくは後処理ステップまたはその両方に関係する、ハイパーパラメータを変更すること、あるいは、教師あり機械学習モデルのパラメータを変更することによって、教師あり機械学習モデルを修正するステップも含む、項2ないし11に記載の方法。
13.教師あり機械学習モデルにおける公平性を改善し、差別的バイアスを低減するための公平性改善システムであって、
教師あり機械学習モデルを強化学習メタ・モデルにリンクさせるように適合されているリンク構成要素と、
教師あり機械学習モデルのハイパーパラメータおよびパラメータのリストを選択するように適合されている選択ユニットと、
複数の相反する目的関数に基づいて報酬関数を計算することによって、強化学習メタ・モデルに関係する強化学習エンジンによって教師あり機械学習モデルのハイパーパラメータおよびパラメータのリストのハイパーパラメータ値およびパラメータ値を調整することによって、教師あり機械学習モデルの少なくとも1つの態様を制御するように適合されているコントローラと、
教師あり機械学習モデルの公平性値を改善するために、選択ユニットおよびコントローラを反復的にトリガするように適合されている反復ユニットとを備える、システム。
14.公平性値が所定の公平性閾値よりも大きく、かつ、性能値が所定の性能閾値よりも大きい場合に、反復を中断するステップも含む、項13に記載のシステム。
15.所定数の反復後に、公平性値が所定の公平性閾値よりも小さいか、または、性能値が所定の性能閾値よりも小さい場合、新たな教師あり機械学習モデルを選択するステップも含む、項14に記載のシステム。
16.性能値は、速度値、予測品質値、サイクル数を含む群から選択される、項13に記載のシステム。
17.Fスコア、再現率および精度または正確度あるいはその両方を使用して予測品質値を決定するように適合されている決定ユニットも備える、項16に記載のシステム。
18.公平性値は、アルゴリズム・バイアス、サンプル・バイアス、偏見バイアスまたは測定バイアスに関して決定される、項13ないし17のいずれかに記載のシステム。
19.報酬関数は、強化学習サイクルの構成要素である、項13ないし18のいずれかに記載のシステム。
20.強化学習サイクルを制御するための強化エージェント・システムも備える、項19に記載のシステム。
21.教師あり機械学習モデルは、ニューラル・ネットワーク、ロジスティック回帰モデル、ランダム・フォレスト・モデル、サポート・ベクタ・マシンのモデル、および決定木モデルを含む群から選択される、項13ないし20のいずれかに記載のシステム。
22.相反する目的関数は、性能指標、精密性指標または公平性指標を含む群から選択される少なくとも2つを含む、項13ないし21のいずれかに記載のシステム。
23.公平性値は、保護される属性の値のみが異なるサンプル・データ間の平均相対差によって決定される、項13ないし22のいずれかに記載のシステム。
24.反復ユニットは、
公平性値が所定の性能閾値よりも小さいという判定を受けて、トレーニング・データセットの1つの特徴が最大の不平衡を有する、使用されているトレーニング・データセット内の寸法を決定し、決定されている寸法が、寸法値+所定のデルタ値のすべての変形例について等しい複数のデータ・ベクトルを有する、使用されているトレーニング・データセットのサブセットを選択するように適合されている、項14ないし23のいずれかに記載のシステム。
25.教師あり機械学習モデルにおいて公平性を改善するためのコンピュータ・プログラム製品であって、プログラム命令を具現化されているコンピュータ可読記憶媒体を備え、プログラム命令は、1つまたは複数のコンピューティング・システムまたはコントローラによって、1つまたは複数のコンピューティング・システムに、
教師あり機械学習モデルを強化学習メタ・モデルにリンクさせるステップと、
教師あり機械学習モデルのハイパーパラメータおよびパラメータのリストを選択するステップと、
複数の相反する目的関数に基づいて報酬関数を計算することによって、教師あり機械学習モデルのハイパーパラメータおよびパラメータのリストのハイパーパラメータ値およびパラメータ値を調整することによって、教師あり機械学習モデルの少なくとも1つの態様を制御するステップと、
教師あり機械学習モデルの公平性値を改善するために、選択するステップおよび制御するステップを反復的に繰り返すステップとを行わせるように実行可能である、コンピュータ・プログラム製品。
Claims (20)
- コンピュータ実施方法であって、
複数のパラメータ値と、複数のハイパーパラメータ値と、セグメント化された関連するサブグループに関する公平性を反映する初期公平性値とを含む機械学習モデル(MLM)の初期バージョンを受信するステップと、
前記MLMの暫定バージョンを作成するために、前記MLMの前記初期バージョンの前記パラメータ値のうちの少なくとも一部または前記ハイパーパラメータ値のうちの少なくとも一部あるいはその両方を調整するステップと、
前記MLMの前記暫定バージョンの公平性値を決定するステップであって、
複数の公平性関連目標値と前記複数の公平性関連目標値を反映する報酬関数とを定義する強化学習メタ・モデル(RLMM)を受信することと、
前記MLMの前記暫定バージョンを動作させることと、
前記MLMの前記暫定バージョンの前記動作中に、前記RLMMによって、前記報酬関数に基づいて報酬値を計算することと、
前記報酬値に基づいて前記MLMの前記暫定バージョンの暫定公平性値を決定することとを含む動作によって、決定するステップと、
前記暫定公平性値が前記初期公平性値よりも大きいことを決定するステップと、
前記暫定公平性値が前記初期公平性値よりも大きいという前記決定に応答して、前記MLMの前記初期バージョンを前記MLMの前記暫定バージョンに置き換え、前記初期公平性値を前記暫定公平性値に置き換えるステップとを含む、コンピュータ実施方法。 - 前記初期公平性値が所定の閾値を超えるまで、前記動作を反復的に繰り返すステップをさらに含む、請求項1に記載のコンピュータ実施方法。
- 前記初期MLMは教師ありMLMである、請求項1または2に記載のコンピュータ実施方法。
- 前記公平性関連目標値は、性別、年齢、国籍、宗教的信念、民族性および指向のうちの少なくとも1つを含む、請求項1ないし3のいずれか一項に記載のコンピュータ実施方法。
- 構成および読み出しに基づいて前記初期MLMを前記強化学習メタ・モデルにリンクさせるステップをさらに含む、請求項1ないし4のいずれか一項に記載のコンピュータ実施方法。
- 前記複数のパラメータ値は、以下のパラメータ・タイプ、すなわち、重み付け係数および活性化関数変数のうちの少なくとも1つの値を含む、請求項1ないし5のいずれか一項に記載のコンピュータ実施方法。
- 前記複数のハイパーパラメータ値は、以下のハイパーパラメータ・タイプ、すなわち、活性化関数のタイプ、層あたりのノードの数、ニューラル・ネットワークの層の数および機械学習モデルのうちの少なくとも1つの値を含む、請求項1ないし6のいずれか一項に記載のコンピュータ実施方法。
- コンピュータ・プログラム製品であって、
1つまたは複数の非一過性コンピュータ可読記憶媒体、および、前記1つまたは複数の非一過性コンピュータ可読記憶媒体に記憶されているプログラム命令を備え、前記プログラム命令は、
複数のパラメータ値と、複数のハイパーパラメータ値と、セグメント化された関連するサブグループに関する公平性を反映する初期公平性値とを含む機械学習モデル(MLM)の初期バージョンを受信するためのプログラム命令と、
前記MLMの暫定バージョンを作成するために、前記MLMの前記初期バージョンの前記パラメータ値のうちの少なくとも一部または前記ハイパーパラメータ値のうちの少なくとも一部あるいはその両方を調整するためのプログラム命令と、
前記MLMの前記暫定バージョンの公平性値を決定するためのプログラム命令であって、
複数の公平性関連目標値と前記複数の公平性関連目標値を反映する報酬関数とを定義する強化学習メタ・モデル(RLMM)を受信するためのプログラム命令と、
前記MLMの前記暫定バージョンを動作させるためのプログラム命令と、
前記MLMの前記暫定バージョンの前記動作中に、前記RLMMによって、前記報酬関数に基づいて報酬値を計算するためのプログラム命令と、
前記報酬値に基づいて前記MLMの前記暫定バージョンの暫定公平性値を決定するためのプログラム命令とを含む動作によって、決定するためのプログラム命令と、
前記暫定公平性値が前記初期公平性値よりも大きいことを決定するためのプログラム命令と、
前記暫定公平性値が前記初期公平性値よりも大きいという前記決定に応答して、前記MLMの前記初期バージョンを前記MLMの前記暫定バージョンに置き換え、前記初期公平性値を前記暫定公平性値に置き換えるためのプログラム命令とを含む、コンピュータ・プログラム製品。 - 前記初期公平性値が所定の閾値を超えるまで、前記動作を反復的に繰り返すためのプログラム命令をさらに含む、請求項8に記載のコンピュータ・プログラム製品。
- 前記初期MLMは教師ありMLMである、請求項8または9に記載のコンピュータ・プログラム製品。
- 前記公平性関連目標値は、性別、年齢、国籍、宗教的信念、民族性および指向のうちの少なくとも1つを含む、請求項8ないし10のいずれか一項に記載のコンピュータ・プログラム製品。
- 構成および読み出しに基づいて前記初期MLMを前記強化学習メタ・モデルにリンクさせるためのプログラム命令をさらに含む、請求項8ないし11のいずれか一項に記載のコンピュータ・プログラム製品。
- 前記複数のパラメータ値は、以下のパラメータ・タイプ、すなわち、重み付け係数および活性化関数変数のうちの少なくとも1つの値を含む、請求項8ないし12のいずれか一項に記載のコンピュータ・プログラム製品。
- 前記複数のハイパーパラメータ値は、以下のハイパーパラメータ・タイプ、すなわち、活性化関数のタイプ、層あたりのノードの数、ニューラル・ネットワークの層の数および機械学習モデルのうちの少なくとも1つの値を含む、請求項8ないし13のいずれか一項に記載のコンピュータ・プログラム製品。
- コンピュータ・システムであって、
1つまたは複数のコンピュータ・プロセッサと、
1つまたは複数のコンピュータ可読記憶媒体と、
前記1つまたは複数のコンピュータ・プロセッサのうちの少なくとも1つによって実行するための、前記1つまたは複数のコンピュータ可読記憶媒体に記憶されているプログラム命令とを備え、前記プログラム命令は、
複数のパラメータ値と、複数のハイパーパラメータ値と、セグメント化された関連するサブグループに関する公平性を反映する初期公平性値とを含む機械学習モデル(MLM)の初期バージョンを受信するためのプログラム命令と、
前記MLMの暫定バージョンを作成するために、前記MLMの前記初期バージョンの前記パラメータ値のうちの少なくとも一部または前記ハイパーパラメータ値のうちの少なくとも一部あるいはその両方を調整するためのプログラム命令と、
前記MLMの前記暫定バージョンの公平性値を決定するためのプログラム命令であって、
複数の公平性関連目標値と前記複数の公平性関連目標値を反映する報酬関数とを定義する強化学習メタ・モデル(RLMM)を受信するためのプログラム命令と、
前記MLMの前記暫定バージョンを動作させるためのプログラム命令と、
前記MLMの前記暫定バージョンの前記動作中に、前記RLMMによって、前記報酬関数に基づいて報酬値を計算するためのプログラム命令と、
前記報酬値に基づいて前記MLMの前記暫定バージョンの暫定公平性値を決定するためのプログラム命令とを含む動作によって、決定するためのプログラム命令と、
前記暫定公平性値が前記初期公平性値よりも大きいことを決定するためのプログラム命令と、
前記暫定公平性値が前記初期公平性値よりも大きいという前記決定に応答して、前記MLMの前記初期バージョンを前記MLMの前記暫定バージョンに置き換え、前記初期公平性値を前記暫定公平性値に置き換えるためのプログラム命令とを含む、コンピュータ・システム。 - 前記初期公平性値が所定の閾値を超えるまで、前記動作を反復的に繰り返すためのプログラム命令をさらに含む、請求項15に記載のコンピュータ・システム。
- 前記公平性関連目標値は、性別、年齢、国籍、宗教的信念、民族性および指向のうちの少なくとも1つを含む、請求項15または16に記載のコンピュータ・システム。
- 構成および読み出しに基づいて前記初期MLMを前記強化学習メタ・モデルにリンクさせるためのプログラム命令をさらに含む、請求項15ないし17のいずれか一項に記載のコンピュータ・システム。
- 前記複数のパラメータ値は、以下のパラメータ・タイプ、すなわち、重み付け係数および活性化関数変数のうちの少なくとも1つの値を含む、請求項15ないし18のいずれか一項に記載のコンピュータ・システム。
- 前記複数のハイパーパラメータ値は、以下のハイパーパラメータ・タイプ、すなわち、活性化関数のタイプ、層あたりのノードの数、ニューラル・ネットワークの層の数および機械学習モデルのうちの少なくとも1つの値を含む、請求項15ないし19のいずれか一項に記載のコンピュータ・システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/377,727 US20200320428A1 (en) | 2019-04-08 | 2019-04-08 | Fairness improvement through reinforcement learning |
US16/377,727 | 2019-04-08 | ||
PCT/IB2020/052465 WO2020208444A1 (en) | 2019-04-08 | 2020-03-18 | Fairness improvement through reinforcement learning |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022527536A true JP2022527536A (ja) | 2022-06-02 |
JPWO2020208444A5 JPWO2020208444A5 (ja) | 2022-08-18 |
Family
ID=72663093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021558964A Pending JP2022527536A (ja) | 2019-04-08 | 2020-03-18 | 強化学習を通じた公平性の改善 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20200320428A1 (ja) |
JP (1) | JP2022527536A (ja) |
CN (1) | CN113692594A (ja) |
DE (1) | DE112020000537T5 (ja) |
GB (1) | GB2597406A (ja) |
WO (1) | WO2020208444A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11984199B2 (en) * | 2019-08-02 | 2024-05-14 | Kpn Innovations, Llc | Methods and systems for generating compatible substance instruction sets using artificial intelligence |
US11636386B2 (en) * | 2019-11-21 | 2023-04-25 | International Business Machines Corporation | Determining data representative of bias within a model |
US11556826B2 (en) * | 2020-03-20 | 2023-01-17 | Adobe Inc. | Generating hyper-parameters for machine learning models using modified Bayesian optimization based on accuracy and training efficiency |
US11551178B2 (en) * | 2020-05-14 | 2023-01-10 | Wells Fargo Bank, N.A. | Apparatuses and methods for regulation offending model prevention |
US12002258B2 (en) * | 2020-06-03 | 2024-06-04 | Discover Financial Services | System and method for mitigating bias in classification scores generated by machine learning models |
CN112163677B (zh) * | 2020-10-14 | 2023-09-19 | 杭州海康威视数字技术股份有限公司 | 应用机器学习模型的方法、装置及设备 |
CN112257848B (zh) * | 2020-10-22 | 2024-04-30 | 北京灵汐科技有限公司 | 确定逻辑核布局的方法、模型训练方法、电子设备、介质 |
WO2022115402A1 (en) * | 2020-11-27 | 2022-06-02 | Amazon Technologies, Inc. | Staged bias measurements in machine learning pipelines |
CN112416602B (zh) * | 2020-12-10 | 2022-09-16 | 清华大学 | 一种分布式数据流资源弹性伸缩增强插件及增强方法 |
CN112905465B (zh) * | 2021-02-09 | 2022-07-22 | 中国科学院软件研究所 | 一种基于深度强化学习的机器学习模型黑盒公平性测试方法和系统 |
US20220391683A1 (en) * | 2021-06-07 | 2022-12-08 | International Business Machines Corporation | Bias reduction during artifical intelligence module training |
US11888544B2 (en) * | 2021-06-14 | 2024-01-30 | Google Llc | Selection of physics-specific model for determination of characteristics of radio frequency signal propagation |
US20230351172A1 (en) * | 2022-04-29 | 2023-11-02 | Intuit Inc. | Supervised machine learning method for matching unsupervised data |
CN118175048A (zh) * | 2022-12-09 | 2024-06-11 | 维沃移动通信有限公司 | 模型监督触发方法、装置、ue、网络侧设备、可读存储介质及通信系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9008840B1 (en) | 2013-04-19 | 2015-04-14 | Brain Corporation | Apparatus and methods for reinforcement-guided supervised learning |
US10839302B2 (en) | 2015-11-24 | 2020-11-17 | The Research Foundation For The State University Of New York | Approximate value iteration with complex returns by bounding |
US11176487B2 (en) * | 2017-09-28 | 2021-11-16 | Oracle International Corporation | Gradient-based auto-tuning for machine learning and deep learning models |
CN109242105B (zh) * | 2018-08-17 | 2024-03-15 | 第四范式(北京)技术有限公司 | 代码优化方法、装置、设备及介质 |
-
2019
- 2019-04-08 US US16/377,727 patent/US20200320428A1/en not_active Abandoned
-
2020
- 2020-03-18 CN CN202080027018.4A patent/CN113692594A/zh active Pending
- 2020-03-18 WO PCT/IB2020/052465 patent/WO2020208444A1/en active Application Filing
- 2020-03-18 JP JP2021558964A patent/JP2022527536A/ja active Pending
- 2020-03-18 DE DE112020000537.2T patent/DE112020000537T5/de active Pending
- 2020-03-18 GB GB2115858.9A patent/GB2597406A/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US20200320428A1 (en) | 2020-10-08 |
DE112020000537T5 (de) | 2021-10-21 |
WO2020208444A1 (en) | 2020-10-15 |
CN113692594A (zh) | 2021-11-23 |
GB2597406A (en) | 2022-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022527536A (ja) | 強化学習を通じた公平性の改善 | |
Molnar et al. | General pitfalls of model-agnostic interpretation methods for machine learning models | |
Hung et al. | Optimizing agent behavior over long time scales by transporting value | |
Alloghani et al. | Implementation of machine learning algorithms to create diabetic patient re-admission profiles | |
US20210303970A1 (en) | Processing data using multiple neural networks | |
EP3867827A1 (en) | Mini-machine learning | |
US11429899B2 (en) | Data model processing in machine learning using a reduced set of features | |
Hu et al. | The MBPEP: a deep ensemble pruning algorithm providing high quality uncertainty prediction | |
US11934416B2 (en) | Task and process mining by robotic process automations across a computing environment | |
US20210374544A1 (en) | Leveraging lagging gradients in machine-learning model training | |
US20240193486A1 (en) | Accelerated machine learning | |
JP2023052555A (ja) | 対話型機械学習 | |
Welchowski et al. | A framework for parameter estimation and model selection in kernel deep stacking networks | |
Moran et al. | Curious instance selection | |
AlShourbaji et al. | An efficient churn prediction model using gradient boosting machine and metaheuristic optimization | |
Li | Application of Machine learning and data mining in Medicine: Opportunities and considerations | |
Tiwari | A hybrid feature selection method using an improved binary butterfly optimization algorithm and adaptive β–hill climbing | |
US11468352B2 (en) | Method and system for predictive modeling of geographic income distribution | |
US20240029088A1 (en) | System for customer churn prediction and prevention | |
US20230036737A1 (en) | Determining available memory on a mobile platform | |
US20240152440A1 (en) | Game performance prediction across a device ecosystem | |
US20230316041A1 (en) | Modified deep learning models with decision tree layers | |
US20230138020A1 (en) | Evolutionary algorithm analytics | |
US20240054334A1 (en) | Training a neural network prediction model for survival analysis | |
US20240028902A1 (en) | Learning apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220808 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220824 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230829 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240319 |