WO2023188256A1

WO2023188256A1 - モデル学習装置、秘密連合学習装置、それらの方法、およびプログラム

Info

Publication number: WO2023188256A1
Application number: PCT/JP2022/016500
Authority: WO
Inventors: 一凡張; 玄武諸橋; 匠深見
Original assignee: 日本電信電話株式会社
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2023-10-05

Abstract

モデル学習装置は、集約モデルを特定する情報または集約モデルを特定する情報の秘匿情報を秘密連合学習装置から得、ローカル学習データを用いた機械学習によって集約モデルを更新してワーカーモデルを得、それを特定する情報の秘匿情報を得て秘密連合学習装置に提供する。秘密連合学習装置は、複数のモデル学習装置から複数のワーカーモデルを特定する情報の秘匿情報を得、それらを用いた秘密計算によって、当該複数のワーカーモデルを得ることなく、当該複数のワーカーモデルを集約した集約モデルを特定する情報の秘匿情報を得て複数のモデル学習装置に提供する。

Description

モデル学習装置、秘密連合学習装置、それらの方法、およびプログラム

　本発明は、機械学習技術に関し、特に連合学習技術に関する。

　学習データを集約せずに分散した状態で機械学習を行う連合学習（Federated learning）が知られている（例えば、非特許文献１等参照）。連合学習では、複数のモデル学習装置が、自ら保持する学習データを用いた機械学習を行ってワーカーモデル（ローカルモデル）を生成し、生成したワーカーモデルを連合学習装置に送信する。連合学習装置は、複数のモデル学習装置から送られたワーカーモデルを集約した集約モデル（グローバルモデル）を生成し、生成した集約モデルを複数のモデル学習装置に送信する。集約モデルを受け取った複数のモデル学習装置は、自ら保持する学習データを用いた機械学習によって当該集約モデルを更新して新たなワーカーモデルを生成し、生成したワーカーモデルを連合学習装置に送信する。このような処理を繰り返すことにより、各モデル学習装置は、自ら保持する学習データを外部に渡すことなく、複数のモデル学習装置に保持された学習データが機械学習に反映された集約モデルを得ることができる。

C. He, S. Li, J. So, X. Zeng, M. Zhang, etc, "FedML: A Research Library and Benchmark for Federated Machine Learning", [online], 2020年1月27日, arXiv: 2007.13518, [2022年2月17日検索], インターネット＜https://arxiv.org/abs/2007.13518＞

　しかしながら、従来の連合学習では、連合学習装置が各モデル学習装置から平文のワーカーモデルを受け取る。そのため、連合学習装置は、送信した集約モデルと受け取ったワーカーモデルとの違いに基づいて、各モデル学習装置が保持する学習データの傾向を知ることができる。

　本発明はこのような点に鑑みてなされたものであり、連合学習の安全性を向上させることを目的とする。

　モデル学習装置は、集約モデルを特定する情報または集約モデルを特定する情報の秘匿情報を秘密連合学習装置から得、記憶部に格納されたローカル学習データを用いた機械学習によって集約モデルを更新してワーカーモデルを得、当該ワーカーモデルを特定する情報の秘匿情報を得、当該ワーカーモデルを特定する情報の秘匿情報を秘密連合学習装置に提供する。

　秘密連合学習装置は、複数のモデル学習装置から複数のワーカーモデルを特定する情報の秘匿情報を得、当該複数のワーカーモデルを特定する情報の秘匿情報を用いた秘密計算によって、当該複数のワーカーモデルを得ることなく、当該複数のワーカーモデルを集約した集約モデルを特定する情報の秘匿情報を得、当該集約モデルを特定する情報または集約モデルを特定する情報の秘匿情報を複数のモデル学習装置に提供する。

　これにより、連合学習の安全性を向上させることができる。

図１は、第１，２実施形態の連合学習システムの構成を例示したブロック図である。図２は、第１，２実施形態のモデル学習装置の構成を例示したブロック図である。図３は、第１，３，４実施形態の秘密連合学習装置の構成を例示したブロック図である。図４は、第２，３，４実施形態の秘密連合学習装置の構成を例示したブロック図である。図５は、第３，４実施形態の連合学習システムの構成を例示したブロック図である。図６は、第３，４実施形態のモデル学習装置の構成を例示したブロック図である。図７は、実施形態のハードウェア構成を例示したブロック図である。

　以下、図面を参照して本発明の実施形態を説明する。
　「第１実施形態」
　本実施形態では、連合学習装置が持つ機能のうち、ワーカーモデル（ローカルモデル）の収集および集約モデルの生成を秘匿状態で実行する。

　＜構成＞
　図１に例示するように、本実施形態の連合学習システム１は、モデル学習を行うＮ個のモデル学習装置１１－１，…，１１－Ｎ、秘密計算によって連合学習を行うＭ個の秘密連合学習装置１２－１，…，１２－Ｍ、および連合学習を制御する制御装置１３を有する。秘密計算方式に限定はない。例えば、この秘密計算方式は、秘密分散されたシャアを用いて秘密計算を行うマルチパーティ計算方式であってもよいし、準同型暗号を用いて秘密計算を行う準同型暗号方式であってもよい。Ｎは１以上の整数であり、例えば、Ｎは２以上の整数である。Ｍは１以上の整数であり、例えば、Ｍは２以上の整数である。ただし、秘密計算方式がマルチパーティ計算方式である場合、Ｍは２以上の整数である。秘密計算方式が準同型暗号方式である場合、Ｍは１以上の整数であり、例えばＭ＝１である。

　図２に例示するように、本実施形態のモデル学習装置１１－ｎは、記憶部１１１－ｎ、取得部１１２－ｎ、学習部１１３－ｎ、秘匿部１１４－ｎ、提供部１１５－ｎ、および制御部１１６－ｎを有する。モデル学習装置１１－ｎは、制御部１１６－ｎの制御に基づいて各処理を実行し、入力情報及び各処理で得られた情報は記憶部１１１－ｎに格納され、必要に応じて読み出されて使用される。ここでｎは正整数であり、ｎ＝１，…，Ｎである。特に断りのない限り、ｎに関する構成および処理は、すべてのｎ＝１，…，Ｎについて同じである。ただし、扱われるデータ（情報）の内容は、ｎの値に応じて異なる場合がある。

　図３に例示するように、本実施形態の秘密連合学習装置１２－ｍは、取得部１２１－ｍ、秘密集約処理部１２２－ｍ、提供部１２３－ｍ、制御部１２６－ｍ、および記憶部１２７－ｍを有する。秘密連合学習装置１２－ｍは、制御部１２６－ｍの制御に基づいて各処理を実行し、入力情報及び各処理で得られた情報は記憶部１２７－ｍに格納され、必要に応じて読み出されて使用される。ここでｍは正整数であり、ｍ＝１，…，Ｍである。特に断りのない限り、ｍに関する構成および処理は、すべてのｍ＝１，…，Ｍについて同じである。ただし、扱われるデータ（情報）の内容は、ｍの値に応じて異なる場合がある。

　＜事前処理＞
　モデル学習装置１１－ｎの記憶部１１１－ｎには、各モデル学習装置１１－ｎのローカル学習データＤ－ｎが格納されている。ローカル学習データＤ－ｎは、機械学習用の学習データであり、教師あり学習用の学習データであってもよいし、教師なし学習用の学習データであってもよい。また、ローカル学習データＤ－ｎは更新されていってもよい。また、使用される秘密計算方式が準同型暗号方式である場合、モデル学習装置１１－ｎの記憶部１１１－ｎには、暗号化鍵と復号鍵とが格納される。

　＜学習処理＞
　以下に本実施形態の学習処理を例示する。
　各モデル学習装置１１－ｎ（図２）の学習部１１３－ｎは、記憶部１１１－ｎに格納されたローカル学習データＤ－ｎを読み込み、当該ローカル学習データＤ－ｎを用いた機械学習によって最新の集約モデルを更新してワーカーモデルを得、当該ワーカーモデルを特定する情報ＷＭ－ｎ（例えば、モデルパラメータ群）を出力する。モデル学習装置１１－ｎが集約モデルを未だ得ていない場合、初期設定された機械学習モデルが「最新の集約モデル」である。制御装置１３から初期設定された機械学習モデルが与えられてもよい。初期設定されたモデルとは、例えば、初期のモデルパラメータ群が設定された機械学習モデルである。モデル学習装置１１－ｎが後述のように集約モデルを特定する情報ＧＭが得ている場合、当該情報ＧＭで特定される集約モデルのうち、最新のものが「最新の集約モデル」である。後者の場合、学習部１１３－ｎは、記憶部１１１－ｎから読み込んだ情報ＧＭに基づいて最新の集約モデルを特定する。なお、集約モデルおよびワーカーモデルは、公知の機械学習モデルである。集約モデルおよびワーカーモデルに限定はなく、例えば、ディープラーニング方式に基づくモデルであってもよいし、隠れマルコフモデル方式に基づくモデルであってもよいし、サポートベクターマシーン方式に基づくモデルであってもよいし、線形予測に基づくモデルであってもよい。ただし、連合学習システム１で扱われるすべての集約モデルおよびワーカーモデルは、同一方式に基づくモデルである。ワーカーモデルを特定する情報ＷＭ－ｎは、秘匿部１１４－ｎに送られる（ステップＳ１１３－ｎ）。

　秘匿部１１４－ｎには、ワーカーモデルを特定する情報ＷＭ－ｎが入力される。秘匿部１１４－ｎは、ワーカーモデルを特定する情報ＷＭ－ｎを、前述の秘密計算が可能な方式で秘匿して、ワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報［ＷＭ－ｎ］を得て出力する。例えば、前述の秘密計算方式がマルチパーティ計算方式である場合、秘匿部１１４－ｎは、情報ＷＭ－ｎをＭ個に秘密分散してＭ個のシェア［ＷＭ－ｎ］_１，…，［ＷＭ－ｎ］_Ｍを得、これらを秘匿情報［ＷＭ－ｎ］として出力する。例えば、前述の秘密計算方式が準同型暗号方式である場合、秘匿部１１４－ｎは、記憶部１１１－ｎから読み込んだ暗号化鍵を用い、準同型暗号方式に則って情報ＷＭ－ｎを暗号化してＭ個（例えば、１個）の暗号文［ＷＭ－ｎ］_１，…，［ＷＭ－ｎ］_Ｍを得、当該暗号文［ＷＭ－ｎ］_１，…，［ＷＭ－ｎ］_Ｍを秘匿情報［ＷＭ－ｎ］として出力する。秘匿情報［ＷＭ－ｎ］＝｛［ＷＭ－ｎ］_１，…，［ＷＭ－ｎ］_Ｍ｝は、提供部１１５－ｎに送られる（ステップＳ１１４－ｎ）。

　提供部１１５－ｎには、ワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報［ＷＭ－ｎ］＝｛［ＷＭ－ｎ］_１，…，［ＷＭ－ｎ］_Ｍ｝が入力される。提供部１１５－ｎは、当該ワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報［ＷＭ－ｎ］_ｍを秘密連合学習装置１２－ｍ（図３）に送信する（提供する）（ただし、ｍ＝１，…，Ｍ）。さらに提供部１１５－ｎは、モデル学習装置１１－ｎが秘密連合学習装置１２－ｍに秘匿情報［ＷＭ－ｎ］_ｍを送信した旨（モデル学習装置１１－ｎがワーカーモデルの学習を終了し、当該ワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報［ＷＭ－ｎ］_ｍを秘密連合学習装置１２－ｍに送信した旨）の同期情報を、制御装置１３に送る（ステップＳ１１５－ｎ）。

　秘密連合学習装置１２－ｍ（図３）の取得部１２１－ｍは、モデル学習装置１１－ｎから送られたワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報［ＷＭ－ｎ］_ｍを受信し、当該秘匿情報［ＷＭ－ｎ］_ｍを記憶部１２７－ｍに格納する。すなわち、取得部１２１－ｍは、複数のモデル学習装置１１－ｎから複数のワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報［ＷＭ－ｎ］_ｍを得て記憶部１２７－ｍに格納する（ステップＳ１２１－ｍ）。

　制御装置１３は、同期情報に基づき、すべてのモデル学習装置１１－１，…，１１－Ｎがすべての秘密連合学習装置１２－１，…，１２－Ｍに秘匿情報［ＷＭ－ｎ］_１，…，［ＷＭ－ｎ］_Ｍを送信したか否かを判定する（ステップＳ１３１）。ここで、すべてのモデル学習装置１１－ｎ（ただし、ｎ＝１，…，Ｎ）がすべての秘密連合学習装置１２－１，…，１２－Ｍに秘匿情報［ＷＭ－ｎ］_１，…，［ＷＭ－ｎ］_Ｍを送信していないと判定され、かつ、基準時点から所定時間が経過していない（タイムアウトしていない）と判定された場合、制御装置１３はある間隔ごとにステップＳ１３１の判定を行う。一方、すべてのモデル学習装置１１－ｎ（ただし、ｎ＝１，…，Ｎ）がすべての秘密連合学習装置１２－１，…，１２－Ｍに秘匿情報［ＷＭ－ｎ］_１，…，［ＷＭ－ｎ］_Ｍを送信したと判定されるか、または、基準時点から所定時間が経過した（タイムアウトした）と判定された場合、制御装置１３は、秘密集約処理の開始を指示する旨の指令を秘密連合学習装置１２－１，…，１２－Ｍに送る。なお、上述のタイムアウトの基準時点はどのようなものであってもよく、例えば、前回の秘密集約処理の開始時または終了時を基準時点としてもよいし、秘密集約処理がまだ実行されていないのであれば学習処理の開始時を基準時点としてもよい（ステップＳ１３２）。

　秘密集約処理の開始を指示する旨の指令は、秘密連合学習装置１２－ｍ（ただし、ｍ＝１，…，Ｍ）（図３）の取得部１２１－ｍで受信され、制御部１２６－ｍに入力される。秘密集約処理の開始を指示する旨の指令を受け取った制御部１２６－ｍは、秘密集約処理部１２２－ｍに秘密集約処理の開始を指示する。これを受けた秘密集約処理部１２２－ｍは、記憶部１２７－ｍから複数の秘匿情報［ＷＭ－ｎ］（ただし、ｎ∈｛１，…，Ｎ｝）（複数のワーカーモデルを特定する情報の秘匿情報）を読み込み、これらを用いた秘密計算によって、当該複数のワーカーモデルを得ることなく、当該複数のワーカーモデルを集約した集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍを得て出力する（秘密集約処理）。例えば、ワーカーモデルを特定する情報ＷＭ－ｎが当該ワーカーモデルのモデルパラメータ群｛ｐ_１（ｎ），…，ｐ_Ｋ（ｎ）｝である場合、｛ｎ_１，…，ｎ_ｍａｘ｝⊆｛１，…，Ｎ｝についてのモデルパラメータ群｛ｐ_１（ｎ_１），…，ｐ_Ｋ（ｎ_１）｝，…，｛ｐ_１（ｎ_ｍａｘ），…，ｐ_Ｋ（ｎ_ｍａｘ）｝を集約したモデルパラメータ群｛ｐ_１，…，ｐ_Ｋ｝が集約モデルを特定する情報ＧＭとなる。例えば、ｐ_ｋはｐ_ｋ（ｎ_１），…，ｐ_ｋ（ｎ_ｍａｘ）の重み付き線形結合値や平均値などの関数値である。ただし、ｋはモデルパラメータを識別するインデックスｋ＝１，…，Ｋであり、Ｋは正整数である。秘密集約処理部１２２－ｍは、秘密計算によって、このようなワーカーモデルを特定する情報ＷＭ－ｎや集約モデルを特定する情報ＧＭを復元することなく、集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍを得て出力する。集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍは提供部１２３－ｍに送られる（ステップＳ１２２－ｍ）。

　提供部１２３－ｍには秘匿情報［ＧＭ］_ｍが入力される。提供部１２３－ｍは、制御装置１３を介して、秘匿情報［ＧＭ］_ｍを複数のモデル学習装置１１－ｎ（ただし、ｎ∈｛１，…，Ｎ｝）に送信する（提供する）。例えば、提供部１２３－ｍは、制御装置１３を介して、秘匿情報［ＧＭ］_ｍをすべてのモデル学習装置１１－１，…，１１－Ｎに送信する（提供する）（ステップＳ１２３－ｍ）。

　秘匿情報［ＧＭ］_ｍ（ただし、ｍ∈｛１，…，Ｍ｝）が送られたモデル学習装置１１－ｎ（図２）の取得部１１２－ｎは、当該秘匿情報［ＧＭ］_ｍ（秘密連合学習装置１２－ｍから提供された集約モデルを特定する情報ＧＭの秘匿情報）を受け取る。取得部１１２－ｎは、秘匿情報［ＧＭ］_ｍを復元して集約モデルを特定する情報ＧＭを得る。例えば、秘密計算方式がマルチパーティ計算方式である場合、取得部１１２－ｎは、復元に必要な互いに異なる複数の秘匿情報［ＧＭ］_ｍ（１），…，［ＧＭ］_{ｍ（ｍａｘ）}（ただし、｛ｍ（１），…，ｍ（ｍａｘ）｝⊆｛１，…，Ｍ｝）から情報ＧＭを復元する。秘密計算方式が準同型暗号方式である場合、取得部１１２－ｎは、記憶部１１１－ｎから読み込んだ復号鍵を用いて秘匿情報［ＧＭ］_ｍを復号して情報ＧＭを得る。集約モデルを特定する情報ＧＭは、記憶部１１１－ｎに格納される（ステップＳ１１２－ｎ）。

　制御部１１６－ｎは、連合学習の終了条件を満たしているか否かを判定する（ステップＳ１１６－ｎ）。ここで、終了条件を満たしていない場合には処理がステップＳ１１３－ｎに戻る。この場合には、これまで述べたステップＳ１１３－ｎからステップＳ１１６－ｎまでの処理（すなわち、Ｓ１１３－ｎ，Ｓ１１４－ｎ，Ｓ１１５－ｎ，Ｓ１２１－ｍ，Ｓ１３１，Ｓ１３２，Ｓ１２２－ｍ，Ｓ１２３－ｍ，Ｓ１１２－ｎ，Ｓ１１６－ｎ）が再び実行される。一方、終了条件を満たしていた場合には、処理を終了する。なお、終了条件はどのようなものでもよい。例えば、制御装置１３が、集約モデルの更新回数、更新量、更新時間などが規定値に達したときに連合学習を終了する旨の指令をモデル学習装置１１－ｎに送信し、この指令を受け取ることが終了条件であってもよい。あるいは、制御部１１６－ｎが集約モデルの更新回数、更新量、更新時間などが規定値に達したか否かを判定し、規定値に達したことを終了条件としてもよい。

　＜本実施形態の特徴＞
　本実施形態では、複数のモデル学習装置がワーカーモデルを特定する情報の秘匿情報を秘密連合学習装置に提供し、秘密連合学習装置は当該秘匿情報を用い、複数のワーカーモデルを得ることなく、当該複数のワーカーモデルを集約した集約モデルを特定する情報の秘匿情報を得る。この場合、秘密連合学習装置は、ワーカーモデル自体を得ることができないので、ワーカーモデルと集約モデルとの違いに基づいて、各モデル学習装置が保持する学習データの傾向を知ることもできない。これにより、連合学習の安全性を向上させることができる。

　［第１実施形態の変形例１］
　制御装置１３は、同期情報に基づき、すべてのモデル学習装置１１－１，…，１１－Ｎがすべての秘密連合学習装置１２－１，…，１２－Ｍに秘匿情報［ＷＭ－ｎ］_１，…，［ＷＭ－ｎ］_Ｍを送信したか否かを判定した（ステップＳ１３１）。しかしながら、これは本発明を限定するものではない。例えば、これに代えて、あらかじめ定められた数のモデル学習装置があらかじめ定められた数の秘密連合学習装置に秘匿情報を送信したか否かが判定されてもよい。そして、あらかじめ定められた数のモデル学習装置があらかじめ定められた数の秘密連合学習装置に秘匿情報を送信していないと判定され、かつ、基準時点から所定時間が経過していないと判定された場合、制御装置１３はある間隔ごとにこの判定を行い、あらかじめ定められた数のモデル学習装置があらかじめ定められた数の秘密連合学習装置に秘匿情報を送信したと判定されるか、または、基準時点から所定時間が経過したと判定された場合、制御装置１３が、秘密集約処理の開始を指示する旨の指令を秘密連合学習装置１２－１，…，１２－Ｍに送ってもよい。あるいは、単に基準時点から所定時間が経過した場合に、制御装置１３が秘密集約処理の開始を指示する旨の指令を秘密連合学習装置１２－１，…，１２－Ｍに送ってもよい。

　［第２実施形態］
　本実施形態は、第１実施形態または第１実施形態の変形例１の変形例であり、特定の秘密連合学習装置１２－１が秘匿情報［ＧＭ］_１，…，［ＧＭ］_Mから集約モデルを特定する情報ＧＭを復元し、当該集約モデルを特定する情報ＧＭを各モデル学習装置１１－ｎに提供する形態である。以降、これまで説明した事項との相違点を中心に説明し、すでに説明した事項については同じ参照番号を用いて説明を簡略化する。

　＜構成＞
　図１に例示するように、本実施形態の連合学習システム２は、モデル学習を行うＮ個のモデル学習装置２１－１，…，２１－Ｎ、秘密計算によって連合学習を行うＭ個の秘密連合学習装置２２－１，１２－２，…，１２－Ｍ、および連合学習を制御する制御装置１３を有する。

　図２に例示するように、本実施形態のモデル学習装置２１－ｎは、記憶部１１１－ｎ、取得部２１２－ｎ、学習部１１３－ｎ、秘匿部１１４－ｎ、提供部１１５－ｎ、および制御部１１６－ｎを有する。モデル学習装置２１－ｎは、制御部１１６－ｎの制御に基づいて各処理を実行し、入力情報及び各処理で得られた情報は記憶部１１１－ｎに格納され、必要に応じて読み出されて使用される。

　図４に例示するように、本実施形態の秘密連合学習装置２２－１は、取得部１２１－１、秘密集約処理部１２２－１、提供部２２３－１、制御部１２６－１、および記憶部１２７－１を有する。秘密連合学習装置２２－１は、制御部１２６－１の制御に基づいて各処理を実行し、入力情報及び各処理で得られた情報は記憶部１２７－１に格納され、必要に応じて読み出されて使用される。秘密連合学習装置１２－２，…，１２－Ｍの構成は、第１実施形態と同じである。

　＜事前処理＞
　本実施形態の事前処理は、使用される秘密計算方式が準同型暗号方式である場合に、モデル学習装置１１－ｎの記憶部１１１－ｎではなく、秘密連合学習装置２２－１の記憶部１２７－１に復号鍵が格納される以外、第１実施形態と同じである。

　＜学習処理＞
　以下に本実施形態の学習処理を例示する。
　まず、モデル学習装置１１－ｎに代えてモデル学習装置２１－ｎが第１実施形態で説明したステップＳ１１３－ｎ，Ｓ１１４－ｎ，Ｓ１１５－ｎの処理を実行し、秘密連合学習装置１２－１に代えて秘密連合学習装置２２－１がステップＳ１２１－１の処理を実行し、秘密連合学習装置１２－ｍ’（ただし、ｍ’∈｛２，…，Ｍ｝）がステップＳ１２１－ｍ’の処理を実行し、制御装置１３がステップＳ１３１，Ｓ１３２の処理を実行し、秘密連合学習装置１２－１に代えて秘密連合学習装置２２－１がステップＳ１２２－１の処理を実行し、秘密連合学習装置１２－ｍ’（ただし、ｍ’∈｛２，…，Ｍ｝）がステップＳ１２２－ｍ’の処理を実行する。ただし、ステップＳ１２２－１では、集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_１が秘密連合学習装置１２－１の提供部１２３－１ではなく、秘密連合学習装置２２－１（図４）の提供部２２３－１に送られる。また、Ｍ≧２の場合、さらに秘密連合学習装置１２－ｍ’の提供部１２３－ｍ’（ただし、ｍ’∈｛２，…，Ｍ｝）が、秘匿情報［ＧＭ］_ｍ’を秘密連合学習装置２２－１（図４）の提供部２２３－１に送信する。これにより、秘密連合学習装置２２－１の提供部２２３－１には、秘匿情報［ＧＭ］_ｍ（ただし、ｍ∈｛１，・・，Ｍ｝）が入力される。提供部２２３－１は入力された秘匿情報［ＧＭ］_ｍを復元して集約モデルを特定する情報ＧＭを得る。例えば、秘密計算方式がマルチパーティ計算方式である場合、提供部２２３－１は、復元に必要な互いに異なる複数の秘匿情報［ＧＭ］_ｍ（１），…，［ＧＭ］_{ｍ（ｍａｘ）}（ただし、｛ｍ（１），…，ｍ（ｍａｘ）｝⊆｛１，…，Ｍ｝）から情報ＧＭを復元する。秘密計算方式が準同型暗号方式である場合、提供部２２３－１は、記憶部１２７－１から読み込んだ復号鍵を用いて秘匿情報［ＧＭ］_ｍを復号して情報ＧＭを得る。提供部２２３－１は、制御装置１３を介して、情報ＧＭを複数のモデル学習装置２」１－ｎ（ただし、ｎ∈｛１，…，Ｎ｝）に送信する（提供する）。例えば、提供部２２３－１は、制御装置１３を介して、情報ＧＭをすべてのモデル学習装置２１－１，…，２１－Ｎに送信する（提供する）（ステップＳ２２３－１）。

　情報ＧＭが送られたモデル学習装置２１－ｎ（図２）の取得部２１２－ｎは、当該情報ＧＭ（集約モデルを特定する情報）を受け取る。すなわち、取得部２１２－ｎは、集約モデルを特定する情報ＧＭを秘密連合学習装置１２－１から得る。この集約モデルを特定する情報ＧＭは、記憶部１１１－ｎに格納される（ステップＳ２１２－ｎ）。制御部１１６－ｎは、連合学習の終了条件を満たしているか否かを判定する（ステップＳ１１６－ｎ）。ここで、終了条件を満たしていない場合には処理がステップＳ１１３－ｎに戻る。この場合には、これまで述べたステップＳ１１３－ｎからステップＳ１１６－ｎまでの処理（すなわち、Ｓ１１３－ｎ，Ｓ１１４－ｎ，Ｓ１１５－ｎ，Ｓ１２１－ｍ，Ｓ１３１，Ｓ１３２，Ｓ１２２－ｍ，Ｓ２２３－１，Ｓ２１２－ｎ，Ｓ１１６－ｎ）が再び実行される。一方、終了条件を満たしていた場合には、処理を終了する。その他の事項は、第１実施形態で説明した通りである。また、第２実施形態において、第１実施形態の変形例１と同じ変形が行われてもよい。

　＜本実施形態の特徴＞
　本実施形態でも、複数のモデル学習装置がワーカーモデルを特定する情報の秘匿情報を秘密連合学習装置に提供し、秘密連合学習装置は当該秘匿情報を用い、複数のワーカーモデルを得ることなく、当該複数のワーカーモデルを集約した集約モデルを特定する情報の秘匿情報を得る。この場合、秘密連合学習装置は、ワーカーモデル自体を得ることができないので、ワーカーモデルと集約モデルとの違いに基づいて、各モデル学習装置が保持する学習データの傾向を知ることもできない。これにより、連合学習の安全性を向上させることができる。

　［第３実施形態］
　本実施形態は、第１実施形態の変形例である。第３実施形態では、モデル学習装置が、取得した集約モデルを更新して新たにワーカーモデルを得る必要があるか否かを判定する。モデル学習装置は、この必要があると判断した場合には集約モデルを更新して新たにワーカーモデルを得るが、必要がないと判断した場合には当該集約モデルを更新して新たにワーカーモデル得ることなく、待機時間経過後に秘密連合学習装置から新たな集約モデルを特定する情報の秘匿情報を取得する。さらに第３実施形態では、秘密連合学習装置が、所定のモデル学習装置からワーカーモデルを特定する情報の秘匿情報を得たか否かを判定する。秘密連合学習装置は、所定のモデル学習装置からワーカーモデルを特定する情報の秘匿情報を得たと判定された場合に、ワーカーモデルを特定する情報の秘匿情報を用いた秘密計算によって、ワーカーモデルを集約した集約モデルを特定する情報の秘匿情報を得る。これにより、制御装置１３を用いることなく、連合学習の安全性を向上させることができる。

　＜構成＞
　図５に例示するように、本実施形態の連合学習システム３は、モデル学習を行うＮ個のモデル学習装置３１－１，…，３１－Ｎ、および、秘密計算によって連合学習を行うＭ個の秘密連合学習装置３２－１，…，３２－Ｍを有する。

　図６に例示するように、本実施形態のモデル学習装置３１－ｎは、記憶部１１１－ｎ、取得部３１２－ｎ、判定部３１７－ｎ、学習部１１３－ｎ、秘匿部１１４－ｎ、提供部１１５－ｎ、および制御部１１６－ｎを有する。モデル学習装置３１－ｎは、制御部１１６－ｎの制御に基づいて各処理を実行し、入力情報及び各処理で得られた情報は記憶部１１１－ｎに格納され、必要に応じて読み出されて使用される。

　図３に例示するように、本実施形態の秘密連合学習装置３２－ｍは、取得部１２１－ｍ、判定部３２８－ｍ、秘密集約処理部３２２－ｍ、提供部１２３－ｍ、制御部１２６－ｍ、および記憶部１２７－ｍを有する。秘密連合学習装置３２－ｍは、制御部１２６－ｍの制御に基づいて各処理を実行し、入力情報及び各処理で得られた情報は記憶部１２７－ｍに格納され、必要に応じて読み出されて使用される。

　＜事前処理＞
　本実施形態の事前処理は、第１実施形態と同じである。

　＜学習処理＞
　以下に本実施形態の学習処理を例示する。
　まず、モデル学習装置１１－ｎに代えてモデル学習装置３１－ｎ（図６）が第１実施形態で説明したステップＳ１１３－ｎ，Ｓ１１４－ｎ，Ｓ１１５－ｎの処理を実行し、秘密連合学習装置１２－ｍに代えて秘密連合学習装置３２－ｍ（図３）がステップＳ１２１－ｍの処理を実行する。ただし、本実施形態では制御装置１３が設けられていないため、ステップＳ１１５－ｎにおいて、モデル学習装置３１－ｎの提供部１１５－ｎは、前述の同期情報を制御装置１３に送信しない。

　また、秘密連合学習装置３２－ｍの判定部３２８－ｍは、所定の契機で、記憶部１２７－ｍに格納された秘匿情報［ＷＭ－ｎ］_ｍを参照し、ワーカーモデルの登録が完了したか否かを判定する。例えば、判定部３２８－ｍは、定期的に当該判定を行ってもよいし、各秘匿情報［ＷＭ－ｎ］_ｍが記憶部１２７－ｍに格納されたことをトリガーとして当該判定を行ってもよい。なお、ワーカーモデルの登録が完了したとは、所定のモデル学習装置３１－ｎ_１，…，３１－ｎ_max（ただし、｛ｎ_１，…，ｎ_max｝＝｛１，…，Ｎ｝）から、新たなワーカーモデルを特定する情報の秘匿情報［ＷＭ－ｎ_１］_ｍ，…，［ＷＭ－ｎ_max］_ｍを得たことを意味する。すなわち、判定部３２８－ｍは、所定のモデル学習装置３１－ｎ_１，…，３１－ｎ_maxから、新たなワーカーモデルを特定する情報の秘匿情報［ＷＭ－ｎ_１］_ｍ，…，［ＷＭ－ｎ_max］_ｍを得たか否かを判定する。所定のモデル学習装置３１－ｎ_１，…，３１－ｎ_maxは、すべてのモデル学習装置３１－１，…，３１－Ｎ（つまり｛ｎ_１，…，ｎ_max｝＝｛１，…，Ｎ｝）であってもよいし、事前に設定された一部のモデル学習装置３１－ｎ_１，…，３１－ｎ_max（つまり｛ｎ_１，…，ｎ_max｝⊂｛１，…，Ｎ｝）であってもよい。また、新たなワーカーモデルを特定する情報の秘匿情報［ＷＭ－ｎ_１］_ｍ，…，［ＷＭ－ｎ_max］_ｍは、まだ秘密集約処理に用いられていない秘匿情報［ＷＭ－ｎ_１］_ｍ，…，［ＷＭ－ｎ_max］_ｍであってもよいし、前回の秘密集約処理の後に取得した秘匿情報［ＷＭ－ｎ_１］_ｍ，…，［ＷＭ－ｎ_max］_ｍであってもよい。ただし、秘匿情報［ＷＭ－ｎ］_ｍは秘密分散方式のシェアや準同型暗号方式の暗号文等であるため、秘匿情報［ＷＭ－ｎ］_ｍから当該秘匿情報［ＷＭ－ｎ］_ｍを提供したモデル学習装置３１－ｎを特定することができない場合もある。このような場合、判定部３２８－ｍは、記憶部１２７－ｍに格納された秘匿情報［ＷＭ－ｎ］_ｍの総データ量からワーカーモデルの登録が完了したか否かを判定してもよい。例えば、判定部３２８－ｍは、記憶部１２７－ｍに格納された秘匿情報［ＷＭ－ｎ］_ｍの総データ量が、所定のモデル学習装置３１－ｎ_１，…，３１－ｎ_maxから提供される秘匿情報［ＷＭ－ｎ_１］_ｍ，…，［ＷＭ－ｎ_max］_ｍの総データ量に一致した場合に、ワーカーモデルの登録が完了したと判定し、そうでない場合にワーカーモデルの登録が完了していないと判定してもよい。あるいは、判定部３２８－ｍは、記憶部１２７－ｍに格納された秘匿情報［ＷＭ－ｎ］_ｍに対応する総ワーカーモデル数が、所定のモデル学習装置３１－ｎ_１，…，３１－ｎ_maxの総ワーカーモデル数ｎ_maxに一致した場合に、ワーカーモデルの登録が完了したと判定し、そうでない場合にワーカーモデルの登録が完了していないと判定してもよい。例えば、ワーカーモデルを特定する情報ＷＭ－ｎがモデルパラメータ群であり、１つのワーカーモデルに含まれるモデルパラメータ数がＮ_ＭＰであり、記憶部１２７－ｍに格納された秘匿情報［ＷＭ－ｎ］_ｍの総データ量がレコード数Ｎ_Ｒである場合、秘匿情報［ＷＭ－ｎ］_ｍが提供された総ワーカーモデル数はＮ_Ｒ／Ｎ_ＭＰとなる。この場合、判定部３２８－ｍは、ｎ_max＝Ｎ_Ｒ／Ｎ_ＭＰであるときにワーカーモデルの登録が完了したと判定し、そうでない場合にワーカーモデルの登録が完了していないと判定してもよい。ここで、ワーカーモデルの登録が完了していないと判定され、かつ、基準時点から所定時間が経過していない（タイムアウトしていない）と判定された場合、判定部３２８－ｍは、所定の契機で、このワーカーモデルの登録が完了したか否かを再び判定する。例えば、判定部３２８－ｍは、所定の待機時間経過後に再び当該判定を行ってもよいし、いずれかの秘匿情報［ＷＭ－ｎ］_ｍが記憶部１２７－ｍに格納されたことをトリガーとして当該判定を再び行ってもよい。一方、ワーカーモデルの登録が完了したと判定されたか、または、基準時点から所定時間が経過した（タイムアウトした）と判定された場合、判定部３２８－ｍは秘密集約処理の開始を指示する旨の指令を制御部１２６－ｍに送る。なお、タイムアウトの基準時点の例は、第１実施形態で説明した通りである（ステップＳ３２８－ｍ）。

　秘密集約処理の開始を指示する旨の指令を受け取った制御部１２６－ｍは、秘密集約処理部３２２－ｍに秘密集約処理の開始を指示する。これを受けた秘密集約処理部３２２－ｍは、記憶部１２７－ｍから複数の秘匿情報［ＷＭ－ｎ］（ただし、ｎ∈｛１，…，Ｎ｝）（複数のワーカーモデルを特定する情報の秘匿情報）を読み込み、これらを用いた秘密計算によって、当該複数のワーカーモデルを得ることなく、当該複数のワーカーモデルを集約した集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍを得て出力する（秘密集約処理）。すなわち、秘密集約処理部３２２－ｍは、所定のモデル学習装置３１－ｎ_１，…，３１－ｎ_maxからワーカーモデルを特定する情報の秘匿情報［ＷＭ－ｎ_１］_ｍ，…，［ＷＭ－ｎ_max］_ｍを得たと判定された場合に、当該ワーカーモデルを特定する情報の秘匿情報［ＷＭ－ｎ_１］_ｍ，…，［ＷＭ－ｎ_max］_ｍを用いた秘密計算によって、当該複数のワーカーモデルを集約した集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍを得て出力する。集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍは、提供部１２３－ｍに送られる（ステップＳ３２２－ｍ）。

　モデル学習装置３１－ｎ（図６）の取得部３１２－ｎは、所定の契機で、秘密連合学習装置３２－ｍ（ただし、ｍ∈｛１，…，Ｍ｝）（図３）の提供部１２３－ｍにアクセスし、提供部１２３－ｍから集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍを取得する。取得部３１２－ｎは、取得した秘匿情報［ＧＭ］_ｍを復元して集約モデルを特定する情報ＧＭを得る。集約モデルを特定する情報ＧＭは、記憶部１１１－ｎに格納される（ステップＳ３１２－ｎ）。

　判定部３１７－ｎは、記憶部１１１－ｎに格納された情報ＧＭに対応する集約モデルを更新して新たにワーカーモデルを得る必要があるか否かを判定する。言い換えると、判定部３１７－ｎは、当該ローカル学習データＤ－ｎを用いた機械学習によって、当該情報ＧＭによって特定される最新の集約モデルを更新してワーカーモデルを得る必要があるか否かを判定する。例えば、判定部３１７－ｎは、当該集約モデルが既にワーカーモデルの生成（ステップＳ１１３－ｎ）に用いられた「最新の集約モデル」と同一または近似する場合に、当該集約モデルを更新して新たにワーカーモデルを得る必要がないと判定し、そうでない場合に当該集約モデルを更新して新たにワーカーモデルを得る必要があると判定する。なお、２つの集約モデルが近似するとは、例えば、それらのモデルパラメータの距離が所定値以下あることであってもよいし、所定の入力群に対する２つの集約モデルの出力分布の違いが所定値以下あることであってもよい（ステップＳ３１７ａ－ｎ）。

　ここで、集約モデルを更新して新たにワーカーモデルを得る必要がないと判定された場合、制御部１１６－ｎは、連合学習の終了条件を満たしているか否かを判定する。ここで終了条件を満たしていた場合には、処理を終了する。一方、終了条件を満たしていない場合には、学習部１１３－ｎが当該集約モデルを更新して新たにワーカーモデルを得ることなく、待機時間経過後に取得部３１２－ｎが秘密連合学習装置３２－ｍ（ただし、ｍ∈｛１，…，Ｍ｝）（図３）から新たな集約モデルを特定する情報の秘匿情報［ＧＭ］_ｍを取得する。すなわち、学習部１１３－ｎが新たなワーカーモデルを得ることなく、取得部３１２－ｎが当該待機時間経過後に提供部１２３－ｍにアクセスし、提供部１２３－ｍから集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍを取得する。取得部３１２－ｎは、取得した秘匿情報［ＧＭ］_ｍを復元して集約モデルを特定する情報ＧＭを得、これを記憶部１１１－ｎに格納し、ステップＳ３１７ａ－ｎに戻る（ステップＳ３１７ｂ－ｎ）。

　一方、集約モデルを更新して新たにワーカーモデルを得る必要があると判定された場合、ステップＳ１１３－ｎの処理に戻る（ステップＳ３１７ｃ－ｎ）。すなわち、学習部１１３－ｎは、記憶部１１１－ｎに格納されたローカル学習データＤ－ｎおよび最新の情報ＧＭを読み込み、当該ローカル学習データＤ－ｎを用いた機械学習によって、当該情報ＧＭによって特定される最新の集約モデルを更新してワーカーモデルを得、当該ワーカーモデルを特定する情報ＷＭ－ｎを出力する（ステップＳ１１３－ｎ）。その後、本実施形態でこれまで説明したステップＳ１１４－ｎ以降の処理が再び実行される。

　さらに、本実施形態のモデル学習装置は、集約モデルを更新して新たにワーカーモデルを得る必要があるか否かを判定する。ここで、集約モデルを更新して新たにワーカーモデルを得る必要がないと判定された場合、モデル学習装置は、当該集約モデルを更新して新たにワーカーモデルを得ることなく、待機時間経過後に新たな集約モデルを特定する情報の秘匿情報を取得する。一方、集約モデルを更新して新たにワーカーモデルを得る必要があると判定された場合、モデル学習装置は、ローカル学習データを用いた機械学習によって集約モデルを更新してワーカーモデルを得る。また秘密連合学習装置は、所定のモデル学習装置からワーカーモデルを特定する情報の秘匿情報を得たか否かを判定する。ここで、所定のモデル学習装置からワーカーモデルを特定する情報の秘匿情報を得たと判定された場合に、秘密連合学習装置は、ワーカーモデルを特定する情報の秘匿情報を用いた秘密計算によって、ワーカーモデルを集約した集約モデルを特定する情報の秘匿情報を得る。これらにより、制御装置１３を用いることなく、連合学習の安全性を向上させることができる。

　また、本実施形態では、モデル学習装置がワーカーモデルの学習を終了したことを外部に伝達しないため、各モデル学習装置の性能や処理時間の情報の流出を防止できる。

　［第３実施形態の変形例１］
　第３実施形態では、秘密連合学習装置３２－ｍ（図３）の判定部３２８－ｍが、ワーカーモデルの登録が完了したと判定するか、または、基準時点から所定時間が経過したと判定した場合に、秘密集約処理の開始を指示する旨の指令を制御部１２６－ｍに送った（ステップＳ３２８－ｍ）。しかし、判定部３２８－ｍが基準時点から所定時間が経過したか否かを判定することなく、ワーカーモデルの登録が完了したと判定した場合に、判定部３２８－ｍが秘密集約処理の開始を指示する旨の指令を制御部１２６－ｍに送ってもよい。

　［第３実施形態の変形例２］
　第３実施形態では、モデル学習装置３１－ｎ（図６）の取得部３１２－ｎが、所定の契機で、秘密連合学習装置３２－ｍ（図３）の提供部１２３－ｍから集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍを取得し、取得した秘匿情報［ＧＭ］_ｍを復元して集約モデルを特定する情報ＧＭを得た。しかし、モデル学習装置３１－ｎの取得部３１２－ｎが、所定の契機で、特定の秘密連合学習装置３２－１（図４）の提供部２２３－１から集約モデルを特定する情報ＧＭを取得してもよい。この場合には、第２実施形態で説明したように、ステップＳ３２２－ｍで、集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_１が、秘密連合学習装置３２－１（図４）の提供部２２３－１に送られる。また、Ｍ≧２の場合、さらに秘密連合学習装置３２－ｍ’の提供部３２３－ｍ’（ただし、ｍ’∈｛２，…，Ｍ｝）が、秘匿情報［ＧＭ］_ｍ’を秘密連合学習装置３２－１（図４）の提供部２２３－１に送信する。これにより、秘密連合学習装置３２－１の提供部２２３－１には、秘匿情報［ＧＭ］_ｍ（ただし、ｍ∈｛１，・・，Ｍ｝）が入力される。提供部２２３－１は入力された秘匿情報［ＧＭ］_ｍを復元して集約モデルを特定する情報ＧＭを得る。モデル学習装置３１－ｎの取得部１１２－ｎは、所定の契機で、秘密連合学習装置３２－１（図４）の提供部２２３－１から集約モデルを特定する情報ＧＭを取得する。その他は第３実施形態と同じである。

　［第４実施形態］
　本実施形態は、第３実施形態の変形例である。第４実施形態では、モデル学習装置がワーカーモデルを特定する情報の秘匿情報を秘密連合学習装置に提供したことを表す平文の同期情報をさらに秘密連合学習装置に提供する。秘密連合学習装置は、モデル学習装置がワーカーモデルを特定する情報の秘匿情報を当該秘密連合学習装置に提供したことを表す平文の同期情報を取得し、当該同期情報を用いて、所定のモデル学習装置からワーカーモデルを特定する情報の秘匿情報を得たか否かを判定する。これにより、通信を効率化でき、性能を向上させることができる。

　＜構成＞
　図５に例示するように、本実施形態の連合学習システム４は、モデル学習を行うＮ個のモデル学習装置４１－１，…，４１－Ｎ、および、秘密計算によって連合学習を行うＭ個の秘密連合学習装置４２－１，…，４２－Ｍを有する。

　図６に例示するように、本実施形態のモデル学習装置４１－ｎは、記憶部１１１－ｎ、取得部４１２－ｎ、判定部３１７－ｎ、学習部１１３－ｎ、秘匿部１１４－ｎ、提供部４１５－ｎ、および制御部１１６－ｎを有する。モデル学習装置４１－ｎは、制御部１１６－ｎの制御に基づいて各処理を実行し、入力情報及び各処理で得られた情報は記憶部１１１－ｎに格納され、必要に応じて読み出されて使用される。

　図３に例示するように、本実施形態の秘密連合学習装置４２－ｍは、取得部４２１－ｍ、判定部４２８－ｍ、秘密集約処理部３２２－ｍ、提供部４２３－ｍ、制御部１２６－ｍ、および記憶部１２７－ｍを有する。秘密連合学習装置４２－ｍは、制御部１２６－ｍの制御に基づいて各処理を実行し、入力情報及び各処理で得られた情報は記憶部１２７－ｍに格納され、必要に応じて読み出されて使用される。

　＜学習処理＞
　以下に本実施形態の学習処理を例示する。
　まず、モデル学習装置１１－ｎに代えてモデル学習装置４１－ｎ（図６）が、第１実施形態で説明したステップＳ１１３－ｎ，Ｓ１１４－ｎの処理を実行する。

　ステップＳ１１４－ｎの処理で得られた秘匿情報［ＷＭ－ｎ］＝｛［ＷＭ－ｎ］_１，…，［ＷＭ－ｎ］_Ｍ｝（ワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報）は、モデル学習装置４１－ｎ（図６）の提供部４１５－ｎに入力される。提供部４１５－ｎは、当該ワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報［ＷＭ－ｎ］_ｍを秘密連合学習装置４２－ｍ（図３）に送信する（提供する）（ただし、ｍ＝１，…，Ｍ）。さらに提供部４１５－ｎは、モデル学習装置４１－ｎが秘密連合学習装置４２－ｍに当該ワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報［ＷＭ－ｎ］_ｍを送信した旨（モデル学習装置４１－ｎがワーカーモデルの学習を完了した旨）の同期情報ｓｙｎ－ｎを秘密連合学習装置４２－ｍに送信する（提供する）（ただし、ｍ＝１，…，Ｍ）。なお、同期情報ｓｙｎ－ｎは平文である。（ステップＳ４１５－ｎ）

　秘密連合学習装置４２－ｍ（図３）の取得部１２１－ｍは、モデル学習装置４１－ｎから送られた秘匿情報［ＷＭ－ｎ］_ｍおよび同期情報ｓｙｎ－ｎを受信し、当該秘匿情報［ＷＭ－ｎ］_ｍおよび同期情報ｓｙｎ－ｎを記憶部１２７－ｍに格納する。すなわち、取得部４２１－ｍは、複数のモデル学習装置４１－ｎから複数のワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報［ＷＭ－ｎ］_ｍ、および、当該モデル学習装置４１－ｎが秘密連合学習装置４２－ｍに当該ワーカーモデルを特定する情報ＷＭ－ｎの秘匿情報［ＷＭ－ｎ］_ｍを送信した旨の同期情報ｓｙｎ－ｎを取得し、これらを記憶部１２７－ｍに格納する（ステップＳ４２１－ｍ）。

　また、秘密連合学習装置４２－ｍの判定部４２８－ｍは、所定の契機で、記憶部１２７－ｍに格納された同期情報ｓｙｎ－ｎを用いて、ワーカーモデルの登録が完了したか否かを判定する。例えば、判定部４２８－ｍは、定期的に当該判定を行ってもよいし、各秘匿情報［ＷＭ－ｎ］_ｍおよび同期情報ｓｙｎ－ｎが記憶部１２７－ｍに格納されたことをトリガーとして当該判定を行ってもよい。第３実施形態で説明した通り、ワーカーモデルの登録が完了したとは、所定のモデル学習装置４１－ｎ_１，…，４１－ｎ_max（ただし、｛ｎ_１，…，ｎ_max｝⊆｛１，…，Ｎ｝）から、新たなワーカーモデルを特定する情報の秘匿情報［ＷＭ－ｎ_１］_ｍ，…，［ＷＭ－ｎ_max］_ｍを得たことを意味する。判定部４２８－ｍは、同期情報ｓｙｎ－ｎを用いることで、どのモデル学習装置４１－ｎが当該秘密連合学習装置４２－ｍに秘匿情報［ＷＭ－ｎ］_ｍを提供したのかを知ることができる。そのため、判定部４２８－ｍは、この同期情報ｓｙｎ－ｎを用いることで、ワーカーモデルの登録が完了したか否かを正確に判定できる。ここで、ワーカーモデルの登録が完了していないと判定され、かつ、基準時点から所定時間が経過していない（タイムアウトしていない）と判定された場合、判定部４２８－ｍは、所定の契機で、このワーカーモデルの登録が完了したか否かを再び判定する。一方、ワーカーモデルの登録が完了したと判定されたか、または、基準時点から所定時間が経過した（タイムアウトした）と判定された場合、判定部４２８－ｍは秘密集約処理の開始を指示する旨の指令を制御部１２６－ｍに送る。なお、タイムアウトの基準時点の例は、第１実施形態で説明した通りである（ステップＳ４２１－ｍ）。

　秘密集約処理の開始を指示する旨の指令を受け取った制御部１２６－ｍは、秘密集約処理部３２２－ｍに秘密集約処理の開始を指示する。これを受けた秘密集約処理部３２２－ｍは、記憶部１２７－ｍから複数の秘匿情報［ＷＭ－ｎ］（ただし、ｎ∈｛１，…，Ｎ｝）（複数のワーカーモデルを特定する情報の秘匿情報）を読み込み、これらを用いた秘密計算によって、当該複数のワーカーモデルを得ることなく、当該複数のワーカーモデルを集約した集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍを得て出力する（秘密集約処理）。集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍは、提供部４２３－ｍに送られる（ステップＳ３２２－ｍ）。

　提供部４２３－ｍには秘匿情報［ＧＭ］_ｍが入力される。提供部４２３－ｍは、取得部１２１－ｍがモデル学習装置４１－ｎから受け取った秘匿情報［ＷＭ－ｎ］_ｍおよび同期情報ｓｙｎ－ｎ（ステップＳ４２１－ｍ）に対する戻り値として、集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍをモデル学習装置４１－ｎに送信する（提供する）（ステップＳ４２３－ｍ）。

　モデル学習装置４１－ｎ（図６）の取得部４１２－ｎには、戻り値として秘密連合学習装置４２－ｍ（ただし、ｍ∈｛１，…，Ｍ｝）から提供された秘匿情報［ＧＭ］_ｍが入力される。取得部４１２－ｎは、取得した秘匿情報［ＧＭ］_ｍを復元して集約モデルを特定する情報ＧＭを得る。集約モデルを特定する情報ＧＭは、記憶部１１１－ｎに格納される（ステップＳ４１２－ｎ）。

　判定部３１７－ｎは、記憶部１１１－ｎに格納された情報ＧＭに対応する集約モデルを更新して新たにワーカーモデルを得る必要があるか否かを判定する。言い換えると、判定部３１７－ｎは、当該ローカル学習データＤ－ｎを用いた機械学習によって、当該情報ＧＭによって特定される最新の集約モデルを更新してワーカーモデルを得る必要があるか否かを判定する（ステップＳ３１７ａ－ｎ）。

　ここで、集約モデルを更新して新たにワーカーモデルを得る必要がないと判定された場合、モデル学習装置４１－ｎ（図６）の制御部１１６－ｎが、連合学習の終了条件を満たしているか否かを判定する。ここで終了条件を満たしていた場合には、処理を終了する。一方、終了条件を満たしていない場合には、学習部１１３－ｎが当該集約モデルを更新して新たにワーカーモデルを得ることなく、待機時間経過後に取得部４１２－ｎが秘密連合学習装置４２－ｍ（ただし、ｍ∈｛１，…，Ｍ｝）（図３）から新たな集約モデルを特定する情報の秘匿情報［ＧＭ］_ｍを取得する。取得部４１２－ｎは、取得した秘匿情報［ＧＭ］_ｍを復元して集約モデルを特定する情報ＧＭを得、これを記憶部１１１－ｎに格納し、ステップＳ３１７ａ－ｎに戻る（ステップＳ４１７ｂ－ｎ）。

　一方、集約モデルを更新して新たにワーカーモデルを得る必要があると判定された場合、ステップＳ１１３－ｎの処理に戻る（ステップＳ３１７ｃ－ｎ）。その後、本実施形態でこれまで説明したステップＳ１１４－ｎ以降の処理が再び実行される。

　また、さらに、本実施形態のモデル学習装置は、当該モデル学習装置がワーカーモデルを特定する情報の秘匿情報を秘密連合学習装置に提供したことを表す平文の同期情報をさらに秘密連合学習装置に提供する。秘密連合学習装置は、当該同期情報を用いて、所定のモデル学習装置からワーカーモデルを特定する情報の秘匿情報を得たか否かを判定する。これにより、ワーカーモデルの登録が完了したか否かを正確に判定できる。その結果、通信を効率化でき、性能を向上させることができる。

　［第４実施形態の変形例１］
　第４実施形態では、秘密連合学習装置４２－ｍ（図３）の判定部４２８－ｍが、ワーカーモデルの登録が完了したと判定するか、または、基準時点から所定時間が経過したと判定した場合に、秘密集約処理の開始を指示する旨の指令を制御部１２６－ｍに送った（ステップＳ４２８－ｍ）。しかし、判定部４２８－ｍが基準時点から所定時間が経過したか否かを判定することなく、ワーカーモデルの登録が完了したと判定した場合に、判定部４２８－ｍが秘密集約処理の開始を指示する旨の指令を制御部１２６－ｍに送ってもよい。

　［第４実施形態の変形例２］
　第４実施形態では、モデル学習装置４１－ｎ（図６）の取得部４１２－ｎが、戻り値として、秘密連合学習装置４２－ｍ（図３）の提供部４２３－ｍから集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_ｍを取得し、取得した秘匿情報［ＧＭ］_ｍを復元して集約モデルを特定する情報ＧＭを得た。しかし、モデル学習装置３１－ｎの取得部１１２－ｎが、戻り値として、特定の秘密連合学習装置４２－１（図４）の提供部２２３－１から集約モデルを特定する情報ＧＭを取得してもよい。この場合には、第２実施形態で説明したように、ステップＳ３２２－ｍで、集約モデルを特定する情報ＧＭの秘匿情報［ＧＭ］_１が秘密連合学習装置４２－１（図４）の提供部２２３－１に送られる。また、Ｍ≧２の場合、さらに秘密連合学習装置４２－ｍ’の提供部４２３－ｍ’（ただし、ｍ’∈｛２，…，Ｍ｝）が、秘匿情報［ＧＭ］_ｍ’を秘密連合学習装置４２－１（図４）の提供部２２３－１に送信する。これにより、秘密連合学習装置４２－１の提供部２２３－１には、秘匿情報［ＧＭ］_ｍ（ただし、ｍ∈｛１，・・，Ｍ｝）が入力される。提供部２２３－１は入力された秘匿情報［ＧＭ］_ｍを復元して集約モデルを特定する情報ＧＭを得、これを戻り値として、モデル学習装置４１－ｎに送信する。モデル学習装置４１－ｎの取得部４１２－ｎは、戻り値として、秘密連合学習装置４２－１（図４）の提供部２２３－１から集約モデルを特定する情報ＧＭを取得する。その他は第４実施形態と同じである。

　［ハードウェア構成］
　各実施形態におけるモデル学習装置１１－ｎ，２１－ｎ，３１－ｎ，４１－ｎおよび秘密連合学習装置１２－ｍ，２２－１，３２－ｍ，４２－ｍは、例えば、ＣＰＵ（central processing unit）等のプロセッサ（ハードウェア・プロセッサ）やＲＡＭ（random-access memory）・ＲＯＭ（read-only memory）等のメモリ等を備える汎用または専用のコンピュータが所定のプログラムを実行することで構成される装置である。すなわち、各実施形態におけるモデル学習装置１１－ｎ，２１－ｎ，３１－ｎ，４１－ｎおよび秘密連合学習装置１２－ｍ，２２－１，３２－ｍ，４２－ｍは、例えば、それぞれが有する各部を実装するように構成された処理回路（processing circuitry）を有する。このコンピュータは１個のプロセッサやメモリを備えていてもよいし、複数個のプロセッサやメモリを備えていてもよい。このプログラムはコンピュータにインストールされてもよいし、予めＲＯＭ等に記録されていてもよい。また、ＣＰＵのようにプログラムが読み込まれることで機能構成を実現する電子回路（circuitry）ではなく、単独で処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。また、１個の装置を構成する電子回路が複数のＣＰＵを含んでいてもよい。

　図７は、各実施形態におけるモデル学習装置１１－ｎ，２１－ｎ，３１－ｎ，４１－ｎおよび秘密連合学習装置１２－ｍ，２２－１，３２－ｍ，４２－ｍのハードウェア構成を例示したブロック図である。図７に例示するように、この例のモデル学習装置１１－ｎ，２１－ｎ，３１－ｎ，４１－ｎおよび秘密連合学習装置１２－ｍ，２２－１，３２－ｍ，４２－ｍは、ＣＰＵ（Central Processing Unit）１０ａ、入力部１０ｂ、出力部１０ｃ、ＲＡＭ（Random Access Memory）１０ｄ、ＲＯＭ（Read Only Memory）１０ｅ、補助記憶装置１０ｆ、通信部１０ｈ及びバス１０ｇを有している。この例のＣＰＵ１０ａは、制御部１０ａａ、演算部１０ａｂ及びレジスタ１０ａｃを有し、レジスタ１０ａｃに読み込まれた各種プログラムに従って様々な演算処理を実行する。また、入力部１０ｂは、データが入力される入力端子、キーボード、マウス、タッチパネル等である。また、出力部１０ｃは、データが出力される出力端子、ディスプレイ等である。通信部１０ｈは、所定のプログラムを読み込んだＣＰＵ１０ａによって制御されるＬＡＮカード等である。また、ＲＡＭ１０ｄは、ＳＲＡＭ (Static Random Access Memory)、ＤＲＡＭ (Dynamic Random Access Memory)等であり、所定のプログラムが格納されるプログラム領域１０ｄａ及び各種データが格納されるデータ領域１０ｄｂを有している。また、補助記憶装置１０ｆは、例えば、ハードディスク、ＭＯ（Magneto-Optical disc）、半導体メモリ等であり、所定のプログラムが格納されるプログラム領域１０ｆａ及び各種データが格納されるデータ領域１０ｆｂを有している。また、バス１０ｇは、ＣＰＵ１０ａ、入力部１０ｂ、出力部１０ｃ、ＲＡＭ１０ｄ、ＲＯＭ１０ｅ、通信部１０ｈ及び補助記憶装置１０ｆを、情報のやり取りが可能なように接続する。ＣＰＵ１０ａは、読み込まれたＯＳ（Operating System）プログラムに従い、補助記憶装置１０ｆのプログラム領域１０ｆａに格納されているプログラムをＲＡＭ１０ｄのプログラム領域１０ｄａに書き込む。同様にＣＰＵ１０ａは、補助記憶装置１０ｆのデータ領域１０ｆｂに格納されている各種データを、ＲＡＭ１０ｄのデータ領域１０ｄｂに書き込む。そして、このプログラムやデータが書き込まれたＲＡＭ１０ｄ上のアドレスがＣＰＵ１０ａのレジスタ１０ａｃに格納される。ＣＰＵ１０ａの制御部１０ａａは、レジスタ１０ａｃに格納されたこれらのアドレスを順次読み出し、読み出したアドレスが示すＲＡＭ１０ｄ上の領域からプログラムやデータを読み出し、そのプログラムが示す演算を演算部１０ａｂに順次実行させ、その演算結果をレジスタ１０ａｃに格納していく。このような構成により、モデル学習装置１１－ｎ，２１－ｎ，３１－ｎ，４１－ｎおよび秘密連合学習装置１２－ｍ，２２－１，３２－ｍ，４２－ｍの機能構成が実現される。

　上述のプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は非一時的な（non-transitory）記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。

　このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。上述のように、このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　各実施形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

　［その他の変形例］
　なお、本発明は上述の実施形態に限定されるものではない。例えば、上述の実施形態において、全部または一部のモデル学習装置が合意形成手法によってワーカーモデルの学習を終了し、当該ワーカーモデルを特定する情報の秘匿情報を秘密連合学習装置に提供した旨を合意し、その旨を秘密連合学習装置に提供してもよい。これにより、秘密連合学習装置は当該全部または一部のモデル学習装置のワーカーモデルを特定する情報の秘匿情報を受け取ってから当該ワーカーモデルを集約した集約モデルを特定する情報の秘匿情報を得ることができる。

　また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

１～４　連合学習システム
１１－ｎ，２１－ｎ，３１－ｎ，４１－ｎ　モデル学習装置
１１１－ｎ　記憶部
１１２－ｎ，２１２－ｎ，３１２－ｎ，４１２－ｎ　取得部
１１３－ｎ　学習部
１１４－ｎ　秘匿部
１１５－ｎ，４１５－ｎ　提供部
３１７－ｎ　判定部
１２－ｍ，２２－１，３２－ｍ，４２－ｍ　秘密連合学習装置
１２１－ｍ，４２１－ｍ　取得部
１２２－ｍ，３２２－ｍ　秘密集約処理部
１２３－ｍ，２２３－１，４２３－ｍ　提供部
１２７－ｍ　記憶部
３２８－ｍ，４２８－ｍ　判定部

Claims

　ローカル学習データを格納する記憶部と、
　集約モデルを特定する情報または前記集約モデルを特定する情報の秘匿情報を秘密連合学習装置から得る取得部と、
　前記ローカル学習データを用いた機械学習によって前記集約モデルを更新してワーカーモデルを得る学習部と、
　前記ワーカーモデルを特定する情報の秘匿情報を得る秘匿部と、
　前記ワーカーモデルを特定する情報の秘匿情報を前記秘密連合学習装置に提供する提供部と、
を有するモデル学習装置。
　請求項１のモデル学習装置であって、
　前記集約モデルを更新して新たに前記ワーカーモデルを得る必要があるか否かを判定する判定部をさらに有し、
　前記集約モデルを更新して新たに前記ワーカーモデルを得る必要がないと判定された場合、前記学習部が前記集約モデルを更新して新たに前記ワーカーモデルを得ることなく、待機時間経過後に前記取得部が前記秘密連合学習装置から新たな集約モデルを特定する情報または前記新たな集約モデルを特定する情報の秘匿情報を取得し、
　前記集約モデルを更新して新たに前記ワーカーモデルを得る必要があると判定された場合、前記学習部が前記ローカル学習データを用いた機械学習によって前記集約モデルを更新して前記ワーカーモデルを得る、モデル学習装置。
　請求項１または２のモデル学習装置であって、
　前記提供部は、当該モデル学習装置が前記ワーカーモデルを特定する情報の秘匿情報を前記秘密連合学習装置に提供したことを表す平文の同期情報をさらに前記秘密連合学習装置に提供する、モデル学習装置。
　複数のモデル学習装置から複数のワーカーモデルを特定する情報の秘匿情報を得る取得部と、
　前記複数のワーカーモデルを特定する情報の秘匿情報を用いた秘密計算によって、前記複数のワーカーモデルを得ることなく、前記複数のワーカーモデルを集約した集約モデルを特定する情報の秘匿情報を得る秘密集約処理部と、
　前記集約モデルを特定する情報または前記集約モデルを特定する情報の秘匿情報を前記複数のモデル学習装置に提供する提供部と、
を有する秘密連合学習装置。
　請求項４の秘密連合学習装置であって、
　前記取得部が所定のモデル学習装置から前記ワーカーモデルを特定する情報の秘匿情報を得たか否かを判定する判定部をさらに有し、
　前記秘密集約処理部は、前記所定のモデル学習装置から前記ワーカーモデルを特定する情報の秘匿情報を得たと判定された場合に、前記ワーカーモデルを特定する情報の秘匿情報を用いた秘密計算によって、前記ワーカーモデルを集約した前記集約モデルを特定する情報の秘匿情報を得る、秘密連合学習装置。
　請求項５の秘密連合学習装置であって、
　前記取得部は、前記モデル学習装置が前記ワーカーモデルを特定する情報の秘匿情報を当該秘密連合学習装置に提供したことを表す平文の同期情報を取得し、
　前記判定部は、前記同期情報を用いて、前記所定のモデル学習装置から前記ワーカーモデルを特定する情報の秘匿情報を得たか否かを判定する、秘密連合学習装置。
　モデル学習装置によるモデル学習方法であって、
　取得部において、集約モデルを特定する情報または前記集約モデルを特定する情報の秘匿情報を秘密連合学習装置から得る取得ステップと、
　学習部において、記憶部に格納されたローカル学習データを用いた機械学習によって前記集約モデルを更新してワーカーモデルを得る学習ステップと、
　秘匿部において、前記ワーカーモデルを特定する情報の秘匿情報を得る秘匿ステップと、
　提供部において、前記ワーカーモデルを特定する情報の秘匿情報を前記秘密連合学習装置に提供する提供ステップと、
を有するモデル学習方法。
　秘密連合学習装置による秘密連合学習方法であって、
　取得部において、複数のモデル学習装置から複数のワーカーモデルを特定する情報の秘匿情報を得る取得ステップと、
　秘密集約処理部において、前記複数のワーカーモデルを特定する情報の秘匿情報を用いた秘密計算によって、前記複数のワーカーモデルを得ることなく、前記複数のワーカーモデルを集約した集約モデルを特定する情報の秘匿情報を得る秘密集約処理ステップと、
　提供部において、前記集約モデルを特定する情報または前記集約モデルを特定する情報の秘匿情報を前記複数のモデル学習装置に提供する提供ステップと、
を有する秘密連合学習方法。
　請求項１または２のモデル学習装置、または、請求項４から６のいずれかの秘密連合学習装置としてコンピュータを機能させるためのプログラム。