WO2024084827A1

WO2024084827A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: WO2024084827A1
Application number: PCT/JP2023/031384
Authority: WO
Inventors: 元脩神保; 斌楊; 信也丸山; 秀穂五味
Original assignee: ソニーグループ株式会社
Priority date: 2022-10-20
Filing date: 2023-08-30
Publication date: 2024-04-25

Abstract

【課題】連合学習による機械学習モデルのセキュリティ性を担保しながら、推論精度をさらに向上させることが可能な、新規かつ改良された技術を提案する。【解決手段】連合学習により推論モデルの学習を行う学習部と、複数の端末の各々により得られるローカルデータに対してプライバシー保護処理が行われたプライバシー保護データを前記複数の端末から取得する取得部と、を備え、前記学習部は、前記プライバシー保護データに基づいて前記推論モデルの学習を行い、前記学習の結果に基づいて前記推論モデルのハイパーパラメータを含む前記推論モデルに関する情報を前記複数の端末に配布し、前記取得部は、前記複数の端末から、前記ローカルデータを学習データとして前記推論モデルの学習が行われることにより得られる前記推論モデルの更新情報を取得し、前記学習部は、前記更新情報を用いて前記推論モデルを更新する、情報処理装置が提供される。

Description

情報処理装置、情報処理方法、およびプログラム

　本開示は、情報処理装置、情報処理方法、およびプログラムに関する。

　近年、収集されたデータに基づいてなんらかの推論を行う機械学習モデル（推論モデル）の開発が行われている。また、上記のような推論モデルの開発において、収集されるデータに含まれるプライバシー情報の保護等のセキュリティ性を担保しながら、モデルの開発を行うための技術も提案されている。例えば、特許文献１には、医用データを処理するための機械学習モデルの訓練において、連合学習の手法を用いた技術が開示されている。

特開２０２１－１１７９６４号公報

　しかし、特許文献１に開示される技術のように連合学習の手法を用いた機械学習モデルにおいては、セキュリティ性を担保するために、モデルの推論精度が代償となる可能性があった。

　上記課題を解決するために、本開示のある観点によれば、連合学習により推論モデルの学習を行う学習部と、複数の端末の各々により得られるローカルデータに対してプライバシー保護処理が行われたデータであるプライバシー保護データを、前記複数の端末から取得する取得部と、を備え、前記学習部は、前記プライバシー保護データに基づいて前記推論モデルの学習を行い、前記学習の結果に基づいて設定される前記推論モデルのハイパーパラメータを含む前記推論モデルに関する情報を前記複数の端末に配布し、前記取得部は、前記複数の端末から、前記複数の端末の各々により、前記ローカルデータを学習データとして、配布された前記ハイパーパラメータを用いた前記推論モデルの学習が行われることにより得られる前記推論モデルの更新情報を取得し、前記学習部は、前記更新情報を用いて前記推論モデルを更新する、情報処理装置が提供される。

　また、本開示によれば、プロセッサが、連合学習により推論モデルの学習を行うことと、複数の端末の各々により得られるローカルデータに対してプライバシー保護処理が行われたデータであるプライバシー保護データを、前記複数の端末から取得することと、前記プライバシー保護データに基づいて前記推論モデルの学習を行うことと、前記学習の結果に基づいて設定される前記推論モデルのハイパーパラメータを含む前記推論モデルに関する情報を前記複数の端末に配布することと、前記複数の端末から、前記複数の端末の各々により、前記ローカルデータを学習データとして、配布された前記ハイパーパラメータを用いた前記推論モデルの学習が行われることにより得られる前記推論モデルの更新情報を取得することと、前記更新情報を用いて前記推論モデルを更新することと、を含む、コンピュータにより実行される情報処理方法が提供される。

　また、本開示によれば、コンピュータを、連合学習により推論モデルの学習を行う学習部と、複数の端末の各々により得られるローカルデータに対してプライバシー保護処理が行われたデータであるプライバシー保護データを、前記複数の端末から取得する取得部と、を備え、前記学習部は、前記プライバシー保護データに基づいて前記推論モデルの学習を行い、前記学習の結果に基づいて設定される前記推論モデルのハイパーパラメータを含む前記推論モデルに関する情報を前記複数の端末に配布し、前記取得部は、前記複数の端末から、前記複数の端末の各々により、前記ローカルデータを学習データとして、配布された前記ハイパーパラメータを用いた前記推論モデルの学習が行われることにより得られる前記推論モデルの更新情報を取得し、前記学習部は、前記更新情報を用いて前記推論モデルを更新する、情報処理装置、として機能させるための、プログラムが提供される。

本開示の一実施形態に係る情報処理システムの構成例を示す説明図である。本実施形態に係る端末１０の構成例を示すブロック図である。本実施形態に係る情報処理装置２０の構成例を示すブロック図である。本実施形態に係る情報処理システムの第１の動作例を説明するためのシーケンス図である。図４に示したシーケンス図におけるＳ１０１のサブルーチンの処理の流れを説明するシーケンス図である。データ処理部１３０によるプライバシー保護データの生成処理の一例を説明するための図である。図４に示したシーケンス図におけるＳ１０７のサブルーチンの処理の流れを説明するシーケンス図である。図４に示したシーケンス図におけるＳ１０９のサブルーチンの処理の流れを説明するシーケンス図である。本実施形態に係る情報処理システムの第２の動作例を説明するためのシーケンス図である。図９に示したシーケンス図のＳ１３１およびＳ１０５のサブルーチンの処理の流れを説明するためのシーケンス図である。データ処理部１３０によるプライバシー保護データの生成処理の他の一例を説明するための図である。本実施形態に係る情報処理システムの第３の動作例を説明するためのシーケンス図である。図１２に示したシーケンス図におけるＳ１４１およびＳ１０３のサブルーチンの処理の流れを説明するためのシーケンス図である。本実施形態による情報処理システムの第３の動作例におけるプライバシー保護データの集約を説明するための図である。本実施形態の第３の動作例における異常値の検知について説明するための概念図である。本実施形態の第３の動作例における異常値の検知について説明するための他の概念図である。本実施形態の変形例におけるプライバシー保護データの生成について説明するための図である。本実施形態による情報処理システムの変形例での動作例を説明するためのシーケンス図である。図１８に示したシーケンス図におけるＳ１５１およびＳ１５５のサブルーチンの処理の流れを説明するシーケンス図である。本開示の一実施形態に係るハードウェア構成９０を示すブロック図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　また、本明細書および図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なる数字またはアルファベットを付して区別する場合もある。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、複数の構成要素の各々に同一符号のみを付する。

　なお、説明は以下の順序で行うものとする。
　１．概要
　２．システム構成例
　３．機能構成例
　　３－１．端末１０
　　３－２．情報処理装置２０
　４．動作例
　　４－１．第１の動作例
　　４－２．第２の動作例
　　４－３．第３の動作例
　５．変形例
　６．ハードウェア構成例
　７．まとめ

　＜１．概要＞
　まず、本開示の一実施形態の概要について述べる。

　上述したように、近年においては、収集されたデータに基づいて何らかの推論を行う推論モデルの開発が行われている。

　推論モデルによれば、未知のデータに基づいて各種の推論を精度高く実現することも可能である。このため、推論モデルの生成・活用は、種々の分野において盛んに行われている。

　しかし、例えばサーバが複数の装置からデータを収集し、当該データに基づく学習を行う場合には、プライバシーの保護が課題となる。

　そこで、複数の装置から収集したデータを用いた学習を行う場合においてデータのプライバシーを保護する手法として、連合学習（Federated Learning）と呼ばれる手法が存在する。

　一般的な連合学習では、サーバから複数の装置の各々に機械学習モデルの学習指示が出され、複数の端末の各々において取得されるデータを用いたモデルの学習が行われる。サーバ側には学習結果が収集され、当該学習結果に基づいて、サーバ側に保持されるモデルが更新される。

　従って、連合学習によれば、複数の装置が保持する、実際に学習に用いられるデータが外部の装置に晒されることなく、推論モデルの学習が行われ得る。

　しかし、機械学習システムを構築するためには、機械学習モデルの学習による最適化が一度行われるだけでは十分でない。一般に機械学習システムの構築は、学習データの準備、モデルの最適化（学習）、および、モデルの運用（推論）の３つの段階に大きく分けることが出来る。

　機械学習モデルの学習段階においては、モデル構造、最適化手法、およびハイパーパラメータを選定するために、複数の試行パターンごとに学習が行われる。これにより、より最適なハイパーパラメータが設定され得る。

　従来、連合学習を用いた機械学習モデルにおいては、実際に学習に用いられるデータがサーバには集約されないため、上記のようなハイパーパラメータの選定のための学習が、複数の端末によって行われていた。

　より詳細には、ハイパーパラメータの設定値の複数の試行パターンごとに、各設定値を用いた学習指示が、サーバから複数の端末に送信される。複数の端末の各々は、受信したハイパーパラメータの設定値を用いて、複数の端末において取得されるデータを学習データとして学習を行う。サーバは、複数の端末から学習結果を集約し、集約結果に基づいてモデルのパラメータを更新する。サーバは、更新後のモデルのパラメータを複数の端末に再度配布する。以上の処理が、学習が収束するまで繰り返される。

　上記の一連の処理が繰り返され、ハイパーパラメータの設定値の１つの試行パターンを用いた学習が収束すると、残りのハイパーパラメータの設定値の試行パターンについても同様に、上記の一連の処理が繰り返される。

　従って、例えば、１のハイパーパラメータの試行パターンによる学習の収束までに、上記の一連の処理が１０回繰り返される必要があると仮定すると、試行パターンが１０種類ある場合には、複数の端末は、１０回×１０種類＝１００回の学習を行う必要がある。

　ここで、ハイパーパラメータの設定値として様々な試行パターンが試行されるほど、より最適なハイパーパラメータが設定され得る。一方で、ハイパーパラメータの試行パターンの増加は、ハイパーパラメータの選定のための学習に要する時間および処理負荷の増加につながるという不都合があった。

　さらに、複数の端末の演算能力が低い場合、ハイパーパラメータの試行パターンの数は極力少ないことが望ましい。これにより、複数の端末がハイパーパラメータの選定のために行う学習の回数が低減される。しかし、試行パターンの数を低減すると、モデルの推論精度が代償となる可能性がある。

　また、機械学習モデルの推論精度は、学習データの品質に大きく影響される。このため、学習データの準備段階で、データ内の異常値、および、悪意のあるユーザによる不正値等の不正なデータが検知され、修正されることが望ましい。

　しかし、一般的な連合学習では、実際に学習に用いられるデータはサーバ側には集約されないため、サーバ側で不正なデータを検知することが難しいという課題があった。

　さらに、学習済のモデルを用いた推論段階（以下、運用段階とも称する）に移行した後に、社会環境の変化等の要因により、端末で取得されるデータの傾向に変化が生じる場合がある。この場合、モデルの学習が行われた時点での学習データと、推論段階において取得されるデータとに乖離が生じ得る。このような場合、モデルの再学習が行われることが望ましい。

　しかし一般的な連合学習では、実際に学習に用いられるデータは端末で保持されるため、サーバ側ではデータ傾向の変化の検出が困難である。

　本開示の一実施形態に係る技術思想は上記のような点に着目して発想されたものであり、連合学習による機械学習モデルのセキュリティ性の担保と、さらに高い推論精度の両立を実現するものである。

　このために、本開示の一実施形態に係る情報処理装置２０は、複数の端末１０の各々において取得される、実際に学習に用いられるデータ（以下、ローカルデータ）に基づいて、ローカルデータに対しプライバシー保護処理が行われたデータであるプライバシー保護データを取得する通信部２５０を備える。通信部２５０は、情報処理装置２０の取得部の一例である。

　また、本開示の一実施形態に係る情報処理装置２０は、収集されたプライバシー保護データに基づいて推論モデルの学習を行う学習部２３０を備える。さらに、学習部２３０は、当該学習の結果に基づいて設定されたハイパーパラメータの情報を含む推論モデルを端末１０に配布する。

　また、本開示の一実施形態に係る情報処理装置２０の学習部２３０は、複数の端末の各々により、ローカルデータを学習データとして、配布された推論モデルの学習が行われることにより得られるモデルの更新情報を用いて、上記推論モデルを更新する。

　上記で述べたような処理によれば、情報処理装置２０側にはローカルデータが収集されない。このため、推論モデルの学習のために収集されるデータのプライバシーを保護することが出来る。

　また、上記で述べたような処理によれば、情報処理装置２０は、実際に学習に用いられるデータであるローカルデータに対してプライバシー保護処理が行われたデータである、プライバシー保護データに基づいて学習を行う。これにより、プライバシー情報を保護しながら、よりローカルデータに近いデータに基づき、ハイパーパラメータの試行のための学習が行われる。このため、上記推論モデルの推論精度の向上が期待できる。

　また、上述のような処理によれば、複数の端末１０の各々では、情報処理装置２０から配布されたハイパーパラメータを用いて推論モデルの学習が行われる。そのため、端末１０では、ハイパーパラメータの試行のための学習が不要となる。従って、端末１０側での学習の処理負荷が軽減される。

　さらに、本開示の一実施形態に係る情報処理装置２０は、プライバシー保護データの集計処理を行う。情報処理装置２０は、集計処理の結果に基づき、ローカルデータの統計的なデータ傾向を示す傾向情報を、複数の端末１０に配布する。

　また、本開示の一実施形態に係る情報処理装置２０は、プライバシー保護データの集計結果に基づき、ローカルデータの分布傾向の変化を監視する。

　さらに、情報処理装置２０は、ローカルデータの分布傾向が変化したことが検知されると、推論モデルの再学習を行う。

　上記で述べたような処理によれば、複数の端末１０において、ローカルデータの分布傾向を示す傾向情報に基づき、学習データに含まれる異常値を検知し得る。

　また、上記で述べたような処理によれば、推論モデルが運用段階に移行した後でも、ローカルデータの傾向の変化に応じた当該推論モデルの再学習が行われ得る。

　以下、上記を実現するシステム構成例について詳細に説明する。

　＜２．システム構成例＞
　図１は、本開示の一実施形態に係る情報処理システムの構成例を示す説明図である。

　図１に示すように、本開示の一実施形態に係る情報処理システムは、複数の端末１０と情報処理装置２０とを備える。

　各々の端末１０と情報処理装置２０とは、ネットワーク３０を介して互いが通信可能に接続される。

　なお、図１には、本実施形態に係る情報処理システムが端末１０Ａ、端末１０Ｂ、および端末１０Ｃの、３の端末１０を備える場合を例示しているが、本実施形態に係る端末１０の数は特に限定されない。例えば、本実施形態に係る情報処理システムは、２の端末１０を備えていてもよい。または、本実施形態に係る情報処理システムは、３以上の端末１０を備えていてもよい。

　また、図１には、端末１０がスマートフォンにより実現される場合を例示しているが、端末１０は他の情報処理端末により実現されてもよい。例えば、端末１０は、ＰＣ（Personal Computer）、タブレット型端末、ゲーム機、ウェアラブルデバイス等により実現されてもよい。

　（端末１０）
　本実施形態に係る端末１０は、取得したローカルデータを学習データとして、情報処理装置２０から配布される推論モデルの学習を行う。

　端末１０は、学習結果に基づき、推論モデルの更新情報を情報処理装置２０へ送信する。更新情報は、例えば、学習の結果得られる更新後のパラメータであってもよい。または、更新前と更新後のパラメータの差分情報であってもよい。

　また、本実施形態に係る端末１０は、取得されたローカルデータに対し、プライバシー保護処理を行うことにより、プライバシー保護データを生成する。

　端末１０は、生成したプライバシー保護データを情報処理装置２０へ送信する。

　また、本実施形態に係る端末１０は、情報処理装置２０から配布される、ローカルデータのデータ傾向を示す傾向情報を受信してもよい。

　端末１０は、当該傾向情報に基づいて、新たに取得されたローカルデータのうち、異常値または不正値などの不正なデータを検知してもよい。端末１０は、検知された不正なデータを除いたローカルデータに基づいて、プライバシー保護情報を生成してもよい。

　（情報処理装置２０）
　本実施形態に係る情報処理装置２０は、複数の端末１０から取得したプライバシー保護情報に基づき生成した推論モデルを、端末１０に配布する。

　また、本実施形態に係る情報処理装置２０は、複数の端末１０から、上記推論モデルの更新情報を受信し、当該更新情報に基づいて推論モデルを更新する。

　本実施形態に係る情報処理装置２０は、更新後の推論モデルに係る、情報処理装置２０からの更新情報（更新モデル、ハイパーパラメータ等）、を複数の端末１０に配布する。

　（ネットワーク３０）
　本実施形態に係るネットワーク３０は、端末１０と情報処理装置２０との間における通信を仲介する。

　＜３．機能構成例＞
　＜＜３－１．端末１０の構成例＞＞
　続いて、本実施形態に係る端末１０の構成例について詳細に説明する。

　図２は、本実施形態に係る端末１０の構成例を示すブロック図である。

　図２に示すように、本実施形態に係る端末１０は、取得部１１０、データ処理部１３０、学習部１５０、および通信部１７０を備えていてもよい。

　（取得部１１０）
　本実施形態に係る取得部１１０は、各種のデータを収集する。

　取得部１１０により収集されるデータは、端末１０での推論モデルの学習データとして用いられてよい。

　取得部１１０は、端末１０での推論モデルの学習データの一要素として利用可能なセンサ情報を収集するための各種のセンサを備えてよい。

　例えば、取得部１１０は、通信部１７０と他の装置との無線通信に係る通信速度または帯域幅等の情報を取得してもよい。

　または、取得部１１０は、外部記憶装置等の外部装置から、学習データとして用いられる音データ、文字データ、または画像データ等の各種データを取得してもよい。画像データは、例えば医用画像であってもよい。

　以下、取得部１１０により収集される、端末１０での推論モデルの学習データとして用いられるデータを、ローカルデータと称する。

　（データ処理部１３０）
　本実施形態に係るデータ処理部１３０は、取得部１１０により取得されたローカルデータに基づいて、プライバシー保護データを生成する機能を有する。

　より詳細には、データ処理部１３０は、ローカルデータに対し、プライバシー保護処理を行う。プライバシー保護処理は、ローカルデータに含まれるプライバシー情報等の秘匿対象の要素の特定および復元を困難にする処理を指す。

　このとき、データ処理部１３０が生成するプライバシー保護データとして、いくつかのデータ形式が考えられる。

　例えば、データ処理部１３０により生成されるプライバシー保護データは、ローカルデータに対して、差分プライバシーを満たすデータ変換処理が行われたデータであってもよい。データ変換処理は、ローカルデータに含まれる要素の各々に対して、予め定められた強度の乱数を付与する処理であってもよい。

　また、差分プライバシーを満たすデータ変換処理として、例えば、ラプラスメカニズム、または、ガウシアンメカニズムが用いられてもよい。

　または、プライバシー保護データは、データ処理部１３０により、ローカルデータに対して、データの次元を削減するデータ変換処理が行われることにより生成されるデータであってもよい。この場合、データ処理部１３０は、Auto-Encoder（自己符号化器）のアルゴリズムを用いて、ローカルデータの次元削減を行ってもよい。

　または、データ処理部１３０により生成されるプライバシー保護データは、ローカルデータに対し、匿名化処理が行われることにより生成されたデータであってもよい。

　または、データ処理部１３０によるプライバシー保護データの生成の他の一例として、データ処理部１３０によりローカルデータの統計量が算出されてもよい。プライバシー保護データは、データ処理部１３０が算出されたローカルデータの統計量に対し差分プライバシーを満たすデータ変換処理を行うことにより生成された統計量データであってもよい。

　または、プライバシー保護データは、データ処理部１３０が、算出されたローカルデータの統計量に対し、秘密計算の要件を満たす暗号化処理を行うことによって生成されたデータであってもよい。

　また、本開示の一実施形態に係るデータ処理部１３０は、情報処理装置２０から、複数の端末１０全体でのデータの傾向情報を取得してもよい。

　データ処理部１３０は、傾向情報に基づき、取得部１１０により新たに取得されるローカルデータに含まれる異常値を検知してもよい。

　さらに、データ処理部１３０は、ローカルデータから、異常値と見做されたデータを修正または除外する処理を行ってもよい。データ処理部１３０は、異常値と見做されたデータが修正または除外されたローカルデータに基づいて、プライバシー保護データを生成してもよい。

　（学習部１５０）
　本実施形態に係る学習部１５０は、取得部１１０により取得されるローカルデータを学習データとして、情報処理装置２０から配布される推論モデルの学習を行う。

　学習部１５０は、上記学習の結果に基づいて、推論モデルの更新情報を出力する。更新情報は、例えば、推論モデルのパラメータの、学習の前後での差分情報であってもよい。

　（通信部１７０）
　本実施形態に係る通信部１７０は、ネットワーク３０を介して情報処理装置２０との通信を行う。

　通信部１７０は、例えば、データ処理部１３０により生成されたプライバシー保護データを、情報処理装置２０へ送信する。

　また、通信部１７０は、学習部１５０による学習の結果出力された推論モデルの更新情報を、情報処理装置２０へ送信する。

　また、通信部１７０は、情報処理装置２０から、推論モデル、および、当該推論モデルの情報処理装置２０からの更新情報等を受信する。

　以上、本実施形態に係る端末１０の構成例について述べた。なお、図２を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る端末１０の構成はかかる例に限定されない。

　本実施形態に係る端末１０は、例えば、ユーザによる情報の入力を受け付ける入力部、各種の情報を表示する表示部などをさらに備えてもよい。

　本実施形態に係る端末１０の構成は、仕様と運用に応じて柔軟に変形可能である。

　＜＜３－２．情報処理装置２０の構成例＞＞
　次に、本実施形態に係る情報処理装置２０の構成例について詳細に説明する。

　図３は、本実施形態に係る情報処理装置２０の構成例を示すブロック図である。

　図３に示すように、本実施形態に係る情報処理装置２０は、生成部２１０、学習部２３０、および通信部２５０を備えていてもよい。

　（生成部２１０）
　本実施形態に係る生成部２１０は、端末１０から取得されたプライバシー保護データの集計処理を行う。

　例えば、プライバシー保護データが暗号化処理されている場合、生成部２１０は、秘密計算の手法を用いて、プライバシー保護データを復号することなく、当該プライバシー保護データが暗号化されたままの状態で集計処理を行ってもよい。

　また、生成部２１０は、プライバシー保護データの集計処理の結果に基づき、ローカルデータの分布を推定する。

　また、生成部２１０は、プライバシー保護データがローカルデータの統計量である場合には、推定されたローカルデータの分布に基づいて、合成データを生成してもよい。本開示において、合成データとは、推定されたローカルデータの分布に基づき疑似的にサンプリングされたデータを指す。

　また、生成部２１０は、上記プライバシー保護データの集計処理の結果に基づき、ローカルデータの統計的なデータ傾向の推定結果を示す傾向情報を生成してもよい。

　傾向情報は、生成部２１０が、定期的に複数の端末１０からプライバシー保護データを収集し、一定期間ごとのプライバシー保護データの集計処理結果の差分を算出することにより生成されてもよい。

　なお、端末１０から収集され情報処理装置２０に蓄積されたプライバシー保護データのデータセットそのものが、傾向情報として用いられてもよい。

　生成部２１０は、通信部２５０に、当該傾向情報を複数の端末１０の各々へ配布させてもよい。

　さらに、生成部２１０は、プライバシー保護データの集計処理の結果に基づき、ローカルデータの分布傾向の変化を監視してもよい。

　（学習部２３０）
　本実施形態に係る学習部２３０は、連合学習により推論モデルの学習を行う。

　推論モデルは、ＣＮＮ（Convolutional Neural Network）であってもよい。この場合、例えば情報処理装置２０は、当該推論モデルを用いて、端末１０により取得される医用画像の画像認識を行い、認識結果に基づき当該医用画像から推定される疾病の診断を行ってもよい。

　または、推論モデルは、時系列データを扱うことが可能なＬＳＴＭ（Long Short-Term Memory）モデルであってもよい。この場合、例えば情報処理装置２０は、当該推論モデルを用いて、端末１０において取得される通信速度等の無線通信品質情報に基づく無線通信の品質予測を行ってもよい。

　学習部２３０は、端末１０から取得されるプライバシー保護データ、または、当該プライバシー保護データに基づき生成される合成データを学習データとして、上記推論モデルのハイパーパラメータの選定のための学習を行う。

　より詳細には、学習部２３０は、上記推論モデルの管理者により決定されるハイパーパラメータの候補値の組合せの試行パターンに応じて、全ての試行パターンが網羅されるように、推論モデルの学習を行ってもよい。

　推論モデルのハイパーパラメータは、学習部２３０による学習の結果に基づいて、推論モデルの管理者により設定されてもよい。

　また、推論モデルの初期パラメータが、学習部２３０によるハイパーパラメータ試行のための学習の結果に基づいて取得されてもよい。

　学習部２３０は、設定されたハイパーパラメータ情報を含む上記推論モデルを、複数の端末１０に配布する。

　また、本実施形態に係る学習部２３０は、端末１０から取得される推論モデルの更新情報に基づいて、当該推論モデルを更新する。

　さらに、本実施形態に係る学習部２３０は、生成部２１０によりローカルデータの分布傾向が変化したことが検知された場合、連合学習技術を用いて、上記推論モデルの再学習を行ってもよい。

　（通信部２５０）
　本実施形態に係る通信部２５０は、ネットワーク３０を介して複数の端末１０と通信を行う。通信部２５０は、情報処理装置２０の取得部の一例である。

　通信部２５０は、例えば、学習部２３０による学習の結果に基づき設定されたハイパーパラメータ情報を含む上記推論モデル、および、当該推論モデルの情報処理装置２０側からの更新情報を、端末１０に送信する。

　また、通信部２５０は、複数の端末１０から、推論モデルの更新情報を受信する。

　以上、本実施形態に係る情報処理装置２０の構成例について述べた。なお、図３を用いて説明した上記の説明はあくまで一例であり、本実施形態に係る情報処理装置２０の構成は係る例に限定されない。

　本実施形態に係る情報処理装置２０は、例えば、ユーザによる情報の入力を受け付ける入力部、各種の情報を表示する表示部などをさらに備えてもよい。

　本実施形態に係る情報処理装置２０の構成は、仕様および運用に応じて柔軟に変形可能である。

　＜４．動作例＞
　続いて、図４～図１６を参照して、本開示の一実施形態に係る情報処理システムの動作例を説明する。

　＜＜４－１．第１の動作例＞＞
　まず、図４～８を参照し、本実施形態に係る情報処理システムの第１の動作例を説明する。第１の動作例では、端末１０のデータ処理部１３０により生成されるプライバシー保護データが、ローカルデータに対して差分プライバシーを満たすデータ変換処理または／およびデータの次元を削減する処理が行われることにより生成されたデータである例を説明する。

　図４は、本実施形態に係る情報処理システムの第１の動作例を説明するためのシーケンス図である。図４に示したシーケンス図は、第１の動作例における処理の流れの概要を示す。

　まず、情報処理装置２０は、複数の端末１０の各々からプライバシー保護データを集約する（Ｓ１０１）。

　次に、情報処理装置２０は、集約されたプライバシー保護データに基づき、ハイパーパラメータ、および、初期パラメータ探索のための試行パターンに応じた推論モデルの学習を行う（Ｓ１０７）。

　次いで、情報処理装置２０および複数の端末１０は、連合学習による推論モデルの学習を行う（Ｓ１０９）。

　複数の端末１０は、それぞれの端末１０において学習済みの推論モデルを用いて、推論を行う（Ｓ１１１）。

　以降、情報処理装置２０および端末１０は、ローカルデータのデータ分布傾向の変化を監視する（Ｓ１１３）。

　データ分布傾向が変化したことが検知されると、情報処理装置２０および端末１０は、連合学習によるモデルの再学習を行う（Ｓ１１５）。

　以上、図４を用いて、本実施形態による第１の動作例を説明した。次いで、図４に示したＳ１０１、Ｓ１０７、およびＳ１０９について、より詳細な処理の流れを説明する。

　（（サブルーチンＳ１０１））
　図５は、図４に示したシーケンス図におけるＳ１０１のサブルーチンの処理の流れを説明するシーケンス図である。

　図５に示したように、まず、複数の端末１０の各々のデータ処理部１３０は、差分プライバシーを満たすデータ変換処理、または、次元削減処理等の手法により、ローカルデータへのプライバシー保護処理を行う（Ｓ２０１）。

　ここで、図６を参照して、上記プライバシー保護処理について説明する。図６は、データ処理部１３０によるプライバシー保護データの生成処理の一例を説明するための図である。図６に示したローカルデータＬＤ１は、端末１０Ａの取得部１１０により収集されたローカルデータの一例を示す。

　図６に示した変換処理後データＤＡ１は、データ処理部１３０によりローカルデータＬＤ１に基づき上記のようなデータ変換処理が行われることにより生成されたプライバシー保護データの一例を示す。

　端末１０Ａ以外の他の端末１０の各々においても、同様にローカルデータに基づきプライバシー保護データが生成される。

　端末１０の通信部１７０は、プライバシー保護処理済みのデータを、プライバシー保護データとして情報処理装置２０へ送信する（Ｓ２０３）。

　情報処理装置２０は、端末１０からプライバシー保護データを収集し、プライバシー保護データの集計処理を行う。図６に示した変換処理後データＤＡ２は、情報処理装置２０により収集されたプライバシー保護データのデータセットの一例を示す。

　また、図６に示したモデルＮ１は、情報処理装置２０が学習を行う推論モデルを示す。図６に示したように、情報処理装置２０は、変換処理後データＤＡ２に基づき、モデルＮ１の学習を行うことが出来る。

　また、情報処理装置２０は、変換処理後データＤＡ２に基づき、複数の端末１０全体でのプライバシー保護データの統計量を集計処理することが出来る。図６に示した統計量Ｓ１は、集計されたプライバシー保護データの統計量の一例を示す。

　本動作例において、プライバシー保護情報は、ローカルデータに対して差分プライバシーを満たすデータ変換処理等の、プライバシー保護処理が施されたデータである。このため、情報処理装置２０は、プライバシー保護情報の集計処理結果である統計量Ｓ１に基づいて、元のデータであるローカルデータの統計量を推定することが出来る。

　さらに、情報処理装置２０は、統計量Ｓ１に基づき、端末１０により取得されるデータ傾向の変化を検出してもよい。統計量Ｓ２は、端末１０により検出されたデータ傾向の変化を示す傾向情報の一例を示す。

　以上、図５を用いて、図４に示したシーケンス図におけるＳ１０１のサブルーチンについて説明した。

　（（サブルーチンＳ１０７））
　図７は、図４に示したシーケンス図におけるＳ１０７のサブルーチンの処理の流れを説明するシーケンス図である。

　図７に示したように、情報処理装置２０は、端末１０から受信したプライバシー保護データに基づいて、推論モデルのハイパーパラメータを選定するための試行パターンに応じた学習を行う。

　まず、推論モデルの管理者により決定されるハイパーパラメータの候補値の試行パターンのうち、１のハイパーパラメータの組合せが選定される（Ｓ２０５）。

　次いで、学習部２３０は、選定されたハイパーパラメータを用いた推論モデルの学習を行うための、推論モデルの初期パラメータを設定する（Ｓ２０７）。

　学習部２３０は、選定されたハイパーパラメータおよび初期パラメータを用い、プライバシー保護データを学習データとして推論モデルの学習を行う（Ｓ２０９）。

　情報処理装置２０は、ハイパーパラメータの全ての試行パターンが網羅されるまで、Ｓ２０５～Ｓ２０９の処理を繰り返してもよい。

　全ての試行パターン分の学習が完了すると、学習の結果に基づき、推論モデルの管理者により、推論モデルのハイパーパラメータが設定される。学習部２３０は、設定されたハイパーパラメータに応じて、推論モデルの初期パラメータを設定する（Ｓ２１１）。

　以上、図７を用いて、図４に示したシーケンス図におけるＳ１０７のサブルーチンの処理の流れについて説明した。

　なお、上記では、情報処理装置２０においてハイパーパラメータの選定のための学習が行われる例を説明したが、本開示は係る例に限定されない。例えば、上記で説明したＳ２０９における、選定されたハイパーパラメータおよび初期パラメータを用いた学習の処理の後に、端末１０が、当該学習の結果に基づき、選定されたハイパーパラメータおよび初期パラメータの評価を行ってもよい。

　さらに、Ｓ２１１において、端末１０による評価結果に基づき推論モデルのハイパーパラメータが設定されてもよい。

　（（サブルーチンＳ１０９））
　次に、図８は、図４に示したシーケンス図におけるＳ１０９のサブルーチンの処理の流れを説明するシーケンス図である。

　図８に示したように、情報処理装置２０の学習部２３０は、通信部２５０に、図４に示したＳ１０７において設定されたハイパーパラメータおよび初期パラメータの情報と共に、推論モデルの学習指示を端末１０に対して送信させる（Ｓ２１３）。

　複数の端末１０の各々は、ローカルデータを学習データとして推論モデルの学習を行う（Ｓ２１５）。

　複数の端末１０の各々は、学習の結果に基づき、推論モデルの更新情報を情報処理装置２０へ送信する（Ｓ２１７）。

　情報処理装置２０の学習部２３０は、複数の端末１０から受信した更新情報を集約し、情報処理装置２０が保持する推論モデルを更新する（Ｓ２１９）。

　以上、図４～図８を参照して、本実施形態に係る情報処理システムの第１の動作例を説明した。

　＜＜４－２．第２の動作例＞＞
　次に、図９～１１を参照して、本実施形態に係る情報処理システムの第２の動作例を説明する。

　本動作例では、プライバシー保護データが、複数の端末１０の各々により生成されたローカルデータの統計量である例を説明する。情報処理装置２０は、ローカルデータの統計量に基づいて、ローカルデータの分布を推定する。情報処理装置２０は、推定したローカルデータの分布に基づき生成した合成データを学習データとして、推論モデルの学習を行うことが出来る。

　図９は、本実施形態に係る情報処理システムの第２の動作例を説明するためのシーケンス図である。なお、図９に示したＳ１０７、Ｓ１０９、Ｓ１１１、Ｓ１１３、およびＳ１１５は、上記で図４を参照して説明した通りであるため、重複する説明を省略する。

　図９に示したように、情報処理装置２０は、端末１０により生成されるローカルデータの統計量データをプライバシー保護データとして集約する（Ｓ１３１）。

　次いで、情報処理装置２０は、集約されたプライバシー保護データ（統計量データ）に基づき、合成データを生成する（Ｓ１０５）。

　本動作例では、情報処理装置２０の情報処理装置２０３は、Ｓ１０５において生成された合成データを学習データとして、推論モデルの学習を行う。次いで、Ｓ１０７～Ｓ１１５の処理が行われる。

　図１０は、図９に示したシーケンス図のＳ１３１およびＳ１０５のサブルーチンの処理の流れを説明するためのシーケンス図である。

　（（サブルーチンＳ１３１））
　図１０に示したように、複数の端末１０のデータ処理部１３０は、ローカルデータの統計量を計算する（Ｓ３０１）。

　端末１０のデータ処理部１３０は、統計量データに対し所定のデータ変換処理を行うことにより、プライバシー保護処理を行う（Ｓ３０２）。

　ここで、図１１を参照して、本動作例におけるデータ処理部１３０によるプライバシー保護処理について説明する。図１１は、データ処理部１３０によるプライバシー保護データの生成処理の他の一例を説明するための図である。図１１に示したローカルデータＬＤ２は、端末１０Ａの取得部１１０により収集されたローカルデータの一例を示す。

　また、図１１に示したローカルデータ統計量ＬＳ１は、端末１０Ａのデータ処理部１３０により算出されたローカルデータの統計量データを示す。変換処理後統計量ＤＢ１は、データ処理部１３０により、ローカルデータ統計量ＬＳ１に差分プライバシーを満たすデータ変換処理が行われることにより生成されたプライバシー保護データの一例を示す。

　次いで、端末１０のデータ処理部１３０は、プライバシー保護処理済みの統計量のデータを、プライバシー保護データとして、通信部１７０に情報処理装置２０へ送信させる（Ｓ３０３）

　（（サブルーチンＳ１０５））
　情報処理装置２０は、複数の端末１０の各々から受信したプライバシー保護処理済みの統計量データに基づき、複数の端末１０全体でのローカルデータの分布を推定する。情報処理装置２０は、推定したローカルデータの分布に基づき、合成データを生成する（Ｓ３０４）。

　図１１に示した例では、統計量Ｓ３が、情報処理装置２０により集計されたローカルデータの統計量の一例を示す。情報処理装置２０は、統計量Ｓ３に基づきローカルデータの分布を推定し、推定された分布に基づいて合成データＧＤ１を生成する。

　情報処理装置２０は、合成データＧＤ１を学習データとして、モデルＮ１の学習を行ってもよい。

　また、情報処理装置２０は、統計量Ｓ３に基づき、傾向情報として統計量Ｓ４を算出してもよい。

　以上、図９～図１１を用いて、本実施形態に係る情報処理システムの第２の動作例を説明した。

　＜＜４－３．第３の動作例＞＞
　次に、図１２～図１６を参照して、本実施形態に係る情報処理システムの第３の動作例を説明する。

　第３の動作例では、情報処理装置２０によりプライバシー保護データに基づいて生成される、ローカルデータの分布傾向を示す傾向情報を用いて、複数の端末１０の各々において異常値の検出が行われる例を詳細に説明する。

　本動作例では、複数の端末１０により取得されるローカルデータが、画像等の入力データから抽出された特徴量の統計量と、各特徴量に関連付けられたラベル情報である例を説明する。

　例えば、特徴量は、医用画像から抽出された特徴量であってもよい。また、特徴量は、複数あってよい。

　また、本動作例では、ローカルデータに含まれるラベル情報が、入力されたデータが正解であるか不正解であるかを分類する２値分類問題における、正解および不正解の２種類のラベルである例を説明する。

　図１２は、本実施形態に係る情報処理システムの第３の動作例を説明するためのシーケンス図である。なお、図１２に示したＳ１０５、Ｓ１０７、Ｓ１０９、Ｓ１１１、Ｓ１１３、およびＳ１１５は、上記で図４および図９を参照して説明した通りであるため、重複する説明を省略する。

　図１２に示したように、情報処理装置２０および端末１０は、プライバシー保護情報として、プライバシー保護処理済みのローカルデータの統計量を集約する処理を行う。このとき、情報処理装置２０は、プライバシー保護データの集計結果に基づき推定されたローカルデータのデータ傾向を示す傾向情報を複数の端末１０の各々へ配布する（Ｓ１４１）。

　複数の端末１０の各々は、配布された傾向情報に基づき、ローカルデータに含まれる異常値を検知する（Ｓ１０３）。

　さらに、本動作例では、端末１０は、Ｓ１０９におけるモデルの学習を行う際に、ローカルデータから異常値を除いたデータを学習データとして学習を行う。

　図１３は、図１２に示したシーケンス図におけるＳ１４１およびＳ１０３のサブルーチンの処理の流れを説明するためのシーケンス図である。

　また、図１４は、本実施形態による情報処理システムの第３の動作例におけるプライバシー保護データの集約を説明するための図である。

　なお、図１３においては、端末１０Ａ、端末１０Ｂ、および端末１０Ｃによる処理が例示されているが、上述したように、本実施形態に係る端末１０の数は係る例に限定されない。本実施形態に係る情報処理システムは、２以上の端末１０を備えてもよい。

　（（サブルーチンＳ１４１））
　図１３に示したように、端末１０Ａのデータ処理部１３０は、取得したローカルデータに含まれる特徴量について、正解ラベル毎に特徴量の統計量を計算する（Ｓ４０１）。端末１０Ｂおよび端末１０Ｃにおいても、それぞれ、正解ラベル毎に特徴量の統計量が計算される（Ｓ４０２、Ｓ４０３）。

　端末１０Ａは、計算した統計量データにプライバシー保護処理を行う（Ｓ４０４）。端末１０Ｂおよび端末１０Ｃにおいても、それぞれ、プライバシー保護処理が行われる（Ｓ４０５、Ｓ４０６）

　図１４に示したローカルデータ統計量ＬＳ２、ローカルデータ統計量ＬＳ３、およびローカルデータ統計量ＬＳ４は、それぞれ、端末１０Ａ、端末１０Ｂ、および端末１０Ｃにより計算された正解ラベル毎の特徴量の統計量データにプライバシー保護処理が行われたデータである、プライバシー保護データを示す。

　次に、複数の端末１０の各々は、情報処理装置２０に、プライバシー保護処理済みの統計量データおよびラベル情報を送信する（Ｓ４０７、Ｓ４０８、Ｓ４０９）。

　情報処理装置２０の生成部２１０は、複数の端末１０から受信した統計量データの集計処理を行う（Ｓ４１０）。

　生成部２１０は、集計処理結果に基づき、正解ラベル毎のデータの傾向（特徴量の分布）を算出する（Ｓ４１１）。

　図１４に示した集計結果ＡＳ１は、情報処理装置２０による統計量データの集計処理結果を示す。また、集計結果ＡＳ２は、集計結果ＡＳ１に基づき算出された、正解ラベル毎のデータの傾向である、傾向情報を示す。

　情報処理装置２０の生成部２１０は、算出されたデータの傾向（傾向情報）を、複数の端末１０の各々へ配布する（Ｓ４１２、Ｓ４１３、Ｓ４１４）。

　（（サブルーチンＳ１０３））
　端末１０Ａは、情報処理装置２０から配布された傾向情報に基づいて、取得部１１０が取得したローカルデータに含まれる異常値の検知を行う（Ｓ４１５）。

　図１５は、本実施形態の第３の動作例における異常値の検知について説明するための概念図である。図１５に示したローカルデータ統計量ＬＳ５は、端末１０の取得部１１０が新たに取得したローカルデータに含まれる正解ラベル毎の特徴量の分布を示す。

　ローカルデータ統計量ＬＳ５に含まれる丸で示された各点は、正解のラベルが付与された特徴量の分布点を指す。また、ローカルデータ統計量ＬＳ５に含まれるＸで示された分布点は、不正解のラベルが付与された特徴量の分布点を示す。

　また、サンプル点Ｐ１は、ローカルデータ統計量ＬＳ５に含まれる、正解のラベルが付与された特徴量の分布点を示す。

　図１５に示した例では、正解のラベルが付与されている丸で示された分布点は、実線の楕円で囲まれた範囲に凡そ分布していることが理解される。一方、不正解のラベルが付与されているＸで示された分布点は、点線の楕円で囲まれた範囲に分布していることが理解される。

　サンプル点Ｐ１は、正解のラベルが付与された分布点であるが、ローカルデータ統計量ＬＳ５の分布において、実線の楕円で示される範囲から離れた位置に分布していることが理解される。

　従って、サンプル点Ｐ１は、端末１０Ａで取得されたローカルデータの分布傾向に基づけば、異常値と見做され得る。

　しかし、端末１０Ａのみで得られるローカルデータの分布の傾向の情報だけでは、サンプル点Ｐ１が、複数の端末１０全体で見たときのローカルデータの分布傾向においても異常値と見做せるか否かが確かではない。

　そこで、図１６を参照して、本動作例における異常値の検知について説明する。図１６は、本実施形態の第３の動作例における異常値の検知について説明するための他の概念図である。図１６に示した分布範囲ＡＣ１および分布範囲ＡＣ２は、情報処理装置２０から端末１０Ａに配布された傾向情報に基づくデータの分布傾向を示す。

　図１６に示したように、サンプル点Ｐ１は、分布範囲ＡＣ１の分布範囲に含まれない。従って、サンプル点Ｐ１は、複数の端末１０全体でのローカルデータの分布傾向においても、異常値と見做し得ることが理解される。

　端末１０Ａは、このように、情報処理装置２０から配布された、複数の端末１０全体でのローカルデータの分布傾向に基づいて、ローカルデータに含まれる異常値をより高精度に検知し得る。

　端末１０Ｂ、および端末１０Ｃにおいても、情報処理装置２０から配布された傾向情報を用いて、ローカルデータに含まれる異常値の検知が行われる（Ｓ４１６、Ｓ４１７）。

　以上、図１２～図１６を参照して、本実施形態に係る情報処理システムの第３の動作例を説明した。

　＜５．変形例＞
　次に、図１７～図１９を用いて、上記で説明した本実施形態に係る情報処理システムの変形例を説明する。

　本変形例では、情報処理装置２０および端末１０は、連合学習により、合成データを生成するための生成モデルを生成する。情報処理装置２０は、当該生成モデルにより生成された合成データを学習データとして、推論モデルの学習を行う。

　図１７は、本実施形態の変形例におけるプライバシー保護データの生成について説明するための図である。

　図１７に示したローカルデータＬＤ３は、端末１０Ａにより取得されるローカルデータを示す。

　また、生成モデルＧＮは、情報処理装置２０および端末１０の連合学習により生成される生成モデルを示す。生成モデルＧＮ１は、複数の端末１０の各々により学習が行われる生成モデルであり、生成モデルＧＮ２と対応するモデルである。生成モデルＧＮ２は、情報処理装置２０により、生成モデルＧＮ１の各々の学習結果に基づいて更新される生成モデルである。

　端末１０Ａは、ローカルデータＬＤ３を学習データとして、生成モデルＧＮ１の学習を行う。生成モデルＧＮ１は、端末１０Ａによる学習済みの生成モデルを示す。

　端末１０Ａは、生成モデルＧＮ１の学習の結果得られる、生成モデルの更新情報を情報処理装置２０に送信する。

　端末１０Ａ以外の端末１０（端末１０Ｂ、端末１０Ｃ）においても、同様に生成モデルの学習が行われ、当該生成モデルの更新情報が情報処理装置２０へ送信される。

　上記生成モデルは、例えば、学習過程において、損失関数の勾配およびパラメータにノイズを付与することにより、学習済みの生成モデルから学習データが特定されることを防ぐ生成モデルである、ＤＰＧＡＮ（Differential Privacy Generative Adversarial Network）のアルゴリズムにより生成されたモデルであってもよい。

　この場合、端末１０から情報処理装置２０へ送信される生成モデルの更新情報から、ローカルデータが推測されることを防ぐことが出来る。従って、本実施形態による情報処理システムのセキュリティ性をより高めることが出来る。

　情報処理装置２０は、更新後の生成モデルＧＮ２または更新後の生成モデルＧＮ２のパラメータ情報を、端末１０の各々に配布してもよい。

　情報処理装置２０は、学習済みの上記生成モデルを用いて、合成データを生成する。図１７に示した合成データＧＤ２は、生成モデルＧＮ２を用いて生成された合成データを示す。

　情報処理装置２０は、合成データＧＤ２を学習データとして、モデルＮ１の学習を行ってもよい。

　また、情報処理装置２０は、生成した合成データに基づき、ローカルデータのデータ傾向を監視してもよい。図１７に示した例では、統計量Ｓ５は、合成データＧＤ２に基づき推定されたローカルデータの統計量から生成される傾向情報のデータを示す。

　上記変形例のような情報処理システムによれば、端末１０において取得されるローカルデータそのものが情報処理装置２０に集約されることなく、推論モデルの学習が行われ得る。従って、本情報処理システムにおけるプライバシーの保護を担保することが出来る。

　また、本変形例によれば、ローカルデータを学習データとして生成された生成モデルを用いて合成データが生成される。これにより、実際に学習に用いられるデータにより近い合成データが生成され得る。従って、情報処理装置２０による推論モデルの推論精度が向上し得る。

　次に、図１８および図１９を用いて、上述した本実施形態による情報処理システムの変形例での動作例を説明する。

　図１８は、本実施形態による情報処理システムの変形例での動作例を説明するためのシーケンス図である。図１８に示したＳ１０３、Ｓ１０７、Ｓ１０９、Ｓ１１１、Ｓ１１３、およびＳ１１５は、上記で図４、図９、および図１２を参照して説明した通りであるので、重複する説明を省略する。

　図１８に示したように、まず、情報処理装置２０および端末１０は、生成モデルを連合学習により学習する（Ｓ１５１）。

　情報処理装置２０は、次に、上記生成モデルに基づいて合成データを生成する（Ｓ１５５）。

　本変形例では、情報処理装置２０の学習部２３０は、生成モデルに基づき生成された合成データを学習データとして推論モデルの学習を行う。

　図１９は、図１８に示したシーケンス図におけるＳ１５１およびＳ１５５のサブルーチンの処理の流れを説明するシーケンス図である。

　（（サブルーチンＳ１５１））
　図１９に示したように、情報処理装置２０の学習部２３０は、複数の端末１０の各々に、生成モデルの初期パラメータおよびハイパーパラメータの設定値を含む学習指示を送信する。（Ｓ５００）。

　なお、初期パラメータおよびハイパーパラメータには、Ｓ５００～Ｓ５０３の連合学習Ｌｏｏｐの初回においては、ランダムに設定された値が用いられてもよい。

　次に、複数の端末１０の学習部１５０は、ローカルデータを学習データとして、情報処理装置２０から学習指示を受信した生成モデルの学習を行う（Ｓ５０１）。

　学習部１５０の各々は、学習結果に基づき、通信部１７０に、生成モデルの更新情報を情報処理装置２０に対して送信させる（Ｓ５０２）。

　情報処理装置２０は、複数の端末１０の各々から受信した生成モデルの更新情報を集約し、集約結果に基づいて生成モデルを更新する（Ｓ５０３）。

　情報処理装置２０および端末１０は、生成モデルの学習が収束するまで、Ｓ５００～Ｓ５０２の処理を繰り返す。

　（（サブルーチンＳ１５５））
　次いで、情報処理装置２０の生成部２１０は、学習済みの生成モデルを用いて合成データを生成する（Ｓ５０４）。

　以上、図１８および図１９を参照して、本実施形態による情報処理システムの変形例での動作例を説明した。

　＜６．ハードウェア構成＞
　以上、本開示の実施形態を説明した。次に、本開示の一実施形態に係る端末１０および情報処理装置２０に共通するハードウェア構成例について説明する。

　図２０は、本開示の一実施形態に係るハードウェア構成９０を示すブロック図である。

　ハードウェア構成９０は、端末１０および情報処理装置２０に適用され得る。

　図２０に示すように、ハードウェア構成９０は、例えば、プロセッサ９０１、ＲＯＭ（Read Only Memory）９０３、ＲＡＭ（Random Access Memory）９０５、ホストバス９０７、ブリッジ９０９、外部バス９１１、インターフェース９１３、入力装置９１５、出力装置９１７、ストレージ装置９１９、ドライブ９２１、接続ポート９２３、および、通信装置９２５を備える。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

　（プロセッサ９０１）
　プロセッサ９０１は、例えば、演算処理装置および制御装置として機能し、ＲＯＭ９０３、ＲＡＭ９０５、ストレージ装置９１９、またはリムーバブル記録媒体９２７に記録された各種プログラムに基づいて各構成要素の動作全般またはその一部を制御する。

　（ＲＯＭ９０３、ＲＡＭ９０５）
　ＲＯＭ９０３は、プロセッサ９０１に読み込まれるプログラムまたは／および演算に用いられるデータ等を格納する手段である。ＲＡＭ９０５には、例えば、プロセッサ９０１に読み込まれるプログラムまたは／および、当該プログラムを実行する際に適宜変化する各種パラメータ等が一時的または永続的に格納される。

　（ホストバス９０７、ブリッジ９０９、外部バス９１１、インターフェース９１３）
　プロセッサ９０１、ＲＯＭ９０３、およびＲＡＭ９０５は、例えば、高速なデータ伝送が可能なホストバス９０７を介して相互に接続される。一方、ホストバス９０７は、例えば、ブリッジ９０９を介して比較的データ伝送速度が低速な外部バス９１１に接続される。また、外部バス９１１は、インターフェース９１３を介して種々の構成要素と接続される。

　（入力装置９１５）
　入力装置９１５には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチおよびレバーなどが用いられる。さらに、入力装置９１５としては、赤外線またはその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置９１５には、マイクロフォンなどの音声入力装置が含まれる。

　また、入力装置９１５は、撮像装置、およびセンサを含んでもよい。撮像装置は、例えば、ＣＣＤ（Charge Coupled Device）またはＣＭＯＳ（Complementary Metal Oxide Semiconductor）などの撮像素子、および撮像素子への被写体像の結像を制御するためのレンズなどの各種の部材を用いて実空間を撮像し、撮像画像を生成する装置である。撮像装置は、静止画を撮像するものであってもよいし、また動画を撮像するものであってもよい。

　センサは、例えば、測距センサ、加速度センサ、ジャイロセンサ、地磁気センサ、振動センサ、光センサ、音センサなどの各種のセンサである。センサは、例えばハードウェア構成９０の筐体の姿勢など、ハードウェア構成９０自体の状態に関する情報、または、ハードウェア構成９０の周辺の明るさまたは騒音など、ハードウェア構成９０の周辺環境に関する情報を取得する。また、センサは、ＧＰＳ（Global Positioning System）信号を受信して装置の緯度、経度および高度を測定するＧＰＳセンサを含んでもよい。

　（出力装置９１７）
　出力装置９１７は、例えば、ＣＲＴ（Cathode Ray Tube）、ＬＣＤ（Liquid Crystal Display）、または有機ＥＬ（Electro-Luminescence）などのディスプレイ装置、スピーカおよびヘッドホンなどのオーディオ出力装置、プリンタ、携帯電話、またはファクシミリ等、取得した情報を利用者に対して視覚的または聴覚的に通知することが可能な種々の振動デバイスを含む。

　（ストレージ装置９１９）
　ストレージ装置９１９は、各種のデータを格納するための装置である。ストレージ装置９１９としては、例えば、ハードディスクドライブ（HDD）などの磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイスなどが用いられる。

　（ドライブ９２１）
　ドライブ９２１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体９２７に記録された情報を読み出し、またはリムーバブル記録媒体９２７に情報を書き込む装置である。

　（リムーバブル記録媒体９２７）
　リムーバブル記録媒体９２７は、例えば、ＤＶＤメディア、Ｂｌｕ－ｒａｙ（登録商標）メディア、ＨＤ　ＤＶＤメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体９２７は、例えば、非接触型ＩＣチップを搭載したＩＣカード、または電子機器等であってもよい。

　（接続ポート９２３）
　接続ポート９２３は、例えば、ＵＳＢ（Universal Serial Bus）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Small Computer System Interface）ポート、ＲＳ－２３２Ｃポート、または光オーディオ端子等のような外部接続機器９２９を接続するためのポートである。

　（外部接続機器９２９）
　外部接続機器９２９は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、またはＩＣレコーダ等である。

　（通信装置９２５）
　通信装置９２５は、ネットワークに接続するための通信デバイスであり、例えば、有線または無線ＬＡＮ（Local Area Network）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、またはＷＵＳＢ（Wireless USB）用の通信カード、光通信用のルータ、ＡＤＳＬ（Asymmetric Digital Subscriber Line）用のルータ、または、各種通信用のモデムなどである。

　＜７．まとめ＞
　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　例えば、本実施形態による端末１０、および情報処理装置２０の動作の処理におけるステップは、必ずしも説明図として記載された順序に沿って時系列に処理される必要はない。例えば、端末１０および情報処理装置２０の動作の処理における各ステップは、説明図として記載した順序と異なる順序で処理されてもよく、並列的に処理されてもよい。

　また、上述した端末１０および情報処理装置２０に内蔵されるプロセッサ、ＲＯＭおよびＲＡＭなどのハードウェアに、本実施形態による情報処理システムの機能を発揮させるための１以上のコンピュータプログラムも作成可能である。また、当該１以上のコンピュータプログラムを記憶させた、コンピュータが読み取り可能な記憶媒体も提供される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　連合学習により推論モデルの学習を行う学習部と、
　複数の端末の各々により得られるローカルデータに対してプライバシー保護処理が行われたデータであるプライバシー保護データを、前記複数の端末から取得する取得部と、を備え、
　前記学習部は、
　　前記プライバシー保護データに基づいて前記推論モデルの学習を行い、
　　前記学習の結果に基づいて設定される前記推論モデルのハイパーパラメータを含む前記推論モデルに関する情報を前記複数の端末に配布し、
　前記取得部は、
　　前記複数の端末から、前記複数の端末の各々により、前記ローカルデータを学習データとして、配布された前記ハイパーパラメータを用いた前記推論モデルの学習が行われることにより得られる前記推論モデルの更新情報を取得し、
　前記学習部は、
　　前記更新情報を用いて前記推論モデルを更新する、
　情報処理装置。
（２）
　前記学習部は、前記プライバシー保護データを学習データとして前記推論モデルの学習を行う、
　前記（１）に記載の情報処理装置。
（３）
　前記プライバシー保護データに基づいて合成データを生成する生成部をさらに備え、
　前記学習部は、前記合成データを学習データとして前記推論モデルの学習を行う、
　前記（１）に記載の情報処理装置。
（４）
　前記プライバシー保護データは、前記ローカルデータに対して、差分プライバシーを満たすデータ変換処理が行われることにより生成されたデータである、
　前記（２）または（３）に記載の情報処理装置。
（５）
　前記データ変換処理は、前記ローカルデータに含まれる要素の各々に対して、予め定められた強度の乱数を付与する処理である、
　前記（４）に記載の情報処理装置。
（６）
　前記データ変換処理は、ラプラスメカニズム、または、ガウシアンメカニズムを用いて実施される、前記（５）に記載の情報処理装置。
（７）
　前記プライバシー保護データは、前記ローカルデータに対して、前記ローカルデータの次元を削減するデータ変換処理が行われることにより生成される、
　前記（２）に記載の情報処理装置。
（８）
　前記プライバシー保護データは、前記ローカルデータの統計量データに対し差分プライバシーを満たすデータ変換処理が行われることにより生成された統計量データであり、
　前記生成部は、前記プライバシー保護データに基づき前記ローカルデータの分布を推定し、
　推定された前記分布に基づいて前記合成データを生成する、
　前記（３）に記載の情報処理装置。
（９）
　前記プライバシー保護データは、前記ローカルデータの統計量データに対し、秘密計算における要件を満たす暗号化処理が行われることにより生成された統計量データであり、
　前記生成部は、前記プライバシー保護データが暗号化されたままの状態で、前記プライバシー保護データの集計処理を行い、
　前記集計処理の結果に基づいて前記ローカルデータの分布を推定し、
　推定された前記分布に基づいて前記合成データを生成する、
　前記（３）に記載の情報処理装置。
（１０）
　前記生成部は、前記プライバシー保護データの集計処理を行い、
　当該集計処理の結果に基づき、前記ローカルデータの統計的なデータ傾向を示す傾向情報を前記複数の端末の各々に配布し、
　前記取得部は、前記複数の端末の各々により前記傾向情報に基づき異常値と見做されたローカルデータを修正または除外して生成された前記プライバシー保護データを、前記複数の端末の各々から取得する、
　前記（３）に記載の情報処理装置。
（１１）
　前記プライバシー保護データは、前記ローカルデータに含まれる要素の特徴量および各特徴量に関連付けられたラベル情報を含み、
　前記生成部は、前記ラベル情報ごとの前記特徴量の分布を、前記傾向情報として配布する、
　前記（１０）に記載の情報処理装置。
（１２）
　前記生成部は、前記プライバシー保護データの集計処理結果に基づき前記ローカルデータの分布傾向の変化を監視し、
　前記学習部は、前記生成部により前記分布傾向が変化したことが検知されると、連合学習を用いて前記推論モデルの再学習を行う、
　前記（３）に記載の情報処理装置。
（１３）
　前記生成部は、前記プライバシー保護データまたは前記ローカルデータから推定される前記ローカルデータの分布情報に基づいて生成される生成モデルに基づき、前記合成データを生成する、
　前記（３）に記載の情報処理装置。
（１４）
　前記取得部は、前記複数の端末から、前記推論モデルの更新情報として、更新前および更新後の推論モデルのパラメータの差分を示す差分情報を取得し、
　前記学習部は、当該差分情報に基づいて前記推論モデルを更新する、
　前記（１）～（１４）のいずれか一項に記載の情報処理装置。
（１５）
　プロセッサが、
　連合学習により推論モデルの学習を行うことと、
　複数の端末の各々により得られるローカルデータに対してプライバシー保護処理が行われたデータであるプライバシー保護データを、前記複数の端末から取得することと、
　前記プライバシー保護データに基づいて前記推論モデルの学習を行うことと、
　前記学習の結果に基づいて設定される前記推論モデルのハイパーパラメータを含む前記推論モデルに関する情報を前記複数の端末に配布することと、
　前記複数の端末から、前記複数の端末の各々により、前記ローカルデータを学習データとして、配布された前記ハイパーパラメータを用いた前記推論モデルの学習が行われることにより得られる前記推論モデルの更新情報を取得することと、
　前記更新情報を用いて前記推論モデルを更新することと、
　を含む、コンピュータにより実行される情報処理方法。
（１６）
　コンピュータを、
　連合学習により推論モデルの学習を行う学習部と、
　複数の端末の各々により得られるローカルデータに対してプライバシー保護処理が行われたデータであるプライバシー保護データを、前記複数の端末から取得する取得部と、を備え、
　前記学習部は、
　　前記プライバシー保護データに基づいて前記推論モデルの学習を行い、
　　前記学習の結果に基づいて設定される前記推論モデルのハイパーパラメータを含む前記推論モデルに関する情報を前記複数の端末に配布し、
　前記取得部は、
　　前記複数の端末から、前記複数の端末の各々により、前記ローカルデータを学習データとして、配布された前記ハイパーパラメータを用いた前記推論モデルの学習が行われることにより得られる前記推論モデルの更新情報を取得し、
　前記学習部は、
　　前記更新情報を用いて前記推論モデルを更新する、
　情報処理装置、として機能させるための、プログラム。

　１０　端末
　１１０　取得部
　１３０　データ処理部
　１５０　学習部
　１７０　通信部
　２０　情報処理装置
　２１０　生成部
　２３０　学習部
　２５０　通信部
　３０　ネットワーク

Claims

　連合学習により推論モデルの学習を行う学習部と、
　複数の端末の各々により得られるローカルデータに対してプライバシー保護処理が行われたデータであるプライバシー保護データを、前記複数の端末から取得する取得部と、を備え、
　前記学習部は、
　　前記プライバシー保護データに基づいて前記推論モデルの学習を行い、
　　前記学習の結果に基づいて設定される前記推論モデルのハイパーパラメータを含む前記推論モデルに関する情報を前記複数の端末に配布し、
　前記取得部は、
　　前記複数の端末から、前記複数の端末の各々により、前記ローカルデータを学習データとして、配布された前記ハイパーパラメータを用いた前記推論モデルの学習が行われることにより得られる前記推論モデルの更新情報を取得し、
　前記学習部は、
　　前記更新情報を用いて前記推論モデルを更新する、
　情報処理装置。
　前記学習部は、前記プライバシー保護データを学習データとして前記推論モデルの学習を行う、
　請求項１に記載の情報処理装置。
　前記プライバシー保護データに基づいて合成データを生成する生成部をさらに備え、
　前記学習部は、前記合成データを学習データとして前記推論モデルの学習を行う、
　請求項１に記載の情報処理装置。
　前記プライバシー保護データは、前記ローカルデータに対して、差分プライバシーを満たすデータ変換処理が行われることにより生成されたデータである、
　請求項２に記載の情報処理装置。
　前記データ変換処理は、前記ローカルデータに含まれる要素の各々に対して、予め定められた強度の乱数を付与する処理である、
　請求項４に記載の情報処理装置。
　前記データ変換処理は、ラプラスメカニズム、または、ガウシアンメカニズムを用いて実施される、
　請求項５に記載の情報処理装置。
　前記プライバシー保護データは、前記ローカルデータに対して、前記ローカルデータの次元を削減するデータ変換処理が行われることにより生成される、
　請求項２に記載の情報処理装置。
　前記プライバシー保護データは、前記ローカルデータの統計量データに対し差分プライバシーを満たすデータ変換処理が行われることにより生成された統計量データであり、
　前記生成部は、前記プライバシー保護データに基づき前記ローカルデータの分布を推定し、
　推定された前記分布に基づいて前記合成データを生成する、
　請求項３に記載の情報処理装置。
　前記プライバシー保護データは、前記ローカルデータの統計量データに対し、秘密計算における要件を満たす暗号化処理が行われることにより生成された統計量データであり、
　前記生成部は、前記プライバシー保護データが暗号化されたままの状態で、前記プライバシー保護データの集計処理を行い、
　前記集計処理の結果に基づいて前記ローカルデータの分布を推定し、
　推定された前記分布に基づいて前記合成データを生成する、
　請求項３に記載の情報処理装置。
　前記生成部は、前記プライバシー保護データの集計処理を行い、
　当該集計処理の結果に基づき、前記ローカルデータの統計的なデータ傾向を示す傾向情報を前記複数の端末の各々に配布し、
　前記取得部は、前記複数の端末の各々により前記傾向情報に基づき異常値と見做されたローカルデータを修正または除外して生成された前記プライバシー保護データを、前記複数の端末の各々から取得する、
　請求項３に記載の情報処理装置。
　前記プライバシー保護データは、前記ローカルデータに含まれる要素の特徴量および各特徴量に関連付けられたラベル情報を含み、
　前記生成部は、前記ラベル情報ごとの前記特徴量の分布を、前記傾向情報として配布する、
　請求項１０に記載の情報処理装置。
　前記生成部は、前記プライバシー保護データの集計処理結果に基づき前記ローカルデータの分布傾向の変化を監視し、
　前記学習部は、前記生成部により前記分布傾向が変化したことが検知されると、連合学習を用いて前記推論モデルの再学習を行う、
　請求項３に記載の情報処理装置。
　前記生成部は、前記プライバシー保護データまたは前記ローカルデータから推定される前記ローカルデータの分布情報に基づいて生成される生成モデルに基づき、前記合成データを生成する、
　請求項３に記載の情報処理装置。
　前記取得部は、前記複数の端末から、前記推論モデルの更新情報として、更新前および更新後の推論モデルのパラメータの差分を示す差分情報を取得し、
　前記学習部は、当該差分情報に基づいて前記推論モデルを更新する、
　請求項１に記載の情報処理装置。
　プロセッサが、
　連合学習により推論モデルの学習を行うことと、
　複数の端末の各々により得られるローカルデータに対してプライバシー保護処理が行われたデータであるプライバシー保護データを、前記複数の端末から取得することと、
　前記プライバシー保護データに基づいて前記推論モデルの学習を行うことと、
　前記学習の結果に基づいて設定される前記推論モデルのハイパーパラメータを含む前記推論モデルに関する情報を前記複数の端末に配布することと、
　前記複数の端末から、前記複数の端末の各々により、前記ローカルデータを学習データとして、配布された前記ハイパーパラメータを用いた前記推論モデルの学習が行われることにより得られる前記推論モデルの更新情報を取得することと、
　前記更新情報を用いて前記推論モデルを更新することと、
　を含む、コンピュータにより実行される情報処理方法。
　コンピュータを、
　連合学習により推論モデルの学習を行う学習部と、
　複数の端末の各々により得られるローカルデータに対してプライバシー保護処理が行われたデータであるプライバシー保護データを、前記複数の端末から取得する取得部と、を備え、
　前記学習部は、
　　前記プライバシー保護データに基づいて前記推論モデルの学習を行い、
　　前記学習の結果に基づいて設定される前記推論モデルのハイパーパラメータを含む前記推論モデルに関する情報を前記複数の端末に配布し、
　前記取得部は、
　　前記複数の端末から、前記複数の端末の各々により、前記ローカルデータを学習データとして、配布された前記ハイパーパラメータを用いた前記推論モデルの学習が行われることにより得られる前記推論モデルの更新情報を取得し、
　前記学習部は、
　　前記更新情報を用いて前記推論モデルを更新する、
　情報処理装置、として機能させるための、プログラム。