JP2023121503A

JP2023121503A - 計算機システム、学習方法、及びエッジ装置

Info

Publication number: JP2023121503A
Application number: JP2022024877A
Authority: JP
Inventors: 崇仁谷村; Takahito Tanimura
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2022-02-21
Filing date: 2022-02-21
Publication date: 2023-08-31
Also published as: WO2023157550A1

Abstract

【課題】エッジ装置及びサーバ間の通信状態を考慮した連合学習を提供する。【解決手段】計算機システムは、学習に使用するデータを取得し、データを用いてタスクに関する推論に用いる第１モデルを生成するための学習処理を実行するエッジ装置と、複数のエッジ装置の各々によって生成された第１モデルを用いて第２モデルを生成し、第２モデルを前記複数のエッジ装置に送信するサーバ装置と、を備える。エッジ装置は、エッジ装置及びサーバ装置の間の通信路の通信状態に関する通信状態情報を取得し、通信状態情報に基づいてモデルのデータサイズを削減するための縮減処理に使用するパラメータを算出し、パラメータに基づいて第１モデルに対して縮減処理を実行し、縮減された第１モデルをサーバ装置に送信する。【選択図】図１

Description

本発明は、連合学習に関する。

タスクの推論を行うモデルの学習では大量のデータが必要となるため、複数の組織又は複数の拠点からデータを収集する方法が考えられる。しかし、個人情報のプライバシー保護及びセキュリティの観点からデータの収集が困難になっている。

データを直接収集することなく汎用的なモデルを生成する方法として連合学習が注目されている。連合学習は、各組織又は各拠点でモデルを学習し、複数のモデルを集約及び統合することによって汎用的なモデルを生成する学習方法である。

特開２０１２－１０３８７９号公報

連合学習では、モデルを学習するエッジ装置と、モデルを集約及び統合するサーバとの間でモデルの情報が送受信される。モデルの情報が大きい場合、エッジ装置及びサーバ間の通信帯域が逼迫するという問題がある。これに対して、特許文献１に記載の技術が知られている。

特許文献１には「ネットワーク係数圧縮装置は、推論部と、学習部と、を備える。推論部は、学習されたニューラルネットワークの入力層に入力された入力データに対する、ニューラルネットワークの隠れ層または出力層の出力値を出力する。学習部は、ニューラルネットワークのネットワーク係数の非可逆圧縮を行いながら、入力データと出力値を教師データとしてネットワーク係数を学習し、圧縮されたネットワーク係数を生成する」ことが記載されている。

特許文献１等の従来技術では、エッジ装置及びサーバ間の通信状態（例えば、通信帯域の空き等）を考慮したものではない。したがって、従来技術では、通信帯域の逼迫が発生し、モデルの正常な送受信が行われない等の問題が発生する可能性がある。

本発明は、エッジ装置及びサーバ間の通信状態を考慮したモデルの縮減手法を組み込んだ連合学習を実行するシステム、装置、及び方法を提供する。

本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、計算機システムであって、学習に使用するデータを取得し、前記データを用いてタスクに関する推論に用いる第１モデルを生成するための学習処理を実行するエッジ装置と、前記複数のエッジ装置の各々によって生成された前記第１モデルを用いて第２モデルを生成し、前記第２モデルを前記複数のエッジ装置に送信するサーバ装置と、を備え、前記エッジ装置は、前記エッジ装置及び前記サーバ装置の間の通信路の通信状態に関する通信状態情報を取得し、前記通信状態情報に基づいて、モデルのデータサイズを削減するための縮減処理に使用する第１パラメータを算出し、前記第１パラメータに基づいて、生成された前記第１モデルに対して前記縮減処理を実行し、前記縮減処理が実行された前記第１モデルを前記サーバ装置に送信する。

本発明によれば、連合学習において、エッジ装置は、エッジ装置及びサーバ間の通信状態を考慮してモデルを縮減し、サーバに送信することができる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

実施例１の計算機システムの構成例を示す図である。実施例１のエッジ装置のハードウェア構成の一例を示す図である。実施例１の推論部の構成の一例を示す図である。実施例１の推論部の構成の一例を示す図である。実施例１のエッジ装置が連合学習において実行する処理の一例を説明するフローチャートである。実施例１のサーバ装置が連合学習において実行する処理の一例を説明するフローチャートである。実施例１のエッジ装置が実行する推論処理の一例を説明するフローチャートである。エッジ装置の機能構成の変形例を示す図である。実施例１の学習監視装置が表示する画面の一例を示す図である。

以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施例の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。

以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。

本明細書等における「第１」、「第２」、「第３」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。

図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。

図１は、実施例１の計算機システムの構成例を示す図である。図２は、実施例１のエッジ装置のハードウェア構成の一例を示す図である。

計算機システムは、サーバ装置１００、複数のエッジ装置１０１、通信路監視装置１０２、及び学習監視装置１０３から構成される。サーバ装置１００及びエッジ装置１０１は、通信路１０５を介して互いに通信する。通信路監視装置１０２は、通信路１０５又は図示しないネットワークを介してサーバ装置１００及びエッジ装置１０１と接続する。また、学習監視装置１０３は、通信路１０５又は図示しないネットワークを介して、サーバ装置１００、複数のエッジ装置１０１、及び通信路監視装置１０２と接続する。

学習監視装置１０３は、サーバ装置１００、複数のエッジ装置１０１、及び通信路監視装置１０２のパラメータ設定及びステータスを監視する。学習監視装置１０３は、例えば、図８に示す画面８００を介して監視結果を提示する。画面８００は、エッジ装置選択欄８０１、監視結果表示欄８０２、及びメッセージ欄８０３を含む。エッジ装置選択欄８０１は、監視結果を参照するエッジ装置１０１を選択するための欄であり、学習監視装置１０３が監視するエッジ装置１０１を表すアイコンが表示される。監視結果表示欄８０２は、エッジ装置選択欄８０１にて選択されたエッジ装置１０１の監視結果（パラメータ設定及びステータス）を表示する欄である。メッセージ欄８０３は、計算機システムの状況を表すメッセージを表示する欄である。

サーバ装置１００及び複数のエッジ装置１０１は連合学習を行うように構成される。連合学習において、エッジ装置１０１は、ローカルデータの収集、ローカルデータを用いたモデルの学習、及びサーバ装置１００へのローカルモデルの送信を行う。また、サーバ装置１００は、ローカルモデルを用いたグローバルモデルの生成、及びエッジ装置１０１へのグローバルモデルの送信を行う。

通信路監視装置１０２は、通信路１０５の通信状態を監視する。ここで、通信路１０５の通信状態とは、通信レイテンシ、スループット、無線周波数帯域等の通信リソース利用率、及びこれらの確率的分布等を表す。これらの通信状態は、時間的に変化するものであってもよい。

エッジ装置１０１は、図２に示すようなバードウェア構成の計算機であって、プロセッサ２０１、主記憶装置２０２、副記憶装置２０３、及びネットワークインタフェース２０４を有する。各ハードウェア要素は内部バス２０５を介して互いに接続される。

プロセッサ２０１は、主記憶装置２０２に格納されるプログラムを実行する。プロセッサ２０１がプログラムにしたがって処理を実行することによって、特定の機能を実現する機能部（モジュール）として動作する。例えば、プロセッサ２０１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）等である。以下の説明では、機能部を主語に処理を説明する場合、プロセッサ２０１が当該機能部を実現するプログラムを実行していることを示す。

主記憶装置２０２は、例えば、ＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）であり、プロセッサ２０１が実行するプログラム及びプログラムが使用するデータを格納する。主記憶装置２０２は、また、ワークエリアとしても使用される。

副記憶装置２０３は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）及びＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等であり、データを永続的に格納する。主記憶装置２０２に格納されるプログラム及びデータは、副記憶装置２０３に格納されてもよい。この場合、プロセッサ２０１が副記憶装置２０３からプログラム及び情報を読み出し、主記憶装置２０２にロードする。

ネットワークインタフェース２０４は、ネットワークを介して外部装置と接続するためのインタフェースである。

なお、エッジ装置１０１のハードウェア構成は一例であってこれに限定されない。キーボード、マウス、タッチパネル等の入力装置を有してもよいし、また、ディスプレイ及びプリンタ等の出力装置を有してもよい。また、エッジ装置１０１は、サーバ装置１００内のプログラムとして仮想的に実現されてもよい。

サーバ装置１００及び通信路監視装置１０２のハードウェア構成は、エッジ装置１０１と同一であるため説明を省略する。

サーバ装置１００は、機能構成として、送受信部１１０、ローカルモデル縮減部１１１、縮減化設定部１１２、グローバルモデル生成部１１３、及びグローバルモデル縮減部１１４を有する。

送受信部１１０は、サーバ装置１００及び外部装置の間のデータの送受信を制御する。ローカルモデル縮減部１１１は、エッジ装置１０１から受信したローカルモデルを縮減する。縮減化設定部１１２は、通信路１０５の通信状態に基づいてローカルモデルの縮減度合いを決定するパラメータを設定する。なお、エッジ装置１０１毎にパラメータが設定される。グローバルモデル生成部１１３は、複数のエッジ装置１０１から受信したローカルモデルを用いてグローバルモデルを生成する。グローバルモデル縮減部１１４は、縮減化設定部１１２によって設定されたパラメータに基づいて、グローバルモデル生成部１１３によって生成されたグローバルモデルを縮減し、エッジ装置１０１に送信する。なお、エッジ装置１０１毎にグローバルモデルが縮減される。

なお、サーバ装置１００は、エッジ装置１０１毎にローカルモデル縮減部１１１を有してもよい。

エッジ装置１０１は、機能構成として、送受信部１２０、縮減化設定部１２１、学習部１２２、ローカルモデル縮減部１２３、及び推論部１２４を有する。

送受信部１２０は、エッジ装置１０１及び外部装置の間のデータの送受信を制御する。縮減化設定部１２１は、通信路１０５の通信状態に基づいてローカルモデルの縮減度合いを決定するパラメータを設定する。学習部１２２は、ローカルデータを用いて学習処理を実行する。ローカルモデル縮減部１２３は、縮減化設定部１２１によって設定されたパラメータに基づいて、学習部１２２によって生成されたローカルモデルを縮減し、サーバ装置１００に送信する。推論部１２４は、サーバ装置１００から受信したグローバルモデル及びタスクデータを用いてタスクの推論を行う。

ここで、推論部１２４は様々な構成が考えられる。図３Ａ及び図３Ｂは、実施例１の推論部１２４の構成の一例を示す図である。

図３Ａの推論部１２４は、特徴抽出部３００及びタスク推論部３０１を含む。特徴抽出部３００は、タスクデータから特徴量を抽出する。タスク推論部３０１は、特徴量を用いてタスクの推論を行って、推論結果を出力する。図３Ａの推論部１２４では、特徴抽出部３００が使用するモデル（特徴抽出モデル）と、タスク推論部３０１が使用するモデル（タスク推論モデル）とが必要となる。この場合、二つのモデルを連合学習の対象のモデル（ローカルモデル）として扱ってもよいし、いずれか一方のモデルをローカルモデルとして扱ってもよい。図３Ａに示す構成の推論部１２４の場合、学習部１２２は、各モデルを生成する学習部に分割してもよい。

図３Ｂの推論部１２４は、タスク推論部３１０を含む。タスク推論部３１０は、タスクデータを用いてタスクの推論を行って、推論結果を出力する。図３Ｂの推論部１２４では、タスク推論部３１０が使用するモデル（タスク推論モデル）が必要となる。この場合、当該モデルがローカルモデルとして扱われる。

なお、サーバ装置１００が有する各機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を機能毎に複数の機能部に分けてもよい。また、エッジ装置１０１が有する各機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を機能毎に複数の機能部に分けてもよい。

次に、本実施例の連合学習の詳細について説明する。連合学習は、以下のような流れで行われる。

（１）エッジ装置１０１は、ローカルデータを用いた学習処理を実行することによってモデルを生成する。なお、ローカルデータは、エッジ装置１０１に接続される機器及びセンサ等から取得されるデータでもよいし、シミュレータ等から取得されるデータでもよい。また、エッジ装置１０１はサーバ装置１００内のプログラムとして仮想的に実現されてもよい。また、エッジ装置１０１は前記の構成を複数組み合わせたものでもよい。（２）エッジ装置１０１は、生成されたモデルのうち、連合学習の対象のモデルをローカルモデルとしてサーバ装置１００に送信する。（３）サーバ装置１００は、複数のローカルモデルを用いてグローバルモデルを生成し、各エッジ装置１０１にグローバルモデルを送信する。（４）エッジ装置１０１は、グローバルモデルを初期のローカルモデルに設定し、再度学習処理を実行する。以下、（２）から（４）までの処理が繰り返し実行される。

以下、連合学習におけるエッジ装置１０１及びサーバ装置１００の処理の詳細を説明する。

図４は、実施例１のエッジ装置１０１が連合学習において実行する処理の一例を説明するフローチャートである。

エッジ装置１０１は、通信路監視装置１０２から通信状態情報を取得する（ステップＳ１０１）。

エッジ装置１０１の縮減化設定部１２１は、通信状態情報に基づいて縮減率を算出する（ステップＳ１０２）。

例えば、縮減化設定部１２１は、ローカルモデルの転送に要する時間の条件を管理しており、当該条件と通信スループット及び通信レイテンシ等とに基づいて縮減率を算出する。さらに、縮減化設定部１２１は、縮減率に基づいてモデルを縮減するためのパラメータを算出する。パラメータは、例えば、閾値である。なお、時間的に変化する通信状態情報にあわせ、縮減率及びモデル縮減率に関するパラメータを更新してもよい。

エッジ装置１０１の学習部１２２は学習処理の設定を行う（ステップＳ１０３）。具体的には、初期モデルを設定し、また、学習処理で使用する各種パラメータを設定する。ここで、初期モデルは初期のローカルモデルのみでもよいし、初期のローカルモデル及び他のモデルを含んでもよい。サーバ装置１００からグローバルモデルを受信している場合には、グローバルモデルが初期のローカルモデルとして設定される。

また、学習部１２２は、モデルのスパース化を促進するための設定を行う。例えば、損失関数にＬ１正則化項又はＬ２正則化項を追加する。また、重みの絶対値が閾値以下の場合にペナルティを課すような正則化項を追加してもよい。

エッジ装置１０１の学習部１２２は学習処理を実行する（ステップＳ１０４）。学習処理は公知の技術であるため詳細な説明は省略する。学習処理によって生成されるモデルは、例えば、ニューラルネットワークである。

図３Ａに示す構成の推論部１２４の場合、特徴抽出モデル及びタスク推論モデルが生成される。特徴抽出モデルは、例えば、オートエンコーダ、ＶＡＥ（ＶａｒｉａｔｉｏｎａｌＡｕｔｏＥｎｃｏｄｅｒ）、ＶＱ－ＶＡＥ（ＶｅｃｔｏｒＱｕａｎｔｉｓｅｄ－ＶａｒｉａｔｉｏｎａｌＡｕｔｏＥｎｃｏｄｅｒ）、及び、ＳｉｍＣＬＲ（ＳｉｍｐｌｅｆｒａｍｅｗｏｒｋｆｏｒＣｏｎｔｒａｓｔｉｖｅＬｅａｒｎｉｎｇｏf ｖｉｓｕａｌＲｅｐｒｅｓｅｎｔａｔｉｏｎｓ）、ＢＹＯＬ（ＢｏｏｔｓｔｒａｐＹｏｕｒＯｗｎＬａｔｅｎｔ）等の対照学習（ＣｏｎｔｒａｓｔｉｖｅＬｅａｒｎｉｎｇ）等を用いて生成することができる。

なお、連合学習の対象が特徴抽出モデルのみである場合、学習部１２２は、連合学習による特徴抽出モデルの学習が終了するまでは、特徴抽出モデルのみを学習し、連合学習による特徴抽出モデルの学習が終了した後、特徴抽出モデル及び学習データを用いてタスク推論モデルを学習するようにしてもよい。

エッジ装置１０１のローカルモデル縮減部１２３は、縮減化設定部１２１によって算出されたパラメータに基づいて、学習処理によって生成されたローカルモデルを縮減する（ステップＳ１０５）。例えば、以下のような縮減方法が考えられる。

（縮減方法１）ローカルモデル縮減部１２３はモデルの重み情報を取得する。ローカルモデル縮減部１２３は、重みの絶対値が閾値以下の重みを０に置き換える。

（縮減方法２）ローカルモデル縮減部１２３はモデルの重み情報を取得する。絶対値が大きい順に重みを並び替える。ローカルモデル縮減部１２３は、重みの総数に対する非ゼロの重みの数の割合が閾値となるように、絶対値が小さい順に所定の数の重みを０に置き換える。

値が０の重みの数を増やすことによって、モデルのデータサイズを小さくすることができる。

エッジ装置１０１のローカルモデル縮減部１２３は、サーバ装置１００に縮減ローカルモデルを送信する（ステップＳ１０６）。

図５は、実施例１のサーバ装置１００が連合学習において実行する処理の一例を説明するフローチャートである。

サーバ装置１００のローカルモデル縮減部１１１は、エッジ装置１０１から受信したローカルモデルを縮減する（ステップＳ２０１）。縮減に使用するパラメータは予め設定されているものとする。全てのエッジ装置１０１からローカルモデルを受信していない場合、サーバ装置１００は、ステップＳ２０１には進まず、待機する。

全てのエッジ装置１０１からローカルモデルを受信した場合、サーバ装置１００のグローバルモデル生成部１１３は、複数のローカルモデルを用いてグローバルモデルを生成する（ステップＳ２０２）。例えば、グローバルモデル生成部１１３は、式（１）を用いて重みを算出する。

ここで、ｗ_ｉはｉ番目のエッジ装置１０１から受信したローカルモデルの重み情報（重みベクトル）を表し、ａ_１、ａ_２、ａ_３は係数を表す。なお、ｉは１からＮまでの自然数である。また、ｍｏｄｅ関数は最頻値を出力する関数であり、ｍａｘ関数は最大値を出力する関数である。

式（１）は、重みの最頻値及び最大値を考慮して、グローバルモデルの重みを算出する数式になっている。

サーバ装置１００は、各通信路１０５の通信状態情報を取得する（ステップＳ２０３）。

サーバ装置１００の縮減化設定部１１２は、各通信路１０５の通信状態情報に基づいて縮減率を算出する（ステップＳ２０４）。

縮減化設定部１１２は、グローバルモデルの転送に要する時間の条件を管理しており、当該条件及び各通信路１０５のスループットに基づいて各エッジ装置１０１の縮減率を算出する。さらに、縮減化設定部１２１は、縮減率に基づいてモデルを縮減するためのパラメータを算出する。パラメータは、例えば、閾値である。

サーバ装置１００のグローバルモデル縮減部１１４は、各エッジ装置１０１のパラメータに基づいて、グローバルモデルを縮減する（ステップＳ２０５）。モデルの縮減方法は、ステップＳ１０５で説明した方法と同一である。ここでは、エッジ装置１０１毎にグローバルモデルが縮減される。

サーバ装置１００のグローバルモデル縮減部１１４は、各エッジ装置１０１に縮減グローバルモデルを送信する（ステップＳ２０６）。

次に、エッジ装置１０１が実行する推論処理について説明する。図６は、実施例１のエッジ装置１０１が実行する推論処理の一例を説明するフローチャートである。

推論部１２４は、学習部１２２によって生成されたモデルの情報を取得し（ステップＳ３０１）、また、タスクデータを取得する（ステップＳ３０２）。

推論部１２４は、モデル及びタスクデータを用いて推論を行い（ステップＳ３０３）、推論結果を出力する（ステップＳ３０４）。具体的には、推論部１２４は、モデルにタスクデータを入力することによって推論結果を取得する。

なお、ローカルモデル及びグローバルモデルの少なくともいずれか一方を縮減する計算機システムでもよい。なお、サーバ装置１００及びエッジ装置１０１の少なくともいずれかが通信路監視装置１０２の機能を有する構成でもよい。

以下、実施例１で説明した計算機システムの具体的な事例について説明する。

（事例１）工場の消費電力を監視及び制御するシステム
エッジ装置１０１は、工場で稼働する機器及びセンサと通信可能に接続される。また、エッジ装置１０１は、機器及びセンサから取得したデータから電力使用状況の特徴を表す特徴ベクトルを出力する特徴抽出モデルと、当該特徴ベクトルを用いて電力使用量の予測値又は電量消費量を削減する制御ポリシーを出力するタスク推論モデルとを保持する。

（事例２）工場における製品の製造作業の割当を制御するシステム
エッジ装置１０１は、工場で稼働する機器及びセンサと通信可能に接続される。また、エッジ装置１０１は、機器及びセンサから取得したデータから機器が行う作業の特性を表す特徴ベクトルを出力する特徴抽出モデルと、当該特徴ベクトルを用いてロボットの作業割り当てポリシーを出力するタスク推論モデルとを保持する。

（事例３）工場における製造の製造作業を制御するシステム
エッジ装置１０１は、工場で稼働する機器及びセンサと通信可能に接続される。また、エッジ装置１０１は、機器及びセンサから取得したデータから機器が行う作業の状態（例えば、ロボットアームがワークを把持する力等）を表す特徴ベクトルを出力する特徴抽出モデルと、当該特徴ベクトルを用いて機器の制御値を出力するタスク推論モデルとを保持する。

（事例４）工場における設備の異常を監視するシステム
エッジ装置１０１は、工場の設備及びセンサと通信可能に接続される。また、エッジ装置１０１は、設備及びセンサから取得したデータから、設備の稼働状態を表す特徴ベクトルを出力する特徴抽出モデルと、当該特徴ベクトルを用いて設備の異常の有無及び内容を出力するタスク推論モデルとを保持する。

（事例５）工場における設備の異常原因を出力するシステム
エッジ装置１０１は、工場の設備及びセンサと通信可能に接続される。また、エッジ装置１０１は、設備及びセンサから取得したデータから、設備の異常の発生状態（例えば、電気ノイズの有無、可動部回転数の異常など）を表す特徴ベクトルを出力する特徴抽出モデルと、当該特徴ベクトルを用いて設備異常の原因を出力するタスク推論モデルとを保持する。

（事例６）工場における製品の品質を管理するシステム
エッジ装置１０１は、工場の検査を行う設備及びセンサと通信可能に接続される。また、エッジ装置１０１は、設備及びセンサから取得したデータから、製品の状態を表す特徴ベクトルを出力する特徴抽出モデルと、当該特徴ベクトルを用いて製品の品質を出力するタスク推論モデルとを保持する。

（事例７）通信網における通信品質を管理するシステム
エッジ装置１０１は、光及び無線通信網における送受信器／ノード機器等の通信機器又は通信機器に具備されたセンサと通信可能に接続される。また、エッジ装置１０１は、通信機器及びセンサから取得したデータから、通信機器又は通信機器が接続された通信路の状態を表す特徴ベクトルを出力する特徴抽出モデルと、当該特徴ベクトルを用いて通信機器又は通信機器が接続された通信路の品質を出力するタスク推論モデルとを保持する。

（変形例）エッジ装置１０１は、推論結果を利用した処理を実行するようにしてよい。例えば、図７に示すような機能構成が考えられる。エッジ装置１０１は、ドキュメント及び検索キーを対応づけたデータを格納するドキュメントＤＢ１２６を保持し、また、ドキュメントＤＢ１２６からドキュメントを検索するドキュメント検索部１２５を有する。推論部１２４は、画像及び文書等を含むタスクデータから推定キーを出力する。ドキュメント検索部１２５は、推論部１２４から出力された推定キーと、ドキュメントＤＢ１２６に登録されている検索キーとの類似度を評価するスコアを算出し、スコアに基づいて関連するドキュメントを検索する。

ドキュメントＤＢ１２６には、例えば、機器の動作状態を表す検索キーと、機器の動作状態に応じた対処方法又は改善策が記載されたドキュメントとを対応づけたデータを登録することが考えられる。この場合、推論部１２４は、機器の動作に関する値を含むタスクデータから機器の動作状態を表す推定キーを出力し、ドキュメント検索部１２５は関連するドキュメントを出力する。これによって、機器に関する情報を取得することができる。

以上で説明したように、本発明によれば、連合学習において、通信状況に応じてモデルを縮減し、サーバ装置１００及びエッジ装置１０１間でモデルを送受信することができる。これによって、連合学習における通信負荷を抑えることができる。

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。

特許請求の範囲に記載した以外の発明の観点の代表的なものとして、次のものがあげられる。
（１）学習に使用するデータを取得し、前記データを用いたタスクに関する推論に用いる第１モデルを生成するための学習処理を実行するエッジ装置と接続するサーバ装置であって、
前記複数のエッジ装置の各々によって生成された前記第１モデルを用いて第２モデルを生成し、
前記エッジ装置及び前記サーバ装置の間の通信路の通信状態に関する通信状態情報を取得し、
前記通信状態情報に基づいて、モデルのデータサイズを削減するための縮減処理に使用するパラメータを算出し、
前記パラメータに基づいて、生成された前記第２モデルに対して前記縮減処理を実行し、
前記縮減処理が実行された前記第２モデルを前記エッジ装置に送信することを特徴とするサーバ装置。
（２）（１）に記載のサーバ装置であって、
前記第１モデル及び前記第２モデルはニューラルネットワークであって、
前記サーバ装置は、前記複数のエッジ装置の各々から受信した前記第１モデルの重みの平均、最頻値、及び最大値を考慮したアルゴリズムに基づいて、前記第２モデルの重みを決定することを特徴とするサーバ装置。
（３）（１）に記載のサーバ装置であって、
前記エッジ装置は、前記学習処理において、前記データから特徴情報を抽出する特徴抽出モデルと、前記特徴情報を用いて前記タスクに関する推論を行うタスク推論モデルとを生成し、
前記第１モデルは、前記特徴抽出モデルであることを特徴とするサーバ装置。

また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、光ディスク、光磁気ディスク、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、Ｓｈｅｌｌ、ＰＨＰ、Ｐｙｔｈｏｎ、Ｊａｖａ（登録商標）等の広範囲のプログラム又はスクリプト言語で実装できる。

さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はＣＤ－ＲＷ、ＣＤ－Ｒ等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。

上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

１００サーバ装置
１０１エッジ装置
１０２通信路監視装置
１０３学習監視装置
１０５通信路
１１０送受信部
１１１ローカルモデル縮減部
１１２縮減化設定部
１１３グローバルモデル生成部
１１４グローバルモデル縮減部
１２０送受信部
１２１縮減化設定部
１２２学習部
１２３ローカルモデル縮減部
１２４推論部
１２５ドキュメント検索部
１２６ドキュメントＤＢ
２０１プロセッサ
２０２主記憶装置
２０３副記憶装置
２０４ネットワークインタフェース
２０５内部バス
３００特徴抽出部
３０１、３１０タスク推論部
８００画面

Claims

計算機システムであって、
学習に使用するデータを取得し、前記データを用いてタスクに関する推論に用いる第１モデルを生成するための学習処理を実行するエッジ装置と、
前記複数のエッジ装置の各々によって生成された前記第１モデルを用いて第２モデルを生成し、前記第２モデルを前記複数のエッジ装置に送信するサーバ装置と、
を備え、
前記エッジ装置は、
前記エッジ装置及び前記サーバ装置の間の通信路の通信状態に関する通信状態情報を取得し、
前記通信状態情報に基づいて、モデルのデータサイズを削減するための縮減処理に使用する第１パラメータを算出し、
前記第１パラメータに基づいて、生成された前記第１モデルに対して前記縮減処理を実行し、
前記縮減処理が実行された前記第１モデルを前記サーバ装置に送信することを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
前記サーバ装置は、
前記通信状態情報を取得し、
前記通信状態情報に基づいて、前記縮減処理に使用する第２パラメータを算出し、
前記第２パラメータに基づいて、生成された前記第２モデルに対して前記縮減処理を実行し、
前記縮減処理が実行された前記第２モデルを前記エッジ装置に送信することを特徴とする計算機システム。
請求項２に記載の計算機システムであって、
前記第１モデル及び前記第２モデルはニューラルネットワークであって、
前記サーバ装置は、前記複数のエッジ装置の各々から受信した前記第１モデルの重みの平均、最頻値、及び最大値を考慮したアルゴリズムに基づいて、前記第２モデルの重みを決定することを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
前記エッジ装置は、
前記学習処理において、前記データから特徴情報を抽出する特徴抽出モデルと、前記特徴情報を用いて前記タスクに関する推論を行うタスク推論モデルとを生成し、
前記第１モデルは、前記特徴抽出モデルであることを特徴とする計算機システム。
計算機システムにおける学習方法であって、
前記計算機システムは、学習に使用するデータを取得し、前記データを用いてタスクに関する推論に用いる第１モデルを生成するための学習処理を実行するエッジ装置と、前記複数のエッジ装置の各々によって生成された前記第１モデルを用いて第２モデルを生成し、前記第２モデルを前記複数のエッジ装置に送信するサーバ装置と、を含み、
前記学習方法は、
前記エッジ装置が、前記エッジ装置及び前記サーバ装置の間の通信路の通信状態に関する通信状態情報を取得する第１のステップと、
前記エッジ装置が、前記通信状態情報に基づいて、モデルのデータサイズを削減するための縮減処理に使用する第１パラメータを算出する第２のステップと、
前記エッジ装置が、前記第１パラメータに基づいて、生成された前記第１モデルに対して前記縮減処理を実行する第３のステップと、
前記エッジ装置が、前記縮減処理が実行された前記第１モデルを前記サーバ装置に送信する第４のステップと、を含むことを特徴とする学習方法。
請求項５に記載の学習方法であって、
前記サーバ装置が、前記通信状態情報を取得するステップと、
前記サーバ装置が、前記通信状態情報に基づいて、前記縮減処理に使用する第２パラメータを算出するステップと、
前記サーバ装置が、前記第２パラメータに基づいて、生成された前記第２モデルに対して前記縮減処理を実行するステップと、
前記サーバ装置が、前記縮減処理が実行された前記第２モデルを前記エッジ装置に送信するステップと、を含むことを特徴とする学習方法。
請求項６に記載の学習方法であって、
前記第１モデル及び前記第２モデルはニューラルネットワークであって、
前記学習方法は、前記サーバ装置が、前記複数のエッジ装置の各々から受信した前記第１モデルの重みの平均、最頻値、及び最大値を考慮したアルゴリズムに基づいて、前記第２モデルの重みを決定するステップを含むことを特徴とする学習方法。
請求項５に記載の学習方法であって、
前記エッジ装置が、前記データから特徴情報を抽出する特徴抽出モデルと、前記特徴情報を用いて前記タスクに関する推論を行うタスク推論モデルとを生成するステップを含み、
前記第１モデルは、前記特徴抽出モデルであることを特徴とする学習方法。
学習に使用するデータを取得し、前記データを用いてタスクに関する推論に用いる第１モデルを生成するための学習処理を実行するエッジ装置であって、
プロセッサ、前記プロセッサに接続されるメモリ、前記プロセッサに接続されるネットワークインタフェースを備え、
複数のエッジ装置の各々によって生成された前記第１モデルを用いて第２モデルを生成し、前記第２モデルを前記複数のエッジ装置に送信するサーバ装置と接続し、
前記エッジ装置及び前記サーバ装置の間の通信路の通信状態に関する通信状態情報を取得し、
前記通信状態情報に基づいて、モデルのデータサイズを削減するための縮減処理に使用するパラメータを算出し、
前記パラメータに基づいて、生成された前記第１モデルに対して前記縮減処理を実行し、
前記縮減処理が実行された前記第１モデルを前記サーバ装置に送信することを特徴とするエッジ装置。
請求項９に記載のエッジ装置であって、
前記学習処理において、前記データから特徴情報を抽出する特徴抽出モデルと、前記特徴情報を用いて前記タスクに関する推論を行うタスク推論モデルとを生成し、
前記第１モデルは、前記特徴抽出モデルであることを特徴とするエッジ装置。