JP7412489B2

JP7412489B2 - 連合学習方法及び装置、電子機器、記憶媒体ならびにコンピュータプログラム

Info

Publication number: JP7412489B2
Application number: JP2022119635A
Authority: JP
Inventors: 吉劉; 北辰馬; 晨 ▲ディー▼ 周; 俊 ▲チョン▼ 賈; 徳景竇; 石磊季; 源廖
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-09-18
Filing date: 2022-07-27
Publication date: 2024-01-12
Anticipated expiration: 2042-07-27
Also published as: CN113850394A; CN113850394B; JP2022136234A; GB202211819D0; GB2611621A; US20220391780A1

Description

本開示は、人工知能の技術分野に関し、特に分散型データ処理及びディープラーニングの技術分野に関する。具体的に、連合学習方法及び装置、電子機器、記憶媒体ならびにコンピュータプログラムに関する。

連合学習は分散型機械学習技術の一種であり、分散型のデータと計算リソースとを用いて、複数の分散型エッジ機器又はサーバの間で協力してトレーニングする。連合学習は機器のローカルアリジナルデータを共有する必要がなく、機器のローカルアリジナルデータの漏洩を防止することができる。関連技術において、シングルタスクの場合に連合学習効率を向上させることを解決する方式を提供したが、どのようにマルチタスク場面での連合学習の効率を向上させるかは早急に解決すべき問題である。

これに鑑みて、本開示は、連合学習方法及び装置、電子機器、記憶媒体ならびにコンピュータプログラムを提供している。

本開示の１つの局面によれば、現在学習周期に対して、複数の候補機器のリソース情報に基づいて、前記複数の候補機器のうち、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を特定することと、前記各タスクに対する対象機器に前記各タスクに対するグローバルモデルを送信することで、前記各タスクに対する対象機器が前記各タスクに対するグローバルモデルをトレーニングすることと、前記各タスクのすべての対象機器に対して送信されたトレーニング後モデルを受信したことに応答して、前記トレーニング後モデルに基づいて前記各タスクに対するグローバルモデルを更新して、前記現在学習周期を完了することと、を含む、連合学習方法を提供している。

本開示の別の局面によれば、現在学習周期に対して、複数の候補機器のリソース情報に基づいて、前記複数の候補機器のうち、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を特定するための第１の特定モジュールと、前記各タスクに対する対象機器に前記各タスクに対するグローバルモデルを送信することで、前記各タスクに対する対象機器が前記各タスクに対するグローバルモデルをトレーニングするための第１の送信モジュールと、前記各タスクのすべての対象機器に対して送信されたトレーニング後モデルを受信したことに応答して、前記トレーニング後モデルに基づいて前記各タスクに対するグローバルモデルを更新して、前記現在学習周期を完了するための更新モジュールと、を含む、連合学習装置を提供している。

本開示の別の局面によれば、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信接続するメモリとを有する電子機器であって、前記メモリに、前記少なくとも１つのプロセッサによって実行され得るコマンドが記憶されており、前記コマンドが前記少なくとも１つのプロセッサによって実行されることで、前記少なくとも１つのプロセッサが本開示が提供した連合学習方法を実行することができる、電子機器を提供している。

本開示の別の局面によれば、コンピュータに本開示が提供した連合学習方法を実行させるためのコンピュータコマンドを記憶している、非一時的なコンピュータ読取可能な記憶媒体を提供している。

本開示の別の局面によれば、プロセッサにより実行される場合に、本開示が提供した連合学習方法を実現するコンピュータプログラムを提供している。

理解されるべきこととして、本部分に記載された内容は、本開示の実施例のキーポイント又は重要な特徴を示すことを意図するものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の説明により容易に理解される。

ここで、図面は、本技術案をよりよく理解するために用いられ、本開示を限定するものではない。

図１は、本開示の実施例による連合学習方法及び装置を適用可能なシステムアーキテクチャ模式図である。図２は、本開示の実施例による連合学習方法のフロー模式図である。図３は、本開示の実施例による複数の候補機器のうち、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を特定するフロー模式図である。図４は、本開示の実施例による連合学習方法の原理模式図である。図５は、本開示の一実施例による連合学習装置の構成ブロック図である。図６は、本開示の実施例の連合学方法を実施するための電子機器のブロック図である。

以下、図面を参照して本開示の例示的な実施例を説明する。ここで、より理解しやすいために本開示の実施例の様々な詳細は含まれ、それらが例示的なものであると考えられるべきである。したがって、当業者であれば、ここで記載される実施例に対して様々な変更・修正を行うことができ、本開示の範囲及び精神から逸脱することはないと分るべきである。同様に、明確かつ簡潔に説明するために、以下の記載において周知の機能や構成に対する説明を省略する。

マルチタスクの場合、サーバリソースを最適化する方式で連合学習の効率を向上させるようにしてよい。例えば、タスクの割当を最適化する方式でネットワーク遅延を低減し、さらに連合学習の効率を向上させるようにしてよい。また、例えば、サーバのＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、中央プロセッサ）及び通信などのリソースを最適化することで収束時間を低減し、さらに連合学習の効率を向上させるようにしてもよい。また、例えば、マルチタスク協力の方式でマルチタスク加速を行うことで、分散型マルチタスク学習の高通信コスト及びフォールトトレランスなどの問題を解決し、さらに連合学習の効率を向上させるようにしてよい。

関連技術において、どのようにサーバリソースを最適化するかのみが考慮されており、どのように機器リソースのスケジューリング案を最適化するかが考慮されていない。機器のリソースは限られており、同一時点で複数のタスクを実行するための十分なリソースがあるとは保証できない。

以下、図１を参照して本開示が提供した方法及び装置のシステムアーキテクチャを説明する。

図１は、本開示の実施例による連合学習方法及び装置のシステムアーキテクチャ模式図である。

図１に示すように、この実施例によるシステムアーキテクチャ１００は、複数の機器１０１と、ネットワーク１０２と、サーバ１０３とを含んでよい。ネットワーク１０２は、機器１０１とサーバ１０３との間に通信リンクの媒体を提供するためのものである。ネットワーク１０２は、各種の接続タイプ、例えば、有線及び／又は無線の通信リンクなどを含んでよい。

ユーザは、機器１０１を用いてネットワーク１０２を介してサーバ１０３と対話することで、メッセージなどを送受信してよい。機器１０１は、各種の電子機器であってよく、スマートフォン、タブレットコンピュータ、ラップトップ型携帯コンピュータなどを含むが、これらに限られない。

本開示の実施例が提供した連合学習方法は、一般的に、サーバ１０３によって実行されてよい。それに応じて、本開示の実施例が提供した連合学習装置は、一般的に、サーバ１０３に設けられてよい。本開示の実施例が提供した連合学習方法は、サーバ１０３と異なり、且つ機器１０１及び/又はサーバ１０３と通信可能なサーバ又はサーバクラスタによって実行されてもよい。それに応じて、本開示の実施例が提供した連合学習装置は、サーバ１０３と異なり、且つ機器１０１及び/又はサーバ１０３と通信可能なサーバ又はサーバクラスタに設けられてもよい。

本開示の実施例において、現在学習周期において、サーバ１０３はトレーニングタスクを別々の機器１０１に割り当て、例えば、ネットワーク１０２を介してトレーニングタスクを別々の機器１０１に割り当ててよい。複数の機器１０１は、一定のトレーニング回数を完了した後に、ネットワーク１０２を介してトレーニング後のモデルをサーバ１０３に返送する。サーバ１０３は、別々の機器１０１から返送したトレーニング後のモデルに応じてこのトレーニングタスクに対するグローバルモデルのパラメータを更新して、現在学習周期のトレーニングを完了する。

理解されるべきこととして、図１における機器１０１とサーバ１０３との数及びタイプは単に例示的なものに過ぎない。実現の必要に応じて、任意の数及びタイプの端末、道路、車両及び通信基地局を有してもよい。

以下、図１を参照して、図２～図４を通じて本開示が提供した連合学習方法を詳細に説明する。

図２は、本開示の一実施例による連合学習方法のフローチャートである。
図２に示すように、この方法２００は操作Ｓ２１０～操作Ｓ２３０を含んでよい。

操作Ｓ２１０において、現在学習周期に対して、複数の候補機器のリソース情報に基づいて、複数の候補機器のうち、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を特定する。

例えば、実行すべき少なくとも１つのタスクは、少なくとも１つの音声識別モデルをトレーニングするタスクを含んでよい。

例えば、実行すべき少なくとも１つのタスクは、音声識別モデルをトレーニングするタスク、画像分類モデルをトレーニングするタスク、テキスト生成モデルをトレーニングするタスクなどを含んでよい。

本開示の実施例において、複数の学習周期を実行することで、少なくとも１つの学習タスクを実行してよい。

例えば、１００個の学習周期を実行することで、音声識別モデルをトレーニングするタスクを実行してよい。

例えば、２００個の学習周期を実行することで、音声識別モデルをトレーニングするタスク、画像分類モデルをトレーニングするタスク、テキスト生成モデルをトレーニングするタスクを実行してよい。音声識別モデルをトレーニングするタスクを実行することは、１００個の学習周期を必要とし、画像分類モデルをトレーニングするタスクを実行することは、１２０個の学習周期を必要とし、テキスト生成モデルをトレーニングするタスクを実行することは、２００個の学習周期を必要とする。一例において、第１０１個の学習周期において、音声識別モデルをトレーニングするタスクを実行しなくなる。

本開示の実施例において、実行すべき少なくとも１つのタスクの数は一定であってもよい。

例えば、音声識別モデルをトレーニングするタスク、画像分類モデルをトレーニングするタスク、テキスト生成モデルをトレーニングするタスクのみを実行してもよい。

本開示の実施例において、実行すべき少なくとも１つのタスクの数は動的なものであってもよい。

例えば、実行開始後に、音声識別モデルをトレーニングするタスク、画像分類モデルをトレーニングするタスク、テキスト生成モデルをトレーニングするタスクを実行してよい。一例において、２００個の学習周期を実行することで、音声識別モデルをトレーニングするタスク、画像分類モデルをトレーニングするタスク、テキスト生成モデルをトレーニングするタスクを実行してよい。音声識別モデルをトレーニングするタスクを実行することは、１００個の学習周期を必要とし、第１０１個の学習周期において、音声識別モデルをトレーニングするタスクがすでに終了し、画像識別モデルをトレーニングするタスク及び語意識別モデルをトレーニングするタスクを加えてよい。

本開示の実施例において、１つの学習周期で、１つの学習タスクに対して、機器はこの学習タスクに対応するモデルを複数回トレーニングするようにしてよい。

例えば、１つの学習周期で、音声識別モデルをトレーニングするタスクに対して、機器はこの音声識別モデルを５回トレーニングするようにしてよい。この学習周期が終了した後、最後のトレーニングによって得られた音声識別モデルをトレーニング後の音声識別モデルとして受信してよい。

本開示の実施例において、候補機器のリソース情報は機器ハードウェアリソースであってよい。

例えば、候補機器のリソース情報は、機器内のＣＰＵの数及び使用率を含んでもよく、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）の数及び使用率であってもよく、メモリの容量であってもよい。理解され得るように、本開示を理解することに役立つように、上記リソース情報は単に例示であって、本開示はこれを限定しない。

操作Ｓ２２０において、各タスクに対する対象機器に各タスクに対するグローバルモデルを送信することで、各タスクに対する対象機器が各タスクに対するグローバルモデルをトレーニングする。

本開示の実施例において、機器のローカルアリジナルデータを利用して、各タスクに対する対象機器が各タスクに対するグローバルモデルをトレーニングするようにしてよい。

例えば、１つの対象機器が１つのタスクのグローバルモデルを受信した後、ローカルアリジナルデータからこのタスクを実行するために必要なトレーニングデータを選出し、このトレーニングデータをこのタスクのグローバルモデルに入力して、このグローバルモデルの出力とトレーニングデータのタグとに基づいて、このグローバルモデルをトレーニングする。

本開示の実施例において、各タスクを実行する対象機器のリソース情報に応じて、各タスクに対する対象機器が各タスクに対するグローバルモデルをトレーニングする目標回数を決めてよい。

例えば、１つのタスクに対して、１つの対象機器のＣＰＵ数が多く、このタスクに対するグローバルモデルをトレーニングする目標回数を１０回に決めてよく、別の対象機器のＣＰＵ数が少なく、このタスクに対するグローバルモデルをトレーニングする目標回数を５回に決めてよい。この目標回数は、例えば、ＣＰＵの占有率に負相関し、又はＣＰＵの数に正相関してよい。

本開示の実施例において、目標回数が決められた後、各タスクに対する対象機器に目標回数を送信することで、各タスクに対する対象機器がこの目標回数に基づいて各タスクに対するグローバルモデルをトレーニングするようにしてよい。

操作Ｓ２３０において、各タスクのすべての対象機器に対して送信されたトレーニング後のモデルを受信したことに応答して、トレーニング後のモデルに基づいて各タスクに対するグローバルモデルを更新して、現在学習周期を完了する。

例えば、現在学習周期で、トレーニング後の音声識別モデルに基づいてグローバル音声識別モデルを更新し、トレーニング後の画像分類モデルに基づいてグローバル画像分類モデルを更新し、トレーニング後のテキスト生成モデルに基づいてグローバルテキスト生成モデルを更新する。

本開示の実施例によって、この連合学習方法によれば、複数のタスクは、互いに待つことなく、並行に実行してよく、モデルが予期性能に達成するまで、又は最終停止条件が来るまで、初期化以外のすべてのステップが複数の周期繰り返されてもよい。本開示の実施例の連合学習方法は、現在のスケジューリング案による他のタスクに対する影響を十分考慮して、各タスクのために機器リソースをより合理的にスケジューリングして収束時間を最大限に低減することができる。

図３は、本開示の実施例による複数の候補機器のうち、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を特定するフロー模式図である。

図３に示すように、この方法は、現在学習周期に対して、複数の候補機器のリソース情報に基づいて、複数の候補機器のうち、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を特定してよい。以降、下記の操作Ｓ３１１～操作Ｓ３１５を通じて詳細に説明する。

操作Ｓ３１１において、複数の候補機器のリソース情報に基づいて、現在学習周期の時間コストを最小にさせる対象機器セットを候補スケジューリング情報として特定する。

例えば、対象機器セットは、それぞれ少なくとも１つの学習タスクに対する少なくとも１つの対象機器グループを含む。

本開示の実施例において、複数の候補機器のリソース情報に基づいて、複数の候補機器のそれぞれが各タスクを実行する時間長情報を特定してよい。

例えば、各候補機器のリソース情報に基づいて、各候補機器の計算能力を示す、各候補機器の計算指標を特定してよい。

例えば、計算指標と、各候補機器に記憶された各タスクに対するトレーニングデータのデータ量とに基づいて、所定変位指数分布を用いて各候補機器が各タスクを実行する時間長情報を特定する。

幾つかの例において、所定変位指数分布を用いることで１つの候補機器が１つのタスクを実行する時間長情報を特定し、ここで、所定変位指数分布は以下の式で示されてよい。

本開示の実施例において、時間長情報に基づいて、現在学習周期の時間コストを最小にさせる対象機器セットを特定してよい。

例えば、この実施例は、各候補機器が現在学習周期の前の学習周期で各タスクを実行する回数に基づいて、複数の候補機器の、各タスクに対するスケジューリングバランス分散を特定してもよい。

幾つかの例において、以下の式によって１つの候補機器の、１つのタスクに対するスケジューリングバランス分散を特定してよい。

例えば、スケジューリングバランス分散及び時間長情報に基づいて、現在学習周期の時間コストを最小にさせる対象機器セットを特定してよい。

この実施例は、グリーディアルゴリズムの思想を参考して、現在学習周期で、すべてのタスクに必要なトレーニング時間を最も短くする近似解（例えば、対象機器セット）を取得してよい。

本開示の実施例において、候補スケジューリング情報と複数の所定スケジューリング情報を初期スケジューリング情報セットとして、下記の操作Ｓ３１２を実行する。

操作Ｓ３１２において、現在スケジューリング情報セットにおける対象スケジューリング情報を調整して、ｎ個の調整後のスケジューリング情報を得る。

本開示の実施例において、現在スケジューリング情報セットにおける対象スケジューリング情報を初めて調整する時、現在スケジューリング情報は上記初期スケジューリング情報である。

本開示の実施例において、現在スケジューリング情報セットにおける各スケジューリング情報の、現在学習周期に対する時間コストに基づいて、現在スケジューリング情報セットにおける少なくとも２つのスケジューリング情報を対象スケジューリング情報として特定する。

例えば、以下の式によってスケジューリング情報の適合値ｆｉｔｎｅｓｓを算出してよい。

本開示の実施例において、クロスオーバーにて対象スケジューリング情報のうちのいずれか２つのスケジューリング情報を調整して、調整後のスケジューリング情報を得る。

例えば、いずれか２つのスケジューリング情報中の候補機器の差分セットを特定して、複数の対象機器を得る。

例えば、複数の対象機器に基づいて、クロスオーバーにて対象スケジューリング情報のうちのいずれか２つのスケジューリング情報を調整する。

操作Ｓ３１３において、ｎ個の調整後のスケジューリング情報及び現在スケジューリング情報セットから現在学習周期の時間コストを高くするｎ個のスケジューリング情報を除去して、更新後のスケジューリング情報セットを得る。

幾つかの例において、適合値の大きさの応じて、スケジューリング情報を除去してよい。例えば、適合値が最小になる２つのスケジューリング情報を除去する。

操作Ｓ３１４において、所定ループ停止条件を満たすか否かを判定する。所定ループ停止条件を満たさないと判定すると、上記操作Ｓ３１２に戻し、所定ループ停止条件を満たすと判定すると、操作Ｓ３１５を実行する。

本開示の実施例において、所定ループ停止条件は更新後のスケジューリング情報セットにおけるあるスケジューリング情報の適合値が所定値に達することであってよい。

操作Ｓ３１５において、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を出力する。

例えば、上記操作Ｓ３１２～操作Ｓ３１３を複数回ループして実行した後、現在スケジューリング情報のうちのあるスケジューリング情報の適合値が所定値に達した場合、ループを停止して、現在スケジューリング情報のうち、適合値が最大になるスケジューリング情報を出力してよく、この適合値が最大になるスケジューリング情報は実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を含む。

遺伝的アルゴリズムの思想を参考して、この実施例の技術案は、大きくて複雑なスケジューリング情報セットを検索することができ、複数の満足するようなスケジューリング情報セットを提供することができる。この実施例は、有限回のループによって、現在スケジューリング情報セットが条件を満たすスケジューリング情報セットに進化するように促すことができる。

幾つかの実施例において、以下の式によって連合学習方法の学習周期を特定してよい。

本開示の実施例によれば、ある学習タスクの学習周期が、必要とする学習周期に達すると、次の学習周期において、実行すべき学習タスクには、このある学習タスクが含まれなくなる。

図４は、本開示の実施例による遷移学習方法の原理模式図である。
図４に示すように、各候補機器の計算指標４０１と各候補機器に記憶された各タスクに対するトレーニングデータのデータ量４０２とに基づいて、例えば、式（２）を用いて各候補機器が各タスクを実行する時間長情報４０４を特定する。

同時に、各候補機器が現在学習周期の前の学習周期で各タスクを実行する回数４０３に応じて、例えば、式（３）に基づいて複数の候補機器の、各タスクに対するスケジューリングバランス分散４０５を特定してよい。

続いて、各候補機器が各タスクを実行する時間長情報４０４と複数の候補機器の、各タスクに対するスケジューリングバランス分散４０５とに応じて、例えば、式（４）に基づいて各タスクに対する複数の対象機器グループを特定してよく、複数の対象機器グループからなるセットは、対象機器セット４０６である。対象機器セット４０６は、現在学習周期の時間コストを最小にさせることができる。

対象機器セット４０６を候補スケジューリング情報４０７としてよい。候補スケジューリング情報４０７と所定スケジューリング情報４０８とに基づいて、初期スケジューリング情報セット４０９を取得する。

続いて、所定ループ停止条件を満たすまで、ループ操作を行う。最初のループにおいて、初期スケジューリング情報セット４０９を現在スケジューリング情報セット４１０とする。

１回のループ操作において、現在スケジューリング情報セット４１０から少なくとも２つのスケジューリング情報を対象スケジューリング情報として選択し、少なくとも２つのスケジューリング情報は、例えば、図４における対象スケジューリング情報Ｔａ４１１と対象スケジューリング情報Ｔｂ４１２とを含む。まず、対象スケジューリング情報Ｔａ４１１と対象スケジューリング情報Ｔｂ４１２との差分セットを特定して、複数の対象機器を得てよい。そして、クロスオーバーを行って、２つの対象スケジューリング情報を調整し、例えば、対象スケジューリング情報Ｔａ４１１に属する１つの対象機器と対象スケジューリング情報Ｔｂ４１２における別の対象機器とを入れ替えて、調整後スケジューリング情報Ｍａ４１３と調整後スケジューリング情報Ｍｂ４１４とを得る。

調整後スケジューリング情報Ｍａ４１３と、調整後スケジューリング情報Ｍｂ４１４と、現在スケジューリング情報セット４１０とから、例えば、式（５）に基づいて各スケジューリング情報の適合値を特定し、適合値が最小になる２つのスケジューリング情報を除去して、更新後スケジューリング情報セット４１５を得る。スケジューリング情報の適合値が小さいほど、現在学習周期の時間コストが高くなる。

この実施例は、更新後スケジューリング情報セット４１５のうち、適合値が最大になるスケジューリング情報４１６が所定ループ停止条件を満たすか否かを判定し、所定ループ停止条件を満たす場合、この適合値が最大になるスケジューリング情報４１６を出力結果とし、所定ループ停止条件を満たさない場合、更新後スケジューリング情報セット４１５を現在スケジューリング情報セット４１０とし、ループ停止条件を満たすまで、上記操作を繰り返す。

本開示が提供した連合学習方法によれば、本開示は、連合学習装置をさらに提供している。以下、図５を参照してこの装置を詳細に説明する。

図５は、本開示の実施例による連合学習装置の構成ブロック図である。
図５に示すように、この装置５００は、第１の特定モジュール５１０、第１の送信モジュール５２０及び更新モジュール５３０を含む。

第１の特定モジュール５１０は、現在学習周期に対して、複数の候補機器のリソース情報に基づいて、上記複数の候補機器のうち、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を特定するために用いられる。幾つかの実施例において、第１の特定モジュール５１０は、前文に説明した操作Ｓ２１０を実行するために用いられ、ここで説明を繰り返さない。

第１の送信モジュール５２０は、上記各タスクに対する対象機器に上記各タスクに対するグローバルモデルを送信することで、上記各タスクに対する対象機器が上記各タスクに対するグローバルモデルをトレーニングするために用いられる。幾つかの実施例において、第１の送信モジュール５２０は、前文に説明した操作Ｓ２２０を実行するために用いられ、ここで説明を繰り返さない。

更新モジュール５３０は、上記各タスクのすべての対象機器に対して送信されたトレーニング後モデルを受信したことに応答して、上記トレーニング後モデルに基づいて上記各タスクに対するグローバルモデルを更新して、上記現在学習周期を完了するために用いられる。幾つかの実施例において、更新モジュール５３０は、前文に説明した操作Ｓ２３０を実行するために用いられ、ここで説明を繰り返さない。

幾つかの実施例において、上記第１の特定モジュールは、上記複数の候補機器のリソース情報に基づいて、現在学習周期の時間コストを最小にさせる、それぞれ少なくとも１つの学習タスクに対する複数の対象機器グループを含む対象機器セットを候補スケジューリング情報として特定するための第１の特定サブモジュールと、上記候補スケジューリング情報と複数の所定スケジューリング情報とを初期スケジューリング情報セットとし、所定ループ停止条件を満たすまで、以下の手段によってループして操作を実行するためのループサブモジュールとを含む。上記手段は、現在スケジューリング情報セットにおける対象スケジューリング情報を調整して、ｎ個（ｎは正の整数である）の調整後スケジューリング情報を得るための調整手段と、上記ｎ個の調整後スケジューリング情報及び上記現在スケジューリング情報セットから上記現在学習周期の時間コストを高くするｎ個のスケジューリング情報を除去して、更新後スケジューリング情報セットを得るための除去手段とを含む。

幾つかの実施例において、上記第２の特定サブモジュールは、上記複数の候補機器のリソース情報に基づいて、上記複数の候補機器のそれぞれが上記各タスクを実行する時間長情報を特定するための第１の特定手段と、上記時間長情報に基づいて、現在学習周期の時間コストを最小にさせる対象機器セットを特定するための第２の特定手段とを含む。

幾つかの実施例において、上記第２の特定手段は、上記各候補機器が上記現在学習周期の前の学習周期で上記各タスクを実行する回数に基づいて、上記複数の候補機器の、上記各タスクに対するスケジューリングバランス分散を特定するための第１の特定サブ手段と、上記スケジューリングバランス分散と上記時間長情報とに基づいて、現在学習周期の時間コストを最小にさせる対象機器セットを特定するための第２の特定サブ手段とを含む。

幾つかの実施例において、上記第１の特定手段は、上記各候補機器のリソース情報に基づいて、上記各候補機器の計算能力を示す、上記各候補機器の計算指標を特定するための第３の特定サブ手段と、上記計算指標と上記各候補機器に記憶された上記各タスクに対するトレーニングデータのデータ量とに基づいて、所定変位指数分布を用いて上記各候補機器が上記各タスクを実行する時間長情報を特定するための実行サブ手段とを含む。

幾つかの実施例において、上記調整手段は、上記現在スケジューリング情報セットにおける各スケジューリング情報の、上記現在学習周期に対する時間コストに基づいて、上記現在スケジューリング情報セットにおける少なくとも２つのスケジューリング情報を対象スケジューリング情報として特定するための第４の特定サブ手段と、クロスオーバーにて上記対象スケジューリング情報のうちのいずれか２つのスケジューリング情報を調整して、調整後スケジューリング情報を得るための第１の調整サブ手段とを含む。

幾つかの実施例において、上記第１の調整サブ手段は、上記いずれか２つのスケジューリング情報中の候補機器の差分セットを特定して、複数の対象機器を得るための第５の特定サブ手段と、上記複数の対象機器に基づいて、上記クロスオーバーにて上記対象スケジューリング情報のうちのいずれか２つのスケジューリング情報を調整するための第２の調整サブ手段とを含む。

幾つかの実施例において、この装置５００は、上記各タスクを実行する対象機器のリソース情報に基づいて、上記各タスクに対する対象機器が上記各タスクに対するグローバルモデルをトレーニングする目標回数を特定するための第２の特定モジュールと、上記各タスクに対する対象機器に上記目標回数を送信することで、上記各タスクに対する対象機器が上記目標回数に基づいて上記各タスクに対するグローバルモデルをトレーニングするようにするための第２の送信モジュールとをさらに含む。

なお、本開示の技術案では、係られたユーザ個人情報の取得、収集、記憶、応用、加工、伝送、提供及び開示などの処理は、いずれも関連法律や法規の規定に合致しており、公序良俗に反していない。

本開示の実施例によれば、本開示は、電子機器、読取可能な記憶媒体及びコンピュータプログラムをさらに提供している。

図６は、本開示の実施例の連合学習方法を実施することが可能な例示的電子機器６００の模式的ブロック図を示している。電子機器は、様々な形式のデジタルコンピュータを示すことを目的とし、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ及び他の適切なコンピュータである。電子機器は、さらに様々な形式の移動装置を示してもよく、例えば、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブル機器及び他の類似の演算装置である。本明細書に示された部材、それらの接続及び関係、並びにそれらの機能は、例示に過ぎず、本明細書に記載された及び／又は要求された本開示の実現を限定しない。

図６に示すように、機器６００は、計算手段６０１を含み、計算手段６０１は、リードオンリーメモリ（ＲＯＭ）６０２に記憶されたコンピュータプログラム又は記憶手段６０８からランダムアクセスメモリ（ＲＡＭ）６０３にロードされたコンピュータプログラムに基づいて、様々な適切な動作及び処理を実行してもよい。ＲＡＭ６０３には、さらに機器６００の操作に必要な様々なプログラム及びデータを記憶してもよい。計算手段６０１、ＲＯＭ６０２、及びＲＡＭ６０３は、バス６０４を介して相互に接続される。入出力（Ｉ／Ｏ）インターフェース６０５も、バス６０４に接続される。

機器６００における複数の部品は、Ｉ／Ｏインターフェース６０５に接続され、例えばキーボード、マウス等の入力手段６０６と、例えば様々な種類のディスプレイ、スピーカ等の出力手段６０７と、例えば磁気ディスク、光ディスク等の記憶手段６０８と、例えばネットワークカード、モデム、無線通信トランシーバ等の通信手段６０９とを含む。通信手段６０９は、機器６００がインターネット等のコンピュータネットワーク及び／又は各種の電気ネットワークを介して他の機器と情報・データをやり取りすることを可能にする。

計算手段６０１は、処理及び演算能力を有する各種の汎用及び／又は専用の処理モジュールであってもよい。計算手段６０１の幾つかの例として、中央処理ユニット（ＣＰＵ）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、各種専用の人工知能（ＡＩ）演算チップ、各種機械学習モデルアルゴリズムをランニングする演算ユニット、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）、並びに任意の適切なプロセッサ、コントローラ、マイクロコントローラ等が挙げられるが、これらに限定されない。計算手段６０１は、前文で説明した各方法と処理、例えば、連合学習方法を実行する。例えば、幾つかの実施例において、連合学習方法は、例えば記憶手段６０８のような機械可読媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例において、コンピュータプログラムの一部又は全部は、ＲＯＭ６０２及び／又は通信手段６０９を介して機器６００にロード及び／又はインストールされてもよい。コンピュータプログラムがＲＡＭ６０３にロードされて計算手段６０１により実行される場合、前文で説明した連合学習方法の１つ又は複数のステップを実行してもよい。代替的に、他の実施例において、計算手段６０１は、他の任意の適切な方式（例えば、ファームウェアを介する）により連合学習方法を実行するように構成されてもよい。

本明細書で以上に説明されたシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、コンプレックスプログラムマブルロジックデバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせにおいて実現されてもよい。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムにおいて実施され、該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラムマブルプロセッサを含むプログラムマブルシステムで実行され及び／又は解釈されることが可能であり、該プログラムマブルプロセッサは、専用又は汎用のプログラムマブルプロセッサであってもよく、記憶システム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、かつデータ及び命令を該記憶システム、該少なくとも１つの入力装置、及び該少なくとも１つの出力装置に伝送することができることを含んでもよい。

本開示の方法を実施するためのプログラムコードは、１つ又は複数のプログラミング言語の任意の組み合わせで作成されてもよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよく、それによって、プログラムコードがプロセッサ又はコントローラにより実行される時に、フローチャート及び／又はブロック図に規定された機能・操作が実施される。プログラムコードは、機器に完全に実行されてもよく、部分的に機器で実行されてもよく、独立したソフトウェアパッケージとして部分的に機器で実行され、かつ部分的に遠隔機器で実行されるか又は完全に遠隔機器又はサーバで実行されてもよい。

本開示のコンテキストにおいて、機械可読媒体は、有形の媒体であってもよく、命令実行システム、装置又は電子機器に使用され、又は命令実行システム、装置又は電子機器と組み合わせて使用されるプログラムを含んで又は記憶してもよい。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子の、磁気的、光学的、電磁的、赤外線の、又は半導体システム、装置又は電子機器、又は上記内容の任意の適切な組み合わせを含んでもよいが、それらに限定されない。機械可読記憶媒体のより具体的な例としては、１つ以上の線による電気的接続、携帯式コンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能なプログラマブルリードオンリーメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、コンパクトディスクリードオンリーメモリ（ＣＤ-ＲＯＭ）、光学記憶装置、磁気記憶装置、又は上記内容の任意の適切な組み合わせを含む。

ユーザとの対話を提供するために、コンピュータにここで説明されたシステム及び技術を実施させてもよく、該コンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを備え、ユーザは、該キーボード及び該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類の装置は、さらにユーザとの対話を提供してもよく、例えば、ユーザに提供されたフィードバックは、いかなる形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、かついかなる形式（音声入力、語音入力又は、触覚入力を含む）でユーザからの入力を受信してもよい。

ここで説明されたシステム及び技術は、バックグラウンド部品を含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェア部品を含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンド部品を含むコンピューティングシステム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザが該グラフィカルユーザインタフェース又は該ネットワークブラウザを介してここで説明されたシステム及び技術の実施形態と対話することができる）、又はこのようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品のいずれかの組み合わせを含むコンピューティングシステムに実施されることが可能である。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によりシステムの部品を互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）及びインターネットを例示的に含む。

コンピュータシステムは、クライアント及びサーバを含んでもよい。クライアントとサーバ同士は、一般的に離れており、通常、通信ネットワークを介して対話する。クライアントとサーバとの関係は、該当するコンピュータ上でランニングし、クライアント－サーバの関係を有するコンピュータプログラムによって生成される。サーバは、クラウドサーバであってもよく、クラウドサーバは、クラウドコンピューティングサーバ又はクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムのうちの１つのホスト製品であり、従来の物理ホストとＶＰＳサービス（「ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ」、又は「ＶＰＳ」と略称する）に存在する管理難度が大きく、サービス拡張性が弱いという欠陥を解決する。サーバは、分散型システムのサーバであってもよく、又はブロックチェーンを組合せたサーバであってもよい。

理解されるべきこととして、以上に示された様々な形式のフローを使用してもよく、操作を改めてソーティングしたり、追加したり又は削除してもよい。例えば、本開示に記載の各操作は、並列に実行されたり、順次に実行されたり、又は異なる順序で実行されてもよく、本開示に開示された技術案が所望する結果を実現することができれば、本明細書はここで限定されない。

上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション及び代替を行うことが可能であると理解すべきである。本開示の精神と原則内で行われる任意の修正、均等置換及び改良などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims

プロセッサによって実行される連合学習方法であって、
現在学習周期に対して、複数の候補機器のリソース情報に基づいて、前記複数の候補機器のうち、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を特定することと、
前記各タスクに対する対象機器に前記各タスクに対するグローバルモデルを送信することで、前記各タスクに対する対象機器が前記各タスクに対するグローバルモデルをトレーニングすることと、
前記各タスクのすべての対象機器に対して送信されたトレーニング後モデルを受信したことに応答して、前記トレーニング後モデルに基づいて前記各タスクに対するグローバルモデルを更新して、前記現在学習周期を完了することと、を含み、
前記複数の候補機器のうち、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を特定することは、
前記複数の候補機器のリソース情報に基づいて、現在学習周期の時間コストを最小にさせる、それぞれ少なくとも１つの学習タスクに対する複数の対象機器グループを含む対象機器セットを候補スケジューリング情報として特定することと、
前記候補スケジューリング情報と複数の所定スケジューリング情報とを初期スケジューリング情報セットとして、所定ループ停止条件を満たすまで、以下の操作をループして実行することとを含み、
前記操作は、
現在スケジューリング情報セットにおける対象スケジューリング情報を調整して、ｎ個（ｎは正の整数である）の調整後スケジューリング情報を得ることと、
前記ｎ個の調整後スケジューリング情報及び前記現在スケジューリング情報セットから前記現在学習周期の時間コストを高くするｎ個のスケジューリング情報を除去して、更新後スケジューリング情報セットを得ることと、を含む。
連合学習方法。
現在学習周期の時間コストを最小にさせる対象機器セットを特定することは、
前記複数の候補機器のリソース情報に基づいて、前記複数の候補機器のそれぞれが前記各タスクを実行する時間長情報を特定することと、
前記時間長情報に基づいて、現在学習周期の時間コストを最小にさせる対象機器セットを特定することと、を含む、
請求項１に記載の方法。
現在学習周期の時間コストを最小にさせる対象機器セットを特定することは、
前記各候補機器が前記現在学習周期の前の学習周期で前記各タスクを実行する回数に基づいて、前記複数の候補機器の、前記各タスクに対するスケジューリングバランス分散を特定することと、
前記スケジューリングバランス分散と前記時間長情報とに基づいて、現在学習周期の時間コストを最小にさせる対象機器セットを特定することと、を含む、
請求項２に記載の方法。
前記複数の候補機器のそれぞれが前記各タスクを実行する時間長情報を特定することは、
前記各候補機器のリソース情報に基づいて、前記各候補機器の計算能力を示す、前記各候補機器の計算指標を特定することと、
前記計算指標と前記各候補機器に記憶された前記各タスクに対するトレーニングデータのデータ量とに基づいて、所定変位指数分布を用いて前記各候補機器が前記各タスクを実行する時間長情報を特定することと、を含む、
請求項２に記載の方法。
現在スケジューリング情報セットにおける対象スケジューリング情報を調整することは、
前記現在スケジューリング情報セットにおける各スケジューリング情報の、前記現在学習周期に対する時間コストに基づいて、前記現在スケジューリング情報セットにおける少なくとも２つのスケジューリング情報を対象スケジューリング情報として特定することと、
クロスオーバーにて前記対象スケジューリング情報のうちのいずれか２つのスケジューリング情報を調整して、調整後スケジューリング情報を得ることと、を含む、
請求項１に記載の方法。
クロスオーバーにて前記対象スケジューリング情報のうちのいずれか２つのスケジューリング情報を調整することは、
前記いずれか２つのスケジューリング情報中の候補機器の差分セットを特定して、複数の対象機器を得ることと、
前記複数の対象機器に基づいて、前記クロスオーバーにて前記対象スケジューリング情報のうちのいずれか２つのスケジューリング情報を調整することと、を含む、
請求項５に記載の方法。
前記各タスクを実行する対象機器のリソース情報に基づいて、前記各タスクに対する対象機器が前記各タスクに対するグローバルモデルをトレーニングする目標回数を特定することと、
前記各タスクに対する対象機器に前記目標回数を送信することで、前記各タスクに対する対象機器が前記目標回数に基づいて前記各タスクに対するグローバルモデルをトレーニングするようにすることと、をさらに含む、
請求項１に記載の方法。
現在学習周期に対して、複数の候補機器のリソース情報に基づいて、前記複数の候補機器のうち、実行すべき少なくとも１つの学習タスクのそれぞれに対する対象機器を特定するための第１の特定モジュールと、
前記各タスクに対する対象機器に前記各タスクに対するグローバルモデルを送信することで、前記各タスクに対する対象機器が前記各タスクに対するグローバルモデルをトレーニングするための第１の送信モジュールと、
前記各タスクのすべての対象機器に対して送信されたトレーニング後モデルを受信したことに応答して、前記トレーニング後モデルに基づいて前記各タスクに対するグローバルモデルを更新して、前記現在学習周期を完了するための更新モジュールと、を含み、
前記第１の特定モジュールは、
前記複数の候補機器のリソース情報に基づいて、現在学習周期の時間コストを最小にさせる、それぞれ少なくとも１つの学習タスクに対する複数の対象機器グループを含む対象機器セットを候補スケジューリング情報として特定するための第１の特定サブモジュールと、
前記候補スケジューリング情報と複数の所定スケジューリング情報とを初期スケジューリング情報セットとし、所定ループ停止条件を満たすまで、以下の手段によってループして操作を実行するためのループサブモジュールと、を含み、
上記手段は、
現在スケジューリング情報セットにおける対象スケジューリング情報を調整して、ｎ個（ｎは正の整数である）の調整後スケジューリング情報を得るための調整手段と、
前記ｎ個の調整後スケジューリング情報及び前記現在スケジューリング情報セットから前記現在学習周期の時間コストを高くするｎ個のスケジューリング情報を除去して、更新後スケジューリング情報セットを得るための除去手段と、を含む、
連合学習装置。
前記第１の特定サブモジュールは、
前記複数の候補機器のリソース情報に基づいて、前記複数の候補機器のそれぞれが前記各タスクを実行する時間長情報を特定するための第１の特定手段と、
前記時間長情報に基づいて、現在学習周期の時間コストを最小にさせる対象機器セットを特定するための第２の特定手段と、を含む、
請求項８に記載の装置。
前記第２の特定手段は、
前記各候補機器が前記現在学習周期の前の学習周期で前記各タスクを実行する回数に基づいて、前記複数の候補機器の、前記各タスクに対するスケジューリングバランス分散を特定するための第１の特定サブ手段と、
前記スケジューリングバランス分散と前記時間長情報とに基づいて、現在学習周期の時間コストを最小にさせる対象機器セットを特定するための第２の特定サブ手段と、を含む、
請求項９に記載の装置。
前記第１の特定手段は、
前記各候補機器のリソース情報に基づいて、前記各候補機器の計算能力を示す、前記各候補機器の計算指標を特定するための第３の特定サブ手段と、
前記計算指標と前記各候補機器に記憶された前記各タスクに対するトレーニングデータのデータ量とに基づいて、所定変位指数分布を用いて前記各候補機器が前記各タスクを実行する時間長情報を特定するための実行サブ手段と、を含む、
請求項９に記載の装置。
前記調整手段は、
前記現在スケジューリング情報セットにおける各スケジューリング情報の、前記現在学習周期に対する時間コストに基づいて、前記現在スケジューリング情報セットにおける少なくとも２つのスケジューリング情報を対象スケジューリング情報として特定するための第４の特定サブ手段と、
クロスオーバーにて前記対象スケジューリング情報のうちのいずれか２つのスケジューリング情報を調整して、調整後スケジューリング情報を得るための第１の調整サブ手段と、を含む、
請求項８に記載の装置。
前記第１の調整サブ手段は、
前記いずれか２つのスケジューリング情報中の候補機器の差分セットを特定して、複数の対象機器を得るための第５の特定サブ手段と、
前記複数の対象機器に基づいて、前記クロスオーバーにて前記対象スケジューリング情報のうちのいずれか２つのスケジューリング情報を調整するための第２の調整サブ手段と、を含む、
請求項１２に記載の装置。
前記各タスクを実行する対象機器のリソース情報に基づいて、前記各タスクに対する対象機器が前記各タスクに対するグローバルモデルをトレーニングする目標回数を特定するための第２の特定モジュールと、
前記各タスクに対する対象機器に前記目標回数を送信することで、前記各タスクに対する対象機器が前記目標回数に基づいて前記各タスクに対するグローバルモデルをトレーニングするようにするための第２の送信モジュールと、をさらに含む、
請求項８に記載の装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信接続するメモリとを有する電子機器であって、
前記メモリに、前記少なくとも１つのプロセッサによって実行され得るコマンドが記憶されており、前記コマンドが前記少なくとも１つのプロセッサによって実行されることで、前記少なくとも１つのプロセッサが請求項１～７のいずれか一項に記載の方法を実行することができる、
電子機器。
コンピュータに請求項１～７のいずれか一項に記載の方法を実行させるためのコンピュータコマンドを記憶している、
非一時的なコンピュータ読取可能な記憶媒体。
プロセッサにより実行される場合に、請求項１～７のいずれか一項に記載の方法を実現するコンピュータプログラム。