JP2022017588A

JP2022017588A - 深層学習フレームワークのトレーニング方法、装置及び記憶媒体

Info

Publication number: JP2022017588A
Application number: JP2021185382A
Authority: JP
Inventors: ティエンジェンハー，; Tianjian He; ディエンハイユー，; Dianhai Yu; ヂーファウー，; Zhihua Wu; ダーシアンドン，; Daxiang Dong; イエンジュンマー，; Yanjun Ma
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-03-10
Filing date: 2021-11-15
Publication date: 2022-01-25
Also published as: EP3955174A3; CN113032117A; KR20210156243A; EP3955174A2; US20220036241A1

Abstract

【課題】深層学習フレームワークの自動的なフレキシブルトレーニングを実現し、トレーニング効果を確保した上でトレーニング効率を向上させ、人的コストを削減する方法、装置、電子機器、プログラム及び記憶媒体を提供する。【解決手段】方法は、ターゲットタスクがトレーニング開始条件を満たす場合、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得するステップと、少なくとも１つのタスクノードのノード数が予め設定された数を超えるかどうかを判断するステップと、ノード数が予め設定された数を超える場合、少なくとも１つのタスクノードはサンプルデータに基づいて、ターゲットタスクの深層学習フレームワークを同期トレーニングするステップと、ターゲットタスクがトレーニング終了条件を満たす場合、同期トレーニングされたターゲット深層学習フレームワークを取得するステップと、を含む。【選択図】図１

Description

本開示は深層学習、ビッグデータ処理などの技術の分野に関し、特に深層学習フレームワークのトレーニング方法、装置及び記憶媒体に関する。

コンピュータ技術の応用に伴い、深層学習技術は教師あり学習の分野で大きな成功を収め、深層学習のモデルフレームワークをトレーニングする時、大規模なラベル付きデータを取得するコストが高いという問題を解決するために、教師なし技術は次第に人々に重視され始めた。多くの無教師あり学習技術では、比較学習はこの一年間で並外れている潜在力を示し、さらに、多くの任務上の指標はすでに教師あり学習の効果に迫っている。具体的には視覚の分野では、深層モデルフレームワークに対するトレーニングは、あるプリトレーニングタスクによって画像に対する表現を学習し、学習された表現を直接具体的なタスクに応用することが望ましい。

しかしながら、実際のトレーニングでは、タスクはクラスターに作業に送信して実行され、複数の人が１ロットのマシンリソースを共有する。プリトレーニングタスクが長い間クラスターリソースを占有すると、他のユーザの調査タスク、または優先度の高いタスクが実行できなくなる。それに、私たちはタスクの送信に成功したとしても、実行に失敗するかどうかを頻繁に観察する必要であり、失敗を発見したら、手動でタスクを再送信する必要であるため、トレーニングの効率は非常に低い。

本開示は、クラスターにおけるタスクトレーニングの人力投入を低減し、及びトレーニング効率を向上させる深層学習フレームワークのトレーニング方法、装置及び記憶媒体を提供する。

本開示の一態様によれば、深層学習フレームワークのトレーニング方法を提供し、ターゲットタスクがトレーニング開始条件を満たす場合、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得するステップと、前記少なくとも１つのタスクノードのノード数が予め設定された数を超えるかどうかを判断するステップと、前記ノード数が前記予め設定された数を超える場合、前記少なくとも１つのタスクノードはサンプルデータに基づいて、前記ターゲットタスクの深層学習フレームワークを同期トレーニングするステップと、前記ターゲットタスクがトレーニング終了条件を満たす場合、同期トレーニングされたターゲット深層学習フレームワークを取得するステップと、を含む。

本開示の別の様態によれば、深層学習フレームワークのトレーニング装置を提供し、ターゲットタスクがトレーニング開始条件を満たす場合、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得するための第１取得モジュールと、前記少なくとも１つのタスクノードのノード数が予め設定された数を超えるかどうかを判断するための判断モジュールと、前記ノード数が前記予め設定された数を超える場合、前記少なくとも１つのタスクノードがサンプルデータに基づいて、前記ターゲットタスクの深層学習フレームワークを同期トレーニングすることに用いられるトレーニングモジュールと、前記ターゲットタスクがトレーニング終了条件を満たす場合、同期トレーニングされたターゲット深層学習フレームワークを取得するための第２取得モジュールと、を含む。

本開示の別の様態によれば、電子機器を提供し、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサによって実行される場合、前記少なくとも１つのプロセッサが第１様態の実施例の深層学習フレームワークのトレーニング方法を実行させる。

本開示の別の様態によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに第１様態の実施例の深層学習フレームワークのトレーニング方法を実行させる。

本出願の別の様態によれば、コンピュータプログラムを提供し、前記コンピュータプログラムはプロセッサによって実行される場合、第１様態の実施例の深層学習フレームワークのトレーニング方法を実現する。

本開示の実施例は、少なくとも以下のような技術的な効果を有する。
ターゲットタスクがトレーニング開始条件を満たす場合、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得し、さらに、少なくとも１つのタスクノードのノード数が予め設定された数を超えるかどうかを判断し、予め設定された数を超える場合、少なくとも１つのタスクノードがサンプルデータに基づいてターゲットタスクの深層学習フレームワークを同期トレーニングし、最後に、ターゲットタスクがトレーニング終了条件を満たす場合、同期トレーニングされたターゲット深層学習フレームワークを取得する。これにより、深層学習フレームワークの自動的なフレキシブルトレーニングを実現し、トレーニング効果を確保した上で、トレーニング効率を向上させ、人的コストを削減する。

なお、この部分に記載されている内容は、本開示の実施例の肝心または重要な特徴を特定することを意図しておらず、本開示の範囲を限定することも意図していないことを理解されたい。本開示の他の特徴は、以下の説明を通して容易に理解される。

図面は、本方案をよりよく理解するために使用され、本開示を限定するものではない。
本開示の第１実施例に係る深層学習フレームワークのトレーニング方法のフローチャートである。本開示の第２実施例に係るターゲットタスクトレーニングの状態概略図である。本開示の第３実施例に係る深層学習フレームワークのトレーニング方法のフローチャートである。本開示の第４実施例に係る深層学習フレームワークのトレーニング方法のフローチャートである。本開示の第５実施例に係る深層学習フレームワークのトレーニング装置の概略構成図である。本開示の第６実施例に係る深層学習フレームワークのトレーニング装置の概略構成図である。本開示の実施例の深層学習フレームワークのトレーニング方法を実現する電子機器のブロック図である。

以下、図面と組み合わせて本開示の例示的な実施例を説明し、理解を容易にするためにその中には本開示の実施例の様々な詳細事項を含んでおり、それらは単なる例示的なものと見なされるべきである。したがって、当業者は、本開示の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更と修正を行うことができることを認識されたい。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

深層学習フレームワークがクラスターリソースにおいてトレーニングされる場合、トレーニング状態を人工的に監視する必要があるため、人的コストが高くなり、及び、トレーニングタスクがクラスターリソースを長時間占有して他タスクに影響を与えて、優先度の高いタスクが実行できなくなるという上記背景技術で言及された問題を解決するために、本開示は深層学習モデルの深層学習フレームワークのフレキシブルトレーニング方式を提供する。クラスターリソースがアイドル状態である場合、我々のプリトレーニングタスクを実行し、人工的に監視する必要はない。より高い優先度のタスクが存在する場合、我々のタスクを終了し、他の高優先度のタスクに影響することを回避する。

具体的には、図１は、本開示の第１実施例に係る深層学習フレームワークのトレーニング方法のフローチャートであり、図１に示すように、当該方法は以下のステップ１０１～１０４を含む。

ステップ１０１において、ターゲットタスクがトレーニング開始条件を満たす場合、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得する。

ターゲットタスクは、画像種別の認識、医薬品に対するラベル分類、画像に対する意味認識などを含む任意の、深層学習に用いられる深層学習フレームワークへのトレーニングタスクであってもよい。

現在タスクノードクラスターは、クラスターリソースに大量のトレーニングタスクが溜まっている可能性があり、ターゲットタスクのトレーニングの実行には一定のリソースが必要とされ、そのため、ターゲットタスクの実行の可能性を確保するために、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得することは容易に理解される。ここで、クラスター内の各ノードはマシンリソースとして理解でき、当該マシンリソースは、サンプルデータに基づいて深層学習フレームワークをトレーニングすることに用いることができる。

ステップ１０２において、少なくとも１つのタスクノードのノード数が予め設定された数を超えるかどうかを判断する。

予め設定された数は、ターゲットタスクのトレーニングタスクの量によって決定されてもよく、いくつかの可能な実施例において、予め試験データに基づいてトレーニングして深層学習モデルを取得でき、当該深層学習モデルの入力はターゲットタスクのタスクタイプであり、出力は予め設定された数であり、これにより、当該深層学習モデルによって対応するタスクタイプを取得することができる。

少ないタスクノードが存在する場合、ターゲットタスクのトレーニング強度を明らかに負担できず、そのため、少なくとも１つのタスクノードのノード数が予め設定された数以上であるかどうかを判断することを理解されたい。

ステップ１０３において、ノード数が予め設定された数を超える場合、少なくとも１つのタスクノードはサンプルデータに基づいて、ターゲットタスクの深層学習フレームワークを同期トレーニングする。

本実施例では、予め設定された数を超える場合、ターゲットタスクを起動できることが示され、条件を満たすすべてのタスクノードによってタスクの深層学習フレームワークを同期トレーニングする。

深層学習フレームワークは、任意の形式の深層学習モデルの初期アーキテクチャであってもよく、畳み込み層、プーリング層、全結合層などを含むことができる。

異なるノードのサンプルデータの取得ルート及び取得時間などは異なってもよいため、異なるタスクノードのトレーニング時に採用されたサンプルデータによってトレーニング結果が異なり、したがって、トレーニング効果の全面性を確保するために、本開示の実施例において、条件を満たすすべてのタスクノードによってタスクの深層学習フレームワークを同期トレーニングし、すべてのタスクノードのトレーニング結果を同期することを理解されたい。

本開示の一実施例では、各タスクノードにおいて深層学習フレームワークをトレーニングし、予め設定された周期に基づいて、各周期の各タスクノードにおける深層学習フレームワークのフレームワークパラメータを読み取る。当該フレームワークパラメータは深層学習モデルのモデルパラメータなどとして理解されてもよく、すべてのタスクノードのフレームワークパラメータの平均値である第１平均値を決定し、第１平均値に基づいて各タスクノードにおける深層学習フレームワークを同期し、これにより、異なるタスクノードの間のトレーニングの同期を実現する。

本開示の別の実施例では、深層学習フレームワークを複数のトレーニング段階に分け、各トレーニング段階が満たされる時、各タスクノードにおける当該トレーニング段階に対するフレームワークパラメータを取得し、当該段階のフレームワークパラメータに対して平均値を求めた後、各トレーニング段階の同期を実現する。

ステップ１０４において、ターゲットタスクがトレーニング終了条件を満たす場合、同期トレーニングされたターゲット深層学習フレームワークを取得する。

いくつかの可能な実施例において、ユーザによって送信されたトレーニングタスクの完成条件を受信した場合、ターゲットタスクがトレーニング終了条件を満たすと見なす。いくつかの別の可能な実施例では、各タスクノードにおいて、損失関数によって深層学習フレームワークの損失値を算出し、すべてのタスクノードの損失値が予め設定された閾値未満である場合、ターゲットタスクがトレーニング終了条件を満たすと見なす。

ターゲットタスクがトレーニング終了条件を満たす場合、すべてのタスクノードが同期トレーニングされるため、すべてのタスクノードの同期トレーニングされたターゲット深層学習フレームワークを取得し、当該ターゲット深層学習フレームワークはすべてのタスクノードを同期するトレーニング結果であり、さらに、ターゲット深層学習フレームワークによってターゲット深層学習フレームワークが必要とされる任意のシーンを行い、例えば、ターゲット深層学習フレームワークによって画像意味の認識を行う。例えば、ターゲット深層学習フレームワークによって画像分類を行う。例えば、ターゲット深層学習フレームワークによって医学などの分野における医薬品ラベルの決定などを行う。

以下は具体的な適用のシーンと組み合わせて、具体的な適用のシーンにおいて深層学習フレームワークをトレーニングするプロセスを例示的に説明する。

［例示１］
本例では、ターゲット深層学習フレームワークによって画像意味の認識を行う。

具体的には、画像意味の認識の需要に応じてトレーニング開始条件を決定し、本例では、トレーニング開始条件がアイドル状態のノードであり、予め設定された数が５つを超過する数である場合、現在タスクノードクラスターにおいてアイドル状態のノード数が５つ以上になると、アイドル状態であるノードをタスクノードに決定する。

さらに、各タスクノードにおいて画像意味認識の深層学習フレームワークをトレーニングし始め、各タスクノードのトレーニングサンプル画像は、オンラインで取得してもよく、当該タスクノードのローカルから読み取ってもよく、各タスクノードのトレーニングサンプル画像は全く同じではなく、教師なしのトレーニング方式を用いることによって各タスクノードの深層学習フレームワークが学習して画像意味に対応するフレームワークパラメータを取得できるようにし、且つ、本実施例では、一定の時間おきに、すべてのタスクノードのフレームワークパラメータの平均値を算出し、平均値に基づいて各タスクノードにおける深層学習フレームワークを同期する。

本実施例では、損失関数によって最後に同期された深層学習フレームワークの意味損失値を算出し、例えば、標準意味が注釈された参照トレーニング画像を最後に同期された深層学習フレームワークに入力し、当該最後に同期された深層学習フレームワークから出力された参照意味を取得し、参照意味と標準意味の意味損失値を算出し、損失がいずれも予め設定された閾値より低い場合、当該最後に同期された深層学習フレームワークが画像を意味認識できるターゲット深層学習フレームワークであると見なす。

トレーニングされたターゲット深層学習フレームワークを取得した後、認識対象の意味の画像を当該深層学習フレームワークに入力し、当該ターゲット深層学習フレームワークから出力された画像意味を取得することができる。

［例示２］
本例では、ターゲット深層学習フレームワークによって医薬品類別の類別ラベルの決定を行う。

具体的には、類別ラベルに基づいてトレーニング開始条件を決定し、本例では、トレーニング開始条件はアイドル状態のノードであり、予め設定された数は２０を超過する数であり、現在タスクノードクラスターにおいてアイドル状態のノード数が２０以上になると、アイドル状態であるノードをタスクノードに決定する。

さらに、各タスクノードにおいて医薬品類別の類別ラベルの深層学習フレームワークをトレーニングし始め、各タスクノードのトレーニングサンプルデータはオンラインで取得してもよく、当該タスクノードのローカルから読みとってもよく、トレーニングサンプルデータは各種の医薬品の医薬品成分、医薬品生産メーカー情報などであってもよく、各タスクノードのトレーニングサンプルデータは全く同じではなく、教師なしのトレーニング方式を用いることによって各タスクノードの深層学習フレームワークが学習して類別認識に対応するフレームワークパラメータを取得できるようにし、且つ、本実施例では、一定の時間おきに、すべてのタスクノードのフレームワークパラメータの平均値を算出し、平均値に基づいて各タスクノードにおける深層学習フレームワークを同期する。

本実施例では、損失関数によって最後に同期された深層学習フレームワークの類別ラベル損失値を算出し、例えば、標準類別ラベルをマーキングする参照医薬品情報を最後に同期された深層学習フレームワークに入力し、当該最後に同期された深層学習フレームワークから出力された参照類別ラベルを取得し、参照類別ラベルと標準類別ラベルの類別ラベル損失値を算出し、損失がいずれも予め設定された閾値より低い場合、当該最後に同期された深層学習フレームワークが医薬品の類別ラベルを認識できるターゲット深層学習フレームワークであると見なす。

トレーニングされたターゲット深層学習フレームワークを取得した後、認識対象の類別ラベルの医薬品情報を当該深層学習フレームワークに入力し、当該ターゲット深層学習フレームワークから出力された類別ラベルを取得できる。これにより、上記トレーニングプロセスは全プロセスでトレーニングの自動化を実現し、ユーザがクラスターリソース及び人物状態などを監視する必要がなく、トレーニングの人的コストを削減し、トレーニング効率を向上させる。

以上のように、本開示の実施例の深層学習フレームワークのトレーニング方法は、ターゲットタスクがトレーニング開始条件を満たす場合、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得し、さらに、少なくとも１つのタスクノードの数が予め設定された数を超えるかどうかを判断し、予め設定された数を超える場合、少なくとも１つのタスクノードはサンプルデータに基づいて、ターゲットタスクの深層学習フレームワークを同期トレーニングし、最後に、ターゲットタスクがトレーニング終了条件を満たす場合、タスクノードの同期トレーニングされたターゲット深層学習フレームワークを取得する。これにより、深層学習フレームワークの自動的なフレキシブルトレーニングを実現し、トレーニング効果を確保した上で、トレーニング効率を向上させ、人的コストを削減する。

なお、異なる適用のシーンにおいて、ターゲットタスクに対応するトレーニング開始条件、及び少なくとも１つのタスクノードに対応する予め設定された開始条件は異なり、まず、例示的にターゲットタスクに対応するトレーニング開始条件を以下のように説明する。

［例示１］
本発明の一実施例では、ターゲットタスクのトレーニングに対する自動化管理を容易にするために、タスクの４つの状態を設定し、図２に示すように、タスクトレーニングの４つの状態は、有効化、待機、動作、終了を含み、これらの変換関係は図２を参照し、各タスクの初期状態はすべて「有効化」であり、クラスターリソースにおいてトレーニングする時、タスクの状態は動作であり、動作状態はタスクが正常に動作していることを示し、中断され、プリエンプトされ、マシンの故障やその他の原因で失敗する場合、待機状態に変換され、待機状態の場合、クラスターリソースがトレーニング開始に関連する要求に再度満たすと、トレーニングタスクは再び動作状態に変換され、タスク全体がトレーニングを順調に完成した後、終了状態に変換され、トレーニング終了を示す。

そのため、本実施例では、ターゲットタスクがトレーニング開始条件を満たすことは、ターゲットタスクが有効化状態に起動されることであってもよく、または、ターゲットタスクが待機状態であることであってもよい。

本実施例では、各タスクノードが待機状態になった後も、前のトレーニング結果を保留することを確保するために、タスクはトレーニングする時、一定の時間おきに、対応する深層学習フレームワークのフレームワークパラメータなどを保存することによって、待機状態の時、マシンリソースが再度満たされると、最近保存されたフレームワークパラメータから自動的にホットスタットして次のトレーニングを行うことを容易にし、トレーニングタスクは再び動作状態に変換される。

［例示２］
本実施例では、人為的にトリガーするトレーニング開始のインタフェースを提供し、受信したユーザ音声情報にターゲットタスクのトレーニング開始キーワードが含まれる場合、または、ユーザが予め設定されたトレーニング開始コントロールをトリガーする時、ターゲットタスクがトレーニング開始条件を満たすと決定する。

［例示３］
本例では、他の高優先度タスクの進行を妨げないために、高レベルのスタクを実行する必要がない場合のみ、タスクのトレーニング開始条件が満たされる。

本実施例では、現在タスクノードクラスターにおける実行対象のタスクの優先度を監視し、優先度が予め設定されたレベルより低い場合、ターゲットタスクがトレーニング開始条件を満たすと決定する。

クラスターリソースに大量のトレーニングタスクが溜まっている可能性があり、ターゲットタスクのトレーニングの実行には一定のリソースが必要であり、そのため、ターゲットタスクを実行できることを確保するために、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得することは容易に理解される。ここで、クラスターにおける各ノードはマシンリソースとして理解でき、当該マシンリソースはサンプルデータによって深層学習フレームワークをトレーニングすることができる。

次に、少なくとも１つのタスクノードに対応する予め設定された開始条件については、以下のように例示的に説明する。

［例示１］
本例では、予め設定された開始条件はノード状態がアイドル状態であることである。

本例では、現在タスクノードクラスターにおける各ノードのノード状態を決定し、当該ノード状態はタスク実行状態及びアイドル状態などを含むことができ、本実施例では、ノード状態がアイドル状態であるノードを、予め設定された開始条件を満たすタスクノードに決定する。

本実施例では、各ノードに状態ビットのクエリ請求を送信して、各ノードのフィードバック情報に基づいて、各ノードのノード状態を決定することができる。

［例示２］
本例では、予め設定された開始条件はアイドルリソース量が一定値を超過することである。

本実施例では、現在タスクノードクラスターにおける各ノードのアイドルリソース量、例えば、アイドルメモリ量を決定し、例えば、各ノードも１つのサブクラスターである場合、アイドルリソース量は各ノードにおけるアイドルのサブノードの数などである。

さらに、アイドルリソース量が予め設定された閾値を超過するノードを、予め設定された開始条件を満たすタスクノードに決定し、予め設定された閾値はターゲットタスクのトレーニング量によって決定することができる。

以上のように、本開示の実施例の深層学習フレームワークのトレーニング方法は、シーン需要に応じて、異なる方式でターゲットタスクに対応するタスクノードを柔軟に決定し、ターゲットタスクトのレーニングの自動化をさらに向上させる。

自己教師ありの手段はすべてデーターパラレルポリシーを用いるため、１つのタスクにとっては、使うノード数が多いほど、パラレルの度合いが高いことを意味し、したがってトレーニングするための時間が短い。

教師ありトレーニングでは、深層ニューラルネットワークをトレーニングする時、深層ニューラルネットワークのトレーニングプロセスにおいて各層の深層ニューラルネットワークの入力を同じ分布に維持する必要があるというトレーニング要件が存在するため、トレーニングプロセスにおいてノード数を増減すると、統計量が変動し、トレーニングが不安定になり、効果が損なわれることになることに注意されたい。自己教師ありトレーニングの上記いくつかの方案では、上記トレーニング要件はすべて全体的なものであるため、ノードの増減は効果に対して全く影響を与えない。この点は私たちが設計したフレキシブルトレーニングモジュールの理論的保証である。

本発明の一実施例では、自動的なフレキシブルプリトレーニングフレームワークを設定し、クラスターのアイドルリソースを十分に使用して自己教師ありトレーニングというすごく時間のかかるタスクを完成できる。より重要なことは、上記トレーニングによって求められたグローバル化要件が、複数のタスクノードの間でトレーニングされたフレームワークパラメータを同期させ、これによってフレキシブルトレーニングの効果が損なわれないことを確保した。且つ、自動検出再送メカニズムは、調査者が常に任務状態を確認する必要がないようにすることができ、人力を解放してより有意義なことをする。

具体的には、図３は本開示の一実施例に係る深層学習フレームワークのトレーニング方法のフローチャートであり、図３に示すように、上記ステップにおいてタスクのトレーニング終了命令を取得する前に、当該方法は、以下のステップ３０１～３０２をさらに含む。

ステップ３０１において、現在タスクノードクラスターに予め設定された開始条件を満たす他のタスクノードが含まれているかどうかを監視する。

本実施例では、ノードトレーニングプロセスにおいて、すなわちタスクがトレーニングするプロセスにおいて、すなわち動作状態にある時、クラスターにより多くのアイドルノードがあると発見する場合、直接「弾く」ことができ、より多くのノードでクラスターリソースを十分に使用してトレーニングを加速する。または、タスクノードが待機状態から動作状態になる場合、現在タスクノードクラスターに予め設定された開始条件を満たす他のタスクノードが含まれているかどうかを監視する。

ステップ３０２、他のタスクノードが存在する場合、他のタスクノードと少なくとも１つのタスクノードはサンプルデータに基づいて、ターゲットタスクの深層学習フレームワークを同期トレーニングする。

本実施例では、他のノードが存在する場合、他のタスクノードと少なくとも１つのタスクノードはサンプルデータに基づいて深層学習フレームワークを同期トレーニングする。例えば、あるタスクは、最初のトレーニングに４つのタスクノードを使用し、その後にプリエンプトされたため、待機状態になった。ターゲットタスクのトレーニング開始条件が再度満たされた時、８つのアイドルのタスクノードがあり、この時、私たちは自動的に当該タスクのために８つのタスクノードを割り当て、これによってフレキシブルという目的を達成する。

本開示の実施例において、他のタスクノードは深層学習フレームワークの初期状態からトレーニングされるのではなく、タスクノードのトレーニングされた状態からトレーニングされる。図４に示すように、他のタスクノードと少なくとも１つのタスクノードに基づいて深層学習フレームワークを同期トレーニングするステップは以下のステップ４０１～４０３を含む。

ステップ４０１、少なくとも１つのタスクノードにおける深層学習フレームワークの現在フレームワークパラメータを取得する。

各タスクノードにおける深層学習フレームワークのフレームワークパラメータはすべて現在タスクノードがトレーニングされた後の成果であることは理解される。

ステップ４０２において、すべての現在フレームワークパラメータの平均値である第２平均値を決定する。

ステップ４０３において、他のタスクノードと少なくとも１つのタスクノードは第２平均値に基づいて深層学習フレームワークのフレームワークパラメータを更新する。

本実施例では、すべてのタスクノードのフレームワークパラメータの第２平均値を算出し、第２平均値に基づいて深層学習フレームワークのフレームワークパラメータを更新し、これによって更新された後の参照フレームワークパラメータを取得し、当該参照フレームワークパラメータには、すべてのタスクノードの現在トレーニング結果が含まれる。

本実施例では、他のタスクノードと少なくとも１つのタスクノードに基づいてターゲットタスクの深層学習フレームワークをトレーニングし、ターゲットタスクのトレーニング効率を向上させる。

もちろん、本開示の一実施例では、ノードに対する占用率を低減するために、ターゲットタスクのトレーニング量に基づいて他のノードの上限を設定してもよく、他のノードの数が当該上限を超過する場合、予め設定された条件を満たすタスクノードから上限に対応する数のノードをランダムに選択して他のノードとする。

以上のように、本開示の実施例の深層学習フレームワークのトレーニング方法は、自動的なフレキシブルプリトレーニングフレームワークを用いて、クラスターのアイドルリソースを十分に使用して自己教師ありトレーニングというすごく時間のかかるタスクを完成でき、トレーニング効果を確保しながらトレーニング効率を向上させる。

上記実施例を実現するために、本開示は深層学習フレームワークのトレーニング装置をさらに提供する。図５は本開示の一実施例に係る深層学習フレームワークのトレーニング装置の概略構成図であり、図５に示すように、当該装置は、第１取得モジュール５１０、判断モジュール５２０、トレーニングモジュール５３０及び第２取得モジュール５４０を含む。

第１取得モジュール５１０は、ターゲットタスクがトレーニング開始条件を満たす場合、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得する。

判断モジュール５２０は、少なくとも１つのタスクノードのノード数が予め設定された数以上であるかどうかを判断する。

トレーニングモジュール５３０は、ノード数が予め設定された数を超える場合、少なくとも１つのタスクノードによってサンプルデータに基づいて、ターゲットタスクの深層学習フレームワークを同期トレーニングする。

第２取得モジュール５４０は、ターゲットタスクがトレーニング終了条件を満たす場合、同期トレーニングされたターゲット深層学習フレームワークを取得する。

本開示の一実施例では、第１取得モジュール５１０は、具体的に、
現在タスクノードクラスターにおける各ノードのノード状態を決定し、
ノード状態がアイドル状態条件であるノードを、予め設定された開始条件を満たす少なくとも１つのタスクノードに決定する。

本開示の一実施例では、第１取得モジュール５１０は、具体的に、
現在タスクノードクラスターにおける各ノードのアイドルリソース量を決定し、
アイドルリソース量が予め設定された閾値条件を超えるノードを、予め設定された開始条件を満たす少なくとも１つのタスクノードに決定する。

本開示の一実施例では、トレーニングモジュール５３０は、具体的に、
各タスクノードにおいて深層学習フレームワークをトレーニングし、
予め設定された周期に基づいて、各周期の各タスクノードにおける深層学習フレームワークのフレームワークパラメータを読み取り、
すべてのタスクノードのフレームワークパラメータの平均値である第１平均値を決定し、第１平均値に基づいて各タスクノードにおける深層学習フレームワークを同期する。

なお、前記深層学習フレームワークのトレーニング方法に対する説明は、本開示の実施例の深層学習フレームワークのトレーニング装置にも適用され、その実現原理は同様であり、ここでは説明を省略する。

以上のように、本開示の実施例的深層学習フレームワークのトレーニング装置は、ターゲットタスクがトレーニング開始条件を満たす場合、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得し、さらに、少なくとも１つのタスクノードの数が予め設定された数を超えるかどうかを判断し、予め設定された数を超える場合、少なくとも１つのタスクノードはサンプルデータに基づいてターゲットタスクの深層学習フレームワークを同期トレーニングし、最後に、ターゲットタスクがトレーニング終了条件を満たす場合、少なくとも１つのタスクノードの同期トレーニングされたターゲット深層学習フレームワークを取得する。これにより、深層学習フレームワークの自動的なフレキシブルトレーニングを実現し、トレーニング効果を確保した上で、トレーニング効率を向上させ、人的コストを削減する。

本開示の一実施例では、図６に示すように、深層学習フレームワークのトレーニング装置は、第１取得モジュール６１０、判断モジュール６２０、トレーニングモジュール６３０、第２取得モジュール６４０及び監視モジュール６５０を含み、第１取得モジュール６１０、判断モジュール６２０、トレーニングモジュール６３０、第２取得モジュール６４０は上記実施例における第１取得モジュール５１０、判断モジュール５２０、トレーニングモジュール５３０及び第２取得モジュール５４０と同じ機能を有し、ここでは説明を省略する。

本実施例では、監視モジュール６５０は、現在タスクノードクラスターに予め設定された開始条件を満たす他のタスクノードが含まれているかどうかを監視する。

トレーニングモジュール６３０は、また、他のタスクノードと少なくとも１つのタスクノードはサンプルデータに基づいて、ターゲットタスクの深層学習フレームワークを同期トレーニングする。

本開示の一実施例では、トレーニングモジュール６３０は、具体的に、
少なくとも１つのタスクノードの各タスクノードにおける深層学習フレームワークの現在フレームワークパラメータを取得し、
すべての現在フレームワークパラメータの平均値である第２平均値を決定し、
他のタスクノードと少なくとも１つのタスクノードが第２平均値に基づいて深層学習フレームワークのフレームワークパラメータを更新する。

本開示の一実施例では、第１取得モジュール５１０は、具体的に、
現在タスクノードクラスターにおける実行対象のタスクの優先度を監視し、
優先度が予め設定されたレベルより低い場合、ターゲットタスクがトレーニング開始条件を満たすと決定する。

以上のように、本開示の実施例的深層学習フレームワークのトレーニング装置は、自動的なフレキシブルプリトレーニングフレームワークで、クラスターのアイドルリソースを十分に使用して自己教師ありトレーニングというすごく時間をかかるタスクを完成でき、トレーニング効果を確保しながらトレーニング効率を向上させる。

本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラムをさらに提供する。

図７は、本開示の実施例を実行するための例示的な電子機器７００の概略ブロック図を示す。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、携帯情報端末、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は、単なる例であり、本明細書の説明及び／又は要求される本開示の実現を制限することを意図したものではない。

図７に示すように、電子機器７００は、読み取り専用メモリ（ＲＯＭ）７０２に記憶されるコンピュータプログラムまたはメモリ７０８からランダムアクセスメモリ（ＲＡＭ）７０３にロードされたコンピュータプログラムに従って様々な適切な動作および処理を実行する計算ユニット７０１を含む。ＲＡＭ７０３には、デバイス７００の動作に必要な各種プログラムやデータが記憶されてもよい。計算ユニット７０１、ＲＯＭ７０２、およびＲＡＭ７０３は、バス７０４を介して互いに接続されている。パス７０４には、入力／出力（Ｉ／Ｏ）インタフェース７０５も接続されている。

デバイス７００の複数のコンポーネントはＩ／Ｏインタフェース７０５に接続され、キーボード、マウスなどの入力ユニット７０６、各タイプのディスプレイ、スピーカなどの出力ユニット７０７、磁気ディスク、光ディスクなどの記憶ユニット７０８、およびネットワークカード、モデム、無線通信トランシーバなどの通信ユニット７０９を含む。通信ユニット７０９は、デバイス７００が、ンターネットなどのコンピュータネットワーク及び／又は各種の電信ネットワークを介して他のデバイスと情報／データを交換することを可能にする。

計算ユニット７０１は、処理および計算能力を有する様々な汎用及び／又は専用の処理コンポーネントであってもよい。計算ユニット７０１のいくつかの例は、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、各種の専用の人工知能（ＡＩ）計算チップ、各種のマシン運転学習モデルアルゴリズムの計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、およびいずれかの適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット７０１は、上記に記載された各方法および処理、例えば、深層学習フレームワークのトレーニング方法を実行する。例えば、在いくつかの実施例では、深層学習フレームワークのトレーニング方法を、記憶ユニット７０８などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。いくつかの実施例では、コンピュータプログラムの一部または全部はＲＯＭ７０２および／または通信ユニット７０９を介してデバイス７００にロードおよび／またはインストールされてもよい。コンピュータプログラムがＲＡＭ７０３にロードされ、計算ユニット７０１によって実行される場合、上記に記載された深層学習フレームワークのトレーニング方法の１つまたは複数のステップが実行されてもよい。代替的に、他の実施例では、計算ユニット７０１は深層学習フレームワークのトレーニング方法を実行するように、他のいずれかの適切な方式（例えば、ファームウェアを介して）によって配置されてもよい。

本明細書で記載されたシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、コンプレックス・プログラマブル・ロジック・デバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、と／又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び／又は解釈することができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも１つの入力装置、及び当該少なくとも１つの出力装置に伝送することができる。

本開示の方法を実行するためのプログラムコードは、１つ又は複数のプログラミング言語の任意の組み合わせで書くことができる。これらのプログラムコードは、プロセッサ又はコントローラによって実行された際に、フローチャート及び／又はブロック図に規定された機能／動作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよい。プログラムコードは、完全に機械上で実行され、部分的に機械上で実行され、スタンドアロンソフトウェアパッケージとして、部分的に機械上で実行され、かつ部分的にリモート機械上で実行され、又は完全にリモート機械又はサーバ上で実行されてもよい。

本開示のコンテクストでは、機械読み取り可能な媒体は、命令実行システム、装置、またはデバイスによって使用されるために、又は命令実行システム、装置、またはデバイスと組み合わせて使用するためのプログラムを含むか、又は記憶することができる有形の媒体であってもよい。機械読み取り可能な媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体システム、装置又はデバイス、または上記内容のいずれかの適切な組み合わせを含むことができるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、１つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリーメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスクリードオンリーメモリ（ＣＤ－ＲＯＭ）、光学記憶装置、磁気記憶装置、または上記内容のいずれかの適切な組み合わせを含む。

ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力、または、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションできる）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実行することができる。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、ブロックチェーンネットワークを含む。

コンピュータシステムは、クライアントとサーバを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、かつ互いにクライアント－サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであっても良く、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービスシステムにおける１つのホスト製品であり、従来の物理ホストとＶＰＳサービス（“ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ”，または “ＶＰＳ”と省略する）に存在する管理の難しさ、業務拡張性の弱いという欠陥を解決した。サーバは分散システムのサーバであってもよく、またはブロックチェーンと組み合わせたサーバであってもよい。

サーバは分散システムのサーバであってもよく、またはブロックチェーンと組み合わせたサーバであってもよい。

なお、上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案の所望の結果を実現することができれば、本明細書では限定されない。

上記具体的な実施形態は、本開示の保護範囲を制限するものではない。当業者は、設計要件と他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができると理解すべきである。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれなければならない。

Claims

深層学習フレームワークのトレーニング方法であって、
ターゲットタスクがトレーニング開始条件を満たす場合、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得するステップと、
前記少なくとも１つのタスクノードのノード数が予め設定された数を超えるかどうかを判断するステップと、
前記ノード数が前記予め設定された数を超える場合、前記少なくとも１つのタスクノードはサンプルデータに基づいて、前記ターゲットタスクの深層学習フレームワークを同期トレーニングするステップと、
前記ターゲットタスクがトレーニング終了条件を満たす場合、同期トレーニングされたターゲット深層学習フレームワークを取得するステップと、を含む、
深層学習フレームワークのトレーニング方法。
前記現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得するステップは、
前記現在タスクノードクラスターにおける各ノードのノード状態を決定するステップと、
前記ノード状態がアイドル状態条件であるノードを、前記予め設定された開始条件を満たす少なくとも１つのタスクノードに決定するステップと、を含む、
請求項１に記載の方法。
現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得するステップは、
前記現在タスクノードクラスターにおける各ノードのアイドルリソース量を決定するステップと、
前記アイドルリソース量が予め設定された閾値条件を超えるノードを、前記予め設定された開始条件を満たす少なくとも１つのタスクノードに決定するステップと、を含む、
請求項１に記載の方法。
前記少なくとも１つのタスクノードはサンプルデータに基づいて、前記ターゲットタスクの深層学習フレームワークを同期トレーニングするステップは、
各前記タスクノードにおいて前記深層学習フレームワークをトレーニングするステップと、
予め設定された周期に基づいて各周期の各前記タスクノードにおける深層学習フレームワークのフレームワークパラメータを読み取るステップと、
すべての前記タスクノードのフレームワークパラメータの平均値である第１平均値を決定するステップと、
前記第１平均値に基づいて各前記タスクノードにおける深層学習フレームワークを同期するステップと、を含む、
請求項１に記載の方法。
前記少なくとも１つのタスクノードがサンプルデータに基づいて、前記ターゲットタスクの深層学習フレームワークを同期トレーニングするステップは、
前記現在タスクノードクラスターに前記予め設定された開始条件を満たす他のタスクノードが含まれているかどうかを監視するステップと、
前記他のタスクノードが存在する場合、前記他のタスクノードと前記少なくとも１つのタスクノードはサンプルデータに基づいて、前記ターゲットタスクの深層学習フレームワークを同期トレーニングするステップと、を含む、
請求項１に記載の方法。
前記他のタスクノードと前記少なくとも１つのタスクノードがサンプルデータに基づいて、前記ターゲットタスクの深層学習フレームワークを同期トレーニングするステップは、
前記少なくとも１つのタスクノードの各タスクノードにおける深層学習フレームワークの現在フレームワークパラメータを取得するステップと、
すべての前記現在フレームワークパラメータの平均値である第２平均値を決定するステップと、
前記他のタスクノードと前記少なくとも１つのタスクノードは前記第２平均値に基づいて前記深層学習フレームワークのフレームワークパラメータを更新するステップと、を含む、
請求項５に記載の方法。
前記ターゲットタスクがトレーニング開始条件を満たす前記場合、
前記現在タスクノードクラスターにおける実行対象のタスクの優先度を監視するステップと、
前記優先度が予め設定されたレベルより低い場合、前記ターゲットタスクがトレーニング開始条件を満たすと決定するステップと、を含む、
請求項１に記載の方法。
深層学習フレームワークのトレーニング装置であって、
ターゲットタスクがトレーニング開始条件を満たす場合、現在タスクノードクラスターにおける予め設定された開始条件を満たす少なくとも１つのタスクノードを取得するための第１取得モジュールと、
前記少なくとも１つのタスクノードのノード数が予め設定された数を超えるかどうかを判断するための判断モジュールと、
前記ノード数が前記予め設定された数を超える場合、前記少なくとも１つのタスクノードがサンプルデータに基づいて、前記ターゲットタスクの深層学習フレームワークを同期トレーニングするトレーニングモジュールと、
前記ターゲットタスクがトレーニング終了条件を満たす場合、同期トレーニングされたターゲット深層学習フレームワークを取得するための第２取得モジュールと、を含む、
深層学習フレームワークのトレーニング装置。
前記第１取得モジュールは、具体的に、
前記現在タスクノードクラスターにおける各ノードのノード状態を決定し、
前記ノード状態がアイドル状態条件であるノードを、前記予め設定された開始条件を満たす少なくとも１つのタスクノードに決定する、
請求項８に記載の装置。
前記第１取得モジュールは、具体的に、
前記現在タスクノードクラスターにおける各ノードのアイドルリソース量を決定し、
前記アイドルリソース量が予め設定された閾値条件を超えるノードを、前記予め設定された開始条件を満たす少なくとも１つのタスクノードに決定する、
請求項８に記載の装置。
前記トレーニングモジュールは、具体的に、
各前記タスクノードにおいて前記深層学習フレームワークをトレーニングし
予め設定された周期に基づいて各周期の各前記タスクノードにおける深層学習フレームワークのフレームワークパラメータを読み取り、
すべての前記タスクノードのフレームワークパラメータの平均値である第１平均値を決定する、
請求項８に記載の装置。
前記現在タスクノードクラスターに前記予め設定された開始条件を満たす他のタスクノードが含まれているかどうかを監視する監視モジュールと、
前記他のタスクノードと前記少なくとも１つのタスクノードはサンプルデータに基づいて、前記ターゲットタスクの深層学習フレームワークを同期トレーニングする前記トレーニングモジュールと、をさらに含む、
請求項８に記載の装置。
前記トレーニングモジュールは、具体的に、
前記少なくとも１つのタスクノードの各タスクノードにおける深層学習フレームワークの現在フレームワークパラメータを取得し、
すべての前記現在フレームワークパラメータの平均値である第２平均値を決定し、
前記他のタスクノードと前記少なくとも１つのタスクノードが前記第２平均値に基づいて前記深層学習フレームワークのフレームワークパラメータを更新する、
請求項１２に記載の装置。
前記第１取得モジュールは、具体的に、
前記現在タスクノードクラスターにおける実行対象のタスクの優先度を監視し、
前記優先度が予め設定されたレベルより低い場合、前記ターゲットタスクがトレーニング開始条件を満たすと決定する、
請求項８に記載の装置。
電子機器であって、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサによって実行される場合、前記少なくとも１つのプロセッサが請求項１～７のいずれかに記載の深層学習フレームワークのトレーニング方法を実行させる、
電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、前記コンピュータに請求項１～７のいずれかに記載の深層学習フレームワークのトレーニング方法を実行させる、
非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータプログラムであって、
前記コンピュータプログラムはプロセッサによって実行される場合、請求項１～７のいずれかに記載の深層学習フレームワークのトレーニング方法を実現する、
コンピュータプログラム。