JP2019507442A

JP2019507442A - 機械学習システムのトレーニング方法及びトレーニングシステム

Info

Publication number: JP2019507442A
Application number: JP2018546445A
Authority: JP
Inventors: ジュンジョウ
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2016-03-04
Filing date: 2017-02-21
Publication date: 2019-03-14
Anticipated expiration: 2037-02-21
Also published as: US11257005B2; CN107153630A; TW201734871A; EP3425527A4; CN107153630B; JP7004661B2; EP3425527A1; TWI740896B; WO2017148314A1; US20180365595A1

Abstract

機械学習システムのトレーニング方法及びトレーニングシステムを本出願に開示する。機械学習システムをトレーニングするためにトレーニングデータが使用される。トレーニング方法は、トレーニングデータを複数の作業マシンに割り当てることと、各作業マシンによって割り当てられたトレーニングデータを複数のデータに分割することと、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得することと、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を集計して現在の重み及び現在の損失関数値を取得することと、現在の重み及び／または現在の損失関数値を使用してモデル異常検出を行うことと、モデル異常検出の結果が第１のタイプの異常であることに応じて、トレーニング用の機械学習システムに前回の集計の重み及び損失関数値を入力することと、モデル異常検出の結果が第２のタイプの異常であることに応じて、現在の重み及び／または現在の損失関数値を第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、トレーニング用の機械学習システムにそれらを入力することとを含む。

Description

本出願は、ビッグデータ処理の技術分野に関し、特に、機械学習システムのトレーニング方法及びシステムに関する。

今日、優れたサービスをユーザに提供することは、全てのインターネット企業が達成しようとする目標である。このため、大半の企業は、機械学習を使用してユーザの好み及び習慣を把握し、個別サービスを提供している。例えば、各ウェブサイトは、ユーザの好みに応じて最大限にサービスを提供するために、機械学習システムを使用してユーザのオンライン行動データを収集し、異なる性別／年齢のユーザに異なる検索結果を提供することができる。

上記の機械学習システムは、ユーザブラウジング／クリック／購入／トップポスティング／ポストへのコメント投稿等などの多数のユーザの行動データを収集し、いくつかの機械学習アルゴリズムを使用して機械学習システムをオフラインでトレーニングすることができる。予測モデルを取得した後、予測モデルをオンラインシステムに配置して、ユーザにサービスを提供する。例えば、Ａｍａｚｏｎの推奨システムでは、ユーザの好みを学習後、ユーザの過去の行動履歴（昨日の履歴及び昨日から２週間以外を含むなど）に基づいて、様々なユーザに様々な製品を推奨することができる。

この方法は、過去のユーザの行動データを使用してオフラインでトレーニングを行ってモデルを取得するものであり、オフライン学習と呼ばれる。ただし、通常の状況では、ユーザの行動及び関心は１日以内に大幅に変化する可能性がある。オフライン学習システムでユーザによって生成された履歴はトレーニング用のシステムにすぐには追加できないため、当然ながら、オフライン学習はこの変化を把握することができない。

オンライン学習とは、新しいトレーニングデータが受信される度に、モデルが継続的にモデル自体を更新することを意味し、したがって、より優れた結果を得ることができる。オンライン学習の精度は比較的高いが、データ収集期間が比較的短いため、モデルはデータ内のノイズの影響を受けやすく、これによりモデルのトレーニングが不安定になる。同時に、オンライン学習では非同期更新モデルの手法が採用されているため、トレーニングデータはモデルに継続的に流入し、モデルは常に更新されて学習する。モデルのトレーニングは、特定の制御不能な問題により中断することが多く、トレーニングが失敗することがある。その結果、使用可能なモデルの生成が失敗するため、オンラインサービスに影響が生じ、ユーザ体験が損なわれる。

上記の問題に鑑みて、本出願の実施形態は、上記の問題を解決するか、または上記の問題を少なくとも部分的に解決する機械学習システムのトレーニング方法及びトレーニングシステムを提供するように提案される。

上記の問題を解決するために、本出願は機械学習システムのトレーニング方法を開示し、これはトレーニングデータを使用して機械学習システムをトレーニングするものである。トレーニング方法は、トレーニングデータを複数の作業マシンに割り当てることと、各作業マシンによって割り当てられたトレーニングデータを複数のデータに分割することと、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得することと、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を集計して現在の重み及び現在の損失関数値を取得することと、現在の重み及び／または現在の損失関数値を使用してモデル異常検出を行うことと、モデル異常検出の結果が第１のタイプの異常であることに応じて、トレーニング用の機械学習システムに前回の集計の重み及び損失関数値を入力することと、モデル異常検出の結果が第２のタイプの異常であることに応じて、現在の重み及び／または現在の損失関数値を第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、トレーニング用の機械学習システムにそれらを入力することとを含む。

本出願の実施形態は少なくとも以下の利点を有する。

本出願の実施形態によって提案される機械学習システムのトレーニング方法及びトレーニングシステムによれば、各作業マシンが一度に１つのデータのみを処理し、データに従って計算されたローカル重み及びローカル損失関数値を集計し、これにより、各計算後に僅かな重み及び損失関数値を正確に更新し、オンライン学習が既存技術のデータ内のノイズの影響を受けやすいという問題を回避する効果を達成することができる。同時に、現在の重み及び／または現在の損失関数値を取得した後に異常検出が行われる。取得した現在の重み及び／または取得した現在の損失関数値が第１のタイプの異常または第２のタイプの異常に属することを検出することに応じて、この計算で計算される現在の重み及び／または現在の損失関数値は破棄されてよく、前回の集計から取得された重み及び損失関数値は機械学習モデルに入力されるか、あるいは、今回計算される現在の重み及び／または現在の損失関数値は修正され、各計算及び集計によって取得される重み及び損失関数値の更新は有効範囲に限定される。これにより、モデルトレーニングが不安定になることを回避し、データノイズに耐えるシステム機能が向上し、オンライン学習の機械学習システムの安定性を改善し、機械学習システムの正常出力を保証し、オンライン後の機械学習システムのサービス機能を改善する。

本出願の第１の実施形態による、機械学習システムのトレーニング方法のフロー図である。本出願の第２の実施形態による、機械学習システムのトレーニング方法のフロー図である。本出願の第３の実施形態による、機械学習システムのトレーニング方法のフロー図である。本出願の第４の実施形態による、機械学習システムのトレーニングシステムのブロック図である。本出願の第５の実施形態による、機械学習システムのトレーニングシステムのブロック図である。本出願の第６の実施形態による、機械学習システムのトレーニングシステムのブロック図である。

本出願の実施形態における技術的解決策は、本出願の実施形態における図面を参照して以降に明確かつ完全に説明される。当然ながら、説明される実施形態は本出願の実施形態の一部を表すに過ぎず、全てを表すわけではない。当業者が本出願の実施形態を基に取得するその他全ての実施形態は、本開示の保護範囲内に該当する。

本出願は、機械学習システムのトレーニング方法を提案する。トレーニング方法は、トレーニングデータを複数の作業マシンに最初に割り当てることと、各作業マシンによって割り当てられたトレーニングデータを複数のデータに分割することと、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得することと、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を集計して現在の重み及び現在の損失関数値を取得することと、現在の重み及び／または現在の損失関数値を使用してモデル異常検出を行うことと、モデル異常検出の結果が第１のタイプの異常であることに応じて、トレーニング用の機械学習システムに前回の集計の重み及び損失関数値を入力することと、モデル異常検出の結果が第２のタイプの異常であることに応じて、現在の重み及び／または現在の損失関数値を第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、トレーニング用の機械学習システムにそれらを入力することとを含む。

第１の実施形態
本出願の第１の実施形態は、機械学習システムのトレーニング方法を提供する。図１は、本出願の第１の実施形態による、機械学習システムのトレーニング方法のフロー図である。機械学習システムは、好適には分散型の機械学習システムであり、パラメータサーバを含む。パラメータサーバは、例えば、複数の作業マシン（作業者またはスレーブ）、複数のサーバ及びコーディネータを含んでよい。図１に示すように、トレーニング方法は以下のステップを含む。

ステップＳ１０１：トレーニングデータを複数の作業マシンに割り当てる。

このステップでは、例えば、各作業マシンはその識別に従って各作業マシンのトレーニングデータを読み取ることができ、データは作業マシン間で重複しない。このステップは、例えば、コーディネータによって、各作業マシンの識別に従って各作業マシンに属するトレーニングデータに分割されてよく、それぞれのトレーニングデータは対応する作業マシンによって読み取られる。

ステップＳ１０２：各作業マシンに割り当てられたトレーニングデータを複数のデータに分割する。

このステップでは、例えば、各作業マシンは、各作業マシンに割り当てられたトレーニングデータを作業マシン自体のシステム構成を基に複数のデータに分割し、各作業マシンの各処理は１つのデータを基に処理を行う。換言すると、各作業マシンは一度に１つのデータのみを処理する。

ステップＳ１０３：各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得する。

このステップでは、例えば、各作業マシンにおいて、それぞれの作業マシンによって取得されたトレーニングデータのデータを基に、この計算におけるそれぞれの作業マシンに対応するローカル重み及びローカル損失関数値を計算して取得する。機械学習システムは複数の作業マシンを含むため、この計算において複数の作業マシンによって取得される多数のローカル重み及びローカル損失関数値はこのステップで取得することができる。

ステップＳ１０４：各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を集計し、現在の重み及び現在の損失関数値を取得する。

このステップでは、例えば、各作業マシンは、計算されたローカル重み及び計算されたローカル損失関数値をサーバに送信する。サーバは、現時点における複数の作業マシンによって計算された複数のローカル重み及びローカル損失関数値を集計し、現在の重み及び現在の損失関数値を取得する。集計の過程は、加算、加算後の平均化及びその他を含むがこれらに限定されず、本発明によって特に限定されるわけではない。

ステップＳ１０３で各作業マシンによってローカル重み及びローカル損失関数値を計算した後、ローカル重み及びローカル損失関数値を非同期的にサーバに送信してよい。コーディネータは、ステップＳ１０４において、サーバを作動して複数のローカル重み及びローカル損失関数の集計を行わせてよい。

ステップＳ１０５：現在の重み及び／または現在の損失関数値を使用して、モデル異常検出を行う。

このステップでは、例えば、集計された現在の重み及び／または現在の損失関数値をモデル異常検出装置に入力し、所定の条件に従って、モデルが異常であるかどうかを検出してよい。検出結果は、例えば、正常、第１のタイプの異常及び第２のタイプの異常であり得る。この３つの場合について、対応する処理が個別に行われる。

一実施形態では、モデル異常検出装置の入力値は、現在の重み、現在の損失関数値、前回の集計の重み及び前回の集計の損失関数値である。前回の集計の重みは、前回の計算で使用されたデータを基に各作業マシンによって計算された前回のローカル重み損失関数値を合計することによって取得される。前回の集計の損失関数値は、前回の計算で使用されたデータを基に各作業マシンによって計算された前回の損失関数値を合計することによって計算される。

ステップＳ１０６：モデル異常検出の結果が第１のタイプの異常であることに応じて、前回の集計の重み及び前回の集計の損失関数値をトレーニング用の機械学習システムに入力する。

このステップでは、例えば、検出結果が第１のタイプの異常である場合、現在の計算において各作業マシンが取得したローカル重み及びローカル損失関数値、集計後の現在の重み及び現在の損失関数値は無視されるか、削除される。前回の集計の重み及び前回の集計の損失関数値をトレーニング用の機械学習システムに入力する。

ステップＳ１０７：モデル異常検出の結果が第２のタイプの異常であることに応じて、現在の重み及び／または現在の損失関数値を、第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、それらをトレーニング用の機械学習システムに入力する。

このステップでは、例えば、検出結果が第２のタイプの異常であり、モデル微調整装置に入力することができ、現在の重み及び／または現在の損失関数値を所定の第１の閾値ずつ減算して、第１の閾値内にある現在の重み及び／または現在の損失関数値の各要素の値を取得し、これらはトレーニング用の機械学習システムに入力される。特に、現在の重み及び／または現在の損失関数値が、最初に所定の第１の閾値ずつ減算した後でも第１の閾値の範囲外である場合、各要素の値が第１の閾値の範囲内となるまで、現在の重み及び／または現在の損失関数値を第１の閾値ずつ減算する処理を１回以上行ってよい。

本出願の第１の実施形態によって提案される機械学習システムのトレーニング方法によれば、各作業マシンが一度に１つのデータのみを処理し、データに従って計算されたローカル重み及びローカル損失関数値を集計し、これにより、各計算後に僅かな重み及び損失関数値を正確に更新し、オンライン学習が既存技術のデータ内のノイズの影響を受けやすいという問題を回避する効果を達成することができる。同時に、現在の重み及び／または現在の損失関数値を取得した後に異常検出が行われる。取得した現在の重み及び／または取得した現在の損失関数値が第１のタイプの異常または第２のタイプの異常に属することを検出することに応じて、この計算で計算される現在の重み及び／または現在の損失関数値は破棄されてよく、前回の集計から取得された重み及び損失関数値は機械学習モデルに入力されるか、あるいは、今回計算される現在の重み及び／または現在の損失関数値は修正され、各計算及び集計によって取得される重み及び損失関数値の更新は有効範囲に限定される。これにより、モデルトレーニングが不安定になることを回避し、データノイズに耐えるシステム機能が向上し、オンライン学習の機械学習システムの安定性を改善し、機械学習システムの正常出力を保証し、オンライン後の機械学習システムのサービス機能を改善する。

第２の実施形態
本出願の第２の実施形態は、機械学習システムのトレーニング方法を提供する。図２は、本出願の第２の実施形態による、機械学習システムのトレーニング方法のフロー図である。機械学習システムは、好適には分散型の機械学習システムである。図２に示すように、トレーニング方法は以下のステップを含む。

Ｓ２０１：トレーニングデータを複数の作業マシンに割り当てる。

Ｓ２０２：各作業マシンに割り当てられたトレーニングデータを複数のデータに分割する。

Ｓ２０３：各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得する。

Ｓ２０４：各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を集計し、現在の重み及び現在の損失関数値を取得する。

Ｓ２０５：現在の重み及び／または現在の損失関数値を使用して、モデル異常検出を行う。

Ｓ２０６：モデル異常検出の結果が第１のタイプの異常であることに応じて、前回の集計の重み及び前回の集計の損失関数値をトレーニング用の機械学習システムに入力する。

Ｓ２０７：モデル異常検出の結果が第２のタイプの異常であることに応じて、現在の重み及び／または現在の損失関数値を、第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、それらをトレーニング用の機械学習システムに入力する。

上記のステップＳ２０１〜Ｓ２０７の部分は第１の実施形態のステップＳ１０１〜Ｓ１０７の部分と同じであり、本明細書には繰り返して説明しない。

本実施形態では、ステップＳ２０５、つまり、現在の重み及び／または現在の損失関数値を使用してモデル異常検出を行うことは以下を含む。

サブステップＳ２０５ａ：現在の損失関数値が前回の集計の損失関数値のｋ倍より大きいかどうかを判定する。

このサブステップでは、現在の損失関数値が異常であるかどうかを判定するための基準として、値ｋを事前に設定することができる。

サブステップＳ２０５ｂ：現在の損失関数値が前回の集計の損失関数値のｋ倍より大きいかどうかを判定することに応じて、モデル異常検出の結果が第１のタイプの異常であると判定する。

このサブステップでは、現在の損失関数値が前回の集計の損失関数値のｋ倍より大きいと判定することに応じて、今回計算されて集計された現在の損失関数値を第１のタイプの異常、つまり、重大な異常として考慮することができる。モデルにこのような異常があると判定することに応じて、今回計算された現在の重み及び現在の損失関数値をそのまま破棄することができる。

本実施形態では、ステップＳ２０５、つまり、現在の重み及び／または現在の損失関数値を使用してモデル異常検出を行うことはさらに以下を含んでよい。

サブステップＳ２０５ｃ：現在の重みの要素の最大値及び／または最小値の絶対値が所定の第２の閾値より大きいかどうかを判定する。

このサブステップでは、現在の重みはＮ要素から構成されるベクトルである。現在の重みを集計した後、ベクトルの各要素（すなわち、各次元）の最大値及び／または最小値の絶対値が所定の第２の閾値より大きいかどうかに関して判定を行うことができる。第２の閾値は事前に指定することができる。

サブステップＳ２０５ｄ：現在の重みの要素の最大値及び／または最小値の絶対値が所定の第２の閾値より大きいかどうかを判定することに応じて、モデル異常検出の結果が第２のタイプの異常であると判定する。

このサブステップでは、現在の重みの要素の最大値及び最小値のうちの少なくとも１つの絶対値が所定の第２の閾値より大きいと判定することに応じて、モデルには第２のタイプの異常、つまり、比較的軽微な異常があると考えられる。現在の計算で計算された現在の重み及び現在の損失関数値は、修正によって第１の閾値内の現在の重み及び／または現在の損失関数値に修正されてよく、これらはトレーニング用の機械学習システムに入力される。

好適には、現在の重み及び／または現在の損失関数値を第１の閾値内のローカル重み及び／またはローカル損失関数値に修正することは、所定の第２の閾値より大きい最大値及び／または最小値の絶対値を有する要素（複数可）を第２の閾値ずつ減算し、各要素が第２の閾値内に収まる現在の重みを取得することを含んでよい。

サブステップＳ２０５ｅ：第１のｎ集計の損失関数値の平均値が第１の集計の損失関数値より大きいかどうかを判定する。

このサブステップでは、第１のｎ集計から取得された損失関数値が、例えば、特定の記憶領域に記憶され、第１のｎ集計の損失関数値の平均値を計算することができる。値が第１の集計から取得された損失関数値より大きいかどうかに関する判定が行われる。

サブステップＳ２０５ｆ：第１のｎ集計の損失関数値の平均値が第１の集計の損失関数値より大きいと判定することに応じて、モデル異常検出の結果が第１のタイプの異常であると判定する。

このサブステップでは、第１のｎ集計の損失関数値の平均値が第１の集計の損失関数値より大きいと判定することに応じて、モデルには第１のタイプの異常、つまり、比較的重大な異常があると考えられてよい。モデルにこのような異常があると判定することに応じて、今回計算された現在の重み及び現在の損失関数値をそのまま破棄することができる。

本出願の第２の実施形態によって提案される機械学習システムのトレーニング方法によれば、各作業マシンが一度に１つのデータのみを処理し、データに従って計算されたローカル重み及びローカル損失関数値を集計し、これにより、各計算後に僅かな重み及び損失関数値を正確に更新し、オンライン学習が既存技術のデータ内のノイズの影響を受けやすいという問題を回避する効果を達成することができる。同時に、現在の重み及び／または現在の損失関数値を取得した後に異常検出が行われる。取得した現在の重み及び／または取得した現在の損失関数値が第１のタイプの異常または第２のタイプの異常に属することを検出することに応じて、この計算で計算される現在の重み及び／または現在の損失関数値は破棄されてよく、前回の集計から取得された重み及び損失関数値は機械学習モデルに入力されるか、あるいは、今回計算される現在の重み及び／または現在の損失関数値は修正され、各計算及び集計によって取得される重み及び損失関数値の更新は有効範囲に限定される。これにより、モデルトレーニングが不安定になることを回避し、データノイズに耐えるシステム機能が向上し、オンライン学習の機械学習システムの安定性を改善し、機械学習システムの正常出力を保証し、オンライン後の機械学習システムのサービス機能を改善する。

第３の実施形態
本出願の第３の実施形態は、機械学習システムのトレーニング方法を提供する。図３は、本出願の第３の実施形態による、機械学習システムのトレーニング方法のフロー図である。機械学習システムは、好適には分散型の機械学習システムである。図３に示すように、トレーニング方法は以下のステップを含む。

Ｓ３０１：トレーニングデータを複数の作業マシンに割り当てる。

Ｓ３０２：各作業マシンに割り当てられたトレーニングデータを複数のデータに分割する。

Ｓ３０３：各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得する。

Ｓ３０４：各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を集計し、現在の重み及び現在の損失関数値を取得する。

Ｓ３０５：現在の重み及び／または現在の損失関数値を使用して、モデル異常検出を行う。

Ｓ３０６：モデル異常検出の結果が第１のタイプの異常であることに応じて、前回の集計の重み及び前回の集計の損失関数値をトレーニング用の機械学習システムに入力する。

Ｓ３０７：モデル異常検出の結果が第２のタイプの異常であることに応じて、現在の重み及び／または現在の損失関数値を、第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、それらをトレーニング用の機械学習システムに入力する。

上記のステップＳ３０１〜Ｓ３０７の部分は第１の実施形態のステップＳ１０１〜Ｓ１０７の部分と同じであり、本明細書には繰り返して説明しない。

本実施形態では、ステップＳ２０５の後、つまり、現在の重み及び／または現在の損失関数値を使用してモデル異常検出を行った後、トレーニング方法はさらに以下を含んでよい。

Ｓ３０８。モデル異常検出の結果が正常であることに応じて、現在の重み及び／または現在の損失関数値をトレーニング用の機械学習システムに入力する。

本実施形態では、現在の計算及び集計後に現在の重み及び現在の損失関数値においてモデルが正常である場合、現在の重み及び／または現在の損失関数値は有効な計算結果として機能してよく、トレーニング用の機械学習システムに入力される。

さらに、好適な実施形態では、ステップＳ３０８の後、つまり、モデル異常検出の結果が正常であることに応じて、現在の重み及び／または現在の損失関数値をトレーニング用の機械学習システムに入力した後、方法はさらに以下を含む。

Ｓ３０９：トレーニングが終了したかどうかを判定する。

このステップでは、例えば、現在の損失関数値及び前回の集計後の損失関数値が第３の閾値より小さいことを検出することに応じて、トレーニングが終了したと判定する。第３の閾値はシステムによって検出される閾値であってよい。

しかしながら、当業者であれば、判定ステップは、第３の閾値との差異を比較することによって行われることに限定されないと明確に理解することができる。トレーニングが終了したかどうかを確認するための様々な方法が当技術分野に存在し、その詳細は本明細書で完全に説明するわけではない。

Ｓ３１０：トレーニングが終了したと判定することに応じて、モデルを生成する。

このステップでは、トレーニングが終了した、つまり、モデルが既に使用可能であると判定することに応じて、モデルが生成される。例えば、モデルをオンラインで適用することができる。

Ｓ３１１：トレーニングが終了していないと判定することに応じて、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を再度取得することを行う。

このステップでは、例えば、現在の損失関数値及び前回の集計の損失関数値が第３の閾値より大きいことを検出することに応じて、トレーニングが終了していないと判定される。この場合、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値の取得は繰り返し行われてよい。換言すると、各作業マシンは、使用要件を満たすモデルが取得されるまで、他のデータを基にローカル重み及びローカル損失関数値を計算し続け、次の集計（複数可）で取得される現在の重み（複数可）及び現在の損失関数値（複数可）にトレーニング方法が繰り返される。

追加的には、第１〜第３の実施形態に開示された解決策において、好適には、複数の作業マシンにトレーニングデータを割り当てる前に、方法はトレーニングデータを取得することをさらに含む。

トレーニングデータを複数の作業マシンに割り当てることは、各作業マシンの識別に従って、複数の作業マシンにトレーニングデータを割り当てることをさらに含む。

さらに、第１〜第３の実施形態に開示された解決策において、好適には、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を集計して現在の重み及び現在の損失関数値を取得することは、各データを基に各作業マシンによって計算されたローカル重みを合計して現在の重みを取得することと、各データを基に各作業マシンによって取得されたローカル損失関数値を合計して現在のローカル損失関数を取得することとを含むことができる。

本出願の第３の実施形態によって提案される機械学習システムのトレーニング方法によれば、各作業マシンが一度に１つのデータのみを処理し、データに従って計算されたローカル重み及びローカル損失関数値を集計し、これにより、各計算後に僅かな重み及び損失関数値を正確に更新し、オンライン学習が既存技術のデータ内のノイズの影響を受けやすいという問題を回避する効果を達成することができる。同時に、現在の重み及び／または現在の損失関数値を取得した後に異常検出が行われる。取得した現在の重み及び／または取得した現在の損失関数値が第１のタイプの異常または第２のタイプの異常に属することを検出することに応じて、この計算で計算される現在の重み及び／または現在の損失関数値は破棄されてよく、前回の集計から取得された重み及び損失関数値は機械学習モデルに入力されるか、あるいは、今回計算される現在の重み及び／または現在の損失関数値は修正され、各計算及び集計によって取得される重み及び損失関数値の更新は有効範囲に限定される。これにより、モデルトレーニングが不安定になることを回避し、データノイズに耐えるシステム機能が向上し、オンライン学習の機械学習システムの安定性を改善し、機械学習システムの正常出力を保証し、オンライン後の機械学習システムのサービス機能を改善する。

第４の実施形態
本出願の第４の実施形態は、機械学習システムのトレーニングシステムを提供する。図４は、本出願の第４の実施形態による、機械学習システムのトレーニングシステムのブロック図である。機械学習システムは、好適には分散型の機械学習システムである。図４に示すように、トレーニングシステム４００は、トレーニングデータを複数の作業マシンに割り当てるように構成されるトレーニングデータ割り当てモジュール４０１と、各作業マシンに割り当てられたトレーニングデータを複数のデータに分割するように構成されるトレーニングデータ分割モジュール４０２と、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得するように構成される取得モジュール４０３と、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を集計して現在の重み及び現在の損失関数値を取得するように構成される集計モジュール４０４と、現在の重み及び／または現在の損失関数値を使用してモデル異常検出を行うように構成される異常検出モジュール４０５と、モデル異常検出の結果が第１のタイプの異常であることに応じて、トレーニング用の機械学習システムに前回の集計の重み及び損失関数値を入力するように構成される第１の処理モジュール４０６と、モデル異常検出の結果が第２のタイプの異常であることに応じて、現在の重み及び／または現在の損失関数値を第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、トレーニング用の機械学習システムにそれらを入力するように構成される第２の処理モジュール４０７とを含む。

本出願の第４の実施形態によって提案される機械学習システムのトレーニングシステムによれば、各作業マシンが一度に１つのデータのみを処理し、データに従って計算されたローカル重み及びローカル損失関数値を集計し、これにより、各計算後に僅かな重み及び損失関数値を正確に更新し、オンライン学習が既存技術のデータ内のノイズの影響を受けやすいという問題を回避する効果を達成することができる。同時に、現在の重み及び／または現在の損失関数値を取得した後に異常検出が行われる。取得した現在の重み及び／または取得した現在の損失関数値が第１のタイプの異常または第２のタイプの異常に属することを検出することに応じて、この計算で計算される現在の重み及び／または現在の損失関数値は破棄されてよく、前回の集計から取得された重み及び損失関数値は機械学習モデルに入力されるか、あるいは、今回計算される現在の重み及び／または現在の損失関数値は修正され、各計算及び集計によって取得される重み及び損失関数値の更新は有効範囲に限定される。これにより、モデルトレーニングが不安定になることを回避し、データノイズに耐えるシステム機能が向上し、オンライン学習の機械学習システムの安定性を改善し、機械学習システムの正常出力を保証し、オンライン後の機械学習システムのサービス機能を改善する。

第５の実施形態
本出願の第５の実施形態は、機械学習システムのトレーニングシステムを提供する。図５は、本出願の第５の実施形態による、機械学習システムのトレーニングシステムのブロック図である。機械学習システムは、好適には分散型の機械学習システムである。図５に示すように、トレーニングシステム５００は、トレーニングデータを複数の作業マシンに割り当てるように構成されるトレーニングデータ割り当てモジュール５０１と、各作業マシンに割り当てられたトレーニングデータを複数のデータに分割するように構成されるトレーニングデータ分割モジュール５０２と、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得するように構成される取得モジュール５０３と、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を集計して現在の重み及び現在の損失関数値を取得するように構成される集計モジュール５０４と、現在の重み及び／または現在の損失関数値を使用してモデル異常検出を行うように構成される異常検出モジュール５０５と、モデル異常検出の結果が第１のタイプの異常であることに応じて、トレーニング用の機械学習システムに前回の集計の重み及び損失関数値を入力するように構成される第１の処理モジュール５０６と、モデル異常検出の結果が第２のタイプの異常であることに応じて、現在の重み及び／または現在の損失関数値を第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、トレーニング用の機械学習システムにそれらを入力するように構成される第２の処理モジュール５０７とを含む。

実施形態では、異常検出モジュール５０５は、現在の損失関数値が前回の集計の損失関数値のｋ倍より大きいかどうかを判定するように構成される第１の判定サブモジュール５０５ａと、現在の損失関数値が前回の集計の損失関数値のｋ倍より大きいかどうかを判定することに応じて、モデル異常検出の結果が第１のタイプの異常であると判定するように構成される第１の決定サブモジュール５０５ｂと、現在の重みの要素の最大値及び／または最小値の絶対値が所定の第２の閾値より大きいかどうかを判定するように構成される第２の判定サブモジュール５０５ｃと、現在の重みの要素の最大値及び／または最小値の絶対値が所定の第２の閾値より大きいかどうかを判定することに応じて、モデル異常検出の結果が第２のタイプの異常であると判定するように構成される第２の決定サブモジュール５０５ｄとを含む。

異常検出モジュール５０５はさらに、第１のｎ集計の損失関数値の平均値が第１の集計の損失関数値より大きいかどうかを判定するように構成される第３の判定サブモジュール５０５ｅと、第１のｎ集計の損失関数値の平均値が第１の集計の損失関数値より大きいと判定することに応じて、モデル異常検出の結果が第１のタイプの異常であると判定するように構成される第３の決定サブモジュール５０５ｆとを含む。

好適には、モデル異常検出の結果が第２のタイプの異常である場合、現在の重み及び／または現在の損失関数値を第２の閾値内の現在の重み及び／または現在の損失関数値に修正することは、所定の第２の閾値より大きい最大値及び／または最小値の絶対値を有する要素を第２の閾値ずつ減算し、各要素が第２の閾値内に収まる現在の重みを取得することを含む。

本出願の第５の実施形態によって提案される機械学習システムのトレーニングシステムによれば、各作業マシンが一度に１つのデータのみを処理し、データに従って計算されたローカル重み及びローカル損失関数値を集計し、これにより、各計算後に僅かな重み及び損失関数値を正確に更新し、オンライン学習が既存技術のデータ内のノイズの影響を受けやすいという問題を回避する効果を達成することができる。同時に、現在の重み及び／または現在の損失関数値を取得した後に異常検出が行われる。取得した現在の重み及び／または取得した現在の損失関数値が第１のタイプの異常または第２のタイプの異常に属することを検出することに応じて、この計算で計算される現在の重み及び／または現在の損失関数値は破棄されてよく、前回の集計から取得された重み及び損失関数値は機械学習モデルに入力されるか、あるいは、今回計算される現在の重み及び／または現在の損失関数値は修正され、各計算及び集計によって取得される重み及び損失関数値の更新は有効範囲に限定される。これにより、モデルトレーニングが不安定になることを回避し、データノイズに耐えるシステム機能が向上し、オンライン学習の機械学習システムの安定性を改善し、機械学習システムの正常出力を保証し、オンライン後の機械学習システムのサービス機能を改善する。

第６の実施形態
本出願の第６の実施形態は、機械学習システムのトレーニングシステムを提供する。図６は、本出願の第６の実施形態による、機械学習システムのトレーニングシステムのブロック図である。機械学習システムは、好適には分散型の機械学習システムである。図６に示すように、トレーニングシステムは、トレーニングデータを複数の作業マシンに割り当てるように構成されるトレーニングデータ割り当てモジュール６０１と、各作業マシンに割り当てられたトレーニングデータを複数のデータに分割するように構成されるトレーニングデータ分割モジュール６０２と、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得するように構成される取得モジュール６０３と、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を集計して現在の重み及び現在の損失関数値を取得するように構成される集計モジュール６０４と、現在の重み及び／または現在の損失関数値を使用してモデル異常検出を行うように構成される異常検出モジュール６０５と、モデル異常検出の結果が第１のタイプの異常であることに応じて、トレーニング用の機械学習システムに前回の集計の重み及び損失関数値を入力するように構成される第１の処理モジュール６０６と、モデル異常検出の結果が第２のタイプの異常であることに応じて、現在の重み及び／または現在の損失関数値を第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、トレーニング用の機械学習システムにそれらを入力するように構成される第２の処理モジュール６０７とを含む。

本実施形態では、システムはさらに、モデル異常検出の結果が正常であることに応じて、現在の重み及び／または現在の損失関数値をトレーニング用の機械学習システムに入力するように構成されるトレーニングモジュール６０８を含む。

本実施形態では、システムはさらに、トレーニングが終了したかどうかを判定するように構成される終了判定モジュール６０９と、トレーニングが終了したと判定することに応じて、モデルを生成するように構成されるモデル生成モジュール６１０と、トレーニングが終了していないと判定することに応じて、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を再度取得することを行うように構成されるリターン実行モジュール６１１とを含む。

本実施形態では、終了判定モジュールは、現在の損失関数値及び前回の集計の損失関数値が第３の閾値より小さいことを検出することに応じて、トレーニングが終了したことを判定するように構成される。

本実施形態では、システムはさらに、トレーニングデータを取得するように構成されるトレーニングデータ取得モジュールを含んでよい。トレーニングデータ割り当てモジュールは、各作業マシンの識別に従って、トレーニングデータを複数の作業マシンに割り当てるように構成される。

好適には、集計モジュールは、各データを基に各作業マシンによって計算されたローカル重みを合計して現在の重みを取得するように構成される重み集積モジュールと、各データを基に各作業マシンによって取得されたローカル損失関数値を合計して現在のローカル損失関数を取得するように構成される損失関数値集積モジュールとを含む。

本出願の第６の実施形態によって提案される機械学習システムのトレーニングシステムによれば、各作業マシンが一度に１つのデータのみを処理し、データに従って計算されたローカル重み及びローカル損失関数値を集計し、これにより、各計算後に僅かな重み及び損失関数値を正確に更新し、オンライン学習が既存技術のデータ内のノイズの影響を受けやすいという問題を回避する効果を達成することができる。同時に、現在の重み及び／または現在の損失関数値を取得した後に異常検出が行われる。取得した現在の重み及び／または取得した現在の損失関数値が第１のタイプの異常または第２のタイプの異常に属することを検出することに応じて、この計算で計算される現在の重み及び／または現在の損失関数値は破棄されてよく、前回の集計から取得された重み及び損失関数値は機械学習モデルに入力されるか、あるいは、今回計算される現在の重み及び／または現在の損失関数値は修正され、各計算及び集計によって取得される重み及び損失関数値の更新は有効範囲に限定される。これにより、モデルトレーニングが不安定になることを回避し、データノイズに耐えるシステム機能が向上し、オンライン学習の機械学習システムの安定性を改善し、機械学習システムの正常出力を保証し、オンライン後の機械学習システムのサービス機能を改善する。

実施形態の方法と基本的に類似しているため、装置の実施形態の説明は比較的簡素であり、関連部分は実施形態の方法の説明を参照することができる。

本明細書における各実施形態は漸進的に説明されており、各実施形態は他の実施形態とは異なる点を強調している。実施形態の中で同一または類似の部分を相互に参照することができる。

当業者は、本出願の実施形態が、方法、装置またはコンピュータプログラム製品として提供可能であることを理解すべきである。したがって、本出願の実施形態は、完全なハードウェアの実施形態、完全なソフトウェアの実施形態またはソフトウェアとハードウェアの組み合わせである実施形態の形態をとってよい。さらに、本出願の実施形態は、コンピュータが使用可能なコードを内蔵した１つ以上のコンピュータが使用可能な記憶媒体（これには、磁気ストレージデバイス、ＣＤ−ＲＯＭ、光ストレージデバイスなどが含まれるが、これらに限定されない）の形態で実装されるコンピュータプログラム製品の形態をとってよい。

典型的な構成では、計算デバイスは１つ以上のプロセッサ（ＣＰＵ）、入出力インターフェース、ネットワークインターフェース及びメモリを含む。メモリは、例えば、不揮発性メモリ、ランダムアクセスメモリ（ＲＡＭ）及び／または、例えば、読み出し専用メモリ（ＲＯＭ）もしくはフラッシュＲＡＭなどの不揮発性メモリなどのコンピュータ可読媒体の形態を含んでよい。メモリはコンピュータ可読媒体の一例である。コンピュータ可読媒体は、揮発性または不揮発性タイプ、取り外し可能または取り外し不可能な媒体を含んでよく、任意の方法または技術を使用して情報の記憶を実現してよい。情報は、コンピュータ可読命令、データ構造、プログラムモジュールまたは他のデータを含んでよい。コンピュータ記憶媒体の例は、相変化メモリ（ＰＲＡＭ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、他のタイプのランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、電気的に消去可能でプログラム可能な読み出し専用メモリ（ＥＥＰＲＯＭ）、クイックフラッシュメモリもしくは他の内部記憶技術、コンパクトディスク読み出し専用メモリ（ＣＤ−ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）もしくは他の光ストレージ、磁気カセットテープ、磁気ディスクストレージもしくは他の磁気ストレージデバイス、または計算デバイスによってアクセスされ得る情報を記憶するために使用され得る任意の他の非伝送媒体を含むが、これらに限定されるものではない。本明細書に定義される通り、コンピュータ可読媒体は変調されたデータ信号及び搬送波などの一時的な媒体を含まない。

本出願の実施形態は、本出願の実施形態による方法、端末デバイス（システム）及びコンピュータプログラム製品のフロー図及び／またはブロック図を参照して説明される。フロー図及び／またはブロック図の各フロー及び／または各ブロック、ならびにフロー図及び／またはブロック図のフロー及び／またはブロックの組み合わせは、コンピュータプログラム命令によって実施され得ることを理解すべきである。コンピュータプログラム命令は、汎用コンピュータ、専用コンピュータ、組込みプロセッサまたはマシンを製造する他のプログラム可能なデータ処理端末デバイスのプロセッサに提供されてよく、そのため、コンピュータまた他のプログラム可能なデータ処理端末デバイスのプロセッサによる命令の実行を通じて、フロー図の１つ以上のフロー及び／またはブロック図の１つ以上のブロックで指定される機能を実施するための装置が作成される。

これらのコンピュータプログラム命令は、コンピュータまたは他のプログラム可能なデータ処理端末デバイスに特定の方法で動作するように指示することが可能なコンピュータ可読ストレージデバイスに記憶されてもよく、これによって、コンピュータ可読ストレージデバイスに記憶される命令は、命令装置を含む製品を製造する。命令装置は、フロー図の１つ以上のフロー及び／またはブロック図の１つ以上のブロックに指定される機能を実施する。

これらのコンピュータプログラム命令は、コンピュータまたは他のプログラム可能なデータ処理端末デバイス上にロードされてもよく、これにより、一連の動作ステップがコンピュータまたは他のプログラム可能な端末デバイス上で行われ、コンピュータ実施プロセスを生成する。コンピュータまたは他のプログラム可能な端末デバイスで実行される命令は、フロー図の１つ以上のフロー及び／またはブロック図の１つ以上のブロックに指定される機能を実施するステップを提供する。

本出願の実施形態の好適な実施形態について説明したが、当業者は、基本的な発明概念を学べば、これらの実施形態に追加の変更及び修正を加えることができる。したがって、添付の特許請求の範囲は、本出願の実施形態の範囲内に該当する好適な実施形態ならびに全ての変更及び修正を含むものとして解釈されることが意図される。

最後に、第１の及び第２のなどの関係語は、本明細書において、あるエンティティまたは動作を他のエンティティまたは動作と区別するためにのみ使用され、これらの動作またはエンティティ間の任意のそのような関係もしくは順序の存在を必ずしも必要としたり示唆したりするわけではないことも留意すべきである。さらに、用語「ｉｎｃｌｕｄｅ（含む）」、「ｃｏｎｔａｉｎ（含む）」またはそれらの任意の変形例は、非排他的包含をカバーすることを意図する。したがって、一連の要素を含むプロセス、方法、商品または端末デバイスは、これらの要素だけでなく、明示的に列挙されていない他の要素も含むか、あるいはこのようなプロセス、方法、商品または端末デバイスに固有の要素も含む。それ以上の制約なく、「・・・を含む」の文により定義される要素は、要素を含むプロセス、方法、商品または端末デバイスが別の同一要素をさらに含むことを排除しない。

本出願に提供される機械学習システムのトレーニング方法及びトレーニングシステムを上記に詳細に説明した。本明細書は本出願の趣旨及び実装を例示するために特定の例を使用している。上記の実施形態の説明は、本出願の方法及び主要な概念の理解を容易にするために使用されるにすぎない。同時に、当業者は、本出願の概念に基づいて、特定の実装及び適用範囲を変更することができる。要約すると、本明細書の内容は、本出願に対する制限として解釈されるべきではない。

Claims

機械学習システムのトレーニング方法であって、トレーニングデータは前記機械学習システムをトレーニングするために使用され、前記トレーニング方法は、
前記トレーニングデータを複数の作業マシンに割り当てることと、
各作業マシンによって割り当てられたトレーニングデータを複数のデータに分割し、各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得することと、
各データを基に各作業マシンによって計算された前記ローカル重み及び前記ローカル損失関数値を集計し、現在の重み及び現在の損失関数値を取得することと、
前記現在の重み及び／または前記現在の損失関数値を使用して、モデル異常検出を行うことと、
前記モデル異常検出の結果が第１のタイプの異常であることに応じて、前回の集計の重み及び損失関数値を前記トレーニング用の機械学習システムに入力することと、
前記モデル異常検出の前記結果が第２のタイプの異常であることに応じて、前記現在の重み及び／または前記現在の損失関数値を第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、前記トレーニング用の機械学習システムにそれらを入力することと
を備える、前記方法。
前記現在の重み及び／または前記現在の損失関数値を使用して前記モデル異常検出を行うことは、
前記現在の損失関数値が前回の集計の損失関数値のｋ倍より大きいかどうかを判定することと、
前記現在の損失関数値が前記前回の集計の前記損失関数値のｋ倍より大きいかどうかを判定することに応じて、前記モデル異常検出の結果が第１のタイプの異常であると判定することと
を備える、請求項１に記載のトレーニング方法。
前記現在の重み及び／または前記現在の損失関数値を使用して前記モデル異常検出を行うことは、
前記現在の重みの要素の最大値及び／または最小値の絶対値が所定の第２の閾値より大きいかどうかを判定することと、
前記現在の重みの前記要素の前記最大値及び／または前記最小値の前記絶対値が前記所定の第２の閾値より大きいかどうかを判定することに応じて、前記モデル異常検出の前記結果が第２のタイプの異常であると判定することと
を備える、請求項１に記載のトレーニング方法。
前記モデル異常検出の前記結果が前記第２のタイプの異常であることに応じて、前記現在の重み及び／または前記現在の損失関数値を前記第１の閾値内の前記現在の重み及び／または前記現在の損失関数値に修正することは、前記第１の閾値より大きい前記最大値及び／または前記最小値の前記絶対値を有する要素を前記第１の閾値ずつ減算し、各要素が前記第１の閾値内に収まる現在の重みを取得することを備える、請求項３に記載のトレーニング方法。
前記現在の重み及び／または前記現在の損失関数値を使用して前記モデル異常検出を行うことは、
第１のｎ集計の損失関数値の平均値が第１の集計の損失関数値より大きいかどうかを判定することと、
前記第１のｎ集計の前記損失関数値の前記平均値が前記第１の集計の前記損失関数値より大きいかどうかを判定することに応じて、前記モデル異常検出の前記結果が前記第１のタイプの異常であると判定することと
を備える、請求項１に記載のトレーニング方法。
前記現在の重み及び／または前記現在の損失関数値を使用して前記モデル異常検出を行った後、前記方法はさらに、前記モデル異常検出の結果が正常であることに応じて、前記現在の重み及び／または前記現在の損失関数値を前記トレーニング用の機械学習システムに入力することを備える、請求項１に記載のトレーニング方法。
前記モデル異常検出の前記結果が正常であることに応じて、前記現在の重み及び／または前記現在の損失関数値を前記トレーニング用の機械学習システムに入力した後、前記方法はさらに、
前記トレーニングが終了したかどうかを判定することと、
前記トレーニングが終了したと判定することに応じて、モデルを生成することと、
前記トレーニングが終了していないと判定することに応じて、各データを基に各作業マシンによって計算された前記ローカル重み及び前記ローカル損失関数値の前記取得を再度繰り返すことと
を備える、請求項６に記載のトレーニング方法。
前記トレーニングが終了したかどうかを判定することは、前記現在の損失関数値及び前記前回の集計の前記損失関数値が第３の閾値より小さいことを検出することに応じて、前記トレーニングが終了したことを判定することを備える、請求項６に記載のトレーニング方法。
前記複数の作業マシンに前記トレーニングデータを割り当てる前に、前記方法はさらに、前記トレーニングデータを取得することを備え、前記トレーニングデータを前記複数の作業マシンに割り当てることはさらに、各作業マシンの識別に従って、前記複数の作業マシンに前記トレーニングデータを割り当てることを備える、請求項１に記載のトレーニング方法。
各データを基に各作業マシンによって計算された前記ローカル重み及び前記ローカル損失関数値を集計し、前記現在の重み及び前記現在の損失関数値を取得することは、
各データを基に各作業マシンによって計算されたローカル重みを合計して、前記現在の重みを取得することと、
各データを基に各作業マシンによって取得されたローカル損失関数値を合計して、前記現在のローカル損失関数を取得することと
を備える、請求項１に記載のトレーニング方法。
機械学習システムのトレーニングシステムであって、トレーニングデータは前記機械学習システムをトレーニングするために使用され、前記トレーニングシステムは、
前記トレーニングデータを複数の作業マシンに割り当てるように構成されるトレーニングデータ割り当てモジュールと、
各作業マシンに割り当てられたトレーニングデータを複数のデータに分割するように構成されるトレーニングデータ分割モジュールと、
各データを基に各作業マシンによって計算されたローカル重み及びローカル損失関数値を取得するように構成される取得モジュールと、
各データを基に各作業マシンによって計算された前記ローカル重み及び前記ローカル損失関数値を集計し、現在の重み及び現在の損失関数値を取得するように構成される集計モジュールと、
前記現在の重み及び／または前記現在の損失関数値を使用して、モデル異常検出を行うように構成される異常検出モジュールと、
前記モデル異常検出の結果が第１のタイプの異常であることに応じて、前回の集計の重み及び損失関数値を前記トレーニング用の機械学習システムに入力するように構成される第１の処理モジュールと、
前記モデル異常検出の前記結果が第２のタイプの異常であることに応じて、前記現在の重み及び／または前記現在の損失関数値を、第１の閾値内にある現在の重み及び／または現在の損失関数値に修正し、それらを前記トレーニング用の機械学習システムに入力するように構成される第２の処理モジュールと
を備える、前記トレーニングシステム。
前記異常検出モジュールは、
前記現在の損失関数値が前回の集計の損失関数値のｋ倍より大きいかどうかを判定するように構成される第１の判定サブモジュールと、
前記現在の損失関数値が前記前回の集計の前記損失関数値のｋ倍より大きいかどうかを判定することに応じて、前記モデル異常検出の結果が第１のタイプの異常であると判定するように構成される第１の決定サブモジュールと
を備える、請求項１１に記載のトレーニングシステム。
前記異常検出モジュールは、
前記現在の重みの要素の最大値及び／または最小値の絶対値が所定の第２の閾値より大きいかどうかを判定するように構成される第２の判定サブモジュールと、
前記現在の重みの前記要素の前記最大値及び／または前記最小値の前記絶対値が前記所定の第２の閾値より大きいかどうかを判定することに応じて、前記モデル異常検出の前記結果が第２のタイプの異常であると判定するように構成される第２の決定サブモジュールと
を備える、請求項１１に記載のトレーニングシステム。
前記モデル異常検出の前記結果が前記第２のタイプの異常である場合、前記現在の重み及び／または前記現在の損失関数値を前記第１の閾値内の前記現在の重み及び／または前記現在の損失関数値に修正することは、所定の第２の閾値より大きい前記最大値及び／または前記最小値の前記絶対値を有する要素を前記第１の閾値ずつ減算し、各要素が前記第１の閾値内に収まる現在の重みを取得することを備える、請求項１３に記載のトレーニングシステム。
前記異常検出モジュールは、
第１のｎ集計の損失関数値の平均値が第１の集計の損失関数値より大きいかどうかを判定するように構成される第３の判定サブモジュールと、
前記第１のｎ集計の前記損失関数値の前記平均値が前記第１の集計の前記損失関数値より大きいかどうかを判定することに応じて、前記モデル異常検出の前記結果が前記第１のタイプの異常であると判定するように構成される第３の決定サブモジュールと
を備える、請求項１１に記載のトレーニングシステム。
前記モデル異常検出の前記結果が正常であることに応じて、前記現在の重み及び／または前記現在の損失関数値を前記トレーニング用の機械学習システムに入力するように構成されるトレーニングモジュールをさらに備える、請求項１１に記載のトレーニングシステム。
前記トレーニングが終了したかどうかを判定するように構成される終了判定モジュールと、
前記トレーニングが終了したと判定することに応じて、モデルを生成するように構成されるモデル生成モジュールと、
前記トレーニングが終了していないと判定することに応じて、各データを基に各作業マシンによって計算された前記ローカル重み及び前記ローカル損失関数値を再度取得することを行うように構成されるリターン実行モジュールと
をさらに備える、請求項１６に記載のトレーニングシステム。
前記終了判定モジュールは、前記現在の損失関数値及び前記前回の集計の前記損失関数値が前記第３の閾値より小さいことを検出することに応じて、前記トレーニングが終了したことを判定するように構成される、請求項１６に記載のトレーニングシステム。
前記トレーニングデータを取得するように構成されるトレーニングデータ取得モジュールをさらに備え、前記トレーニングデータ割り当てモジュールは、各作業マシンの識別に従って、前記トレーニングデータを前記複数の作業マシンに割り当てるように構成される、請求項１１に記載のトレーニングシステム。
前記集計モジュールは、
各データを基に各作業マシンによって計算されたローカル重みを合計して、前記現在の重みを取得するように構成される重み集積モジュールと、
各データを基に各作業マシンによって取得されたローカル損失関数値を合計して、前記現在のローカル損失関数を取得するように構成される損失関数値集積モジュールと
を備える、請求項１１に記載のトレーニングシステム。