JP2022132078A - 機械学習モデル更新方法、コンピュータプログラムおよび管理装置 - Google Patents

機械学習モデル更新方法、コンピュータプログラムおよび管理装置 Download PDF

Info

Publication number
JP2022132078A
JP2022132078A JP2021203911A JP2021203911A JP2022132078A JP 2022132078 A JP2022132078 A JP 2022132078A JP 2021203911 A JP2021203911 A JP 2021203911A JP 2021203911 A JP2021203911 A JP 2021203911A JP 2022132078 A JP2022132078 A JP 2022132078A
Authority
JP
Japan
Prior art keywords
edge devices
data
correlation
edge
groups
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021203911A
Other languages
English (en)
Other versions
JP7339321B2 (ja
Inventor
オスタガード ジェレミー
Ostergaard Jeremy
アチャヤ ジョイディープ
Acharya Joydeep
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2022132078A publication Critical patent/JP2022132078A/ja
Application granted granted Critical
Publication of JP7339321B2 publication Critical patent/JP7339321B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3428Benchmarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Stored Programmes (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】機械学習モデルの更新においては、更新が必要となる変化が発生した後の最初の呼び出しの遅れが影響する可能性がある。【解決手段】本明細書に記載されている例示の実装形態には、資源に制約のある複数の制御エッジデバイス上で機械学習モデルを実質的に同時に機械学習モデルオーケストレーションするシステムおよび方法を含み、これにより、モデルが導入された場所でのイベントや環境条件の変化に対して、システム全体がより俊敏に対応できるようになる。本明細書で説明する例示の実装形態には、実行されると、相関関係に基づいて、対応するモデルとともに更新されるエッジデバイスのリストを決定する複数のプロセスを含む。【選択図】 図3

Description

本開示はエッジ/クラウドシステム、より具体的には、エッジコンピュータで機械学習モデルを更新するシステムおよび方法に関するものである。
エッジコンピュータは、対応するデータソースや操作端末の近くに設置され、軽量なコンピューティング資源(処理能力、ファイルシステムストレージ、メモリなど)を持ち、他の多くの類似したエッジコンピュータと連携して配備することを特徴とする。機械学習の介入など、集中的なコンピューティングプロセスにエッジコンピュータを使用する場合、このような特徴を考慮することでメリットが得られる。
ある事象に関し、1つもしくは多数の仮説を推論するために機械学習を使用する際は、推論プロセスを実行するコンピュータ、ファイルシステムまたはメモリに記憶されたモデル、および対象に関するデータソースを使用する。しかし、対象や環境は静止したままではないため、現実の世界で運用される、任意の機械学習による推論プロセスを行うと、異なる対象や状況に遭遇することになる。例えば、生産ラインのパターンの変化、不良の発生、ベルトコンベア上の部品の配向のずれ、ライン上での異なる部品の混在生産など、時間の経過とともに対象が異なってくる場合がある。また、例えば、太陽の動きによる光の状態の影響や、天候による視界への影響などにより、光、温度、塵埃、作業者の存在や行動などの環境条件に基づく場合には、機械学習による推論プロセスの状況が時間の経過とともに変化することもある。
このような推論プロセスでは、使用する資源の量がモデルの適合性の範囲に相当する。例えば、推論プロセスがサポートする対象のタイプや状況の数を増やそうとするならば、プロセスの処理能力、メモリ、ファイルシステムの使用量を増やしてもよい。エッジコンピュータのようにコンピュータ上の資源量が制限されている場合、対象や状況の適合性が限られたモデルを使用しなければならず、これらのモデルでは、対象や状況がその範囲を超えて変化した場合に、精度の低下や適合性の欠如が生じる可能性がある。
このような状況では、コンピュータ上のモデルを置き換えることで、推論プロセスの限られた対象と状況の適合性を緩和することができる。例えば、対象や状況が変化したときは、モデルの入れ替えが有益になる。図1は、エッジコンピュータによるモデル入れ替え手順の使用について示したものである。エッジコンピュータ上のモデルの入れ替え手順の間、推論プロセスを一時的に停止する必要がある場合があり、ダウンタイムが発生することがある。また、変化が発生してから入れ替え手続きが呼び出されるまでに時間がかかると、旧モデルで問題が発生する時間が長くなる。実際には、行為者であるエッジコントローラの人間のオペレータが、状況や対象物の変化を識別して入れ替え手続きを呼び出すことが一般的であり、その結果、長い遅延が発生することになる。
ダウンタイムの回数やモデル入れ替えの遅れを減らすために、複数のエッジコンピュータが共通の変化によって影響を受ける場合、図2に示すように、機械学習モデルオーケストレーションシステムを使用すれば、多数のエッジコンピュータのモデルを同時に入れ替えすることができる。このようなシステムでは、対象や状況の変化によってエッジコントローラのモデルが悪影響を受ける前に、先手を打ってモデルを入れ替えすることで、遅延やダウンタイムを削減または解消することができる。
以上のような機械学習におけるモデルの更新に関する技術として、特許文献1が存在する。特許文献1では、機械設備の故障予知精度を向上させるために、相関モデルの更新が実行されている。
特開2019-28565号公報
しかし、このような関連技術のシステムでは、変化が発生した後の最初の呼び出しの遅れが影響する可能性がある。関連技術では、この呼び出しは手動で行われるか、手動で入力されたスケジュールに従って行われる。さらに、最適なパフォーマンスを得るためには、どのコンピュータのモデルを一緒に入れ替えするべきか、また、所与の状況にはどのモデルを使用すべきかを機械学習モデルオーケストレーションシステムに知らせる必要がある。実際には、この情報はシステムに予めプログラムされているか、基本的な数学的論理やクエリによって行われる。
本開示の態様は、複数のエッジデバイスのうちの1つのエッジデバイスによって起動されたモデルリフレッシュ事象の場合、エッジデバイスとの第1の相関関係に基づいて、モデルリフレッシュを適用するために、複数のエッジデバイスのうちの1つ以上を選択し、複数のエッジデバイスのうちの1つ以上の間の第2の相関関係に基づいて、複数のエッジデバイスのうちの1つ以上を複数のグループにグループ化し、複数のグループの各々に適用されるモデルを選択する機械学習モデル更新方法に関する。
本開示の態様は、コンピュータプログラムに関し、このコンピュータプログラムによりコンピュータが、複数のエッジデバイスのうちの1つのエッジデバイスによって起動されたモデルリフレッシュ事象について、エッジデバイスとの第1の相関関係に基づいて、モデルリフレッシュを適用するために、複数のエッジデバイスのうちの1つ以上を選択し、複数のエッジデバイスのうちの1つ以上の間の第2の相関関係に基づいて、複数のエッジデバイスのうちの1つ以上を複数のグループにグループ化し、複数のグループの各々に適用されるモデルを選択するコンピュータプログラムに関する。コンピュータプログラムの命令は、非一時的コンピュータ可読媒体上に記憶でき、1つ以上のプロセスによって実行されるように構成されている。
本開示の態様は、複数のエッジデバイスのうちの1つのエッジデバイスによって起動されたモデルリフレッシュ事象の場合、エッジデバイスとの第1の相関関係に基づいて、モデルリフレッシュを適用するために、複数のエッジデバイスのうちの1つ以上を選択する手段と、複数のエッジデバイスのうちの1つ以上の間の第2の相関関係に基づいて、複数のエッジデバイスのうちの1つ以上を複数のグループにグループ化する手段と、複数のグループの各々に適用されるモデルを選択する手段と、を含み得るシステムに関する。
本開示の態様は、管理装置であって、複数のエッジデバイスのうちの1つのエッジデバイスによって起動されたモデルリフレッシュ事象の場合、エッジデバイスとの第1の相関関係に基づいて、モデルリフレッシュを適用するために、複数のエッジデバイスのうちの1つ以上を選択し、複数のエッジデバイスのうちの1つ以上の間の第2の相関関係に基づいて、複数のエッジデバイスのうちの1つ以上を複数のグループにグループ化し、複数のグループの各々に適用されるモデルを選択するプロセッサを含むことができる管理装置に関する。本管理装置をコンピュータとして機能させるコンピュータプログラムの命令は、非一時的コンピュータ可読媒体上に記憶でき、1つ以上のプロセスによって実行されるように構成されている。
エッジコンピュータによるモデル入れ替え手順の使用について示したものである。 機械学習モデルオーケストレーションシステムの使用例を示す。 例示の実装形態による、エッジコンピュータでモデルリフレッシュを呼び出すソフトウェアシステムの例を示す。 例示の実装形態による、4つの独立したプロセスを含むモデルリフレッシュシステムの例を示す。 例示の実装形態による、第1のプロセスの例示のフロー図を示す。 例示の実装形態による、第2のプロセスの例示のフロー図を示す。 例示の実装形態による、第3のプロセスの例示のフロー図を示す。 例示の実装形態による、デバイス相関サブプロセスを示す図である。 例示の実装形態による、図8のサブプロセスに入力できるデバイス情報の例を示す。 例示の実装形態による、サブセットとメンバーのリストが、デバイスとそのサブセットのメンバーシップのテーブルにコンパイルされる例を示す。 例示の実装形態による、デバイスの各可能な組み合わせを評価して、グループ/サブセットが交わらないようにするための選択プロセスの例を示す。 例示の実装形態による、図10に示す、いくつかの可能なデバイスの配列から計算したスコア値のリストの例を示す。 例示の実装形態による、エッジコンピュータのサブセットごとに最適なモデルを選択する第4のプロセス手順の例を示す。 グループに対して最高性能のモデルの決定がどのようにして行われ得るかを示す例を示す。 例示の実装形態による、センサが接続された複数のエッジデバイスと、管理装置とを含むシステムを示す。 いくつかの例示の実装形態で使用するのに好適な、例示的なコンピュータデバイスを備えた例示的なコンピューティング環境を示す。
以下の詳細な説明は、本出願の図面および例示の実装形態の詳細を提供するものである。図面間の冗長要素の参照番号および説明は、明確のため、省略する。本明細書全体を通して使用される用語は、例として提供されるものであり、限定することを意図するものではない。例えば、「自動」という用語の使用は、本出願の実装形態を実施する当業者の所望の実装形態に応じて、実装形態のいくつかの態様では、ユーザまたは管理者の制御を含む完全自動または半自動の実装を含んでいてもよい。選択は、ユーザインターフェースまたは他の入力手段を介してユーザによって、または所望のアルゴリズムを通して実装することができる。本明細書で説明する例示の実装形態は、単独で、または組み合わせて利用することができ、例示の実装形態の機能性は、所望の実装形態に従った任意の手段を介して実装することができる。
図3は、例示の実装形態による、エッジコンピュータでモデルリフレッシュを呼び出すソフトウェアシステムの例を示す。本明細書で説明する例示の実装形態は、ソフトウェアベースのシステムが、機械学習モデルオーケストレーションシステム404を呼び出して、複数のエッジコンピュータ上の機械学習モデルを更新することを含む。本明細書で説明する例示の実装形態は、401でエッジコンピュータデバイス420上の推論対象または状況400の変化(本明細書ではリフレッシュ事象と呼ぶ)を自動的に検出し、次に機械学習モデルオーケストレーションシステム404を呼び出して、402でサーバ430が決定したように、どのエッジコンピュータがモデルを入れ替えすべきか、各エッジコンピュータでどのような新しいモデルを使用すべきか(本明細書ではモデルリフレッシュと呼ぶ)のアルゴリズム的に生成されたリスト403を提供する。エッジコンピュータでの変化(「リフレッシュ事象」)を自動的に検出することで、関連技術の実装形態の能力を超えて、リフレッシュ事象からモデルリフレッシュの完了までの遅延を短縮することができる。モデルリフレッシュをどのように実行するかをアルゴリズムで決定することにより、手動で構成する必要性を排除して、機械学習モデルオーケストレーションシステム404のパフォーマンスを、精度と適応性の面で向上させることができる。提案されたモデルリフレッシュ呼び出しシステムの成果は、リフレッシュ事象に関連するエッジコンピュータからのデータ、資源管理システムからのエッジコンピュータのデバイス情報、およびエッジコンピュータの推論プロセスの時系列情報を検討することにより実現する。
図4は、例示の実装形態による、4つの独立したプロセスを含むモデルリフレッシュシステムの例を示す。本明細書に記載するように、第1のプロセスで説明したサブシステムの複数のインスタンスが存在し、別々のエッジコンピュータ上で動作することが可能である。第2のプロセスで記述されたサブシステムは、第1のプロセスで記述したサブシステムの複数のインスタンスからコールと入力を受け取ることが可能である。そうすることで、第1のプロセスで使用したサブシステムを、配備されている多くの、またはすべてのエッジコンピュータで実行することが可能になり、必要に応じてモデルの入れ替えを呼び出すことができるようになる。
例示の実装形態では、図4に示すように、4つの別々のプロセスが使用される。エッジコンピュータデバイス420上で連続的に実行される第1のプロセス501は、エッジデータ500を解析することにより、リフレッシュ事象を識別し、システムを起動する。サーバ430上で実行される第2のプロセス502は、他のエッジコンピュータと、起動しているエッジコンピュータデバイス420とを比較することにより、どのエッジコンピュータでモデルリフレッシュを行うかを選択する。サーバ430上で実行される第3のプロセス503は、デバイス情報技術(IT)および操作技術(OT)データベース510に基づいて選択されたエッジコンピュータを、互いに類似性に基づいてグループ化し、どのエッジコンピュータが同じモデルを使用すべきかを識別する。サーバ430上で実行される第4のプロセス504は、リフレッシュ事象からのデータと履歴データベース520内の履歴事象との比較に基づいて、エッジコンピュータの各グループがリフレッシュ事象に応答して使用するのに最適なモデルを選択する。
図5は、例示の実装形態による、第1のプロセスの例示のフロー図を示す。第1のプロセス501は、システムの起動に使用され、エッジコンピュータデバイス420上で行われ、継続的に実行されて、エッジデータデバイスからのデータ、推論プロセス出力、作業状況情報の変化を解析することで、推論対象や状況の変化を識別する。このプロセスは、継続的に行われて、機械学習による推論の対象のタイプや状況のタイプが変化したことを示す基準に関するデータを監視する。
このプロセスのデータは、エッジコントローラ上のエッジデータ収集機能613によって収集される。同じコンピュータ上で実行されている機械学習による推論プロセスからの統計値を示す推論プロセスの統計情報612と、エッジコンピュータデバイス420の一種であるエッジコントローラが観察できる外部エッジデータ610の2種類のデータが収集される。推論プロセスの統計情報612は、コンピュータ上で実行されているローカル推論プロセスからの利用可能なログファイル、アプリケーションプログラミングインターフェース(API)または標準出力から収集され、このプロセスが対象の推論に成功したか失敗したかの記録、信頼率、エラーまたは警告メッセージ、推論にかかった時間、識別された特徴の数、対象の分類またはタイプ、一般的なログメッセージ、または元のデータソース(カメラなど)から渡された非構造化データなどを含む。観測可能な外部エッジデータ610は、エッジコンピュータデバイス420が受信するネットワークデータ600を監視したり、プロトコルを介してネットワーク上の他のデバイスのデバイス情報611にアクセスしたり、他のデータソースから作業環境の外部条件602を観察したりすることで収集される。
ネットワークデータ600には、他のネットワークデバイスの動作状況やアクティビティ(例えば、コントローラが動作を開始したことを示すパケットを送信する)、実行中のソフトウェアサービスやオペレーションシステムのバージョンを識別するための他のデバイスのネットワークポートの問い合わせ、ハードウェアの仕様を識別するための媒体アクセス制御(MAC)アドレス、異なるデバイス間の一般的な通信データパターンなどが含まれる。エッジコンピュータは、リアルタイムで収集されたデータに加えて、そのモデルを使用する際に存在するべき予想/正常データ値を示す機械学習モデルごとに、上記のタイプのデータのリポジトリまたはデータベースを有している。
第1のプロセス501は、収集したエッジデータと、現在実行中のモデルの予想正常データ614との比較解析615を継続的に行う。この解析では、利用可能なデータタイプごとに、現在のデータと予想されるデータの間のずれのレベルを計算し、すべてのデータタイプをまとめて617で合計ずれのレベルを計算する。データがリフレッシュ事象を示しているという判定は、データの特定の値に対する基準によって、または合計もしくは特定のデータタイプのいずれかに対するずれのレベルが、616で決定したような一定のしきい値を超えていることによって行われる。しきい値や基準値は、システムオペレータによる入力によって設定することができる。
リフレッシュ事象が指示された場合、第1のプロセス501は、619において、モデルリフレッシュが行われるようにサーバ430を呼び出し、解析に使用された収集エッジデータセットもサーバに送信する。それ以外の場合は、618ではアクションを起こさない。
図6は、例示の実装形態による、第2のプロセスのフロー図を示す。第2のプロセス502は、第1のプロセス501が変化を識別した後にサーバ上で行われ、(第1のプロセス501において)起動しているエッジコンピュータデバイス420からのデータを他のエッジコンピュータと比較することにより、どのエッジコンピュータをモデルリフレッシュのために選択すべきかを識別する。モデルリフレッシュ619の要求を受信した後、デバイス情報データプロセッサ機能711は、710でデバイス管理システムに問い合わせてエッジコンピュータの情報を取得する。これらのシステムには、700および701で示したように、資産、ソフトウェア、ハードウェア、または在庫管理システム、電子資源プランニングシステム、または製造実行システムが含まれる。これらのシステムから収集されるデータは、静的なデバイス情報および/またはその他のハードウェア情報である。エッジコンピュータのタイプ、付属ハードウェア、配備場所、ある生産ラインやその他の機械との関連、配備の階層、ネットワークトポロジーなどが含まれる。さらに、操作のスケジュール、どのような対象が存在するかのスケジュール、状況変化のスケジュール、操作プロセスと個々のコンピュータとの関係など、デバイスの使用に関するプロセス情報を含むことができる。
各エッジコンピュータのデータが照会された後、起動しているエッジコンピュータデバイスのデバイスデータをトリガ712し、このデータが、全エッジコンピュータのデータ713のセットから分離される。次いで、これらの2つのデータセットは、デバイス相関サブプロセス714を介して解析され、このデバイス相関サブプロセス714は、715において、他のすべてのエッジコンピュータと、起動しているエッジコンピュータデバイス420との間の相関値を決定する。そして、相関値に基づいて、各コンピュータが、起動しているエッジコンピュータが検出したのと同じリフレッシュ事象の影響を受ける可能性が高いかどうかを判定する。
この判定は、2つのコンピュータ間の相関値が、716に示すように、一定のしきい値を超えた場合や、基準に合致した場合に行われるように、システムオペレータが設定できる。起動しているコンピュータと類似していると判定されたエッジコンピュータは、717でテーブルにコンパイルされ、それらのエッジコンピュータに関する、コンパイルされたデータとともに、718で次のプロセスに出力される。
図7は、例示の実装形態による、第3のプロセスの例示のフロー図を示す。第3のプロセス503は、モデルリフレッシュのためにエッジコンピュータのセットが選択された後にサーバ430で行われ、各エッジコンピュータに関するデータ比較により、セットを類似したエッジコンピュータの複数のサブセットに配列する。プロセスは、812でモデルリフレッシュを実行するエッジコンピュータデバイスのセットと、811でそれらのデバイスのデータのコンパイルが受信された後に先へ進む。
まず、データプロセッサ機能814が、時系列データベースなどの他の履歴データソースから、各デバイスとそれに使用されるモデルに関連する追加のデータを取得する。このデータには、アクティブな期間、対象が観察された時間、対象の推論に成功したプロセスまたは失敗したプロセスの記録、信頼率、エラーまたは警告メッセージ、推論にかかった時間、または履歴主要パフォーマンス評価指標801および802で例示したように識別された特徴の数など、過去の推論プロセスの主要パフォーマンス評価指標810に関する時系列情報を含んでいてもよい。同じ対象が各エッジコンピュータ(例えば、コンベヤベルトに沿って移動する対象を推論するシーケンス内の複数のエッジコンピュータ)に到達する時間の差を考慮するために、このデータに対して時間シフト整列機能813を実行することができる。例示の実装形態では、時系列情報を利用することで、異なるデバイスからの事象が時間的にずれている場合、それらを揃えることができる。コンベアベルトに沿って移動する同一の対象物を複数のエッジコンピュータが順に処理する例では、順に検出された複数のエッジコンピュータの各事象を時系列データによって識別することができ、その結果、順に検出された各エッジコンピュータが順に検出された後続のエッジコンピュータからあるデルタ時間(例えば、数秒)だけオフセットされていると判定することができる。次にデータプロセッサは、815において、収集した時系列データのパフォーマンスとアクティビティを解析することで、デバイスの機械学習パフォーマンスパターン(パフォーマンス対時間)を判定する。この追加のデバイスとモデルのデータは、816で受信したデバイス情報と一緒にコンパイルされる。
データがコンパイルされた後、デバイス相関サブプロセス817を介して解析され、デバイス情報/ハードウェア構成に基づいて、各デバイスと他のデバイスとの間のデバイス類似性の相関値を決定し、デバイス相関値のマトリクスが得られる。そして、相関値に基づいて、相関値を持つデバイスが同じ機械学習モデルを使用した場合には、818で、最適な推論プロセスパフォーマンスを発揮する可能性が高いかどうかの判定を行う。この判定は、2つ以上のデバイス間の平均または最小の相関値がしきい値を超えたり、システムオペレータが設定できるある値の基準に合致したりした場合に行われる。この判定が複数のコンピュータ間で行われた場合、これらのコンピュータはグループとしてのデバイスのサブセットに入れられる。この判定後、デバイスが他のデバイスや複数のデバイスとグループ化されている場合は、単独のメンバーとしてサブセットに入れられる。プロセスの結果、各デバイスは、1つ以上のメンバーを持つサブセットに属し、サブセットとメンバーのリストは、819でデバイスとそのサブセットのメンバーシップのテーブルにコンパイルされ、図11に示されるようにプロセスによって出力される。
図8は、例示の実装形態による、デバイス相関サブプロセスを示す図である。第2のプロセス502および第3のプロセス503が使用するデバイス相関サブプロセスは、サーバ430上で行われ、900で、のデバイス情報のセットに基づいて、あるデバイスと他のデバイスとの間の相関値を生成する。このサブプロセスに入力されるデバイス情報の例を図10に示す。まず901では、デバイス情報の非構造化データを処理して構造化データに変換し、可能であれば他のデバイスに存在するデータタイプに分類する。続いて902では、すべてのデバイスの値について、データタイプごとに標準的なフォーマットにデータを正規化し、903では定性的な値を定量的な値に変換する関数を行う。その後、904で第2のプロセス502または第3のプロセス503で規定されているように相関値を算出する。これらの値は、あるデバイスと別のデバイスの間でデータタイプの各値を比較することによって決定され、この比較は、等しいかどうか905、どちらの値が高いか907などの基本的な比較機能を介して行うことができ、あるいは、906に示すように、所望の実装形態に応じて、各値間のずれのレベルなど、より高度な比較機能を用いて行うこともできる。さらに、各データタイプには、908での計算における重要性を増加または減少させるために送られる重みを持たせることができ、これはシステムオペレータによって設定することができる。その後、909で相関値がコンパイルされる。第2のプロセス502の場合、出力はテーブル内の1行の相関値であり、第3のプロセス503の場合、出力は図11に例示されているようなマトリックステーブルになる。
図9は、例示の実装形態による、図8のサブプロセスに入力できるデバイス情報の実施例を示す。所望の実装形態によると、情報には、デバイスの識別子(ID)、オペレーティングシステム(OS)のバージョン、CODESYSのバージョン、データプロセッサ、ドライバ情報、マシンビジョンアプリケーション情報、利用している基礎的なプログラマブル論理コントローラ(PLC)、およびさまざまな重みが含まれるが、これらに限定されない。
図10は、例示の実装形態による、サブセットとメンバーのリストが、デバイスとそのサブセットのメンバーシップのテーブルにコンパイルされる例を示す。図10に示すように、デバイスIDはマトリクス状に配列されており、そこからデバイスのペア間の相関関係が得られる。
第2のプロセス502の判定時のデバイスは、起動しているデバイスとの相関値がデバイスのオペレータが設定したしきい値を超えた場合、あるいは、所望の実装形態に応じて、簡単な評価で選択できる。
デバイスの可能な組み合わせをそれぞれ評価して、グループ/サブセットが交わらないようにすることで、第3のプロセス503の判定時にグループ化するデバイスを選択できる。図11に、例示の実装形態による、デバイスの各可能な組み合わせを評価して、グループ/サブセットが交わらないようにするための選択プロセスの例を示す。この評価は、デバイスグループの最小量、グループの各メンバー間の平均相関値の最小値、および各デバイスの他のグループメンバー間の平均相関値に基づくスコアを使用して行うことができる。ここで例示したように、デバイス相関値の他に、グループの平均相関値も算出することができ、これは、あるグループのデバイス相関値を他のグループメンバーと比較した場合の平均値である。
これらのスコアのそれぞれについて、システムオペレータは、1201での評価中に満たされることが求められる目標スコア値を設定してもよい。デバイスグループの数が最小である場合のスコアは、実際にグループ化されるデバイスの数を表しており、1201および1202に示すように、このスコアの値を目標とすれば、1つのメンバーしか含まないグループの数が少ない配列を選択することができる。グループの平均相関値が最小である場合のスコアは、配列中、「最も相関の低い」グループを表しており、その値を目標とすれば、第3のプロセス503に向けて最小の相関メトリックの設定をすることができるようになる。このように、オペレータは、グループの数や最小平均グループの相関に関するしきい値のスコアを設定することができる。グループ数の例では、グループgにn個のデバイスを配列した場合、スコアは(g/n)*100%で計算できるので、スコアが高いほどグループ数が少ないことを意味し、スコア0%はすべてのデバイスがそれぞれのグループに属していることを意味し、スコア100%はすべてのデバイスが1つのグループに属している可能性があることを意味する。オペレータは、デバイスが、あるしきい値を大きく超えている場合は低いスコアを、デバイスが非常に似ている場合は高いスコアを選択することができる。したがって、図11のプロセスは、所望の実装形態に応じて調整することができる。
最小平均グループの相関スコアの例では、配列中のすべてのグループの中で最も低いグループの平均相関値であり、配列中の最も相関の低いグループに対して何が許容されるかを示している。オペレータは、異種のデバイスが一緒にグループ化されることに対する許容度が高い場合は低いスコアを、異種のデバイスが一緒にグループ化されることに対する許容度が低い場合は高いスコアを選択することができるため、所望の許容度に応じて調整することができる。このように、1200、1201、1202のフローでは、「グループの数」のしきい値を満たさない配列を検討対象から外している。しきい値を満たさない場合は、最高のスコアを持つものだけを残す。
1203において、各デバイスの平均相関値のスコアは、各デバイスがそのグループにどれだけ密接に「適合」しているかを表しており、1204および1205に示すように、他のしきい値が満たされた後に、異なるグループ配列を比較して最適な配列を決定するために使用することができる。このように、1203、1204、1205のプロセスで、フローは、最小平均グループの相関しきい値を満たさない配列を検討対象から外す。しきい値を満たさない場合、フローは最高のスコアを持つものだけを残すことができる。単一のデバイスからなるグループは、(当該デバイスは、自分自身と完全に一致するため)完全なグループ相関スコアになるが、単一デバイスのグループは、第4のプロセス504におけるグループベースのモデル選択においては利点がないため、単一のデバイスグループを持つ配列は選択から外すべきであり、グループの数が少ない配列は選択されるべきである。したがって、1206において、結果として得られる選択は、グループに対する最も高い平均デバイス相関を有する配列であり、勝者は、グループに対する平均デバイス相関が最も高いものが勝者として選択される。同点は、第1にグループに対する平均デバイス相関、第2に最小平均グループ相関、第3にグループ数で決めるなど、所望の実装形態に応じて解決することができるが、これに限定されるものではない。
図12は、例示の実装形態による、図10のいくつかのデバイスの可能な配列から計算された例示のスコア値のリストを示す。各デバイスセットの第1の配列は、デバイスがグループ化されていない第3のプロセス503からのプロセスを使用しない、従来のモデル選択プロセスとなり得るものを実証している。図12に示すように、デバイスセットは、グループ検討のためのデバイスの組み合わせと、デバイスセット内でグループとして検討できる配列やサブセットを示している。各配列は、図11のプロセスを通じて、最小平均グループの相関、グループに対する平均デバイス相関、およびグループの数に基づいて評価される。図12の例では、プロセスは、グループのすべての可能な配列から始まり、それに対して、各配列の各グループに対して、図11のデバイス相関サブプロセスでグループ相関を計算する。そして、各配列の各グループについて、デバイス相関サブプロセスと同様にしてグループ相関を算出する。それぞれの配列に対して、2つのスコアが計算され、さらにグループに対する平均デバイス相関などのスコアが追加される。これは、配列内のすべてのグループのすべてのグループ相関値を、グループの大きさで加重した平均値である。よって、結果は、デバイスが残りのグループとどれだけ相関しているかの平均値を示し、ある特定のグループがどれだけ最適かを示す。
一度決定され、評価されたデバイスのサブセットグループは、次に説明する第4のプロセスに利用することができる。
図13は、例示の実装形態による、第4のプロセスの例示のフロー図を示す。モデルをリフレッシュするために、類似デバイスのサブセットが決定された後に、第4のプロセス504がサーバ上で行われ、第1のプロセス501からのリフレッシュ事象に関連するデータを、各サブセットのエッジコントローラからの過去のデータの履歴時系列データベースと比較することにより、各サブセットに対して最適に動作する可能性が最も高いモデルを選択する。まず、1405では、データを比較して、900での現在のリフレッシュ事象とデータの履歴の中で類似した事象を識別する。第1のプロセス501で説明したように、リフレッシュ事象が起動されたときに、エッジコンピュータの機械学習による推論プロセスで得た統計を含む現在の「ライブ」データ1400が、エッジデバイスによって送信される。このデータは、次に、同じ展開1404における機械学習による推論プロセスで得た履歴統計と比較されるが、これらの統計は、これらの推論プロセスへの変化が呼び出されたときにキャプチャされた「ライブ」データ1403とともに、推論プロセスの主要パフォーマンス指標1402を含んでいてもよい。
これらの事象のキャプチャされたライブデータを、過去のキャプチャされたデータと比較することで、基本的な比較またはデバイス比較サブプロセスで使用したものと同様の、より高度な論理を使用して、類似した事象を識別することができる。類似した事象を判定した後、1406でエッジコンピュータの推論プロセスの主要パフォーマンス評価指標(KPI)が解析され、これらの類似した事象でどのモデルが最高のパフォーマンスを発揮したかが判定される。この解析は、サブセットに含まれる各エッジコンピュータで同様の事象が発生した際に使用された各モデルについて、各主要パフォーマンス評価指標に基づく定量化可能な調整値を算出し、すべての調整値を組み合わせて、どのモデルが今回と同様の事象の下で歴史的に最も優れたパフォーマンスを発揮したかを判定する。この解析と、サブセット全体の類似した事象における過去のすべてのモデルパフォーマンスの解析に基づき、1407で、サブセットのエッジコンピュータの平均性能が最も高くなる単一モデルを選択する。
このプロセスが各サブセットについて完了した後、その結果は、デバイスグループ1401の元のリストから導き出された、エッジコンピュータと各コンピュータがどのモデルを受け取るべきか機械学習モデルオーケストレーションシステム404の最終的なテーブルにコンパイルすることができる。その後、機械学習モデルオーケストレーションシステム404は、1409において、エッジコンピュータへの新しいモデルの送信を要求するためのインターフェースを使用して呼び出され、このようにしてテーブルの情報が提供される。そして、この呼び出しの結果、機械学習モデルオーケストレーションシステム404は、テーブル中のリストアップされたエッジコンピュータと対話して、それぞれのエッジコンピュータの機械学習による推論モデルを本システムが指定するモデルに置き換えて、配信システム530を更新する。最終的には、この機械学習による置換呼び出しシステムの結果、各エッジコンピュータはこのシステムで最適と判定されたモデルを使用することになるはずである。
図14は、グループに対して最高性能のモデルの判定がどのようにして行われ得るかを示す一例を示したものである。各モデルのKPIスコアがモデルのKPIに基づいて計算されているとすると、デバイスグループに最適なモデルは、例えば、各デバイスのモデルのスコアを平均し、グループ内の残りのデバイスとの平均的な相関値で重み付けして決定することができる。デバイスのグループ化を考慮していない従来のモデル選択システムでは、個々のデバイスの過去のモデルのKPIだけを見ることになり、KPIの異常値や、過去の事象中のエラーによってKPIを通常とは異なったものに変化させた場合に、マイナスの影響を受けやすくなる。グループベースの評価でモデルを選択することで、相関する他のデバイスのKPI値も検討することを加えて、不規則な過去のモデルのKPIの影響を軽減することができる。
本明細書に記載されている例示の実装形態すべてにおいて、このシステムを利用すれば、機械学習のエッジプロセスに対し、対象または状況の変化に動的に対応することができる。本システムの応用例としては、製造ラインで生産されている製品モデルの予期せぬ変化、製造設備の稀な故障による製品への影響、マシンビジョンプロセスでのアイテムの配向の違い、工場の照明条件の予期せぬ変化などが挙げられる。機械学習モデルの切り替えを起動する類似のシステムと比較して、本開示は、新しい事象をより速く識別して反応し、その後のモデルの切り替えにおいて最適でないモデル選択を修正することで精度を向上させ、データ解析を利用してデバイス間の関係や事象とモデル間の関係を手動で分類するのに必要な労力を削減することができる。
図15は、例示の実装形態による、センサが接続された複数のエッジデバイスと、管理装置とを含むシステムを示す。接続されたセンサを有する1つ以上のエッジデバイス1601-1、1601-2、1601-3、および1601-4は、モノのインターネット(IoT)ゲートウェイまたは他の製造管理システムのための機能性を促進する、管理装置1602に接続されたネットワーク1600に通信可能に連結される。管理装置1602は、エッジデバイス1601-1、1601-2、1601-3、および1601-4のセンサから収集された履歴データを含むデータベース1603を管理するが、この履歴データは、エッジデバイス1601-1、1601-2、1601-3、および1601-4から受信したラベル付きデータおよびラベルなしデータを含んでいてもよい。代替的な例示の実装形態では、エッジデバイス1601-1、1601-2、1601-3、1601-4のセンサからのデータは、エンタープライズ資源プランニングシステムなどのデータを取り込む私有のデータベースなどの中央リポジトリまたは中央データベースに記憶することができ、管理装置1602は、中央リポジトリまたは中央データベースからデータにアクセスまたは取得することができる。このようなエッジデバイスには、所望の実装形態によって、センサ付きのロボットアーム、センサ付きのタービン、センサ付きの旋盤などが含まれる。モデルリフレッシュ事象は、エッジデバイスのモデルから現在のデータへの予測データのずれ、または本明細書に記載されるようなモデル変更を必要とするエッジデバイスへの状態変化を示す現在のデータ内の基準の検出のうちの1つ以上に基づいて、エッジデバイス1601-1、1601-2、1601-3、1601-4のいずれかによって起動され得る。
図16は、サーバ430の機能を促進するものとして、図15に示されているような管理装置1602、またはエッジコンピュータデバイス420の一種であるエッジコントローラなど、いくつかの例示の実装形態で使用するのに好適な、例示的なコンピュータデバイスを備えた例示的なコンピューティング環境を示している。
コンピューティング環境1700のコンピュータデバイス1705は、1つ以上の処理ユニット、コア、またはプロセッサ1710、メモリ1715(例えば、RAM、ROM、および/または同様のもの)、内部ストレージ1720(例えば、磁気、光学、ソリッドステートストレージ、および/または有機)、および/またはI/Oインターフェース1725を含むことができ、これらはすべて、情報を通信するための通信機構またはバス1730上に連結するか、またはコンピュータデバイス1705に組み込むことができる。また、I/Oインターフェース1725は、所望の実装形態に応じて、カメラから画像を受信したり、プロジェクタやディスプレイに画像を提供したりするように構成されている。
コンピュータデバイス1705は、入力/ユーザインターフェース1735および出力デバイス/インターフェース1740に通信可能に連結することができる。入力/ユーザインターフェース1735および出力デバイス/インターフェース1740のいずれか一方または両方は、有線または無線のインターフェースとすることができ、着脱可能とすることができる。入力/ユーザインターフェース1735は、入力を提供するために使用することができる、物理的または仮想的な任意のデバイス、コンポーネント、センサ、またはインターフェース(例えば、ボタン、タッチスクリーンインターフェース、キーボード、ポインティング/カーソルコントロール、マイク、カメラ、点字、モーションセンサ、光学リーダなど)を含むことができる。出力装置/インターフェース1740は、ディスプレイ、テレビ、モニタ、プリンタ、スピーカ、点字などを含んでもよい。いくつかの例示の実装形態では、入力/ユーザインターフェース1735および出力デバイス/インターフェース1740は、コンピュータデバイス1705とともに埋め込まれてもよく、またはコンピュータデバイス1705に物理的に連結されてもよい。他の例示の実装形態では、他のコンピュータデバイスは、コンピュータデバイス1705のための入力/ユーザインターフェース1735および出力デバイス/インターフェース1740の機能として機能してもよく、またはその機能を提供してもよい。
コンピュータデバイス1705の例には、移動性の高いデバイス(例えば、スマートフォン、車両やその他の機械に搭載されたデバイス、人間や動物が持ち運ぶデバイスなど)、モバイルデバイス(例えば、タブレット、ノートブック、ラップトップ、パーソナルコンピュータ、ポータブルテレビ、ラジオなど)、および移動用として設計されていないデバイス(例えば、デスクトップコンピュータ、その他のコンピュータ、情報キオスク、1つ以上のプロセッサがその中に組み込まれたおよび/またはそれに連結されたテレビ、ラジオなど)が含まれ得るが、これらに限定されない。
コンピュータデバイス1705は、同じ構成または異なる構成の1つ以上のコンピュータデバイスを含む、任意の数のネットワーク化されたコンポーネント、デバイス、およびシステムと通信するために、外部ストレージ1745およびネットワーク1750に(例えば、I/Oインターフェース1725を介して)通信可能に連結してもよい。コンピュータデバイス1705または接続されたコンピュータデバイスは、サーバ、クライアント、シンサーバ、一般機械、特別目的機械、または別のラベルとして機能し、サービスを提供し、または参照することができる。
I/Oインターフェース1725は、コンピューティング環境1700の少なくともすべての接続されたコンポーネント、デバイス、およびネットワークとの間で情報を通信するための、任意の通信またはI/Oプロトコルまたは標準(例えば、イーサネット、802.11x、ユニバーサルシステムバス、WiMax、モデム、セルラーネットワークプロトコルなど)を使用する有線および/または無線インターフェースを含むことができるが、これらに限定されない。ネットワーク1750は、任意のネットワークまたはネットワークの組み合わせ(例えば、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、電話回線網、セルラーネットワーク、衛星ネットワークなど)でよい。
コンピュータデバイス1705は、一時的な媒体および非一時的な媒体を含む、コンピュータで使用可能な媒体またはコンピュータで読み取り可能な媒体を使用および/または通信することができる。一時的な媒体としては、伝送媒体(金属ケーブル、光ファイバーなど)、信号、搬送波などがある。非一時的な媒体には、磁気媒体(ディスク、テープなど)、光媒体(CD ROM、デジタルビデオディスク、ブルーレイディスクなど)、ソリッドステート媒体(RAM、ROM、フラッシュメモリ、ソリッドステートストレージなど)、その他の不揮発性のストレージやメモリなどがある。
コンピュータデバイス1705を使用して、いくつかの例示的なコンピューティング環境において、技術、方法、アプリケーション、プロセス、またはコンピュータ実行可能な命令を実装することができる。コンピュータ実行可能な命令は、一時的な媒体から取得することも、非一時的な媒体に記憶して取得することもできる。実行可能な命令は、任意のプログラミング言語、スクリプト言語、および機械言語(C、C++、C#、Java、Visual Basic、Python、Perl、JavaScript他など)のうちの1つ以上で作成されてもよい。
プロセッサ(単数または複数)1710は、任意のオペレーティングシステム(OS)(図示せず)の下で、ネイティブ環境または仮想環境で実行することができる。論理ユニット1760、アプリケーションプログラミングインターフェースユニット1765(以下、APIユニット1765と称する)、入力ユニット1770、出力ユニット1775、および異なるユニットが相互に、OSと、および他のアプリケーション(図示せず)と通信するためのユニット間通信機構1795を含む、1つ以上のアプリケーションを展開することができる。記載されているユニットや要素は、デザイン、機能、構成、または実装において様々であり、記載されている内容に限定されるものではない。
いくつかの例示の実装形態では、情報または実行命令がAPIユニット1765によって受信されると、それは1つ以上の他のユニット(例えば、論理ユニット1760、入力ユニット1770、出力ユニット1775)に伝達されてもよい。いくつかの例では、論理ユニット1760は、上述のいくつかの例示の実装形態において、ユニット間の情報フローを制御し、APIユニット1765、入力ユニット1770、出力ユニット1775によって提供されるサービスを指示すように構成されてもよい。例えば、1つ以上のプロセスまたは実装の流れは、論理ユニット1760単独で、またはAPIユニット1765と組み合わせて制御されてもよい。入力ユニット1770は、例示の実装形態で説明した計算のための入力を得るように構成されてもよく、出力ユニット1775は、例示の実装形態で説明した計算に基づいて出力を提供するように構成されてもよい。
プロセッサ(単数または複数)1710は、複数のエッジデバイスからエッジデバイスによって起動されるモデルリフレッシュ事象について、図4に示されるように、エッジデバイスに対する第1の相関関係に基づいてモデルリフレッシュを適用するために、複数のエッジデバイスのうちの1つ以上を選択し、複数のエッジデバイスのうちの1つ以上の間の第2の相関関係に基づいて、複数のグループにグループ化し、複数のグループのそれぞれに適用するモデルを選択するように構成することができる。
プロセッサ(単数または複数)1710は、複数のエッジデバイスの1つ以上から第1のデータを取り込み、複数のエッジデバイスの残りの1つ以上から第2のデータを取り込み、第1のデータは、複数のエッジデバイスの1つ以上に関連付けられた第1の静的デバイス情報および/または第1のプロセス情報を含み、第2のデータは、複数のエッジデバイスの残りの1つ以上に関連付けられた第2の静的デバイス情報および/または第2のプロセス情報を含み、図6に示すように、第1のデータおよび第2のデータから、複数のエッジデバイスのうちの1つ以上と複数のエッジデバイスのうちの残りの1つ以上との間の第1の相関関係を計算することにより第1の相関関係を決定するように構成されてもよい。
プロセッサ(単数または複数)1710は、図7に示されるように、静的デバイス情報からのエッジデバイスのうちの1つ以上の間の第2の相関関係、プロセス情報、および過去の主要パフォーマンス評価指標(KPI)から導出される複数のエッジデバイスの1つ以上の機械学習パフォーマンスパターンを計算することによって、第2の相関関係を決定するように構成されてもよい。
プロセッサ(単数または複数)1710は、しきい値を満たすデバイスの数を有する複数のグループのうちの第1のグループを選択し、複数のグループのうちの第1のグループから、しきい値を超える最高のグループ相関スコアを有する複数のグループのうちの第2のグループを選択し、第2のグループのそれぞれについて、図13に示されるように、第2のグループのそれぞれのエッジデバイスのそれぞれにわたって最高の平均主要パフォーマンス評価指標を有するモデルを選択することによって、複数のグループのそれぞれに適用されるモデルを選択するように構成されてもよい。
詳細な説明のうちの一部は、コンピュータ内の操作のアルゴリズムおよび記号表現に関して提示される。これらのアルゴリズム記述および記号表現は、データプロセス技術の当業者が使用することにより、当業者にそれらの技術革新の本質を伝える手段である。アルゴリズムは、所望の終了状態または結果をもたらす、定義された一連のステップである。例示の実装形態では、実行されるステップは、有形の結果を達成するための有形量の物理的操作を必要とする。
特に記載がない限り、議論から明らかなように、明細書の議論全体を通して「プロセスする」、「演算する」、「算出する」、「判定する」、「表示する」などの用語を使用する場合は、物理電子工学として表されるコンピュータシステムのレジスタおよびメモリ内のデータを演算システムのメモリ、レジスタ、または他の情報ストレージ、伝送または表示デバイス内の物理量として同様に表される他のデータに操作および変換するコンピュータシステム、または他の情報処理デバイスの動作およびプロセスを含むことができることは理解できよう。
例示の実装形態は、本明細書での操作を実行するための装置にも関連する場合もある。この装置は、必要な目的のために特別に構成することができ、あるいは1つ以上のコンピュータプログラムを選択的に起動または再構成する1つ以上の汎用コンピュータを含んでいてもよい。このようなコンピュータプログラムは、コンピュータ可読ストレージ媒体またはコンピュータ可読信号媒体などのコンピュータ可読媒体に記憶されてもよい。コンピュータ可読ストレージ媒体は、限定されるものではないが、光ディスク、磁気ディスク、読み取り専用メモリ、ランダムアクセスメモリ、ソリッドステートデバイスおよびドライブなどの有形媒体、または電子情報を記憶するのに好適な任意の他のタイプの有形または非一時的媒体を含んでいてもよい。コンピュータ可読信号媒体は、搬送波のような媒体を含んでいてもよい。本明細書で提示されるアルゴリズムおよび表示は、いかなる識別のコンピュータまたは他の装置にも本質的に関連するものではない。コンピュータプログラムは、所望の実装形態の操作を実行する命令を含む純粋なソフトウェア実装を含むことができる。
様々な汎用システムを、本明細書の実施例に従ってプログラムおよびモジュールと共に使用することができ、または所望の方法ステップを実行するためのより特化された装置を構築することが便利であると証明することができる。さらに、例示の実装形態の説明には、任意の識別のプログラミング言語を参照していない。本明細書に記載された例示の実装形態の技術を実装するために、様々なプログラミング言語を使用することができることは理解できよう。プログラミング言語の命令は、1つ以上の処理デバイス、例えば中央処理装置(CPU)、プロセッサ、またはコントローラによって実行してもよい。
当該技術分野で知られているように、上述した操作は、ハードウェア、ソフトウェア、またはソフトウェアとハードウェアのいくつかの組み合わせによって実行することができる。例示の実装形態の様々な態様は、回路および論理デバイス(ハードウェア)を使用して実装してもよく、他の態様は、プロセッサによって実行される場合、プロセッサに本出願の実装を実行する方法を実行させる、機械可読媒体(ソフトウェア)上に記憶された命令を用いて実装してもよい。さらに、本出願のいくつかの例示の実装形態は、ハードウェアのみで実行してもよく、他の例示の実装形態は、ソフトウェアでのみ実行してもよい。さらに、記載された様々な機能は、単一のユニット内で実行することができ、またはいくつかの方法でいくつかの構成要素にわたって拡散することができる。ソフトウェアによって実行される場合、方法は、コンピュータ可読媒体上に記憶された命令に基づいて、汎用コンピュータなどのプロセッサによって実行してもよい。所望であれば、命令は、圧縮されたフォーマットおよび/または暗号化されたフォーマットで媒体上に記憶することができる。
さらに、本出願のその他の実装形態は、本出願の教示内容および技術内容を考慮することによって、当業者には明らかであろう。記載された例示の実装形態の様々な態様および/または構成要素は、単独で、または任意の組み合わせで使用してもよい。本明細書および例示の実装形態は、例示に過ぎず、本出願の真の範囲と精神は、下記の特許請求の範囲によって示されるものである。
404 機械学習モデルオーケストレーションシステム
430 サーバ
420 エッジコンピュータデバイス
500 エッジデータ
510 データベース
600 ネットワークデータ
610 外部エッジデータ
611 デバイス情報
612 推論プロセスの統計情報
613 エッジデータ収集機能
711 デバイス情報データプロセッサ機能
714 デバイス相関サブプロセス
801、802 履歴主要パフォーマンス評価指標
810 過去のプロセスの主要パフォーマンス評価指標
813 時間シフト整列機能
817 デバイス相関サブプロセス
1600 ネットワーク
1601-1、1601-2、1601-3、1601-4 エッジデバイス
1602 管理装置
1700 コンピューティング環境
1705 コンピュータデバイス
1710 プロセッサ
1720 内部ストレージ
1725 I/Oインターフェース
1730 バス

Claims (17)

  1. 複数のエッジデバイスのうちの1つのエッジデバイスによって起動されたモデルリフレッシュ事象の場合、
    前記エッジデバイスとの第1の相関関係に基づいて、モデルリフレッシュを適用するために、前記複数のエッジデバイスのうちの1つ以上を選択し、
    前記複数のエッジデバイスのうちの1つ以上の間の第2の相関関係に基づいて、前記複数のエッジデバイスのうちの前記1つ以上を前記複数のグループにグループ化し、
    前記複数のグループの各々に適用されるモデルを選択する、機械学習モデル更新方法。
  2. さらに、前記第1の相関関係を判定し、
    前記第1の相関関係の判定では、
    前記複数のエッジデバイスの前記1つ以上から第1のデータと前記複数のエッジデバイスの残りの1つ以上から第2のデータとを取り込むことであって、前記第1のデータは、前記複数のエッジデバイスの前記1つ以上に関連付けられた第1の静的デバイス情報を備え、前記第2のデータは、前記複数のエッジデバイスの前記残りの1つ以上に関連付けられた第2の静的デバイス情報を含む、取り込み、
    前記第1のデータおよび前記第2のデータから、前記複数のエッジデバイスの前記1つ以上と、前記複数のエッジデバイスの前記残りの1つ以上の間の前記第1の相関関係を計算する、機械学習モデル更新請求項1に記載の方法。
  3. さらに、前記第2の相関関係を判定し、
    前記第2の相関関係を判定では、
    静的デバイス情報からの前記エッジデバイスのうちの前記1つ以上の間の前記第2の相関関係、プロセス情報、および過去の主要パフォーマンス評価指標であるKPIから導出される前記複数のエッジデバイスの前記1つ以上の機械学習パフォーマンスパターンを計算する、請求項1に記載の機械学習モデル更新方法。
  4. 前記複数のグループの各々に適用する前記モデルの選択では、
    しきい値を満たす多数のデバイスを有する前記複数のグループの1つ以上の第1のグループを選択し、
    前記複数のグループの1つ以上の前記第1のグループを、しきい値を超える最高のグループ相関スコアを有する、前記複数のグループの1つ以上の第2のグループを選択し、
    前記第2のグループの各々に対して、前記第2のグループの前記各々の中の前記エッジデバイスの各々の間で最大平均主要パフォーマンス評価指標を有するモデルを選択する、請求項1に記載の機械学習モデル更新方法。
  5. 前記モデルリフレッシュ事象は、前記エッジデバイスのモデルから現在のデータへの予測データのずれ、またはモデル変更を必要とする前記エッジデバイスへの状態変化を示す前記現在のデータ内の基準の検出とのうちの1つ以上により、複数のエッジデバイスのうちの前記エッジデバイスによって起動される、請求項1に記載の機械学習モデル更新方法。
  6. さらに、前記第1の相関関係を判定し、
    前記第1の相関関係の判定では、
    前記複数のエッジデバイスの前記1つ以上から第1のデータと前記複数のエッジデバイスの残りの1つ以上から第2のデータとを取り込み、
    前記第1のデータは、前記複数のエッジデバイスの前記1つ以上に関連付けられた第1のプロセス情報を備え、前記第2のデータは、前記複数のエッジデバイスの前記残りの1つ以上に関連付けられた第2のプロセス情報を含み、
    前記第1のデータおよび前記第2のデータから、前記複数のエッジデバイスの前記1つ以上と、前記複数のエッジデバイスの前記残りの1つ以上の間の前記第1の相関関係を計算する、請求項1に記載の機械学習モデル更新方法。
  7. コンピュータに以下の処理を実行させるコンピュータプログラムであって、
    複数のエッジデバイスのうちの1つのエッジデバイスによって起動されたモデルリフレッシュ事象の場合、
    前記エッジデバイスとの第1の相関関係に基づいて、モデルリフレッシュを適用するために、前記複数のエッジデバイスのうちの1つ以上を選択し、
    前記複数のエッジデバイスのうちの前記1つ以上の間の第2の相関関係に基づいて、前記複数のエッジデバイスのうちの前記1つ以上を複数のグループにグループ化し、
    前記複数のグループの各々に適用されるモデルを選択する、コンピュータプログラム。
  8. さらに、前記第1の相関関係を判定し、
    前記第1の相関関係の判定では、
    前記複数のエッジデバイスの前記1つ以上から第1のデータと前記複数のエッジデバイスの残りの1つ以上から第2のデータとを取り込み、
    前記第1のデータは、前記複数のエッジデバイスの前記1つ以上に関連付けられた第1の静的デバイス情報を備え、前記第2のデータは、前記複数のエッジデバイスの前記残りの1つ以上に関連付けられた第2の静的デバイス情報を含み、
    前記第1のデータおよび前記第2のデータから、前記複数のエッジデバイスの前記1つ以上と、前記複数のエッジデバイスの前記残りの1つ以上の間の前記第1の相関関係を計算する、請求項7に記載のコンピュータプログラム。
  9. さらに、前記第2の相関関係を判定し、
    前記第2の相関関係の判定では、
    静的デバイス情報からの前記エッジデバイスのうちの前記1つ以上の間の前記第2の相関関係、プロセス情報、および過去の主要パフォーマンス評価指標であるKPIから導出される前記複数のエッジデバイスの前記1つ以上の機械学習パフォーマンスパターンを計算する、請求項7に記載のコンピュータプログラム。
  10. 前記複数のグループの各々に適用する前記モデルの選択では、
    しきい値を満たす多数のデバイスを有する前記複数のグループの1つ以上の第1のグループを選択し、
    前記複数のグループの1つ以上の前記第1のグループから、しきい値を超える最高のグループ相関スコアを有する、前記複数のグループの1つ以上の第2のグループを選択し、
    前記第2のグループの各々に対して、前記第2のグループの前記各々の中の前記エッジデバイスの各々の間で最大平均主要パフォーマンス評価指標を有するモデルを選択する、請求項7に記載のコンピュータプログラム。
  11. 前記モデルリフレッシュ事象は、前記エッジデバイスのモデルから現在のデータへの予測データのずれ、またはモデル変更を必要とする前記エッジデバイスへの状態変化を示す前記現在のデータ内の基準の検出とのうちの1つ以上により、複数のエッジデバイスのうちの前記エッジデバイスによって起動される、請求項7に記載のコンピュータプログラム。
  12. さらに、前記第1の相関関係を判定し、
    前記第1の相関関係の判定では、
    前記複数のエッジデバイスの前記1つ以上から第1のデータと前記複数のエッジデバイスの残りの1つ以上から第2のデータとを取り込み、
    前記第1のデータは、前記複数のエッジデバイスの前記1つ以上に関連付けられた第1のプロセス情報を備え、前記第2のデータは、前記複数のエッジデバイスの前記残りの1つ以上に関連付けられた第2のプロセス情報を含み、
    前記第1のデータおよび前記第2のデータから、前記複数のエッジデバイスの前記1つ以上と、前記複数のエッジデバイスの前記残りの1つ以上の間の前記第1の相関関係を計算する、請求項7に記載のコンピュータプログラム。
  13. 複数のエッジデバイスを管理するように構成された管理装置であって、
    複数のエッジデバイスのうちの1つのエッジデバイスによって起動されたモデルリフレッシュ事象の場合、
    前記エッジデバイスとの第1の相関関係に基づいて、モデルリフレッシュを適用するために、前記複数のエッジデバイスのうちの1つ以上を選択し、
    前記複数のエッジデバイスのうちの前記1つ以上の間の第2の相関関係に基づいて、前記複数のエッジデバイスのうちの前記1つ以上を複数のグループにグループ化し、
    前記複数のグループの各々に適用されるモデルを選択するように構成されたプロセッサを含む、管理装置。
  14. 前記プロセッサが、前記第1の相関関係を、
    前記複数のエッジデバイスの前記1つ以上から第1のデータと前記複数のエッジデバイスの残りの1つ以上から第2のデータとを取り込み、
    前記第1のデータは、前記複数のエッジデバイスの前記1つ以上に関連付けられた第1の静的デバイス情報を備え、前記第2のデータは、前記複数のエッジデバイスの前記残りの1つ以上に関連付けられた第2の静的デバイス情報を含み、
    前記第1のデータおよび前記第2のデータから、前記複数のエッジデバイスの前記1つ以上と、前記複数のエッジデバイスの前記残りの1つ以上の間の前記第1の相関関係を計算することと、によって、判定する、請求項13に記載の管理装置。
  15. 前記プロセッサが、前記第2の相関関係を、
    静的デバイス情報からの前記エッジデバイスのうちの前記1つ以上の間の前記第2の相関関係、プロセス情報、および過去の主要パフォーマンス指標であるKPIから導出される前記複数のエッジデバイスの前記1つ以上の機械学習パフォーマンスパターンを計算することによって判定する、請求項13に記載の管理装置。
  16. 前記プロセッサは、前記複数のグループの各々に適用される前記モデルを、
    しきい値を満たす多数のデバイスを有する前記複数のグループの1つ以上の第1のグループを選択し、
    前記複数のグループの1つ以上の前記第1のグループから、しきい値を超える最高のグループ相関スコアを有する、前記複数のグループの1つ以上の第2のグループを選択し、
    前記第2のグループの各々に対して、前記第2のグループの前記各々の中の前記エッジデバイスの各々の間で最大平均主要パフォーマンス評価指標を有するモデルを選択することによって、選択する、請求項13に記載の管理装置。
  17. 前記プロセッサが、前記第1の相関関係を、
    前記複数のエッジデバイスの前記1つ以上から第1のデータと前記複数のエッジデバイスの残りの1つ以上から第2のデータとを取り込み、
    前記第1のデータは、前記複数のエッジデバイスの前記1つ以上に関連付けられた第1のプロセス情報を備え、前記第2のデータは、前記複数のエッジデバイスの前記残りの1つ以上に関連付けられた第2のプロセス情報を含み、
    前記第1のデータおよび前記第2のデータから、前記複数のエッジデバイスの前記1つ以上と、前記複数のエッジデバイスの前記残りの1つ以上の間の前記第1の相関関係を計算することによって判定する、請求項13に記載の管理装置。
JP2021203911A 2021-02-26 2021-12-16 機械学習モデル更新方法、コンピュータプログラムおよび管理装置 Active JP7339321B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/187,432 US20220277231A1 (en) 2021-02-26 2021-02-26 System to invoke update of machine learning models on edge computers
US17/187,432 2021-02-26

Publications (2)

Publication Number Publication Date
JP2022132078A true JP2022132078A (ja) 2022-09-07
JP7339321B2 JP7339321B2 (ja) 2023-09-05

Family

ID=80113358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021203911A Active JP7339321B2 (ja) 2021-02-26 2021-12-16 機械学習モデル更新方法、コンピュータプログラムおよび管理装置

Country Status (3)

Country Link
US (1) US20220277231A1 (ja)
EP (1) EP4050529A1 (ja)
JP (1) JP7339321B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11620162B2 (en) * 2021-05-24 2023-04-04 Capital One Services, Llc Resource allocation optimization for multi-dimensional machine learning environments

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107018184A (zh) * 2017-03-28 2017-08-04 华中科技大学 分布式深度神经网络集群分组同步优化方法及系统
WO2019215779A1 (ja) * 2018-05-07 2019-11-14 日本電気株式会社 モデル提供システム、方法およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11720813B2 (en) * 2017-09-29 2023-08-08 Oracle International Corporation Machine learning platform for dynamic model selection
US20190156246A1 (en) * 2017-11-21 2019-05-23 Amazon Technologies, Inc. Generating and deploying packages for machine learning at edge devices
US11616839B2 (en) * 2019-04-09 2023-03-28 Johnson Controls Tyco IP Holdings LLP Intelligent edge computing platform with machine learning capability

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107018184A (zh) * 2017-03-28 2017-08-04 华中科技大学 分布式深度神经网络集群分组同步优化方法及系统
WO2019215779A1 (ja) * 2018-05-07 2019-11-14 日本電気株式会社 モデル提供システム、方法およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
緒方 祐次: "エッジインテグレーション技術に関する検討", 電気学会研究会資料, vol. 通信研究会, JPN6023001080, 30 January 2020 (2020-01-30), JP, pages 41 - 44, ISSN: 0005082597 *

Also Published As

Publication number Publication date
EP4050529A1 (en) 2022-08-31
US20220277231A1 (en) 2022-09-01
JP7339321B2 (ja) 2023-09-05

Similar Documents

Publication Publication Date Title
US11477202B2 (en) System and method for detecting unknown IoT device types by monitoring their behavior
US11151014B2 (en) System operational analytics using additional features for health score computation
US10055275B2 (en) Apparatus and method of leveraging semi-supervised machine learning principals to perform root cause analysis and derivation for remediation of issues in a computer environment
US20220086071A1 (en) A network device classification apparatus and process
US11410061B2 (en) Dynamic anomaly reporting
US9860109B2 (en) Automatic alert generation
KR102087959B1 (ko) 통신망의 인공지능 운용 시스템 및 이의 동작 방법
US11711714B2 (en) Systems and methods for client device roaming in a wireless network to provide lossless video transmission services
US10942801B2 (en) Application performance management system with collective learning
US11500370B2 (en) System for predictive maintenance using generative adversarial networks for failure prediction
WO2021114816A1 (zh) 基于机器人操作系统的消息处理方法、装置及计算机设备
US20210110282A1 (en) Dynamic configuration of anomaly detection
US20230205516A1 (en) Software change analysis and automated remediation
US11392821B2 (en) Detecting behavior patterns utilizing machine learning model trained with multi-modal time series analysis of diagnostic data
JP7339321B2 (ja) 機械学習モデル更新方法、コンピュータプログラムおよび管理装置
US11153183B2 (en) Compacted messaging for application performance management system
US20160364281A1 (en) Application performance management system with dynamic discovery and extension
US20180052728A1 (en) Root cause candidate determination in multiple process systems
US10817396B2 (en) Recognition of operational elements by fingerprint in an application performance management system
Kalibhat et al. Software troubleshooting using machine learning
CN111258845A (zh) 事件风暴的检测
CN113656207B (zh) 故障处理方法、装置、电子设备和介质
EP4303730A1 (en) Computer-implemented method for automatically detecting anomalies in a cloud infrastructure comprising microservices
JP7401747B2 (ja) 類別プログラム、類別装置及び類別方法
US20240104580A1 (en) Service level agreement management and breach detection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230824

R150 Certificate of patent or registration of utility model

Ref document number: 7339321

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150