JP2023537766A

JP2023537766A - 自動化されたデータサイエンスプロセスのためのシステム及び方法

Info

Publication number: JP2023537766A
Application number: JP2023510484A
Authority: JP
Inventors: ヨンシャンザン，; ウェイリン，; ウィリアムシュマルゾ，
Original assignee: ヒタチヴァンタラエルエルシー
Priority date: 2020-08-20
Filing date: 2020-08-20
Publication date: 2023-09-05
Also published as: EP4214584A1; WO2022039748A1; US20230289623A1; CN115968479A; EP4214584A4

Abstract

本明細書で説明される例示的な実施形態は、自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのためのシステム及び方法であって、本システム及び方法が、第１のシステムにおけるオフライン学習プロセスを通して予測モデル及び処方モデルを生成することと、予測モデル及び処方モデルを第２のシステムにデプロイすることを通して第２のシステムの動作を制御することと、処方モデル及び予測モデルが第２のシステムにデプロイされた状態で、オンライン学習プロセスを通した第２のシステムからのフィードバックから予測モデル及び処方モデルを自律的に更新することを含み得る、システム及び方法を対象とする。

Description

本開示は、一般に、データサイエンス技法に関し、より詳細には、データサイエンスプロセス及び自動化された機械学習（ＡｕｔｏＭＬ）に関する。

従来技術では、データサイエンスプロセスは、分析ソリューション及びインテリジェントアプリケーションを効率的且つ効果的に提供するための方法論を定義する。自動化された機械学習（ＡｕｔｏＭＬ）は、与えられたデータに対して自動的にモデルを構築することができるフレームワークのシステムであり、これにより、ＭＬパイプラインにおいて最大数のステップが自動化され、人間の労力が最小限となり、モデル性能が向上する。

従来技術の実装形態には、予測コンポーネントを含むＡｕｔｏＭＬフレームワークが存在する。従来技術のＡｕｔｏＭＬフレームワークは、特定のＭＬ実装形態に特化し、一般にカスタマイズ可能ではない静的な実装形態を含む。更に、そのような従来技術の実装形態は、自動化されたデータサイエンスプロセスを利用していない。

従来技術の実装形態は、記述的及び探索的分析を支援するためのコンポーネント、処方的、自動化、又は自律的学習コンポーネントを持たない。本明細書で説明される例示的な実装形態は、自動化されたデータサイエンスプロセスを提供するように構成された、統合され高度にカスタマイズ可能且つ拡張可能なフレームワークを通して、予測コンポーネントに加えてこれらのコンポーネントを支援することを対象とする。

従来のデータサイエンスプロセスはいくつかの課題を有する。第１に、従来のデータサイエンスプロセスは、価値主導型タスクをサポートするには十分に包括的ではない。具体的にどのように価値を推進するかをデータサイエンスの専門家が理解できるようにする包括的なプロセスが求められている。第２に、従来のデータサイエンスプロセスでは、オフラインプロセスのみに主眼が置かれている。従来技術では、オンラインのデータサイエンスプロセスは提案されておらず、オフラインプロセスとオンラインプロセスとの両方を組み合わせたデータサイエンスプロセスも存在しない。オフラインプロセスとオンラインプロセスとの両方をサポートするデータサイエンスプロセスが求められている。オンラインプロセスは、動的システムにおけるリアルタイムデータに基づいて最良適合モデルを得るための自動化及び自律学習を支援することから、実世界のシステムにおいて重要な場合がある。更に、従来のデータサイエンスプロセスでは、人間がかなりの量の手作業を行う必要がある。データサイエンスプロセスにおけるタスクを自動的に行うシステムが求められている。

ＡｕｔｏＭＬフレームワークの従来技術の実装形態はいくつかの欠陥を有する。第１に、従来技術のＡｕｔｏＭＬフレームワークは、データサイエンスタスクの「予測」の側面のみを扱う一方、データサイエンスプロセスの他のコンポーネントにおける一般的な作業は自動化されていない。データサイエンスプロセスにおける一般的な作業を自動化するシステムが求められている。

従来技術の実装形態では、各ＡｕｔｏＭＬライブラリは、１つの基礎となる機械学習ライブラリしかサポートしない。様々な機械学習ライブラリをサポートする統合された拡張可能なシステムを支援することが求められている。

上記の求めに対処するために、本明細書で説明される例示的な実装形態は、記述的、探索的、予測的、処方的、自動化、且つ自律的であると共に、価値主導型タスクをサポートするように構成された包括的なデータサイエンスシステムを含む。このプロセスはオフラインプロセスとオンラインプロセスとを含み、オフラインプロセスとオンラインプロセスとは全体で１つのシステムとしてシームレスに統合される。

本明細書で説明される例示的な実装形態では、過去のデータに対するすべてのデータサイエンスタスクのための方法論及びワークフローを定義するオフラインプロセスが存在する。このプロセスは、システムの記述的、探索的、予測的、且つ処方的な側面を支援する最初の４つのコンポーネントに対応する。

本明細書で説明される例示的な実装形態では、リアルタイムデータに対するすべてのデータサイエンスタスクのための方法論及びワークフローを定義するオンラインプロセスが存在する。このプロセスは、システムの予測的、処方的、自動化、自律的な側面を支援する最後の４つのコンポーネントに対応する。

本明細書で説明される例示的な実装形態では、ＡｕｔｏＭＬがプロセスの各ステップに適用されて手作業を減らし、アウトカムを最適化するデータサイエンスプロセスのための自動化されたシステムが存在する。統合されたカスタマイズ可能且つ拡張可能なフレームワークが、システムをサポートするために導入され提供される。

本開示の態様は、自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのための方法であって、本方法が、第１のシステムにおけるオフライン学習プロセスを通して予測モデル及び処方モデルを生成することと、予測モデル及び処方モデルを第２のシステムにデプロイすることを通して第２のシステムの動作を制御することと、処方モデル及び予測モデルが第２のシステムにデプロイされた状態で、オンライン学習プロセスを通した第２のシステムからのフィードバックから処方モデル及び予測モデルを自律的に更新することを含む、方法を含み得る。

本開示の態様は、自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのためのシステムであって、本システムが、第１のシステムにおけるオフライン学習プロセスを通して予測モデル及び処方モデルを生成するための手段と、予測モデル及び処方モデルを第２のシステムにデプロイすることを通して第２のシステムの動作を制御するための手段と、処方モデル及び予測モデルが第２のシステムにデプロイされた状態で、オンライン学習プロセスを通した第２のシステムからのフィードバックから処方モデル及び予測モデルを自律的に更新するための手段を含む、システムを含み得る。

本開示の態様は、自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのための命令を記憶する非一時的コンピュータ可読媒体であって、本命令が、第１のシステムにおけるオフライン学習プロセスを通して予測モデル及び処方モデルを生成することと、予測モデル及び処方モデルを第２のシステムにデプロイすることを通して第２のシステムの動作を制御することと、処方モデル及び予測モデルが第２のシステムにデプロイされた状態で、オンライン学習プロセスを通した第２のシステムからのフィードバックから処方モデル及び予測モデルを自律的に更新することを含む、非一時的コンピュータ可読媒体を含み得る。

本開示の態様は、自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのためのシステムであって、本システムが、オフライン学習プロセスを通して予測モデル及び処方モデルを生成し、予測モデル及び処方モデルを第２のシステムにデプロイすることを通して第２のシステムの動作を制御し、処方モデル及び予測モデルが第２のシステムにデプロイされた状態で、オンライン学習プロセスを通した第２のシステムからのフィードバックから処方モデル及び予測モデルを自律的に更新するように構成されたプロセッサを備えた第１のシステムを備える、システムを含み得る。

例示的な実装形態による、オフラインプロセスとオンラインプロセスとの両方のための自動化されたシステムの一例を示す。

例示的な実装形態による、オフラインプロセスの例示的なフローを示す。

例示的な実装形態による、オフラインシステムと統合された場合のオンラインシステムの例示的なワークフローを示す。

例示的な実装形態による、自動化された適応型コホート学習の一例を示す。

例示的な実装形態によるソリューション構成ファイルの一例を示す。

例示的な実装形態による、自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのための例示的なフロー図を示す。例示的な実装形態による、自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのための例示的なフロー図を示す。

例示的な実装形態による、複数のシステムと管理装置とを示す。

いくつかの例示的な実施形態で使用するのに適した例示的なコンピュータデバイスを含む例示的なコンピューティング環境を示す。

以下の詳細な説明は、本出願の図面及び例示的な実装形態の詳細を提供する。明確にするために、図面間で重複する要素の参照符号及び説明は省略される。説明全体を通して使用される用語は、例として提示されるものであり、限定することを意図されたものではない。例えば「自動」という用語の使用は、本出願の実装形態を実施する当業者の所望の実装形態に応じて、実装形態の特定の態様に対するユーザ又は管理者の制御を含む全自動又は半自動の実装形態を含み得る。選択は、ユーザインターフェース又は他の入力手段を介してユーザによって実施されてもよいし、所望のアルゴリズムを介して実装されてもよい。本明細書で説明される例示的な実装形態は、単独で又は組み合わせて利用することができ、例示的な実装形態の機能は、望ましい実装形態にしたがって任意の手段を介して実装されてもよい。

本明細書で説明される例示的な実装形態は、記述コンポーネント、探索コンポーネント、予測コンポーネント、処方コンポーネント、自動化コンポーネント、及び自律コンポーネントを含む、ビジネス価値の推進を助ける包括的なデータサイエンスプロセスを支援するシステムを対象とする。

記述コンポーネントは、ビジネス上の問題、データ、及び技術の理解及び評価を対象とする。記述ステップは、データ統計、辞書、ダッシュボード、及びレポートの使用を通して、優先順位付け、実現可能性、投資利益率、及び実行可能なビジネスユースケースを提供する。記述ステップは、システムの成功を測る主要業績指標／メトリクスを特定するケース価値決定を利用する。記述ステップは、技術、データ、及び分析の実現可能性、並びにリスクを更に評価し、孤立した分析を避けるためにバリューチェーンを利用しながらのデータの理解及びサニティチェックを更に含む。

探索コンポーネントは、仮説の構築及び立案、データ探索（例えば、相関分析、外れ値分析、トレンド、中心性、季節性分析など）、データ可視化の構築、実例分析、データエンジニアリング（例えば、統合、正規化）、並びにより良い予測因子として使用され得る変数の特定を通した探索的データ分析及びデータエンジニアリングを含む。

予測コンポーネントは、記述コンポーネント及び探索コンポーネントから学習した知識に基づいて予測モデルを構築することを対象とする。予測コンポーネントは、統計的学習及び機械学習を用いた分析（因果関係の体系化）、「適合度」指標、データに埋め込まれたパターン／関係の体系化、データエンリッチメント、特徴量エンジニアリング、アセット及び物理挙動モデルの作成、並びに教師あり／教師なし／強化機械学習を含み得る。

処方コンポーネントは、予測コンポーネントからの予測に応じて処方的な実行可能なレコメンデーションを生成することを対象とし、根本原因分析、説明可能な人工知能（ＡＩ）、実行可能なレコメンデーションの生成、アセット及び物理挙動モデルのマイニング及び組み込み、決定有効性の測定、並びに制約ベースの最適化の実施を含み得る。

自動化コンポーネントは、動作環境又はシステムと統合すること、及び動作環境又は制御システムへの処方アクションの適用を自動化することに重点を置く。自動化コンポーネントは、モデルのデプロイ及び実行、モデルのライフサイクル管理、動作環境又は制御システムへの処方アクションの適用の自動化、スマート製品又はデバイス、インテリジェントアプリケーション、並びに決定有効性を含み得る。プログラマブルロジックコントローラ（ＰＬＣ）、ロボット、可変周波数駆動装置（ＶＦＤ）、スマート製品又はデバイス、センサなどを含む自動化ハードウェアコンポーネントは、処方アクションの適用を自動化することなどの自動化タスクをサポートするようにプログラムされ得る。自動化コンポーネントは、限定されるものではないが、生産性、スループット、及び収益の向上、製品品質の改善、健康及び安全の強化、光熱費／エネルギーコストの削減、産業システムのダウンタイムの短縮、並びにシステムの故障の診断時間の短縮及び保守／修理のコスト削減を含むいくつかの利益を促進し得る。

自律コンポーネントは、新しいデータ及びフィードバックに基づく継続的学習に重点を置き、強化学習、転移学習、自動学習（例えば、知識ストア、知識グラフ、ユーザ行動など）、複数のサブシステム（又はドメイン）を通したコホート学習、並びに新しいデータ／証拠及び／又は誤差／フィードバックに基づく継続的学習の自動化を含み得る。自動化コンポーネント及び自律コンポーネントは一緒に統合されて、処方アクションの適用の自動化をサポートし、新しいデータ、誤差、及びフィードバックを取得し、予測モデル及び処方モデルを再訓練し、自律学習の能力を活用することによってより効率的且つ効果的に作業するようにシステムを制御することに関する処方アクションに関して知的決定を行う。このことは、システムの自動化をサポートするためにルールベースのモデル又はアルゴリズムが人間によって設計及び保守される従来技術の自動化システムとは対照的である。

システムの多くのタスクは異なるデータサイエンスタスク間で汎用的であるため、本明細書で説明される例示的な実装形態は、開発時間を短縮し、ソリューションの性能を改善するために、各コンポーネントの汎用コンポーネントをＡｕｔｏＭＬ技法により自動化する。

図１（ａ）は、例示的な実装形態による、オフラインプロセスとオンラインプロセスとの両方のための自動化されたシステムの一例を示している。図１（ａ）の例示的な実装形態では、自動化され得る汎用コンテンツの例示的なサブセットが示されている。

図１（ａ）の例では、オフラインシステムは、記述コンポーネント１００と、探索コンポーネント１１０と、予測コンポーネント１２０と、処方コンポーネント１３０とを含む。オフラインシステムは、オフラインデータ又は過去のデータに対して稼働する。オフラインシステムからの出力は、記述コンポーネント１００及び探索コンポーネント１１０からのデータ分析結果、予測コンポーネント１２０からの予測モデル、並びに処方コンポーネント１３０からの処方モデルを含む。

記述コンポーネント１００は、入力として問題及びデータセットが提供されると、出力として記述分析１０１（例えば、データサニティチェック、統計など）を提供するように構成される。探索コンポーネント１１０は、与えられたデータセットが分析を実施するのに十分な品質である場合、与えられたデータセットの探索的分析１１１（例えば、相関、外れ値など）を提供するように構成される。予測コンポーネント１２０は、探索的分析が予測モデルを構築するのに十分な品質である場合、探索的分析に基づいて予測モデルを構築するように構成される。十分な品質ではない場合、十分な品質が達成されるまで、更なる記述分析又は探索的分析が実施され得る。予測コンポーネント１２０は、予測モデリングのための多くの活動を実施することができ、ソリューション初期化１２１、ソリューション選択１２２、ハイパーパラメータの最適化１２３、及び後処理１２４を含む。処方コンポーネント１３０は、予測モデルに基づいて処方モデル１３１（例えば、根本原因分析、レコメンデーション、説明可能なＡＩなど）を構築するように構成される。予測モデルが処方モデルを構築するのに十分な品質ではない場合、予測モデルは予測コンポーネント１２０によって再構築され得る。

オンラインシステムの一例では、オンラインシステムは、オンラインデータ又はリアルタイムデータを入力として取り込むように構成される。オンラインシステムからの出力は、予測、実行可能なレコメンデーション、制御システム又は機械システムへの制御信号、及び継続的に学習されたモデルを含む。オンラインシステムの例示的な実装形態では、予測コンポーネント１２０は、オフラインシステムからのモデルをオンラインシステムにデプロイして、リアルタイムデータの入力に基づいて予測を実施するように構成される。処方コンポーネント１３０は、予測コンポーネント１２０から提供された予測に基づいて、処方モデルから処方アクションを生成するように構成される。

自動化コンポーネント１４０は、制御システムに処方アクションを自動的に適用し、基礎となる機械／アセットの動作を変更するように構成される。自動化コンポーネント１４０は、デバイス／機器／プロセス／モデルの統合及びデプロイ１４１、並びにＤｅｖＯｐｓ改善及びレコメンドされたアクションの適用の自動化１４２を含み得る。

自律コンポーネント１５０は、観測されたインシデント及びアクションアイテムに対して関連する処方アクションと共に予測を比較することに基づいて誤差及び／又はフィードバックを求めるように構成される。リアルタイムデータ及び現在のバージョンのモデルを用いて、情報は、予測モデル及び処方モデルを再訓練して改善するために利用される。再訓練されたモデルは、予約されたテストデータに対して評価される。再訓練されたモデルは、より良好な性能を有する場合には再訓練されたモデルがオンラインシステムにデプロイされ、より良好な性能を持たない場合には現在の現行バージョンのモデルが留まる。自律コンポーネント１５０は、自己学習（例えば、強化学習）１５１、継続的学習１５２、転移学習１５３、及びコホート学習１５４を含み得る。

図１（ｂ）は、例示的な実装形態による、オフラインプロセスの例示的なフローを示している。最初に、図１（ａ）に示すように、記述コンポーネント１００が呼び出される。１０００において、データが記述分析を支援するのに十分であるか否かの判定が行われる。十分である場合（はいの場合）、フローは、図１（ａ）に示すように探索コンポーネント１１０に進んで探索分析を決定し、十分ではない場合（いいえの場合）、フローは、１０１０に進んでシステムに更なるデータを要求する。

１００１において、記述分析及び探索的分析がモデルを構築するのに十分な品質であるか否かの判定が行われる。十分な品質である場合（はいの場合）、フローは、予測コンポーネント１２０に進んで探索的分析及び予測分析から予測モデルを生成する。十分な品質ではない（いいえの場合）、フローは、１０１０に戻って分析を実施するために更なるデータを取得する。

１００２において、予測コンポーネント１２０によって生成された予測モデルが過去のデータに対して十分な精度を有するか否かの判定が行われる。十分な精度を有する場合（はいの場合）、フローは、処方コンポーネント１３０に進んで処方モデルを生成する。十分な精度を持たない場合（いいえの場合）、フローは、探索コンポーネント１１０に戻って更なる探索的分析を生成する。

１００３において、処方コンポーネント１３０によって生成された処方モデルが十分な精度を有するか否かの判定が行われる。十分な精度を有する場合（はいの場合）、フローは終了し、予測モデル及び処方モデルが基礎となるシステムにオンラインでデプロイされるとオンラインシステムが呼び出される。十分な精度を持たない場合（いいえの場合）、フローは、予測コンポーネント１２０に戻って予測モデルを再生成する。

図２は、例示的な実装形態による、オフラインシステムと統合された場合のオンラインシステムの例示的なワークフローを示している。図２に示すように、オンラインシステムは、オンラインデータ（又はリアルタイムデータ）に対して予測モデル及び処方モデルを適用するように稼働して、予測及び実行可能なレコメンデーションを生成し、制御システムにレコメンデーションを自動的に適用し、新しいデータ、誤差、及びフィードバックに基づいて継続的に自己学習する。ワークフローの一例は以下のとおりである。

最初に、オフラインシステム２１０は、オンラインシステムのための予測モデル及び処方モデルを生成して提供するように構成され、その後、予測モデル及び処方モデルは、２１１においてオンラインシステムにデプロイされる。２１２において、モデルは、リアルタイムデータ２２０に対して予測２２１を実施するようにオンラインシステムで実行される。また、処方アクション２３１が予測２２１に基づいて処方モデルから生成され、制御システム２３０に自動的に適用される。次いで、制御システム／ＤｅｖＯｐｓ２３０は、アセット及び機械の働き方の構成を変更することによって処方アクションに応答し、それによってセンサから収集されたリアルタイムデータに影響を与える。

リアルタイムで、予測２２１と２２０における観測された値とを比較することによって誤差が自動的に生成される。予測アクション及び処方アクションに関するフィードバックも操作者のログを解析することにより自動的に生成され得る。誤差、フィードバック、及び新しいデータは、自律学習２００を通して予測モデル及び処方モデルの両方を再訓練するために組み合わされる。

望ましい実装形態にしたがって、継続的学習、転移学習、強化学習、微調整技法、ブーストなどを含む、自律学習２００のためのいくつかの技法が使用され得る。望ましい実装形態によっては、継続的学習が、リアルタイムで、又は予め定義されたスケジュールに基づいてなされ得る。再訓練されたモデルは、予約されたテストデータに対して評価され、モデルは、より良好な性能を有する場合には２１１においてオンラインシステムにデプロイされ、より良好な性能を持たない場合には現在のバージョンのモデルがオンラインシステムに留まる。

別の例示的な実装形態では、再訓練されたモデルが既存モデルと並行してオンラインシステムにデプロイされ得る。既存のモデルと再訓練されたモデルとの両方がリアルタイムデータに対して稼働されて、予め定義された期間の予測及び処方アクションが生成される。しかしながら、予め定義された期間では、既存モデルから生成された予測及び処方アクションのみが有効になる。予め定義された期間が終了すると、既存モデルと再訓練されたモデルとが、予め定義された期間の予測及び処方アクションに基づいて評価されて比較され、より良好な性能を有するモデルがオンラインシステムに残されて有効になる。

例示的な実装形態を通して、オンラインシステムは、基礎となる産業システムのリアルタイムな状況に基づいて、リアルタイムで「最良適合」ソリューションを求めようと試みる。モデル自身によって分析されるメトリクス及び目的は、基礎となる産業システムに基づいて望ましい実装形態にしたがって構成され得る。

図２に示すように、モデルは、構築されると、物理ランタイム環境にデプロイされる。物理ランタイム環境（例えば、顧客環境）へのアクセスは難しく、コストがかかり得る。そのような問題に対処するために、例示的な実装形態は、物理ランタイム環境に容易にデプロイされ得るモデルを含むパッケージを含む。

そのような例示的な実装形態を実現するために、モデルファイルが標準的なフォーマットでレンダリングされ、モデルファイルのパッケージが、モデルをデプロイ及び実行できるように任意の物理ランタイム環境にも移植可能であるように作られる。最初の課題を解決するために、例示的な実装形態は、モデルファイルに標準的なｐｉｃｋｌｅファイル形式を使用し、モデルのライフサイクルを管理するためにＭＬＦｌｏｗを使用する。２つ目の課題を解決するために、例示的な実装形態は、（モデルファイルを含む）ＭＬＦｌｏｗパッケージをＤｏｃｋｅｒイメージにパッケージ化し、これは、ＭＬＦｌｏｗパッケージを含む仮想ランタイム環境であり、物理ランタイム環境ファシリティに加えて稼働し得る。

機械学習のライフサイクル管理は、モデルの構築、モデルのデプロイ、モデルのバージョン管理などを含む、モデルのライフサイクルを管理する効率的な仕方である。本明細書で説明される例示的な実装形態では、提供されたモデルのフォーマットを標準化し、異なる実行環境で使用可能にすることに更に重点を置いている。本明細書における例示的な実装形態では、１つの実装形態は、モデルファイルにｐｉｃｋｌｅファイル形式を用い、これをＭＬＦｌｏｗパッケージにパッケージ化することであり、ＭＬＦｌｏｗは既存のモデルライフサイクル管理ツールである。モデルバージョニングはモデル性能に基づいて行われ、新しいモデルが構築されると、新しいモデルは、メトリクスに基づいて予約されたテストデータに対して評価される。評価結果が良好である場合（そして既存モデルよりも優れている場合）、新しいモデルは保持され、そうでなければ破棄される。再訓練されたモデルを選択する別の例示的な実装形態については、［００４７］で説明している。

自律学習は、変化する不確実な世界において、人間の支援又は監督を受けることなく機械（又は他の学習器）が自ら学習及び分析することを促進する人工知能（ＡＩ）手法である。自律学習を用いることにより、学習器が自律的に自らの学習プロセスを担う。自律学習は、自主学習とも呼ばれる。

例示的な実装形態では、動的であり時間と共に変化する物理ランタイム環境にモデルがデプロイされた後、モデルは、人間の支援又は監督を受けることなく、図２に示すように、物理ランタイム環境において収集された新しいリアルタイムデータ、誤差、及びフィードバックに基づいて自動的にモデルが調整及び改善される。この目的のために、強化学習、継続的学習、転移学習、コホート学習などを含む、いくつかの技法が使用され得る。

強化学習は、不確実で潜在的に複雑な環境において、試行錯誤的に累積報酬の概念を最大化するために、ソフトウェアエージェントがどのようにアクションを起こすべきかに関係する機械学習の領域である。強化学習は、ランダムな試行によって開始され、ゴールを達成するための複雑な戦術により終了する。

本明細書で説明される例示的な実装形態では、強化学習は、デプロイされたオフラインモデルから始まり（これはランダムな試行よりも優れる）、予測を作成し、処方アクションを生成する。処方アクションの適用により、収集されるデータを含む物理ランタイム環境の挙動が変化する。新しいデータ、モデル誤差、及びフィードバック、並びに問題のターゲットが収集され、次の処方アクションを計算するために使用される。ディープＱネットワーク（ＤｅｅｐＱＮｅｔｗｏｒｋ、ＤＱＮ）、深層決定論的方策勾配法（ＤｅｅｐＤｅｔｅｒｍｉｎｉｓｔｉｃＰｏｌｉｃｙＧｒａｄｉｅｎｔ、ＤＤＰＧ）、近傍方策最適化（ＰｒｏｘｉｍａｌＰｏｌｉｃｙＯｐｔｉｍｉｚａｔｉｏｎ、ＰＰＯ）、双生遅延深層決定論的方策勾配法（ＴｗｉｎＤｅｌａｙｅｄＤｅｅｐＤｅｔｅｒｍｉｎｉｓｔｉｃＰｏｌｉｃｙＧｒａｄｉｅｎｔ、ＴＤ３）などを含む、いくつかの最先端技法が望ましい実装形態にしたがって使用され得る。

強化学習モデリングにおける様々な要素を説明するために１つの例を提供する。１つの例では、プラントからの生産量を最適化するためのモデルが構築される。オフラインモデルを構築するために、プラントの生産量に対する主要な因子が決定されて特徴量として使用され、生産量は目標として使用されて、教師あり回帰モデルを構築する。オフラインモデルが構築されると、オフラインモデルはオンラインシステムにデプロイされ得る。ここで、以下のように、生産量を最適化するためにオフラインモデルに加えて強化学習が使用される。

「状態」：状態は、学習エージェントが環境から受け取る観測値を定義する。この例では、センサの読み値、運転パラメータ、及び現在の生産量を含むのが現在のプラントの状態である。

「方策」：方策は、学習エージェントが環境の現在の状態における所与の時点でどのように振る舞うかを定義する。この例では、方策は、プラントの知覚された現在の状態から生産量を最適化するために取られるべきアクションへのマッピングを定義する。

「報酬」：報酬は、強化学習問題のゴールを定義する。この例では、報酬は「プラントの生産量」である。報酬は、即時的な意味でアクションのアウトカムを示し、各アクションが直ちに報酬につながる。

「価値関数」：ある状態の価値は、その状態から学習エージェントが得ることを期待し得る報酬の総計である。この例では、ある状態から一定期間、例えば１ヶ月間のプラントの総生産量である。価値関数は、長期的に見た場合の報酬を定義する。

オフラインモデルとオンラインモデルとでは使用される機械学習技法が異なり得ることに留意されたい。この例では、オフラインモデルは教師あり学習技法に基づく一方、オンラインモデルは強化学習技法に基づく。

継続的学習は、システムで新たに収集されたデータを用いて、同一の問題に対して既存のモデルを段階的且つ継続的に改善することを促進する機械学習技法である。例示的な実装形態では、オフラインシステムからモデルが構築された後、モデルはオンラインシステムにデプロイされる。オンラインシステムにおいて収集された新しいリアルタイムデータが、モデルを再訓練し、より良好な性能を実現するためにモデルを改善するために使用される。新しいモデルは新しいデータに適応して、自らを最良適合モデルにする。モデルの再訓練は、訓練の必要性及びコストに応じて、リアルタイム、毎日、毎週などであり得る予め定義されたスケジュールで行われ得る。継続的学習では、オフラインモデルとオンラインモデルとで使用される機械学習技法は同じである。

転移学習は、ある問題に対して、関連する問題から学習した知識を活用することによってモデルを構築することを促進する機械学習技法である。転移学習を使う理由としては、新しい問題のための過去のデータが十分ではないこと、新しい問題からのデータでは訓練コストが非常に高いこと、新しい問題と既存の問題とが非常に似ており、新しい問題は既存の問題に対して構築されたモデルから恩恵を受け得ることが挙げられる。本明細書で説明される例示的な実装形態では、ある問題のためにオフラインモデルが構築された後、オフラインモデルは、別の問題のためにオンラインシステムにデプロイされる。モデルは、オンラインシステムからのリアルタイムデータを用いて新しい問題のために再訓練され、改善される。このように、転移学習は、新しい問題のためのモデルを構築する効率的且つ効果的な仕方であり得る。転移学習では、オフラインモデルとオンラインモデルとで使用される機械学習技法は同じである。

図３は、例示的な実装形態による、自動化された適応型コホート学習の一例を示している。産業システムは、同時に働くいくつかの類似したコンポーネントを含み得る。システム全体が大きすぎる、及び／又はオンラインシステムではモデルを構築するためのコンピューティング能力が十分ではない場合、図３に示すように、１つの設計は、自動化された適応型コホート学習３００を用いて、３２０においてオンラインモデル構築作業を各サブシステムに配布し、３３０においてサブシステムからのモデルを組み合わせ、３３１において結合されたモデルを各サブシステムに配布して戻すことである。サブシステムは、システム全体の階層設計、すなわちアセットモデルに基づいて特定され得る。自動化された適応型コホート学習３００のワークフローは、以下を含み得る。

３１０において、グローバルオフライン予測モデル及びグローバルオフライン処方モデルが、システムのすべての過去のデータに基づいて訓練される。オフラインモデルを構築することは、１回限りの作業であり、オフラインモデルを構築するためのコンピューティングハードウェアリソースの要件が満たされ得ると仮定する。３２０において、グローバル予測モデル及びグローバル処方モデルが各サブシステムにデプロイされる。各サブシステムは、図２に示すようにオンラインシステムに設置され、図２に示すようなワークフローにしたがう。ローカルモデル３２０の各サブシステムにおいて、図２に示すように、ローカルモデル（予測モデル及び処方モデル）の各ペアが自律学習により更新される。

何らかの予め定義されたスケジュール（例えば、毎日）で、３３０において、サブシステムにおけるローカルモデルは、一緒にアンサンブルされてグローバルモデルを作成する。モデルがどのように評価されるかに応じて、ローカルモデルをグローバルモデルへとアンサンブルさせるために採用され得る２つの設計スキームが存在する。１つの例示的な設計スキームは、グローバル評価を含み得る。システム全体にわたる新しいグローバルデータに対してローカルモデル（予測モデル及び処方モデル）の各ペアを予め定義された期間（例えば、３時間）実行させる。次いで、グローバル評価設計スキームは、望ましい実装形態にしたがってビジネスメトリクスなどであり得る予め定義された評価メトリクスに基づいて、ローカルモデルの各ペアの性能スコアを測定する。モデル評価の出力はベクトルであり、各要素はローカルモデル（予測モデル及び処方モデル）のペアの性能スコアである。最後に、グローバル評価設計スキームは、最も高い性能スコアを見出し、対応するモデルを選択する。

別の設計スキームは、ローカル評価を含み得る。各サブシステムにおける新しいローカルデータに対してローカルモデル（予測モデル及び処方モデル）の各ペアを予め定義された期間（例えば、３時間）実行させる。次いで、ローカル評価設計スキームは、望ましい実装形態にしたがってビジネスメトリクスなどであり得る予め定義された評価メトリクスに基づいて、ローカルモデルの各ペアの性能スコアを測定する。モデル評価の出力は行列であり、各要素は、各サブシステムにおけるローカルデータに対するローカルモデル（予測モデル及び処方モデル）のペアの性能スコアである。最後に、ローカル評価設計スキームは、すべてのローカルデータにわたる性能スコアに基づいて、ローカルモデルの各ペアが何回最高位にランクされたかを確認し、最も多く勝利したモデルを選択し得る。

ローカル評価のための別の設計スキームの例では、例示的な実装形態は、ローカルモデル（予測モデル及び処方モデル）の各ペアについてローカルデータセットにわたって平均性能スコアを計算し、最も高い平均性能スコアを有するモデルをグローバルモデルとして選択し得る。

ローカル評価のための別の設計スキームの例では、例示的な実装形態は、性能スコア行列をランキング行列に変換し、ローカルモデル（予測モデル及び処方モデル）の各ペアについてローカルデータセットにわたって平均ランキングを計算し、最も高いランクを有するモデルをグローバルモデルとして選択し得る。

ローカル評価のための別の設計スキームの例では、グローバルモデル（予測モデル及び処方モデル）の１つのペアを選択する代わりに、例示的な実装形態は、各ローカルデータセットに対して最良の性能スコアを有するローカルモデルのペアを取得し、すべてのサブシステムに対してモデル（予測モデル及び処方モデル）のペアのセットを選択し得る。

最後に、選択されたモデル３１１は、ローカルモデル３２０の各サブシステムにデプロイされる。このような例示的な実装形態を通して、オンラインシステムは、リアルタイムデータに対して自動化され、適応可能であり得る。

本明細書で説明される例示的な実装形態は、一緒に１つのプロセスとしてシームレスに働くオフラインプロセスとオンラインプロセスとを含む包括的なデータサイエンスプロセスを提供する。本明細書で説明されるデータサイエンスプロセスのための自動化されたシステムの発展をサポートするために、例示的な実装形態は、様々な基礎となる機械学習ライブラリに統合された使いやすいインターフェースを提供し、様々な技能レベルのデータサイエンスの専門家のニーズに合う、統合され高度にカスタマイズ可能であり高度に拡張可能なフレームワークを含む。フレームワークは、各ソリューションを以下のように２つのコンポーネントに編成する。

ソリューション構成ファイル：ソリューション構成ファイルは、データサイエンスプロセスのすべてのステップにおけるアクション又は項目を定義する。ソリューション構成ファイルは、図１（ａ）に示す各ステップについて、各ステップをどのように実行するかについて構成及び命令を指定するためのセクションを有する。各セクションはまた、行う必要がある作業の詳細を定義するサブセクションを有し得る。

メインプログラム：メインプログラムは、各ソリューションへのエントリポイントである。メインプログラムは、ソリューション構成ファイルを読み取り、各コンポーネントの定義にしたがい、それに応じてコンポーネントを実行する。

ソリューション構成ファイルは、以下の主要な属性を特徴とする。

統合されている：複数の機械学習ライブラリからの機械学習方法が、単一のソリューション構成ファイルにおいて指定され得る。

拡張可能：ソリューションは、ソリューション構成ファイルにセクションを追加することにより、最先端の技法で容易に拡張される。

カスタマイズ可能：最適化された汎用ソリューションテンプレートが、分類、回帰、レコメンデーションエンジン、クラスタリング、及び異常検知などの各ソリューションタイプについて提供される。追加的に、ユーザは自らのニーズに合うようにソリューション構成ファイルを容易にカスタマイズし得る。

図４は、例示的な実装形態による、ソリューション構成ファイルの一例を示している。本明細書で説明されるような、また図１（ａ）に示すようなオフラインプロセス及びオンラインプロセスを含むデータサイエンスプロセスは、本明細書に示したソリューション構成ファイル４００にしたがって実行される。各ソリューションはソリューション構成ファイルを有し、ソリューション構成ファイルは、ソリューションのすべての詳細を指定するために使用される。本明細書で説明される例示的な実装形態では、ソリューション構成ファイル４００は、図１（ａ）に示した各コンポーネントについて、オンラインプロセス及びオフラインプロセスにおいて各コンポーネントをどのように実行するかについての構成及び命令を指定するセクションを有する。構成は各コンポーネントについてセクションを含み得る。各コンポーネントに更なる仕様が必要とされる場合、サブセクションがそのような詳細を指定するために使用される。

記述コンポーネント１００では、記述セクション４０１は、データソースの記述と、データソースに関連する他のメタデータ情報とを含み得る。このようなメタデータ情報は、サニティチェック、欠損値の量の特定、又は平均値、中央値、標準偏差などの基本的統計量に関する情報などの記述コンポーネント機能１０１に利用され得る。

探索コンポーネント１１０では、探索セクション４０２は、相関分析、外れ値分析、時系列データ分析（トレンド、中心性、季節性）などのデータ分析１１１を含み得る。

予測コンポーネント１２０では、予測コンポーネント１２０の機能は、解決すべき問題のタイプ（例えば、分類問題など）を定義することを対象とする。初期化されるプロセスとしては、ソリューションの初期化１２１、ソリューションの選択１２２、ハイパーパラメータの最適化１２３、及びモデルの後処理１２４が挙げられる。ソリューション構成ファイルは、新しいデータセットの場所及びソリューション初期化モデルを示すソリューション初期化パラメータと、新しいデータセットの場所及びソリューション選択モデルの場所を示すソリューション選択パラメータと、ソリューション候補を最適化するためのサブセクションのリストを示すハイパーパラメータの最適化パラメータと、モデル後処理パラメータとを含み得る予測４０３を含み得る。ソリューション構成ファイルのパラメータを利用し得るソリューション初期化、ソリューション選択、ハイパーパラメータの最適化、及びモデルの後処理の例は、「ＡＵＴＯＭＡＴＥＤＭＡＣＨＩＮＥＬＥＡＲＮＩＮＧ：ＡＵＮＩＦＩＥＤ，ＣＵＳＴＯＭＩＺＡＢＬＥ，ＡＮＤＥＸＴＥＮＳＩＢＬＥＳＹＳＴＥＭ」と題する国際出願ＰＣＴ／ＵＳ２０２０／０３９６４７号明細書に記載されており、同国際出願の内容はすべての目的で参照によりその全体が組み込まれる。

図４の例示的なソリューション構成ファイルでは、予測セクション４０４は、ハイパーパラメータの最適化の構成を主に指定する。ハイパーパラメータの最適化は、望ましい実装形態にしたがって、どのようなデータが使用されるか、特徴量がどのように処理されるか、どのようなモデルが使用されるか、モデルのそれぞれについてのモデルアルゴリズム、モデルがどのように評価されるか、モデルのパラメータ、及び他のパラメータに関する情報を含み得る。ハイパーパラメータの最適化のサブセクションは、データ４０３－１、特徴量４０３－２、モデル４０３－３、特徴量仕様４０３－４、モデル仕様４０３－５、及びモデル評価４０３－６であり得る。データ４０３－１は、データが抽出されるデータソース又はデータファイルを示すことができ、望ましい実装形態にしたがって、ラベル、関与する特徴量のタイプ、データ分割などのパラメータを含み得る。データ４０３－１はまた、入力及び出力を指定し得る。特徴量４０３－２は、望ましい実装形態にしたがって、関連する特徴量の抽出の有効化／無効化、分散閾値に基づく特徴量選択など、特徴量抽出に関するパラメータを示す。モデル４０３－３は、限定されるものではないが、望ましい実装形態に応じて、ロジスティック回帰、ランダムフォレスト分類器、勾配ブースティング分類器、サポートベクターマシン分類器、ニューラルネットワーク分類器など、データ４０３－１に適用されるモデルを示す。特徴量仕様４０３－４は、組み込まれている特徴量４０３－２のためのパラメータを示し得る。モデル仕様４０３－５は、組み込まれているモデル４０３－３のためのパラメータを示す。評価４０３－６は、モデル４０３－３を評価するために使用されるメトリクスを示す。

処方コンポーネント１３０（及び対応する細部１３１）では、処方セクション４０４は、１３１に示すように、モデルの特徴量重要度を計算する手法及び関連するパラメータと、予測の根本原因分析を実施する手法及び関連するパラメータと、最良目標値を得るために特徴量空間を最適化する手法及び関連するパラメータとを含み得る。

自動化コンポーネント１４０では、自動化セクション４０５は、１４１に示すように、オフラインモデルをオンラインシステムにデプロイする手法及び関連するパラメータを含むことができ、１４２に示すように、オンラインシステムへの処方アクションの適用を自動化する。他の自動化タスクは、ＡＰＩ及び／又はデータインターフェースを通したオンラインシステム（デバイス、機械など）との統合を含む。

自律コンポーネント１５０では、自律セクション４０６は、リアルタイムデータに対して自律学習を実行する手法及び関連するパラメータを含み得る。これは、コンポーネント、すなわち、強化学習１５１、継続的学習１５２、転移学習１５３、及びコホート学習１５４のうちの１つ又は複数のコンポーネントを含む。自律コンポーネントは、オンラインシステム内で稼働し、モデルのライフサイクル管理を構成する必要もある。

いくつかのコンポーネント（例えば、モデル４０３－３）では、ソリューション構成ファイルの仕様は、基礎となる機械学習ライブラリのどのモデルアルゴリズムを呼び出す必要があるか、どのパラメータをモデルアルゴリズムに渡す必要があるかなどを含み得る。ソリューション構成ファイル４００は、各ソリューションで考慮に入れるように各問題を定義するために使用される。例えば、機械の場面では、分類及び回帰の問題がある場合があり、それによって、問題は、データがどのように前処理されるか、特徴量エンジニアリングがどのように実施されるか、どのようなモデルが選択されるか、パラメータチューニング、後処理、評価などを含む全ソリューションによって指定される。

図１（ａ）に示すコンポーネントは、ソリューション構成ファイルを解析し、ファイルにしたがって実行する機械学習ライブラリを取得する。例示的な実装形態はソリューション構成ファイルを利用してソリューションを定義して指定し、ソリューション構成ファイルを読み取って解析するために多くのプログラミング言語（Ｐｙｔｈｏｎ、Ｊａｖａなど）で提供されているリフレクション技法を使用する。そのような例示的な実装形態を通して、アウトカムは、様々な分析ライブラリ及び機械学習ライブラリが一緒に１つのソリューションで使用され得るということである。

例示的な実装形態では、メインプログラムは、各ソリューションへのエントリポイントであり、ソリューション構成ファイルを読み取り、各モジュールの定義にしたがい、それに応じてモジュールを実行するように構成される。

ソリューション構成ファイルは、以下のような主要な属性を特徴とし、本明細書ではソリューション構成ファイルの内容を説明した後に詳細を説明する。ソリューション構成ファイルは、特徴量エンジニアリング及び複数の機械学習ライブラリからのモデルアルゴリズムなどの機械学習方法が単一のソリューション構成ファイルで指定され得るように統合される。ソリューション構成ファイルは、ソリューションが、ソリューション構成ファイルにセクションを追加することにより、最先端の技法で容易に拡張されるように拡張可能である。ソリューション構成ファイルはカスタマイズ可能である。限定されるものではないが、分類、回帰、クラスタリング、異常検知、レコメンデーションエンジン、残存耐用年数予測を含む、最適化された汎用ソリューションテンプレートが各ソリューションタイプについて提供される。ハイパーパラメータの最適化の目的のために、テンプレートは、可能なすべての特徴量エンジニアリング技法及び関連するパラメータグリッド、モデルアルゴリズム及び関連するパラメータグリッド、並びに評価技法を指定する。ユーザは、ソリューションテンプレートで指定された構成を使用することもできるし、構成を変更し、自らのニーズに合うようにカスタマイズすることもできる。

図５（ａ）は、例示的な実装形態による、自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのための例示的なフロー図を示している。例示的な実装形態では、フローは、５０１において、図４に示したソリューション構成ファイルから記述コンポーネント１００、探索コンポーネント１１０、予測コンポーネント１２０、及び処方コンポーネント１３０を生成して実行して、第１のオフラインシステムにおいて予測モデル及び処方モデルを生成する。次いで、５０２において、フローは、予測モデル及び処方モデルを第２のオンラインシステムにデプロイして、第２のシステムから提供されたリアルタイムデータに応じて処方モデルによって生成された処方アクションから第２のシステムの動作を制御する。５０３において、フローは、図２及び図５（ｂ）に示すように、第２のシステムからのリアルタイムデータ、誤差、及びフィードバックに基づいて、予測モデル及び処方モデルを自律的に更新する。

図５（ｂ）は、例示的な実装形態にしたがって、モデルがデプロイされた状態で、第２のシステムからのリアルタイムデータ、誤差、及びフィードバックから予測モデル及び処方モデルを自律的に更新するように構成されたオンラインプロセスの例示的なフローを示している。５１０において、フローは、第２のシステムからフィードバックを受け取る。５１１において、フローは、予測モデルからの予測と第２のシステムからのフィードバックとの間の誤差を求める。５１２において、フローは、図３に示すように、新しいデータ、誤差、及びフィードバックに基づいて、予測モデル及び処方モデルを再訓練する。５１３において、現在のモデルと比較して再訓練されたモデルに予約されたテストデータを使用することに基づいて、再訓練された予測モデル及び再訓練された処方モデルが現在デプロイされている予測モデル及び処方モデルよりも高い精度を有するか否かの判定が行われる。高い精度を有する場合（はいの場合）、フローは、５１４に進んでデプロイされたモデルを再訓練されたモデルと置き換え、高い精度を持たない場合（いいえの場合）、フローは終了する。既存モデルと再訓練されたモデルとを比較する別の例示的な実装形態については、既存モデルと並列に再訓練されたモデルをどのようにオンラインシステムにデプロイし得るかを含む例示的な実装形態を参照されたい。

図５（ａ）及び図５（ｂ）に示すようなフローを通して、モデルを生成するためのオフライン訓練システムは、モデルをデプロイするオンラインシステムと統合することができ、それにより、オンラインシステムに動作を停止させることを必要とせずに、オンラインシステムを制御するためのモデルのシームレスな更新が可能になる。オフラインモデルがオンラインシステムにデプロイされた後、オフラインモデルは過去のデータに基づいて並行して改善され、次いで、（現在のバージョンのオンラインモデルと比較して）オフラインモデルからの性能改善が予め定義された基準を満たす場合、オンラインシステムの通常の動作を中断せずに、オンラインモデルをシームレスに置き換えることができる。

図６は、例示的な実装形態による、複数のシステムと管理装置とを示している。１つ又は複数の第２のシステム６０１－１、６０１－２、６０１－３、及び６０１－４は、モデルを受け取って、それらの基礎となる装置にオンラインでデプロイし、且つオフラインモデルを制御し、オフラインモデルを処理して１つ又は複数の第２のシステム６０１－１、６０１－２、６０１－３、及び６０１－４にデプロイする第１のシステムを支援する管理装置６０２に接続されたネットワーク６００に通信可能に結合される。管理装置６０２は、データベース６０３を管理し、データベース６０３は、ネットワーク６００内のシステムから集約されたデータフィードバックを含む。代替の例示的な実装形態では、第２のシステム６０１－１、６０１－２、６０１－３、及び６０１－４からのデータフィードバックは、エンタープライズリソースプランニングシステムなどのシステムからのデータを集約するプロプライエタリデータベースなどの中央リポジトリ又は中央データベースに集約され得、管理装置６０２は、中央リポジトリ又は中央データベースからデータにアクセスし得る、又は中央リポジトリ又は中央データベースからデータを取得し得る。このようなシステムとしては、旋盤、プレス機、フライス、グラインダなどの製造プロセス又は他のプロセスのために操作者によって操作されることになる装置、並びにフォークリフト、クレーン、トラックなどの移動式装置、並びに、製造、加工、又は他のプロセスの目的で操作者によって操作されることになる任意の他の装置が挙げられる。予測モデル及び処方モデルをオンラインでデプロイするために、１つ又は複数の第２のシステム６０１－１、６０１－２、６０１－３、及び６０１－４のそれぞれが、基礎となる装置の動作を直接制御する１つ又は複数のプログラマブルロジックコントローラ（ＰＬＣ）、或いは動作を制御する命令を基礎となる装置に発出するように構成されたモノのインターネット（ＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓ、ＩｏＴ）ゲートウェイを備え得る。ＰＬＣ又はＩｏＴゲートウェイは、管理装置６０２からのモデルを受け取って実行して、基礎となるシステムにモデルをデプロイし、管理装置６０２にフィードバックを提供するように構成され得る。管理装置６０２は、システムとはオフラインで独立に動作させるために、第２のシステム６０１－１、６０１－２、６０１－３、及び６０１－４とは別個に動作され得る。提案される自動化されたシステムは、以下のように実装され得る。

例示的な実装形態の例示的なユースケースでは、システムは、データサイエンスプロセスの様々なタスクを自動的に実行するためのソフトウェアコンポーネントを有する機械学習ライブラリを含むスタンドアローンシステムとして提供され得る。このような実装形態では、ユーザは、ライブラリ内の関数を呼び出すコードを書き、計算及びデータストレージを管理する。

例示的な実装形態の例示的なユースケースでは、システムは、機械学習ライブラリで提供される関数を提示するグラフィカルユーザインターフェース（ＧＵＩ）を備えたオンプレミスソフトウェアとして実装され得る。ユーザは、ＧＵＩで自動データサイエンスプロセスを実行し、計算及びデータストレージを管理する。

例示的な実装形態の例示的なユースケースでは、機械学習ライブラリを提示するウェブベースのユーザインターフェースを通して、ソフトウェアアズアサービス（ＳｏｆｔｗａｒｅａｓａＳｅｒｖｉｃｅ、ＳａａＳ）ベースのソリューションが利用され得る。ユーザは、サービスにサブスクライブし、サービスプロバイダにデータをアップロードし、ウェブベースのユーザインターフェースを使用して自動データサイエンスプロセスを実行する。サービスプロバイダは、計算及びデータストレージを管理する。

例示的な実装形態の例示的なユースケースでは、システムは、マイクロサービス又はマイクロアプリケーションとして組み込まれて機械学習ライブラリを提示し得る。

図７は、図６に示すような管理装置６０２など、又は図６に示すような第２のシステム６０１－１、６０１－２、６０１－３、６０１－４のＰＬＣ／ＩｏＴゲートウェイなどのいくつかの例示的な実施形態で使用するのに適した例示的なコンピュータデバイスを含む例示的なコンピューティング環境を示している。本明細書で説明される機能は、望ましい実装形態に応じて、管理装置６０２において実装され得る、又は要素のいくつかの組み合わせに基づいてシステムを通して支援され得る。

コンピューティング環境７００におけるコンピュータデバイス７０５は、１つ若しくは複数の処理ユニット、コア、若しくはプロセッサ７１０、メモリ７１５（例えば、ＲＡＭ、ＲＯＭ、及び／又は同様のもの）、内部ストレージ７２０（例えば、磁気ストレージ、光ストレージ、ソリッドステートストレージ、及び／又は有機ストレージ）、及び／又はＩ／Ｏインターフェース７２５を備えることができ、これらのうちのいずれかは、情報を通信するために通信メカニズム若しくはバス７３０上で結合され得る、又はコンピュータデバイス７０５内に埋め込まれ得る。Ｉ／Ｏインターフェース７２５はまた、望ましい実装形態に応じて、カメラから画像を受け取るように、又はプロジェクタ若しくはディスプレイに画像を提供するように構成される。

コンピュータデバイス７０５は、入力／ユーザインターフェース７３５及び出力デバイス／インターフェース７４０に通信可能に結合され得る。入力／ユーザインターフェース７３５及び出力デバイス／インターフェース７４０の一方又は両方のいずれかが、有線又は無線インターフェースであり得、取り外し可能であり得る。入力／ユーザインターフェース７３５は、入力を提供するために使用され得る物理的又は仮想的である任意のデバイス、コンポーネント、センサ、又はインターフェースを含んでもよい（例えば、ボタン、タッチスクリーンインターフェース、キーボード、ポインティング／カーソルコントロール、マイクロフォン、カメラ、点字、モーションセンサ、光学リーダ、及び／又は同様のもの）。出力デバイス／インターフェース７４０は、ディスプレイ、テレビ、モニタ、プリンタ、スピーカ、点字などを含んでもよい。いくつかの例示的な実装形態では、入力／ユーザインターフェース７３５及び出力デバイス／インターフェース７４０は、コンピュータデバイス７０５に埋め込まれ得る、又はコンピュータデバイス７０５に物理的に結合され得る。他の例示的な実装形態では、他のコンピュータデバイスが、コンピュータデバイス７０５のための入力／ユーザインターフェース７３５及び出力デバイス／インターフェース７４０として機能していてもよいし、又はその機能を提供してもよい。

コンピュータデバイス７０５の例としては、限定するものではないが、高度なモバイルデバイス（例えば、スマートフォン、車両及び他の機械にあるデバイス、人間及び動物によって携帯されるデバイスなど）、モバイルデバイス（例えば、タブレット、ノートブック、ラップトップ、パーソナルコンピュータ、携帯型テレビ、ラジオなど）、及び移動性を目的として設計されてはいないデバイス（例えば、デスクトップコンピュータ、他のコンピュータ、案内所（ｉｎｆｏｒｍａｔｉｏｎｋｉｏｓｋ）、その内部に埋め込まれた／それに結合された１つ又は複数のプロセッサを有するテレビ、ラジオなど）が挙げられる。

コンピュータデバイス７０５は、同一又は異なる構成の１つ又は複数のコンピュータデバイスを含む任意の数のネットワーク接続されたコンポーネント、デバイス、及びシステムと通信するために外部ストレージ７４５及びネットワーク７５０に（例えば、Ｉ／Ｏインターフェース７２５を介して）通信可能に結合され得る。コンピュータデバイス７０５又は任意の接続されたコンピュータデバイスは、サーバ、クライアント、シンサーバ、汎用機械、専用機械などとして機能したり、これらのサービスを提供したり、そのように呼称されたりし得る。

Ｉ／Ｏインターフェース７２５は、限定されるものではないが、情報をコンピューティング環境７００内の少なくともすべての接続されたコンポーネント、デバイス、及びネットワークに、又はこれらから情報を通信するための任意の通信又はＩ／Ｏプロトコル又は規格（例えば、Ｅｔｈｅｒｎｅｔ、８０２．１１ｘ、ユニバーサルシステムバス、ＷｉＭａｘ、モデム、セルラネットワークプエロトコルなど）を使用する有線及び／又は無線インターフェースを含み得る。ネットワーク７５０は、任意のネットワーク又はネットワークの組み合わせであり得る（例えば、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、電話ネットワーク、セルラネットワーク、衛星ネットワークなど）。

コンピュータデバイス７０５は、一時的媒体及び非一時的媒体を含むコンピュータ使用可能媒体又はコンピュータ可読媒体を使用し得る、且つ／又は使用して通信し得る。一時的媒体は、送信媒体（例えば、金属ケーブル、光ファイバ）、信号、搬送波などを含む。非一時的媒体は、磁気媒体（例えば、ディスク及びテープ）、光媒体（例えば、ＣＤ－ＲＯＭ、デジタルビデオディスク、Ｂｌｕ－ｒａｙディスク）、ソリッドステート媒体（例えば、ＲＡＭ、ＲＯＭ、フラッシュメモリ、ソリッドステートストレージ）、及び他の不揮発性ストレージ又はメモリを含む。

コンピュータデバイス７０５は、いくつかの例示的なコンピューティング環境において技法、方法、アプリケーション、プロセス、又はコンピュータ実行可能命令を実装するために使用され得る。コンピュータ実行可能命令は、一時的媒体から取得することができ、非一時的媒体に記憶させることができ、非一時的媒体から取得することができる。実行可能命令は、任意のプログラミング、スクリプティング、及び機械言語（例えば、Ｃ、Ｃ＋＋、Ｃ＃、Ｊａｖａ、ＶｉｓｕａｌＢａｓｉｃ、Ｐｙｔｈｏｎ、Ｐｅｒｌ、ＪａｖａＳｃｒｉｐｔなど）のうちの１つ又は複数に由来し得る。

プロセッサ７１０は、ネイティブ環境又は仮想環境において任意のオペレーティングシステム（ＯＳ）（図示せず）の下で稼働することができる。論理ユニット７６０、アプリケーションプログラミングインターフェース（ＡＰＩ）ユニット７６５、入力ユニット７７０、出力ユニット７７５、並びに、互いに、ＯＳと、及び他のアプリケーション（図示せず）と通信するための異なるユニット用のユニット間通信メカニズム７９５を含む１つ又は複数のアプリケーションがデプロイされ得る。説明されたユニット及び要素は、設計、機能、構成、又は実装形態において異なる可能性があり、提供された説明に限定されるものではない。

いくつかの例示的な実装形態では、情報又は実行命令がＡＰＩユニット７６５によって受け取られると、情報又は実行命令は、１つ又は複数の他のユニット（例えば、論理ユニット７６０、入力ユニット７７０、出力ユニット７７５）に通信され得る。いくつかの例では、論理ユニット７６０は、上述のいくつかの例示的な実装形態において、ユニット間での情報フローを制御し、ＡＰＩユニット７６５、入力ユニット７７０、出力ユニット７７５によって提供されるサービスを指揮するように構成され得る。例えば、１つ又は複数のプロセス又は実装形態のフローは、論理ユニット７６０単独で、又はＡＰＩユニット７６５と連携して制御され得る。入力ユニット７７０は、例示的な実装形態で説明された計算のための入力を取得するように構成されてもよく、出力ユニット７７５は、例示的な実装形態で説明された計算に基づいて出力を提供するように構成されてもよい。

プロセッサ７１０は、図１（ａ）、図５（ａ）、及び図５（ｂ）に示すように、オフライン学習プロセスを通して予測モデル及び処方モデルを生成し、予測モデル及び処方モデルを第２のシステムにデプロイすることを通して第２のシステムの動作を制御し、処方モデル及び予測モデルが第２のシステムにデプロイされた状態で、オンライン学習プロセスを通した第２のシステムからのフィードバックから処方モデル及び予測モデルを自律的に更新するように構成され得る。

プロセッサ７１０は、図１（ａ）～図３に示すように、予測モデルと処方モデルを第２のシステムに配備して動作を制御することが、第２のシステムの動作を変更する処方モデルから生成された処方アクションの自動適用を実行することによって、予測モデル及び処方モデルを第２のシステムにデプロイすることを通して第２のシステムの動作を制御するように構成される。

プロセッサ７１０は、図１（ａ）～図４に示すように、ソリューション構成ファイルから、記述分析を実施するように構成された記述コンポーネントを生成することと、ソリューション構成ファイル及び記述分析から、探索的分析を実施するように構成された探索コンポーネントを生成することと、ソリューション構成ファイル及び探索的分析から、ソリューション構成ファイルで指定された１つ又は複数の機械学習ライブラリを組み込んで予測モデルを生成するように構成された予測コンポーネントを生成することと、ソリューション構成ファイル及び予測モデルから、予測モデルからの結果に処方アクションをマッピングして、処方モデルを生成するように構成された処方コンポーネントを生成することによって、第１のシステムにおけるオフライン学習プロセスを通して予測モデル及び処方モデルを生成するように構成され得る。

プロセッサ７１０は、図１（ａ）に示すように、オンラインとなるように、且つ第２のシステムからリアルタイムデータを取り込むように構成されるように予測モデル及び処方モデルをデプロイすることと、リアルタイムデータから予測モデルを通して予測を生成することと、予測から処方モデルを通して処方アクションを生成することと、処方アクションにしたがって第２のシステムの動作を制御することとによって、第２のシステムに予測モデル及び処方モデルをデプロイすることを通して第２のシステムの動作を制御するように構成され得る。

プロセッサ７１０は、図５（ｂ）に示すように、第２のシステムからのフィードバックと、動作を制御することに関連する予測モデルからの予測との間の差分に基づいて、誤差を求めることと、第２のシステムのためのプロセッサ７１０が、予測モデル及び処方モデルが第２のシステムにデプロイされた状態で、継続的学習プロセスを通したリアルタイムデータ、誤差、及びフィードバックに基づいて予測モデル及び処方モデルを再訓練するように構成されることと、予測モデル及び処方モデルよりも良好な性能を有する再訓練された予測モデル及び再訓練された処方モデルについて、再訓練された処方モデル及び再訓練された予測モデルを第２のシステムにデプロイすることによって、予測モデル及び処方モデルが第２のシステムにデプロイされた状態で、オンライン学習プロセスを通した第２のシステムからのフィードバックから予測モデル及び処方モデルを自律的に更新するように構成され得る。

プロセッサ７１０は、図３に示すように、第２のシステムにおいて、再訓練された予測モデル及び再訓練された処方モデルを生成するための機械学習プロセスを第２のシステムのサブシステムに関連付けられた複数のローカルモデルに配布することと、複数のローカルモデルを反復してアンサンブルさせて複数の再訓練された予測モデル及び複数の再訓練された処方モデルを生成し、生成された複数の再訓練された予測モデルのうちの１つ及び生成された複数の再訓練された処方モデルのうちの１つを選択して機械学習プロセスに配布して戻すことと、複数のローカルモデルをアンサンブルさせて再訓練された予測モデル及び再訓練された処方モデルを生成することによって、第２のシステムにおいて、予測モデル及び処方モデルが第２のシステムにデプロイされた状態で、継続的学習プロセスを通したリアルタイムデータ、誤差、及びフィードバックに基づいて予測モデル及び処方モデルを再訓練するように構成され得る。

プロセッサ７１０は、図３に示すように、強化学習プロセス又は転移学習プロセスの１つ又は複数を通したリアルタイムデータ、誤差、及びフィードバックに基づいて予測モデル及び処方モデルを再訓練することによって、第２のシステムにおいて、予測モデル及び処方モデルが第２のシステムにデプロイされた状態で、継続的学習プロセスを通したリアルタイムデータ、誤差、及びフィードバックに基づいて予測モデル及び処方モデルを再訓練するように構成され得る。

詳細な説明のいくつかの部分は、コンピュータ内の動作のアルゴリズム及び記号式表現の観点から提示されている。これらアルゴリズム記述及び記号式表現は、データ処理技術における当業者によって、その革新の本質を他の当業者に伝えるために使用される手段である。アルゴリズムとは、所望の最終状態又は最終結果をもたらす一連の定義済みステップである。例示的な実装形態では、実行される各ステップは、有形の結果を実現するために有形の量を物理的に操作することを必要とする。

特に別段の記載のない限り、上記の論述から明らかなように、説明全体を通して、「処理」、「コンピューティング」、「計算」、「判定」、「表示」などの用語を利用する論述では、コンピュータシステム又は他の情報処理デバイスのアクション及びプロセスを含むことができ、コンピュータシステム又は他の情報処理デバイスは、コンピュータシステムのレジスタ及びメモリ内の物理的な（電子的な）量として表されるデータを処理して、コンピュータシステムのメモリ若しくはレジスタ又は他の情報記憶、伝送、若しくは表示デバイス内の物理的な量として同様に表される他のデータに変換することを理解されたい。

例示的な実装形態はまた、本明細書における各動作を実行するための装置に関連し得る。この装置は、必要とされる目的のために特別に構築されてもよいし、１つ又は複数のコンピュータプログラムによって選択的に作動若しくは再構成される１つ又は複数の汎用コンピュータを備えてもよい。このようなコンピュータプログラムは、コンピュータ可読記憶媒体又はコンピュータ可読信号媒体などのコンピュータ可読媒体に記憶されてもよい。コンピュータ可読記憶媒体は、限定されるものではないが、光ディスク、磁気ディスク、読み取り専用メモリ、ランダムアクセスメモリ、ソリッドステートデバイス及びソリッドステートドライブ、又は電子情報を記憶するのに適した他の任意のタイプの有形又は非一時的媒体などの有形媒体を含み得る。コンピュータ可読信号媒体は、搬送波などの媒体を含み得る。本明細書において提示されるアルゴリズム及びディスプレイは、いかなる特定のコンピュータ又は他の装置にも本質的に関連しない。コンピュータプログラムは、所望の実装形態の動作を実行する命令を含む純粋なソフトウェア実装形態を含むことができる。

様々な汎用システムが、本明細書での各例によるプログラム及び構成要素と共に使用されてもよいし、更に特殊な装置を構築して、所望の方法ステップを実行すること好都合と分かる場合もある。加えて、例示的な実装形態は、いかなる特定のプログラミング言語にも関連して記載されていない。本明細書で説明される例示的な実装形態の教示を実装するために様々なプログラミング言語が使用されてもよいことを理解されたい。プログラミング言語の命令は、１つ又は複数の処理デバイス、例えば、中央処理装置（ＣＰＵ）、プロセッサ、又はコントローラによって実行されてもよい。

当技術分野で知られているように、上述の各動作は、ハードウェア、ソフトウェア、又はソフトウェアとハードウェアとの何らかの組み合わせによって実行され得る。例示的な実装形態の様々な態様は、回路及び論理デバイス（ハードウェア）を使用して実装されてもよく、また他の態様が、プロセッサによって実行されると、本出願の実装形態を実行する方法をプロセッサに実行させる、機械可読媒体（ソフトウェア）に記憶された各命令を使用して実装されてもよい。更に、本出願のいくつかの例示的な実装形態は、ハードウェアのみで実行されてもよく、また他の例示的な実装形態は、ソフトウェアのみで実行されてもよい。更に、説明した様々な機能は、単一のユニットで実行させることもできるし、任意の数の仕方でいくつかの構成要素にわたって分散させることもできる。方法は、ソフトウェアによって実行される場合、コンピュータ可読媒体に記憶された命令に基づいて、汎用コンピュータなどのプロセッサによって実行されてもよい。必要な場合、命令は、圧縮及び／又は暗号化された形式で媒体に記憶され得る。

更に、当業者であれば、本明細書を検討すれば、また本明細書に開示される教示を実施することにより、他の実装形態に想到するはずである。説明した例示的な実装形態の様々な態様及び／又は構成要素は、単独で又は任意の組み合わせで使用されてもよい。本明細書及び例示的な実装形態は、単なる例と見なされ、本出願の真の範囲及び趣旨は、添付の特許請求の範囲によって示されることが意図されている。

Claims

自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのための方法であって、前記方法が、
第１のシステムにおけるオフライン学習プロセスを通して予測モデル及び処方モデルを生成することと、
前記予測モデル及び前記処方モデルを第２のシステムにデプロイすることを通して前記第２のシステムの動作を制御することと、
前記処方モデル及び前記予測モデルが前記第２のシステムにデプロイされた状態で、オンライン学習プロセスを通した前記第２のシステムからのフィードバックから前記処方モデル及び前記予測モデルを自律的に更新することと
を含む、方法。
前記予測モデル及び前記処方モデルを前記第２のシステムにデプロイすることを通して前記第２のシステムの動作を前記制御することが、前記処方モデルから生成された処方アクションの自動適用を実行して前記第２のシステムの動作を変更することを含む、請求項１に記載の方法。
前記第１のシステムにおける前記オフライン学習プロセスを通して前記予測モデル及び前記処方モデルを前記生成することが、
ソリューション構成ファイルから、記述分析を実施するように構成された記述コンポーネントを生成することと、
前記ソリューション構成ファイル及び前記記述分析から、探索的分析を実施するように構成された探索コンポーネントを生成することと、
前記ソリューション構成ファイル及び前記探索的分析から、前記ソリューション構成ファイルで指定された１つ又は複数の機械学習ライブラリを組み込んで前記予測モデルを生成するように構成された予測コンポーネントを生成することと、
前記ソリューション構成ファイル及び前記予測モデルから、前記予測モデルからの結果に処方アクションをマッピングして処方モデルを生成するように構成された処方コンポーネントを生成することと
を含む、請求項１に記載の方法。
前記予測モデル及び前記処方モデルを前記第２のシステムにデプロイすることを通して前記第２のシステムの動作を前記制御することが、
オンラインとなるように、且つ前記第２のシステムからリアルタイムデータを取り込むように構成されるように前記予測モデル及び前記処方モデルをデプロイすることと、
前記リアルタイムデータから前記予測モデルを通して予測を生成することと、
前記予測から前記処方モデルを通して処方アクションを生成することと、
前記処方アクションにしたがって前記第２のシステムの前記動作を制御することと
を含む、請求項１に記載の方法。
前記予測モデル及び前記処方モデルが前記第２のシステムにデプロイされた状態で、前記オンライン学習プロセスを通した前記第２のシステムからの前記フィードバックから前記予測モデル及び前記処方モデルを前記自律的に更新することが、
前記第２のシステムからの前記フィードバックと、前記動作を前記制御することに関連する前記予測モデルからの予測との間の差分に基づいて、誤差を求めることと、
前記第２のシステムにおいて、前記予測モデル及び前記処方モデルが前記第２のシステムにデプロイされた状態で、継続的学習プロセスを通したリアルタイムデータ、前記誤差、及び前記フィードバックに基づいて前記予測モデル及び前記処方モデルを再訓練することと、
前記予測モデル及び前記処方モデルよりも良好な性能を有する前記再訓練された予測モデル及び前記再訓練された処方モデルについて、前記再訓練された処方モデル及び前記再訓練された予測モデルを前記第２のシステムにデプロイすることと
を含む、請求項１に記載の方法。
前記第２のシステムにおいて、前記予測モデル及び前記処方モデルが前記第２のシステムにデプロイされた状態で、前記継続的学習プロセスを通した前記リアルタイムデータ、前記誤差、及び前記フィードバックに基づいて前記予測モデル及び前記処方モデルを前記再訓練することが、
再訓練された予測モデル及び再訓練された処方モデルを生成するための機械学習プロセスを前記第２のシステムのサブシステムに関連付けられた複数のローカルモデルに配布することと、
前記複数のローカルモデルを反復してアンサンブルさせて複数の再訓練された予測モデル及び複数の再訓練された処方モデルを生成し、前記生成された複数の再訓練された予測モデルのうちの１つ及び前記生成された複数の再訓練された処方モデルのうちの１つを選択して、前記機械学習プロセスに配布して戻すことと、
前記複数のローカルモデルをアンサンブルさせて、前記再訓練された予測モデル及び前記再訓練された処方モデルを生成することと
を含む、請求項５に記載の方法。
前記第２のシステムにおいて、前記予測モデル及び前記処方モデルが前記第２のシステムにデプロイされた状態で、前記継続的学習プロセスを通した前記リアルタイムデータ、前記誤差、及び前記フィードバックに基づいて前記予測モデル及び前記処方モデルを前記再訓練することが、
強化学習プロセス又は転移学習プロセスの１つ又は複数を通した前記リアルタイムデータ、前記誤差、及び前記フィードバックに基づいて前記予測モデル及び前記処方モデルを再訓練すること
を含む、請求項５に記載の方法。
自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのためのシステムであって、前記システムが、
第１のシステムであって、
オフライン学習プロセスを通して予測モデル及び処方モデルを生成し、
前記予測モデル及び前記処方モデルを第２のシステムにデプロイすることを通して前記第２のシステムの動作を制御し、
前記処方モデル及び前記予測モデルが前記第２のシステムにデプロイされた状態で、オンライン学習プロセスを通した前記第２のシステムからのフィードバックから前記処方モデル及び前記予測モデルを自律的に更新する
ように構成されたプロセッサを備えた、第１のシステム
を備える、システム。
前記プロセッサが、前記第２のシステムの動作を変更する前記処方モデルから生成された処方アクションの自動適用を実行することによって、前記予測モデル及び前記処方モデルを前記第２のシステムにデプロイすることを通して前記第２のシステムの動作を制御するように構成される、請求項８に記載のシステム。
前記プロセッサが、
ソリューション構成ファイルから、記述分析を実施するように構成された記述コンポーネントを生成することと、
前記ソリューション構成ファイル及び前記記述分析から、探索的分析を実施するように構成された探索コンポーネントを生成することと、
前記ソリューション構成ファイル及び前記探索的分析から、前記ソリューション構成ファイルで指定された１つ又は複数の機械学習ライブラリを組み込んで前記予測モデルを生成するように構成された予測コンポーネントを生成することと、
前記ソリューション構成ファイル及び前記予測モデルから、前記予測モデルからの結果に処方アクションをマッピングして処方モデルを生成するように構成された処方コンポーネントを生成することと
によって、前記第１のシステムにおける前記オフライン学習プロセスを通して前記予測モデル及び前記処方モデルを生成するように構成される、請求項８に記載のシステム。
前記プロセッサが、
オンラインとなるように、且つ前記第２のシステムからリアルタイムデータを取り込むように構成されるように前記予測モデル及び前記処方モデルをデプロイすることと、
前記リアルタイムデータから前記予測モデルを通して予測を生成することと、
前記予測から前記処方モデルを通して処方アクションを生成することと、
前記処方アクションにしたがって前記第２のシステムの前記動作を制御することと
によって、前記予測モデル及び前記処方モデルを前記第２のシステムにデプロイすることを通して前記第２のシステムの動作を制御するように構成される、請求項８に記載のシステム。
前記プロセッサが、
前記第２のシステムからの前記フィードバックと、前記動作を前記制御することに関連付けられた前記予測モデルからの予測との間の差分に基づいて、誤差を求めることと、
前記第２のシステムが、前記予測モデル及び前記処方モデルが前記第２のシステムにデプロイされた状態で、継続的学習プロセスを通したリアルタイムデータ、前記誤差、及び前記フィードバックに基づいて前記予測モデル及び前記処方モデルを再訓練するように構成されることと、
前記予測モデル及び前記処方モデルよりも良好な性能を有する前記再訓練された予測モデル及び前記再訓練された処方モデルについて、前記再訓練された処方モデル及び前記再訓練された予測モデルを前記第２のシステムにデプロイすることと
によって、前記予測モデル及び前記処方モデルが前記第２のシステムにデプロイされた状態で、前記オンライン学習プロセスを通した前記第２のシステムからの前記フィードバックから前記予測モデル及び前記処方モデルを自律的に更新するように構成される、請求項８に記載のシステム。
前記第２のシステムが、
再訓練された予測モデル及び再訓練された処方モデルを生成するための機械学習プロセスを前記第２のシステムのサブシステムに関連付けられた複数のローカルモデルに配布することと、
前記複数のローカルモデルを反復してアンサンブルさせて複数の再訓練された予測モデル及び複数の再訓練された処方モデルを生成し、前記生成された複数の再訓練された予測モデルのうちの１つ及び前記生成された複数の再訓練された処方モデルのうちの１つを選択して前記機械学習プロセスに配布して戻すことと、
前記複数のローカルモデルをアンサンブルさせて、前記再訓練された予測モデル及び前記再訓練された処方モデルを生成することと
によって、前記予測モデル及び前記処方モデルが前記第２のシステムにデプロイされた状態で、前記継続的学習プロセスを通した前記リアルタイムデータ、前記誤差、及び前記フィードバックに基づいて前記予測モデル及び前記処方モデルを再訓練するように構成される、請求項１２に記載のシステム。
前記第２のシステムが、
強化学習プロセス又は転移学習プロセスの１つ又は複数を通した前記リアルタイムデータ、前記誤差、及び前記フィードバックに基づいて前記予測モデル及び前記処方モデルを再訓練すること
によって、前記予測モデル及び前記処方モデルが前記第２のシステムにデプロイされた状態で、前記継続的学習プロセスを通した前記リアルタイムデータ、前記誤差、及び前記フィードバックに基づいて前記予測モデル及び前記処方モデルを再訓練するように構成される、請求項１３に記載のシステム。
自動化され自律的な自己学習型機械学習モデルの生成及びデプロイのための命令を記憶する非一時的コンピュータ可読媒体であって、前記命令が、
第１のシステムにおけるオフライン学習プロセスを通して予測モデル及び処方モデルを生成することと、
前記予測モデル及び前記処方モデルを第２のシステムにデプロイすることを通して前記第２のシステムの動作を制御することと、
前記処方モデル及び前記予測モデルが前記第２のシステムにデプロイされた状態で、オンライン学習プロセスを通した前記第２のシステムからのフィードバックから前記処方モデル及び前記予測モデルを自律的に更新することと
を含む、非一時的コンピュータ可読媒体。