JP7728107B2 - コンピュータ制御システムの時系列予測の実行 - Google Patents
コンピュータ制御システムの時系列予測の実行Info
- Publication number
- JP7728107B2 JP7728107B2 JP2021099178A JP2021099178A JP7728107B2 JP 7728107 B2 JP7728107 B2 JP 7728107B2 JP 2021099178 A JP2021099178 A JP 2021099178A JP 2021099178 A JP2021099178 A JP 2021099178A JP 7728107 B2 JP7728107 B2 JP 7728107B2
- Authority
- JP
- Japan
- Prior art keywords
- drift
- model
- sde
- variables
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B17/00—Systems involving the use of models or simulators of said systems
- G05B17/02—Systems involving the use of models or simulators of said systems electric
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/027—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/048—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Automation & Control Theory (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Feedback Control In General (AREA)
- Testing And Monitoring For Control Systems (AREA)
Description
多くの現実生活の用途においては、コンピュータ制御システムの時系列予測を行うためにモデルを使用することが望まれる。実際の例として、ガソリンエンジン用のガソリンパティキュレートフィルタにおいては、煤粒子がフィルタ上に蓄積する。従って、フィルタの機能を維持するには、煤粒子の蓄積を予測して、洗浄動作(例えば、酸素バーストを使用)を遅滞なく開始し得るようにする必要がある。より一般的には、そのようなコンピュータ制御システムにおいては、典型的には、1つ以上のセンサが、システム及び/又はその環境の測定値の取得のために使用され、1つ以上のアクチュエータが、環境に影響を与えるアクションの実行のために使用されている。コンピュータ制御システムには、ロボットが1つ以上のタスクを自動的に、例えば、外部デバイス又は組み込まれたコントローラの制御下において実行し得るロボットシステムが含まれる。さらなる例には、車両及びそのコンポーネント、家電製品、電動工具、製造機械、パーソナルアシスタント、アクセス制御システム、ドローン、ナノロボット及び暖房制御システムがある。
物理量をより正確に予測することができ、より少ない測定値に基づいてより効率的にトレーニングすることができる、及び/又は、モデルがその予測にどのように到達したかに関するより多くの見通しを提供する、トレーニング可能な予測モデルを持つことが望ましい。
図1は、コンピュータ制御システム及び/又はその環境の観測値のセットに基づいて、コンピュータ制御システムの時系列予測を行うためのモデルをトレーニングするためのシステム100を示している。このモデルは、SDE変数のセットの確率微分方程式(SDE)を使用することができる。SDEは、ドリフト成分及び拡散成分を含み得る。
dxt=(θ1xt-θ2xtyt)dt+0.2dβt
dyt=(-θ3yt+θ4xtyt)dt+0.3dβt
ここで、θ=(2.0,1.0,4.0,1.0)である。
この例においては、SDE及び観測変数のセットが一致しており、トレーニング可能な観測モデルは使用されない。この例においては、軌道は、例えば、間隔t=[0,1]、解像度dt=0.01により予測することができる。本発明者らは、事前定義されたドリフト成分部分が、標準偏差0.5の真の値θを中心とする正規分布からサンプリングされたパラメータθ’を有するPDEの形態において提供される実験を行った。
dxt=ζ(yt-xt)+dβt
dyt=xt(κ-zt)-yt+dβt
dzt=(xtyt-ρzt)+dβt
この例においては、SDE及び観測変数のセットが一致しており、トレーニング可能な観測モデルは使用されていない。実験においては、ζ=10、κ=2.67、ρ=28であり、βtは、単位拡散を伴うブラウン運動に従う確率変数である。実験においては、(x(0)=1,y(0)=1,z(0)=28)によりシステムを開始する上記のダイナミクスからの2000の観測値が決定された。ここで、前半はトレーニング用であり、残余はテスト用であった。ドリフト成分の事前定義された部分として、パラメータは、ガウスノイズによって歪められたシステムを支配する3つの方程式の1つが提供された。
Claims (14)
- コンピュータ制御システムの観測値のセットに基づいてコンピュータ制御システムの時系列予測を行うためのモデルをトレーニングするコンピュータ実装方法(600)であって、
前記モデルは、SDE変数のセットの確率微分方程式(SDE)を使用し、
前記SDEは、ドリフト成分及び拡散成分を含み、
前記方法は、
-モデルを定義するモデルデータにアクセスするステップ(610)であって、前記モデルデータは、前記SDEの前記ドリフト成分のトレーニング可能な部分のパラメータのセットを少なくとも含む、ステップと、
-コンピュータ制御システムの観測値のセットを取得するステップ(630)であって、前記観測値は、コンピュータ制御システム及び/又はその環境の時系列の測定値を含む、ステップと、
-観測値のセットに基づいてモデルをトレーニングするステップ(640)と、
を含み、
前記トレーニングするステップ(640)は、
-先行時点におけるSDE変数のセットの値に基づいて現時点におけるSDE変数のセットの値を予測するステップ(650)のために、時系列予測を行うためにモデルを使用するステップであって、前記SDEを使用することを含む、ステップと、
-前記時系列予測を観測値のセットの観測値と比較することによってトレーニング信号を導出するステップ(660)と、
-前記トレーニング信号に基づいて前記ドリフト成分のトレーニング可能な部分のパラメータのセットを少なくとも調整するステップ(670)と、
を含み、
さらに、前記方法は、トレーニングのための入力として、前記SDEの前記ドリフト成分の事前定義された部分を受信するステップ(620)を含み、
前記予測するステップ(650)は、
第1のドリフトを得るために前記ドリフト成分の事前定義された部分を評価するステップ(651)と、
前記第1のドリフトを、前記ドリフト成分の前記トレーニング可能な部分を評価することによって取得された第2のドリフトと組み合わせるステップ(652)と、
を含み、
前記第1のドリフトと前記第2のドリフトとを組み合わせるステップは、前記第1のドリフトの値と前記第2のドリフトの対応する値とを重み値に従って組み合わせることを含み、前記重み値は、前記組合せにおける前記ドリフト成分の前記事前定義された部分の重みを示し、前記トレーニングするステップは、前記トレーニング信号に基づいて前記重み値を調整することをさらに含む、方法(600)。 - 前記ドリフト成分の前記トレーニング可能な部分及び前記拡散成分は、ベイズモデルである、請求項1に記載の方法(600)。
- 前記トレーニング信号を導出するステップは、選択された観測値の測定値が、決定された時系列予測に従って観測される尤度を決定するためのノイズモデルを使用すること、及び、前記尤度を最尤推定に使用することを含む、請求項2に記載の方法(600)。
- 前記ドリフト成分の前記トレーニング可能な部分を評価することは、パラメータフリー確率変数の値をサンプリングすること、前記トレーニング可能な部分のノードの線形活性化の統計パラメータを決定すること、及び、前記統計パラメータと前記確率変数のサンプリングされた値とに基づいて前記線形活性化を決定論的に計算することを含む、請求項3に記載の方法(600)。
- 前記トレーニング信号を導出するステップは、トレーニング可能なドリフト成分を含むモデルと、トレーニング可能なドリフト成分を含まないモデルとの間の差分を最小化するための正則化項を評価することを含む、請求項3又は4に記載の方法(600)。
- 前記方法は、前記モデルの前記トレーニング前に、パラメータ化された微分方程式を観測値のセットに適合させることによって前記ドリフト成分の前記事前定義された部分を決定するステップを含む、請求項1乃至5のいずれか一項に記載の方法(600)。
- コンピュータ制御システムを制御及び/又は監視するためのコンピュータ制御システムの時系列予測を行うためにトレーニングされたモデルを使用するコンピュータ実装方法(700)であって、前記モデルは、SDE変数のセットの確率微分方程式(SDE)を使用し、前記SDEは、ドリフト成分及び拡散成分を含み、
前記方法は、
-前記モデルを定義するモデルデータにアクセスするステップ(710)であって、前記モデルデータは、少なくとも前記SDEの前記ドリフト成分のトレーニングされた部分のパラメータのセットを含むステップと、
-前記コンピュータ制御システム及び/又はその環境の測定値を表すセンサデータを取得するステップ(720)と、
-前記測定値に基づいて前記コンピュータ制御システムの時系列予測を決定するステップ(730)であって、先行時点におけるSDE変数のセットの値に基づいて現時点におけるSDE変数のセットの値を予測するステップ(750)のために前記SDEを使用することを含む、ステップと、
-決定された時系列予測に基づいて、前記コンピュータ制御システムを制御及び/又は監視する際に使用するための出力データを生成するステップ(760)と、
を含み、
前記モデルデータは、前記SDEの前記ドリフト成分の事前定義された部分をさらに定義し、
前記現時点におけるSDE変数のセットの値を予測するステップ(750)は、
第1のドリフトを得るために前記ドリフト成分の前記事前定義された部分を評価するステップ(751)と、
前記第1のドリフトを、前記ドリフト成分の前記トレーニング可能な部分を評価することによって取得された第2のドリフトと組み合わせるステップ(752)と、
を含み、
前記第1のドリフトと前記第2のドリフトとを組み合わせるステップは、前記第1のドリフトの値と前記第2のドリフトの対応する値とを重み値に従って組み合わせることを含み、前記重み値は、前記組合せにおける前記ドリフト成分の前記事前定義された部分の重みを示す、方法(700)。 - 前記方法は、前記コンピュータ制御システムの制御又は監視に使用される出力デバイスへの出力インタフェースを使用し、決定された時系列予測に基づいて前記コンピュータ制御システムの制御又は監視を可能にするために前記出力データを前記出力デバイスに提供することをさらに含む、請求項7に記載の方法(700)。
- 前記時系列予測は、車両の機械的部品、例えば、排気ガス処理部品及び/又は水素燃料電池のスタック及び/又はパティキュレートフィルタの時系列予測である、請求項7又は8に記載の方法(700)。
- 前記トレーニングされたモデルは、前記コンピュータ制御システムの環境の時系列予測を提供する環境モデルであり、前記方法は、出力データとして、前記環境モデルに従って前記環境とのシミュレートされた相互作用を実行するための制御データを生成することに基づいて前記コンピュータ制御システムをトレーニングすることを含む、請求項7に記載の方法(700)。
- 前記ドリフト成分の前記トレーニング可能な部分及び前記拡散成分は、ベイズモデルであり、前記方法は、時系列予測の不確実性を決定することをさらに含む、請求項7乃至10のいずれか一項に記載の方法(700)。
- コンピュータ制御システムの観測値のセットに基づいてコンピュータ制御システムの時系列予測を行うためのモデルをトレーニングするためのシステム(100)であって、前記モデルは、SDE変数のセットの確率微分方程式(SDE)を使用し、前記SDEは、ドリフト成分及び拡散成分を含み、
前記システムは、
-前記モデルを定義し、少なくとも前記SDEのドリフト成分のトレーニング可能な部分のパラメータのセットを含むモデルデータ(040)にアクセスするためのデータインタフェース(120)と、
-プロセッササブシステム(140)と、
を含み、
前記プロセッササブシステム(140)は、
-前記コンピュータ制御システムの前記観測値のセットを取得し、前記観測値は、前記コンピュータ制御システム及び/又はその環境の時系列の測定値を含み、
-前記観測値のセットに基づいて前記モデルをトレーニングするように構成され、
前記トレーニングすることは、
-時系列予測を行うために前記モデルを使用することであって、先行時点におけるSDE変数のセットの値に基づいて現時点におけるSDE変数のセットの値を予測するために、前記SDEを使用することを含む、ことと、
-前記時系列予測を観測値のセットの観測値と比較することによってトレーニング信号を導出することと、
-前記トレーニング信号に基づいて少なくとも前記ドリフト成分のトレーニング可能な部分のパラメータのセットを少なくとも調整することと、
を含み、
前記プロセッササブシステム(140)は、トレーニングのための入力として、前記SDEの前記ドリフト成分の事前定義された部分を受信するようにさらに構成され、
前記現時点におけるSDE変数のセットの値を予測することは、
第1のドリフトを得るために前記ドリフト成分の事前定義された部分を評価することと、
前記第1のドリフトを、前記ドリフト成分の前記トレーニング可能な部分を評価することによって取得された第2のドリフトと組み合わせることと、
を含み、
前記第1のドリフトと前記第2のドリフトとを組み合わせることは、前記第1のドリフトの値と前記第2のドリフトの対応する値とを重み値に従って組み合わせることを含み、前記重み値は、前記組合せにおける前記ドリフト成分の前記事前定義された部分の重みを示し、前記トレーニングすることは、前記トレーニング信号に基づいて前記重み値を調整することをさらに含む、システム(100)。 - コンピュータ制御システムを制御及び/又は監視するためにコンピュータ制御システムの時系列予測を行うためのトレーニングされたモデルを使用するためのシステム(200)であって、前記モデルは、SDE変数のセットの確率微分方程式(SDE)を使用し、前記SDEは、ドリフト成分及び拡散成分を含み、
前記システムは、
-前記モデルを定義し、少なくとも前記SDEのドリフト成分のトレーニングされた部分のパラメータのセットを含むモデルデータ(040)にアクセスするためのデータインタフェース(220)と、
-プロセッササブシステム(240)と、
を含み、
前記プロセッササブシステム(240)は、
-前記コンピュータ制御システム及び/又はその環境の測定値を表すセンサデータを取得し、
-前記測定値に基づいて前記コンピュータ制御システムの時系列予測を決定し、先行時点におけるSDE変数のセットの値に基づいて現時点におけるSDE変数のセットの値を予測するために、前記SDEを使用することを含み、
-決定された時系列予測に基づいて、前記コンピュータ制御システムの制御及び/又は監視する際に使用するための出力データを生成する
ように構成され、
前記モデルデータは、前記SDEの前記ドリフト成分の事前定義された部分をさらに定義し、
前記現時点におけるSDE変数のセットの値を予測することは、
第1のドリフトを得るために前記ドリフト成分の事前定義された部分を評価することと、
前記第1のドリフトを、前記ドリフト成分の前記トレーニング可能な部分を評価することによって取得された第2のドリフトと組み合わせることと、
を含み、
前記第1のドリフトと前記第2のドリフトとを組み合わせることは、前記第1のドリフトの値と前記第2のドリフトの対応する値とを重み値に従って組み合わせることを含み、前記重み値は、前記組合せにおける前記ドリフト成分の前記事前定義された部分の重みを示す、システム(200)。 - 一時的又は非一時的データを含むコンピュータ可読媒体(700)であって、
前記データは、
-プロセッサシステムによって実行されるときに、前記プロセッサシステムに、請求項1乃至6のいずれか一項に記載のコンピュータ実装方法を実行させる命令と、
-プロセッサシステムによって実行されるときに、前記プロセッサシステムに、請求項7乃至11のいずれか一項に記載のコンピュータ実装方法を実行させる命令と、
-コンピュータ制御システムの時系列予測を行うためのトレーニングされたモデルと、のうちの1つ以上を表し、
前記モデルは、SDE変数のセットの確率微分方程式(SDE)を使用し、前記SDEは、ドリフト成分及び拡散成分を含み、前記モデルは、先行時点におけるSDE変数のセットの値に基づいて現時点におけるSDE変数のセットの値を予測するために前記SDEを使用することにより、測定値に基づいて前記コンピュータ制御システムの時系列予測を行うように構成され、第1のドリフトを得るために前記ドリフト成分の事前定義された部分を評価し、前記第1のドリフトを、前記ドリフト成分の前記トレーニング可能な部分を評価することによって取得された第2のドリフトと組み合わせることを含む、
コンピュータ可読媒体(700)。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP20180249 | 2020-06-16 | ||
| EP20180249.3A EP3926420B1 (en) | 2020-06-16 | 2020-06-16 | Making time-series predictions of a computer-controlled system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021197189A JP2021197189A (ja) | 2021-12-27 |
| JP7728107B2 true JP7728107B2 (ja) | 2025-08-22 |
Family
ID=71105218
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021099178A Active JP7728107B2 (ja) | 2020-06-16 | 2021-06-15 | コンピュータ制御システムの時系列予測の実行 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US11868887B2 (ja) |
| EP (1) | EP3926420B1 (ja) |
| JP (1) | JP7728107B2 (ja) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12001949B2 (en) | 2018-09-05 | 2024-06-04 | Sartorius Stedim Data Analytics Ab | Computer-implemented method, computer program product and system for data analysis |
| EP4290412A3 (en) | 2018-09-05 | 2024-01-03 | Sartorius Stedim Data Analytics AB | Computer-implemented method, computer program product and system for data analysis |
| EP4016202B1 (de) * | 2020-12-15 | 2023-11-22 | Siemens Aktiengesellschaft | Verfahren zum nachbilden von rauschanteilen von verlustbehaftet aufgezeichneten betriebssignalen sowie steuereinrichtung |
| JP7444186B2 (ja) * | 2022-03-22 | 2024-03-06 | 横河電機株式会社 | モデル検証装置、モデル検証方法、および、モデル検証プログラム |
| EP4627417A1 (en) * | 2022-12-02 | 2025-10-08 | Normal Computing Corporation | Thermodynamic artificial intelligence for generative diffusion models and bayesian deep learning |
| WO2024180613A1 (ja) * | 2023-02-27 | 2024-09-06 | 日本電気株式会社 | 拡散係数推定装置、制御装置、拡散係数推定方法及びプログラム |
| WO2024212160A1 (en) * | 2023-04-13 | 2024-10-17 | Robert Bosch Gmbh | Method and apparatus for diffusion model |
| US20240391095A1 (en) * | 2023-05-25 | 2024-11-28 | Mitsubishi Electric Research Laboratories, Inc. | System and method for controlling a mechanical system with multiple degrees of freedom |
| US20250111552A1 (en) * | 2023-09-28 | 2025-04-03 | Nvidia Corporation | System and method for efficient text-guided generation of high-resolution videos |
| DE102023211083A1 (de) * | 2023-11-08 | 2025-05-08 | Robert Bosch Gesellschaft mit beschränkter Haftung | Computerimplementiertes verfahren zur bestimmung eines surrogatmodells eines zustandsraummodells |
| CN118035926B (zh) * | 2024-04-11 | 2024-06-18 | 合肥工业大学 | 基于多元数据扩散的模型训练、水检测方法及系统 |
| CN118230559B (zh) * | 2024-05-27 | 2024-08-13 | 山东金宇信息科技集团有限公司 | 一种用于隧道的交通事件感知管控方法、设备及介质 |
| CN120431956A (zh) * | 2024-12-31 | 2025-08-05 | 荣耀终端股份有限公司 | 一种音频分离方法及相关设备 |
| CN119692257B (zh) * | 2025-02-25 | 2025-06-13 | 安世亚太科技股份有限公司 | 一种流体系统动态行为的高精度预测方法 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2016135514A1 (en) | 2015-02-27 | 2016-09-01 | Energy Technologies Institute Llp | Method and apparatus for controlling an environment management system within a building |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6532454B1 (en) * | 1998-09-24 | 2003-03-11 | Paul J. Werbos | Stable adaptive control using critic designs |
| US20130325774A1 (en) * | 2012-06-04 | 2013-12-05 | Brain Corporation | Learning stochastic apparatus and methods |
| US10565329B2 (en) * | 2014-06-30 | 2020-02-18 | Evolving Machine Intelligence Pty Ltd | System and method for modelling system behaviour |
| EP3933713B1 (en) * | 2017-04-14 | 2025-06-04 | DeepMind Technologies Limited | Distributional reinforcement learning |
| US20190259095A1 (en) * | 2018-02-20 | 2019-08-22 | Southwest Business Corporation | Determining present and future virtual balances for a client computing device |
| US10600005B2 (en) * | 2018-06-01 | 2020-03-24 | Sas Institute Inc. | System for automatic, simultaneous feature selection and hyperparameter tuning for a machine learning model |
| CN109299429A (zh) * | 2018-07-11 | 2019-02-01 | 重庆邮电大学 | 一种基于维纳过程的动态社会关系建模方法 |
| GB201908532D0 (en) * | 2019-06-13 | 2019-07-31 | Microsoft Technology Licensing Llc | Collecting observations for machine learning |
-
2020
- 2020-06-16 EP EP20180249.3A patent/EP3926420B1/en active Active
-
2021
- 2021-06-07 US US17/340,978 patent/US11868887B2/en active Active
- 2021-06-15 JP JP2021099178A patent/JP7728107B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2016135514A1 (en) | 2015-02-27 | 2016-09-01 | Energy Technologies Institute Llp | Method and apparatus for controlling an environment management system within a building |
| JP2018506807A (ja) | 2015-02-27 | 2018-03-08 | エナジー テクノロジーズ インスティテュート エルエルピー | 建物内の環境管理システムを制御するための方法および装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| US11868887B2 (en) | 2024-01-09 |
| JP2021197189A (ja) | 2021-12-27 |
| US20210397955A1 (en) | 2021-12-23 |
| EP3926420A1 (en) | 2021-12-22 |
| EP3926420B1 (en) | 2023-11-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7728107B2 (ja) | コンピュータ制御システムの時系列予測の実行 | |
| CN111796514B (zh) | 基于所训练的贝叶斯神经网络来控制和监视物理系统 | |
| CN115668072B (zh) | 随机预测控制的非线性优化方法 | |
| US20240220774A1 (en) | Deep reinforcement learning with fast updating recurrent neural networks and slow updating recurrent neural networks | |
| CN113627602B (zh) | 预测计算机控制实体的状态 | |
| CN111665747B (zh) | 基于推断状态对物理系统的控制 | |
| US10860927B2 (en) | Stacked convolutional long short-term memory for model-free reinforcement learning | |
| EP3772707A1 (en) | Dynamics model for globally stable modeling of system dynamics | |
| US12536351B2 (en) | Motion planning | |
| JP2026500447A (ja) | ニューラルネットワークモデルを用いた高次元物理システムの次数低減モデル化および制御 | |
| KR20230119023A (ko) | 단기 기억 장치가 있는 어텐션 신경망 | |
| CN114722995A (zh) | 训练神经随机微分方程的神经漂移网络和神经扩散网络的设备和方法 | |
| Park et al. | Gaussian process online learning with a sparse data stream | |
| Mitra et al. | Formal verification techniques for vision-based autonomous systems–a survey | |
| Pozzi et al. | Imitation learning-driven approximation of stochastic control models | |
| Maddu et al. | STENCIL-NET: data-driven solution-adaptive discretization of partial differential equations | |
| US20250371223A1 (en) | Simulating physical environments with discontinuous dynamics using graph neural networks | |
| Li et al. | A customizable neural network based framework for autonomous vehicle control with human-guided learning | |
| Farahmand et al. | Truncated approximate dynamic programming with task-dependent terminal value | |
| Deshpande et al. | An algorithm to create model file for Partially Observable Markov Decision Process for mobile robot path planning | |
| Zhou et al. | Autonomous Vehicle Path Tracking Using Event‐Triggered MPC With Switching Model: Methodology and Real‐World Validation | |
| Berger et al. | RAnGE: Reachability analysis for guaranteed ergodicity | |
| MONTE | Department of Electrical Engineering and Computer Science | |
| Dyro | Optimization-Driven Autonomous Driving: Control, Intent, and Testing | |
| JP2025517212A (ja) | エージェントの連続時間相互作用モデリングのためのデバイス及びコンピュータ実装された方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240530 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250319 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250422 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250718 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250807 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250812 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7728107 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |