JP2022023775A - 強化学習モデルを構築するための方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム - Google Patents
強化学習モデルを構築するための方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2022023775A JP2022023775A JP2021055392A JP2021055392A JP2022023775A JP 2022023775 A JP2022023775 A JP 2022023775A JP 2021055392 A JP2021055392 A JP 2021055392A JP 2021055392 A JP2021055392 A JP 2021055392A JP 2022023775 A JP2022023775 A JP 2022023775A
- Authority
- JP
- Japan
- Prior art keywords
- coal supply
- model
- reinforcement learning
- temperature
- simulated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C04—CEMENTS; CONCRETE; ARTIFICIAL STONE; CERAMICS; REFRACTORIES
- C04B—LIME, MAGNESIA; SLAG; CEMENTS; COMPOSITIONS THEREOF, e.g. MORTARS, CONCRETE OR LIKE BUILDING MATERIALS; ARTIFICIAL STONE; CERAMICS; REFRACTORIES; TREATMENT OF NATURAL STONE
- C04B7/00—Hydraulic cements
- C04B7/36—Manufacture of hydraulic cements in general
- C04B7/361—Condition or time responsive control in hydraulic cement manufacturing processes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F27—FURNACES; KILNS; OVENS; RETORTS
- F27B—FURNACES, KILNS, OVENS, OR RETORTS IN GENERAL; OPEN SINTERING OR LIKE APPARATUS
- F27B7/00—Rotary-drum furnaces, i.e. horizontal or slightly inclined
- F27B7/20—Details, accessories, or equipment peculiar to rotary-drum furnaces
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F27—FURNACES; KILNS; OVENS; RETORTS
- F27B—FURNACES, KILNS, OVENS, OR RETORTS IN GENERAL; OPEN SINTERING OR LIKE APPARATUS
- F27B7/00—Rotary-drum furnaces, i.e. horizontal or slightly inclined
- F27B7/20—Details, accessories, or equipment peculiar to rotary-drum furnaces
- F27B7/42—Arrangement of controlling, monitoring, alarm or like devices
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F27—FURNACES; KILNS; OVENS; RETORTS
- F27D—DETAILS OR ACCESSORIES OF FURNACES, KILNS, OVENS, OR RETORTS, IN SO FAR AS THEY ARE OF KINDS OCCURRING IN MORE THAN ONE KIND OF FURNACE
- F27D19/00—Arrangements of controlling devices
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F27—FURNACES; KILNS; OVENS; RETORTS
- F27D—DETAILS OR ACCESSORIES OF FURNACES, KILNS, OVENS, OR RETORTS, IN SO FAR AS THEY ARE OF KINDS OCCURRING IN MORE THAN ONE KIND OF FURNACE
- F27D21/00—Arrangements of monitoring devices; Arrangements of safety devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F27—FURNACES; KILNS; OVENS; RETORTS
- F27D—DETAILS OR ACCESSORIES OF FURNACES, KILNS, OVENS, OR RETORTS, IN SO FAR AS THEY ARE OF KINDS OCCURRING IN MORE THAN ONE KIND OF FURNACE
- F27D19/00—Arrangements of controlling devices
- F27D2019/0096—Arrangements of controlling devices involving simulation means, e.g. of the treating or charging step
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/08—Thermal analysis or thermal optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Mechanical Engineering (AREA)
- Geometry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Chemical & Material Sciences (AREA)
- Ceramic Engineering (AREA)
- Materials Engineering (AREA)
- Structural Engineering (AREA)
- Organic Chemistry (AREA)
- Feedback Control In General (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Curing Cements, Concrete, And Artificial Stone (AREA)
Abstract
Description
ステップ201、分解炉石炭供給量と分解炉温度との間の第1模擬モデルを確立し、
このステップの目的は、強化学習モデルを構築するための方法の実行主体(例えば図1に示すようなサーバ105)により分解炉石炭供給量と分解炉温度との間の第1模擬モデルを確立することである。
y(k) = a*y(k-1)+b*u(k-1)
式中、y(k)は時間kでの分解炉温度であり、y(k-1)とu(k-1)はそれぞれ時間k-1(即ち時間kの前の時間)の分解温度と分解炉石炭供給量であり、aとbはそれぞれ未定係数であり、具体な値は、歴史データに基づく最小二乘法を使用して計算でき、例えばある実験シーンで、aは0.983であり、bは0.801である。
このステップの目的は、上記実行主体によりキルンヘッド石炭供給量とキルン電流、二次空気温度、及び煙室温度の間の第2模擬モデルを確立することである。
ステップ201、ステップ202のうえで、このステップの目的は、上記実行主体により火格子圧力、第1模擬モデルから出力された分解炉温度、第2模擬モデルから出力されたキルン電流、二次空気温度、煙室温度及び遊離カルシウム含有量の間の予測モデルを確立する。
ステップ301、分解炉石炭供給量と分解炉温度との間の第1模擬モデルを確立し、
ステップ302、キルンヘッド石炭供給量とキルン電流、二次空気温度、及び煙室温度の間の第2模擬モデルを確立し、
ステップ303、火格子圧力、第1模擬モデルから出力された分解炉温度、第2模擬モデルから出力されたキルン電流、二次空気温度、煙室温度及び遊離カルシウム含有量の間の予測モデルを確立し、
ステップ304、第1模擬モデル、第2模擬モデル及び予測モデルを、予め設定された強化学習モデルアーキテクチャに従って石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築し、
以上のステップ301-304は図2に示すようなステップ201-204と一致し、上記ステップは強化学習モデルの構築プロセスとしてまとめられることができ、同じ部分の内容は前の実施例の対応する部分を参照し、ここで繰り返して説明しない。
ステップ304で使用可能な強化学習モデルを構築したうえで、このステップの目的は、上記実行主体によりユーザーが目標シーンで設定した目標遊離カルシウム含有量を受信することである。このステップは、強化学習モデルがセメント焼成をガイドする時の石炭供給量の使用プロセスのステップ1として、即ち設定されたクリンカー品質指標を取得する。
ステップ305のうえで、このステップの目的は、上記実行主体により強化学習モデルを使用して目標遊離カルシウム含有量に対応する理論的な石炭供給量を確定することであり、即ち強化学習モデルは石炭供給量と遊離カルシウム含有量との間の対応関係を特徴付けることができるため、目標遊離カルシウム含有量を設定した場合で、該対応関係に応じて対応する理論的な石炭供給量を逆に推定することができ、理論的な石炭供給量は理論的な分解炉石炭供給量と理論的なキルンヘッド石炭供給量を含む。
分解炉温度について、
現在の分解炉温度を取得して、且つ第1模擬モデルに従って現在の分解炉温度に対応する模擬分解炉石炭供給量を確定し、
模擬分解炉石炭供給量と理論的な分解炉石炭供給量との間の第1差が第1予め設定された閾値を超えることに応答し、第1差の正負に応じて分解炉の温度を調整して制御する。
現在のキルン電流、二次空気温度、煙室温度を取得し、且つ第2模擬モデルに従って現在のキルン電流、二次空気温度、煙室温度に対応する模擬キルンヘッド石炭供給量を確定し、
模擬キルンヘッド石炭供給量と理論的なキルンヘッド石炭供給量との間の第2差が第2予め設定された閾値を超えることに応答し、第2差に応じてキルン電流、二次空気温度、煙室温度を調整する。
遊離カルシウム含有量は、生産プロセスで約1時間に1回測定され、石炭供給量などのパラメーターをリアルタイムで制御して調整する必要があるため、遊離カルシウム含有量のリアルタイム予測モデルを確立する必要がある。遊離カルシウム含有量は、主に分解炉温度、キルン電流、二次空気温度、煙室温度、火格子圧力に関連する必要があるため、確立されたモデルは、
遊離カルシウム含有量 = f(分解炉温度、キルン電流、二次空気温度、煙室温度、火格子圧力)であり、実験では、大量の歴史データでfをフィットし、本実施例は、具体的に大量の歴史データを神経ネットワークによって該予測モデルを構築する。
強化学習モデルを通じてパラメーターを調整したいと、セメント焼成プロセスの模擬モデルの構築に必要である。即ち、石炭供給量が調整された後、分解炉温度、キルン電流、二次空気温度、煙室温度などの被制御変数は焼成プロセスに如何に変化するかである。業界では、一次慣性モデルとヒステリシスリンクを使用して、大きな慣性と純粋なヒステリシスを持つ複雑な産業システムを模擬する。関連する専門家の情報を参照した後、分解炉の温度は主に分解炉石炭供給量に関連し、キルン電流、二次空気温度、煙室温度は主にキルンヘッド石炭供給量に関連する。分解炉温度が分解炉石炭供給量に関連するシステムモデル、キルン電流、二次空気温度、煙室温度がキルンヘッド石炭供給量に関連するシステムモデルを確立することができる。
上記ステップで構築された模擬モデルと予測モデルを使用すると、強化学習モデルを簡単に確立できる。本実施例は、具体的にActor-critic強化学習モデルを使用し、分解炉石炭供給量、キルンヘッド石炭供給量、火格子圧力の3つの調整可能なパラメーターを強化学習モデルのAction(動作)として、焼成プロセス中の他のパラメーターを一時的に無視し、最終的な遊離カルシウム含有量が1%-1.5%であることを確保すると同時に、原材料供給量が一定である場合、分解炉石炭供給量、キルンヘッド石炭供給量をできるだけ少なくすることを目標とする。石炭の消費の測定基準は、総石炭供給量/原材料供給量であり、ここで、原材料供給量の速度は一定、即ち単位時間内あたりの原材料供給量は一定であると仮定しているため、石炭の消費は分解炉石炭供給量、キルンヘッド石炭供給量のみを考慮する必要がある。
Action(動作)、3次元ベクトルであり、3次元連続したactionであり、それぞれ分解炉石炭供給量、キルンヘッド石炭供給量、火格子圧力値である。即ち常にこの3つのパラメーターを出力して制御し、
State(状態)、1つの14次元(t-2に対応する部分のパラメーターを削減した後に10次元である)ベクトルであり、それぞれ分解炉温度t-2(削減可能)、t-1、t時間の値、キルン電流、二次空気温度と煙室温度のt-2(削減可能)、t-1、t時間の値、火格子圧力の現在の値、上記ステップによって構築された遊離カルシウム含有量予測モデルによる遊離カルシウム含有量の予測値である。毎回1つのActionを実行した後、Stateは模擬環境を通じて更新し、
Reward(報酬/報酬値)、品質を確保しながら石炭消費量を削減することが目標であるため、Rewardは2つの部分、即ち遊離カルシウム含有量が目標値範囲内にあるかどうかと現在の石炭供給量に分けられる。即ちReward = -(キルンヘッド石炭供給量+分解炉石炭供給量)+100*I_({1%≦実際の遊離カルシウム含有量≦1.5%})であり、Iは指標関数であり、1%≦実際の遊離カルシウム含有量≦1.5%である場合、Iの取る値は1であり、そうでないと、Iの取る値は0である。
強化学習モデルを使用して目標遊離カルシウム含有量に対応する理論的な石炭供給量を確定し、理論的な石炭供給量は理論的な分解炉石炭供給量と理論的なキルンヘッド石炭供給量を含むように配置される理論的な石炭供給量確定ユニットと、
理論的な石炭供給量に応じて目標シーンでの分解炉石炭供給操作とキルンヘッド石炭供給操作をガイドするように配置される石炭供給操作ガイドユニットと、を備えてもよい。
現在の分解炉温度を取得して、且つ第1模擬モデルに従って現在の分解炉温度に対応する模擬分解炉石炭供給量を確定するように配置される模擬分解炉温度確定ユニットと、
模擬分解炉石炭供給量と理論的な分解炉石炭供給量との間の第1差が第1予め設定された閾値を超えることに応答し、第1差の正負に応じて分解炉の温度を調整するように配置される第1調整制御ユニットと、を備えてもよい。
現在のキルン電流、二次空気温度、煙室温度を取得し、且つ第2模擬モデルに従って現在のキルン電流、二次空気温度、煙室温度に対応する模擬キルンヘッド石炭供給量を確定するように配置される模擬キルンヘッド石炭供給量確定ユニットと、
模擬キルンヘッド石炭供給量と理論的なキルンヘッド石炭供給量との間の第2差が第2予め設定された閾値を超えることに応答し、第2差に応じてキルン電流、二次空気温度、煙室温度を調整するように配置される第2調整制御ユニットと、を備えてもよい。
Actor-Critic強化学習モデルアーキテクチャに従って石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築するように配置されるA2C強化学習モデル構築サブユニットを備えてもよい。
分解炉石炭供給量、キルンヘッド石炭供給量、火格子圧力を3次元ベクトルで示されるActionとして構築するように配置されるAction配置モジュールと、
少なくとも前の時間の分解炉温度、キルン電流、二次空気温度、煙室温度、現在の時間の分解炉温度、キルン電流、二次空気温度、煙室温度、火格子圧力、及び予測モデルから出力された遊離カルシウム含有量の予測値をそれぞれ1つの次元として、10次元ベクトルで示されるStateとして構築し、毎回1つのActionを実行した後、Stateは予め設定された模擬環境を通じて更新するように配置されるState配置モジュールと、
出力された遊離カルシウム含有量の予測値が予め設定された目標値範囲にあるかどうかと現在の石炭供給量をRewardとするように配置されるReward配置モジュールと、
Action、State及びRewardに基づいて石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築するように配置されるA2C強化学習モデル構築モジュールと、を備える。
Claims (15)
- 強化学習モデルを構築するための方法であって、
分解炉石炭供給量と分解炉温度との間の第1模擬モデルを確立するステップと、
キルンヘッド石炭供給量とキルン電流、二次空気温度、及び煙室温度の間の第2模擬モデルを確立するステップと、
火格子圧力、前記第1模擬モデルから出力された分解炉温度及び前記第2模擬モデルから出力されたキルン電流、二次空気温度、煙室温度及び遊離カルシウム含有量の間の予測モデルを確立するステップと、
前記第1模擬モデル、前記第2模擬モデル及び前記予測モデルを、予め設定された強化学習モデルアーキテクチャに従って石炭供給量と遊離カルシウム含有量の間の関連を特徴付ける強化学習モデルを構築し、前記石炭供給量は分解炉石炭供給量とキルンヘッド石炭供給量を含むステップと、を含む強化学習モデルを構築するための方法。 - 目標シーンで所定の目標遊離カルシウム含有量を受信するステップと、
前記強化学習モデルを使用して前記目標遊離カルシウム含有量に対応する理論的な石炭供給量を確定し、前記理論的な石炭供給量は理論的な分解炉石炭供給量と理論的なキルンヘッド石炭供給量を含むステップと、
前記理論的な石炭供給量に従って前記目標シーンでの分解炉石炭供給操作とキルンヘッド石炭供給操作をガイドするステップと、をさらに含む請求項1に記載の方法。 - 現在の分解炉温度を取得し、且つ前記第1模擬モデルに従って現在の分解炉温度に対応する模擬分解炉石炭供給量を確定するステップと、
前記模擬分解炉石炭供給量と前記理論的な分解炉石炭供給量との間の第1差が第1予め設定された閾値を超えることに応答し、前記第1差の正負に応じて分解炉の温度を調整して制御するステップと、をさらに含む請求項2に記載の方法。 - 現在のキルン電流、二次空気温度、煙室温度を取得し、且つ前記第2模擬モデルに従って現在のキルン電流、二次空気温度、煙室温度に対応する模擬キルンヘッド石炭供給量を確定するステップと、
前記模擬キルンヘッド石炭供給量と前記理論的なキルンヘッド石炭供給量との間の第2差が第2予め設定された閾値を超えることに応答し、前記第2差に応じて前記キルン電流、前記二次空気温度、前記煙室温度を調整するステップと、をさらに含む請求項2に記載の方法。 - 前記の予め設定された強化学習モデルアーキテクチャに従って石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築するステップは、
Actor-Critic強化学習モデルアーキテクチャに従って石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築するステップを含む請求項1~4のいずれかに記載の方法。 - 前記のActor-Critic強化学習モデルアーキテクチャに従って石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築するステップは、
Actor-Critic強化学習モデルアーキテクチャに従って石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築するステップと、
少なくとも前の時間の分解炉温度、キルン電流、二次空気温度、煙室温度、現在の時間の分解炉温度、キルン電流、二次空気温度、煙室温度、火格子圧力、及び前記予測モデルから出力された遊離カルシウム含有量の予測値をそれぞれ1つの次元として、10次元ベクトルで示されるStateとして構築し、毎回1つのActionを実行した後、Stateは予め設定された模擬環境を通じて更新するステップと、
出力された遊離カルシウム含有量の予測値が予め設定された目標値範囲にあるかどうかと現在の石炭供給量をRewardとするステップと、
Action、State及びRewardに基づいて石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築するステップと、を含む請求項5に記載の方法。 - 強化学習モデルを構築するための装置であって、
分解炉石炭供給量と分解炉温度との間の第1模擬モデルを確立するように配置される第1模擬モデル確立ユニットと、
キルンヘッド石炭供給量とキルン電流、二次空気温度、及び煙室温度の間の第2模擬モデルを確立するように配置される第2模擬モデル確立ユニットと、
成火格子圧力、前記第1模擬モデルから出力された分解炉温度及び前記第2模擬モデルから出力されたキルン電流、二次空気温度、煙室温度及び遊離カルシウム含有量の間の予測モデルを確立するように配置される予測モデル確立ユニットと、
前記第1模擬モデル、前記第2模擬モデル及び前記予測モデルを、予め設定された強化学習モデルアーキテクチャに従って石炭供給量と遊離カルシウム含有量の間の関連を特徴付ける強化学習モデルを構築し、前記石炭供給量は分解炉石炭供給量とキルンヘッド石炭供給量を含むように配置される強化学習モデル構築ユニットと、を備える強化学習モデルを構築するための装置。 - 目標シーンで所定の目標遊離カルシウム含有量を受信するように配置される所定のパラメーター受信ユニットと、
前記強化学習モデルを使用して前記目標遊離カルシウム含有量に対応する理論的な石炭供給量を確定し、前記理論的な石炭供給量は理論的な分解炉石炭供給量と理論的なキルンヘッド石炭供給量を含むように配置される理論的な石炭供給量確定ユニットと、
前記理論的な石炭供給量に従って前記目標シーンでの分解炉石炭供給操作とキルンヘッド石炭供給操作をガイドするように配置される石炭供給操作ガイドユニットと、をさらに備える請求項7に記載の装置。 - 現在の分解炉温度を取得し、且つ前記第1模擬モデルに従って現在の分解炉温度に対応する模擬分解炉石炭供給量を確定するように配置される模擬分解炉温度確定ユニットと、
前記模擬分解炉石炭供給量と前記理論的な分解炉石炭供給量との間の第1差が第1予め設定された閾値を超えることに応答し、前記第1差の正負に応じて分解炉の温度を調整して制御するように配置される第1調整制御ユニットと、をさらに備える請求項8に記載の装置。 - 現在のキルン電流、二次空気温度、煙室温度を取得し、且つ前記第2模擬モデルに従って現在のキルン電流、二次空気温度、煙室温度に対応する模擬キルンヘッド石炭供給量を確定するように配置される模擬キルンヘッド石炭供給量確定ユニットと、
前記模擬キルンヘッド石炭供給量と前記理論的なキルンヘッド石炭供給量との間の第2差が第2予め設定された閾値を超えることに応答し、前記第2差に応じて前記キルン電流、前記二次空気温度、前記煙室温度を調整するように配置される第2調整制御ユニットと、をさらに備える請求項8に記載の装置。 - 前記強化学習モデル構築ユニットは、
Actor-Critic強化学習モデルアーキテクチャに従って石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築するように配置されるA2C強化学習モデル構築サブユニットを備える請求項7~10のいずれかに記載の装置。 - 前記A2C強化学習モデル構築サブユニットは、
Actor-Critic強化学習モデルアーキテクチャに従って石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築するように配置されるAction配置モジュールと、
少なくとも前の時間の分解炉温度、キルン電流、二次空気温度、煙室温度、現在の時間の分解炉温度、キルン電流、二次空気温度、煙室温度、火格子圧力、及び前記予測モデルから出力された遊離カルシウム含有量の予測値をそれぞれ1つの次元として、10次元ベクトルで示されるStateとして構築し、毎回1つのActionを実行した後、Stateは予め設定された模擬環境を通じて更新するように配置されるState配置モジュールと、
出力された遊離カルシウム含有量の予測値が予め設定された目標値範囲にあるかどうかと現在の石炭供給量をRewardとするように配置されるReward配置モジュールと、
Action、State及びRewardに基づいて石炭供給量と遊離カルシウム含有量との間の関連を特徴付ける強化学習モデルを構築するように配置されるA2C強化学習モデル構築モジュールと、をさらに備える請求項11に記載の装置。 - 電子デバイスであって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されるメモリと、を備え、
前記メモリに前記少なくとも1つのプロセッサによって実行されることができる命令が記憶され、前記命令は前記少なくとも1つのプロセッサによって実行され、前記少なくとも1つのプロセッサに請求項1-6のいずれかに記載の強化学習モデルを構築するための方法を実行させることができる電子デバイス。 - コンピュータ命令が記憶された非一時的なコンピュータ可読記憶媒体であって、前記コンピュータ命令は前記コンピュータに請求項1-6のいずれかに記載の強化学習モデルを構築するための方法を実行するために使用されるコンピュータ可読記憶媒体。
- コンピュータプログラムであって、前記コンピュータプログラムはプロセッサにより実行されると、請求項1-6のいずれかに記載の強化学習モデルを構築するための方法を実行するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010948561.XA CN112100916B (zh) | 2020-09-10 | 2020-09-10 | 用于构建强化学习模型的方法、装置、电子设备及介质 |
CN202010948561.X | 2020-09-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022023775A true JP2022023775A (ja) | 2022-02-08 |
JP7257436B2 JP7257436B2 (ja) | 2023-04-13 |
Family
ID=73750827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021055392A Active JP7257436B2 (ja) | 2020-09-10 | 2021-03-29 | 強化学習モデルを構築するための方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210216686A1 (ja) |
EP (1) | EP3872432B1 (ja) |
JP (1) | JP7257436B2 (ja) |
KR (1) | KR102506122B1 (ja) |
CN (1) | CN112100916B (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7348451B2 (ja) | 2019-12-02 | 2023-09-21 | トヨタ車体株式会社 | 車体下部補強構造 |
CN113656945B (zh) * | 2021-07-19 | 2024-06-07 | 首钢京唐钢铁联合有限责任公司 | 一种板坯燃耗确定方法、装置、服务器及存储介质 |
CN113657484B (zh) * | 2021-08-13 | 2024-02-09 | 济南大学 | 水泥篦冷机典型工况划分与识别的方法 |
CN113673112B (zh) * | 2021-08-27 | 2024-08-20 | 西安热工研究院有限公司 | 一种水电联产机组制水生产成本确定方法及系统 |
CN114585004B (zh) * | 2022-03-03 | 2023-04-25 | 南京信息工程大学 | 一种基于Actor-Critic算法的多智能体异构网络资源优化方法 |
CN114622912B (zh) * | 2022-03-17 | 2022-12-27 | 中国矿业大学 | 一种采煤机智能控制装置及其控制方法 |
CN114742312A (zh) * | 2022-04-26 | 2022-07-12 | 西安热工研究院有限公司 | 一种磨煤机堵煤预警方法、装置、电子设备及存储介质 |
CN115186582B (zh) * | 2022-07-05 | 2023-04-18 | 科大智能物联技术股份有限公司 | 一种基于机器学习模型的轧钢加热炉控制方法 |
CN116199441A (zh) * | 2022-12-09 | 2023-06-02 | 中国中材国际工程股份有限公司 | 基于数据和规则双驱动的分解炉出口温度目标值确定方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6790034B1 (en) * | 1999-11-04 | 2004-09-14 | Pretoria Portland Cement Company Limited | Kiln plant control system |
CN106202946A (zh) * | 2016-07-18 | 2016-12-07 | 燕山大学 | 基于深度信念网络模型的水泥熟料游离钙含量预测方法 |
JP2017066020A (ja) * | 2015-09-30 | 2017-04-06 | 太平洋セメント株式会社 | フライアッシュセメントの品質または製造条件の予測方法 |
CN109147878A (zh) * | 2018-10-08 | 2019-01-04 | 燕山大学 | 一种水泥熟料游离钙软测量方法 |
CN109165798A (zh) * | 2018-10-19 | 2019-01-08 | 燕山大学 | 一种水泥熟料游离氧化钙含量在线预测方法及系统 |
CN109761517A (zh) * | 2019-03-13 | 2019-05-17 | 安徽海螺集团有限责任公司 | 一种基于游离钙预测数据控制熟料生产的方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1014240A1 (en) * | 1998-12-17 | 2000-06-28 | Siemens Aktiengesellschaft | A system of case-based reasoning for sensor prediction in a technical process, especially in a cement kiln, method and apparatus therefore |
US8095479B2 (en) * | 2006-02-28 | 2012-01-10 | Hitachi, Ltd. | Plant control apparatus and method having functions of determining appropriate learning constraint conditions |
US7660639B2 (en) * | 2006-03-27 | 2010-02-09 | Hitachi, Ltd. | Control system for control subject having combustion unit and control system for plant having boiler |
JP6639988B2 (ja) * | 2016-03-29 | 2020-02-05 | 太平洋セメント株式会社 | セメントクリンカーの製造条件の予測方法 |
CN106570244B (zh) * | 2016-10-25 | 2019-07-30 | 浙江邦业科技股份有限公司 | 一种预测水泥回转窑熟料质量的一维仿真方法 |
CN110187727B (zh) * | 2019-06-17 | 2021-08-03 | 武汉理工大学 | 一种基于深度学习和强化学习的玻璃熔炉温度控制方法 |
CN111061149B (zh) * | 2019-07-01 | 2022-08-02 | 浙江恒逸石化有限公司 | 基于深度学习预测控制优化的循环流化床节煤降耗的方法 |
CN110981240B (zh) * | 2019-12-19 | 2022-04-08 | 华东理工大学 | 煅烧过程优化方法和系统 |
-
2020
- 2020-09-10 CN CN202010948561.XA patent/CN112100916B/zh active Active
-
2021
- 2021-03-24 EP EP21164660.9A patent/EP3872432B1/en active Active
- 2021-03-29 US US17/215,932 patent/US20210216686A1/en active Pending
- 2021-03-29 JP JP2021055392A patent/JP7257436B2/ja active Active
- 2021-04-20 KR KR1020210051391A patent/KR102506122B1/ko active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6790034B1 (en) * | 1999-11-04 | 2004-09-14 | Pretoria Portland Cement Company Limited | Kiln plant control system |
JP2017066020A (ja) * | 2015-09-30 | 2017-04-06 | 太平洋セメント株式会社 | フライアッシュセメントの品質または製造条件の予測方法 |
CN106202946A (zh) * | 2016-07-18 | 2016-12-07 | 燕山大学 | 基于深度信念网络模型的水泥熟料游离钙含量预测方法 |
CN109147878A (zh) * | 2018-10-08 | 2019-01-04 | 燕山大学 | 一种水泥熟料游离钙软测量方法 |
CN109165798A (zh) * | 2018-10-19 | 2019-01-08 | 燕山大学 | 一种水泥熟料游离氧化钙含量在线预测方法及系统 |
CN109761517A (zh) * | 2019-03-13 | 2019-05-17 | 安徽海螺集团有限责任公司 | 一种基于游离钙预测数据控制熟料生产的方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20210052412A (ko) | 2021-05-10 |
JP7257436B2 (ja) | 2023-04-13 |
KR102506122B1 (ko) | 2023-03-03 |
US20210216686A1 (en) | 2021-07-15 |
EP3872432B1 (en) | 2023-06-21 |
CN112100916B (zh) | 2023-07-25 |
EP3872432A1 (en) | 2021-09-01 |
CN112100916A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022023775A (ja) | 強化学習モデルを構築するための方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム | |
JP6530783B2 (ja) | 機械学習装置、制御装置及び機械学習プログラム | |
Zhao et al. | A cooperative water wave optimization algorithm with reinforcement learning for the distributed assembly no-idle flowshop scheduling problem | |
Xu et al. | An effective teaching–learning-based optimization algorithm for the flexible job-shop scheduling problem with fuzzy processing time | |
CN110520868A (zh) | 分布式强化学习 | |
KR20170024086A (ko) | 시뮬레이션 모듈을 사용하는 컴퓨터-지원 플랜트 제어 최적화를 위한 방법 | |
CN108885717A (zh) | 异步深度强化学习 | |
CN108762221B (zh) | 含有不可控事件的自动制造系统的无死锁控制方法 | |
CN111008449A (zh) | 一种用于战场仿真环境下深度强化学习推演决策训练的加速方法 | |
TW202232356A (zh) | 用於訓練強化學習模型以為高爐熱控制提供操作指令的計算機實施的方法和對應的計算機系統 | |
JP2023517262A (ja) | 自動学習基盤時系列データ予測及び制御方法と装置 | |
JP6947029B2 (ja) | 制御装置、それを使用する情報処理装置、制御方法、並びにコンピュータ・プログラム | |
JP6867307B2 (ja) | ステージ済アプリケーションによりライブ状態の制御/推定アプリケーションを置換するシステムと方法 | |
CN112859601B (zh) | 机器人控制器设计方法、装置、设备及可读存储介质 | |
Huang et al. | Improved firefly algorithm with courtship learning for unrelated parallel machine scheduling problem with sequence-dependent setup times | |
CA3207065A1 (en) | Intelligent identification of an execution environment | |
CN113721456A (zh) | 控制模型的训练方法、装置、计算机设备及存储介质 | |
JP2022064643A (ja) | モデル学習装置、制御装置、モデル学習方法、および、コンピュータプログラム | |
WO2018101476A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP7548090B2 (ja) | シミュレーション装置、シミュレーションシステム、シミュレーション方法、およびシミュレーションプログラム | |
Ji et al. | LSTM-TD3-Based Control for Delayed Drone Combat Strategies | |
CN103558762A (zh) | 基于图形化组态技术的免疫遗传pid控制器的实现方法 | |
Chen et al. | Exploration of Adaptive Environment Design Strategy Based on Reinforcement Learning in CAD Environment | |
KR102545836B1 (ko) | 인공지능 기반 웹툰 제작 방법 및 장치, 시스템 | |
JP2022148258A (ja) | シミュレーション装置、シミュレーションシステム、シミュレーション方法、およびシミュレーションプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7257436 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |