JP2023138425A - Machine learning apparatus and exhaust heat recovery system - Google Patents

Machine learning apparatus and exhaust heat recovery system Download PDF

Info

Publication number
JP2023138425A
JP2023138425A JP2023038359A JP2023038359A JP2023138425A JP 2023138425 A JP2023138425 A JP 2023138425A JP 2023038359 A JP2023038359 A JP 2023038359A JP 2023038359 A JP2023038359 A JP 2023038359A JP 2023138425 A JP2023138425 A JP 2023138425A
Authority
JP
Japan
Prior art keywords
exhaust gas
boiler
value
aqc
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023038359A
Other languages
Japanese (ja)
Inventor
敦史 雪岡
Atsushi Yukioka
寛太 宮内
Kanta Miyauchi
幸弘 竹中
Yukihiro Takenaka
健良 槇
Takeyoshi Saki
修示 山本
Shuji Yamamoto
拓朗 野副
Takuro Nozoe
寿典 田中
Hisanori Tanaka
朝暉 李
chao hui Li
鳳銀 陳
Fengyin Chen
杰玉 肖
Jieyu Xiao
峰娃 趙
Fengwa Zhao
傳利 考
Chuanli Kao
皓 張
Akira Cho
娜 李
Na Li
寧 汪
Ning Wang
海根 葛
Haigen Ge
偉 方
Wei Fang
健 周
Takeshi Shu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kawasaki Heavy Industries Ltd
Original Assignee
Kawasaki Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kawasaki Heavy Industries Ltd filed Critical Kawasaki Heavy Industries Ltd
Publication of JP2023138425A publication Critical patent/JP2023138425A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Waste-Gas Treatment And Other Accessory Devices For Furnaces (AREA)

Abstract

To optimize an exhaust gas flow rate flowing through each line of an exhaust gas line introducing an exhaust gas generated in a cement firing facility into a boiler and a bypass line bypassing the boiler so as to be joined with the exhaust gas line.SOLUTION: A machine learning apparatus mechanically learns the determination of an operation value in an exhaust heat recovery system. The machine learning apparatus comprises: an operation value output part outputting an operation value to a controller; a state observation part acquiring state values including a boiler inlet gas temperature, a steam flow rate from a boiler and a power generation output value of a steam turbine generator; a reward calculation part calculating a reward based on a prescribed energy value related to the power generation output value included in the state values acquired after the operation of at least one damper based on the operation value; and a learning part mechanically learning the determination of the operation value to be output to the controller from the present state values on based on the operation value, the state values and the reward.SELECTED DRAWING: Figure 4

Description

本発明は、セメント製造プロセスの排ガスから熱を回収する排熱回収システムで用いられる機械学習装置および排熱回収システムに関する。 The present invention relates to a machine learning device and an exhaust heat recovery system used in an exhaust heat recovery system that recovers heat from exhaust gas in a cement manufacturing process.

セメント製造プロセスは、大きく分けて、セメント原料を乾燥・粉砕・調合する原料工程、原料から中間製品であるクリンカを焼成する焼成工程、および、クリンカに石こうを加えて粉砕してセメントに仕上げる仕上げ工程から成る。このうち焼成工程では、セメント原料は、先ず、プレヒータ(以下、「PH」とも称する)で予熱され、次いで、仮焼炉で仮焼され、続いて、キルン炉で焼成され、最後に、エアクエンチングクーラ(以下、「AQC」とも称する)で冷却される。従来から、PHやAQCで発生した排ガス熱を回収し、回収した熱で発電する排熱回収システムが知られている。 The cement manufacturing process is broadly divided into a raw material process in which cement raw materials are dried, crushed, and mixed; a firing process in which clinker, which is an intermediate product, is fired from the raw materials; and a finishing process in which gypsum is added to the clinker and crushed to make cement. Consists of. In the firing process, the cement raw material is first preheated in a preheater (hereinafter also referred to as "PH"), then calcined in a calcining furnace, then fired in a kiln, and finally, It is cooled by a cooling cooler (hereinafter also referred to as "AQC"). BACKGROUND ART Exhaust heat recovery systems have been known that recover exhaust gas heat generated by PH or AQC and generate electricity using the recovered heat.

例えば特許文献1の図3に開示された排熱回収システムは、AQCで発生した排ガスから熱を回収するAQCボイラが設けられた、AQCの高温部から煙突へ延びる排ガスラインと、AQCの低温部から延び、AQCボイラを迂回するバイパスラインとを備える。排ガスラインは、AQC内の比較的高温(例えば平均360℃)の排ガスを排出し、バイパスラインは、AQC内の比較的低温(例えば平均110℃)の排ガスを排出する。排ガスラインを通じてAQCから排出された排ガスは、AQCボイラへ導かれる。AQCボイラでは、排ガスの熱によって過熱蒸気が発生し、過熱蒸気は、蒸気タービン発電機での発電に利用される。AQCボイラで熱が回収された排ガスは、バイパスラインにおいてAQCから排出された排ガスと合流した後、集塵機を通過し、煙突から大気に放出される。 For example, the exhaust heat recovery system disclosed in FIG. 3 of Patent Document 1 includes an exhaust gas line extending from the high temperature section of the AQC to the chimney, which is equipped with an AQC boiler that recovers heat from the exhaust gas generated by the AQC, and a low temperature section of the AQC. and a bypass line that extends from the AQC boiler and bypasses the AQC boiler. The exhaust gas line discharges relatively high temperature (eg, 360° C. on average) exhaust gas within the AQC, and the bypass line exhausts relatively low temperature (eg, 110° C. on average) exhaust gas within the AQC. Exhaust gas discharged from the AQC through the exhaust gas line is guided to the AQC boiler. In an AQC boiler, superheated steam is generated by the heat of exhaust gas, and the superheated steam is used for power generation in a steam turbine generator. The exhaust gas whose heat has been recovered by the AQC boiler joins the exhaust gas discharged from the AQC in the bypass line, passes through the dust collector, and is discharged into the atmosphere from the chimney.

また、この排熱回収システムは、AQCボイラを通過する排ガスラインおよびAQCボイラを迂回するバイパスラインとは別に、PHボイラを通過する排ガスラインと、PH排ガスラインから分岐してPHボイラを迂回するバイパスラインも備えている。 In addition to the exhaust gas line that passes through the AQC boiler and the bypass line that bypasses the AQC boiler, this exhaust heat recovery system also includes an exhaust gas line that passes through the PH boiler, and a bypass that branches off from the PH exhaust gas line and bypasses the PH boiler. It also has a line.

特許第5897302号公報Patent No. 5897302

上述のような排熱回収システムは、できるだけ大きなエネルギを生成するよう最適化されることが望ましい。このような方法としては、高温で且つ大量の排ガスがボイラに送られるように、例えばバイパスライン等に設けたダンパの開度を調節することなどが考えられる。ところが、ボイラへ流入する排ガスの流量および温度は、一方を上昇させると他方が低減し得る関係にある。 It is desirable that waste heat recovery systems such as those described above be optimized to produce as much energy as possible. As such a method, for example, adjusting the opening degree of a damper provided in a bypass line or the like may be considered so that a large amount of high-temperature exhaust gas is sent to the boiler. However, the flow rate and temperature of the exhaust gas flowing into the boiler are in a relationship where if one is increased, the other can be decreased.

例えば、AQCボイラを迂回するバイパスラインに開度調整可能なダンパが設けられている場合、ダンパの開度を減少させれば、このバイパスラインを通じてAQCから排出される排ガス量は減少し、排ガスラインを通じてAQCから排出される排ガス量は上昇する。しかし、バイパスラインを通じて比較的低温の排ガスがAQCから排出されにくくなることで、AQC内の温度分布が変動し、排ガスラインを通じてAQCボイラへ流入する排ガスの温度は低下する。逆に、バイパスラインのダンパの開度を増大することで、AQCボイラに流入する排ガスの流量は減少するが、AQCボイラに流入する排ガスの温度は上昇する。さらに、キルンからAQCへ供給されるクリンカ量は時々刻々と変動しており、その結果、AQC内の排ガスの温度分布にも変動が生じている。このため、排ガスラインおよびバイパスラインを流れる排ガスの流量をどのように調節すれば最適なシステムを実現できるかを把握することは非常に困難であった。また、システムを最適化することの必要性は、PHボイラを通過する排ガスラインとPHボイラを迂回するバイパスラインでも生じ得る。 For example, if a damper whose opening degree can be adjusted is installed on a bypass line that bypasses an AQC boiler, if the opening degree of the damper is reduced, the amount of exhaust gas discharged from the AQC through this bypass line will be reduced, and the exhaust gas line As a result, the amount of exhaust gas emitted from AQC increases. However, since relatively low temperature exhaust gas becomes difficult to be discharged from the AQC through the bypass line, the temperature distribution within the AQC fluctuates, and the temperature of the exhaust gas flowing into the AQC boiler through the exhaust gas line decreases. Conversely, by increasing the opening degree of the damper of the bypass line, the flow rate of the exhaust gas flowing into the AQC boiler decreases, but the temperature of the exhaust gas flowing into the AQC boiler increases. Furthermore, the amount of clinker supplied from the kiln to the AQC fluctuates from moment to moment, and as a result, the temperature distribution of exhaust gas within the AQC also fluctuates. For this reason, it has been extremely difficult to understand how to adjust the flow rate of exhaust gas flowing through the exhaust gas line and the bypass line to realize an optimal system. The need to optimize the system may also arise with exhaust gas lines passing through the PH boiler and bypass lines bypassing the PH boiler.

そこで、本発明は、セメント焼成設備で発生した排ガスをボイラへ導く排ガスラインと、ボイラを迂回して排ガスラインに合流するバイパスラインとを備える排熱回収システムにおいて、排ガスラインおよびバイパスラインを流れる排ガス流量の最適化するための機械学習装置および排熱回収システムを提供することを目的とする。 Therefore, the present invention provides an exhaust heat recovery system that includes an exhaust gas line that guides exhaust gas generated in cement firing equipment to a boiler, and a bypass line that bypasses the boiler and joins the exhaust gas line. The purpose is to provide a machine learning device and waste heat recovery system for optimizing flow rate.

本発明の一態様に係る機械学習装置は、排熱回収システムにおいて運転値の決定を機械学習する機械学習装置であって、
前記排熱回収システムは、セメント原料を焼成する過程で排ガスを発生する排ガス発生部を有するセメント焼成設備と、前記セメント焼成設備の外部において前記排ガスを大気に放出する放出設備と、ボイラおよび排風機が設けられ、前記排ガス発生部で発生した排ガスの一部を、前記ボイラを通過させて前記放出設備へ導く排ガスラインと、前記排ガス発生部で発生した排ガスの残りを、前記ボイラを迂回させて、前記排ガスラインにおける前記ボイラと前記放出設備の間に導くバイパスラインと、前記排ガスラインおよび前記バイパスラインの少なくとも一方に設けられた少なくとも1つのダンパと、運転値に基づき、前記少なくとも1つのダンパを動作させる制御器と、前記ボイラにおいて発生した蒸気により発電する蒸気タービン発電機と、を備え、
前記機械学習装置は、前記運転値を前記制御器に出力する運転値出力部と、前記ボイラへ流入する排ガスの温度と、前記ボイラから前記蒸気タービン発電機へ送る蒸気の流量と、前記蒸気タービン発電機の発電出力値と、を含む状態値を取得する状態観測部と、前記運転値に基づき前記少なくとも1つのダンパを動作させた後に取得された前記状態値に含まれる前記発電出力値に関連する所定のエネルギ値に基づいて、報酬を計算する報酬計算部と、前記運転値と、前記状態値と、前記報酬とに基づいて、現在の前記状態値から前記制御器に出力する前記運転値を決定することを機械学習する学習部と、を備える。
A machine learning device according to one aspect of the present invention is a machine learning device that performs machine learning to determine operating values in an exhaust heat recovery system, and includes:
The exhaust heat recovery system includes a cement firing facility having an exhaust gas generating section that generates exhaust gas during the process of firing cement raw materials, a discharge facility that releases the exhaust gas to the atmosphere outside the cement firing facility, a boiler, and an exhaust fan. is provided with an exhaust gas line that allows a part of the exhaust gas generated in the exhaust gas generation section to pass through the boiler and guides it to the discharge equipment, and an exhaust gas line that allows the remainder of the exhaust gas generated in the exhaust gas generation section to bypass the boiler. , a bypass line leading between the boiler and the discharge equipment in the exhaust gas line; at least one damper provided in at least one of the exhaust gas line and the bypass line; and a steam turbine generator that generates electricity using steam generated in the boiler,
The machine learning device includes an operating value output unit that outputs the operating value to the controller, a temperature of exhaust gas flowing into the boiler, a flow rate of steam sent from the boiler to the steam turbine generator, and the steam turbine. a state observation unit that obtains a state value including a power generation output value of the generator; a remuneration calculation unit that calculates a remuneration based on a predetermined energy value to be used, and the operation value that is output from the current state value to the controller based on the operation value, the state value, and the remuneration. and a learning section that performs machine learning to determine.

また、本発明の一態様に係る排熱回収システムは、上記の機械学習装置を備えた前記排熱回収システムである。 Further, an exhaust heat recovery system according to one aspect of the present invention is the exhaust heat recovery system including the above-described machine learning device.

上記の機械学習装置および排熱回収システムによれば、できるだけ大きなエネルギを生成するような運転値を決定することを機械学習することができる。従って、機械学習装置の学習結果を用いて、現在の排熱回収システムの状態から決定した運転値に基づき、排ガスラインおよびバイパスラインの少なくとも一方に設けられた少なくとも1つのダンパを動作させることにより、排ガスからできるだけ大きなエネルギを生成するシステムを実現できる。 According to the machine learning device and exhaust heat recovery system described above, machine learning can be performed to determine operating values that generate as much energy as possible. Therefore, by operating at least one damper provided in at least one of the exhaust gas line and the bypass line based on the operating value determined from the current state of the exhaust heat recovery system using the learning results of the machine learning device, It is possible to realize a system that generates as much energy as possible from exhaust gas.

本発明によれば、セメント焼成設備で発生した排ガスをボイラへ導く排ガスラインと、ボイラを迂回して排ガスラインに合流するバイパスラインとを備える排熱回収システムに対して、排ガスラインおよびバイパスラインを流れる排ガス流量の最適化するための機械学習装置および排熱回収システムを提案することができる。 According to the present invention, an exhaust gas line and a bypass line are connected to an exhaust heat recovery system that includes an exhaust gas line that guides exhaust gas generated in cement firing equipment to a boiler, and a bypass line that bypasses the boiler and joins the exhaust gas line. We can propose a machine learning device and an exhaust heat recovery system for optimizing the flow rate of flowing exhaust gas.

図1は、本発明の一実施形態に係る排熱回収システムの概略構成図である。FIG. 1 is a schematic configuration diagram of an exhaust heat recovery system according to an embodiment of the present invention. 図2は、排熱回収システムにおける制御系のブロック図である。FIG. 2 is a block diagram of a control system in the exhaust heat recovery system. 図3は、強化学習アルゴリズムの基本的な概念を説明する図である。FIG. 3 is a diagram explaining the basic concept of a reinforcement learning algorithm. 図4は、機械学習装置の機能ブロック図である。FIG. 4 is a functional block diagram of the machine learning device. 図5は、機械学習装置が行う機械学習(強化学習)の流れを示すフローチャートである。FIG. 5 is a flowchart showing the flow of machine learning (reinforcement learning) performed by the machine learning device.

[排熱回収システム]
以下、本発明の一実施形態に係る排熱回収システムについて図面を参照しながら説明する。排熱回収システム1では、セメント製造設備2においてセメントを製造する過程で発生する排ガスから熱を回収するシステムである。本実施形態に係る排熱回収システム1は、セメント製造設備2および発電設備3を備える。
[Exhaust heat recovery system]
Hereinafter, an exhaust heat recovery system according to an embodiment of the present invention will be described with reference to the drawings. The exhaust heat recovery system 1 is a system that recovers heat from exhaust gas generated during the process of manufacturing cement in the cement manufacturing equipment 2. The exhaust heat recovery system 1 according to this embodiment includes a cement manufacturing facility 2 and a power generation facility 3.

[セメント製造設備]
上述したように、セメント製造プロセスは、原料工程、焼成工程および仕上げ工程から成る。図1に示すように、セメント製造設備2は、原料工程を担う原料生成設備10と、焼成工程を担う焼成設備20を有する。
[Cement manufacturing equipment]
As mentioned above, the cement manufacturing process consists of a raw material process, a firing process, and a finishing process. As shown in FIG. 1, the cement manufacturing facility 2 includes a raw material production facility 10 that performs a raw material process and a firing facility 20 that performs a firing process.

原料生成設備10は、石灰石、粘土などのセメント原料を乾燥・粉砕・調合して得られた粉体原料を生成する設備である。原料生成設備10は、原料ミル11、セパレータ12およびサイロ13を含む。原料ミル11では、石灰石、粘土などが粉砕および乾燥される。なお、原料ミル11には、後述するPHボイラ30からの排ガスが流入され、セメント原料の乾燥に利用される。原料ミル11で粉砕および乾燥されたセメント原料は、排ガスに同伴して排出されて、セパレータ12へ流入する。セパレータ12では、セメント原料が排ガスから分離されるとともに分級される。セパレータ12で分離・分級されたセメント原料は、サイロ13で混合および貯蔵され、サイロ13から焼成設備20へ供給される。なお、後述するように、セパレータ12内の排ガスは、集塵機14へと送られる。 The raw material generation equipment 10 is equipment that generates powdered raw materials obtained by drying, pulverizing, and blending cement raw materials such as limestone and clay. The raw material production facility 10 includes a raw material mill 11, a separator 12, and a silo 13. In the raw material mill 11, limestone, clay, etc. are crushed and dried. Note that exhaust gas from a PH boiler 30, which will be described later, flows into the raw material mill 11 and is used for drying cement raw materials. The cement raw material pulverized and dried in the raw material mill 11 is discharged together with exhaust gas and flows into the separator 12 . In the separator 12, the cement raw material is separated from the exhaust gas and classified. The cement raw materials separated and classified by the separator 12 are mixed and stored in the silo 13, and then supplied from the silo 13 to the firing equipment 20. Note that, as described later, the exhaust gas within the separator 12 is sent to the dust collector 14.

焼成設備20は、原料生成設備10にて得た粉体原料から、中間製品であるクリンカを焼成する設備である。焼成設備20は、プレヒータ(PH)21、仮焼炉22、ロータリキルン23、およびAQC24を備える。 The firing equipment 20 is equipment for firing clinker, which is an intermediate product, from the powder raw material obtained in the raw material production equipment 10. The firing equipment 20 includes a preheater (PH) 21, a calcining furnace 22, a rotary kiln 23, and an AQC 24.

PH21は、直列的に接続された複数段のサイクロン集塵器を備える。PH21では、ロータリキルン23からの排熱が最下段のサイクロン集塵器から最上段のサイクロン集塵器へ向けて順に移動し、セメント原料が最上段のサイクロン集塵器から最下段のサイクロン集塵器へ向けて順に移動する。PH21の最下段のサイクロン集塵器は、仮焼炉22と接続されている。 PH21 includes multiple stages of cyclone dust collectors connected in series. In PH21, the exhaust heat from the rotary kiln 23 moves sequentially from the cyclone dust collector at the bottom to the cyclone dust collector at the top, and the cement raw material moves from the cyclone dust collector at the top to the cyclone dust collector at the bottom. Move in order towards the container. The lowermost cyclone dust collector of the PH 21 is connected to the calcining furnace 22 .

仮焼炉22では、PH21を出たセメント原料が、約900℃の雰囲気で仮焼される。仮焼炉22には、AQC24から仮焼炉22へ排熱を送る仮焼炉用抽気ライン22aと、燃料等を仮焼炉22へ供給する燃料供給ライン22bとが接続されている。仮焼炉22の出口は、ロータリキルン23の入口と接続されている。 In the calcining furnace 22, the cement raw material that has passed through pH21 is calcined in an atmosphere of approximately 900°C. The calciner 22 is connected to a calciner bleed line 22a that sends exhaust heat from the AQC 24 to the calciner 22, and a fuel supply line 22b that supplies fuel and the like to the calciner 22. The outlet of the calcining furnace 22 is connected to the inlet of the rotary kiln 23.

ロータリキルン23は、横長の円筒型の回転窯であって、原料入口から原料出口へ向かって僅かに下る勾配を付けて設置されている。ロータリキルン23では、PH21および仮焼炉22で予熱・仮焼されたセメント原料を、AQC24の排熱およびバーナ25の燃焼ガスによって焼成する。ロータリキルン23の出口は、AQC24の入口24aと接続されている。 The rotary kiln 23 is a horizontally long cylindrical rotary kiln, and is installed with a slight downward slope from the raw material inlet toward the raw material outlet. In the rotary kiln 23, the cement raw material preheated and calcined in the PH 21 and calciner 22 is calcined using exhaust heat from the AQC 24 and combustion gas from the burner 25. The outlet of the rotary kiln 23 is connected to the inlet 24a of the AQC 24.

AQC24では、ロータリキルン23から出た高温(例えば約1400℃)の焼成物が急冷される。具体的には、ロータリキルン23の出口からAQC24内に落下投入された焼成物は、AQC24内の図示しないコンベアにより出口24bへ向かって搬送される。焼成物は、コンベアで搬送される間、コンベアの下方から冷却用空気が吹きつけられることによって冷却される。AQC24にて冷却された焼成物、すなわちクリンカは、出口24bから出た後、図示しないクリンカコンベヤによりクリンカサイロへ送られる。 In the AQC 24, the fired product discharged from the rotary kiln 23 at a high temperature (for example, about 1400° C.) is rapidly cooled. Specifically, the fired product dropped into the AQC 24 from the exit of the rotary kiln 23 is conveyed toward the exit 24b by a conveyor (not shown) inside the AQC 24. While being conveyed by the conveyor, the baked product is cooled by being blown with cooling air from below the conveyor. The fired product cooled in the AQC 24, that is, the clinker, exits from the outlet 24b and is then sent to the clinker silo by a clinker conveyor (not shown).

AQC24内で高温の焼成物に対し吹き付けられた冷却用空気は、高温の排ガスとなる。AQC24内のガス温度は、焼成物の搬送方向に沿って出口24bに近づくにつれ低くなる分布を形成している。例えば、AQC24の入口24a近傍のガス温度は、約1350℃となっており、AQC24の出口24b近傍のガス温度は、約100℃となっている。ただし、AQC24へのクリンカ供給量には振れ幅があるため、AQC24内の排ガスの温度に変動が生じている。また、AQC24内(より詳しくはAQC24内における高温部24cよりも焼成物の搬送方向上流側)には、排ガスの温度を計測する温度計81が設けられている。 The cooling air blown onto the high-temperature fired product within the AQC 24 becomes high-temperature exhaust gas. The gas temperature within the AQC 24 forms a distribution that decreases as it approaches the outlet 24b along the conveyance direction of the fired product. For example, the gas temperature near the inlet 24a of the AQC 24 is about 1350°C, and the gas temperature near the outlet 24b of the AQC 24 is about 100°C. However, since the amount of clinker supplied to the AQC 24 varies, the temperature of the exhaust gas inside the AQC 24 fluctuates. Further, a thermometer 81 for measuring the temperature of the exhaust gas is provided inside the AQC 24 (more specifically, on the upstream side of the high temperature section 24c within the AQC 24 in the conveying direction of the baked product).

[発電設備]
発電設備3は、プレヒータボイラ(以下、「PHボイラ」とも称する)30、エアクエンチングクーラボイラ(以下、「AQCボイラ」とも称する)40、および蒸気タービン発電機50を備える。
[Power generation equipment]
The power generation facility 3 includes a preheater boiler (hereinafter also referred to as "PH boiler") 30, an air quenching cooler boiler (hereinafter also referred to as "AQC boiler") 40, and a steam turbine generator 50.

(PHボイラ)
PHボイラ30は、PH21で発生した排ガスを加熱媒体とするボイラである。PHボイラ30は、ガス入口およびガス出口を有するボイラ本体31を備える。ボイラ本体31内には、熱交換器である過熱器32および蒸発器33が、ボイラ本体31におけるガス入口からガス出口に向かってこの順に設置されている。また、ボイラ本体31には、蒸気ドラム34が付属されている。
(PH boiler)
The PH boiler 30 is a boiler that uses exhaust gas generated at PH21 as a heating medium. The PH boiler 30 includes a boiler body 31 having a gas inlet and a gas outlet. Inside the boiler body 31, a superheater 32 and an evaporator 33, which are heat exchangers, are installed in this order from the gas inlet to the gas outlet of the boiler body 31. Further, a steam drum 34 is attached to the boiler main body 31.

PHボイラ30は、PH21から放出設備16に延びる排ガスライン61(PH用排ガスライン)に設けられている。具体的に、ロータリキルン23の高温の排ガスが、仮焼炉22およびPH21の順に流れ、その後、排ガスライン61を通じてPHボイラ30に導かれる。 The PH boiler 30 is provided in an exhaust gas line 61 (PH exhaust gas line) extending from the PH 21 to the discharge equipment 16. Specifically, high-temperature exhaust gas from the rotary kiln 23 flows through the calciner 22 and the PH 21 in this order, and then is led to the PH boiler 30 through the exhaust gas line 61.

排ガスライン61におけるPHボイラ30より下流側には、排風機35が設けられている。また、排ガスライン61には、PHボイラ30を迂回させるバイパスライン62(PH用バイパスライン)が接続されている。バイパスライン62の上流側端部は、排ガスライン61におけるPHボイラ30より上流側に接続されており、バイパスライン62の下流側端部は、排ガスライン61におけるPHボイラ30と排風機35との間に接続されている。 An exhaust fan 35 is provided downstream of the PH boiler 30 in the exhaust gas line 61 . Further, a bypass line 62 (PH bypass line) that bypasses the PH boiler 30 is connected to the exhaust gas line 61. The upstream end of the bypass line 62 is connected to the exhaust gas line 61 upstream of the PH boiler 30, and the downstream end of the bypass line 62 is connected to the exhaust gas line 61 between the PH boiler 30 and the exhaust fan 35. It is connected to the.

排ガスライン61におけるバイパスライン62の上流側端部とPHボイラ30との間に、入口ダンパ61aが設けられている。バイパスライン62には、バイパスダンパ62aが設けられている。また、排ガスライン61におけるPHボイラ30より上流側、より詳しくはバイパスライン62の上流側端部より上流側には、排ガスの温度を計測する温度計82が設けられている。また、排ガスライン61におけるPHボイラ30より下流側、より詳しくはPHボイラ30とバイパスライン62の下流側端部との間には、排ガスの温度を計測する温度計83が設けられている。 An inlet damper 61a is provided between the upstream end of the bypass line 62 in the exhaust gas line 61 and the PH boiler 30. The bypass line 62 is provided with a bypass damper 62a. Further, a thermometer 82 for measuring the temperature of the exhaust gas is provided upstream of the PH boiler 30 in the exhaust gas line 61, more specifically, upstream of the upstream end of the bypass line 62. Further, a thermometer 83 for measuring the temperature of the exhaust gas is provided downstream of the PH boiler 30 in the exhaust gas line 61, more specifically between the PH boiler 30 and the downstream end of the bypass line 62.

PHボイラ30で熱交換された後の排ガスおよびバイパスライン62を流れる排ガスは、排風機35により上述した原料ミル11へ送られ、原料ミル11の熱源として利用される。原料ミル11へ供給されるセメント原料(被乾燥物)と、原料ミル11から排出されるセメント原料(乾燥物)とが定期的にサンプリングされ、夫々の質量が測定される。原料ミル11に供給されるセメント原料の水分量(水分率)は原料ミル11における被乾燥物の質量と乾燥物の質量との差、即ち、原料ミル11で減少した質量に基づいて求めることができる。本実施形態では、これらのセメント原料の質量測定器を、セメント原料の水分量を測定するための水分測定装置17とする。但し、水分測定装置17は上記に限定されない。また、排ガスライン61における原料ミル11とセパレータ12との間には、原料ミル11から流出する排ガスの温度を計測する温度計87が設けられている。 The exhaust gas after heat exchange in the PH boiler 30 and the exhaust gas flowing through the bypass line 62 are sent to the raw material mill 11 described above by the exhaust fan 35 and are used as a heat source for the raw material mill 11. The cement raw material (dried material) supplied to the raw material mill 11 and the cement raw material (dried material) discharged from the raw material mill 11 are periodically sampled, and the mass of each is measured. The moisture content (moisture percentage) of the cement raw material supplied to the raw material mill 11 can be determined based on the difference between the mass of the material to be dried and the mass of the dried material in the raw material mill 11, that is, the mass reduced in the raw material mill 11. can. In this embodiment, these cement raw material mass measuring instruments are used as a moisture measuring device 17 for measuring the moisture content of cement raw materials. However, the moisture measuring device 17 is not limited to the above. Further, a thermometer 87 is provided between the raw material mill 11 and the separator 12 in the exhaust gas line 61 to measure the temperature of the exhaust gas flowing out from the raw material mill 11.

排ガスライン61におけるセパレータ12と放出設備16との間には、集塵機14および排風機15が、排ガスの流れの上流から下流に向けてこの順番で設けられている。原料ミル11でセメント原料の乾燥に利用された排ガスは、セパレータ12へ送られた後、集塵機14へ送られる。セパレータ12から集塵機14へ送られた排ガスは、集塵機14で粉塵が分離されたのち、排風機15により放出設備16としての煙突へ送られて、大気に放出される。 Between the separator 12 and the discharge equipment 16 in the exhaust gas line 61, a dust collector 14 and an exhaust fan 15 are provided in this order from upstream to downstream of the exhaust gas flow. The exhaust gas used for drying the cement raw material in the raw material mill 11 is sent to the separator 12 and then to the dust collector 14. The exhaust gas sent from the separator 12 to the dust collector 14 is separated into dust by the dust collector 14, and then sent to a chimney serving as a discharge facility 16 by an exhaust fan 15 and discharged into the atmosphere.

(AQCボイラ)
AQCボイラ40は、AQC24で発生した排ガスを加熱媒体とするボイラである。AQCボイラ40は、ガス入口およびガス出口を有するボイラ本体41を備える。ボイラ本体41内には、熱交換器である過熱器42、蒸発器43、および予熱器(エコノマイザ)44が、ガス入口からガス出口に向かってこの順に設置されている。また、ボイラ本体41には、蒸気ドラム45が付属されている。
(AQC boiler)
The AQC boiler 40 is a boiler that uses exhaust gas generated by the AQC 24 as a heating medium. The AQC boiler 40 includes a boiler body 41 having a gas inlet and a gas outlet. Inside the boiler body 41, a superheater 42, which is a heat exchanger, an evaporator 43, and a preheater (economizer) 44 are installed in this order from the gas inlet to the gas outlet. Further, a steam drum 45 is attached to the boiler main body 41.

AQCボイラ40は、AQC24の高温部24cから放出設備48に延びる排ガスライン63(AQC用排ガスライン)が接続されている。AQC24の高温部24cとは、AQC24における排ガス温度が比較的高温(例えば約350℃)である箇所である。例えば、AQC24の高温部24cの平均温度は、AQCボイラ40の許容温度範囲内にある。排ガスライン63の上流側端部がAQC24の高温部24cに位置することで、比較的高温な排ガスが、排ガスライン63を通じてAQC24からAQCボイラ40に導かれ、AQCボイラ40の加熱媒体として利用される。 The AQC boiler 40 is connected to an exhaust gas line 63 (exhaust gas line for AQC) extending from the high temperature section 24c of the AQC 24 to the discharge equipment 48. The high temperature portion 24c of the AQC 24 is a location where the exhaust gas temperature in the AQC 24 is relatively high (for example, about 350° C.). For example, the average temperature of the high temperature section 24c of the AQC 24 is within the allowable temperature range of the AQC boiler 40. Since the upstream end of the exhaust gas line 63 is located in the high temperature section 24c of the AQC 24, relatively high temperature exhaust gas is guided from the AQC 24 to the AQC boiler 40 through the exhaust gas line 63 and is used as a heating medium for the AQC boiler 40. .

なお、AQC24には、上述した仮焼炉用抽気ライン22aが接続されている。仮焼炉用抽気ライン22aは、排ガスライン63とAQC24との接続位置よりも焼成物の搬送方向上流側でAQC24と接続している。このため、仮焼炉用抽気ライン22aからは、排ガスライン63を通じて排出される排ガスの温度よりも高い温度(例えば約600℃)の排ガスが抽気される。 Note that the AQC 24 is connected to the above-mentioned calciner bleed line 22a. The calcining furnace bleed line 22a is connected to the AQC 24 on the upstream side in the conveyance direction of the fired product from the connection position between the exhaust gas line 63 and the AQC 24. Therefore, exhaust gas having a temperature higher than the temperature of the exhaust gas discharged through the exhaust gas line 63 (for example, about 600° C.) is extracted from the calciner bleed line 22a.

排ガスライン63におけるAQCボイラ40と放出設備48との間には、集塵機46および排風機47が、排ガスの流れの上流から下流に向けてこの順番で設けられている。AQC24の低温部24dからは、AQCボイラ40を迂回させるバイパスライン64(AQC用バイパスライン)が延びている。AQC24の低温部24dとは、AQC24における排ガス温度が比較的低温(例えば約150℃)である箇所であり、AQC24における高温部24cよりも焼成物搬送方向下流側に位置している。バイパスライン64の上流側端部は、AQC24の低温部24dに接続されており、バイパスライン64の下流側端部は、排ガスライン63におけるAQCボイラ40と集塵機46との間に接続されている。バイパスライン64の上流側端部がAQC24の低温部24dに位置することで、比較的低温な排ガスが、バイパスライン64を通じてAQC24から排出される。 Between the AQC boiler 40 and the discharge equipment 48 in the exhaust gas line 63, a dust collector 46 and an exhaust fan 47 are provided in this order from upstream to downstream of the exhaust gas flow. A bypass line 64 (AQC bypass line) that bypasses the AQC boiler 40 extends from the low temperature section 24d of the AQC 24. The low temperature portion 24d of the AQC 24 is a portion where the exhaust gas temperature in the AQC 24 is relatively low (for example, about 150° C.), and is located downstream of the high temperature portion 24c of the AQC 24 in the direction of conveyance of the baked product. The upstream end of the bypass line 64 is connected to the low temperature section 24d of the AQC 24, and the downstream end of the bypass line 64 is connected between the AQC boiler 40 and the dust collector 46 in the exhaust gas line 63. Since the upstream end of the bypass line 64 is located in the low temperature section 24d of the AQC 24, relatively low temperature exhaust gas is discharged from the AQC 24 through the bypass line 64.

排ガスライン63におけるAQCボイラ40より上流側には、入口ダンパ63aが設けられている。バイパスライン64には、バイパスダンパ64aが設けられている。排ガスライン63の上流側端部とAQCボイラ40(ボイラ本体41の入口)との間には、排ガスの温度を計測する温度計84が設けられている。排ガスライン63におけるAQCボイラ40(ボイラ本体41の出口)とバイパスライン64の下流側端部との間には、排ガスの温度を計測する温度計88が設けられている。 An inlet damper 63a is provided upstream of the AQC boiler 40 in the exhaust gas line 63. The bypass line 64 is provided with a bypass damper 64a. A thermometer 84 for measuring the temperature of the exhaust gas is provided between the upstream end of the exhaust gas line 63 and the AQC boiler 40 (inlet of the boiler main body 41). A thermometer 88 is provided in the exhaust gas line 63 between the AQC boiler 40 (the outlet of the boiler main body 41) and the downstream end of the bypass line 64 to measure the temperature of the exhaust gas.

AQCボイラ40から流出した排ガスおよびバイパスライン64を流れる排ガスは、排風機47により集塵機46へ送られ、その後放出設備16としての煙突へ送られて、大気に放出される。 The exhaust gas flowing out from the AQC boiler 40 and the exhaust gas flowing through the bypass line 64 are sent to the dust collector 46 by the exhaust fan 47, and then sent to the chimney as the discharge equipment 16, and are released into the atmosphere.

(蒸気タービン発電機)
蒸気タービン発電機50は、蒸気タービン51と発電機52とを備える。蒸気タービン51は、供給される蒸気によって駆動される。蒸気タービン51は、多段式蒸気タービンであり、例えば、蒸気タービン51の高圧段には高圧蒸気が供給され、蒸気タービン51の低圧段には低圧蒸気が供給される。発電機52は、蒸気タービン51の回転軸の運動エネルギを電気エネルギに変換する。蒸気タービン発電機50で生成した電力は、排熱回収システム1における補機(例えば排風機15,35,47)の稼働に利用される。
(steam turbine generator)
Steam turbine generator 50 includes a steam turbine 51 and a generator 52. The steam turbine 51 is driven by supplied steam. The steam turbine 51 is a multi-stage steam turbine, and for example, a high pressure stage of the steam turbine 51 is supplied with high pressure steam, and a low pressure stage of the steam turbine 51 is supplied with low pressure steam. The generator 52 converts the kinetic energy of the rotating shaft of the steam turbine 51 into electrical energy. The electric power generated by the steam turbine generator 50 is used to operate auxiliary machines (for example, the exhaust fans 15, 35, 47) in the exhaust heat recovery system 1.

蒸気タービン51で使用された蒸気は、冷却塔53から送られる冷却水によって復水器54で凝縮される。復水器54で生成された復水は、ポンプ55によりAQCボイラ40に送られる。AQCボイラ40に供給された水は、予熱器44で排ガスから熱を与えられて加熱される。予熱器44で加熱された水は、AQCボイラ40の蒸気ドラム45、PHボイラ30の蒸気ドラム34および高圧段フラッシャ56に分配される。 Steam used in the steam turbine 51 is condensed in a condenser 54 by cooling water sent from a cooling tower 53. Condensate generated in the condenser 54 is sent to the AQC boiler 40 by a pump 55. The water supplied to the AQC boiler 40 is heated in the preheater 44 by being given heat from the exhaust gas. The water heated by the preheater 44 is distributed to the steam drum 45 of the AQC boiler 40, the steam drum 34 of the PH boiler 30, and the high pressure stage flasher 56.

AQCボイラ40の蒸気ドラム45に供給された水は、蒸発器43で加熱された後に蒸気ドラム45に戻って気液分離する。蒸気ドラム45の蒸気は、過熱器42で飽和温度以上に加熱された後、蒸気タービン51に導かれる。 The water supplied to the steam drum 45 of the AQC boiler 40 is heated by the evaporator 43 and then returned to the steam drum 45 for gas-liquid separation. The steam in the steam drum 45 is heated to a saturation temperature or higher in the superheater 42 and then guided to the steam turbine 51.

PHボイラ30の蒸気ドラム34に供給された水は、蒸発器33で加熱された後に蒸気ドラム34に戻って気液分離する。蒸気ドラム34の蒸気は、過熱器32で飽和温度以上に加熱された後、蒸気タービン51に導かれる。 The water supplied to the steam drum 34 of the PH boiler 30 is heated by the evaporator 33 and then returned to the steam drum 34 for gas-liquid separation. The steam in the steam drum 34 is heated to a saturation temperature or higher in the superheater 32 and then guided to the steam turbine 51.

予熱器44で加熱された水のうち、蒸気ドラム34,45に供給されなかった残りの水が高圧段フラッシャ56に送られる。高圧段フラッシャ56は、予熱器44から送られる水を気液分離する。高圧段フラッシャ56で生成された蒸気は、蒸気タービン51(より詳しくは蒸気タービン51の中圧段)に供給され、残った熱水は、低圧段フラッシャ57に送られる。低圧段フラッシャ57は、高圧段フラッシャ56から送られる水を気液分離する。低圧段フラッシャ57で生成された蒸気は、蒸気タービン51(より詳しくは蒸気タービン51の低圧段)に供給され、残った水は、復水器54からの復水とともに予熱器44に送られる。 Of the water heated by the preheater 44, the remaining water that was not supplied to the steam drums 34, 45 is sent to the high pressure stage flasher 56. The high-pressure stage flasher 56 separates water sent from the preheater 44 into gas and liquid. The steam generated by the high-pressure stage flasher 56 is supplied to the steam turbine 51 (more specifically, the intermediate-pressure stage of the steam turbine 51), and the remaining hot water is sent to the low-pressure stage flasher 57. The low pressure stage flasher 57 separates water sent from the high pressure stage flasher 56 into gas and liquid. The steam generated by the low-pressure stage flasher 57 is supplied to the steam turbine 51 (more specifically, the low-pressure stage of the steam turbine 51), and the remaining water is sent to the preheater 44 together with condensed water from the condenser 54.

また、発電設備3は、PHボイラ30から蒸気タービン51へ送る蒸気の流量を計測する蒸気流量計85と、AQCボイラ40から蒸気タービン51へ送る蒸気の流量を計測する蒸気流量計86を備える。 The power generation equipment 3 also includes a steam flow meter 85 that measures the flow rate of steam sent from the PH boiler 30 to the steam turbine 51, and a steam flow meter 86 that measures the flow rate of steam sent from the AQC boiler 40 to the steam turbine 51.

(制御装置)
本実施形態に係る排熱回収システム1は制御装置7を備える。図2は、排熱回収システム1における制御系のブロック図である。図2に示すように、温度計81,82,83,84,88で計測した温度、蒸気流量計85,86で計測した蒸気流量、および蒸気タービン発電機50での発電出力値が、制御装置7へ送られる。排風機15,35,47には、それぞれ、排風機15,35,47の消費電力値を計測する消費電力計測器15a,35a,47aが設けられている。消費電力計測器15a,35a,47aで計測した消費電力値が、制御装置7へ送られる。
(Control device)
The exhaust heat recovery system 1 according to this embodiment includes a control device 7. FIG. 2 is a block diagram of a control system in the exhaust heat recovery system 1. As shown in FIG. 2, the temperature measured by the thermometers 81, 82, 83, 84, 88, the steam flow rate measured by the steam flow meters 85, 86, and the power generation output value of the steam turbine generator 50 are controlled by the control device. Sent to 7. The exhaust fans 15, 35, 47 are provided with power consumption meters 15a, 35a, 47a that measure the power consumption values of the exhaust fans 15, 35, 47, respectively. The power consumption values measured by the power consumption meters 15a, 35a, and 47a are sent to the control device 7.

また、制御装置7は、制御器71および機械学習器72を備える。制御器71および機械学習器72は、それぞれ、CPU等の演算処理部と、不揮発性および揮発性の記憶部とを備える。制御器71および機械学習器72とは、情報の送受信が可能となるように電気的に接続される。なお、機械学習器72は、制御器71と分離して制御器71の外部に設けられてもよく、この場合、機械学習器72は、制御器71とネットワーク等を介して接続されてもよい。 Further, the control device 7 includes a controller 71 and a machine learning device 72. The controller 71 and the machine learning device 72 each include an arithmetic processing unit such as a CPU, and a nonvolatile storage unit and a volatile storage unit. The controller 71 and the machine learning device 72 are electrically connected so that they can transmit and receive information. Note that the machine learning device 72 may be provided separately from the controller 71 and provided outside the controller 71, and in this case, the machine learning device 72 may be connected to the controller 71 via a network or the like. .

制御器71は、ダンパ61a,62a,63a,64aおよび排風機15,35,47を制御する。なお、制御器71は、ダンパ61a,62a,63a,64aを制御する制御ユニットと、排風機15,35,47を制御する制御ユニットとを含んでもよい。機械学習器72は、排熱回収システム1においてできるだけ大きなエネルギを生成するための機械学習を行なう。機械学習器72は、ダンパ61a,62a,63a,64aの開度の少なくとも1つを含む運転値を決定することを機械学習する。すなわち、制御対象であるダンパ61a,62a,63a,64aおよび排風機15,35,47のうちの一部が、機械学習器72により出力される運転値に基づき制御され、残りは、記憶部に予め記憶されたプログラムおよび/またはデータに基づき制御される。 The controller 71 controls the dampers 61a, 62a, 63a, 64a and the exhaust fans 15, 35, 47. Note that the controller 71 may include a control unit that controls the dampers 61a, 62a, 63a, and 64a, and a control unit that controls the exhaust fans 15, 35, and 47. The machine learning device 72 performs machine learning to generate as much energy as possible in the exhaust heat recovery system 1. The machine learning device 72 performs machine learning to determine an operating value including at least one of the opening degrees of the dampers 61a, 62a, 63a, and 64a. That is, some of the dampers 61a, 62a, 63a, 64a and exhaust fans 15, 35, 47 that are to be controlled are controlled based on the operating values output by the machine learning device 72, and the rest are stored in the storage unit. Control is based on pre-stored programs and/or data.

以下に説明する例では、制御対象のうちバイパスダンパ62a,64aが、機械学習器72により出力される運転値に基づき制御されるものとして説明する。この場合、例えば、入口ダンパ61a,63aは、セメント製造設備2が稼働する間、予め定めた設定開度(例えば開度100%)となるよう制御器71により制御される。また、排風機15,35,47は、セメント製造設備2が稼働する間、予め定めた設定回転数(排風量)で稼働するよう制御器71により制御される。 In the example described below, it is assumed that the bypass dampers 62a and 64a among the control targets are controlled based on the operating value output by the machine learning device 72. In this case, for example, the inlet dampers 61a and 63a are controlled by the controller 71 to maintain a predetermined opening degree (eg, 100% opening degree) while the cement manufacturing equipment 2 is in operation. Further, the exhaust fans 15, 35, and 47 are controlled by the controller 71 so as to operate at a predetermined set rotation speed (air exhaust amount) while the cement manufacturing equipment 2 is in operation.

排熱回収システム1の状態に対して、単純な演算式等を用いて、バイパスダンパ62a,64aの開度をどのように調節すれば最適なシステムを実現できるのかを明示的に示すことは困難である。そこで、人工知能としての機械学習器72は、報酬を与えるだけで目標到達のための行動を自動的に学習する強化学習のアルゴリズムを採用する。以下、機械学習器72が行う機械学習について説明する。 It is difficult to explicitly show how to adjust the opening degrees of the bypass dampers 62a and 64a to realize an optimal system based on the state of the exhaust heat recovery system 1 using a simple calculation formula, etc. It is. Therefore, the machine learning device 72 as an artificial intelligence employs a reinforcement learning algorithm that automatically learns actions to reach a goal just by giving a reward. The machine learning performed by the machine learning device 72 will be described below.

-機械学習方法-
図3は、強化学習アルゴリズムの基本的な概念を説明する図である。図3に示すように、強化学習では、学習する主体となるエージェント(制御装置7)と、制御対象となる環境(セメント製造設備2および発電設備3)とのやり取りにより、エージェントの学習が進行する。より具体的には、エージェントの学習に際し、次の(1)~(4)が繰り返される。
(1)エージェントが時刻tにおける環境の状態stを観測すること。
(2)エージェントが観測結果と過去の学習に基づいて自分が取れる行動atを選択して、行動atを実行すること。
(3)行動atが実行されることで、環境の状態stが次の状態st+1へと変化し、この状態の変化に基づいて、エージェントが報酬rt+1を受け取ること。
(4)エージェントが状態st、行動at、報酬rt+1および過去の学習の結果に基づいて学習を進めること。
-Machine learning method-
FIG. 3 is a diagram explaining the basic concept of a reinforcement learning algorithm. As shown in Figure 3, in reinforcement learning, the agent's learning progresses through interactions between the learning agent (control device 7) and the environment to be controlled (cement manufacturing equipment 2 and power generation equipment 3). . More specifically, the following (1) to (4) are repeated during agent learning.
(1) The agent observes the state of the environment s t at time t.
(2) The agent selects an action a t that it can take based on observation results and past learning, and executes the action a t .
(3) By executing the action a t , the state of the environment s t changes to the next state s t+1 , and the agent receives a reward r t+1 based on this change in state.
(4) The agent proceeds with learning based on the state s t , the action a t , the reward r t+1 , and the results of past learning.

上記の(4)における学習では、エージェントは将来取得できる報酬rの量を判断するための基準となる情報として、状態st,行動at,報酬rt+1のマッピングを獲得する。例えば、各時刻において取り得る状態の個数がm、取り得る行動の個数がnとすると、行動を繰り返すことによって状態stと行動atの組に対する報酬rt+1を記憶するm×nの2次元配列が得られる。そして、上記得られたマッピングに基づいて現在の状態や行動がどのくらい良いのかを示す関数である価値関数(評価関数)を用い、行動を繰り返す中で価値関数を更新していくことにより状態に対する最適な行動を学習していく。 In the learning in (4) above, the agent acquires a mapping of state s t , action a t , and reward r t+1 as reference information for determining the amount of reward r that can be obtained in the future. For example, if the number of states that can be taken at each time is m and the number of possible actions is n, then by repeating the action, the reward r t+1 for the set of state s t and action a t is memorized. A two-dimensional array is obtained. Based on the mapping obtained above, we use a value function (evaluation function), which is a function that indicates how good the current state and behavior are, and update the value function while repeating the behavior to determine the optimal value for the state. We will learn the following behaviors.

価値関数の一つとして知られる状態行動価値関数Q(st,at)は、ある状態stにおいて行動atがどのくらい良い行動であるのかを示す。状態行動価値関数Q(st,at)は、状態と行動を引数とする関数として表現される。状態行動価値関数Q(st,at)は、行動を繰り返す中での学習において、ある状態における行動に対して得られた報酬や、行動により移行する未来の状態における行動の価値などに基づいて更新される。状態行動価値関数Q(st,at)の更新式は強化学習のアルゴリズムに応じて定義されており、例えば、代表的な強化学習アルゴリズムの1つであるQ学習においては、状態行動価値関数Q(st,at)の更新式は、以下の数1で定義される。 A state-action value function Q (s t , a t ), which is known as one of the value functions, indicates how good an action a t is in a certain state s t . The state-action value function Q (s t , a t ) is expressed as a function using the state and action as arguments. The state-action value function Q (s t , a t ) is based on the reward obtained for an action in a certain state and the value of the action in a future state to which the action will transition during learning while repeating the action. will be updated. The update formula for the state action value function Q(s t , a t ) is defined according to the reinforcement learning algorithm. For example, in Q learning, which is one of the typical reinforcement learning algorithms, the state action value function The update formula for Q(s t , a t ) is defined by Equation 1 below.

Figure 2023138425000002
Figure 2023138425000002

そして、上記の(2)における行動atの選択においては、過去の学習によって作成された価値関数を用いて現在の状態stにおいて将来にわたっての報酬(rt+1+rt+2+…)が最適となる行動at(状態stにおいて最も価値の高い行動at)を選択する。Q学習においては、報酬(rt+1+rt+2+…)が最適となる行動atは、報酬(rt+1+rt+2+…)が最大となる行動atに相当し得る。 Then, in selecting the action a t in (2) above, the future reward (r t+1 +r t+2 +...) in the current state s t is calculated using the value function created by past learning. Select the action a t for which is optimal (the action a t with the highest value in the state s t ). In Q-learning, the action a t for which the reward (r t+1 +r t+2 +...) is optimal corresponds to the action a t for which the reward (r t+1 +r t+2 +...) is the maximum. obtain.

強化学習のアルゴリズムとしては、Q学習、SARSA法、TD学習、AC法など様々な手法が周知であるが、本発明に適用する方法としていずれの強化学習アルゴリズムが採用されてもよい。これらの強化学習アルゴリズムは周知であるから、本明細書における各アルゴリズムの更なる詳細な説明は省略する。 As reinforcement learning algorithms, various methods such as Q learning, SARSA method, TD learning, and AC method are well known, but any reinforcement learning algorithm may be adopted as a method applied to the present invention. Since these reinforcement learning algorithms are well known, further detailed description of each algorithm will be omitted herein.

また、価値関数の更新方法として、現在の状態stに対して或る行動atを適用することにより状態stが新たな状態st+1に移行するたびに、価値関数の更新を行う学習方法(いわゆるオンライン学習)を採用しなくてもよい。例えば、現在の状態stに対して或る行動atを適用することにより状態stが新たな状態st+1に移行するということを繰り返して、それら状態および行動を学習用データとして蓄積し、蓄積した学習用データを用いて価値関数を更新する、いわゆるバッチ学習やミニバッチ学習を採用してもよい。 In addition, as a method for updating the value function, the value function is updated every time the state s t shifts to a new state s t+1 by applying a certain action a t to the current state s t . It is not necessary to adopt a learning method (so-called online learning). For example, by repeatedly applying a certain action a t to the current state s t , the state s t shifts to a new state s t+1 , and these states and actions are stored as learning data. However, so-called batch learning or mini-batch learning, in which the value function is updated using accumulated learning data, may be adopted.

図4は、機械学習器72の機能ブロック図である。図4に示す機械学習器72は、状態観測部91、状態値記憶部92、報酬計算部93、学習部94、学習結果記憶部95、および運転値出力部96を備える。 FIG. 4 is a functional block diagram of the machine learning device 72. The machine learning device 72 shown in FIG. 4 includes a state observation section 91, a state value storage section 92, a reward calculation section 93, a learning section 94, a learning result storage section 95, and an operation value output section 96.

状態観測部91は、セメント製造設備2および発電設備3の状態に関する様々な種類の値を、状態値として取得する。状態値記憶部92は、状態観測部91が取得した状態値を記憶し、記憶した状態値を、報酬計算部93および学習部94に出力する。 The state observation unit 91 acquires various types of values regarding the states of the cement manufacturing equipment 2 and the power generation equipment 3 as state values. The state value storage section 92 stores the state values acquired by the state observation section 91 and outputs the stored state values to the reward calculation section 93 and the learning section 94.

状態値には、例えば、温度計81の計測値(AQC24内上流側の排ガスの温度)、温度計82の計測値(PHボイラ30へ流入する排ガスの温度)、温度計83の計測値(PHボイラ30から流出した排ガスの温度)、温度計84の計測値(AQCボイラ40へ流入する排ガスの温度)、温度計88の計測値(AQCボイラ40から流出した排ガスの温度)、温度計87の計測値(原料ミル11の出口の排ガス温度)、蒸気流量計85の計測値(PHボイラ30の蒸気流量)、蒸気流量計86の計測値(AQCボイラ40の蒸気流量)、蒸気タービン発電機50の発電出力値、消費電力計測器15a,35a,47aの消費電力値などが含まれ得る。状態値には、排風機15,35,47の入口または出口の排ガスの温度が含まれてもよい。状態値には、最新の運転で取得した値の他、過去の運転で取得した値が含まれてもよい。例えば状態値には、予め制御装置7に記憶された値が含まれてもよい。例えば状態値には、水分測定装置17で計測したセメント原料の水分量が含まれてもよいし、入口ダンパ61a,63aの設定開度が含まれてもよいし、排風機15,35,47の各設定回転数(排風量)が含まれてもよい。状態値には、排風機15,35,47の入口の排ガス温度が含まれてもよい。 The state values include, for example, the measured value of the thermometer 81 (the temperature of the exhaust gas on the upstream side in the AQC 24), the measured value of the thermometer 82 (the temperature of the exhaust gas flowing into the PH boiler 30), and the measured value of the thermometer 83 (the temperature of the exhaust gas flowing into the PH boiler 30). The temperature of the exhaust gas flowing out from the boiler 30), the measurement value of the thermometer 84 (the temperature of the exhaust gas flowing into the AQC boiler 40), the measurement value of the thermometer 88 (the temperature of the exhaust gas flowing out from the AQC boiler 40), the measurement value of the thermometer 87 (the temperature of the exhaust gas flowing out from the AQC boiler 40), Measured value (exhaust gas temperature at the outlet of raw material mill 11), measured value of steam flow meter 85 (steam flow rate of PH boiler 30), measured value of steam flow meter 86 (steam flow rate of AQC boiler 40), steam turbine generator 50 power generation output values, power consumption values of the power consumption meters 15a, 35a, 47a, etc. The state value may include the temperature of the exhaust gas at the inlet or outlet of the exhaust fan 15, 35, 47. The status values may include values obtained during past operations as well as values obtained during the latest operation. For example, the state value may include a value stored in the control device 7 in advance. For example, the state value may include the moisture content of the cement raw material measured by the moisture measuring device 17, the set opening degree of the inlet dampers 61a, 63a, or the exhaust fan 15, 35, 47. Each setting rotation speed (exhaust air volume) may be included. The state value may include the exhaust gas temperature at the inlet of the exhaust fan 15, 35, 47.

なお、図4に状態値の例が示されているが、状態値はこれに限定されない。すなわち、状態値記憶部92に記憶される状態値に、図4に示した値の全てが含まれなくてもよいし、図4に示した値とは別の値を含んでもよい。 Note that although an example of the state value is shown in FIG. 4, the state value is not limited to this. That is, the state values stored in the state value storage section 92 may not include all of the values shown in FIG. 4, or may include values other than the values shown in FIG.

報酬計算部93は、予め設定された報酬条件に基づいて、状態値記憶部92から取得した状態値を分析して報酬を計算する。報酬計算部93は、計算した報酬を学習部94に出力する。 The remuneration calculation section 93 analyzes the state value acquired from the state value storage section 92 and calculates the remuneration based on preset remuneration conditions. The reward calculation unit 93 outputs the calculated reward to the learning unit 94.

報酬条件は、強化学習における報酬を与える条件である。報酬条件は、操作者などによって予め機械学習器72に設定される。例えば、報酬条件は、排熱回収システム1において生成されるエネルギが大きいと判定される場合には、生成されるエネルギが小さいと判定される場合に比べて大きい報酬を与えるように設定される。報酬には、例えば、プラスの報酬やマイナスの報酬、報酬なし(報酬ゼロ)などがある。 Reward conditions are conditions for giving rewards in reinforcement learning. The reward conditions are set in advance in the machine learning device 72 by an operator or the like. For example, the reward conditions are set such that when it is determined that the energy generated in the exhaust heat recovery system 1 is large, a larger reward is given than when it is determined that the generated energy is small. Examples of rewards include positive rewards, negative rewards, and no reward (zero reward).

本実施形態では、報酬条件に、排熱回収システム1において生成されるエネルギを評価する指標に応じた報酬を与えるように設定されている。具体的には、評価指標として、蒸気タービン発電機50の発電出力値から、排熱回収システム1における補機の消費電力値を引いた値を用いる。つまり、排熱回収システム1において生成されるエネルギ値として、蒸気タービン発電機50の発電出力値自体ではなく、発電出力値から補機の消費電力を引いた正味のエネルギ値が評価指標として設定されている。 In this embodiment, the remuneration conditions are set so that a remuneration is given according to an index for evaluating the energy generated in the exhaust heat recovery system 1. Specifically, a value obtained by subtracting the power consumption value of the auxiliary equipment in the exhaust heat recovery system 1 from the power generation output value of the steam turbine generator 50 is used as the evaluation index. In other words, as the energy value generated in the exhaust heat recovery system 1, the net energy value obtained by subtracting the power consumption of the auxiliary equipment from the power generation output value is set as an evaluation index, not the power generation output value itself of the steam turbine generator 50. ing.

報酬計算部93は、評価指標としてのエネルギ値が所定の閾値を上回る場合にはプラスの報酬を計算し、エネルギ値が所定の閾値を下回る場合にはマイナスまたはゼロの報酬を計算する。例えば、報酬計算部93は、エネルギ値が所定の第1閾値より低く且つ別の第2閾値より高い場合にゼロの報酬を計算し、エネルギ値が第2閾値より低い場合にマイナスの報酬を計算してもよい。閾値は、シミュレーションや過去の運転結果などにより決定され、制御装置7の記憶部に予め記憶されている。 The reward calculation unit 93 calculates a positive reward when the energy value as an evaluation index exceeds a predetermined threshold, and calculates a negative or zero reward when the energy value is less than a predetermined threshold. For example, the reward calculation unit 93 calculates a zero reward when the energy value is lower than a predetermined first threshold and higher than another second threshold, and calculates a negative reward when the energy value is lower than the second threshold. You may. The threshold value is determined based on simulation, past driving results, etc., and is stored in advance in the storage section of the control device 7.

ここで、評価指標の計算、すなわち報酬の計算には、蒸気タービン発電機50により生成した電力を使用して稼働する全ての補機の消費電力が用いられなくてもよい。例えば、蒸気タービン発電機50により生成した電力を使用して稼働する全ての補機の中で、消費電力が比較的大きい装置のみ報酬の計算に用いられてもよい。本例では、報酬の計算には、他の補機に比べて消費電力の大きい排風機15,35,47の消費電力が用いられる。 Here, the power consumption of all the auxiliary machines that operate using the power generated by the steam turbine generator 50 may not be used for calculating the evaluation index, that is, calculating the reward. For example, among all the auxiliary machines that operate using the electric power generated by the steam turbine generator 50, only the apparatus with relatively large power consumption may be used for calculating the reward. In this example, the power consumption of the exhaust fans 15, 35, and 47, which consume more power than other auxiliary machines, is used to calculate the reward.

学習部94は、状態値記憶部92から取得した状態値および報酬計算部93から取得した報酬に基づいて、運転値の決定を機械学習(強化学習)する。より詳しくは、学習部94は、状態観測部91が取得した状態値から特定された状態(状態値の組み合わせにより定義される状態st)と、当該状態における運転値の決定とを引数で表現した価値関数(状態行動価値関数Q(st,at))を用いて、得られる報酬が最大となるように価値関数を更新する。 The learning unit 94 performs machine learning (reinforcement learning) to determine the driving value based on the state value acquired from the state value storage unit 92 and the reward acquired from the reward calculation unit 93. More specifically, the learning unit 94 expresses the state identified from the state values acquired by the state observation unit 91 (state s t defined by a combination of state values) and the determination of the operating value in the state using arguments. The value function is updated using the value function (state action value function Q (s t , a t )) so that the obtained reward is maximized.

学習結果記憶部95は、学習部94が学習した結果を記憶する。なお、学習結果としての価値関数を記憶する方法としては、近似関数を用いる方法や、配列を用いる方法を一般的に用いられる。但し、これらの方法以外にも、例えば状態が多くの状態を取るような場合には状態st、行動atを入力として価値を出力する多値出力のSVMやニューラルネットワーク等の教師あり学習器を用いる方法などが用いられてもよい。 The learning result storage unit 95 stores the results learned by the learning unit 94. Note that as a method for storing the value function as a learning result, a method using an approximation function or a method using an array are generally used. However, in addition to these methods, for example, when a state has many states, supervised learning devices such as multi-value output SVM or neural network that output values by inputting state s t and action a t can be used. A method using the above may also be used.

運転値出力部96は、学習部94が学習した結果と現在の状態値とに基づき、運転値を決定し、決定された運転値を制御器71に出力する。 The operating value output unit 96 determines an operating value based on the result learned by the learning unit 94 and the current state value, and outputs the determined operating value to the controller 71.

なお、本例では、運転値はバイパスダンパ62a,64aの開度であるが、運転値はこれに限定されない。上述したように、運転値は、ダンパ61a,62a,63a,64aの開度の少なくとも1つを含んでいればよい。例えば、図4に運転値の例を示したように、運転値には、バイパスダンパ62a,64aの開度に加えてまたは代わりに、入口ダンパ61a,63aの各開度および排風機15,35,47の各回転数の一部または全部が含まれ得る。 In this example, the operating value is the opening degree of the bypass dampers 62a, 64a, but the operating value is not limited to this. As described above, the operating value may include at least one of the opening degrees of the dampers 61a, 62a, 63a, and 64a. For example, as shown in FIG. 4, the operating values include the openings of the inlet dampers 61a, 63a and the exhaust fans 15, 35 in addition to or instead of the openings of the bypass dampers 62a, 64a. , 47 rotation speeds may be included.

次に、機械学習器72が行う機械学習(強化学習)の流れを、図5を参照して説明する。 Next, the flow of machine learning (reinforcement learning) performed by the machine learning device 72 will be explained with reference to FIG.

機械学習が開始されると、状態観測部91は環境(状態st)を特定するための情報を状態値として取得する(ステップS01)。状態値記憶部92は、取得した状態値を記憶する(ステップS02)。学習部94は、状態観測部91が取得した状態値に基づいて、現在の状態stを特定する(ステップS03)。学習部94は、過去の学習結果とステップS03で特定した状態stとに基づいて行動atを選択する(ステップS04)。行動atとは、定義された状態stに応じた運転値の決定である。ここで、例えば、複数の運転値を選択可能な行動として用意しておき、過去の学習結果に基づいて将来に得られる報酬rが最も大きくなる行動aを選択するようにしてもよい。運転値出力部96は、ステップS04で選択された行動atに基づいて、出力すべき運転値を決定し、決定された運転値を制御器71へ出力する。制御器71によって行動atが実行され(ステップS05)、これに応じてセメント製造設備2および発電設備3が運転する。 When machine learning is started, the state observation unit 91 acquires information for specifying the environment (state s t ) as a state value (step S01). The state value storage unit 92 stores the acquired state value (step S02). The learning unit 94 identifies the current state s t based on the state value acquired by the state observation unit 91 (step S03). The learning unit 94 selects the action a t based on the past learning results and the state s t specified in step S03 (step S04). Action a t is the determination of an operating value according to a defined state s t . Here, for example, a plurality of driving values may be prepared as selectable actions, and the action a that provides the largest future reward r may be selected based on past learning results. The operating value output unit 96 determines the operating value to be output based on the action a t selected in step S04, and outputs the determined operating value to the controller 71. The action a t is executed by the controller 71 (step S05), and the cement manufacturing equipment 2 and the power generation equipment 3 are operated accordingly.

行動atが実行されて状態が移行した後、状態観測部91が環境(状態st+1)を特定するための情報を取得し(ステップS06)、状態値記憶部92がそれを状態値として記憶する(ステップS07)。この段階においては、セメント製造設備2および発電設備3の状態は、時刻tから時刻t+1への時間的推移と共に、実行された行動atによって変化している。報酬計算部93は、設定された報酬条件に基づいて、時刻t+1の状態値から報酬rt+1を求める(ステップS08)。学習部94は、ステップS03で特定した状態st、ステップS04で選択した行動at、および、ステップS08で算出した報酬rt+1に基づいて機械学習を進める(ステップS09)。学習に用いられる価値関数については、適用する学習アルゴリズムに応じて決定する。学習結果記憶部95は、学習部94が学習した結果を記憶し(ステップS10)、処理はステップS03へ戻る。 After the action a t is executed and the state transitions, the state observation unit 91 acquires information for specifying the environment (state s t+1 ) (step S06), and the state value storage unit 92 stores it as a state value. (step S07). At this stage, the states of the cement manufacturing equipment 2 and the power generation equipment 3 are changing according to the executed action a t as well as the time transition from time t to time t+1. The reward calculation unit 93 calculates the reward r t+ 1 from the state value at time t+1 based on the set reward conditions (step S08). The learning unit 94 advances machine learning based on the state s t specified in step S03, the action a t selected in step S04, and the reward r t+1 calculated in step S08 (step S09). The value function used for learning is determined depending on the learning algorithm to be applied. The learning result storage unit 95 stores the results learned by the learning unit 94 (step S10), and the process returns to step S03.

上述の通り、機械学習器72では、機械学習(強化学習)を繰り返す。機械学習器72による学習は、エネルギの生成に関して最適なシステムが実現されたことが確認された段階で(例えば、所定の期間、所定のエネルギを生成することが確認された段階で)完了させてもよい。 As described above, the machine learning device 72 repeats machine learning (reinforcement learning). Learning by the machine learning device 72 is completed when it is confirmed that an optimal system for energy generation has been achieved (for example, when it is confirmed that a predetermined energy is generated for a predetermined period). Good too.

学習が完了した学習データを用いて実際に排熱回収システム1の運転値を決定する際には、機械学習器72は新たな学習を行なわないようにして、学習完了時の学習データをそのまま使用して繰り返し運転をするようにしてもよい。この場合、運転値出力部96は、学習部94が学習した結果(即ち、学習結果記憶部95に記憶されている学習結果)と現在の状態値とに基づいて運転値を決定し、それを制御器71へ出力する。 When actually determining the operating value of the exhaust heat recovery system 1 using the learning data for which learning has been completed, the machine learning device 72 does not perform new learning and uses the learning data at the time of learning completion as is. It is also possible to perform repeated operation. In this case, the operating value output unit 96 determines the operating value based on the result learned by the learning unit 94 (that is, the learning result stored in the learning result storage unit 95) and the current state value, and Output to controller 71.

以上に説明した通り、本実施形態に係る排熱回収システム1は、機械学習器72(機械学習装置)を備えており、機械学習器72は、運転値を制御器71に出力する運転値出力部96と、AQCボイラ40へ流入する排ガスの温度と、AQCボイラ40から流出する排ガスの温度と、PHボイラ30へ流入する排ガスの温度と、PHボイラ30から流出する排ガスの温度と、蒸気タービン発電機50の発電出力値と、を含む状態値を取得する状態観測部91と、運転値に基づきバイパスダンパ62a,64aを動作させた後に取得された状態値に含まれる発電出力値に関連する所定のエネルギ値に基づいて、報酬を計算する報酬計算部93と、運転値、状態値および報酬とに基づいて、現在の状態値から制御器71に出力する運転値を決定することを機械学習する学習部94と、を備える。 As explained above, the exhaust heat recovery system 1 according to the present embodiment includes a machine learning device 72 (machine learning device), and the machine learning device 72 outputs an operating value to output an operating value to the controller 71. 96, the temperature of the exhaust gas flowing into the AQC boiler 40, the temperature of the exhaust gas flowing out from the AQC boiler 40, the temperature of the exhaust gas flowing into the PH boiler 30, the temperature of the exhaust gas flowing out from the PH boiler 30, and the steam turbine. A state observation unit 91 that acquires a state value including the power generation output value of the generator 50, and a power generation output value included in the state value acquired after operating the bypass dampers 62a, 64a based on the operating value. A reward calculation unit 93 calculates a reward based on a predetermined energy value, and machine learning determines an operating value to be output to the controller 71 from the current state value based on the operating value, state value, and reward. A learning section 94 is provided.

本実施形態によれば、できるだけ大きなエネルギを生成するような運転値を決定することを機械学習することができる。従って、機械学習器72の学習結果を用いて、現在の排熱回収システム1の状態から決定した運転値に基づき、バイパスライン62,64に夫々設けられたバイパスダンパ62a,64aを動作させることにより、排ガスからできるだけ大きなエネルギを生成するシステムを実現できる。 According to this embodiment, machine learning can be performed to determine operating values that generate as much energy as possible. Therefore, by operating the bypass dampers 62a and 64a provided in the bypass lines 62 and 64, respectively, based on the operating values determined from the current state of the exhaust heat recovery system 1 using the learning results of the machine learning device 72. , it is possible to realize a system that generates as much energy as possible from exhaust gas.

学習部94は、状態観測部91が取得した状態値から特定された状態と、当該状態における運転値の決定とを引数で表現した価値関数(状態行動価値関数Q(st,at))を用いて、報酬が最大となるように価値関数を更新するように構成されてよい。 The learning unit 94 generates a value function (state action value function Q(s t , a t )) that expresses the state specified from the state value acquired by the state observation unit 91 and the determination of the driving value in the state using arguments. may be used to update the value function so that the reward is maximized.

また、本実施形態では、機械学習器72が、AQCボイラ40およびPHボイラ30の双方について、流入する排ガス量を調節する運転値の決定を学習する。このため、システム全体の最適化を図ることができる。 Further, in the present embodiment, the machine learning device 72 learns how to determine the operating value for adjusting the amount of inflowing exhaust gas for both the AQC boiler 40 and the PH boiler 30. Therefore, the entire system can be optimized.

また、機械学習器72の報酬計算部93は、報酬を計算するための評価指標として、蒸気タービン発電機50の発電出力値から、排熱回収システム1における補機の消費電力値を引いた値を用いる。このため、正味の発電効率を向上することができる。 In addition, the remuneration calculation unit 93 of the machine learning device 72 uses a value obtained by subtracting the power consumption value of the auxiliary equipment in the exhaust heat recovery system 1 from the power generation output value of the steam turbine generator 50 as an evaluation index for calculating the remuneration. Use. Therefore, the net power generation efficiency can be improved.

以上に本発明の好適な実施の形態を説明したが、本発明の精神を逸脱しない範囲で、上記実施形態の具体的な構造および/又は機能の詳細を変更したものも本発明に含まれ得る。上記の排熱回収システム1の構成は、例えば、以下のように変更することができる。 Although the preferred embodiments of the present invention have been described above, the present invention may include modifications of the specific structure and/or functional details of the above embodiments without departing from the spirit of the present invention. . The configuration of the exhaust heat recovery system 1 described above can be modified as follows, for example.

上記実施形態では、機械学習器72が、AQCボイラ40およびPHボイラ30の双方について、流入する排ガス量を調節する運転値の決定を学習したが、本発明はこれに限定されない。 In the embodiment described above, the machine learning device 72 learned how to determine the operating value for adjusting the amount of inflowing exhaust gas for both the AQC boiler 40 and the PH boiler 30, but the present invention is not limited thereto.

例えば、上記実施形態では、機械学習器72が、PH用バイパスダンパ62aの開度とAQC用バイパスダンパ64aの開度を含む運転値の決定を学習したが、機械学習器72は、PH用入口ダンパ61aの開度および/またはPH用バイパスダンパ62aの開度を含む運転値の決定を機械学習してもよい。つまり、AQCボイラ40およびPHボイラ30全体ではなく、PHボイラ30単体の熱回収率の向上を図る運転値の決定を機械学習してもよい。この場合、状態値には、PHボイラ30へ流入する排ガスの温度と、PHボイラ30から蒸気タービン発電機50へ送る蒸気の流量と、蒸気タービン発電機50の発電出力値とが含まれ得る。また、この場合、状態値には、PHボイラ30から流出する排ガスの温度が含まれ得る。 For example, in the above embodiment, the machine learning device 72 learned to determine the operating values including the opening degree of the PH bypass damper 62a and the opening degree of the AQC bypass damper 64a. Machine learning may be used to determine the operating values including the opening degree of the damper 61a and/or the opening degree of the PH bypass damper 62a. That is, machine learning may be used to determine an operating value that improves the heat recovery rate of the PH boiler 30 alone, rather than the AQC boiler 40 and the PH boiler 30 as a whole. In this case, the state value may include the temperature of the exhaust gas flowing into the PH boiler 30, the flow rate of steam sent from the PH boiler 30 to the steam turbine generator 50, and the power generation output value of the steam turbine generator 50. Further, in this case, the state value may include the temperature of the exhaust gas flowing out from the PH boiler 30.

また、例えば、機械学習器72は、AQC用入口ダンパ63aの開度および/またはAQC用バイパスダンパ64aの開度を含む運転値の決定を機械学習してもよい。つまり、AQCボイラ40およびPHボイラ30全体ではなく、AQCボイラ40単体の熱回収率の向上を図る運転値の決定を機械学習してもよい。この場合、状態値には、AQCボイラ40へ流入する排ガスの温度と、AQCボイラ40から蒸気タービン発電機50へ送る蒸気の流量と、蒸気タービン発電機50の発電出力値とが含まれ得る。また、この場合、状態値には、AQCボイラ40から流出する排ガスの温度が含まれ得る。 Further, for example, the machine learning device 72 may perform machine learning to determine the operating value including the opening degree of the AQC inlet damper 63a and/or the opening degree of the AQC bypass damper 64a. That is, machine learning may be used to determine an operating value that improves the heat recovery rate of the AQC boiler 40 alone, rather than the AQC boiler 40 and the PH boiler 30 as a whole. In this case, the state value may include the temperature of the exhaust gas flowing into the AQC boiler 40, the flow rate of steam sent from the AQC boiler 40 to the steam turbine generator 50, and the power generation output value of the steam turbine generator 50. Further, in this case, the state value may include the temperature of the exhaust gas flowing out from the AQC boiler 40.

また、上記実施形態では、評価指標としてのエネルギ値は、蒸気タービン発電機50の発電出力値から、補機の消費電力値を引いた値であったが、評価指標としてのエネルギ値はこれに限られない。例えば、評価指標としてのエネルギ値は、蒸気タービン発電機50の発電出力値自体であってもよい。 Further, in the above embodiment, the energy value as an evaluation index is the value obtained by subtracting the power consumption value of the auxiliary equipment from the power generation output value of the steam turbine generator 50. Not limited. For example, the energy value as the evaluation index may be the power generation output value of the steam turbine generator 50 itself.

1 :排熱回収システム
2 :セメント製造設備
3 :発電設備
7 :制御装置
15 :排風機
16 :放出設備
20 :焼成設備(セメント焼成設備)
21 :プレヒータ(PH)
22 :仮焼炉
22a :仮焼炉用抽気ライン
22b :燃料供給ライン
23 :ロータリキルン
24 :エアクエンチングクーラ(AQC)
30 :PHボイラ
35 :排風機
40 :AQCボイラ
47 :排風機
48 :放出設備
50 :蒸気タービン発電機
61 :排ガスライン
61a :入口ダンパ
62 :バイパスライン
62a :バイパスダンパ
63 :排ガスライン
63a :入口ダンパ
64 :バイパスライン
64a :バイパスダンパ
71 :制御器
72 :機械学習器(機械学習装置)
91 :状態観測部
92 :状態値記憶部
93 :報酬計算部
94 :学習部
95 :学習結果記憶部
96 :運転値出力部
1 : Exhaust heat recovery system 2 : Cement manufacturing equipment 3 : Power generation equipment 7 : Control device 15 : Exhaust fan 16 : Release equipment 20 : Firing equipment (cement firing equipment)
21: Preheater (PH)
22: Calciner 22a: Calciner bleed line 22b: Fuel supply line 23: Rotary kiln 24: Air quenching cooler (AQC)
30: PH boiler 35: Exhaust fan 40: AQC boiler 47: Exhaust fan 48: Discharge equipment 50: Steam turbine generator 61: Exhaust gas line 61a: Inlet damper 62: Bypass line 62a: Bypass damper 63: Exhaust gas line 63a: Inlet damper 64: Bypass line 64a: Bypass damper 71: Controller 72: Machine learning device (machine learning device)
91: State observation section 92: State value storage section 93: Reward calculation section 94: Learning section 95: Learning result storage section 96: Operation value output section

Claims (8)

排熱回収システムにおいて運転値の決定を機械学習する機械学習装置であって、
前記排熱回収システムは、
セメント原料を焼成する過程で排ガスを発生する排ガス発生部を有するセメント焼成設備と、
前記セメント焼成設備の外部において前記排ガスを大気に放出する放出設備と、
ボイラおよび排風機が設けられ、前記排ガス発生部で発生した排ガスの一部を、前記ボイラを通過させて前記放出設備へ導く排ガスラインと、
前記排ガス発生部で発生した排ガスの残りを、前記ボイラを迂回させて、前記排ガスラインにおける前記ボイラと前記放出設備の間に導くバイパスラインと、
前記排ガスラインおよび前記バイパスラインの少なくとも一方に設けられた少なくとも1つのダンパと、
前記運転値に基づき前記少なくとも1つのダンパを動作させる制御器と、
前記ボイラにおいて発生した蒸気により発電する蒸気タービン発電機と、を備え、
前記機械学習装置は、
前記運転値を前記制御器に出力する運転値出力部と、
前記ボイラへ流入する排ガスの温度と、前記ボイラから前記蒸気タービン発電機へ送る蒸気の流量と、前記蒸気タービン発電機の発電出力値と、を含む状態値を取得する状態観測部と、
前記運転値に基づき前記少なくとも1つのダンパを動作させた後に取得された前記状態値に含まれる前記発電出力値に関連する所定のエネルギ値に基づいて、報酬を計算する報酬計算部と、
前記運転値と、前記状態値と、前記報酬とに基づいて、現在の前記状態値から前記制御器に出力する前記運転値を決定することを機械学習する学習部と、を備える、機械学習装置。
A machine learning device that performs machine learning to determine operating values in an exhaust heat recovery system,
The waste heat recovery system is
Cement firing equipment having an exhaust gas generation section that generates exhaust gas during the process of firing cement raw materials;
a discharge facility that discharges the exhaust gas to the atmosphere outside the cement firing facility;
an exhaust gas line that is provided with a boiler and an exhaust fan, and guides a part of the exhaust gas generated in the exhaust gas generation section to the discharge equipment through the boiler;
a bypass line that bypasses the boiler and guides the remainder of the exhaust gas generated in the exhaust gas generation section between the boiler and the discharge equipment in the exhaust gas line;
at least one damper provided in at least one of the exhaust gas line and the bypass line;
a controller that operates the at least one damper based on the operating value;
a steam turbine generator that generates electricity using steam generated in the boiler,
The machine learning device includes:
an operating value output unit that outputs the operating value to the controller;
a state observation unit that acquires state values including a temperature of exhaust gas flowing into the boiler, a flow rate of steam sent from the boiler to the steam turbine generator, and a power generation output value of the steam turbine generator;
a remuneration calculation unit that calculates remuneration based on a predetermined energy value related to the power generation output value included in the state value acquired after operating the at least one damper based on the operation value;
A machine learning device comprising: a learning unit that performs machine learning to determine the operating value to be output to the controller from the current state value based on the operating value, the state value, and the reward. .
前記排熱回収システムは、前記蒸気タービン発電機により生成した電力を使用して稼働する補機を備え、
前記補機は、少なくとも前記排風機を含み、
前記エネルギ値は、前記蒸気タービン発電機の発電出力値から、前記補機の消費電力値を引いた値であり、
前記報酬計算部は、前記エネルギ値が所定の閾値を上回る場合にはプラスの報酬を計算し、前記エネルギ値が所定の閾値を下回る場合にはマイナスまたはゼロの報酬を計算する、請求項1に記載の機械学習装置。
The exhaust heat recovery system includes an auxiliary machine that operates using electric power generated by the steam turbine generator,
The auxiliary equipment includes at least the exhaust fan,
The energy value is a value obtained by subtracting the power consumption value of the auxiliary equipment from the power generation output value of the steam turbine generator,
The remuneration calculation unit calculates a positive remuneration when the energy value exceeds a predetermined threshold, and calculates a negative or zero remuneration when the energy value is below a predetermined threshold. Machine learning device described.
前記エネルギ値は、前記発電出力値自体であり、
前記報酬計算部は、前記エネルギ値が所定の閾値を上回る場合にはプラスの報酬を計算し、前記エネルギ値が所定の閾値を下回る場合にはマイナスまたはゼロの報酬を計算する、請求項1に記載の機械学習装置。
The energy value is the power generation output value itself,
The remuneration calculation unit calculates a positive remuneration when the energy value exceeds a predetermined threshold, and calculates a negative or zero remuneration when the energy value is below a predetermined threshold. Machine learning device described.
前記セメント焼成設備は、セメント原料を予熱するプレヒータ(以下、PH)と、前記プレヒータで予熱された前記セメント原料を焼成するキルンと、前記キルンから出た焼成物を搬送しつつ急冷するエアクエンチングクーラ(以下、AQC)とを有し、前記排ガス発生部は前記AQCであり、前記排ガスラインの上流側端部は、前記AQCの所定の高温部と接続されており、前記バイパスラインの上流側端部は、前記高温部よりも焼成物の搬送方向下流側に位置する前記AQCの低温部と接続されている、請求項1~3のいずれか1項に記載の機械学習装置。 The cement firing equipment includes a preheater (hereinafter referred to as PH) that preheats the cement raw material, a kiln that fires the cement raw material preheated by the preheater, and an air quencher that rapidly cools the fired product from the kiln while conveying it. The exhaust gas generating section is the AQC, the upstream end of the exhaust gas line is connected to a predetermined high temperature section of the AQC, and the upstream end of the bypass line is connected to a predetermined high temperature section of the AQC. The machine learning device according to any one of claims 1 to 3, wherein the end portion is connected to a low temperature section of the AQC located downstream of the high temperature section in the conveyance direction of the fired product. 前記放出設備はAQC用放出設備であり、前記ボイラはAQC用ボイラであり、前記排風機はAQC用排風機であり、前記排ガスラインはAQC用排ガスラインであり、前記バイパスラインはAQC用バイパスラインであり、前記ダンパは入口ダンパであり、
前記排熱回収システムは、
前記セメント焼成設備の外部において前記排ガスを大気に放出するPH用放出設備と、
PH用ボイラおよびPH用排風機が設けられ、前記PHで発生した排ガスの一部を、前記PH用ボイラを通過させて前記PH用放出設備へ導くPH用排ガスラインと、
前記PHで発生した排ガスの残りを、前記PH用ボイラを迂回させて、前記排ガスラインにおける前記PH用ボイラと前記PH用放出設備の間に導くPH用バイパスラインと、
前記PH用排ガスラインおよび前記PH用バイパスラインの少なくとも一方に設けられた、開度変更可能な少なくとも1つのPH用ダンパと、を更に備え、
前記蒸気タービン発電機は、前記AQC用ボイラおよび前記PH用ボイラにおいて発生した蒸気により発電し、
前記運転値は、前記少なくとも1つのPH用ダンパの開度を含む、請求項4に記載の機械学習装置。
The discharge equipment is an AQC discharge equipment, the boiler is an AQC boiler, the exhaust fan is an AQC exhaust fan, the exhaust gas line is an AQC exhaust gas line, and the bypass line is an AQC bypass line. and the damper is an inlet damper,
The waste heat recovery system is
PH release equipment that releases the exhaust gas to the atmosphere outside the cement firing equipment;
A PH exhaust gas line, which is provided with a PH boiler and a PH exhaust fan, and leads a part of the exhaust gas generated in the PH through the PH boiler to the PH discharge equipment;
a PH bypass line that bypasses the PH boiler and leads the remainder of the exhaust gas generated in the PH between the PH boiler and the PH discharge equipment in the exhaust gas line;
further comprising at least one PH damper that is provided in at least one of the PH exhaust gas line and the PH bypass line and whose opening degree can be changed,
The steam turbine generator generates electricity using steam generated in the AQC boiler and the PH boiler,
The machine learning device according to claim 4, wherein the operating value includes an opening degree of the at least one PH damper.
前記セメント焼成設備は、セメント原料を予熱するプレヒータ(以下、PH)と、前記プレヒータで予熱された前記セメント原料を焼成するキルンと、前記キルンから出た焼成物を搬送しつつ急冷するエアクエンチングクーラ(以下、AQC)とを有し、前記排ガス発生部は前記PHであり、前記排ガスラインの上流側端部は、前記PHと接続されており、前記バイパスラインの上流側端部は、前記排ガスラインにおける前記ボイラより上流側と接続されている、請求項1~3のいずれか1項に記載の機械学習装置。 The cement firing equipment includes a preheater (hereinafter referred to as PH) that preheats the cement raw material, a kiln that fires the cement raw material preheated by the preheater, and an air quencher that rapidly cools the fired product from the kiln while conveying it. the exhaust gas generating section is the PH, the upstream end of the exhaust gas line is connected to the PH, and the upstream end of the bypass line is connected to the PH. The machine learning device according to claim 1, wherein the machine learning device is connected to an upstream side of the boiler in an exhaust gas line. 前記学習部は、前記状態観測部が取得した前記状態値から特定された状態と、当該状態における前記運転値の決定とを引数で表現した価値関数を用いて、前記報酬が最大となるように前記価値関数を更新する、請求項1~3のいずれか1項に記載の機械学習装置。 The learning unit is configured to maximize the reward using a value function in which the state identified from the state value acquired by the state observation unit and the determination of the operating value in the state are expressed as arguments. The machine learning device according to any one of claims 1 to 3, which updates the value function. 請求項1~3のいずれか1項に記載の機械学習装置を備える、前記排熱回収システム。 The exhaust heat recovery system, comprising the machine learning device according to any one of claims 1 to 3.
JP2023038359A 2022-03-16 2023-03-13 Machine learning apparatus and exhaust heat recovery system Pending JP2023138425A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202210259215.XA CN116804516A (en) 2022-03-16 2022-03-16 Machine learning device and waste heat recovery system
CN202210259215.X 2022-03-16

Publications (1)

Publication Number Publication Date
JP2023138425A true JP2023138425A (en) 2023-10-02

Family

ID=88078389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023038359A Pending JP2023138425A (en) 2022-03-16 2023-03-13 Machine learning apparatus and exhaust heat recovery system

Country Status (2)

Country Link
JP (1) JP2023138425A (en)
CN (1) CN116804516A (en)

Also Published As

Publication number Publication date
CN116804516A (en) 2023-09-26

Similar Documents

Publication Publication Date Title
CN101441442B (en) Control device for plant, control device for thermal power plant, and gas concentration estimation device of coal-burning boiler
CN102011615B (en) Method and system for controlling moisture separator reheaters
CN101657765B (en) Method and apparatus for generalized performance evaluation of equipment using achievable performance derived from statistics and real-time data
EP2369433A1 (en) Computer-based method and device for automatically providing control parameters for a plurality of coal mills supplying coal powder to a plant
US9382848B2 (en) System and method for start-up of a combined cycle power plant
JP2005273655A (en) Power generation control method and its equipment
JP2023138425A (en) Machine learning apparatus and exhaust heat recovery system
US8707702B2 (en) Method and device for utilizing heat transported by a discontinuous flow of exhaust gases
JP3712329B2 (en) Process control unit
JP2018105592A (en) Rotational frequency controller of mill classifier and fuel ratio calculation device suitable for the same
CN116243740A (en) Intelligent ORC evaporator temperature adjusting method and device based on ceramic industry
TWI725529B (en) Dry quenching equipment and dust removal method in dry quenching boiler
JP7126215B2 (en) System controller and control method
CN111094851B (en) Heat value estimation method, heat value estimation device, and refuse storage facility
RU2614241C2 (en) Method and system for determining refrigerant cooling flow parameter
JP6702110B2 (en) Method, device and program for predicting inlet temperature of crusher in circulating crushing plant, and method, device and program for calculating raw material supply amount
JP2021501867A (en) Dynamic heat generation calculations to improve feedback control of solid fuel-based combustion processes
CN113834072B (en) Control device, control method, and computer-readable medium
Mentsiev et al. Automation and control of thermal processes in the furnace
CN114729746A (en) Control device for combustion facility, control method for combustion facility, and program
JPH09170736A (en) Method for supplying specified amount of refuse for refuse incinerator
UA87508C2 (en) Device and method for regulation of operating regime of dry coke-quenching plant
JPH01302021A (en) Control device for pulverized coal fired boiler
WO2020203280A1 (en) Waste heat recovery system
WO2022239668A1 (en) Display device, information processing device, information processing method, and program