CN110836518A - 基于系统基础知识的自学习空调系统全局优化控制方法 - Google Patents
基于系统基础知识的自学习空调系统全局优化控制方法 Download PDFInfo
- Publication number
- CN110836518A CN110836518A CN201911101360.XA CN201911101360A CN110836518A CN 110836518 A CN110836518 A CN 110836518A CN 201911101360 A CN201911101360 A CN 201911101360A CN 110836518 A CN110836518 A CN 110836518A
- Authority
- CN
- China
- Prior art keywords
- action
- state
- value
- self
- air conditioning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/62—Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
- F24F11/63—Electronic processing
- F24F11/64—Electronic processing using pre-stored data
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/50—Control or safety arrangements characterised by user interfaces or communication
- F24F11/61—Control or safety arrangements characterised by user interfaces or communication using timers
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Air Conditioning Control Device (AREA)
Abstract
本发明一种基于系统基础知识的自学习空调系统全局优化控制方法,涉及空调智能控制技术领域。基于系统基础知识的自学习空调系统全局优化控制方法,其包括步骤A采集并输入系统基础知识为系统基准模型,并设定优化目标、动作及奖励参数;B读取系统当前运行状态参数;C选定动作;D判断该动作是否满足系统知识限定;E执行动作;F计算奖励总和值函数,并更新【状态‑动作‑值】数据库;G动作转移后进行下一轮循环优化。本发明利用现有系统的少量关键传感器和能耗监测系统的数据,以自学习算法为指导,根据输入参数的评估预测、决策设定参数执行,记录运行收益,学习修正调控策略,总结经验数据库及减少现场优化调试工作量,实现多设备联合优化。
Description
技术领域
本发明涉及空调智能控制技术领域,具体指一种基于系统基础知识的自学习空调系统全局优化控制方法。
背景技术
空调系统是一个动态系统。在中央空调系统运行过程中,各设备性能、状态及负荷等会随着时间、建筑需求或天气等因素变化,其最佳运行策略和工况也会随之变化,导致了固定的运行策略难以满足空调系统动态变化的系统环境。公共建筑大量实际运行数据已经可以被利用,但对于如何将建筑能耗监测实时数据和建筑控制运行结合从而优化建筑实时运行效果、产生节能效益仍然处于探索阶段,缺乏解决方案。针对大部分建筑空调系统运行过程中依然存在严重依赖运行人员经验、仅考虑单一设备缺乏全局优化等问题,目前尚无完备的解决方案。
发明内容
本发明的目的克服现有技术存在的缺失和不足,提出一种基于系统基础知识的自学习空调系统全局优化控制方法,在保证用户舒适性的前提下,提高整个中央空调系统的能效。
本发明具体步骤如下:
(一)、采集并输入系统基础知识作为系统基准模型并设定优化目标、动作及奖励参数。在使用该优化方法之前,需明确该系统的基本信息。一般包括系统实际需求、轮巡时间、系统设备特性、系统设计限制、极限条件等。同时确立优化目标,并根据优化目标初始化优化算法,确立控制系统观察的状态(s,如室外环境参数、室内环境参数、设备运行状态),行动(a,比如升降频率、增减台数等),奖励r(如系统总功率或系统总效率),并初始化【状态-动作-值】数据库,初始化使【状态-动作-值】数据库内各状态下任意一个动作被选择的概率均相等。
(二)、读取当前系统运行状态参数s1。根据已确定的状态参数,通过空调系统传感器、设备或BA等智能系统读取当前时间点的状态参数。
(三)、在当前状态参数下,查找【状态-动作-值】数据库,在状态s1下的所有行为a内利用一定规则选择一个动作a1。该规则下,在学习初始阶段,系统随机选择动作,多次运行后,随着【状态-动作-值】数据库的更新,引入一个选择系数ε,即在s状态下进行动作选择时,有ε的概率选取【状态-动作-值】数据库中奖励总和值最大的动作,剩余1-ε的情况下随机选择动作。为保证取值效率。
(四)、判断该动作是否满足系统知识限定。若该动作满足空调设定知识限定要求,则进入下一步(五),否则直接跳到步(六),取该状态下的动作奖励r1为负无穷。
(五)、执行选取的动作a1。执行动作后,当前状态变为s2,同时得到了执行该动作后的奖励r1。
(六)、计算奖励总和值函数,同时更新【状态-动作-值】数据库。在计算完成动作后的奖励状态更新后,系统在轮训时间后进入下一次优化,继续进行上述流程。奖励总和值的计算方法取执行动作后的奖励值r1加下一状态s2,的最大奖励总和函数值乘以折扣因子。
(七)、在计算完成动作后的奖励总和值后,需要对【状态-动作-值】数据库进行更新。用新的奖励综合值加上旧值和新值之差和学习率的积。通过调整学习率保证搜索空间,最终提高数据库收敛的稳定性。
作为优选,在运行系统之前,需根据系统基本信息确立系统优化目标,进一步明确系统需选用的状态参数、动作参数及奖励参数。
作为优选,在运行优化系统之前,需要确保系统内设备在稳定运行区间内正常运行,无故障、损坏及应急情况。
作为优选,轮巡时间不宜过小,以免损坏设备。
作为优选,单步动作步长应设置在合理范围内,以免损坏设备。
作为优选,【状态-动作-值】数据库可表示为多状态和动作的表格。格式如下:
在数据量较大的情况下,数据库对应关系可以用神经元网络形式表示:以状态和动作作为神经网络的输入,然后经过神经网络分析后得到动作的奖励总和值。
如上所述,本发明在常规机电系统控制的基础上,利用少量关键传感器和现有能耗监测系统的数据,在特定物理边界条件下,以自学习算法为指导,根据输入参数对其运行结果进行评估预测,决策设定机电系统控制参数并执行,记录反馈的运行收益,学习和修正调控策略,最终总结出针对该建筑的规律经验数据库,持续优化机电系统的后续运行。该方法同时可减少现场优化调试的工作量,并可实现系统中多设备的联合优化。同时以自学习方法代替固守不变的传统控制方法,提高系统能效。
本发明对冷却系统进行整体寻优,避免了单一优化过程中由于冷水机组和冷却水泵、冷却塔的性能相互关联相互干扰的问题,达到了满足运行条件前提下能耗最低的目的。
附图说明
图1为本发明基于系统基础知识的自学习空调系统全局优化控制方法流程框图;
图2为本发明实施例的冷却系统优化控制方法的系统示意图。
具体实施方式
下面结合附图和实施例对本发明进一步的描述
本发明基于系统基础知识的自学习空调系统全局优化控制方法流程(如附图1所示),包括如下步骤:
A.采集并输入系统基础知识为系统基准模型,并设定优化目标、动作及奖励参数;
B.读取系统当前运行状态参数;
C.选定动作;
D.判断该动作是否满足系统知识限定;
E.执行动作;
F.计算奖励总和值函数,并更新【状态-动作-值】数据库;
G.动作转移后进行下一轮循环优化。
本发明实施例,基本系统图(如附图2所示)。图中省略了冷冻水输配及末端侧。该系统同时配备了室外湿球温度传感器、冷却塔进水温度传感器,同时冷却塔及冷却泵装有变频设备。对于该系统优化控制来说,由于冷水机组和冷却水泵、冷却塔的性能相互关联相互影响,较低的冷却水供水温度可以提高冷水机组的性能系数,进而使得在相同制冷量下消耗较少的电。然而,较低的冷却水供水温度也要求较大的冷却水量和较大的风量来增加冷凝器的排热能力,导致水泵和风机消耗更多的电能,因此,在此处将冷机、冷却水泵、冷却塔风机统一列为冷却系统进行全局优化。
本发明实施例,A,对于该系统,其优化目标设定为:在满足系统运行要求的基础上,使得冷却侧总效率最高。观察变量设置为当前系统的制冷量q、当前室外湿球温度td,当前水泵频率fp,当前冷却塔频率ft,当前冷却塔进水温度tt,以上参数通过系统传感器以及设备通讯接口读出。系统动作主要有增加冷却塔频率1Hz,减少冷却塔频率1Hz,增加冷却泵频率1Hz,减少冷却泵频率1Hz,维持现状5种,通过冷却泵和冷却塔变频器实现控制。奖励设计为动作后的冷却系统总体效率减去动作前冷却系统整体效率。其中效率计算方法为当前系统制冷量除以当前系统瞬时功率,瞬时功率数据从能耗监测系统中取得。轮巡时间设置为10分钟,同时明确系统限制条件,即水泵及冷却塔的频率调节上限和下限以及冷却塔最高允许进水温度限制。该实施例中,设定水泵及冷却塔的频率上限为50Hz,下限为30Hz,冷却塔最高允许进水温度限制为39℃。
其【状态-动作-值】数据库可表示为如下的表格:
B,读取当前系统运行状态参数,例如系统此时全频率运行,当前状态s为(q1,td1,fp1,ft1,tt1)。从系统中冷机设备、室外湿球温度传感器、冷却泵变频器、冷却塔变频器、冷却水温度传感器读取状态参数。
C,系统开机并维持稳定一段时间后,根据【状态-动作-值】数据库,初始在a1-a5五个动作中随机选择动作,运行一段时间后根据以90%的概率选择奖励总和值最大的动作,10%的概率随机选择动作。
D,判断在该动作a后,频率超过高限值或者低限值,或者冷却塔进水温度高于最高允许进水温度,如出现上述情况,则直接跳到F,取该步动作奖励r1为负无穷。
E,执行选取的动作a。执行动作后,当前状态变为s2,同时根据公式动作前系统整体能耗-动作后系统整体能耗计算得到了执行该动作后的奖励r。
F,计算奖励总和值函数,同时更新【状态-动作-值】数据库。计算奖励总和值。在计算完成动作后的奖励总和值Q*(s1,a1)后,需要对【状态-动作-值】数据库进行更新。
G,经过数轮学习后,数据库收敛,完成全部更新,数据收敛后,系统可根据当前状态选择最优工况进行运行。避免了单一优化过程中由于冷水机组和冷却水泵、冷却塔的性能相互关联相互干扰的问题,达到了满足运行条件前提下能耗最低的目的。
综上所述,本发明在常规机电系统控制的基础上,利用少量关键传感器和现有能耗监测系统的数据,在特定物理边界条件下,以自学习算法为指导,根据输入参数对其运行结果进行评估预测,决策设定机电系统控制参数并执行,记录反馈的运行收益,学习和修正调控策略,最终总结出针对该建筑的规律经验数据库,持续优化机电系统的后续运行。该方法同时可减少现场优化调试的工作量,并可实现系统中多设备的联合优化。同时以自学习方法代替固守不变的传统控制方法。
Claims (11)
1.一种基于系统基础知识的自学习空调系统全局优化控制方法,其特征在于,包括以下步骤:
A.采集并输入系统基础知识为系统基准模型,设定优化目标、动作及奖励参数;
B.读取系统当前运行状态参数;
C.选定动作;
D.判断该动作是否满足系统知识限定;
E.执行动作;
F.计算奖励总和值函数,更新【状态-动作-值】数据库;
G.动作转移后进行下一轮循环优化。
2.根据权利1所述的基于系统基础知识的自学习空调系统全局优化控制方法,其特征在于,所述步骤A.采集并输入系统基础知识作为系统基准模型,并设定优化目标、动作及奖励参数,还包括如下步骤:
A1.所述明确该系统的基本信息:包括系统实际需求、系统设备特性、系统设计限制、极限条件;
A2.所述确立优化目标,根据优化目标初始化优化算法,确立控制系统观察:
状态s,室外环境参数、室内环境参数、设备运行状态;
行动a,升降频率、增减台数;
奖励r,系统总功率或系统总效率;
A3.所述初始化【状态-动作-值】数据库,为各状态下任意一个动作被选择的概率均相等。
3.根据权利1所述的基于系统基础知识的自学习空调系统全局优化控制方法,其特征在于,所述步骤B.读取系统当前运行状态参数:根据已确定的状态参数,通过空调系统传感器、设备或BA智能系统读取当前时间点的状态参数。
4.根据权利1所述的基于系统基础知识的自学习空调系统全局优化控制方法,其特征在于,所述步骤C.选定动作还包括:
在当前状态参数下,查找【状态-动作-值】数据库,在状态s1下的所有行为a内,利用一定规则选择一个动作a1;
该规则下,在学习初始阶段,系统随机选择动作,随着【状态-动作-值】数据库的更新,引入一个选择系数ε,即在任一状态下进行动作选择时,有ε的概率选取【状态-动作-值】数据库中奖励总和值最大的动作,剩余1-ε的情况下随机选择动作。
5.根据权利1所述的基于系统基础知识的自学习空调系统全局优化控制方法,其特征在于,所述步骤D.判断该动作是否满足系统知识限定:若该动作满足空调设定知识限定要求,则进入下一步执行动作,否则直接进入奖励值综合函数计算。
6.根据权利1所述的基于系统基础知识的自学习空调系统全局优化控制方法,其特征在于,所述步骤E.执行动作,还包括如下步骤:
E1.执行选取的动作a1;
E2.执行动作后,当前状态为s2,同时得到了执行该动作后的奖励r1。
7.根据权利1所述的基于系统基础知识的自学习空调系统全局优化控制方法,其特征在于,所述步骤F.计算奖励总和值函数,并更新【状态-动作-值】数据库,还包括如下步骤;
F1.动作转移后进行下一轮循环优化包括:状态更新后,系统在轮巡时间后进入下一次优化,继续进行上述流程;
F2.奖励总和值的计算方法取执行动作后的奖励值r1加下一状态s2,的最大奖励总和函数值乘以折扣因子;
F3.在计算完成动作后的奖励总和值后,更新【状态-动作-值】数据库;
用新的奖励综合值加上旧值和新值之差和学习率的积;
通过调整学习率保证搜索空间,最终提高数据库收敛的稳定性。
9.根据权利2所述的基于系统基础知识的自学习空调系统全局优化控制方法,其特征在于,所述A2.在运行优化系统之前,需要确保系统内设备在稳定运行区间内正常运行,无故障、损坏及应急情况。
10.根据权利7所述的基于系统基础知识的自学习空调系统全局优化控制方法,其特征在于,所述F2.中折扣因子为计算奖励综合值中的一个概率常数,取值在0-1之间,乘上动作后转移到的状态s2下数据库中呈现的最大奖励总和值,再加上s1动作后得到的奖励r1作为Q(s1,a1)。
11.根据权利7所述的基于系统基础知识的自学习空调系统全局优化控制方法,其特征在于,所述F1.轮巡时间不小于30秒。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911101360.XA CN110836518A (zh) | 2019-11-12 | 2019-11-12 | 基于系统基础知识的自学习空调系统全局优化控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911101360.XA CN110836518A (zh) | 2019-11-12 | 2019-11-12 | 基于系统基础知识的自学习空调系统全局优化控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110836518A true CN110836518A (zh) | 2020-02-25 |
Family
ID=69574860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911101360.XA Pending CN110836518A (zh) | 2019-11-12 | 2019-11-12 | 基于系统基础知识的自学习空调系统全局优化控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110836518A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111538233A (zh) * | 2020-05-06 | 2020-08-14 | 上海雁文智能科技有限公司 | 一种基于能耗奖励的中央空调人工智能控制方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104633829A (zh) * | 2013-11-06 | 2015-05-20 | 上海思控电气设备有限公司 | 楼宇冷冻站节能控制装置及方法 |
CN106961684A (zh) * | 2017-03-24 | 2017-07-18 | 厦门大学 | 基于深度强化学习的认知无线电空频二维抗敌意干扰方法 |
WO2018211139A1 (en) * | 2017-05-19 | 2018-11-22 | Deepmind Technologies Limited | Training action selection neural networks using a differentiable credit function |
JP2019060514A (ja) * | 2017-09-25 | 2019-04-18 | 日本電信電話株式会社 | 空調制御装置、空調制御方法、およびプログラム |
CN109726866A (zh) * | 2018-12-27 | 2019-05-07 | 浙江农林大学 | 基于q学习神经网络的无人船路径规划方法 |
CN109804206A (zh) * | 2016-10-11 | 2019-05-24 | 三菱电机株式会社 | 用于操作空调系统的控制器和空调系统的控制方法 |
-
2019
- 2019-11-12 CN CN201911101360.XA patent/CN110836518A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104633829A (zh) * | 2013-11-06 | 2015-05-20 | 上海思控电气设备有限公司 | 楼宇冷冻站节能控制装置及方法 |
CN109804206A (zh) * | 2016-10-11 | 2019-05-24 | 三菱电机株式会社 | 用于操作空调系统的控制器和空调系统的控制方法 |
CN106961684A (zh) * | 2017-03-24 | 2017-07-18 | 厦门大学 | 基于深度强化学习的认知无线电空频二维抗敌意干扰方法 |
WO2018211139A1 (en) * | 2017-05-19 | 2018-11-22 | Deepmind Technologies Limited | Training action selection neural networks using a differentiable credit function |
JP2019060514A (ja) * | 2017-09-25 | 2019-04-18 | 日本電信電話株式会社 | 空調制御装置、空調制御方法、およびプログラム |
CN109726866A (zh) * | 2018-12-27 | 2019-05-07 | 浙江农林大学 | 基于q学习神经网络的无人船路径规划方法 |
Non-Patent Citations (1)
Title |
---|
陈敏: "《认知计算导论》", 30 April 2017, 华中科技大学出版社 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111538233A (zh) * | 2020-05-06 | 2020-08-14 | 上海雁文智能科技有限公司 | 一种基于能耗奖励的中央空调人工智能控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111735178B (zh) | 基于精英主义和svr回归算法的空调节能系统及优化方法 | |
CN110392515B (zh) | 一种基于历史数据的冷热源机房节能控制方法及系统 | |
CN104534627B (zh) | 中央空调冷却水系统综合能效控制方法 | |
CN103912966B (zh) | 一种地源热泵制冷系统优化控制方法 | |
CN114383299B (zh) | 基于大数据与动态仿真的中央空调系统运行策略优化方法 | |
CN111555274B (zh) | 一种空调负荷需求响应能力动态评估方法 | |
CN110220288A (zh) | 基于大数据云平台的集中空调系统智能优化控制方法及装置 | |
CN111780384A (zh) | 一种中央空调控制系统 | |
CN110848895B (zh) | 一种非工空调柔性负荷控制方法和系统 | |
CN116398994B (zh) | 一种基于负荷预测的冷水机组群控优化方法 | |
CN114046593A (zh) | 一种动态预测性机器学习型空调节能控制方法及系统 | |
CN110940061A (zh) | 中央空调控制方法及系统 | |
CN110895029A (zh) | 一种基于冷冻水的温度的建筑负荷预测方法 | |
CN111664550A (zh) | 基于预测模型和最优化算法的能效优化方法及系统 | |
CN117267910B (zh) | 中央空调制冷系统负荷柔性调节方法、装置、设备及介质 | |
CN110836518A (zh) | 基于系统基础知识的自学习空调系统全局优化控制方法 | |
EP3563097B1 (en) | A variable speed compressor based ac system and control method | |
CN102679649B (zh) | 一种制冷系统的节能控制装置和方法 | |
CN114744653B (zh) | 一种复合储能电站运行优化方法、系统及可存储介质 | |
CN116592546A (zh) | 一种基于Q-learning的多目标冷冻侧供水温度控制优化方法 | |
CN114543273B (zh) | 一种集中空调供冷系统自适应深度学习优化节能控制算法 | |
CN110779173A (zh) | 一种基于强化学习的冷水机组无模型优化运行控制方法 | |
CN115526112A (zh) | 一种基于机器学习的建筑碳排放动态寻优管控系统及方法 | |
CN115628517A (zh) | 一种中央空调冷却塔节能策略的模拟系统 | |
CN113757856A (zh) | 一种空调冷却水系统控制方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200225 |