CN109552079B

CN109552079B - 一种基于规则与Q-learning增强学习的电动汽车复合能量管理方法

Info

Publication number: CN109552079B
Application number: CN201910080455.1A
Authority: CN
Inventors: 陶吉利; 韩凯; 胡远敏; 马龙华; 张智焕
Original assignee: Ningbo Institute of Technology of ZJU
Current assignee: Ningbo Institute of Technology of ZJU
Priority date: 2019-01-28
Filing date: 2019-01-28
Publication date: 2020-10-09
Anticipated expiration: 2039-01-28
Also published as: CN109552079A

Abstract

本发明公开了一种基于规则与Q‑learning增强学习的电动汽车复合能量管理方法。该方法根据每一时刻车辆的功率需求，锂电池以及超级电容SOC状况来进行能量管理。在基于Q‑learning增强学习的能量管理策略中，能量管理控制器通过观察系统状态采取动作，计算每个动作相应的奖励值并且进行实时更新，利用奖励值通过Q‑learning增强学习算法仿真训练得到一种使系统损耗功率最小的能量管理策略，最后利用学习得到的能量管理策略进行实时功率分配，同时继续对奖励值进行更新，以适应当前的驾驶条件。该方法在满足所需功率的基础上，可以保持锂电池的电量并延长锂电池的寿命，同时降低系统的能量损耗，提高了混合动力系统的效率。

Description

一种基于规则与Q-learning增强学习的电动汽车复合能量管理方法

技术领域

本发明涉及一种基于规则与Q-learning增强学习的电动汽车能量管理方法。

背景技术

当前汽车对不可再生燃料的高度依赖，引起人们对全球环境可持续发展的关注。传统汽车造成的空气污染和资源消耗问题极大地促进了电动汽车的发展。对于电动汽车的储能系统，不仅需要足够的能量来长距离行驶，还需要足够的动力来加速、制动、爬坡等。锂电池由于其重量轻、储能大、功率大、无污染等特点既能满足高功率密度又能满足高能量密度的要求，但单独使用锂电池可能导致电池组过热并缩短其寿命。而超级电容具有寿命长和瞬时功率高等优点，可以作为混合储能系统的辅助电源。另外，超级电容工作的温度范围广，并且可以完全吸收汽车的制动能量，有效地弥补了锂电池的缺点。所以锂电池与超级电容组合的混合动力系统是延长系统寿命，满足大顺是功率需求的有效解决方案。因此，如何高效发挥锂电池及超级电容的特点及优势，对二者能量进行优化分配是动力系统能量管理的核心和关键。

发明内容

本发明的目的是解决电动汽车车混合动力系统的能量分配问题，本文提出了一种基于规则与非线性预测控制的复合能源管理方法，该方法根据每一时刻车辆的功率需求，锂电池以及超级电容SOC状况来进行能量管理。在基于Q-learning增强学习的能量管理策略中，能量管理控制器通过观察系统状态采取动作，计算每个动作相应的奖励值并且进行实时更新，利用奖励值通过Q-learning增强学习算法仿真训练得到一种使系统损耗功率最小的能量管理策略，最后利用学习得到的能量管理策略进行实时功率分配，同时继续对奖励值进行更新，以适应当前的驾驶条件。试验结果表明，该方法可以保持锂电池的电量并延长锂电池的寿命，同时降低系统的能量损耗，提高了混合动力系统的效率。

本发明具体采用的技术方案如下：

一种基于规则与Q-learning增强学习的电动汽车复合能量管理方法，在该复合能量管理方法中，将基于Q-learning增强学习的能量管理策略与基于规则的能量管理策略相结合，以完成对混合动力系统的能量分配；当汽车进行制动或锂电池与超级电容能量过低时，直接基于规则得到锂电池和超级电容的输出功率；其他情况下，采用基于Q-learning增强学习的能量管理策略，通过Q-learning增强学习策略得到锂电池的输出功率，从而完成能量分配。

基于上述技术方案，本发明还可以提供如下优选方式。

作为优选，电动汽车混合动力系统由锂电池和超级电容组成。

作为优选，该方法通过每个时刻汽车运行所需功率P_n、锂电池的SOC以及超级电容的SOC进行锂电池功率P_b与超级电容功率P_uc的分配，具体的分配策略如下：

若P_n<0且USOC>USOC_H，则使P_b＝P_n且P_uc＝0；

若P_n<0且USOC≤USOC_H，则使P_b＝0且P_uc＝P_n；

若P_n>0且USOC>USOC_L且BSOC>BSOC_L，则采用基于Q-learning增强学习的能量管理策略进行功率分配；

若P_n>0且USOC≤USOC_L且BSOC>BSOC_L,则使P_b＝P_n且P_uc＝0；

若P_n>0且USOC>USOC_L且BSOC≤BSOC_L,则使P_b＝0且P_uc＝P_n；

其中，P_n表示每个时刻汽车运行所需功率，BSOC表示锂电池的SOC，USOC表示超级电容的SOC；USOC_H、USOC_L分别表示超级电容SOC的上限值、下限值，BSOC_L表示锂电池SOC的下限值。

进一步的，所述基于Q-learning增强学习的能量管理策略中，增强学习系统接受系统状态的输入，并且根据学习得到的策略输出相应的行为动作；系统在当前动作作用下，变迁到新的状态，同时得到系统对于动作的即时奖励反馈，并且根据即时奖励反馈更新随时间量累计总奖励的价值函数Q；当价值函数收敛时，学习过程结束；所述的增强学习系统的目标是学习一个策略，使系统选择的动作能够获得的奖赏Q最大；所述策略通过价值函数Q值表体现，Q值表为由状态量和动作量生成的二维数表，并通过锂电池与超级电容的损耗来计算并不断更新；控制器根据当前系统所处的状态，在Q值表中选择最大Q值所对应的动作量作为当前最优动作量输出；其中汽车所需功率P_n作为唯一状态量，锂电池的输出功率P_b作为动作量。

进一步的，所述基于Q-learning增强学习的能量管理策略进行功率分配的步骤为：

步骤1).在特定工况下，通过仿真训练学习Q值表，具体计算过程如1.1)～1.6)：

1.1).首先对Q表进行初始化，令其为0；令训练周期数为N，每个周期时间长度为T；令训练周期序列数n为1；

1.2).初始化锂电池和超级电容的状态，令时间序列数t＝1；

1.3).根据当前时刻锂电池和超级电容各个状态以及所需功率，计算锂电池输出电流同时计算即时奖励反馈并更新Q值表，具体方法如下：

选择汽车所需功率P_n作为唯一状态量；将汽车所需功率通过划分为num_s个区间，每个区间代表一个状态，即num_s个状态，对于当前的状态P_n有：

其中，P_nmax表示所需功率的最大值，d₁表示状态量每个区间的长度，n_s表示状态量对应于Q值表中的序列值；状态量通过序列值n_s在Q值表中进行索引；

选择锂电池的输出功率P_b作为动作量，将动作量通过划分为num_a个区间，每个区间代表一个动作，即num_a个动作，则当前的动作P_b由下式计算：

P_b＝(n_a-0.5)·d₂

其中，P_bmax表示锂电池功率的最大值，d₂表示状态量每个区间的长度，n_a表示动作量量对应于Q值表中的序列值，通过索引Q值表获得；同时，超级电容输出功率由所需功率减去锂电池输出功率获得；

由价值函数计算得到的二维Q值表的大小为num_s×num_a；价值函数Q由：即时奖励反馈r和累计奖励两部分组成，其中即时奖励反馈r通过锂电池与超级电容的损耗来表示，具体计算方法为：

r＝-(i_L(k)²·R_i+i_c(k)²·R_c)

其中，i_L(k)和i_c(k)分别为k时刻的锂电池输出电流和超级电容输出电流；R_i为锂电池内阻，R_c为超级电容内阻；同时，价值函数Q根据下式进行更新：

其中，η∈(0,1)为学习速率，γ∈(0,1)为折扣因子；s'和a'分别为状态量s在动作a的作用下得到的下个时刻的状态量与动作量，Q'(s,a)和Q(s,a)分别表示更新后和更新前的价值函数；

1.4).更新锂电池和超级电容的状态；

1.5).令t＝t+1，如果t>T，则n＝n+1；否则转步骤1.3)；

1.6).如果n>N，则结束训练；否则转1.2.

在训练N个周期以后，学习获得一个Q值表；

步骤2).利用规则以及Q值表进行能量的实时分配：在任意工况中，根据每个时刻的功率需求，通过规则以及步骤1)中训练得到的Q值表得到锂电池与超级电容的输出功率，从而完成能量分配；同时在能量分配的过程中，仍然对Q值表进行进一步的修正更新，以适应当前的驾驶条件。

本发明提出的方法根据每一时刻车辆的功率需求，锂电池以及超级电容SOC状况来进行能量管理。该方法根据每一时刻车辆的功率需求，锂电池以及超级电容SOC状况来进行能量管理。在基于Q-learning增强学习的能量管理策略中，能量管理控制器通过观察系统状态采取动作，计算每个动作相应的奖励值并且进行实时更新，利用奖励值通过Q-learning增强学习算法仿真训练得到一种使系统损耗功率最小的能量管理策略，最后利用学习得到的能量管理策略进行实时功率分配，同时继续对奖励值进行更新，以适应当前的驾驶条件。该方法在满足所需功率的基础上，可以保持锂电池的电量并延长锂电池的寿命，同时降低系统的能量损耗，提高了混合动力系统的效率。

附图说明

图1为锂电池模型；

图2为超级电容模型；

图3为电动汽车及双向电能转换研究实验平台结构图；

图4为ECE驾驶工况速度图；

图5为ECE驾驶工况下，两种策略中各个数据比较：从左到右从上到下分别为锂电池输出功率，超级电容输出功率，锂电池SOC，超级电容SOC。

具体实施方式

下面结合附图和具体实施方式对本发明做进一步阐述和说明。

本发明中的基于规则与Q-learning增强学习的电动汽车复合能量管理方法，主要用于对混合动力的电动汽车进行能量分配管理，其混合动力系统由锂电池和超级电容组成。通过该方法，可对电动汽车混合动力输出时的锂电池和超级电容的功率进行合理分配，在满足所需功率的基础上，可以保持锂电池的电量并减少系统能量的损耗。

在该复合能量管理方法中，将基于Q-learning增强学习的能量管理策略与基于规则的能量管理策略相结合，以完成对混合动力系统的能量分配；当汽车进行制动或锂电池与超级电容能量过低时，直接基于规则得到锂电池和超级电容的输出功率；其他情况下，采用基于Q-learning增强学习的能量管理策略，通过Q-learning增强学习策略得到锂电池的输出功率，从而完成能量分配。

电动汽车混合动力系统由锂电池和超级电容组成，因此两者各自的输出功率需要进行合理分配。该方法通过每个时刻汽车运行所需功率P_n、锂电池的SOC以及超级电容的SOC进行锂电池功率P_b与超级电容功率P_uc的分配，具体的分配策略如下：

若P_n<0且USOC>USOC_H，则使P_b＝P_n且P_uc＝0；

若P_n<0且USOC≤USOC_H，则使P_b＝0且P_uc＝P_n；

若P_n>0且USOC≤USOC_L且BSOC>BSOC_L,则使P_b＝P_n且P_uc＝0；

若P_n>0且USOC>USOC_L且BSOC≤BSOC_L,则使P_b＝0且P_uc＝P_n；

在上述策略中，除P_n>0且USOC>USOC_L且BSOC>BSOC_L的情况属于基于Q-learning增强学习的能量管理策略进行分配外，其余均是基于规则的能量管理策略，直接得到锂电池和超级电容的输出功率。

而在基于Q-learning增强学习的能量管理策略中，增强学习系统接受系统状态的输入，并且根据学习得到的策略输出相应的行为动作；系统在当前动作作用下，变迁到新的状态，同时得到系统对于动作的即时奖励反馈，并且根据即时奖励反馈更新随时间量累计总奖励的价值函数Q。当价值函数收敛时，学习过程结束。增强学习系统的目标是学习一个策略，使系统选择的动作能够获得的奖赏Q最大；而所谓的策略通过价值函数Q值表体现，Q值表为由状态量和动作量生成的二维数表，并通过锂电池与超级电容的损耗来计算并不断更新。控制器根据当前系统所处的状态，在Q值表中选择最大Q值所对应的动作量作为当前最优动作量输出；其中汽车所需功率P_n作为唯一状态量，锂电池的输出功率P_b作为动作量。

下面详细介绍基于Q-learning增强学习的能量管理策略进行功率分配的步骤，具体如下：

1.2).初始化锂电池和超级电容的状态，令时间序列数t＝1；

由于Q-learning增强学习策略是在基于规则的能量管理策略基础上进行能量分配的，而在规则中，已将系统所需的大部分状态条件给出，所以这里选择汽车所需功率P_n作为唯一状态量；为了将连续的状态量对应于Q值表中，将汽车所需功率通过划分为num_s个区间，每个区间代表一个状态，即num_s个状态，对于当前的状态P_n有：

选择锂电池的输出功率P_b作为动作量，同样地，将动作量通过划分为num_a个区间，每个区间代表一个动作，即num_a个动作，则当前的动作P_b由下式计算：

P_b＝(n_a-0.5)·d₂

r＝-(i_L(k)²·R_i+i_c(k)²·R_c)

1.4).更新锂电池和超级电容的状态；

1.5).令t＝t+1，如果t>T，则n＝n+1；否则转步骤1.3)；

1.6).如果n>N，则结束训练；否则转1.2.

在训练N个周期以后，学习获得一个Q值表，然后进行步骤2)。

下面基于上述方法，结合具体实施例对其技术效果进行进一步展示，部分参数的定义如前所述，不再赘述。

实施例

在电动汽车及双向电能转换研究实验平台上采用该方法利用ECE(EconomicCommission of Europe)驾驶工况进行实验。实验平台结构图如图3所示，整个研究实验平台由工控机1统一管理，工控机1通过CAN网络控制充电机、逆变器、电池管理系统以及双向DC/DC变换器，通过以太网与电力测功系统工控机2通信，从而电机以及变频器。ECE驾驶工况如图4所示。

在复合能量管理策略中中，将基于Q-learning增强学习的能量管理策略与基于规则的能量管理策略相结合，以完成对混合动力系统的能量分配：当汽车进行制动或锂电池与超级电容能量过低时，直接基于规则得到锂电池和超级电容的输出功率；其他情况下，采用基于Q-learning增强学习的能量管理策略，通过Q-learning增强学习策略得到锂电池的输出功率，从而完成能量分配。本实施例中，电动汽车混合动力系统由锂电池和超级电容组成。其模型建立如下：

1).锂电池模型：本发明选择一个基于RC网络的电池模型来分析锂电池的动态性能，等效模型如图1所示。该模型包含开路电压U_oc、内阻R_i、和RC网络。其中，RC网络通过扩散电阻R_D和扩散电容C_D表示电池的动态电压性能。其中，i_L表示锂电池输出电流(放电为正，充电为负)，U_t表示端电压，U_D表示扩散电阻引起的扩散电压。则锂电池动态方程可表示为：

U_t＝U_oc-U_D-i_L·R_i

2).超级电容模型：为了分析超级电容的动态性能，可将超级电容视为理想电容与内阻R_c的组合，如图2所示。超级电容的动态方程可表示为：

U_ct＝U_co-R_c·i_c

其中，U_ct，U_co分别表示超级电容的端电压与理想电容器两端的电压，i_c为超级电容输出电流(放电为正，充电为负)。同时，超级电容SOC(USOC)可表示为：

其中，U_max表示超级电容电压最大值。

3):系统状态方程：

对于由锂电池和超级电容组成的混合动力系统，可将连续时间模型转换为离散状态方程。选取锂电池扩散电压U_D(k)，锂电池SOC BSOC(k)，超级电容SOC USOC(k)作为状态变量，则锂电池和超级电容的状态方程可表示为：

其中，Q_b，Q_c分别为锂电池与电容的电荷容量，其值分别为2000Ah，7920C。。

同时，锂电池与超级电容的输出功率计算如下：

P_b(k)＝i_L(k)·U_t(k)

P_uc(k)＝i_c(k)·U_ct(k)

且满足P_n(k)＝P_b(k)+P_uc(k)

其中，P_b为锂电池输出功率，P_uc为超级电容输出功率，P_n表示汽车运行所需功率。锂电池与超级电容各个参数及单位如表1所示。

表1锂电池与超级电容模型参数

该方法通过每个时刻汽车运行所需功率P_n、锂电池的SOC以及超级电容的SOC进行锂电池功率P_b与超级电容功率P_uc的分配，具体的分配策略如下：

若P_n<0且USOC>USOC_H，则使P_b＝P_n且P_uc＝0；

若P_n<0且USOC≤USOC_H，则使P_b＝0且P_uc＝P_n；

若P_n>0且USOC≤USOC_L且BSOC>BSOC_L,则使P_b＝P_n且P_uc＝0；

若P_n>0且USOC>USOC_L且BSOC≤BSOC_L,则使P_b＝0且P_uc＝P_n；

在所述基于Q-learning增强学习的能量管理策略中，增强学习系统接受系统状态的输入，并且根据学习得到的策略输出相应的行为动作。系统在当前动作作用下，变迁到新的状态，同时得到系统对于动作的即时奖励反馈，并且根据即时奖励反馈更新随时间量累计总奖励的价值函数Q。当价值函数收敛时，学习过程结束。对于增强学习系统来说，其目标是学习一个策略，使系统选择的动作能够获得的奖赏Q最大。具体计算方法如下：

1)策略：策略规定了特定状态下系统的输出动作。在Q-learning增强学习过程中，策略通过价值函数Q值表体现，Q值表是由状态量和动作量生成的二维数表。控制器根据当前系统所处的状态，在Q值表中选择最大Q值所对应的动作量作为当前最优动作量输出。

2)系统状态量s：由于Q-learning增强学习策略使在基于规则的能量管理策略基础上进行能量分配的，而在规则中，已将系统所需的大部分状态条件给出，所以这里选择汽车所需功率P_n作为唯一状态量。为了将连续的状态量对应于Q值表中，将所需功率通过划分为num_s个区间，每个区间代表一个状态，即num_s个状态，对于当前的状态P_n有：

其中，P_nmax表示所需功率的最大值，d₁表示状态量每个区间的长度，n_s表示状态量对应于Q值表中的序列值。于是状态量可通过序列值n_s在Q值表中进行索引。

3)动作量a：选择锂电池的输出功率P_b作为动作量。同样地，将动作量通过划分为num_a个区间，每个区间代表一个动作，即num_a个动作，则当前的动作P_b可由下式计算：

P_b＝(n_a-0.5)·d₂

其中，P_bmax表示锂电池功率的最大值，d₂表示状态量每个区间的长度，n_a表示动作量量对应于Q值表中的序列值，可通过索引Q值表获得。同时，超级电容输出功率可由所需功率减去锂电池输出功率获得。

4)价值函数Q：价值函数Q可以评估对于当前状态采取某一动作的好坏。由价值函数计算得到的二维Q值表的大小为num_s×num_a。价值函数Q由两部分组成：即时奖励反馈r和累计奖励。其中，即时奖励反馈r通过锂电池与超级电容的损耗来表示，具体计算方法为：

r＝-(i_L(k)²·R_i+i_c(k)²·R_c)

其中，i_L(k)和i_c(k)分别为k时刻的锂电池输出电流和超级电容输出电流；R_i为锂电池内阻，R_c为超级电容内阻。同时，价值函数Q根据下式进行更新：

其中，η∈(0,1)为学习速率，γ∈(0,1)为折扣因子。s'，a'为状态量s在动作a的作用下得到的下个时刻的状态量与动作量，Q'(s,a)和Q(s,a)分别表示更新后和更新前的价值函数。

综上所述，基于规则与Q-learning增强学习的能量管理策略进行功率分配的操作步骤为：

步骤1).在特定工况下，通过仿真训练学习Q值表；

步骤2).利用规则以及Q值表进行能量的实时分配。在任意工况中，根据每个时刻的功率需求，通过规则以及1)中训练得到的Q值表得到锂电池与超级电容的输出功率，从而完成能量分配。同时在能量分配的过程中，仍然通过公式对Q值表进行进一步的修正更新，以适应当前的驾驶条件。

其中在步骤1)中，仿真训练学习Q值表具体计算过程如下：

1.1).首先对Q值表进行初始化，令其为0。令训练周期数为N，每个周期时间长度为T。令训练周期序列数n为1。

1.2).初始化系统状态，令时间序列数t＝1；

1.3).根据当前时刻系统的各个状态值，通过所述方法得到锂电池输出电流并计算即时奖励反馈同时更新Q值表；

1.4).更新系统状态；

1.5).令t＝t+1，如果t>T，则n＝n+1；否则转1.3)；

1.6).如果n>N，则结束训练；否则转1.2).

在训练N个周期以后，可以学习获得一个Q值表。仿真训练过程中各个参数值以及初始状态设定如表2所示：

表2仿真训练参数值及初始状态设定

系统采用该方法(RQL)进行能量管理之后的锂电池与超级电容的输出同只基于规则的能量管理方法(R-Based)的输出对比如图5所示。由图中可以看出，ECE工况下，采用该方法进行能量管理中的超级电容SOC水平比较低，锂电池SOC水平比较高，说明该方法减少了锂电池的使用，保持了锂电池电量，有助于延长锂电池寿命。同时计算可得，采用该方法系统损耗的能量为810.36J，采用基于规则的能量管理方法系统需要能量为877.85J，由此可知，该方法可以减少系统能量损耗

以上所述的实施例只是本发明的一种较佳的方案，然其并非用以限制本发明。有关技术领域的普通技术人员，在不脱离本发明的精神和范围的情况下，还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案，均落在本发明的保护范围内。

Claims

1.一种基于规则与Q-learning增强学习的电动汽车复合能量管理方法，其特征在于：在复合能量管理方法中，将基于Q-learning增强学习的能量管理策略与基于规则的能量管理策略相结合，以完成对混合动力系统的能量分配；当汽车进行制动或锂电池与超级电容能量过低时，直接基于规则得到锂电池和超级电容的输出功率；其他情况下，采用基于Q-learning增强学习的能量管理策略，通过Q-learning增强学习策略得到锂电池的输出功率，从而完成能量分配；

电动汽车混合动力系统由锂电池和超级电容组成；

若P_n<0且USOC>USOC_H，则使P_b＝P_n且P_uc＝0；

若P_n<0且USOC≤USOC_H，则使P_b＝0且P_uc＝P_n；

若P_n>0且USOC≤USOC_L且BSOC>BSOC_L,则使P_b＝P_n且P_uc＝0；

若P_n>0且USOC>USOC_L且BSOC≤BSOC_L,则使P_b＝0且P_uc＝P_n；

其中，P_n表示每个时刻汽车运行所需功率，BSOC表示锂电池的SOC，USOC表示超级电容的SOC；USOC_H、USOC_L分别表示超级电容SOC的上限值、下限值，BSOC_L表示锂电池SOC的下限值；

所述基于Q-learning增强学习的能量管理策略中，增强学习系统接受系统状态的输入，并且根据学习得到的策略输出相应的行为动作；系统在当前动作作用下，变迁到新的状态，同时得到系统对于动作的即时奖励反馈，并且根据即时奖励反馈更新随时间量累计总奖励的价值函数Q；当价值函数收敛时，学习过程结束；所述的增强学习系统的目标是学习一个策略，使系统选择的动作能够获得的奖赏Q最大；所述策略通过价值函数Q值表体现，Q值表为由状态量和动作量生成的二维数表，并通过锂电池与超级电容的能耗来计算并不断更新；控制器根据当前系统所处的状态，在Q值表中选择最大Q值所对应的动作量作为当前最优动作量输出；其中汽车所需功率P_n作为唯一状态量，锂电池的输出功率P_b作为动作量；

所述基于Q-learning增强学习的能量管理策略进行功率分配的步骤为：

1.2).初始化锂电池和超级电容的状态，令时间序列数t＝1；

P_b＝(n_a-0.5)·d₂

其中，P_bmax表示锂电池功率的最大值，d₂表示状态量每个区间的长度，n_a表示动作量对应于Q值表中的序列值，通过索引Q值表获得；同时，超级电容输出功率由所需功率减去锂电池输出功率获得；

r＝-(i_L(k)²·R_i+i_c(k)²·R_c)

1.4).更新锂电池和超级电容的状态；

1.5).令t＝t+1，如果t>T，则n＝n+1；否则转步骤1.3)；

1.6).如果n>N，则结束训练；否则转1.2；

在训练N个周期以后，学习获得一个Q值表；

步骤2).在任意工况中，根据每个时刻的功率需求，通过规则以及步骤1)中训练得到的Q值表得到锂电池与超级电容的输出功率，从而完成能量分配；同时在能量分配的过程中，仍然对Q值表进行进一步的修正更新，以适应当前的驾驶条件。