CN115879637A - 基于多智能体深度强化学习的车-站-网互动决策方法 - Google Patents
基于多智能体深度强化学习的车-站-网互动决策方法 Download PDFInfo
- Publication number
- CN115879637A CN115879637A CN202211702610.7A CN202211702610A CN115879637A CN 115879637 A CN115879637 A CN 115879637A CN 202211702610 A CN202211702610 A CN 202211702610A CN 115879637 A CN115879637 A CN 115879637A
- Authority
- CN
- China
- Prior art keywords
- charging
- new energy
- power
- user
- energy automobile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Charge And Discharge Circuits For Batteries Or The Like (AREA)
Abstract
本发明涉及基于多智能体深度强化学习的车‑站‑网互动决策方法,通过采集充电站数据以及用户新能源汽车的数据;构建分布式部分可观测马尔科夫决策模型,并在分布式部分可观测马尔科夫决策模型中设置以用户用能成本、充电站峰谷差造成的惩罚和约束条件不满足造成的惩罚之和作为目标函数;使用多智能体强化学习BiCNet算法构建的分布式部分可观测马尔科夫决策模型进行集中训练和分布式执行,得到实际决策方法。本发明能够有效地使实现电动汽车充电与可再生能源的匹配,最大化的减少了负荷用电高峰,降低了充电站负荷峰谷差。
Description
技术领域
本发明属于电动汽车充电技术领域,尤其是基于多智能体深度强化学习的车-站-网互动决策方法。
背景技术
电动汽车数量与日俱增,截至2022年6月底,全国新能源汽车保有量达1001万辆,然而目前电动汽车充电引导控制策略尚未完备,对用户充电行为缺乏科学有效的引导控制,出现了个别充电站内用户等待时间过长,用户体验较差等一系列问题,甚至引发了配电网局部过载和一定程度的交通拥堵。电动汽车充电过程涉及到“车-站-网”多主体耦合,给充电负荷的有效管理控制增加了难度。
此外,城市大规模电动汽车充电负荷跟随用户的出行行为规律,随着集约型城市的发展和建设,电动汽车随着人群在住宅区和工商业区间进行流动,与人群流动具有高度的一致性。通过研究城市电力负荷曲线发现,人群的出行规律使充电负载峰值与谷值之间的差异增加了14%,车辆与人随影而行,间接增大了对配电网负载均衡的压力。
但若电动汽车能够和充电站、配电网进行友好互动,一方面可通过调整电动汽车的充放电时标进行有序充电调度,通过电动汽车有序充放电等手段将用电高峰时段的部分负荷转移到用电低谷时段,减少高峰用电期的主网电能消耗;另一方面,可以引导电动汽车充电和数据中心负荷与可再生能源出力一致,促进强间歇性的可再生能源消纳,充分利用绿色可再生能源,克服可再生能源和电动汽车负荷的“双随机性”。不仅电动汽车用户可以获得更低的充电成本,充电站和配电网也能减缓更多设备投入。但是目前尚未出现能够将电动汽车和充电站、配电网进行友好互动相结合的方法。
发明内容
本发明的目的在于克服现有技术的不足,提出基于多智能体深度强化学习的车-站-网互动决策方法,能够适应于各场景下新能源电动汽车在充电站的有序充电决策,降低用户的充电费用和充电站的负荷峰谷差。
本发明解决其技术问题是采取以下技术方案实现的:
基于多智能体深度强化学习的车-站-网互动决策方法,包括以下步骤:
步骤1、采集充电站数据以及用户新能源汽车的数据;
步骤2、根据步骤1采集的数据,构建分布式部分可观测马尔科夫决策模型;
步骤3、使用多智能体强化学习BICNET算法对步骤2构建的分布式部分可观测马尔科夫决策模型进行集中训练和分布式执行,得到实际决策方法。
而且,所述充电站数据包括:充电站的运行情况、充电站内分布式发电有功功率和充电桩整体负荷;
用户新能源汽车的数据包括:充电桩所连用户新能源汽车荷电状态、用户新能源汽车离开时间和用户新能源汽车充放电动作。
而且,所述步骤2构建的分布式部分可观测马尔科夫决策模型为:
其中,S为全局状态,具体包括配电网潮流数据和电动汽车负荷Lc, 表示新能源汽车负荷的集合,S是一组全局状态,包括配电网负荷功率的集合L,分布式发电产生的有功功率集合P,配电网内无功功率集合Q,各节点电压集合V以及所处的调度时段t,因此其状态表示为
S={Lc,L,P,Q,V,t}
其中,L={(pL,qL)}表示配电网有功和无功负荷的集合,P={(Pw,Pv)}表示配网内总的风能和光伏有功功率出力的集合,Q={qu}为配电网无功出力的集合,V={(v,θ)}表示电压的幅值和相角;
为用户新能源汽车充放电动作,/>为充电站i内充电桩1上的用户新能源汽车以额定功率充电,/>为充电站i中充电桩x上的新能源汽车在等待充电,为每个充电站i设置一个智能体,智能体Oi, t为单个智能体i)在时刻t观测到的充电站的状态信息,Oi包括充电站内的分布式风力发电有功功率/>和光伏发电功率/>充电桩整体负荷/> 充电桩所连用户新能源汽车荷电状态/>以及用户新能源汽车离开时间N为充电站内所拥有的用户新能源汽车车辆总数,其中,Ri为目标函数,目标函数为用户用能成本、充电站峰谷差造成的惩罚和约束条件不满足造成的惩罚之和:
R=ω1f1+ω2f2
其中,f1为用户侧目标函数,f2为配电网的优化目标,ω1和ω2为优化目标的权重,ω1=ω2=0.5。
而且,所述用户侧目标函数f1为:
其中,Sj为时段j充电站充电电价,Pc,t为园区内时刻t用户新能源汽车总充电功率,Δt为控制时段,Δt=15min因此一天共分为96个控制时刻,X为充电站内充电桩的总数量,Pc,x为时段t内充电桩x所连用户新能源汽车的充电功率,同时电动汽车优化调度需要满足用户需求及电力系统物理约束。
而且,所述用户需求及电力系统物理约束包括:充电量约束、充电功率约束和充放电时刻约束;其中充电量约束条件为:
其中,Tc,x、Td,x分别为充电桩x上所连用户新能源汽车的充电时长和放电时长;SOCmin,x和SOCmax,x分别为用户新能源汽车电池可用的最小、最大荷电状态,α为用户新能源汽车充放电效率,Qx为用户新能源汽车的电池容量,W为用户新能源汽车的日行驶平均能耗,Pd,x(t)为第x充电桩上的新能源汽车放电功率,Pc,x(t)为第x充电桩上的新能源汽车放电功率,为减少用户新能源汽车电池损耗,当新能源汽车荷电状态SOCx<20%时,新能源汽车只能进行充电和填谷,当SOCx>90%时,新能源汽车为了防止过充不得再进行充电:
其中,tcs,x和tds,x分别为用户电动汽车的充电开始时刻和放电开始时刻,SOCmax=90%,SOCmin=20%;
充电功率约束为:
Pc,x,min≤Pc,x≤Pc,x,max(x=1,2,...,X)
其中,Pc,x和Pd,x分别为x充电桩上所连用户新能源汽车的充电功率,Pc,x,max和Pd,x,max分别是第x充电桩上所连用户新能源汽车的最大充放电功率;
充放电时刻约束f2为:
t∈[Teva,Tevd]
其中,Teva为抵达时刻,Tevd为汽车离开时刻。
而且,所述配电网的优化目标为:
其中,Pmax为配电网峰值功率,Pmin为配电网低谷功率,P0为电网各控制时段基础负荷,Pc,t为所有充电站时刻t所有用户新能源汽车总充电功率。
本发明的优点和积极效果是:
1、发明通过采集充电站数据以及用户新能源汽车的数据;构建分布式部分可观测马尔科夫决策模型,并在分布式部分可观测马尔科夫决策模型中设置以用户用能成本、充电站峰谷差造成的惩罚和约束条件不满足造成的惩罚之和作为目标函数;使用多智能体强化学习BICNET算法构建的分布式部分可观测马尔科夫决策模型进行集中训练和分布式执行,得到实际决策方法。本发明能够有效地使实现电动汽车充电与可再生能源的匹配,最大化的减少了负荷用电高峰,降低了充电站负荷峰谷差。
2、本发明所提供的基于深度强化学习的车-站-网互动决策方法,对电动汽车充电功率的有效调控,可明显降低电动汽车集中充电的峰荷值,降低大规模电动汽车充电对电网的冲击,并有效提高电网和充电设施利用率。通过车-站-网互动决策技术可以有效提高配电网消纳新能源发电的能力,将进一步有力推动电力系统和交通系统的低碳化发展,形成用户-充电站-电网多利益主体共赢局面。
附图说明
图1为多智能体深度强化学习神经网络结构图。
具体实施方式
以下结合附图对本发明做进一步详述。
基于多智能体深度强化学习的车-站-网互动决策方法,如图1所示,包括以下步骤:
步骤1、采集充电站数据以及用户新能源汽车的数据。
本步骤中充电站数据包括:充电站的运行情况、充电站内分布式发电有功功率和充电桩整体负荷;用户新能源汽车的数据包括:充电桩所连用户新能源汽车荷电状态、用户新能源汽车离开时间和用户新能源汽车充放电动作。
步骤2、根据步骤1采集的数据,构建分布式部分可观测马尔科夫决策模型。对多个充电站进行车-站-网互动优化调度,并在观测信息的部分着重考虑用户信息的隐私性,各充电站只有本地的用户信息,用户原始信息如某电动汽车离站时间等不再汇总上传到云平台,多个充电站分别根据本地观测到的状态信息在约束条件下做出调度决策并协调配合达到多利益主体的合作共赢,以此建立基于分布式部分可观测马尔科夫决策模型。
其中,S为全局状态,具体包括配电网潮流数据和电动汽车负荷Lc, 表示新能源汽车负荷的集合,S是一组全局状态,包括配电网负荷功率的集合L,分布式发电产生的有功功率集合P,配电网内无功功率集合Q,各节点电压集合V以及所处的调度时段t,因此其状态表示为
S={Lc,L,P,Q,V,t}
其中,L={(pL,qL)}表示配电网有功和无功负荷的集合,P={(Pw,Pv)}表示配网内总的风能和光伏有功功率出力的集合,Q={qu}为配电网无功出力的集合,V={(v,θ)}表示电压的幅值和相角。
为用户新能源汽车充放电动作,/>为充电站i内充电桩1上的用户新能源汽车以额定功率充电,/>为充电站i中充电桩x上的新能源汽车在等待充电,为每个充电站i设置一个智能体,智能体Oi ,t为单个智能体i)在时刻t观测到的充电站的状态信息,Oi包括充电站内的分布式风力发电有功功率/>和光伏发电功率/>充电桩整体负荷/> 充电桩所连用户新能源汽车荷电状态/>以及用户新能源汽车离开时间/>N为充电站内所拥有的用户新能源汽车车辆总数,其中,Ri为目标函数,目标函数为用户用能成本、充电站峰谷差造成的惩罚和约束条件不满足造成的惩罚之和:
R=ω1f1+ω2f2
其中,f1为用户侧目标函数,f2为配电网的优化目标,ω1和ω2为优化目标的权重,ω1=ω2=0.5。
用户侧目标函数f1以用户充电费用最小为目标建立充电模型:
其中,Sj为时段j充电站充电电价,Pc,t为园区内时刻t用户新能源汽车总充电功率,Δt为控制时段,Δt=15min因此一天共分为96个控制时刻,X为充电站内充电桩的总数量,Pc,x为时段t内充电桩x所连用户新能源汽车的充电功率,同时电动汽车优化调度需要满足用户需求及电力系统物理约束。
用户需求及电力系统物理约束包括:充电量约束、充电功率约束和充放电时刻约束;其中充电量约束条件为:
其中,Tc,x、Td,x分别为充电桩x上所连用户新能源汽车的充电时长和放电时长;SOCmin,x和SOCmax,x分别为用户新能源汽车电池可用的最小、最大荷电状态,α为用户新能源汽车充放电效率,Qx为用户新能源汽车的电池容量,W为用户新能源汽车的日行驶平均能耗,Pd,x(t)为第x充电桩上的新能源汽车放电功率,Pc,x(t)为第x充电桩上的新能源汽车放电功率,为减少用户新能源汽车电池损耗,当新能源汽车荷电状态SOCx<20%时,新能源汽车只能进行充电和填谷,当SOCx>90%时,新能源汽车为了防止过充不得再进行充电:
其中,tcs,x和tds,x分别为用户电动汽车的充电开始时刻和放电开始时刻,SOCmax=90%,SOCmin=20%;
充电功率约束为:
Pc,x,min≤Pc,x≤Pc,x,max(x=1,2,…,X)
其中,Pc,x和Pd,x分别为x充电桩上所连用户新能源汽车的充电功率,Pc,x,max和Pd,x,max分别是用户新能源汽车x的最大充放电功率;
充放电时刻约束f2为:
t∈[Teva,Tevd]
其中,Teva为抵达时刻,Tevd为汽车离开时刻。
而且,所述配电网的优化目标为:
其中,Pmax为配电网峰值功率,Pmin为配电网低谷功率,P0为电网各控制时段基础负荷,Pc,t为充电站i时刻Δt所有用户新能源汽车总充电功率。
步骤3、使用多智能体强化学习BICNET算法对步骤2构建的分布式部分可观测马尔科夫决策模型进行训练和实际决策,BICNET算法采用集中训练,分布式执行的方式,得到实际决策方法,同时可以最大程度的保护电动汽车车主信息的隐私性。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。
Claims (6)
1.基于多智能体深度强化学习的车-站-网互动决策方法,其特征在于:包括以下步骤:
步骤1、采集充电站数据以及用户新能源汽车的数据;
步骤2、根据步骤1采集的数据,构建分布式部分可观测马尔科夫决策模型;
步骤3、使用多智能体强化学习BICNET算法对步骤2构建的分布式部分可观测马尔科夫决策模型进行集中训练和分布式执行,得到实际决策方法。
2.根据权利要求1所述的基于多智能体深度强化学习的车-站-网互动决策方法,其特征在于:所述充电站数据包括:充电站的运行情况、充电站内分布式发电有功功率和充电桩整体负荷;
用户新能源汽车的数据包括:充电桩所连用户新能源汽车荷电状态、用户新能源汽车离开时间和用户新能源汽车充放电动作。
3.根据权利要求1所述的基于多智能体深度强化学习的车-站-网互动决策方法,其特征在于:所述步骤2构建的分布式部分可观测马尔科夫决策模型为:
其中,S是一组全局状态,包括配电网负荷功率的集合L,分布式发电产生的有功功率集合P,配电网内无功功率集合Q,各节点电压集合V以及所处的调度时段t,因此其状态表示为:
S={Lc,L,P,Q,V,t}
其中,L={(pL,qL)}表示配电网有功和无功负荷的集合,P={(Pw,Pv)}表示配网内总的风能和光伏有功功率出力的集合,Q={qu}为配电网无功出力的集合,V={(v,θ)}表示电压的幅值和相角,为用户新能源汽车充放电动作,/>为充电站i内充电桩1上的用户新能源汽车以额定功率充电,/>为充电站i中充电桩x上的新能源汽车在等待充电,为每个充电站i设置一个智能体,智能体Oi ,t为单个智能体i,在时刻t观测到的充电站的状态信息,Oi包括充电站内的分布式风力发电有功功率/>和光伏发电功率/>充电桩整体负荷/>充电桩所连用户新能源汽车荷电状态/>以及用户新能源汽车离开时间/>N为充电站内所拥有的用户新能源汽车车辆总数,其中,Ri为目标函数,目标函数为用户用能成本、充电站峰谷差造成的惩罚和约束条件不满足造成的惩罚之和:
R=ω1f1+ω2f2
其中,f1为用户侧目标函数,f2为配电网的优化目标,ω1和ω2为优化目标权重,ω1=ω2=0.5。
5.根据权利要求4所述的基于多智能体深度强化学习的车-站-网互动决策方法,其特征在于:所述用户需求及电力系统物理约束包括:充电量约束、充电功率约束和充放电时刻约束;其中充电量约束条件为:
其中,Tc,x、Td,x分别为充电桩x上所连用户新能源汽车的充电时长和放电时长;SOCmin,x和SOCmax,x分别为新能源汽车电池可用的最小、最大荷电状态,α为用户新能源汽车充放电效率,Qx为新能源汽车的电池容量,W为用户新能源汽车的日行驶平均能耗,Pd,x(t)为第x充电桩上的新能源汽车放电功率,Pc,x(t)为第x充电桩上的新能源汽车放电功率,为减少用户新能源汽车电池损耗,当充电桩x连接的电动汽车荷电状态SOCx<20%时,新能源汽车只能进行充电和填谷,当SOCx>90%时,新能源汽车为了防止过充不得再进行充电:
其中,tcs,x和tds,x分别为用户电动汽车的充电开始时刻和放电开始时刻,SOCmax=90%,SOCmin=20%;
充电功率约束为:
Pc,x,min≤Pc,x≤Pc,x,max(x=1,2,…,X)
其中,Pc,x和Pd,x分别为x充电桩上所连用户新能源汽车的充电功率,Pc,x,max和Pd,x,max分别是第x充电桩上所连的新能源汽车的最大充电和放电功率;
充放电时刻约束f2为:
t∈[Teva,Tevd]
其中,Teva为抵达时刻,Tevd为汽车离开时刻。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211702610.7A CN115879637A (zh) | 2022-12-29 | 2022-12-29 | 基于多智能体深度强化学习的车-站-网互动决策方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211702610.7A CN115879637A (zh) | 2022-12-29 | 2022-12-29 | 基于多智能体深度强化学习的车-站-网互动决策方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115879637A true CN115879637A (zh) | 2023-03-31 |
Family
ID=85756951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211702610.7A Pending CN115879637A (zh) | 2022-12-29 | 2022-12-29 | 基于多智能体深度强化学习的车-站-网互动决策方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115879637A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116436019A (zh) * | 2023-04-12 | 2023-07-14 | 国网江苏省电力有限公司电力科学研究院 | 一种多资源协调优化方法、装置及存储介质 |
CN116901774A (zh) * | 2023-09-11 | 2023-10-20 | 南京安充智能科技有限公司 | 基于全网通充电桩的柔性配电方法、系统及存储介质 |
CN117613919A (zh) * | 2023-11-24 | 2024-02-27 | 浙江大学 | 一种工商业园区用电峰谷差智能控制方法 |
-
2022
- 2022-12-29 CN CN202211702610.7A patent/CN115879637A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116436019A (zh) * | 2023-04-12 | 2023-07-14 | 国网江苏省电力有限公司电力科学研究院 | 一种多资源协调优化方法、装置及存储介质 |
CN116436019B (zh) * | 2023-04-12 | 2024-01-23 | 国网江苏省电力有限公司电力科学研究院 | 一种多资源协调优化方法、装置及存储介质 |
CN116901774A (zh) * | 2023-09-11 | 2023-10-20 | 南京安充智能科技有限公司 | 基于全网通充电桩的柔性配电方法、系统及存储介质 |
CN116901774B (zh) * | 2023-09-11 | 2023-11-14 | 南京安充智能科技有限公司 | 基于全网通充电桩的柔性配电方法、系统及存储介质 |
CN117613919A (zh) * | 2023-11-24 | 2024-02-27 | 浙江大学 | 一种工商业园区用电峰谷差智能控制方法 |
CN117613919B (zh) * | 2023-11-24 | 2024-05-24 | 浙江大学 | 一种工商业园区用电峰谷差智能控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115879637A (zh) | 基于多智能体深度强化学习的车-站-网互动决策方法 | |
CN105322559B (zh) | 一种基于v2g技术的电动汽车配电调度控制方法 | |
WO2022021957A1 (zh) | 运营商收益最大化的v2g二阶段随机规划调度模型 | |
CN109492791B (zh) | 基于充电引导的城际高速路网光储充电站定容规划方法 | |
CN102130478B (zh) | 电动汽车充电站协调充电控制方法 | |
CN108631344B (zh) | 一种计及输电网运行约束的电动汽车有序充放电控制方法 | |
CN109146201A (zh) | 基于合作博弈的充换储一体化电站微电网优化调度方法 | |
CN104269849A (zh) | 基于建筑光伏微电网的能量管理方法及系统 | |
CN109599856A (zh) | 一种微网多楼宇中电动汽车充放电管理优化方法及装置 | |
CN112186809A (zh) | 基于电动汽车v2g模式的虚拟电厂优化协同调度方法 | |
CN113098011B (zh) | 一种基于改进NashQ算法的风电调度方法及系统 | |
CN110429596B (zh) | 计及电动汽车时空分布的配电网可靠性评估方法 | |
CN106960279A (zh) | 考虑用户参与度的电动汽车能效电厂特征参数评估方法 | |
CN102708425A (zh) | 基于Multi-Agent系统的电动汽车服务网络协调控制系统及方法 | |
CN107590607A (zh) | 一种基于光伏预测的微电网优化调度系统和方法 | |
CN109117503A (zh) | 一种v2v和v2g共存应用场景模型的构建方法及装置 | |
CN112183882B (zh) | 一种基于电动汽车快充需求的智慧充电站充电优化方法 | |
CN107453381A (zh) | 基于两阶段交叉控制的电动汽车集群功率调节方法及系统 | |
CN111626527A (zh) | 计及可调度电动汽车快/慢充放电形式的智能电网深度学习调度方法 | |
CN111762057B (zh) | 一种区域微网中v2g电动汽车智能充放电管理方法 | |
CN109742755A (zh) | 基于节点分区的含电动汽车的主动配电网运行调度方法 | |
CN107391899A (zh) | 一种电动汽车集群负荷响应能力评估方法 | |
Hai-Ying et al. | Optimal control strategy of vehicle-to-grid for modifying the load curve based on discrete particle swarm algorithm | |
CN117698496A (zh) | 考虑多分布资源协调运行的充电桩规划方法、系统、介质 | |
CN116961057A (zh) | 一种考虑电动汽车的多时段配电网故障恢复方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |