CN112465303A - 考虑需求响应基于多代理的双边电力市场优化决策方法 - Google Patents
考虑需求响应基于多代理的双边电力市场优化决策方法 Download PDFInfo
- Publication number
- CN112465303A CN112465303A CN202011233077.5A CN202011233077A CN112465303A CN 112465303 A CN112465303 A CN 112465303A CN 202011233077 A CN202011233077 A CN 202011233077A CN 112465303 A CN112465303 A CN 112465303A
- Authority
- CN
- China
- Prior art keywords
- agent
- price
- electricity
- market
- strategy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000004044 response Effects 0.000 title claims abstract description 37
- 238000005457 optimization Methods 0.000 title claims abstract description 25
- 230000002146 bilateral effect Effects 0.000 title claims abstract description 22
- 230000005611 electricity Effects 0.000 claims abstract description 103
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 25
- 238000010248 power generation Methods 0.000 claims abstract description 18
- 238000007670 refining Methods 0.000 claims description 4
- 238000000137 annealing Methods 0.000 claims description 3
- 238000001816 cooling Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 abstract description 12
- 230000007246 mechanism Effects 0.000 abstract description 10
- 230000008859 change Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S50/00—Market activities related to the operation of systems integrating technologies related to power network operation or related to communication or information technologies
- Y04S50/14—Marketing, i.e. market research and analysis, surveying, promotions, advertising, buyer profiling, customer management or rewards
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种考虑需求响应基于多代理的双边电力市场优化决策方法,包括:发电商Agent确定报价策略,递交分段报价信息;零售商Agent进行负荷预测,递交购电投标信息;ISO根据收到的报价信息和购电投标信息,生成供给曲线和需求曲线,并调用出清算法,确定市场出清信息;各发电商Agent计算各自的发电成本和收益,根据Q学习算法完善决策;各零售商Agent计算购电成本,并确定零售电价;用户Agent向零售商Agent购电,根据实际情况和价格信号进行响应并调整用电计划;零售商Agent计算其收益,根据Q学习算法完善决策。本发明在双边电力市场机制下考虑了用户、零售商、发电商各方收益,优化了各方决策行为。
Description
技术领域
本发明涉及电力市场优化决策技术领域,尤其涉及一种考虑需求响应基于多代理的双边电力市场优化决策方法。
背景技术
电力市场改革是由传统的垂直一体化垄断经营引入竞争的过程。竞争的引入一般从发电侧开始,首先实行厂网分开,通过建立独立的发电企业与独立系统运营商(Independent System Operator,ISO),发电企业以最大化收益为目标参与竞价,打破传统电网各发电机组按照统一计划发电的模式。
在仅有发电侧开放的电力市场中,价格形成机制不完善,电价长期保持不变或变化不明显,用户需求弹性很低或近乎为零。ISO只接受来自发电商的报价,而认定负荷需求为一定值,用户或负荷聚集商只能被动的接受市场价格。这种体制有诸多弊端,例如发电商可能合谋抬高电价,导致电价高于正常水平,从而攫取不正当利益;另外,为满足负荷的增长,只能不断增加装机容量,长期来看投资成本巨大。
对称电力市场是指发电侧和零售侧同时参与竞价的市场。此时,市场的出清价格由发电侧和零售侧共同决定,竞争机制更加完善,并有利于充分调动需求侧资源,发掘用户的响应潜力,使其积极响应市场价格的变化,从而确保电力市场更加高效的运行,最大化社会福利,并在紧急时刻实施紧急需求响应等以确保系统稳定运行。目前已有许多国家将需求响应(Demand Response,DR)项目纳入了电力市场框架中,如美国PJM电力市场的紧急需求响应项目和经济需求响应项目、德州电力市场ERCORT的自愿负荷响应以及负荷资源参与辅助服务等。
作为研究分布式系统的有效方法,基于多代理(Multi-agent)的计算经济学仿真在电力市场研究中得到了广泛应用。现有技术大多仅研究批发侧市场下的相关问题及发电商报价策略,并没有考虑售电侧放开的市场模式以及零售商的参与,也没有涉及用户需求响应。目前的研究较少考虑用户、零售商、发电商之间的交互以及用户在分时电价下的响应行为特性。
因此,本领域的技术人员致力于开发一种考虑需求响应的双边电力市场优化决策方法。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何在双边电力市场机制下考虑用户、零售商、发电商各方收益,优化各方决策行为。
为实现上述目的,本发明提供了一种考虑需求响应基于多代理的双边电力市场优化决策方法,所述方法包括以下步骤:
步骤1、参与报价的发电商Agent结合自身机组的参数和所知的市场信息,确定报价策略,并按照规定的格式递交分段报价信息,所述报价信息包括供电电量和供电价格;
步骤2、具有购电需求的零售商Agent结合其供电区域内用户的用电特性,进行负荷预测,按照规定格式递交自己的购电投标信息,所述购电投标信息包括购电投标电量和购电投标价格;
步骤3、ISO根据收到的所述报价信息和购电投标信息,生成供给曲线和需求曲线,并调用出清算法,确定市场出清信息,并发布给各发电商Agent和零售商Agent,所述市场出清信息包括市场出清价格、各发电商Agent和零售商Agent所得电量;
步骤4、各发电商Agent获知所述市场出清信息,计算各自的发电成本和收益,并根据Q学习算法完善决策,准备下一次竞价;
步骤5、各零售商Agent获知所述市场出清信息,计算购电成本,并确定零售电价;
步骤6、用户Agent向零售商Agent购电,并根据自己的实际情况和价格信号,进行响应并调整用电计划;
步骤7、零售商Agent计算其收益,并根据Q学习算法完善决策,准备下一次竞价。
进一步地,所述步骤2中所述购电投标价格根据导数跟踪法确定。
进一步地,所述步骤4中所述根据Q学习算法完善决策具体包括以下步骤:
步骤4.1、将市场总负荷和出清价格关联,构建成环境空间S;
步骤4.2、将可能的偏离发电成本的报价集合构建成可行域空间A;
步骤4.3、采用改进的Boltzmannε-greedy探索策略选择报价策略;
步骤4.4、选取市场出清后发电商获得的卖电收益作为即时回报,用于更新每个策略的Q值。
进一步地,所述步骤4.1具体包括:
将市场总负荷L∈[Lmin,Lmax]N等分,将出清电价ρ∈[0,ρmax]M等分,其中Lmin和Lmax分别为系统最小和最大负荷,ρmax为电力市场出清价格上限,将市场总负荷和出清价格关联,构建N*M环境空间S。
进一步地,所述步骤4.2中,所述可行域空间A为:
式中,Amin和Amax分别为策略系数的最小和最大限制,a为可选策略的数量;
所述发电成本用分段递增的阶梯形曲线表示为:
C={(c1,q1),(c2,q2),...,(cb,qb)}
式中,b为阶梯段数,c为价格,q为发电机组出力;
所述报价Bi(qi)对于某一个确定的Ai用分段递增的阶梯形曲线表示为:
{(Ai·c1,q1),(Ai·c2,q2),...,(Ai·cb,qb)}。
进一步地,所述步骤4.3具体包括:
式中,Qt(s,a)为第t轮竞价时各策略的Q值;st和at为第t轮竞价时所处状态和所选策略;p(ai|s)为s状态下选择策略ai的概率;T为退火系数,采用等比降温策略进行更新。
进一步地,所述步骤4.4中更新每个策略的Q具体为:
其中,r是即时回报;α是学习率;γ是未来收益的折扣系数。
进一步地,所述步骤7中所述根据Q学习算法完善决策具体包括以下步骤:
步骤7.1、将市场总负荷和购电价格关联,构建成环境空间S;
步骤7.2、将售电价格构建成可行域空间A;
步骤7.3、采用改进的Boltzmannε-greedy探索策略选择报价策略;
步骤7.4、选取市场出清后零售商获得的售电收益作为即时回报,用于更新每个策略的Q值。
进一步地,所述步骤6还包括用户Agent将用户满意度反馈至零售商Agent,若所述用户满意度小于满意度阈值,零售商Agent根据所述用户满意度降低零售电价水平。
进一步地,所述用户满意度为用电方式满意度和电费支出满意度的加权和。
本发明的有益效果:
1)本发明考虑了用户可变的负荷对电力市场价格带来的影响,更加符合电力市场实际情况,可以真实反映市场价格的出清。
2)改进Q学习(Q-learning)算法的Agent决策模型,比常规基于Q-Learning的决策模型更能有效反映用户的决策行为,且能更快的达到收敛。
3)本发明在用户可变负荷基础上,考虑用户对分时电价的响应行为,可以量化用户的需求响应量和行为对市场价格的影响。
附图说明
图1是本发明的一个较佳实施例的多代理的决策优化系统原理框图;
图2是本发明的一个较佳实施例的供给曲线和需求曲线的均衡;
图3是本发明的一个较佳实施例的电力市场决策优化的流程图;
图4是本发明的一个较佳实施例的发电商Agent决策优化的流程图;
图5是本发明的一个较佳实施例的用户用电响应特性曲线。
具体实施方式
以下参考说明书附图介绍本发明的优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
本申请的一个实施例提供了一种基于多代理的决策优化方法,对双边电力市场机制下的出清价格及各方收益进行了研究,并考虑了用户的分时电价响应行为对市场的影响。其给出了日前双边市场的交易、出清机制和决策优化流程;对发电商Agent(GA)、零售商Agent(RA)的决策行为进行了建模,包括以Q学习(Q-learning)算法和改进的Boltzmannε-greedy探索策略描述发电商Agent的报价行为,以导数跟踪法描述零售商Agent的售电行为。还考虑分时电价响应特性和用户满意度,对用户Agent(CA)的决策行为进行了建模。
本实施例构建的多代理的决策优化系统如图1所示。
一、对称电力市场交易机制
日前市场采用电力库的形式,并采用分时竞价机制。在双边市场中,参与交易的Agent类型除了发电商、ISO之外,还应包括零售商和用户。负荷预测工作不再由ISO统一进行,而是由各区域零售商自行负责,负荷预测的精度直接影响其投标和收益。
在日前电力市场中,市场运营商ISO规定一个报价截止时刻,发电商提前一天在该时刻之前递交报价,投标中需标明供电量与对应价格。发电报价按照从低到高的顺序排列,可以得到表示价格和累计数量关系的函数曲线,即市场的供给曲线。同样的,要求零售商也提交包含量价信息的投标,并按照从高到低的顺序进行排列,即为市场的需求曲线。其中零售商一般是以负荷聚集商或者虚拟电厂的形式进行投标。
供给曲线与需求曲线的交点即为市场的均衡点(如图2所示),所有价格低于或等于均衡点价格(即市场出清价)的报价都会被接受。如果所有的成交电量都以市场出清价结算,称为“统一价格支付”;若按照发电商各自递交的报价结算,称为“按报价支付”。在双边机制下,出清价格由发电侧和零售侧共同决定,发电侧报价过高或零售侧报价过低都会导致其盈利减少或用电需求得不到满足,因此能够有效的抑制电价的不正常抬升。
二、价格出清
实际的电力市场在确定出清价格时,需要考虑系统安全运行约束,如线路最大潮流约束、机组最小启停时间约束等。目前常见的电力市场出清方法有排队法、动态规划法、线性规划法等。本实施例采用多时段竞价的线性规划法进行求解。
在仅开放发电市场的条件下,价格出清的目标函数是购电费用最低,如式(1);而在发、输、配电市场全面开放的条件下,目标函数是社会效益最高,取供求曲线的交点作为统一出清价格,如图2所示。
式中,H为一天的总时段数,Ng为发电商数量,PG(i,h)为发电商i竞价所得发电量,ρ(h)为出清电价。
价格出清时需要考虑的约束条件包括负荷平衡约束、机组最大最小出力约束、机组最小启停时间约束、机组爬坡率约束和系统网架约束等。
三、决策优化流程
电力市场决策优化的流程图如3所示,具体如下:
1)参与报价的发电商Agent结合自身机组的参数和所知的市场信息,通过一定算法确定报价策略,并按照规定的格式递交分段报价。
2)具有购电需求的零售商Agent结合其供电区域内用户的用电特性,进行负荷预测,按照规定格式递交自己的购电投标,包括电量和价格。
3)ISO根据收到的报价信息,生成供求曲线,并调用出清算法,确定市场出清价格、各参与者所得电量等,并发布给市场参与者。
4)各发电商Agent获知市场出清信息,计算各自的发电成本和收益,并根据Q学习算法完善自己的决策,准备下一次竞价。
5)各零售商Agent获知市场出清信息,计算购电成本,并确定电力零售价。
6)用户Agent向零售商Agent购电,并根据自己的实际情况和价格信号,进行响应并调整用电计划。
7)零售商Agent计算其收益,并根据Q学习算法完善决策,准备下一次竞价。
四、发电商Agent模型
发电商Agent采用基于边际成本的竞价策略,其模型主要包括发电成本计算,报价策略的选择以及学习算法。电力拍卖市场是典型的重复博弈,适合采用随机选择报价的方法。本实施例应用Q学习(Q-learning)算法来模拟发电商Agent的学习能力,并采用改进的Boltzmannε-greedy探索策略进行决策。具体如下:
应用Q-learning算法首先要构建环境-可行域(S-A)空间。本实施例将市场总负荷L∈[Lmin,Lmax]N等分,将出清电价ρ∈[0,ρmax]M等分,其中Lmin和Lmax分别为系统最小和最大负荷(保留一定裕度),ρmax为市场价格帽子。将2个变量关联考虑,则环境空间S共包含N*M种状态。
设发电机的发电成本函数可以用分段递增的阶梯形曲线表示。设成本曲线的段数为b,c为价格,q为发电机出力,则分段发电成本可以表示为:
C={(c1,q1),(c2,q2),...,(cb,qb)} (2)
机组采用基于成本的方法进行报价,其可行域空间A即为可能的偏离成本的报价集合,设可选策略的数量为a,则第i个策略可表示为:
其中,Amin和Amax分别为策略系数的最小和最大限制;若Amin=0,表示按成本报价。
发电商i的报价函数Bi(qi)也是阶梯段数为b的分段曲线,对于某一个确定的Ai,可以表示为
{(Ai·c1,q1),(Ai·c2,q2),...,(Ai·cb,qb)} (4)
采用改进的Boltzmannε-greedy探索策略选择报价策略。首先按照Boltzmann策略和greedy策略各选择一个策略ar和ap,分别如式(5)、(6)。随后生成一个随机数ε,若ε满足式(7)则选取策略ap,反之选取策略ar。
其中,Qt(s,a)为第t轮竞价时各策略的Q值;st和at为第t轮竞价时所处状态和所选策略;p(ai|s)为s状态下选择策略ai的概率;T为退火系数,采用等比降温策略进行更新。
选取市场出清后该发电商获得的卖电收益(即)作为即时回报r,用于更新每个策略的Qt(s,a),如式(8)。
其中,α是学习率;γ是未来收益的折扣系数。
随着仿真博弈的不断进行和Q值的不断更新,Qt(s,a)将以概率1收敛于最优策略,即达到一个均衡策略。完整的发电商Agent决策过程如图4所示。
五、零售商Agent模型
在对称电力市场中,零售商可以看成多个用户的聚合体,它负责一定区域内用户电能的供应,这种聚合的方式更有利于实现用户利益的最大化。
零售商本身一般不具备大型投资成本,因此其准入门槛较低,数量也最多。数量众多的零售商能够增加市场的竞争度,一般来说任何一个零售商都不可能占有绝对大部分市场,也就不可能操纵市场价格形成垄断,市场运行的效率得以提高。
零售商的总购电成本Cpur包括发电侧成本和输配电成本,如式(9)。
Cpur=Cgen+Ctran+Ccong (9)
其中,Cgen为发电侧购电成本;Ctran为购买电能的输配电损耗成本,与所购电量和系统潮流有关;Ccong为配电网发生时产生的阻塞成本。
零售商Agent的决策目标是使其盈利最大。零售商Agent与发电商Agent模型的不同之处在于,其不仅需要向ISO递交购电投标,还需要确定电能的零售价格,因此其决策环节包括两部分,确定购电价格和售电价格。本实施例采用导数跟踪法确定零售商Agent购电价格;仍采用随机重复报价法和Q-learning算法确定售电价格。
零售商承担着用户的供电工作,如果无法购得用户所需电量会使用户满意度降低,进而选择其他零售商,因此零售商Agent的首要目标是满足用户的用电需求,并在此基础上赚取差价。
导数跟踪法的大致思想为:每一回合,零售商将会对其报价做出一个微小的上下调整;如果零售商当前的报价不能使其购买到用户所需的电量,则零售商会在下一回合投标时增加自己的报价,以求购得所需电量,反之则会尝试逐步降低自己愿意支付的价格;在满足购电量的基础上,如果上一回合的价格调整使零售商的收益增加,那么本回合的价格将按照上一回合调整的方向进行调整,反之则向相反的方向调整。
假设本回合零售商投标的购电价格为ρt,价格调整为Δt,则下一回合的投标为
ρt+1=ρt+Δt+1 (10)
0≤qpur≤qexp (12)
其中qpur为购得电量,qexp为用户所需电量,α、β是相关系数,与Δt的变化速率有关。Δt不是固定值,而是与已购电量和所需电量的差值有关,每一回合都不相同。
零售商购得所需电量之后,计算Cpur,并在其基础上加收一定的费用,将电能卖给用户。其零售价格为:
psell=Cpur+pser (13)
0≤pser≤pmax-Cpur (14)
其中,pmax为零售电价的最大值;pser由零售商通过随机重复报价和Q-Learning算法确定。考虑到通过导数跟踪法确定的购电价格是变化量,而对于不同的购电价格,零售商Agent制定的售电价格可能是不同的,因此将市场总负荷L和购电价格Cpur作为Q-Learning算法的状态空间S。将市场总负荷L∈[Lmin,Lmax]N等分,将购电电价Cpur∈[0,ρmax]M等分,其中Lmin和Lmax分别为系统最小和最大负荷(保留一定裕度),ρmax为市场价格帽子。将2个变量关联考虑,则环境空间S共包含N*M种状态。
将售电价格pser作为策略空间A,即
Pser={pser,0,pser,1,pser,2,...,pser,m} (15)
m为可选策略数量;Pser,0=0,pser,m=pmax-Cpur。
采用改进的Boltzmannε-greedy探索策略选择定价策略。首先按照Boltzmann策略和greedy策略各选择一个策略ar和ap,分别如前述式(5)、(6)。随后生成一个随机数ε,若ε满足式(7)则选取策略ap,反之选取策略ar。
选取市场出清后该零售商获得的售电收益(即)作为即时回报r,用于更新每个策略的Qt(s,a),如前述式(8)。
六、考虑分时电价响应的用户Agent模型
用户在电力市场中扮演着终端消费者的角色。以往用户只能被动的接受市场电价;然而随着售电侧市场的放开,电力的零售价格变得更加灵活,用户可以通过对价格信号(如分时电价、尖峰电价)的响应,改变自己的用电计划,或者削减某些时刻负荷量,以最小化自身的用电支出,同时也能在一定程度上影响市场价格。电力系统的管理者也可以通过制定需求响应项目,与用户签订合同,对需求侧资源进行调度,以保障电力系统的稳定高效运行。
用户Agent的决策目标是在保证用电需求的基础上使支出最少。本实施例利用消费者心理学理论对分时电价机制下用户Agent的响应特性进行建模与分析。
电力用户的电能需求量受价格变化的影响大致可以抽象为如图5所示的曲线。价格的刺激有一个阈值,对应图中A点,用户对低于该阈值的价格变化量基本上无响应或响应非常小,该段称为响应死区;当价格变化超过阈值后,用户将开始根据电价的变化改变自己的负荷计划,大致可以近似为线性关系,该段称为正常响应区;当价格变化量大于一定值时,用户的响应能力达到极限,该段称为饱和区,反映了电力一定程度上的刚性需求。由此,用户响应特性曲线主要由死区阈值(A)、线性区斜率(K)和饱和区阈值(B)决定。用户可以分为商业用户、工业用户和家庭用户三类。对于不同类型的用户Agent,上述三个参数也有所不同,反映出不同个体间的差异。
分时电价实施后,负荷从高电价时段向低电价时段转移的负荷量与高电价时段负荷量的比值,称为负荷转移率。以峰谷时段的负荷转移为例,用户的负荷转移率可以表示为如下的函数关系:
同理,峰平时段转移率μpf,平谷时段转移率μfv可以用相同的函数关系来表示。
假设从某时段转移出的电量和转移到某时段的电量按时间平均分配,则经过转移后的用户峰谷时段负荷可用式(17)表示。
Tp、Tf、Tv分别表示峰时段、平时段、谷时段,h为其中的任一时段;L0(h)、Ltou(h)分别为分时电价(TOU)实施前和实施后h时段的负荷量;分别为未实施TOU时,峰、平时段总负荷在对应时段内的平均值。
用户接受分时电价并调整自身的用电计划,其用电满意度也会产生变化。用户满意度是零售商在制定零售价时需要重点考虑的因素,满意度过低会导致客户流失。本文分别从用电方式满意度和电费支出满意度两个方面来衡量用户总体满意度,并对零售商形成反馈。
用电方式满意度用于表征用户的用电习惯与原来相比改变的程度,如式(18)。
电费支出满意度用于表征用户由于响应分时电价而造成的成本降低的程度,如式(19)。
用户总体满意度θ为两者的加权和,如式(20);若满意度小于一定值θ′,表示用户满意度较差,则零售商Agent将会根据反馈降低零售电价水平。
θ=λ1θ1+λ2θ2,λ1+λ2=1 (20)
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (10)
1.一种考虑需求响应基于多代理的双边电力市场优化决策方法,其特征在于,所述方法包括以下步骤:
步骤1、参与报价的发电商Agent结合自身机组的参数和所知的市场信息,确定报价策略,并按照规定的格式递交分段报价信息,所述报价信息包括供电电量和供电价格;
步骤2、具有购电需求的零售商Agent结合其供电区域内用户的用电特性,进行负荷预测,按照规定格式递交自己的购电投标信息,所述购电投标信息包括购电投标电量和购电投标价格;
步骤3、ISO根据收到的所述报价信息和购电投标信息,生成供给曲线和需求曲线,并调用出清算法,确定市场出清信息,并发布给各发电商Agent和零售商Agent,所述市场出清信息包括市场出清价格、各发电商Agent和零售商Agent所得电量;
步骤4、各发电商Agent获知所述市场出清信息,计算各自的发电成本和收益,并根据Q学习算法完善决策,准备下一次竞价;
步骤5、各零售商Agent获知所述市场出清信息,计算购电成本,并确定零售电价;
步骤6、用户Agent向零售商Agent购电,并根据自己的实际情况和价格信号,进行响应并调整用电计划;
步骤7、零售商Agent计算其收益,并根据Q学习算法完善决策,准备下一次竞价。
2.如权利要求1所述的考虑需求响应基于多代理的双边电力市场优化决策方法,其特征在于,所述步骤2中所述购电投标价格根据导数跟踪法确定。
3.如权利要求1所述的考虑需求响应基于多代理的双边电力市场优化决策方法,其特征在于,所述步骤4中所述根据Q学习算法完善决策具体包括以下步骤:
步骤4.1、将市场总负荷和出清价格关联,构建成环境空间S;
步骤4.2、将可能的偏离发电成本的报价集合构建成可行域空间A;
步骤4.3、采用改进的Boltzmannε-greedy探索策略选择报价策略;
步骤4.4、选取市场出清后发电商获得的卖电收益作为即时回报,用于更新每个策略的Q值。
4.如权利要求3所述的考虑需求响应基于多代理的双边电力市场优化决策方法,其特征在于,所述步骤4.1具体包括:
将市场总负荷L∈[Lmin,Lmax]N等分,将出清电价ρ∈[0,ρmax]M等分,其中Lmin和Lmax分别为系统最小和最大负荷,ρmax为电力市场出清价格上限,将市场总负荷和出清价格关联,构建N*M环境空间S。
8.如权利要求1所述的考虑需求响应基于多代理的双边电力市场优化决策方法,其特征在于,所述步骤7中所述根据Q学习算法完善决策具体包括以下步骤:
步骤7.1、将市场总负荷和购电价格关联,构建成环境空间S;
步骤7.2、将售电价格构建成可行域空间A;
步骤7.3、采用改进的Boltzmannε-greedy探索策略选择报价策略;
步骤7.4、选取市场出清后零售商获得的售电收益作为即时回报,用于更新每个策略的Q值。
9.如权利要求1所述的考虑需求响应基于多代理的双边电力市场优化决策方法,其特征在于,所述步骤6还包括用户Agent将用户满意度反馈至零售商Agent,若所述用户满意度小于满意度阈值,零售商Agent根据所述用户满意度降低零售电价水平。
10.如权利要求9所述的考虑需求响应基于多代理的双边电力市场优化决策方法,其特征在于,所述用户满意度为用电方式满意度和电费支出满意度的加权和。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011233077.5A CN112465303A (zh) | 2020-11-06 | 2020-11-06 | 考虑需求响应基于多代理的双边电力市场优化决策方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011233077.5A CN112465303A (zh) | 2020-11-06 | 2020-11-06 | 考虑需求响应基于多代理的双边电力市场优化决策方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112465303A true CN112465303A (zh) | 2021-03-09 |
Family
ID=74825186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011233077.5A Pending CN112465303A (zh) | 2020-11-06 | 2020-11-06 | 考虑需求响应基于多代理的双边电力市场优化决策方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112465303A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112906975A (zh) * | 2021-03-17 | 2021-06-04 | 广东电网有限责任公司电力调度控制中心 | 一种双层优化方法及其装置 |
CN113379512A (zh) * | 2021-07-02 | 2021-09-10 | 广东电力信息科技有限公司 | 一种电力现货市场交易出清方法及系统 |
CN113469734A (zh) * | 2021-06-15 | 2021-10-01 | 广东电力交易中心有限责任公司 | 一种电力零售用户的交易信息管理方法及装置 |
CN113888348A (zh) * | 2021-09-16 | 2022-01-04 | 国网湖北省电力有限公司电力科学研究院 | 一种以多边利益平衡为目标的源荷智能匹配方法 |
CN114390486A (zh) * | 2021-12-07 | 2022-04-22 | 国网浙江省电力有限公司营销服务中心 | 一种面向需求侧管理的d2d通信系统通信资源分配方法 |
CN114897552A (zh) * | 2022-03-18 | 2022-08-12 | 南京工程学院 | 一种基于强化学习的现货市场售电商报价方法 |
TWI779732B (zh) * | 2021-07-21 | 2022-10-01 | 國立清華大學 | 使用多智能體遷移式強化學習的再生能源競價方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105976079A (zh) * | 2016-03-22 | 2016-09-28 | 国网河南省电力公司 | 一种考虑需求响应资源的电力零售商日前能量获取的确定方法 |
CN107644370A (zh) * | 2017-09-29 | 2018-01-30 | 中国电力科学研究院 | 一种自增强学习的撮合竞价方法及系统 |
CN108537363A (zh) * | 2018-03-09 | 2018-09-14 | 天津大学 | 一种配售分开环境下售电公司购电量控制方法 |
CN110009526A (zh) * | 2019-04-04 | 2019-07-12 | 国网福建省电力有限公司 | 基于三维市场状态的售电商智能代理投标行为优化方法 |
CN110648191A (zh) * | 2019-08-16 | 2020-01-03 | 国家电网有限公司 | 一种发电商电能及备用市场联合报价方法及系统 |
CN110689399A (zh) * | 2019-08-29 | 2020-01-14 | 国家电网有限公司 | 在统一市场出清价格机制下基于博弈论的购电商竞价方法 |
CN110852519A (zh) * | 2019-11-18 | 2020-02-28 | 贵州电网有限责任公司 | 一种考虑多类型负荷的售电公司最优盈利方法 |
CN111612552A (zh) * | 2020-06-09 | 2020-09-01 | 东北电力大学 | 一种计及三主体竞价的综合能源系统日前迭代出清方法 |
-
2020
- 2020-11-06 CN CN202011233077.5A patent/CN112465303A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105976079A (zh) * | 2016-03-22 | 2016-09-28 | 国网河南省电力公司 | 一种考虑需求响应资源的电力零售商日前能量获取的确定方法 |
CN107644370A (zh) * | 2017-09-29 | 2018-01-30 | 中国电力科学研究院 | 一种自增强学习的撮合竞价方法及系统 |
CN108537363A (zh) * | 2018-03-09 | 2018-09-14 | 天津大学 | 一种配售分开环境下售电公司购电量控制方法 |
CN110009526A (zh) * | 2019-04-04 | 2019-07-12 | 国网福建省电力有限公司 | 基于三维市场状态的售电商智能代理投标行为优化方法 |
CN110648191A (zh) * | 2019-08-16 | 2020-01-03 | 国家电网有限公司 | 一种发电商电能及备用市场联合报价方法及系统 |
CN110689399A (zh) * | 2019-08-29 | 2020-01-14 | 国家电网有限公司 | 在统一市场出清价格机制下基于博弈论的购电商竞价方法 |
CN110852519A (zh) * | 2019-11-18 | 2020-02-28 | 贵州电网有限责任公司 | 一种考虑多类型负荷的售电公司最优盈利方法 |
CN111612552A (zh) * | 2020-06-09 | 2020-09-01 | 东北电力大学 | 一种计及三主体竞价的综合能源系统日前迭代出清方法 |
Non-Patent Citations (1)
Title |
---|
谢畅: ""基于供给函数模型的电力主能量及辅助服务市场竞价均衡分析"", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》, 15 May 2019 (2019-05-15) * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112906975A (zh) * | 2021-03-17 | 2021-06-04 | 广东电网有限责任公司电力调度控制中心 | 一种双层优化方法及其装置 |
CN113469734A (zh) * | 2021-06-15 | 2021-10-01 | 广东电力交易中心有限责任公司 | 一种电力零售用户的交易信息管理方法及装置 |
CN113469734B (zh) * | 2021-06-15 | 2024-01-02 | 广东电力交易中心有限责任公司 | 一种电力零售用户的交易信息管理方法及装置 |
CN113379512A (zh) * | 2021-07-02 | 2021-09-10 | 广东电力信息科技有限公司 | 一种电力现货市场交易出清方法及系统 |
CN113379512B (zh) * | 2021-07-02 | 2023-12-12 | 广东电力信息科技有限公司 | 一种电力现货市场交易出清方法及系统 |
TWI779732B (zh) * | 2021-07-21 | 2022-10-01 | 國立清華大學 | 使用多智能體遷移式強化學習的再生能源競價方法 |
CN113888348A (zh) * | 2021-09-16 | 2022-01-04 | 国网湖北省电力有限公司电力科学研究院 | 一种以多边利益平衡为目标的源荷智能匹配方法 |
CN113888348B (zh) * | 2021-09-16 | 2024-05-28 | 国网湖北省电力有限公司电力科学研究院 | 一种以多边利益平衡为目标的源荷智能匹配方法 |
CN114390486A (zh) * | 2021-12-07 | 2022-04-22 | 国网浙江省电力有限公司营销服务中心 | 一种面向需求侧管理的d2d通信系统通信资源分配方法 |
CN114897552A (zh) * | 2022-03-18 | 2022-08-12 | 南京工程学院 | 一种基于强化学习的现货市场售电商报价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112465303A (zh) | 考虑需求响应基于多代理的双边电力市场优化决策方法 | |
Chen et al. | Indirect customer-to-customer energy trading with reinforcement learning | |
Abapour et al. | A Bayesian game theoretic based bidding strategy for demand response aggregators in electricity markets | |
Dong et al. | Decentralized peer-to-peer energy trading strategy in energy blockchain environment: A game-theoretic approach | |
Herranz et al. | Optimal demand-side bidding strategies in electricity spot markets | |
Ghazvini et al. | Incentive-based demand response programs designed by asset-light retail electricity providers for the day-ahead market | |
Motalleb et al. | A real-time demand response market through a repeated incomplete-information game | |
CN112651770B (zh) | 电力现货市场售电商负荷申报优化方法及系统 | |
CN109389327B (zh) | 基于风光不确定性的多虚拟电厂时前合作方法 | |
CN108182507A (zh) | 一种计及不确定性的售电商最优电价决策方法 | |
CN110276671A (zh) | 一种基于区块链技术的电力交易方法 | |
Elyas et al. | A novel method for maintenance scheduling of generating units considering the demand side | |
CN110659772A (zh) | 售电公司在分段线性偏差电量考核机制下的最优经营策略确定方法 | |
CN105321103A (zh) | 一种基于主从博弈的直购电双边交易的合同电价制定方法 | |
CN111695943A (zh) | 一种计及浮动高峰电价的优化管理方法 | |
Okwuibe et al. | Intelligent bidding strategies in local electricity markets: A simulation-based analysis | |
Sueyoshi et al. | A wholesale power trading simulator with learning capabilities | |
Khajeh et al. | Blockchain-based demand response using prosumer scheduling | |
Soleymani et al. | Strategic bidding of generating units in competitive electricity market with considering their reliability | |
CN115186926A (zh) | 一种基于电-碳共享的园区能量优化方法及系统 | |
Hortacsu et al. | Testing strategic models of firm behavior in restructured electricity markets: a case study of ERCOT | |
Naseri et al. | Dynamic retail market tariff design for an electricity aggregator using reinforcement learning | |
Sheybani et al. | Put option pricing and its effects on day-ahead electricity markets | |
Xu et al. | Perception and decision-making for demand response based on dynamic classification of consumers | |
Khodabakhsh et al. | Designing a bi-level flexibility market for transmission system congestion management considering distribution system performance improvement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210309 |
|
RJ01 | Rejection of invention patent application after publication |