CN107644370A - 一种自增强学习的撮合竞价方法及系统 - Google Patents
一种自增强学习的撮合竞价方法及系统 Download PDFInfo
- Publication number
- CN107644370A CN107644370A CN201710914516.0A CN201710914516A CN107644370A CN 107644370 A CN107644370 A CN 107644370A CN 201710914516 A CN201710914516 A CN 201710914516A CN 107644370 A CN107644370 A CN 107644370A
- Authority
- CN
- China
- Prior art keywords
- sale
- electricity
- quotation
- bidding
- study
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000005611 electricity Effects 0.000 claims abstract description 157
- 238000004422 calculation algorithm Methods 0.000 claims description 30
- 238000004088 simulation Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000002860 competitive effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000010248 power generation Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 208000001613 Gambling Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000009937 brining Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种自增强学习的撮合竞价方法,所述方法包括:采集所有售电商的报价,设定待测售电商报价为初始竞价,其他售电商报价设定为初始售电商报价;基于预先设定的步长调整售电商报价和竞价报价;基于所述初始售电商报价、初始竞价、竞价报价和售电商报价得到收益;基于预先设定的步长重新调整电商报价和竞价报价继续计算收益,直到达到预先设定的学习报价轮数阈值;基于所有的售电商报价、竞价报价和收益确定最终竞价报价。所述系统包括:采集模块、调整模块、生成模块、计算模块和确定模块。本发明采用撮合出清的方法,售电商通过代理进行报价学习,建立其他售电商竞价对策模型产生大量学习样本继续进行推演自学习,以达到最优竞价的目的。
Description
技术领域
本发明涉及电力市场运行与竞价领域,具体涉及一种自增强学习的撮合竞价方法及系统。
背景技术
由于电源与需求呈逆向分布,发电区域电能过剩,用电区域则电力不足,这种不均衡的能源结构决定了必须通过开展大规模跨区域电力交易,对能源资源进行有效配置,充分发挥发电、输电设施的能力,保障电力供应。
在跨区域集中交易制度逐步完善的过程中,跨区域发电侧市场的竞争压力逐步增大,发电企业为了在市场中生存与发展,其必须与其他发电商竞争上网,以实现利润最大化为目标。
为了避免发电厂商们之间的恶性竞争和发电集团公司可能要面临的价格剧烈波动的巨大风险,广大学者和研究人员往往采用多代理系统(Multi-agent System,简称为MAS)技术和演化博弈理论为参与市场竞争的发电商们构建更加灵活的发电竞价策略,并在利润最大化的实践中不断完善,同时对寡头垄断竞争的发电侧电力市场竞价规则和竞价行为进行评估。
在人工智能领域,将由多个Agent所构成的相互作用、相互关联的系统称为多代理系统(Multi-Agent System)。多代理系统中,每一个Agent都是一个独立的具有学习能力的实体,通过与环境之间的信息交互进行演化,从而推动整个系统的演化。开展多Agent建模能够更有效地表征涉及人类智能活动的经济系统的特性。电力市场参与者的行为具有高度的智能性和复杂性,利用常规方法很难进行有效分析,因此采用多Agent系统建模与仿真方法,实现对电力市场运营的有效模拟。
然而,Agent机器学习需要大量的训练样本,而目前数据样本仍不够完善。而解决这个问题,需要构建电力市场仿真模型,产生大量的智慧机器样本,对算法进行训练。
电力市场仿真可以研究市场环境中各个参与者的行为,为电力市场改革提供决策支持。经典博弈论被广泛应用于电力市场竞价策略研究,但其基本假设是每个市场参与者都是“完全理性”的,而且要求参与者具有“理性的共同认识”,即相信对手在追求自身利益最大化目标时不会犯任何错误,因此存在较大局限性。
发明内容
为了解决现有技术中所存在的上述不足,本发明提供一种自增强学习的撮合竞价方法。
本发明提供的技术方案是:一种自增强学习的撮合竞价方法,所述竞价方法包括:
采集所有售电商的报价,其中设定待测售电商报价为初始竞价,剩余其他售电商报价设定为初始售电商报价;
基于预先设定的步长调整售电商报价和竞价报价;
基于所述初始售电商报价、初始竞价、竞价报价和售电商报价得到收益;
基于预先设定的步长重新调整电商报价和竞价报价继续计算收益,直到达到预先设定的学习报价轮数阈值;
基于所有的售电商报价、竞价报价和收益确定最终竞价报价。
优选的,所述采集所有售电商的报价,其中待测售电商报价为初始竞价,剩余其他售电商报价作为初始售电商报价包括:
采集所有售电商的报价构建集合S,S={s1,s2,…,sn},其中s1,s2,…,sn为所有售电商报价;
设定待测售电商报价at;at∈S;
设定初始售电商报价为st,st∈S-at。
优选的,所述基于预先设定的步长调整所述竞价报价包括:
以小概率的ε‐greedy算法随机选择报价;
所述ε-greedy算法按下式计算:
ε=tempt
式中:temp:小于1的衰减系数;t:当前学习报价轮数。
优选的,所述基于预先设定的步长调整所述售电商报价如下式:
式中:pi,t:售电商i在t轮学习中的模拟报价;stepi:售电商i的竞价风险调整步长;Gaini:报价的函数,表征售电商i参与匹配的收益;其他:不满足调价条件的情况;t:当前学习报价轮数。
优选的,所述售电商i的竞价风险调整步长stepi基于概率θt计算;
以概率θt选择所述步长stepi,以概率1‐θt选择原步长stepi;
所述概率θt的计算式如下:
θt=θ0 t
式中:θ0:报价调整概率且0<θ0<1。
优选的,所述基于初始售电商报价、初始竞价报价、新的竞价报价和新的售电商报价采用Q‐learning算法得到收益由下式计算:
Q'(at,st)=(1-α)Q(at,st)+αγmaxQ(a't+1,s't+1)
式中:α:学习率且0<α<1;γ:时间贴现率且0<γ<1;maxQ(a't+1,s't+1):新状态下的最大收益值;a't+1:新状态下的最优策略;Q(at,st):收益;Q'(at,st):新状态的收益。
优选的,所述学习报价轮数阈值设定为1000。
基于本发明另一发明目的,本技术方案还提供一种自增强学习的撮合竞价系统,
所述系统包括:
采集模块:用于采集所有售电商的报价,其中设定待测售电商报价为初始竞价,剩余其他售电商报价设定为初始售电商报价;
调整模块:用于基于预先设定的步长调整售电商报价和竞价报价;
生成模块:用于基于所述初始售电商报价、初始竞价、竞价报价和售电商报价得到收益;
计算模块:基于预先设定的步长重新调整电商报价和竞价报价继续计算收益,直到达到预先设定的学习报价轮数阈值;
确定模块:用于基于所有的售电商报价、竞价报价和收益确定最终竞价报价。
优选的,所述采集模块包括:
采集子模块:采集所有售电商的报价构建集合S,S={s1,s2,…,sn},其中s1,s2,…,sn为所有售电商报价;
设定子模块:用于设定待测售电商报价at;at∈S并且设定初始售电商报价为st,st∈S-at。
优选的,所述调整模块包括:
选择子模块:用于以小概率的ε‐greedy算法随机选择报价和以大概率的ε‐greedy算法选择最大收益所对应的报价;
计算子模块:用于计算概率ε-greedy和售电商报价。
与最接近的现有技术相比,本发明提供的技术方案具有以下有益效果:
(1)本发明提供的技术方案,采用自增强学习的竞价方法,在现有的Q-Learning增强学习的算法基础上,增加风险调价步长动态报价模型产生动态样本对智能代理进行演化训练,本模型可以解决实际数据样本不足的情况下进行竞价学习;
(2)本发明提供的技术方案,在实际在训练过程中,引入随机性,防止竞价学习陷入局部最优。同时动态样本模型考虑了时间贴现成本和随机选择概率,更加符合实际;
(3)本发明提供的技术方案,首次将基于多售电商的竞价模型应用于跨区域交易中,且具有良好的效果。
附图说明
图1为本发明的电力市场多售电商体系结构示意图;
图2为本发明的智能代理竞价模型示意图;
图3为本发明的智能代理竞价算法流程示意图;
图4为本发明实施例中的23节点网络实例示意图;
图5为本发明实施例中的售电商自学习模拟报价示意图;
图6为本发明实施例中的电力均衡情况下市场统一出清价学习示意图;
图7为本发明实施例中的电力短缺情况下市场统一出清价学习示意图;
图8为本发明实施例中的电力富余情况下市场统一出清价学习示意图。
具体实施方式
为了更好地理解本发明,下面结合说明书附图和实例对本发明的内容做进一步的说明。
1、如图1所示,电力市场交易的参与者可以简单的分为售电侧和购电侧,售电测即为发电测,这种交易以电网为物理基础,在调度中心的监控下实现供需平衡。各个组成部分都是服从整体自治的个体,因此适用于多代理系统进行问题求解。
2、基于现有的多售电商的Q-learning算法存在的局部最优和学习效果难以保证,对Q-learning算法进行改进;
基于多售电商的Q-learning算法介绍
采用增强学习算法的智能代理和环境的交互模型如图2所示,在一个序列的离散时间段t内交互,S={s1,s2,…,sn}是环境状态的有限集合,A={a1,a2,…,am}是代理可能采取的所有策略的有限集合,在每个时间段t,智能代理得到当前的系统状态st=s∈S,根据st选择一个策略at=a∈A,之后智能代理得到一个立即收益rt,同时环境变化到一个新状态st+1=s'∈S,转移的概率为p(s,s',a)。
智能代理的任务是找到一个最优策略使长期的收益最大。Q-Learning的任务是在初始条件未知的情况下决定π。如果环境模型(即状态转移概率及评价模型)已知,则上述问题可用动态规划(DP)解决。Q-Learning算法的思想是不去顾及环境模型,而是直接优化可迭代计算的Q函数。Watkins定义此Q函数为在状态st时执行动作at,且此后按最优动作序列执行时折扣累计强化值,即
Q(at,st)=rt+γmaxQ(a't+1,st+1) (1)
式中,rt是策略变化后竞价方的立即收益,一般取0;γ(0<γ<1)是未来收益的贴现率;maxQ(a't+1,st+1)为新状态下的最大Q值,即竞价方获取的最大收益;a't+1为新状态下的最优报价策略。
代理通过评价“状态-行为”对Q(s,a)来优化策略,其学习步骤如下:
(1)观察现在的状态st;
(2)选择并且执行一个动作at;
(3)观察下一个状态st+1;
(4)收到一个立即收益rt;
(5)更新Q值。
Q'(at,st)=(1-α)Q(at,st)+αγmaxQ(a't+1,s't+1) (2)
其中:α:学习率且0<α<1;γ:时间贴现率且0<γ<1;maxQ(a't+1,s't+1):新状态下的最大Q值;a't+1:新状态下的最优策略;Q(at,st):收益;Q'(at,st):新状态的收益;t:0<t≤1000且t为正整数。理论上已经证明,满足适当条件时,当t趋近于无穷大时,Qt(s,a)以概率1收敛于最优点。
已有的Q-learning算法还存在以下问题:
(1)基于上面的方法得到Q值后,假如代理仅仅依据Q值大小选取策略,很容易陷入局部最优;
(2)由于条件的限制,与对手的竞价互动数据规模较小,学习效果难以保证。
基于多售电商的Q-learning算法的改进
针对问题1,本专利引入了ε-greedy算法对学习进行更多探索。针对问题2,本专利采用引入考虑时间成本和风险调整步长的智能代理生成机器样本,对学习算法进行自增强学习训练。
基于多售电商自增强学习的跨区域撮合竞价方法
为了应用Q-Learning算法于跨区域多售电商撮合交易,首先要定义系统状态、策略和收益。
(1)系统状态:系统状态s由所有售电商的报价构成;
(2)策略:本模型的策略为竞价售电商的报价;
(3)收益:本文中各个代理的收益取该轮交易售电商得到的利润,即收入减去成本。
3、如图3所示,算法的具体步骤是:
S1:采集所有售电商的报价,其中设定待测售电商报价为初始竞价,剩余其他售电商报价设定为初始售电商报价;
采用增强学习算法的智能代理和环境的交互模型如图2所示,在一个序列的离散时间段t内交互,S={s1,s2,…,sn}是所有售电商的报价构建的有限集合,其中s1,s2,…,sn为所有售电商报价;at为待测售电商报价,且at∈S;st为初始售电商报价,且st=S-at。
S2:基于预先设定的步长调整所述售电商报价和所述竞价报价;
S2-1:基于预先设定的步长调整竞价报价
在新一轮市场交易开始时,引入ε-greedy算法,即以小概率ε随机选取竞价报价at,选取好竞价报价at,先采用传统的高低匹配集中撮合出清的方法,在由收入减去成本的方法确定收益,为了使学习逐步精确,可选取ε为:
ε=tempt (3)
式中:temp:小于1的衰减系数;t为学习报价轮数阈值,且0<t≤1000,t为正整数。可见概率ε随着迭代次数的增加而逐渐减小,即探索随着结果逐步精确而逐步减小。
S2-2:基于预先设定的步长调整售电商报价
由于竞价报价是一个动态的博弈过程,博弈对手也会根据上一轮的报价进行调整。本专利结合实际,建立了考虑时间成本和风险调整步长的动态代理状态生成模型,即竞价对手的新一轮报价采用下式进行预估:
式中:pi,t:售电商i在t轮学习中的模拟报价;stepi:售电商i的竞价风险调整步长;Gaini:报价的函数,表征售电商i参与匹配的收益;其他:不满足调价条件的情况;t:当前学习报价轮数且0<t≤1000,t为正整数。
S2-2-1:售电商i的竞价风险调整步长stepi基于概率θt计算
然而,考虑到随机因素和竞价的时间成本,这里可以引入报价调整概率θt,竞价对手的新一轮报价以概率θt进行如式(4)的调整,即以概率θt选择所述动态报价模型,结果作为新报价,以概率1-θt选择报价维持不变,且θt应该随着学习轮次的增加而逐渐降低。这里可以按下式对θt进行求解
θt=θ0 t (5)
式中:θ0:报价调整概率且0<θ0<1,这里取0.98;t:当前学习报价轮数且0<t≤1000,t为正整数。
S3:基于初始售电商报价、初始竞价、竞价报价和售电商报价得到收益
在新报价s't+1下,计算最大的收益,按下式对收益进行更新:
Q'(at,st)=(1-α)Q(at,st)+αγmaxQ(a't+1,s't+1) (6)
式中:α:学习率且0<α<1,这里取0.70;γ:时间贴现率且0<γ<1,这里取0.8;maxQ(a't+1,s't+1):新状态下的最大收益值;a't+1:新状态下的最优策略;Q(at,st):收益;Q'(at,st):新状态的收益;t:当前学习报价轮数且0<t≤1000,t为正整数。
S4:基于预先设定的步长重新调整电商报价和竞价报价继续计算收益,直到达到预先设定的学习报价轮数阈值
继续迭代;使迭代次数t加1,转至S2。总共迭代1000次为最优。
S5:基于预先设定的步长重新调整电商报价和竞价报价继续计算收益,直到达到预先设定的学习报价轮数阈值。
基于同一构思,本实施例还提供了一种自增强学习的撮合竞价系统,所述系统包括:
采集模块:用于采集所有售电商的报价,其中设定待测售电商报价为初始竞价,剩余其他售电商报价设定为初始售电商报价;
调整模块:用于基于预先设定的步长调整所述售电商报价和所述竞价报价;
生成模块:用于基于所述初始售电商报价、初始竞价报价、新的竞价报价和新的售电商报价采用Q‐learning算法得到收益;
计算模块:基于预先设定的步长重新调整电商报价和竞价报价继续计算收益,直到达到预先设定的学习报价轮数阈值;
确定模块:用于基于所有的售电商报价、竞价报价和收益确定最终竞价报价;
实施例中,所述采集模块包括:
采集子模块:采集所有售电商的报价构建集合S,S={s1,s2,…,sn},其中s1,s2,…,sn为所有售电商报价;
设定子模块:用于设定待测售电商报价at;at∈S并且设定初始售电商报价为st,st∈S-at;
实施例中,所述调整模块包括:
选择子模块:用于以小概率的ε‐greedy算法随机选择报价和以大概率的ε‐greedy算法选择最大收益所对应的报价;
计算子模块:用于计算概率ε-greedy和售电商报价。
具体实施例一:
下面结合我国23节点特高压售电商互连的网架图使用本发明的模型对跨区域多售电商交易进行模拟。
网架图见图4。
表1为各个节点根据历史数据进行学习预测后得到的的数据申报初始预测值。
表1各节点申报数据表
全国共计23个售电商节点,其中12个售电商参与售电,申报了共计20177.71GW.h的电量,9个售电商参与购电,申报了共计16968.2GW.h的电量。从表中可以看出,我国10节点电力严重富余,达到10224.6GW.h,而5、6、7节点的电力又严重缺乏。正是这个电力供需分布不均衡,给跨区域多售电商交易提供了可能。
采用本专利模型从售电节点3,即基于多售电商自增强学习的跨区域撮合竞价方法交易模拟,学习竞价1000次,撮合方法采用传统的高低匹配撮合模型,其报价结果变化见图5。从图中可以看到,前200轮以探索式学习为主,而经过约200轮次学习,报价逐渐稳定在428元/MWh,达到了市场均衡。从效果上来看,本专利模型的收敛速度比较快。
另外,通过本模型还可以预测当前市场的统一出清价格的波动,如图6。可见在本次供需关系下,通过对市场行为的预测,市场的统一出清价在368元/MWh到388元/MWh波动,对竞价售电商参与竞价有很好的指导作用。
本专利可以模拟不同市场供需情况下的出清电价的变化。图6为电力供需均衡时的统一出清电价模拟,图7为电力短缺时的统一出清电价模拟,图8为电力短缺时的统一出清电价模拟。从结果来看,电力短缺会导致出清电价上涨,电力过剩对导致出清电价下跌。因此,在不同的供需情况下,竞价的策略不同,随统一出清电价变化。
表2为在第1000次学习下各售电商的交易结果,市场统一出清价为386.70元/MWh,其中某一售电商报价为386.58,共交易电量为1931GWh,获利为1.93亿元。
表2第1000次学习交易结果
某一售电商通过学习,所拥有电量全部中标,得到利益最大化,可见本专利的可行性。
以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。
Claims (10)
1.一种自增强学习的撮合竞价方法,其特征在于,所述竞价方法包括:
采集所有售电商的报价,其中设定待测售电商报价为初始竞价,剩余其他售电商报价设定为初始售电商报价;
基于预先设定的步长分别调整初始售电商报价和初始竞价构成售电商报价和竞价报价;
基于所述初始售电商报价、初始竞价、竞价报价和售电商报价得到收益;
基于预先设定的步长重新调整电商报价和竞价报价继续计算收益,直到达到预先设定的学习报价轮数阈值;
基于所有的售电商报价、竞价报价和收益确定最终竞价报价。
2.如权利要求1所述的一种自增强学习的撮合竞价方法,其特征在于,所述采集所有售电商的报价,其中待测售电商报价为初始竞价,剩余其他售电商报价作为初始售电商报价包括:
采集所有售电商的报价构建集合S,S={s1,s2,…,sn},其中s1,s2,…,sn为所有售电商报价;
设定待测售电商报价at,at∈S;
设定初始售电商报价为st,st∈S-at。
3.如权利要求1所述的一种自增强学习的撮合竞价方法,其特征在于,所述基于预先设定的步长调整所述竞价报价包括:
以小概率的ε‐greedy算法随机选择报价;
所述ε-greedy算法按下式计算:
ε=tempt
式中:temp:小于1的衰减系数;t:当前学习报价轮数。
4.如权利要求1所述的一种自增强学习的撮合竞价方法,其特征在于,所述基于预先设定的步长调整所述售电商报价如下式:
式中:pi,t:售电商i在t轮学习中的模拟报价;stepi:售电商i的竞价风险调整步长;Gaini:报价的函数,表征售电商i参与匹配的收益;其他:不满足调价条件的情况;t:当前学习报价轮数。
5.如权利要求4所述的一种自增强学习的撮合竞价方法,其特征在于,所述售电商i的竞价风险调整步长stepi基于概率θt计算;
以概率θt选择所述步长stepi,以概率1‐θt选择原步长stepi;
所述概率θt的计算式如下:
θt=θ0 t
式中:θ0:报价调整概率且0<θ0<1。
6.如权利要求1‐5任一项所述的一种自增强学习的撮合竞价方法,其特征在于,所述基于初始售电商报价、初始竞价报价、新的竞价报价和新的售电商报价采用Q‐learning算法得到收益由下式计算:
Q'(at,st)=(1-α)Q(at,st)+αγmaxQ(a't+1,s't+1)
式中:α:学习率且0<α<1;γ:时间贴现率且0<γ<1;maxQ(a't+1,s't+1):新状态下的最大收益值;a't+1:新状态下的最优策略;Q(at,st):收益;Q'(at,st):新状态的收益;t:当前学习报价轮数。
7.如权利要求6所述的一种自增强学习的撮合竞价方法,其特征在于,所述学习报价轮数阈值设定为1000。
8.一种自增强学习的撮合竞价系统,其特征在于,所述系统包括:
采集模块:用于采集所有售电商的报价,其中设定待测售电商报价为初始竞价,剩余其他售电商报价设定为初始售电商报价;
调整模块:用于基于预先设定的步长调整所述售电商报价和所述竞价报价;
生成模块:用于基于所述初始售电商报价、初始竞价报价、新的竞价报价和新的售电商报价采用Q‐learning算法得到收益;
计算模块:基于预先设定的步长重新调整电商报价和竞价报价继续计算收益,直到达到预先设定的学习报价轮数阈值;
确定模块:用于基于所有的售电商报价、竞价报价和收益确定最终竞价报价。
9.如权利要求8所述的一种自增强学习的撮合竞价系统,其特征在于,所述采集模块包括:
采集子模块:采集所有售电商的报价构建集合S,S={s1,s2,…,sn},其中s1,s2,…,sn为所有售电商报价;
设定子模块:用于设定待测售电商报价at;at∈S并且设定初始售电商报价为st,st∈S-at。
10.如权利要求8所述的一种自增强学习的撮合竞价系统,其特征在于,所述调整模块包括:
选择子模块:用于以小概率的ε‐greedy算法随机选择报价和以大概率的ε‐greedy算法选择最大收益所对应的报价;
计算子模块:用于计算概率ε-greedy和售电商报价。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710914516.0A CN107644370A (zh) | 2017-09-29 | 2017-09-29 | 一种自增强学习的撮合竞价方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710914516.0A CN107644370A (zh) | 2017-09-29 | 2017-09-29 | 一种自增强学习的撮合竞价方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107644370A true CN107644370A (zh) | 2018-01-30 |
Family
ID=61123024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710914516.0A Pending CN107644370A (zh) | 2017-09-29 | 2017-09-29 | 一种自增强学习的撮合竞价方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107644370A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109195186A (zh) * | 2018-09-17 | 2019-01-11 | 河海大学 | 一种基于演化博弈的网络切片接入强化学习方法 |
CN109636515A (zh) * | 2018-11-30 | 2019-04-16 | 中国电力科学研究院有限公司 | 一种售电商智能代理投标方法及装置 |
CN110555742A (zh) * | 2018-05-31 | 2019-12-10 | 中国电力科学研究院有限公司 | 一种发电商代理报价的生成方法与系统 |
CN111047350A (zh) * | 2019-11-14 | 2020-04-21 | 南京智杰物联科技股份有限公司 | 多维度竞价系统及竞价方法 |
CN111461803A (zh) * | 2019-01-18 | 2020-07-28 | 中国电力科学研究院有限公司 | 一种强化学习跨国电力市场报价竞标策略选择方法及系统 |
CN111899122A (zh) * | 2020-07-03 | 2020-11-06 | 国网江苏省电力有限公司镇江供电分公司 | 一种基于储能控制的用户分散出清方法 |
CN112465303A (zh) * | 2020-11-06 | 2021-03-09 | 上海交通大学 | 考虑需求响应基于多代理的双边电力市场优化决策方法 |
US11063434B2 (en) | 2019-05-13 | 2021-07-13 | National Tsing Hua University | Method and apparatus for reinforcement learning based energy bidding |
TWI763087B (zh) * | 2020-10-21 | 2022-05-01 | 國立清華大學 | 基於強化學習的點對點能源共享方法及裝置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101908172A (zh) * | 2010-07-29 | 2010-12-08 | 中国电力科学研究院 | 一种采用多种智能代理算法的电力市场混合仿真方法 |
CN105447775A (zh) * | 2016-01-11 | 2016-03-30 | 广东电网有限责任公司 | 内嵌电网安全约束的电力日前市场撮合交易方法 |
CN106651552A (zh) * | 2016-12-13 | 2017-05-10 | 四川大学 | 一种基于信息互动的分布式能源系统多代理交易竞价模型 |
-
2017
- 2017-09-29 CN CN201710914516.0A patent/CN107644370A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101908172A (zh) * | 2010-07-29 | 2010-12-08 | 中国电力科学研究院 | 一种采用多种智能代理算法的电力市场混合仿真方法 |
CN105447775A (zh) * | 2016-01-11 | 2016-03-30 | 广东电网有限责任公司 | 内嵌电网安全约束的电力日前市场撮合交易方法 |
CN106651552A (zh) * | 2016-12-13 | 2017-05-10 | 四川大学 | 一种基于信息互动的分布式能源系统多代理交易竞价模型 |
Non-Patent Citations (1)
Title |
---|
熊高峰等: "An Electricity Supplier Bidding Strategy Through Q-Learning", 《INSTITUTE OF ELECTRICAL AND ELECTRONIC ENGINEERS》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555742A (zh) * | 2018-05-31 | 2019-12-10 | 中国电力科学研究院有限公司 | 一种发电商代理报价的生成方法与系统 |
CN109195186A (zh) * | 2018-09-17 | 2019-01-11 | 河海大学 | 一种基于演化博弈的网络切片接入强化学习方法 |
CN109636515A (zh) * | 2018-11-30 | 2019-04-16 | 中国电力科学研究院有限公司 | 一种售电商智能代理投标方法及装置 |
CN111461803A (zh) * | 2019-01-18 | 2020-07-28 | 中国电力科学研究院有限公司 | 一种强化学习跨国电力市场报价竞标策略选择方法及系统 |
US11063434B2 (en) | 2019-05-13 | 2021-07-13 | National Tsing Hua University | Method and apparatus for reinforcement learning based energy bidding |
CN111047350A (zh) * | 2019-11-14 | 2020-04-21 | 南京智杰物联科技股份有限公司 | 多维度竞价系统及竞价方法 |
CN111899122A (zh) * | 2020-07-03 | 2020-11-06 | 国网江苏省电力有限公司镇江供电分公司 | 一种基于储能控制的用户分散出清方法 |
CN111899122B (zh) * | 2020-07-03 | 2024-01-02 | 国网江苏省电力有限公司镇江供电分公司 | 一种基于储能控制的用户分散出清方法 |
TWI763087B (zh) * | 2020-10-21 | 2022-05-01 | 國立清華大學 | 基於強化學習的點對點能源共享方法及裝置 |
CN112465303A (zh) * | 2020-11-06 | 2021-03-09 | 上海交通大学 | 考虑需求响应基于多代理的双边电力市场优化决策方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107644370A (zh) | 一种自增强学习的撮合竞价方法及系统 | |
Wang et al. | An evolutionary game approach to analyzing bidding strategies in electricity markets with elastic demand | |
Huang et al. | Combination of multiple data-driven models for long-term monthly runoff predictions based on Bayesian model averaging | |
Nanduri et al. | A reinforcement learning model to assess market power under auction-based energy pricing | |
Li et al. | Optimized neural network combined model based on the induced ordered weighted averaging operator for vegetable price forecasting | |
Wang et al. | Agent and system dynamics-based hybrid modeling and simulation for multilateral bidding in electricity market | |
CN109472700A (zh) | 股票价格的预测方法、服务器及存储介质 | |
Gao et al. | A multiagent competitive bidding strategy in a pool-based electricity market with price-maker participants of WPPs and EV aggregators | |
CN113159835B (zh) | 基于人工智能的发电侧电价报价方法、装置、存储介质及电子设备 | |
CN109919658A (zh) | 一种基于博弈论的负荷控制方法及系统 | |
CN101908172A (zh) | 一种采用多种智能代理算法的电力市场混合仿真方法 | |
Sueyoshi | An agent-based approach equipped with game theory: strategic collaboration among learning agents during a dynamic market change in the California electricity crisis | |
Mahvi et al. | Optimal bidding strategy in a competitive electricity market based on agent-based approach and numerical sensitivity analysis | |
Wu et al. | Strategic bidding in a competitive electricity market: An intelligent method using Multi-Agent Transfer Learning based on reinforcement learning | |
CN109191017B (zh) | 一种综合能源系统的仿真方法、装置、设备及存储介质 | |
Chen et al. | Customized rebate pricing mechanism for virtual power plants using a hierarchical game and reinforcement learning approach | |
Yao et al. | Distributed electric energy trading model and strategy analysis based on prospect theory | |
CN116862551A (zh) | 一种考虑用户隐私保护的新能源消纳电价决策方法 | |
CN110264007A (zh) | 股票交易控制方法及装置 | |
Wang et al. | Multi-agent simulation for strategic bidding in electricity markets using reinforcement learning | |
Faia et al. | Genetic algorithms for portfolio optimization with weighted sum approach | |
CN112686693A (zh) | 电力现货市场边际电价预测方法、系统、设备及存储介质 | |
Wu et al. | Applications of AI techniques to generation planning and investment | |
Wu et al. | Peer-to-peer energy trading optimization for community prosumers considering carbon cap-and-trade | |
CN106503889A (zh) | 一种土地集约利用主客观综合评价方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180130 |
|
RJ01 | Rejection of invention patent application after publication |