CN111368168A - 一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质 - Google Patents

一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质 Download PDF

Info

Publication number
CN111368168A
CN111368168A CN202010171840.XA CN202010171840A CN111368168A CN 111368168 A CN111368168 A CN 111368168A CN 202010171840 A CN202010171840 A CN 202010171840A CN 111368168 A CN111368168 A CN 111368168A
Authority
CN
China
Prior art keywords
electricity price
data
obtaining
value
big data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010171840.XA
Other languages
English (en)
Inventor
刘留
张骁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Aiwente Intelligent Technology Co ltd
Original Assignee
Foshan Aiwente Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Aiwente Intelligent Technology Co ltd filed Critical Foshan Aiwente Intelligent Technology Co ltd
Priority to CN202010171840.XA priority Critical patent/CN111368168A/zh
Publication of CN111368168A publication Critical patent/CN111368168A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E40/00Technologies for an efficient electrical power generation, transmission or distribution
    • Y02E40/70Smart grids as climate change mitigation technology in the energy generation sector
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S50/00Market activities related to the operation of systems integrating technologies related to power network operation or related to communication or information technologies
    • Y04S50/14Marketing, i.e. market research and analysis, surveying, promotions, advertising, buyer profiling, customer management or rewards

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质,所述方法包括:根据样本数据构建电价获取模型;通过大数据信息平台获取当前有关电价的文本数据;采用词库和无词典的分词算法对采集的文本数据进行文本分词,并采用特征提取算法提取出价值信息;将所述价值信息输入电价获取模型中,以获取当前时段的电价状态。本发明能够准确获取当前阶段的电价状态,便于地方性电力承担单位能够快速、准确、全面地获取最新电价政策信息,及时消化电价政策,提高电价的执行水平。同时,本发明还通过建立电价预测模型来精确预测未来时段的电价状态,有助于发电企业制定最优的发电策略和报价策略,并有利于用户根据电价和需求降低使用成本。

Description

一种基于大数据的电价获取和预测方法、系统和计算机可读 存储介质
技术领域
本发明涉及电力领域,尤其涉及一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质。
背景技术
电力能源是经济增长和社会发展的重要物质基础,电力属于国家控制的重要资源之一。与一般商品价格相比,电价承载的功能更为复杂,除了一般的经济性和社会性要求外,还有较强的政治性要求。因此,电价政策常常作为国家宏观调控能源战略的重要手段,也是引导电力行业健康发展的指南针。
当前我国正处于深化电力体制改革关键时期,电力监管部门出台新的价格政策频率在逐步加快,而作为地方性电力供应的承担单位,则需要能够快速、准确、全面地获取最新电价政策信息,及时消化电价政策,合理预判政策走向,有效规避政策风险,提高电价的执行水平。
同时,在电力市场中,电价预测也具有重要的意义。就发电企业来说,有助于制定最优的发电策略和报价策略,也有利于用户根据电价和需求降低使用成本。尤其在使用实时电价条件下,用户可以根据预测的电价调整自己的用电计划,不仅能够降低使用成本,而且就整个电网来说,可以将用电高峰时刻的负荷转移到低谷时刻,使得不同时刻的电力使用情况趋于平均,从而降低发电成本。
基于上述需求,目前急需提出一种精准的基于大数据的电价获取和预测方法。
发明内容
为了解决上述至少一个技术问题,本发明提出了一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质。
为了实现上述目的,本发明第一方面提出了一种基于大数据的电价获取和预测方法,所述方法包括:
根据样本数据构建电价获取模型;
通过大数据信息平台获取当前有关电价的文本数据;
采用词库和无词典的分词算法对采集的文本数据进行文本分词,并采用特征提取算法提取出价值信息;
将所述价值信息输入电价获取模型中,以获取当前时段的电价状态。
本方案中,在获取当前时段的电价状态之后,所述方法还包括:
将获取的电价状态输入至数据库中;
对所述数据库中的历史电价数据进行归一化预处理;
根据归一化预处理后的历史电价数据来训练构建电价预测模型;
根据电价预测模型预测未来预设时间段内和/或预设节点的电价状态。
本方案中,所述归一化预处理的计算公式为:
Figure BDA0002409430950000021
其中x′表示归一化预处理后的数据;xmax表示数据库中历史电价数据的最大值,xmin表示数据库中历史电价数据的最小值。
本方案中,根据归一化预处理后的历史电价数据来训练构建电价预测模型,具体包括:
确定BP神经网络结构;
初始化BP神经网络的权值和阈值以及粒子群中粒子的位置和速度;
输入训练用的电价样本数据,并计算粒子的适应度值;
搜索粒子个体极值Gbest,并判断当前适应度值是否优于极值Gbest,若是,则更新粒子的极值Gbest;
搜索群体极值Zbest,并判断全部粒子当前适应值是否优于极值Zbest,若是,则更新粒子的极值Zbest;
根据公式
Figure BDA0002409430950000031
更新粒子的速度V,并根据公式
Figure BDA0002409430950000032
更新粒子的位置X,其中c1为粒子自身加速系数,c2为全局加速系数,μ1,μ2为分布在[0,1]区间的随机数,ρ为约束因子;
根据公式
Figure BDA0002409430950000033
更新权值ω;其中,Tmax是迭代次数,ωmax,ωmin为最大最小权重,t为当前迭代值;
检查是否满足终止条件,若是,则停止迭代,得到所述BP神经网络的最优权值和阈值;
计算误差,进行权值和阈值更新,检验是否满足结束条件,若是则停止迭代,输出所述BP神经网络最优权值和阈值。
本方案中,在检查是否满足终止条件之后,所述方法还包括:
若不满足终止条件,则重新计算粒子的适应度值,并进入下一次迭代。
本方案中,在判断当前适应度值是否优于极值Gbest,或判断全部粒子当前适应值是否优于极值Zbest之后,所述方法还包括:
若否,根据公式
Figure BDA0002409430950000034
更新粒子的速度V,并根据公式
Figure BDA0002409430950000035
更新粒子的位置X。
本方案中,所述BP神经网络以Sigmoid方程作为每个神经元之间的传递函数,神经元输入x与与输出f(x)的关系为:
Figure BDA0002409430950000036
本方案中,在对所述电价数据库中的历史电价数据进行归一化预处理之后,所述方法还包括:
将数据库中的同类型日的最低温度、最高温度和平均温度分别代入低温、中温、高温的隶属度函数中;
根据隶属度最大原则,分别求出同类型日的最低温度、最高温度和平均温度的模糊值;
将同类型日的最低温度、最高温度和平均温度的模糊值作为输入量来训练电价预测模型。
本发明第二方面还提出一种电价获取和预测系统,所述电价获取和预测系统包括:存储器及处理器,所述存储器中包括一种基于大数据的电价获取和预测方法程序,所述电价获取和预测保护方法程序被所述处理器执行时实现如上述的一种基于大数据的电价获取和预测方法的步骤。
本发明第三方面还提出一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于大数据的电价获取和预测方法程序,所述基于大数据的电价获取和预测方法程序被处理器执行时,实现如上述的一种基于大数据的电价获取和预测方法的步骤。
本发明通过大数据信息获取有关电价政策的文本数据,并通过机器学习的方法进行特征提取,并挖掘有价值信息,然后基于有价值信息准确获取当前阶段的电价状态。同时,本发明还通过建立电价预测模型来精确预测未来时段的电价状态,有助于发电企业制定最优的发电策略和报价策略,也有利于用户根据电价和需求降低使用成本。
本发明的附加方面和优点将在下面的描述部分中给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1示出了本发明一种电价获取方法的流程图;
图2示出了本发明一种电价预测方法的流程图;
图3示出了本发明训练电价预测模型的方法流程图;
图4示出了本发明采用温度数据训练电价预测模型的方法流程图;
图5示出了本发明一种电价获取和预测系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种电价获取方法的流程图。
如图1所示,本发明第一方面提出一种基于大数据的电价获取和预测方法,所述方法包括:
S102,根据样本数据构建电价获取模型;
S104,通过大数据信息平台获取当前有关电价的文本数据;
S106,采用词库和无词典的分词算法对采集的文本数据进行文本分词,并采用特征提取算法提取出价值信息;
S108,将所述价值信息输入电价获取模型中,以获取当前时段的电价状态。
需要说明的是,本发明的技术方案可以在PC、手机、PAD等终端设备中进行操作。
需要说明的是,所述文本数据可以为有关电价政策的文本,其属于公开类资料,且固定在发改委、物价局等政府网页发布,并在电力行业等专业垂直门户有新闻发布。所述样本数据为有关电价政策的历史文本,所述电价获取模型是基于历史文本进行机器学习而得到的。
需要说明的是,在步骤S104中,可采用网络爬虫的方式从各个网站(如百度、谷歌等)爬取文本内容。网络爬虫按照系统结构和实现技术,大致可以分为以下类型:通用网络爬虫(General Purpose Web Crawler)、聚焦网络爬虫(Focused Web Crawler)、增量式网络爬虫(Incremental Web Crawler)、深层网络爬虫(Deep Web Crawler)。本发明优选采用应用聚焦网络爬虫和增量式网络爬虫。
所述聚焦网络爬虫是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。和通用网络爬虫相比,聚焦爬虫只需要爬行与主题相关的页面,极大地节省了硬件和网络资源,还可以很好地满足特定人群对特定领域信息的需求。所述增量式网络爬虫是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。和周期性爬行和刷新页面的网络爬虫相比,增量式爬虫只会在需要的时候爬行新产生或发生更新的页面,并不重新下载没有发生变化的页面,可有效减少数据下载量,及时更新已爬行的网页,减小时间和空间上的耗费。
需要说明的是,在步骤S106中,基于词库的分词算法包括正向最大匹配、正向最小匹配、逆向匹配及逐词遍历匹配法等。这类算法的特点是易于实现,设计简单,但分词的正确性很大程度上取决于所建的词库;基于无词典的分词算法是基于词频的统计,将原文本中任意前后紧邻的两个字作为一个词进行出现频率的统计,出现的次数越高,成为一个词的可能性也就越大,在频率超过某个预先设定的阈值时,就将其作为一个词进行索引。这种方法能够有效地提取出未登录词。本发明结合这两种分词算法能够有效提升了分词的精度。
特征提取是指提取关于文本的元数据,文本数据中包括描述性特征(如名称、日期、大小、类型等)和语义性特征(如作者、机构、标题、内容等)。对于有固定格式的描述性特征,比如日期、类型等,可以使用简单的正则表达式进行提取,对于语义性特征,首先需要特征表示,其是用一定特征项(如词条或描述)来代表文本,对这些特征项进行处理,从而实现对非结构化的文本处理。特征表示模型包括布尔逻辑型、向量空间模型(Vector SpaceModel,VSM)、概率型以及混合型等。在特征表示之后,需要基于特征提取算法来构造一个评价函数,对每个特征进行评估,然后把特征按分值高低排队,预定数目分数最高的特征被选取。所述评价函数包括:信息增益(Information Gain)、期望交叉熵(Expected CrossEntropy)、互信息(Mutual Information)和文本证据权(The Weight of Evidence forText)。但不限于此。
图2示出了本发明一种电价预测方法的流程图。
如图2所示,在获取当前时段的电价状态之后,所述方法还包括:
S202,将获取的电价状态输入至数据库中;
S204,对所述数据库中的历史电价数据进行归一化预处理;
S206,根据归一化预处理后的历史电价数据来训练构建电价预测模型;
S208,根据电价预测模型预测未来预设时间段内和/或预设节点的电价状态。
需要说明的是,所述归一化预处理的计算公式为:
Figure BDA0002409430950000081
其中x′表示归一化预处理后的数据;xmax表示数据库中历史电价数据的最大值,xmin表示数据库中历史电价数据的最小值。
需要说明的是,所述数据库用于存放历史各个时间阶段的电价状态和其它影响电价状态的数据;所述电价预测模型为基于粒子群算法的BP神经网络模型。
图3示出了本发明训练电价预测模型的方法流程图。
如图3所示,根据归一化预处理后的历史电价数据来训练构建电价预测模型,具体包括:
步骤1,确定BP神经网络结构;
需要说明的是,所述BP神经网络是一种以反向传播算法调整网络权值的多层前馈神经网络。在网络训练中,通过把输出层与实际输出样本之间的误差反向经过各隐含层传递到输入层,逐层计算各层神经元的误差以修正各个连接权值和阈值,最终达到理想误差。
优选的,本发明采用3层BP神经网络结构,并以Sigmoid方程作为每个神经元之间的传递函数,神经元输入x与输出f(x)的关系为:
Figure BDA0002409430950000082
步骤2,初始化BP神经网络的权值和阈值以及粒子群中粒子的位置和速度;
需要说明的是,可以根据以下计算公式来初始化BP神经网络的权值:
Figure BDA0002409430950000083
Vjk=Vjk+μXjek
其中,i=1,2,…,n;j=1,2,…,l;k=1,2,…,m;Vij、Vjk为BP神经网路连接权值,p(i)、Xj分别为输入层输入和隐含层输出;μ为学习速率,ek为误差;
需要说明的是,可以根据以下计算公式来初始化BP神经网络的阈值:
Figure BDA0002409430950000091
bk=bk+ek
其中,j=1,2,…,l;k=1,2,…,m;aj、bk为BP神经网路隐含层和输出层阀值。
步骤3,输入训练用的电价样本数据,并计算粒子的适应度值;
需要说明的是,可以取数据库中的历史电价数据作为训练用的的电价样本数据;适应度值F的计算公式为:
Figure BDA0002409430950000092
其中,N为训练样本数;C为输出网络神经元的个数;
Figure BDA0002409430950000093
为i样本的第j个网络输出节点的电价理想输出值;
Figure BDA0002409430950000094
为i样本的第j个网络输出节点的电价实际输出值。
步骤4,搜索粒子个体极值Gbest,并判断当前适应度值是否优于极值Gbest,若是,则更新粒子的极值Gbest;若否,根据公式
Figure BDA0002409430950000095
Figure BDA0002409430950000096
更新粒子的速度V,并根据公式
Figure BDA0002409430950000097
更新粒子的位置X。
步骤5,搜索群体极值Zbest,并判断全部粒子当前适应值是否优于极值Zbest,若是,则更新粒子的极值Zbest;若否,根据公式
Figure BDA0002409430950000098
Figure BDA0002409430950000099
更新粒子的速度V,并根据公式
Figure BDA00024094309500000910
更新粒子的位置X。
步骤6,根据公式
Figure BDA00024094309500000911
更新粒子的速度V,并根据公式
Figure BDA00024094309500000912
更新粒子的位置X,其中c1为粒子自身加速系数,c2为全局加速系数,μ1,μ2为分布在[0,1]区间的随机数,ρ为约束因子。
步骤7,根据公式
Figure BDA0002409430950000101
更新权值ω;其中,Tmax是迭代次数,ωmax,ωmin为最大最小权重,t为当前迭代值。
步骤8,检查是否满足终止条件,若是,则停止迭代,得到所述BP神经网络的最优权值和阈值;若不满足终止条件,则重新计算粒子的适应度值,并进入下一次迭代。
步骤9,计算误差,进行权值和阈值更新,检验是否满足结束条件,若是则停止迭代,输出所述BP神经网络最优权值和阈值;若否则重新计算误差。
进一步的,利用BP神经网络来初步预测电价结果后,可根据马尔可夫链来确定预测误差的状态转移规律,进而修正电价预测结果。
所述马尔可夫链预测模型中的马尔可夫链计算公式为:Xn=X0Pn,其中,Xn和X0分别为n时刻和初始时刻的状态概率向量,P为马尔可夫状态转移概率矩阵。
将电价样本数据输入至所述BP神经网络中,得到预测时刻n的初步预测结果Cp,并求出绝对百分比误差,采用模糊C-均值聚类法对马尔可夫状态区间进行划分,得到m个状态Q1,Q2,Q3,…,Qm,根据划分的状态空间对绝对百分比误差进行统计,得出马尔可夫状态转移表,并根据马尔可夫状态转移表,由状态转移表求出马尔可夫状态转移概率矩阵为:
Figure BDA0002409430950000111
Figure BDA0002409430950000112
其中,Pij为状态Qi经过1步转移到状态Qj的转移概率,Nj为马尔可夫状态转移表Qj的样本数,Nij为状态Qi经过1步转移到状态Qj的频次。
根据上述马尔可夫链计算公式Xn=X0Pn,计算得到时刻n的状态概率向量Xn,Xn中最大概率值Xp对应的状态Qp即为预测时刻n的绝对百分比误差状态;对所述BP神经网络的初步预测结果Cp进行修正,则修正后的预测结果为:
C*=Cp(1+δ*);
Figure BDA0002409430950000113
其中,δa,δb为状态Qp的区间上、下界。
图4示出了本发明采用温度数据训练电价预测模型的方法流程图。
如图4所示,在对所述电价数据库中的历史电价数据进行归一化预处理之后,所述方法还包括:
S402,将数据库中的同类型日的最低温度、最高温度和平均温度分别代入低温、中温、高温的隶属度函数中;
S404,根据隶属度最大原则,分别求出同类型日的最低温度、最高温度和平均温度的模糊值;
S406,将同类型日的最低温度、最高温度和平均温度的模糊值作为输入量来训练电价预测模型。
需要说明的是,将温度数据作为输入量来训练电价预测模型时,可以对温度数据进行模糊化处理。
低温的隶属度函数采用偏小型梯形分布如下式:
Figure BDA0002409430950000121
中温的隶属度函数采用中间梯形分布如下式:
Figure BDA0002409430950000122
高温的隶属度函数采用偏大型梯形分布如下式:
Figure BDA0002409430950000123
将同类型日的最低温度Tl分别代入以上三个公式,可以分别求出三个状态的隶属度{Tl1,Tl2,Tl3}。根据隶属度最大原则,Tl=max{Tl1,Tl2,Tl3},可知Tl所属的模糊集。对于最高温度Th和平均温度Ta可采用同样的方法求出三个状态的隶属度及其取值。
进一步的,节假日也是影响电价波动的重要因素,本发明还可以通过建立节假日模型来计算特殊节假日电价状态;具体计算方法如下步骤:
步骤1,预测特殊日电价P时,先计算特殊日前一个月内的周末电价平均值P特前0,再计算特殊日前一个星期工作日电价的平均值P特前1
步骤2,在前一年的此特殊向前一个月内找到周末电价的平均值P'特前0,此日前一个星期工作日的平均值P'特前1
步骤3,求取电价的增长比例关系,计算公式如下:
Figure BDA0002409430950000131
Figure BDA0002409430950000132
取前两年的特殊日电价历史数据进行求解,根据重近轻远原则,两年的比例分别为qa1,qa2,qb1,qb2,前两年节日电价分别为P特1,P特2;根据以下计算公式计算求取加权平均比例关系q1,q2
Figure BDA0002409430950000135
为前两年节假日电价的加权平均值,
q1=α·qa1+(1-α)·qa2
q2=α·qb1+(1-α)·qb2
Figure BDA0002409430950000133
优选的,α取0.73,β取0.11,但不限于此。
步骤4,计算特殊日电价,考虑周末电价与特殊日电价的相似性,取不同的权重;计算公式如下:
Figure BDA0002409430950000134
图5示出了本发明一种电价获取和预测系统的框图。
如图5所示,本发明第二方面还提出一种电价获取和预测系统5,所述电价获取和预测系统5包括:存储器51及处理器52,所述存储器51中包括一种基于大数据的电价获取和预测方法程序,所述电价获取和预测保护方法程序被所述处理器执行时实现如下步骤:
根据样本数据构建电价获取模型;
通过大数据信息平台获取当前有关电价的文本数据;
采用词库和无词典的分词算法对采集的文本数据进行文本分词,并采用特征提取算法提取出价值信息;
将所述价值信息输入电价获取模型中,以获取当前时段的电价状态。
需要说明的是,本发明的系统可以在PC、手机、PAD等终端设备中进行操作。
需要说明的是,所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
进一步的,在获取当前时段的电价状态之后,还包括:
将获取的电价状态输入至数据库中;
对所述数据库中的历史电价数据进行归一化预处理;
根据归一化预处理后的历史电价数据来训练构建电价预测模型;
根据电价预测模型预测未来预设时间段内和/或预设节点的电价状态。
进一步的,所述归一化预处理的计算公式为:
Figure BDA0002409430950000141
其中x′表示归一化预处理后的数据;xmax表示数据库中历史电价数据的最大值,xmin表示数据库中历史电价数据的最小值。
进一步的,根据归一化预处理后的历史电价数据来训练构建电价预测模型,具体包括:
确定BP神经网络结构;
初始化BP神经网络的权值和阈值以及粒子群中粒子的位置和速度;
输入训练用的电价样本数据,并计算粒子的适应度值;
搜索粒子个体极值Gbest,并判断当前适应度值是否优于极值Gbest,若是,则更新粒子的极值Gbest;
搜索群体极值Zbest,并判断全部粒子当前适应值是否优于极值Zbest,若是,则更新粒子的极值Zbest;
根据公式
Figure BDA0002409430950000151
更新粒子的速度V,并根据公式
Figure BDA0002409430950000152
更新粒子的位置X,其中c1为粒子自身加速系数,c2为全局加速系数,μ1,μ2为分布在[0,1]区间的随机数,ρ为约束因子;
根据公式
Figure BDA0002409430950000153
更新权值ω;其中,Tmax是迭代次数,ωmax,ωmin为最大最小权重,t为当前迭代值;
检查是否满足终止条件,若是,则停止迭代,得到所述BP神经网络的最优权值和阈值;
计算误差,进行权值和阈值更新,检验是否满足结束条件,若是则停止迭代,输出所述BP神经网络最优权值和阈值。
进一步的,在检查是否满足终止条件之后,还包括:
若不满足终止条件,则重新计算粒子的适应度值,并进入下一次迭代。
进一步的,在判断当前适应度值是否优于极值Gbest,或判断全部粒子当前适应值是否优于极值Zbest之后,还包括:
若否,根据公式
Figure BDA0002409430950000154
更新粒子的速度V,并根据公式
Figure BDA0002409430950000155
更新粒子的位置X。
进一步的,所述BP神经网络以Sigmoid方程作为每个神经元之间的传递函数,神经元输入x与与输出f(x)的关系为:
Figure BDA0002409430950000156
进一步的,在对所述电价数据库中的历史电价数据进行归一化预处理之后,还包括:
将数据库中的同类型日的最低温度、最高温度和平均温度分别代入低温、中温、高温的隶属度函数中;
根据隶属度最大原则,分别求出同类型日的最低温度、最高温度和平均温度的模糊值;
将同类型日的最低温度、最高温度和平均温度的模糊值作为输入量来训练电价预测模型。
本发明第三方面还提出一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于大数据的电价获取和预测方法程序,所述基于大数据的电价获取和预测方法程序被处理器执行时,实现如上述的一种基于大数据的电价获取和预测方法的步骤。
本发明通过大数据信息获取有关电价政策的文本数据,并通过机器学习的方法进行特征提取,并挖掘有价值信息,然后基于有价值信息准确获取当前阶段的电价状态。同时,本发明还通过建立电价预测模型来精确预测未来时段的电价状态,有助于发电企业制定最优的发电策略和报价策略,也有利于用户根据电价和需求降低使用成本。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种基于大数据的电价获取和预测方法,其特征在于,所述方法包括:
根据样本数据构建电价获取模型;
通过大数据信息平台获取当前有关电价的文本数据;
采用词库和无词典的分词算法对采集的文本数据进行文本分词,并采用特征提取算法提取出价值信息;
将所述价值信息输入电价获取模型中,以获取当前时段的电价状态。
2.根据权利要求1所述的一种基于大数据的电价获取和预测方法,其特征在于,在获取当前时段的电价状态之后,所述方法还包括:
将获取的电价状态输入至数据库中;
对所述数据库中的历史电价数据进行归一化预处理;
根据归一化预处理后的历史电价数据来训练构建电价预测模型;
根据电价预测模型预测未来预设时间段内和/或预设节点的电价状态。
3.根据权利要求2所述的一种基于大数据的电价获取和预测方法,其特征在于,所述归一化预处理的计算公式为:
Figure FDA0002409430940000011
其中x′表示归一化预处理后的数据;xmax表示数据库中历史电价数据的最大值,xmin表示数据库中历史电价数据的最小值。
4.根据权利要求2所述的一种基于大数据的电价获取和预测方法,其特征在于,根据归一化预处理后的历史电价数据来训练构建电价预测模型,具体包括:
确定BP神经网络结构;
初始化BP神经网络的权值和阈值以及粒子群中粒子的位置和速度;
输入训练用的电价样本数据,并计算粒子的适应度值;
搜索粒子个体极值Gbest,并判断当前适应度值是否优于极值Gbest,若是,则更新粒子的极值Gbest;
搜索群体极值Zbest,并判断全部粒子当前适应值是否优于极值Zbest,若是,则更新粒子的极值Zbest;
根据公式
Figure FDA0002409430940000021
更新粒子的速度V,并根据公式
Figure FDA0002409430940000022
更新粒子的位置X,其中c1为粒子自身加速系数,c2为全局加速系数,μ1,μ2为分布在[0,1]区间的随机数,ρ为约束因子;
根据公式
Figure FDA0002409430940000023
更新权值ω;其中,Tmax是迭代次数,ωmax,ωmin为最大最小权重,t为当前迭代值;
检查是否满足终止条件,若是,则停止迭代,得到所述BP神经网络的最优权值和阈值;
计算误差,进行权值和阈值更新,检验是否满足结束条件,若是则停止迭代,输出所述BP神经网络最优权值和阈值。
5.根据权利要求4所述的一种基于大数据的电价获取和预测方法,其特征在于,在检查是否满足终止条件之后,所述方法还包括:
若不满足终止条件,则重新计算粒子的适应度值,并进入下一次迭代。
6.根据权利要求4所述的一种基于大数据的电价获取和预测方法,其特征在于,在判断当前适应度值是否优于极值Gbest,或判断全部粒子当前适应值是否优于极值Zbest之后,所述方法还包括:
若否,根据公式
Figure FDA0002409430940000024
更新粒子的速度V,并根据公式
Figure FDA0002409430940000025
更新粒子的位置X。
7.根据权利要求4所述的一种基于大数据的电价获取和预测方法,其特征在于,所述BP神经网络以Sigmoid方程作为每个神经元之间的传递函数,神经元输入x与与输出f(x)的关系为:
Figure FDA0002409430940000031
8.根据权利要求2所述的一种基于大数据的电价获取和预测方法,其特征在于,在对所述电价数据库中的历史电价数据进行归一化预处理之后,所述方法还包括:
将数据库中的同类型日的最低温度、最高温度和平均温度分别代入低温、中温、高温的隶属度函数中;
根据隶属度最大原则,分别求出同类型日的最低温度、最高温度和平均温度的模糊值;
将同类型日的最低温度、最高温度和平均温度的模糊值作为输入量来训练电价预测模型。
9.一种电价获取和预测系统,其特征在于,所述电价获取和预测系统包括:存储器及处理器,所述存储器中包括一种基于大数据的电价获取和预测方法程序,所述电价获取和预测保护方法程序被所述处理器执行时实现如权利要求1至8任意一项所述的一种基于大数据的电价获取和预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括一种基于大数据的电价获取和预测方法程序,所述基于大数据的电价获取和预测方法程序被处理器执行时,实现如权利要求1至8中任意一项所述的一种基于大数据的电价获取和预测方法的步骤。
CN202010171840.XA 2020-03-12 2020-03-12 一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质 Withdrawn CN111368168A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010171840.XA CN111368168A (zh) 2020-03-12 2020-03-12 一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010171840.XA CN111368168A (zh) 2020-03-12 2020-03-12 一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111368168A true CN111368168A (zh) 2020-07-03

Family

ID=71211833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010171840.XA Withdrawn CN111368168A (zh) 2020-03-12 2020-03-12 一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111368168A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232886A (zh) * 2020-10-30 2021-01-15 南方电网能源发展研究院有限责任公司 一种电价概率预测方法、系统、计算机设备和存储介质
CN116362421A (zh) * 2023-05-31 2023-06-30 天津市普迅电力信息技术有限公司 一种基于能源综合统筹分析的供能分配预测系统及其方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232886A (zh) * 2020-10-30 2021-01-15 南方电网能源发展研究院有限责任公司 一种电价概率预测方法、系统、计算机设备和存储介质
CN116362421A (zh) * 2023-05-31 2023-06-30 天津市普迅电力信息技术有限公司 一种基于能源综合统筹分析的供能分配预测系统及其方法
CN116362421B (zh) * 2023-05-31 2023-10-10 天津市普迅电力信息技术有限公司 一种基于能源综合统筹分析的供能分配预测系统及其方法

Similar Documents

Publication Publication Date Title
Dong et al. Two-phase multidocument summarization through content-attention-based subtopic detection
CN107562784A (zh) 基于ResLCNN模型的短文本分类方法
CN114647741B (zh) 工艺自动决策和推理方法、装置、计算机设备及存储介质
CN114519145A (zh) 一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法
US12051017B2 (en) Apparatus for determining role fitness while eliminating unwanted bias
CN115270988A (zh) 知识表征解耦的分类模型的微调方法、装置和应用
CN115062727B (zh) 一种基于多阶超图卷积网络的图节点分类方法及系统
CN111368168A (zh) 一种基于大数据的电价获取和预测方法、系统和计算机可读存储介质
Zheng et al. RLSTM: a new framework of stock prediction by using random noise for overfitting prevention
CN114881172A (zh) 一种基于加权词向量和神经网络的软件漏洞自动分类方法
CN115080868A (zh) 产品推送方法、装置、计算机设备、存储介质和程序产品
Dai et al. Research on mathematical model of box office forecast through BP neural network and big data technology
WO2024179089A1 (zh) 一种基于深度神经网络与双正则化的视频评分预测方法
Wenjie et al. A NOVEL MODEL FOR STOCK CLOSING PRICE PREDICTION USING CNN-ATTENTION-GRU-ATTENTION.
CN117194771B (zh) 一种图模型表征学习的动态知识图谱服务推荐方法
Fan et al. StockMixer: A Simple Yet Strong MLP-Based Architecture for Stock Price Forecasting
Song et al. A novel text classification approach based on Word2vec and TextRank keyword extraction
Zhao A Novel Stock Index Intelligent Prediction Algorithm Based on Attention‐Guided Deep Neural Network
Koromyslova et al. Feature selection for natural language call routing based on self-adaptive genetic algorithm
Dong et al. A hierarchical network with user memory matrix for long sequence recommendation
Wu et al. A Text Emotion Analysis Method Using the Dual‐Channel Convolution Neural Network in Social Networks
Lai et al. Chinese stock market prediction based on multifeature fusion and TextCNN
Gong et al. A probabilistic matrix factorization recommendation method based on deep learning
He et al. A CNN-Relstm model based on a hybrid architecture of unidirectional and bidirectional LSTM for predicting stock prices
Zuo et al. A tag-aware recommendation algorithm based on deep learning and multi-objective optimization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200703