CN102968669A - 对负荷进行预测的方法和装置 - Google Patents
对负荷进行预测的方法和装置 Download PDFInfo
- Publication number
- CN102968669A CN102968669A CN2011102703879A CN201110270387A CN102968669A CN 102968669 A CN102968669 A CN 102968669A CN 2011102703879 A CN2011102703879 A CN 2011102703879A CN 201110270387 A CN201110270387 A CN 201110270387A CN 102968669 A CN102968669 A CN 102968669A
- Authority
- CN
- China
- Prior art keywords
- load
- keyword
- network information
- keywords
- abnormal nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种对负荷进行预测的方法和装置。对负荷进行预测的方法包括:基于与负荷相关联的历史数据来预测粗略表示负荷的未来发展趋势的初步预测曲线;基于与负荷相关联的历史数据来确定负荷发生过异常的异常节点;从搜集的过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词;在搜集的当前的网络信息中查找一个或多个关键词;以及基于一个或多个关键词中的每个关键词对负荷造成的影响来修正初步预测曲线,以得到精确表示负荷的未来发展趋势的最终预测曲线。
Description
技术领域
本发明涉及负荷预测的领域,具体涉及对负荷进行预测的方法和装置。
背景技术
用于预测覆盖一天或一周内的系统负荷的短期负荷预测(Short TermLoad Forecast,简称STLF)对于电力系统的操作安排和控制很重要。深入的分析例如电力负荷流同样基于短期负荷预测的结果.
大多现存的技术在短期负荷预测上仅利用了电力的历史负荷数据和气象变量。然而,电气装置的使用会引起电力负荷变化。一些由网络信息反映的相关词汇对电气装置的使用具有直接影响。
因此,需要一种考虑网络信息中的相关词汇对负荷的影响的预测方法。
发明内容
在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本发明的一个主要目的在于,提供对负荷进行预测的方法和装置。
根据本发明的一个方面,提供了一种对负荷进行预测的方法,包括:基于与负荷相关联的历史数据来预测粗略表示负荷的未来发展趋势的初步预测曲线;基于与负荷相关联的历史数据来确定负荷发生过异常的异常节点;从搜集的过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词;在搜集的当前的网络信息中查找一个或多个关键词;以及基于一个或多个关键词中的每个关键词对负荷造成的影响来修正初步预测曲线,以得到精确表示负荷的未来发展趋势的最终预测曲线。
根据本发明的另一个方面,提供了一种对负荷进行预测的装置,包括:曲线预测单元,被配置为基于与负荷相关联的历史数据来预测粗略表示负荷的未来发展趋势的初步预测曲线;异常节点确定单元,被配置为基于与负荷相关联的历史数据来确定负荷发生过异常的异常节点;关键词提取单元,被配置为从搜集的过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词;关键词查找单元,被配置为在搜集的当前的网络信息中查找一个或多个关键词;以及曲线修正单元,被配置为基于一个或多个关键词中的每个关键词对负荷造成的影响来修正初步预测曲线,以得到精确表示负荷的未来发展趋势的最终预测曲线。
另外,本发明的实施例还提供了用于实现上述方法的计算机程序。
此外,本发明的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
图1是示出根据本发明的实施例的对负荷进行预测的方法的流程图;
图2是示出根据本发明的一个例子的图1中的确定异常节点的过程的流程图;
图3是示出根据本发明的一个例子的图1中的提取关键词的过程的流程图;
图4是示出根据本发明的一个例子的图1中的修正初步预测曲线的过程的流程图;
图5是示出根据本发明的一个例子的对网络信息进行结构化的过程的流程图;
图6是示出根据本发明的实施例的对负荷进行预测的装置的框图;
图7是示出根据本发明的一个例子的异常节点确定单元的配置的框图;
图8是示出根据本发明的一个例子的关键词提取单元的配置的框图;
图9是示出根据本发明的一个例子的曲线修正单元的配置的框图;
图10是示出根据本发明的一个例子的网络信息结构化单元的配置的框图;以及
图11是示出可以用于实施本发明的用于对负荷进行预测的方法和装置的计算设备的举例的结构图。
具体实施方式
下面参照附图来说明本发明的实施例。在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
以下参照图1来描述根据本发明的实施例的对负荷进行预测的方法。
本文中的负荷例如可以是电力负荷、燃气负荷、用水负荷、交通负荷、或者任意其他可以通过网络信息来预测的负荷。
如图1所示,在步骤S102,可以基于与负荷相关联的历史数据来预测初步预测曲线。初步预测曲线可以粗略表示负荷的未来发展趋势。例如,历史数据可以是负荷的实际历史曲线。但这仅是个例子,历史数据可以包括可以用于预测初步预测曲线的任意数据。如果负荷是电力负荷,则该初步预测曲线为电力负荷的初步预测曲线。
在步骤S104,可以基于与负荷相关联的历史数据来确定负荷发生过异常的异常节点。例如,异常节点可以是实际发生的负荷状况和预测的负荷状况显著不同的点。但这仅是个例子,根据不同的标准,异常节点会有所不同。在一些情况下,异常节点可以表示由时间和地理位置构成的二维节点。换句话说,异常节点表示在特定时间段或特定时刻在特定地理位置或特定地理区域处发生异常的点。如果负荷是电力负荷,则异常节点为电力负荷发生异常的节点。
在步骤S106,可以从搜集的过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词。
例如,可以从发生异常节点时的前一段时间的网络信息中提取可以对负荷造成影响的关键词。如果负荷是电力负荷,则可以将发生异常节点的前一段时间的网络信息中出现的与电力负荷关联的词汇(例如,“停电”、“限电”等)提取作为可能影响负荷的关键词。这里的“停电”、“限电”仅是示例,实际提取出的关键词还可能包括“演唱会”、“运动会”等其他可能对电力负荷造成影响的词汇。
在步骤S108,可以在搜集的当前的网络信息中查找一个或多个关键词。换句话说,在当前的网络信息中查找在步骤S106中提取的关键词。如果在当前的网络信息中出现所提取的与异常节点相关联并影响负荷的一个或多个关键词,则负荷在未来也可能发生异常。
在电力负荷的情况下,如果在步骤S106提取出的关键词是“演唱会”和“限电”,则确定在当前的网络信息中查找是否存在“演唱会”和“限电”。如果在当前的网络信息中存在“演唱会”、“限电”,则电力负荷在未来也可能发生异常。
在步骤S110,可以基于一个或多个关键词中的每个关键词对负荷造成的影响来修正初步预测曲线,以得到精确表示负荷的未来发展趋势的最终预测曲线。仍假设负荷是电力负荷,如果在当前的网络信息中仅查找到“演唱会”,则可以根据“演唱会”对电力负荷造成的影响(其可能使电力负荷增大)来修正初步预测曲线。如果在当前的网络信息中仅查找到“限电”,则可以根据“限电”对电力负荷造成的影响(其可能使电力负荷减小)来修正初步预测曲线。如果在当前的网络信息中同时查找到“演唱会”和“限电”,则可以根据“演唱会”对电力负荷造成的影响(其可能使电力负荷增大)和“限电”对电力负荷造成的影响(其可能使电力负荷减小)来修正初步预测曲线。
尽管在步骤S102至步骤S110的描述中提到了电力负荷,但是步骤S102至步骤S110同样可以应用于燃气负荷、用水负荷或交通负荷等。例如,如果负荷是交通负荷,则在步骤S102中预测的初步预测曲线可以是与交通负荷相关的初步预测曲线,在步骤S104中确定的异常节点为交通负荷发生异常的节点。在步骤S106中提取的关键词可能与异常节点关联的并对交通负荷造成影响的例如“提前下班”、“放假”、“阴雨”等词汇,在步骤S108中查找关键词“提前下班”、“放假”、“阴雨”等,在步骤S110中,根据查找到的关键词对交通负荷的影响来修正初步预测曲线。
容易理解到,步骤S102至步骤S110也可以应用于燃气负荷、用水负荷等等,在此不再赘述。
此外,步骤S102即基于与负荷相关联的历史数据来预测粗略表示负荷的未来发展趋势的初步预测曲线的步骤可以紧邻在步骤S110即基于一个或多个关键词中的每个关键词对负荷造成的影响来修正初步预测曲线的步骤之前,或者紧邻在步骤S104即基于与负荷相关联的历史数据来确定负荷发生过异常的异常节点的步骤之前。换句话说,只要在步骤S110即修正初步预测曲线的步骤之前执行步骤S102就可以。
以下参照图2来描述根据本发明的一个例子的图1中的步骤S104即确定异常节点的过程。
如图2所示,在步骤S104-2,可以基于与负荷相关联的历史数据来预测粗略表示负荷的过去预测发展趋势的过去预测曲线FL(T,L),其中T表示时间,L表示地理位置。即,利用目标时刻之前的一段时间间隔的负荷曲线来预测目标时刻的负荷曲线。
在步骤S104-4,可以对过去预测曲线FL(T,L和表示负荷的过去实际发展趋势的过去实际曲线AL(T,L)进行比较以确定过去预测曲线上各点的预测误差E(T,L)。
例如,可以通过式(1)来计算误差E(Ti,Lj)
其中,Ti表示时间,Lj表示地理位置,E(Ti,Lj)表示在时间Ti和地理位置Lj的预测误差,FL(Ti,Lj)表示过去预测曲线上在时间Ti和地理位置Lj的点,AL(Ti,Lj)表示过去实际曲线上在时间Ti和地理位置Lj的点。
在步骤S104-6,可以将过去预测曲线上预测误差大于预定阈值Eth的点确定为负荷发生过异常的异常节点。
以下参照图3来描述根据本发明的一个例子的图1中的步骤S106即提取关键词的步骤的过程。
在步骤S106-2,可以在过去的网络信息中查找与异常节点相关联的一个或多个关键词。
在步骤S106-4,可以确定与异常节点相关联的一个或多个关键词中的每个关键词的影响因子。
具体地,可以确定与异常节点相关联的一个或多个关键词中的每个关键词在过去的网络信息中的出现频率F(Ti,Lj,Km),其中Km表示关键词。然后,可以根据与异常节点相关联的一个或多个关键词中的每个关键词Km在过去的网络信息中的出现频率和异常节点的预测误差E(Ti,Lj),来确定与异常节点相关联的一个或多个关键词中的每个关键词的影响因子W(Km)。
对每个异常节点,可以通过利用至少m个下式(2)来计算影响因子。
其中,Km表示关键词,W(Km)表示影响因子,F(Ti,Lj,Km)表示在时间Ti和地理位置Lj的关键词Km的出现频率。
在步骤S106-6,可以根据影响因子W(Km)的大小,从与异常节点相关联的一个或多个关键词中提取与异常节点相关联并影响负荷的一个或多个关键词。换句话说,从与异常节点相关联的关键词中提取具有较大影响因子W(Km)的关键词作为与异常节点相关联并影响负荷的关键词。
以下参照图4来描述根据本发明的实施例的修正初步预测曲线的过程。
如图4所示,在步骤S110-2,可以确定一个或多个关键词中的每个关键词在当前的网络信息中的出现频率。
在步骤S110-4,可以根据一个或多个关键词中的每个关键词在当前的网络信息中的出现频率F(Tx,Ly,Km)和影响因子W(Km)来修正初步预测曲线PFL(Tx,Ly),其中,Tx表示要预测的时间、Ly表示要预测的地理位置。例如,可以通过下式(3)来获得最终预测曲线FL(Tx,Ly):
在步骤S106即在从搜集的过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词的步骤之前,还可以对搜集的网络信息进行结构化。具体地,可以将网络信息结构化为与负荷相关联的关键词、时间、地理位置以及关键词的出现频率。以下参照图5来描述根据本发明的一个例子的对网络信息进行结构化的过程。
如图5所示,在步骤S502,可以搜集与负荷相关联的网页。例如,可以通过网络爬虫来搜集网页。但网络爬虫仅是一种示例方式,可以通过任意其他适当方式来搜集网页。
在步骤S504,可以识别与网页相关联的地理位置和时间。例如,与网页相关联的地理位置可以是网页的发布地理位置,可以通过IP地址来获得网页的发布地理位置。与网页相关联的地理位置也可以是网页上提到的地理位置。类似地,与网页相关联的时间可以是网页的发布时间,或者与网页相关联的时间也可以是网页上提到的时间。
在步骤S506,可以将网页中与负荷相关联的词汇确定为种子候选者,并将具有最高出现频率的种子候选者确定为种子。如果负荷是电力负荷,则在确定种子候选者时可以将包含“电”的词汇,例如“电”、“电流量”、“电压”、“电线”等确定为种子候选者。但这仅是示例性的,不包含“电”但于电力负荷相关的词汇也可以作为种子候选者,例如,“照明”。
在步骤S508,对于特定时间和地理位置,将经常与种子同时出现的、且具有高的词频逆文档频率(term frequenc-inverse documentfrequency,简称TF-IDF)的词汇确定为关键词。例如,在电力负荷的情况下,如果“电”和“照明”是种子,则可以将经常与“电”和“照明”同时出现的并具有较高TF-IDF的词汇确定为关键词。
在步骤S510,可以基于关键词、时间、地理位置、以及关键词的出现频率对网络信息进行结构化。
在对网络信息进行结构化的情况下,在步骤S106,可以从结构化的、过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词。接下来,在步骤S108,可以在结构化的、当前的网络信息中查找一个或多个关键词。
通过对网络信息进行结构化,可以提高操作速度和准确度。例如,可以更快速高效地在过去的网络信息中提取关键词,并且更快速高效地在当前的网络信息中查找关键词。
以下参照图6来描述根据本发明的实施例的对负荷进行预测的装置600。
如图6所示,对负荷进行预测的装置600可以包括曲线预测单元602、异常节点确定单元604、关键词提取单元606、关键词查找单元608和曲线修正单元610。
曲线预测单元602可以基于与负荷相关联的历史数据来预测粗略表示负荷的未来发展趋势的初步预测曲线。异常节点确定单元604可以基于与负荷相关联的历史数据来确定负荷发生过异常的异常节点。关键词提取单元606可以从搜集的过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词。关键词查找单元608可以在搜集的当前的网络信息中查找一个或多个关键词。曲线修正单元610可以基于一个或多个关键词中的每个关键词对负荷造成的影响来修正初步预测曲线,以得到精确表示负荷的未来发展趋势的最终预测曲线。
以下参照图7来描述根据本发明的一个例子的异常节点确定单元604的配置。
如图6所示,异常节点确定单元604包括曲线比较子单元604-2和异常节点确定子单元604-4。
之前描述的曲线预测单元602还可以被配置为基于与负荷相关联的历史数据来预测粗略表示负荷的过去预测发展趋势的过去预测曲线。
曲线比较子单元604-2可以对过去预测曲线和表示负荷的过去实际发展趋势的过去实际曲线进行比较以确定过去预测曲线上各点的预测误差。异常节点确定子单元604-4可以将过去预测曲线上预测误差大于预定阈值的点确定为负荷发生过异常的异常节点。
异常节点可以是例如由时间和地理位置构成的二维节点。
以下参照图8来描述根据本发明的一个例子的关键词提取单元606的配置。
如图8所示,关键词提取单元606可以包括关键词查找子单元606-2、影响因子确定子单元606-4和关键词提取子单元606-6。
关键词查找子单元606-2可以在过去的网络信息中查找与异常节点相关联的一个或多个关键词。影响因子确定子单元606-4可以确定与异常节点相关联的一个或多个关键词中的每个关键词的影响因子。关键词提取子单元606-6可以根据影响因子的大小,从与异常节点相关联的一个或多个关键词中提取与异常节点相关联并影响负荷的一个或多个关键词。
影响因子确定子单元606-4可以包括出现频率确定部件和影响因子确定部件(均未示出)。
出现频率确定部件可以确定与异常节点相关联的一个或多个关键词中的每个关键词在过去的网络信息中的出现频率。影响因子确定部件可以根据与异常节点相关联的一个或多个关键词中的每个关键词在过去的网络信息中的出现频率和异常节点的预测误差,确定与异常节点相关联的一个或多个关键词中的每个关键词的影响因子。
以下参照图9来描述根据本发明的一个例子的曲线修正单元610的配置。
如图9所示,曲线修正单元610可以包括出现频率确定子单元610-2和曲线修正子单元610-4。
出现频率确定子单元610-2可以确定一个或多个关键词中的每个关键词在当前的网络信息中的出现频率。曲线修正子单元610-4可以根据一个或多个关键词中的每个关键词在当前的网络信息中的出现频率和影响因子来修正初步预测曲线。
装置600还可以包括被配置为对搜集的网络信息进行结构化的网络信息结构化单元612。具体地,网络信息结构化单元612可以将网络信息结构化为与负荷相关联的关键词、时间、地理位置以及关键词的出现频率。以下参照图10来描述网络信息结构化单元612的配置。
在装置600包括网络信息结构化单元612的情况下,关键词提取单元606可以从结构化的、过去的网络信息中提取与异常节点相关联并影响负荷的一个或多个关键词,以及关键词查找单元608可以在结构化的、当前的网络信息中查找一个或多个关键词。
如图10所示,网络信息结构化单元612可以包括网页搜集子单元612-2、位置时间识别子单元612-4、种子确定子单元612-6、关键词确定子单元612-8和网络信息结构化子单元612-10。
网页搜集子单元612-2可以搜集与负荷相关联的网页。位置时间识别子单元612-4可以识别与网页相关联的地理位置和时间。种子确定子单元612-6可以将网页中与负荷相关联的词汇确定为种子候选者,并将具有最高出现频率的种子候选者确定为种子。关键词确定子单元612-8可以对于特定时间和地理位置,将经常与种子同时出现的、且具有高词频逆文档频率的词汇确定为关键词网络信息结构化子单元612-10可以基于关键词、时间、地理位置、以及关键词的出现频率对网络信息进行结构化。
负荷可以例如是电力负荷、燃气负荷、用水负荷和交通负荷之一。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。
在通过软件和/或固件实现本发明的实施例的情况下,从存储介质或网络向具有专用硬件结构的计算机,例如图11所示的通用计算机1100安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等等。
在图11中,中央处理单元(CPU)1101根据只读存储器(ROM)1102中存储的程序或从存储部分1108加载到随机存取存储器(RAM)1103的程序执行各种处理。在RAM 1103中,也根据需要存储当CPU 1101执行各种处理等等时所需的数据。CPU 1101、ROM 1102和RAM 1103经由总线1104彼此链路。输入/输出接口1105也链路到总线1104。
下述部件链路到输入/输出接口1105:输入部分1106(包括键盘、鼠标等等)、输出部分1107(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分1108(包括硬盘等)、通信部分1109(包括网络接口卡比如LAN卡、调制解调器等)。通信部分1109经由网络比如因特网执行通信处理。根据需要,驱动器1110也可链路到输入/输出接口1105。可拆卸介质1111比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1110上,使得从中读出的计算机程序根据需要被安装到存储部分1108中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1111安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图11所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1111。可拆卸介质1111的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 1102、存储部分1108中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明还提出一种存储有机器可读取的指令代码的程序产品。指令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等。
本领域的普通技术人员应理解,在此所例举的是示例性的,本发明并不局限于此。
在本说明书中,“第一”、“第二”以及“第N个”等表述是为了将所描述的特征在文字上区分开,以清楚地描述本发明。因此,不应将其视为具有任何限定性的含义。
作为一个示例,上述方法的各个步骤以及上述设备的各个组成模块和/或单元可以实施为软件、固件、硬件或其组合,并作为相应设备中的一部分。上述装置中各个组成模块、单元通过软件、固件、硬件或其组合的方式进行配置时可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。
作为一个示例,在通过软件或固件实现的情况下,可以从存储介质或网络向具有专用硬件结构的计算机(例如图11所示的通用计算机1100)安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其他实施方式中使用,与其他实施方式中的特征相组合,或替代其他实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其他特征、要素、步骤或组件的存在或附加。
此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
本发明及其优点,但是应当理解在不超出由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。而且,本发明的范围不仅限于说明书所描述的过程、设备、手段、方法和步骤的具体实施例。本领域内的普通技术人员从本发明的公开内容将容易理解,根据本发明可以使用执行与在此的相应实施例基本相同的功能或者获得与其基本相同的结果的、现有和将来要被开发的过程、设备、手段、方法或者步骤。因此,所附的权利要求旨在在它们的范围内包括这样的过程、设备、手段、方法或者步骤。
附记
附记1.一种对负荷进行预测的方法,包括:
基于与所述负荷相关联的历史数据来预测粗略表示所述负荷的未来发展趋势的初步预测曲线;
基于与所述负荷相关联的历史数据来确定所述负荷发生过异常的异常节点;
从搜集的过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词;
在搜集的当前的网络信息中查找所述一个或多个关键词;以及
基于所述一个或多个关键词中的每个关键词对所述负荷造成的影响来修正所述初步预测曲线,以得到精确表示所述负荷的未来发展趋势的最终预测曲线。
附记2.根据附记1所述的方法,其中,所述基于与所述负荷相关联的历史数据来确定所述负荷发生过异常的异常节点的步骤包括:
基于与所述负荷相关联的历史数据来预测粗略表示所述负荷的过去预测发展趋势的过去预测曲线;
对所述过去预测曲线和表示所述负荷的过去实际发展趋势的过去实际曲线进行比较以确定所述过去预测曲线上各点的预测误差;以及
将所述过去预测曲线上所述预测误差大于预定阈值的点确定为所述负荷发生过异常的所述异常节点。
附记3.根据附记2所述的方法,其中,所述异常节点是由时间和地理位置构成的二维节点。
附记4.根据附记2所述的方法,其中,所述从过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词的步骤包括:
在所述过去的网络信息中查找与所述异常节点相关联的一个或多个关键词;
确定与所述异常节点相关联的一个或多个关键词中的每个关键词的影响因子;以及
根据所述影响因子的大小,从与所述异常节点相关联的一个或多个关键词中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词。
附记5.根据附记4所述的方法,其中,所述确定与所述异常节点相关联的一个或多个关键词中的每个关键词的影响因子的步骤包括:
确定与所述异常节点相关联的一个或多个关键词中的每个关键词在所述过去的网络信息中的出现频率;以及
根据与所述异常节点相关联的一个或多个关键词中的每个关键词在所述过去的网络信息中的出现频率和所述异常节点的预测误差,确定与所述异常节点相关联的一个或多个关键词中的每个关键词的影响因子。
附记6.根据附记4所述的方法,其中,所述基于所述一个或多个关键词中的每个关键词对所述负荷造成的影响来修正所述初步预测曲线的步骤包括:
确定所述一个或多个关键词中的每个关键词在所述当前的网络信息中的出现频率;以及
根据所述一个或多个关键词中的每个关键词在所述当前的网络信息中的所述出现频率和所述影响因子来修正所述初步预测曲线。
附记7.根据附记1所述的方法,在所述从搜集的过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词的步骤之前还包括对搜集的网络信息进行结构化,
其中,从结构化的、过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词;以及
在结构化的、当前的网络信息中查找所述一个或多个关键词。
附记8.根据附记7所述的方法,其中,所述对所述网络信息进行结构化的步骤包括:
将所述网络信息结构化为与所述负荷相关联的关键词、时间、地理位置以及所述关键词的出现频率。
附记9.根据附记8所述的方法,其中,所述将所述网络信息结构化为与所述负荷相关联的关键词、时间、地理位置以及所述关键词的出现频率的步骤包括:
搜集与所述负荷相关联的网页;
识别与所述网页相关联的地理位置和时间;
将所述网页中与所述负荷相关联的词汇确定为种子候选者,并将具有最高出现频率的所述种子候选者确定为种子;
对于特定时间和地理位置,将经常与所述种子同时出现的、且具有高词频逆文档频率的词汇确定为所述关键词;以及
基于所述关键词、所述时间、所述地理位置、以及所述关键词的所述出现频率对所述网络信息进行结构化。
附记10.根据附记1至9中任一项所述的方法,其中,所述负荷是电力负荷、燃气负荷、用水负荷和交通负荷之一。
附记11.根据附记1至9中任一项所述的方法,其中,
所述基于与所述负荷相关联的历史数据来预测粗略表示所述负荷的未来发展趋势的初步预测曲线的步骤紧邻在所述基于所述一个或多个关键词中的每个关键词对所述负荷造成的影响来修正所述初步预测曲线,以得到精确表示所述负荷的未来发展趋势的最终预测曲线的步骤之前;或者
所述基于与所述负荷相关联的历史数据来预测粗略表示所述负荷的未来发展趋势的初步预测曲线的步骤紧邻在基于与所述负荷相关联的历史数据来确定所述负荷发生过异常的异常节点的步骤之前。
附记12.一种对负荷进行预测的装置,包括:
曲线预测单元,被配置为基于与所述负荷相关联的历史数据来预测粗略表示所述负荷的未来发展趋势的初步预测曲线;
异常节点确定单元,被配置为基于与所述负荷相关联的历史数据来确定所述负荷发生过异常的异常节点;
关键词提取单元,被配置为从搜集的过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词;
关键词查找单元,被配置为在搜集的当前的网络信息中查找所述一个或多个关键词;以及
曲线修正单元,被配置为基于所述一个或多个关键词中的每个关键词对所述负荷造成的影响来修正所述初步预测曲线,以得到精确表示所述负荷的未来发展趋势的最终预测曲线。
附记13.根据附记12所述的装置,其中,所述曲线预测单元还被配置为基于与所述负荷相关联的历史数据来预测粗略表示所述负荷的过去预测发展趋势的过去预测曲线;
所述异常节点确定单元包括:
曲线比较子单元,被配置为对所述过去预测曲线和表示所述负荷的过去实际发展趋势的过去实际曲线进行比较以确定所述过去预测曲线上各点的预测误差;以及
异常节点确定子单元,被配置为将所述过去预测曲线上所述预测误差大于预定阈值的点确定为所述负荷发生过异常的所述异常节点。
附记14.根据附记13所述的装置,其中,所述异常节点是由时间和地理位置构成的二维节点。
附记15.根据附记13所述的装置,其中,所述关键词提取单元包括:
关键词查找子单元,被配置为在所述过去的网络信息中查找与所述异常节点相关联的一个或多个关键词;
影响因子确定子单元,被配置为确定与所述异常节点相关联的一个或多个关键词中的每个关键词的影响因子;以及
关键词提取子单元,被配置为根据所述影响因子的大小,从与所述异常节点相关联的一个或多个关键词中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词。
附记16.根据附记15所述的装置,其中,所述影响因子确定子单元包括:
出现频率确定部件,被配置为确定与所述异常节点相关联的一个或多个关键词中的每个关键词在所述过去的网络信息中的出现频率;以及
影响因子确定部件,被配置为根据与所述异常节点相关联的一个或多个关键词中的每个关键词在所述过去的网络信息中的出现频率和所述异常节点的预测误差,确定与所述异常节点相关联的一个或多个关键词中的每个关键词的影响因子。
附记17.根据附记15所述的装置,其中,所述曲线修正单元包括:
出现频率确定子单元,被配置为确定所述一个或多个关键词中的每个关键词在所述当前的网络信息中的出现频率;以及
曲线修正子单元,被配置为根据所述一个或多个关键词中的每个关键词在所述当前的网络信息中的所述出现频率和所述影响因子来修正所述初步预测曲线。
附记18.根据附记12所述的装置,还包括:网络信息结构化单元,被配置为对搜集的网络信息进行结构化,
其中,所述关键词提取单元被配置为从结构化的、过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词;以及
所述关键词查找单元被配置为在结构化的、当前的网络信息中查找所述一个或多个关键词。
附记19.根据附记13所述的装置,其中,所述网络信息结构化单元被配置为将所述网络信息结构化为与所述负荷相关联的关键词、时间、地理位置以及所述关键词的出现频率。
附记20.根据附记19所述的装置,其中,所述网络信息结构化单元包括:
网页搜集子单元,被配置为搜集与所述负荷相关联的网页;
位置时间识别子单元,被配置为识别与所述网页相关联的地理位置和时间;
种子确定子单元,被配置为将所述网页中与所述负荷相关联的词汇确定为种子候选者,并将具有最高出现频率的所述种子候选者确定为种子;
关键词确定子单元,被配置为对于特定时间和地理位置,将经常与所述种子同时出现的、且具有高词频逆文档频率的词汇确定为所述关键词;以及
网络信息结构化子单元,被配置为基于所述关键词、所述时间、所述地理位置、以及所述关键词的所述出现频率对所述网络信息进行结构化。
附记21.根据附记12至20中任一项所述的装置,其中,所述负荷是电力负荷、燃气负荷、用水负荷和交通负荷之一。
Claims (10)
1.一种对负荷进行预测的方法,包括:
基于与所述负荷相关联的历史数据来预测粗略表示所述负荷的未来发展趋势的初步预测曲线;
基于与所述负荷相关联的历史数据来确定所述负荷发生过异常的异常节点;
从搜集的过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词;
在搜集的当前的网络信息中查找所述一个或多个关键词;以及
基于所述一个或多个关键词中的每个关键词对所述负荷造成的影响来修正所述初步预测曲线,以得到精确表示所述负荷的未来发展趋势的最终预测曲线。
2.根据权利要求1所述的方法,其中,所述基于与所述负荷相关联的历史数据来确定所述负荷发生过异常的异常节点的步骤包括:
基于与所述负荷相关联的历史数据来预测粗略表示所述负荷的过去预测发展趋势的过去预测曲线;
对所述过去预测曲线和表示所述负荷的过去实际发展趋势的过去实际曲线进行比较以确定所述过去预测曲线上各点的预测误差;以及
将所述过去预测曲线上所述预测误差大于预定阈值的点确定为所述负荷发生过异常的所述异常节点。
3.根据权利要求2所述的方法,其中,所述异常节点是由时间和地理位置构成的二维节点。
4.根据权利要求2所述的方法,其中,所述从过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词的步骤包括:
在所述过去的网络信息中查找与所述异常节点相关联的一个或多个关键词;
确定与所述异常节点相关联的一个或多个关键词中的每个关键词的影响因子;以及
根据所述影响因子的大小,从与所述异常节点相关联的一个或多个关键词中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词。
5.根据权利要求4所述的方法,其中,所述确定与所述异常节点相关联的一个或多个关键词中的每个关键词的影响因子的步骤包括:
确定与所述异常节点相关联的一个或多个关键词中的每个关键词在所述过去的网络信息中的出现频率;以及
根据与所述异常节点相关联的一个或多个关键词中的每个关键词在所述过去的网络信息中的出现频率和所述异常节点的预测误差,确定与所述异常节点相关联的一个或多个关键词中的每个关键词的影响因子。
6.根据权利要求4所述的方法,其中,所述基于所述一个或多个关键词中的每个关键词对所述负荷造成的影响来修正所述初步预测曲线的步骤包括:
确定所述一个或多个关键词中的每个关键词在所述当前的网络信息中的出现频率;以及
根据所述一个或多个关键词中的每个关键词在所述当前的网络信息中的所述出现频率和所述影响因子来修正所述初步预测曲线。
7.根据权利要求1所述的方法,在所述从搜集的过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词的步骤之前还包括对搜集的网络信息进行结构化,
其中,从结构化的、过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词;以及
在结构化的、当前的网络信息中查找所述一个或多个关键词。
8.根据权利要求7所述的方法,其中,所述对所述网络信息进行结构化的步骤包括:
将所述网络信息结构化为与所述负荷相关联的关键词、时间、地理位置以及所述关键词的出现频率。
9.根据权利要求8所述的方法,其中,所述将所述网络信息结构化为与所述负荷相关联的关键词、时间、地理位置以及所述关键词的出现频率的步骤包括:
搜集与所述负荷相关联的网页;
识别与所述网页相关联的地理位置和时间;
将所述网页中与所述负荷相关联的词汇确定为种子候选者,并将具有最高出现频率的所述种子候选者确定为种子;
对于特定时间和地理位置,将经常与所述种子同时出现的、且具有高词频逆文档频率的词汇确定为所述关键词;以及
基于所述关键词、所述时间、所述地理位置、以及所述关键词的所述出现频率对所述网络信息进行结构化。
10.一种对负荷进行预测的装置,包括:
曲线预测单元,被配置为基于与所述负荷相关联的历史数据来预测粗略表示所述负荷的未来发展趋势的初步预测曲线;
异常节点确定单元,被配置为基于与所述负荷相关联的历史数据来确定所述负荷发生过异常的异常节点;
关键词提取单元,被配置为从搜集的过去的网络信息中提取与所述异常节点相关联并影响所述负荷的一个或多个关键词;
关键词查找单元,被配置为在搜集的当前的网络信息中查找所述一个或多个关键词;以及
曲线修正单元,被配置为基于所述一个或多个关键词中的每个关键词对所述负荷造成的影响来修正所述初步预测曲线,以得到精确表示所述负荷的未来发展趋势的最终预测曲线。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110270387.9A CN102968669B (zh) | 2011-08-31 | 2011-08-31 | 对负荷进行预测的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110270387.9A CN102968669B (zh) | 2011-08-31 | 2011-08-31 | 对负荷进行预测的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102968669A true CN102968669A (zh) | 2013-03-13 |
CN102968669B CN102968669B (zh) | 2015-11-25 |
Family
ID=47798800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110270387.9A Expired - Fee Related CN102968669B (zh) | 2011-08-31 | 2011-08-31 | 对负荷进行预测的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102968669B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103279810A (zh) * | 2013-06-09 | 2013-09-04 | 重庆大学 | 基于预测误差收敛性检验和轨迹修正的短期负荷预测方法 |
CN104156787A (zh) * | 2014-08-18 | 2014-11-19 | 国家电网公司 | 一种基于不同负荷特性的电力分区负荷预测方法 |
CN104766175A (zh) * | 2015-04-16 | 2015-07-08 | 东南大学 | 一种基于时间序列分析的电力系统异常数据辨识与修正方法 |
CN110031917A (zh) * | 2019-04-03 | 2019-07-19 | 殷健 | 一种雨情监测方法 |
WO2019178974A1 (zh) * | 2018-03-23 | 2019-09-26 | 北京金风慧能技术有限公司 | 风力发电机叶片的疲劳损伤监测方法、电子设备和存储介质 |
CN111475536A (zh) * | 2019-01-23 | 2020-07-31 | 百度在线网络技术(北京)有限公司 | 基于搜索引擎的数据分析方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101118560A (zh) * | 2006-08-03 | 2008-02-06 | 株式会社东芝 | 关键词输出设备和关键词输出方法 |
CN101159968A (zh) * | 2007-11-19 | 2008-04-09 | 河北全通通信有限公司 | Gms移动网络扩容精算方法 |
CN102073785A (zh) * | 2010-11-26 | 2011-05-25 | 哈尔滨工程大学 | 基于广义动态模糊神经网络的燃气日负荷组合预报方法 |
-
2011
- 2011-08-31 CN CN201110270387.9A patent/CN102968669B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101118560A (zh) * | 2006-08-03 | 2008-02-06 | 株式会社东芝 | 关键词输出设备和关键词输出方法 |
CN101159968A (zh) * | 2007-11-19 | 2008-04-09 | 河北全通通信有限公司 | Gms移动网络扩容精算方法 |
CN102073785A (zh) * | 2010-11-26 | 2011-05-25 | 哈尔滨工程大学 | 基于广义动态模糊神经网络的燃气日负荷组合预报方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103279810A (zh) * | 2013-06-09 | 2013-09-04 | 重庆大学 | 基于预测误差收敛性检验和轨迹修正的短期负荷预测方法 |
CN103279810B (zh) * | 2013-06-09 | 2016-09-07 | 重庆大学 | 基于预测误差收敛性检验和轨迹修正的短期负荷预测方法 |
CN104156787A (zh) * | 2014-08-18 | 2014-11-19 | 国家电网公司 | 一种基于不同负荷特性的电力分区负荷预测方法 |
CN104766175A (zh) * | 2015-04-16 | 2015-07-08 | 东南大学 | 一种基于时间序列分析的电力系统异常数据辨识与修正方法 |
WO2019178974A1 (zh) * | 2018-03-23 | 2019-09-26 | 北京金风慧能技术有限公司 | 风力发电机叶片的疲劳损伤监测方法、电子设备和存储介质 |
CN111475536A (zh) * | 2019-01-23 | 2020-07-31 | 百度在线网络技术(北京)有限公司 | 基于搜索引擎的数据分析方法和装置 |
CN111475536B (zh) * | 2019-01-23 | 2023-10-17 | 百度在线网络技术(北京)有限公司 | 基于搜索引擎的数据分析方法和装置 |
CN110031917A (zh) * | 2019-04-03 | 2019-07-19 | 殷健 | 一种雨情监测方法 |
CN110031917B (zh) * | 2019-04-03 | 2021-06-18 | 殷健 | 一种雨情监测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102968669B (zh) | 2015-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | Prediction of bus travel time using random forests based on near neighbors | |
Li et al. | Fine-grained location extraction from tweets with temporal awareness | |
CN102968669B (zh) | 对负荷进行预测的方法和装置 | |
Tselentis et al. | Improving short‐term traffic forecasts: to combine models or not to combine? | |
Kim et al. | Selective disassembly sequencing with random operation times in parallel disassembly environment | |
US20130151536A1 (en) | Vertex-Proximity Query Processing | |
CN105447038A (zh) | 用于获取用户特征的方法和系统 | |
CN110968654A (zh) | 文本数据的地址类目确定方法、设备以及系统 | |
CN116881675B (zh) | 一种基于贝叶斯算法的电力设备状态监测方法 | |
CN115017425B (zh) | 地点检索方法、装置、电子设备以及存储介质 | |
CN104951478A (zh) | 信息处理方法和信息处理装置 | |
Li et al. | Extracting fine‐grained location with temporal awareness in tweets: A two‐stage approach | |
KR102457359B1 (ko) | 뉴럴 네트워크를 이용하는 마케팅 비용 효율 산정 방법 및 상기 마케팅 비용 효율 산정 방법을 수행하는 전자 시스템 | |
CN114417192B (zh) | 更新兴趣点poi状态的方法、装置、设备、介质及产品 | |
CN112925900A (zh) | 搜索信息处理方法、装置、设备及存储介质 | |
CN117992743A (zh) | 一种基于知识图谱的电网故障智能分析与处置方法及系统 | |
US8990170B2 (en) | Method and apparatus for detecting an address update | |
CN117767250A (zh) | 基于故障监测的直流微电网协调控制方法及系统 | |
CN116628346A (zh) | 搜索词推荐模型的训练方法及装置 | |
CN111221849A (zh) | 一种卫星故障定位方法、装置、终端及计算机可读介质 | |
CN106651408A (zh) | 一种数据分析方法及装置 | |
Kharista et al. | The performance of GM (1, 1) and ARIMA for forecasting of foreign tourists visit to Indonesia | |
CN113807091B (zh) | 词语挖掘方法、装置、电子设备和可读存储介质 | |
CN105408896A (zh) | 信息管理装置和信息管理方法 | |
Wang et al. | [Retracted] Design of an Underground Transmission Line Condition Fault Monitoring System for Power Grids Based on Data Analysis Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151125 Termination date: 20180831 |
|
CF01 | Termination of patent right due to non-payment of annual fee |