CN113052256B

CN113052256B - 一种风向聚类方法、装置及电子设备

Info

Publication number: CN113052256B
Application number: CN202110389384.0A
Authority: CN
Inventors: 胡阳; 李倩; 房方; 郭小江; 王庆华; 刘吉臻
Original assignee: North China Electric Power University; Huaneng Group Technology Innovation Center Co Ltd
Current assignee: North China Electric Power University; Huaneng Group Technology Innovation Center Co Ltd
Priority date: 2021-04-12
Filing date: 2021-04-12
Publication date: 2022-07-19
Anticipated expiration: 2041-04-12
Also published as: CN113052256A

Abstract

本发明提供了一种风向聚类方法、装置及电子设备，其中，该方法包括：获取风电场各风机的周期性风向数据；根据周期性风向数据确定适用于周期性风向数据的相似性度量指标；基于相似性度量指标，选出k个聚类中心，并将周期性风向数据划为k个簇；基于周期性风向数据确定误差平方和准则函数；基于误差平方和准则函数对k个簇的聚类效果进行评价，确定最终聚类效果。其中，通过周期性风向数据确定适用于周期性风向数据的相似性度量指标与误差平方和准则函数，解决了传统K‑means算法不适用于周期性风向数据聚类的缺点，保证了聚类结果的可靠性和真实性，并且根据聚类结果可以获得可靠合理的风扇划分，避免了人为划分扇区的主观性。

Description

一种风向聚类方法、装置及电子设备

技术领域

本发明涉及数据聚类技术领域，具体而言，涉及一种风向聚类方法、装置及电子设备。

背景技术

目前，我国风力发电正处于快速且稳步发展的时期，然而，风能具有随机性和波动性，造成了风电场输出功率具有较大的不确定性。现有研究主要集中在风速特征对风电出力的影响，而风向也是影响风电出力的重要因素。在研究风向因素时，为了避免人为划分扇区具有一定主观性的缺点，采用聚类算法，对风机数据采集与监控系统所记录的风向数据进行聚类，并依据聚类结果划分风向扇区。

现有技术中常用的聚类算法有K-means聚类，K-means算法是一种十分基础的无监督聚类算法，但对于风向数据而言，传统的k-means聚类无法获得较好的聚类效果。由于大气的不可压缩流动性和惯性，导致了风向数据的周期性，对风向数据进行采样统计时发现，在一定时间尺度范围内，风向会在一定范围内来回摆动，由于风向数据的周期性，经过连续时间序列采样后的风向数据，总是以不同的频率出现在区间[0，360]内，而在风向频率统计图上，风向5°和风向355°之间只相差了10°，而不是两者直接相减，这导致K-means算法原本定义的计算样本间相似性的距离度量指标在对周期性的风向数据进行聚类计算时不再适用。

基于此，亟需改进现有的K-means算法以适用对周期性风向数据的聚类，从而获得较好的风向数据聚类效果。

发明内容

有鉴于此，本发明的目的在于提供一种风向聚类方法、装置以及电子设备，能够通过风向变化角度确定相似度量指标与误差平方和准则函数，解决传统聚类算法不适用于对周期性风向数据进行聚类的缺点。

第一方面，本发明实施例提供了一种风向聚类方法，方法包括：

获取风电场各风机的周期性风向数据，周期性风向数据表征风电场各风机的历史运行数据；根据周期性风向数据确定适用于周期性风向数据的相似性度量指标；基于相似性度量指标，选出k个聚类中心，并将周期性风向数据划为k个簇；基于周期性风向数据确定误差平方和准则函数，其中，误差平方和准则函数适用于评价周期性风向数据的聚类效果；基于误差平方和准则函数对k个簇的聚类效果进行评价，确定最终聚类效果。

优选地，获取风电场各风机的周期性风向数据的步骤，包括：按照预设的采样时间采集风电场各风机的风向数据；存储风向数据，将存储的风向数据作为周期性风向数据。

优选地，聚类中心的数量k不少于2类，并且，聚类中心的数量k不大于8类。

优选地，根据周期性风向数据确定适用于周期性风向数据的相似性度量指标，包括：基于周期性风向数据，确定风向变化角度；基于风向变化角度，确定周期性风向数据中风向样本之间的相似性度量指标；基于相似性度量指标，选出k个聚类中心，包括：在周期性风向数据中选择一个目标风向样本作为初始聚类中心；计算周期性风向数据中除目标风向样本之外的其余风向样本与初始聚类中心之间的相似性度量指标；依次计算每个风向样本被选为下一个聚类中心的概率，依据轮盘赌算法选出下一个聚类中心，计算周期性风向数据中除目标风向样本之外的其余风向样本与下一个聚类中心之间的相似性度量指标；直到选出k个聚类中心。

优选地，周期性风向数据集合X为：

其中，x_i＝{x_i1,x_i2,…,x_ip}，x_i∈X，x_i表示第i台风机采集的风向样本，X为n×p维数据，n表示n台风机，p表示共有p个采样时刻风向数据。

基于周期性风向数据，确定风向变化角度包括：

通过下述算式计算风向变化角度D_im：

其中，x_im∈x_i，x_jm∈x_j，x_im表示第i台风机在第m时刻采集的风向样本，x_jm表示第j台风机在第m时刻采集的风向样本。

优选地，根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标，包括：

通过下述算式计算相似性度量指标D(x_i,x_j)：

其中，D_im表示第i台风机和第j台风机在第m时刻采集的两个风向样本之间的风向变化角度。

优选地，在基于相似性度量指标，选出k个聚类中心之后，方法还包括：

通过下述步骤计算聚类中心：计算周期性风向数据中各风向样本到k个聚类中心之间的相似性度量指标D(x_i,x_j)，将风向样本归属到与聚类中心相似性度量指标最小的簇内，完成对周期性风向数据的聚类，得到k个簇；计算每个簇内所有风向样本的均值，并将该均值作为新的聚类中心；

重复执行步骤计算聚类中心的步骤，直至聚类中心不再变化，得到聚类结果。

优选地，基于误差平方和准则函数对k个簇的聚类效果进行评价，确定最终聚类效果包括：

通过下述算式计算误差平方和准则：

其中，D_im表示第i个簇内第m个风向样本到簇内聚类中心的风向变化角度，i＝1,2,...,k，m＝1,2,...,l，k表示共有k个簇，l表示第k个簇内除聚类中心外其余风向样本的个数。

根据误差平方和的大小，评价不同聚类数下对周期性风向数据的聚类效果，确定最终聚类效果。

第二方面，本发明实施例还提供了一种风向聚类装置，装置包括：

数据获取模块，用于获取风电场各风机的周期性风向数据，周期性风向数据表征风电场各风机的历史运行数据；

指标确定模块，用于根据周期性风向数据确定适用于周期性风向数据的相似性度量指标；

数据划分模块，用于基于相似性度量指标，选出k个聚类中心，并将周期性风向数据划为k个簇；

函数确定模块，用于基于周期性风向数据确定误差平方和准则函数，其中，误差平方和准则函数适用于评价周期性风向数据的聚类效果；

效果确定模块，用于基于误差平方和准则函数对k个簇的聚类效果进行评价，确定最终聚类效果。

第三方面，本发明实施例还提供一种电子设备，包括：处理器、存储器和总线，存储器存储有处理器可执行的机器可读指令，当电子设备运行时，处理器与存储器之间通过总线通信，机器可读指令被处理器执行时执行如上述的风向聚类方法的步骤。

第四方面，本发明实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上述的风向聚类方法的步骤。

本发明实施例带来了以下有益效果：

本发明实施例提供的风向聚类方法、装置以及电子设备，其中方法包括：获取风电场各风机的周期性风向数据，周期性风向数据表征风电场各风机的历史运行数据；根据周期性风向数据确定适用于周期性风向数据的相似性度量指标；基于相似性度量指标，选出k个聚类中心，并将周期性风向数据划为k个簇；基于周期性风向数据确定误差平方和准则函数，其中，误差平方和准则函数适用于评价周期性风向数据的聚类效果；基于误差平方和准则函数对k个簇的聚类效果进行评价，确定最终聚类效果。其中，通过周期性风向数据确定适用于周期性风向数据的相似性度量指标与误差平方和准则函数，解决了传统K-means算法不适用于周期性风向数据聚类的缺点，保证了聚类结果的可靠性和真实性，并且根据聚类结果可以获得可靠合理的风扇划分，避免了人为划分扇区的主观性。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例所提供的一种风向聚类方法的流程图；

图2为本发明实施例所提供的另一种风向聚类方法的流程图；

图3为本发明实施例所提供的一种聚类个数与误差平方和关系图；

图4为本发明实施例所提供的一种风向数据聚类后风向频率统计图；

图5为本发明实施例所提供的一种风向聚类装置的结构示意图；

图6为本发明实施例所提供的另一种风向聚类装置的结构示意图；

图7为本发明实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例，都属于本发明保护的范围。

目前，常用的聚类算法有K-means聚类算法，K-means算法是一种十分基础的无监督聚类算法，其基本思想是：随机选取数据样本中的k个点作为初始聚类中心，基于样本间相似程度进行聚类，采用误差平方和作为指标衡量聚类效果。通过K-means聚类后，将样本数据分为k个互斥簇，同一簇内的数据样本相似性高，不同簇内的数据样本相似性低。K-means采用距离度量作为相似性指标，常用欧几里得距离和余弦相似度来评价样本内不同个体的间差异的大小，即距离度量指标越大，个体间差异越大。

但对于风向数据而言，传统的k-means聚类无法获得较好的聚类效果。由于大气的不可压缩流动性和惯性，导致了风向数据的周期性，对风向数据进行采样统计时发现，在一定时间尺度范围内，风向会在一定范围内来回摆动，由于风向数据的周期性，经过连续时间序列采样后的风向数据，总是以不同的频率出现在区间[0，360]内，而在风向频率统计图上，风向5°和风向355°之间只相差了10°，而不是两者直接相减，这导致K-means算法原本定义的计算样本间相似性的距离度量指标在对周期性的风向数据进行聚类计算时不再适用。

基于此，本发明实施例提供了一种风向聚类方法，以解决传统聚类算法不适用于对周期性风向数据进行聚类的缺点，并提高聚类效果的可靠性与真实性。

实施例1

请参阅图1，图1为本发明实施例所提供的一种风向聚类方法的流程图。所如图1中所示，本发明实施例提供的风向聚类方法，包括：

S110、获取风电场各风机的周期性风向数据，周期性风向数据表征风电场各风机的历史运行数据；

本实施例中的风机可以指风电场中的风力发电机。具体地，上述周期性风向数据为风电场各风机按照预设的采样时间采集的风向数据。例如，上述风向数据可以为风的速度、风的方向等。

其中，预设的采样时间可以是一天内指定的时间段，比如上午六点到七点，记录当前时间段内各风机采集到的风向数据。

S120、根据周期性风向数据确定适用于周期性风向数据的相似性度量指标；

具体地，本实施例中的相似性度量指标是一种适用于计算周期性数据间距离的具有创新性的度量指标。

基于周期性风向数据定义风向变化角度，风向变化角度表示风电场不同风机在同一时刻采集到的风向样本之间的风向角度变化情况，再根据定义的风向变化角度，确定不同风机在同一时刻下采集的风向样本的相似性度量指标。本实施例中的风向变化角度是对任意两个风向样本之间的差值进行处理，化为符合周期数据特点的差值数据，相似性度量指标用于综合评定周期性风向数据中风向样本之间相似程度，可以是相似系数函数或者距离函数。

S130、基于所述相似性度量指标，选出k个聚类中心，并将所述周期性风向数据划为k个簇；

具体地，在周期性风向数据中选择一个目标风向样本作为初始聚类中心，计算周期性风向数据中除目标风向样本之外其余各风向样本与初始聚类中心之间的相似性度量指标，依次计算每个风向样本被选为聚类中心的概率，依据轮盘赌算法选出下一个聚类中心，计算所述周期性风向数据中除所述目标风向样本之外的其余风向样本与下一个聚类中心之间的相似性度量指标，直到选出k个聚类中心，并将周期性风向数据中所有风向样本划分为k个簇。

S140、基于所述周期性风向数据确定误差平方和准则函数，其中，所述误差平方和准则函数适用于评价所述周期性风向数据的聚类效果；

具体地，本实施例中的误差平方和准则函数是一种适用于评价周期性风向数据聚类效果的具有创新性的评价指标。基于周期性风向数据，确定每个簇中各个风向样本与簇内聚类中心之间的风向变化角度，再根据风向变化角度确定误差平方和准则函数。

S150、基于误差平方和准则函数对k个簇的聚类效果进行评价，确定最终聚类效果。

例如，基于风向变化角度确定误差平方和准则函数，在选出k个聚类中心后，此时聚类数为k，根据改进后的k-means算法对周期性风向数据进行聚类，得到聚类结果，计算在聚类数为k时误差平方和值的大小，根据误差平方和值的大小，对聚类效果进行评价，误差平方和的值越小表示在此聚类数下对周期性风向数据进行聚类的效果越好，可以选择不同的聚类数k值，根据预设的误差平方和准则函数，对聚类效果进行评价，得到最终的聚类效果。

本发明实施例提供的一种风向聚类方法，方法包括：获取风电场各风机的周期性风向数据，周期性风向数据表征风电场各风机的历史运行数据；根据周期性风向数据确定适用于周期性风向数据的相似性度量指标；基于相似性度量指标，选出k个聚类中心，并将周期性风向数据划为k个簇；基于周期性风向数据确定误差平方和准则函数，其中，误差平方和准则函数适用于评价周期性风向数据的聚类效果；基于误差平方和准则函数对k个簇的聚类效果进行评价，确定最终聚类效果。其中，通过周期性风向数据确定适用于周期性风向数据的相似性度量指标与误差平方和准则函数，解决了传统K-means算法不适用于周期性风向数据聚类的缺点，保证了聚类结果的可靠性和真实性，并且根据聚类结果可以获得可靠合理的风扇划分，避免了人为划分扇区的主观性，依据聚类结果到各个风向扇区划分，对风电场功率曲线(Wind Farmer Power Curve，WFPC)建模以及后续的风电场功率预测、状态检测、故障预警等研究工作具有重要指导意义。

在本发明实施例中，作为一种优选的实施例，步骤S110通过以下步骤获取风电场各风机的周期性风向数据，包括：

按照预设的采样时间采集风电场各风机的风向数据；

存储所述风向数据，将存储的所述风向数据作为周期性风向数据。

在本发明实施例中，作为一种优选的实施例，聚类中心的数量k不少于2类，并且，所述聚类中心的数量k不大于8类。

在本发明实施例中，作为一种优选的实施例，步骤S120通过以下步骤根据周期性风向数据确定适用于周期性风向数据的相似性度量指标，包括：

基于所述周期性风向数据，确定风向变化角度；

基于所述风向变化角度，确定所述周期性风向数据中风向样本之间的相似性度量指标。

步骤S120通过以下步骤基于相似性度量指标，选出k个聚类中心，包括：在所述周期性风向数据中选择一个目标风向样本作为初始聚类中心；

计算所述周期性风向数据中除所述目标风向样本之外的其余风向样本与初始聚类中心之间的相似性度量指标；

依次计算每个风向样本被选为下一个聚类中心的概率，依据轮盘赌算法选出下一个聚类中心，计算所述周期性风向数据中除所述目标风向样本之外的其余风向样本与下一个聚类中心之间的相似性度量指标；

直到选出k个聚类中心。

在本发明实施例中，作为一种优选的实施例，步骤S110中的周期性风向数据集合X可以表示为：

基于所述周期性风向数据，确定风向变化角度包括：

通过下述算式计算风向变化角度D_im：

在本发明实施例中，作为一种优选的实施例，所述根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标，包括：

通过下述算式计算相似性度量指标D(x_i,x_j)：

在本发明实施例中，作为一种优选的实施例，在所述基于相似性度量指标，选出k个聚类中心之后，所述方法还包括：

通过下述步骤计算聚类中心：计算所述周期性风向数据中各风向样本到k个聚类中心之间的相似性度量指标D(x_i,x_j)，将所述风向样本归属到与聚类中心相似性度量指标最小的簇内，完成对所述周期性风向数据的聚类，得到k个簇；计算每个簇内所有风向样本的均值，并将该均值作为新的聚类中心；

重复执行所述步骤计算聚类中心的步骤，直至所述聚类中心不再变化，获取聚类结果。

在本发明实施例中，作为一种优选的实施例，基于误差平方和准则函数对k个簇的聚类效果进行评价，确定最终聚类效果包括：

通过下述算式计算误差平方和准则：

根据所述误差平方和的大小，评价不同聚类数下对所述周期性风向数据的聚类效果，确定最终聚类效果。

实施例2

请参阅图2，图2为本发明实施例所提供的另一种风向聚类方法的流程图。如图2中所示，本发明实施例提供的另一种风向聚类方法，包括：

S210、根据周期性风向数据确定适用于周期性风向数据的相似性度量指标；

S220、基于相似性度量指标，选出k个聚类中心；

S230、通过下述步骤计算聚类中心：计算周期性风向数据中各风向样本到k个聚类中心之间的相似性度量指标，将风向样本归属到与聚类中心相似性度量指标最小的簇内，完成对周期性风向数据的聚类，得到k个簇；计算每个簇内所有风向样本的均值，并将该均值作为新的聚类中心；

具体地，计算周期性风向数据中各风向样本与聚类中心之间的相似性度量指标，相似性度量指标越小表示样本间差异越小，反之，相似性指标越大表示样本间差异越大，将周期性风向数据中除k个聚类中心外的其余风向样本归属到与聚类中心之间相似性度量指标最小的簇内，完成对周期性风向数据中所有风向样本的聚类，并得到k个簇，再计算每个簇内风向样本的均值，将得到的结果作为该簇新的聚类中心。

S240、重复执行所述步骤计算聚类中心的步骤，直至所述聚类中心不再变化，得到聚类结果。

具体地，重复对周期性风向数据中的风向样本划分为k个簇，计算每个簇内的所有风向样本的均值，并将该均值作为该簇的聚类中心，当每个簇内的聚类中心不在变化时，完成对周期性风向数据进行k个聚类数的聚类，并得到聚类结果。

其中，S210至S220的描述可以参照S120至S130的描述，并且能达到相同的技术效果，对此不做赘述。

本发明实施例提供的一种风向聚类方法，该方法包括：获取风电场各风机的周期性风向数据，所述周期性风向数据表征所述风电场各风机的历史运行数据；根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标；基于所述相似性度量指标，选出k个聚类中心；通过下述步骤计算聚类中心：计算所述周期性风向数据中各风向样本到k个聚类中心之间的相似性度量指标D(x_i,x_j)，将所述风向样本归属到与聚类中心相似性度量指标最小的簇内，完成对所述周期性风向数据的聚类，得到k个簇；计算每个簇内所有风向样本的均值，并将该均值作为新的聚类中心；重复执行所述步骤计算聚类中心的步骤，直至所述聚类中心不再变化，获取聚类结果，并将所述周期性风向数据划为k个簇；基于所述周期性风向数据确定误差平方和准则函数，其中，所述误差平方和准则函数适用于评价所述周期性风向数据的聚类效果；基于所述误差平方和准则函数对所述k个簇的聚类效果进行评价，确定最终聚类效果。其中，通过重复计算周期性风向数据中风向向本与聚类中心之间的相似性度量指标，对周期性风向数据进行划分，再计算每个簇内风向样本的均值，将该均值作为新的聚类中心，直到聚类中心不在发生变化，进而优化聚类中心，提升对周期性风向数据进行聚类的效果。

请参阅图3、图4，图3为本发明实施例所提供的一种聚类个数与误差平方和关系图，图4为本发明实施例所提供的一种风向数据聚类后风向频率统计图。

如图3所示，可以明显看出适用于评价周期性风向数据聚类效果的误差平方和准则函数与聚类数k的关系，随着每个簇聚合程度的提高，误差平方和(SSE*)会变小，且当聚类个数趋近于真实聚类数时，误差平方和(SSE*)的下降幅度会骤减，然后随着k的增大而趋于平缓，当k等于3时，聚类效果最佳。

依据周期性风向数据聚类结果，周期性风向数据被分为3类，根据聚类结果返回的idx找到风向数据对应的风速，建立风向玫瑰图对风向扇区进行划分，选取某风机风向数据聚类结果进行展示，风机总的风向数据统计结果及各扇区划分后风向数据统计情况如图4所示，改进后的k-means算法可以获得可观可靠的风向扇区划分，避免了认为划分扇区的主观性。

实施例3

请参阅图5、图6，图5为本发明实施例所提供的一种风向聚类装置的结构示意图，图6为本发明实施例所提供的另一种风向聚类装置的结构示意图。如图5中所示，所述风向聚类装置包括：数据获取模块520、指标确定模块530、数据划分模块540、函数确定模块550以及效果确定模块560；

所述数据获取模块520，用于获取风电场各风机的周期性风向数据，周期性风向数据表征所述风电场各风机的历史运行数据；

所述指标确定模块530，用于根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标；

所述数据划分模块540，用于基于所述相似性度量指标，选出k个聚类中心，并将所述周期性风向数据划分为k个簇；

函数确定模块550，用于基于所述周期性风向数据确定误差平方和准则函数，其中，所述误差平方和准则函数适用于评价所述周期性风向数据的聚类效果；

所述效果确定模块560，用于基于所述误差平方和准则函数对所述k个簇的聚类效果进行评价，确定最终聚类效果。

本发明实施例提供的风向聚类装置，该装置包括：数据获取模块520、指标确定模块530、数据划分模块540、函数确定模块550以及效果确定模块560；数据获取模块520，用于获取风电场各风机的周期性风向数据，周期性风向数据表征风电场各风机的历史运行数据；指标确定模块530，用于根据周期性风向数据确定适用于周期性风向数据的相似性度量指标；数据划分模块540，用于基于相似性度量指标，选出k个聚类中心，并将周期性风向数据划分为k个簇；函数确定模块550，用于基于所述周期性风向数据确定误差平方和准则函数，其中，所述误差平方和准则函数适用于评价所述周期性风向数据的聚类效果；效果确定模块560，用于基于误差平方和准则函数对k个簇的聚类效果进行评价，确定最终聚类效果。其中，通过周期性风向数据确定适用于周期性风向数据的相似性度量指标与误差平方和准则函数，解决了传统K-means算法不适用于周期性风向数据聚类的缺点，保证了聚类结果的可靠性和真实性，并且根据聚类结果可以获得可靠合理的风扇划分，避免了人为划分扇区的主观性，依据聚类结果到各个风向扇区划分，对风电场功率曲线(Wind Farmer PowerCurve，WFPC)建模以及后续的风电场功率预测、状态检测、故障预警等研究工作具有重要指导意义。

优选地，数据获取模块520具体用于：

通过以下步骤获取风电场各风机的周期性风向数据，包括：

按照预设的采样时间采集风电场各风机的风向数据；

优选地，指标确定模块530具体用于：

通过以下步骤根据周期性风向数据确定适用于周期性风向数据的相似性度量指标，包括：

基于所述周期性风向数据，确定风向变化角度；

优选地，数据划分模块540具体用于：

通过以下步骤基于相似性度量指标，选出k个聚类中心，包括：在所述周期性风向数据中选择一个目标风向样本作为初始聚类中心；

直到选出k个聚类中心。

优选地，聚类中心的数量k不少于2类，并且，所述聚类中心的数量k不大于8类。

进一步的，如图6所示，所述风向聚类装置还包括：

结果获取模块545，用于通过下述步骤计算聚类中心：计算所述周期性风向数据中各风向样本到k个聚类中心之间的相似性度量指标D(x_i,x_j)，将所述风向样本归属到与聚类中心相似性度量指标最小的簇内，完成对所述周期性风向数据的聚类，得到k个簇；计算每个簇内所有风向样本的均值，并将该均值作为新的聚类中心；重复执行所述步骤计算聚类中心的步骤，直至所述聚类中心不再变化，获取聚类结果。

实施例4

请参阅图7，图7为本发明实施例所提供的一种电子设备的结构示意图。如图7中所示，电子设备700包括处理器710、存储器720和总线730。

存储器720存储有处理器710可执行的机器可读指令，当电子设备700运行时，处理器710与存储器720之间通过总线730通信，机器可读指令被处理器710执行时，可以执行如上述图1以及图2所示方法实施例中的一种风向聚类方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

本发明实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的一种风向聚类方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种风向聚类方法，其特征在于，包括：

获取风电场各风机的周期性风向数据，所述周期性风向数据表征所述风电场各风机的历史运行数据；

根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标；

基于所述相似性度量指标，选出k个聚类中心，并将所述周期性风向数据划为k个簇；

基于所述周期性风向数据确定误差平方和准则函数，其中，所述误差平方和准则函数适用于评价所述周期性风向数据的聚类效果；

基于所述误差平方和准则函数对所述k个簇的聚类效果进行评价，确定最终聚类效果；

其中，所述根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标，包括：

通过下述算式计算相似性度量指标D(x_i,x_j)：

2.根据权利要求1所述的方法，其特征在于，获取风电场各风机的周期性风向数据的步骤，包括：

按照预设的采样时间采集风电场各风机的风向数据；

3.根据权利要求1所述的方法，其特征在于，所述聚类中心的数量k不少于2类，并且，所述聚类中心的数量k不大于8类。

4.根据权利要求1所述的方法，其特征在于，所述根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标，包括：

基于所述周期性风向数据，确定风向变化角度；

基于所述风向变化角度，确定所述周期性风向数据中风向样本之间的相似性度量指标；

所述基于所述相似性度量指标，选出k个聚类中心，包括：在所述周期性风向数据中选择一个目标风向样本作为初始聚类中心；

直到选出k个聚类中心。

5.根据权利要求4所述的方法，其特征在于，所述周期性风向数据集合X为：

其中，x_i＝{x_i1,x_i2,…,x_ip}，x_i∈X，x_i表示第i台风机采集的风向样本，X为n×p维数据，n表示n台风机，p表示共有p个采样时刻风向数据；

所述基于所述周期性风向数据，确定风向变化角度包括：

通过下述算式计算风向变化角度D_im：

6.根据权利要求1所述的方法，其特征在于，在所述基于所述相似性度量指标，选出k个聚类中心之后，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述基于所述误差平方和准则函数对所述k个簇的聚类效果进行评价，确定最终聚类效果包括：

通过下述算式计算误差平方和准则：

其中，D_im表示第i个簇内第m个风向样本到簇内聚类中心的风向变化角度，i＝1,2,...,k，m＝1,2,...,l，k表示共有k个簇，l表示第k个簇内除聚类中心外其余风向样本的个数；

8.一种风向聚类装置，其特征在于，所述装置包括：

数据获取模块，用于获取风电场各风机的周期性风向数据，所述周期性风向数据表征所述风电场各风机的历史运行数据；

指标确定模块，用于根据所述周期性风向数据确定适用于周期性风向数据的相似性度量指标；

数据划分模块，用于基于所述相似性度量指标，选出k个聚类中心，并将所述周期性风向数据划为k个簇；

函数确定模块，用于基于所述周期性风向数据确定误差平方和准则函数，其中，所述误差平方和准则函数适用于评价所述周期性风向数据的聚类效果；

效果确定模块，用于基于所述误差平方和准则函数对所述k个簇的聚类效果进行评价，确定最终聚类效果；

其中，所述指标确定模块，还用于：

通过下述算式计算相似性度量指标D(x_i,x_j)：

9.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述处理器执行所述机器可读指令，以执行如权利要求1至7任一所述风向聚类方法的步骤。