CN106326264A - 聚类设备和方法 - Google Patents

聚类设备和方法 Download PDF

Info

Publication number
CN106326264A
CN106326264A CN201510372135.5A CN201510372135A CN106326264A CN 106326264 A CN106326264 A CN 106326264A CN 201510372135 A CN201510372135 A CN 201510372135A CN 106326264 A CN106326264 A CN 106326264A
Authority
CN
China
Prior art keywords
monitoring point
monitoring
data
rank
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510372135.5A
Other languages
English (en)
Other versions
CN106326264B (zh
Inventor
张霓
胡卫松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to CN201510372135.5A priority Critical patent/CN106326264B/zh
Publication of CN106326264A publication Critical patent/CN106326264A/zh
Application granted granted Critical
Publication of CN106326264B publication Critical patent/CN106326264B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

提供了一种聚类设备,包括:获取单元,被配置为获取监测点的监测数据,所述监测数据是时空数据;划分单元,被配置为从所获取的监测数据中选取目标数据,并对选取的目标数据划分级别;构造单元,被配置为根据划分级别后的目标数据来构造聚类参数;以及确定单元,被配置为根据聚类参数来确定监测点的类别。还提供了一种聚类方法。采用本发明,能够获得监测点之间的时空变化的关联。就大气污染监测数据而言,能够获得污染传播链路相似的污染节点,从而实现了污染溯源。

Description

聚类设备和方法
技术领域
本申请涉及数据分析领域,具体涉及一种聚类设备和方法。
背景技术
大气污染的形成受排放物、扩散条件、地理环境等因素影响,其成因复杂多样,这为准确地分析某地区大气污染的分布和扩散趋势带来了困难。尤其是对污染源头的追溯,缺乏有效的数据分析方法。
发明内容
本发明综合考虑大气污染物、天气、地理等影响因素,挖掘大气污染监测点之间的时空关联特性,并以此聚合具有相同污染变化和扩散趋势等特征的监测点。本发明不仅能够适用于大气污染数据,也适用于其他具有相似时空特征的数据,如交通数据等。
根据本发明的一个方面,提供了一种聚类设备,包括:获取单元,被配置为获取监测点的监测数据,所述监测数据是时空数据;划分单元,被配置为从所获取的监测数据中选取目标数据,并对选取的目标数据划分级别;构造单元,被配置为根据划分级别后的目标数据来构造聚类参数;以及确定单元,被配置为根据聚类参数来确定监测点的类别。
在一个实施例中,划分单元被配置为:对选取的目标数据进行分组;以及通过对分组后的数据进行直方图均衡来划分级别。
在一个实施例中,构造单元被配置为:计算监测点之间的激活力,所述激活力表示监测点之间的关联程度;根据激活力来计算监测点之间的亲和度,所述亲和度表示监测点之间的传播链路的重合程度。
在一个实施例中,构造单元被配置为:计算监测点i的监测数据位于某个级别的频度fi;计算监测点j的监测数据位于某个级别的频度fj;计算监测点i和监测点j的监测数据同时位于某个级别的频度fij;计算监测点i和监测点j之间的加权距离dij;根据fi、fj、fij和dij来计算监测点i和监测点j之间的激活力。
在一个实施例中,fij是监测点i和监测点j在特定时间窗内同时出现在某个相同级别的次数,fi是监测点i在特定时间窗内单独出现在该相同级别的次数,fj是监测点j在特定时间窗内单独出现在该相同级别的次数。
在一个实施例中,fij是监测点i和监测点j在特定时间窗内从某个相同级别跨越至另一相同级别的次数,fi是监测点i在特定时间窗内单独发生该级别跨越的次数,fj是监测点j在特定时间窗内单独发生该级别跨越的次数。
在一个实施例中,构造单元被配置为根据以下参数来计算加权距离dij:监测点i和监测点j之间的地理距离、实时风力级别、风向与监测点i和监测点j的连线之间的夹角、监测点i和监测点j的海拔高度、以及风速监测点的海拔高度。
在一个实施例中,构造单元被配置为:确定指向监测点i和监测点j并且激活力大于预定阈值的监测点k的集合;确定监测点i和监测点j所指向的并且激活力大于所述预定阈值的监测点m的集合;基于监测点k的集合和监测点m的集合,计算监测点i和监测点j之间的亲和度。
优选地,监测数据包括大气污染监测数据或交通数据。
在一个实施例中,确定单元被配置为采用K-means聚类算法来确定监测点的类别。
根据本发明的另一个方面,提供了一种聚类方法,包括:获取监测点的监测数据,所述监测数据是时空数据;从所获取的监测数据中选取目标数据,并对选取的目标数据划分级别;根据划分级别后的目标数据来构造聚类参数;以及根据聚类参数来确定监测点的类别。
在一个实施例中,对选取的目标数据划分级别包括:对选取的目标数据进行分组;以及通过对分组后的数据进行直方图均衡来划分级别。
在一个实施例中,构造聚类参数包括:计算监测点之间的激活力,所述激活力表示监测点之间的关联程度;根据激活力来计算监测点之间的亲和度,所述亲和度表示监测点之间的传播链路的重合程度。
在一个实施例中,计算监测点之间的激活力包括:计算监测点i的监测数据位于某个级别的频度fi;计算监测点j的监测数据位于某个级别的频度fj;计算监测点i和监测点j的监测数据同时位于某个级别的频度fij;计算监测点i和监测点j之间的加权距离dij;根据fi、fj、fij和dij来计算监测点i和监测点j之间的激活力。
在一个实施例中,fij是监测点i和监测点j在特定时间窗内同时出现在某个相同级别的次数,fi是监测点i在特定时间窗内单独出现在该相同级别的次数,fj是监测点j在特定时间窗内单独出现在该相同级别的次数。
在一个实施例中,fij是监测点i和监测点j在特定时间窗内从某个相同级别跨越至另一相同级别的次数,fi是监测点i在特定时间窗内单独发生该级别跨越的次数,fj是监测点j在特定时间窗内单独发生该级别跨越的次数。
在一个实施例中,根据以下参数来计算加权距离dij:监测点i和监测点j之间的地理距离、实时风力级别、风向与监测点i和监测点j的连线之间的夹角、监测点i和监测点j的海拔高度、以及风速监测点的海拔高度。
在一个实施例中,计算监测点之间的亲和度包括:确定指向监测点i和监测点j并且激活力大于预定阈值的监测点k的集合;确定监测点i和监测点j所指向的并且激活力大于所述预定阈值的监测点m的集合;基于监测点k的集合和监测点m的集合,计算监测点i和监测点j之间的亲和度。
优选地,监测数据包括大气污染监测数据或交通数据。
在一个实施例中,采用K-means聚类算法来确定监测点的类别。
采用本发明的技术方案,能够获得数据点之间的时空变化关联。对于大气污染监测数据,能够获得污染传播链路相似的污染节点,从而实现了污染溯源。
附图说明
通过下文结合附图的详细描述,本发明的上述和其它特征将会变得更加明显,其中:
图1是示出了根据本发明一个实施例的聚类设备的框图。
图2是示出了根据本发明一个实施例的聚类方法的流程图。
图3是示出了根据本发明一个实施例的划分级别的示意图。
图4-12是示出了根据本发明一个具体示例的数据计算结果的示意图。
具体实施方式
下面,通过结合附图对本发明的具体实施例的描述,本发明的原理和实现将会变得明显。应当注意的是,本发明不应局限于下文所述的具体实施例。另外,为了简便起见,省略了与本发明无关的公知技术的详细描述。
图1是示出了根据本发明一个实施例的聚类设备的框图。如图1所示,聚类设备10包括获取单元110、划分单元120、构造单元130和确定单元140。下面,详细描述聚类设备10中的各个单元的操作。
获取单元110被配置为获取监测点的监测数据,该监测数据是时空数据。在本申请中,“时空数据”是指同时具有时间和空间维度的数据,例如大气污染监测数据、交通流量数据等等。
在一个示例中,对于大气污染监测站点来说,监测点的时空数据可以包括6种主要大气污染物(PM2.5、PM10、SO2、NO2、CO、O3)的浓度及其对应空气质量指数(IAQI)值。
划分单元120被配置为从获取单元110获取的监测数据中选取目标数据,并对选取的目标数据划分级别。优选地,划分单元120首先对选取的目标数据进行分组,然后通过对分组后的数据进行直方图均衡来划分级别。例如,就大气污染监测数据来说,可依据六种大气污染物(PM2.5、PM10、SO2、NO2、CO、O3)的分布趋势,将其分为三组。即,CO、NO2、SO2一组,O3一组,PM2.5、PM10一组。各组的IAQI为其组内对应污染物IAQI的均值,分别记为IAQI1、IAQI2、和IAQI3。然后,对于不同季节/时间段,直方图均衡后的所划分的等级数目和等级之间的界限不尽相同,可以视实际需求而定。以2013.12-2014.2期间的大气污染监测数据为例,将其分为三组,每组10个污染等级,如图3中所示。
构造单元130被配置为根据划分级别后的目标数据来构造聚类参数。在一个实施例中,构造单元130首先计算监测点之间的激活力。在本申请人中,“激活力”表示监测点之间的关联程度。例如,监测点之间的“激活力”可以定义为:
AF i j = ( f i j / f i ) ( f i j / f j ) d i j 2 公式(1)
其中,fi表示监测点i的监测数据位于某个级别的频度,fj表示监测点j的监测数据位于某个级别的频度,fij表示监测点i和监测点j的监测数据同时位于某个级别的频度,而dij表示监测点i和监测点j之间的加权距离。
激活力AFij是监测点i被激活后,监测点i激活监测点j的程度的度量。激活力是一个有向的度量,即AFij≠AFji
在一个示例中,fij是监测点i和监测点j在特定时间窗内同时出现在某个相同级别的次数,fi是监测点i在特定时间窗内单独出现在该相同级别的次数,fj是监测点j在特定时间窗内单独出现在该相同级别的次数。举例来说,假设监测点i在时间窗T内的级别依次为{1,1,2,2,,3},而监测点j在时间窗T内的级别依次为{1,2,2,3,4},则共现级别(即,监测点i和监测点j在时间窗T内同时出现的级别)为{1,2}。相应地,fij=2,fi=4,fj=3。
在另一个示例中,fij是监测点i和监测点j在特定时间窗内同时发生级别跨越的次数,fi是监测点i在特定时间窗内单独发生级别跨越的次数,fj是监测点j在特定时间窗内单独发生级别跨越的次数。举例来说,假设监测点i在时间窗T内的级别依次为{1,1,2,2,,3},而监测点j在时间窗T内的级别依次为{1,2,2,3,4},则监测点i和监测点j同时发生级数跨越的次数是1(即,监测点i从2级跨越到3级,与此同时,监测点j从3级跨越4级)。相应地,fij=1,fi=2,fj=3。
对于大气污染监测数据,大气污染的扩散与风向和地势有直接联系。在一个实施例中,可以根据监测点i与监测点j之间的风向和风力以及监测点所处地势,将距离dij定义为受地理距离、风向和地势影响的加权距离:
d i j = 1 2 × d 0 × [ 1 + e - s × c o s θ × e - ( h - h 0 h 0 ) ] 公式(2)
其中,d0为监测点i与j之间的地理距离,s为实时风力级别,θ为风向与i与j之间连线的夹角(其取值在[0,π]),h为监测点i和j所处的平均海拔高度,h0为风速监测点的海拔高度。由此可见,若i与j之间为顺风,则dij相对减小。若风向与i与j之间连线方向重合,则风速影响大。此外,根据大气运动理论,高度越大,风速越大,则dij也相对减小。
然后,构造单元130根据激活力来计算监测点之间的亲和度。在本申请中,“亲和度”表示监测点之间的传播链路的重合程度,并以此作为聚类依据。例如,“亲和度”可定义为:
A i j A F = 1 | K i j | Σ k ∈ K i j O R ( AF k i , AF k j ) × 1 | M i j | Σ m ∈ M i j O R ( AF i m , AF j m ) 公式(3)
其中,δ为预先设定的阈值,用来去除关联相对小的链路以提高亲和度的聚合度。
Kij={k|AFki>δor AFkj>δ}为所有指向监测点i和j且激活力大于δ的监测点的集合,|Kij|表示集合Kij中的元素的个数。
Mij={m|AFim>δor AFjm>δ}为监测点i和j所指向的且激活力大于δ的监测点的集合,|Mij|表示集合Mij中的元素的个数。
表示用x和y中的较小值除以较大值。
确定单元140被配置为根据聚类参数来确定监测点的类别。例如,确定单元140可以采用K-means聚类算法来确定监测点的类别。具体说来,在获得亲和度矩阵Aij后,确定单元140可根据监测点间的亲和度值进行聚类,使类内监测点的亲和度最大,类间监测点的亲和度较小。这样,具有相似污染传播链路的污染监测点将被聚为一类,从而能够对污染物进行溯源。
下面,通过一个具体计算示例来描述上述聚类设备10的操作。
在本示例中,获取单元110获取2013.12-2014.2期间北京10个官方监测点的大气污染监测数据,如图4所示。
划分单元120依据CO、NO2、SO2、O3、PM2.5、PM10的分布趋势,将其分为三组。即,CO、NO2、SO2一组,O3一组,PM2.5、PM10一组。各组的IAQI为其组内对应污染物IAQI的均值,分别记为IAQI1、IAQI2、IAQI3。然后,划分单元120将分组后的参数进行直方图均衡,均匀划分级别。直方图均衡后,将每组IAQI分为10个污染等级,所划分的等级数目和等级之间的界限如图3所示。特别地,其中以1号和2号监测点为例,依据其2013年12月5日单日24小时的IAQI3监测数据,污染级别划分结果如图5所示。
构造单元130构造计算激活力模型,计算测量点间的激活力。例如,构造单元130可以计算监测点i与监测点j在时间窗T内同时出现在同一级别的次数fij、监测点i单独出现在共现级别的次数fi、以及监测点j单独出现在共现级别的次数fj。以1号和2号监测站点2013年12月5日单日24小时的IAQI3监测数据为例,其计算结果如下:共现的级别分别为2和3,1号和2号监测点同时达到某一级别的次数f12=10,1号监测点出现在这两个级别的总次数f1=24,而2号监测点出现在这两个级别的总次数f2=18。
根据1号至10号监测点2013年12月(共336个小时)的IAQI3监测数据,在时间窗T=1h,滑动步长P=1h的条件下,构造单元130计算监测点间两两同时出现在同一级别的次数的结果,如图6所示。
另外,构造单元130计算监测点i单独出现在共现级别的次数fi,结果如图7所示,构造单元130还计算监测点j单独出现在共现级别的次数fj,结果如图8所示。
构造单元130根据1号至10号监测点的经纬度坐标,根据以上公式(2)计算监测点间的加权距离dij,结果如图9所示。
在得到fi、fj、和dij之后,构造单元130根据以上公式(1)计算得到2013年12月的AQI3激活力,结果如图10所示。
此后,构造单元130根据以上公式(3)计算得到2013年12月的AQI3亲和度,结果如图11所示。以计算1号和2号监测点的亲和度为例,由于监测点数目(10个)较少,所以在此情况下可以设阈值σ=0。利用上述公式(3),此时|K12|为所有指向1号和2号监测点且激活力大于0的监测点的数目,|M12|为1号和2号监测点所指向的所有其他监测点中激活力大于0的站点的数目。由激活力计算结果可知,|K12|=|M12|=10。
OR(AFk1,AFk2)=min(AFk1,AFk2)/max(AFk1,AFk2)
其中,min(AFk1,AFk2)为对于监测点k,其指向1号和2号监测点的激活力中较小的值;max(AFk1,AFk2)为对于监测点k,其指向1号和2号监测点的激活力中较大的值。
记AFii=1.000,则
Σ k ∈ K i j O R ( A F k i , A F k j ) = Σ m i n ( A F k 1 , A F k 2 ) / max ( A F k 1 , A F k 2 ) = 181.2 / 100000 + 181.2 / 100000 + 6.198 / 15.35 + 3.251 / 4.9 89 + 0.375 / 1.382 + 3.881 / 7.258 + 4.164 / 5.845 + 1.583 / 5.2 66 + 0.394 / 0.632 + 1.552 / 3.202 = 3.985
类似的, Σ m ∈ M i j O R ( AF i m , AF j m ) = Σ m i n ( A F 1 l , A F 2 l ) / max ( A F 1 l , A F 2 l ) ,
其中,min(AF1l,AF2l)为1号和2号监测点所指向l号监测点的激活力的较小值,max(AF1l,AF2l)为1号和2号监测点所指向l号监测点的激活力的较大值。由于本例中激活力矩阵为对称矩阵,所以∑min(AF1l,AF2l)/max(AF1l,AF2l)=∑min(AFk1,AFk2)/max(AFk1,AFk2)=3.985,即亲和度矩阵中A12=A21=0.3985≈0.399。
确定单元140根据1号至10号监测点处的2013年12月的IAQI3监测数据,基于K-means聚类算法进行聚类,结果如图12所示。
图2是示出了根据本发明一个实施例的聚类方法的流程图。如图2所示,方法20在步骤S210处开始。
在步骤S220,获取监测点的监测数据,该监测数据是时空数据。例如,该监测数据可以包括大气污染监测数据或交通数据。
在步骤S230,从所获取的监测数据中选取目标数据,并对选取的目标数据划分级别。优选地,对选取的目标数据进行分组,然后通过对分组后的数据进行直方图均衡来划分级别。
在步骤S240,根据划分级别后的目标数据来构造聚类参数。优选地,计算监测点之间的激活力,并根据激活力来计算监测点之间的亲和度。具体计算过程例如可以参考上文针对公式(1)-(3)的描述,此处不再重复。
在步骤S250,根据聚类参数来确定监测点的类别。优选地,可以采用K-means聚类算法来确定监测点的类别。
最后,方法20在步骤S260处结束。
应该理解,本发明的上述实施例可以通过软件、硬件或者软件和硬件两者的结合来实现。例如,上述实施例中的系统内的各种组件可以通过多种器件来实现,这些器件包括但不限于:模拟电路、数字电路、通用处理器、数字信号处理(DSP)电路、可编程处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、可编程逻辑器件(CPLD),等等。
另外,本领域的技术人员可以理解,本发明实施例中描述的初始参数可以存储在本地数据库中,也可以存储在分布式数据库中或者可以存储在远程数据库中。
此外,这里所公开的本发明的实施例可以在计算机程序产品上实现。更具体地,该计算机程序产品是如下的一种产品:具有计算机可读介质,计算机可读介质上编码有计算机程序逻辑,当在计算设备上执行时,该计算机程序逻辑提供相关的操作以实现本发明的上述技术方案。当在计算系统的至少一个处理器上执行时,计算机程序逻辑使得处理器执行本发明实施例所述的操作(方法)。本发明的这种设置典型地提供为设置或编码在例如光介质(例如CD-ROM)、软盘或硬盘等的计算机可读介质上的软件、代码和/或其他数据结构、或者诸如一个或多个ROM或RAM或PROM芯片上的固件或微代码的其他介质、或一个或多个模块中的可下载的软件图像、共享数据库等。软件或固件或这种配置可安装在计算设备上,以使得计算设备中的一个或多个处理器执行本发明实施例所描述的技术方案。
尽管以上已经结合本发明的优选实施例示出了本发明,但是本领域的技术人员将会理解,在不脱离本发明的精神和范围的情况下,可以对本发明进行各种修改、替换和改变。因此,本发明不应由上述实施例来限定,而应由所附权利要求及其等价物来限定。

Claims (20)

1.一种聚类设备,包括:
获取单元,被配置为获取监测点的监测数据,所述监测数据是时空数据;
划分单元,被配置为从所获取的监测数据中选取目标数据,并对选取的目标数据划分级别;
构造单元,被配置为根据划分级别后的目标数据来构造聚类参数;以及
确定单元,被配置为根据聚类参数来确定监测点的类别。
2.根据权利要求1所述的设备,其中,所述划分单元被配置为:
对选取的目标数据进行分组;以及
通过对分组后的数据进行直方图均衡来划分级别。
3.根据权利要求1所述的设备,其中,所述构造单元被配置为:
计算监测点之间的激活力,所述激活力表示监测点之间的关联程度;
根据激活力来计算监测点之间的亲和度,所述亲和度表示监测点之间的传播链路的重合程度。
4.根据权利要求3所述的设备,其中,所述构造单元被配置为:
计算监测点i的监测数据位于某个级别的频度fi
计算监测点j的监测数据位于某个级别的频度fj
计算监测点i和监测点j的监测数据同时位于某个级别的频度fij
计算监测点i和监测点j之间的加权距离dij
根据fi、fj、fij和dij来计算监测点i和监测点j之间的激活力。
5.根据权利要求4所述的设备,其中,fij是监测点i和监测点j在特定时间窗内同时出现在某个相同级别的次数,fi是监测点i在特定时间窗内单独出现在该相同级别的次数,fj是监测点j在特定时间窗内单独出现在该相同级别的次数。
6.根据权利要求4所述的设备,其中,fij是监测点i和监测点j在特定时间窗内从某个相同级别跨越至另一相同级别的次数,fi是监测点i在特定时间窗内单独发生该级别跨越的次数,fj是监测点j在特定时间窗内单独发生该级别跨越的次数。
7.根据权利要求4所述的设备,其中,所述构造单元被配置为根据以下参数来计算加权距离dij
监测点i和监测点j之间的地理距离、实时风力级别、风向与监测点i和监测点j的连线之间的夹角、监测点i和监测点j的海拔高度、以及风速监测点的海拔高度。
8.根据权利要求3所述的设备,其中,所述构造单元被配置为:
确定指向监测点i和监测点j并且激活力大于预定阈值的监测点k的集合;
确定监测点i和监测点j所指向的并且激活力大于所述预定阈值的监测点m的集合;
基于监测点k的集合和监测点m的集合,计算监测点i和监测点j之间的亲和度。
9.根据权利要求1所述的设备,其中,所述监测数据包括大气污染监测数据或交通数据。
10.根据权利要求1所述的设备,其中,所述确定单元被配置为:
采用K-means聚类算法来确定监测点的类别。
11.一种聚类方法,包括:
获取监测点的监测数据,所述监测数据是时空数据;
从所获取的监测数据中选取目标数据,并对选取的目标数据划分级别;
根据划分级别后的目标数据来构造聚类参数;以及
根据聚类参数来确定监测点的类别。
12.根据权利要求11所述的方法,其中,对选取的目标数据划分级别包括:
对选取的目标数据进行分组;以及
通过对分组后的数据进行直方图均衡来划分级别。
13.根据权利要求11所述的方法,其中,构造聚类参数包括:
计算监测点之间的激活力,所述激活力表示监测点之间的关联程度;
根据激活力来计算监测点之间的亲和度,所述亲和度表示监测点之间的传播链路的重合程度。
14.根据权利要求13所述的方法,其中,计算监测点之间的激活力包括:
计算监测点i的监测数据位于某个级别的频度fi
计算监测点j的监测数据位于某个级别的频度fj
计算监测点i和监测点j的监测数据同时位于某个级别的频度fij
计算监测点i和监测点j之间的加权距离dij
根据fi、fj、fij和dij来计算监测点i和监测点j之间的激活力。
15.根据权利要求14所述的方法,其中,fij是监测点i和监测点j在特定时间窗内同时出现在某个相同级别的次数,fi是监测点i在特定时间窗内单独出现在该相同级别的次数,fj是监测点j在特定时间窗内单独出现在该相同级别的次数。
16.根据权利要求14所述的方法,其中,fij是监测点i和监测点j在特定时间窗内从某个相同级别跨越至另一相同级别的次数,fi是监测点i在特定时间窗内单独发生该级别跨越的次数,fj是监测点j在特定时间窗内单独发生该级别跨越的次数。
17.根据权利要求14所述的方法,其中,根据以下参数来计算加权距离dij
监测点i和监测点j之间的地理距离、实时风力级别、风向与监测点i和监测点j的连线之间的夹角、监测点i和监测点j的海拔高度、以及风速监测点的海拔高度。
18.根据权利要求13所述的方法,其中,计算监测点之间的亲和度包括:
确定指向监测点i和监测点j并且激活力大于预定阈值的监测点k的集合;
确定监测点i和监测点j所指向的并且激活力大于所述预定阈值的监测点m的集合;
基于监测点k的集合和监测点m的集合,计算监测点i和监测点j之间的亲和度。
19.根据权利要求11所述的方法,其中,所述监测数据包括大气污染监测数据或交通数据。
20.根据权利要求11所述的方法,其中,采用K-means聚类算法来确定监测点的类别。
CN201510372135.5A 2015-06-30 2015-06-30 聚类设备和方法 Active CN106326264B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510372135.5A CN106326264B (zh) 2015-06-30 2015-06-30 聚类设备和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510372135.5A CN106326264B (zh) 2015-06-30 2015-06-30 聚类设备和方法

Publications (2)

Publication Number Publication Date
CN106326264A true CN106326264A (zh) 2017-01-11
CN106326264B CN106326264B (zh) 2022-07-29

Family

ID=57722983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510372135.5A Active CN106326264B (zh) 2015-06-30 2015-06-30 聚类设备和方法

Country Status (1)

Country Link
CN (1) CN106326264B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106841436A (zh) * 2017-01-18 2017-06-13 上海市环境监测中心 一种工业区大气VOCs自动监测预警溯源系统及其方法
CN111241720A (zh) * 2020-04-27 2020-06-05 北京英视睿达科技有限公司 一种道路扬尘模型的建模方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998033162A1 (en) * 1997-01-27 1998-07-30 Biocode, Inc. Marking of products to extablish identity, source and fate
CN104702685A (zh) * 2015-03-11 2015-06-10 中山大学 基于后向轨迹的污染源追踪方法及其系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998033162A1 (en) * 1997-01-27 1998-07-30 Biocode, Inc. Marking of products to extablish identity, source and fate
CN104702685A (zh) * 2015-03-11 2015-06-10 中山大学 基于后向轨迹的污染源追踪方法及其系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUN GUO ET AL: "An Activation Force-based Affinity Measure for Analyzing Complex Networks", 《SCIENTIFIC REPORTS》 *
王斌: "利用空气污染指数(API)分析我国空气污染的区域时空变化特征", 《万方数据知识服务平台》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106841436A (zh) * 2017-01-18 2017-06-13 上海市环境监测中心 一种工业区大气VOCs自动监测预警溯源系统及其方法
CN111241720A (zh) * 2020-04-27 2020-06-05 北京英视睿达科技有限公司 一种道路扬尘模型的建模方法和装置
CN111241720B (zh) * 2020-04-27 2020-07-17 北京英视睿达科技有限公司 一种道路扬尘模型的建模方法和装置

Also Published As

Publication number Publication date
CN106326264B (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
Kazemzadeh et al. Spatial characteristics and temporal trends of meteorological and hydrological droughts in northwestern Iran
CN103197299B (zh) 天气雷达径向风信息提取及量化分析系统
Zandbergen et al. Error propagation models to examine the effects of geocoding quality on spatial analysis of individual-level datasets
CN110956412B (zh) 基于实景模型的洪灾动态评估方法、装置、介质和设备
Chan et al. Surveillance and epidemiology of infectious diseases using spatial and temporal lustering methods
Harirforoush et al. Spatial and temporal analysis of seasonal traffic accidents
Dugan et al. SEDNA-bioacoustic analysis toolbox
CN116680658A (zh) 一种基于风险评价的热浪监测站选址方法及系统
CN110716998B (zh) 一种精细尺度人口数据空间化方法
CN113516387B (zh) 基于地理空间大数据的区域生态安全格局构建方法及系统
CN106326264A (zh) 聚类设备和方法
CN117171533B (zh) 一种地理测绘作业数据实时采集处理方法及系统
CN106920198A (zh) 用于污染物溯源的设备和方法
CN106918677B (zh) 用于污染物溯源的设备和方法
Agarwal et al. Unfolding community structure in rainfall network of Germany using complex network-based approach
Ramachandra et al. Understanding urban sprawl dynamics of Gulbarga-Tier II city in Karnataka through spatio-temporal data and spatial metrics
Karmshahi et al. Application of an integrated CA-Markov model in simulating spatiotemporal changes in forest cover: a case study of Malekshahi county forests, Ilam province
Victorino et al. Profiling flood risk through crowdsourced flood level reports
Fariza et al. Spatial-Temporal Visualization of Dengue Haemorrhagic Fever Vulnerability in Kediri District, Indonesia, Using K-means Algorithm
Moughal et al. Enhanced detection of burned area using cross-and autocorrelation
Sabarish et al. Spatial Outlier Detection Algorithm for Trajectory-Data
Wang et al. How many probe vehicles are enough for identifying traffic congestion?—a study from a streaming data perspective
Thakur et al. Evidence of long range dependence and self-similarity in urban traffic systems
Casali Topological Assessment of Changes in Road Network Systems in Time, under Discrete Flooding Events, and under Classes of Unexpected Disruptions
Kanevski A methodology for automatic analysis and modeling of spatial environmental data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant