CN110597880A - 一种用水模式挖掘和匹配的方法,系统和设备 - Google Patents
一种用水模式挖掘和匹配的方法,系统和设备 Download PDFInfo
- Publication number
- CN110597880A CN110597880A CN201910878118.7A CN201910878118A CN110597880A CN 110597880 A CN110597880 A CN 110597880A CN 201910878118 A CN201910878118 A CN 201910878118A CN 110597880 A CN110597880 A CN 110597880A
- Authority
- CN
- China
- Prior art keywords
- pattern
- water
- hot spot
- data
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 129
- 238000005065 mining Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000003909 pattern recognition Methods 0.000 claims abstract description 31
- 238000000605 extraction Methods 0.000 claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims abstract description 21
- 238000003745 diagnosis Methods 0.000 claims abstract description 12
- 230000006399 behavior Effects 0.000 claims abstract description 11
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000011156 evaluation Methods 0.000 claims description 17
- 238000009412 basement excavation Methods 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000013461 design Methods 0.000 claims description 6
- 238000007635 classification algorithm Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000007418 data mining Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 abstract description 7
- 238000003860 storage Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000000737 periodic effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011524 similarity measure Methods 0.000 description 3
- 238000003287 bathing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- DMJXRYSGXCLCFP-LBPRGKRZSA-N (3s)-n-tert-butyl-1,2,3,4-tetrahydroisoquinoline-3-carboxamide Chemical compound C1=CC=C2CN[C@H](C(=O)NC(C)(C)C)CC2=C1 DMJXRYSGXCLCFP-LBPRGKRZSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000003339 best practice Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
Abstract
本发明提供一种用水模式挖掘和匹配的方法,系统和设备,通过对热点用水模式的挖掘和匹配,达到对特殊用户群体或特殊用水行为的监控,在为用水异常情况的诊断和预警提供依据的同时,达到企业运行降本提效的目的,该方法包括数据预处理,获取实时用水数据并进行降维处理成多个时间序列数据;模式挖掘,对所述时间序列数据进行模式特征提取和聚类,完成热点模式的挖掘,并存储入模式识别库;模式匹配,根据模式识别库对时间序列数据进行模式识别分析和系统优化,对未知标记类别的时间序列数据进行模式挖掘以获得新的热点模式。
Description
技术领域
本发明涉及人工智能技术在水务行业的应用,具体涉及一种用水模式挖掘和匹配的方法,系统和设备。
背景技术
近年来,随着智慧水务信息化新技术和漏损管理最佳实践在供水管网产销差管理方面的应用,国内大部分水司已经逐渐认识到以分区计量管理为主要方式、以大水量用户管理和分析为辅助手段、结合信息化技术对供水管网产销差进行分析和报警,并为水司主动漏损管理和用水稽查提供辅助决策建议,是一种行之有效的降低管网产销差模式。
在上述大前提下,如何在大量远传数据和分区建设的基础上,通过挖掘用水数据中隐藏的用水行为进行有效的异常侦测与预警成为行业面临的技术痛点。现有的用水行为分析方法还停留在简单的数理统计分析维度,无法全面的描述真实的用水行为特征,同时也无关构建一个动态可自动更新及优化的系统。
发明内容
本发明的目的是提供一种用水模式挖掘和匹配的方法,系统和设备,以便于解决现有技术中存在的上述问题。
为了达到上述目的,本发明一方面提供一种用水模式的挖掘方法,包括:
获取实时用水数据并进行降维处理,通过采样和切分形成多个时间序列数据;
对所述时间序列数据进行模式特征提取和聚类,完成用水模式的挖掘;
对所述用水模式进行挖掘和分析之后获取热点模式;
将所述热点用水模式推荐给专家系统进行标记以完成热点模式的挖掘;
将所述热点模式存储入模式识别库。
在具体的实施例中,所述时间序列数据包括局部用水特征的短周期用水数据和包括全局用水特征的长周期用水数据。
进一步的,采用时序数据特征提取算法获取所述短周期用水数据和长周期用水数据中的特征序列数据,并根据业务场景对特征序列数据进行误差调整。
进一步的,所述特征序列数据包括周期趋势特征、节假日模式特征、频域分解和小波变换分解特征;
所述业务场景包括区域信息、分类信息、口径流量信息、天气信息、水文信息及GDP信息。
进一步的,根据特征序列数据的聚类计算结果,计算与模式识别库所存储的用水模式的相似度,当相似度低于阈值时标记为用水模式。
进一步的,根据特征序列数据的分布进行热点模式的标记,当特征序列数据的数据分布占比超过阈值时,所述用水模式标记为热点模式。
进一步的,专家系统将对热点模式的聚类序列集进行确认及分析,对此热点模式进行标记或排除,被标记热点模式自动加入模式识别库。
另一方面,本发明还提供一种用水模式的匹配方法,包括以下步骤:
获取实时用水数据并进行降维处理,通过采样和切分形成多个时间序列数据;
根据模式识别库对时间序列数据进行模式识别分析,获得识别结果并根据模式识别结果进行动态系统优化,如识别结果为未知标记类别,则对该时间序列数据进行模式挖掘以获得新的热点模式;
根据模式匹配结果,对用水模式进行异常诊断和预警,对损漏行为进行诊断分析,提供调度策略规划及设计。
在具体的实施例中,采用Autoenocoder算法进行时序序列的自动特征提取,并将提取的模式特征进行编码。
进一步的,构建分类算法模型以对模式特征编码进行分类,所述分类根据模式识别库中以标记的热点模式进行置信度评价,选择置信度评价最高的热点模式作为所述时序序列的匹配模式。
另一方面,本发明还提供一种用水模式的挖掘系统,包括:
数据预处理模块,获取实时用水数据并进行降维处理,通过采样和切分形成多个时间序列数据;
数据挖掘模块,对所述时间序列数据进行模式特征提取和聚类,完成用水模式的挖掘,对所述用水模式进行挖掘和分析之后获取热点模式;
专家系统模块,将所述热点模式进行标记以完成热点模式的挖掘;
模式识别库,用以存储经过标记的热点模式。
另一方面,本发明还提供一种用水模式的匹配系统,包括:
数据预处理模块,获取实时用水数据并进行降维处理,通过采样和切分形成多个时间序列数据;
模式编码模块,采用Autoenocoder算法进行时序序列的自动特征提取,并将提取的模式特征进行编码;
模式匹配模块,用以构建分类算法模型以对模式特征编码进行分类,所述分类根据模式识别库中以标记的热点模式进行置信度评价,选择置信度评价最高的热点模式作为所述时序序列的匹配模式;
功能与服务模块,用以根据模式匹配结果,对用水模式进行异常诊断和预警,对损漏行为进行诊断分析,提供调度策略规划及设计。
另一方面,本发明还提供一种用水模式的挖掘装置,包括:
处理器;
用以存储处理器可执行计算机程序指令的存储器;
其中,所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。
另一方面,一种用水模式的匹配装置,包括:
处理器;
用以存储处理器可执行计算机程序指令的存储器;
其中,所述计算机程序指令被处理器执行时实现权利要求8至10中任意一项所述的方法。
上述实施例提供的一种用水模式挖掘和匹配的方法,系统和设备,通过对热点用水模式的挖掘和匹配,达到对特殊用户群体或特殊用水行为的监控,从而进行分析和管理,在为用水异常情况的诊断和预警提供依据的同时,达到降低企业运行成本增加效益的目的,该方法包括数据预处理,获取实时用水数据并进行降维处理成多个时间序列数据;模式挖掘,对所述时间序列数据进行模式特征提取和聚类,完成热点模式的挖掘,并存储入模式识别库;模式匹配,根据模式识别库对时间序列数据进行模式识别分析,并根据模式识别结果进行动态系统优化,如识别结果为未知标记类别,则对该时间序列数据进行模式挖掘以获得新的热点模式。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例的用水模式挖掘方法的流程图;
图2是本发明一个实施例的用水模式匹配方法的流程图
图3为本发明一个实施例的用水模式挖掘和匹配的系统架构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面参照附图描述根据本发明实施例提出的一种用水模式挖掘和匹配的方法,系统和设备,首先将参照附图描述根据本发明实施例提出的用水模式挖掘方法。
图1是本发明一个实施例的用水模式挖掘方法的流程图。
如图1所示,该用水模式挖掘方法包括:
步骤S101,数据预处理。
具体的,在本发明的一个实施例中,水务用水和供水数据是连续的时序数据,由于受外部环境扰动、物理设施(如远传表的结构、电源等)影响,存在数据漏传、数据缺失、数据单点及多点异常等数据问题,需要在前期进行相关数据预处理工作,完成数据清理。同时,为便于后续补充的处理,在数据预处理环节对数据进行采样和切分处理,目的是通过不同的切分周期进行数据模式特征提取。数据切分采用短周期+长周期的组合方式,短周期为60分钟的采样曲线,长周期为72小时的采样曲线。这样的处理方式有利于结合局部特征和全局特征,进行更加全面的特征提取。
步骤S102,模式特征提取。
具体的,在本发明的一个实施例中,预处理之后的数据通过特征提取达到两个目的,一个是数据降维,提取主要特征忽略不关键的特征帧,有利于后续的聚类更快收敛;另外通过特征分析发现有价值的关键特征,可以指导后续模型创建和对用水模式的综合评价。特征提取包括时间周期的选择及设计,时间周期包括小时、天、周、月度、季度、年度特征的选择;外部可利用信息的整合,如大企业所在区域信息、分类信息、口径流量信息;同时在可行的情况下结合外部可获取的天气、水文以及GDP等宏观信息。采用的算法包括时域分析、频域分析、小波变换、PAAA提取等。
具体而言,特征提取方式的选择依赖于不同相似性度量的算法输入,相似性度量描述了进行时间序列聚类分析需要选择合适的距离评价方法及准则,根据不同应用场景的需求,基于欧式距离或曼哈顿距离,依据形状聚类(空间上的相似度),依据变化聚类(数据生成过程的相似度)的不同方法。同时根据不同业务场景需求,进行误差调节。
步骤S103,模式聚类。
具体的,在本发明的一个实施例中,在特征提取之后,对提取的特征序列采用聚类算法进行迭代聚类,后去聚类中心和类中心的距离评估。根据不同业务场景的需求,本发明综合使用层次聚类、面向时间序列的TICC、基于DTW实现的1NN-DTW等算法。算法设计过程中主要考虑算法计算效率(时间复杂度)与算法实施效果(模型有效性评价)的折中,在保证计算效率前期下,通过优化算法实现来提升模式识别准确率。
步骤S104,用水模式挖掘。
具体的,在本发明的一个实施例中,从聚类结果中,进行用水模式的挖掘,可以通过不同聚类中心及不同特征序列的分布情况,发现新的用水模式。用水模式的挖掘过程中,将新的用水模式与模式识别库现有热点模式进行相似度比较,当相似度低于15%,标记为潜在热点模式。
步骤105,热点模式分析。
具体的,在本发明的一个实施例中,利用特征序列的分布进行热点模式的标记。当潜在热点模式的特征序列的数据分布占比超过预设比例是,该新挖掘的潜在热点模式可被推荐为热点模式,同时推荐给专家系统进行二次确认。
步骤106,模式入库。
具体的,在本发明的一个实施例中,专家系统将对反复出现的热点模式聚类序列集进行确认及分析,对此热点模式进行标记或排除,被标记热点模式自动加入模式识别库。
步骤107,更新相似度量和聚类策略。
具体的,在本发明的一个实施例中,专家系统对新热点模式的标记经验,将作为新的监督数据用于更新模型算法的输入。
图2是本发明一个实施例的用水模式匹配方法的流程图。
如图1所示,该用水模式匹配方法包括:
步骤S201,数据预处理:获取实时用水数据并进行降维处理,通过采样和切分形成多个时间序列数据。
步骤S202,模式特征提取与模式编码
具体的,在本发明的一个实施例中,采用Autoenocoder算法进行时序序列的自动特征提取,避免了复杂的手动特征提取过程。同时提取的时序序列特征通过模式特征编码,提供给后续步骤使用。
步骤S203,模式识别。
具体的,在本发明的一个实施例中,通过构建分类算法模型对编码特征进行分类,根据模式库中已有标记的热点模式,对提取特征的时序序列进行置信度的对比评价。
步骤S204,模式归类。
选择置信度最高的热点模式作为该段时间序列的识别后的热点模式。
步骤S205,热点模式挖掘。
如果识别结果为未知标记类别,再转入热点模式推荐流程,同时本发明的用水模式挖掘方法进行模式挖掘和评估。
具体的,本发明另一实施例中,实施例的业务场景为使用人工智能数据分析技术,针对远传大用水量用户的5分钟实时用水数据、历史用水特性、近期用水趋势、用水异常等数据进行分析。主要针对两个方面,一是特种用水用户,例如洗浴、足浴、洗衣等高水费用户群体进行分析和管理。达到通过监控少部分用户来实现一定可观收益水量管理的目的,帮助水司降低因为非法用水、倒装水表、仪表计量误差、小表大流量、大表小流量等问题造成的表观漏损量;二是针对完成二次供水改造的DMA小区,对小区供水量实时数据进行分析,发现小区水箱水池漏损,改善小区泵房运行效能,从而降低产水司销差和二次供水管理费用,达到降本增效的目的。
用水特性模型以天为周期挖掘大用户的用水特性和异常数据检测。结合大用户的行业特性对日用水曲线的时序数据进行聚类分析,得到聚类模型。针对抄表周期的多样性导致的日用水曲线时序数据的长度不一致,采用(DTW)方法来进行规整。聚类异常值评估采用置信度评估区间手段,动态进行优化调节,超出动态优化曲线的异常值,触发异常报警。
图3为本发明一种用水模式挖掘和匹配的系统架构图。
如图3所示的一种用水模式挖掘和匹配系统,包括:用水模式挖掘模块2,用水模式匹配模块3,数据预处理模块1、模式识别库4、专家系统4和功能与服务模块6。
数据预处理模块1,用以获取实时用水数据并进行降维处理,通过采样和切分形成多个时间序列数据。
用水模式挖掘模块2包括模式特征提取模块201、模式聚类模块202和热点模式挖掘模块203,利用对历史用水数据的特征提取、聚类,完成潜在热点模式的挖掘,形成热点模式,推荐给专家系统标注
模式特征提取模块291通过时序数据特征提取算法从时序数据中,进行模式特征的提取工作,包括但不限于如下几个特征提取维度:
1)周期模式提取,提取时间序列中的周期趋势特征,包括15分钟周期、30分钟周期、1小时周期特征、1天、7天、14天、1月周期特征;
2)节假日模式特征提取,用于提取周末、国家法定节假日的时序数据用水特征;
3)分解特征,包括频域分解和小波变换分解特征等。
模式聚类模块202,利用相似度评估和聚类算法,完成对提取模式特征的聚类分析,通过多轮迭代形成可区分模式类簇。
热点模式挖掘模块203,在上述模式聚类的基础上,利用数据挖掘算法,对热点模式类别进行抽取及挖掘,形成候选热点模式类别,推荐给专家系统。
专家系统4用以领域专家接入将候选的热点模式进行标记为新的热点模式。
模式识别库5,用以存储专家系统标记的热点模式。
模式匹配功能模块3,主要利用建立好的模式库,对实时用水数据进行模式识别分析,分析识别结果并动态进行系统优化,主要包括:
模式编码模块301:通过AutoEncoder编码技术,对时序数据进行编码及特征映射;
模式匹配模块302:利用编码结果,构建模式识别的分类器,对输入序列进行最优模式匹配;
功能与服务模块6,是系统方法对外提供服务的接口,利用模式识别的行为分析技术,可以支撑如下领域:
1)用水异常诊断与预警,通过模式匹配结果的评估,构建置信区间,通过置信区间覆盖情况构建用水异常诊断和预警系统;
2)漏损诊断,利用模式库预建漏损模式,通过模式识别匹配策略进行漏损行为诊断分析;
3)调度策略规划及设计,可以利用模式聚类的结果,尤其是周期性模式分布情况,优化调度策略。
具体的,本发明的一种实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为上述方法。
电子设备可以被提供为终端、服务器或其它形态的设备。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用水模式的挖掘方法,其特征在于,包括:
获取实时用水数据并进行降维处理,通过采样和切分形成多个时间序列数据;
对所述时间序列数据进行模式特征提取和聚类,完成用水模式的挖掘;
对所述用水模式进行挖掘和分析之后获取热点模式;
将所述热点用水模式推荐给专家系统进行标记以完成热点模式的挖掘;
将所述热点模式存储入模式识别库。
2.如权利要求1所述的一种用水模式的挖掘方法,其特征在于,
采用时序数据特征提取算法获取所述短周期用水数据和长周期用水数据中的特征序列数据,并根据业务场景对特征序列数据进行误差调整。
3.如权利要求2所述的一种用水模式的挖掘方法,其特征在于,
所述特征序列数据包括周期趋势特征、节假日模式特征、频域分解和小波变换分解特征;
所述业务场景包括区域信息、分类信息、口径流量信息、天气信息、水文信息及GDP信息。
4.如权利要求2所述的一种用水模式的挖掘方法,其特征在于,
根据特征序列数据的聚类计算结果,计算与模式识别库所存储的用水模式的相似度,当相似度低于阈值时标记为用水模式。
5.如权利要求4所述的一种用水模式的挖掘方法,其特征在于,
根据特征序列数据的分布进行热点模式的标记,当特征序列数据的数据分布占比超过阈值时,所述用水模式标记为热点模式;
专家系统对热点模式的聚类序列集进行确认及分析,对此热点模式进行标记或排除,被标记热点模式自动加入模式识别库。
6.如权利要求1所述的一种用水模式的匹配方法,其特征在于,包括以下步骤:
获取实时用水数据并进行降维处理,通过采样和切分形成多个时间序列数据;
根据模式识别库对时间序列数据进行模式识别分析,获得识别结果并根据模式识别结果进行动态系统优化,如识别结果为未知标记类别,则对该时间序列数据进行模式挖掘以获得新的热点模式;
根据模式匹配结果,对用水模式进行异常诊断和预警,对损漏行为进行诊断分析,提供调度策略规划及设计。
7.如权利要求6所述的一种用水模式的匹配方法,其特征在于,
采用Autoenocoder算法进行时序序列的自动特征提取,并将提取的模式特征进行编码;
构建分类算法模型以对模式特征编码进行分类,所述分类根据模式识别库中以标记的热点模式进行置信度评价,选择置信度评价最高的热点模式作为所述时序序列的匹配模式。
8.一种用水模式的挖掘系统,其特征在于,包括:
数据预处理模块,获取实时用水数据并进行降维处理,通过采样和切分形成多个时间序列数据;
数据挖掘模块,对所述时间序列数据进行模式特征提取和聚类,完成用水模式的挖掘,对所述用水模式进行挖掘和分析之后获取热点模式;
专家系统模块,将所述热点模式进行标记以完成热点模式的挖掘;
模式识别库,用以存储经过标记的热点模式。
9.一种用水模式的匹配系统,其特征在于,包括:
数据预处理模块,获取实时用水数据并进行降维处理,通过采样和切分形成多个时间序列数据;
模式编码模块,采用Autoenocoder算法进行时序序列的自动特征提取,并将提取的模式特征进行编码;
模式匹配模块,用以构建分类算法模型以对模式特征编码进行分类,所述分类根据模式识别库中以标记的热点模式进行置信度评价,选择置信度评价最高的热点模式作为所述时序序列的匹配模式;
功能与服务模块,用以根据模式匹配结果,对用水模式进行异常诊断和预警,对损漏行为进行诊断分析,提供调度策略规划及设计。
10.一种用水模式的挖掘装置,其特征在于,包括:
处理器;
用以存储处理器可执行计算机程序指令的存储器;
其中,所述计算机程序指令被处理器执行时实现权利要求1至8中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910878118.7A CN110597880B (zh) | 2019-09-17 | 2019-09-17 | 一种用水模式挖掘和匹配的方法,系统和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910878118.7A CN110597880B (zh) | 2019-09-17 | 2019-09-17 | 一种用水模式挖掘和匹配的方法,系统和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110597880A true CN110597880A (zh) | 2019-12-20 |
CN110597880B CN110597880B (zh) | 2024-02-23 |
Family
ID=68860408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910878118.7A Active CN110597880B (zh) | 2019-09-17 | 2019-09-17 | 一种用水模式挖掘和匹配的方法,系统和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110597880B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111539539A (zh) * | 2020-04-03 | 2020-08-14 | 国家计算机网络与信息安全管理中心 | 数据中心动力环境设备运行模式突变检测方法及装置 |
CN113052718A (zh) * | 2021-01-14 | 2021-06-29 | 北京朗新明环保科技有限公司 | 一种智能水务平台 |
CN113158716A (zh) * | 2020-11-20 | 2021-07-23 | 云智慧(北京)科技有限公司 | 一种基于信号频域分析的智能告警方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650446A (zh) * | 2016-12-26 | 2017-05-10 | 北京邮电大学 | 基于系统调用的恶意程序行为识别方法和系统 |
WO2019134220A1 (zh) * | 2018-01-08 | 2019-07-11 | 中国科学院广州能源研究所 | 一种天然气水合物开采采气方法及系统 |
-
2019
- 2019-09-17 CN CN201910878118.7A patent/CN110597880B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650446A (zh) * | 2016-12-26 | 2017-05-10 | 北京邮电大学 | 基于系统调用的恶意程序行为识别方法和系统 |
WO2019134220A1 (zh) * | 2018-01-08 | 2019-07-11 | 中国科学院广州能源研究所 | 一种天然气水合物开采采气方法及系统 |
Non-Patent Citations (1)
Title |
---|
庞天杰: "基于模糊改进聚类分析的数据挖掘模型", 《太原师范学院学报(自然科学版)》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111539539A (zh) * | 2020-04-03 | 2020-08-14 | 国家计算机网络与信息安全管理中心 | 数据中心动力环境设备运行模式突变检测方法及装置 |
CN113158716A (zh) * | 2020-11-20 | 2021-07-23 | 云智慧(北京)科技有限公司 | 一种基于信号频域分析的智能告警方法和系统 |
CN113052718A (zh) * | 2021-01-14 | 2021-06-29 | 北京朗新明环保科技有限公司 | 一种智能水务平台 |
Also Published As
Publication number | Publication date |
---|---|
CN110597880B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Time series anomaly detection for smart grids: A survey | |
CN110597880B (zh) | 一种用水模式挖掘和匹配的方法,系统和设备 | |
Kim | Modeling special-day effects for forecasting intraday electricity demand | |
CN105678481A (zh) | 一种基于随机森林模型的管线健康状态评估方法 | |
CN106446016A (zh) | 一种基于并行关联规则挖掘的配电网运行可靠性预测方法 | |
Wan et al. | Literature review of data analytics for leak detection in water distribution networks: A focus on pressure and flow smart sensors | |
CN109409561B (zh) | 多时间尺度时间序列协同预测模型的构建方法 | |
CN109034490A (zh) | 一种电力负荷预测方法、装置、设备及存储介质 | |
CN116091118A (zh) | 电价预测方法、装置、设备、介质及产品 | |
CN106022640B (zh) | 电量指数核对系统及方法 | |
Kim et al. | Analytics for understanding customer behavior in the energy and utility industry | |
Patsakos et al. | A survey on deep learning for building load forecasting | |
CN112783865A (zh) | 一种半监督人机结合的运维故障库生成方法及系统 | |
CN111339155B (zh) | 一种关联分析系统 | |
Carrasco-Jiménez et al. | Detection of anomalous patterns in water consumption: An overview of approaches | |
CN112488805B (zh) | 基于多元回归时间序列分析的长租市场预警方法 | |
CN211236974U (zh) | 一种基于三维展示的水工监测系统 | |
CN115796174A (zh) | 定单处理方法、装置、设备以及存储介质 | |
Ji et al. | Online refinement of day‐ahead forecasting using intraday data for campus‐level load | |
CN111931798B (zh) | 进行冷头状态分类检测和寿命预测的方法 | |
US10508532B1 (en) | Efficient recovery of petroleum from reservoir and optimized well design and operation through well-based production and automated decline curve analysis | |
Chren | Towards multi-layered reliability analysis in smart grids | |
Bâra et al. | Intelligent systems for predicting and analyzing data in power grid companies | |
CN115327675B (zh) | 气象装备运行状态监控方法、系统、设备及存储介质 | |
Yu et al. | Research on energy consumption prediction of office buildings based on comprehensive similar day and ensemble learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |