CN116541782A - 一种电力营销数据异常识别方法 - Google Patents
一种电力营销数据异常识别方法 Download PDFInfo
- Publication number
- CN116541782A CN116541782A CN202310464046.8A CN202310464046A CN116541782A CN 116541782 A CN116541782 A CN 116541782A CN 202310464046 A CN202310464046 A CN 202310464046A CN 116541782 A CN116541782 A CN 116541782A
- Authority
- CN
- China
- Prior art keywords
- data
- abnormal
- service
- isolated forest
- identifying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000002159 abnormal effect Effects 0.000 claims abstract description 60
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 238000005516 engineering process Methods 0.000 claims description 13
- 230000005856 abnormality Effects 0.000 claims description 9
- 238000000354 decomposition reaction Methods 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000013075 data extraction Methods 0.000 claims description 6
- 238000011161 development Methods 0.000 claims description 6
- 230000018109 developmental process Effects 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000007726 management method Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000000903 blocking effect Effects 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 238000007418 data mining Methods 0.000 claims description 3
- 230000005611 electricity Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 230000029052 metamorphosis Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电力营销数据异常识别方法,包括以下步骤:S01:构建统一的数据平台;S02:构建孤立森林模型;S03:基于构建的孤立森林模型完成异常数据识别检测;S04:提取异常数据的特征;S05:异常数据的识别及输出,该方法通过对实时采集的电力营销数据进行分析,能够及时发现异常数据,并对异常数据进行更正和补救,优化系统,该发明实用性强,使用方便,能够极大的提高电力营销的工作效率和准确度,提升客户满意度。
Description
技术领域
本发明涉及电力营销数据异常分析技术领域,尤其是涉及一种电力营销数据异常识别方法。
背景技术
大数据环境下,“数据大而知识少”是企业面临的共性问题。国电公司提出“一型五化”的大规模营销系统,即客户导向,业务密集,管理专业化,组织扁平化,控制实时,服务协同。一方面,在“大营销”的背景下,各类数据重复多、数据类型多样、数据冗余多的背景下,对市场营销的管理者和决策人员提出了严峻的挑战。
随着智能电网建设的全面推进,以及SG186营销业务应用系统的建立与完善,积累了海量的业务数据,当前,由于电网结构的不断优化,技术的不断升级,电力公司的经营模式向着电力市场需求和提升客户满意度的方向发展,这就对电力企业所提供的营销服务的质量提出了更高的要求,给电力企业带来了诸多的压力,使得常规的分析方法很难在当前的市场环境中得到有效的运用。
发明内容
为了克服上述问题,本发明的目的是提供一种电力营销数据异常识别方法,该方法通过对实时采集的电力营销数据进行分析,能够及时发现异常数据,并对异常数据进行更正和补救,优化系统,该发明实用性强,使用方便,能够极大的提高电力营销的工作效率和准确度,提升客户满意度。
本发明采用的技术方案是:一种电力营销数据异常识别方法,包括以下步骤:
S01:构建统一的数据平台;
S02:构建孤立森林模型;
S03:基于构建的孤立森林模型完成异常数据识别检测;
S04:提取异常数据的特征;
S05:异常数据的识别及输出。
进一步的,所述构建统一的数据平台包括使用大数据建立电力营销服务技术支撑平台,该平台包含市场发展、商业活动、客户服务、工厂运营数据,在平台的核心应用中,具体包括:数据采集服务、数据查询服务、数据搜索服务、分布式离线计算服务、分布式实时计算服务、数据挖掘服务、分布式协调服务、分布式队列监控服务、分布式数据库服务、分布式文档存储服务、数据订阅服务、开发监控服务和集群管理。
进一步的,所述构建孤立森林模型的步骤具体包括:
S021:按照电网信息的尺度,建立基于孤立森林的数据集合D;
S022:对数据进行流式处理,按照一定的规律对数据进行排序,选取合适的样本个数作为二叉树的主要数据;
S023:对其它样本进行隔离,按照特征性和差异性对样本进行分类,直至每个样本集中仅包含一个样本;
S024:以一组随机选取的数值区间作为数据抽取门限,依此划分数据结构,并作为判据进行分析。
进一步的,所述数据中正常的数据划分为高密度区,反之的数据划分为低密度区,说明数据中有异常,当检测的结果不能肯定时,再将训练样本分开,再进行分割,直至检测出全部数据。
进一步的,所述基于构建的孤立森林模型完成异常数据识别检测的步骤具体包括:
S031:清理数据源,剔除重复或相似度高的冗杂数据;
S032:把原数据集合D引入到孤立森林模型中,并按照二叉树模型中的根值设置条件,把用电用户的数据相应地放在二叉树的根值上;
S033:利用孤立森林的方法对数据进行随机分割,使得数据落入对应的二叉树上的叶片结点;
S034:针对信息资料的特点与差异,逐步将资料分开,直至仅包含单一资料的子资料;
S035:计算出叶片结点资料到根结点资料之间的距离及等级关系,也就是异常资料S所处的位置;
S036:利用标准化公式,计算出各二叉树的平均高度,并估算出S的变态指标,完成异常数据识别检测。
进一步的,所述提取异常数据的特征采用的是随机解耦合的特征分解技术,对异常数据的光谱特性进行有效分解,构建多尺度的异常数据特征分解模型。
进一步的,所述随机解耦合的特征分解技术的步骤具体包括:
S041:采用孤立森林学习方法,获取异常数据的自相关性分布特性;
S042:通过孤立森林方法进行自适应优化,获取异常数据的稀疏异质特征;
S043:利用分块信息融合技术,对异常数据进行探测与重建。
进一步的,所述异常数据的识别及输出的具体步骤为:
S051:根据孤立森林模型的统计分析,从市场营销数据中抽取出具有显著差异的关联特征集;
S052:利用关联规则和粗集特征匹配实现市场营销数据的异常识别;
S053:构造出了电力市场中异常值的一个统计特征集合,并给出用来描述电力市场中异常值分布的概念函数;
S054:在此基础上,利用稀疏特征重构技术,构建一种新的电力市场营销数据的异常属性解析模型;
S055:利用频谱特征提取技术,重建电力市场中的电力市场异常信息,获得电力市场中电力市场异常信息的空间线性结构。
本发明的有益效果:
本发明一种电力营销数据异常识别方法,该方法通过对实时采集的电力营销数据进行分析,能够及时发现异常数据,并对异常数据进行更正和补救,优化系统,该发明实用性强,使用方便,能够极大的提高电力营销的工作效率和准确度,提升客户满意度。
附图说明
图1为发明提出的一种电力营销数据异常识别方法的流程图;
图2为发明提出的一种电力营销数据异常识别方法的电力营销数据存储结构模型;
图3为发明提出的一种电力营销数据异常识别方法的电力营销数据异常识别时域波形;
图4为发明提出的一种电力营销数据异常识别方法的电力营销数据异常识别结果。
具体实施方式
下面结合附图及实施例描述本发明的具体实施方式:
需要说明的是,本说明书所附图中示意的结构,比例,大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,任何结构的修饰,比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
同时,本说明书中所引用的如“上”,“下”,“左”,“右”,“中间”及“一”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
如图1~3所示,其示出了本发明的具体实施方式:本发明公开的一种电力营销数据异常识别方法,包括以下步骤:
S01:构建统一的数据平台;
S02:构建孤立森林模型;
S03:基于构建的孤立森林模型完成异常数据识别检测;
S04:提取异常数据的特征;
S05:异常数据的识别及输出。
优选的,所述构建统一的数据平台包括使用大数据建立电力营销服务技术支撑平台,该平台包含市场发展、商业活动、客户服务、工厂运营数据,在平台的核心应用中,具体包括:数据采集服务、数据查询服务、数据搜索服务、分布式离线计算服务、分布式实时计算服务、数据挖掘服务、分布式协调服务、分布式队列监控服务、分布式数据库服务、分布式文档存储服务、数据订阅服务、开发监控服务和集群管理。
优选的,所述构建孤立森林模型的步骤具体包括:
S021:按照电网信息的尺度,建立基于孤立森林的数据集合D;
S022:对数据进行流式处理,按照一定的规律对数据进行排序,选取合适的样本个数作为二叉树的主要数据;
S023:对其它样本进行隔离,按照特征性和差异性对样本进行分类,直至每个样本集中仅包含一个样本;
S024:以一组随机选取的数值区间作为数据抽取门限,依此划分数据结构,并作为判据进行分析。
优选的,所述数据中正常的数据划分为高密度区,反之的数据划分为低密度区,说明数据中有异常,当检测的结果不能肯定时,再将训练样本分开,再进行分割,直至检测出全部数据。
在本发明当中,通过构建异常特征提取与大数据储存结构,采用空间分布式融合规划,构建异常栅格结构,对异常栅格结构进行建模,图2显示了目前的市场销售数据存储结构。
在图2中的电力营销数据分层存储结构模型中,与空间分布的融合规划相结合,对电力营销数据展开分层规划和信息融合处理,从而可以构建出电力营销数据的分层权重组合结构模型,其中k=1,2,。。。,n代表的是资料层数。在此基础上,采用分块融合方法,对电力营销数据进行层次组合规划,得到X=[x1(k-1),…,xn(k-M)],对电力营销异常数据进行模糊差分融合,得到n个参数,并保持了对电力营销数据进行层次存储所需的区域模块特性的估计值。然后,利用排序的思想,建立了一种基于电力市场异常数据本体论特征集合。
提出一种基于网络模型的基于网络模型的网络模型,该模型对网络模型进行了建模,并对网络模型进行了仿真。在此基础上,针对电力市场中出现的异常数据,采用PCA的方法对其进行分类,并对其进行分类。在此基础上,利用异质信息在虚拟空间中的融合,建立多维信息的异质信息分布集合;利用多维信息的语义本体论,建立多维信息的多维信息关联模型,建立多维信息的多维信息关联模型。
优选的,所述基于构建的孤立森林模型完成异常数据识别检测的步骤具体包括:
S031:清理数据源,剔除重复或相似度高的冗杂数据;
S032:把原数据集合D引入到孤立森林模型中,并按照二叉树模型中的根值设置条件,把用电用户的数据相应地放在二叉树的根值上;
S033:利用孤立森林的方法对数据进行随机分割,使得数据落入对应的二叉树上的叶片结点;
S034:针对信息资料的特点与差异,逐步将资料分开,直至仅包含单一资料的子资料;
S035:计算出叶片结点资料到根结点资料之间的距离及等级关系,也就是异常资料S所处的位置;
S036:利用标准化公式,计算出各二叉树的平均高度,并估算出S的变态指标,完成异常数据识别检测。
在本发明当中,通过模拟试验,对比分析研究成果。主要研究内容包括:基于改进的光谱聚类方法进行异常检测;基于低秩建模方法进行异常检测;基于Spark框架进行异常检测。
模拟实验环境的设计是:在电力营销数据节点中,提取出的异常特征数目为240,在200m×200m,800kHz的电流中,对电能销售信息进行检测,在此基础上,进行了120次的多元回归分析,同时在此基础上,对电力市场运行数据进行了仿真,并对其中的不正常信息进行了识别。
利用A/D变换,将电力采集到的信号转化成数字信号,再利用MATLAB建模,对其进行了分析与处理,得到了其在时间上的变化情况。选取如图3所示的电力营销资料,并使用这些资料所含有的不正常资料作了初步的辨识。在此基础上,建立基于多源异构数据的多源多维信息融合方法,并对其进行了分类。
通过对图4中显示的结果进行分析,发现5秒后,电力销售数据的输出结果有明显的变化。实践表明,在这种情况下,采用离散森林模型进行异常营销数据的识别,能够有效地识别出异常营销数据,并能够对其进行有效的发现。
以异常值的正确率为检验标准,对所提算法的适用性进行了检验。在此基础上,利用改进的谱聚类算法,结合低秩建模,以及Spark算法,进行比较试验,以检验所提算法的有效性。
随着试验次数的增多,不同的试验方法对电网销售数据的检测精度也随之提高。在三种对比方式中,采用低秩模型与方法所得结果的准确率相当,而采用改进的光谱聚类算法所得结果的准确率更高,达到了0.925。实验结果表明,该算法的准确率在一定程度上有所降低,但其准确率在0.906到0.945之间。通过实例分析,证明了该方法在电力市场中的应用效果。
优选的,所述提取异常数据的特征采用的是随机解耦合的特征分解技术,对异常数据的光谱特性进行有效分解,构建多尺度的异常数据特征分解模型。
优选的,所述随机解耦合的特征分解技术的步骤具体包括:
S041:采用孤立森林学习方法,获取异常数据的自相关性分布特性;
S042:通过孤立森林方法进行自适应优化,获取异常数据的稀疏异质特征;
S043:利用分块信息融合技术,对异常数据进行探测与重建。
优选的,所述异常数据的识别及输出的具体步骤为:
S051:根据孤立森林模型的统计分析,从市场营销数据中抽取出具有显著差异的关联特征集;
S052:利用关联规则和粗集特征匹配实现市场营销数据的异常识别;
S053:构造出了电力市场中异常值的一个统计特征集合,并给出用来描述电力市场中异常值分布的概念函数;
S054:在此基础上,利用稀疏特征重构技术,构建一种新的电力市场营销数据的异常属性解析模型;
S055:利用频谱特征提取技术,重建电力市场中的电力市场异常信息,获得电力市场中电力市场异常信息的空间线性结构。
本发明一种电力营销数据异常识别方法,通过对实时采集的电力营销数据进行分析,能够及时发现异常数据,并对异常数据进行更正和补救,优化系统,该发明实用性强,使用方便,能够极大的提高电力营销的工作效率和准确度,提升客户满意度。
上面结合附图对本发明优选实施方式作了详细说明,但是本发明不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
不脱离本发明的构思和范围可以做出许多其他改变和改型。应当理解,本发明不限于特定的实施方式,本发明的范围由所附权利要求限定。
Claims (8)
1.一种电力营销数据异常识别方法,包括以下步骤:
S01:构建统一的数据平台;
S02:构建孤立森林模型;
S03:基于构建的孤立森林模型完成异常数据识别检测;
S04:提取异常数据的特征;
S05:异常数据的识别及输出。
2.根据权利要求1所述的一种电力营销数据异常识别方法,其特征在于,所述构建统一的数据平台包括使用大数据建立电力营销服务技术支撑平台,该平台包含市场发展、商业活动、客户服务、工厂运营数据,在平台的核心应用中,具体包括:数据采集服务、数据查询服务、数据搜索服务、分布式离线计算服务、分布式实时计算服务、数据挖掘服务、分布式协调服务、分布式队列监控服务、分布式数据库服务、分布式文档存储服务、数据订阅服务、开发监控服务和集群管理。
3.根据权利要求1所述的一种电力营销数据异常识别方法,其特征在于,所述构建孤立森林模型的步骤具体包括:
S021:按照电网信息的尺度,建立基于孤立森林的数据集合D;
S022:对数据进行流式处理,按照一定的规律对数据进行排序,选取合适的样本个数作为二叉树的主要数据;
S023:对其它样本进行隔离,按照特征性和差异性对样本进行分类,直至每个样本集中仅包含一个样本;
S024:以一组随机选取的数值区间作为数据抽取门限,依此划分数据结构,并作为判据进行分析。
4.根据权利要求3所述的一种电力营销数据异常识别方法,其特征在于,所述数据中正常的数据划分为高密度区,反之的数据划分为低密度区,说明数据中有异常,当检测的结果不能肯定时,再将训练样本分开,再进行分割,直至检测出全部数据。
5.根据权利要求1所述的一种电力营销数据异常识别方法,其特征在于,所述基于构建的孤立森林模型完成异常数据识别检测的步骤具体包括:
S031:清理数据源,剔除重复或相似度高的冗杂数据;
S032:把原数据集合D引入到孤立森林模型中,并按照二叉树模型中的根值设置条件,把用电用户的数据相应地放在二叉树的根值上;
S033:利用孤立森林的方法对数据进行随机分割,使得数据落入对应的二叉树上的叶片结点;
S034:针对信息资料的特点与差异,逐步将资料分开,直至仅包含单一资料的子资料;
S035:计算出叶片结点资料到根结点资料之间的距离及等级关系,也就是异常资料S所处的位置;
S036:利用标准化公式,计算出各二叉树的平均高度,并估算出S的变态指标,完成异常数据识别检测。
6.根据权利要求1所述的一种电力营销数据异常识别方法,其特征在于,所述提取异常数据的特征采用的是随机解耦合的特征分解技术,对异常数据的光谱特性进行有效分解,构建多尺度的异常数据特征分解模型。
7.根据权利要求6所述的一种电力营销数据异常识别方法,其特征在于,所述随机解耦合的特征分解技术的步骤具体包括:
S041:采用孤立森林学习方法,获取异常数据的自相关性分布特性;
S042:通过孤立森林方法进行自适应优化,获取异常数据的稀疏异质特征;
S043:利用分块信息融合技术,对异常数据进行探测与重建。
8.根据权利要求1所述的一种电力营销数据异常识别方法,其特征在于,所述异常数据的识别及输出的具体步骤为:
S051:根据孤立森林模型的统计分析,从市场营销数据中抽取出具有显著差异的关联特征集;
S052:利用关联规则和粗集特征匹配实现市场营销数据的异常识别;
S053:构造出了电力市场中异常值的一个统计特征集合,并给出用来描述电力市场中异常值分布的概念函数;
S054:在此基础上,利用稀疏特征重构技术,构建一种新的电力市场营销数据的异常属性解析模型;
S055:利用频谱特征提取技术,重建电力市场中的电力市场异常信息,获得电力市场中电力市场异常信息的空间线性结构。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310464046.8A CN116541782A (zh) | 2023-04-26 | 2023-04-26 | 一种电力营销数据异常识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310464046.8A CN116541782A (zh) | 2023-04-26 | 2023-04-26 | 一种电力营销数据异常识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116541782A true CN116541782A (zh) | 2023-08-04 |
Family
ID=87444587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310464046.8A Withdrawn CN116541782A (zh) | 2023-04-26 | 2023-04-26 | 一种电力营销数据异常识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116541782A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117151768A (zh) * | 2023-10-30 | 2023-12-01 | 国网浙江省电力有限公司营销服务中心 | 一种生成式营销事件风控规则库的构建方法及系统 |
CN117150438A (zh) * | 2023-10-31 | 2023-12-01 | 成都汉度科技有限公司 | 基于边缘计算的通信数据融合方法及系统 |
-
2023
- 2023-04-26 CN CN202310464046.8A patent/CN116541782A/zh not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117151768A (zh) * | 2023-10-30 | 2023-12-01 | 国网浙江省电力有限公司营销服务中心 | 一种生成式营销事件风控规则库的构建方法及系统 |
CN117150438A (zh) * | 2023-10-31 | 2023-12-01 | 成都汉度科技有限公司 | 基于边缘计算的通信数据融合方法及系统 |
CN117150438B (zh) * | 2023-10-31 | 2024-02-06 | 成都汉度科技有限公司 | 基于边缘计算的通信数据融合方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106707099B (zh) | 基于异常用电检测模型的监测定位方法 | |
CN116541782A (zh) | 一种电力营销数据异常识别方法 | |
CN113657545B (zh) | 用户业务数据的处理方法、装置、设备及存储介质 | |
CN105574544A (zh) | 一种数据处理方法和装置 | |
CN114048870A (zh) | 一种基于日志特征智能挖掘的电力系统异常监测方法 | |
CN111861756A (zh) | 一种基于金融交易网络的团伙检测方法及其实现装置 | |
CN111126437B (zh) | 基于加权动态网络表示学习的异常群体检测方法 | |
CN107527223A (zh) | 一种购票信息分析的方法及装置 | |
CN113723452A (zh) | 一种基于kpi聚类的大规模异常检测系统 | |
CN112016769B (zh) | 管理相对人风险预测以及信息推荐方法及装置 | |
CN116823496A (zh) | 基于人工智能的智能保险风险评估和定价系统 | |
CN106846170B (zh) | 一种发电机组跳闸监测方法及其监测装置 | |
CN112668733A (zh) | 基于无监督学习的通信管理系统缺陷故障派单方法及装置 | |
CN116991932B (zh) | 一种基于人工智能的数据分析治理系统及其方法 | |
CN112699921B (zh) | 一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法 | |
CN111209955A (zh) | 基于深度神经网络和随机森林的飞机电源系统故障识别方法 | |
CN117171244A (zh) | 基于数据中台构建的企业数据管理系统及其数据分析方法 | |
CN117411780A (zh) | 一种基于多源数据特征的网络日志异常检测方法 | |
CN114880584B (zh) | 一种基于社区发现的发电机组故障分析方法 | |
CN114399407B (zh) | 一种基于动静态选择集成的电力调度监控数据异常检测方法 | |
Yang et al. | Design and Application of Big Data Technology Management for the Analysis System of High Speed Railway Operation Safety Rules | |
CN115392710A (zh) | 一种基于数据过滤的风电机组运行决策方法及系统 | |
CN116232695A (zh) | 一种网络安全运维关联分析系统 | |
CN115658772A (zh) | 一种无人机光伏巡检数据类资产管理方法及系统 | |
CN113221984B (zh) | 用户酒驾行为分析预测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230804 |