CN112508625A - 基于多分枝残差注意力网络的智能稽查建模方法 - Google Patents
基于多分枝残差注意力网络的智能稽查建模方法 Download PDFInfo
- Publication number
- CN112508625A CN112508625A CN202011498663.2A CN202011498663A CN112508625A CN 112508625 A CN112508625 A CN 112508625A CN 202011498663 A CN202011498663 A CN 202011498663A CN 112508625 A CN112508625 A CN 112508625A
- Authority
- CN
- China
- Prior art keywords
- layer
- branch residual
- branch
- convolution
- residual error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007689 inspection Methods 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 24
- 230000002159 abnormal effect Effects 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 27
- 238000011176 pooling Methods 0.000 claims description 22
- 238000010586 diagram Methods 0.000 claims description 16
- 238000012550 audit Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 7
- 230000003321 amplification Effects 0.000 claims description 3
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 abstract description 3
- 230000008859 change Effects 0.000 abstract description 2
- 238000005070 sampling Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 230000008034 disappearance Effects 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于多分枝残差注意力网络的智能稽查建模方法,其步骤为:首先,获取稽查数据字段,并对稽查数据字段进行预处理得到训练数据;其次,构建多分枝残差注意力网络,并利用训练数据对多分枝残差注意力网络进行训练,得到多分枝残差注意力网络模型;最后,将稽查数据输入多分枝残差注意力网络模型中,输出稽查结果,完成对电力营销业务中的异常问题的识别分类与自动排查。本发明通过多次卷积操作,捕获更多数据,解决长时序数据较难学习的问题,同时该网络采用高效注意力机制,在稽查数据变化较大的时刻点投入更多的注意力,从而提高了模型训练和预测的准确度。
Description
技术领域
本发明涉及智能稽查建模技术领域,特别是指一种基于多分枝残差注意力网络的智能稽查建模方法。
背景技术
电力稽查是电力营销中不可或缺的一个职能,在电力营销市场化过程中扮演越来越重要的角色。如何平衡稽查与被稽查者之间的利益,在有限的稽查中发现和预测电力营销中更多的错误,已经成为电力公司和科研人员关注的新课题。建立智能稽查模型,深入洞察电力营销业务中存在的问题,支撑异常问题整改,实现数字化稽查是提高电力营销稽查效率的必要手段。目前,电力营销稽查建模方法主要有以下几种:
(1)基于稽查结果的营销工作质量评价定性分析模型
该方法运用专家调查法进行风险程度和管控强度测评,基于评价得分和具体差错类型,应用专业统计分析建模技术,建立稽查结果统计分析模型,实现营销差错的主因分析确定、成因分析、责任岗位分析、营销业务短板分析、风险性分析,但是这种方法稽查方式单一。
(2)基于数据挖掘技术的电价执行在线稽查模型
该方法以计量、营销等海量用电数据为研究对象,利用K-Means聚类算法识别客户的典型用电模式,利用马氏距离判别算法识别电价异常用户。利用计量自动化、营销系统海量用电数据,基于自适应模糊神经推理和决策树C5.0算法构建电价执行智能稽查模型,但是这种方法准确率不高。
(3)基于数据挖掘的用电数据异常的分析与研究
该方法首先利用孤立森林算法构建异常检测模型,识别大部分异常用户。其次通过建立基于聚类分析、局部离群因子算法的异常检测模型并进行比较。再次利用决策树算法建立用电数据异常识别模型,但是此方法效率低下,排查范围有限。
(4)基于广义规则归纳算法的电力稽查关联问题分析模型
该模型从建模角度出发,对稽查样本问题库进行编码整理,再对问题字段进行bool变换,将文本规范化为符号变量,解决了文本难以分类和噪声过大的问题,然后利用数据挖掘中的GRI关联算法对已有的稽查样本数据库进行问题关联分析,得出问题间的隐含关系,但是此方法排查深度不够,误差率高。
发明内容
针对目前深度学习算法在稽查建模方法中存在特征提取不充分,浅层的网络容易出现梯度消失,较难有效学习长时序数据间的映射关系等问题,本发明提供了一种基于多分枝残差注意力网络的智能稽查建模方法,克服了传统方法人工筛选效率低、应用场景单一、模型精度差的缺陷。
本发明的技术方案是这样实现的:
一种基于多分枝残差注意力网络的智能稽查建模方法,其步骤如下:
步骤一:获取稽查数据字段,并对稽查数据字段进行预处理得到训练数据;
步骤二:构建多分枝残差注意力网络,并利用训练数据对多分枝残差注意力网络进行训练,得到多分枝残差注意力网络模型;
步骤三:将稽查数据输入多分枝残差注意力网络模型中,输出稽查结果,完成对电力营销业务中的异常问题的识别分类与自动排查。
所述稽查数据字段包括:日期、线路或台区ID、供电量、售电量、线路用户电量、电流、电压和功率因素。
所述多分枝残差注意力网络的网络结构为:输入层-卷积层I-多分枝残差注意力模块I-下采样层I-多分枝残差注意力模块II-下采样层II-多分枝残差注意力模块III-下采样层III-多分枝残差注意力模块IV-下采样层IV-卷积层II-池化层-全连接层I-全连接层II-输出层。
所述多分枝残差注意力模块I、多分枝残差注意力模块II、多分枝残差注意力模块III和多分枝残差注意力模块IV均包括多分枝残差块和高效注意力模块,多分枝残差块的输入侧与卷积层I、下采样层I、下采样层II或下采样层III相连接,多分枝残差块的输出侧与高效注意力模块的输入侧相连接,高效注意力模块的输出侧与下采样层I、下采样层II、下采样层III或下采样层IV相连接;所述多分枝残差块用于提取训练数据的特征,高效注意力模块用于优化训练数据的特征。
所述多分枝残差块包括多分枝残差单元I、多分枝残差单元II和多分枝残差单元III,多分枝残差单元I的输入侧与卷积层I、下采样层I、下采样层II或下采样层III相连接,多分枝残差单元I的输出侧与多分枝残差单元II的输入侧相连接,多分枝残差单元II的输出侧与多分枝残差单元III的输入侧相连接,多分枝残差单元III的输出侧与高效注意力模块的输入侧相连接,多分枝残差单元II的输出侧与高效注意力模块的输出侧相连接。
所述多分枝残差单元I、多分枝残差单元II和多分枝残差单元III的网络结构相同,均包括第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层,第一卷积层分别与第五卷积层、第二卷积层、第三卷积层和第四卷积层相连接,第二卷积层分别与第三卷积层和第五卷积层相连接,第三卷积层分别与第四卷积层和第五卷积层相连接,第四卷积层与第五卷积层相连接;第一卷积层为多分枝残差单元I、多分枝残差单元II或多分枝残差单元III的输入卷积层,第五卷积层为多分枝残差单元I、多分枝残差单元II或多分枝残差单元III的输出卷积层。
所述高效注意力模块包括第一池化层、一维卷积层I、一维卷积层II、一维卷积层III、激活层和第二池化层,第一池化层分别与一维卷积层I和第二池化层相连接,一维卷积层I与一维卷积层II相连接,一维卷积层II与激活层相连接,激活层与一维卷积层III相连接,一维卷积层III与第二池化层相连接;所述第一池化层为高效注意力模块的输入层,第二池化层为高效注意力模块的输出层。
高效注意力模块优化训练数据的特征的方法为:
对于大小为W×1×C的特征图U,U=[x1,x2,...,xc],对特征图U进行一维化操作,得到一维化后的特征图Z;
利用特征图U的每个通道及其k近邻构造快速一维卷积y,并将一维化后的特征图Z与快速一维卷积y进行卷积运算,得到权重Wk;
利用激活函数对权重Wk进行归一化,并对归一化后的权重进行放大,得到最终的权重Fw;
利用最终的权重Fw加权到特征图U上得到优化后的特征图。
所述一维化后的特征图Z的获得方法为:
其中,zc∈Z={z1,z2,…,zc},FGAP(·)表示将特征通道c中的特征图的线性运算,xi表示特征通道c中第i个特征图,W表示特征通道c中的特征图个数;
所述权重Wk为:
所述最终的权重Fw为:
Fw=n·σ(Wk)
其中,n为权值放大系数,σ(·)为Sigmoid函数;
所述优化后的特征图为:
U′=Fw·U
其中,U′为优化后的特征图。
本技术方案能产生的有益效果:
1)本发明首先对原始稽查数据进行归一化处理,通过滑动窗口的方式获得网络的输入;
2)多分枝残差注意力网络利用叠加的多分枝残差结构来提取深层的负载特征,降低网络优化的难度,增强了网络信息的传递,并解决网络的梯度消失问题;
3)通过多次卷积操作,捕获更多数据,解决长时序数据较难学习的问题,同时该网络采用高效注意力机制,在稽查数据变化较大的时刻点投入更多的注意力,从而提高了模型训练和预测的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的多分枝残差注意力网络。
图2是本发明的多分枝残差单元。
图3是本发明的高效注意力模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种基于多分枝残差注意力网络的智能稽查建模方法,具体步骤如下:
步骤一:获取稽查数据字段,并对稽查数据字段进行预处理得到训练数据;所述稽查数据字段包括:日期、线路或台区ID、供电量、售电量、线路用户电量、电流、电压和功率因素。对稽查数据字段进行预处理:对线损率大于1或者小于0的数据进行标记,不纳入数据建模;对线路线损率超过6%以及台区线损率超过8%的日期标记为异常区间。
步骤二:构建多分枝残差注意力网络,并利用训练数据对多分枝残差注意力网络进行训练,得到多分枝残差注意力网络模型;本发明中将稽查数据分为70%的训练序列和30%的验证序列。多分枝残差块对数据进行特征提取,高效注意力模块对特征进行优化。网络利用自适应优化算法减少损失,反向传播更新网络的参数。如图1所示,在智能稽查模型中,根据深层次的特征更加能够反映注意力所在的位置,多分枝残差注意力网络首先利用卷积层进行浅层的负载特征提取,然后利用多个堆叠的多分枝残差块提取深层次的负载特征。
多分枝残差注意力网络的网络结构为:输入层-卷积层I-多分枝残差注意力模块I-下采样层I-多分枝残差注意力模块II-下采样层II-多分枝残差注意力模块III-下采样层III-多分枝残差注意力模块IV-下采样层IV-卷积层II-池化层-全连接层I-全连接层II-输出层。所述多分枝残差注意力模块I、多分枝残差注意力模块II、多分枝残差注意力模块III和多分枝残差注意力模块IV均包括多分枝残差块和高效注意力模块,多分枝残差块的输入侧与卷积层I、下采样层I、下采样层II或下采样层III相连接,多分枝残差块的输出侧与高效注意力模块的输入侧相连接,高效注意力模块的输出侧与下采样层I、下采样层II、下采样层III或下采样层IV相连接;所述多分枝残差块用于提取训练数据的特征,高效注意力模块用于优化训练数据的特征。
所述多分枝残差块包括多分枝残差单元I、多分枝残差单元II和多分枝残差单元III,多分枝残差单元I的输入侧与卷积层I、下采样层I、下采样层II或下采样层III相连接,多分枝残差单元I的输出侧与多分枝残差单元II的输入侧相连接,多分枝残差单元II的输出侧与多分枝残差单元III的输入侧相连接,多分枝残差单元III的输出侧与高效注意力模块的输入侧相连接,多分枝残差单元II的输出侧与高效注意力模块的输出侧相连接。
所述多分枝残差单元I、多分枝残差单元II和多分枝残差单元III的网络结构相同,均包括第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层,第一卷积层分别与第五卷积层、第二卷积层、第三卷积层和第四卷积层相连接,第二卷积层分别与第三卷积层和第五卷积层相连接,第三卷积层分别与第四卷积层和第五卷积层相连接,第四卷积层与第五卷积层相连接;第一卷积层为多分枝残差单元I、多分枝残差单元II或多分枝残差单元III的输入卷积层,第五卷积层为多分枝残差单元I、多分枝残差单元II或多分枝残差单元III的输出卷积层。
针对梯度消失的问题,何凯明提出了残差网络结构,该结构借鉴了HighwayNetwork的思想,即增加一个恒等变换,将原本网络的学习函数H(x)转换成F(x)+x。多分枝残差块在残差网络基础上做了以下创新。多分枝残差在原有的残差单元结构中增加小的残差块,同时增加了每一层网络的感受野大小,多分枝残差单元如图2所示。多分枝残差对原残差中的3×3进行改进,将1×1卷积后的特征图按通道数平均分为s(图中s=4)块,每一个小块是Xi,每一个Xi都会进行一个3×1的卷积,用Ki表示卷积,卷积结果由yi表示,Xi与Ki-1的输出相加,然后送入Ki。这样就可以得到不同数量和不同感受野大小的输出,例如:y2得到3×1的感受野,y3可以得到5×1的感受野,y4则可以得到更大的7×1的感受野。最后将四个结果进行拼接融合,再进行1×1的卷积,这种先拆分后融合的思路可以得到多尺度的特征,和更好的进行特征融合。与此同时,原始残差函数的输出是(0,+∞),这样会使得前向传播的信号是递增趋势,此结果会影响网络的表达能力,使得网络预测效果变差。多分枝残差块将激活函数ReLU加到残差单元的分支中,在每次卷积操作之前都会进行预激活操作,然后利用矩阵之间的加法进行合并。以上操作保证了残差函数的输出在(-∞,+∞)之间,使得网络性能大大优化。本发明中,激活函数σ(·)只在一条线路上对下一个。多分枝残差单元产生影响。通过调整激活函数和Batch Nomalization在残差单元中的位置,使得多分枝残差单元不仅满足了解决梯度消失的条件,同时也保证了残差函数的输出是在(-∞,+∞)。多分枝残差块的性能要优于原始残差块。
完成浅层特征的提取后,本实施例首先利用一个由3个多分枝残差单元组成的多分枝残差进行特征提取,每个多分枝残差单元中卷积核的个数均为30,多分枝残差单元中的卷积核的大小均为3×1。然后利用两组由4个多分枝残差单元组成的多分枝残差块提取深层次的负载特征信息,这两组多分枝残差块中卷积核的个数为40。最后再利用一个由3个多分枝残差单元组成的多分枝残差块(卷积核的个数为30)进行特征学习。在此同时,将四个多分枝残差块预处理得到的深层次的特征图进行相应的注意力操作,在经过多分枝残差块的特征提取后特征图进入高效注意力模块,进行相应的注意力操作。
受到Encoder-Decoder结构在图像分类和深层次的特征图中更能够反映注意力机制所在的区域观点的启发,本发明针对智能稽查模型,设计了一种前向的注意力机制,融入到多分枝残差块,最终构成多分枝残差注意力网络。高效注意力模块的结构如图3所示。
高效注意力模块用于生成输入特征图的软权重。深层次的特征图经过高效注意力模块后会生成注意力图,用该注意力图和特征图进行对应元素相乘,就能够得到加权的特征图,这样原来的特征图中显著的特征就得到了增强,不显著的特征就会相应得被抑制。在将特征进行四次多分枝残差块和高效注意力模块学习时,会对其进行下采样操作。最后将学习得到的特征图进行拉伸可以得到一个很长的特征向量,利用两个全连接层即可将建立输入序列和输出序列的一种映射,最终完成对电力营销业务中的异常问题的识别分类与自动排查。
所述高效注意力模块包括第一池化层、一维卷积层I、一维卷积层II、一维卷积层III、激活层和第二池化层,第一池化层分别与一维卷积层I和第二池化层相连接,一维卷积层I与一维卷积层II相连接,一维卷积层II与激活层相连接,激活层与一维卷积层III相连接,一维卷积层III与第二池化层相连接;所述第一池化层为高效注意力模块的输入层,第二池化层为高效注意力模块的输出层。
高效注意力模块优化训练数据的特征的方法为:
对于大小为W×1×C的特征图U,U=[x1,x2,...,xc],对特征图U进行一维化操作,得到一维化后的特征图Z;本发明将每个通道独立进行求平均值操作,即把特征图一维化,即将每个特征通道变成一个实数,这个实数某种程度上具有全局(W×1)的感受野,并且输出的维度和输入的特征通道数相匹配。它表征着在特征通道上响应的全局分布,公式如下:
其中,zc∈Z={z1,z2,…,zc},FGAP(·)表示将特征通道c中的特征图通过线性运算变成一个实数,xi表示特征通道c中第i个特征图,W表示特征通道c中的特征图个数。
完成上述操作后,输入特征W×1×C的特征图变成1×1×C。之后,我们利用每个通道及其k个近邻构造快速一维卷积yC1D,即第一通道第1至第k项为非零项,其他项均为零。第二通道中第2至第k+1项为非零项,其他项均为零,以此类推。快速一维卷积用来捕获本地跨通道交互,其中k代表本地跨通道交互的覆盖范围,即有多少个相近邻参与一个通道的注意力预测。快速一维卷积yC1D的转置矩阵的表现形式如下:
其中,wc,c-k+1表示特征通道c中第一个跨通道交互的数值,wc,c表示特征通道c中第k个跨通道交互的数值。
利用特征图U的每个通道及其k近邻构造快速一维卷积y,并将一维化后的特征图Z与快速一维卷积y进行卷积运算,得到权重Wk;将一维化后的特征图Z与快速一维卷积进行卷积运算,对于zc,只考虑zc和k个近邻之间的信息交互。这种操作比起全连接操作,会大幅降低模型的复杂度,其公式为:
利用激活函数对权重Wk进行归一化,并对归一化后的权重进行放大,得到最终的权重Fw;加入Sigmoid门,目的为获得0-1之间归一化的权重。但由于归一化后的特征通道权值在0-1之间,会出现某些特征通道间关系的相关性和差异性不明显。因此,将权值放大,公式中n为权值放大系数,比如,n为10,即权重区间为0-10,使得重要权重更加显著,公式为:
Fw=n·σ(Wk)
其中,σ(·)为Sigmoid函数;
利用最终的权重Fw加权到特征图U上得到优化后的特征图;述优化后的特征图为:
U′=Fw·U
其中,U′为优化后的特征图。
通过上述操作,完成对权重的抑制或增强,即显著的稽查特征得到增强,非显著的稽查特征就会相应得被抑制。完成特征重标定的特征图接着进入下面网络,进行学习。
步骤三:将稽查数据输入多分枝残差注意力网络模型中,输出稽查结果,完成对电力营销业务中的异常问题的识别分类与自动排查。本发明在进行智能稽查时,使用训练好的多分枝残差注意力网络模型。输入稽查数据,经过训练好的权重提取特征后映射出稽查结果,完成对电力营销业务中的异常问题的识别分类与自动排查。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于多分枝残差注意力网络的智能稽查建模方法,其特征在于,其步骤如下:
步骤一:获取稽查数据字段,并对稽查数据字段进行预处理得到训练数据;
步骤二:构建多分枝残差注意力网络,并利用训练数据对多分枝残差注意力网络进行训练,得到多分枝残差注意力网络模型;
步骤三:将稽查数据输入多分枝残差注意力网络模型中,输出稽查结果,完成对电力营销业务中的异常问题的识别分类与自动排查。
2.根据权利要求1所述的基于多分枝残差注意力网络的智能稽查建模方法,其特征在于,所述稽查数据字段包括:日期、线路或台区ID、供电量、售电量、线路用户电量、电流、电压和功率因素。
3.根据权利要求1所述的基于多分枝残差注意力网络的智能稽查建模方法,其特征在于,所述多分枝残差注意力网络的网络结构为:输入层-卷积层I-多分枝残差注意力模块I-下采样层I-多分枝残差注意力模块II-下采样层II-多分枝残差注意力模块III-下采样层III-多分枝残差注意力模块IV-下采样层IV-卷积层II-池化层-全连接层I-全连接层II-输出层。
4.根据权利要求3所述的基于多分枝残差注意力网络的智能稽查建模方法,其特征在于,所述多分枝残差注意力模块I、多分枝残差注意力模块II、多分枝残差注意力模块III和多分枝残差注意力模块IV均包括多分枝残差块和高效注意力模块,多分枝残差块的输入侧与卷积层I、下采样层I、下采样层II或下采样层III相连接,多分枝残差块的输出侧与高效注意力模块的输入侧相连接,高效注意力模块的输出侧与下采样层I、下采样层II、下采样层III或下采样层IV相连接;所述多分枝残差块用于提取训练数据的特征,高效注意力模块用于优化训练数据的特征。
5.根据权利要求4所述的基于多分枝残差注意力网络的智能稽查建模方法,其特征在于,所述多分枝残差块包括多分枝残差单元I、多分枝残差单元II和多分枝残差单元III,多分枝残差单元I的输入侧与卷积层I、下采样层I、下采样层II或下采样层III相连接,多分枝残差单元I的输出侧与多分枝残差单元II的输入侧相连接,多分枝残差单元II的输出侧与多分枝残差单元III的输入侧相连接,多分枝残差单元III的输出侧与高效注意力模块的输入侧相连接,多分枝残差单元II的输出侧与高效注意力模块的输出侧相连接。
6.根据权利要求5所述的基于多分枝残差注意力网络的智能稽查建模方法,其特征在于,所述多分枝残差单元I、多分枝残差单元II和多分枝残差单元III的网络结构相同,均包括第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层,第一卷积层分别与第五卷积层、第二卷积层、第三卷积层和第四卷积层相连接,第二卷积层分别与第三卷积层和第五卷积层相连接,第三卷积层分别与第四卷积层和第五卷积层相连接,第四卷积层与第五卷积层相连接;第一卷积层为多分枝残差单元I、多分枝残差单元II或多分枝残差单元III的输入卷积层,第五卷积层为多分枝残差单元I、多分枝残差单元II或多分枝残差单元III的输出卷积层。
7.根据权利要求5所述的基于多分枝残差注意力网络的智能稽查建模方法,其特征在于,所述高效注意力模块包括第一池化层、一维卷积层I、一维卷积层II、一维卷积层III、激活层和第二池化层,第一池化层分别与一维卷积层I和第二池化层相连接,一维卷积层I与一维卷积层II相连接,一维卷积层II与激活层相连接,激活层与一维卷积层III相连接,一维卷积层III与第二池化层相连接;所述第一池化层为高效注意力模块的输入层,第二池化层为高效注意力模块的输出层。
8.根据权利要求7所述的基于多分枝残差注意力网络的智能稽查建模方法,其特征在于,高效注意力模块优化训练数据的特征的方法为:
对于大小为W×1×C的特征图U,U=[x1,x2,...,xc],对特征图U进行一维化操作,得到一维化后的特征图Z;
利用特征图U的每个通道及其k近邻构造快速一维卷积y,并将一维化后的特征图Z与快速一维卷积y进行卷积运算,得到权重Wk;
利用激活函数对权重Wk进行归一化,并对归一化后的权重进行放大,得到最终的权重Fw;
利用最终的权重Fw加权到特征图U上得到优化后的特征图。
9.根据权利要求8所述的基于多分枝残差注意力网络的智能稽查建模方法,其特征在于,所述一维化后的特征图Z的获得方法为:
其中,zc∈Z={z1,z2,…,zc},FGAP(·)表示将特征通道c中的特征图的线性运算,xi表示特征通道c中第i个特征图,W表示特征通道c中的特征图个数;
所述权重Wk为:
所述最终的权重Fw为:
Fw=n·σ(Wk)
其中,n为权值放大系数,σ(·)为Sigmoid函数;
所述优化后的特征图为:
U′=Fw·U
其中,U′为优化后的特征图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011498663.2A CN112508625B (zh) | 2020-12-18 | 2020-12-18 | 基于多分枝残差注意力网络的智能稽查建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011498663.2A CN112508625B (zh) | 2020-12-18 | 2020-12-18 | 基于多分枝残差注意力网络的智能稽查建模方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112508625A true CN112508625A (zh) | 2021-03-16 |
CN112508625B CN112508625B (zh) | 2022-10-21 |
Family
ID=74922474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011498663.2A Active CN112508625B (zh) | 2020-12-18 | 2020-12-18 | 基于多分枝残差注意力网络的智能稽查建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112508625B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180341860A1 (en) * | 2017-05-23 | 2018-11-29 | Google Llc | Attention-based sequence transduction neural networks |
US20190149834A1 (en) * | 2017-11-15 | 2019-05-16 | Salesforce.Com, Inc. | Dense Video Captioning |
CN110059586A (zh) * | 2019-03-29 | 2019-07-26 | 电子科技大学 | 一种基于空洞残差注意力结构的虹膜定位分割系统 |
CN110188765A (zh) * | 2019-06-05 | 2019-08-30 | 京东方科技集团股份有限公司 | 图像语义分割模型生成方法、装置、设备及存储介质 |
CN110532859A (zh) * | 2019-07-18 | 2019-12-03 | 西安电子科技大学 | 基于深度进化剪枝卷积网的遥感图像目标检测方法 |
CN110929697A (zh) * | 2019-12-17 | 2020-03-27 | 中国人民解放军海军航空大学 | 一种基于残差结构的神经网络目标识别方法及系统 |
CN111259982A (zh) * | 2020-02-13 | 2020-06-09 | 苏州大学 | 一种基于注意力机制的早产儿视网膜图像分类方法和装置 |
CN111445390A (zh) * | 2020-02-28 | 2020-07-24 | 天津大学 | 基于宽残差注意力的三维医学图像超分辨率重建方法 |
CN112016499A (zh) * | 2020-09-04 | 2020-12-01 | 山东大学 | 基于多分支卷积神经网络的交通场景风险评估方法及系统 |
CN112016434A (zh) * | 2020-08-25 | 2020-12-01 | 安徽索贝数码科技有限公司 | 一种基于注意力机制3d残差网络的镜头运动识别方法 |
-
2020
- 2020-12-18 CN CN202011498663.2A patent/CN112508625B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180341860A1 (en) * | 2017-05-23 | 2018-11-29 | Google Llc | Attention-based sequence transduction neural networks |
US20190149834A1 (en) * | 2017-11-15 | 2019-05-16 | Salesforce.Com, Inc. | Dense Video Captioning |
CN110059586A (zh) * | 2019-03-29 | 2019-07-26 | 电子科技大学 | 一种基于空洞残差注意力结构的虹膜定位分割系统 |
CN110188765A (zh) * | 2019-06-05 | 2019-08-30 | 京东方科技集团股份有限公司 | 图像语义分割模型生成方法、装置、设备及存储介质 |
CN110532859A (zh) * | 2019-07-18 | 2019-12-03 | 西安电子科技大学 | 基于深度进化剪枝卷积网的遥感图像目标检测方法 |
CN110929697A (zh) * | 2019-12-17 | 2020-03-27 | 中国人民解放军海军航空大学 | 一种基于残差结构的神经网络目标识别方法及系统 |
CN111259982A (zh) * | 2020-02-13 | 2020-06-09 | 苏州大学 | 一种基于注意力机制的早产儿视网膜图像分类方法和装置 |
CN111445390A (zh) * | 2020-02-28 | 2020-07-24 | 天津大学 | 基于宽残差注意力的三维医学图像超分辨率重建方法 |
CN112016434A (zh) * | 2020-08-25 | 2020-12-01 | 安徽索贝数码科技有限公司 | 一种基于注意力机制3d残差网络的镜头运动识别方法 |
CN112016499A (zh) * | 2020-09-04 | 2020-12-01 | 山东大学 | 基于多分支卷积神经网络的交通场景风险评估方法及系统 |
Non-Patent Citations (5)
Title |
---|
KAIMING HE等: "Deep Residual Learning for Image Recognition", 《2016 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
QILONG WANG等: "ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks", 《2020 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
SHANG-HUA GAO等: "Res2Net: A New Multi-Scale Backbone Architecture", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
彭显刚等: "数据挖掘技术在电价执行稽查中的应用研究", 《电气应用》 * |
金余丰等: "残差网络和注意力机制相结合的滚动轴承故障诊断模型", 《机械科学与技术》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112508625B (zh) | 2022-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tang et al. | A pruning neural network model in credit classification analysis | |
CN111126386A (zh) | 场景文本识别中基于对抗学习的序列领域适应方法 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN113269647B (zh) | 基于图的交易异常关联用户检测方法 | |
Li et al. | Multi-factor based stock price prediction using hybrid neural networks with attention mechanism | |
CN114818579B (zh) | 基于一维卷积长短期记忆网络的模拟电路故障诊断方法 | |
CN111046961B (zh) | 基于双向长短时记忆单元和胶囊网络的故障分类方法 | |
CN114818703B (zh) | 基于BERT语言模型和TextCNN模型的多意图识别方法及系统 | |
CN117151870B (zh) | 一种基于客群画像行为分析方法及系统 | |
CN114330541A (zh) | 道路交通事故风险预测深度学习算法 | |
CN109617864B (zh) | 一种网站识别方法及网站识别系统 | |
CN114488069A (zh) | 基于图神经网络的雷达高分辨率距离像识别方法 | |
CN117435982A (zh) | 一种多维度快速识别网络水军的方法 | |
CN112508625B (zh) | 基于多分枝残差注意力网络的智能稽查建模方法 | |
CN117094835A (zh) | 面向社交媒体内容的多目标群体分类方法 | |
CN111275109A (zh) | 基于自编码器的电力设备状态数据特征选优方法及系统 | |
CN110705638A (zh) | 一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法 | |
CN116304941A (zh) | 一种基于多模型组合的海洋数据质量控制方法及装置 | |
CN114143210B (zh) | 一种基于深度学习的指挥控制网络关键节点识别方法 | |
CN115170334A (zh) | 一种反洗钱模型的训练方法及装置 | |
CN114547294A (zh) | 一种基于传播过程综合信息的谣言检测方法及系统 | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
Wang et al. | Risk assessment of customer churn in telco using FCLCNN-LSTM model | |
CN113283586B (zh) | 一种基于决策机和特征选择的快速入侵检测方法 | |
CN112633399B (zh) | 一种稀疏协同联合表示模式识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |