CN109344144A - 一种低压台区户变关系识别方法和系统 - Google Patents
一种低压台区户变关系识别方法和系统 Download PDFInfo
- Publication number
- CN109344144A CN109344144A CN201811038149.3A CN201811038149A CN109344144A CN 109344144 A CN109344144 A CN 109344144A CN 201811038149 A CN201811038149 A CN 201811038149A CN 109344144 A CN109344144 A CN 109344144A
- Authority
- CN
- China
- Prior art keywords
- data
- voltage
- current
- curve
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000008859 change Effects 0.000 title claims description 10
- 230000005611 electricity Effects 0.000 claims abstract description 21
- 238000004140 cleaning Methods 0.000 claims abstract description 16
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 230000000875 corresponding effect Effects 0.000 claims description 89
- 238000013524 data verification Methods 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 16
- 230000011218 segmentation Effects 0.000 claims description 16
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 230000003203 everyday effect Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 8
- 241001269238 Data Species 0.000 abstract 1
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 230000008569 process Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种低压台区户变关系识别方法和系统,其中,所述方法包括:从用户信息采集系统中获取至少包括档案数据、电压数据和电流数据中的一项或多项的源数据;对源数据进行数据清洗,得到清洗后数据;从清洗后数据中获取能够表征户变关系的用电地址数据和电压数据,并根据用电地址数据和电压数据进行台区识别,得到相应的识别结果;对得到各识别结果进行数据校验;这样,本发明实施例提供的识别方法,能够做到:降低现场人员的工作难度,提高线损计算的准确性,为降损分析提供合理的依据,有效解决了长期困扰电力企业的问题。
Description
技术领域
本发明涉及识别技术领域,具体涉及一种低压台区户变关系识别方法和系统。
背景技术
随着用电信息采集系统的建设与发展,线损管理越来越趋于精细化管理,这就要求户变关系有更高的准确性。同时,由于用电负荷的不断增加,新增的台区数量巨大,户变关系的维护工作日益增大。目前,由于管理方面存在不足,信息更新不及时,信息缺失造成用户和台区的档案信息不正确。混乱的户变关系不仅影响台区线损的正确性,影响电网企业的经营风险和企业效益,而且也会造成用户的计量以及债权纠纷问题。所以,梳理正确的户变关系迫在眉睫,是电力公司急需解决的问题之一。导致配电变压器与表计对应关系错误的原因主要有系统原始资料错误、用户接入点信息错误,表箱、表计错对应等。治理这类问题时要采用现场比对的方法,而在实际过程中由于配电网供电环境的复杂性,供电线路采用架空或地埋方式,走线凌乱,现场人员难以准确判断用户表计实际对应的台区配电变压器。
为正确梳理户变关系,加强线损的精细化管理。电力公司一直在做相关工作和努力。目前,用到的方法有停电法和低压电力线载波通信技术。停电法即通过对变压器与使用该变压器供电的用户做停电处理而记录变压器与表计的隶属关系。虽然现在出现了瞬时停电法,停电时间较短,但该方法会造成居民生活用电不方便,而且相关人员一一核对户变关系也会增加工作量。低压电力线载波通信技术是通过载波设备进行台区识别,虽然该方法的准确率较高,但由于要在表计上安装载波设备或模块,所以适用性不高。
发明内容
本发明实施例的目的在于提供一种低压台区户变关系识别方法和系统,用以解决现有现场人员的工作难度大,线损计算的准确性低的问题。
为实现上述目的,本发明实施例提供一种低压台区户变关系识别方法,所述方法包括:从用户信息采集系统中获取至少包括档案数据、电压数据和电流数据中的一项或多项的源数据;对所述源数据进行数据清洗,得到清洗后数据;从所述清洗后数据中获取能够表征户变关系的用电地址数据和电压数据,并根据所述用电地址数据和所述电压数据进行台区识别,得到相应的识别结果;对得到各识别结果进行数据校验。
可选地,所述档案数据至少包括以下一项:表计或用户的台区编号、用电地址;或者,所述电压数据为最近更新时间的每天96点电压曲线数据;或者,所述电流数据为最新更新时间的每天96点电流曲线数据。
可选地,所述对所述源数据进行数据清洗具体包括:对所述源数据的缺失值进行缺失值补全;或者,若所述电压数据或所述电流数据产生异常,则对所述源数据进行异常值处理;或者,若所述源数据中有重复数据,则对所述源数据进行数据去重的处理。
可选地,所述对所述源数据的缺失值进行缺失值补全具体包括:若缺失值为所述源数据的重要数据,则对该缺失值进行补全;或者,对于所述源数据中的运行数据通过相邻值和/或临近天同时刻的数值进行补全;或者,若所述源数据对应的缺失数据为一天的全部缺失数据,则对该缺失数据不进行补全;或者,若所述源数据对应的缺失数据为档案信息缺失数据,则通过人工核对的方式进行补全。
可选地,所述根据所述用电地址数据和所述电压数据进行台区识别分析具体包括:根据所述用电地址数据进行相应的用电地址识别;根据所述电压数据进行台区识别。
可选地,所述根据所述用电地址数据进行相应的用电地址识别具体包括:选取所述档案数据中的用电地址;对所述用电地址对应的文本进行文本分词处理,得到相应的各切分词语;基于各切分词语,构建相应的词向量空间;统计文本词频,选取词作为特征项,权重用词频表示,通过TF-IDF算法来计算权重值,TF为词频,IDF为一个词在各文本中出现的频率;将各文本转化成相应的向量形式,并通过分类器对各向量形式的各文本进行分类。
可选地,所述对所述用电地址对应的文本进行文本分词处理,得到相应的各切分词语具体包括:若所述用电地址对应的文本为收录到词典的词语,则基于词典的词语进行分类,按照正向匹配法进行文本分词处理,得到相应的各切分词语;若所述用电地址对应的文本为未被词典收录的词语,则基于预设的的统计语言模型进行文本分词处理,得到相应的各切分词语;或者,所述分类器采用K-近邻算法进行分类,所述K-近邻算法是指给定当前测试文本,系统在训练集中查找离该测试文本最近的K个文本,并根据所述K个文本的类别判断当前测试文本的类别。
可选地,所述根据所述电压数据进行台区识别具体包括:选取相同时间段的电压数据,其中,所述电压数据包括总表电压数据和分表电压数据;以台区总表作为基准表,基于皮尔逊相关系数,比较所述总表电压数据与各分表电压数据的相似度,得到相应的相似度值,其中,所述皮尔逊相关系数作为所述相似度的判断标准,两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商;基于相应的相似度值,比较所述总表电压数据与各分表电压数据的各相关系数,若所述总表电压数据与当前分表电压数据的相关系数大于预设相关系数阈值,则判断出总表与当前分表处于同一台区,其中,各相关系数在0-1之间;或者,在试点台区通过ROC曲线面积AUC确定相应的相关系数阈值大小,其中,所述AUC对应的数值与分类的准确度正相关;或者,获取台区识别结果,基于所述台区识别结果计算相应的AUC,并基于相应的AUC对确定出的相关系数阈值进行修正,得到修正后的相关系数阈值。
可选地,所述对得到的各识别结果进行数据校验具体包括:获取所述电流数据,基于所述电流数据得到相同时间内总表电流对应的第一曲线、分表电流和对应的第二曲线,并基于所述第一曲线和所述第二曲线对得到的各识别结果进行数据校验;若所述第一曲线和所述第二曲线一致,分表和总表处于同一台区,则校验出得到的识别结果正确,其中,所述电流数据至少包括以下一项:相同时间内总表电流数据、各分表电流数据、分表电流和数据;或者,获取所述电压数据,基于所述电压数据得到总表电压对应的第三曲线、分表每相对应的各电压曲线,并基于所述第三曲线和分表每相对应的各电压曲线对得到的各识别结果进行数据校验;若将所述第三曲线和分表每相对应的各电压曲线进行比较,比较结果显示出:相同相位同一段时间的电压变化趋势一致,分表和总表处于同一台区,则校验出得到的识别结果正确;或者,若校验出电压曲线存在于错误的台区,对该电压错误的台区进行标记,并重新对该电压错误的台区进行识别及计算;或者,若校验出电流曲线存在于错误的台区,对该电流错误的台区进行标记,并重新对该电流错误的台区进行识别及计算。
与上述方法相匹配,本发明另一方面提供一种低压台区户变关系识别系统,所述系统包括:获取单元,从用户信息采集系统中获取至少包括档案数据、电压数据和电流数据中的一项或多项的源数据;数据清洗单元,对所述获取单元获取到的所述源数据进行数据清洗,得到清洗后数据;识别单元,从所述清洗单元的所述清洗后数据中获取能够表征户变关系的用电地址数据和电压数据,并根据所述用电地址数据和所述电压数据进行台区识别,得到相应的识别结果;数据校验单元,对得到各识别结果进行数据校验。
本发明实施例具有如下优点:本发明实施例提供的一种低压台区户变关系识别方法和系统,能够做到:降低现场人员的工作难度,提高线损计算的准确性,为降损分析提供合理的依据,有效解决了长期困扰电力企业的问题。
附图说明
图1为本发明实施例1提供的一种低压台区户变关系识别方法的流程示意图;
图2为本发明实施例1提供的一种低压台区户变关系识别方法的另一流程示意图;
图3为本发明实施例2提供的一种低压台区户变关系识别系统的结构示意图;
结合附图,本发明的实施例中附图标记如下:
301-获取单元;302-数据清洗单元;303-识别单元;304-数据校验单元。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例1
根据本发明的实施例,提供了一种低压台区户变关系识别方法,如图1所示,为本发明实施例1提供的一种低压台区户变关系识别方法的流程示意图。该方法至少包括以下步骤:
S101,从用户信息采集系统中获取至少包括档案数据、电压数据和电流数据中的一项或多项的源数据;
S102,对源数据进行数据清洗,得到清洗后数据;
S103,从清洗后数据中获取能够表征户变关系的用电地址数据和电压数据,并根据用电地址数据和电压数据进行台区识别,得到相应的识别结果;
S104,对得到各识别结果进行数据校验;这样,本发明实施例提供的一种低压台区户变关系识别方法,能够做到:降低现场人员的工作难度,提高线损计算的准确性,为降损分析提供合理的依据,有效解决了长期困扰电力企业的问题。
在一个可选的例子中,档案数据至少包括以下一项:表计或用户的台区编号、用电地址;或者,电压数据为最近更新时间的每天96点电压曲线数据;或者,电流数据为最新更新时间的每天96点电流曲线数据。
在一个可选的例子中,对源数据进行数据清洗具体包括:对源数据的缺失值进行缺失值补全;或者,若电压数据或电流数据产生异常,则对源数据进行异常值处理;或者,若源数据中有重复数据,则对源数据进行数据去重的处理。
在一个可选的例子中,对源数据的缺失值进行缺失值补全具体包括:若缺失值为源数据的重要数据,则对该缺失值进行补全;或者,对于源数据中的运行数据通过相邻值和/或临近天同时刻的数值进行补全;或者,若源数据对应的缺失数据为一天的全部缺失数据,则对该缺失数据不进行补全;或者,若源数据对应的缺失数据为档案信息缺失数据,则通过人工核对的方式进行补全。
可选地,根据用电地址数据和电压数据进行台区识别分析具体包括:根据用电地址数据进行相应的用电地址识别;根据电压数据进行台区识别。
在一个可选的例子中,根据用电地址数据进行相应的用电地址识别具体包括:选取档案数据中的用电地址;对用电地址对应的文本进行文本分词处理,得到相应的各切分词语;基于各切分词语,构建相应的词向量空间;统计文本词频,选取词作为特征项,权重用词频表示,通过TF-IDF算法来计算权重值,TF为词频,IDF为一个词在各文本中出现的频率;将各文本转化成相应的向量形式,并通过分类器对各向量形式的各文本进行分类。
在一个可选的例子中,对用电地址对应的文本进行文本分词处理,得到相应的各切分词语具体包括:若用电地址对应的文本为收录到词典的词语,则基于词典的词语进行分类,按照正向匹配法进行文本分词处理,得到相应的各切分词语;若用电地址对应的文本为未被词典收录的词语,则基于预设的的统计语言模型进行文本分词处理,得到相应的各切分词语;或者,分类器采用K-近邻算法进行分类,K-近邻算法是指给定当前测试文本,系统在训练集中查找离该测试文本最近的K个文本,并根据K个文本的类别判断当前测试文本的类别。
在一个可选的例子中,根据电压数据进行台区识别具体包括:选取相同时间段的电压数据,其中,电压数据包括总表电压数据和分表电压数据;以台区总表作为基准表,基于皮尔逊相关系数,比较总表电压数据与各分表电压数据的相似度,得到相应的相似度值,其中,皮尔逊相关系数作为相似度的判断标准,两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商;基于相应的相似度值,比较总表电压数据与各分表电压数据的各相关系数,若总表电压数据与当前分表电压数据的相关系数大于预设相关系数阈值,则判断出总表与当前分表处于同一台区,其中,各相关系数在0-1之间;或者,在试点台区通过ROC曲线面积AUC确定相应的相关系数阈值大小,其中,AUC对应的数值与分类的准确度正相关;或者,获取台区识别结果,基于台区识别结果计算相应的AUC,并基于相应的AUC对确定出的相关系数阈值进行修正,得到修正后的相关系数阈值。
需要说明的是,在试点台区通过ROC曲线面积AUC确定相应的相关系数阈值大小的过程是现有技术,在此不再赘述。
此外,基于台区识别结果计算相应的AUC,并基于相应的AUC对确定出的相关系数阈值进行修正,得到修正后的相关系数阈值的过程也是现有技术在,在此不再赘述。
在一个可选的例子中,对得到的各识别结果进行数据校验具体包括:获取电流数据,基于电流数据得到相同时间内总表电流对应的第一曲线、分表电流和对应的第二曲线,并基于第一曲线和第二曲线对得到的各识别结果进行数据校验;若第一曲线和第二曲线一致,分表和总表处于同一台区,则校验出得到的识别结果正确,其中,电流数据至少包括以下一项:相同时间内总表电流数据、各分表电流数据、分表电流和数据;或者,获取电压数据,基于电压数据得到总表电压对应的第三曲线、分表每相对应的各电压曲线,并基于第三曲线和分表每相对应的各电压曲线对得到的各识别结果进行数据校验;若将第三曲线和分表每相对应的各电压曲线进行比较,比较结果显示出:相同相位同一段时间的电压变化趋势一致,分表和总表处于同一台区,则校验出得到的识别结果正确;或者,若校验出电压曲线存在于错误的台区,对该电压错误的台区进行标记,并重新对该电压错误的台区进行识别及计算;或者,若校验出电流曲线存在于错误的台区,对该电流错误的台区进行标记,并重新对该电流错误的台区进行识别及计算。
下面列举一个具体应用场景下的实例,以进一步详细说明本实施例1提供的一种通过数据挖掘进行低压台区识别的方法。操作步骤有获取源数据、数据清洗、算法识别和数据校验。具体步骤如图2所示。
本发明具体步骤如下:
1、获取源数据
从用户信息采集系统中获取档案数据、电压数据和电流数据。档案数据主要包括表计或用户的台区编号、用电地址、用户名、PT、CT等相关信息。电压数据和电流数据指最近时间的每天96点电压或电流曲线数据。
2、数据清洗
源数据是档案数据和运行数据,会存在一些“脏数据”,需要将数据清洗成干净的数据。数据清洗主要包括缺失值补全、异常值处理、数据去重。若缺失值重要,要对其补全。对于运行数据通常通过相邻值和临近天同时刻的数值进行补全,若一天数据全部缺失,由于可能是表计发生接触不良或疑似窃电,则不进行补全。对于档案信息缺失,则需通过人员核对的方式补全。运行数据较档案数据更可能产生异常值,比如电压值为负值或者超过电压最高限值,要进行计算,修改异常值。最后的步骤是数据去重,即对重复数据进行去重。
3、算法识别
数据中能够反映户变关系的数据有用电地址信息和电压数据。根据配电网线路的设计特点,用户就近连接配电变压器,即同一台区的用户的地址都比较接近。但是变压器的供电半径有严格要求,即使地理位置比较接近,也可能会归属于不同台区。另一方面,同一台区的用户电压数据相关性较大,而不同台区的电压数据相关性较小。所以识别分为两个步骤:用电地址识别和电压数据识别,即先通过地址文本分析筛选出位置接近的用户,再通过电压数据分析进行台区识别。
①用电地址识别
用电地址是结构化的中文文本,不同于英文词与词之间靠空格键来分割,首先需要对文本分词。用电地址一般都按由省、市、县、街道的规律组成,具有地理词语规律和词组较短的规律。首先基于词典分类,按照最大正向匹配法进行分词。最大匹配法简称为MM法。其基本思想为:首先从左向右取待切分汉语句的m个字符作为匹配字段,m为大机器词典中最长词条个数。之后查找大机器词典并进行匹配。若匹配成功,则将这个匹配字段作为一个词切分出来。若匹配不成功,则将这个匹配字段的最后一个字去掉,剩下的字符串作为新的匹配字段,进行再次匹配,重复以上过程,直到切分出所有词为止。对于文本中有未收录到词典的词语,则基于统计进行分词。它不依靠词典,而是将文本中任意两个字同时出现的频率进行统计,次数越高的就可能是一个词。它首先切分出与词表匹配的所有可能的词,运用统计语言模型决定最优的切分结果。
分词完成后,构建词向量空间。统计文本词频,选取词作为特征项,权重用词频表示。利用TF-IDF算法来计算权重。TF指词频,IDF反映的是一个词在所有文本中出现的频率。IDF越高,某词在文本中出现的次数越多,公式1为如下:
其中,N代表文本的总数,N(x)代表含有词x的文本总数。
将文本转化成向量的形式后,利用分类器进行分类。所用的分类器为K-近邻算法,即KNN。KNN的基本思想是:给定一个测试文本,系统在训练集中查找离它最近的k个文本,然后根据k个文本的类别判断测试文本的类别。
这样,就可以将数据按照用电地址分类。由于所有用电地址相同的用户不一定都在同一台区,所以要用电压数据进行识别。
②电压数据识别
同一台区同一相位的电压数据相似度高,不同台区的电压数据相似度低。选择台区总表作为基准表,比较总表和分表的电压数据的相似性。电压数据是每天96点的电压值,同一台区内,同时刻的电压值因为电压损失会有所不同,但96点电压数据组成的曲线的变化趋势是大致相同的。所以选择皮尔逊相关系数作为相似度的判定标准。两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商,公式2如下:
其中,ρX,Y表示X和Y两个变量的相关系数。表示X变量的平均值,表示Y变量的平均值。
比较总表与分表的相关系数,相关系数在0-1之间,若大于阈值,则认为是同一台区。在试点台区通过求ROC曲线面积AUC来确定阈值的大小,RUC值越大,证明分类越准确。在后期通过台区识别的结果求AUC,也可以修正阈值。通过比较电压数据的相关性,可以识别用户的台区以及实际相位。
4、数据校验
对同一台区,分表的电流之和与总表的电流之和基本相同,相同相位同一段时间的电压变化趋势一致。利用电流数据画出相同时间总表电流与分表电流和的曲线,检验台区识别的结果。利用电压数据画出总表与分表每相的电压曲线,检验相位识别是否正确。对于电压、电流曲线存在错误的台区,要选择其他日期进行重新台区识别计算。
本发明实施例提供的一种低压台区户变关系识别方法,利用数据挖掘技术开展低压台区户变关系识别,分析台区与用户的互变关系、设备相位识别,降低现场人员的工作难度,提高线损计算的准确性,为降损分析提供合理的依据,有效解决了长期困扰电力企业的问题。
实施例2
根据本发明的实施例,提供了一种低压台区户变关系识别系统,如图3所示,为本发明实施例2提供的一种低压台区户变关系识别系统的结构示意图。
本发明实施例2提供的一种低压台区户变关系识别系统包括获取单元301、数据清洗单元302、识别单元303和数据校验单元304。
具体而言,获取单元301,从用户信息采集系统中获取至少包括档案数据、电压数据和电流数据中的一项或多项的源数据;
数据清洗单元302,对获取单元301获取到的源数据进行数据清洗,得到清洗后数据;
识别单元303,从清洗单元的清洗后数据中获取能够表征户变关系的用电地址数据和电压数据,并根据用电地址数据和电压数据进行台区识别,得到相应的识别结果;
数据校验单元304,对得到各识别结果进行数据校验;这样,本发明实施例提供的一种低压台区户变关系识别系统,能够做到:降低现场人员的工作难度,提高线损计算的准确性,为降损分析提供合理的依据,有效解决了长期困扰电力企业的问题。
在一个可选的例子中,获取单元301获取到的档案数据至少包括以下一项:表计或用户的台区编号、用电地址;或者,电压数据为最近更新时间的每天96点电压曲线数据;或者,电流数据为最新更新时间的每天96点电流曲线数据。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (10)
1.一种低压台区户变关系识别方法,其特征在于,包括:
从用户信息采集系统中获取至少包括档案数据、电压数据和电流数据中的一项或多项的源数据;
对所述源数据进行数据清洗,得到清洗后数据;
从所述清洗后数据中获取能够表征户变关系的用电地址数据和电压数据,并根据所述用电地址数据和所述电压数据进行台区识别,得到相应的识别结果;
对得到各识别结果进行数据校验。
2.根据权利要求1所述的方法,其特征在于,
所述档案数据至少包括以下一项:
表计或用户的台区编号、用电地址;或者,
所述电压数据为最近更新时间的每天96点电压曲线数据;或者,
所述电流数据为最新更新时间的每天96点电流曲线数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述源数据进行数据清洗具体包括:
对所述源数据的缺失值进行缺失值补全;或者,
若所述电压数据或所述电流数据产生异常,则对所述源数据进行异常值处理;或者,
若所述源数据中有重复数据,则对所述源数据进行数据去重的处理。
4.根据权利要求3所述的方法,其特征在于,所述对所述源数据的缺失值进行缺失值补全具体包括:
若缺失值为所述源数据的重要数据,则对该缺失值进行补全;或者,
对于所述源数据中的运行数据通过相邻值和/或临近天同时刻的数值进行补全;或者,
若所述源数据对应的缺失数据为一天的全部缺失数据,则对该缺失数据不进行补全;或者,
若所述源数据对应的缺失数据为档案信息缺失数据,则通过人工核对的方式进行补全。
5.根据权利要求1所述的方法,其特征在于,所述根据所述用电地址数据和所述电压数据进行台区识别分析具体包括:
根据所述用电地址数据进行相应的用电地址识别;
根据所述电压数据进行台区识别。
6.根据权利要求5所述的方法,其特征在于,所述根据所述用电地址数据进行相应的用电地址识别具体包括:
选取所述档案数据中的用电地址;
对所述用电地址对应的文本进行文本分词处理,得到相应的各切分词语;
基于各切分词语,构建相应的词向量空间;
统计文本词频,选取词作为特征项,权重用词频表示,通过TF-IDF算法来计算权重值,TF为词频,IDF为一个词在各文本中出现的频率;
将各文本转化成相应的向量形式,并通过分类器对各向量形式的各文本进行分类。
7.根据权利要求6所述的方法,其特征在于,
所述对所述用电地址对应的文本进行文本分词处理,得到相应的各切分词语具体包括:
若所述用电地址对应的文本为收录到词典的词语,则基于词典的词语进行分类,按照正向匹配法进行文本分词处理,得到相应的各切分词语;
若所述用电地址对应的文本为未被词典收录的词语,则基于预设的的统计语言模型进行文本分词处理,得到相应的各切分词语;或者,
所述分类器采用K-近邻算法进行分类,所述K-近邻算法是指给定当前测试文本,系统在训练集中查找离该测试文本最近的K个文本,并根据所述K个文本的类别判断当前测试文本的类别。
8.根据权利要求5所述的方法,其特征在于,所述根据所述电压数据进行台区识别具体包括:
选取相同时间段的电压数据,其中,所述电压数据包括总表电压数据和分表电压数据;
以台区总表作为基准表,基于皮尔逊相关系数,比较所述总表电压数据与各分表电压数据的相似度,得到相应的相似度值,其中,所述皮尔逊相关系数作为所述相似度的判断标准,两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商;
基于相应的相似度值,比较所述总表电压数据与各分表电压数据的各相关系数,若所述总表电压数据与当前分表电压数据的相关系数大于预设相关系数阈值,则判断出总表与当前分表处于同一台区,其中,各相关系数在0-1之间;或者,
在试点台区通过ROC曲线面积AUC确定相应的相关系数阈值大小,其中,所述AUC对应的数值与分类的准确度正相关;或者,
获取台区识别结果,基于所述台区识别结果计算相应的AUC,并基于相应的AUC对确定出的相关系数阈值进行修正,得到修正后的相关系数阈值。
9.根据权利要求1所述的方法,其特征在于,
所述对得到的各识别结果进行数据校验具体包括:
获取所述电流数据,基于所述电流数据得到相同时间内总表电流对应的第一曲线、分表电流和对应的第二曲线,并基于所述第一曲线和所述第二曲线对得到的各识别结果进行数据校验;若所述第一曲线和所述第二曲线一致,分表和总表处于同一台区,则校验出得到的识别结果正确,其中,所述电流数据至少包括以下一项:相同时间内总表电流数据、各分表电流数据、分表电流和数据;或者,
获取所述电压数据,基于所述电压数据得到总表电压对应的第三曲线、分表每相对应的各电压曲线,并基于所述第三曲线和分表每相对应的各电压曲线对得到的各识别结果进行数据校验;若将所述第三曲线和分表每相对应的各电压曲线进行比较,比较结果显示出:相同相位同一段时间的电压变化趋势一致,分表和总表处于同一台区,则校验出得到的识别结果正确;或者,
若校验出电压曲线存在于错误的台区,对该电压错误的台区进行标记,并重新对该电压错误的台区进行识别及计算;或者,
若校验出电流曲线存在于错误的台区,对该电流错误的台区进行标记,并重新对该电流错误的台区进行识别及计算。
10.一种低压台区户变关系识别系统,其特征在于,包括:
获取单元,从用户信息采集系统中获取至少包括档案数据、电压数据和电流数据中的一项或多项的源数据;
数据清洗单元,对所述获取单元获取到的所述源数据进行数据清洗,得到清洗后数据;
识别单元,从所述清洗单元的所述清洗后数据中获取能够表征户变关系的用电地址数据和电压数据,并根据所述用电地址数据和所述电压数据进行台区识别,得到相应的识别结果;
数据校验单元,对得到各识别结果进行数据校验。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811038149.3A CN109344144A (zh) | 2018-09-06 | 2018-09-06 | 一种低压台区户变关系识别方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811038149.3A CN109344144A (zh) | 2018-09-06 | 2018-09-06 | 一种低压台区户变关系识别方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109344144A true CN109344144A (zh) | 2019-02-15 |
Family
ID=65292334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811038149.3A Pending CN109344144A (zh) | 2018-09-06 | 2018-09-06 | 一种低压台区户变关系识别方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109344144A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109683064A (zh) * | 2019-03-05 | 2019-04-26 | 深圳供电局有限公司 | 配电网络多台区在线识别系统及方法 |
CN110175167A (zh) * | 2019-05-10 | 2019-08-27 | 国网天津市电力公司电力科学研究院 | 一种适用于低压台区用电数据的数据清洗方法及系统 |
CN110221162A (zh) * | 2019-07-25 | 2019-09-10 | 云南电网有限责任公司电力科学研究院 | 基于中性点电压补偿的户、变、相关系确定方法及装置 |
CN110389267A (zh) * | 2019-07-17 | 2019-10-29 | 国网陕西省电力公司电力科学研究院 | 一种基于智能电能表采集数据的低压台区台户关系识别方法 |
CN110516912A (zh) * | 2019-07-24 | 2019-11-29 | 长沙恒电聚能电子科技有限公司 | 一种配电台区户变关系的识别方法 |
CN110707686A (zh) * | 2019-09-06 | 2020-01-17 | 北京市腾河智慧能源科技有限公司 | 台区识别方法、构建台区线路拓扑的方法 |
CN110727662A (zh) * | 2019-09-10 | 2020-01-24 | 国网浙江省电力有限公司电力科学研究院 | 基于相关性分析的低压台区用户相位识别方法和系统 |
CN110749852A (zh) * | 2019-10-15 | 2020-02-04 | 南京林洋电力科技有限公司 | 一种基于瞬时三相功率不平衡的相位识别方法 |
CN111400371A (zh) * | 2020-03-13 | 2020-07-10 | 上海电力大学 | 一种基于电压相关性校验的户变关系识别方法 |
CN111596232A (zh) * | 2020-06-15 | 2020-08-28 | 四川中电启明星信息技术有限公司 | 一种基于电压序列变点检测的户变关系校验方法 |
CN111650431A (zh) * | 2020-05-26 | 2020-09-11 | 珠海中慧微电子有限公司 | 一种电表台区识别方法 |
CN112234605A (zh) * | 2020-09-22 | 2021-01-15 | 北京市腾河智慧能源科技有限公司 | 基于电器启停的负荷特征识别台区户变关系的方法及系统 |
CN112270510A (zh) * | 2020-12-21 | 2021-01-26 | 广东电网有限责任公司佛山供电局 | 一种基于个体和群体电压相似性的户变关系辨识方法 |
CN112348046A (zh) * | 2020-05-20 | 2021-02-09 | 南方电网数字电网研究院有限公司 | 电力设备定位方法、装置、计算机设备和存储介质 |
CN112636335A (zh) * | 2020-12-07 | 2021-04-09 | 云南电网有限责任公司昆明供电局 | 基于电压数据去相关遴选和相关分析的低压配电网户变关系校验方法及系统 |
CN112686308A (zh) * | 2020-12-28 | 2021-04-20 | 青岛鼎信通讯股份有限公司 | 一种基于kh与fcm的低压台区归属识别方法及系统 |
CN112751335A (zh) * | 2020-12-25 | 2021-05-04 | 青岛鼎信通讯股份有限公司 | 一种基于用电信息采集系统的户变关系识别方法 |
CN113256444A (zh) * | 2021-04-30 | 2021-08-13 | 北京中电飞华通信有限公司 | 一种低压台区户变关系辨识方法和装置 |
CN113362076A (zh) * | 2021-05-21 | 2021-09-07 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 一种配电网10kV双电源户变关系分析方法 |
CN113572167A (zh) * | 2021-09-26 | 2021-10-29 | 江苏智臻能源科技有限公司 | 一种低压台区精确分支识别方法 |
CN113612221A (zh) * | 2021-07-20 | 2021-11-05 | 国网湖南省电力有限公司 | Hplc台区集中器与台区总表的相位一致性判定方法 |
CN115344567A (zh) * | 2022-10-18 | 2022-11-15 | 国网天津市电力公司营销服务中心 | 一种适用于边缘计算的低压台区数据清洗治理方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104092481A (zh) * | 2014-07-17 | 2014-10-08 | 江苏林洋电子股份有限公司 | 一种通过电压特征区分台区和相别的方法 |
CN104218581A (zh) * | 2014-09-24 | 2014-12-17 | 国家电网公司 | 一种利用量测数据校验配电网拓扑结构的方法 |
CN104820956A (zh) * | 2015-05-21 | 2015-08-05 | 中国电力科学研究院 | 一种基于数据特征分析的低压配电系统拓扑自动识别方法 |
CN106250927A (zh) * | 2016-07-29 | 2016-12-21 | 国网河南省电力公司电力科学研究院 | 基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN107370147A (zh) * | 2017-07-18 | 2017-11-21 | 国网天津市电力公司 | 一种基于ami数据分析的配电网拓扑修正方法 |
CN108054755A (zh) * | 2017-12-26 | 2018-05-18 | 广州市捷信通科技发展有限公司 | 一种基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN108257374A (zh) * | 2017-12-14 | 2018-07-06 | 国网北京市电力公司 | 户变关系的识别方法和装置 |
-
2018
- 2018-09-06 CN CN201811038149.3A patent/CN109344144A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104092481A (zh) * | 2014-07-17 | 2014-10-08 | 江苏林洋电子股份有限公司 | 一种通过电压特征区分台区和相别的方法 |
CN104218581A (zh) * | 2014-09-24 | 2014-12-17 | 国家电网公司 | 一种利用量测数据校验配电网拓扑结构的方法 |
CN104820956A (zh) * | 2015-05-21 | 2015-08-05 | 中国电力科学研究院 | 一种基于数据特征分析的低压配电系统拓扑自动识别方法 |
CN106250927A (zh) * | 2016-07-29 | 2016-12-21 | 国网河南省电力公司电力科学研究院 | 基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN107370147A (zh) * | 2017-07-18 | 2017-11-21 | 国网天津市电力公司 | 一种基于ami数据分析的配电网拓扑修正方法 |
CN108257374A (zh) * | 2017-12-14 | 2018-07-06 | 国网北京市电力公司 | 户变关系的识别方法和装置 |
CN108054755A (zh) * | 2017-12-26 | 2018-05-18 | 广州市捷信通科技发展有限公司 | 一种基于k最近邻分类算法的配电网拓扑结构校验方法 |
Non-Patent Citations (3)
Title |
---|
孟凡荣: "《煤矿安全监测监控数据知识发现方法》", 30 November 2008 * |
张茹: "《数字内容安全》", 30 September 2017 * |
杨秀璋: "《Python 网络数据爬取及分析从入门到精通 分析篇》", 30 June 2018 * |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109683064A (zh) * | 2019-03-05 | 2019-04-26 | 深圳供电局有限公司 | 配电网络多台区在线识别系统及方法 |
CN109683064B (zh) * | 2019-03-05 | 2021-06-29 | 深圳供电局有限公司 | 配电网络多台区在线识别系统及方法 |
CN110175167A (zh) * | 2019-05-10 | 2019-08-27 | 国网天津市电力公司电力科学研究院 | 一种适用于低压台区用电数据的数据清洗方法及系统 |
CN110389267A (zh) * | 2019-07-17 | 2019-10-29 | 国网陕西省电力公司电力科学研究院 | 一种基于智能电能表采集数据的低压台区台户关系识别方法 |
CN110389267B (zh) * | 2019-07-17 | 2021-05-04 | 国网陕西省电力公司电力科学研究院 | 一种低压台区台户关系识别方法 |
CN110516912A (zh) * | 2019-07-24 | 2019-11-29 | 长沙恒电聚能电子科技有限公司 | 一种配电台区户变关系的识别方法 |
CN110221162A (zh) * | 2019-07-25 | 2019-09-10 | 云南电网有限责任公司电力科学研究院 | 基于中性点电压补偿的户、变、相关系确定方法及装置 |
CN110221162B (zh) * | 2019-07-25 | 2021-05-28 | 云南电网有限责任公司电力科学研究院 | 基于中性点电压补偿的户、变、相关系确定方法及装置 |
WO2021043317A1 (zh) * | 2019-09-06 | 2021-03-11 | 北京市腾河智慧能源科技有限公司 | 台区识别方法、构建台区线路拓扑的方法 |
CN110707686B (zh) * | 2019-09-06 | 2020-07-24 | 北京市腾河智慧能源科技有限公司 | 台区识别方法、构建台区线路拓扑的方法 |
US11774472B2 (en) | 2019-09-06 | 2023-10-03 | Beijing Tengineer Aiot Tech Co., Ltd. | Transformer area identification method and method for constructing transformer area line topology |
CN110707686A (zh) * | 2019-09-06 | 2020-01-17 | 北京市腾河智慧能源科技有限公司 | 台区识别方法、构建台区线路拓扑的方法 |
CN110727662A (zh) * | 2019-09-10 | 2020-01-24 | 国网浙江省电力有限公司电力科学研究院 | 基于相关性分析的低压台区用户相位识别方法和系统 |
CN110749852B (zh) * | 2019-10-15 | 2022-02-01 | 南京林洋电力科技有限公司 | 一种基于瞬时三相功率不平衡的相位识别方法 |
CN110749852A (zh) * | 2019-10-15 | 2020-02-04 | 南京林洋电力科技有限公司 | 一种基于瞬时三相功率不平衡的相位识别方法 |
CN111400371A (zh) * | 2020-03-13 | 2020-07-10 | 上海电力大学 | 一种基于电压相关性校验的户变关系识别方法 |
CN112348046A (zh) * | 2020-05-20 | 2021-02-09 | 南方电网数字电网研究院有限公司 | 电力设备定位方法、装置、计算机设备和存储介质 |
CN111650431A (zh) * | 2020-05-26 | 2020-09-11 | 珠海中慧微电子有限公司 | 一种电表台区识别方法 |
CN111650431B (zh) * | 2020-05-26 | 2022-06-14 | 珠海中慧微电子有限公司 | 一种电表台区识别方法 |
CN111596232A (zh) * | 2020-06-15 | 2020-08-28 | 四川中电启明星信息技术有限公司 | 一种基于电压序列变点检测的户变关系校验方法 |
CN112234605A (zh) * | 2020-09-22 | 2021-01-15 | 北京市腾河智慧能源科技有限公司 | 基于电器启停的负荷特征识别台区户变关系的方法及系统 |
CN112234605B (zh) * | 2020-09-22 | 2022-03-22 | 北京市腾河智慧能源科技有限公司 | 基于电器启停的负荷特征识别台区户变关系的方法及系统 |
CN112636335A (zh) * | 2020-12-07 | 2021-04-09 | 云南电网有限责任公司昆明供电局 | 基于电压数据去相关遴选和相关分析的低压配电网户变关系校验方法及系统 |
CN112636335B (zh) * | 2020-12-07 | 2023-08-08 | 云南电网有限责任公司昆明供电局 | 基于电压数据去相关遴选和相关分析的低压配电网户变关系校验方法及系统 |
CN112270510A (zh) * | 2020-12-21 | 2021-01-26 | 广东电网有限责任公司佛山供电局 | 一种基于个体和群体电压相似性的户变关系辨识方法 |
CN112751335A (zh) * | 2020-12-25 | 2021-05-04 | 青岛鼎信通讯股份有限公司 | 一种基于用电信息采集系统的户变关系识别方法 |
CN112751335B (zh) * | 2020-12-25 | 2022-09-02 | 青岛鼎信通讯股份有限公司 | 一种基于用电信息采集系统的户变关系识别方法 |
CN112686308A (zh) * | 2020-12-28 | 2021-04-20 | 青岛鼎信通讯股份有限公司 | 一种基于kh与fcm的低压台区归属识别方法及系统 |
CN113256444A (zh) * | 2021-04-30 | 2021-08-13 | 北京中电飞华通信有限公司 | 一种低压台区户变关系辨识方法和装置 |
CN113362076A (zh) * | 2021-05-21 | 2021-09-07 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 一种配电网10kV双电源户变关系分析方法 |
CN113612221A (zh) * | 2021-07-20 | 2021-11-05 | 国网湖南省电力有限公司 | Hplc台区集中器与台区总表的相位一致性判定方法 |
CN113572167A (zh) * | 2021-09-26 | 2021-10-29 | 江苏智臻能源科技有限公司 | 一种低压台区精确分支识别方法 |
CN113572167B (zh) * | 2021-09-26 | 2021-12-14 | 江苏智臻能源科技有限公司 | 一种低压台区精确分支识别方法 |
CN115344567A (zh) * | 2022-10-18 | 2022-11-15 | 国网天津市电力公司营销服务中心 | 一种适用于边缘计算的低压台区数据清洗治理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109344144A (zh) | 一种低压台区户变关系识别方法和系统 | |
WO2021184630A1 (zh) | 基于知识图谱定位排污对象的方法及相关设备 | |
CN106934493B (zh) | 一种电力客户价值评估模型的构建方法 | |
CN107992633A (zh) | 基于关键词特征的电子文档自动分类方法及系统 | |
CN108304468A (zh) | 一种文本分类方法以及文本分类装置 | |
CN112699246A (zh) | 基于知识图谱的领域知识推送方法 | |
CN101986296B (zh) | 基于语义本体的噪声数据清洗方法 | |
CN114048870A (zh) | 一种基于日志特征智能挖掘的电力系统异常监测方法 | |
US20120089620A1 (en) | Extracting data | |
CN111179115A (zh) | 故障处理辅助决策方法、装置、存储介质及电子设备 | |
CN109240258A (zh) | 基于词向量的汽车故障智能辅助诊断方法和系统 | |
CN110888973B (zh) | 一种监控信息表自动结构化梳理的方法 | |
CN104216979B (zh) | 中文工艺专利自动分类系统及利用该系统进行专利分类的方法 | |
Ding et al. | Research on text information mining technology of substation inspection based on improved Jieba | |
CN104050556A (zh) | 一种垃圾邮件的特征选择方法及其检测方法 | |
CN107402859A (zh) | 软件功能验证系统及其验证方法 | |
Ao et al. | News keywords extraction algorithm based on TextRank and classified TF-IDF | |
CN113946657A (zh) | 一种基于知识推理的电力业务意图自动识别方法 | |
CN116821310A (zh) | 一种基于大模型和知识图谱的企业知识库问答系统 | |
KR101179613B1 (ko) | 빈발항목과 연관규칙을 이용한 특허문서 자동분류 방법 | |
CN111694957A (zh) | 基于图神经网络的问题单分类方法、设备及存储介质 | |
Yanti et al. | Application of named entity recognition via Twitter on SpaCy in Indonesian (case study: Power failure in the Special Region of Yogyakarta) | |
CN111104483A (zh) | 基于机器学习的ict系统故障分析及辅助判别方法 | |
CN114676698A (zh) | 一种基于知识图谱的设备故障关键信息提取方法及系统 | |
CN110597792A (zh) | 基于同期线损数据融合的多级冗余数据融合方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190215 |