CN115168437A - 一种基于数据分析实现用电用户画像的方法及系统 - Google Patents
一种基于数据分析实现用电用户画像的方法及系统 Download PDFInfo
- Publication number
- CN115168437A CN115168437A CN202211081317.3A CN202211081317A CN115168437A CN 115168437 A CN115168437 A CN 115168437A CN 202211081317 A CN202211081317 A CN 202211081317A CN 115168437 A CN115168437 A CN 115168437A
- Authority
- CN
- China
- Prior art keywords
- data
- behavior
- electricity
- utilization
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24573—Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Pure & Applied Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Mathematical Analysis (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- Library & Information Science (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于数据分析实现用电用户画像的方法及系统,包括:步骤1:采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;步骤2:构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签;步骤3:基于标签设置结果,从所有初始用电行为中提取代表用电行为;步骤4:基于所述代表用电行为构建所述用户的用户用电画像。通过对用户的用电行为设置用电标签,并提取代表用电行为,进而来构建用户用电画像,便于精准锁定用户用电需求,间接方便为用户后续用电情况的精准推荐。
Description
技术领域
本发明涉及数据分析技术领域,特别涉及基于数据分析实现用电用户画像的方法及系统。
背景技术
画像即客户信息标签化,就是分析客户信息,抽象出评价其属性及特征的标签,从而刻画出客户全貌。客户画像反映了客户真实的需求,把握住了客户画像就是把握住了客户体验管理的咽喉。
近年来,随着大数据技术的迅猛发展,不少电力企业基于用户画像,建立与大数据相关的营销体系,以进行精准营销和信息推荐,在进行用户画像确定的过程是基于采集的用户的所有用电数据来进行分析,此种方式不能精准的确定出用户代表行为,进而不能精准的锁定用户用电需求。
因此,本发明提出基于数据分析实现用电用户画像的方法及系统。
发明内容
本发明提供基于数据分析实现用电用户画像的方法及系统,用以通过对用户的用电行为设置用电标签,并提取代表用电行为,进而来构建用户用电画像,便于精准锁定用户用电需求,间接方便为用户后续用电情况的精准推荐。
本发明提供基于数据分析实现用电用户画像的方法,包括:
步骤1:采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;
步骤2:构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签,包括:
获取每类用电数据中不同用电时刻下的用电信息;
基于行为分析模型,对对应类用电数据进行行为分析,得到初始用电行为;
基于信息解析模型,对所述用电信息进行解析,确定同个用电时刻下的并列用电操作;
从所有并列用电操作中提取独有用电操作,并确定每个独有用电操作的操作线;
基于所述并列用电操作以及操作线,得到每个操作线的线特征以及每个时刻的并特征;
获取每个操作线的有效线,并提取所述有效线中每个用电时刻下的并列用电操作,得到与所述有效线对应的基准特征;
基于所述操作线的线特征以及同个操作线中包含的所有基准特征,构建得到对应操作线的特征阵列;
基于所述特征阵列,向对应操作线的初始行为点设置子标签,并得到对应初始用电行为的用电标签;
步骤3:基于标签设置结果,从所有初始用电行为中提取代表用电行为;
步骤4:基于所述代表用电行为构建所述用户的用户用电画像。
优选的,采集用户的历史用电数据,包括:
确定所述用户的身份标识;
建立与所述身份标识相关的用电网络;
分别按照所述用电网络中的每个用电分叉,调取所述用户的用电信息,进而得到历史用电数据。
优选的,对所述历史用电数据进行预分类,得到若干类用电数据,包括:
对所述历史用电数据进行数据预处理,得到第一用电数据;
确定所述第一用电数据的数据有效性;
当所述数据有效性大于预设有效性时,判定所述第一用电数据合格,并按照预分类方式,对所述第一用电数据进行分类,得到若干类用电数据;
对所有第一子有效性对应的分叉权重进行累加和计算,若累加和计算结果小于预设结果,对所述第一子有效性对应的用电数据按照筛选比例进行随机筛选,得到第一待用数据;
否则,将所述第一子有效性对应的分叉权重进行由大到小排序,筛选分叉权重累加和恰好大于预设结果所对应的第二子有效性,并获取与所述第二子有效性对应的第二待用数据;
基于所述第一待用数据、第二待用数据以及第三待用数据,得到合格的第二用电数据,并按照预分类方式,对所述第二用电数据进行分类,得到若干类用电数据。
优选的,按照预分类方式,对所述第二用电数据进行分类,得到若干类用电数据,包括:
获取所述预分类方式的分类指标;
按照所述分类指标,在所述第二用电数据中建立分类中心,并基于所述分类中心,得到围绕所述分类中心的分类数据;
在分类之后,判断是否遗留有剩余未分类数据;
若不存在,将围绕结果作为若干类用电数据;
若存在,确定剩余为分类数据中每个第一数据与每个分类中心的第一距离,并按照最小原则,判断同个第一数据对应的最小距离是否只有一个;
若是,将对应第一数据归类到对应分类中心;
否则,以所述第一数据所在位置为中心,以所述最小距离为半径,构建包围圈;
按照所述最小距离对所述包围圈进行扩展的第一区域进行等区域划分,并分别构建每个第二区域中所存在的其余数据位置中每个位置与该第二区域中分类中心连接线;
以所述第二区域的分类中心为中心点,构建绘制框,并确定所述绘制框中所包含的线段总长;
将对应第一数据归类到最大线段总长对应的分类中心;
基于归类结果以及围绕结果,得到若干类用电数据。
优选的,基于所述特征阵列,向对应操作线的初始行为点设置子标签,包括:
确定所述特征阵列中每个特征元素的特征值;
基于所述特征元素的元素属性以及特征值,计算得到所述特征阵列的标签设置值;
确定所述特征阵列对应的操作线的线类型,并从标签数据库中,调取与所述线类型相关的设置标签符号;
将所述标签设置值附加在所述设置标签符号上,并设置在对应操作线的初始行为点上;
其中,附加上标签设置值的设置标签符号即为子标签。
优选的,基于标签设置结果,从所有初始用电行为中提取代表用电行为,包括:
基于标签设置结果,确定每个初始用电行为的标签集合;
对所述标签集合进行标签解析,得到解析向量;
将所述解析向量进行标准化转换,得到标准向量,并计算所述标准向量的当下值;
当所述当下值大于预设值时,判定对应的初始用电行为为代表用电行为;
否则,将对应初始用电行为剔除。
优选的,基于所述代表用电行为构建所述用户的用户用电画像,包括:
根据每个代表用电行为的行为向量,构建得到对应代表用电行为的行为矩阵;
根据所述行为矩阵中每行行为确定矩阵内部相似比值,同时,确定所述行为矩阵的矩阵外部相似比值;
基于同个代表用电行为的矩阵内部相似比值以及矩阵外部相似比值,得到相似加权值;
基于所有相似加权值-代表用电行为,构建得到所述用户的用户用电画像。
优选的,根据所述行为矩阵中每行行为确定矩阵内部相似比值,包括:
其中,表示对应行为矩阵中行为向量的总个数;=m1-1;表示对应行为矩阵中第j1个行为向量与第j2个行为向量的相似度;表示除去行为向量之外的剩余行为向量与对应行为矩阵中第j1个行为向量的最大相似度;表示对应行为矩阵的矩阵内部相似比值。
本发明提供了基于数据分析实现用电用户画像的系统,包括:
预分类模块,用于采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;
标签设置模块,用于构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签;
行为提取模块,用于基于标签设置结果,从所有初始用电行为中提取代表用电行为;
画像构建模块,用于基于所述代表用电行为构建所述用户的用户用电画像。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中基于数据分析实现用电用户画像的方法的流程图;
图2为本发明实施例中数据归类的结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供基于数据分析实现用电用户画像的方法,如图1所示,包括:
步骤1:采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;
步骤2:构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签;
步骤3:基于标签设置结果,从所有初始用电行为中提取代表用电行为;
步骤4:基于所述代表用电行为构建所述用户的用户用电画像。
该实施例中,历史用电数据包括用电高峰期、用电低峰期以及不同用电器所使用的用电设备等,比如是在家里使用电的情况,来确定不同时刻下的用电器件。
该实施例中,历史用电数据指的是按照高峰期以及低峰期时段对用电数据进行分类,且获取每个时段的用电行为,比如:对高压锅的用电行为(时间、功率、电压等),对洗衣机的用电行为等。
该实施例中,用电标签指的是向不同的初始行为设置用电使用情况也就是用电使用的具备代表性的标签。
该实施例中,代表用电行为主要是根据标签提取到的,比如,存在:行为1、2、3,此时,根据标签提取到行为1为代表用电行为,进而根据该行为1来构建用户用电画像。
上述技术方案的有益效果是:通过对用户的用电行为设置用电标签,并提取代表用电行为,进而来构建用户用电画像,便于精准锁定用户用电需求,间接方便为用户后续用电情况的精准推荐。
本发明提供基于数据分析实现用电用户画像的方法,采集用户的历史用电数据,包括:
确定所述用户的身份标识;
建立与所述身份标识相关的用电网络;
分别按照所述用电网络中的每个用电分叉,调取所述用户的用电信息,进而得到历史用电数据。
该实施例中,身份标识指的是该用户的用电标识,具备唯一性,比如是该用户具备用电家庭1的标识,此时,按照该用电家庭1的标识,来建立该家庭的用电网络,且用电网络比如,指的是家庭中所有需要使用电且处于插电使用电器的设备所构成的网络。
该实施例中,每个电器设备可以对应一个用电分叉,来调取不同设备的用电信息,进而得到历史用电数据。
上述技术方案的有益效果是:通过确定身份标识,构建用电网络,进而来得到用电数据。
本发明提供基于数据分析实现用电用户画像的方法,对所述历史用电数据进行预分类,得到若干类用电数据,包括:
对所述历史用电数据进行数据预处理,得到第一用电数据;
确定所述第一用电数据的数据有效性;
当所述数据有效性大于预设有效性时,判定所述第一用电数据合格,并按照预分类方式,对所述第一用电数据进行分类,得到若干类用电数据;
对所有第一子有效性对应的分叉权重进行累加和计算,若累加和计算结果小于预设结果,对所述第一子有效性对应的用电数据按照筛选比例进行随机筛选,得到第一待用数据;
否则,将所述第一子有效性对应的分叉权重进行由大到小排序,筛选分叉权重累加和恰好大于预设结果所对应的第二子有效性,并获取与所述第二子有效性对应的第二待用数据;
基于所述第一待用数据、第二待用数据以及第三待用数据,得到合格的第二用电数据,并按照预分类方式,对所述第二用电数据进行分类,得到若干类用电数据。
该实施例中,数据预处理指的是删除历史用电数据中无用数据,进而得到第一用电数据。
该实施例中,确定不同用电设备的用电情况,进而确定每个用电设备的有效性,进而来根据用电设备的权重,来构建得到数据的有效性。
该实施例中,预设有效性是预先设置好的,且取值一般为0.3。
该实施例中,预设分类方式指的是按照用电设备的设备用电类型,来对数据进行分类,得到若干类用电数据。
该实施例中,预设差值范围是预先设置好的,范围一般为大于0。
该实施例中,比如存在子有效性1、2、3,此时,第一子有效性为1,且对应的分叉权重小于预设结果,则对对应的用电数据按照比例筛选,且比例筛选指的是,该子有效性基于所有有效性的比值,比如是1/3。
该实施例中,如果分叉权重不小于预设结果,此时,将该第一子有效性1作为第二子有效性,并将数据是为第二待用数据。
上述技术方案的有益效果是:通过对数据进行无用数据的剔除,且通过计算子有效性以及数据有效性,确定对数据分类的数据基础群体,且在确定基础群体的故丛横中,按照差值大小以及权重大小来实现对数据的筛选,保证数据的可靠性,为后续确定代表用电行为提供基础。
本发明提供基于数据分析实现用电用户画像的方法,按照预分类方式,对所述第二用电数据进行分类,得到若干类用电数据,包括:
获取所述预分类方式的分类指标;
按照所述分类指标,在所述第二用电数据中建立分类中心,并基于所述分类中心,得到围绕所述分类中心的分类数据;
在分类之后,判断是否遗留有剩余未分类数据;
若不存在,将围绕结果作为若干类用电数据;
若存在,确定剩余为分类数据中每个第一数据与每个分类中心的第一距离,并按照最小原则,判断同个第一数据对应的最小距离是否只有一个;
若是,将对应第一数据归类到对应分类中心;
否则,以所述第一数据所在位置为中心,以所述最小距离为半径,构建包围圈;
按照所述最小距离对所述包围圈进行扩展的第一区域进行等区域划分,并分别构建每个第二区域中所存在的其余数据位置中每个位置与该第二区域中分类中心连接线;
以所述第二区域的分类中心为中心点,构建绘制框,并确定所述绘制框中所包含的线段总长;
将对应第一数据归类到最大线段总长对应的分类中心;
基于归类结果以及围绕结果,得到若干类用电数据。
该实施例中,预分类方式的指标,比如是,按照不同的电器标准用电范围情况对其进行分类,比如电器1的标准用电为1,电器2的标准用电为1,此时,将电器1和电器2是为一类,以此类推。
该实施例中,通过用电范围来对不同的电器进行归类,且在归类的过程中,判断是否存在遗漏。
比如:数据1、数据2归中心01,数据3、数据4归中心02,此时,还遗漏数据5,确定数据5到不同中心的距离,进而按照最小原则,来对最小距离是否只有一个进行判断,且分类中心的确定可以是基于范围中的中间值进行确定的。
该实施例中,如图2所示,假如是存在一个中心01,此时,包围圈为02,进行扩展的第一区域为03,比如存在两个一样的最小距离,此时进行按照三份对第一区域进行划分,04表示区域中存在的其他数据,05为绘制框,且绘制框中的所有线段的总长进行比较,来确定归于的分类中心,进而得到类用电数据。
上述技术方案的有益效果是:通过按照分类指标,确定分类中心,得到分类数据,实现数据分类,其中,在确定未分类数据的归于分类中心的问题上,通过按照最小原则以及建立包围圈以及绘制框,来得到线段总长,实现归类,为数据分类提供基础。
本发明提供基于数据分析实现用电用户画像的方法,构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签,包括:
获取每类用电数据中不同用电时刻下的用电信息;
基于行为分析模型,对对应类用电数据进行行为分析,得到初始用电行为;
基于信息解析模型,对所述用电信息进行解析,确定同个用电时刻下的并列用电操作;
从所有并列用电操作中提取独有用电操作,并确定每个独有用电操作的操作线;
基于所述并列用电操作以及操作线,得到每个操作线的线特征以及每个时刻的并特征;
获取每个操作线的有效线,并提取所述有效线中每个用电时刻下的并列用电操作,得到与所述有效线对应的基准特征;
基于所述操作线的线特征以及同个操作线中包含的所有基准特征,构建得到对应操作线的特征阵列;
基于所述特征阵列,向对应操作线的初始行为点设置子标签,并得到对应初始用电行为的用电标签。
该实施例中,比如,类1中,包含的用电设备为1、2、3,此时,获取不同时刻下用电设备1、2以及3的用电信息。
该实施例中,行为分析模型是预先训练好的,且以类的用电信息以及对应的行为在内的,因此,通过对对应类用电数据进行分析,可以得到对应的初始用电行为。
该实施例中,信息解析模型是预先训练好的,且以不同组合的用电信息以及对应的用电操作在内的,进而通过对该信息进行解析,可以得到并列用电操作,比如,时刻1下存在的并列用电操作为:操作1、操作2,时刻2下存在并列用电操作:操作2、操作3,此时,对应的独有用电操作为:操作1、操作2以及操作3,且可以构成3个操作线,且该操作线指的是持续时间段都在执行同个操作。
比如:时刻1-时刻2:操作线01;
时刻1:操作线02;
时刻3:操作线03;
时刻1:操作1、操作2,时刻2:操作1;时刻3:操作3;
且线特征是针对操作线获取到的,且操作线是针对的同个操作,比如是一直使用热水壶,且热水壶处于加热阶段的可以是为有效线,且该有效线对应的并列其他操作对应的特征为基准特征。
该实施例中,比如:线特征为01,对应基准特征包括001、003,此时,特征阵列为[01001 003]。
该实施例中,操作线的初始行为点指的是该操作线的初始发生时间点。
该实施例中,阵列不同对应的子标签不同,主要是为了对用电行为进行有效标定,为后续确定代表行为提供基础。
上述技术方案的有益效果是:通过对类用电数据进行分析,并通过对用电信息进行解析,便于基于并列用电操作以及操作线进行特征阵列的构建,来设置子标签,保证用电的代表性,为后续确定代表用电行为提供基础。
本发明提供基于数据分析实现用电用户画像的方法,基于所述特征阵列,向对应操作线的初始行为点设置子标签,包括:
确定所述特征阵列中每个特征元素的特征值;
基于所述特征元素的元素属性以及特征值,计算得到所述特征阵列的标签设置值;
确定所述特征阵列对应的操作线的线类型,并从标签数据库中,调取与所述线类型相关的设置标签符号;
将所述标签设置值附加在所述设置标签符号上,并设置在对应操作线的初始行为点上;
其中,附加上标签设置值的设置标签符号即为子标签。
该实施例中,特征阵列中包含的特征元素,都具有特征值,进而根据属性与值,确定设置值,其中,根据属性确定权重,通过权重与值相乘,再累加和计算,得到设置值。
该实施例中,线操作是针对的不同用电设备,且用电设备的用电类型,进而调取与该类型相关的标签符号。
该实施例中,标签值与标签符号的结合,可以作为子标签。
上述技术方案的有益效果是:通过确定标签设置值以及标签符号,便于设置子标签,为后续提取代表行为提供基础,保证画像获取的精准性。
本发明提供基于数据分析实现用电用户画像的方法,基于标签设置结果,从所有初始用电行为中提取代表用电行为,包括:
基于标签设置结果,确定每个初始用电行为的标签集合;
对所述标签集合进行标签解析,得到解析向量;
将所述解析向量进行标准化转换,得到标准向量,并计算所述标准向量的当下值;
当所述当下值大于预设值时,判定对应的初始用电行为为代表用电行为;
否则,将对应初始用电行为剔除。
该实施例中,标签集合解析,主要是为了获取解析向量,也就是将每个标签转换为对应的值,构建得到解析向量,且标准换转换是为了对解析向量中的某些值进行系数调整,进而得到标准向量。
该实施例中,当下值可以是标准向量中所有元素值的累加和,且预设值是预先设置好的。
上述技术方案的有益效果是:通过对标签进行解析以及标准转化,便于有效判定是否可以作为代表用电行为,为构建画像提供有效基础。
本发明提供基于数据分析实现用电用户画像的方法,基于所述代表用电行为构建所述用户的用户用电画像,包括:
根据每个代表用电行为的行为向量,构建得到对应代表用电行为的行为矩阵;
根据所述行为矩阵中每行行为确定矩阵内部相似比值,同时,确定所述行为矩阵的矩阵外部相似比值;
基于同个代表用电行为的矩阵内部相似比值以及矩阵外部相似比值,得到相似加权值;
基于所有相似加权值-代表用电行为,构建得到所述用户的用户用电画像。
该实施例中,不同的代表用电行为用行为向量表示,来构建矩阵,且由于每个行为的偏向性是不一样的,因此,来获取行为向量的行为偏向性,进而来确定矩阵内部相似比值以及矩阵外部相似比值,来得到相似加权值。
该实施例中,相似加权值越大,对应的参考价值越大,对应的用电画像越趋于该方面。
上述技术方案的有益效果是:通过构建矩阵,并确定矩阵中的矩阵内部相似比值以及矩阵外部相似比值,来得到相似加权值,进而来构建用户画像,为后续提供便利。
本发明提供基于数据分析实现用电用户画像的方法,根据所述行为矩阵中每行行为确定矩阵内部相似比值,包括:
其中,表示对应行为矩阵中行为向量的总个数;=m1-1;表示对应行为矩阵中第j1个行为向量与第j2个行为向量的相似度;表示除去行为向量之外的剩余行为向量与对应行为矩阵中第j1个行为向量的最大相似度;表示对应行为矩阵的矩阵内部相似比值。
该实施例中,矩阵外部相似比值是基于该矩阵与其他矩阵之间的相似度比值,计算方法与矩阵内部相似比值类似。
上述技术方案的有益效果是:通过对矩阵内部中每行向量之间的相似度比较,来得到矩阵内部相似比值,为构建用户画像提供基础。
本发明提供了基于数据分析实现用电用户画像的系统,包括:
预分类模块,用于采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;
标签设置模块,用于构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签;
行为提取模块,用于基于标签设置结果,从所有初始用电行为中提取代表用电行为;
画像构建模块,用于基于所述代表用电行为构建所述用户的用户用电画像。
上述技术方案的有益效果是:通过对用户的用电行为设置用电标签,并提取代表用电行为,进而来构建用户用电画像,便于精准锁定用户用电需求,间接方便为用户后续用电情况的精准推荐。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (9)
1.基于数据分析实现用电用户画像的方法,其特征在于,包括:
步骤1:采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;
步骤2:构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签,包括:
获取每类用电数据中不同用电时刻下的用电信息;
基于行为分析模型,对对应类用电数据进行行为分析,得到初始用电行为;
基于信息解析模型,对所述用电信息进行解析,确定同个用电时刻下的并列用电操作;
从所有并列用电操作中提取独有用电操作,并确定每个独有用电操作的操作线;
基于所述并列用电操作以及操作线,得到每个操作线的线特征以及每个时刻的并特征;
获取每个操作线的有效线,并提取所述有效线中每个用电时刻下的并列用电操作,得到与所述有效线对应的基准特征;
基于所述操作线的线特征以及同个操作线中包含的所有基准特征,构建得到对应操作线的特征阵列;
基于所述特征阵列,向对应操作线的初始行为点设置子标签,并得到对应初始用电行为的用电标签;
步骤3:基于标签设置结果,从所有初始用电行为中提取代表用电行为;
步骤4:基于所述代表用电行为构建所述用户的用户用电画像。
2.如权利要求1所述的基于数据分析实现用电用户画像的方法,其特征在于,采集用户的历史用电数据,包括:
确定所述用户的身份标识;
建立与所述身份标识相关的用电网络;
分别按照所述用电网络中的每个用电分叉,调取所述用户的用电信息,进而得到历史用电数据。
3.如权利要求1所述的基于数据分析实现用电用户画像的方法,其特征在于,对所述历史用电数据进行预分类,得到若干类用电数据,包括:
对所述历史用电数据进行数据预处理,得到第一用电数据;
确定所述第一用电数据的数据有效性;
当所述数据有效性大于预设有效性时,判定所述第一用电数据合格,并按照预分类方式,对所述第一用电数据进行分类,得到若干类用电数据;
对所有第一子有效性对应的分叉权重进行累加和计算,若累加和计算结果小于预设结果,对所述第一子有效性对应的用电数据按照筛选比例进行随机筛选,得到第一待用数据;
否则,将所述第一子有效性对应的分叉权重进行由大到小排序,筛选分叉权重累加和恰好大于预设结果所对应的第二子有效性,并获取与所述第二子有效性对应的第二待用数据;
基于所述第一待用数据、第二待用数据以及第三待用数据,得到合格的第二用电数据,并按照预分类方式,对所述第二用电数据进行分类,得到若干类用电数据。
4.如权利要求3所述的基于数据分析实现用电用户画像的方法,其特征在于,按照预分类方式,对所述第二用电数据进行分类,得到若干类用电数据,包括:
获取所述预分类方式的分类指标;
按照所述分类指标,在所述第二用电数据中建立分类中心,并基于所述分类中心,得到围绕所述分类中心的分类数据;
在分类之后,判断是否遗留有剩余未分类数据;
若不存在,将围绕结果作为若干类用电数据;
若存在,确定剩余为分类数据中每个第一数据与每个分类中心的第一距离,并按照最小原则,判断同个第一数据对应的最小距离是否只有一个;
若是,将对应第一数据归类到对应分类中心;
否则,以所述第一数据所在位置为中心,以所述最小距离为半径,构建包围圈;
按照所述最小距离对所述包围圈进行扩展的第一区域进行等区域划分,并分别构建每个第二区域中所存在的其余数据位置中每个位置与该第二区域中分类中心连接线;
以所述第二区域的分类中心为中心点,构建绘制框,并确定所述绘制框中所包含的线段总长;
将对应第一数据归类到最大线段总长对应的分类中心;
基于归类结果以及围绕结果,得到若干类用电数据。
5.如权利要求1所述的基于数据分析实现用电用户画像的方法,其特征在于,基于所述特征阵列,向对应操作线的初始行为点设置子标签,包括:
确定所述特征阵列中每个特征元素的特征值;
基于所述特征元素的元素属性以及特征值,计算得到所述特征阵列的标签设置值;
确定所述特征阵列对应的操作线的线类型,并从标签数据库中,调取与所述线类型相关的设置标签符号;
将所述标签设置值附加在所述设置标签符号上,并设置在对应操作线的初始行为点上;
其中,附加上标签设置值的设置标签符号即为子标签。
6.如权利要求1所述的基于数据分析实现用电用户画像的方法,其特征在于,基于标签设置结果,从所有初始用电行为中提取代表用电行为,包括:
基于标签设置结果,确定每个初始用电行为的标签集合;
对所述标签集合进行标签解析,得到解析向量;
将所述解析向量进行标准化转换,得到标准向量,并计算所述标准向量的当下值;
当所述当下值大于预设值时,判定对应的初始用电行为为代表用电行为;
否则,将对应初始用电行为剔除。
7.如权利要求1所述的基于数据分析实现用电用户画像的方法,其特征在于,基于所述代表用电行为构建所述用户的用户用电画像,包括:
根据每个代表用电行为的行为向量,构建得到对应代表用电行为的行为矩阵;
根据所述行为矩阵中每行行为确定矩阵内部相似比值,同时,确定所述行为矩阵的矩阵外部相似比值;
基于同个代表用电行为的矩阵内部相似比值以及矩阵外部相似比值,得到相似加权值;
基于所有相似加权值-代表用电行为,构建得到所述用户的用户用电画像。
9.基于数据分析实现用电用户画像的系统,其特征在于,包括:
预分类模块,用于采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;
标签设置模块,用于构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签;
行为提取模块,用于基于标签设置结果,从所有初始用电行为中提取代表用电行为;
画像构建模块,用于基于所述代表用电行为构建所述用户的用户用电画像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211081317.3A CN115168437B (zh) | 2022-09-06 | 2022-09-06 | 一种基于数据分析实现用电用户画像的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211081317.3A CN115168437B (zh) | 2022-09-06 | 2022-09-06 | 一种基于数据分析实现用电用户画像的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115168437A true CN115168437A (zh) | 2022-10-11 |
CN115168437B CN115168437B (zh) | 2022-11-25 |
Family
ID=83481288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211081317.3A Active CN115168437B (zh) | 2022-09-06 | 2022-09-06 | 一种基于数据分析实现用电用户画像的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115168437B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116757442A (zh) * | 2023-08-09 | 2023-09-15 | 国网浙江省电力有限公司 | 基于限流算法的复杂用电行为用户画像构建方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144468A (zh) * | 2019-12-19 | 2020-05-12 | 国网冀北电力有限公司信息通信分公司 | 电力用户信息标签化方法和装置、电子设备以及存储介质 |
WO2021208342A1 (zh) * | 2020-04-14 | 2021-10-21 | 广东卓维网络有限公司 | 一种多元用户与电网友好互动用电系统 |
CN113837274A (zh) * | 2021-09-24 | 2021-12-24 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 基于用电特性分析的用户用电行为画像方法及装置 |
-
2022
- 2022-09-06 CN CN202211081317.3A patent/CN115168437B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144468A (zh) * | 2019-12-19 | 2020-05-12 | 国网冀北电力有限公司信息通信分公司 | 电力用户信息标签化方法和装置、电子设备以及存储介质 |
WO2021208342A1 (zh) * | 2020-04-14 | 2021-10-21 | 广东卓维网络有限公司 | 一种多元用户与电网友好互动用电系统 |
CN113837274A (zh) * | 2021-09-24 | 2021-12-24 | 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 | 基于用电特性分析的用户用电行为画像方法及装置 |
Non-Patent Citations (2)
Title |
---|
傅军等: "电力用户行为画像构建技术研究", 《电气应用》 * |
王成亮等: "基于模糊聚类的电力客户用电行为模式画像", 《电测与仪表》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116757442A (zh) * | 2023-08-09 | 2023-09-15 | 国网浙江省电力有限公司 | 基于限流算法的复杂用电行为用户画像构建方法及系统 |
CN116757442B (zh) * | 2023-08-09 | 2023-10-24 | 国网浙江省电力有限公司 | 基于限流算法的复杂用电行为用户画像构建方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115168437B (zh) | 2022-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111368890A (zh) | 故障检测方法及装置、信息物理融合系统 | |
CN109389180A (zh) | 一款基于深度学习的电力设备图像识别方法及巡查机器人 | |
CN110458195B (zh) | 一种基于多判据融合的异常数据甄别方法 | |
CN112434799B (zh) | 基于全卷积神经网络的非侵入式负荷识别方法 | |
CN111080105A (zh) | 基于电压时序数据的台区户变关系识别方法及系统 | |
CN115168437B (zh) | 一种基于数据分析实现用电用户画像的方法及系统 | |
CN110309884A (zh) | 基于泛在电力物联网体系的用电数据异常识别系统 | |
CN111861023A (zh) | 基于统计学的混合风电功率预测方法、装置 | |
CN111506635A (zh) | 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 | |
CN115660262B (zh) | 一种基于数据库应用的工程智慧质检方法、系统及介质 | |
CN115617784A (zh) | 一种信息化配电的数据处理系统及其处理方法 | |
TWI662809B (zh) | 影像串流服務的障礙定位系統及維運方法 | |
CN111092764B (zh) | 一种实时动态亲密度关系分析方法及系统 | |
CN112113638A (zh) | 水表功能自检装置及方法 | |
CN116168213A (zh) | 人流量数据的识别方法和人流量数据识别模型的训练方法 | |
CN116361482A (zh) | 基于知识图谱技术的电力效能场景化抽取模型及方法及辅助系统 | |
CN115880472A (zh) | 一种电力红外图像数据智能诊断分析系统 | |
CN115713027A (zh) | 一种变压器状态评估方法、装置及系统 | |
CN113535820A (zh) | 一种基于卷积神经网络的电气操作人员属性推测方法 | |
CN115598459A (zh) | 一种配电网10kV馈线故障停电预测方法 | |
CN114818234A (zh) | 一种电力设备智能化综合运行健康识别管理方法及系统 | |
CN105160024A (zh) | 一种大数据用电分析的系统和方法 | |
CN111143835A (zh) | 基于机器学习的电力计量系统业务逻辑非侵入式防护方法 | |
CN115601197B (zh) | 光伏电站的异常状态检测方法、装置 | |
CN115809761B (zh) | 一种基于低压台区的电压质量分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |