CN114266512A - 一种用户用能行为分析方法及系统及装置及介质 - Google Patents
一种用户用能行为分析方法及系统及装置及介质 Download PDFInfo
- Publication number
- CN114266512A CN114266512A CN202210184341.3A CN202210184341A CN114266512A CN 114266512 A CN114266512 A CN 114266512A CN 202210184341 A CN202210184341 A CN 202210184341A CN 114266512 A CN114266512 A CN 114266512A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- similarity matrix
- behavior
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/82—Energy audits or management systems therefor
Abstract
本发明公开了一种用户用能行为分析方法及系统及装置及介质,涉及数据分析领域,包括:基于用户用能行为样本数据获得训练数据并进行分类与标注获得训练样本;基于用户特征信息建立基于该特征的相似性复杂网络,基于所有特征对于的相似性复杂网络获得第一相似性矩阵;基于第一相似性矩阵构建相似度矩阵;基于训练样本和相似度矩阵进行训练获得用户用能行为相似性矩阵;获得用户用能行为待分类的第一用户数据,对第一用户数据中的部分用户用能行为数据进行分类与标注,获得标签样本;基于标签样本和用户用能行为相似性矩阵,对第一用户数据中的未分类用户用能行为数据进行分类与标注,本发明解决了现有用户用能行为分析方法的局限性。
Description
技术领域
本发明涉及数据分析领域,具体地,涉及一种用户用能行为分析方法及系统及装置及介质。
背景技术
用电行为分析是电网分析规划的重要环节,立足于用户侧视角,研究用电行为规律,分析其环境感知机理,从不同时空范围建立模式识别模型以描述用户用电特性。用电行为包含了用户在外界环境影响下进行的用电活动及背后的行为规律。前者是一种显性行为,可通过智能电表等采样并以负荷曲线等形式表现;而用电行为规律则包含了用户习惯偏好、思维方式等用电态度,是一种隐性行为,需通过深入挖掘显性行为方能得到,对决策更具指导性。随着不断开放的售电市场催生繁荣的商业模式,售电商更加重视电力用户用电体验,从需求响应、用户代理、电价结构设计等方面广泛开展以用户为中心的售电服务以提升自身竞争力。在这种市场基础下,用电行为分析研究能够通过挖掘电力用户行为模式和需求特性为电网管理侧提供决策依据,从而提升售电商、负荷聚集商、数据服务提供商和配网调度员的业务质量,推动电力消费智能化变革,也有助于引导用户绿色用电。
传统的电力分析通常使用求解巨维微分-代数方程组的方法来分析电力系统的动态行为。该方法可以很好的处理简单网络的分析,但是对于复杂的电力网络进行分析研究时,这类方法无法揭示用户用能行为特征,具有较大的局限性。
为了便于理解和实施,下面对与本方案相关的几种现有技术进行介绍:
现有技术1:
方案来源:《一种基于减法聚类模型的多表融合用能行为分析方法》申请号:CN201910029623.4
具体方案:
步骤1、根据采集的水、电、气示度计算每日用能量;
步骤2、对用户用能量进行清洗,去除明显异常用能数据;
步骤3、将用电量,用水量,用气量组成三维的用能数据作为该用户每日的用能数据;并根据聚类周期,构筑数据矢量,拼接的顺序要求每个用户一致;
步骤4、初始化聚类数目,计算每个用户数据点处的密度指标,选取具有最高密度指标的数据点为第一个聚类中心;
步骤5、增加聚类数目,对聚类中心选中的用户数据点,更新每个用户数据的密度指标,并选取具有最高密度指标的数据点为新的聚类中心;
步骤6、在未达到决定聚类数目之前重复步骤5,直到完成。
方案缺点:
该发明具备一定的多平台数据融合特性,但仅采取了每日用量一个特征,特征数量较少,分析能力较弱,对于多尺度的大数据环境可用性不高。
现有技术2:
方案来源:《基于用户用能标签的综合能源负荷预测方法及系统》申请号 :CN202010971992.8
具体方案:
S1,结合用能场景进行用户用能行为分析,并构建用户用能标签体系;
S2,选取关键用户用能标签,进行短期和中长期负荷预测的用户标签嵌入;
S3,构建基于用户标签的CNN-LSTM负荷预测模型;
S4,利用CNN-LSTM负荷预测模型进行综合能源短期和中长期的负荷预测。
方案缺点:
单纯分析了用户用电场景的下的用能行为,无法分析其他场景如互联网、电信网等用户行为对用户用能行为的影响。
现有技术3:
方案来源:《基于多层复杂网络的四网融合用户用能数据模型构建方法》202010447886 .X
具体方案:
采集多维样本使用数据,所述多维样本数据包括电网使用数据、电信网使用数据、广电网使用数据和互联网使用数据;
基于所述多维样本数据对每个粒度网络进行建模,将每个粒度中每个用户使用的每个维度的样本数据作为一个节点,将所述每个维度的样本数据的节点之间的具有交互关系的使用连边连接;
构建四层网络,所述四层网络包括电网层、电信网层、广电网层和互联网层,将每个粒度的多个用户的电网使用数据、电信网使用数据、广电网使用数据和互联网使用数据放在对应的层中,将所有所述节点投射到每一层中,并将相邻层上代表同一用户交互关系的所述节点用耦合边连接;
构建属性层,所述属性层包括多个用户类型,将每个用户类型作为一个属性节点,所述属性节点代表每层网络中节点的属性值,各网络层中的某一所述节点包含所述属性值时,将所述属性节点与所述节点用属性边连接;
将每一层均构建为图G(V ,E ,A),其中,V表示节点集,E表示边集,A是各节点存储的信息,所述各节点存储的信息包括用户名称、用户类型以及相应的用能数据。
方案缺点:
不同层的复杂网络内在联系薄弱,虽然能够分析各个网络对用户用能的影响,但是即使同一用能习惯的用户,在其他网络的行为也会出现较大差别,对分析用户用能行为作用有限。
现有技术4:
方案来源:《一种基于神经网络的用户侧综合能效评价方法》申请号:202010798317 .X
具体方案:
获取待评价用户的能效指标数据,所述能效指标数据为预设指标体系中各一级能效指标对应的各二级能效指标数据;
将待评估用户的二级能效指标数据输入预先训练的综合能效评估模型,得到综合能效评估模型输出的待评估用户的一级能效指标评价结果;
所述预先训练的综合能效评估模型采用神经网络,神经网络以二级能效指标数据为输入,以二级能效指标对应的各一级能效指标评价结果为输出,训练样本为已知一级能效指标评价结果和对应的二级能效指标数据。
方案缺点:
该方案是一种用户用能行为的分析方案,但效能分析的合理性决定于效能指标,效能指标如果不够合理准确,那么神经网络训练得到的用户用能效能分析也会不够准确。
现有技术5:
方案来源:《一种多维、多层、多粒度的多网融合建模方法》申请号:202010330031.9
具体方案:
根据电网数据、电信网数据、广电网数据、互联网数据,构建多维网络模型,所述多维网络模型包括电网多维网络、电信网多维网络、广电网多维网络、互联网多维网络;
在所述多维网络模型中,根据不同网络节点作为粒度单元,构建多粒度网络模型;
根据电网、电信网、广电网、互联网之间的耦合和关联关系,将不同网络之间的相关联网络节点连线,构建多层网络模型;
通过上述步骤,得到多维、多层、多粒度的复杂网络模型,用于描述多网融合后的复杂系统。
方案缺点:
该方法最终得到的复杂系统会随着层数、维度的增加,而变得极为复杂,用户之间的关系会变得难以分析,并且没有给出用户用能。
发明内容
为了解决现有用户用能行为分析方法的局限性,本发明提供了一种用户用能行为分析方法及系统及装置及介质。
为实现上述发明目的,本发明提供了一种用户用能行为分析方法,所述方法包括:
基于用户用能行为样本数据获得训练数据;
对所述训练数据进行分类与标注获得训练样本;
以用户为节点,任意两个用户之间的某个特征相似度为边的权重,建立基于该特征的相似性复杂网络,基于所有特征对于的相似性复杂网络获得第一相似性矩阵;
基于所述第一相似性矩阵构建相似度矩阵;
基于所述训练样本和所述相似度矩阵对所述第一相似性矩阵进行迭代更新,获得用户用能行为相似性矩阵;
获得用户用能行为待分类的第一用户数据,对所述第一用户数据中的部分用户用能行为数据进行分类与标注,获得标签样本;
基于所述标签样本和所述用户用能行为相似性矩阵,对所述第一用户数据中的未分类用户用能行为数据进行分类与标注。
申请人研究发现为了深入研究复杂电力网络的机理,揭示用户用能行为的影响因素,采用复杂网络相关理论进行分析是非常好的切入点,因此通过分析电力网络以及与之相关其他网络之间的联系(如电信网、广电网、互联网等),建立整体的复杂网络融合体系,对于分析用户用能行为特征是非常必要的。
现有的复杂网络的主要研究方法有单一网络建模、树形结构模型、二分网、小世界模型等。但是这些研究方法分析基于电网、电信网、广电网、互联网等多网融合的用户数据及用能行为就存在一定的局限性。其中,单一网络所有的节点和连边均是同质的;树形结构模型易于构造,但过于简单,模型的网络拓扑与现实场景相差较大;二分网无法刻画多个节点之间的相互联系。
基于目前存在的问题情况,本发明提出了一种用户用能行为分析方法,该方法能够融合用户不同维度下的特征信息(如电网信息、互联网信息等),分析用户用能行为的相似性,从而实现对用户用能行为的分类。
本发明通过构建用户不同特征数据构成的复杂网络,计算每个特征对应的初始网络,分析用户所有数据特征下的复杂网络相似性,并将所有特征构建的复杂网络进行融合,通过融合网络分析用户的用能行为相似性,最终对用户行为进行分类。
优选的,本方法中从多个数据源中采集数据获得所述用户用能行为样本数据。本方法通过分析电力网络以及与之相关其他网络之间的联系(如电信网、广电网、互联网等),建立整体的复杂网络融合体系,对于分析用户用能行为特征是非常必要的。通过上述方式能够融合用户不同维度下的特征信息(如电网信息、互联网信息等)。
优选的,本方法中对所述用户用能行为样本数据进行预处理,基于用户身份信息将预处理后的样本数据进行对齐获得训练数据。
优选的,本方法中所述用户用能行为样本数据的预处理方式包括:将所述用户用能行为样本数据进行清洗。
优选的,本方法中所述用户用能行为样本数据的预处理方式包括:将所述用户用能行为样本数据进行对齐。
优选的,本方法中所述用户用能行为样本数据的预处理方式包括:检测所述用户用能行为样本数据中是否具有逻辑错误的数据,若有则从所述用户用能行为样本数据中剔除具有逻辑错误的数据。
其中,采集到的原始数据经常会出现数据缺失、重复、数值异常等问题,因此为了防止这部分异常数据影响后续分析结果,需要对其进行清洗。
优选的,本方法采用k-means算法对所述训练数据进行分类与标注。本发明采取k-means算法能够对样本数据进行全自动分类与标注,提高分类与标注的效率。
优选的,本方法中每个用户具有M个特征,共获得M个相似性复杂网络,使用第一相似性矩阵表示M个相似性复杂网络,M为整数。
优选的,本方法中所述用户用能行为相似性矩阵的获得方式具体为:
对所述第一相似性矩阵进行标准化处理获得第二相似性矩阵;
基于所述训练样本和所述相似度矩阵对所述第二相似性矩阵进行迭代更新,获得所述用户用能行为相似性矩阵。
优选的,本方法中对在K邻近区域中所述相似度矩阵用于表示用户之间的相似度,K为自定义参数。
优选的,本方法中基于所述标签样本和所述用户用能行为相似性矩阵,采用标签传播方式对所述第一用户数据中的未分类用户用能行为数据进行分类与标注。
优选的,本方法中第二相似性矩阵的迭代更新公式为:
优选的,本方法中第一用户数据有N个用户,其中,有Nl个用户为标签样本,N个样本的分类矩阵为L,初始信息矩阵表示为:
本方法中的标签传播的迭代方式为:
其中,Slabel是标定样本集的序号集合,变量 t 表示迭代次数,通过迭代计算得到预测矢量,预测矢量长度为类别数目,预测矢量中各标量的数值代表样本属于对应类别的几率大小数值。
其中,本发明采取标签传播方法对用户用能行为进行分类预测,即根据融合网络中各个用户之间的距离远近,将部分已经标记的用户用能行为类别信息传播给未标记的用户,从而实现未标记的用户用能行为分类。
本发明还提供了一种用户用能行为分析系统,所述系统包括:
训练数据获得单元,用于基于用户用能行为样本数据获得训练数据;
第一分类与标注单元,用于对所述训练数据进行分类与标注获得训练样本;
第一相似性矩阵构建单元,用于以用户为节点,任意两个用户之间的某个特征相似度为边的权重,建立基于该特征的相似性复杂网络,基于所有特征对于的相似性复杂网络获得第一相似性矩阵;
相似度矩阵构建单元,用于基于所述第一相似性矩阵构建相似度矩阵;
训练单元,用于基于所述训练样本和所述相似度矩阵对所述第一相似性矩阵进行迭代更新,获得用户用能行为相似性矩阵;
标签样本获得单元,用于获得用户用能行为待分类的第一用户数据,对所述第一用户数据中的部分用户用能行为数据进行分类与标注,获得标签样本;
第二分类与标注单元,用于基于所述标签样本和所述用户用能行为相似性矩阵,对所述第一用户数据中的未分类用户用能行为数据进行分类与标注。
本发明还提供了一种用户用能行为分析装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述用户用能行为分析方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述用户用能行为分析方法的步骤。
本发明提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明解决了现有用户用能行为分析方法的局限性,能够根据实际情况对用户的用能行为进行自动分类,通过复杂网络相关原理分析用户在不同网络上的行为,获取用户的用能行为相似性分析矩阵,直观的展示具有相似用能行为的用户群体,能够对用户用能行为进行归类与预测,并且通过相似性矩阵预测新用户的用能行为倾向。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,并不构成对本发明实施例的限定;
图1是本发明中用户用能行为分析方法流程示意图;
图2是本发明中用户用能行为分析系统的组成示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
实施例一
请参考图1,图1为用户用能行为分析方法流程示意图,本发明实施例一提供了一种用户用能行为分析方法,所述方法包括:
基于用户用能行为样本数据获得训练数据;
对所述训练数据进行分类与标注获得训练样本;
以用户为节点,任意两个用户之间的某个特征相似度为边的权重,建立基于该特征的相似性复杂网络,基于所有特征对于的相似性复杂网络获得第一相似性矩阵;
基于所述第一相似性矩阵构建相似度矩阵;
基于所述训练样本和所述相似度矩阵对所述第一相似性矩阵进行迭代更新,获得用户用能行为相似性矩阵;
获得用户用能行为待分类的第一用户数据,对所述第一用户数据中的部分用户用能行为数据进行分类与标注,获得标签样本;
基于所述标签样本和所述用户用能行为相似性矩阵,对所述第一用户数据中的未分类用户用能行为数据进行分类与标注。
其中,本实施例中的用户用能行为可以是用电行为、用天然气行为、用水行为等等,本发明实施例不对具体的用能类型进行限定,下面以用电行为进行举例,其他类型的用能行为同理。
通过对背景技术中的几种现有技术的分析发现,现有技术中的用户用能行为分析方法均存在相应的技术问题,因此,本实施例通过构建用户不同特征数据构成的复杂网络,计算每个特征对应的初始网络,分析用户所有数据特征下的复杂网络相似性,并将所有特征构建的复杂网络进行融合,通过融合网络分析用户的用能行为相似性,最终对用户行为进行分类。
本实施例的具体实施步骤包括:
数据预处理:数据清洗与对齐
数据的预处理包括两个部分,数据清洗与数据对齐。采集到的原始数据经常会出现数据缺失、重复、数值异常等问题,因此为了防止这部分异常数据影响后续分析结果,需要对其进行清洗。
对于数据的缺失值,非关键字段填充0,关键字段则需要采用一定的填充规则进行填充或者舍弃相关条目的数据。本发明采取平均填充对缺失数据进行补齐。
对于原始数据中的逻辑错误(逻辑错误指用户数据集中的属性值与实际值不符,或违背了业务规则或逻辑),本发明通过检测字段中各属性值有效数值范围进行判断并剔除具有逻辑错误的数据。
将分别经过数据清洗过后的多网数据(如电网、电信网、广电网、互联网等),以具有唯一性的用户ID为标准进行对齐,即将属于同一用户的不同网络数据特征融合在一起,获取用于相似性分析的融合网络数据,其中,在实际的应用中在对齐时也可以采用其他出身份ID的方式对齐。
用户用能行为分类与标注:
根据实际情况以及供电需求的不同,用户的用能行为会有不同的定义,如:只工作日外出上班,夜晚归家用户,其用电高峰通常在夜晚,可定义为类别A;长期在家工作的自由工作者,定义为用户类别B等。用户的类别定义可以在数据采集时便进行分类标注,也可以根据相应算法进行自动标注分类。
本发明采取k-means算法对样本数据进行全自动分类与标注,其中,在实际应用中也可以采用其他算法进行分类与标注,本发明对具体是分类与标注算法不进行限定。其具体流程如下:
1、根据需求选取训练集中k个典型用能行为数据作为初始用户类别中心;其中,训练集的获得方式为对采集到的原始数据进行数据清洗与对齐获得。
2、对于训练集中的其余数据,根据其与初始用户类别中心的欧氏距离,归类于这些初始用户;
3、重新计算每个类别的平均值,更新用户类别的中心;
4、不断重复2、3,直到收敛,完成对所有用户用能行为的分类标注。
独立特征网络构建与相似性网络初始化
假设有N个用户数据,每个用户数据有M个特征(如用电量,通话次数,上网时长,网络流量等),首先定义用户为节点,任意用户之间的某个特征(如用电量)相似度为边的权重,建立基于该特征(用电量)的相似性复杂网络,N个用户的M个特征都将对应一个相似性复杂网络,这些网络可以使用N×N的第一相似性矩阵表示。第一相似性矩阵相似矩阵定义为,定义表示第i个用户与第j个用户在第m类特征上的相似程度,的计算公式如下:
其中,表示第i个用户在第m类特征下K个近邻的集合,根据数据集的大小,K是一个人工定义参数,取值范围为[50,80]。是第i个用户与他的K个近邻在第m类特征下特征向量间的平均欧氏距离。将进行标准化处理,得到第二相似性矩阵:
由于在给定的用户数据范围内,有较高相似性的用户比起具有较低相似性的用户具有更高的可依赖度,那么在K邻近区域定义相似度矩阵T来表示用户之间的相似度:
矩阵包含用户与其它所有用户的相似信息,而矩阵仅包含最近 K 个相邻用户间的相似信息。在之后的相似性矩阵迭代融合过程中,矩阵被用来作为初始状态,矩阵用来作为融合过程中的核矩阵。将所有特征进行初始化后,需要对用户数据进行迭代,相似性矩阵根据不同类型特征数据迭代更新公式如下:
用户用能行为分类:
本发明采取标签传播方法对用户用能行为进行分类预测,即根据融合网络中各个用户之间的距离远近,将部分已经标记的用户用能行为类别信息传播给未标记的用户,从而实现未标记的用户用能行为分类,其具体方法如下:
假设有N个用户,其中有Nl个用户是经过k-means聚类获取了类别标签的样本,其N个样本的分类矩阵为L,其初始信息矩阵表示为:
对应的初始标定信息矩阵L0的矩阵规模是N ×样本类别数目,假如第 10 个样本被标定为第3个类别,则L0(10,3) = 1。
标签传播的迭代方案如下:
上式中,变量 t 表示迭代次数,Slabel是标定样本集的序号集合。通过上式的迭代,可以计算得到对应新样本的一个预测矢量,即为迭代结束之后矩阵 L 中新样本所在行的该行矢量,记为Lpredict,矢量长度是类别数目,矢量中各标量的数值代表着样本属于对应类别的可能性,其中标量数值越大,代表该样本属于对应类别的可能性越高。例如Lpredict=[0.25,0.3,0.45]的情况下,预测矢量所对应三个类别的标量值分别为 0.25、0.3、0.45,易知 0.45 最大,即该样本属于第三个类别的可能性最高,则判定该样本类别为第三类。
实施例二
请参考图2,图2为用户用能行为分析系统的组成示意图,本发明实施例二提供了一种用户用能行为分析系统,所述系统包括:
训练数据获得单元,用于基于用户用能行为样本数据获得训练数据;
第一分类与标注单元,用于对所述训练数据进行分类与标注获得训练样本;
第一相似性矩阵构建单元,用于以用户为节点,任意两个用户之间的某个特征相似度为边的权重,建立基于该特征的相似性复杂网络,基于所有特征对于的相似性复杂网络获得第一相似性矩阵;
相似度矩阵构建单元,用于基于所述第一相似性矩阵构建相似度矩阵;
训练单元,用于基于所述训练样本和所述相似度矩阵对所述第一相似性矩阵进行迭代更新,获得用户用能行为相似性矩阵;
标签样本获得单元,用于获得用户用能行为待分类的第一用户数据,对所述第一用户数据中的部分用户用能行为数据进行分类与标注,获得标签样本;
第二分类与标注单元,用于基于所述标签样本和所述用户用能行为相似性矩阵,对所述第一用户数据中的未分类用户用能行为数据进行分类与标注。
实施例三
本发明实施例三提供了一种用户用能行为分析装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述用户用能行为分析方法的步骤。
实施例四
本发明实施例四提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述用户用能行为分析方法的步骤。
其中,所述处理器可以是中央处理器(CPU,Central Processing Unit),还可以是其他通用处理器、数字信号处理器(digital signal processor)、专用集成电路(Application Specific Integrated Circuit)、现成可编程门阵列(Fieldprogrammablegate array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的数据,实现发明中用户用能行为分析装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等。此外,存储器可以包括高速随机存取存储器、还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡,安全数字卡,闪存卡、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述用户用能行为分析装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序可存储于一计算机可读存介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码、对象代码形式、可执行文件或某些中间形式等。所述计算机可读取介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存储器、点载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
本发明已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (21)
1.一种用户用能行为分析方法,其特征在于,所述方法包括:
基于用户用能行为样本数据获得训练数据;
对所述训练数据进行分类与标注获得训练样本;
以用户为节点,任意两个用户之间的某个特征相似度为边的权重,建立基于该特征的相似性复杂网络,基于所有特征对于的相似性复杂网络获得第一相似性矩阵;
基于所述第一相似性矩阵构建相似度矩阵;
基于所述训练样本和所述相似度矩阵对所述第一相似性矩阵进行迭代更新,获得用户用能行为相似性矩阵;
获得用户用能行为待分类的第一用户数据,对所述第一用户数据中的部分用户用能行为数据进行分类与标注,获得标签样本;
基于所述标签样本和所述用户用能行为相似性矩阵,对所述第一用户数据中的未分类用户用能行为数据进行分类与标注。
2.根据权利要求1所述的用户用能行为分析方法,其特征在于,从多个数据源中采集数据获得所述用户用能行为样本数据。
3.根据权利要求1所述的用户用能行为分析方法,其特征在于,对所述用户用能行为样本数据进行预处理,基于用户身份信息将预处理后的样本数据进行对齐获得训练数据。
4.根据权利要求3所述的用户用能行为分析方法,其特征在于,所述用户用能行为样本数据的预处理方式包括:将所述用户用能行为样本数据进行清洗。
5.根据权利要求3所述的用户用能行为分析方法,其特征在于,所述用户用能行为样本数据的预处理方式包括:将所述用户用能行为样本数据进行对齐。
6.根据权利要求3所述的用户用能行为分析方法,其特征在于,所述用户用能行为样本数据的预处理方式包括:检测所述用户用能行为样本数据中是否具有逻辑错误的数据,若有则从所述用户用能行为样本数据中剔除具有逻辑错误的数据。
7.根据权利要求1所述的用户用能行为分析方法,其特征在于,本方法采用k-means算法对所述训练数据进行分类与标注。
8.根据权利要求1所述的用户用能行为分析方法,其特征在于,本方法中每个用户具有M个特征,共获得M个相似性复杂网络,使用第一相似性矩阵表示M个相似性复杂网络,M为整数。
9.根据权利要求1所述的用户用能行为分析方法,其特征在于,本方法中所述用户用能行为相似性矩阵的获得方式具体为:
对所述第一相似性矩阵进行标准化处理获得第二相似性矩阵;
基于所述训练样本和所述相似度矩阵对所述第二相似性矩阵进行迭代更新,获得所述用户用能行为相似性矩阵。
10.根据权利要求1所述的用户用能行为分析方法,其特征在于,对在K邻近区域中所述相似度矩阵用于表示用户之间的相似度,K为自定义参数。
11.根据权利要求1所述的用户用能行为分析方法,其特征在于,基于所述标签样本和所述用户用能行为相似性矩阵,采用标签传播方式对所述第一用户数据中的未分类用户用能行为数据进行分类与标注。
19.一种用户用能行为分析系统,其特征在于,所述系统包括:
训练数据获得单元,用于基于用户用能行为样本数据获得训练数据;
第一分类与标注单元,用于对所述训练数据进行分类与标注获得训练样本;
第一相似性矩阵构建单元,用于以用户为节点,任意两个用户之间的某个特征相似度为边的权重,建立基于该特征的相似性复杂网络,基于所有特征对于的相似性复杂网络获得第一相似性矩阵;
相似度矩阵构建单元,用于基于所述第一相似性矩阵构建相似度矩阵;
训练单元,用于基于所述训练样本和所述相似度矩阵对所述第一相似性矩阵进行迭代更新,获得用户用能行为相似性矩阵;
标签样本获得单元,用于获得用户用能行为待分类的第一用户数据,对所述第一用户数据中的部分用户用能行为数据进行分类与标注,获得标签样本;
第二分类与标注单元,用于基于所述标签样本和所述用户用能行为相似性矩阵,对所述第一用户数据中的未分类用户用能行为数据进行分类与标注。
20.一种用户用能行为分析装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-18中任意一个所述用户用能行为分析方法的步骤。
21.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-18中任意一个所述用户用能行为分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210184341.3A CN114266512A (zh) | 2022-02-28 | 2022-02-28 | 一种用户用能行为分析方法及系统及装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210184341.3A CN114266512A (zh) | 2022-02-28 | 2022-02-28 | 一种用户用能行为分析方法及系统及装置及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114266512A true CN114266512A (zh) | 2022-04-01 |
Family
ID=80833725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210184341.3A Pending CN114266512A (zh) | 2022-02-28 | 2022-02-28 | 一种用户用能行为分析方法及系统及装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114266512A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104392247A (zh) * | 2014-11-07 | 2015-03-04 | 上海交通大学 | 一种用于数据聚类的相似性网络融合快速方法 |
CN104680193A (zh) * | 2015-02-11 | 2015-06-03 | 上海交通大学 | 基于快速相似性网络融合算法的在线目标分类方法与系统 |
CN110070140A (zh) * | 2019-04-28 | 2019-07-30 | 清华大学 | 基于多类别信息的用户相似性确定方法及装置 |
CN113722437A (zh) * | 2021-08-31 | 2021-11-30 | 平安科技(深圳)有限公司 | 基于人工智能的用户标签识别方法、装置、设备及介质 |
CN113850632A (zh) * | 2021-11-29 | 2021-12-28 | 平安科技(深圳)有限公司 | 用户类别确定方法、装置、设备及存储介质 |
-
2022
- 2022-02-28 CN CN202210184341.3A patent/CN114266512A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104392247A (zh) * | 2014-11-07 | 2015-03-04 | 上海交通大学 | 一种用于数据聚类的相似性网络融合快速方法 |
CN104680193A (zh) * | 2015-02-11 | 2015-06-03 | 上海交通大学 | 基于快速相似性网络融合算法的在线目标分类方法与系统 |
CN110070140A (zh) * | 2019-04-28 | 2019-07-30 | 清华大学 | 基于多类别信息的用户相似性确定方法及装置 |
CN113722437A (zh) * | 2021-08-31 | 2021-11-30 | 平安科技(深圳)有限公司 | 基于人工智能的用户标签识别方法、装置、设备及介质 |
CN113850632A (zh) * | 2021-11-29 | 2021-12-28 | 平安科技(深圳)有限公司 | 用户类别确定方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
卢贤龙: "基于相似性网络融合的目标分类研究", 《中国优秀硕士学位论文全文数据库-信息科技辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10713597B2 (en) | Systems and methods for preparing data for use by machine learning algorithms | |
Abu-El-Haija et al. | Learning edge representations via low-rank asymmetric projections | |
CN111079639B (zh) | 垃圾图像分类模型构建的方法、装置、设备及存储介质 | |
US11176154B1 (en) | Collaborative dataset management system for machine learning data | |
CN112541458B (zh) | 基于元学习的域自适应的人脸识别方法、系统、装置 | |
CN108446741B (zh) | 机器学习超参数重要性评估方法、系统及存储介质 | |
CN113761261A (zh) | 图像检索方法、装置、计算机可读介质及电子设备 | |
CN111339818A (zh) | 一种人脸多属性识别系统 | |
US20210279279A1 (en) | Automated graph embedding recommendations based on extracted graph features | |
Qi et al. | Patent analytic citation-based vsm: Challenges and applications | |
CN110458600A (zh) | 画像模型训练方法、装置、计算机设备及存储介质 | |
CN114492601A (zh) | 资源分类模型的训练方法、装置、电子设备及存储介质 | |
CN113869609A (zh) | 一种根因分析频繁子图置信度预测方法及系统 | |
Zhang et al. | Lancet: labeling complex data at scale | |
CN115204318B (zh) | 事件自动层级分类方法及电子设备 | |
CN111612164A (zh) | 非迭代式大数据半监督学习方法、系统、存储介质及终端 | |
CN108830302B (zh) | 一种图像分类方法、训练方法、分类预测方法及相关装置 | |
CN111161238A (zh) | 图像质量评价方法及装置、电子设备、存储介质 | |
CN114266512A (zh) | 一种用户用能行为分析方法及系统及装置及介质 | |
WO2021143686A1 (zh) | 神经网络定点化方法、装置、电子设备及可读存储介质 | |
CN111125541B (zh) | 面向多用户的可持续多云服务组合的获取方法 | |
CN113627464A (zh) | 图像处理方法、装置、设备和存储介质 | |
CN113656707A (zh) | 一种理财产品推荐方法、系统、存储介质及设备 | |
CN113821657A (zh) | 基于人工智能的图像处理模型训练方法及图像处理方法 | |
CN113822412A (zh) | 一种图节点标注方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220401 |
|
RJ01 | Rejection of invention patent application after publication |