CN115375205A - 一种用水用户画像的确定方法、装置及设备 - Google Patents
一种用水用户画像的确定方法、装置及设备 Download PDFInfo
- Publication number
- CN115375205A CN115375205A CN202211307492.XA CN202211307492A CN115375205A CN 115375205 A CN115375205 A CN 115375205A CN 202211307492 A CN202211307492 A CN 202211307492A CN 115375205 A CN115375205 A CN 115375205A
- Authority
- CN
- China
- Prior art keywords
- data information
- water
- historical data
- user
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 178
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012545 processing Methods 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000004422 calculation algorithm Methods 0.000 claims description 24
- 238000007418 data mining Methods 0.000 claims description 21
- 230000008929 regeneration Effects 0.000 claims description 6
- 238000011069 regeneration method Methods 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 239000002131 composite material Substances 0.000 claims description 4
- 230000006870 function Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000012549 training Methods 0.000 description 9
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000009172 bursting Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种用水用户画像的确定方法、装置及设备。其中,所述方法包括:获取至少一种用水用户的历史的数据信息;根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签;获取至少一种用水用户的当前的数据信息,在所述至少一类标签中,确定当前的数据信息对应的目标标签;根据所述目标标签,确定用水用户画像;其中,所述数据信息包括基本信息、用水信息、缴费信息和服务信息中的至少一项。本发明的方案能够全面且详细的描述用户特征,实现供水系统的科学调度,提高供水效率。
Description
技术领域
本发明涉及计算机信息处理技术领域,特别是指一种用水用户画像的确定方法、装置及设备。
背景技术
用水与人民的生活息息相关,用户的用水行为受到多种因素影响,如家庭人数、人员结构、外界温度、用水习惯等;统计海量的用户用水和缴费等数据时,统计效率低,导致难以针对用户的具体情况进行供水,供水效率低。
发明内容
本发明提供一种用水用户画像的确定方法、装置及设备,能够全面且详细的描述用户特征,实现供水系统的科学调度,提高供水效率。
为解决上述技术问题,本发明的技术方案如下:
一种用水用户画像的确定方法,所述方法包括:
获取至少一种用水用户的历史的数据信息;
根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签;
获取至少一种用水用户的当前的数据信息,在所述至少一类标签中,确定当前的数据信息对应的目标标签;
根据所述目标标签,确定用水用户画像;
其中,所述数据信息包括基本信息、用水信息、缴费信息和服务信息中的至少一项。
可选的,所述至少一类标签包括:
统计类标签;
规则类标签;
数据挖掘类标签。
可选的,当所述标签为统计类标签时,根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签,包括:
为所述历史的数据信息,添加所述历史的数据信息对应的统计类标签。
可选的,当所述标签为规则类标签时,根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签,包括:
根据所述历史的数据信息,通过第一预设算法进行计算,得到第一计算结果;
将所述第一计算结果与预设规则进行对比,得到所述历史的数据信息对应的规则类标签。
可选的,当所述标签为数据挖掘类标签时,根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签,包括:
根据所述历史的数据信息,通过第二预设算法进行计算,得到第二计算结果;
对所述第二计算结果进行聚类处理,得到所述历史的数据信息对应的数据挖掘类标签。
可选的,所述用水用户画像的确定方法,还包括:
对所述历史的数据信息进行预处理,得到处理后的历史的数据信息。
可选的,所述用水用户画像的确定方法,还包括:
对所述目标标签进行交叉处理、嵌套处理、关联处理和/或重新生成处理中的至少一种,得到复合目标标签。
本发明还提供一种用水用户画像的确定装置,所述装置包括:
获取模块,用于获取至少一种用水用户的历史的数据信息;
处理模块,用于根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签;
所述获取模块,还用于获取至少一种用水用户的当前的数据信息,在所述至少一类标签中,确定当前的数据信息对应的目标标签;
所述处理模块,还用于根据所述目标标签,确定用水用户画像;
其中,所述数据信息包括基本信息、用水信息、缴费信息和服务信息中的至少一项。
本发明还提供一种计算设备,包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如上所述的方法的步骤。
本发明还提供一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如上所述的方法的步骤。
本发明的上述方案至少包括以下有益效果:
本发明的上述方案,通过获取至少一种用水用户的历史的数据信息;根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签;获取至少一种用水用户的当前的数据信息,在所述至少一类标签中,确定当前的数据信息对应的目标标签;根据所述目标标签,确定用水用户画像;其中,所述数据信息包括基本信息、用水信息、缴费信息和服务信息中的至少一项。能够全面且详细的描述用户特征,实现供水系统的科学调度,提高供水效率。
附图说明
图1是本发明实施例提供的用水用户画像的确定方法的流程示意图;
图2是本发明实施例的用水用户画像的确定装置的模块框示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
如图1所示,本发明的实施例提供一种用水用户画像的确定方法,所述方法包括:
步骤11,获取至少一种用水用户的历史的数据信息;
步骤12,根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签;
步骤13,获取至少一种用水用户的当前的数据信息,在所述至少一类标签中,确定当前的数据信息对应的目标标签;
步骤14,根据所述目标标签,确定用水用户画像;
其中,所述数据信息包括基本信息、用水信息、缴费信息和服务信息中的至少一项。
其中,所述基本信息可以包括但不限于:用户档案数据、水表档案数据等信息;具体可以包括但不限于:用水户号、小区位置、是否有二次供水、房屋面积、人口数量、水表号、水表类型、水表安装时间和/或水表使用年限等信息;
所述用水信息可以包括但不限于:抄表数据、智能水表数据、水压数据等等信息;具体可以包括但不限于:最后一次抄表读数、上次抄表读数、抄表周期、用水量和/或用水阶梯等信息;其中,所述智能水表能够实时获取用户的用水情况,可获得较长周期的用水量数据历史记录;所述水压数据可以采用智能水表直接获取,如果采用普通水表无法获取,可以通过取泵站水压数据的近似值获得;
所述缴费数据可以包括但不限于:收费数据、缴费数据、欠费数据等信息;具体可以包括但不限于:本次抄表应缴费用、或者智能水表直接得出的应缴费用、出账单时间、缴费时间、缴费周期(缴费时间-账单时间)、缴费方式、欠费金额、欠费次数、欠费频率、缴费及时性、累计欠费金额、催收次数和/或催收记录等信息;
所述服务信息可以包括但不限于:报装数据、服务工单数据、热线数据、停水数据等信息;具体可以包括但不限于:平均停水时长、停水次数、计划停水来水及时性、计划停水通知及时性和/或停水原因等信息;
此外,所述服务信息还可以与爆管信息、工程施工等信息进行关联,所述爆管信息与所述工程施工信息中的时间和地点可与受影响用水用户进行关联。
本发明的该实施例中,通过为用水用户构建用水用户画像,能够全面且详细的描述用户特征,实现供水系统的科学调度,提高供水效率。
需要说明的是,所述用水用户画像,即用水用户信息标签化,用水用户画像能够为供水企业提供足够的信息基础,帮助用水企业快速地找到用水用户需求等信息;确定用水用户画像,可以对用户提供个性化的服务,提升用户用水体验,大量用水用户的用水规律可以为合理供水提供指导,从而提升供水效率。
本发明一可选的实施例中,所述步骤12中,所述至少一类标签包括:
统计类标签;
规则类标签;
数据挖掘类标签。
需要说明的是,所述统计类标签、规则类标签和数据挖掘类标签具体可以包括但不限于:基本标签、安全标签、违约违章标签、合作标签、舆情标签;
其中,所述基本标签可以包括但不限于:用水量等级标签、用水量波动等级标签、小区档次标签、用户年龄段标签等;
所述安全标签可以包括但不限于:事故次数标签、事故严重度标签等;
所述违约违章标签可以包括但不限于:违章用水次数标签、欠费次数标签、欠费原因标签等;
所述合作标签可以包括但不限于:热线类型标签、热线次数标签等;
所述舆情标签可以包括但不限于:舆情等级、舆情次数标签等。
本实施例中,所述统计类标签、规则类标签和数据挖掘类标签可以具体划分为多种标签,能够更加详细的描述客户的特征,从而准确的锁定客户情况,进行精准供水。
本发明又一可选的实施例中,当所述标签为统计类标签时,所述步骤12,可以包括:
步骤121,为所述历史的数据信息,添加所述历史的数据信息对应的统计类标签。
本实施例中,对于单个用水用户,可以统计用户的自然属性和表基本属性,用户自然属性包括但不限于:用户姓名、地址、近一个月用水量、阶梯用水费用等;表基本属性包括但不限于:表号、表类型、表信号、电池电压、上报周期、阀门状态等;例如:用户的开户日期、用户地址、近30日缴费次数、近半年缴费金额等信息。
具体的,以近30日缴费次数为例,所述近30日缴费次数的对应的一级归类标签为费用统计,细化描述所述近30日缴费次数对应的标签,可以包括:缴费时间、缴费金额、缴费方式三个二级子标签,同时在业务系统中进行记录更新,并从数据仓库中定时抽取元数据进行分析,从而将用户的缴费信息保持在最新状态。
本发明又一可选的实施例中,当所述标签为规则类标签时,所述步骤12,可以包括:
步骤122,根据所述历史的数据信息,通过第一预设算法进行计算,得到第一计算结果;
步骤123,将所述第一计算结果与预设规则进行对比,得到所述历史的数据信息对应的规则类标签。
本实施例中,所述规则类标签可以是基于水务运维人员对用户用水行为、水表类型对应的状态感知信息、计量信息及时间信息等,确定的筛选规则生成的各类标签。
其中,所述预设规则可以包括但不限于:预先设定的数字或者范围,例如:为欠款金额标签预设三个规则,分别为:近两年内该用户累计欠费小于1000元,近两年内该用户累计欠费大于1万元小于2万元,以及近两年内该用户累计欠费大于2万元,若第一计算结果符合近两年内该用户累计欠费小于1000元,则该用户对应小金额用户标签;若第一计算结果符合近两年内该用户累计欠费大于1万元小于2万元,则该用户对应大金额用户标签;若第一计算结果符合近两年内该用户累计欠费大于2万元,则该用户对应超大金额用户标签。
所述第一预设算法可以包括但不限于:计算数据信息的统计值,所述统计值可以包括但不限于:平均值、中位数、百分位数等,例如:缴费及时性数据可以所有用户的缴费周期平均值为依据,(缴费周期=缴费时间-账单时间),缴费周期低于平均值的用户对应缴费积极标签,缴费周期高于平均值的用户对应缴费消极标签,对于最后一次已出账单但没有缴费记录,即缴费周期数据为空的用户对应欠费标签。
本发明一可选的具体实施例中,通过第一预设算法计算第一用户近两年内累计欠费额,确定所述第一用户对应的标签的过程,具体可以包括:
设定预设数值为-100元,通过第一用户近两年内累计缴费金额,减去第一用户近两年内累计应缴金额,得到第一用户近两年内累计欠费额,将得到的第一用户近两年内累计欠费额与预设阈值进行对比,若第一用户近两年内累计欠费额大于所述预设阈值,则第一用户对应消极缴费标签;若第一用户近两年内累计欠费额等于所述预设阈值,则第一用户对应正常缴费标签;若第一用户近两年内累计欠费额小于所述预设阈值,则第一用户对应积极缴费标签。
具体的,所述第一用户近两年内累计缴费金额为500元,所述第一用户近两年内累计应缴金额800元,因此,所述第一用户近两年内累计欠费额为-300元,将第一用户近两年内累计欠费额-300元与预设阈值-100元进行对比,确定所述第一用户近两年内累计欠费额大于所述预设阈值,则第一用户对应消极缴费标签。
本发明又一可选的实施例中,当所述标签为数据挖掘类标签时,所述步骤12,可以包括:
步骤124,根据所述历史的数据信息,通过第二预设算法进行计算,得到第二计算结果;
步骤125,对所述第二计算结果进行聚类处理,得到所述历史的数据信息对应的数据挖掘类标签。
需要说明的是,对于实现本发明的目的而言,通过第二预设算法进行计算,得到第二计算结果的步骤并不是必要的,也可以直接对所述历史的数据信息和/或经过第一预设算法得到的第一计算结果进行聚类分析,得到所述历史的数据信息对应的数据挖掘类标签。本实施例中,所述第二预设算法可以包括基于历史的数据信息的预测算法。例如,基于目标用户近三年的历史用水量数据,采用预测算法预测出所述目标用户下个月的用水量,所述预测算法可以包括但不限于:LSTM(长短期记忆人工神经网络)、SVM(支持向量机)、XGBoost(分布式梯度增强库)等;
所述第二预设算法还可以包括用户数据信息与历史的数据信息的比较。例如,通过数据挖掘的手段,将用水量与历史用水量进行比较,当发现用水户在某个时间段用水量显著高于历史平均水平,则提示存在用水量异常现象,可能出现漏水等现象。可以实现对用水用户的用水情况的准确描述,便于精准供水。
本发明又一可选的具体实施例中,当所述第二预设算法为XGBoost时,确定所述历史的数据信息对应的数据挖掘类标签的过程,具体可以包括:
以一个月为单位获取目标用户近三年的历史用水量数据,其中,对于统计周期大于一个月的历史用水量数据,采用插值法处理为每个月的历史用水量数据;将历史用水量数据随机分为80%的训练集和20%的验证集;
将所述训练集输入到所述XGBoost预测模型中,XGBoost算法训练出k棵回归树构成的集合为:F={f1(X),f2(X),……,fk-1(X)};
通过第c棵回归树拟合第c-1棵回归树,计算得出残差,将全部回归树的预测值相加,得到最终的预测结果,其中,第t次的训练迭代结果根据如下公式计算:
当给定样本x时,对于该样本的预测结果为每一棵树的预测值之和,其中,用户用水量XGBoost预测模型如下:
所述XGBoost预测模型的目标函数如下:
其中,为所述XGBoost预测模型的目标函数,为用户用水量真实值,为前一次的预测结果,为第t次训练计算得出的残差,为所述预测模型的损失函数,n为样本总数,i为第i个样本,t为训练次数,k为回归树的数量;
所述预测模型的目标函数可以通过泰勒级数展开,计算公式如下:
使用基于XGBoost预测模型建立的用户用水量预测模型对验证数据集进行验证模型的准确度,用于所述预测模型评估的均方根误差的计算式如下:
通过不断训练对决策树的参数进行调优,在完成参数调优后,对XGBoost正则化参数进行调优以降低模型的复杂度,提高模型表现;最后确定理想的参数组合作为XGBoost预测模型的参数。
本发明又一可选的实施例中,直接对数据信息进行聚类处理,得到数据信息对应的数据挖掘类标签的过程,具体可以包括:
将智能水表的用户用水数据按照24时制划分成对应周一到周日1~7天的七段数据,然后将7天的数据分别按照12个时间段进行划分,记为:Qt1,Qt2,……,Qt12,以0点为起点,每两个小时作为一个时间段进行划分,即:Qt1:0:00-2:00,Qt2:2:00-4:00,……,Qt11:20:00-22:00,Qt12:22:00-24:00。将每个时间段的结尾时间节点的用水量值减去起始时间节点的用水量值,即可得到每个时间段的用水量。
选取早、中、晚三个典型时间段进行分析,例如以6:00-8:00、12:00-14:00、18:00-20:00三个时间段的平均用水量作为聚类中心,按照用户用水量与聚类中心的距离,分为K类;对K类不同的用户根据其用水特点,标注为不同的数据挖掘类标签,如:用户a的用水特征为工作日早晚用水量有两个高峰,中午用水量为零或者远低于早晚用水量,则所述用户a对应常规上班居民标签;用户b的用水特征为早中晚用水量区别不大,则所述用户b对应常年居家居民标签。
在刻画用水用户画像过程中处于系统运行稳定后,有大量历史的数据信息的情况下,收集各类数据利用机器学习等方法进行数据挖掘,对用户进行聚类分析,这样可以通过数据挖掘类标签统计宏观数据的变化趋势,例如:水务用户所用表计是否数据异常表、用户用水是否存在漏水等现象。
例如:在对用户累计用水量及用水量趋势统计分析过程中,可以用到聚类算法,所述聚类算法可以包括但不限于:K-Means(K均值聚类算法)、Mean Shift(均值偏移)、DBSCAN(基于密度的聚类算法)等,
其中,Mean Shift的均值中心计算公式如下:
这样可以对应给定过的水表用户样本集,按照样本之间的距离大小,将样本集划分为多个聚类簇,让聚类簇内的点的距离尽量小,而让聚类簇之间的距离尽量大,通过对用户多次回归聚类,最终区分聚类簇,并通过数据特征描述每个聚类簇的特点。
具体的,对于使用智能水表的用户,由于可以精确统计用户的用水量,可以获知每天甚至每小时的用水量,因此可以对用水用户的用水特征进行分类,根据用水用户的用水特征进行分类,根据用水用户的用水信息,每一天中每个小时的用水量,以及工作日和周末的用水量变化,可以运用聚类算法进行自动分类,形成相应的数据挖掘类标签。
本发明又一可选的实施例中,在所述步骤11之后,还可以包括:
步骤11-1,对所述历史的数据信息进行预处理,得到处理后的历史的数据信息。
本实施例中,对所述历史的数据信息进行预处理可以包括但不限于:对数据进行清洗、特征抽取和/或数据分析,例如:剔除历史的数据信息中为零的数据等。这样可以避免异常数据的干扰,使得用水用户画像更加准确。
本发明又一可选的实施例中,所述用水用户画像的确定方法,还可以包括:
步骤15,对所述目标标签进行交叉处理、嵌套处理、关联处理和/或重新生成处理中的至少一种,得到复合目标标签。
本实施例中,通过对所述目标标签的交叉处理、嵌套处理、关联处理和/或重新生成处理中的至少一种,能够形成更符合实际业务需求的标签;
对所述目标标签的交叉处理可以包括:将多个标签合并为一个具有多重属性的标签;
对所述目标标签的嵌套处理可以包括:为具有从属关系的多个标签按照其细化程度进行排列和绑定,以适应不同的画像精度的要求;
对所述目标标签的关联处理可以包括:将属于同一用户或者同一应用的标签进行绑定。
对所述目标标签的所述重新生成处理可以包括:在当前匹配到的标签无法解决现实中的具体问题时,调整数据源中的数据,或者重新生成标签。
本发明的上述实施例中,能够基于用水用户基本信息、用水信息和/或服务信息等业务数据为导向定义标签的方式,所构建的用水用户画像可以更加全面、详细的描述用水用户的特征,从而对其用水和缴费情况进行分析和预测,更好的指导供水系统的科学调度,提高供水效率,提供水费收缴率。
如图2所示,本发明的实施例还提供一种用水用户画像的确定装置20,所述装置20包括:
获取模块21,用于获取至少一种用水用户的历史的数据信息;
处理模块22,用于根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签;
所述获取模块,还用于获取至少一种用水用户的当前的数据信息,在所述至少一类标签中,确定当前的数据信息对应的目标标签;
所述处理模块,还用于根据所述目标标签,确定用水用户画像;
其中,所述数据信息包括基本信息、用水信息、缴费信息和服务信息中的至少一项。
可选的,所述至少一类标签包括:
统计类标签;
规则类标签;
数据挖掘类标签。
可选的,当所述标签为统计类标签时,根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签,包括:
为所述历史的数据信息,添加所述历史的数据信息对应的统计类标签。
可选的,当所述标签为规则类标签时,根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签,包括:
根据所述历史的数据信息,通过第一预设算法进行计算,得到第一计算结果;
将所述第一计算结果与预设规则进行对比,得到所述历史的数据信息对应的规则类标签。
可选的,当所述标签为数据挖掘类标签时,根据所述历史的数据信息,根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签,包括:
根据所述历史的数据信息,通过第二预设算法进行计算,得到第二计算结果;
对所述第二计算结果进行聚类处理,得到所述历史的数据信息对应的数据挖掘类标签。
可选的,所述处理模块22还可以用于:
对所述历史的数据信息进行预处理,得到处理后的历史的数据信息。
可选的,所述处理模块22还可以用于:
对所述目标标签进行交叉处理、嵌套处理、关联处理和/或重新生成处理中的至少一种,得到复合目标标签。
需要说明的是,该装置是与上述方法对应的装置,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种计算设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种用水用户画像的确定方法,其特征在于,所述方法包括:
获取至少一种用水用户的历史的数据信息;
根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签;
获取至少一种用水用户的当前的数据信息,在所述至少一类标签中,确定当前的数据信息对应的目标标签;
根据所述目标标签,确定用水用户画像;
其中,所述数据信息包括基本信息、用水信息、缴费信息和服务信息中的至少一项。
2.根据权利要求1所述的用水用户画像的确定方法,其特征在于,所述至少一类标签包括:
统计类标签;
规则类标签;
数据挖掘类标签。
3.根据权利要求2所述的用水用户画像的确定方法,其特征在于,当所述标签为统计类标签时,根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签,包括:
为所述历史的数据信息,添加所述历史的数据信息对应的统计类标签。
4.根据权利要求2所述的用水用户画像的确定方法,其特征在于,当所述标签为规则类标签时,根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签,包括:
根据所述历史的数据信息,通过第一预设算法进行计算,得到第一计算结果;
将所述第一计算结果与预设规则进行对比,得到所述历史的数据信息对应的规则类标签。
5.根据权利要求2所述的用水用户画像的确定方法,其特征在于,当所述标签为数据挖掘类标签时,根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签,包括:
根据所述历史的数据信息,通过第二预设算法进行计算,得到第二计算结果;
对所述第二计算结果进行聚类处理,得到所述历史的数据信息对应的数据挖掘类标签。
6.根据权利要求1所述的用水用户画像的确定方法,其特征在于,还包括:
对所述历史的数据信息进行预处理,得到处理后的历史的数据信息。
7.根据权利要求1所述的用水用户画像的确定方法,其特征在于,还包括:
对所述目标标签进行交叉处理、嵌套处理、关联处理和/或重新生成处理中的至少一种,得到复合目标标签。
8.一种用水用户画像的确定装置,其特征在于,所述装置包括:
获取模块,用于获取至少一种用水用户的历史的数据信息;
处理模块,用于根据所述历史的数据信息,确定所述历史的数据信息对应的至少一类标签;
所述获取模块,还用于获取至少一种用水用户的当前的数据信息,在所述至少一类标签中,确定当前的数据信息对应的目标标签;
所述处理模块,还用于根据所述目标标签,确定用水用户画像;
其中,所述数据信息包括基本信息、用水信息、缴费信息和服务信息中的至少一项。
9.一种计算设备,其特征在于,包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7任一项所述的方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-7任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211307492.XA CN115375205B (zh) | 2022-10-25 | 2022-10-25 | 一种用水用户画像的确定方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211307492.XA CN115375205B (zh) | 2022-10-25 | 2022-10-25 | 一种用水用户画像的确定方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115375205A true CN115375205A (zh) | 2022-11-22 |
CN115375205B CN115375205B (zh) | 2023-06-23 |
Family
ID=84072735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211307492.XA Active CN115375205B (zh) | 2022-10-25 | 2022-10-25 | 一种用水用户画像的确定方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115375205B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116050946A (zh) * | 2023-03-29 | 2023-05-02 | 东莞先知大数据有限公司 | 一种水务用户催收管理方法、装置、电子设备和存储介质 |
CN116402260A (zh) * | 2023-06-07 | 2023-07-07 | 埃睿迪信息技术(北京)有限公司 | 一种排水户画像的确定方法、装置及设备 |
CN117851953A (zh) * | 2024-02-22 | 2024-04-09 | 深圳拓安信物联股份有限公司 | 用水异常检测方法、装置、电子设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764984A (zh) * | 2018-05-17 | 2018-11-06 | 国网冀北电力有限公司电力科学研究院 | 一种基于大数据的电力用户画像构建方法及系统 |
CN109002996A (zh) * | 2018-07-26 | 2018-12-14 | 珠海卓邦科技有限公司 | 基于水费回收的风险评估方法及系统 |
CN110796354A (zh) * | 2019-10-21 | 2020-02-14 | 国网湖南省电力有限公司 | 一种企业电费回收风险画像方法及系统 |
US20200117675A1 (en) * | 2017-07-26 | 2020-04-16 | Beijing Sankuai Online Technology Co., Ltd. | Obtaining of Recommendation Information |
CN111723257A (zh) * | 2020-06-24 | 2020-09-29 | 山东建筑大学 | 基于用水规律的用户画像方法与系统 |
CN115062087A (zh) * | 2022-07-01 | 2022-09-16 | 国网汇通金财(北京)信息科技有限公司 | 一种用户画像构建方法、装置、设备和介质 |
-
2022
- 2022-10-25 CN CN202211307492.XA patent/CN115375205B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200117675A1 (en) * | 2017-07-26 | 2020-04-16 | Beijing Sankuai Online Technology Co., Ltd. | Obtaining of Recommendation Information |
CN108764984A (zh) * | 2018-05-17 | 2018-11-06 | 国网冀北电力有限公司电力科学研究院 | 一种基于大数据的电力用户画像构建方法及系统 |
CN109002996A (zh) * | 2018-07-26 | 2018-12-14 | 珠海卓邦科技有限公司 | 基于水费回收的风险评估方法及系统 |
CN110796354A (zh) * | 2019-10-21 | 2020-02-14 | 国网湖南省电力有限公司 | 一种企业电费回收风险画像方法及系统 |
CN111723257A (zh) * | 2020-06-24 | 2020-09-29 | 山东建筑大学 | 基于用水规律的用户画像方法与系统 |
CN115062087A (zh) * | 2022-07-01 | 2022-09-16 | 国网汇通金财(北京)信息科技有限公司 | 一种用户画像构建方法、装置、设备和介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116050946A (zh) * | 2023-03-29 | 2023-05-02 | 东莞先知大数据有限公司 | 一种水务用户催收管理方法、装置、电子设备和存储介质 |
CN116402260A (zh) * | 2023-06-07 | 2023-07-07 | 埃睿迪信息技术(北京)有限公司 | 一种排水户画像的确定方法、装置及设备 |
CN117851953A (zh) * | 2024-02-22 | 2024-04-09 | 深圳拓安信物联股份有限公司 | 用水异常检测方法、装置、电子设备及存储介质 |
CN117851953B (zh) * | 2024-02-22 | 2024-07-12 | 深圳拓安信物联股份有限公司 | 用水异常检测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115375205B (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xia et al. | Detection methods in smart meters for electricity thefts: A survey | |
CN115375205A (zh) | 一种用水用户画像的确定方法、装置及设备 | |
US11372896B2 (en) | Method and apparatus for grouping data records | |
CN105678398A (zh) | 基于大数据技术的电力负荷预测方法及基于该方法的研究应用系统 | |
Montañez et al. | A machine learning approach for detecting unemployment using the smart metering infrastructure | |
CN108492134A (zh) | 基于多周期回归树集成的大数据用户用电行为分析系统 | |
CN109376906B (zh) | 基于多维度轨迹的出行时间预测方法、系统及电子设备 | |
Wang et al. | Short-term industrial load forecasting based on ensemble hidden Markov model | |
CN109583729B (zh) | 用于平台在线模型的数据处理方法和装置 | |
CN110880127A (zh) | 消费水平的预测方法、装置、电子设备及存储介质 | |
CN116823496A (zh) | 基于人工智能的智能保险风险评估和定价系统 | |
CN113205223A (zh) | 一种电量预测系统及其预测方法 | |
Cho et al. | A Delphi technology forecasting approach using a semi-Markov concept | |
CN112614004A (zh) | 用电信息的处理方法及装置 | |
CN113570398A (zh) | 推广数据处理方法、模型训练方法、系统和存储介质 | |
CN111126629A (zh) | 模型的生成方法、刷单行为识别方法、系统、设备和介质 | |
Jeyaranjani et al. | Deep learning based smart meter data analytics for electricity load prediction | |
Flesca et al. | On forecasting non-renewable energy production with uncertainty quantification: A case study of the Italian energy market | |
CN115983898A (zh) | 基于马尔可夫状态转移矩阵的电费收入预测方法及系统 | |
CN113537607B (zh) | 停电预测方法 | |
Daraghmi et al. | Accurate and time‐efficient negative binomial linear model for electric load forecasting in IoE | |
Buzau | Machine learning algorithms for the detection of non-technical losses in electrical distribution networks | |
CN114820036A (zh) | 面向大数据和回归分析预测算法的充电市场分析系统 | |
Cheng et al. | PowerNet: Neural power demand forecasting in smart grid | |
CN117172607B (zh) | 基于公共空间服务的数据采集和项目运营分析系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CB03 | Change of inventor or designer information |
Inventor after: Wu Liyang Inventor after: Huang Tao Inventor before: Wu Liyang Inventor before: Huang Tao Inventor before: Liu Lifeng |
|
CB03 | Change of inventor or designer information |