CN116049543A - 综合能效服务业务混合推荐方法、系统及存储介质 - Google Patents
综合能效服务业务混合推荐方法、系统及存储介质 Download PDFInfo
- Publication number
- CN116049543A CN116049543A CN202211661697.8A CN202211661697A CN116049543A CN 116049543 A CN116049543 A CN 116049543A CN 202211661697 A CN202211661697 A CN 202211661697A CN 116049543 A CN116049543 A CN 116049543A
- Authority
- CN
- China
- Prior art keywords
- user
- recommendation
- data
- weight
- items
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于电力服务领域,为综合能效服务业务混合推荐方法、系统及存储介质;包括:数据整合和数据预处理;获得多个单一模型的推荐结果,包括基于营销档案属性和挖掘模型的推荐结果、基于用户评分的推荐结果、基于项目属性的推荐结果和基于用户关注点的推荐结果;在多个单一模型的推荐结果中分别增加流行度权重因子,获得基于流行度的推荐结果;推荐结果整合,运用综合权重方法确定各个推荐结果在最终推荐结果中的比重,确定目标用户对各个推荐结果的综合得分,基于综合得分确定排名靠前的作为最终推荐结果。本发明通过对协同过滤算法补充与改进,结合用户的偏好特征匹配有价值的服务,实现用户策略推荐服务的智能化和精准化。
Description
技术领域
本发明属于电力服务领域,具体涉及综合能效服务业务混合推荐方法、系统及存储介质。
背景技术
随着综合能源服务业务的不断拓展,门户网站注册用户数量快速增加,健全完善能效服务体系,全面开展能效公共服务,需进一步强化共性能力建设,统筹数据服务资源,为用户提供优质的资源推送服务,提高总部及各级单位关于能效服务资源的接收和消纳能力。
首先,随着门户网站用户数量及服务资源的快速增长,原有推荐策略的推荐内容、效率,及推送的颗粒度、精准度、覆盖面积已不再适用当下的业务需求;面对多样性的客户群体,根据用户行业信息简单模糊匹配业务的方式,无法做到“千人千面”、“一户一策”的精准推荐模式。
其次,能效服务涉及的数据来源繁杂、客户群体多样、业务范围广泛,客户用电、用能、行为数据无法充分利用并发挥本身价值。门户网站中现有推荐过程是通过用户行业与四库所属场景进行简单匹配,推荐结果过于粗糙,相同行业用户推荐结果相同,无差异化,且无法进行自动化、智能化的推荐。也就是说,现有能效服务业务的资源推荐逻辑,仅采用用电客户档案的行业大类与四库资源所属行业进行行业匹配,致使用户各行业间的推荐内容无差别,未充分利用四库数据资源。另一方面,推荐逻辑未考虑到当客户档案缺失时无法推送的问题,例如新用户及游客登录推荐内容为空的问题。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供综合能效服务业务混合推荐方法、系统及存储介质,通过对协同过滤算法补充与改进,并结合用户的偏好特征匹配有价值的服务,实现用户策略推荐服务的智能化和精准化,使用户能够精准快速地获取自己感兴趣的资源。
本发明的推荐方法采用如下技术方案来实现:一种综合能效服务业务混合推荐方法,包括以下步骤:
数据整合和数据预处理;
获得多个单一模型的推荐结果,包括基于营销档案属性和挖掘模型的推荐结果、基于用户评分的推荐结果、基于项目属性的推荐结果和基于用户关注点的推荐结果;
在多个单一模型的推荐结果中分别增加流行度权重因子,获得基于流行度的推荐结果;
推荐结果整合,运用综合权重方法确定各个推荐结果在最终推荐结果中的比重,确定目标用户对各个推荐结果的综合得分,基于综合得分确定排名靠前的作为最终推荐结果。
在优选的实施例中,获得基于营销档案属性和挖掘模型的推荐结果,包括:
通过电力数据描述统计分析,结合业务需求及数据实际情况,运用数据探索的特征构建方法,对各个业务挖掘主题进行用户业务信息和量费特征提取,构建特征指标;
基于电力数据,以及基于维度指标或者事实标签,运用特征工程和无监督算法,构建用户挖掘模型,对用户潜力进行挖掘;
基于行业特征、网上公开信息、专家经验,设计用户行业衍生关键词;
对四库数据进行分词和提取关键词;其中,四库包括综合能效服务业务的解决方案、案例、供应商和产品;
计算用户行业衍生关键词和四库数据关键词之间的相似度。
在优选的实施例中,获得基于用户评分的推荐结果,包括:
构建用户评分矩阵,定义门户网站用户集合U={u1,u2,......um},综合能效服务业务的解决方案、案例所形成的项目集合I={i1,i2,......it};根据门户网站用户对所述项目集合中解决方案、案例的点击、转发、点赞、停留时长数据形成评分矩阵Rm*t;
基于所构建的用户评分矩阵,通过改进的用户相似度计算公式sim(a,b)A得到用户相似度矩阵;
其中,Ra,c表示门户网站用户a对综合能效服务业务的解决方案c的评分,Rb,c表示门户网站用户b对综合能效服务业务的解决方案c的评分;Ra表示门户网站用户a对项目集合中所有项目评分的中位数,Rb表示用户b对项目集合中所有项目评分的中位数;表示门户网站用户a对项目集合中所有项目评分的均值,表示门户网站用户b对项目集合中所有项目评分的均值;Ia,b表示门户网站用户a和b共同对项目集合中评分过的项目;Ia表示门户网站用户a对项目集合中评分过的项目;Ib表示门户网站用户b对项目集合中评分过的项目;
根据所获取的用户相似度矩阵,找出与目标用户相似度最高的若干个用户组成邻居用户集合;
根据目标用户t的近邻集合Uk获得目标用户尚未评级的解决方案的预测评级分数Pt,c:
根据预测评级分数从大到小进行排序,排序列表选取前n个方案作为目标用户的基于用户评分的推荐结果。
在优选的实施例中,获得基于项目属性的推荐结果,包括:
根据综合能效服务业务中解决方案的分词结果,获得项目属性分类,并结合行业应用领域、适用场景,构建项目属性矩阵;
对解决方案中所属行业分类,根据国民经济行业划分为若干个大类,基于分类之间的语义关系,构建分类语义层次树;
通过计算项目间相似度的获得解决方案之间的相似度,获得解决方案的邻居集合,从邻居集合中给用户推荐相似度排名靠前的项目。
在优选的实施例中,获得基于用户关注点的推荐结果,包括:
通过用户新注册时填写的关注点、兴趣领域,结合适用场景、行业应用领域,计算与四库中项目属性信息的相似度,根据相似度进行排名,推荐排名靠前的项目给用户;
其中,四库包括综合能效服务业务的解决方案、案例、供应商和产品。
在优选的实施例中,流行度权重因子的计算方式为:
通过用户对解决方案的点击评分状况,得到流行度,对流行度进行归一化处理;
根据归一化后的流行度,计算流行度权重因子:
其中,NPop为归一化后的流行度的数值。
在优选的实施例中,所述综合权重方法结合主观权重与客观权重;
主观权重以业务为依据,根据各业务维度的重要程度与现实影响,听取相关专家的意见,判断各业务维度标签权重并赋值w1;确定主观权重所考虑的因素包括:门户网站的内外部数据波动情况、推荐结果更新频度和用户兴趣提现程度;其中基于门户网站外部数据的推荐结果变化周期不明显,门户网站内部数据受用户埋点数据增加的影响,推荐结果更新频率更为频繁;所述埋点数据受用户主观性影响大,更能展现用户的兴趣;
对各个模型赋予的主观权重分别为:对基于营销档案属性和挖掘模型的推荐结果,赋予的主观权重为0.2;对基于项目属性的推荐结果,赋予的主观权重为0.2;对基于用户评分的推荐结果,赋予的主观权重为0.4;对基于用户关注点的推荐结果,赋予的主观权重为0.2;
基于熵值法,根据指标变异性的大小来确定客观权重;客观权重的确定包括以下步骤:
基于各模型推荐得分进行数据归一化:
其中,y为归一化后结果,x为用户各个模型得分;
基于推荐得分的归一化结果,计算信息熵:
信息熵:E=-ln(n)-1∑plnp
其中n为用户数量;
确定各推荐模型结果的客观权重:
然后,综合业务的主观权重和各模型推荐结果的客观权重得到最终权重:
其中,w1为各个模型的主观权重,w2为各个模型的客观权重;
最后,对各目标用户推荐的综合能效服务业务项目的最终得分为:
S=∑w×y
其中,w为确定的最终权重。
本发明推荐系统所采用的技术方案如下:一种综合能效服务业务混合推荐系统,包括以下模块:
数据处理模块,用于对数据整合和对数据预处理;
单模型推荐模块,用于获得多个单一模型的推荐结果,包括基于营销档案属性和挖掘模型的推荐结果、基于用户评分的推荐结果、基于项目属性的推荐结果和基于用户关注点的推荐结果;
流行度推荐模块,用于在多个单一模型的推荐结果中分别增加流行度权重因子,获得基于流行度的推荐结果;
综合推荐模块,用于对推荐结果整合,运用综合权重方法确定各个推荐结果在最终推荐结果中的比重,确定目标用户对各个推荐结果的综合得分,基于综合得分确定排名靠前的作为最终推荐结果;
所述流行度权重因子的计算方式为:
通过用户对解决方案的点击评分状况,得到流行度,对流行度进行归一化处理;
根据归一化后的流行度,计算流行度权重因子:
其中,NPop为归一化后的流行度的数值;
所述综合权重方法结合主观权重与客观权重;主观权重以业务为依据,根据各业务维度的重要程度与现实影响,听取相关专家的意见,判断各业务维度标签权重并赋值w1;确定主观权重所考虑的因素包括:门户网站的内外部数据波动情况、推荐结果更新频度和用户兴趣提现程度;其中基于门户网站外部数据的推荐结果变化周期不明显,门户网站内部数据受用户埋点数据增加的影响,推荐结果更新频率更为频繁;所述埋点数据受用户主观性影响大,更能展现用户的兴趣;
对各个模型赋予的主观权重分别为:对基于营销档案属性和挖掘模型的推荐结果,赋予的主观权重为0.2;对基于项目属性的推荐结果,赋予的主观权重为0.2;对基于用户评分的推荐结果,赋予的主观权重为0.4;对基于用户关注点的推荐结果,赋予的主观权重为0.2;
基于熵值法,根据指标变异性的大小来确定客观权重;客观权重的确定包括以下步骤:
基于各模型推荐得分进行数据归一化:
其中,y为归一化后结果,x为用户各个模型得分;
基于推荐得分的归一化结果,计算信息熵:
信息熵:E=-ln(n)-1∑p ln p
其中n为用户数量;
确定各推荐模型结果的客观权重:
然后,综合业务的主观权重和各模型推荐结果的客观权重得到最终权重:
其中,w1为各个模型的主观权重,w2为各个模型的客观权重;
最后,对各目标用户推荐的综合能效服务业务项目的最终得分为:
S=∑w×y
其中,w为确定的最终权重。
本发明提供的一种存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时,实现所述推荐方法的各步骤。
从以上技术方案可知,本发明采用改进算法进行服务策略推荐:针对目前推荐过程中使用最广泛的协同过滤算法不完全适用综合能源服务业务的现状,如协同过滤受用户行为数据量波动的影响较大,因此融合四库知识流行度和用户间多相似度的能效服务业务推荐算法进行补充,对各行业、各细分领域、各区域的用户进行服务策略精准推送;同时结合埋点数据进行智能化、动态化推荐,跟随用户行为的数据变化及时更新推荐结果。与现有技术相比,本发明取得的技术效果包括:
1、由于能效服务业务涉及的数据来源繁杂、客户群体多样,本发明采用改进后的用户评分相似度计算公式、用户关注相似度,考虑了四库资源属性相似度的影响,通过融合项目属性相似度、改进后的用户评分相似度计算、用户关注相似度得到多相似度结果,以提升对目标用户的推荐效果。既考虑了用户的关注喜好,又加入四库资源之间的相似关系,提高了用户相似度计算的准确率。
2、传统推荐算法中热门项目推荐增多、冷门项目推荐减少,本发明为了增加推荐多样性,在传统推荐算法基础上考虑流行度的影响,将流行度作为权重因子引入到相似性计算和结果推荐过程中,减少热门项目推荐,增加冷门项目推荐。更具体来说,本发明在最终结果推荐中加入四库资源流行度的权重因子,并对权重因子计算方法进行了改进,更加适用于目前的业务逻辑。
本发明通过在推荐结果中增加流行度的权重因子来降低热门资源在最终推荐中的影响力,增大流行度较低资源被推荐的可能性,防止出现因热门项目导致推荐的单一化,解决了传统协同过滤算法未考虑资源的流行度随时间的衰减问题。
3、针对用户的冷启动、相似度计算不合理等因素造成推荐效果的缺陷,本发明考虑项目属性相似度、用户关注相似度以及基于营销档案的推荐,对推荐结果进行补充,增加推荐的多样性,实现数据为业务赋能。例如,面对网站新注册用户推荐困难问题,结合用户选择的关注点及行业属性进行用户冷启动处理,为其进行推荐。
4、本发明在推荐过程增加基于内部数据的挖掘结果。基于营销业务系统用户的档案、用电、用能数据,分析挖掘用户清洁能源能力等级、需求响应能力等级等结果,结合用户属性、四库属性,挖掘用户感兴趣和不感兴趣的范围或方向,计算用户属性与四库属性相似度,用于用户推荐,提高用户推荐准确度。
附图说明
图1是本发明实施例提供的综合能效服务业务混合推荐方法的流程图;
图2是本发明实施例中构建的分类语义层次树示意图;
图3是本发明实施例中构建的层次模型示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
如图1所示,本实施例提供综合能效服务业务混合推荐方法,基于融合项目流行度和用户间多相似度对能效服务业务进行推荐,具体包括以下步骤:
S1、前期的数据整合,对与用户和项目相关的数据进行整合。
本实施例中,数据整合的范围包括:营销业务应用系统的用户档案和电量电费数据、门户网站的用户行为数据、网站用户注册信息、新注册用户关注点、兴趣点、四库资源项目属性数据等。
S2、数据预处理,包括数据探查、筛选、清洗、计算、集成。
本实施例中,基于营销内部档案及量费数据、门户网站埋点数据、网站用户注册信息及关注点、兴趣领域、四库中的项目属性等数据,首先对于数据的数量、质量、分布情况进行探查;其次是数据清洗、处理、计算、集成等完成数据预处理。其中,数据清洗包括需求数据的字段筛选、异常值识别及处理、空缺值的识别及填充等工作;数据处理包括档案数据转换、四库属性(项目名称、描述、应用场景、适用领域、用户关注点等)语义分割;数据计算包括营销量费指标计算、近一年埋点数据中用户点击次数计算,以及网站停留时长、点赞、分享等行为的得分计算;数据集成指:对四库资源项目分词、计算清洗后的数据进行汇总,形成后期推荐算法需要的输入数据。
需说明的是,绿色国网平台是国网综合能源服务专用的互联网平台入口;四库为绿色国网平台中的专属概念,包括综合能效服务业务的解决方案、案例、供应商和产品。
S3、获得多个单一模型的推荐结果
S31、获得基于营销档案属性和挖掘模型的推荐结果
(1)构建特征指标,基于营销业务应用系统中的用户基本档案和应收电费、应收电量等数据构建特征指标,用于用户潜力挖掘。
基于建模分析目的,通过电力数据描述统计分析,结合业务需求及数据实际情况,运用数据探索的特征构建方法,对各个业务挖掘主题进行用户业务信息和量费特征提取,构建特征指标,如表1所示。
表1
(2)用户潜力挖掘
基于用电档案、用电特征、用能情况、运行负荷等电力数据,以及基于维度指标或者事实标签,运用特征工程和无监督算法,构建用户挖掘模型,对用户潜力进行挖掘。用户潜力挖掘主要采用的算法技术有:统计分析、相关系数计算、专家打分法、客观权重法、PCA等;基于相同行业用户不同的得分情况,按照分位数或得分情况,对用户赋予不同的潜力标签。
(3)用户典型行业分析
基于行业特征、网上公开信息(如江苏节能网、中国节能协会网、中国节能服务网等专业网站)、专家经验等信息,设计工业、公共服务及组织管理等用户所属行业的二级行业衍生关键词,所设计的用户行业衍生关键词用于与四库属性进行相似度匹配,从而判断两者是否高度相关。部分行业的衍生关键词示例,如表2所示。
表2
(4)四库数据分词和提取关键词
基于四库项目名称,剔除出现频率高或无意义的词汇,减少对有效信息造成的噪音干扰,降低对数据运行准确度的影响;增加自定义词典,提高增加分词结果的可用性;使用结巴分词,将四库数据进行分词;并对四库数据中的项目介绍等数据提取关键词,用于后续四库属性或用户属性的相似度计算。部分四库数据分词处理后结果如表3所示。
表3
序号 | 方案名称 | 分词后的结果 |
1 | 余热余压余气综合利用业务 | 余热,余压,余气,综合利用,业务 |
2 | 水泥厂需求响应解决方案 | 水泥厂,需求响应 |
3 | 工业企业用能优化解决方案 | 工业,企业,用能,优化 |
4 | 酒店能源数字化解决方案 | 酒店,能源,数字化 |
5 | 空调系统解决方案 | 空调,系统 |
6 | 办公楼宇综合能效解决方案 | 办公楼宇,综合能效 |
7 | 楼宇智慧消防解决方案 | 楼宇,智慧,消防 |
8 | 绿色照明解决方案 | 绿色,照明 |
(5)属性相似度计算
利用杰卡德系数,计算用户行业衍生关键词和四库数据关键词之间的相似度,其主要思想为:交集与并集的比值。
其中,S为用户所属行业的衍生关键词集合,T为从四库数据中提取的四库项目名称或介绍汇聚的关键词集合,J为相似度。部分行业的计算结果如表4所示。
表4
(6)推荐结果剔除
基于用户潜力挖掘结果,剔除相关推荐结果。如:清洁能源低潜力用户的推荐结果中,剔除包含有光伏、清洁能源等相关四库资源。
S32、获得基于用户评分的推荐结果
(1)构建用户评分矩阵
基于门户网站用户评分的推荐中,定义门户网站用户集合U={u1,u2,......um},四库中综合能效服务业务的解决方案、案例等形成的项目集合I={i1,i2,......it}。
根据门户网站用户对上述项目集合中解决方案、案例的点击、转发、点赞、停留时长等数据形成评分矩阵Rm*t,得到评分集合。若门户网站用户um未对项目it打分,则评分矩阵中相应元素rmt=0;若门户网站用户对多个解决方案、案例进行了评分,会形成如下评分矩阵:
(2)计算用户相似度矩阵
基于步骤(1)中构建的用户对于四库资源项目的评分矩阵,通过用户相似度计算公式得到用户相似度矩阵。
相似度计算如公式2-公式4所示,其中sim(a,b)c为标准的余弦相似度计算方法,sim(a,b)p为皮尔逊相关相似度计算方法;sim(a,b)A为本实施例改进后的余弦相似度计算方法,用评分中位数代替标准皮尔逊相似度公式里的均值,消除了极值对于均值大小的影响。
本实施例结合综合能效服务业务的数据情况,对用户相似度矩阵的计算公式进行了改进,式中Ra,c表示门户网站用户a对四库资源项目中综合能效服务业务的解决方案c的评分,Rb,c表示门户网站用户b对四库资源项目中综合能效服务业务的解决方案c的评分;Ra表示门户网站用户a对项目集合中所有项目评分的中位数,Rb表示用户b对项目集合中所有项目评分的中位数;表示门户网站用户a对项目集合中所有项目评分的均值,表示门户网站用户b对项目集合中所有项目评分的均值;Ia,b表示门户网站用户a和b共同对项目集合中评分过的项目;Ia表示门户网站用户a对项目集合中评分过的项目;Ib表示门户网站用户b对项目集合中评分过的项目。
用户相似度矩阵为n*n的矩阵;本实施例获得的用户相似度矩阵,如公式5所示:
(3)寻找邻居用户集合
根据上述获取的用户相似度矩阵,找出与目标用户相似度最高的若干个用户组成邻居用户集合。
本步骤以山东某科技有限公司浏览的四库中的解决方案为例,作为目标用户,通过该公司与其他用户对于解决方案的评分计算得到用户相似度矩阵,得到邻居集合{武汉某科技有限公司、天台县某配件有限公司、宁德市某机械制造有限公司、浙江金仪某生物技术有限公司......},并根据邻居用户得分降序排序,选取排在前四的相似用户为最终邻居用户集合。
(4)预测分数生成推荐集合
在得到邻居用户集合后,根据目标用户t山东某科技有限公司的近邻集合Uk获得目标用户t尚未评级的解决方案c(例如暖通节能技术解决方案)的预测评级分数Pt,,c,如公式6所示:
最后根据预测评级分数从大到小进行排序,排序列表选取前n个方案作为目标用户t山东某科技有限公司的基于用户评分的推荐结果。部分推荐结果如表5所示。
表5
用户ID | 企业名称 | 行业 | 解决方案推荐结果 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 余热余压利用解决方案 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 余热余压余气利用解决方案 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 工业企业用能优化解决方案 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 清洁供热制冷解决方案 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 综合能源业务咨询服务的解决方案 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 压缩空气系统节能托管项目解决方法案例 |
S33、获得基于项目属性的推荐结果
传统协同过滤推荐算法中,以选取共评方案、案例的近邻用户,依据预测评分结果进行推荐,忽略了属性的相关因素。而四库资源项目本身具有工业、制造业、农林牧渔等行业分类属性,根据用户在门户网站的点击情况,获得用户的兴趣偏好。根据前期数据预处理中得到的综合能效服务业务中解决方案的分词结果,获得项目属性分类,并结合行业应用领域(高耗能、综合零售、服装制造、有色金属等)、适用场景(包括园区、学校、医院、酒店等)等数据信息,构建项目属性矩阵,如公式7所示:
其中,amn表示项目m的属性n的值。
以解决方案为例,对方案中所属行业分类,根据国民经济行业划分为20个大类,基于分类之间的语义关系,构建分类语义层次树,语义层次树如图2所示:
然后计算项目之间的相似度,如公式8所示:
simAttr(m,n)=∑k∈AttrωksimAttr(amk,ank)
(8)
通过计算项目间的相似度得到解决方案之间的相似度,获得解决方案的邻居集合,从邻居集合中给用户推荐相似度排名靠前的项目。
S34、获得基于用户关注点的推荐结果
用户关注相似度可以判定用户间关注喜好领域的共性,解决缺少属性信息时新注册用户的冷启动问题。通过用户新注册时必须填写的关注点、兴趣领域(例如:用户关注点为综合能效、高耗能、光伏等),结合适用场景、行业应用领域,计算与四库中项目属性信息的相似度,根据相似度进行排名,推荐排名靠前的项目给用户。
S4、在多个单一模型的推荐结果中分别增加流行度权重因子,获得基于流行度的推荐结果。
对四库资源项目产生过行为的用户总数作为项目流行度,它会对项目间的相似度产生影响。以解决方案为例,在目前门户网站中,流行度高的方案更容易被推荐,被用户发现和反馈,流行度低的方案不容易被推荐,很难被用户发现。因此,本实施例通过在推荐结果中增加流行度权重因子,以降低热门方案在最终推荐结果中的影响力。流行度权重因子的计算方式具体如下:
首先通过用户对解决方案的点击评分状况,得到流行度n。因为各项目流行度差别较大,因此在原先公式的基础上进行了改进,对流行度进行了归一化处理,如公式9所示:
Pop为项目的流行度,max Pop和min Pop为流行度中的最大值和最小值,NPop为流行度归一化后的数值。
归一化后进行流行度权重因子的计算如公式10所示:
综合以上步骤,形成初步推荐结果,包括:融合流行度权重因子的基于营销档案属性和挖掘模型的推荐结果、融合流行度权重因子的基于用户评分的推荐结果、融合流行度权重因子的基于用户关注点的推荐结果、融合流行度权重因子的基于项目属性的推荐结果。其中,融合流行度权重因子的基于项目属性的部分推荐结果展示如表6所示。
表6
用户ID | 企业名称 | 行业 | 解决方案推荐结果 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 余热余压利用解决方案 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 余热余压余气利用解决方案 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 综合能源业务咨询服务的解决方案 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 工业企业用能优化解决方案 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 清洁供热制冷解决方案 |
1317****sgcc | 山东**消防科技有限公司 | 铸造及其他金属制品制造 | 压缩空气系统节能托管项目解决方法案例 |
S5、推荐结果整合
为了弥补推荐算法在业务应用的缺陷,除了通过优化算法以外,本实施例还通过优化推荐过程逻辑改善推荐效果。基于以上多种方式混合推荐,运用综合权重方法(结合主观权重与客观权重),确定各个推荐结果在最终推荐结果中的比重,从而确定目标用户对各个推荐结果的综合得分,基于综合得分确定排名靠前的作为最终推荐结果。
1)主观权重:以业务为依据,根据各业务维度的重要程度与现实影响,听取相关专家的意见,判断各业务维度标签权重并赋值w1。主观权重采用层次分析法确定,既考虑了指标之间客观存在的关系,又考虑了专家对指标重要性的主观判断。构建层次模型如图3所示,模型的主观权重确定考虑以下因素:
①源数据波动情况:推荐结果的源数据为门户网站的内外部数据,外部数据即营销业务应用系统用户档案及量费数据,其中,外部数据用于用户潜力挖掘及推荐。在数据探索阶段,对源数据的更新频率、数据波动、数据异常等情况探索发现,外部数据较内部数据来说外部数据量级及用户数量较为稳定,且数据量突变不大。
②推荐结果更新频度:基于门户网站内外部数据的稳定程度的特点,基于内外部数据的推荐结果更新程度对比分析发现,基于外部数据的推荐结果变化周期不明显;内部数据受用户埋点数据增加的影响,推荐结果更新频率更为频繁。
③用户兴趣提现程度:对比各推荐结果重要程度来看,埋点数据受用户主观性影响大,更能展现用户的兴趣。
综合以上,对各个模型赋予的主观权重如表7所示。
表7
模型名称 | 主观权重 |
基于营销档案属性和挖掘模型的推荐 | 0.2 |
基于项目属性的推荐 | 0.2 |
基于用户评分的推荐 | 0.4 |
基于用户关注点的推荐 | 0.2 |
2)客观权重:基于熵值法确定,其基本思想是根据指标变异性的大小来确定客观权重。一般来说,若某个指标的信息熵越小,表明指标值的变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。信息熵也就是信息量的期望;可以把信息熵理解成不确定性的大小,不确定性越大,信息熵也就越大。其表达公式如下:
H(x)=-∑plog2p
客观权重的确定包括以下步骤:
(1)基于各模型推荐得分进行数据归一化:
其中,y为归一化后结果,x为用户各个模型得分。
(2)基于推荐得分的归一化结果,计算信息熵:
信息熵:E=-ln(n)-1∑plnp
(13)
其中,y为模型得分归一化结果,n为用户数量。
(3)确定各推荐模型结果的客观权重:
3)综合业务主观权重和各模型推荐结果的客观权重得到最终权重:
其中,w1为各个模型的主观权重,w2为各个模型的客观权重。
4)对各目标用户推荐的综合能效服务业务项目的最终得分为:
S=∑w×y
(16)
其中,w为确定的最终权重。
基于以上步骤,获取目标用户的最终评分,并将得分降序排列,从高到低进行排序选取n个推荐项目,得到最终推荐结果,部分推荐结果效果展示如表8所示。
表8
实施例2
与实施例1基于相同的发明构思,本实施例提供的是一种综合能效服务业务混合推荐系统,包括以下模块:
数据处理模块,用于对数据整合和对数据预处理;
单模型推荐模块,用于获得多个单一模型的推荐结果,包括基于营销档案属性和挖掘模型的推荐结果、基于用户评分的推荐结果、基于项目属性的推荐结果和基于用户关注点的推荐结果;
流行度推荐模块,用于在多个单一模型的推荐结果中分别增加流行度权重因子,获得基于流行度的推荐结果;
综合推荐模块,用于对推荐结果整合,运用综合权重方法确定各个推荐结果在最终推荐结果中的比重,确定目标用户对各个推荐结果的综合得分,基于综合得分确定排名靠前的作为最终推荐结果。
流行度推荐模块中,流行度权重因子的计算方式为:
通过用户对解决方案的点击评分状况,得到流行度,对流行度进行归一化处理;
根据归一化后的流行度,计算流行度权重因子:
其中,NPop为归一化后的流行度的数值;
综合推荐模块所采用的综合权重方法,结合主观权重与客观权重。
主观权重以业务为依据,根据各业务维度的重要程度与现实影响,听取相关专家的意见,判断各业务维度标签权重并赋值w1;确定主观权重所考虑的因素包括:门户网站的内外部数据波动情况、推荐结果更新频度和用户兴趣提现程度;其中基于门户网站外部数据的推荐结果变化周期不明显,门户网站内部数据受用户埋点数据增加的影响,推荐结果更新频率更为频繁;所述埋点数据受用户主观性影响大,更能展现用户的兴趣;
对各个模型赋予的主观权重分别为:对基于营销档案属性和挖掘模型的推荐结果,赋予的主观权重为0.2;对基于项目属性的推荐结果,赋予的主观权重为0.2;对基于用户评分的推荐结果,赋予的主观权重为0.4;对基于用户关注点的推荐结果,赋予的主观权重为0.2。
基于熵值法,根据指标变异性的大小来确定客观权重;客观权重的确定包括以下步骤:
基于各模型推荐得分进行数据归一化:
其中,y为归一化后结果,x为用户各个模型得分;
基于推荐得分的归一化结果,计算信息熵:
信息熵:E=-ln(n)-1∑plnp
其中n为用户数量;
确定各推荐模型结果的客观权重:
然后,综合业务的主观权重和各模型推荐结果的客观权重得到最终权重:
其中,w1为各个模型的主观权重,w2为各个模型的客观权重;
最后,对各目标用户推荐的综合能效服务业务项目的最终得分为:
S=Σw×y
其中,w为确定的最终权重。
本实施例的各模块分别用于实现实施例1中各步骤,其详细的实现过程请参照实施例1,在此不赘述。
本实施例还提供一种存储介质,存储介质上存储有计算机指令,当计算机指令被处理器执行时,实现实施例1所述推荐方法的各步骤。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.一种综合能效服务业务混合推荐方法,其特征在于,包括以下步骤:
数据整合和数据预处理;
获得多个单一模型的推荐结果,包括基于营销档案属性和挖掘模型的推荐结果、基于用户评分的推荐结果、基于项目属性的推荐结果和基于用户关注点的推荐结果;
在多个单一模型的推荐结果中分别增加流行度权重因子,获得基于流行度的推荐结果;
推荐结果整合,运用综合权重方法确定各个推荐结果在最终推荐结果中的比重,确定目标用户对各个推荐结果的综合得分,基于综合得分确定排名靠前的作为最终推荐结果。
2.根据权利要求1所述的推荐方法,其特征在于,获得基于营销档案属性和挖掘模型的推荐结果,包括:
通过电力数据描述统计分析,结合业务需求及数据实际情况,运用数据探索的特征构建方法,对各个业务挖掘主题进行用户业务信息和量费特征提取,构建特征指标;
基于电力数据,以及基于维度指标或者事实标签,运用特征工程和无监督算法,构建用户挖掘模型,对用户潜力进行挖掘;
基于行业特征、网上公开信息、专家经验,设计用户行业衍生关键词;
对四库数据进行分词和提取关键词;其中,四库包括综合能效服务业务的解决方案、案例、供应商和产品;
计算用户行业衍生关键词和四库数据关键词之间的相似度。
3.根据权利要求1所述的推荐方法,其特征在于,获得基于用户评分的推荐结果,包括:
构建用户评分矩阵,定义门户网站用户集合U={u1,u2,......um},综合能效服务业务的解决方案、案例所形成的项目集合I={i1,i2,......it};根据门户网站用户对所述项目集合中解决方案、案例的点击、转发、点赞、停留时长数据形成评分矩阵Rm*t;
基于所构建的用户评分矩阵,通过改进的用户相似度计算公式sim(a,b)A得到用户相似度矩阵;
其中,Ra,c表示门户网站用户a对综合能效服务业务的解决方案c的评分,Rb,c表示门户网站用户b对综合能效服务业务的解决方案c的评分;Ra表示门户网站用户a对项目集合中所有项目评分的中位数,Rb表示用户b对项目集合中所有项目评分的中位数;表示门户网站用户a对项目集合中所有项目评分的均值,表示门户网站用户b对项目集合中所有项目评分的均值;Ia,b表示门户网站用户a和b共同对项目集合中评分过的项目;Ia表示门户网站用户a对项目集合中评分过的项目;Ib表示门户网站用户b对项目集合中评分过的项目;
根据所获取的用户相似度矩阵,找出与目标用户相似度最高的若干个用户组成邻居用户集合;
根据目标用户t的近邻集合Uk获得目标用户尚未评级的解决方案的预测评级分数Pt,c:
根据预测评级分数从大到小进行排序,排序列表选取前n个方案作为目标用户的基于用户评分的推荐结果。
4.根据权利要求1所述的推荐方法,其特征在于,获得基于项目属性的推荐结果,包括:
根据综合能效服务业务中解决方案的分词结果,获得项目属性分类,并结合行业应用领域、适用场景,构建项目属性矩阵;
对解决方案中所属行业分类,根据国民经济行业划分为若干个大类,基于分类之间的语义关系,构建分类语义层次树;
通过计算项目间相似度的获得解决方案之间的相似度,获得解决方案的邻居集合,从邻居集合中给用户推荐相似度排名靠前的项目。
5.根据权利要求1所述的推荐方法,其特征在于,获得基于用户关注点的推荐结果,包括:
通过用户新注册时填写的关注点、兴趣领域,结合适用场景、行业应用领域,计算与四库中项目属性信息的相似度,根据相似度进行排名,推荐排名靠前的项目给用户;
其中,四库包括综合能效服务业务的解决方案、案例、供应商和产品。
7.根据权利要求1所述的推荐方法,其特征在于,所述综合权重方法结合主观权重与客观权重;
主观权重以业务为依据,根据各业务维度的重要程度与现实影响,听取相关专家的意见,判断各业务维度标签权重并赋值w1;确定主观权重所考虑的因素包括:门户网站的内外部数据波动情况、推荐结果更新频度和用户兴趣提现程度;其中基于门户网站外部数据的推荐结果变化周期不明显,门户网站内部数据受用户埋点数据增加的影响,推荐结果更新频率更为频繁;所述埋点数据受用户主观性影响大,更能展现用户的兴趣;
对各个模型赋予的主观权重分别为:对基于营销档案属性和挖掘模型的推荐结果,赋予的主观权重为0.2;对基于项目属性的推荐结果,赋予的主观权重为0.2;对基于用户评分的推荐结果,赋予的主观权重为0.4;对基于用户关注点的推荐结果,赋予的主观权重为0.2;
基于熵值法,根据指标变异性的大小来确定客观权重;客观权重的确定包括以下步骤:
基于各模型推荐得分进行数据归一化:
其中,y为归一化后结果,x为用户各个模型得分;
基于推荐得分的归一化结果,计算信息熵:
信息熵:E=-ln(n)-1∑p ln p
其中n为用户数量;
确定各推荐模型结果的客观权重:
然后,综合业务的主观权重和各模型推荐结果的客观权重得到最终权重:
其中,w1为各个模型的主观权重,w2为各个模型的客观权重;
最后,对各目标用户推荐的综合能效服务业务项目的最终得分为:
S=Σw×y
其中,w为确定的最终权重。
8.一种综合能效服务业务混合推荐系统,其特征在于,包括以下模块:
数据处理模块,用于对数据整合和对数据预处理;
单模型推荐模块,用于获得多个单一模型的推荐结果,包括基于营销档案属性和挖掘模型的推荐结果、基于用户评分的推荐结果、基于项目属性的推荐结果和基于用户关注点的推荐结果;
流行度推荐模块,用于在多个单一模型的推荐结果中分别增加流行度权重因子,获得基于流行度的推荐结果;
综合推荐模块,用于对推荐结果整合,运用综合权重方法确定各个推荐结果在最终推荐结果中的比重,确定目标用户对各个推荐结果的综合得分,基于综合得分确定排名靠前的作为最终推荐结果;
所述流行度权重因子的计算方式为:
通过用户对解决方案的点击评分状况,得到流行度,对流行度进行归一化处理;
根据归一化后的流行度,计算流行度权重因子:
其中,NPop为归一化后的流行度的数值;
所述综合权重方法结合主观权重与客观权重;主观权重以业务为依据,根据各业务维度的重要程度与现实影响,听取相关专家的意见,判断各业务维度标签权重并赋值w1;确定主观权重所考虑的因素包括:门户网站的内外部数据波动情况、推荐结果更新频度和用户兴趣提现程度;其中基于门户网站外部数据的推荐结果变化周期不明显,门户网站内部数据受用户埋点数据增加的影响,推荐结果更新频率更为频繁;所述埋点数据受用户主观性影响大,更能展现用户的兴趣;
对各个模型赋予的主观权重分别为:对基于营销档案属性和挖掘模型的推荐结果,赋予的主观权重为0.2;对基于项目属性的推荐结果,赋予的主观权重为0.2;对基于用户评分的推荐结果,赋予的主观权重为0.4;对基于用户关注点的推荐结果,赋予的主观权重为0.2;
基于熵值法,根据指标变异性的大小来确定客观权重;客观权重的确定包括以下步骤:
基于各模型推荐得分进行数据归一化:
其中,y为归一化后结果,x为用户各个模型得分;
基于推荐得分的归一化结果,计算信息熵:
信息熵:E=-ln(n)-1∑p ln p
其中n为用户数量;
确定各推荐模型结果的客观权重:
然后,综合业务的主观权重和各模型推荐结果的客观权重得到最终权重:
其中,w1为各个模型的主观权重,w2为各个模型的客观权重;
最后,对各目标用户推荐的综合能效服务业务项目的最终得分为:
S=Σw×y
其中,w为确定的最终权重。
9.根据权利要求8所述的推荐系统,其特征在于,获得基于用户评分的推荐结果,包括:
构建用户评分矩阵,定义门户网站用户集合U={u1,u2,......um},综合能效服务业务的解决方案、案例所形成的项目集合I={i1,i2,......it};根据门户网站用户对所述项目集合中解决方案、案例的点击、转发、点赞、停留时长数据形成评分矩阵Rm*t;
基于所构建的用户评分矩阵,通过改进的用户相似度计算公式sim(a,b)A得到用户相似度矩阵;
其中,Ra,c表示门户网站用户a对综合能效服务业务的解决方案c的评分,Rb,c表示门户网站用户b对综合能效服务业务的解决方案c的评分;Ra表示门户网站用户a对项目集合中所有项目评分的中位数,Rb表示用户b对项目集合中所有项目评分的中位数;表示门户网站用户a对项目集合中所有项目评分的均值,表示门户网站用户b对项目集合中所有项目评分的均值;Ia,b表示门户网站用户a和b共同对项目集合中评分过的项目;Ia表示门户网站用户a对项目集合中评分过的项目;Ib表示门户网站用户b对项目集合中评分过的项目;
根据所获取的用户相似度矩阵,找出与目标用户相似度最高的若干个用户组成邻居用户集合;
根据目标用户t的近邻集合Uk获得目标用户尚未评级的解决方案的预测评级分数Pt,c:
根据预测评级分数从大到小进行排序,排序列表选取前n个方案作为目标用户的基于用户评分的推荐结果。
10.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令被处理器执行时,实现权利要求1-7中任一项所述推荐方法的各步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211661697.8A CN116049543A (zh) | 2022-12-23 | 2022-12-23 | 综合能效服务业务混合推荐方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211661697.8A CN116049543A (zh) | 2022-12-23 | 2022-12-23 | 综合能效服务业务混合推荐方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116049543A true CN116049543A (zh) | 2023-05-02 |
Family
ID=86117316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211661697.8A Pending CN116049543A (zh) | 2022-12-23 | 2022-12-23 | 综合能效服务业务混合推荐方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116049543A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117093782A (zh) * | 2023-10-20 | 2023-11-21 | 国网智能科技股份有限公司 | 一种电力人工智能模型系统及方法 |
-
2022
- 2022-12-23 CN CN202211661697.8A patent/CN116049543A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117093782A (zh) * | 2023-10-20 | 2023-11-21 | 国网智能科技股份有限公司 | 一种电力人工智能模型系统及方法 |
CN117093782B (zh) * | 2023-10-20 | 2024-03-12 | 国网智能科技股份有限公司 | 一种电力人工智能模型系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | An online reviews-driven method for the prioritization of improvements in hotel services | |
CN107562818B (zh) | 信息推荐系统及方法 | |
CN106156127B (zh) | 选择数据内容向终端推送的方法及装置 | |
CN107833117B (zh) | 一种考虑标签信息的贝叶斯个性化排序推荐方法 | |
WO2018068603A1 (zh) | 基于大数据技术的供应链管理决策支持系统 | |
CN109918563B (zh) | 一种基于公开数据的图书推荐的方法 | |
CN103559622A (zh) | 基于特征的协同过滤推荐方法 | |
Liu | Using big data database to construct new GFuzzy text mining and decision algorithm for targeting and classifying customers | |
Lu et al. | Personalized information recommendation model based on context contribution and item correlation | |
CN111143689A (zh) | 根据用户需求和用户画像构建推荐引擎的方法 | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
Al-Bashiri et al. | Collaborative filtering recommender system: overview and challenges | |
Dong et al. | Method for ranking the helpfulness of online reviews based on so-iles todim | |
CN116049543A (zh) | 综合能效服务业务混合推荐方法、系统及存储介质 | |
CN111159559A (zh) | 根据用户需求和用户行为构建推荐引擎的方法 | |
Liu et al. | The product marketing model of the economic zone by the sensor big data mining algorithm | |
CN115344767A (zh) | 基于网络数据的供应商评价方法 | |
CN115829683A (zh) | 一种基于逆奖赏学习优化的电力积分商品推荐方法及系统 | |
Farsani et al. | A semantic recommendation procedure for electronic product catalog | |
Wang | Township recycling performance assessment based on fuzzy TOPSIS model: An empirical investigation using the artificial intelligence-based VIKOR approach | |
Wang et al. | Research on precision marketing strategy based on cluster analysis algorithm | |
Lu et al. | A novel e-commerce customer continuous purchase recommendation model research based on colony clustering | |
CN114092123A (zh) | 一种满意度智能分析系统 | |
Wang et al. | Research on electronic word-of-mouth for product and service quality improvement: bibliometric analysis and future directions | |
Wang | Application of E-Commerce Recommendation Algorithm in Consumer Preference Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |