CN113360784A - 一种用于设备运维方案推荐的知识图谱优化的协同过滤算法 - Google Patents

一种用于设备运维方案推荐的知识图谱优化的协同过滤算法 Download PDF

Info

Publication number
CN113360784A
CN113360784A CN202110691180.2A CN202110691180A CN113360784A CN 113360784 A CN113360784 A CN 113360784A CN 202110691180 A CN202110691180 A CN 202110691180A CN 113360784 A CN113360784 A CN 113360784A
Authority
CN
China
Prior art keywords
similarity
scoring
knowledge graph
users
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110691180.2A
Other languages
English (en)
Other versions
CN113360784B (zh
Inventor
张永军
温洪帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202110691180.2A priority Critical patent/CN113360784B/zh
Publication of CN113360784A publication Critical patent/CN113360784A/zh
Application granted granted Critical
Publication of CN113360784B publication Critical patent/CN113360784B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于知识图谱优化的协同过滤算法,通过引入融合因子函数进行相似度融合的推荐算法。本发明主要提供一种基于知识图谱的运维推荐系统,能够大幅度提升推荐系统的效果以及解决传统推荐系统数据稀疏的问题。该系统主要包括:基于加权欧氏距离的知识图谱的相似度计算模块;基于用户的协同过滤算法相似度计算模块;通过融合因子函数进行两种相似度融合的模块;利用融合后的相似度进行推荐方案的推荐模块。本发明通过引入融合因子函数实现两种相似度融合的方式来提高推荐算法的准确率,可以根据推荐算法的评价方案来更新融合因子函数中的参数,增加了推荐算法的有效性。

Description

一种用于设备运维方案推荐的知识图谱优化的协同过滤算法
技术领域
本发明涉及设备运维信息推荐技术领域,具体涉及推荐系统中关心的数据稀疏性问题,通过引入知识图谱作为辅助信息来更好的描述运维系统中异常问题的相似性,然后根据用户对运维方案的评分来推荐合适的运维方案,使得推荐的结果更精确。
背景技术
推荐系统已经广泛应用在实际生活中的很多场景,特别是个性化推荐系统已经有越来越多的研究工作和落地实践,但是仍然面临着一些问题,例如数据稀疏、冷启动等问题。推荐算法大致分为基于内容的推荐、基于协同过滤的推荐、混合推荐。其中协同过滤算法是应用最为广泛的且最有效的推荐算法。其基本思想是利用用户和物品历史的反馈数据,挖掘用户和物品本身的相关联性,并基于此进行推荐排序。具体地,协同过滤推荐又被分为3类:基于用户的协同过滤推荐,基于物品的协同过滤推荐,基于模型的推荐。基于用户的协同过滤方法是基于假设“用户可能喜欢与他相似用户喜欢的物品”,通过用户历史反馈记录计算用户间的相似度,利用其相似的用户对物品的反馈来预测对应用户的反馈情况并进行推荐。这类方法的主要优点在于避开了对物品自身属性的特征挖掘,但是在实际应用中我们会发现当我们在使用用户历史行为数据来构建用户-项目评分矩阵的时候随着系统上的用户和项目的数量逐渐增多使得评分矩阵变大,然而其中的每一位用户评分过少因此会产生数据稀疏的问题。为了解决这类问题,我们提出了基于用户对项目评分来预测用户对项目属性偏好的方法。其次,我们还考虑到用户偏好相似度仅仅通过用户评分来刻画并不全面,所以我们结合知识图谱,从用户的历史交互项目出发,沿着知识图谱上有向的传播用户的偏好能很好的刻画用户隐藏偏好相似性。
发明内容
本发明主要解决的技术问题是提供一种基于知识图谱的运维推荐系统,能够大幅度提升推荐系统的效果以及解决传统推荐系统数据稀疏的问题。该方法的流程如下:
步骤S1:基于知识图谱的相似度计算模块,其中知识图谱的相似度计算方法采取利用加权的欧式距离计算知识图谱实体之间的语义相似度;
步骤S2:基于用户的协同过滤相似度计算模块,该模块利用系统中用户的评分矩阵表示用户对运维方案的偏好,计算不同用户之间在运维方案属性偏好上的相似性;
步骤S3:预测评分模块,用于通过融合因子函数计算得到最终的相似性,通过融合后的相似性得到指定运维方案的最近邻居后,通过评分预测公式来计算系统中的用户对未评分方案的评分,然后向用户推荐评分最高的前N种运维方案。
本发明中提出新的融合因子函数公式如公式(1)所示,推导过程如下:
实际使用场景中的用户对某个异常的问题的考虑角度不一致等原因,需要考虑评分数量对相似度计算的影响。因此设定用户对异常问题-运维方案评分数量的共同阀值γ,根据其大小调整两个相似度在数据稀疏性情况下的权重比例,这样做可以保证算法的精度。由此可得计算两种相似度的融合的公式具体计算方法如下:
Figure RE-GDA0003192807100000031
式(3)中的sim(Ii,Ij)代表混合后的相似度,count代表员工对运维方案的评分数量,a为融合因子,其中α的取值范围为0到1。如果α的值为0,则此算法只选择使用协同过滤的相似度,α的值是1代表的情况是仅利用知识图谱的计算的相似度。
知识图谱中实体的相同属性对融合因子函数的影响计算知识图谱的相似度占比大小的权重的公式为:
Figure RE-GDA0003192807100000032
式中的直接关系权重值为η,间接关系权重值为η2。则根据公式 (4)得到相似度计算方式如下:
Figure RE-GDA0003192807100000033
由上面的分析可以得出融合后的知识图谱的相似度融合因子函数为fkg(Ii,Ij),其可以表示为:
Figure RE-GDA0003192807100000034
同理经过融合后的协同过滤相似度的融合因子函数为 fcf(Ii,Ij),其可以表示成:
Figure RE-GDA0003192807100000041
考虑到员工评分数量对融合因子的影响和异常问题实体的相同属性对融合因子的影响,则最终的相似度计算公式为:
Figure RE-GDA0003192807100000042
由公式(8)可以看出,此时sim(Ii,Ij)表示的是最终相似度,α为融合因子。当员工对某种方案评分数量小于公共的评分数量时,则可以忽略运维人员的评分数量对融合函数的影响,此时只单独考虑异常问题实体的相同属性对融合函数的影响。
本发明具有以下显著特点:i)从应用的角度上解决了数据稀疏性问题并提高推荐效果:将用户的历史评分数据投影到项目属性上面,通过公式刻画出用户对项目属性的偏好程度,在一定程度上解决了数据稀疏的问题;ii)提出一种利用融合因子函数进行知识图谱与协同过滤算法相结合的方式改善了原算法的效果,使得推荐的准确性提升更大以及更具有应用价值。
附图说明
图1是预测评分完成后进行推荐列表生成的流程示意图;
图2是基于知识图谱优化的推荐算法流程图;
具体实施方法
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
请参阅图1以及图2,本发明实施例包括:
(a)一种基于知识图谱的设备运维推荐系统,其特征在于,包括:用户偏好相似度计算模块、设备运维知识图谱的相似度计算模块及预测评分模块。
(b)用户偏好相似度计算模块,其中用户偏好相似度计算的方法是通过用户-运维方案的评分矩阵表计算用户在运维方案的相似性;
(c)知识图谱的相似度计算模块,考虑到仅仅结合用户评分数据不能很好的刻画用户相似度之间的联系,因此我们结合知识图谱到推荐算法当中,通过引入知识图谱中的辅助信息很好的刻画了用户偏好在知识图谱上的传播。通过结合设备运维知识图谱用沿着知识图谱的用户历史交互异常问题-运维方案出发很好的刻画出用户的隐藏偏好,从而计算出基于知识图谱的相似性;
(d)融合因子函数的确定,通过分析运维数据中确定员工对运维方案的评分次数count,据此确定评分数量的多少对融合函数中权重的影响;在计算运维异常实体的相似度时,需要计算实体之间的相同属性的数目,相同的属性关系越多,此时则相似度计算的权重f(Ii,Ij) 代表的比例越大;对于融合因子函数中的融合因子α的确定,需要通过实验遍历的方式选择最合适的值。
(e)预测评分模块,用于通过融合因子函数计算得到最终的用户相似性,通过用户相似性得到指定用户的最近邻邻居后通过评分预测公式来预测用户对未评分运维方案的评分。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (5)

1.一种基于知识图谱优化的协同过滤推荐算法,其特征在于,包括:
步骤S1:基于知识图谱的相似度计算模块,其中知识图谱的相似度计算方法采取利用加权的欧式距离计算知识图谱实体之间的语义相似度;
步骤S2:基于用户的协同过滤相似度计算模块,该模块利用系统中用户的评分矩阵表示用户对运维方案的偏好,计算不同用户之间在运维方案属性偏好上的相似性;
步骤S3:预测评分模块,用于通过融合因子函数计算得到最终的相似性,通过融合后的相似性得到指定运维方案的最近邻居后,通过评分预测公式来计算系统中的用户对未评分方案的评分,然后向用户推荐评分最高的前N种运维方案。
2.根据权利要求1所述的一种基于知识图谱的相似度计算方法,其特征在于,利用加权的欧式距离计算知识图谱实体之间的相似度。
3.根据权利要求1中的步骤S2所述的方法,其特征在于,根据用户的评分计算相似度来表示用户对方案的偏好,具体包括:可以利用余弦公式计算得到运维人员评价的异常问题-运维方案的相似度。
4.根据权利要求1中的步骤S3所述的方法,其特征在于,根据融合因子函数将知识图谱和基于用户的协同过滤算法的相似度进行融合,具体包括:
sim(Ii,Ij)=fkg(Ii,Ij)·simk(Ii,Ij)+fcf(Ii,Ij)·simcf(Ii,Ij) (1)
式(1)中的fkg(Ii,Ij)和fcf(Ii,Ij)为融合因子函数。考虑到具体的使用场景中有其它因素会影响到相似度计算过程中的融合因子函数的参数选择和确定,因此基于用户评分数量的多少和运维图谱中相同实体的属性数量可能产生的影响,本文提出了一些对融合因子函数的优化。
5.根据权利要求1中的步骤S3所述的方法进行预测评分,其特征在于,根据得到的融合后的相似度利用预测评分公式进行评分预测,具体包括:
评分预测公式为:
Figure RE-FDA0003192807090000021
公式(2)中的
Figure RE-FDA0003192807090000022
为用户对异常问题v的解决方案的平均评分,ruj表示的是相似异常问题对应运维方案的评分,f(|tui-tuj|)表示的是时间衰减函数,目的是提高员工最近评分的行为对推荐方案的权重。员工对异常问题的解决方案的平均评分
Figure RE-FDA0003192807090000023
N(u)为异常问题对应方案的评分集合,rui表示方案的评分,Nt为时间衰减参数而tui-tuj表示的是时间间隔。
CN202110691180.2A 2021-06-22 2021-06-22 一种用于设备运维方案推荐的知识图谱优化的协同过滤算法 Active CN113360784B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110691180.2A CN113360784B (zh) 2021-06-22 2021-06-22 一种用于设备运维方案推荐的知识图谱优化的协同过滤算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110691180.2A CN113360784B (zh) 2021-06-22 2021-06-22 一种用于设备运维方案推荐的知识图谱优化的协同过滤算法

Publications (2)

Publication Number Publication Date
CN113360784A true CN113360784A (zh) 2021-09-07
CN113360784B CN113360784B (zh) 2023-09-19

Family

ID=77535666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110691180.2A Active CN113360784B (zh) 2021-06-22 2021-06-22 一种用于设备运维方案推荐的知识图谱优化的协同过滤算法

Country Status (1)

Country Link
CN (1) CN113360784B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113917267A (zh) * 2021-10-15 2022-01-11 万帮数字能源股份有限公司 一种充电桩故障排查方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160217374A1 (en) * 2015-01-27 2016-07-28 Milq Inc. Method and system utilizing collaborative filtering
CN106570090A (zh) * 2016-10-20 2017-04-19 杭州电子科技大学 基于兴趣变化和信任关系的协同过滤推荐方法
CN109447713A (zh) * 2018-10-31 2019-03-08 国家电网公司 一种基于知识图谱的推荐方法及装置
CN112765488A (zh) * 2021-01-25 2021-05-07 广东工业大学 一种融合社交网络和知识图谱的推荐方法、系统和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160217374A1 (en) * 2015-01-27 2016-07-28 Milq Inc. Method and system utilizing collaborative filtering
CN106570090A (zh) * 2016-10-20 2017-04-19 杭州电子科技大学 基于兴趣变化和信任关系的协同过滤推荐方法
CN109447713A (zh) * 2018-10-31 2019-03-08 国家电网公司 一种基于知识图谱的推荐方法及装置
CN112765488A (zh) * 2021-01-25 2021-05-07 广东工业大学 一种融合社交网络和知识图谱的推荐方法、系统和设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113917267A (zh) * 2021-10-15 2022-01-11 万帮数字能源股份有限公司 一种充电桩故障排查方法

Also Published As

Publication number Publication date
CN113360784B (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
Luo et al. Personalized recommendation by matrix co-factorization with tags and time information
CN103164463B (zh) 推荐标签的方法和装置
CN109684538A (zh) 一种基于用户个人特征的推荐方法及推荐系统
CN107833117B (zh) 一种考虑标签信息的贝叶斯个性化排序推荐方法
CN112115377B (zh) 一种基于社交关系的图神经网络链路预测推荐方法
CN107220365A (zh) 基于协同过滤与关联规则并行处理的精准推荐系统及方法
CN112612973B (zh) 结合知识图谱的个性化智能服装搭配推荐方法
WO2010037286A1 (zh) 一种基于协同过滤的推荐方法和系统
CN104462383A (zh) 一种基于用户多种行为反馈的电影推荐方法
CN111125540A (zh) 一种融合知识图谱表示学习和偏置矩阵分解的推荐方法
CN103309869A (zh) 数据对象的展示关键词推荐方法及系统
CN110704413A (zh) 一种基于深度学习的知识图谱构建方法
CN113360784B (zh) 一种用于设备运维方案推荐的知识图谱优化的协同过滤算法
CN117557306A (zh) 基于行为、特征对消费者分类的管理系统
Li et al. Knowledge graph representation reasoning for recommendation system
Ifada et al. How relevant is the irrelevant data: leveraging the tagging data for a learning-to-rank model
Ifada et al. Do-rank: DCG optimization for learning-to-rank in tag-based item recommendation systems
CN108415987B (zh) 一种电影推荐的冷启动解决方法
EP4116884A2 (en) Method and apparatus for training tag recommendation model, and method and apparatus for obtaining tag
CN105930358A (zh) 基于关联度的案例检索方法及其系统
CN102073709A (zh) 一种基于最近邻用户重排序(drnn)的相似度计算方法
CN111460318B (zh) 基于显性和隐性信任的协同过滤推荐方法
CN114912031A (zh) 基于聚类和协同过滤的混合推荐方法和系统
CN114970854A (zh) 一种基于时序邻域聚合的多视野动态网络链接预测方法及系统
CN113535956A (zh) 一种基于媒介贡献度的新闻热点预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant