CN113220905A - 一种融合知识图谱的服务推荐方法 - Google Patents

一种融合知识图谱的服务推荐方法 Download PDF

Info

Publication number
CN113220905A
CN113220905A CN202110582984.9A CN202110582984A CN113220905A CN 113220905 A CN113220905 A CN 113220905A CN 202110582984 A CN202110582984 A CN 202110582984A CN 113220905 A CN113220905 A CN 113220905A
Authority
CN
China
Prior art keywords
service
individual
service individual
vector
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110582984.9A
Other languages
English (en)
Inventor
杨贞帼
张宏国
马超
黄海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Science and Technology
Original Assignee
Harbin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin University of Science and Technology filed Critical Harbin University of Science and Technology
Priority to CN202110582984.9A priority Critical patent/CN113220905A/zh
Publication of CN113220905A publication Critical patent/CN113220905A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种融合知识图谱的服务推荐方法,包括:对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;通过TF‑IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;结合基于服务向量的相似度与基于知识图谱的相似度计算方法,进行推荐。

Description

一种融合知识图谱的服务推荐方法
技术领域
本发明涉及数据分析技术领域,尤其涉及一种融合知识图谱的服务推荐方法。
背景技术
目前的服务推荐方法大多存在冷启动问题,不能很好的对新的或者未被用户评分的服务进行推荐,会造成给用户推荐的服务并不符合用户真正需要的情况。且当前的解决方法中鲜有与知识图谱相结合的方法。
发明内容
基于上述存在的问题,本发明提供一种融合知识图谱的服务推荐方法,用以解决现有的推荐方法的冷启动问题。
本发明提出一种融合知识图谱的服务推荐方法,包括:
对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;
通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;
将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;
将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;
将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;
结合基于服务向量的相似度与基于知识图谱的相似度计算方法,进行推荐。
所述的方法中,所述对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组包括:
服务集A,A={a1,a2,...,an},对于A中的每个服务个体a∈A,进行以下操作:
将服务个体a的特征信息Ma进行分词,得到分词后的结果ma={ma1,ma2,...,man};
对分词后的结果ma中的每一个词mai(i=1,2,...,n)的词性进行标注,包括标注为名词、动词、形容词等;
对词性标注后的mai进行命名实体识别,确定mai实体的类型(人名、地名、机构名或其它);
利用mai的命名实体识别结果,通过依存句法分析,将ma中每个词之间的关系表示出来ra=(mai,r,maj),i,j=1,2,...,n,i≠j,其中r为14种依存句法分析标注关系(主谓关系(SBV)、动宾关系(VOB)、间宾关系(IOB)、前置宾语(FOB)、兼语(DBL)、定中关系(ATT)等)之一;
将ra中包含服务个体特征信息的主谓关系(SBV)、动宾关系(VOB)、定中关系(ATT)进行抽取,形成服务个体a的三元关系组Ga=(a,rj,tj),j=1,2,....;
在a的三元关系组Ga=(a,rj,tj),j=1,2,....中,tj包含着a的特征词,取tj的全集为服务个体a的特征词集合CFa={CFa1,CFa2,....}。
所述的方法中,所述通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系,具体为:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,的特征词集合CFa={CFa1,CFa2,....}进行以下操作:
设特征词CFai在a的特征信息中出现nai次,a的特征信息中共有Σknak个词。计算特征词CFai的TF值,
Figure BDA0003086743650000021
设特征信息语料库中的文档总数为D,其中包含CFai的文档数为Dai。计算特征词CFai的IDF值,IDFai=log(D/(Dai+1));
计算特征词CFai的TF-IDF值,TF-IDFai=TFai×IDFai
对服务个体a特征词集合CFa中所有特征词的TF-IDF值进行排序,选取前ω作为服务个体a的特征词集合CF’a={CF’a1,CF’a2,...,CF’};
根据新的服务个体a的特征词集合CF’a,对应删除a中不必要的三元关系组,更新后的三元关系组记为G’a=(a,r’j,t’j),j=1,2,...。
所述的方法中,所述将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱,具体为:
设服务知识图谱为G,对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,进行以下操作:
判断G中是否存在服务个体a对应的实体;
如果G中存在服务个体a对应的实体,即a∈G,进行以下操作:
将服务个体a与知识图谱G中a对应的实体进行匹配;
利用服务个体a的三元关系组G’a,补充服务知识图谱G中不存在的a的属性,补全服务知识图谱G,设补全后服务知识图谱为G’;
将G’中a的全部三元关系组成a的最终三元关系组G”a;
将a在G’中的属性组成集合EFa,a的最终特征词集合Fa=EFa
如果G中不存在服务个体a对应的实体,即
Figure BDA0003086743650000022
进行以下操作:
将a的三元关系组G’a全部添加到知识图谱中,补全服务知识图谱G,设补全后服务知识图谱为G’;
将a的三元关系G’a作为a的最终三元关系组,即G”a=G’a;
将a的特征词集合CF’a,作为最终特征词集合Fa=CF’a
所述的方法中,所述将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度,具体为:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其特征词集合Fa,进行以下操作:
步骤一:将Fa中每个特征词j,利用Word2vec方法转化成对应词向量
Figure BDA0003086743650000023
步骤二:计算特征词j的词向量模,
Figure BDA0003086743650000024
步骤三:将服务个体a的特征词集合Fa改为向量表述形式,
Figure BDA0003086743650000025
将A中所有服务个体的向量组成所有服务向量集F=(F’1,F’2,...,F’n);
比较得到F中各服务向量维数,找出最小的向量维数m;
利用主成分分析法(PCA)对F中各向量进行降维至m维,得到维数统一的项目向量集F’=(I1,I2,....In);
设F’中任意两个服务个体分别为x,y;
通过利用Pearson相关系数计算F’a中所有服务个体之间的相似度
Figure BDA0003086743650000026
得到基于服务个体向量的相似度simf(x,y)。
所述的方法中,所述将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度,具体为:
对服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其三元关系组G”a,进行以下操作:
步骤一:将G”a输入到TransHR模型中,通过TransHR模型将a输出为d维向量;
步骤二:将a用向量Ia=(E1a,E2a,...,Eda)T表示,其中Epa,p=1,2,...,d表示a在第p维上的值。
服务集A={a1,a2,...,an}中的每个服务个体a,经过上述步骤处理后即可得到服务个体a在知识图谱G’中的向量表示形式;
设A中任意两个服务个体为x,y;
通过
Figure BDA0003086743650000031
计算得到A中任意任意两个服务个体间的距离;
通过
Figure BDA0003086743650000032
计算A中任意任意两个服务个体间的相似度,得到基于知识图谱的服务个体相似度simsg(Ix,Iy)。
所述的方法中,所述结合基于服务个体向量的相似度与基于知识图谱的服务个体相似度计算方法,进行推荐,具体为:
设A中任意两个服务个体为x,y;
将基于服务个体向量的相似度simf(x,y)与基于知识图谱的服务个体相似度simsg(Ix,Iy)相结合,具体如下:
通过sim(x,y)=λsimf(x,y)+(1-λ)simsg(Ix,Iy),λ∈(0,1),计算得到x,y的混合相似度;
收集用户u对服务集A中已评分的服务个体集合A1以及用户u对A1中服务个体的评分结果UA1=(ua11,ua12,...);
取服务集A与用户u已评分的服务个体集合A1的差集A2=A-A1,作为预测服务集;
设sim(i,p)为用户u已评分服务个体i,i∈A1,与预测服务个体p,p∈A2之间的混合相似度,ru,i为用户u对已评分服务i的评分;
通过
Figure BDA0003086743650000033
计算用户u对于服务p的预测评分pred(u,p);
对pred(u,p)的值进行排序,取前n个作为结果推荐给用户u,完成推荐。
与现有技术相比,本发明提供的方法通过将基于服务个体向量的相似度和基于知识图谱的服务个体相似度两种相似度相结合的方式,解决目前服务推荐存在现有推荐方法与知识图谱结合不足的问题,使服务推荐方法有更好的适用性,使得本发明可以解决服务推荐中冷启动的问题。本发明所采用的融合知识图谱的推荐方法,使该过程更加简单合理。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提出的一种融合知识图谱的服务推荐方法流程图;
图2为本发明计算服务特征与知识图谱相融合的流程图
图3为本发明计算基于服务个体向量的相似度流程图;
图4为本发明计算基于知识图谱的服务个体相似度流程图;
图5为本发明计算融合基于服务个体向量的相似度和基于知识图谱的服务个体相似度进行推荐流程图;
图6为本发明所提出的一种融合知识图谱的服务推荐方法整体体系架构图。
具体实施方式
为了使本发明的目的,技术方案和优点更加清楚,下面结合附图,对本发明实施例提供的一种融合知识图谱的服务推荐方法的具体实施方式进行详细地说明。应当理解,下面所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
基于上述存在的问题,本发明提供一种融合知识图谱的服务推荐方法,用以解决现有的服务推荐中存在的冷启动问题。
实施例1:
本发明提出一种融合知识图谱的服务推荐方法,如图1所示:
对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;
通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;
将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;
将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;
将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;
结合基于服务向量的相似度与基于知识图谱的相似度计算方法,进行推荐。
实施例2:
本发明提出一种计算服务特征与知识图谱相融合的方法,如图2所示:
服务集A,A={a1,a2,...,an},对于A中的每个服务个体a∈A,进行以下操作:
将服务个体a的特征信息Ma进行分词,得到分词后的结果ma={ma1,ma2,...,man};
对分词后的结果ma中的每一个词mai(i=1,2,...,n)的词性进行标注,包括标注为名词、动词、形容词等;
对词性标注后的mai进行命名实体识别,确定mai实体的类型(人名、地名、机构名或其它);
利用mai的命名实体识别结果,通过依存句法分析,将ma中每个词之间的关系表示出来ra=(mai,r,maj),i,j=1,2,...,n,i≠j,其中r为14种依存句法分析标注关系(主谓关系(SBV)、动宾关系(VOB)、间宾关系(IOB)、前置宾语(FOB)、兼语(DBL)、定中关系(ATT)等)之一;
将ra中包含服务个体特征信息的主谓关系(SBV)、动宾关系(VOB)、定中关系(ATT)进行抽取,形成服务个体a的三元关系组Ga=(a,rj,tj),j=1,2,....;
在a的三元关系组Ga=(a,rj,tj),j=1,2,....中,tj包含着a的特征词,取tj的全集为服务个体a的特征词集合CFa={CFa1,CFa2,....}。
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,的特征词集合CFa={CFa1,CFa2,....}进行以下操作:
设特征词CFai在a的特征信息中出现nai次,a的特征信息中共有Σknak个词。计算特征词CFai的TF值,
Figure BDA0003086743650000051
设特征信息语料库中的文档总数为D,其中包含CFai的文档数为Dai。计算特征词CFai的IDF值,IDFai=log(D/(Dai+1));
计算特征词CFai的TF-IDF值,TF-IDFai=TFai×IDFai
对服务个体a特征词集合CFa中所有特征词的TF-IDF值进行排序,选取前ω作为服务个体a的特征词集合CF’a={CF’a1,CF’a2,...,CF’};
根据新的服务个体a的特征词集合CF’a,对应删除a中不必要的三元关系组,更新后的三元关系组记为G’a=(a,r’j,t’j),j=1,2,...。
设服务知识图谱为G,对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,进行以下操作:
判断G中是否存在服务个体a对应的实体;
如果G中存在服务个体a对应的实体,即a∈G,进行以下操作:
将服务个体a与知识图谱G中a对应的实体进行匹配;
利用服务个体a的三元关系组G’a,补充服务知识图谱G中不存在的a的属性,补全服务知识图谱G,设补全后服务知识图谱为G’;
将G’中a的全部三元关系组成a的最终三元关系组G”a;
将a在G’中的属性组成集合EFa,a的最终特征词集合Fa=EFa
如果G中不存在服务个体a对应的实体,即
Figure BDA0003086743650000056
进行以下操作:
将a的三元关系组G’a全部添加到知识图谱中,补全服务知识图谱G,设补全后服务知识图谱为G’;
将a的三元关系G’a作为a的最终三元关系组,即G”a=G’a;
将a的特征词集合CF’a,作为最终特征词集合Fa=CF’a
实施例3:
本发明提出一种基于服务个体向量的相似度的计算方法,如图3所示:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其特征词集合Fa,进行以下操作:
步骤一:将Fa中每个特征词j,利用Word2vec方法转化成对应词向量
Figure BDA0003086743650000052
步骤二:计算特征词j的词向量模,
Figure BDA0003086743650000053
步骤三:将服务个体a的特征词集合Fa改为向量表述形式,
Figure BDA0003086743650000054
将A中所有服务个体的向量组成所有服务向量集F=(F’1,F’2,...,F’n);
比较得到F中各服务向量维数,找出最小的向量维数m;
利用主成分分析法(PCA)对F中各向量进行降维至m维,得到维数统一的项目向量集F’=(I1,I2,....In);
设F’中任意两个服务个体分别为x,y;
通过利用Pearson相关系数计算F’a中所有服务个体之间的相似度
Figure BDA0003086743650000055
得到基于服务个体向量的相似度simf(x,y)。
实施例4:
本发明提出基于知识图谱的服务个体相似度的计算方法,如图4所示:
对服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其三元关系组G”a,进行以下操作:
步骤一:将G”a输入到TransHR模型中,通过TransHR模型将a输出为d维向量;
步骤二:将a用向量Ia=(E1a,E2a,...,Eda)T表示,其中Epa,p=1,2,...,d表示a在第p维上的值。
服务集A={a1,a2,...,an}中的每个服务个体a,经过上述步骤处理后即可得到服务个体a在知识图谱G’中的向量表示形式;
设A中任意两个服务个体为x,y;
通过
Figure BDA0003086743650000061
计算得到A中任意任意两个服务个体间的距离;
通过
Figure BDA0003086743650000062
计算A中任意任意两个服务个体间的相似度,得到基于知识图谱的服务个体相似度simsg(Ix,Iy);
实施例5:
本发明提出融合基于服务个体向量的相似度和基于知识图谱的服务个体相似度进行推荐的计算方法,如图5所示:
设A中任意两个服务个体为x,y;
将基于服务个体向量的相似度simf(x,y)与基于知识图谱的服务个体相似度simsg(Ix,Iy)相结合,具体如下:
通过sim(x,y)=λsimf(x,y)+(1-λ)simsg(Ix,Iy),λ∈(0,1),计算得到x,y的混合相似度;
收集用户u对服务集A中已评分的服务个体集合A1以及用户u对A1中服务个体的评分结果UA1=(ua11,ua12,...);
取服务集A与用户u已评分的服务个体集合A1的差集A2=A-A1,作为预测服务集;
设sim(i,p)为用户u已评分服务个体i,i∈A1,与预测服务个体p,p∈A2之间的混合相似度,ru,i为用户u对已评分服务i的评分;
通过
Figure BDA0003086743650000063
计算用户u对于服务p的预测评分pred(u,p);
对pred(u,p)的值进行排序,取前n个作为结果推荐给用户u,完成推荐。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种融合知识图谱的服务推荐方法,其特征是,包括:
对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;
通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;
将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;
将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;
将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;
结合基于服务向量的相似度与基于知识图谱的相似度计算方法,进行推荐。
2.如权利要求1所述的方法,其特征是,所述对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组包括:
服务集A,A={a1,a2,...,an},对于A中的每个服务个体a∈A,进行以下操作:
将服务个体a的特征信息Ma进行分词,得到分词后的结果ma={ma1,ma2,...,man};
对分词后的结果ma中的每一个词mai(i=1,2,...,n)的词性进行标注,包括标注为名词、动词、形容词等;
对词性标注后的mai进行命名实体识别,确定mai实体的类型(人名、地名、机构名或其它);
利用mai的命名实体识别结果,通过依存句法分析,将ma中每个词之间的关系表示出来ra=(mai,r,maj),i,j=1,2,...,n,i≠j,其中r为14种依存句法分析标注关系(主谓关系(SBV)、动宾关系(VOB)、间宾关系(IOB)、前置宾语(FOB)、兼语(DBL)、定中关系(ATT)等)之一;
将ra中包含服务个体特征信息的主谓关系(SBV)、动宾关系(VOB)、定中关系(ATT)进行抽取,形成服务个体a的三元关系组Ga=(a,rj,tj),j=1,2,....;
在a的三元关系组Ga=(a,rj,tj),j=1,2,....中,tj包含着a的特征词,取tj的全集为服务个体a的特征词集合CFa={CFa1,CFa2,....}。
3.如权利要求1或2所述的方法,其特征是,所述通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系,具体为:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,的特征词集合CFa={CFa1,CFa2,....}进行以下操作:
设特征词CFai在a的特征信息中出现nai次,a的特征信息中共有Σknak个词。计算特征词CFai的TF值,
Figure FDA0003086743640000011
设特征信息语料库中的文档总数为D,其中包含CFai的文档数为Dai。计算特征词CFai的IDF值,IDFai=log(D/(Dai+1));
计算特征词CFai的TF-IDF值,TF-IDFai=TFai×IDFai
对服务个体a特征词集合CFa中所有特征词的TF-IDF值进行排序,选取前ω作为服务个体a的特征词集合CF’a={CF’a1,CF’a2,...,CF’};
根据新的服务个体a的特征词集合CF’a,对应删除a中不必要的三元关系组,更新后的三元关系组记为G’a=(a,r’j,t’j),j=1,2,...。
4.如权利要求1或2或3所述的方法,其特征是,所述将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱,具体为:
设服务知识图谱为G,对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,进行以下操作:
判断G中是否存在服务个体a对应的实体;
如果G中存在服务个体a对应的实体,即a∈G,进行以下操作:
将服务个体a与知识图谱G中a对应的实体进行匹配;
利用服务个体a的三元关系组G’a,补充服务知识图谱G中不存在的a的属性,补全服务知识图谱G,设补全后服务知识图谱为G’;
将G’中a的全部三元关系组成a的最终三元关系组G”a;
将a在G’中的属性组成集合EFa,a的最终特征词集合Fa=EFa
如果G中不存在服务个体a对应的实体,即
Figure FDA0003086743640000021
进行以下操作:
将a的三元关系组G’a全部添加到知识图谱中,补全服务知识图谱G,设补全后服务知识图谱为G’;
将a的三元关系G’a作为a的最终三元关系组,即G”a=G’a;
将a的特征词集合CF’a,作为最终特征词集合Fa=CF’a
5.如权利要求1或2或3或4所述的方法,其特征是,所述将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度,具体为:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其特征词集合Fa,进行以下操作:
步骤一:将Fa中每个特征词j,利用Word2vec方法转化成对应词向量
Figure FDA0003086743640000022
步骤二:计算特征词j的词向量模,
Figure FDA0003086743640000023
步骤三:将服务个体a的特征词集合Fa改为向量表述形式,
Figure FDA0003086743640000024
将A中所有服务个体的向量组成所有服务向量集F=(F’1,F’2,...,F’n);
比较得到F中各服务向量维数,找出最小的向量维数m;
利用主成分分析法(PCA)对F中各向量进行降维至m维,得到维数统一的项目向量集F’=(I1,I2,....In);
设F’中任意两个服务个体分别为x,y;
通过利用Pearson相关系数计算F’a中所有服务个体之间的相似度
Figure FDA0003086743640000025
得到基于服务个体向量的相似度simf(x,y)。
6.如权利要求1或2或3或4所述的方法,其特征是,所述将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度,具体为:
对服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其三元关系组G”a,进行以下操作:
步骤一:将G”a输入到TransHR模型中,通过TransHR模型将a输出为d维向量;
步骤二:将a用向量Ia=(E1a,E2a,...,Eda)T表示,其中Epa,p=1,2,...,d表示a在第p维上的值。
服务集A={a1,a2,...,an}中的每个服务个体a,经过上述步骤处理后即可得到服务个体a在知识图谱G’中的向量表示形式;
设A中任意两个服务个体为x,y;
通过
Figure FDA0003086743640000026
计算得到A中任意任意两个服务个体间的距离;
通过
Figure FDA0003086743640000031
计算A中任意任意两个服务个体间的相似度,得到基于知识图谱的服务个体相似度simsg(Ix,Iy)。
7.如权利要求5或6所述的方法,其特征是,所述结合基于服务个体向量的相似度与基于知识图谱的服务个体相似度计算方法,进行推荐,具体为:
设A中任意两个服务个体为x,y;
将基于服务个体向量的相似度simf(x,y)与基于知识图谱的服务个体相似度simsg(Ix,Iy)相结合,具体如下:
通过sim(x,y)=λsimf(x,y)+(1-λ)simsg(Ix,Iy),λ∈(0,1),计算得到x,y的混合相似度;
收集用户u对服务集A中已评分的服务个体集合A1以及用户u对A1中服务个体的评分结果UA1=(ua11,ua12,...);
取服务集A与用户u已评分的服务个体集合A1的差集A2=A-A1,作为预测服务集;
设sim(i,p)为用户u已评分服务个体i,i∈A1,与预测服务个体p,p∈A2之间的混合相似度,ru,i为用户u对已评分服务i的评分;
通过
Figure FDA0003086743640000032
计算用户u对于服务p的预测评分pred(u,p);
对pred(u,p)的值进行排序,取前n个作为结果推荐给用户u,完成推荐。
CN202110582984.9A 2021-05-27 2021-05-27 一种融合知识图谱的服务推荐方法 Pending CN113220905A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110582984.9A CN113220905A (zh) 2021-05-27 2021-05-27 一种融合知识图谱的服务推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110582984.9A CN113220905A (zh) 2021-05-27 2021-05-27 一种融合知识图谱的服务推荐方法

Publications (1)

Publication Number Publication Date
CN113220905A true CN113220905A (zh) 2021-08-06

Family

ID=77098718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110582984.9A Pending CN113220905A (zh) 2021-05-27 2021-05-27 一种融合知识图谱的服务推荐方法

Country Status (1)

Country Link
CN (1) CN113220905A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114398109A (zh) * 2022-01-07 2022-04-26 福州大学 基于通用知识图谱的个性化智能助手构建方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012099115A (ja) * 2010-11-03 2012-05-24 Nhn Corp 集団知性を用いた推薦システム及びその方法
CN104978320A (zh) * 2014-04-02 2015-10-14 东华软件股份公司 一种基于相似度的知识推荐方法和设备
CN108733798A (zh) * 2018-05-17 2018-11-02 电子科技大学 一种基于知识图谱的个性化推荐方法
CN111369318A (zh) * 2020-02-28 2020-07-03 安徽农业大学 一种基于商品知识图谱特征学习的推荐方法及系统
CN111753098A (zh) * 2020-06-23 2020-10-09 陕西师范大学 一种基于跨媒体动态知识图谱的教学方法及系统
CN111897967A (zh) * 2020-07-06 2020-11-06 北京大学 一种基于知识图谱和社交媒体的医疗问诊推荐方法
CN112035672A (zh) * 2020-07-23 2020-12-04 深圳技术大学 一种知识图谱补全方法、装置、设备以及存储介质
US20200387809A1 (en) * 2019-04-30 2020-12-10 Tata Consultancy Services Limited Method and system for utilizing domain knowledge to automatically identify solution to a problem
CN112269882A (zh) * 2020-10-12 2021-01-26 西安工程大学 一种面向知识图谱的旅游景点推荐方法
CN112463980A (zh) * 2020-11-25 2021-03-09 南京摄星智能科技有限公司 一种基于知识图谱的预案智能推荐方法
CN112612973A (zh) * 2020-12-31 2021-04-06 重庆邮电大学 结合知识图谱的个性化智能服装搭配推荐方法
CN112667877A (zh) * 2020-12-25 2021-04-16 陕西师范大学 一种基于旅游知识图谱的景点推荐方法及设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012099115A (ja) * 2010-11-03 2012-05-24 Nhn Corp 集団知性を用いた推薦システム及びその方法
CN104978320A (zh) * 2014-04-02 2015-10-14 东华软件股份公司 一种基于相似度的知识推荐方法和设备
CN108733798A (zh) * 2018-05-17 2018-11-02 电子科技大学 一种基于知识图谱的个性化推荐方法
US20200387809A1 (en) * 2019-04-30 2020-12-10 Tata Consultancy Services Limited Method and system for utilizing domain knowledge to automatically identify solution to a problem
CN111369318A (zh) * 2020-02-28 2020-07-03 安徽农业大学 一种基于商品知识图谱特征学习的推荐方法及系统
CN111753098A (zh) * 2020-06-23 2020-10-09 陕西师范大学 一种基于跨媒体动态知识图谱的教学方法及系统
CN111897967A (zh) * 2020-07-06 2020-11-06 北京大学 一种基于知识图谱和社交媒体的医疗问诊推荐方法
CN112035672A (zh) * 2020-07-23 2020-12-04 深圳技术大学 一种知识图谱补全方法、装置、设备以及存储介质
CN112269882A (zh) * 2020-10-12 2021-01-26 西安工程大学 一种面向知识图谱的旅游景点推荐方法
CN112463980A (zh) * 2020-11-25 2021-03-09 南京摄星智能科技有限公司 一种基于知识图谱的预案智能推荐方法
CN112667877A (zh) * 2020-12-25 2021-04-16 陕西师范大学 一种基于旅游知识图谱的景点推荐方法及设备
CN112612973A (zh) * 2020-12-31 2021-04-06 重庆邮电大学 结合知识图谱的个性化智能服装搭配推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEIZHUANG HAN 等: "Movie recommendation algorithm based on knowledge graph", 《2019 2ND INTERNATIONAL CONFERENCE ON SAFETY PRODUCE INFORMATIZATION (IICSPI)》 *
王鸿伟: "基于网络特征学习的个性化推荐系统", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114398109A (zh) * 2022-01-07 2022-04-26 福州大学 基于通用知识图谱的个性化智能助手构建方法

Similar Documents

Publication Publication Date Title
CN108052583B (zh) 电商本体构建方法
CN110162591B (zh) 一种面向数字教育资源的实体对齐方法及系统
CN109388795A (zh) 一种命名实体识别方法、语言识别方法及系统
CN112395410B (zh) 一种基于实体抽取的产业舆情推荐方法、装置及电子设备
CN111858940B (zh) 一种基于多头注意力的法律案例相似度计算方法及系统
CN112101040A (zh) 一种基于知识图谱的古代诗词语义检索方法
CN111368075A (zh) 文章质量预测方法、装置、电子设备及存储介质
CN110941720B (zh) 一种基于知识库的特定人员信息纠错方法
CN112101042B (zh) 文本情绪识别方法、装置、终端设备和存储介质
CN113886604A (zh) 一种职位知识图谱生成方法和系统
CN112699645B (zh) 语料标注方法、装置及设备
CN113821605A (zh) 一种事件抽取方法
CN111125457A (zh) 一种深度跨模态哈希检索方法及装置
CN114357120A (zh) 基于faq的无监督式检索方法、系统及介质
CN111538846A (zh) 基于混合协同过滤的第三方库推荐方法
CN114461890A (zh) 分层多模态的知识产权搜索引擎方法与系统
CN113051380A (zh) 信息生成方法、装置、电子设备和存储介质
CN116127090A (zh) 基于融合和半监督信息抽取的航空系统知识图谱构建方法
CN113220905A (zh) 一种融合知识图谱的服务推荐方法
Andriyanov Combining Text and Image Analysis Methods for Solving Multimodal Classification Problems
CN113516094A (zh) 一种用于为文档匹配评议专家的系统以及方法
CN111191029B (zh) 基于监督学习和文本分类的ac构建方法
CN116933164A (zh) 基于相似性的医康养服务需求分类方法
CN110020439B (zh) 一种基于隐藏关联网络的多领域文本隐式特征抽取方法
CN108427769B (zh) 一种基于社交网络的人物兴趣标签提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210806

WD01 Invention patent application deemed withdrawn after publication