CN113220905A - 一种融合知识图谱的服务推荐方法 - Google Patents
一种融合知识图谱的服务推荐方法 Download PDFInfo
- Publication number
- CN113220905A CN113220905A CN202110582984.9A CN202110582984A CN113220905A CN 113220905 A CN113220905 A CN 113220905A CN 202110582984 A CN202110582984 A CN 202110582984A CN 113220905 A CN113220905 A CN 113220905A
- Authority
- CN
- China
- Prior art keywords
- service
- individual
- service individual
- vector
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 239000013598 vector Substances 0.000 claims abstract description 62
- 238000004364 calculation method Methods 0.000 claims abstract description 14
- 238000003058 natural language processing Methods 0.000 claims abstract description 6
- 230000001502 supplementing effect Effects 0.000 claims abstract description 5
- 238000000513 principal component analysis Methods 0.000 claims description 6
- ONUFESLQCSAYKA-UHFFFAOYSA-N iprodione Chemical compound O=C1N(C(=O)NC(C)C)CC(=O)N1C1=CC(Cl)=CC(Cl)=C1 ONUFESLQCSAYKA-UHFFFAOYSA-N 0.000 claims description 3
- 230000008520 organization Effects 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种融合知识图谱的服务推荐方法,包括:对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;通过TF‑IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;结合基于服务向量的相似度与基于知识图谱的相似度计算方法,进行推荐。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及一种融合知识图谱的服务推荐方法。
背景技术
目前的服务推荐方法大多存在冷启动问题,不能很好的对新的或者未被用户评分的服务进行推荐,会造成给用户推荐的服务并不符合用户真正需要的情况。且当前的解决方法中鲜有与知识图谱相结合的方法。
发明内容
基于上述存在的问题,本发明提供一种融合知识图谱的服务推荐方法,用以解决现有的推荐方法的冷启动问题。
本发明提出一种融合知识图谱的服务推荐方法,包括:
对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;
通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;
将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;
将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;
将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;
结合基于服务向量的相似度与基于知识图谱的相似度计算方法,进行推荐。
所述的方法中,所述对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组包括:
服务集A,A={a1,a2,...,an},对于A中的每个服务个体a∈A,进行以下操作:
将服务个体a的特征信息Ma进行分词,得到分词后的结果ma={ma1,ma2,...,man};
对分词后的结果ma中的每一个词mai(i=1,2,...,n)的词性进行标注,包括标注为名词、动词、形容词等;
对词性标注后的mai进行命名实体识别,确定mai实体的类型(人名、地名、机构名或其它);
利用mai的命名实体识别结果,通过依存句法分析,将ma中每个词之间的关系表示出来ra=(mai,r,maj),i,j=1,2,...,n,i≠j,其中r为14种依存句法分析标注关系(主谓关系(SBV)、动宾关系(VOB)、间宾关系(IOB)、前置宾语(FOB)、兼语(DBL)、定中关系(ATT)等)之一;
将ra中包含服务个体特征信息的主谓关系(SBV)、动宾关系(VOB)、定中关系(ATT)进行抽取,形成服务个体a的三元关系组Ga=(a,rj,tj),j=1,2,....;
在a的三元关系组Ga=(a,rj,tj),j=1,2,....中,tj包含着a的特征词,取tj的全集为服务个体a的特征词集合CFa={CFa1,CFa2,....}。
所述的方法中,所述通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系,具体为:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,的特征词集合CFa={CFa1,CFa2,....}进行以下操作:
设特征信息语料库中的文档总数为D,其中包含CFai的文档数为Dai。计算特征词CFai的IDF值,IDFai=log(D/(Dai+1));
计算特征词CFai的TF-IDF值,TF-IDFai=TFai×IDFai;
对服务个体a特征词集合CFa中所有特征词的TF-IDF值进行排序,选取前ω作为服务个体a的特征词集合CF’a={CF’a1,CF’a2,...,CF’aω};
根据新的服务个体a的特征词集合CF’a,对应删除a中不必要的三元关系组,更新后的三元关系组记为G’a=(a,r’j,t’j),j=1,2,...。
所述的方法中,所述将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱,具体为:
设服务知识图谱为G,对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,进行以下操作:
判断G中是否存在服务个体a对应的实体;
如果G中存在服务个体a对应的实体,即a∈G,进行以下操作:
将服务个体a与知识图谱G中a对应的实体进行匹配;
利用服务个体a的三元关系组G’a,补充服务知识图谱G中不存在的a的属性,补全服务知识图谱G,设补全后服务知识图谱为G’;
将G’中a的全部三元关系组成a的最终三元关系组G”a;
将a在G’中的属性组成集合EFa,a的最终特征词集合Fa=EFa。
将a的三元关系组G’a全部添加到知识图谱中,补全服务知识图谱G,设补全后服务知识图谱为G’;
将a的三元关系G’a作为a的最终三元关系组,即G”a=G’a;
将a的特征词集合CF’a,作为最终特征词集合Fa=CF’a。
所述的方法中,所述将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度,具体为:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其特征词集合Fa,进行以下操作:
将A中所有服务个体的向量组成所有服务向量集F=(F’1,F’2,...,F’n);
比较得到F中各服务向量维数,找出最小的向量维数m;
利用主成分分析法(PCA)对F中各向量进行降维至m维,得到维数统一的项目向量集F’=(I1,I2,....In);
设F’中任意两个服务个体分别为x,y;
所述的方法中,所述将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度,具体为:
对服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其三元关系组G”a,进行以下操作:
步骤一:将G”a输入到TransHR模型中,通过TransHR模型将a输出为d维向量;
步骤二:将a用向量Ia=(E1a,E2a,...,Eda)T表示,其中Epa,p=1,2,...,d表示a在第p维上的值。
服务集A={a1,a2,...,an}中的每个服务个体a,经过上述步骤处理后即可得到服务个体a在知识图谱G’中的向量表示形式;
设A中任意两个服务个体为x,y;
所述的方法中,所述结合基于服务个体向量的相似度与基于知识图谱的服务个体相似度计算方法,进行推荐,具体为:
设A中任意两个服务个体为x,y;
将基于服务个体向量的相似度simf(x,y)与基于知识图谱的服务个体相似度simsg(Ix,Iy)相结合,具体如下:
通过sim(x,y)=λsimf(x,y)+(1-λ)simsg(Ix,Iy),λ∈(0,1),计算得到x,y的混合相似度;
收集用户u对服务集A中已评分的服务个体集合A1以及用户u对A1中服务个体的评分结果UA1=(ua11,ua12,...);
取服务集A与用户u已评分的服务个体集合A1的差集A2=A-A1,作为预测服务集;
设sim(i,p)为用户u已评分服务个体i,i∈A1,与预测服务个体p,p∈A2之间的混合相似度,ru,i为用户u对已评分服务i的评分;
对pred(u,p)的值进行排序,取前n个作为结果推荐给用户u,完成推荐。
与现有技术相比,本发明提供的方法通过将基于服务个体向量的相似度和基于知识图谱的服务个体相似度两种相似度相结合的方式,解决目前服务推荐存在现有推荐方法与知识图谱结合不足的问题,使服务推荐方法有更好的适用性,使得本发明可以解决服务推荐中冷启动的问题。本发明所采用的融合知识图谱的推荐方法,使该过程更加简单合理。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提出的一种融合知识图谱的服务推荐方法流程图;
图2为本发明计算服务特征与知识图谱相融合的流程图
图3为本发明计算基于服务个体向量的相似度流程图;
图4为本发明计算基于知识图谱的服务个体相似度流程图;
图5为本发明计算融合基于服务个体向量的相似度和基于知识图谱的服务个体相似度进行推荐流程图;
图6为本发明所提出的一种融合知识图谱的服务推荐方法整体体系架构图。
具体实施方式
为了使本发明的目的,技术方案和优点更加清楚,下面结合附图,对本发明实施例提供的一种融合知识图谱的服务推荐方法的具体实施方式进行详细地说明。应当理解,下面所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
基于上述存在的问题,本发明提供一种融合知识图谱的服务推荐方法,用以解决现有的服务推荐中存在的冷启动问题。
实施例1:
本发明提出一种融合知识图谱的服务推荐方法,如图1所示:
对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;
通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;
将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;
将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;
将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;
结合基于服务向量的相似度与基于知识图谱的相似度计算方法,进行推荐。
实施例2:
本发明提出一种计算服务特征与知识图谱相融合的方法,如图2所示:
服务集A,A={a1,a2,...,an},对于A中的每个服务个体a∈A,进行以下操作:
将服务个体a的特征信息Ma进行分词,得到分词后的结果ma={ma1,ma2,...,man};
对分词后的结果ma中的每一个词mai(i=1,2,...,n)的词性进行标注,包括标注为名词、动词、形容词等;
对词性标注后的mai进行命名实体识别,确定mai实体的类型(人名、地名、机构名或其它);
利用mai的命名实体识别结果,通过依存句法分析,将ma中每个词之间的关系表示出来ra=(mai,r,maj),i,j=1,2,...,n,i≠j,其中r为14种依存句法分析标注关系(主谓关系(SBV)、动宾关系(VOB)、间宾关系(IOB)、前置宾语(FOB)、兼语(DBL)、定中关系(ATT)等)之一;
将ra中包含服务个体特征信息的主谓关系(SBV)、动宾关系(VOB)、定中关系(ATT)进行抽取,形成服务个体a的三元关系组Ga=(a,rj,tj),j=1,2,....;
在a的三元关系组Ga=(a,rj,tj),j=1,2,....中,tj包含着a的特征词,取tj的全集为服务个体a的特征词集合CFa={CFa1,CFa2,....}。
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,的特征词集合CFa={CFa1,CFa2,....}进行以下操作:
设特征信息语料库中的文档总数为D,其中包含CFai的文档数为Dai。计算特征词CFai的IDF值,IDFai=log(D/(Dai+1));
计算特征词CFai的TF-IDF值,TF-IDFai=TFai×IDFai;
对服务个体a特征词集合CFa中所有特征词的TF-IDF值进行排序,选取前ω作为服务个体a的特征词集合CF’a={CF’a1,CF’a2,...,CF’aω};
根据新的服务个体a的特征词集合CF’a,对应删除a中不必要的三元关系组,更新后的三元关系组记为G’a=(a,r’j,t’j),j=1,2,...。
设服务知识图谱为G,对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,进行以下操作:
判断G中是否存在服务个体a对应的实体;
如果G中存在服务个体a对应的实体,即a∈G,进行以下操作:
将服务个体a与知识图谱G中a对应的实体进行匹配;
利用服务个体a的三元关系组G’a,补充服务知识图谱G中不存在的a的属性,补全服务知识图谱G,设补全后服务知识图谱为G’;
将G’中a的全部三元关系组成a的最终三元关系组G”a;
将a在G’中的属性组成集合EFa,a的最终特征词集合Fa=EFa。
将a的三元关系组G’a全部添加到知识图谱中,补全服务知识图谱G,设补全后服务知识图谱为G’;
将a的三元关系G’a作为a的最终三元关系组,即G”a=G’a;
将a的特征词集合CF’a,作为最终特征词集合Fa=CF’a。
实施例3:
本发明提出一种基于服务个体向量的相似度的计算方法,如图3所示:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其特征词集合Fa,进行以下操作:
将A中所有服务个体的向量组成所有服务向量集F=(F’1,F’2,...,F’n);
比较得到F中各服务向量维数,找出最小的向量维数m;
利用主成分分析法(PCA)对F中各向量进行降维至m维,得到维数统一的项目向量集F’=(I1,I2,....In);
设F’中任意两个服务个体分别为x,y;
实施例4:
本发明提出基于知识图谱的服务个体相似度的计算方法,如图4所示:
对服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其三元关系组G”a,进行以下操作:
步骤一:将G”a输入到TransHR模型中,通过TransHR模型将a输出为d维向量;
步骤二:将a用向量Ia=(E1a,E2a,...,Eda)T表示,其中Epa,p=1,2,...,d表示a在第p维上的值。
服务集A={a1,a2,...,an}中的每个服务个体a,经过上述步骤处理后即可得到服务个体a在知识图谱G’中的向量表示形式;
设A中任意两个服务个体为x,y;
实施例5:
本发明提出融合基于服务个体向量的相似度和基于知识图谱的服务个体相似度进行推荐的计算方法,如图5所示:
设A中任意两个服务个体为x,y;
将基于服务个体向量的相似度simf(x,y)与基于知识图谱的服务个体相似度simsg(Ix,Iy)相结合,具体如下:
通过sim(x,y)=λsimf(x,y)+(1-λ)simsg(Ix,Iy),λ∈(0,1),计算得到x,y的混合相似度;
收集用户u对服务集A中已评分的服务个体集合A1以及用户u对A1中服务个体的评分结果UA1=(ua11,ua12,...);
取服务集A与用户u已评分的服务个体集合A1的差集A2=A-A1,作为预测服务集;
设sim(i,p)为用户u已评分服务个体i,i∈A1,与预测服务个体p,p∈A2之间的混合相似度,ru,i为用户u对已评分服务i的评分;
对pred(u,p)的值进行排序,取前n个作为结果推荐给用户u,完成推荐。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (7)
1.一种融合知识图谱的服务推荐方法,其特征是,包括:
对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组;
通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系;
将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱;
将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度;
将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度;
结合基于服务向量的相似度与基于知识图谱的相似度计算方法,进行推荐。
2.如权利要求1所述的方法,其特征是,所述对服务集中的每个服务个体的特征信息利用自然语言处理方法进行抽取,形成服务个体的特征词集合和三元关系组包括:
服务集A,A={a1,a2,...,an},对于A中的每个服务个体a∈A,进行以下操作:
将服务个体a的特征信息Ma进行分词,得到分词后的结果ma={ma1,ma2,...,man};
对分词后的结果ma中的每一个词mai(i=1,2,...,n)的词性进行标注,包括标注为名词、动词、形容词等;
对词性标注后的mai进行命名实体识别,确定mai实体的类型(人名、地名、机构名或其它);
利用mai的命名实体识别结果,通过依存句法分析,将ma中每个词之间的关系表示出来ra=(mai,r,maj),i,j=1,2,...,n,i≠j,其中r为14种依存句法分析标注关系(主谓关系(SBV)、动宾关系(VOB)、间宾关系(IOB)、前置宾语(FOB)、兼语(DBL)、定中关系(ATT)等)之一;
将ra中包含服务个体特征信息的主谓关系(SBV)、动宾关系(VOB)、定中关系(ATT)进行抽取,形成服务个体a的三元关系组Ga=(a,rj,tj),j=1,2,....;
在a的三元关系组Ga=(a,rj,tj),j=1,2,....中,tj包含着a的特征词,取tj的全集为服务个体a的特征词集合CFa={CFa1,CFa2,....}。
3.如权利要求1或2所述的方法,其特征是,所述通过TF-IDF方法计算服务个体的特征词集合中特征词的重要程度,保留重要的特征词和对应的三元关系,具体为:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,的特征词集合CFa={CFa1,CFa2,....}进行以下操作:
设特征信息语料库中的文档总数为D,其中包含CFai的文档数为Dai。计算特征词CFai的IDF值,IDFai=log(D/(Dai+1));
计算特征词CFai的TF-IDF值,TF-IDFai=TFai×IDFai;
对服务个体a特征词集合CFa中所有特征词的TF-IDF值进行排序,选取前ω作为服务个体a的特征词集合CF’a={CF’a1,CF’a2,...,CF’aω};
根据新的服务个体a的特征词集合CF’a,对应删除a中不必要的三元关系组,更新后的三元关系组记为G’a=(a,r’j,t’j),j=1,2,...。
4.如权利要求1或2或3所述的方法,其特征是,所述将服务个体的三元关系组与知识图谱中的服务个体特征信息相融合,补充服务个体特征词集合、补全知识图谱,具体为:
设服务知识图谱为G,对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,进行以下操作:
判断G中是否存在服务个体a对应的实体;
如果G中存在服务个体a对应的实体,即a∈G,进行以下操作:
将服务个体a与知识图谱G中a对应的实体进行匹配;
利用服务个体a的三元关系组G’a,补充服务知识图谱G中不存在的a的属性,补全服务知识图谱G,设补全后服务知识图谱为G’;
将G’中a的全部三元关系组成a的最终三元关系组G”a;
将a在G’中的属性组成集合EFa,a的最终特征词集合Fa=EFa。
将a的三元关系组G’a全部添加到知识图谱中,补全服务知识图谱G,设补全后服务知识图谱为G’;
将a的三元关系G’a作为a的最终三元关系组,即G”a=G’a;
将a的特征词集合CF’a,作为最终特征词集合Fa=CF’a。
5.如权利要求1或2或3或4所述的方法,其特征是,所述将服务个体特征词集合中的特征词通过Word2vec方法向量化,计算得到基于服务个体向量的相似度,具体为:
对于服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其特征词集合Fa,进行以下操作:
比较得到F中各服务向量维数,找出最小的向量维数m;
利用主成分分析法(PCA)对F中各向量进行降维至m维,得到维数统一的项目向量集F’=(I1,I2,....In);
设F’中任意两个服务个体分别为x,y;
6.如权利要求1或2或3或4所述的方法,其特征是,所述将知识图谱中的服务个体三元关系组利用TransHR方法向量化,计算得到基于知识图谱的服务个体相似度,具体为:
对服务集A={a1,a2,...,an}中的每个服务个体a,a∈A,其三元关系组G”a,进行以下操作:
步骤一:将G”a输入到TransHR模型中,通过TransHR模型将a输出为d维向量;
步骤二:将a用向量Ia=(E1a,E2a,...,Eda)T表示,其中Epa,p=1,2,...,d表示a在第p维上的值。
服务集A={a1,a2,...,an}中的每个服务个体a,经过上述步骤处理后即可得到服务个体a在知识图谱G’中的向量表示形式;
设A中任意两个服务个体为x,y;
7.如权利要求5或6所述的方法,其特征是,所述结合基于服务个体向量的相似度与基于知识图谱的服务个体相似度计算方法,进行推荐,具体为:
设A中任意两个服务个体为x,y;
将基于服务个体向量的相似度simf(x,y)与基于知识图谱的服务个体相似度simsg(Ix,Iy)相结合,具体如下:
通过sim(x,y)=λsimf(x,y)+(1-λ)simsg(Ix,Iy),λ∈(0,1),计算得到x,y的混合相似度;
收集用户u对服务集A中已评分的服务个体集合A1以及用户u对A1中服务个体的评分结果UA1=(ua11,ua12,...);
取服务集A与用户u已评分的服务个体集合A1的差集A2=A-A1,作为预测服务集;
设sim(i,p)为用户u已评分服务个体i,i∈A1,与预测服务个体p,p∈A2之间的混合相似度,ru,i为用户u对已评分服务i的评分;
对pred(u,p)的值进行排序,取前n个作为结果推荐给用户u,完成推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110582984.9A CN113220905A (zh) | 2021-05-27 | 2021-05-27 | 一种融合知识图谱的服务推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110582984.9A CN113220905A (zh) | 2021-05-27 | 2021-05-27 | 一种融合知识图谱的服务推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113220905A true CN113220905A (zh) | 2021-08-06 |
Family
ID=77098718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110582984.9A Pending CN113220905A (zh) | 2021-05-27 | 2021-05-27 | 一种融合知识图谱的服务推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113220905A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114398109A (zh) * | 2022-01-07 | 2022-04-26 | 福州大学 | 基于通用知识图谱的个性化智能助手构建方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012099115A (ja) * | 2010-11-03 | 2012-05-24 | Nhn Corp | 集団知性を用いた推薦システム及びその方法 |
CN104978320A (zh) * | 2014-04-02 | 2015-10-14 | 东华软件股份公司 | 一种基于相似度的知识推荐方法和设备 |
CN108733798A (zh) * | 2018-05-17 | 2018-11-02 | 电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN111369318A (zh) * | 2020-02-28 | 2020-07-03 | 安徽农业大学 | 一种基于商品知识图谱特征学习的推荐方法及系统 |
CN111753098A (zh) * | 2020-06-23 | 2020-10-09 | 陕西师范大学 | 一种基于跨媒体动态知识图谱的教学方法及系统 |
CN111897967A (zh) * | 2020-07-06 | 2020-11-06 | 北京大学 | 一种基于知识图谱和社交媒体的医疗问诊推荐方法 |
CN112035672A (zh) * | 2020-07-23 | 2020-12-04 | 深圳技术大学 | 一种知识图谱补全方法、装置、设备以及存储介质 |
US20200387809A1 (en) * | 2019-04-30 | 2020-12-10 | Tata Consultancy Services Limited | Method and system for utilizing domain knowledge to automatically identify solution to a problem |
CN112269882A (zh) * | 2020-10-12 | 2021-01-26 | 西安工程大学 | 一种面向知识图谱的旅游景点推荐方法 |
CN112463980A (zh) * | 2020-11-25 | 2021-03-09 | 南京摄星智能科技有限公司 | 一种基于知识图谱的预案智能推荐方法 |
CN112612973A (zh) * | 2020-12-31 | 2021-04-06 | 重庆邮电大学 | 结合知识图谱的个性化智能服装搭配推荐方法 |
CN112667877A (zh) * | 2020-12-25 | 2021-04-16 | 陕西师范大学 | 一种基于旅游知识图谱的景点推荐方法及设备 |
-
2021
- 2021-05-27 CN CN202110582984.9A patent/CN113220905A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012099115A (ja) * | 2010-11-03 | 2012-05-24 | Nhn Corp | 集団知性を用いた推薦システム及びその方法 |
CN104978320A (zh) * | 2014-04-02 | 2015-10-14 | 东华软件股份公司 | 一种基于相似度的知识推荐方法和设备 |
CN108733798A (zh) * | 2018-05-17 | 2018-11-02 | 电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
US20200387809A1 (en) * | 2019-04-30 | 2020-12-10 | Tata Consultancy Services Limited | Method and system for utilizing domain knowledge to automatically identify solution to a problem |
CN111369318A (zh) * | 2020-02-28 | 2020-07-03 | 安徽农业大学 | 一种基于商品知识图谱特征学习的推荐方法及系统 |
CN111753098A (zh) * | 2020-06-23 | 2020-10-09 | 陕西师范大学 | 一种基于跨媒体动态知识图谱的教学方法及系统 |
CN111897967A (zh) * | 2020-07-06 | 2020-11-06 | 北京大学 | 一种基于知识图谱和社交媒体的医疗问诊推荐方法 |
CN112035672A (zh) * | 2020-07-23 | 2020-12-04 | 深圳技术大学 | 一种知识图谱补全方法、装置、设备以及存储介质 |
CN112269882A (zh) * | 2020-10-12 | 2021-01-26 | 西安工程大学 | 一种面向知识图谱的旅游景点推荐方法 |
CN112463980A (zh) * | 2020-11-25 | 2021-03-09 | 南京摄星智能科技有限公司 | 一种基于知识图谱的预案智能推荐方法 |
CN112667877A (zh) * | 2020-12-25 | 2021-04-16 | 陕西师范大学 | 一种基于旅游知识图谱的景点推荐方法及设备 |
CN112612973A (zh) * | 2020-12-31 | 2021-04-06 | 重庆邮电大学 | 结合知识图谱的个性化智能服装搭配推荐方法 |
Non-Patent Citations (2)
Title |
---|
WEIZHUANG HAN 等: "Movie recommendation algorithm based on knowledge graph", 《2019 2ND INTERNATIONAL CONFERENCE ON SAFETY PRODUCE INFORMATIZATION (IICSPI)》 * |
王鸿伟: "基于网络特征学习的个性化推荐系统", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114398109A (zh) * | 2022-01-07 | 2022-04-26 | 福州大学 | 基于通用知识图谱的个性化智能助手构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108052583B (zh) | 电商本体构建方法 | |
CN110162591B (zh) | 一种面向数字教育资源的实体对齐方法及系统 | |
CN109388795A (zh) | 一种命名实体识别方法、语言识别方法及系统 | |
CN112395410B (zh) | 一种基于实体抽取的产业舆情推荐方法、装置及电子设备 | |
CN111858940B (zh) | 一种基于多头注意力的法律案例相似度计算方法及系统 | |
CN112101040A (zh) | 一种基于知识图谱的古代诗词语义检索方法 | |
CN111368075A (zh) | 文章质量预测方法、装置、电子设备及存储介质 | |
CN110941720B (zh) | 一种基于知识库的特定人员信息纠错方法 | |
CN112101042B (zh) | 文本情绪识别方法、装置、终端设备和存储介质 | |
CN113886604A (zh) | 一种职位知识图谱生成方法和系统 | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN113821605A (zh) | 一种事件抽取方法 | |
CN111125457A (zh) | 一种深度跨模态哈希检索方法及装置 | |
CN114357120A (zh) | 基于faq的无监督式检索方法、系统及介质 | |
CN111538846A (zh) | 基于混合协同过滤的第三方库推荐方法 | |
CN114461890A (zh) | 分层多模态的知识产权搜索引擎方法与系统 | |
CN113051380A (zh) | 信息生成方法、装置、电子设备和存储介质 | |
CN116127090A (zh) | 基于融合和半监督信息抽取的航空系统知识图谱构建方法 | |
CN113220905A (zh) | 一种融合知识图谱的服务推荐方法 | |
Andriyanov | Combining Text and Image Analysis Methods for Solving Multimodal Classification Problems | |
CN113516094A (zh) | 一种用于为文档匹配评议专家的系统以及方法 | |
CN111191029B (zh) | 基于监督学习和文本分类的ac构建方法 | |
CN116933164A (zh) | 基于相似性的医康养服务需求分类方法 | |
CN110020439B (zh) | 一种基于隐藏关联网络的多领域文本隐式特征抽取方法 | |
CN108427769B (zh) | 一种基于社交网络的人物兴趣标签提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210806 |
|
WD01 | Invention patent application deemed withdrawn after publication |