CN113837847B - 基于异质多元关系融合的知识密集型服务推荐方法 - Google Patents

基于异质多元关系融合的知识密集型服务推荐方法 Download PDF

Info

Publication number
CN113837847B
CN113837847B CN202111276405.4A CN202111276405A CN113837847B CN 113837847 B CN113837847 B CN 113837847B CN 202111276405 A CN202111276405 A CN 202111276405A CN 113837847 B CN113837847 B CN 113837847B
Authority
CN
China
Prior art keywords
service
employer
knowledge
heterogeneous
services
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111276405.4A
Other languages
English (en)
Other versions
CN113837847A (zh
Inventor
龙梅
王旭
陶影辉
高旻
阳碧玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202111276405.4A priority Critical patent/CN113837847B/zh
Publication of CN113837847A publication Critical patent/CN113837847A/zh
Application granted granted Critical
Publication of CN113837847B publication Critical patent/CN113837847B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Biophysics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了基于异质多元关系融合的知识密集型服务推荐方法,包括以下步骤:S1:构建异构信息网络,获取异构信息网络中的异质多元关系;S2:融合所述异质多元关系,学习雇主和服务的综合向量表示;S3:基于雇主和服务的综合向量表示获取预测值,根据所述预测值给每个雇主推荐服务。本发明可以较好的实现工业领域中雇主知识密集型服务需求挖掘,可以帮助面临信息过载的非专业用户在大量的专业化应用中发现自己感兴趣的知识密集型服务,有助于增加雇主对平台的粘性,促进销售,并提高平台的服务质量和利润。

Description

基于异质多元关系融合的知识密集型服务推荐方法
技术领域
本发明涉及推荐技术领域,具体涉及一种基于异质多元关系融合的知识密集型服务推荐方法。
背景技术
推荐方法被各种在线平台用于预测和推荐用户感兴趣的产品或服务,在提高产品或服务销售率、曝光率,缓解信息过载方面具有突出的作用。如淘宝、亚马逊等平台的推荐方法利用用户的历史交易、浏览、点击、评价等行为数据分析用户的偏好,预测并推荐用户最可能购买的服务或产品。但是现有推荐方法主要用于消费领域向用户推荐标准化的产品或服务。这些标准化的产品或服务同时被大量的用户使用。与标准化产品或服务不同,工业设计、工业智造、市场研究、动漫设计、软件研发等知识密集型服务是依雇主需求高度定制化的,且每个雇主购买的每项知识密集型服务的具体内容因隐私保护,不会对外公开。因此,现有用于消费领域的推荐方法用于工业领域推荐知识密集型服务的准确性不高。
服务市场和信息与通讯技术的快速发展,为知识密集型服务在线交易提供了基础。如ZBJ.com,Upwork,和99designs等平台专注于服务知识密集型服务的在线交易。随着知识密集型服务在线交易频率和交易数量的提升,一些推荐方法被运用于知识密集型服务平台,以缓解信息过载问题。但是现有推荐方法主要帮助工作者在大量定制化知识密集型服务需求中找到与其兴趣和能力高度相关的任务,或根据用户提交的需求信息向用户推荐知识资源(信息或人力资源)。当前,知识密集型服务平台缺乏探索雇主潜在知识密集型服务需求并推荐服务的推荐方法。为促进销售,提高平台服务质量和利润,急需研发知识密集型服务推荐方法以探索雇主知识密集型服务间存在的关系(或雇主的知识密集型服务需求偏好),并推荐服务。
发明内容
针对现有技术中的缺陷,本发明提供一种基于异质多元关系融合的知识密集型服务推荐方法,包括以下步骤:
S1:构建异构信息网络,获取异构信息网络中的异质多元关系;
S2:融合所述异质多元关系,学习雇主和服务的综合向量表示;
S3:基于雇主和服务的综合向量表示获取预测值,根据所述预测值给每个雇主推荐服务。
优选地,步骤S1中,构建异构信息网络的方法包括以下步骤:
S11:构建知识密集型服务信息网络的网络模式,以示意知识密集型服务信息网络中的对象类型及其交互关系;其中,所述对象类型包括雇主、服务、知识、商业活动和工人,所述交互关系包括雇主-服务、知识-服务、商业活动-服务和工人-服务;
S12:获取原始数据并对原始数据进行预处理,建立对象关系;其中,所述对象关系包雇主-服务关系、商业活动-服务关系、工人-服务关系、服务-服务知识相似性关系;
S13:链接所有对象关系,构建知识密集服务的异构信息网络。
优选地,步骤S1中,获取异构信息网络中的异质多元关系的方法具体为:设计元路径,采用随机游走策略,按照设计的元路径获取异构信息网络中的异质多元关系。
优选地,步骤S2中,融合所述异质多元关系,学习雇主和服务的综合向量表示的方法包括以下步骤:
S21:融合每条元路径获取的异质多元关系,学习雇主和服务语义特定的向量表示;
S22:融合来所有元路径的异质多元关系,学习雇主和服务的综合向量表示。
优选地,步骤S21中,融合每条元路径获取的异质多元关系,学习雇主和服务语义特定的向量表示的具体方法为:将每条元路径获取的异质多元关系输入metapath2vec模型中学习,得到雇主和服务语义特定的向量表示。
优选地,步骤S22中,学习雇主向量表示的方法包括以下步骤:
S221:通过多层感知机转换雇主语义特定的向量表示;
S222:基于雇主语义特定向量表示计算每条元路径对每个雇主的重要性;
S223:归一化每条元路径对每个雇主的重要性,计算每条路径的权重;
S224:基于每条元路径的权重进行加权融合,得到雇主的综合向量表示。
优选地,步骤S3中,基于雇主和服务的综合向量表示构建推荐模型,基于所述推荐模型获取预测值,其中,所述推荐模型具体为:
其中,表示预测值,pu表示雇主综合向量表示,qs表示服务综合向量表示,h为预测层。
优选地,根据通过推荐模型获取预测值之前,还包括利用损失函数对模型进行优化训练,最小化预测值与实际值Rus之间的差值。
优选地,步骤S3中,根据所述预测值给每个雇主推荐服务的方法为:按照预测值的大小进行排序得到推荐列表,将推荐列表的前K个服务推荐给雇主。
本发明的有益效果体现在:本发明所提供的一种基于异质多元关系融合的知识密集型服务推荐方法,可以较好的实现工业领域中雇主知识密集型服务需求挖掘。知识密集型服务平台上集聚了大量专业化的应用,提供知识密集型服务推荐方法应用到推荐系统,可以帮助面临信息过载的非专业用户在大量的专业化应用中发现自己感兴趣的知识密集型服务,有助于增加雇主对平台的粘性,促进销售,并提高平台的服务质量和利润。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明的一种基于异质多元关系融合的知识密集型服务推荐方法流程图;
图2为知识密集型服务信息网络的网络模式的结构示意图;
图3为建立对象关系的示意图;
图4为知识密集型服务异构信息网络的一个片段;
图5为设计的元路径示意图;
图6为推荐模型在不同元路径组合下的性能;
图7为推荐模型在不同相似度下的性能;
图8为推荐模型在不同下的性能。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
如图1所示,本发明所提供的一种基于异质多元关系融合的知识密集型服务推荐方法,包括以下步骤:
S1:构建异构信息网络,获取异构信息网络中的异质多元关系;
需要说明的,步骤S1中,构建异构信息网络的方法包括以下步骤:
S11:构建知识密集型服务信息网络的网络模式,以示意知识密集型服务信息网络中的对象类型及其交互关系;其中,所述对象类型包括雇主、服务、知识、商业活动和工人,所述交互关系包括雇主-服务、知识-服务、商业活动-服务和工人-服务;
交互关系定义如下:
1)交互关系定义1:知识-服务交互关系定义
交互关系定义1.1:同一雇主购买的某些知识密集型服务很可能需要类似的知识去执行。
交互关系定义1.2:需要相似知识执行的知识密集型服务是相似的。
2)交互关系定义2:商业活动-服务交互关系定义
交互关系定义2.1:同一雇主购买的某些知识密集型服务很可能属于相同的商业活动。
交互关系定义2.2:属于同一商业活动的知识密集型服务具有高度相关性。
3)交互关系定义3:工作者-服务交互关系定义
交互关系定义3.1:雇主可能会从熟悉的知识工作者那里购买知识密集型服务。
交互关系定义3.2:由同一知识工作者提供的知识密集型服务具有较高的相关性。
根据上述定义,知识密集型服务的信息网络中有5种对象类型:雇主、服务、知识、商业活动和知识工作者,以及4种关系类型:雇主-服务、知识-服务、商业活动-服务和工人-服务。
然而,用于描述执行服务所需知识的信息是丰富而异质的,如:专业、学历、工作经历、项目经历、职称、取得的资格证书等。如果将执行各种知识密集型服务的所有知识信息都展现在知识密集型服务的信息网络中,那么这种知识-服务多链接关系将使知识密集型服务的信息网络将变得冗杂,模型的计算复杂度也会增加。所以我们利用知识数据量化知识密集型服务间的知识相似度,将知识-服务多链接关系转化为服务-服务知识相似度单链接关系,以轻量化知识密集型服务的信息网络,减轻模型计算复杂度。
所以知识密集型服务的网络模式如图2所示。由图2可知,知识密集型服务的信息网络中包含4种对象类型,4种交互关系类型,所以知识密集型服务的信息网络是一个异构信息网络。
S12:获取原始数据并对原始数据进行预处理,建立对象关系;其中,所述对象关系包雇主-服务关系、商业活动-服务关系、工人-服务关系、服务-服务知识相似性关系;该过程如图3所示,获取原始数据,并对原始数据进行预处理,基于预处理的原始数据建立对象关系,所示原始数据包含交易数据、工作者-服务关系、服务-类目关系、知识数据,1)雇主-服务关系:交易数据是推荐建模最基础的数据,可直接从知识密集型服务平台上获取。如图3所示的雇主-服务矩阵表示了雇主-服务关系,矩阵中的1表示雇主和服务间有过交互(如雇主过买过改服务),0表示雇主和服务间没有交互。本发明的任务是在没有与雇主互动的服务中找到雇主最感兴趣的服务,并推荐给雇主。
2)工作者-服务关系:工作者-服务关系也可直接从知识密集型服务平台上获取,如图3所示,工作者-服务关系表明每个工作者可以提供什么类型的知识密集型服务。
3)服务-服务知识相似性关系:知识密集型服务平台一般会按特定的规则分类平台上提供的知识密集型服务,并整理出服务-类目关系。虽然不同的平台可能有不同的分类规则,但是同一类目下的服务或子类目间经常具有某些相似性。可以在服务-类目关系的基础上量化服务间的知识相似性。图3中的服务-类目关系显示典型的服务-类目关系树,最底层的S表示一种独立的知识密集型服务,C2表示二级类目,C1表示一级类目。根据平台服务类目关系的特点,可以以服务-类目关系中的S、C2或C1为关键词收集知识数据来量化服务间的知识相似性。如:
通常描述完成知识密集型服务所需知识的信息为文本信息。以C2为关键词收集知识数据,并将同一关键词下收集到的数据合并为一个文本。
利用ParagraphVector(Le&TomasMikolov,2014)模型学习每个C2下的知识文本的向量表示,得到
计算间的内积,得到C2间的知识相似性。
根据服务-类目中的C2-S关系,将C2间的知识相似性映射到服务间,得到服务-服务知识相似性。
4)商业活动-服务关系:在价值链咨询模型的基础上,将服务-类目关系中的S、C2或C1归类到不同商业活动下,并建立商业活动-服务关系。如:
根据价值链咨询模型,将C2归类到不同商业活动下,建立A-C2关系。
根据服务-类目中的C2-S关系,将A-C2关系映射到服务间,得到商业活动-服务关系。
S13:链接所有对象关系,构建知识密集服务的异构信息网络。
根据步骤S11建立的“知识密集型服务信息网络的网络模板”和步骤S12构建的雇主-服务、工作者-服务、服务-服务知识相似性、商业活动-服务等对象关系,链接所有对象,建立异质对象间的高阶连通性。知识密集型服务异构信息网络的一个片段如图4所示。网络中,基础的雇主-服务交互关系用粗实线表示,其他工作者-服务、服务-服务知识相似性、商业活动-服务等对象关系用细实线表示。在异构信息网络中探索对象间的多关系生成的推荐用粗实线表示。在建立知识密集型服务的异构信息网络时,变动服务-服务知识相似性的阈值控制网络中交互关系的丰富性。并在通过试验寻找使模型性能最好的知识相似度。
需要说明的,步骤S1中,获取异构信息网络中的异质多元关系的方法具体为:设计元路径,采用随机游走策略,按照设计的元路径获取异构信息网络中的异质多元关系。每条元路径的的语义解释如表1所示,每条元路径的结构如图5所示。
表1元路径语义解释
给定元路径沿元路径/>定义的关系可以在知识密集型服务的异构信息网络中获得很多具体的路径,这些具体的路劲成为路径实例,用ρ。链接雇主u和服务s的路径实例集合成为u和s间的基于元路径的异质多关系。在知识密集型服务的异构信息网络中,沿元路径探索对象间的异质多关系可以生成推荐。如在图3所示的异构信息网络中,基于路径实例u1-s1-u2-s2,u1-s1-u3-s2,和(u1-s1-a1-s2)sim,很可能会向雇主u1推荐服务s2。基于路径实例u4-s3-w2-s4和(u4-s3-a2-s4)sim,很可能会向雇主u4推荐服务s4
如果没有构建知识密集型服务得异构信息网络,仅依赖雇主-服务二部图,雇主u4将不会被推荐任何服务。与仅包含雇主-服务交互关系的二部图相比,知识密集型服务的异构信息网络中包含的丰富的异质多关系更有利于揭示雇主知识密集型服务间的关系,并长生推荐。
S2:融合所述异质多元关系,学习雇主和服务的综合向量表示;
需要说明的,步骤S2中,融合所述异质多元关系,学习雇主和服务的综合向量表示的方法包括以下步骤:
S21:融合每条元路径获取的异质多元关系,学习雇主和服务语义特定的向量表示;
需要说明的,步骤S21中,融合每条元路径获取的异质多元关系,学习雇主和服务语义特定的向量表示的具体方法为:将每条元路径获取的异质多元关系输入metapath2vec模型中学习,得到雇主和服务语义特定的向量表示,了若设计了N条元路径,表示为:则经过metapath2vec模型学习后,异质信息网络中的每个节点均可获得N组语义特定的向量表示,提取雇主和服务的向量表示,分别表示为:/>
S22:融合来所有元路径的异质多元关系,学习雇主和服务的综合向量表示。
需要说明的,步骤S22中,学习雇主向量表示的方法包括以下步骤:
S221:通过多层感知机转换雇主语义特定的向量表示,具体为:
S222:基于雇主语义特定的向量表示计算每条元路径对每个雇主的重要性:给定语义注意向量x和雇主u在元路径上的雇主语义特定的向量/>用x和/>的相似性来表示元路径/>对雇主u的重要性,表示/>
其中W、b和x分别为权重矩阵、偏置项和语义注意向量,h是待学习的参数,并在所有元路径和语义特定的节点向量间共享。
S223:通过SoftMax函数归一化每条元路径对雇主的重要性,计算每条元路径的权重:元路径对雇主u的权重表示为/>
越高,元路径/>对雇主u越重要。一般每条元路径对不同雇主的权重是不同的;
S224:基于每条元路径的权重进行加权融合,得到雇主的综合向量表示,使用作为权重系数,雇主综合向量表示具体为:
需要说明的,元路径对所有雇主的权重表示为/>可以表示为所有/>平均值:
需要说明的,融合异构多元关系,学习服务综合向量表示的过程与学习雇主综合向量表示的过程相同。
需要说明的,步骤S3中,基于雇主和服务的综合向量表示,通过推荐模型获取预测值,其中,所述推荐模型具体为:
其中,表示预测值,pu表示雇主综合向量表示,qs表示服务综合向量表示,h为预测层。
需要说明的,根据通过推荐模型获取预测值之前,还包括利用损失函数对模型进行优化训练,最小化预测值与实际值Rus之间的差值。本发明使用(EfficientNeuralMatrixFactorizationwithoutSamplingforRecommendation)等提出的非采样策略优化模型,模型损失函数为:
其中B∈U表示雇主集中的一组雇主,S是服务集,d是嵌入向量的维度,cus表示Rus的权重,其中表示负样本的权重。
S3:基于雇主和服务的综合向量表示获取预测值,根据所述预测值给每个雇主推荐服务。
需要说明的,步骤S3中,根据所述预测值给每个雇主推荐服务的方法为:按照预测值的大小进行排序得到推荐列表,将推荐列表的前K个服务推荐给雇主。
综上所述,本发明所提供的一种基于异质多元关系融合的知识密集型服务推荐方法,可以较好的实现工业领域中雇主知识密集型服务需求挖掘。知识密集型服务平台上集聚了大量专业化的应用,提供知识密集型服务推荐方法应用到推荐系统,可以帮助面临信息过载的非专业用户在大量的专业化应用中发现自己感兴趣的知识密集型服务,有助于增加雇主对平台的粘性,促进销售,并提高平台的服务质量和利润。
为了更好地理解本发明的方案,下面以猪八戒平台的服务推荐为例进一步对本发明进行解释说明。
猪八戒网(ZBJ.com)是中国领先和最大的专注于服务知识密集型服务交易的平台。当前,平台上聚集了超2千万用户。提供工业智造、工程设计、工商财税、品牌设计、市场研究、游戏开发、软件开发等企业生产经营过程中涉及的各种知识密集型服务服务。在猪八戒平台的知识密集型服务交易数据上对所提方法进行了试验,以评估上述方法,具体的目的是回答以下研究问题:
问题一:与目前最先进的推荐模型相比,本发明所提算法模型的性能如何?
问题二:融合异质多关系学习雇主和服务的向量表示时,雇主节点和服务节点分别依赖哪些元路径?
问题三:随着所考虑关系的变化,模型性能如何变化?
问题四:随知识相似度的变化,模型性能如何变化?
问题五:非采样策略中,系数如何影响模型性能?
数据集:
交易数据:从猪八戒网上获得雇主-服务交易记录16219条,其中有2355名雇主,1875项服务,每名雇主至少购买了5项服务,每项服务至少被购买过3次。数据的稀疏度为0.37%。雇主-服务交互记录稀疏且不充分。
服务文档:如图3所示,从猪八戒网获得的服务文档包含服务-类目关系和工作者-服务关系。在服务类目关系中,同一二级类目下的服务基本需要相似的知识来完成,但部分二级类目间仍存在知识相似性。工作者-服务关系显示了每个工作者可以提供哪些服务。
招聘数据:由于二级类目间存在知识相似性,所以以服务-类目关系中的200个二级类目名称为关键词从招聘网站上收集了7900条招聘数据作为知识数据。其中每个关键词至少拥有30条相关的知识数据,每条知识数据包含岗位职责和岗位要求两项内容。岗位职责主要描述了工作内容,岗位要求主要描述了所需的知识和能力。
所有的数据被随机的分成了3组,80%作为训练集,10%作为验证集,10%作为测试集。
实验设置:基于元路径的随机游走收集路径实例时,每个结点的游走次数w为200,游走长度l为20。使用metapath2vec融合来自每条元路径的多元关系,学习每个结点语义特定的向量表示时,异质领域的大小k为7。整个学习过程中,向量的输入输出维度均为128。实验过程中,分析服务-服务知识相似度sim、非采样策略中系数和元路径组合变动对模型性能的影响。
评价指标:使用了两个广泛应用于推荐系统评价的指标:recall@K和NDCG@K。recall@K表示样本中的正案例被正确预测的概率。NDCG@K是评价推荐表排序准确性的指标,推荐列表越匹配用户的偏好,NDCG@K的值越高。为了防止随机性和波动性,选取10次实验指标值的平均值作为指标的最终测试值。
对比方案:
BPR(BayesianPersonalizedRanking):一种基于贝叶斯后验优化的个性化排序模型,它能最小化两两排序的损失。
NeuMF:一种基于深度学习的典型推荐算法。它将矩阵分解与多层感知机结合,使模型具有非线性表达能力,可以更好的建模复杂的用户-物品交互。
NGCF(NeuralGraphCollaborativeFiltering):一个基于图神经网络的推荐模型。同嵌入传播,以高阶连通的形式明确的编码用户-物品二部图中的协同信号。
LightGCN:在用户-物品交互图中线性传播用户和物品嵌入,并将用户和物品的最终嵌入表示为各层所学嵌入的加权值。
EASE:一个无隐藏层的模型,在处理稀疏数据方面具有很好的表现。
SLIMElastic:通过解决l1和l2正则化优化问题学习稀疏聚集稀疏矩阵,以产生高质量的推荐。
实验结果:
方法比较:当元路径组合为[USASsim,USUS,USWS],知识相似度为0.45,非采样策略中系数的值为0.02时,所提推荐系统具有最好推荐性能。如表2和表3所示,与基线模型中的表现最好的模型相比,所提模型的recall@K提升了24.46%-47.56%,NDCG@K指标提升了46.67%-58.7%。
表2模型recall@K指标的值
表3模型NDCG@K指标的值
元路径组合的影响:
当模型性能最好时,元路径组合为[USASsim,USUS,USWS]。元路径组合对雇主和服务的权重分别为[0.0026,0.7768,0.2205]和[0.9674,0.0215,0.0110]。说明服务结点的表示学习依赖元路径USASsim,这验证了关系定义1.2和2.2的正确性。雇主结点的表示学习依赖元路径USUS和USWS,这验证了关系定义3.1的正确性。在雇主结点表示学习过程中,虽然元路径USASsim的权重比较低,但我们分析,服务结点通过元路径USASsim聚合语义,然后服务结点通过元路径USUS影响雇主结点的语义聚合。
消融实验:
本实验比较了不同元路径组合所提模型性能的影响。图6显示了在不同元路径组合模型的性能。从图6可知,随着所考虑关系的增多,模型训练时得到的有用信息越多,模型的性能越来越好。但当考虑的关系过多,也会也会带来过多噪音,从而影响模型性能的进一步提升。考虑关系间的复合约束可以有效过滤关系中噪音,从而帮助进一步提升模型性能。
知识相似度对模型性能的影响:
图7显示了不同相似度下的模型性能。由图7可知,模型性能随知识相似度的增大先提升,达到最好性能后,开始下降。使模型性能最好的知识相似度值大约在0.45左右。
非采样策略中系数对模型性能的影响:
非采样策略中系数控制样本中负样本(缺失值)权重。从图8可以看出,模型性能随/>的增大先上升,达到最大值后开始下降,当/>的值在0.02附近时,模型性能最好。这证实了(C.Chenetal.,2020)等人的研究,对于系数数据,将/>设置为较小值,有利于缓解不平衡学习问题和提高模型性能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (5)

1.基于异质多元关系融合的知识密集型服务推荐方法,其特征在于,包括以下步骤:
S1:构建异构信息网络,获取异构信息网络中的异质多元关系;
S2:融合所述异质多元关系,学习雇主和服务的综合向量表示;
S3:基于雇主和服务的综合向量表示获取预测值,根据所述预测值给每个雇主推荐服务;
步骤S1中,构建异构信息网络的方法包括以下步骤:
S11:构建知识密集型服务信息网络的网络模式,以示意知识密集型服务信息网络中的对象类型及其交互关系;其中,所述对象类型包括雇主、服务、知识、商业活动和工人,所述交互关系包括雇主-服务、知识-服务、商业活动-服务和工人-服务;
S12:获取原始数据并对原始数据进行预处理,建立对象关系;其中,所述对象关系包雇主-服务关系、商业活动-服务关系、工人-服务关系、服务-服务知识相似性关系;
S13:基于知识密集型服务信息网络的网络模式,链接所有对象关系,构建知识密集服务的异构信息网络;
步骤S2中,融合所述异质多元关系,学习雇主和服务的综合向量表示的方法包括以下步骤:
S21:融合每条元路径获取的异质多元关系,学习雇主和服务语义特定的向量表示;
S22:融合来自所有元路径的异质多元关系,学习雇主和服务的综合向量表示;
步骤S3中,基于雇主和服务的综合向量表示获取预测值的方法为:基于雇主和服务的综合向量表示构建推荐模型,基于所述推荐模型获取预测值,其中,所述推荐模型具体为:
其中,表示预测值,pu表示雇主综合向量表示,qs表示服务综合向量表示,h为预测层;
步骤S3中,根据所述预测值给每个雇主推荐服务的方法为:按照预测值的大小进行排序得到推荐列表,将推荐列表的前K个服务推荐给雇主。
2.根据权利要求1所述的基于异质多元关系融合的知识密集型服务推荐方法,其特征在于,步骤S1中,获取异构信息网络中的异质多元关系的方法具体为:设计元路径,采用随机游走策略,按照设计的元路径获取异构信息网络中的异质多元关系。
3.根据权利要求1所述的基于异质多元关系融合的知识密集型服务推荐方法,其特征在于,步骤S21中,融合每条元路径获取的异质多元关系,学习雇主和服务语义特定的向量表示的具体方法为:将每条元路径获取的异质多元关系输入metapath2vec模型中学习,得到雇主和服务语义特定的向量表示。
4.根据权利要求1所述的基于异质多元关系融合的知识密集型服务推荐方法,其特征在于,步骤S22中,学习雇主的综合向量表示的方法包括以下步骤:
S221:通过多层感知机转换雇主语义特定的向量表示;
S222:基于雇主语义特定向量表示计算每条元路径对每个雇主的重要性;
S223:归一化每条元路径对每个雇主的重要性,计算每条路径的权重;
S224:基于每条元路径的权重进行加权融合,得到雇主的综合向量表示。
5.根据权利要求1所述的基于异质多元关系融合的知识密集型服务推荐方法,其特征在于,根据通过推荐模型获取预测值之前,还包括利用损失函数对模型进行优化训练,最小化预测值与实际值Rus之间的差值。
CN202111276405.4A 2021-10-29 2021-10-29 基于异质多元关系融合的知识密集型服务推荐方法 Active CN113837847B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111276405.4A CN113837847B (zh) 2021-10-29 2021-10-29 基于异质多元关系融合的知识密集型服务推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111276405.4A CN113837847B (zh) 2021-10-29 2021-10-29 基于异质多元关系融合的知识密集型服务推荐方法

Publications (2)

Publication Number Publication Date
CN113837847A CN113837847A (zh) 2021-12-24
CN113837847B true CN113837847B (zh) 2023-08-29

Family

ID=78966679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111276405.4A Active CN113837847B (zh) 2021-10-29 2021-10-29 基于异质多元关系融合的知识密集型服务推荐方法

Country Status (1)

Country Link
CN (1) CN113837847B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115146963B (zh) * 2022-07-01 2023-06-30 西南交通大学 一种基于第三方云平台的多链联动协同方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017041541A1 (zh) * 2015-09-08 2017-03-16 北京邮电大学 推送推荐信息的方法、服务器及存储介质
CN110598130A (zh) * 2019-09-30 2019-12-20 重庆邮电大学 一种融合异构信息网络和深度学习的电影推荐方法
CN112182424A (zh) * 2020-11-11 2021-01-05 重庆邮电大学 一种基于异构信息和同构信息网络融合的社交推荐方法
CN112800342A (zh) * 2021-04-15 2021-05-14 中国人民解放军国防科技大学 基于异质信息的推荐方法、系统、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017041541A1 (zh) * 2015-09-08 2017-03-16 北京邮电大学 推送推荐信息的方法、服务器及存储介质
CN110598130A (zh) * 2019-09-30 2019-12-20 重庆邮电大学 一种融合异构信息网络和深度学习的电影推荐方法
CN112182424A (zh) * 2020-11-11 2021-01-05 重庆邮电大学 一种基于异构信息和同构信息网络融合的社交推荐方法
CN112800342A (zh) * 2021-04-15 2021-05-14 中国人民解放军国防科技大学 基于异质信息的推荐方法、系统、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Heterogeneous Graph Embedding for Cross-Domain Recommendation Through Adversarial Learning;Jin Li等;《international conference on database systems for advanced applications DASFAA2020:database systems for advanced applications》;第507-522页 *

Also Published As

Publication number Publication date
CN113837847A (zh) 2021-12-24

Similar Documents

Publication Publication Date Title
Shao et al. IoT data visualization for business intelligence in corporate finance
Aguwa et al. Modeling of fuzzy-based voice of customer for business decision analytics
Chung et al. Discovering business intelligence from online product reviews: A rule-induction framework
AU2021205119A1 (en) Risk identification and risk register generation system and engine
US6836773B2 (en) Enterprise web mining system and method
US20050102292A1 (en) Enterprise web mining system and method
Nethravathi et al. Business intelligence appraisal based on customer behaviour profile by using hobby based opinion mining in India: a case study
EP2465054A1 (en) Method for scoring items using one or more ontologies
CN114254201A (zh) 一种科技项目评审专家的推荐方法
Lukosius et al. Marketing theory and big data
van Capelleveen et al. The influence of knowledge in the design of a recommender system to facilitate industrial symbiosis markets
Sharma et al. A study of tree based machine learning techniques for restaurant reviews
CN116362620A (zh) 一种电子商务在线客户服务评价方法
CN115221387A (zh) 一种基于深度神经网络的企业信息整合方法
CN113837847B (zh) 基于异质多元关系融合的知识密集型服务推荐方法
Paul et al. A weighted hybrid recommendation approach for user’s contentment using natural language processing
Darena et al. Machine learning-based analysis of the association between online texts and stock price movements
Tang et al. Service recommendation based on dynamic user portrait: an integrated approach
Singh et al. Implementation of knowledge based collaborative filtering and machine learning for E-Commerce recommendation system
Ahmed et al. Amazon Product Recommendation System
Hayashi et al. Exploring the Fundamental Units of Semantic Representation of Data Using Heterogeneous Variable Network in Data Ecosystems
Arunagiri et al. Selection of browsers for smartphones: a fuzzy hybrid approach and machine learning technique
Liao et al. Mining the co-movement in the Taiwan stock funds market
Zhang et al. Analysis model of customer reviews based on neural network
Snášel et al. User profiles modeling in information retrieval systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant