CN116108162B

CN116108162B - 一种基于语义增强的复杂文本推荐方法及系统

Info

Publication number: CN116108162B
Application number: CN202310197696.0A
Authority: CN
Inventors: 赖培源; 戴青云; 刘庆
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2023-03-02
Filing date: 2023-03-02
Publication date: 2024-03-08
Anticipated expiration: 2043-03-02
Also published as: CN116108162A

Abstract

本发明公开了一种基于语义增强的复杂文本推荐方法和系统，针对成果转化平台中供给的成果描述文本复杂问题，提出在复杂文本特征提取的基础上，针对中文词汇多样性问题，采用通用词汇文本扩展的方式，对文本特征词进行内容扩展，并使用上下文特征提取算法，融合资源实体的结构信息、扩展的文本信息，以及基于历史交互信息建立实体间的关联信息，基于融合的实体向量，通过推荐算法进行推荐模型训练，实现复杂文本描述场景下的智能推荐。本发明针对复杂文本的推荐构建推荐模型，提高了复杂文本推荐的效率及准确性。

Description

一种基于语义增强的复杂文本推荐方法及系统

技术领域

本发明涉及计算机人工智能领域，更具体的，涉及一种基于语义增强的复杂文本推荐方法及系统。

背景技术

在传统的推荐系统中，用户通常不会提供详细的用户资料，或者提供不一定完整、甚至不一定真实的用户资料，因此，只能通过“最热门的项目”、“最高的评分”等一些冷启动方式。但是，在一些商业平台中，因为双方均有主动对接的意愿，通常能获得较为丰富、真实的用户资料，通过发布企业的技术需求和悬赏金额，吸引技术专家在线提交解决方案，进而由企业负责选定技术方案并协商签订技术合同，达成在线的技术对接。

在相关商业平台中，技术专家为了能够得到企业的认可，获得更多由平台推荐的技术需求，他们都愿意在平台提交详细的个人资料进行注册认证，包括提交他们的项目成果、发表的论文、获得的技术专利、参与研发的产品等等。企业的技术需求也有详细的文本描述，包括需求的具体内容、技术指标、研究基础等。但专家的信息、企业技术需求信息、科技项目成果信息多数是离散而多语义的，目前的推荐算法模型尚未有针对复杂文本描述场景下的设计。因此针对复杂文本的推荐，如何提供一种基于语义增强的推荐方法是亟不可待需要解决的问题。

发明内容

为了解决上述至少一个技术问题，本发明提出了一种基于语义增强的复杂文本推荐方法及系统。

本发明第一方面提供了一种基于语义增强的复杂文本推荐方法，包括：

通过将复杂文本资源进行特征提取，生成资源实体的结构向量及文本向量，并在提取特征的基础上进行文本扩展的增强语义；

融合资源实体的结构信息、扩展的文本信息生成模型参数，将资源通过三元组进行表示；

采用注意力机制基于历史交互信息生成实体间的关联向量，通过所述关联向量建立实体间的关联信息；

将结构向量、文本向量及关联向量进行融合，基于融合的实体向量，构建复杂文本推荐模型进行模型参数训练，通过训练后的复杂文本推荐模型进行推荐。

本方案中，生成资源实体的结构向量，具体为：

获取文本中的关键词信息，基于所述关键词信息建立实体、关系及属性的三元组；

将三元组中的实体节点及关系进行随机初始化，对于任一三元组(h,r,t)，其初始化结构嵌入向量为(e_h,s,e_r,e_t,s)，e_h,s为头节点，e_r为实体间的关系，e_t,s为尾节点，其中d₁和d₂为可设定的向量维度数量，为非零整数；

利用TransR模型学习知识图谱结构嵌入表征向量，对节点结构嵌入向量进行特征向量特征映射，其中特征映射的评分函数F_s为：

其中，表示关系空间对应矩阵，为可训练参数，R表示实数集；

将三元组中的头节点及尾节点映射到关系空间进行向量比较，通过训练生成资源实体的结构向量。

本方案中，生成资源实体的文本向量，具体为：

获取文本资源属性的关键词，基于公开文库建立检索空间，根据所述关键词在检索空间中进行数据检索，将相似度符合预设标准的数据进行标记，通过标记的数据进行信息拓展，获取相应的描述文本；

在相应的描述文本中进行数据统计，选用出现频次最多的段落，对于相同频次的选择先出现的段落，进行字数限制，使用Bert训练生成特征词基于上下文的文本向量；

对实体e_i的描述性文本W_i进行初始化，W_i＝[w_i,1,w_i,2,…,w_i,j]，其中表示组成文本W_i的词组，d₃为可设定的向量维度数量，为非零整数；

将Bert的输出隐藏状态向量取平均作为实体的文本嵌入向量，获取知识图谱中任一三元组的头节点的文本嵌入表征向量为e_h，d，尾节点的文本嵌入表征向量为e_t，d，其中

对实体的文本嵌入向量进行特征映射，通过对比获取实体的文本向量，其中特征映射的评分函数F_d为：

其中，表示关系空间对应矩阵，为可训练参数。

本方案中，融合资源实体的结构信息、扩展的文本信息生成模型参数，具体为：

在知识图谱嵌入表征学习过程中根据结构向量和文本向量，根据结构向量和文本向量对应评分函数的值判断知识图谱中是否存在对应三元组，对应目标函数g定义为：g(h,r,t)＝F_s+F_d；

知识图谱嵌入表征学习的目标函数L定义为：

其中，Γ表示训练集，(h,r,t,t′)表示有效三元组与无效三元组的集合，(h,r,t)表示知识图谱上存在三元组，(h,r,t′)表示知识图谱中不存在三元组，t′表示通过随机替换有效三元组中的一个实体，σ表示模型参数集合；

通过训练后获取模型参数，将实体的结构嵌入向量表征和文本嵌入向量表征拼接作为实体的嵌入向量表征，对知识图谱上的一个三元组(h,r,t)，其嵌入向量为：

(e_h,e_r,e_t)＝([e_h,s；e_h,d],e_r,[e_t,s；e_t,d])；

将所有的资源实体通过三元组进行表示。

本方案中，采用注意力机制基于历史交互信息生成实体间的关联向量，通过所述关联向量建立实体间的关联信息，具体为：

获取文本资源的历史交互信息，定义X_i,Y_j表示文本资源i，j的综合表征，

其中，E_i表示资源i的属性融合向量，E_j表示资源j的属性融合向量，R_i表示其他资源与资源i的关系，R_j表示其他资源与资源j的关系，m表示实体的属性总数；

用缩放点积注意力机制计算key和query之间的相似度作为注意力权重，根据注意力权重对资源i，j进行聚合，通过平均池化层得到资源i，j在交互信息上的表征向量f_i,f_j，作为实体间的关联向量。

本方案中，基于融合的实体向量，构建复杂文本推荐模型进行模型参数训练，具体为：

将实体的结构向量、文本向量及交互信息对应的关联向量进行融合，得到资源i及资源j的综合表征C_i,C_j，C_i＝W_c[e_i,h,s；e_i,h,d；f_i]，C_j＝W_c[e_j,h,s；e_j,h,d；f_j],其中，W_c表示融合参数矩阵，e_i,h，s,e_j，h,s分别表示资源i及资源j的结构向量，e_i,h,d,e_j,h,d分别表示资源i及资源j的文本向量；

利用CTR预估模型构建复杂文本推荐模型，对资源i和资源j进行匹配，获取匹配程度r，

所述复杂文本推荐模型的目标函数L_CF为：

其中，(i,j⁺,j^-)表示推荐训练集O的正例及负例，(i,j⁺)表示正例，(i,j^-)表示负例，σ表示模型参数集合。

本发明第二方面提供了一种基于语义增强的复杂文本推荐系统，包括如下模块：特征词提取模块、结构向量生成模块、文本向量生成模块、交互向量生成模块、表征向量融合模块、推荐训练模块以及数据更新模块；

所述特征词提取模用于从资源的描述文本中提取关键词；

所述结构向量生成模块用于将资源的关键词以及与关键词的关系构建三元组，通过TransR模型训练得到资源的结构向量，当资源涉及到多个关键词时，负责将多个结构向量进行融合生成资源的融合结构向量；

所述文本向量生成模块用于将关键词在公开数据中进行检索扩展，获得描述文本后，逐段落计算词频并选定词频最大的段落，采用Bert训练获得文本向量，并获取融合文本向量；

交互向量生成模块基于注意力机制将发生交互关系的资源之间进行相关系数的计算，当多个交互关系时可选择交互次数最多的资源，并基于相关系数计算获得资源的关联向量；

表征向量融合模块将结构向量、文本向量、交互向量进行拼接，获得资源的融合表征向量，作为推荐训练模块的输入；

推荐训练模块将各个资源的融合表征向量以及各个资源的交互历史信息，按照预设比例设置训练集、验证集、测试集进行复杂文本推荐模型的训练，获得模型参数；

数据更新模块将更新后的资源以及资源间的交互数据，导入到各个模块进行重新训练，实现模型的持续优化。

本方案中，利用CTR预估模型构建复杂文本推荐模型，对资源i和资源j进行匹配，获取匹配程度r，T表示矩阵转置，C_i,C_j为资源i及资源j的综合表征；

C_i＝W_c[e_i,h,s；e_i,h,d；f_i]

C_j＝W_c[e_j,h,s；e_j,h,d；f_j]

其中，W_c表示融合参数矩阵，e_i,h,s,e_j,h,s分别表示资源i及资源j的结构向量，e_i,h,d,e_j,h,d分别表示资源i及资源j的文本向量，f_i,f_j表示实体间的关联向量；

所述复杂文本推荐模型的目标函数L_CF为：

附图说明

图1示出了本发明一种基于语义增强的复杂文本推荐方法的流程图；

图2示出了本发明生成文本向量的方法流程图；

图3示出了本发明根据资源交互信息生成关联向量的方法流程图；

图4示出了本发明一种基于语义增强的复杂文本推荐系统的框图；

图5示出了本发明一种基于语义增强的复杂文本推荐系统的结构示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了本发明一种基于语义增强的复杂文本推荐方法的流程图。

如图1所示，本发明第一方面提供了一种基于语义增强的复杂文本推荐方法，包括：

S102，通过将复杂文本资源进行特征提取，生成资源实体的结构向量及文本向量，并在提取特征的基础上进行文本扩展的增强语义；

S104，融合资源实体的结构信息、扩展的文本信息生成模型参数，将资源通过三元组进行表示；

S106，采用注意力机制基于历史交互信息生成实体间的关联向量，通过所述关联向量建立实体间的关联信息；

S108，将结构向量、文本向量及关联向量进行融合，基于融合的实体向量，构建复杂文本推荐模型进行模型参数训练，通过训练后的复杂文本推荐模型进行推荐。

需要说明的是，通过构建词向量的三元组信息，采用TransR方法，通过训练生成结构向量，首先，获取文本中的关键词信息，基于所述关键词信息建立实体、关系及属性的三元组，即建立[专家，关系，属性词]，以及[需求，关系，属性词]的三元组；

将三元组中的实体节点及关系进行随机初始化，对于任一三元组(h,r,t)，其初始化结构嵌入向量为(e_h,s,e_r,e_t,s)，e_h，s为头节点，e_r为实体间的关系，e_t，s为尾节点，其中d₁和d₂为可设定的向量维度数量，为非零整数；

利用TransR模型学习知识图谱结构嵌入表征向量，假设知识图谱上三元组的头节点的结构嵌入向量加上关系嵌入向量约等于尾节点的结构嵌入向量，即：

e_h，s+e_r≈e_t，s

知识图谱上节点和关系可能不在同一个嵌入向量空间上，对节点结构嵌入向量进行特征向量特征映射，其中特征映射的评分函数F_s为：

根据假设可知如果知识图谱上存在三元组，则F_s的值小于预设阈值，否则大于预设阈值，将三元组中的头节点及尾节点映射到关系空间进行向量比较，通过训练生成资源实体的结构向量，在融合模型中，将F_s作为目标函数进行训练，在选定的模型参数中，可以获得可训练参数

图2示出了本发明生成文本向量的方法流程图。

根据本发明实施例，生成资源实体的文本向量，具体为：

S202，获取文本资源属性的关键词，基于公开文库(如百度百科)建立检索空间，根据所述关键词在检索空间中进行数据检索，将相似度符合预设标准的数据进行标记，通过标记的数据进行信息拓展，获取相应的描述文本；

S204，在相应的描述文本中进行数据统计，选用出现频次最多的段落，对于相同频次的选择先出现的段落，进行字数限制，使用Bert训练生成特征词基于上下文的文本向量；

S206，对实体的描述性文本进行初始化，将Bert的输出隐藏状态向量取平均作为实体的文本嵌入向量，对实体的文本嵌入向量进行特征映射，通过对比获取实体的文本向量。

需要说明的是，对实体e_i的描述性文本W_i进行初始化，W_i＝[w_i，1，w_i，2，…，w_i，j]，其中表示组成文本W_i的词组，d₃为可设定的向量维度数量，为非零整数；

将Bert的输出隐藏状态向量取平均作为实体的文本嵌入向量，获取知识图谱中任一三元组的头节点的文本嵌入表征向量为e_h，d，尾节点的文本嵌入表征向量为e_t，d，其中假设知识图谱上三元组的头结点文本嵌入向量加上关系嵌入向量约等于尾结点文本嵌入向量：

e_h,d+e_r≈e_t,d

其中特征映射的评分函数F_d为：

其中，表示关系空间对应矩阵，为可训练参数；

根据假设如果知识图谱上存在三元组，则F_d的值小于预设阈值，否则大于预设阈值。在融合模型中，将F_d作为目标函数的一部分进行训练，在选定的模型参数中，可以获得可训练参数

需要说明的是，在知识图谱嵌入表征学习过程中根据结构向量和文本向量，根据结构向量和文本向量对应评分函数的值判断知识图谱中是否存在对应三元组，对应目标函数g定义为：g(h,r，t)＝F_s+F_d，如果知识图谱上存在三元组，则g(h，r，t)的值小于预设阈值，否则g(h,r,t)大于预设阈值。

知识图谱嵌入表征学习的目标函数L定义为：

其中，Γ表示训练集，(h，r,t,t′)表示有效三元组与无效三元组的集合，(h,r，t)表示知识图谱上存在三元组，(h，r，t′)表示知识图谱中不存在三元组，t′表示通过随机替换有效三元组中的一个实体，σ表示模型参数集合；

通过训练后获取模型参数，将实体的结构嵌入向量表征和文本嵌入向量表征拼接作为实体的嵌入向量表征，对知识图谱上的一个三元组(h，r,t)，其嵌入向量为：

(e_h,e_r,e_t)＝([e_h，s；e_h，d]，e_r，[e_t，s；e_t，d])；

将所有的资源实体，包括人才、成果、企业需求、发明专利等，都用三元组表示，三元组中融合结构向量和文本向量信息。

图3示出了本发明根据交互信息生成关联向量的方法流程图。

根据本发明实施例，采用注意力机制基于历史交互信息生成实体间的关联向量，通过所述关联向量建立实体间的关联信息，具体为：

假设资源i与资源j之间存在交互历史关系，交互行为包括访问、成交、收藏等。

S302，获取文本资源的历史交互信息，根据资源i及资源j的属性融合向量及关系融合向量定义资源的综合表征；

定义X_i,Y_j表示文本资源i，j的综合表征，

其中，E_i表示资源i的属性融合向量，由m个e_i，t，k拼接组成，e_i，t，k表示第i个实体的第k个属性t，E_j表示资源j的属性融合向量，由m个e_j，t，k拼接组成，e_j，t，k表示第j个实体的第k个属性t，R_i为关系融合向量，表示其他资源与资源i的关系，由m个e_i，r，k拼接组成，e_i，r，k表示第i个实体与当前实体的第k个属性的关系r，R_j为关系融合向量，表示其他资源与资源j的关系，由m个e_j,r，k拼接组成，e_j，r，k表示第j个实体与当前实体的第k个属性的关系r；

S304，采用注意力机制生成资源i及资源j之间的注意力权重；

用缩放点积注意力机制计算key和query之间的相似度作为注意力权重A_i，j，具体为：

其中，为可训练参数，/>d_k为K_j的维度，T为矩阵转置，Q_i为资源i注意力机制的query值，K_j为资源j注意力机制的key值；

S306，通过注意力权重对资源i及资源j进行聚合，并利用平均池化层得到资源i及资源j在交互信息上的表征向量，生成资源实体的关联向量；

根据注意力权重对资源i，j进行聚合，得到资源聚合后的表示F_i，F_j：

F_j＝softmax(A_i,j)V_j

其中，V_i，V_j为资源i,j在注意力机制中的value值，为可训练参数，通过平均池化层得到资源i，j在交互信息上的表征向量f_i，f_j，作为实体间的关联向量，f_i＝mean pooling(F_i)，f_j＝mean pooling(F_j)，其中mean pooling表示池化操作。

需要说明的是，将实体的结构向量、文本向量及交互信息对应的关联向量进行融合，得到资源i及资源j的综合表征C_i,C_j，C_i＝W_c[e_i,h,s；e_i,h,d；f_i]，C_j＝W_c[e_j,h,s；e_j,h,d；f_j],其中，W_c表示融合参数矩阵，e_i,h,s,e_j,h,s分别表示资源i及资源j的结构向量，e_i,g,d,e_j,g,d分别表示资源i及资源j的结构向量；

利用CTR预估模型构建复杂文本推荐模型，通过训练目标函数得到参数模型，对资源i和资源j进行匹配，获取匹配程度r，通过匹配程度进行复杂文本的推荐，T表示矩阵转置；

所述复杂文本推荐模型的目标函数L_CF为：

图4、5示出了本发明一种基于语义增强的复杂文本推荐系统的框图及结构示意图。

本发明第二方面提供了一种基于语义增强的复杂文本推荐系统，包括如下模块：存储器、处理器、特征词提取模块、结构向量生成模块、文本向量生成模块、交互向量生成模块、表征向量融合模块、推荐训练模块以及数据更新模块；

所述存储器中包括一种基于语义增强的复杂文本推荐方法程序，所述处理器执行一种基于深度学习的知识产权个性化推荐方法程序；

所述特征词提取模用于从资源的描述文本中提取关键词；

需要说明的是，对于复杂文本推荐模型的训练还设置定时训练模块，所述定时训练模块负责定时启动模型的训练更新，可设定固定时间，如每周六凌晨一点。利用CTR预估模型构建复杂文本推荐模型，通过训练目标函数得到模型参数后，对资源i和资源j进行匹配，获取匹配程度r，根据匹配程度进行相关推荐，T表示矩阵转置，C_i,C_j为资源i及资源j的综合表征；

C_i＝W_c[e_i,h,s；e_i,h,d；f_i]

C_j＝W_c[e_j,h,s；e_j,h,d；f_j]

其中，W_c表示融合参数矩阵，e_i,g,s,e_j,g,s分别表示资源i及资源j的结构向量，e_i,g,d,e_j,g,d分别表示资源i及资源j的文本向量，f_i,f_j表示实体间的关联向量；

所述复杂文本推荐模型的目标函数L_CF为：

本发明第三方面还提供一种计算机可读存储介质，所述计算机可读存储介质中包括一种基于语义增强的复杂文本推荐方法程序，所述一种基于语义增强的复杂文本推荐方法程序被处理器执行时，实现如上述任一项所述的一种基于语义增强的复杂文本推荐方法的步骤。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种基于语义增强的复杂文本推荐方法，其特征在于，包括以下步骤：

将结构向量、文本向量及关联向量进行融合，基于融合的实体向量，构建复杂文本推荐模型进行模型参数训练，通过训练后的复杂文本推荐模型进行推荐；

生成资源实体的结构向量，具体为：

将三元组中的头节点及尾节点映射到关系空间进行向量比较，通过训练生成资源实体的结构向量；

生成资源实体的文本向量，具体为：

对实体e_i的描述性文本W_i进行初始化，W_i＝[w_i,1,w_i,2,…,w_i,l]，其中表示组成文本W_i的词组，d₃为可设定的向量维度数量，为非零整数；

将Bert的输出隐藏状态向量取平均作为实体的文本嵌入向量，获取知识图谱中任一三元组的头节点的文本嵌入表征向量为e_h,d，尾节点的文本嵌入表征向量为e_t,d，其中

融合资源实体的结构信息、扩展的文本信息生成模型参数，具体为：

在知识图谱嵌入表征学习过程中根据结构向量和文本向量，根据结构向量和文本向量对应评分函数的值判断知识图谱中是否存在对应三元组，对应目标函数g定义为：g(h,r,t)＝F_s+F_d；如果知识图谱上存在三元组，则g(h,r,t)的值小于预设阈值，否则g(h,r,t)大于预设阈值；

知识图谱嵌入表征学习的目标函数L定义为：

(e_h，e_r,e_t)＝([e_h，s；e_h,d],e_r，[e_t，s；e_t，d])；

将所有的资源实体通过三元组进行表示；

基于融合的实体向量，构建复杂文本推荐模型进行模型参数训练，具体为：

将实体的结构向量、文本向量及交互信息对应的关联向量进行融合，得到资源i及资源j的综合表征C_i,C_j，C_i＝W_c[e_i,h,s；e_i,h,d；f_i]，C_j＝W_c[e_j,h,s；e_j,h,d；f_j],其中，W_c表示融合参数矩阵，e_i,h,s,e_j,h,s分别表示资源i及资源j的结构向量，e_i,h,d,e_j,h,d分别表示资源i及资源j的文本向量；

利用CTR预估模型构建复杂文本推荐模型，对资源i和资源j进行匹配，获取匹配程度r，T表示矩阵转置；

所述复杂文本推荐模型的目标函数L_CF为：

2.根据权利要求1所述的一种基于语义增强的复杂文本推荐方法，其特征在于，采用注意力机制基于历史交互信息生成实体间的关联向量，通过所述关联向量建立实体间的关联信息，具体为：

用缩放点积注意力机制计算键向量key和查询向量query之间的相似度作为注意力权重，根据注意力权重对资源i，j进行聚合，通过平均池化层得到资源i，j在交互信息上的表征向量f_i,f_j，作为实体间的关联向量。

3.一种基于语义增强的复杂文本推荐系统，其特征在于，包括如下模块：特征词提取模块、结构向量生成模块、文本向量生成模块、交互向量生成模块、表征向量融合模块、推荐训练模块以及数据更新模块；

所述特征词提取模用于从资源的描述文本中提取关键词；

数据更新模块将更新后的资源以及资源间的交互数据，导入到各个模块进行重新训练，实现模型的持续优化；

生成资源实体的结构向量，具体为：

生成资源实体的文本向量，具体为：

知识图谱嵌入表征学习的目标函数L定义为：

(e_h，e_r,e_t)＝([e_h，s；e_h,d],e_r[e_t，s；e_t，d])；

将所有的资源实体通过三元组进行表示；

构建复杂文本推荐模型进行模型参数训练，具体为：

所述复杂文本推荐模型的目标函数L_CF为：