CN114154071B - 一种基于注意力机制的情感时序推荐方法 - Google Patents

一种基于注意力机制的情感时序推荐方法 Download PDF

Info

Publication number
CN114154071B
CN114154071B CN202111501438.4A CN202111501438A CN114154071B CN 114154071 B CN114154071 B CN 114154071B CN 202111501438 A CN202111501438 A CN 202111501438A CN 114154071 B CN114154071 B CN 114154071B
Authority
CN
China
Prior art keywords
user
project
layer
specifically
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111501438.4A
Other languages
English (en)
Other versions
CN114154071A (zh
Inventor
王庆先
刘鹏宇
常奥
黄庆
吴苏强
曾昌强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202111501438.4A priority Critical patent/CN114154071B/zh
Publication of CN114154071A publication Critical patent/CN114154071A/zh
Application granted granted Critical
Publication of CN114154071B publication Critical patent/CN114154071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于注意力机制的情感时序推荐方法,包括以下步骤:S1、收集评论信息和时间信息,并将其输入嵌入层,得到具有时态信息的用户因素和项目因素;S2、将有时态信息的用户因素和项目因素输入至blstm层进行情感特征提取,得到用户和项目之间的交互序列;S3、将用户和项目之间的交互序列通过注意力层输入至cnn层,得到用户表示和项目表示;S4、将用户表示和项目表示输入至输出层,得到精确评分,进而将最高精确评分对应项目作为情感时序推荐结果。

Description

一种基于注意力机制的情感时序推荐方法
技术领域
本发明属于序列推荐领域,具体涉及一种基于注意力机制的情感时序推荐方法。
背景技术
近年来,如何利用评价信息提高推荐满意度成为研究者关注的焦点。例如使用文本信息作为辅助边信息来缓解评分矩阵的稀疏问题,引入评论来解决协同过滤CF算法稀疏性带来的问题。基于CNN的解决方案通常利用不同大小的转换过滤器和最大池操作来获得特征向量。然而,基于CNN的推荐方法的缺点是,在推荐时总是忽略用户偏好的时间动态性。因此,如何探索用户和项目评论的动态变化以提高推荐者的性能仍然是一个巨大的挑战。在这种情况下,基于RNN的方法可以在预测用户下一步将消费哪个项目方面获得良好的性能。一些深度兴趣进化网络模型被提出以捕捉暂时的兴趣,但它没有在评论中使用丰富的情感信息。此外,大多数现有的方法使用评分或审查文本作为单独的输入。他们没有全面地使用反馈信息,没有充分利用现有异构数据的优势来有效地捕获时间动态,且未能考虑全局联系和局部联系,且能并行化计算,且模型过拟合现象较严重。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于注意力机制的情感时序推荐方法解决了深度兴趣进化网络模型没有在评论中使用丰富的情感信息的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于注意力机制的情感时序推荐方法,包括以下步骤:
S1、收集评论信息和时间信息,并将其输入嵌入层,得到具有时态信息的用户因素和项目因素;
S2、将有时态信息的用户因素和项目因素输入至blstm层进行情感特征提取,得到用户和项目之间的交互序列;
S3、将用户和项目之间的交互序列通过注意力层输入至cnn层,得到用户表示和项目表示;
S4、将用户表示和项目表示输入至输出层,得到精确评分,进而将最高精确评分对应项目作为情感时序推荐结果。
进一步地:所述步骤S1中,所述评论信息具体为评论的集合R={r1,r2,...,rp},其中,ri为第i条评论,i=1,2,...,p,p为评论的总数;
第i条评论具体为ri={w1,w2,...,wq},其中,wj为第j个词的低维密集向量,j=1,2,...,q,q为第i条评论的单词数;
其中,第j个词的低维密集向量wj的表达式具体为:
wj=ej×We
式中,We为预训练的词向量矩阵,ej为嵌入层中输入第j个词生成对应的索引ej
所述时间信息具体为第i次用户与项目交互和第i+1次用户与项目交互之间的时间间隔
Figure BDA0003401797010000021
其表达式具体为:
Figure BDA0003401797010000022
式中,ti为第i条评论对应的时间,min(T)为用户与项目交互时间间隔的最小值,max(T)为用户与项目交互时间间隔的最大值。
上述进一步方案的有益效果为:本发明通过用户交互之间的时间间隔表示时间信息,可以不改变输入的评论顺序。
进一步地:所述步骤S1中,具有时态信息的用户因素和项目因素具体为融合时间信息的用户和项目评论集;
得到具有时态信息的用户因素和项目因素的方法具体为:
通过融合时间信息和评论信息,得到更新后的评论,进而得到融合时间信息的用户和项目评论集;
其中,融合时间信息的用户和项目评论集R′=[rt1,rt2,...,rtw];rti为更新后的第i条评论,且
Figure BDA0003401797010000031
Figure BDA0003401797010000032
为连接算子。
进一步地:所述步骤S2中,blstm层包括并列的前向lstm层和后向lstm层;
所述步骤S2包括以下分步骤:
S21、将融合时间信息的用户和项目评论集输入blstm层,通过前向lstm层和后向lstm层进行情感特征提取,分别得到时间步k的语法含义
Figure BDA0003401797010000033
和时间步k的单子含义
Figure BDA0003401797010000034
其中,时间步k的语法含文
Figure BDA0003401797010000035
和时间步k的单子含义
Figure BDA0003401797010000036
的表达式具体为:
Figure BDA0003401797010000037
Figure BDA0003401797010000038
式中,
Figure BDA0003401797010000039
为时间步k-1的语法含义,
Figure BDA00034017970100000310
为时间步k-1的单子含义,xk为在时间步k,blstm层输入融合时间信息的用户和项目评论集向量;
S22、根据语法含义
Figure BDA00034017970100000311
和单子含义
Figure BDA00034017970100000312
得到时间步k的隐藏状态更新hk
其中,时间步k的隐藏状态更新hk的表达式具体为:
Figure BDA00034017970100000313
S23、将所有时间步的隐藏状态更新组合,得到用户和项目之间的交互序列H;
其中,用户和项目之间的交互序列H=[h1,h1,...,hT],T为句子长度。
进一步地:所述步骤S3包括以下分步骤:
S31、将用户和项目之间的交互序列输入注意力层,得到句子级用户和项目之间的交互序列;
S32、将句子级用户和项目之间的交互序列输入cnn层,得到用户表示和项目表示。
上述进一步方案的有益效果为:本发明的cnn层使用多个不同的卷积滤波器来提取特征,可以获得丰富的特征。
进一步地:所述步骤S31具体为:
通过注意力层生成一个权重向量,使权重向量乘以用户和项目之间的交互序列,得到句子级用户和项目之间的交互序列;
其中,句子级用户和项目之间的交互序列h*表达式具体为:
h*=tanh(r)
r=HαT
α=softmax(wTM)
M=tanh(H)
式中,M为第二运算过程向量,r为第一运算过程向量,α为权重向量,T为句子长度,w为是经过训练的参数向量,tanh(*)为第一激活函数,softmax(*)为第二激活函数。
进一步地:所述S32中,cnn层包括依次连接的卷积层、最大池化层和全连接层;
其中,所述卷积层设置有并列的G个互不相同卷积滤波器;
所述步骤S32包括以下分步骤:
S32-1、将用户和项目之间的交互序列通过卷积层的卷积滤波器提取特征,得到特征图;
其中,所述特征图T具体为T=[t1t2,...,ts];tj为第j个卷积滤波器输出的结果,j=1,2,...,s,s为卷积滤波器的总数;第j个卷积滤波器输出的结果tj表达式具体为:
Figure BDA0003401797010000051
式中,Xi为句子级用户和项目之间的交互序列h*中的第i个评论,其中i=1,2,...,p,p为评论的总数,bj为偏置项,
Figure BDA0003401797010000052
为卷积运算,Kj为第j个卷积滤波器,
Figure BDA0003401797010000053
为第三激活函数;
S32-2、将所述特征图输入最大池化层进行特征提取,得到特征子向量,进而将得到的特征子向量进行拼接,得到固定长度的特征向量;
其中,得到特征子向量zs的表达式具体为:
zs=max(T)
所述特征向量Z具体为[z1,z2,...,zG];
S32-3、将特征向量输入至全连接层,进而通过下式对特征向量进行特征提取,得到用户表示和项目表示;
χ=relu(W×Z+b)
式中,χ为特征提取的结果,relu(*)为激活函数,W为权重矩阵,Z为特征向量,b为偏置项;
根据特征提取的结果χ得到用户表示χu和项目表示χo
上述进一步方案的有益效果为:设置最大池化层可以捕获更有意义的信息,得到特征子向量。
进一步地:所述步骤S4包括以下分步骤:
S41、根据用户表示和项目表示计算得到评分,进而根据评分计算预测评分;
其中,计算评分γ的表达式具体为:
Figure BDA0003401797010000061
所述预测评分
Figure BDA0003401797010000062
的表达式具体为:
Figure BDA0003401797010000063
式中,γm为第m次计算的评分,γn为第n次计算的评分;
Figure BDA00034017970100000611
为第一辅助向量,
Figure BDA00034017970100000610
为第二辅助向量,N为计算的评分的总数;
S42、根据评分和预测评分计算,得到评分的损失函数和损失函数的正则化项,进而通过评分的损失函数和损失函数的正则化项处理评分,得到精确评分;
其中,损失函数
Figure BDA0003401797010000069
的表达式具体为:
Figure BDA0003401797010000064
式中,M为预测评分
Figure BDA0003401797010000065
的总数,
Figure BDA0003401797010000066
为第f次计算的预测评分,yf为第f次计算的评分;
所述损失函数的正则化项
Figure BDA0003401797010000068
表达式具体为:
Figure BDA0003401797010000067
式中,η为惩罚系数,Θ为可训练参数的集合。
上述进一步方案的有益效果为:本发明设置损失函数可以判定推荐结果的准确度,设置损失函数的正则化项可以防止深度学习中的过拟合问题,从而得到精确评分。
本发明的有益效果为:
(1)本发明把基于注意力的双向长短期记忆网络与卷积神经网络结合,构造出一个强有力的模型,以更好得捕捉推荐系统中评论数据中的情感特征,进而提升推荐性能。
(2)本发明在blstm层的基础上引入了注意力层的机制,增强了学习情感的能力,进而会增强推荐系统的预测能力。
附图说明
图1为一种基于注意力机制的情感时序推荐方法的流程图;
图2为本发明的网络模型图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例1:
如图1所示,在本发明的一个实施例中,一种基于注意力机制的情感时序推荐方法,包括以下步骤:
S1、收集评论信息和时间信息,并将其输入嵌入层,得到具有时态信息的用户因素和项目因素;
S2、将有时态信息的用户因素和项目因素输入至blstm层进行情感特征提取,得到用户和项目之间的交互序列;
S3、将用户和项目之间的交互序列通过注意力层输入至cnn层,得到用户表示和项目表示;
S4、将用户表示和项目表示输入至输出层,得到精确评分,进而将最高精确评分对应项目作为情感时序推荐结果。
评分是推荐系统内对一个项目在下一次交互中被推荐概率的度量标准。
所述步骤S1中,所述评论信息具体为评论的集合R={r1,r2,...,rp},其中,ri为第i条评论,i=1,2,...,p,p为评论的总数;
第i条评论具体为ri={w1,w2,...,wq},其中,wj为第j个词的低维密集向量,j=1,2,...,q,q为第i条评论的单词数;
其中,第j个词的低维密集向量wj的表达式具体为:
wj=ej×We
式中,We为预训练的词向量矩阵,ej为嵌入层中输入第j个词生成对应的索引ej
Figure BDA0003401797010000081
Figure BDA0003401797010000082
为评论矩阵,具体为q行v列的矩阵,|v|为预训练词数据集中的词数。
所述时间信息具体为第i次用户与项目交互和第i+1次用户与项目交互之间的时间间隔
Figure BDA0003401797010000083
其表达式具体为:
Figure BDA0003401797010000084
式中,ti为第i条评论对应的时间,min(T)为用户与项目交互时间间隔的最小值,max(T)为用户与项目交互时间间隔的最大值,
Figure BDA0003401797010000085
的维度为
Figure BDA0003401797010000086
Figure BDA0003401797010000089
为行数为q的矩阵。
所述步骤S1中,具有时态信息的用户因素和项目因素具体为融合时间信息的用户和项目评论集;
得到具有时态信息的用户因素和项目因素的方法具体为:
通过融合时间信息和评论信息,得到更新后的评论,进而得到融合时间信息的用户和项目评论集;
其中,融合时间信息的用户和项目评论集R′=[rt1,rt2,...,rtq];rti为更新后的第i条评论,且
Figure BDA0003401797010000087
Figure BDA0003401797010000088
为连接算子。
所述步骤S2中,blstm层包括并列的前向lstm层和后向lstm层;
所述步骤S2包括以下分步骤:
S21、将融合时间信息的用户和项目评论集输入blstm层,通过前向lstm层和后向lstm层进行情感特征提取,分别得到时间步k的语法含义
Figure BDA0003401797010000091
和时间步k的单子含义
Figure BDA0003401797010000092
其中,时间步k的语法含义
Figure BDA0003401797010000093
和时间步k的单子含义
Figure BDA0003401797010000094
的表达式具体为:
Figure BDA0003401797010000095
Figure BDA0003401797010000096
式中,
Figure BDA0003401797010000097
为时间步k-1的语法含义,
Figure BDA0003401797010000098
为时间步k-1的单子含义,xk为在时间步k,blstm层输入融合时间信息的用户和项目评论集向量;
S22、根据语法含义
Figure BDA0003401797010000099
和单子含义
Figure BDA00034017970100000910
得到时间步k的隐藏状态更新hk
其中,时间步k的隐藏状态更新hk的表达式具体为:
Figure BDA00034017970100000911
S23、将所有时间步的隐藏状态更新组合,得到用户和项目之间的交互序列H;
其中,用户和项目之间的交互序列H=[h1,h1,...,hT],T为句子长度。
所述步骤S3包括以下分步骤:
S31、将用户和项目之间的交互序列输入注意力层,得到句子级用户和项目之间的交互序列;
S32、将句子级用户和项目之间的交互序列输入cnn层,得到用户表示和项目表示。
所述步骤S31具体为:
通过注意力层生成一个权重向量,使权重向量乘以用户和项目之间的交互序列,得到句子级用户和项目之间的交互序列;
其中,句子级用户和项目之间的交互序列h*表达式具体为:
h*=tanh(r)
r=HαT
α=softmax(wTM)
M=tanh(H)
式中,M为第二运算过程向量,r为第一运算过程向量,α为权重向量,T为句子长度,w为是经过训练的参数向量,tanh(*)为第一激活函数,softmax(*)为第二激活函数。
所述S32中,cnn层包括依次连接的卷积层、最大池化层和全连接层;
其中,所述卷积层设置有并列的G个互不相同卷积滤波器;
所述步骤S32包括以下分步骤:
S32-1、将用户和项目之间的交互序列通过卷积层的卷积滤波器提取特征,得到特征图;
其中,所述特征图T具体为T=[t1,t2,...,ts];tj为第j个卷积滤波器输出的结果,j=1,2,...,s,s为卷积滤波器的总数;第j个卷积滤波器输出的结果tj表达式具体为:
Figure BDA0003401797010000101
式中,Xi为句子级用户和项目之间的交互序列h*中的第i个评论,其中i=1,2,...,p,p为评论的总数,bj为偏置项,
Figure BDA0003401797010000103
为卷积运算,Kj为第j个卷积滤波器,
Figure BDA0003401797010000102
为第三激活函数;
S32-2、将所述特征图输入最大池化层进行特征提取,得到特征子向量,进而将得到的特征子向量进行拼接,得到固定长度的特征向量;
其中,得到特征子向量zs的表达式具体为:
zs=max(T)
所述特征向量Z具体为[z1,z2,...,zG];
S32-3、将特征向量输入至全连接层,进而通过下式对特征向量进行特征提取,得到用户表示和项目表示;
χ=relu(W×Z+b)
式中,χ为特征提取的结果,relu(*)为激活函数,W为权重矩阵,Z为特征向量,b为偏置项;
根据特征提取的结果χ得到用户表示χu和项目表示χo
所述步骤S4包括以下分步骤:
S41、根据用户表示和项目表示计算得到评分,进而根据评分计算预测评分;
其中,计算评分γ的表达式具体为:
Figure BDA0003401797010000111
所述预测评分
Figure BDA0003401797010000117
的表达式具体为:
Figure BDA0003401797010000112
式中,γm为第m次计算的评分,γn为第n次计算的评分;
Figure BDA0003401797010000113
为第一辅助向量,
Figure BDA0003401797010000114
为第二辅助向量,N为计算的评分的总数;
S42、根据评分和预测评分计算,得到评分的损失函数和损失函数的正则化项,进而通过评分的损失函数和损失函数的正则化项处理评分,得到精确评分;
其中,损失函数
Figure BDA0003401797010000115
的表达式具体为:
Figure BDA0003401797010000116
式中,M为预测评分
Figure BDA0003401797010000121
的总数,
Figure BDA0003401797010000122
为第f次计算的预测评分,yf为第f次计算的评分;
所述损失函数的正则化项
Figure BDA0003401797010000124
表达式具体为:
Figure BDA0003401797010000123
式中,η为惩罚系数,Θ为可训练参数的集合。
如图2所示,通过本发明的网络框架,可以将评论信息结合时间信息和情感信息转化为评分,提高了评分的评估能力。
本发明方法的实施过程为:嵌入层输入评论信息和时间信息,输出网络训练得到具有时态信息的用户因素和项目因素,blstm层输入具有时态信息的用户因素和项目因素,通过情感特征提取,得到用户和项目之间的交互序列,注意力层生成权重向量,使用户和项目之间的交互序列单次特征乘以权重向量,得到句子级用户和项目之间的交互序列,cnn层输入句子级用户和项目之间的交互序列,通过cnn层提取特征,得到用户表示和项目表示,将用户表示和项目表示输入至输出层,经过最小二乘的损失函数和损失函数的正则化项处理,得到精确评分,进而提高用户所需项目在下一次交互中被推荐概率。
本发明的有益效果为:本发明把基于注意力的双向长短期记忆网络与卷积神经网络结合,构造出一个强有力的模型,以更好得捕捉推荐系统中评论数据中的情感特征,进而提升推荐性能。
本发明在blstm层的基础上引入了注意力层的机制,增强了学习情感的能力,进而会增强推荐系统的预测能力。
在本发明的描述中,需要理解的是,术语“中心”、“厚度”、“上”、“下”、“水平”、“顶”、“底”、“内”、“外”、“径向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或隐含指明的技术特征的数量。因此,限定由“第一”、“第二”、“第三”的特征可以明示或隐含地包括一个或者更多个该特征。

Claims (5)

1.一种基于注意力机制的情感时序推荐方法,其特征在于,包括以下步骤:
S1、收集评论信息和时间信息,并将其输入嵌入层,得到具有时态信息的用户因素和项目因素;
S2、将有时态信息的用户因素和项目因素输入至blstm层进行情感特征提取,得到用户和项目之间的交互序列;
S3、将用户和项目之间的交互序列通过注意力层输入至cnn层,得到用户表示和项目表示;
S4、将用户表示和项目表示输入至输出层,得到精确评分,进而将最高精确评分对应项目作为情感时序推荐结果;
所述步骤S3包括以下分步骤:
S31、将用户和项目之间的交互序列输入注意力层,得到句子级用户和项目之间的交互序列;
S32、将句子级用户和项目之间的交互序列输入cnn层,得到用户表示和项目表示;
所述步骤S31具体为:
通过注意力层生成一个权重向量,使权重向量乘以用户和项目之间的交互序列,得到句子级用户和项目之间的交互序列;
其中,句子级用户和项目之间的交互序列h*表达式具体为:
h*=tanh(r)
r=HαT
α=softmax(wTM)
M=tanh(H)
式中,M为第二运算过程向量,r为第一运算过程向量,α为权重向量,T为句子长度,w为是经过训练的参数向量,tanh(*)为第一激活函数,softmax(*)为第二激活函数;
所述S32中,cnn层包括依次连接的卷积层、最大池化层和全连接层;
其中,所述卷积层设置有并列的G个互不相同卷积滤波器;
所述步骤S32包括以下分步骤:
S32-1、将用户和项目之间的交互序列通过卷积层的卷积滤波器提取特征,得到特征图;
其中,特征图具体为[t1,t2,…,ts];tj为第j个卷积滤波器输出的结果,j=1,2,…,s,s为卷积滤波器的总数;第j个卷积滤波器输出的结果tj表达式具体为:
Figure FDA0004154417330000021
式中,Xi为句子级用户和项目之间的交互序列h*中的第i个评论,其中i=1,2,…,p,p为评论的总数,bj为偏置项,※为卷积运算,Kj为第j个卷积滤波器,
Figure FDA0004154417330000022
为第三激活函数;
S32-2、将所述特征图输入最大池化层进行特征提取,得到特征子向量,进而将得到的特征子向量进行拼接,得到固定长度的特征向量;
其中,得到特征子向量zs的表达式具体为:
zs=max(T)
所述特征向量Z具体为[z1,z2,...,zG];
S32-3、将特征向量输入至全连接层,进而通过下式对特征向量进行特征提取,得到用户表示和项目表示;
χ=relu(W×Z+b)
式中,χ为特征提取的结果,relu(*)为激活函数,W为权重矩阵,Z为特征向量,b为偏置项;
根据特征提取的结果χ得到用户表示χu和项目表示χo
2.根据权利要求1所述的基于注意力机制的情感时序推荐方法,其特征在于,所述步骤S1中,所述评论信息具体为评论的集合R={r1,r2,...,rp},其中,ri为第i条评论,i=1,2,...,p,p为评论的总数;
第i条评论具体为ri={w1,w2,...,wq},其中,wj为第j个词的低维密集向量,j=1,2,...,q,q为第i条评论的单词数;
其中,第j个词的低维密集向量wj的表达式具体为:
wj=ej×We
式中,We为预训练的词向量矩阵,ej为嵌入层中输入第j个词生成对应的索引ej
所述时间信息具体为第i次用户与项目交互和第i+1次用户与项目交互之间的时间间隔
Figure FDA0004154417330000031
其表达式具体为:
Figure FDA0004154417330000032
式中,ti为第i条评论对应的时间,min(T)为用户与项目交互时间间隔的最小值,max(T)为用户与项目交互时间间隔的最大值。
3.根据权利要求2所述的基于注意力机制的情感时序推荐方法,其特征在于,所述步骤S1中,具有时态信息的用户因素和项目因素具体为融合时间信息的用户和项目评论集;
得到具有时态信息的用户因素和项目因素的方法具体为:
通过融合时间信息和评论信息,得到更新后的评论,进而得到融合时间信息的用户和项目评论集;
其中,融合时间信息的用户和项目评论集R′=[rt1,rt2,…,rtq];rti为更新后的第i条评论,且
Figure FDA0004154417330000041
Figure FDA0004154417330000042
为连接算子。
4.根据权利要求3所述的基于注意力机制的情感时序推荐方法,其特征在于,所述步骤S2中,blstm层包括并列的前向lstm层和后向lstm层;
所述步骤S2包括以下分步骤:
S21、将融合时间信息的用户和项目评论集输入blstm层,通过前向lstm层和后向lstm层进行情感特征提取,分别得到时间步k的语法含义
Figure FDA0004154417330000043
和时间步k的单子含义
Figure FDA0004154417330000044
其中,时间步k的语法含义
Figure FDA0004154417330000045
和时间步k的单子含义
Figure FDA0004154417330000046
的表达式具体为:
Figure FDA0004154417330000047
Figure FDA0004154417330000048
式中,
Figure FDA0004154417330000049
为时间步k-1的语法含义,
Figure FDA00041544173300000410
为时间步k-1的单子含义,xk为在时间步k,blstm层输入融合时间信息的用户和项目评论集向量;
S22、根据语法含义
Figure FDA0004154417330000051
和单子含义
Figure FDA0004154417330000052
得到时间步k的隐藏状态更新hk
其中,时间步k的隐藏状态更新hk的表达式具体为:
Figure FDA0004154417330000053
S23、将所有时间步的隐藏状态更新组合,得到用户和项目之间的交互序列H;
其中,用户和项目之间的交互序列H=[h1,h1,…,hT],T为句子长度。
5.根据权利要求1所述的基于注意力机制的情感时序推荐方法,其特征在于,所述步骤S4包括以下分步骤:
S41、根据用户表示和项目表示计算得到评分,进而根据评分计算预测评分;
其中,计算评分γ的表达式具体为:
Figure FDA0004154417330000054
所述预测评分
Figure FDA0004154417330000055
的表达式具体为:
Figure FDA0004154417330000056
式中,γm为第m次计算的评分,n为第n次计算的评分;
Figure FDA0004154417330000057
为第一辅助向量,
Figure FDA0004154417330000058
为第二辅助向量,N为计算的评分的总数;
S42、根据评分和预测评分计算,得到评分的损失函数和损失函数的正则化项,进而通过评分的损失函数和损失函数的正则化项处理评分,得到精确评分;
其中,损失函数
Figure FDA0004154417330000061
的表达式具体为:
Figure FDA0004154417330000062
式中,M为预测评分
Figure FDA0004154417330000063
的总数,
Figure FDA0004154417330000064
为第f次计算的预测评分,yf为第f次计算的评分;
所述损失函数的正则化项
Figure FDA0004154417330000065
表达式具体为:
Figure FDA0004154417330000066
式中,η为惩罚系数,Θ为可训练参数的集合。
CN202111501438.4A 2021-12-09 2021-12-09 一种基于注意力机制的情感时序推荐方法 Active CN114154071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111501438.4A CN114154071B (zh) 2021-12-09 2021-12-09 一种基于注意力机制的情感时序推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111501438.4A CN114154071B (zh) 2021-12-09 2021-12-09 一种基于注意力机制的情感时序推荐方法

Publications (2)

Publication Number Publication Date
CN114154071A CN114154071A (zh) 2022-03-08
CN114154071B true CN114154071B (zh) 2023-05-09

Family

ID=80454255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111501438.4A Active CN114154071B (zh) 2021-12-09 2021-12-09 一种基于注意力机制的情感时序推荐方法

Country Status (1)

Country Link
CN (1) CN114154071B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334759A (zh) * 2019-06-28 2019-10-15 武汉大学 一种评论驱动的深度序列推荐方法
CN111079015A (zh) * 2019-12-17 2020-04-28 腾讯科技(深圳)有限公司 一种推荐方法、装置、计算机设备和存储介质
CN111506814A (zh) * 2020-04-09 2020-08-07 苏州大学 一种基于变分自注意力网络的序列推荐方法
CN112231577A (zh) * 2020-11-06 2021-01-15 重庆理工大学 一种融合文本语义向量和神经协同过滤的推荐方法
CN112328893A (zh) * 2020-11-25 2021-02-05 重庆理工大学 一种基于记忆网络和协同注意力的推荐方法
CN113127604A (zh) * 2021-05-10 2021-07-16 齐鲁工业大学 基于评论文本的细粒度物品推荐方法及系统
CN113297487A (zh) * 2021-05-24 2021-08-24 中南大学 一种基于注意力机制增强门控循环单元的序列推荐系统及方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060097A (zh) * 2019-04-01 2019-07-26 苏州市职业大学 基于注意力机制和卷积神经网络的用户行为序列推荐方法
CN110659411B (zh) * 2019-08-21 2022-03-11 桂林电子科技大学 一种基于神经注意力自编码器的个性化推荐方法
CN110807156A (zh) * 2019-10-23 2020-02-18 山东师范大学 一种基于用户序列点击行为的兴趣推荐方法及系统
CN110874439B (zh) * 2019-11-20 2022-08-02 电子科技大学 一种基于评论信息的推荐方法
CN111242729A (zh) * 2020-01-07 2020-06-05 西北工业大学 一种基于长短期兴趣的序列化推荐方法
CN111522962B (zh) * 2020-04-09 2023-05-02 苏州大学 序列推荐方法、装置及计算机可读存储介质
CN111711828B (zh) * 2020-05-18 2022-04-05 北京字节跳动网络技术有限公司 一种信息处理方法、装置和电子设备
CN111753209B (zh) * 2020-07-02 2023-07-18 南京工业大学 一种基于改进时序卷积网络的序列推荐列表生成方法
CN112016002A (zh) * 2020-08-17 2020-12-01 辽宁工程技术大学 融合评论文本层级注意力和时间因素的混合推荐方法
CN112328900A (zh) * 2020-11-27 2021-02-05 北京工业大学 一种融合评分矩阵和评论文本的深度学习推荐方法
CN113268657B (zh) * 2021-04-16 2022-10-28 中国人民解放军战略支援部队信息工程大学 基于评论和物品描述的深度学习推荐方法及系统
CN113570154A (zh) * 2021-08-09 2021-10-29 齐鲁工业大学 融合用户动态兴趣的多粒度交互推荐方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334759A (zh) * 2019-06-28 2019-10-15 武汉大学 一种评论驱动的深度序列推荐方法
CN111079015A (zh) * 2019-12-17 2020-04-28 腾讯科技(深圳)有限公司 一种推荐方法、装置、计算机设备和存储介质
CN111506814A (zh) * 2020-04-09 2020-08-07 苏州大学 一种基于变分自注意力网络的序列推荐方法
CN112231577A (zh) * 2020-11-06 2021-01-15 重庆理工大学 一种融合文本语义向量和神经协同过滤的推荐方法
CN112328893A (zh) * 2020-11-25 2021-02-05 重庆理工大学 一种基于记忆网络和协同注意力的推荐方法
CN113127604A (zh) * 2021-05-10 2021-07-16 齐鲁工业大学 基于评论文本的细粒度物品推荐方法及系统
CN113297487A (zh) * 2021-05-24 2021-08-24 中南大学 一种基于注意力机制增强门控循环单元的序列推荐系统及方法

Also Published As

Publication number Publication date
CN114154071A (zh) 2022-03-08

Similar Documents

Publication Publication Date Title
CN112348075B (zh) 一种基于情景注意力神经网络的多模态情感识别方法
CN108363753B (zh) 评论文本情感分类模型训练与情感分类方法、装置及设备
CN109992779B (zh) 一种基于cnn的情感分析方法、装置、设备及存储介质
CN113535904B (zh) 一种基于图神经网络的方面级情感分析方法
CN113987179B (zh) 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质
CN112687374B (zh) 一种基于文本和图像信息联合计算的心理危机预警方法
CN112256866B (zh) 一种基于深度学习的文本细粒度情感分析算法
CN112527993B (zh) 一种跨媒体层次化深度视频问答推理框架
CN110378489A (zh) 基于实体超平面投影的知识表示学习模型
CN111061951A (zh) 一种基于双层自注意力评论建模的推荐模型
CN111538841B (zh) 基于知识互蒸馏的评论情感分析方法、装置及系统
Zhang et al. Multi-modal emotion recognition based on deep learning in speech, video and text
CN115270807A (zh) 网络用户的情感倾向判定方法、装置、设备及存储介质
CN115374789A (zh) 基于预训练模型bert的多粒度融合方面级情感分析方法
CN114169408A (zh) 一种基于多模态注意力机制的情感分类方法
CN112541541B (zh) 基于多元素分层深度融合的轻量级多模态情感分析方法
CN114154071B (zh) 一种基于注意力机制的情感时序推荐方法
CN113255360A (zh) 基于层次化自注意力网络的文档评级方法和装置
Akalya devi et al. Multimodal emotion recognition framework using a decision-level fusion and feature-level fusion approach
Uvaliyeva et al. The Development of the Staking-Ensemble of Methods for Analyzing Academic Data
Shukla et al. Deep ganitrus algorithm for speech emotion recognition
CN117368777B (zh) 基于小样本学习算法的锂离子电池寿命预测方法和系统
CN110991637B (zh) 一种公司形象提升系统的社交网络数据提取方法及系统
CN116522006B (zh) 基于视图自监督训练的慕课推荐方法及系统
Chen et al. Temporal attentive adversarial domain adaption for cross cultural affect recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant